AlphaGo的人类对手Lee Se-dolhas在“深度思维挑战赛”中赢得了第四场比赛,证明了人类仍然可以胜过机器。这是我们在这场开创性比赛中的最新报道。
输掉比赛不会影响5局比赛的最终结果,但是从心理上讲,这不仅对Lee和他的职业围棋选手而且对AI研究人员都非常重要。还有一些可玩的东西!赛后新闻发布会上,Deep Mind首席执行官Demi Hassabis说他对结果感到非常高兴:
“……这就是我们来到这里的原因-测试AlphaGo是否达到极限。”
记分牌显示Lee在180次移动后获胜。和以前的比赛一样,他用尽了全部时间,并且用了两个假补时加时赛。比赛结束后李世多说:
“仅仅因为我赢了一场比赛,我就从来没有得到如此多的祝贺。”
根据Google博客:
Lee Sedol在连续三连输之后,今天(3月12日星期六)卷土重来,在第四局击败AlphaGo。Lee扮演白色,在180次移动后以辞职获胜。
AlphaGo在比赛的上半场保持强势地位,但评论员指出,李·塞多尔(Lee Sedol)出色地执行了第78步,随后AlphaGo在第79步中犯了一个错误。
这是美国和韩国评论员不得不说的。九人围棋球员迈克尔·雷德蒙德(Michael Redmond)说
“今天的比赛是AlphaGo玩非常有趣,出色的游戏的另一个例子。但是,李·塞多尔(Lee Sedol)的第78步确实很棒,使他获胜。
同样被评为9旦的宋太极说:
看来Lee Sedol现在可以更好地阅读AlphaGo,并且对AlphaGo的动作有了更好的了解。对于第5场比赛,这将是一场比以往更近的战斗,因为我们彼此都更加了解。专业围棋选手表示,在见证了AlphaGo的创新举动之后,他们对围棋变得更加感兴趣。人们开始重新考虑以前被视为不良或不良举动的举动。AlphaGo可以帮助我们在Go游戏中跳出思维。”
DemiHassabis发推文:
3月12日,星期六
Google的AlphaGo赢得了“深度思维挑战赛”,这是他连续第三次与18届世界冠军Lee Se-dol对抗,这是我们在AI方面的历史性突破的最新故事。
第三局结束时的棋盘位置看起来惊人地不同。这次AlphaGo在176步后辞职而获胜。Lee的所有时间和两次byō-yomio时间都用光了,而AlphaGo的时钟还剩8:31。
根据Google的说法:
AlphaGo在董事会上创造了很大的领土,但李·塞多尔(Lee Sedol)使用了一些创新策略,发起了一场全有或全无的大规模战斗,并使局势复杂化。在随后的kō战斗中,AlphaGo获胜。
总结了在首尔举行的5局系列赛的第三场比赛,韩国评论员8岁的李贤旭说:
“李·塞多尔表现出色。我本人是一名职业球员,我谨此表示他对AlphaGo连续三场比赛的表现,这场比赛几乎表现出色。Lee在今天比赛结束时采取了多种动作,以进一步了解AlphaGo。我也期待剩下的比赛。”
美国评论员迈克尔·雷德蒙德(Michael Redmond)9岁说:
“有争议的是,在前两场比赛中,LeeSedol的演奏方式与他的真实风格有所不同,试图找出计算机上的弱点。从强势的开局到决赛的复杂动作,今天李绝对是在玩自己的游戏.AlphaGo做好了一切准备,包括打架比赛,并取得了胜利。我要祝贺实际上成就了这一成就的人们,因为这是一件艺术品。”
DeepMind的创始人兼首席执行官Demis Hassabis和发起AlphaGo项目的人在推特上写道:
尽管AlphaGo已经赢得了比赛,但在5局系列赛中仍有两轮比赛可以确定最终比赛的比分。第四场比赛将于3月13日星期日进行,最后一场比赛将于3月15日星期二举行。Lee Se-dol当然还有可以玩的东西-世界上最好的人能击败DeepMind的算法方法吗?
3月11日,星期五
继在第一场比赛(如下所述)中取得成功之后,AlphaGo再次采取了许多创造性的举动,使第二场比赛的专家评论员感到惊讶。
美国评论员说:
“ AlphaGo的游戏给我留下了深刻的印象。开幕式的确很美。根据我从其他游戏中看到的内容,AlphaGo在中端和中端游戏中始终很强大,但是这次又扩展到了开始时。这是一款精美的创新游戏。”
韩国评论员柳丹赫(9 Dan)说:
“在第一场比赛中,李·塞多尔(Lee Sedol)做出了艰难的举动来鼓动AlphaGo,但没有成功。今天,他尝试了相反的做法-他打得稳健,进入了决赛。在使用自己的读友时代时,他犯了一些错误,我认为这是失败的原因。”
第二场比赛与李·塞德(Lee Sed-ol)和阿尔法(AlphaGo)一起用了整整两个小时的时间,加上加倍的byō-yomi加时赛,持续了4个小时。
您可以在以下视频中看到90秒的游戏摘要,这比第一游戏的视频要好得多。
3月9日,星期三
Google的DeepMind AlphaGo程序在与传奇围棋选手Lee Se-dol的比赛中赢得了第一场比赛。好吧,它可能只是五连冠中的第一场比赛,但这是向前迈出的一大步, AI相当于登陆月球。
您不能真正责怪Demis Hassabis的排名过高-确实很棒。
也许更令人惊奇的是,用于创建AlphaGo的技术本质上是AI长期以来一直在研究的方法-神经网络和强化学习。这并不意味着正确实现就容易了,但这全都是“更多”而不是“根本不同”的情况。
由Google的Deep Mind团队设计的名为AlphaGo的网络体系结构是新颖的,因为它在传统的强化学习“行为批评”排列中使用了两个截然不同的神经网络。第一个网络选择可能的举动,第二个网络根据该举动在未来带来的优势进行评估。这种方法使AlphaGo可以从3000万的人类Go游戏中学习,然后继续通过与自己对战来进行数百万游戏来提高其性能。
早在10月,AlphaGo击败了欧洲围棋冠军(Google的AI Beats Human Professional Player At Go),并且Google以经典的人碰到机器象棋比赛的风格对软件进行了更严格的测试。世界冠军韩国的李世多在首尔举行了一场五场比赛,奖金为100万美元,现在这场比赛已经开始。
AlphaGo赢得了第一场比赛。根据DeepMind新闻稿:
AlphaGo对阵Lee Sedol的第一场比赛。在充满复杂战斗的游戏中,它们的整体并驾齐驱。李·塞多尔(Lee Sedol)采取了非常激进的举动,但AlphaGo并未从战斗中退缩。与Lee Sedol相比,AlphaGo几乎用尽了所有时间,后者只剩30分钟了。
结果:W + Res移动次数:186黑色(李·塞多尔)所花费的时间:1:31:32白色(AlphaGo)占用的时间:1:54:30您可以在下面观看直播视频的录制-比赛大约在27分钟后开始,您需要警告它,这不是一个很好的视频,它有很多小故障和可怕的评论员:
根据游戏专家的说法,Lee在大部分游戏中似乎都占了上风,但是在最后20分钟内,AlphaGo做出了必然取得胜利的举动。
令人担忧的是,一些分析家声称,早期行动是人类永远不会玩的东西。可能这首场比赛的胜利是由于人类玩家不了解其机器对手的本性吗?
据称,深蓝战胜卡斯帕罗夫的那场著名的国际象棋是由于一个错误引起的,该错误导致了卡斯帕罗夫无法理解的随机动作,并归因于高超的情报。据说他因为担心而失去了比赛。如果真是这样,那么您可以期待Lee Se-dolto逐渐习惯于对手。
AlphaGo是否以非人类的方式使Lee感到紧张并不重要。程序正在招募最高级的人类玩家并受到认真对待的事实,仍然相当于AI登月的AI。
注意其余比赛的更新。
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。