当前位置:首页 > 单机 > 最新资讯 >

人机大战第四场李世石挽尊因AlphaGo放水?

时间:2016-05-16

在赛后的记者招待会上,李世石谈到了AlphaGo的两个弱点:一个是AlphaGo执黑棋时似乎挣扎比较多,相较执白棋时更难赢。

就在舆论普遍认为李世石将会继续败北的时候,人机大战的第四场,李世石出人意料地挽回了胜局,将比分改写为“3:1”。比赛开局阶段,李世石始终落后于 AlphaGo,一直在被吊打。然而,第78手的时候,局势峰回路转,李世石下出了关键的一步,一招极其冷门下出妙手。对于这一步棋,视频观战的职业棋手 古力评价为“神之一手”。

随后,AlphaGo 一连串的差手让棋面局势利好于李世石。在第97步,AlphaGo 再次出现低级失误,所下白子被李世石果断吃掉。最终,经过长达4个多小时的鏖战之后,AlphaGo中盘认输,李世石终于在这场人机大战中赢回“尊严”之战。

人机大战第四场李世石挽尊因AlphaGo放水?

对于戏剧性的比赛结果,记者的朋友圈出现了有多种观点看法,其中最有代表性的一种说法是“AlphaGo 选择性放水“。甚至还有阴谋论表示,AlphaGo 今天失利是因为被改代码。那么,AlphaGo 放水的可能性有多大呢?

人机大战第四场李世石挽尊因AlphaGo放水?

记者第一时间针对这一问题请教了围棋界、科学界的专业人士。对此说法, 他们都表示,“可能性为零”。至于李世石第78步的落子,完全可以称得上是载入史册的一次妙招!

业余围棋5段的高飞龙表示:

“李世石创造了历史,第78步棋没有一定水平看都看不懂,很高的职业水准才能想得到。”

棋手鲍云对于李世石第78步下法给予了很高的评价:

“配得上最高评价神之一手。”

AlphaGo 程序在大优局面的情况下被李世石的妙手打懵了,导致在随后的20来步进入疯狗状态。鲍云表示:

“AlphaGo 前半盘大优,不是防水的态度。至于AlphaGo 第97步的表现可以用“疯狗病发作”来形容。78-97步,机器应该有足够的(时间来)缓冲调整计算出局面走势。97确实是很“丢狗”的一步,说明算法还是有极大的问题,抗击打能力不足,崩溃的太脆了”。

那么,AlphaGo 为何会出现如此明显的异常表现?

根据Alphago原论文第一作者之一的Demis Hassabis 在赛后的总结,

“李世石下出白78后,AlphaGo自我感觉良好,在程序的“值网络”(用于评估电脑胜率)中,误以为胜率达到70%,直到第87步才反应过来。”

人机大战第四场李世石挽尊因AlphaGo放水?

高飞龙猜测,很可能是蒙特卡洛算法本身的一个缺陷。“78步本身是盲点,(李世石)小概率的选点,很可能导致(AlphaGo)在正确率很高的算法上出现意外事件,导致出错。”如果这一猜测成立,人类将可能找到每盘打败阿尔法的策略。而谷歌公司,将需要很长的时间来修正这一“缺陷”问题。

出门问问NLP工程师李理也在微信群给出了自己的猜测:

“(如果一定要猜测)我觉得可能是开局主要靠value network,因为搜索空间太大,有可能在某些特殊的局面下出现非常差的结果。就像之前神经网络识别图片时也出现过很诡异的错误,还有人研究怎么构造让它识别出错的例子。

同时,他也认为这一“诡异”问题将会比较难解决,”

神经网络打分是固定的,搜索有一定随机性。而value network是异步的,调试也不简单,得通宵加班找bug了。

PS.最新消息补充:

在赛后的记者招待会上,李世石谈到了AlphaGo的两个弱点:一个是AlphaGo执黑棋时似乎挣扎比较多,相较执白棋时更难赢。另一个是,当它遇到出其不意的招数时,有可能会导致失误,未必是失误,就是bug。

那么问题来了,第5场比赛,各位怎么看?是李世石再下一城还是AlphaGo 4:1 荣耀收关?

中国电竞网发布此文仅为传递信息,不代表中国电竞网认同其观点或证实其描述。

分享:

推荐阅读

推荐新闻

类似黑色行动3 使命召唤13运动系统曝光 类似黑色行动3 使命召唤13运动系统曝光
微软宣布星火计划下架 在线服务8月关闭
任天堂将推出《喷射美少女》主题扑克牌
华盛顿邮报给予《神秘海域4路》40分差评
《质量效应:仙女座》细节:质量提升明显

热门视频

热门单机下载排行