新闻 | 财经 | 证券 | 经济 | 基金 | 能源 | 科技 | 宏观 | 房产 | 期货 | 理财 | 汽车 | 配资 | 黄金 | 法治 | 原创 | 头条
AlphaGo只赢了柯洁1/4子,但这才是它最可怕的地方

发稿时间:2017-05-24 10:51:15 来源:财经界综合

5月23日下午2点51分,柯洁九段收完了最后一个单官(单官即占不到棋盘上空交叉点的一手棋),开始等待裁判最后的判决。其实作为当前围棋积分排行榜上排名第一的人类,柯洁在裁判宣布结果前就已经算出自己将以1/4子落败,“因为AlphaGo下棋的速度一直是匀速,即使在单官这种没有什么意义的阶段它也会下很久,趁这个时间我就在不停地计算自己的目数。”柯洁在赛后对媒体坦言。

这场巅峰对决是在一个多月前定下的,柯洁九段和AlphaGo将有三番棋的对决,无论输赢都将下满三盘,每盘双方都有3小时时间,保留五次1分钟读秒。柯洁当场表示,自己将抱有“必胜的心态和必死的信念”。

柯洁一只手在自己的棋盒里打着转,另一只手托着腮,眼睛直勾勾地盯着棋盘,似乎想再从裁判的手中多算出哪怕半目。“三番棋第一盘棋结束,AlphaGo以1/4子获胜”,终于,裁判报出了那个他早已就算好的数字。

这场持续4小时17分钟,共计289手的对弈结束了,终局时柯洁的剩余时间还有13分22秒,AlphaGo的剩余时间是他的近7倍。今年春节,当AlphaGo化名Master在围棋网站上用快棋大战人类高手60回合且无一败绩时,不少人表示慢棋是人类赢棋最后的机会,如今看来,这个机会也非常渺茫了。

在一个多月的备战中,柯洁曾反复思考击败AlphaGo的策略。在今天的比赛中,他在第三手就用了AlphaGo擅长的点三三下法,希望能够借此取得优势。然而出乎柯洁的意料,AlphaGo不但处理得很好,反而还占了上风。“我印象中它是非常贪恋实地的,今天这盘棋(我)也在贯彻先捞后洗的策略,没想到被它打破了意图,棋完全进入了它的调子中。”柯洁说:“如果用棋手比喻,这个AlphaGo和去年完全是两个人,那一次他的棋很接近人类,但现在更接近我理解中的围棋上帝。”

在很多人眼里,柯洁以1/4子这个围棋中影响胜负的最小目数落败,至少说明双方的差距不是很大。然而对于只在乎如何实现胜率最大化的AlphaGo来说,能以如此小的差距赢棋反而凸显了它的实力。

有人将AlphaGo比作撑杆跳运动员布勃卡,他在职业生涯中35次刷新世界纪录,但几乎每次都只略微提高1厘米,一直在用最小的进步博取最大的收益。AlphaGo可能也是如此,“只能赢1/4子”和“只想赢1/4”虽然在结果上相同,但背后代表的实力却是天差地别。

“AlphaGo只有一个目的,就是将其胜率最大化。”AlphaGo项目的主要负责人David Silver解释道:“所以它要确定风险最小的获胜机会。”或许与柯洁这样的高手对弈时,每多扩大一点目数的优势就意味着风险的提高,所以对于AlphaGo来说,只赢1/4子是最经济的行为。

据AlphaGo之父、DeepMind创始人Demis Hassabis所说,这一次与柯洁对弈的AlphaGo是最新升级过的版本。由于采用了更高效的算法,所以新版本AlphaGo需要的计算能力是去年与李世石对弈的1/10,它运行在Google云端平台之上,并且采用Google专门为机器学习研发的TPU芯片。

此外Hassabis还表示,如今的AlphaGo已经不再通过学习棋谱来提高水平,而是通过“左右互搏”,即自己与自己对弈来训练。因此,他们也不清楚AlphaGo是否会有什么弱点,这也是它选择与柯洁对战的原因。

就在对战的前一天夜里,柯洁在新浪微博上发表《最后的对决》,在文章中他表示,与AlphaGo的三番棋会是他与人工智能最后的三盘棋。第一天的比赛结束后,他解释了这个决定背后的原因:“与人工智能的差距不是靠自身努力可以弥补的。”而随着将来人工智能的继续发展,获胜的可能也就越来越渺茫。

责任编辑:夏晨风
猜你喜欢