柯洁调整胜率表示应战人工智能弱点论引争议

2016-03-17 09:50

此前，围棋世界冠军柯洁和中国象棋特级大师、北京队主教练张强均向21世纪经济报道记者表示，软件现已颠覆了棋类运动的部分理念和规律，终有一天人工智能的棋艺会天下无敌。3月15日，人机大战五盘结束，谷歌的AlphaGo以4：1战胜李世石。至此，人工智能已在围棋、国际象棋、中国象棋三项智力竞技体育中，实现了对人类顶尖高手的全面胜利。

在战胜李世石后，DEEPMIND研发工程师拉里亚·哈德塞尔开始把目光转向柯洁，他在社交软件脸书上表示：“柯洁，准备好了吗？”

而据21世纪经济报道记者得悉，在看到脸书上的非正式挑战后，柯洁的经纪人庄文回应称，还没有接到谷歌方面的正式邀请。“如果接到邀请，柯洁将会欣然应战，此前在解说李世石棋局时，柯洁就多次表明了态度。”

此前，围棋世界冠军柯洁和中国象棋特级大师、北京队主教练张强均向21世纪经济报道记者表示，软件现已颠覆了棋类运动的部分理念和规律，终有一天人工智能的棋艺会天下无敌。

张强预测：“计算机将加速棋类运动的灭亡，甚至降低人类的创造性和毅力。”然而，当下的计算机并非完美，从对弈棋局来看，目前系统仍存在计算错误、欠缺灵活性、规律总结能力较差等弱点。

人脑对垒电脑

李世石逐步揣摩AlphaGO“心思”的5场对战，也是大众了解人工智能的过程。在最后一盘厮杀中，尽管李世石采用了与前四局不同的招数，然而“神之一手”并没有出现，AlphaGO最终获胜，其技术实力和“棋感”有目共睹。

根据专家的公开分析，AlphaGO的成功来源于深度学习技术和蒙特卡洛树算法的结合。蒙特卡洛树搜索算法是特别适合棋类游戏的算法。而对于盘面组合数极大的围棋，还需要深度学习这一新技术，深度学习本质是指人工神经网络，包括决定落子的“策略网络”，评估局面胜算的“价值网络”。相比以往的穷举法，是飞跃性的进展。

深度学习则是谷歌引以为豪的技术创新。日本函馆未来大学教授、人工智能学会会长松原仁在接受21世纪经济报道记者采访时表示，AlphaGO在围棋领域超越人类，是人工智能很大的突破。围棋获胜虽然没有改变世界，但是这显示了在其他领域超越人类的可能性。他说道，“此次比赛中，谷歌开发的强大性能的电脑功不可没。”

在不少业内人士看来，AlphaGO是通过深度学习得来的“机器棋感”来和人类的抽象推理进行角力的。

浙江大学人工智能研究院院长吴飞教授告诉21世纪经济报道记者：“在第四盘比赛中，李世石把旗子摆到了中盘，引向中盘，复杂度比较高。阿尔法狗近身鏖战能力强，某个棋子在中空地带，可能出现棋子的步骤成千上万，计算就失误了，可能是算法里没有考虑这个情景。BUG是人没有教阿尔法狗这个特定的棋局，‘神来之笔’则是人的一种动物性。”

可以说，如今备受关注的棋局终结，外界对于人工智能虽然强大，但也并非没有弱点已达成共识。

就在第四盘战胜AlphaGo后，李世石曾在记者会上表示：“今天自己下出意外的招式时，AlphaGo出现了某种形式的漏洞（BUG），对于意外招式的应对能力较为欠缺。”

谷歌DeepMind首席执行官丹米斯-哈撒比斯（Demis Hassabis）也通过社交平台承认，李世石翻盘是因为击中了机器人的BUG，下出白78手后，AlphaGo自我感觉良好，在程序的“值网络”（用于评估电脑胜率）中，误以为胜率达到70%，但直到第87步才反应过来。

即使在AlphaGo获胜的前两局中，也并非完美。“前两盘机器在布局上有一些小问题，但由于李世石后面犯了错误，才把优势拱手相让了。”柯洁对本报表示。

围棋如此，在中国象棋和国际象棋人机大战中，计算机也没能达到步步精确。中国象棋人机大战早在2006年就举行过，但未受到高度关注。当年超级计算机天梭浪潮与中国五位特级大师对弈，最终以3胜5和2负取得胜利。

亲自上阵的张强取得1胜1和的战绩，他告诉21世纪经济报道：“计算机有软手、失误和计算不到位的情况，开局时我就略略占优。即使发展到现在，也会存在BUG，不会步步精准。”此外，1997年深蓝虽战胜国际象棋棋王卡斯帕罗夫，但也是仅以3.5比2.5获胜，其中也存在计算失误情况。

而在另一方面，AlphaGo等人工智能的缺陷还表现在欠缺灵活性和针对性。

哈撒比斯表示：“我们向它输入网络上的对弈棋谱，使其逐渐学会下围棋的通用范式，并未输入李九段的对弈棋谱，也没有进行针对性训练。”

截至目前，在“三棋”中尚无证据证明，计算机可以针对某一对手的特殊风格做出调整，以取得更优结果。而这在实际对弈中却极为常见，如对手善于平稳中取胜，则应将局面引入混乱搏杀，反之亦然。

究其原因，是因为针对性出招可以使机器缩短获胜时间并节省计算量，最重要的是有助于降低BUG的出现率，这显然会使机器变得更加聪明。“现实中备战，棋手一定会研究对手，力图走出让对手别扭的棋。”柯洁直言。

而最后一个值得商榷的是，计算机的规律总结能力能否超越人类。

“人工智能真是太了不起了，它每天都可以学习几万盘棋，这个数量是人类一生都无法企及的数量。”柯洁表示。然而，这一可怕的优势恰恰反映出机器总结规律的能力暂时弱于人类。张强指出：“与机器相比，人类在少量记忆、训练的情况下就能找到规律，从而达到很高的水平。但机器却需要输入远多于人类记忆极限的盘数才能具备相应水平。”

降低创造性致棋类消亡？

现如今，象棋人工智能软件主要包括天机、名手、旋风等。而早在AlphaGo登台亮相之前的数年，象棋选手就已普遍使用类似人工智能帮助提高棋艺。

张强告诉21世纪经济报道：“以前出一个高手需要5-10年培养期，现在只要三四年了。对棋类而言，人工智能或许弊大于利。由于很多神秘面纱陆续被计算机解密，这虽可以加速象棋的发展速度，但等到全部解密之后，象棋、围棋就成了五子棋、跳棋那样无趣了。”

在与机器进行棋类游戏的过程中，人们常常失去斗棋的乐趣，主要存在两方面原因。一方面，机器下棋都存在“固化”思维，面对同样的局势，机器总是在同一处落子。松原仁认为，AlphaGO也不例外，在多次的对战中很有可能试出机器弱点从而取胜，“在交手过程中棋手会继续学习，但是AlphaGO并不会。”

另一方面，尽管谷歌声称AlphaGO拥有“大局观”，但是对于“以退为进”、“乱中取胜”等人类的棋类技巧以及团队作战时的配合协调方面，目前AlphaGO尚未实现。对此松原仁指出，AlphaGO理解力上存在缺点，它会做出选择，但是不能表达出确切的逻辑关系和理由。

扼杀创造力之辩还体现在另一方面。目前，受到人工智能的影响，象棋的训练方法已发生了巨大改变。张强解释称：“曾经是由棋手创造性地开发出新的招法，现在变成电脑给出答案了。谁用电脑的时间长、方法得当，谁的水平就增长得快，这伤害了人类的创造性和意志品质。”

类似的情况其实在AlphaGo与李世石的第二盘中就有所体现出来。

据柯洁回忆称：“双方交锋第二盘的第37手，机器下出了人类从没有走过的招法，开始很惊讶，但后来仔细想想，这步棋是非常有道理的，甚至可以说是创造了一种布局变化。”

棋手们普遍显示出了对人工智能的抗拒心理。“我是不是生不逢时了？”柯洁感叹。而对于与AlphaGo的对战，柯洁也收回了此前百分百胜、六七成胜率的判断，“现在说胜率都是没有意义的。”

发表评论