物联传媒 旗下网站
登录 注册
RFID世界网 >  新闻中心  >  物联网新闻  >  正文

从大胜李世石到险胜柯洁,AlphaGo这一年经历了什么?

作者:本站收录
来源:产业最前线
日期:2017-05-24 10:15:00
摘要:世界排名第一的柯洁,曾认真研究了一年多AlphaGo喜欢的三三式;在这一年多,AlphaGo则从第18代迭代为第60代。这些表象背后,人工智能深度学习能力经历了怎样的演进?

  世界排名第一的柯洁,曾认真研究了一年多AlphaGo喜欢的三三式;在这一年多,AlphaGo则从第18代迭代为第60代。这些表象背后,人工智能深度学习能力经历了怎样的演进?

  5月23日上午10点半,备受全世界瞩目的人机大战第二季将全面打响。最终,人类围棋界排名第一的中国棋手柯洁输给了AI界排名第一的AlphaGo围棋人工智能程序。


  一场科技层面注定失败的比赛

  这是一场业内同行普遍不看好结果的比赛。

  尽管柯洁在大战前悲壮地表示,“我会用所有的热情去与它做最后的对决,不管面对再强大的对手——我也绝不会后退!”赛前的豪迈,依然改变不了失败的结果。在专业棋手看来,输四分之一子的柯洁虽败犹荣。

  对柯洁而言,这是一场注定艰难但必须争胜的战斗。在此之前,柯洁专门研究了AlphaGo喜欢的三三式,并在比赛中应用。

  而在这一年中,AlphaGo从对阵李世石时的第18代,迭代为对阵柯洁时的第60代。快速迭代的背后,是AlphaGo全新的深度学习逻辑。这种经历迭代的深度学习逻辑,其强大力让人难以望其项背。

  深度学习的两次逻辑变更

  2016年在AlphaGo以4:1大胜李世石后,人工智能再次进入大众的视野,而在这场世纪“人机大战”后,Deepmind随即宣布“阿尔法狗”进入闭关状态。

  直到2016年12月29日,神秘的AlphaGo才化身为Master再次复出。随后其在短短一周内,击败了包括目前中韩第一人柯洁和朴廷桓,以及古力、陈耀烨、范廷钰、常昊等10多位中韩世界冠军,豪取60连胜,就连原来信心满满的柯洁也对此也一改以往自信狂傲的口吻,声称自己很可能全输给AlphaGo。

  而前两次人机对决的场景还历历在目,第三次人机大战却已悄然来临,但整个人类世界对于两方选手的感情却发生了颠覆性的变化,一边倒的认为柯洁必输。

  那么这一年时间里AlphaGo身上究竟发生了什么?居然让舆论变化如此之大,这无疑源于人们对AlphaGo了解的加深。

  与李世石对战的AlphaGo 1.0版混合了三种算法:蒙特卡洛树搜索+监督学习+增强学习。其中,蒙特卡洛树搜索是一种优化过的暴力计算,比1997年深蓝的暴力计算更聪明。而这里的监督学习,是通过学习3000万步人类棋谱,对六段以上职业棋手走棋规律进行模仿,也是AlphaGo获得突破性进展的关键算法。而增强学习作为辅助,是两台AlphaGo从自我对战众中学习如何下棋,对棋力提升有限。

  此次AlphaGo2.0的技术原理已有颠覆式改变。首先是放弃了监督学习,没有再用人的3000万局棋谱进行训练。这本是AlphaGo最亮眼的算法,也是今天主流机器学习不可避免的核心条件:依赖于优质的数据,在这个特定问题下就这么被再次突破了。

  其次,放弃了蒙特卡洛树搜索,不再进行暴力计算。理论上,算法越笨,就越需要暴力计算做补充。算法越聪明,就可以大大减少暴力计算。从AlphaGo 2.0的“马甲”Master的历史行为看,走棋非常迅速,约在每10秒钟就走棋一步,如此速度很可能是放弃了暴力的计算。

  再次,极大地强化了增强学习的作用,之前敲边鼓的算法,正式成为扛把子主力。想想看有多励志:两台白痴机器,遵守走棋和获胜规则,从随机走棋开始日夜切磋,总结经验,不断批评和自我批评,一周后终成大器。

  通俗地讲,1.0版本的AlphaGo尚需借助人类棋谱来增长功力,而新版阿尔法狗2.0已正式摒弃人类棋谱,只靠计算机自身深度学习的方式成长——即探索“深度学习”方式的极限,臻至“围棋之神”的境界。所以,它现在在围棋方面俨然打通了任督二脉,人类根本找不到其脉搏。

  而在今年 4 月,AlphaGo 之父哈萨比斯在英国剑桥大学进行了演讲,专门提到为了帮助 AlphaGo 提升。他公开表示,之前 AlphaGo 提升一个版本需要 3 个月,现在只需要 1 周。AlphaGo 对阵李世石时的版本号是 V18,而当下的版本估计已经到了 V60,在逻辑上和棋局策略上已经今非昔比。

  诚如哈萨比斯所说,AlphaGo证明了人类3000年来在围棋上犯了一个大错,其仅凭两台机器自我对弈中学习和进化,最终不仅赶超了人类进化的速度,还发展出一套截然不同的下棋方法,并且更加接近完美的状态,实现了对人类的碾压,重演了一部围棋的进化史,而且得出了与这两千年来不同的进化结果。

  如今,人工智能已经上升为国家战略,而在2017年业界的声音也的确进入了该领域的下一个阶段——更加强调人工智能技术的落地。未来社会每个人身边独有一个人工智能助手,人类将从简单重复的劳动中解脱出来。

  人工智能产业风口已来

  不过,柯洁输给AlphaGo并不代表人类败给了人工智能,因为这种对抗从来不是技术与人关系的实质。人工智能的出现从来不是作为人类的对手,而是作为人类的助手。

  就好像现在多数人应该都觉得,让人和汽车比谁跑得快,连娱乐价值都没有了,而如何利用汽车、利用无人驾驶让我们的生活更方便,才是更有价值的探索方向。这也是谷歌一直所追求的“如何让机器更智能,如何让人的生活更好”,而且阿尔法狗后面站着的实际上就是人类本身。

  而随着阿尔法狗在深度学习领域的示范效应,深度学习有望进一步加速渗透至各个行业,垂直行业的信息化公司有望充分利用深度学习提升行业智能水平。目前,谷歌、微软、 Facebook、百度等巨头纷纷开源深度学习框架,大大降低开发深度学习系统应用门槛,加速渗透至各个行业,包括金融、医疗、服务机器人、法律、无人驾驶、教育、气象、农业等,垂直行业的信息化公司有望迎来发展良机。2017年被业内评价为人工智能应用元年。

  基于人工智能巨大的发展空间,国内相关上市公司也将迎来发展契机。阿里云、腾讯、百度、科大讯飞等行业巨头,大疆、华大基因、柔宇科技等创新企业正在人工智能领域开始耕耘。

  而相较于在原创性研究领域的薄弱,中国在AI应用方面具有独特的优势:一方面政府统一规划使得国内在人工智能方面的投入可能取得更好成果,另一方面国内巨大的市场需求,将促使人工智能在产业应用的落地加快,最终产生一些在国外无法实现的应用模式。

  在AlphaGo不断迭代深度学习逻辑的同时,人类在不断拓宽对人工智能的应用。在这一场永不停歇的人机大战中,谁是最终的赢家,结局已经注定。

人物访谈