• 企业400电话
  • 微网小程序
  • AI电话机器人
  • 电商代运营
  • 全 部 栏 目

    企业400电话 网络优化推广 AI电话机器人 呼叫中心 网站建设 商标✡知产 微网小程序 电商运营 彩铃•短信 增值拓展业务
    王小川谈人机大战:重演了一部进化史,重新认识智慧的界限
      摘要: 如果有合适的条件,完全可能有其他的生命进化路径,以及更纷歧样的进化结果。

    AlphaGo三番棋对决中的第二盘昨日打响,最终柯洁不敌阿尔法围棋,第二盘告负,目前双方比分0:2。

    随后搜狗公司CEO王小川在知乎上发布评论文章称,2017人机大战的意义在于它重演一部进化史,重新认识智慧的界限。王小川体现,“AlphaGo2.0 告诉我们:如果有合适的条件,完全可能有其他的生命进化路径,以及更纷歧样的进化结果。”

    王小川认为,AlphaGo 2.0与1.0已大不相同,新的算法对计算资源开销极小,把当前棋局输入神经网络,电流流过,输出就是最佳的走棋方案。王小川猜测,有可能仅仅依靠一个 GPU 工作,每一步棋消耗的能源接近人的大脑。

    在王小川看来, AlphaGo2.0已经完全抛弃掉人类这两千年来进化的围棋经验,另寻他径,仅凭两台机器自我对弈中学习和进化,最终不但赶超了人类进化的速度,还发展出一套截然差别的下棋方法,而且更加接近完美的状态,实现了对人类的碾压,重演了一部围棋的进化史,并且得出了与这两千年来差别的进化结果。

    附王小川评论全文:

    该来的终于来了。

    一年前 AlphaGo 发布,看完论文后我就在知乎上发文预测机器会完胜人类。好些行业伴侣不相信,为此我收了很多“智商税”,之后微信发红包一直发到春节才发完。此外我还立了两个断言:一个是 Google 很有可能再研发出 AlphaGo 2.0,开脱“监督学习”,不再需要人类下围棋的历史数据,而是只通过“增强学习”,两台 AlphaGo 自我对战学习如何下棋,并达到登峰造极的地步。从公开的资料判断,此言中了。这意味着什么呢,又有什么看点呢?

    技术重大提升:和 1.0 原理大差别,更接近于人

    AlphaGo 1.0 是巧妙地混合了三种算法:蒙特卡洛树搜索 + 监督学习 + 增强学习。其中蒙特卡洛树搜索是一种优化过的暴力计算,比 1997 年深蓝的暴力计算更聪明。而这里的监督学习,是通过学习 3000 万步人类棋谱,对六段以上职业棋手走棋规律进行模仿,也是 AlphaGo 获得突破性进展的关键算法。而增强学习作为辅助,是两台 AlphaGo 从自我对战众中学习如何下棋,据悉对棋力提升有限。

    按照公开资料推测,此次 AlphaGo2.0 的技术原理与之前有着巨大差别:

    1. 放弃了监督学习,没有再用人的 3000 万局棋谱进行训练。这本是 AlphaGo 最亮眼的算法,也是今天主流机器学习不成制止的核心条件:依赖于优质的数据,在这个特定问题下就这么被再次突破了。

    2. 放弃了蒙特卡洛树搜索,不再进行暴力计算。理论上,算法越笨,就越需要暴力计算做增补。算法越聪明,就可以大大减少暴力计算。从 AlphaGo 2.0 的“马甲”Master 的历史行为看,走棋非常迅速,约在每 10 秒钟就走棋一步,如此速度很可能是放弃了暴力的计算。

    3. 极大地强化了增强学习的作用,之前敲边鼓的算法,正式成为扛把子主力。想想看有多励志:两台呆子机器,遵守走棋和获胜规则,从随机走棋开始日夜切磋,总结经验,不停批评和自我批评,一周后终成大器。

    在这样的算法下,AlphaGo 2.0 对计算资源开销极小,把当前棋局输入神经网络,电流流过,输出就是最佳的走棋方案。我猜测如此算法下,有可能仅仅依靠一个 GPU 工作,每一步棋消耗的能源接近人的大脑。

    最大看点: AlphaGo2.0 棋风完全脱离人类经验

    本年年初,AlphaGo 化身 Master 连胜人类顶尖棋手 60 局。在围棋领域,机器完胜已经酿成公认的定论。这导致很多人开始问:这次人机大战还有意义吗?我们的关注点不再是机器是否会赢——而是机器将用什么姿势战胜人类。

    AlphaGo 学习了 3000 万步人类棋谱,走棋风格也近似于人。在角逐现场,偶有 AlphaGo 走棋和人的经验不符合,就被评为“愚蠢”,只是在中盘之后发现机器渐渐局面占优最终获胜,为了自圆其说解读为“AlphaGo 中盘逆转”,,前两局莫过如此。第三局开始评论者长了教训,开始尊称 AlphaGo 为“阿老师”,有了欣赏和敬畏的心态。这带给围棋界很大的冲击,以前大家认为正确的东西,其实是不正确的。

    柯洁曾经评价说:“AlphaGo 出现,很多理论都被推翻,再看以前定式变得好笑,亏那么多目就不再是两分。”人类通过数千年实战,总结了围棋理论,然后计算机告诉人类:这些全都是错的。现在在很多角逐上,人类棋手已经开始向机器学习,模仿 AlphaGo 的下法,棋圣聂卫平也曾体现“理论被颠覆了”。

    上一篇:微信惊现“远程弹窗漏洞” 已刷爆伴侣圈
    下一篇:想要玩转比特币,需要了解它背后的区块链技术
  • 相关文章
  • 

    © 2016-2020 巨人网络通讯 版权所有

    《增值电信业务经营许可证》 苏ICP备15040257号-8

    王小川谈人机大战:重演了一部进化史,重新认识智慧的界限 王小川,王,小川,谈,人机,