制造企业
您当前的位置是:首页>>制造企业>>正文

细思极恐!AlphaGo已开始摆脱人类依赖……

发布时间:2019-10-26  浏览次数:886   文章來源:www.midg.org

在第一场对阵AlphaGo的比赛中,科杰输了四分之一。

包括柯杰在内的许多人都期待这一结果。

在第一次赛后会议上,柯杰直截了当地说人工智能的进展太快了,每次都是一个巨大的进步。这就是他在比赛前夕发布微博的原因,这次将是他与人工智能的最后三场战斗。

柯杰清楚地知道人类不能再击败AlphaGo了。他形容AlphaGo越来越像“走向上帝”。如果他想赢得它,他只能找到一些错误,但目前,他还没有看到AlphaGo的任何弱点。

在这里,我引用了搜狗CEO王小川关于发布内容的内容,然后向大家介绍了AlphaGo。

去年的AlphaGo混合了三种算法,即蒙特卡罗树搜索+监督学习+增强学习。

其中,蒙特卡罗树搜索是一种优化的暴力计算;有监督学习是通过学习3000万人类象棋模式来模仿六个以上职业棋手的规则,这也是AlphaGo取得突破性进展的关键算法;作为强化学习的辅助手段,两个AlphaGos学习如何从自己的战斗中下棋。

每当您获得游戏信息时,AlphaGo将根据战略网络探索哪个位置具有高潜在价值和高概率,以确定最佳位置。在指定的搜索时间结束时,系统在模拟期间最频繁检查的位置将是AlphaGo的最终选择。

简单来说,AlphaGo依赖于概率,而概率则依赖于预先学习。这一次,与Ke Jie比赛的AlphaGo已经被两个人评为去年。

最初的AlphaGo主要依靠监督学习,即学习对象几乎完全来自人类棋类玩家,新版AlphaGo增强了强化学习,主要是学习机器自学的游戏。

难怪柯杰去年会觉得AlphaGo的方法与人类非常接近,但今年,AlphaGo在战斗中变得更加“普遍”,并且许多棋子对于人类玩家来说是不可能的。

DeepMind的创始人和AlphaGo的父亲Demis Hassabis证实了这一点。他说,与科杰对战的AlphaGo更依赖于人类数据,更少依赖人类数据。

除了开始脱离人类数据之外,让人类更加困难的是它的恐怖速度。我们经常说我们必须“弥补优势并相互补充”,AlphaGo可以将这个过程加速数百次。

长期方面并不是说AlphaGo的研发团队一直在寻找差距。在去年输给李世石之后,他们回过头来立即改善了AlphaGo的知识差距,并且更加努力地改进算法以使AlphaGo变得更强大。

这次AlphaGo在算法方面要强大得多。去年,AlphaGo通过分布式计算机运行,今年只使用一台机器。因此,柯杰没有让AlphaGo的CPU因其快速操作而升温。相反,今天的AlphaGo计算能力比去年低10倍。

从比赛开始,科杰几乎是AlphaGo的两倍。双方的第一场比赛耗时4小时17分37秒,其中科杰用了2小时46分43秒,而AlphaGo用了1小时30分54秒。

学习更快更快,人类玩家很难看到赔率。柯杰也看到了这一点,但他为什么要打架呢。

这也是普通网民最关心的问题。高杰在获胜或失败时,是否需要达到“人类尊严”的高度?答案肯定不是。

像所有竞争游戏一样,Go也是一名职业选手。对于运动员来说,输赢是一件例行公事。任何人都难以面对竞争对手,他们的实力差距很大。

现在高洁正面临这样的对手。因此,游戏的下一个重点不是Ko Jie能否赢得比赛,而是Alpha Gos AI技术将给人类带来什么。

目前,Alpha Go已经推翻了传统的Go。柯杰也尝试了一些“非常规”的游戏方式。他认为Alpha Go已经改变了他的许多原始观点。现在他觉得游戏中没有国际象棋无法播放。

Demis Hassabis在比赛前的讲话中说,Go的风格变化很大,而在另外的一万年里,人类将无法用尽他们的方式。

AlphaGo可以作为一种工具,帮助人们了解Go,让伟大的玩家发现Go的更多神秘面纱。

这真是一种美妙的感觉。当你认为一件事几乎是唯一的事情时,突然间又有另一种可能性。这就像哥伦布发现新世界为未来打开了一扇新的大门。

柯杰说,到现在为止,最大的特权是打击Alpha Go,谢谢你拥有这样一个对手。他从Alpha Go获得了很多游戏的快乐,这来自竞争,而不是结果。

比赛结束后,Ko Jie希望将AlphaGo用作帮助他提高国际象棋技能的工具。在人与机器之间,他选择与人类下棋。他笑着说:“我仍然可以赢得人类的胜利。”