日期归档
直销中心
您当前的位置是:首页>>直销中心>>正文

技术揭秘阿里云人工智能ET魔术秀 读心术是如何实现的?

发布时间:2019-08-28  浏览次数:1236   文章來源:www.midg.org

TechWeb于11月11日报道,这可能是人工智能史上第一次举办如此成功的技术魔术表演。

在11月10日晚的天猫双11狂欢之夜,阿里巴巴云人工智能ET首次亮相,并为全球观众举办了一场技术魔术表演。华邵邀请了五名来自现场的观众从32张牌中抽出5张牌,挑战ET“猜测猜测”:准确猜出牌中的牌是什么。理论上,随机猜测5名玩家的扑克牌是一项“不可能的任务”,成功率仅为1/24165120!

但是,每个人最终都看到了它。 ET准确无误地向五位观众报告了牌的套装和分数。观众感到震惊。

事实上,ET并没有真正拥有“阅读思维”,而是使用一种称为De?Bruijn序列的数学方程式,再加上强大的人工智能技术,来完成这一完美展示。

De?Bruijn序列的原理非常复杂。这里不详述。有意者可以在线搜索。但是De?Bruijn序列的结论非常简单,即从这样的序列中任意取出相邻的n个数,它们的二元排列必须是不同的。这意味着ET只需按顺序对五个查看器中的黑色和红色卡(二进制中的0和1)进行排序,并且只有一个唯一的解决方案。

简单地说,卡片按顺序排列,无论卡片如何切割,分类组合的可能性减少到32,然后根据下表找到相应的排列,答案就绪。

如果一个普通的魔术师能够完成这样的魔法(需要备份上表),你可能会在理解了真相后惊叹于他的记忆。

但是当人工智能执行这种魔法时,它不仅仅是记忆。

在这个神奇的节目中,阿里云ET全面展示了人工智能的综合能力,如语音识别,语音合成,自然语言理解,实时图像识别和机器学习。

例如,在与华绍的交流中,ET不仅可以在屏幕下方“理解”华韶的文字和实时字幕,还可以给出相应的回答,回答流程。不仅如此,ET还“看到”华韶拥有一副以上的扑克牌。

在节目中,被称为“中国的好舌头”的华韶,在与ET的对话中加快了演讲速度。 ET仍然可以准确地实现实时语音识别,并在屏幕上输出字幕。其背后是阿里巴巴iDST技术团队开发的智能语音交互(智能语音交互)系统,包括语音识别,语音合成,自然语言理解等技术。

在ET识别黑卡的过程中,应用了人工图像识别技术。当观众绘制扑克牌时,ET已完成对五个观众的面部识别,并使用该算法建立器官轮廓定位,以识别是否有人转身。

目前,阿里云ET的人脸算法采用机器学习方法,涵盖了人脸检测,器官轮廓定位,人像美化,性别年龄识别,一对一人脸认证,一对多人脸识别等多个方向。包括卷积神经网络,监督?下降?方法等,实现高精度高效技术,人脸识别对LFW识别率达99.5%以上。

基于此,ET可以轻松识别黑卡观众的动作并准确报告五个观众的手。这个过程看起来很简单,其背后的算法和所需的大规模计算能力并非一蹴而就。

无论是语音识别还是图像识别,阿里云ET的底层都依赖于深度学习算法和大规模计算能力。复杂算法模型的训练通常需要数千亿的样本数据,这对其背后的计算能力提出了很高的要求。

事实上,ET可以做的不仅仅是魔术师。借助深度神经网络等机器学习技术,阿里云人工智能能够利用数据为整个城市提供思维和决策。目前,杭州政府联合阿里巴巴云等13家公司为该市安装了人工智能城市数据大脑,历史已有2200多年,使杭州成为一个自我调节和良性的城市。在交通运输试点领域,ET通过对交叉路口交通状况的预测来调节交通信号灯,使部分车辆的交通速度提高了11%。

人工智能正在以难以想象的速度融入您的生活。事实上,ET已经成为你周围真正的魔术师。

更多阿里云相关:阿里云官方网站阿里云服务器1000元阿里云新手礼包每周视频直播技术分享