日期归档
展会信息
您当前的位置是:首页>>展会信息>>正文

谷歌用 AI 让自拍一键变表情包,斗图从此立于不败之地

发布时间:2019-09-02  浏览次数:1301   文章來源:www.midg.org

注意:为了让您在聊天中立于不败之地,Google使用了机器学习技术,这是一种工具的最新开发,它允许您使用自拍来生成个人表达包,并在您自己的聊天软件Allo上进行更新。

拍照,分享和重新观看 - 自拍已成为许多人的日常习惯。我们采取自拍肖像,自画像,自画像,“早上自拍,我醒来”。自画像已经成为人类社会行为的一部分,长期以来一直被用来展示自己。对于一些人来说,自画像表现出来;其他人,自画像展示了他们希望别人思考的东西。还有一些人想要同时展示这两者。自拍是基于现实的直观表达,自我表达比现实更舒适和放松。

机器学习驱动的聊天表情符号

谷歌的Allo内置机器学习驱动程序聊天程序。它是网络与艺术家合作的产物。想象一下,在你的表达式回复栏中,有一个按钮 - “自动更改表达式”,可以自动生成你的“漫画版”。触摸按钮,程序将提示您自拍。接下来,谷歌的图像识别将识别你的脸并将你的功能扫描成一个由Lamar Abrams绘制的工具包,Lamar Abrams是一个故事板画家和作家,其杰作是广受好评的在线卡通Steven Universe系列。该套件可存储数百个眼睛,鼻子,脸部,发型和眼镜元素。谷歌宣称该工具包可以产生5630亿个不同的面孔。系统会生成原始漫画,您可以进行调整:更改发型或更改为不同的眼镜。最后,机器将自动生成22个表达式。

该工具源于一个内部研究项目,以查看机器学习是否可以使用自拍来生成即时卡通人物。但正如谷歌用户体验计划负责人杰森康威尔所指出的那样,制作一个人的漫画不是最终目标。 “你怎么做的不仅表达了你自己的外表,还表达了你的个性?”康威尔说,“这个问题非常有趣。它既可以呈现机器学习,也可以呈现计算机视觉,也可以呈现人。这就是Jennifer加入的原因,为您提供表达自己的艺术方式。

Cornwell提到了着名艺术总监Jennifer Daniel,他是第一位在Richard Turley时代创造了《Bloomberg Businessweek》着名视角的设计师,后来她为《the New York Times》制作了一系列视觉专栏。丹尼尔指出,“插图可以传达自拍无法表达的情绪状态。”自拍是您理想的状态。相比之下,表达是对你感情的升华和夸张。因此,表达非常有趣和有趣:你可以拿一块比萨饼,或者成为带有唾液的僵尸。康威尔说:“我们的目标不是确切的事情,我们要让用户创造他们喜欢的东西。”因此,用户测试尊重人们的感受,会提出问题:你是否看到自己在这张照片中?你的朋友可以认出你吗?

谷歌将这个项目归类为一个长期项目,旨在探索使机器学习更广泛可用的新方法。据谷歌称,谷歌的机器学习水平领先全球。如果它使机器学习成为应用程序和网站的必备功能,其产品将粉碎竞争对手。根据Google的计划,Allo已成为各种新机器学习应用程序的试验平台。 Cornwell说:“我们在Allo平台上的实验旨在找到通过机器学习更好地传达信息的方法,从准确的时间表到确切的时间表,再到在准确的时间表达准确的感受。”

这听起来有点可怕,好像Allo试图取代我们并成为对话的必需品?但是,在实践中,应用程序几乎是不可避免的。当有人向您发送消息时,Allo会根据您的对话历史记录快速回复您。例如,如果您的朋友向您发送她的跳伞照片,系统将回复:“太棒了!”。或者,你正在一个小组聊天,Allo将使用机器学习弹出一系列定制的有趣图片来回复。这个想法是,即使你不在那里,你也可以增强表达能力,就好像你是亲自一样。康威尔说:“我们在很多其他方面都在思考同样的问题,艺术和机器学习将如何相遇?”但他拒绝透露谷歌的研究方向。与此同时,丹尼尔承认将推出新的表情符号,每个表情符号由不同的艺术家推出,具有新的风格。雷锋网认为,如果有这样一个新的表达包,你能把自己变成一只可爱的狗吗?请让这一天快到!

丹尼尔指出,这个项目代表了一个新的艺术和工程交叉点。毕竟,我们刚刚开始触及机器学习在艺术中的作用。如果达芬奇还活着,很难相信蒙娜丽莎会是什么样子。相反,也许这将是一个用户特定的图像,它可以重新创造她自己的神秘女性形象,也可以跨越不同的文化和时代。但目前我们还没有在惠特尼双年展上找到任何酷感。也许我们需要像谷歌这样的公司来打破僵局。已经解决美国技术设计领域胜利的丹尼尔一直都很直率。为了与谷歌合作,她评论道:“我对工程与艺术合作以及这个合作平台感兴趣。在这个平台上,我们不仅创造了内容,还创造了产品本身。

传统计算机通过分析图像的像素,通过算法确定属性的值,以及通过像素值评估颜色,形状或纹理来转换自拍的艺术。然而,人们的自画像现在在不同的背景灯下有各种姿势。虽然很容易识别诸如光的定性特征,但是可以辨别出眼睛的颜色。但这对于计算机来说是一项非常复杂的任务。这是因为当人们认出眼睛的颜色时,他们不仅要观察眼睛的像素值,还要考虑周围的环境。

为了解决这个问题,我们研究了一种类似于人眼选择特征的算法,而不是传统的编码方法,来解释每种光照条件下眼睛的颜色。同时,我们可以从头开始创建一个大型神经网络,也许我们可以做到这一点。我们想要一种更有效的方式来实现我们的目标,因为将面孔变成漫画将是一个漫长而艰巨的过程。

为了创造您期望从朋友那里得到的图像,我们与艺术团队一起创造了各种元素。例如,艺术家最初在人工干预下为实验设计了发型,并且训练网络与相应的漫画相匹配以进行自拍。之后,手动判断输出表达式与输入照片之间的匹配程度,以了解该工具的性能。在某些情况下,评估者认为某些风格不是很好,因此艺术家创造了更多神经网络可以识别的元素。

评估者对发型进行分类,左手图标越多,表示它们越近。在达成共识后,驻地艺术家Lamar Abrams根据图片的共性创建了表达方式。

避免恐怖谷效应

在美学研究中,有一个着名的问题是“恐怖谷效应” - 一个假设,即如果人类复制品几乎就像一个真实的人,那将是令人作呕的。在机器学习中,如果您遇到计算机对您的看法并比较您对自己的看法,这可能会变得更加复杂。

与准确复制一个人的外观相比,获得一个低分辨率的模型,如表情和贴纸,让团队探索通过返回图像来增强表达,这不是为了重现现实,而是更多地打破规则。

该团队与艺术家Lamar Abrams一起设计了超过5630亿的投资组合

将像素转换为艺术漫画

计算机如何感知您,您如何看待自己以及您希望如何展示自己,以及如何协调两者之间的关系是一种艺术实践。这是一个自定义功能,包括不同的发型,肤色和鼻子形状,这是至关重要的。毕竟,漫画的定义是主观的。美学是由种族,文化和阶级定义的,它导致人们无意识地排斥自己。因此,我们努力创造的空间有不同的种族,年龄,男性,女性和雌雄同体。我们的团队将继续评估研究结果,以防止培训系统出现偏差。

为身份和情感创建广泛的调色板

没有“普遍的美学”或“单调的你”这样的东西。人们与父母交谈的方式与他们与朋友交谈的方式以及与同事交谈的方式不同。当你有很多社交角色时,制作一个虚拟化身是不够的。为了解决这个问题,Allo团队正在研究一系列艺术声音,以帮助他人扩大声音。目前发布的第一种风格可能是黑色和黑色风格,下一个风格可能会更加可爱。在那之后,也许他们会把你变成一只狗。如果表情符号扩展了沟通的世界,那么最激动人心的一点不是这种技术和语言是如何演变的,而是人们如何思考工具本身的功能。

雷锋网知道,Allo目前在Android系统上可用,很快就会在iOS上推出。

通过CO.DESIGN

雷锋网版权文章,禁止擅自复制。