首页 >> 新闻 >> 科技新闻 >> 谷歌教AI画画:会让它像人类那样思考吗?

谷歌教AI画画:会让它像人类那样思考吗?

2017年06月09日 10:50 来源:网易科技报道 
,《大西洋月刊》(The Atlantic)撰文称,人类最早在岩石上画图形的时候,实现了巨大的认知跃进——如今,计算机也在学习做同样的事情。要是谷歌教导AI去绘画,那会有助于它思考以及像人类那样思考吗?

  (原标题:If Google Teaches an AI to Draw, Will That Help It Think?)

谷歌教AI画画:会让它像人类那样思考吗?

  网易科技讯 6月9日消息,《大西洋月刊》(The Atlantic)撰文称,人类最早在岩石上画图形的时候,实现了巨大的认知跃进——如今,计算机也在学习做同样的事情。要是谷歌教导AI去绘画,那会有助于它思考以及像人类那样思考吗?

  以下是文章主要内容:

  想象一下,有人叫你画一头猪和一辆卡车。你可能会画成这样:

谷歌教AI画画:会让它像人类那样思考吗?

  这很简单。但接着,想象下你被要求画个猪卡车。作为人类,你会直观地想到如何将猪和卡车这两个物体的特征结合起来,也许你会画成下面这样:

谷歌教AI画画:会让它像人类那样思考吗?

  看看那条小小的、弯曲的猪尾巴,看看驾驶室有点圆的窗口,该窗口也会让你想到眼睛。车轮变成了蹄状,又或者说猪脚变得像车轮。如果你这么画,同为人类的我会主观地认为这是对“猪卡车”很有创意的一种解读。

  谷歌的AI 绘画系统SketchRNN

  直到最近,只有人类能够完成这种概念转变,但现在并不只有人类能够做到了。该猪卡车实际上是极具吸引力的人工智能系统SketchRNN输出的作品,该系统是谷歌探究AI能否创作艺术的新项目的一部分。该项目名为Project Magenta,由道格·艾克(Doug Eck)领导。

  上周,我在谷歌大脑(Google Brain)团队位于山景城的办公室拜访了艾克。该办公室也是Magenta项目的所在地。艾克非常聪明,也很谦逊。他于2000年在印第安纳大学获得计算机科学博士学位,后来专注于研究音乐和机器学习技术,一开始是在蒙特利尔大学(人工智能的温床)担任教授,后来到谷歌供职。在谷歌,他最初从事Google Music音乐服务项目,后来转到谷歌大脑团队参与Magenta项目。

  据艾克说,他打造可创作艺术的AI工具的雄心最初只是夸夸其谈,“但经过几轮的反复思考后,我觉得,‘我们当然需要做这个,这非常重要。’”

  正如他和他的同事大卫·哈(David Ha)所写到的,SketchRNN的意义不仅仅在于学习如何画画,而在于“用类似于人类的方式概括归纳抽象的概念。”他们并不想要打造一台能够画猪的机器。他们想要打造一台能够识别和输出“猪的特征”的机器,即便机器得到的是诸如卡车的提示性语言,它也能够不受影响,作出准确的判断。

  隐含的观点是,当人的画画的时候,他们会对这个世界做抽象的概念。他们会去画“猪”的广义概念,而不是画特定的动物。也就是说,我们的大脑如何存储“猪的特征”信息和我们如何画猪之间存在关联性。学习如何画猪,你可能就能学到人脑合成猪的特征的能力。

  这是谷歌的AI软件的运作模式。谷歌开发了一款名为“Quick, Draw!”的游戏,在人们玩该款游戏时,它会生成一个涵盖人类各种各样的绘图(如猪、雨、救火车、瑜伽动作、花园和猫头鹰)的庞大数据库。

  当我们画的时候,我们是将丰富多彩、熙熙攘攘的世界压缩成少数的一些线条或者笔画。正是这些简单的笔画构成了SketchRNN底层的数据集。借助谷歌开源的TensorFlow软件库,每一种绘图——猫,瑜伽动作,雨——都能够用于训练一种特定的神经网络。这有别于引起媒体广泛报道的那种基于照片的绘图系统,比如机器能够渲染出梵高或者原来的DeepDream风格的照片,又或者能够画出任何的形状,然后给它填充“猫的特征”。

  这些项目都让人类觉得很不可思议。它们相当有趣,因为它们所产生的图像看起来就像来自人类对现实世界的观察,尽管不完全像。

  像人那样用绘图表达所看到的东西

  然而,SketchRNN的输出作品一点都称不上不可思议。“它们感觉很真实,”艾克说,“我不想说‘很像人类的作品,’但它们感觉很真实,那些像素生成工具则不然。”

  这是Magenta团队的核心洞见。“人类……并不是把世界当成一个像素网格去理解,而是发展出抽象的概念去表示我们所看到的东西。”艾克和大卫·哈在描述其工作的论文中写道,“我们从小时候就能够通过用铅笔或者蜡笔在纸上绘画来传达我们所看到的东西。”

  如果人类能够做到这一点,那谷歌会希望机器也能够做到。去年,谷歌CEO桑达尔·皮查伊(Sundar Pichai)称他的公司“以人工智能为先”。对于谷歌来说,AI是其“将全世界的信息组织起来,使之随处可得,随处可用”初始使命的一种自然而然的延伸。现在不同的地方在于,信息由人工智能来组织,然后使得它们能为广大用户使用。Magenta是谷歌组织和理解一个特定的人类领域的疯狂尝试之一。

  机器学习是谷歌所采用的各种工具最广泛的一个概念。它是通过编程让计算机自学如何执行各种不同的任务的一种方式,常见的方式是给计算机注入标签数据来进行“训练”。进行机器学习的一种热门方式是,借助以人脑的连接系统为原型的神经网络。不同的节点(人工神经元)会相互连接,它们有着不同的权重,会响应部分输入信息,但不响应其它的输入信息。

  近年来,多层级神经网络被证明在解决棘手的问题上非常成功,尤其是在翻译和图像识别/操纵上。谷歌在这些新架构上重新构建了很多的核心服务。这些神经网络模拟人类大脑的运作过程,其互相连接的层可识别输入信息(比如图像)不同的模式。低级别的层可能含有响应光明与黑暗简单的像素级模式的神经元。高级别的层则可能会响应狗的脸、汽车或者蝴蝶。

  构建带有这种架构和机制的网络会带来不可思议的成效。原本极其困难的计算难题变成了调整模型的训练,然后让一些图形处理单元运算一会的问题。正如吉迪恩·刘易斯-克劳斯(Gideon Lewis-Kraus)在《纽约时报》所描述的,谷歌翻译(Google Translate)曾是一个开发超过10年的复杂系统。该公司后来利用深度学习系统仅仅花了9个月就重新构造了一个谷歌翻译系统。“该AI系统一夜之间就有了巨大的提升,这种提升相当于老系统在整个生命周期积累的全部提升。”刘易斯-克劳斯写道。

  正因为此,神经网络的使用量和类型呈现井喷式增长。SketchRNN方面,他们使用可处理输入序列的递归神经网络。他们用人们画各种不同的东西时连续画下的笔画来训练该网络。

  用最简单的话来说,这种训练就是一个编码的过程。数据(绘图)输入之后,该网络会尝试想出它在处理的东西的一般性规则。那些概括是数据的模型,数据存储在描述网络中的神经元的倾向的数学计算当中。

  那个结构被称作潜伏空间或者Z(zed),是猪的特征或者卡车的特征又或者瑜伽动作的特征方面的信息存储的地方。正如AI行业人士所说的,叫系统做个样本,即叫它画出它训练的东西来,SketchRNN就会画出猪或者卡车又或者瑜伽动作。它所画的东西,就是它所学到的东西。

  SketchRNN 能够学到什么?

  SketchRNN能够学到什么呢?下图是一个接受过消防车绘画训练的神经网络所生成的新消防车。在该模型中,有个名为“温度”的变量,它可让研究人员上下调整输出的随机性。在下图中,偏蓝色的图像是“温度”下调后的产物,偏红色的图像则是“温度”上调后的产物。

谷歌教AI画画:会让它像人类那样思考吗?

  又或者,你可能更喜欢猫头鹰:

谷歌教AI画画:会让它像人类那样思考吗?

网友有话说
深圳玩乐活动11群
版权与免责声明:
①凡本网注明"来源:深港在线综合"的所有作品,均由本网编辑搜集整理,并加入大量个人点评、观点、配图等内容,版权均属于深港在线,未经本网许可,禁止转载,违反者本网将追究相关法律责任。
②本网转载并注明自其它来源的作品,目的在于传递更多信息,并不代表本网赞同其观点或证实其内容的真实性,不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时,必须保留本网注明的作品来源,并自负版权等法律责任。
③如涉及作品内容、版权等问题,请在作品发表之日起一周内与本网联系,我们将在您联系我们之后24小时内予以删除,否则视为放弃相关权利。
深港橱窗
赞助商
热图推荐
实用信息