百度首席科学家吴恩达近日接受科技博客GigaOM采访时表示,创造力并非深不可测,人工智能不仅可以获得创造力,甚至有可能具备意识。
以下为原文内容:
吴恩达2014年5月出任百度首席科学家。他负责领导该公司的全球人工智能战略和基础设施建设。他领导百度北京研究院和百度硅谷研究院,带领技术团队在语音、大数据和图片搜索领域开展研发工作。
除了任职于百度外,吴恩达还是斯坦福大学计算机科学系的兼职教授。2011年,他领导开发了斯坦福的MOOC(大规模开放在线课程)平台,并教授了一门在线机器学习课程,听课学生已经超过10万。他后来参与创办了Coursera,至今仍然担任董事长。
在此之前,吴恩达还是谷歌大脑深度学习项目的创始负责人。他署名和联合署名的机器学习、机器人及相关领域论文超过100篇。他2013年入选《时代周刊》评选的“全世界最有影响力的100人”。他先后在卡内基梅隆大学、麻省理工学院和加州大学伯克利分校获得学位。
他将于2月15日至16日在旧金山举行的Gigaom AI大会上发表演讲,以下是我们对他的采访。
问:请给我们讲讲你在百度的日常工作。你的人工智能团队都做些什么?
答:我们会开发基础的人工智能技术,从语音识别到计算机视觉,从神经语言程序学到数据仓库,再到用户理解。我们会利用这些技术支持百度的很多内部业务,还会孕育新的方向。例如,在百度内部,我们所有的重要业务领域都已经被人工智能改变。从网络搜索和广告投放到机器翻译和餐厅推荐。所以人工智能已经在百度随处可见。
除此之外,我们还看到了很多由人工智能创造的新机会,例如更好的对话式医疗助手——它采用聊天盒子的形式。我们还使用面部识别开发了十字转门,可以在有权限的人接近时自动打开。所以说,我们的团队正在追求垂直领域的各种新机会。
问:你做的事情有没有涉及基础研究的内容?你有没有做过一些或许有用,但还不知道具体如何使用的事情?
答:我们会从事很多基础研究。有些研究最初是一项非常成功的基础研究,经过一段时间之后,当你从中看到实用价值后,它就没有那么基础了。我们有很多这样的研究。我们在百度开展的早期面部识别工作最初就像是基础研究,但现在已经成为融入产品的一项服务,供数以亿计的用户使用。
我们早期在神经机器翻译领域的工作最初也是基础研究。事实上,此事包含着鲜为人知的一面:神经机器翻译是一项最早由中国开拓、发展和推出的技术。美国公司在这方面远远落后于百度,这个例子可以说明我们的中国团队处于领先地位。
我感觉我们在面部识别领域展开的计算机视觉基础研究同样处于先驱地位。我们目前正在学习机器人和机器学习等领域展开广泛的基础研究,涵盖从基础研究到应用的整个过程。
问:百度的团队是什么样子?你们是否普遍采用小团队形式?是否以开发人员为主?你们认为怎样才能有效分配有限的资源?
答:这是个复杂的问题。我们的很多项目一开始都很小。比如一年前,自动驾驶团队只有22人。但在取得一些进展,展示出最初的前景,并制定了经过深思熟虑的商业计划后,便可因此投入更多资源,现在的团队可能已经有几百人了。这一开始是一个基础研究项目,但现在成为了全新的业务方向。
所以我们有很多项目最初的团队规模都很小,但在取得一些进展,价值越发明确后,便会将团队规模扩大到几十人,甚至几百人。
问:你认为当今人工智能技术有哪些难题可以在5年内解决?有哪些事情如今看来很难实现,但5年后会变得稀松平常?
答:从研究角度来看,我认为迁移学习和多任务学习是我需要探索的领域之一。当今机器学习技术的多数经济价值都是应用学习,学习许多标签化的数据,以此完成你希望解决的具体任务。例如,利用庞大的标签化人脸数据库学习识别人脸。对于很多任务而言,我们在特定的垂直领域根本没有足够的数据来构建自己的系统。
所以今后的一大领域是迁移学习,你可以让一套机器学习系统从事不同的任务。比如让它学会识别常见物体。学会了识别常见物体后,可以利用其中的多少知识来从事面部识别这项具体任务?
从研究角度来看,我认为这很有前景,而且有一些技术目前已经广泛应用于迁移学习,但我认为相关的理论和最佳实践仍然处于早期阶段。我们之所以看好迁移学习,是因为现代深度学习技术已经可以为具备海量数据的问题提供不可思议的价值。这可以为很多应用模式的发展提供巨大的动力。
以语音识别为例。我们在某些语言上拥有海量数据,比如普通话。某些语言的使用人数很少,永远不可能有这么庞大的数据。因此,可以将我们从普通话学到的知识迁移到这种语言,从而则针对只有少数人使用、数据量很小的中国方言提供语音识别。我们的确有这方面的技术,我们目前也在从事这方面的开发,但我认为这一研究领域的进步可以帮助人工智能解决更多问题。
问:人工智能是否为我们提供了有用的信息,帮助我们了解人类智能?或者反过来,我们是否利用对人类智能的了解改进人工智能的效果?又或者它们虽然都有“智能”这个词,但实际上却截然不同?
答:神经科学领域的知识对最近的人工智能发展只起到了一点作用。从现实角度看,尽管神经科学经过了几个世纪的发展,但我认为我们至今对人类大脑的工作方式仍然很不了解,所以我们对人类大脑工作方式的了解并没有给人工智能带来太多启发。但实际上,人工智能技术当前的进步更大程度上源于计算机科学原理,而非神经科学原理。
尽管如此,人工智能已经非常擅长自动处理人类所能从事的事情。例如人类非常擅长识别语音,而人工智能语音识别也在从事相同的任务。人类非常擅长识别人脸,人工智能也在这一领域取得了快速进步。
结果就是,我们的工具更擅长自动处理人类所能完成的工作,而不是解决人类都无法胜任的任务。原因有很多,但其中之一在于,当我们选择一项人类能够完成的任务,然后让人工智能介入其中之后,就会努力研究为什么人类完成任务的速度更快。所以,如果你看看人工智能的各种垂直领域,肯定会发现一些连人类都不太擅长的任务。
我认为亚马逊现在为我推荐的书甚至比我妻子推荐的还好。要知道,我妻子对我非常了解。之所以出现这种情况,是因为亚马逊汇总了海量数据,了解我浏览过哪些书,在网站上看过哪些书。从这个角度看,它远比我的妻子更了解我在看什么内容。
虽然也有一些例外,但当人工智能试图处理人类力所能及的事情时,我认为整体的进步速度很快。
问:谈到人工智能所能完成的任务,你总是显得很保守。我猜之所以这样,部分原因在于过高的预期曾经对科研工作产生过极大的影响,尤其是在资金方面。是这样吗?
答:我通常很务实,也很实际。但我希望提供一个略有不同的视角。如果我要组建一个团队来治愈人类所有的疾病,那肯定值得庆祝。这是个伟大的任务。但说实话,有时候把目标定得太高会付出代价。在当今的硅谷,这显然不受欢迎,而且逆势而为。硅谷现在都喜欢谈论登月那种级别的目标,因为即便你失败了,仍然会成为明星。
但实际上,我认为把目标定得太高会付出代价。所以,跟组建团队来治愈人类所有的疾病相比,更有成效、对世界更有利的做法或许是解决疟疾问题。所以我认为,我们可以通过人工智能技术给世界带来一些重大改变。可以用无人驾驶汽车改变交通状况,也可以利用人工智能技术改变物流行业,甚至可以用人工智能技术彻底改变医疗技术。可以借助人工智能技术给世界带来重大变革。
因此,我的很多工作都瞄准了这些具体而务实的目标,因为我认为,相比于花时间描绘科幻小说那种几百年可能都无法实现的场景,这样做对世界更为有利。我知道这种思维方式在硅谷已经不再流行,甚至逆势而为。
尽管如此,作为一个社会,我们应该从事各种各样的事情。所以我认为世界会变得更好,有的人会通过盖茨基金会和世界卫生组织解决疟疾问题,我们在对抗疟疾的过程中或许已经取得了实质性进展。但同时也有一些人在解决人类的所有疾病。以不同方式分配社会资源是件好事。
但我的确认为,如果能够思考“我们有信心解决哪些任务?”而不是“我们应该投资哪些遥不可及的梦想?”肯定有助于我们所在的领域取得进步。我们团队有一部分人在从事这些工作,但仅占很小一部分。
问:你相信有可能实现强人工智能(AGI)吗?如果相信,你认为这有可能借助摩尔定律,在我们所知的技术革命道路上实现吗?或者,要实现强人工智能,是否需要借助全新的突破,甚至我们不曾预料的突破?
答:要实现强人工智能肯定需要很多突破。这很可能发生。既包括软件算法突破,也有可能包括硬件突破。但究竟是在十年、百年还是千年以后实现,我很难预测。
问:你认为人类的创造力(例如创作剧本或伟大的小说)需要借助强人工智能技术,还是利用现有的技术即可完成?
答:我认为很多时候,当我们不知道某个东西的创造流程时,会思考很多创造力方面的东西。例如,加里·卡斯帕罗夫(Garry Kasparov)曾经说过,他从深蓝的招数中看到了创造力。而作为技术人员,我了解国际象棋程序的运行规则。通过海量计算,它们使出的国际象棋招数甚至能被象棋大师视作创造力。
当我自己参与到创造流程之后,我发现创造力是很困难的事情,需要将很多小东西逐渐拼凑起来,然后形成一个似乎不知来自何处的大东西。但如果有人没有看到所有的小东西,那就很难将所有小东西拼凑成有创意的东西。有的时候,与从内部观察相比,从外部观察创造力会感觉这更像是一种魔术。
我的艺术家朋友会反复训练自己的笔触,一遍一遍不厌其烦地绘制相同的东西,逐渐取得进步。我的祖父是一名画家,他通过日积月累的进步创造出优异的作品,当你见到最终的作品而没有目睹整个过程的点滴进步时,我认为你更会感觉这像是一场魔术。但如果你本人需要从事各种工作来实现这个点滴进步的过程,恐怕就不会有这么强烈的冲击。
问:你的言外之意是说,人类的创造力是可以通过计算获得的。在某个时间范围内是合理的。这并不是什么超凡脱俗的神秘能力,并没有超越我们的认知。是这样吗?
答:没错。无论是偶尔令人眼前一亮的象棋妙招,还是找到一句人类未曾思考过的句子解释,抑或创造一件简单的艺术品,我认为机器的行为在某些人的眼中已经具备了一定的创造力。我们可能会继续看到点滴的进步,而机器最终也将在未来几年更具“创造力”。
问:你的团队在地理上是如何分布的?多数人都在哪里?
答:主要在北京,我们在美国大约有一个100人的团队,北京有几个大型团队,在上海和深圳还有几个小团队。
问:有了机器人,你可以看到国家和地区的重点开始浮现。例如,与其他地方相比,日本更重视提升机器人的友好度,让人类可以与之建立情感联系。人工智能领域是否也是这种情况?因为你之前提到面部识别已经进入中国。不同公司、不同地区或不同国家对于人工智能的看法是否会有差异?
答:我认为面部识别就很好地证明经济压力和一流的商业模式已经推动中国实现了很大进步.。从产品角度来看,不同的商业压力和产品优先级导致不同国家对不同领域的投资力度有所差异。
中国就有一些现成的例子:在中国,通过手机键盘输入中文比输入英文更痛苦。由此便产生了很多压力,催生了更好的手机语音识别技术。所以我感觉,百度引领的很多语音识别突破都源自产品压力,必须为用户提供有效的语音识别功能。
具体到机器翻译,美国针对神经机器翻译展开了很多公关工作。但鲜为人知的是,神经机器翻译是由中国率先开拓、发展和推出的。美国大型公司后来才开始发展这项技术。我认为,之所以出现这种现象,原因之一在于中国人很需要把公开内容翻译成中文。而英文世界里已经有很多英文内容。中文内容同样很多,但外国内容也在快速翻译成中文。这就像一种文化现象。由于世界上有很多英文内容,我认为说英语的人接触外语内容的压力较小。
面部识别业务在中国进展飞快,因为作为一个优先使用移动设备的社会,中国人已经习惯了开展重大的财务交易。例如,你可以向百度申请教育贷款,我们就会根据你在手机上的行为贷给你很多钱。而当我们通过手机给某人汇去很多钱时,就很希望能验证此人的身份。所以面部识别就成为这一领域的关键技术。正是因为面对这些压力,才使得面部识别在中国实现了快速发展,速度超过其他国家。
中国和美国都在人工智能领域展开了很多创新。我猜还有其他领域。英国在人工智能游戏领域进行大举投资,我本人并没有投入这一领域的研究,但我估计不同组织有着不同的兴趣和重点。
我认为当今的人工智能发展已经成为一个全球化的现象。我感觉中国还有很多创新是英语世界的人没有意识到的。问题不在于保密与否,关键是缺乏流畅的交流能力。例如,我几周前刚刚参加了NIPS大会。短短一天内,NIPS上的多数重要讲话都已经总结和记录成中文,并发表在中国的网站上。也就是说,把巴塞罗那的英语会议上的知识翻译成中文的速度很快,效率很高。这样一来,很多中国研究人员一天之内就能看到这些内容的中文翻译。我认为,正是因为很多中国人都能用英语流利地阅读和讲话,才使之成为可能。
可惜的是,把中文翻译成其他内容的速度却慢得多,这完全是因为中国之外的很多研究人员都不说中文。所以虽然中国发明了很多东西,也有很多东西广为流传,但英文世界的人却并没有注意到。有的时候,英语世界的公司可能要到一年以后才能发明类似的东西。
因此,我希望能够帮助人们加快知识的反向传播速度。因为,如果我们建立一个更加国际化的研究社区,全世界都将取得更快的进步速度。
我觉得还有一些更具体的例子。一年多以前,普通话短语的语音识别率已经超过人类,但这个结果直到最近才在全球广为人知。我还见过很多例子,从语音识别进步到神经机器翻译进步,再到GPU开发流程的进步。但我希望在中国发明出来之后,能够尽快传播到美国。
问:你能否介绍一些网站或期刊,方便我们找到这些信息?
答:中文的知识传播方式与美国不同。人工智能知识在中国社交媒体上传播速度极快,如果你不亲身体验,就很难理解这种模式。此外还有很多网站,但很多都是中文网站。你可以在Twitter上关注我,看看我能做点什么。
问:你对人类意识有什么看法?或者更具体地说,你是否相信人类的意识本质上也是一种计算?
答:我不知道意识是什么。从哲学上讲,关于你周围的人是真的有意识,还是行尸走肉,抑或是通过计算表现出意识的机器人,一直都有争论。毕竟,我们如何知道自己之外的其他人真的有意识,而不是机器人?我不认为意识是计算机永远无法达到的,但目前还不清楚究竟如何实现,需要多少年才能实现。
随时随地了解最新ICT产业资讯,请扫描二维码,或搜索"chnsourcing",关注中国外包网官方微信。
作者:长歌