详细解释:关于机器学习的问题解答

对很多人来说,机器学习技术似乎很超前。但近年来,机器学习技术已经越来越多地出现在我们的生活中 - 无论是 Google 计算机在围棋比赛中的精彩表现,还是 Inbox by Gmail 创建自动回复的功能,都是该技术的实际应用。虽然这些成果令人振奋,但有些人仍不清楚机器学习技术究竟是什么,为什么这种技术如此重要,以及为什么识别出照片中的狗并非听起来那么容易。因此,我们采访了 Google 负责机器学习技术的科研人员玛雅·古普塔 (Maya Gupta),请她来为大家进行解释。

我们先从基本概念说起。机器学习技术究竟是什么呢?

机器学习技术就是收集大量示例,找出能够解释这些示例的模式,然后利用这些模式对新示例进行预测。

以电影推荐为例。假设有十亿人分别告诉我们十部他们喜欢的电影。这样,计算机就可以利用这些大量的示例来了解人们喜欢的电影有哪些共同点。然后,计算机会归纳出一些模式来解释这些示例,比如“喜欢恐怖片的人通常不喜欢爱情片,但人们喜欢由相同演员出演的电影。”如果您告诉计算机您喜欢杰克·尼科尔森 (Jack Nicholson) 主演的《闪灵》,那么它可以较为准确地猜测您是否会喜欢他主演的爱情喜剧片《爱是妥协》,以及应该在 YouTube 上为您推荐哪些其他视频。

好的,基本上了解了。那么,这是如何应用到实际情况中的呢?

在实际情况中,机器学习的模式可能会非常复杂,很难用语言解释清楚。以 Google 照片为例,您可以使用它从自己的照片中搜索出有狗的照片。Google 是怎么做到这一点的呢?首先,我们会收集大量带“狗”标签的示例照片(这要归功于互联网!)。我们还会收集大量带“猫”标签的照片,以及带各种各样其他标签的照片,在这里就不一一列举了 :)。

然后,计算机会找出像素模式和颜色模式,以便猜测照片中是猫还是狗,还是其他东西。一开始,计算机只是随机猜测哪些模式可以很好地识别出狗。接着,它会观察一张有狗的示例图片,看看当前的模式能不能准确地识别出这条狗。如果误将猫识别成了狗,计算机就会对所用模式进行一些细微的调整。接下来,它会观察一张有猫的图片,并再次对模式进行微调,以便准确地识别出这只猫。计算机会将此过程重复大约十亿次:观察某个示例,如果判断有误,则对所用模式进行微调,以便针对该示例做出更准确的判断。

最后,这些模式会形成机器学习的模型(例如,深度神经网络),该模型在大多数情况下都可以准确识别出狗、猫、消防员以及许多其他事物。

听起来好超前啊。目前还有哪些 Google 产品在使用机器学习技术?

借助机器学习技术,Google 正在不断推出大量全新的功能。例如,Google 翻译可以将采用某种语言书写的路牌或菜单拍成照片,识别出其中的字词和语言,然后神奇地将内容实时翻译为您使用的语言。

您还可以对着 Google 翻译说出任何内容,采用机器学习技术的语音识别功能会随即自动识别并翻译您所说的内容。语音识别功能目前在许多其他产品中也得到了应用,例如在 Google 应用中识别语音查询内容,以及简化 YouTube 视频搜索流程。

对于标志、菜单等,只需将摄像头对准它们,即可立即获得翻译。您甚至无需连接到互联网。 *Word Lens 支持英语与二十多种语言之间的互译。
与讲其他语言的人交谈。
以手写方式轻松输入键盘不支持的字符和字词。
只需输入您要翻译的字词即可。

机器学习技术和人工智能是一回事吗?

事实上,这两个词对不同的人来说含义可能不同,但基本上,人工智能 (AI) 是用于描述计算机程序的一个非常宽泛的术语。如果某个计算机程序会尝试解决对人类来说非常简单的那一类问题(例如,看图讲故事),我们就可以说该程序采用了人工智能技术。人类还可以轻松做到很多神奇的事情,其中一件就是从示例中学习。这正是机器学习程序也要试图做到的:教导计算机从示例中学习。

有意思的是,弄清楚如何开发这些计算机程序后,我们有时可以扩展它们的功能,以便快速处理大量数据,从而解决非常棘手的难题,例如掌握围棋技能、同时为每个人规划交通路线、改善全国范围内的能源消耗情况,当然还有我非常喜欢的一项功能,就是在 Google 中找到最贴近个人需求的搜索结果。

Google 现在为什么如此重视机器学习技术?

机器学习并不是一项全新技术,它源自 18 世纪的统计学。但您说得没错,近年来我们已开始积极发展这项技术,原因有三个。

首先,我们需要大量的示例来教导计算机如何做出准确的预测,哪怕是对你我来说非常简单的事情(例如,找出照片中的狗)。得益于互联网上的各种活动,我们现在有丰富的示例来源可供计算机学习。例如,目前全球范围内各种语言的网站上有数百万张带“狗”标签的狗照片。

但拥有大量示例还不够。您不能只是把一大堆狗照片摆在摄像头前,就期望计算机能够学习到些什么 - 计算机还需要使用学习程序。近来,这一领域(以及 Google)取得了一些振奋人心的重大突破,这些机器学习程序更加精密,功能更强大。

但我们的程序仍不够完美,计算机也不够智能,因此我们需要观察大量示例并反复进行大量微调,最终达到我们的要求。这些都需要强大的计算能力和出色的并行处理能力。当然,软件和硬件的最新发展也是这一切得以实现的原因。

能否举个例子说明计算机目前无法做到,但有望在不久的将来借助机器学习技术做到的事情?

仿佛就在昨天,当您通过电话读出信用卡号时,语音识别功能还只能勉强识别出 10 个不同的数字。而在过去的五年间,得益于先进的机器学习技术,语音识别功能取得了惊人的进展。现在,您可以利用该功能进行 Google 搜索。不仅如此,该功能将会变得越来越完善,识别速度会越来越快。

我认为,机器学习技术甚至可以让我们更好地穿衣打扮。不知道大家的情况,但我自己很讨厌试衣服!如果发现适合自己的牛仔裤品牌,我会一口气买五条。但机器学习技术可以根据适合我们的品牌示例来推荐可能适合我们的其他品牌。这个问题有点超出了 Google 的工作范围,但我希望有人从事这方面的研究!

机器学习技术在十年后会发展成什么样子?

目前,整个领域都在尝试攻克的一个难题是,如何从更少的示例中更快速地学习。其中一种方法是让机器掌握更多常识(在该领域中,我们称之为“正则化”),Google 正在努力进行这方面的研究。

对机器来说,什么是常识呢?常识意味着,一般来说,机器不应该因为示例的细微变化而完全改变其认知。例如,照片中戴着牛仔帽的狗仍然是狗。

我们通过降低机器学习技术对不重要的细微变化(例如,戴牛仔帽)的敏感度,在学习程序中灌输这种常识。这说起来容易,但如果出现差错,则会导致机器对重大变化不够敏感!因此,我们仍在摸索如何找到平衡点。

机器学习技术最让您感到兴奋的地方是什么?促使您从事该领域工作的动力是什么?

我在西雅图长大。在那里,我听过很多美国西部早期探险者的故事,例如路易斯 (Lewis) 和克拉克 (Clark) 的探险故事。机器学习技术的研究工作也需要这种探险精神 - 探索新鲜事物,然后披荆斩棘开创美好未来。

如果要为 Google 的机器学习技术设计一个车尾贴标语,您觉得应该是什么?

一次不成没关系,可以再试十亿次。

返回页首