直接前往內容

深入剖析:機器學習問答篇

對許多人來說,機器學習像是未來的技術。不過近來在日常生活中,機器學習的應用陸續崛起,包括 Google 電腦在圍棋比賽中的精湛表現,以及 Inbox by Gmail 自動填寫回覆內容的功能,都是很好的例子。這一切固然令人振奮,但有些人仍不明白機器學習是什麼,也不清楚其重要性,更難以理解為什麼辨識出相片中的小狗比想像中困難許多。因此,我們特別邀請在 Google 負責機器學習的研究員 Maya Gupta 為我們解惑。

從基本概念開始說起吧!到底什麼是機器學習?

機器學習技術會收集大量範例,找出其中的模式來解讀這些範例,然後再根據這些模式對新的範例做出預測。

以電影推薦為例,假設有十億名觀眾各自提出自己最喜愛的十部電影,我們就有大量範例可供電腦參考,進而掌握一般大眾喜愛的電影有哪些共通點。電腦接著會歸納出一些模式來解讀這些範例,例如:「喜歡恐怖電影的人,通常不喜歡愛情電影,但如果兩種電影中有相同的演員就能吸引他們。」之後,如果你告訴電腦你喜歡傑克尼柯遜主演的《鬼店》,電腦將推測你是否會喜歡同樣由傑克尼柯遜演出的愛情喜劇《愛您在心眼難開》,並挑選要推薦給你的 YouTube 影片。

瞭解了。那麼,這項技術實際上是怎麼運作的呢?

實際上,機器學到的模式可能非常複雜,難以透過文字解釋。以 Google 相簿來說,這項服務能夠讓你在自己的相簿中尋找有狗兒出現的相片。Google 是怎麼辦到的?首先,我們收集到大量設有「狗」標籤的範例 (拜網際網路之賜!)。同時我們也收集到大量設有「貓」標籤以及上百萬種其他標籤的相片,就不在這裡一一列出了 :)

接著,電腦會找出像素模式和色彩模式,以便推測圖片中是貓或狗,還是其他東西。一開始,電腦只會任意猜測哪些模式可用來辨識狗,再藉由比對一張狗的範例圖片來確認目前模式是否準確。如果目前模式誤將貓認成狗,電腦就會做出微調。接下來,電腦會比對一張貓的圖片,並視需要再一次調整模式來提高準確度。這樣的步驟會反覆進行大約十億次之多:讓電腦辨識範例圖片中的內容,如果辨識錯誤,就調整目前使用的模式,針對該範例提高辨識準確度。

到了最後,這些模式會形成機器學習模組,就像是深層神經網路,能夠大致正確地辨識狗、貓和消防員,以及許許多多其他事物。

聽起來未來感十足。目前還有哪些 Google 產品採用機器學習技術呢?

我們利用機器學習技術展開了各式各樣的新嘗試,Google 翻譯就是一個例子;這項服務能夠拍下某種語言的招牌或菜單,認出相片中的字詞和語言,然後神奇地將內容即時翻譯成你的語言。

你也可以對 Google 翻譯說出任何內容,以機器學習技術為基礎的語音辨識功能隨即會發揮妙用。語音辨識功能目前也用於許多其他產品,例如在 Google app 中辨識語音查詢內容,並且讓使用者更容易找到 YouTube 影片。

對於招牌、菜單等物件,只要將相機對準它們,就能立即取得翻譯,而且你甚至不需要連上網路就能使用這項功能。 *Word Lens 支援英文與二十多種語言的雙向對譯。
與使用不同語言的人交談。
以手寫方式輕鬆輸入鍵盤不支援的字元和字詞。
只要輸入你要翻譯的字詞即可。

那麼,Google 現在為何如此重視機器學習技術?

機器學習並不是一項嶄新技術,而是源自 18 世紀的統計學。但你說的沒錯,近年來我們的確積極發展這項技術,原因有三個。

首先,我們需要大量的範例,才能訓練電腦準確做出預測,即使是你我都能輕鬆辦到的事也一樣 (像是在相片中找出狗)。拜興盛的網際網路活動所賜,我們現在有豐富的範例來源可供電腦學習。舉例來說,現在全世界各種語言的網站上,都有數百萬張設有「狗」標籤的相片。

不過,有了大量範例還不夠。你不能只是把一大堆跟狗有關的相片擺在網路攝影機前面,就期望電腦從中學到什麼。電腦還需要一套學習程式。而不久前,這個領域 (以及 Google 本身) 才取得重大突破,讓機器學習程式變得更加精密,功能也更為強大。

然而,我們的程式仍不完美,電腦也還很遲鈍,因此我們得不斷觀看大量範例並反覆進行微調,才能改善程式的效能。這整個過程需要大量的運算能力,以及精細的平行處理技術才能辦到。不過,隨著軟體和硬體有了新進展,我們也得以完成這項挑戰。

有沒有什麼事情是電腦目前仍無法辦到,但導入機器學習技術後就有可能實現的?

還記得當你透過電話讀出信用卡號碼時,語音辨識功能必須費盡千辛萬苦才能辨識出十個不同的數字嗎?這彷彿是昨天才發生的事。然而,就在最近五年,語音辨識功能透過精密的機器學習技術有了突破性進展,現在你已經可以透過語音在 Google 上搜尋資料,而且這項功能日後還會變得更好用、更快速。

我認為機器學習技術甚至可以改善我們的服裝儀容。我不知道你怎麼想,但我實在很討厭試穿衣服!只要找到一家合適的牛仔褲品牌,我就會連買五件。但機器學習技術能把我們適合的品牌當做範例,推薦其他可能也適合我們的品牌。這問題有點超出 Google 的服務範圍,但我真希望有人可以研發這項功能!

接下來的十年內,機器學習技術會發展到什麼程度?

目前整個機器學習領域的目標之一,就是提升學習速度,以及減少學習時所需的範例數。其中一個方法 (也是 Google 致力發展的部分),就是為機器提供更多基本常識,在這個領域中我們稱之為「規則化」。

對於機器而言,什麼叫基本常識?這表示在一般情況下,範例的細微變化不會顛覆機器的認知。舉例來說,即使相片中的狗戴了牛仔帽,機器也仍然知道這是狗。

我們降低了機器學習程式對於枝微末節變化 (像是牛仔帽) 的敏感度,藉此灌輸這類基本常識。聽起來很簡單,但實際上只要稍有差錯,就會導致機器無法對重大變化產生反應。因此,我們仍在摸索如何找到平衡點。

機器學習技術最讓你期待的是什麼?讓你持續投注心力的動力為何?

我成長於西雅圖,聽過很多有關 Lewis 和 Clark 這些早期美國西部探險家的事蹟。機器學習研究也充滿著這種探險精神。我們在探索全新的事物,試著為了遠大的未來開疆闢土。

假如你有機會為 Google 的機器學習技術設計一個簡單又有意思的標語,那會是什麼?

如果一開始沒成功,那就再試個十億次。

返回頁首