深入剖析：機器學習問答篇

對許多人來說，機器學習像是未來的技術。不過近來在日常生活中，機器學習的應用陸續崛起，包括 Google 電腦在圍棋比賽中的精湛表現，以及 Inbox by Gmail 自動填寫回覆內容的功能，都是很好的例子。這一切固然令人振奮，但有些人仍不明白機器學習是什麼，也不清楚其重要性，更難以理解為什麼辨識出相片中的小狗比想像中困難許多。因此，我們特別邀請在 Google 負責機器學習的研究員 Maya Gupta 為我們解惑。

從基本概念開始說起吧！到底什麼是機器學習？

機器學習技術會收集大量範例，找出其中的模式來解讀這些範例，然後再根據這些模式對新的範例做出預測。

以電影推薦為例，假設有十億名觀眾各自提出自己最喜愛的十部電影，我們就有大量範例可供電腦參考，進而掌握一般大眾喜愛的電影有哪些共通點。電腦接著會歸納出一些模式來解讀這些範例，例如：「喜歡恐怖電影的人，通常不喜歡愛情電影，但如果兩種電影中有相同的演員就能吸引他們。」之後，如果你告訴電腦你喜歡傑克尼柯遜主演的《鬼店》，電腦將推測你是否會喜歡同樣由傑克尼柯遜演出的愛情喜劇《愛您在心眼難開》，並挑選要推薦給你的 YouTube 影片。

瞭解了。那麼，這項技術實際上是怎麼運作的呢？

實際上，機器學到的模式可能非常複雜，難以透過文字解釋。以 Google 相簿來說，這項服務能夠讓你在自己的相簿中尋找有狗兒出現的相片。Google 是怎麼辦到的？首先，我們收集到大量設有「狗」標籤的範例 (拜網際網路之賜！)。同時我們也收集到大量設有「貓」標籤以及上百萬種其他標籤的相片，就不在這裡一一列出了 :)

接著，電腦會找出像素模式和色彩模式，以便推測圖片中是貓或狗，還是其他東西。一開始，電腦只會任意猜測哪些模式可用來辨識狗，再藉由比對一張狗的範例圖片來確認目前模式是否準確。如果目前模式誤將貓認成狗，電腦就會做出微調。接下來，電腦會比對一張貓的圖片，並視需要再一次調整模式來提高準確度。這樣的步驟會反覆進行大約十億次之多：讓電腦辨識範例圖片中的內容，如果辨識錯誤，就調整目前使用的模式，針對該範例提高辨識準確度。

到了最後，這些模式會形成機器學習模組，就像是深層神經網路，能夠大致正確地辨識狗、貓和消防員，以及許許多多其他事物。

聽起來未來感十足。目前還有哪些 Google 產品採用機器學習技術呢？

我們利用機器學習技術展開了各式各樣的新嘗試，Google 翻譯就是一個例子；這項服務能夠拍下某種語言的招牌或菜單，認出相片中的字詞和語言，然後神奇地將內容即時翻譯成你的語言。

你也可以對 Google 翻譯說出任何內容，以機器學習技術為基礎的語音辨識功能隨即會發揮妙用。語音辨識功能目前也用於許多其他產品，例如在 Google app 中辨識語音查詢內容，並且讓使用者更容易找到 YouTube 影片。

對於招牌、菜單等物件，只要將相機對準它們，就能立即取得翻譯，而且你甚至不需要連上網路就能使用這項功能。 *Word Lens 支援英文與二十多種語言的雙向對譯。

與使用不同語言的人交談。

以手寫方式輕鬆輸入鍵盤不支援的字元和字詞。

只要輸入你要翻譯的字詞即可。

那麼，Google 現在為何如此重視機器學習技術？

機器學習並不是一項嶄新技術，而是源自 18 世紀的統計學。但你說的沒錯，近年來我們的確積極發展這項技術，原因有三個。

首先，我們需要大量的範例，才能訓練電腦準確做出預測，即使是你我都能輕鬆辦到的事也一樣 (像是在相片中找出狗)。拜興盛的網際網路活動所賜，我們現在有豐富的範例來源可供電腦學習。舉例來說，現在全世界各種語言的網站上，都有數百萬張設有「狗」標籤的相片。

不過，有了大量範例還不夠。你不能只是把一大堆跟狗有關的相片擺在網路攝影機前面，就期望電腦從中學到什麼。電腦還需要一套學習程式。而不久前，這個領域 (以及 Google 本身) 才取得重大突破，讓機器學習程式變得更加精密，功能也更為強大。

然而，我們的程式仍不完美，電腦也還很遲鈍，因此我們得不斷觀看大量範例並反覆進行微調，才能改善程式的效能。這整個過程需要大量的運算能力，以及精細的平行處理技術才能辦到。不過，隨著軟體和硬體有了新進展，我們也得以完成這項挑戰。

有沒有什麼事情是電腦目前仍無法辦到，但導入機器學習技術後就有可能實現的？

還記得當你透過電話讀出信用卡號碼時，語音辨識功能必須費盡千辛萬苦才能辨識出十個不同的數字嗎？這彷彿是昨天才發生的事。然而，就在最近五年，語音辨識功能透過精密的機器學習技術有了突破性進展，現在你已經可以透過語音在 Google 上搜尋資料，而且這項功能日後還會變得更好用、更快速。

我認為機器學習技術甚至可以改善我們的服裝儀容。我不知道你怎麼想，但我實在很討厭試穿衣服！只要找到一家合適的牛仔褲品牌，我就會連買五件。但機器學習技術能把我們適合的品牌當做範例，推薦其他可能也適合我們的品牌。這問題有點超出 Google 的服務範圍，但我真希望有人可以研發這項功能！

接下來的十年內，機器學習技術會發展到什麼程度？

目前整個機器學習領域的目標之一，就是提升學習速度，以及減少學習時所需的範例數。其中一個方法 (也是 Google 致力發展的部分)，就是為機器提供更多基本常識，在這個領域中我們稱之為「規則化」。

對於機器而言，什麼叫基本常識？這表示在一般情況下，範例的細微變化不會顛覆機器的認知。舉例來說，即使相片中的狗戴了牛仔帽，機器也仍然知道這是狗。

我們降低了機器學習程式對於枝微末節變化 (像是牛仔帽) 的敏感度，藉此灌輸這類基本常識。聽起來很簡單，但實際上只要稍有差錯，就會導致機器無法對重大變化產生反應。因此，我們仍在摸索如何找到平衡點。

機器學習技術最讓你期待的是什麼？讓你持續投注心力的動力為何？

我成長於西雅圖，聽過很多有關 Lewis 和 Clark 這些早期美國西部探險家的事蹟。機器學習研究也充滿著這種探險精神。我們在探索全新的事物，試著為了遠大的未來開疆闢土。

假如你有機會為 Google 的機器學習技術設計一個簡單又有意思的標語，那會是什麼？

如果一開始沒成功，那就再試個十億次。