Dalam bahasa mudah: Soal jawab tentang pembelajaran mesin

Bagi kebanyakan kita, pembelajaran mesin seakan agak futuristik. Namun kebelakangan ini, ia telah muncul, semakin banyak, dalam kehidupan kita - sama ada komputer Google yang bermain permainan Go dengan hebat atau Inbox by Gmail yang membuat balasan automatik. Walaupun kesemua itu mengujakan, sesetengah daripada kita masih tertanya-tanya apakah itu sebenarnya pembelajaran mesin. Atau mengapa ia penting. Atau mengapa mengenal pasti anjing dalam foto tidak semudah yang disangka. Jadi kami menemui Maya Gupta, seorang saintis penyelidikan untuk pembelajaran mesin di Google, bagi mencari jawapannya.

Mari mulakan dengan perkara yang asas. Apakah sebenarnya pembelajaran mesin itu?

Pembelajaran mesin mengambil banyak contoh, memikirkan pola yang menerangkan contoh, kemudian menggunakan pola tersebut untuk membuat ramalan tentang contoh baharu.

Ambil cadangan filem, sebagai contoh. Katakan satu bilion orang memberitahu kami sepuluh filem kegemaran masing-masing. Itu satu jumlah yang besar yang dapat digunakan oleh komputer untuk mengetahui persamaan yang dimiliki oleh filem kesukaan ramai. Kemudian komputer menghasilkan pola untuk menerangkan pelbagai contoh. Misalnya, “Orang yang menyukai filem seram biasanya tidak menyukai filem romantis, tetapi orang menyukai filem yang dibintangi oleh pelakon yang sama.” Kemudian jika anda memberitahu komputer bahawa anda menyukai The Shining yang dibintangi oleh Jack Nicholson, komputer dapat membuat tekaan yang agak tepat sama ada anda menyukai filem komedi romantis Something’s Gotta Give oleh Jack Nicholson dan jenis video lain yang boleh disyorkan kepada anda di YouTube.

Faham. Lebih kurang. Namun, bagaimana pula dari segi amalinya?

Dari segi amali, pola yang dipelajari oleh mesin boleh jadi sangat rumit dan sukar dijelaskan dengan kata-kata. Fikirkan Google Photos, yang membolehkan anda mencari gambar yang mengandungi imej anjing. Bagaimanakah Google melakukannya? Mula-mula, kami akan mendapatkan banyak contoh foto yang berlabel “anjing” (terima kasih Internet!). Kami juga mendapatkan banyak foto berlabel “kucing” dan foto dengan sejuta label yang lain, tetapi saya tidak akan menyenaraikannya semua di sini :).

Kemudian komputer akan mencari pola piksel dan pola warna yang membantu ia meneka sama ada imej itu ialah kucing atau anjing (atau...). Mula-mula, ia hanya membuat tekaan secara rawak pada pola yang berguna untuk mengenal pasti anjing. Kemudian ia akan melihat contoh imej anjing dan melihat sama ada pola yang sedia ada berjaya mengenal pasti dengan betul. Jika ia tersilap mengecam kucing sebagai anjing, maka ia membuat sedikit pelarasan pada pola yang digunakan. Kemudian ia melihat imej kucing dan sekali lagi mengubah pola untuk cuba mendapatkan yang betul. Dan ia mengulangi proses ini kira-kira satu bilion kali: gunakan satu contoh sebagai rujukan, jika tidak berjaya, ubah pola yang digunakan untuk mendapat hasil yang lebih tepat pada contoh tersebut.

Akhirnya, pola itu akan membentuk model yang dipelajari mesin, seperti rangkaian neural dalam, yang (kebanyakannya) boleh mengenal pasti anjing, kucing, ahli bomba dan banyak lagi perkara lain dengan betul.

Itu kedengaran agak futuristik. Apakah antara produk Google lain yang menggunakan pembelajaran mesin pada hari ini?

Terdapat bermacam-macam perkara baharu yang dilakukan oleh Google dengan pembelajaran mesin, seperti Google Terjemah boleh mengambil foto tanda jalan atau menu dalam satu bahasa, memikirkan perkataan dan bahasa yang ada dalam foto itu dan melakukan penterjemahan ke dalam bahasa anda dalam masa nyata dengan penuh keajaiban.

Anda juga boleh menyebut hampir apa-apa sahaja kepada Terjemah dan pengecaman pertuturan yang dipelajari oleh mesin akan diaktifkan. Pengecaman pertuturan digunakan dalam pelbagai produk lain juga, seperti memikirkan pertanyaan suara anda untuk apl Google dan menjadikan video YouTube lebih mudah dicari.

Untuk papan tanda, menu, dsb., cuma halakan kamera anda dan dapatkan terjemahan segera. Anda sama sekali tidak memerlukan sambungan Internet. *Word Lens tersedia antara bahasa Inggeris dengan lebih dua puluh empat bahasa.

Bercakap dengan seseorang yang bertutur bahasa yang berbeza.

Tulis tangan aksara dan perkataan yang tidak disokong oleh papan kekunci anda dengan mudah.

Hanya taip perkataan yang ingin diterjemahkan.

Jadi, mengapakah Google mengambil berat tentang pembelajaran mesin sekarang?

Pembelajaran mesin bukanlah perkara baharu dan telah bertapak dalam perangkaan kurun ke-18. Tetapi betul kata anda, ciri ini benar-benar hangat sejak kebelakangan ini disebabkan tiga perkara.

Pertama, kami memerlukan sejumlah besar contoh untuk mengajar komputer cara membuat ramalan yang baik, walaupun tentang perkara yang anda atau saya rasakan mudah (seperti mencari anjing dalam foto). Dengan pelbagai aktiviti di Internet, kini kami mendapat sumber contoh yang kaya, yang boleh digunakan oleh komputer untuk belajar. Contohnya, kini terdapat berjuta-juta gambar anjing yang dilabelkan sebagai "anjing" di tapak web di seluruh dunia, dalam setiap bahasa.

Namun contoh yang banyak sahaja tidak memadai. Anda tidak boleh sekadar menunjukkan beberapa gambar anjing kepada kamera web dan mengharapkan peranti tersebut mempelajari sesuatu — komputer memerlukan program pembelajaran. Kebelakangan ini, industri (dan Google) telah membuat beberapa penemuan menarik tentang tahap kerumitan dan kekuatan program pembelajaran mesin tersebut.

Walau bagaimanapun, program kami masih belum sempurna dan komputer masih agak dungu, jadi kami perlu melihat banyak contoh beberapa kali untuk mengubah suai tombol-tombol digital bagi memperoleh hasil yang betul. Proses ini memerlukan kuasa pengkomputeran yang sangat besar dan pemprosesan selari yang canggih. Kemajuan perisian dan perkakasan baharu telah merealisasikan keperluan ini juga.

Apakah satu perkara yang tidak dapat komputer lakukan hari ini, tetapi akan dapat dilakukan tidak lama lagi hasil daripada pembelajaran mesin?

Rasanya seperti baru semalam pengecaman pertuturan bertungkus-lumus untuk mengenal pasti hanya sepuluh angka yang berbeza apabila anda menyebut nombor kad kredit anda melalui telefon. Pengecaman pertuturan telah mengalami lonjakan kemajuan yang besar dalam tempoh lima tahun kebelakangan ini melalui penggunaan pembelajaran mesin yang canggih dan kini anda boleh menggunakannya untuk mengeluarkan carian Google. Prestasinya semakin baik dan cepat.

Saya berpendapat pembelajaran mesin juga akan membuatkan kita kelihatan lebih menarik. Saya tidak pasti tentang anda, tetapi saya tidak suka mencuba pakaian! Apabila saya terjumpa satu jenama jeans yang sesuai, saya akan beli lima pasang sekali gus. Tetapi pembelajaran mesin boleh mengubah contoh-contoh jenama yang sesuai dengan kita menjadi cadangan untuk perkara lain yang sesuai dengan kita. Masalah itu mungkin di luar skop Google, tapi saya harap ada orang yang mengusahakannya!

Apakah rupa pembelajaran mesin sepuluh tahun akan datang?

Satu perkara yang sedang diusahakan oleh seluruh industri ialah cara untuk belajar dengan lebih cepat daripada jumlah contoh yang lebih kecil. Satu pendekatan untuk perkara ini (yang Google usahakan dengan amat gigih) ialah memberi mesin kami lebih kemunasabahan, yang kami panggil "pelaziman".

Apakah persepsi mesin tentang kemunasabahan? Satu daripada maksudnya ialah, secara amnya, jika contoh berubah sedikit, mesin tersebut tidak seharusnya berubah fikiran sepenuhnya. Sebagai contoh, foto anjing dengan topi koboi masih foto tentang anjing.

Kami menguatkuasakan jenis kemunasabahan seperti ini dalam program pembelajaran dengan menjadikan pembelajaran mesin tidak sensitif terhadap perubahan kecil yang tidak penting, seperti topi koboi. Walaupun kedengaran mudah, jika tersilap melaksanakannya, mesin akan menjadi tidak sensitif terhadap perubahan yang penting! Keseimbangan inilah yang masih kami cuba selesaikan.

Apakah ciri pembelajaran mesin yang membuat anda teruja? Apakah yang mendorong anda untuk mengusahakan bidang ini?

Saya dibesarkan di Seattle dan kami banyak belajar tentang penjelajah awal Amerika Barat seperti Lewis dan Clark. Penyelidikan pembelajaran mesin mempunyai semangat penerokaan yang sama — kami melihat pelbagai perkara buat kali pertama dan cuba memetakan jalan menuju masa depan yang hebat.

Jika anda boleh memberikan slogan pelekat bamper kepada pembelajaran mesin di Google, apakah agaknya pilihan anda?

Jika tidak berjaya sekali, cuba lagi berbilion kali.