Langsung ke konten

Pembahasan mendetail: Tanya jawab tentang machine learning

Sebagian besar orang menganggap machine learning itu cukup futuristik. Namun, kini machine learning semakin banyak ditemui di sekitar kita—baik komputer Google yang bisa bermain game Go yang seru, atau Inbox by Gmail yang dapat mengirim balasan otomatis. Meskipun semua itu keren, beberapa dari kita masih bertanya-tanya apa sebenarnya yang dimaksud dengan machine learning atau mengapa machine learning itu penting. Atau, mengapa mengidentifikasi anjing di sebuah foto itu tidak semudah kedengarannya. Karena itulah kami berbincang dengan Maya Gupta, ilmuwan peneliti machine learning di Google, untuk membahas hal ini secara detail.

Mari kita mulai dari dasar-dasarnya. Apa sebenarnya yang dimaksud dengan machine learning?

Machine learning mengambil banyak contoh, mengidentifikasi pola yang menjelaskan contoh tersebut, lalu menggunakan pola itu untuk membuat prediksi tentang contoh-contoh baru.

Misalnya rekomendasi film. Bayangkan ada satu miliar orang, yang masing-masing memberi tahu kami sepuluh film favoritnya. Contoh sebanyak itu akan dapat digunakan komputer untuk mempelajari persamaan genre film yang disukai orang-orang. Kemudian, komputer akan mencari tahu pola untuk menjelaskan contoh tersebut, misalnya, “Orang yang suka film horor biasanya tidak suka film roman, tapi jika pemeran aktornya sama, mereka akan suka”. Jadi jika Anda memberi tahu komputer bahwa Anda menyukai film The Shining karena diperankan Jack Nicholson, komputer dapat membuat tebakan bagus kalau Anda akan menyukai komedi romantis berjudul Something’s Gotta Give yang juga menampilkan Jack Nicholson, dan video lain untuk direkomendasikan kepada Anda di YouTube.

Paham. Ya, lumayan. Namun, bagaimana praktiknya?

Dalam praktiknya, pola machine learning bisa sangat rumit dan sulit dijelaskan. Google Foto misalnya, memungkinkan Anda menelusuri foto untuk menemukan foto berisi anjing. Bagaimana Google melakukannya? Pertama, kami mengumpulkan banyak contoh foto yang diberi label “anjing” (terima kasih internet). Kami juga mengumpulkan banyak foto yang diberi label “kucing”, dan berbagai foto dengan jutaan label lainnya, tetapi saya tidak akan menuliskan semua daftar labelnya di sini :).

Machine learning membantu menebak mana foto kucing atau anjing.

Kemudian, komputer akan mencari tahu pola piksel dan pola warna yang membantunya menebak apakah sebuah sosok adalah seekor kucing atau anjing (atau lainnya…). Pertama, komputer akan menebak secara acak pola apa yang tepat untuk mengidentifikasi anjing. Komputer akan melihat contoh foto anjing, dan melihat apakah polanya saat ini sesuai. Jika salah menyebut kucing sebagai anjing, komputer akan sedikit menyesuaikan pola yang saat ini digunakan. Kemudian, komputer akan melihat gambar kucing, dan menyesuaikan polanya lagi untuk mencoba menebaknya dengan benar. Proses ini diulangi hingga miliaran kali: pertama melihat contoh lalu menebak, dan jika tebakannya salah, komputer akan menyesuaikan pola yang digunakannya agar dapat menebak contoh dengan benar.

Pada akhirnya, pola tersebut akan membentuk model machine learning, seperti jaringan neural dalam, yang (sering kali) dapat mengidentifikasi anjing, kucing, petugas pemadam kebakaran, dan lainnya dengan benar.

Produk Google yang menggunakan machine learning.

Kedengarannya cukup futuristik. Produk Google mana sajakah yang menggunakan machine learning saat ini?

Ada banyak sekali produk Google yang menggunakan machine learning, seperti Google Terjemahan yang dapat mengambil foto rambu lalu lintas atau menu dalam satu bahasa, memahami kata dan bahasa yang ada dalam foto tersebut, dan dengan ajaib menerjemahkannya secara real-time ke dalam bahasa Anda.

Anda juga dapat mengucapkan apa saja ke Terjemahan, lalu pengenalan ucapan yang dilengkapi machine learning akan merespons. Pengenalan ucapan juga banyak digunakan oleh produk lainnya, seperti aplikasi Google yang menggunakannya untuk memahami kueri suara Anda, dan memudahkan penelusuran video YouTube.

Jadi, mengapa Google kini mulai menanggapi masalah machine learning secara serius?

Machine learning bukanlah hal yang baru, dan teknologi ini berakar dari statistik pada abad ke-18. Namun, ada tiga alasan yang membuatnya semakin trending akhir-akhir ini.

Pertama, diperlukan sampel dalam jumlah besar untuk mengajari komputer cara membuat prediksi yang akurat, bahkan terkait berbagai hal yang dirasa mudah bagi kita (seperti menemukan anjing dalam foto). Dengan semua aktivitas di internet, kini terdapat sumber sampel melimpah yang dapat digunakan sebagai bahan pembelajaran bagi komputer. Misalnya, kini terdapat jutaan foto anjing yang diberi label “anjing” di berbagai situs di seluruh dunia, dalam semua bahasa.

Namun, sampel yang melimpah saja tidaklah cukup. Anda tidak bisa menunjukkan sekumpulan foto anjing ke webcam dengan begitu saja dan berharap bahwa komputer dapat mempelajarinya. Hal ini dikarenakan komputer memerlukan program pembelajaran. Baru-baru ini, para ahli machine learning (dan Google) berhasil membuat beberapa terobosan luar biasa yang menjadikan machine learning semakin rumit dan canggih.

Namun, program kami masih belum sempurna, dan komputer belum cukup pintar, sehingga kami harus melihat banyak contoh berkali-kali untuk menyesuaikan berbagai komponen digital hingga dapat berfungsi baik. Semua itu memerlukan daya komputasi yang sangat besar, dan pemrosesan paralel yang rumit. Namun, perkembangan software dan hardware baru membuat hal ini dapat dilakukan.

Hal apa yang tidak dapat dilakukan komputer saat ini, tetapi akan segera dapat tercapai berkat adanya machine learning?

Beberapa waktu yang lalu, teknologi pengenalan ucapan sudah kesulitan hanya untuk mengenali sepuluh digit angka berbeda saat Anda membaca nomor kartu kredit melalui telepon. Pengenalan ucapan telah berkembang pesat selama lima tahun terakhir menggunakan machine learning yang canggih, dan kini Anda dapat menggunakannya untuk melakukan penelusuran Google. Teknologi ini akan terus berkembang dengan pesat.

Bahkan menurut saya, machine learning akan mampu membuat penampilan kita semua tampak lebih baik. Bisa jadi kita berbeda, tetapi saya tidak suka mencoba berbagai macam pakaian. Jika ada satu merek jeans yang cocok, saya akan membeli lima sekaligus. Namun, machine learning dapat menggunakan contoh merek yang kita sukai untuk memberikan rekomendasi jeans lain yang serupa. Masalah di atas mungkin berada di luar cakupan Google, tetapi semoga ada orang lain yang sedang mengerjakannya.

Bagaimana masa depan machine learning dalam sepuluh tahun ke depan?

Satu hal yang sedang diupayakan adalah cara mempercepat pengajaran dengan contoh yang lebih sedikit. Salah satu pendekatannya (yang sedang diupayakan Google secara maksimal) adalah dengan memberikan daya nalar yang lebih baik kepada mesin, yang dalam bidang ini disebut sebagai “regularisasi”.

Seperti apa wujud daya nalar bagi mesin? Maksudnya di sini adalah, secara umum, jika suatu contoh hanya berubah sedikit, mesin tersebut tidak akan sepenuhnya berubah pikiran. Misalnya, foto anjing yang memakai topi koboi tetaplah seekor anjing.

Kami ingin menanamkan daya nalar semacam ini ke dalam program pembelajaran dengan menghilangkan kepekaan machine learning terhadap perubahan kecil yang tidak penting, seperti topi koboi. Meskipun mudah diucapkan, jika salah langkah, Anda malah akan membuat mesin kurang peka terhadap perubahan penting. Jadi, kami sedang mencari cara untuk menyeimbangkannya.

Akan seperti apakah machine learning dalam 10 tahun ke depan?

Hal apakah yang paling menarik bagi Anda tentang machine learning? Apa motivasi Anda dalam mengerjakannya?

Saya tumbuh di Seattle, tempat saya belajar banyak dari kisah penjelajah awal Amerika Barat seperti Lewis dan Clark. Para peneliti machine learning juga memiliki semangat eksplorasi yang sama — kami menyaksikan hal baru untuk pertama kali, dan memetakan rute menuju masa depan yang cerah.

Jika misalnya Anda bisa memberi sebuah slogan untuk machine learning di Google, apa yang akan Anda tuliskan?

Jika yang pertama gagal, coba lagi hingga miliaran kali.

Machine Learning di Google.
Kembali ke atas