Ayrıntılı inceleme: Makine öğrenimiyle ilgili sorular-cevaplar

Birçoğumuz makine öğreniminin oldukça fütüristik olduğunu düşünür. Diğer yandan son dönemde bu kavram, örneğin Go oyununu olağanüstü başarıyla oynayan Google bilgisayarı veya Gmail'in otomatik yanıtlar oluşturan Gelen Kutusu olarak karşımıza giderek daha çok çıkıyor. Tüm bunlar heyecan verici olmakla birlikte, bazılarımız hâlâ makine öğreniminin tam olarak ne olduğunu merak ediyor. Ya da niye önemli olduğunu. Veya bir fotoğraftaki köpeği tanımanın neden göründüğü kadar kolay olmadığını merak ediyor. Bu yüzden, Google'da makine öğrenimi üzerinde çalışan araştırmacı bilim insanı Maya Gupta ile oturup bu konuyu ayrıntılarıyla ele aldık.

En temel konulardan başlayalım. Makine öğrenimi tam olarak nedir?

Makine öğrenimi bir dizi örneği alır, örnekleri açıklayan kalıpları belirler, daha sonra bu kalıpları yeni örnekler hakkında tahminler oluşturmak için kullanır.

Örneğin, film önerilerini ele alalım. Bir milyar kişinin her birinin bize en sevdiği on filmi söylediğini düşünelim. Bu bilgi, insanların ortak olarak sevdiği filmleri öğrenmek için bilgisayarın kullanabileceği çok sayıda örnek sağlar. Daha sonra, bilgisayar bu örnekleri açıklayan bir kalıp oluşturabilir. Örneğin bu, "Korku filmlerini sevenler genellikle romantik filmleri sevmiyor, ancak insanlar aynı oyuncuların oynadığı filmleri seviyor” gibi bir kalıp olabilir. Daha sonra, bilgisayara Jack Nicholson'ın oynadığı Cinnet filmini beğendiğinizi belirttiğinizde bilgisayar, Jack Nicholson'ın Aşkta Her Şey Mümkün adlı romantik komedisini beğenip beğenmeyeceğiniz ve YouTube'da size başka hangi videoları önerebileceği konusunda doğru tahminlerde bulunabilir.

Anladım. Yani biraz. Peki bu pratikte nasıl çalışıyor?

Pratikte, makinenin öğrendiği kalıplar çok karmaşık ve bunların kelimelerle ifade edilmesi zor olabiliyor. İçinde köpeklerin olduğu resimleri bulmak için fotoğraflarınızda arama yapabilmenizi sağlayan Google Fotoğraflar'ı düşünelim. Google bunu nasıl yapıyor? Öncelikle, İnternet üzerinde "köpek" etiketli çok sayıda fotoğraf örneği alıyoruz. Ayrıca, "kedi" etiketli pek çok fotoğraf alıyoruz. Başka etiketlere sahip yaklaşık bir milyon fotoğraf daha alıyoruz, ama bunların hepsini burada saymayacağım :).

Daha sonra, bilgisayar bir fotoğrafın kedi mi yoksa köpek mi (veya başka bir şey mi) olduğunu tahmin etmesine yardımcı olacak piksel ve renk kalıplarını arıyor. İlk olarak, köpekleri tanımak için iyi kalıpların neler olabileceğine ilişkin rastgele bir tahminde bulunuyor. Daha sonra, bir örnek köpek resmine bakıyor ve belirlediği geçerli kalıbın doğru olup olmadığını görüyor. Yanlışlıkla bir kediyi köpek olarak tanımlamışsa kullanmakta olduğu kalıplarda bazı küçük ayarlamalar yapıyor. Daha sonra, bir kedi resmine bakıyor ve doğru olanı bulmaya çalışırken kalıplarını biraz daha değiştiriyor. Bu işlemi yaklaşık bir milyar kez tekrarlıyor. Bir örneğe bakıyor, tanımlamayı tam olarak istenilen şekilde yapamadıysa aynı örnekte daha iyi bir iş çıkarmak için kalıplarında düzeltme yapıyor.

Sonunda, kalıplar derin bir sinir ağı gibi köpekleri, kedileri, itfaiyecileri ve daha birçok şeyi (çoğunlukla) doğru şekilde tanımlayabilen, makine ile öğrenilmiş bir model oluşturuyor.

Bu teknoloji kulağa çok fütüristik geliyor. Bugün başka hangi Google ürünlerinde makine öğrenimi kullanılıyor?

Google, makine öğrenimiyle birçok yeniliğe imza atıyor. Örneğin, Google Çeviri, bir dilde hazırlanmış sokak tabelasının veya menünün fotoğrafını çekip fotoğraftaki kelimeleri ve dili çözebilir, sonra sihirli bir şekilde, gerçek zamanlı olarak sizin dilinize çevirebilir.

Ayrıca, Çeviri'ye herhangi bir şey söylediğinizde makine ile öğrenilmiş konuşma tanıma devreye girer. Konuşma tanıma, örneğin Google uygulaması için sesli sorgularınızı çözme ve YouTube videolarını daha aranabilir hale getirme gibi çeşitli ürünlerde de kullanılıyor.

Kameranızı tabela, menü ve benzeri nesnelere doğrultup çevirilerini anında görün. Bunun için internet bağlantısı bile gerekmez. *Word Lens İngilizce ile diğer onlarca dil arasında çeviri için kullanılabilir.

Farklı dilde konuşan birisiyle sohbet edin.

Klavyenizin desteklemediği karakterleri ve kelimeleri elinizle kolayca yazın.

Çevirmek istediğiniz kelimeleri yazmanız yeterli.

Peki Google makine öğrenimi konusuna şimdi neden bu kadar önem veriyor?

Makine öğrenimi tamamen yeni bir şey değil. Kökleri, 18. yüzyıl istatistiklerine kadar gidiyor. Ama haklısınız, son dönemde üç nedenden dolayı bu çalışmalar önem kazanıyor.

Öncelikle, size veya bana kolay gelen şeyler (örneğin bir fotoğraftaki köpeği bulmak gibi) konusunda bile doğru tahminlerde bulunmalarını bilgisayarlara öğretmek için devasa miktarda örneğe ihtiyacımız var. İnternetteki tüm bu etkinlikle birlikte artık bilgisayarların öğrenebileceği zengin bir örnek kaynağına sahibiz. Örneğin, şu anda dünyanın her yerinden, her dilde hazırlanmış web sitelerinde "köpek" etiketli milyonlarca köpek fotoğrafı var.

Yine de çok sayıda örneğinizin olması yeterli değil. Bir web kamerasına çok sayıda köpek fotoğrafı gösterip bilgisayarın bundan bir şey öğrenmesini bekleyemezsiniz. Bilgisayarların, öğrenmelerini sağlayacak bir programa ihtiyacı vardır. Son zamanlarda, bu alanda (ve Google'da) bazı makine öğrenme programlarının ne kadar karmaşık ve güçlü olabileceğiyle ilgili heyecan verici buluşlar yapıldı.

Ancak, programlarımız hâlâ mükemmel değil ve bilgisayarlar da hâlâ akıllı değil. Bu yüzden, çok sayıda dijital düğmeyi doğru ayarlamak için çok sayıda örneği pek çok kez görmemiz gerekiyor. Bunların tümü, devasa bilgi işlem gücü ve aşırı miktarda paralel işlem gerektiriyor. Ancak yeni yazılımlarla ve donanımlarla sağlanan ilerlemeler bunu da mümkün kıldı.

Bilgisayarların bugün yapamadığı ama makine öğrenimi sayesinde yakında yapabileceği bir şeye örnek verebilir misiniz?

Yakın zamana kadar günlük kullanımda konuşma tanıma özelliği, telefonda kredi kartı bilgilerinizi söylediğinizde on farklı rakamı bile tanımakta zorlanıyordu. Gelişmiş makine öğrenimi kullanılarak son beş yılda konuşma tanımada inanılmaz ilerlemeler sağlandı ve şu anda bu özelliği Google aramaları yapmak için kullanabiliyorsunuz. Üstelik hızlı bir şekilde daha da iyiye gidiyor.

Bence makine öğrenimi, hepimizin daha iyi görünmesini bile sağlayacak. Sizi bilmiyorum ama ben kıyafet denemekten nefret ederim! Bana yakışan bir pantolon modeli bulup aynısından beş tane alırım. Ama makine öğrenimi, bedenimize uygun markaların örneklerini inceleyip bize başka nelerin yakışacağına dair öneriler sağlayabilir. Bu sorun biraz Google'ın kapsamı dışında, ama umarım birisi bunun üzerinde çalışıyordur!

On yıl içinde makine öğreniminin nasıl olacağını öngörüyorsunuz?

Bu alandaki uzmanlar ayrıca daha az örnekten nasıl daha hızlı öğrenilebileceği üzerinde çalışıyor. Bunu çözmek için bir yaklaşım da (ki Google özellikle bunun üzerinde çok çalışıyor) makinelerimize daha fazla sağduyu vermektir. Bu, "düzenleme" adını verdiğimiz alana giriyor.

Bir makinede sağduyu nasıl bir şeydir? Bu, genel anlamda bir örneğin yalnızca küçük bir kısmı değişiyorsa makinenin fikrini tamamıyla değiştirmemesi gerektiği anlamına geliyor. Örneğin, kovboy şapkalı bir köpeğin fotoğrafı yine de bir köpektir.

Makine öğrenimini, kovboy şapkası gibi küçük, önemsiz değişikliklere karşı duyarsız hale getirerek öğrenme programında bu tür bir sağduyuyu uyguluyoruz. Tabii bunu söylemesi kolay. Ancak yanlış yaparsanız makine, önemli değişikliklere karşı yeterince duyarlı olmaz! Dolayısıyla, bunun dengesini bulmak için çalışmalarımıza devam ediyoruz.

Makine öğrenimi konusunda sizi en çok heyecanlandıran nedir? Sizi bu konuda çalışmaya iten şey ne?

Ben Seattle'da büyüdüm. Orada, Lewis ve Clark gibi Batı Amerika'nın ilk kâşifleri hakkında pek çok şey öğrendik. Makine öğrenimi araştırması da aynı keşif ruhunu taşıyor. Birçok şeyi ilk kez görüyoruz ve geleceğe giden büyüleyici bir yolun haritasını çıkarmaya çalışıyoruz.

Google'da makine öğrenimi için bir slogan bulmanız gerekse bu ne olurdu?

İlkinde başarılı olamazsan bir milyar kez daha dene.