Знакомство с машинным обучением

Искусственный интеллект перестает быть чудом из научной фантастики и постепенно становится частью нашей повседневной жизни. Это может быть программа, способная обыграть профессионала в го, или автоответчик в Inbox от Gmail. Однако многие до сих пор не до конца понимают, что такое машинное обучение и почему оно так важно. Например, знаете ли вы, что нужно сделать компьютеру, чтобы распознать собаку на фотографии? В этой статье Майя Гупта из отдела машинного обучения Google ответит на самые распространенные вопросы об этой технологии.

Для начала – что такое машинное обучение?

Машинное обучение – это процесс, в ходе которого система обрабатывает большое число примеров, выявляет закономерности и использует их, чтобы прогнозировать характеристики новых данных.

Рассмотрим автоматические рекомендации. Предположим, есть миллиард пользователей и каждый из них сообщил системе десять любимых фильмов. Это группа примеров. Компьютер проанализирует ее и определит, что общего есть у этих фильмов. Затем он найдет закономерность в выборе пользователей. Допустим, любителям ужасов не нравятся мелодрамы, зато люди часто предпочитают фильмы со знакомыми актерами. Поэтому если вы укажете, что любите фильм "Сияние" с Джеком Николсоном, система сделает вывод, что вам может понравиться комедия "Любовь по правилам и без", в которой также играет Джек Николсон. Кроме того, она будет предлагать вам определенные видео на YouTube.

Звучит просто. Но как это работает?

Процесс поиска закономерностей очень сложный. Система ищет их даже на уровне пикселей. Например, что нужно сделать Google Фото, чтобы найти фотографии по запросу "собака"? Во-первых, обработать огромное количество фотографий собак из Интернета, столько же изображений с ярлыком "кошка" и миллионом других ярлыков.

Во-вторых, нужно найти последовательности пикселей и сочетания цветов, характерные для картинок с собаками, кошками и другими объектами. Сначала система только предполагает, какие наборы данных могут быть изображениями собак. Затем она соотносит свои догадки с фотографией собаки. Если окажется, что система по ошибке приняла собаку за кошку, она исправит закономерности, которые использует для поиска картинок с собаками и кошками. Таким образом системе нужно проанализировать каждый из миллиарда примеров и настроить связанные с ним закономерности для более точного поиска.

В конце концов выявленные закономерности позволят создать модель – глубокую нейронную сеть, – которая в большинстве случаев сможет правильно распознавать на изображениях собак, кошек, людей и т. д.

Невероятно! В каких ещё сервисах Google используется машинное обучение?

Мы используем алгоритмы машинного обучения во многих продуктах. Именно благодаря такому алгоритму Google Переводчик может найти слова на вывеске или в меню и моментально перевести их на другой язык.

Также машинное обучение включается при распознавании речи – функции, которая есть не только в Google Переводчике, но и в других сервисах, например YouTube и приложении Google.

Чтобы перевести надпись с помощью Google Переводчика, просто наведите на нее камеру. Подключение к Интернету не требуется. *Приложение Word Lens позволяет выполнять перевод с английского более чем на 20 языков и обратно.

Без труда общайтесь на незнакомом языке.

Если клавиатура на устройстве не поддерживает какие-либо символы, напишите их от руки.

Просто напечатайте текст, который хотите перевести.

Почему Google придает машинному обучению такое большое значение?

Машинное обучение – дисциплина, которая зародилась ещё в XVIII веке как часть теории статистики. Но сегодня она актуальна как никогда.

Мы постоянно улучшаем свои сервисы, поэтому нам нужно научить их делать более точные прогнозы и выполнять те задачи, которые не вызывают трудностей у человека. Интернет ‒ это практически неисчерпаемый источник данных, необходимых для машинного обучения. Взять те же фотографии собак. Только представьте, сколько их опубликовано онлайн!

Но имея один только доступ к базе примеров, компьютер ничему не научится. Ему нужна обучающая программа. За последние несколько лет различным ИТ-компаниям, включая Google, удалось создать невероятно сложные и мощные программы машинного обучения.

Впрочем, они пока неидеальны, как и компьютеры в целом, поэтому нам ещё предстоит внести в их работу множество изменений. Это потребует огромной вычислительной мощности и специальных ресурсов для параллельной работы программ. К счастью, нам помогают последние достижения в области программного и аппаратного обеспечения.

Есть ли какая-то невыполнимая на сегодняшний день задача, с которой компьютеры научатся справляться в ближайшем будущем?

Ещё недавно программы с функцией распознавания речи с трудом различали цифры. Сегодня приложение Google без труда понимает любые голосовые запросы. И это далеко не предел. Технологии машинного обучения стремительно развиваются.

Возможно, однажды машинное обучение облегчит нам шопинг! Я, например, терпеть не могу примерять одежду. Если джинсы какого-то производителя хорошо на мне сидят, я куплю пять пар, чтобы не мучиться с примеркой. Конечно, одежда – это не совсем по части Google, но можно создать сервис, который будет рекомендовать подходящие бренды, как наши сервисы рекомендуют фильмы, музыку и другой контент.

Каким будет машинное обучение через 10 лет?

Сейчас многие ИТ-компании ищут ответ на вопрос, как повысить скорость обучения компьютеров, сократив объем используемых при анализе исходных данных. Для решения этой проблемы мы используем такой подход, как регуляризация. Он заключается в том, чтобы наделить компьютеры здравым смыслом.

Но что такое здравый смысл для машины? Говоря простым языком, если на фотографии изображена собака в ковбойской шляпе, компьютер должен по-прежнему считать эту картинку изображением собаки, а не ковбоя.

Поэтому мы стремимся к тому, чтобы программы машинного обучения не учитывали такие незначительные детали. Самое сложное при этом – научить систему понимать, какие элементы являются важными, а какие нет. Над этим ещё придется поломать голову.

Что побудило вас заняться машинным обучением?

Я выросла в Сиэтле, где много узнала об исследованиях американского Запада, в частности экспедиции Льюиса и Кларка. Работая в сфере машинного обучения, я тоже чувствую себя исследователем: мы совершаем технологические открытия и прокладываем путь к лучшему будущему.