Análisis: preguntas y respuestas sobre el aprendizaje automático
Muchas personas consideran que el aprendizaje automático es bastante futurista. Sin embargo, ha comenzado a aparecer cada vez más en nuestras vidas, ya sea que se trate de una computadora de Google que juega una partida increíble de Go o de las respuestas automáticas que crea Inbox by Gmail. Aunque estos avances son muy emocionantes, algunas personas aún se preguntan en qué consiste exactamente el aprendizaje automático, por qué es importante o por qué identificar a un perro en una foto no es tan fácil como parece. Por lo tanto, nos reunimos con Maya Gupta, investigadora científica del aprendizaje automático en Google, para analizarlo.
Comencemos por los aspectos básicos. ¿En qué consiste exactamente el aprendizaje automático?
El aprendizaje automático toma un conjunto de ejemplos, descubre patrones que los explican y usa esos patrones para realizar predicciones acerca de ejemplos nuevos.
Tomemos como ejemplo las recomendaciones de películas. Supongamos que mil millones de personas nos dicen sus diez películas favoritas. La computadora puede usar esta serie de ejemplos para conocer qué tienen en común las películas preferidas de las personas. Luego, la computadora crea patrones para explicar esos ejemplos, como "a las personas que les gustan las películas de terror no suelen gustarles las románticas, pero les gustan las películas en las que aparecen los mismos actores". Por lo tanto, si le dices a la computadora que te gusta "El resplandor" con Jack Nicholson, podrá predecir si te gustará la comedia romántica "Alguien tiene que ceder" con Jack Nicholson y qué otros videos te puede recomendar en YouTube.
Entiendo. Más o menos. Sin embargo, ¿cómo funciona ese proceso en la práctica?
En la práctica, los patrones que la computadora aprende pueden ser muy difíciles y complejos de explicar en palabras. Por ejemplo, Google Fotos te permite buscar en tus fotos imágenes de perros. ¿Cómo logra Google hacer eso? Primero, tomamos una serie de ejemplos de fotos con la etiqueta "perro" (¡gracias, Internet!). También recibimos un grupo de fotos con la etiqueta "gato" y alrededor de un millón de etiquetas más, pero no las mencionaré todas aquí.
Luego, la computadora busca patrones de píxeles y de colores que le permiten identificar si es un gato o un perro (o…). Primero, debe descubrir de manera aleatoria cuáles son los mejores patrones para identificar a los perros. Analiza la imagen de ejemplo de un perro y comprueba si los patrones actuales son correctos. Si se equivoca al identificar un gato de un perro, realiza pequeños ajustes a los patrones que está usando. Luego, examina la imagen de un gato y vuelve a corregir los patrones para que sean correctos. Repite este proceso cerca de mil millones de veces: analiza un ejemplo y, si no lo identifica de manera correcta, corrige los patrones que usa para mejorar su tarea en ese ejemplo específico.
Finalmente, los patrones conforman un modelo basado en el aprendizaje automático, como una red neuronal profunda, que puede identificar perros y gatos, bomberos y mucho más de manera casi perfecta.
Suena muy futurista. ¿Qué otros productos de Google usan el aprendizaje automático en la actualidad?
Hay una gran cantidad de proyectos nuevos que Google está realizando con el aprendizaje automático. Por ejemplo, Google Traductor puede tomar una foto de un cartel en la calle o de un menú escritos en un idioma, identificar las palabras y el idioma del texto que aparece en la foto y traducirlo mágicamente a tu idioma en tiempo real.
También puedes decirle una frase a Google Traductor, y comenzará a funcionar el reconocimiento de voz basado en el aprendizaje automático. El reconocimiento de voz también se usa en muchos otros productos, como Google app, para resolver tus consultas por voz y lograr que los videos de YouTube sean más fáciles de encontrar.
En el caso de carteles, menús, etc., solo apunta tu cámara a ellos para obtener una traducción instantánea. Ni siquiera es necesario estar conectado a Internet. * Word Lens está disponible del inglés a más de veinticinco idiomas.
Comunícate con una persona que hable un idioma distinto.
Escribe caracteres y palabras que no son compatibles con tu teclado.
Solo ingresa las palabras que deseas traducir.
Entonces, ¿por qué ahora Google hace tanto hincapié en el aprendizaje automático?
El aprendizaje automático no es completamente nuevo, ya que sus raíces se remontan a las estadísticas del siglo XVIII. Pero estás en lo cierto al afirmar que se popularizó últimamente. Se debe a tres razones.
Primero, necesitamos una gran cantidad de ejemplos para poder enseñarles a las computadoras a realizar buenas predicciones, incluso en cuanto a problemas que podríamos considerar sencillos, como encontrar un perro en una foto. Gracias a la cantidad de actividad en Internet, tenemos una enorme fuente de ejemplos a partir de los que la computadora puede aprender. Por ejemplo, ahora existen millones de fotos con la etiqueta "perro" en sitios web alrededor del mundo y en todos los idiomas.
No obstante, tener muchos ejemplos no es suficiente. No puedes simplemente mostrarle un montón de fotos de perros a una cámara web y esperar que aprenda algo. La computadora necesita un programa de aprendizaje. Recientemente, este sector (y Google) llevó a cabo avances emocionantes en cuanto a la complejidad y la potencia que pueden tener dichos programas de aprendizaje automático.
Pero nuestros programas aún no son perfectos y las computadoras todavía no son tan inteligentes, por lo que debemos ver muchos ejemplos varias veces para ajustar bastantes detalles técnicos y obtener el resultado correcto. Este proceso requiere una gran capacidad informática y una sofisticada paralización de procesos. Sin embargo, los nuevos progresos en software y hardware lo hicieron posible.
¿Qué acción que las computadoras no pueden hacer hoy podrán lograr muy pronto gracias al aprendizaje automático?
Parece que fue ayer cuando el reconocimiento de voz tenía dificultades para reconocer solo diez dígitos distintos cuando leías tu número de tarjeta de crédito por teléfono. En los últimos cinco años, el reconocimiento de voz logró avances increíbles gracias a la implementación de aprendizaje automático sofisticado, que ahora puedes usar para realizar búsquedas en Google. Además, sigue mejorando con rapidez.
Creo que el aprendizaje automático incluso mejorará nuestro aspecto. Por ejemplo, odio probarme ropa. Si encuentro una marca de jeans que me gusta, compro cinco pares. Sin embargo, el aprendizaje automático puede convertir los ejemplos de las marcas que nos quedan bien en recomendaciones sobre qué más puede quedarnos bien. Aunque este problema no concierne a Google, espero que alguien se ocupe de él.
¿Cómo será el aprendizaje automático en diez años?
Todo el sector está trabajando para que el aprendizaje funcione más rápido con menos ejemplos. Uno de los enfoques para lograrlo (en el que Google en particular está trabajando arduamente) se basa en proporcionar a nuestras computadoras más sentido común, que en el sector se conoce como "regularización".
¿Cómo adquiere sentido común una computadora? En general, puede significar que si un ejemplo varía un poco, la computadora no debería cambiar el resultado completamente. Por ejemplo, la foto de un perro con un sombrero de vaquero sigue siendo de un perro.
Para implementar esta clase de sentido común en el programa de aprendizaje, intentamos que el aprendizaje automático no sea sensible a los cambios irrelevantes y pequeños, como el sombrero de vaquero. Aunque es fácil decirlo, si te equivocas, harás que la computadora no sea lo suficientemente sensible a los cambios importantes. Aún estamos buscando ese equilibrio.
¿Qué te entusiasma más acerca del aprendizaje automático? ¿Qué te motiva a trabajar en él?
Crecí en Seattle, donde aprendí mucho sobre los primeros exploradores del oeste de Estados Unidos, como Lewis y Clark. La investigación sobre el aprendizaje automático tiene el mismo espíritu explorador. Estamos viendo todo por primera vez y tratamos de trazar un camino hacia un gran futuro.
Si pudieras crear un eslogan para la calcomanía de un auto sobre el aprendizaje automático de Google, ¿cuál sería?
Si no funciona la primera vez, trata un millón de veces más.