Análisis del aprendizaje automático: preguntas y respuestas

Muchos de nosotros creemos que el aprendizaje automático es una cosa muy futurista. Sin embargo, está cada vez más presente en nuestra vida, ya sea cuando un ordenador de Google juega una increíble partida de Go, o bien cuando Inbox by Gmail genera respuestas automáticas. Si bien todo esto suena emocionante, muchos de nosotros seguimos preguntándonos en qué consiste exactamente el aprendizaje automático, por qué es tan importante o por qué identificar un perro en una foto no es tan sencillo como parece. Con el fin de analizar todo esto, nos hemos reunido con Maya Gupta, investigadora de Google en este campo.

Empecemos por lo más sencillo: ¿qué es exactamente el aprendizaje automático?

El aprendizaje automático toma un conjunto de ejemplos, descubre los patrones que hay detrás de ellos y los utiliza para hacer predicciones sobre ejemplos nuevos.

Pensemos, por ejemplo, en recomendaciones de películas. Supongamos que mil millones de personas nos dicen sus diez películas favoritas. Ese sería el conjunto de ejemplos que el ordenador puede utilizar para descubrir qué películas son comunes entre ese grupo de personas. A continuación, el ordenador elabora patrones para explicar esos ejemplos, como "A las personas a las que les gustan las películas de terror no les suelen gustar las románticas, pero sí les gustan las películas en las que aparecen los mismos actores". Por tanto, si le indicas al ordenador que te gusta El resplandor de Jack Nicholson, podrá deducir si también te gusta la comedia romántica Cuando menos te lo esperas, también de Jack Nicholson, y qué otros vídeos de YouTube podría recomendarte.

Entendido, más o menos. Sin embargo, ¿cómo se traduce esto en la práctica?

En la práctica, los patrones que aprende la máquina pueden ser muy complejos y difíciles de explicar con palabras. Pongamos como ejemplo Google Fotos, que te permite buscar en tus fotos imágenes en las que aparezcan perros. ¿Cómo lo hace Google? Bien, en primer lugar utilizamos un conjunto de ejemplos de fotos con la etiqueta "perro" (gracias a Internet). También utilizamos un conjunto de fotos con la etiqueta "gato", así como fotos con millones de etiquetas diferentes, pero no las voy a enumerar todas aquí :).

A continuación, el ordenador busca patrones de píxeles y patrones de colores que le ayudan a averiguar si se trata de un gato, de un perro o de cualquier otra cosa. Primero, hace una estimación aleatoria sobre los patrones que podrían ser adecuados para identificar perros. Después examina un ejemplo de una imagen de un perro y comprueba si sus patrones encajan correctamente. Si determina que está llamando perro a un gato, realiza algunos ajustes en los patrones utilizados. Después examina la imagen de un gato y vuelve a afinar sus patrones para intentar conseguir el más preciso. Este proceso se repite alrededor de mil millones de veces: examina un ejemplo y, si el patrón no es el correcto, lo va cambiando para mejorar el resultado del mismo.

Al final, los patrones constituyen un modelo de aprendizaje automático, como si se tratase de una red neuronal profunda que puede identificar (casi) correctamente perros, gatos, bomberos y muchas otras cosas.

Suena muy futurista. ¿Qué otros productos de Google utilizan actualmente aprendizaje automático?

Google está utilizando aprendizaje automático en muchos proyectos nuevos, como es el caso del Traductor de Google, que puede tomar una foto de un cartel de señalización o de un menú de un restaurante en un idioma, descubrir las palabras y el idioma que aparecen en la foto, y traducirlos por arte de magia y en tiempo real a tu idioma.

También puedes enviar casi cualquier mensaje de voz al Traductor de Google y el reconocimiento de voz podrá procesarlo mediante aprendizaje automático. La tecnología de reconocimiento de voz se utiliza en otros productos de Google, por ejemplo, para realizar consultas de voz en la aplicación Google o para buscar vídeos más fácilmente en YouTube.

Para traducir señales, menús o similares, apunta con tu cámara y obtén una traducción instantánea. Ni siquiera es necesario que estés conectado a Internet. * Word Lens está disponible en inglés y en más de dos docenas de idiomas.

Conversa con alguien que hable otro idioma.

Escribe a mano caracteres y palabras fácilmente sin necesidad de utilizar el teclado.

Simplemente introduce las palabras que quieras traducir.

Entonces, ¿por qué Google le está dando tanta importancia ahora al aprendizaje automático?

El aprendizaje automático no es algo nuevo, ya que se remonta a las estadísticas del siglo XVIII, pero es cierto que últimamente está en auge y esto se debe a tres motivos que voy a explicar a continuación.

El primero de ellos es que necesitamos una inmensa cantidad de ejemplos para enseñar a los ordenadores cómo hacer buenas predicciones, incluso sobre cosas que tú y yo consideramos fáciles (como encontrar un perro en una foto). Con toda la actividad que hay en Internet, ahora tenemos una fuente de ejemplos más amplia que pueden utilizar los ordenadores. Por ejemplo, ahora hay millones de fotos de perros con la etiqueta "perro" en sitios web de todo el mundo y en todos los idiomas.

Pero no basta con tener muchos ejemplos. No puedes enseñarle simplemente un montón de fotos de perros a una cámara web y esperar que aprenda sola; el ordenador necesita un programa de aprendizaje. De hecho, últimamente el sector (y también Google) ha hecho importantes avances en cuanto a la complejidad y la potencia que pueden tener estos programas de aprendizaje.

Sin embargo, nuestros programas todavía no son perfectos y los ordenadores siguen siendo poco inteligentes, por lo que tenemos que ver muchos ejemplos numerosas veces para cambiar los controles digitales y obtener resultados precisos. Aunque esto necesita una capacidad de procesamiento enorme y una sofisticada computación paralela, los nuevos avances en software y hardware también han conseguido que sea posible.

¿Hay algo que los ordenadores no puedan hacer hoy pero que si podrán hacer en el futuro gracias al aprendizaje automático?

Hasta hace nada, ya era una proeza utilizar el reconocimiento de voz para detectar apenas diez dígitos distintos cuando decías el número de tu tarjeta de crédito por teléfono. El reconocimiento de voz ha conseguido increíbles avances en los últimos cinco años con el uso del sofisticado aprendizaje automático, y ahora podemos utilizarlo para hacer búsquedas en Google, y cada vez de forma más rápida.

Creo que el aprendizaje automático puede ayudarnos también a mejorar nuestro aspecto. No sé vosotros, pero yo odio probarme ropa. Si encuentro una marca de vaqueros que me sienta bien, me compro cinco. Pues bien, el aprendizaje automático puede convertir ejemplos de las marcas que nos sientan bien en recomendaciones de otras prendas que igualmente podrían quedarnos bien. Este problema está fuera del alcance de Google, pero espero que alguien esté investigándolo.

¿Cómo será el aprendizaje automático dentro de diez años?

El sector está trabajando actualmente para alcanzar un aprendizaje más rápido a partir de menos ejemplos. Una forma de abordar esto (algo en lo que Google está haciendo especial hincapié) consiste en aportarles a nuestras máquinas más sentido común, lo que en el sector se denomina "regularización".

¿Qué es el sentido común para una máquina? En general, significa que si un ejemplo cambia solo un poco, la máquina no debería cambiar sus conclusiones. Es decir, una foto de un perro con un sombrero de vaquero sigue siendo un perro.

Imponemos este tipo de sentido común en el programa de aprendizaje cuando conseguimos que el aprendizaje automático sea capaz de obviar los cambios pequeños e insignificantes, como un sombrero de vaquero. Aunque esto parezca fácil de decir, si nos equivocamos, es posible que una máquina no detecte bien los cambios importantes. Se trata de alcanzar un equilibrio y todavía estamos trabajando para conseguirlo.

Para ti, ¿qué es lo más emocionante del aprendizaje automático? ¿Qué es lo que te motiva a trabajar con él?

Me crié en Seattle, donde aprendimos mucho sobre los primeros exploradores del Oeste de Estados Unidos, como Lewis y Clark. El aprendizaje automático tiene ese mismo espíritu explorador, ya que descubrimos cosas por primera vez e intentamos trazar un camino hacia un gran futuro.

Si pudieras ponerle un eslogan al aprendizaje automático de Google, ¿cuál sería?

Si de primeras no lo consigues, inténtalo mil millones de veces más.