Lección 5
Máquinas que ven
¿Cómo reconoce imágenes la IA?

¿Cómo reconoce imágenes la IA?

Seguro que a estas alturas te estás preguntando cómo puede una IA reconocer una imagen cuando se la enseñas. Pues imagina que tienes una caja mágica llena de bloques de construcción, como las piezas de LEGO o los bloques de Minecraft. Pero estos no son bloques normales, son bloques especiales que pueden cambiar de forma y color. Cada vez que pones una foto frente a la caja, los bloques se mueven y cambian para tratar de construir algo que se parezca a lo que se ve en la foto.

El proceso de reconocer una imagen es como si la caja mágica estuviera tratando de armar un rompecabezas con esos bloques de construcción. Al principio la caja no lo hace demasiado bien, porque no entiende qué forma o color deben tener los bloques para parecerse a la foto. Pero a medida que le muestras más y más fotos, la caja comienza a aprender. Empezará a darse cuenta de cosas como, “Ah, cuando la foto es de un perro, necesito usar bloques marrones y blancos, algunos redondeados” o “cuando la foto es un árbol, necesito usar bloques con varios tonos de verde y marrón, algunos bastante rectos”.

Un chihuahua hecho con bloques de Minecraft.

De esta forma, la caja mágica, es decir, nuestra IA, aprende a reconocer lo que está en las imágenes. A través de muchas imágenes y pruebas, aprende cuáles son las mejores formas y colores de los bloques para representar cada tipo de imagen.

Recuerda cómo, al igual que tu cerebro aprende a reconocer las cosas después de verlas muchas veces, la IA también aprende de esta manera: le tenemos que enseñar muchas imágenes distintas de los objetos que queremos que reconozca y decirle qué objeto es en cada caso. Al principio, puede que no sea muy buena, pero con la práctica y la experiencia, se vuelve cada vez mejor (ya sabes, ¡aprendizaje automático!).

¿Esto es aprendizaje supervisado o no supervisado? ¿Te acuerdas?

¿Y cómo le enseño una imagen a la IA? Puedes usar fotos que tengas guardadas en tu ordenador o, todavía mejor, si tienes cámara en tu ordenador o tablet puedes usar la cámara como si fuesen los ojos que ven las fotos y enviar directamente lo que “ve” la cámara a la IA, esa caja mágica que utiliza sus bloques especiales para tratar de reconstruir lo que ve en las fotos.

¿Y para qué queremos que una máquina aprenda a ver? ¡Pues la verdad es que sirve para muchísimas cosas! Te cuento algunas de ellas en la siguiente sección.