Retos para la visión artificial

Lección 5

Máquinas que ven

¿Para qué sirve una máquina que puede ver?

Aunque la IA nos sorprende a veces con su habilidad para resolver muchos problemas, no siempre es capaz de alcanzar las capacidades de los humanos en el campo de la visión.

Te pongo aquí una lista de retos pendientes y dificultades que tiene la IA cuando trata de ver el mundo como hacemos los humanos:

Variabilidad: Esto ya lo habíamos comentado antes. Las imágenes pueden variar en iluminación, ángulo, escala, resolución, calidad… La visión artificial debe ser capaz de reconocer objetos en todas estas condiciones, lo que puede ser complicado.
Objetos ocultos: A veces los objetos pueden estar parcialmente ocultos por otros objetos en una imagen (los expertos en IA lo llaman oclusión). La visión artificial debe poder reconocer y entender objetos incluso cuando no se ven completos.
Ruido: ¡El ruido no es solo algo que afecte a nuestros oídos! Cuando una imagen tiene manchas o distorsiones se dice que tiene “ruido”. Este ruido dificulta a la IA la detección y reconocimiento de objetos.
Objetos en movimiento: Cuando los objetos se mueven, la visión artificial debe seguirlos y reconocerlos, lo que puede ser un desafío en escenas dinámicas (es decir, donde hay mucho movimiento).
Diversidad de objetos: ¡El mundo es maravilloso! Solo en la naturaleza ya existen millones y millones de especies diferentes de plantas y animales. Súmale a eso todos los objetos creados por el hombre. La visión artificial debería ser capaz de reconocer una amplia gama de ellos, desde un animal como el ñu hasta un objeto cotidiano como la cuchara.
Privacidad: ¿Te suena esta palabra? Aparece mucho por Internet cuando nos preguntan algún dato personal (como tu nombre o dónde vives). Tener privacidad significa que nuestras cosas solo las usa y las ve quien nosotros queramos. Por ejemplo, si mandas un mensaje por WhatsApp a una amiga, nadie más que tú y tú amiga lo podéis ver. ¡Ni siquiera el dueño de WhatsApp tiene permiso para verlo! Imagina una IA que es capaz de reconocer caras y se utilizara con cámaras de seguridad por la calle. Podría saber dónde vas y qué haces en cada momento. Eso sería invadir tu privacidad. ¡En la Lección 10 te cuento más cosas sobre esto!

¡Hola! Soy Mark Zuckerberg, dueño de WhatsApp y, aunque quisiera, no puedo leer ni uno de tus mensajes. ¡Eso es la privacidad!

Discriminación: Los sistemas de visión artificial pueden tratar a algunas personas de manera injusta o diferente si no están bien entrenados. ¿Sabes que algunos teléfonos móviles tienen una IA que permite desbloquearlos simplemente mostrando tu cara? Imagina que esa IA solo funcionara bien con gente que tenga la piel de color claro, porque solo lo han entrenado con imágenes de ese tipo de personas. ¡Eso sería discriminación!
Aprendizaje continuo: La IA necesita aprender constantemente de nuevas imágenes para mejorar. Imagina que queremos que aprenda a reconocer un nuevo detector de ñus que han inventado. Esto significa que la IA tiene que tener acceso a datos actualizados y ser (re)entrenada a menudo. No podemos crear un modelo y olvidarnos de él o se quedará viejo en dos días.

Bueno, ¿qué te ha parecido la visión artificial? Espero que te hayas quedado con ganas de más, porque en la siguiente sesión vamos a crear un programa con Machine Learning for Kids para reconocer imágenes. ¡Vamos allá!