Datos
Los son la información a partir de la que aprende el sistema. Por ejemplo, para que la IA aprenda a distinguir en una imagen distintos animales, tenemos que darle fotos de estos animales y decirle lo que es cada uno.
Recuerda que en el aprendizaje supervisado tenemos que ponerle una etiqueta a cada foto (la clase para que la IA sepa lo que es (“perro”, “gato”, “rana”, “ñu”, “gorila”, …). Esas fotos, junto con las etiquetas de cada una, son los datos a partir de los que la IA aprende.
La cantidad de datos también es importante. ¡Cuantos más, mejor! Además deben ser variados. Si queremos que la IA aprenda a distinguir lo que es un perro, no podemos darle solo fotos de caniches y chihuahuas. Tendremos que darle fotos lo más variadas posibles, de muchas razas y perros diferentes, para que aprenda todos los detalles que hacen que un perro sea un perro. Por ejemplo, si le damos una foto de un perro con hocico largo y peludo, aprenderá que esa es una característica que tienen los perros. He estado poniendo ejemplos donde los datos son imágenes, pero en realidad pueden ser muchas otras cosas, como textos, vídeos o sonidos. Depende de la tarea que queramos que la IA resuelva.
Por ejemplo, si queremos que una IA aprenda a reconocer emociones y sentimientos de la gente cuando escribe, podríamos darle muchos ejemplos de textos donde la gente dice cosas buenas (“¡Qué divertido¡”, “Me encanta ese libro”) y cosas malas (“Me aburro como una ostra”, “No me gusta nada”). Así aprendería a distinguir cuando alguien escribe algo si lo que está diciendo es positivo o negativo.
También podríamos darle ejemplos de sonidos donde se oye el canto de distintos pájaros para que aprenda a distinguir a unas razas de otras.
¿Te ha quedado claro lo importante que son los datos para que la IA aprenda? Pues vamos a ver qué otros elementos son importantes.