La variabilidad y ambigüedad del lenguaje
Entender el lenguaje natural (el que usamos los humanos) parece sencillo para una persona, pero nuestra forma de hablar y escribir tiene algunas características que hacen que a la IA le cueste entendernos. Los dos principales problemas de nuestro lenguaje son la sinonimia y la polisemia, es decir, la variabilidad y la ambigüedad del lenguaje humano.
La sinonimia implica que uno puede decir la misma información de muchas maneras diferentes. Oraciones que significan lo mismo pueden ser completamente diferentes desde un punto de vista de las palabras que se utilizan. Mira este ejemplo:
- Me gustan las hamburguesas
- Me encanta comer hamburguesas
- Las hamburguesas con mi comida favorita
- Disfruto comiendo burgers
- Las hamburguesas son de mi agrado
- Las hamburguesas son exquisitas
- Me encanta el sabor de las hamburguesas
- Las hamburguesas son sabrosas
- Disfruto mucho comiendo hamburguesas
Para una máquina no es sencillo entender que todas estas frases significan lo mismo. Tampoco le resulta fácil entender que “gato”, “minino” y “michi” se refieren al mismo animal.
El segundo problema es el de la ambigüedad del lenguaje, también conocido como polisemia. Algo es ambiguo cuando puede ser entendido de dos o más maneras o sentidos diferentes. Por ejemplo “María ha visto a Juan con el catalejo”. Esta frase se puede interpretar de dos maneras diferentes: “María estaba mirando por un catalejo y ha visto a Juan” o “María ha visto pasar a Juan que llevaba un catalejo en la mano (se lo acaba de comprar)”.
Otro ejemplo, un poco más raro: “Voy a comprar un jabón para niños con forma de hipopótamo”. ¿Dónde está la ambigüedad aquí? Lo primero que habrás pensado es que el jabón tiene forma de hipopótamo, ¿pero podría ser que fuera el niño el que tuviera forma de hipopótamo?