Lección 3
Máquinas que leen y escuchan
La variabilidad y ambigüedad del lenguaje

La variabilidad y ambigüedad del lenguaje

Entender el lenguaje natural (el que usamos los humanos) parece sencillo para una persona, pero nuestra forma de hablar y escribir tiene algunas características que hacen que a la IA le cueste entendernos. Los dos principales problemas de nuestro lenguaje son la sinonimia y la polisemia, es decir, la variabilidad y la ambigüedad del lenguaje humano.

La sinonimia implica que uno puede decir la misma información de muchas maneras diferentes. Oraciones que significan lo mismo pueden ser completamente diferentes desde un punto de vista de las palabras que se utilizan. Mira este ejemplo:

  • Me gustan las hamburguesas
  • Me encanta comer hamburguesas
  • Las hamburguesas con mi comida favorita
  • Disfruto comiendo burgers
  • Las hamburguesas son de mi agrado
  • Las hamburguesas son exquisitas
  • Me encanta el sabor de las hamburguesas
  • Las hamburguesas son sabrosas
  • Disfruto mucho comiendo hamburguesas

Para una máquina no es sencillo entender que todas estas frases significan lo mismo. Tampoco le resulta fácil entender que “gato”, “minino” y “michi” se refieren al mismo animal.

El  segundo problema es el de la ambigüedad del lenguaje, también conocido como polisemia. Algo es ambiguo cuando puede ser entendido de dos o más maneras o sentidos diferentes. Por ejemplo “María ha visto a Juan con el catalejo”. Esta frase se puede interpretar de dos maneras diferentes: “María estaba mirando por un catalejo y ha visto a Juan” o “María ha visto pasar a Juan que llevaba un catalejo en la mano (se lo acaba de comprar)”.

Otro ejemplo, un poco más raro: “Voy a comprar un jabón para niños con forma de hipopótamo”. ¿Dónde está la ambigüedad aquí? Lo primero que habrás pensado es que el jabón tiene forma de hipopótamo, ¿pero podría ser que fuera el niño el que tuviera forma de hipopótamo?

Jabón con forma de hipopótamo.
Niño con forma de hipopótamo (no es de verdad, lo ha dibujado una IA).
Nuestro conocimiento del mundo nos dice que eso es poco probable y que lo que tiene forma de hipopótamo es el jabón, por lo que no hay ambigüedad posible. Pero un ordenador tiene problemas en codificar conocimiento del mundo, por lo que para él no es tan obvio y esta frase resulta ambigua.