Lección 7
Máquinas que escriben y hablan
¿Quién es ChatGPT?

¿Quién es ChatGPT?

Ya te lo he mencionado un par de veces en esta lección. ChatGPT es el chatbot más avanzado que existe en la actualidad y ha sido desarrollado por la empresa OpenAI. Es verdad que tiene algunos competidores muy potentes, como Bard (que lo ha creado Google) y Llama 2 (que es de Meta), pero fue el primer chatbot que consiguió asombrar al mundo con sus capacidades, así que te voy a hablar un poco más de él.

He titulado esta sección “Quién es” en lugar de “Qué es” porque a veces suena tan humano que nos cuesta creer que estemos hablando con una máquina en lugar de con una persona. ¡Muchos consideran a ChatGPT como un primer paso en el camino a conseguir una IA general!

Si quieres verlo en funcionamiento, pincha aquí y te llevará a su página web. Pero antes de hacerlo, quiero que tengas en cuenta que tienes que tener al menos 13 años para poder crear una cuenta en su web y utilizarlo. Si eres menor de 13 años, tienes que usarlo siempre con la supervisión de un adulto: tu papá, tu mamá, una profe…

Otro detalle importante: no compartas nunca datos personales (nombre, dirección, teléfono, contraseñas…) cuando tengas una conversación con ChatGPT. Sus creadores tienen acceso a las conversaciones que tienes con él. Las miran para mejorar poco a poco el sistema y ver qué cosas no hace todavía bien, ¡pero no querrás que unos desconocidos se enteren de todos tus secretos!

(Original: OpenAI Vector: Zhing Za, Public domain, via Wikimedia Commons)
¡Hola! Soy ChatGPT. ¿En qué puedo ayudarte hoy?

¿Qué tiene por dentro ChatGPT? En sus tripas lo que hay es un modelo de lenguaje. Si recuerdas, este tipo de IA está diseñada para comprender y generar texto en lenguaje natural, es decir, a comunicarse con lenguaje humano. ¡Además puede hacerlo en diferentes idiomas! Entre ellos el español 😉 Eso está genial, porque muchas de estas herramientas que trabajan con lenguaje humano solo funcionan en inglés, porque solo las han entrenado con textos en ese idioma.

Lo que más llama la atención de ChatGPT es lo bien que genera texto, como si lo hubiera escrito un humano. Puede responder preguntas, mantener conversaciones, redactar texto, realizar traducciones, resumir contenido y muchas cosas más. Aunque sepa hacer todas esas cosas, también tiene algunas limitaciones, aunque algunas de ellas las han añadido sus creadores a propósito, para que no haga cosas malas. Te las cuento aquí abajo.

  • No le pidas su opinión sobre nada. Intenta preguntarle qué equipo le gusta más, si el Madrid o el Barcelona. ¡Te contestará que no tiene preferencias ni emociones porque es una IA!
  • No le pidas que haga nada ilegal o inapropiado. No puedes pedirle que te dé consejos para gastar bromas pesadas a tus amigos del cole. Te dirá que eso no está bien.
  • No le preguntes cosas ocurridas después de septiembre de 2021. El modelo de lenguaje se entrenó con textos hasta esa fecha, así que no le puedes preguntar qué película ganó más premios Óscar en 2022 porque no lo sabe.
  • No le preguntes predicciones para el futuro. Te dirá que no puede saber nada más allá de septiembre de 2021.
  • No le pidas que haga chistes o comentarios ofensivos sobre gente real. Nunca te va a decir nada que pueda dañar a otras personas o a ti mismo.

¿Sabes cómo han creado una IA tan potente? Pues han tenido que usar los tres tipo de aprendizaje que vimos en la primera lección: supervisado, no supervisado y por refuerzo. Para aprender se usaron como datos miles de millones de documentos de Internet: páginas de revistas, periódicos, artículos científicos, redes sociales, Wikipedia… Como ves, muchos datos y muy variados, para aprender sobre todo tipo de cosas.

En la primera fase de aprendizaje, le dieron a ChatGPT todos esos datos para que aprendiera de manera no supervisada cosas básicas del lenguaje, cómo se relacionan las palabras entre sí, cómo siguen unas oraciones a otras…

Después de esto, le dieron millones de ejemplos de conversaciones, de preguntas y respuestas, para que aprendiera cómo los humanos nos comunicamos cuando hablamos unos con otros. En esta fase se usó aprendizaje supervisado.

Por último, en una tercera fase se usó aprendizaje por refuerzo para terminar de mejorar la forma de conversar con los humanos. Lo que hicieron es preguntarle cosas a ChatGPT y pedirle que devolviera varias respuestas. Entonces un humano cogía esas respuestas y las ordenaba de mejor a peor, para que ChatGPT aprendiera a tener conversaciones que nos suenen naturales.

Aquí estoy pidiéndole a ChatGPT que me diga algo bonito. Siempre tiene una palabra amable en la boca.

Te he contado un poquito cómo funciona ChatGPT y las cosas que puede hacer, aunque es una herramienta mucho más potente de lo que imaginas. ¿Quieres saber cómo puede ayudarnos en el cole? Te lo cuento en la siguiente sección.