ChatGPT: la máquina combinatoria

Hoy, los modelos de generación de lenguaje como ChatGPT escriben historias de calidad dudosa. Pero su futuro podría estar lleno de posibilidades para ellos y para los escritores que los usen.

Por Roberto Wong

13 marzo 2023

AÑADIR A FAVORITOS

ClosePlease loginn

En su ensayo “Filosofía de la composición”, Edgar Allan Poe alude la escritura de su poema El cuervo para “mostrar que ningún detalle de su composición puede asignarse a un azar o intuición, sino que la obra se desenvolvió paso a paso hasta quedar completa, con la precisión y el rigor lógico de un problema matemático”.

Poe, como sabemos, es el padre de la novela negra (en 1841 publicó Los crímenes de la calle Morgue, que podría considerarse el primer relato policial), género que antepuso el racionalismo al romanticismo circundante.

Bajo la misma lógica, Poe propone en dicho ensayo ver a la escritura como un mecanismo de ingeniería, una máquina que responde a una intención o efecto.

Atento a estas consideraciones, (…) calculé inmediatamente la longitud adecuada para el poema que me había propuesto, longitud que alcanzaría a unos cien versos. El poema llegó a tener 108.

Casi doscientos años después, los LLM (Large Language Models, por sus siglas en inglés, y catalogados de manera imprecisa como inteligencia artificial, o IA), han logrado resolver con la precisión y el rigor lógico al que aspiraba Poe la escritura de cualquier texto.

(( La inteligencia artificial (IA) es la disciplina que tiene por objetivo crear software inteligente, esto es, con capacidades similares a las humanas. El aprendizaje automático, machine learning, por otro lado, es un subconjunto de la inteligencia artificial que se refiere a sistemas capaces de aprender por sí mismos. ))

¿Cómo llegamos hasta aquí?

Empecemos con una distinción: los LLM

{{ El origen de dicha tecnología se remonta a la década de 1960, cuando se comenzaron a explorar modelos que pudieran imitar conversaciones humanas –por ejemplo, ELIZA–. Tuvo un desarrollo exponencial en 2017 a partir de una tecnología llamada “Transformer”, un tipo de red neuronal que categoriza una instrucción y sus relaciones con otras palabras para entender su contexto y sentido. }}

son modelos que entienden y generan texto a partir de una instrucción o prompt.

{{ Los LLM pueden ser utilizados para una variedad de tareas, como análisis de sentimientos en redes sociales, servicio al cliente, resúmenes automáticos, traducción automática, clasificación de documentos, generación de texto y más. }}

Están basados en redes neuronales, en concreto, en una tecnología llamada Natural Language Processing que permite a las computadoras interpretar, manipular y “comprender” el lenguaje humano. Las comillas son importantes: dicha “comprensión” está basada en un modelo probabilístico a partir del análisis de miles de datos (principalmente, el contenido disponible en internet: desde Wikipedia, hasta los cientos de miles de blogs y perfiles en redes sociales).

(( Este video explica un LLM utilizando un ejemplo basado en una canción de Bob Dylan. ))

Imaginémoslo de la siguiente forma: una instrucción o prompt solicita “un tuit de Donald Trump” a uno de estos modelos. El algoritmo, entonces, crea una respuesta semántica a partir del mapa que tiene disponible, es decir, establece el prompt dentro de una serie de coordenadas y, en cierto sentido, “predice”

{{ Estas predicciones a veces generan resultados inesperados y, consecuentemente, conllevan riesgos como los expuestos aquí. }}

un tuit de Donald Trump que se acerca lo más posible al cuadrante semántico que el prompt representa (en otras palabras, el modelo es similar al ars combinatoria de Ramon Llull: una combinación mecánica capaz de representar un lenguaje universal).

La calidad del resultado, en el caso de los LLM, dependerá del volumen y calidad de los datos con el que ha sido entrenado,

{{ En 2016 Microsoft lanzó Tay, un robot precursor a este tipo de modelos, que interactuaba en Twitter con cualquier persona. En menos de 24 horas el robot comenzó a contestar a los usuarios con comentarios racistas o sexistas, pues su modelo se basaba en los datos de la misma red social. }}

así como del modelo de entrenamiento.

ChatGPT, desarrollado por la empresa OpenAI y quizás el modelo más famoso a la fecha, está optimizado para generar textos conversacionales o “diálogos” a partir de un método llamado pre-entrenamiento generativo, en el cual el modelo intentará predecir cuál será la siguiente instrucción o prompt en la conversación para tener una charla mucho más dinámica y fluida.

Los parámetros (o coordenadas, utilizando el símil anterior) que ChatGPT puede llegar a reconocer están cerca de los 175 mil millones, y está disponible tanto en inglés como en español.

Dicho esto, ChatGPT es tan solo uno de tantos LLM disponibles. Todos están basados en datos existentes, pero algunos se han enfocado en ciertos nichos específicos (AI Dungeon, por ejemplo, crea aventuras para Dungeons & Dragons a partir de cinco sets de datos predeterminados: Fantasía, Misterio, Zombies, Aventuras postapocalípticas y Cyberpunk).

Este ejemplo nos permite echar un vistazo a las implicaciones que estos modelos tienen en la escritura creativa. En 2017, por ejemplo, se publicó 1 the Road, una novela experimental en el que un algoritmo emuló la famosa novela de Jack Kerouac –en este caso, el prompt fue una laptop conectada a múltiples sensores durante un viaje en automóvil desde Nueva York a Nueva Orleans.

(( Una cámara de vigilancia montada en el maletero fue entrenada para percibir los paisajes, al tiempo que un micrófono capturó las conversaciones dentro del automóvil y el GPS rastreó la ubicación del automóvil. Estos inputs sirvieron al algoritmo para escribir la novela en una impresora similar a la que usan las terminales que leen tu tarjeta de crédito. ))

Cuatro años después se publicó en Corea del Sur una novela de 560 páginas sobre “un matemático aficionado, un profesor, un psiquiatra, un astrofísico y un monje budista, unidos para comprender el significado de la existencia humana”. Pese a lo inverosímil (o extravagante) de la premisa, lo cierto es que hay ahora una multitud de libros escritos con la ayuda de LLM, así como diversas herramientas que buscan ayudar a aspirantes a escritores a ser más productivos (por ejemplo, decenas de escritores en Amazon están usando estas herramientas para aumentar sus ingresos en un sistema que favorece la velocidad y el número de títulos en catálogo).

Al día de hoy, sin embargo, la calidad de estos libros sigue siendo cuestionable.

{{ Recientemente Clarkesworld, un sello editorial enfocado en ciencia ficción, ha cerrado su buzón de colaboraciones debido a un exceso de propuestas de mala calidad escritas con ChatGPT. }}

Para probarlo, le he dado como instrucción al modelo escribir “un relato al estilo de Philip K. Dick sobre una inteligencia artificial que vuelve obsoletos a los escritores”. Este es el resultado:

Había una vez, en un mundo donde la tecnología había avanzado más allá de lo reconocible, la inteligencia artificial estaba a cargo de todas las formas de escritura. Desde artículos de noticias hasta novelas, la IA estaba produciendo contenido más rápido y mejor que cualquier humano. Las máquinas eran implacables en su producción, nunca tomando descansos ni cometiendo errores. Podían producir historias en cualquier estilo y género, con una precisión e imaginación impecables.
Al principio, los escritores mostraron su escepticismo. Pensaron que la IA no podría igualar la profundidad emocional y la sutileza que solo un ser humano podría aportar a su escritura. Pero a medida que las máquinas continuaron produciendo obra tras obra maestra, los escritores comenzaron gradualmente a darse cuenta de la verdad. Las máquinas los estaban haciendo obsoletos.

En una conversación entre Maurizio Ferraris y Jacques Derrida, el último dice: “estoy tentado a decir que mi experiencia de la escritura me lleva a pensar que no siempre se escribe con el deseo de que a uno lo entiendan; (…) debo admitir que en la escritura subyace la exigencia de un exceso aun respecto de aquello que puedo comprender de cuanto digo: la necesidad de dejar una suerte de apertura, de juego, de indeterminación”.

(( Jacques Derrida y Maurizio Ferraris, El gusto del secreto, Amorrortu, 2009, pp 46-47 ))

Es aquí donde ChatGPT y otros modelos similares fallan: los textos que producen son demasiado literales o, dicho de otro modo, carecen de misterio (Piglia lo diría de otra forma: todo relato narra, en realidad, dos historias: una visible y otra secreta).

Esta tecnología plantea, sin embargo, un punto de inflexión: ¿existirá un futuro en que sea posible escribir cualquier historia a partir de este tipo de instrucciones?

Quizás. Un panel de expertos estima 2061 como el horizonte probable para ver una AI con un nivel similar al humano.

De llegar ahí, los escritores se parecerán más a la actual figura del DJ: mezclarán prompts para crear toda clase de historias, no solo escritas, sino en combinación con música, video o experiencias inmersivas –en un ejercicio radical de imaginación, podemos pensar en modelos tercerizados, colectivos y no-lineares de pensamiento.

Estas ideas, en todo caso, funcionan como líneas de fuga ante una pregunta más mundana: ¿serán capaces estos modelos de crear un punto de vista distinto a los datos con los que han sido creados? En otras palabras, ¿podrán generar en algún momento desviaciones a sus propios modelos? Al final, los LLM y otras tecnologías similares “predicen” una respuesta a partir de patrones que, como sabemos, tienden a la estandarización y, con esta, al lugar común o al prejuicio –recientemente, una obra de teatro escrita con ChatGPT dio a personajes de Oriente Medio roles de “terrorista” o “violador”.

No es difícil prever, ante estos escenarios, un regreso a la disidencia o la vanguardia.

En cualquiera de estos casos, el futuro resulta fascinante. ~

*Estructura de un ensayo sobre las implicaciones de ChatGPT en la literatura, escrito por el propio ChatGPT*.

Roberto Wong

Website | + posts

(Tampico, 1982) es narrador. En 2015 publicó París D.F., su primera novela, por la que ganó el Premio Dos Passos. En 2017 ganó el IX Certamen Internacional Sor Juana Inés de la Cruz en la categoría de cuento con el libro Los recuerdos son pistas, el resto es una ficción. Actualmente vive en Barcelona, desde donde mantiene El Anaquel, un blog y podcast sobre literatura y cultura.