Entrevista a Toni Roldán. “En tareas que requieren juicio, la IA ayuda más a los mejores”

AÑADIR A FAVORITOS
Please login to bookmark Close

Toni Roldán es director del centro de política económica de Esade (EsadeEcPol). Fue secretario de programas y áreas sectoriales de Ciudadanos, y diputado en tres legislaturas. Tras su paso por la política retomó su carrera académica. Su tesis doctoral por la LSE, Three experiments on technology, inequality and ideology, aborda el vínculo entre los sesgos y las medidas políticas, los efectos de las tutorías en línea, y la relación entre la inteligencia artificial y la desigualdad, que es el tema de esta conversación: según su investigación, en vez de estrechar las diferencias en el mundo del trabajo es probable que la IA las aumente, como otras revoluciones tecnológicas.

Tu tesis son tres temas que no están tan relacionados. Se parece más a un libro de cuentos que a una novela.

Para los economistas hace mucho tiempo que las tesis doctorales son tres papers. Haces una introducción para vincular los temas como puedas. La función que yo hago es publicar en el mundo americano, y eso es un paper de diecisiete páginas con un anexo de cien, donde tú, con un análisis experimental muy concreto, respondes a una pregunta muy específica. En otra época eran más generales. De todas formas, mucha gente hace temas más parecidos entre sí. Mi expertise es más metodológica. También he tenido la suerte de que la política me ha servido para hacerme preguntas que no era capaz de hacerme hace diez años.

¿Te ha cambiado como economista tu experiencia en la política?

Muchísimo. Influye por ejemplo en el tercer paper, donde hemos participado seis personas, “Ideological alignment and evidence based policy adoption”. Es una intuición obvia: la importancia del mensajero. Si yo te transmito una evidencia, tú vas a recibir la evidencia de una manera distinta a si la transmite otra persona.

En el paper, que está aceptado para publicación en American Economic Review, habéis mirado 5.600 ayuntamientos.

Un reto de ese paper, y una contribución, es la construcción de la base de datos. Hay que encontrar los correos, contactar. Yo liaba a todos los amigos para que me hicieran los policy briefs y mensajes. Mandábamos el mensaje, que está basado en un paper, en el cual se informaba a los concejales de turismo o a los alcaldes de una medida neutral que mejora el turismo. Y lo que hacíamos era variar el mensajero. Hay un artículo en elDiario.es que pone “Wikipedia mejora un 9 %”, y el mismo titular en El Mundo. Y lo mismo con faes y Fundación Alternativas. Y así podíamos también mirar si el formato tenía alguna relevancia en la comunicación.

Que no tanta, parece.

No hay ninguna diferencia significativa. Siempre he pensado que el tema del formato es menos interesante, pero sí hay una manera de comunicar las políticas. Es una de las cosas que me interesan para el futuro: la parte de las narrativas, contar historias versus datos, más que si es un informe con unos bullet points muy buenos. Las historias son más memorables. Y de esto empieza a haber estudios, muy difíciles de hacer.

No es fácil medir eso.

Piensa en Trump con el muro. Piensas en políticas de Hillary y no te acuerdas de ninguna. Tenía un ejército de tíos listísimos, hacían unos excels que te cagas. Y este hombre, con una sola medida, concentra todo su mensaje de valores, su narrativa.

Eso de “dato mata relato” no es cierto.

Lo que recuerdas es una historia con valores asociados a un mensaje.

El segundo trabajo, que publicó Journal of Public Economics, habla de tutorías online.

Había una visión muy establecida –influida por Coursera y el abandono tan grande de la formación online– de que no iban a funcionar las tutorías online. Lo hicimos como respuesta social a la pandemia, porque los pobres no tenían a nadie que les enseñara. Había que responder a la pregunta de si las tutorías online funcionan o no. Y descubrimos que sí. Los efectos son impresionantes: hacer un curso de ocho semanas da mejoras equivalentes a casi un año de escolarización. Lo hicimos con niños de entornos muy vulnerables y con los excelentes profesores de Empieza por Educar. No sé cuántas veces habremos oído en los debates lo de la ratio, que hay pocos profes. Se gasta muchísimo en políticas que no son efectivas, como en la repetición.

Esto es mucho más barato.

Y más si le metes ia. Haces pequeños grupos online; reduces todo el costo de la movilidad del profesor. El humano pasa a ser casi un apoyo emocional; la práctica la hace la IA. Es una revolución, porque puedes tener feedback en tiempo real de cómo le está yendo al niño cuando el profesor da la clase, con mucha más información, individualizada. Para alumnos vulnerables, la IA va a funcionar a través de los profes.

Solventa el reto de la personalización. Ayuda si tienes un buen nivel. Puedes enseñar en el nivel correcto, porque muchos de esos ejercicios son adaptativos. Pero en población vulnerable tienes además posibilidades de mejorar la estructura. El profe gana productividad: generar ejercicios, estructurar clases, solventar dudas.

Tienes recursos como Edpuzzle, que es catalana y está en Estados Unidos. Tienes muchas opciones, pero deben estar mediadas. Puedes hacer ia dos de cada tres sesiones, tienes un profe que es el ejecutor, el que guía la IA. Es una política pública tremenda.

En los debates en los medios a menudo se presenta al revés: ya no podremos evaluar… En vez de señalar cómo puede ayudar a los profesores.

Como profesor, cada ejemplo que haces de práctica es una evaluación. El debate sobre los exámenes va a ser menos relevante. El terreno educativo es donde me parece que hay más posibilidades.

Tiene que ver con el primer paper de la tesis, “When AI increases inequality”, que está en revisión en Management Science. Hay una forma pesimista de enfocarlo y otra optimista. Por un lado: la IA ayuda a mejorar, y el que es mejor mejora más. La otra manera de verlo es: no vale para reducir la desigualdad; puede fomentarla, ya que ayuda más al que es mejor.

El 90% de la evidencia hasta ahora ha encontrado un resultado contraintuitivo: que la IA lleva a lo que llaman leveling up hypothesis, una compresión de la productividad en multitud de tareas. Ya sabes que los economistas hablamos mucho en términos de tareas. Lo que encuentran en esas tareas muy acotadas es que los peores mejoran mucho más con la IA que los mejores. Históricamente, la tecnología siempre ha sido eso que se denomina skill-biased technological change: cambio tecnológico con sesgo de destreza. Premiaba a los que tenían mayor educación. Con una computadora, si tenías estudios, multiplicabas; si no, seguías haciendo lo mismo. Inicialmente se pensó que esta tecnología iba a ser diferente. Y, de hecho, es diferente en algunas cosas. Hay tareas que aprende por sí misma. Hasta ahora, todas las tecnologías debían ser programadas. La diferencia fundamental es que tú no necesitas establecer unos algoritmos que les digan lo que tienen que hacer: endógenamente aprenden los patrones y, por lo tanto, por sí mismas se entrenan para ser cada vez mejores y no necesitan al humano.

Te permiten no solo identificar los patrones, sino actuar sobre ellos. Una computadora por sí misma no podía activar un programa, o aprender cómo hacer un dron y hacerlo, o comprarlo… Ahora tienes un agente que lo puede hacer todo solo.

Para la parte de desigualdad –que es la pregunta que intento responder, que está totalmente abierta– tienes muchos papers que encuentran compressing inequality. En tareas muy distintas, incluyendo la escritura creativa. De pronto, hago ese experimento y lo que veo es que los mejores lo hacen mucho mejor que los peores con el apoyo, en una tarea síncrona.

Un concurso de debate.

Con 140 chavales, asignación aleatoria, en tres rondas distintas, para apoyar el debate con información. Es una tarea muy distinta a las otras, porque es síncrona. En una tarea asíncrona, por resumir mucho, puedes fácilmente copiar y pegar. Por ejemplo, el paper más famoso es el de Brynjolfsson, Li y Raymond sobre atención al cliente. Tienen un machine-learning chatbot y dicen: “Me están preguntando…” Copian y pegan; los malos mejoran. Imagina un escritor horrible de emails: le pones Chatgpt y mejora muchísimo. Si eres una persona que sabe articular frases, tu mejora es menor. Y el peor no ha hecho nada. Ha mejorado, pero ha hecho un efecto sustitución. Otro aspecto muy importante es la diferencia entre complementariedad y sustitución. En estas tareas que se han observado hasta ahora, hay compresión de productividad, pero ¿cuán realista es eso? Está sustituyendo el juicio, no está mejorando el conjunto.

No sabemos si se puede generalizar.

¿Tiene validez externa? La productividad de las empresas depende de más cosas: de la interacción con los equipos, de los equipos de tus colegas, del líder estratégico que ve la oportunidad y en una reunión aprovecha el momento, del vendedor que ve cómo está pensando su interlocutor. Todo eso son tareas síncronas. Tienen que ver con las soft skills o con higher-order skills. Estoy evaluando el efecto de esas tareas que se realizan en tiempo real. Cuando estás rebatiendo un argumento y usas la IA, tienes que filtrar; es más complementario. No puedes copiar y pegar. Estás extrayendo en tiempo real los argumentos: calculas cuál es el más relevante para el contexto, según lo que me ha dicho el otro. Mi intuición es que vamos a un mundo más relacionado con el paper. Hay un par de artículos que apuntan en esa dirección, los cito en la versión revisada. Uno es de David Autor y otro de Ajay Agrawal.

¿Expertise, de Autor? ¿El del inventario y el contable?

Exacto. Hace análisis de tareas. Cada trabajo tiene una parte que requiere más judgment y otra más implementation, más mecánica. Para investigar antes tenías que mirar cincuenta páginas web y ahora esa tarea de búsqueda la automatiza la máquina. Pero es una tarea relativamente inexperta. No necesita juicio. En las otras tareas, el valor relativo del expertise ha subido mucho. Porque para ser un buen periodista o escritor tienes que extraer, discriminar, elegir, construir un relato atractivo, darle el estilo, el contexto histórico, cultural. Esas cosas que son tácitas y que van más allá de lo que pueda hacer la IA ahora mismo. Pero va a llegar un momento en el que le pidas que te escriba un artículo. Y te dará un artículo que estará muy bien, aunque seguramente le faltará un poco de alma. Los mejores y quizá los periodistas más viejos seguramente tengan un valor; porque tendrán su voz propia. Y siempre podrán añadir. Pero si piensas en el periodista medio, pues eso ya lo hace una máquina. Lo mismo pasa con muchísima gente. Es una cosa que no entendíamos bien al principio. En los debates es claro: las tareas que se automatizan son las más inexpertas. En cambio, el juicio en tiempo real no puedes automatizarlo.

Por tanto, el tío que es muy listo complementa mejor con la máquina. A todos les ayuda, pero él puede extraer y seleccionar en tiempo real los argumentos, en vez de colapsar. Y se ve muy claro en mis resultados: tengo, por suerte, una desagregación por tareas. Una que era claridad y estructura; otra que era calidad de los argumentos; otra que era retórica; y otra que era la calidad de la refutación en la respuesta. En calidad estructural, los mejores no ganan tanto.

Si no tienes un armazón, la IA te lo puede dar.

En todas las demás tareas –en las que requieren juicio o pericia– se observa complementariedad con los high-skilled. Considero de altas destrezas a los estudiantes que tienen un merit scholarship o que lo han hecho muy bien en la primera ronda.

Encuentras una cosa interesante en ellos: la sensación de aprovechar mejor el tiempo. Usar la IA les daba información sobre el tiempo que invertían, una seguridad…

Los listos del grupo de control muestran más incertidumbre. Y los otros, los que no son tan buenos, creen que les ha ido mejor. En cambio, ahí la mejora con la máquina es gigante. Los listos ajustan y mejoran su autopercepción.

Les puede dar más realismo. Evalúan mejor si están preparados.

Autor divide entre tareas expertas e inexpertas. Si automatizas las que no requieren ser experto, las otras aumentan de valor. Si automatizas las expertas, se democratiza el acceso a esa profesión y por tanto la demanda y los salarios van a bajar: todo el mundo va a poder hacerlo. En cambio, igual hay menos contables, pero los buenos van a ir muy bien, porque el judgment sigue siendo importantísimo.

Hay situaciones en las que es muy complementaria, porque tú eres el que tiene que hacer la pregunta correcta. El que ve cuál es el argumento, el que hace el juicio de oportunidad. Eso no lo puede hacer la máquina.

En su fantástico blog Silicon continent Luis Garicano se pregunta por algo muy importante. Vamos a un mundo en el que el valor relativo de las tareas menos juiciosas o más inexpertas cae porque las hace la máquina. Y el sistema estructurado de aprendizaje que tienes en las otras profesiones se te va a la mierda. Tienes un sistema en el que los juniors entran y hacen fotocopias, y luego hacen la presentación, y luego aprenden a razonar, a usar datos… Pero si esas tareas no las hacen nunca, ¿cómo premias a los que puedan tener judgment en el futuro? Da miedo.

En términos macroeconómicos algunos hablan de una gran mejora de productividad y otros son más escépticos. Nadie sabe muy bien cómo va a afectar.

Hay un valor de mejora de la productividad enorme. En el mismo tiempo haces muchas más cosas. Hasta ahora teníamos el mundo que hemos visto tantas veces: tareas rutinarias y no rutinarias, repetitivas, que pueden ser cognitivas o no cognitivas. Desde el que hace las tuercas de Chaplin hasta el de los apuntes contables. Ahora, estas máquinas han expandido su capacidad de hacer trabajo cognitivo. Puede que tengas una máquina que hace mejor que los juniors las tareas que les asignabas. Está la opción de encontrar una nueva manera de hacer las cosas o realizar una formación socioemocional muy distinta… Si no, es muy difícil. Yo no soy optimista. No soy de los que piensan que esto va a ser genial para todos.

Estoy haciendo un trabajo sobre el cognitive offloading. Uso NotebookLM, le pido que mire lo que hay, que resuma. ¿Es pensamiento profundo? Quizá no. Pero el 80% del trabajo analítico está hecho. Me he vuelto totalmente dependiente. Y tú o yo aprendimos a escribir. Pero si eres un chaval y nunca te enseñan, ¿cómo vas a aprender? Hay quien dice que tampoco sabemos hacer la raíz cuadrada de 730.

Pero te enseñan en el cole.

Sí. Como en todo aprendizaje, la práctica es clave. Si en vez de hacer una redacción operas siempre por sustitución, quizá sigas aprendiendo, pero tendrás muchísimas tentaciones de escribir mucho menos. Y la escritura en sí misma es un ejercicio de pensamiento crítico gigante. Ayuda al que tiene juicio. Pero el que necesita desarrollarlo…

No tiene la capacidad de hacerlo.

Creo que tendrá que haber políticas casi de salud pública a favor de un aprendizaje en el colegio de matemáticas y escritura básica. Ya no es solo el efecto inmediato de la redacción; tienes menos capacidad creativa, caes en la pereza y ya no haces el esfuerzo.

Y luego están esos oficios que no se podrán sustituir: no sabemos seguro cuáles son, pero tenemos alguna idea. ¿Peluquería? ¿Cuidar niños?

Todos los interpersonal. El personal trainer, cuidadores, enfermeras…

Algunos dicen que si crece mucho la productividad y aumentan los precios, serán prohibitivos.

Esos son oficios que no aumentan la productividad. Son estancos. Otra gente irá a esos oficios porque habrá más desempleados y se orientarán a cosas low skill. No necesariamente van a subir los costes, no vas a tener scarcity si de otros sectores se mueven.

¿Qué pasará con la medicina?

Es mixto. A veces necesitas un conocimiento muy elevado, porque son tareas de juicio. Otras no. Si se trata de interpretar una radiografía, quizá es una tarea que ya puede hacer muy bien la máquina. Hay fronteras tecnológicas que no son lineales. Digamos, por ejemplo: las radiografías las lee perfectamente, pero las matemáticas las hace mal. Es difícil predecir de manera lineal.

A nivel general también está el problema de la concentración de poder. Lo hemos visto con las tecnológicas y ahora puede ser más grande.

Ha habido un debate sobre los sueldos: estamos hablando de pagar bonus de cien millones de dólares. Hoy veía el anuncio de Sam Altman, que decía que han cedido para que el gobierno federal, por un dólar, tenga acceso a toda la información de Chatgpt.

Y viceversa: y además les pagan un dólar.

Tienes a Chatgpt con la información de los ciudadanos de Estados Unidos. ¿Y no habrá otros gobiernos con interés en ella? O que se pueda utilizar, me lo invento, para bombardear o exterminar. Hay que tener en cuenta la capacidad autónoma que posee. Puedes hacer que te compre unos billetes, que haga cosas.

Balaji Srinivasan dice que ya tenemos IA letal: los drones. Y que la IA no es politeísta, es monoteísta.

En Europa tenemos Mistral. No sé hasta qué punto es relevante, la parte industrial se me escapa un poco. Pero algo quieres tener. Todas las industrias dependen en su mayoría de la ia para producir de manera más eficiente. Y si esa ia te la provee un gobierno que no es tu amigo…

Dices que no hemos visto nada como la IA. ¿Es un cambio mayor que internet?

Es difícil decirlo. Pero el potencial que tiene es asombroso: por la capacidad de aprender por sí misma. Es ilimitado. Y, por supuesto, la transformación transversal en los trabajos: el equipo de análisis, pero también el señor que vende hipotecas, por ejemplo. Y el tipo de uso que tú y yo le damos probablemente es bastante pobre comparado con el que le da un chaval de veintidós años. Como nuestros padres al principio con internet. Tienes más tendencia a usarlo como Google. Ahora yo he trabajado como si tuviera un asistente. Le das un texto en bruto, te lo transforma.

Una de las cosas positivas que veo con mi paper es que son cajas negras. Para las decisiones sobre si vas a tomar ese medicamento o si vas a publicar ese texto, seguirás necesitando un humano. Quizá los profesores no necesiten ser tan expertos en la materia, sino en motivar, en acompañar. Van a cambiar los roles de muchas cosas. ~


    ×

    Selecciona el país o región donde quieres recibir tu revista: