Pocas tecnologías se ponen de moda tantas veces como la inteligencia artificial (IA). Hace 40 años, había una tremenda discusión en círculos académicos acerca de si sería posible alguna vez procesar el lenguaje natural. Algunos, incluso, se quejaron porque todos los fondos de investigación en computación iban a dar a la IA.
Hace 30 años, empezaron a utilizarse técnicas asociadas a la fuerza bruta para, por ejemplo, jugar ajedrez. De hecho, una computadora muy grande, cara y poderosa venció al campeón mundial. Hace 20 años, se podía procesar lenguaje natural (siempre con fuerza bruta) al punto de ganarle al campeón de Jeopardy! (donde la respuesta es una pregunta).
En los últimos 10 años, nos hemos acostumbrado a utilizar la IA en nuestros teléfonos (con ayuda de la nube y la internet de las cosas) para tomar toda clase de decisiones. Ya nadie se extraña cuando ve a alguien hablándole al teléfono o conversando con dispositivos domésticos que controlan las luces, la música, el horno, etc.
Las grandes tecnológicas son capaces de predecir de manera muy certera lo que el cliente quiere leer, escuchar o comprar, incluso con quién quiere discutir. La mayoría de los anuncios en línea son dirigidos por herramientas que predicen a quienes podría interesarles, y solo estos verán la publicidad.
ChatGPT
Puede ser un truco de mercadeo para volver a poner la IA de moda. Recientemente, acuñaron el término IA generativa, un software que ya no solo analiza grandes cantidades de datos, sino que es capaz de redactar textos y producir sonidos e imágenes nuevas, que no existen hasta que el software los genera. Por ejemplo, un programa que transcribe un discurso de manera casi perfecta. Si ese texto se edita, el programa regenera el discurso con la voz original, pero diciendo cosas diferentes. La experiencia de oírse a uno mismo decir cosas que nunca ha dicho es ciertamente novedosa.
Hay IA capaz de generar un cuadro a partir de una descripción del paisaje que el usuario quisiera ver, la imagen se puede refinar o corregir (el cielo más nublado, el caballo más oscuro y galopando, la jinete sin sombrero, etc.), incluso pedir que haga la imagen al estilo de Dalí o Picasso, con resultados realmente impresionantes.
De manera muy similar, es posible producir música a partir de una descripción o con semejanzas o videos de alta calidad, a gusto del usuario. Hay uno que modifica los labios de artistas de cine y los pone a hablar en otro idioma, con la misma voz y sin ninguna indicación de que fue doblado, porque, estrictamente hablando, no fue doblado.
Uno de estos software, en forma de chat, es ChatGPT (GPT son las siglas en inglés de transformador generativo preentrenado). Fue liberado gratuitamente a finales de noviembre y registró un millón de usuarios en cinco días. Al parecer, es el registro más rápido de un sistema hasta ahora.
El chat no será siempre gratis, corre en la nube y consume ingentes recursos computacionales, pero está recabando más y más información de manera gratuita. Además de conversar con los usuarios, como otros chats, este redacta mejor que la mayoría de nosotros, lo que pone sobre aviso a educadores alrededor del planeta, ya que exámenes y tareas con frecuencia son (¿eran?) redacciones que el software hace mejor que los estudiantes (y probablemente que los profesores).
A mediados de enero, Edward Tian, estudiante de computación en la Universidad de Princeton, publicó una app (GPTZero) que discierne, con un 2 % de falsos positivos, si un texto fue redactado por un humano o IA.
Se me ocurre que Tian debe haber analizado la manera en que las palabras se estructuran (él dice haber medido la perplejidad y la explosividad de las palabras), pero en todo caso, está analizando palabras, igual que lo hace la IA para predecir (probabilísticamente) como se mezclan mejor.
Si bien esta app ayudará a reducir el plagio, no es muy difícil imaginar que pronto la IA utilizará las medidas de perplejidad y explosividad de las palabras para confundir a quienes se esfuercen por identificar el resultado de un transformador generativo preentrenado.
LEA MÁS: ChatGPT: el robot que sabe mucho
Programas informáticos
Obviamente, si este tipo de sistemas son capaces de producir toda clase de textos de alta calidad, también lo serán para escribir código, es decir, programas en un lenguaje de programación específico.
Claro que hay código muy complejo, y no creo que pueda generarlo, pero la mayoría del código escrito por seres humanos es bastante sencillo y rutinario. De hecho, un experimento realizado con programadores profesionales de Github concluyó que, en promedio, el transformador generativo puede producir un 40 % del código. Eso se traduce en ahorros cuantiosos e incluso en ventaja competitiva para los programadores que mejor utilicen la herramienta.
Muchos consideran que el poder de tales programas reside en el tamaño del modelo, y el tamaño lo miden por el número de parámetros. ChatGPT está construido sobre el modelo de GPT 3.5 de la empresa Open AI. Al parecer, tiene 175.000 millones de parámetros, y el GPT 4, que se supone se liberará al mercado en el primer trimestre de este año, tendrá un millón de millones de parámetros.
Temores y expectativas
Hay mucha especulación en torno a las capacidades de estas IA en un futuro muy cercano. Pero, juzgando por la velocidad de mejora mostrada en los últimos años, es obvio que el ritmo es exponencial.
No está muy lejos la posibilidad de que personifiquen el chat, dándole una imagen y una voz. Estos sistemas podrán conversar con nosotros para entretener, dar consejos, ayudar a resolver problemas e incluso participar en debates.
Hay quienes sugieren que si conservamos suficiente información (incluidas imágenes y voz) podremos conversar con seres queridos que han fallecido. No sé si es cuerdo, pero creo que es posible.
Hace por lo menos cinco años, leí que los médicos del futuro corren el riesgo de ser acusados de mala praxis si toman decisiones importantes sin consultar una IA. No quiere decir que deban seguir las recomendaciones al pie de la letra, la decisión final siempre será del médico, pero debe consultar.
Tampoco es difícil imaginar que se extienda a toda clase de profesionales (abogados, jueces, ingenieros, investigadores, políticos o informáticos) tomadores de decisiones con posibles implicaciones en la sociedad.
No sé cuánto tiempo le tomará a la IA cambiar por completo la sociedad, todo dependerá de cómo se desarrolle la tecnología, pero también de cómo la aprovechen para poner en práctica soluciones puntuales —por ejemplo, predecir fraude en transacciones financieras— y de quiénes podrán ver implementaciones que cruzan a lo largo y ancho de industrias enteras cambiando modelos de negocio y balance de poderes (quiénes toman las decisiones, cómo y cuándo).
De lo que sí estoy bastante seguro es de que ignorar esta tecnología conlleva un alto precio. No ignorar no implica adquirir y adoptar a ciegas, se debe invertir en estudiar, investigar y entender, ya que no hay, y nunca ha habido, sustituto para el entendimiento.
El autor es ingeniero, presidente del Club de Investigación Tecnológica desde 1988 y organizador del TEDxPuraVida.