Madrid. Microsoft anunció que está investigando el modo en que se producen las interacciones entre humanos y robots, utilizando para ello la tecnología de inteligencia artificial (IA) ChatGPT en estas máquinas.
Desarrollado por OpenAI, ChatGPT es un ‘chatbot’ entrenado para mantener una conversación en texto que se basa en el modelo de lenguaje GPT 3.5 y tiene capacidad para generar y enlazar ideas, así como para recordar conversaciones. En el último mes, la compañía ha ido integrando esta tecnología en sus diferentes servicios, comenzando con Azure OpenAI Service a mediados de enero, para llevarla después a su motor de búsqueda Bing y su navegador Edge.
LEA MÁS: ChatGPT, el robot de inteligencia artificial con el que pueden estafarlo y robarle sus datos
Su última iteración se materializó en la vista previa del nuevo Bing basado en inteligencia artificial en las aplicaciones para móviles y en su navegador Edge, así como la versión del motor de búsqueda para Skype. Ahora, el fabricante tecnológico adelantó que está probando esta tecnología en robots, para “hacer posibles las interacciones naturales” con humanos y explicó qué es lo que espera de esta integración.
“Nuestro objetivo con esta investigación es ver si ChatGPT puede pensar más allá del texto y razonar sobre el mundo físico para ayudar con las tareas de robótica”, comentó Microsoft a través de un comunicado, donde matizó que busca ayudar a las personas a interactuar con los robots más fácilmente, sin necesidad de aprender lenguajes de programación complejos ni detalles sobre sistemas robóticos.
En este sentido, estableció como desafío enseñar a este ‘chatbot’ a resolver problemas teniendo en cuenta factores como el contexto del entorno operativo y el modo en que “las acciones físicas pueden cambiar el estado del mundo”. La empresa reconoció que este producto de OpenAI tiene capacidades para llevar a cabo tareas por sí mimo, pero que desarrolló una serie de principios de diseño que se pueden utilizar para guiar los modelos de lenguaje hacia la resolución de tareas de robótica.
Por otra parte, indicó que ChatGPT puede “desbloquear un nuevo paradigma de la robótica”, en la que habitualmente se suceden procesos lentos, costosos e ineficientes de reescritura del código del comportamiento del robot. De esa forma, este ‘chatbot’ tiene la capacidad de brindar comentarios de alto nivel al denominado modelo de lenguaje extenso o de gran tamaño (LLM, por sus siglas en inglés), a la vez que monitoriza el rendimiento del robot y generar código para diferentes escenarios de robótica.
Para impulsar el LLM, Microsoft construyó una serie de principios de diseño destinados a escribir indicaciones para tareas de robótica. Para ello definió un conjunto de interfaces de programación de aplicaciones (API) robóticas. Una vez escrito el mensaje de texto para que ChatGPT lo interprete, en el que se describe el objetivo de la tarea que debe realizar la máquina, se indica explícitamente lo que debe hacer, lo que no debe hacer o cómo el ‘chatbot’ debe formular sus respuestas.
El desarrollador o ingeniero aguarda la respuesta o salida del código de ChatGPT utilizando un simulador y, si es necesario, utiliza lenguaje natural para evaluar a la IA sobre la calidad y la seguridad de sus contestaciones. Una vez el modelo haya respondido del modo deseado y la solución es viable, se implementa en el robot el código final del chat de inteligencia artificial.
Casos de ChatGPT en robots
La compañía tecnológica compartió una serie de experimentos para mostrar cuáles son las acciones a las que pueden responder los robots utilizando el modelo desarrollado por OpenAI. En primer lugar, le hizo saber los pasos que han de seguirse para controlar un dron real y este supo escribir estructuras de código complejas, como un patrón en zigzag para visualizar las baldas de una estantería.
ChatGPT también se utilizó con el simulador Microsoft AirSim, un escenario en el que el modelo “pudo analizar la intención del usuario” y las señales detalladas para controlar un dron con precisión. Este lenguaje se probó, incluso, en un escenario de manipulación con un brazo robótico.
Tras analizar las directrices, ChatGPT supo encadenar una serie de habilidades aprendidas para, entre otras actividades, apilar bloques de madera. Los desarrolladores también optaron por atribuir a estos robots objetivos como encontrar objetos, mediante funciones de detección. Asimismo, realizó experimentos adicionales para evaluar si el ‘chatbot’ puede decidir dónde dirigir a la máquina en función de lo que debía buscar.
LEA MÁS: Usuarios acusan a chatbot de acoso sexual y atizan debate sobre inteligencia artificial