ElevenLabs, una startup especializada en inteligencia artificial (IA) aplicada a la voz, anunció que los desarrolladores ahora pueden crear agentes conversacionales en su plataforma. Estas herramientas, basadas en IA generativa, son compatibles con modelos de lenguaje como Gemini, GPT y Claude, y permiten amplias opciones de personalización.
La empresa se destacó por soluciones como clonación de voz y transformación de texto a voz, con el objetivo de eliminar barreras lingüísticas. Entre sus aplicaciones más conocidas están una herramienta de doblaje de IA y una plataforma de lectura con voces de actores icónicos.
Los nuevos agentes de IA conversacional incluyen características configurables como el tono de voz, duración de las respuestas y nivel de creatividad. Además, los desarrolladores pueden integrar conocimientos específicos mediante URLs, bloques de texto o archivos.
ElevenLabs habilitó un canal especializado para simplificar la creación y gestión de estos bots. El proceso comienza al iniciar sesión, seleccionar un idioma principal y configurar mensajes iniciales. Luego, los desarrolladores deben elegir un modelo de lenguaje (Gemini, GPT o Claude), definir la creatividad y establecer límites de uso de tokens.
Otras opciones incluyen ajustes en la voz, latencia, estabilidad, autenticación y duración de las conversaciones. Para proyectos más complejos, los usuarios pueden implementar su propio modelo de lenguaje o utilizar herramientas como el SDK de ElevenLabs, compatible con Python, JavaScript, React y Swift, junto con la API WebSocket para personalización avanzada.
Retos y soluciones en el desarrollo
Sam Sklar, director de crecimiento de ElevenLabs, señaló que los principales desafíos fueron integrar bases de conocimiento y gestionar interrupciones durante las interacciones. Estas dificultades impulsaron la creación de un entorno que facilita la configuración y el manejo de los agentes.
Con estas innovaciones, ElevenLabs busca liderar el campo de la IA generativa en aplicaciones de voz, ofreciendo soluciones adaptadas a las necesidades de los usuarios.
*La creación de este contenido contó con la asistencia de inteligencia artificial. La información fue proporcionada y revisada por un periodista para asegurar su precisión. El contenido no se generó automáticamente.