“Todos los grandes pensadores respecto a la IA generativa han citado que el futuro es agéntico, por decirlo. Esta idea de que los modelos de lenguaje de gran tamaño (LLM), o estos modelos de lenguaje por sí solos son buenos y que cuando se les da acceso a interactuar, ya sea con otros modelos de lenguaje o con el entorno, llámese con bases de datos, información, internet, entre otros, sus capacidades aumentan”, señaló José Manuel Peña.

El pasado 29 de abril la unidad de Educación Ejecutiva (UEjecutivos) de la FEN U. de Chile realizó la masterclass Inteligencia Artificial Generativa y agentes: De la teoría a la práctica, en la que participaron José Manuel Peña y José Gregorio, ambos miembros del cuerpo docente del diplomado en IA Generativa para Organizaciones.

Gregorio explicó que uno de los grandes potenciales que tiene la Inteligencia Artificial Generativa, que es el siguiente paso de la IA, “es que es capaz de interpretar los datos no estructurados. Casi el 80%-90% de toda la información que existe en el mundo está en información no tabulada. Quiere decir que antes no podíamos utilizarla para entrenar nuestros modelos o si queríamos utilizarla para ello teníamos que hacer un esfuerzo enorme para poder pasarla”. 

En ese aspecto, sostuvo que estos modelos, al estar pre entrenados, como chat GPT, es posible proporcionarle un texto, un tweet y preguntarle si este es de sentimiento positivo o de sentimiento negativo o traspasarle una transcripción de un call center y decirle que lo resuma, por lo que es un modelo capaz de hacer múltiples y muchas tareas.

Y en ello, internet ha hecho que se pueda contar con mucha información en línea, lo que posibilitó que grandes empresas “scrapearan” y consiguieran mucha información, para poder entrenar estos modelos. “Lo interesante es que han ido incrementando su nivel de crecimiento y su nivel de eficacia en los últimos años”, destacó. 

Si hasta el año pasado, el tema relevante se asociaba a cómo utilizar el prompt, para realizar acciones, este año se habla que el futuro es utilizar agentes, que son sistemas con el Archer Language Module, que cuentan con un prompt especial para poder interactuar. Puso énfasis en que lo más significativo es que son capaces de hacerlo con el ambiente u otros agentes a través del uso de herramientas.

Desde una perspectiva de agente, como un workflow automatizado, la tarea sería más compleja. Por ejemplo, se le podría pedir escribir un ensayo, pero que revise si necesito investigar. Luego, se le podría pedir un primer borrador, para después revisar si se necesita investigar más. También, se evaluarían cambios y de ahí volver a revisar el borrador. De esa manera, se sigue iterando hasta tener una solución completa, que se parece más a como nosotros escribimos o trabajamos, explicó Gregorio. 

A ello, Peña complementó: “Un agente es alguna entidad que tiene capacidad de manipular e interactuar con el entorno mediante herramientas. O sea, es agarrar un LLM y dotarlo de ojos, dotarlo de manos, dotarlo de oídos, de distintas formas con las cuales puede absorber cosas de su entorno, sea cual sea su entorno, Y tenga herramientas para mover ese entorno, ya sea interactuar, ingresar, hacer algo”. 

Agregó que “un agente no tiene que utilizar el mismo modelo para todos sus pasos. Puedes tener distintos modelos para distintas tareas. Y ahí es donde comenzamos a realmente a trabajar con arquitectura un poco más compleja”.

Gregorio dijo que “tratar de replicar cómo el humano trabaja es lo que mejor resulta para tener sistemas que sean confiables, que sean robustos y que realmente entreguen valor a las organizaciones”.

Google News Portal Innova
Síguenos en Google Noticias

Equipo Prensa
Portal Innova

VIAS IMPORTACIONES 2024