1.2 IA Generativa, Modelos de IA y Agentes

Los LLMs (Large Language Models) son modelos de lenguaje de gran tamaño (como GPT, ~~BERT,~~BERT ~~LLaMA,~~o ~~etc.)~~LLaMA) entrenados con enormes corpus de texto para realizar tareas como generación de texto, ~~traducción~~traducción, clasificación o respuesta a preguntas. Plataformas como Hugging Face ~~describe~~ofrecen labibliotecas ~~biblioteca~~como Transformers, que ~~gestiona~~permiten gestionar y utilizar estos ~~modelos,~~modelos ~~indicando~~en ~~que~~diferentes ~~éstos~~modalidades. seAunque originalmente estaban orientados al procesamiento de texto, hoy en día muchos de estos modelos pueden ~~usar~~trabajar entambién ~~modalidades~~con ~~diversas: texto,~~ imágenes, audio eo ~~incluso~~vídeo, ~~enfoques~~dando ~~multimodales.~~lugar a sistemas multimodales capaces de combinar distintos tipos de información.

Además de los LLMs ~~“puro~~centrados ~~texto”,~~en texto, existen modelos de visión basados en redes neuronales profundas, como las CNN (~~CNNs,~~Convolutional Neural Networks) o los Vision ~~Transformers,~~Transformers, ~~difusión~~que ~~estable)~~se utilizan para ~~clasificación/segmentación~~tareas como clasificación de imágenes, ydetección de objetos o segmentación visual. También han aparecido modelos generativos como Stable Diffusion, que permiten crear imágenes a partir de descripciones textuales. En paralelo, se han desarrollado modelos multimodales (~~p.ej.~~por ~~CLIP,~~ejemplo ~~LLaVA)~~CLIP ~~que~~o ~~procesan~~LLaVA) ~~simultáneamente~~capaces de relacionar texto e ~~imagen.~~imagen, ~~Todos~~permitiendo ~~ellos~~tareas ~~suelen~~como ~~derivar~~describir una fotografía, responder preguntas sobre una imagen o generar contenido visual a partir de instrucciones en lenguaje natural.

Muchos de estos sistemas se construyen a partir de lo que se denomina un modelo fundacional (foundation model):. Se trata de grandes redes ~~preentrenadas~~neuronales entrenadas previamente con enormes cantidades de datos ~~genéricos~~generales a—como ~~escala~~los ~~(por~~modelos ~~ejemplo~~GPT de OpenAI ~~GPT~~ o ~~Google~~BERT ~~BERT).~~de Google— que aprenden patrones lingüísticos y conceptuales amplios. Estos modelos ~~genéricos~~ proporcionan ~~las~~una ~~capacidades~~capacidad general de ~~base,~~comprensión y generación, que ~~luego~~posteriormente sepuede ~~ajustan~~adaptarse (a tareas específicas mediante técnicas como el fine-~~tuning)~~tuning o ~~especializan~~el ~~para~~ajuste ~~tareas~~mediante ~~concretas.~~instrucciones. Por ejemplo, un “modelo ~~fundacional” genérico~~fundacional entrenado con grandes cantidades de texto ~~diverso se~~ puede ~~luego~~posteriormente ~~finetunear~~especializarse para responder ~~solo~~ preguntas ~~médicas.~~médicas, analizar documentos legales o ayudar en tareas educativas.

En los últimos años ha aparecido además un nivel más avanzado de uso de los LLMs: los agentes de inteligencia artificial. Un agente es un sistema que utiliza un modelo de lenguaje como núcleo de razonamiento, pero que además puede tomar decisiones, planificar pasos y utilizar herramientas externas (bases de datos, buscadores, programas o APIs) para resolver tareas complejas. En ~~resumen,~~lugar de limitarse a generar una respuesta, el modelo puede descomponer un problema, ejecutar acciones y combinar distintos recursos para alcanzar un objetivo.

El desarrollo más reciente en este ámbito es la orquestación de agentes, donde varios agentes especializados colaboran entre sí dentro de un mismo sistema. En este enfoque, cada agente puede encargarse de una función concreta —por ejemplo, búsqueda de información, análisis de datos, generación de texto o verificación de resultados— y un sistema de coordinación organiza su interacción. Este paradigma está dando lugar a nuevas arquitecturas de software basadas en equipos de agentes cooperativos, capaces de automatizar procesos complejos y construir aplicaciones inteligentes más avanzadas.

En conjunto, la evolución de la inteligencia artificial ha pasado desde modelos especializados en tareas concretas hacia modelos fundacionales generales, después hacia LLMs capaces de interactuar con múltiples modalidades de datos, y finalmente hacia sistemas de agentes y orquestación de agentes, que representan actualmente una de las fronteras más activas de investigación y desarrollo en IA. Estos enfoques permiten que los modelos ~~actuales~~no desolo IAgeneren ~~suelen~~contenido, ~~ser~~sino ~~preentrenados~~que también razonen, planifiquen y colaboren para resolver problemas reales en ~~datos~~distintos ~~amplios~~ámbitos científicos, educativos y ~~luego usados o adaptados a diferentes disciplinas científicas (biología, geología, matemáticas, etc.)~~profesionales.