1.2 IA Generativa, Modelos de IA y Agentes
Los LLMs (Large Language Models) son modelos de lenguaje de gran tamaño (como GPT, BERT,BERT LLaMA,o etc.)LLaMA) entrenados con enormes corpus de texto para realizar tareas como generación de texto, traduccióntraducción, clasificación o respuesta a preguntas. Plataformas como Hugging Face describeofrecen labibliotecas bibliotecacomo Transformers, que gestionapermiten gestionar y utilizar estos modelos,modelos indicandoen quediferentes éstosmodalidades. seAunque originalmente estaban orientados al procesamiento de texto, hoy en día muchos de estos modelos pueden usartrabajar entambién modalidadescon diversas: texto, imágenes, audio eo inclusovídeo, enfoquesdando multimodales.lugar a sistemas multimodales capaces de combinar distintos tipos de información.
Además de los LLMs “purocentrados texto”,en texto, existen modelos de visión basados en redes neuronales profundas, como las CNN (CNNs,Convolutional Neural Networks) o los Vision Transformers,Transformers, difusiónque estable)se utilizan para clasificación/segmentacióntareas como clasificación de imágenes, ydetección de objetos o segmentación visual. También han aparecido modelos generativos como Stable Diffusion, que permiten crear imágenes a partir de descripciones textuales. En paralelo, se han desarrollado modelos multimodales (p.ej.por CLIP,ejemplo LLaVA)CLIP queo procesanLLaVA) simultáneamentecapaces de relacionar texto e imagen.imagen, Todospermitiendo ellostareas suelencomo derivardescribir una fotografía, responder preguntas sobre una imagen o generar contenido visual a partir de instrucciones en lenguaje natural.
Muchos de estos sistemas se construyen a partir de lo que se denomina un modelo fundacional (foundation model):. Se trata de grandes redes preentrenadasneuronales entrenadas previamente con enormes cantidades de datos genéricosgenerales a—como escalalos (pormodelos ejemploGPT de OpenAI GPT o GoogleBERT BERT).de Google— que aprenden patrones lingüísticos y conceptuales amplios. Estos modelos genéricos proporcionan lasuna capacidadescapacidad general de base,comprensión y generación, que luegoposteriormente sepuede ajustanadaptarse (a tareas específicas mediante técnicas como el fine-tuning)tuning o especializanel paraajuste tareasmediante concretas.instrucciones. Por ejemplo, un “modelo fundacional” genéricofundacional entrenado con grandes cantidades de texto diverso se puede luegoposteriormente finetunearespecializarse para responder solo preguntas médicas.médicas, analizar documentos legales o ayudar en tareas educativas.
En los últimos años ha aparecido además un nivel más avanzado de uso de los LLMs: los agentes de inteligencia artificial. Un agente es un sistema que utiliza un modelo de lenguaje como núcleo de razonamiento, pero que además puede tomar decisiones, planificar pasos y utilizar herramientas externas (bases de datos, buscadores, programas o APIs) para resolver tareas complejas. En resumen,lugar de limitarse a generar una respuesta, el modelo puede descomponer un problema, ejecutar acciones y combinar distintos recursos para alcanzar un objetivo.
El desarrollo más reciente en este ámbito es la orquestación de agentes, donde varios agentes especializados colaboran entre sí dentro de un mismo sistema. En este enfoque, cada agente puede encargarse de una función concreta —por ejemplo, búsqueda de información, análisis de datos, generación de texto o verificación de resultados— y un sistema de coordinación organiza su interacción. Este paradigma está dando lugar a nuevas arquitecturas de software basadas en equipos de agentes cooperativos, capaces de automatizar procesos complejos y construir aplicaciones inteligentes más avanzadas.
En conjunto, la evolución de la inteligencia artificial ha pasado desde modelos especializados en tareas concretas hacia modelos fundacionales generales, después hacia LLMs capaces de interactuar con múltiples modalidades de datos, y finalmente hacia sistemas de agentes y orquestación de agentes, que representan actualmente una de las fronteras más activas de investigación y desarrollo en IA. Estos enfoques permiten que los modelos actualesno desolo IAgeneren suelencontenido, sersino preentrenadosque también razonen, planifiquen y colaboren para resolver problemas reales en datosdistintos ampliosámbitos científicos, educativos y luego usados o adaptados a diferentes disciplinas científicas (biología, geología, matemáticas, etc.)profesionales.
