# 1.Fundamentos de Inteligencia Artificial para docentes

# 1.0 Antes de comenzar

El uso de la inteligencia artificial en educación, además de plantear preguntas sobre su uso responsable, abre **nuevas oportunidades** para enriquecer la práctica docente. En el módulo o curso anterior hemos abordado los aspectos relacionados con sus implicaciones éticas, legales y pedagógicas: cómo proteger los datos personales del alumnado, cómo evitar sesgos o usos inapropiados y qué responsabilidades asumimos cuando incorporamos sistemas de inteligencia artificial en el proceso educativo.

Este segundo curso del itinerario se centra en el **diseño curricular con apoyo de inteligencia artificial generativa**, explorando cómo estas herramientas pueden convertirse en asistentes que apoyen la planificación y la creación de recursos.

Para ello, comenzaremos con un primer capítulo sobre **qué es la inteligencia artificial** y en particular los **modelos de lenguaje**, que son los sistemas que permiten a herramientas como los asistentes, generar textos, y por tanto, ayudarnos con la planificación y el diseño curricular. También se explorarán diferentes **fundamentos y conceptos técnicos** para entender de forma básica cómo funcionan estos sistemas, saber qué pueden hacer y cuáles son sus limitaciones, para, en el capítulo siguiente, saber cómo formular instrucciones adecuadas (**prompting**) para obtener mejores resultados.

A partir de ahí, veremos cómo la inteligencia artificial puede apoyar diferentes **tareas habituales del profesorado**. Por ejemplo, puede ayudar a generar ideas para **situaciones de aprendizaje**, proponer actividades adaptadas a distintos niveles, elaborar o adaptar **materiales didácticos**, crear ejemplos, preguntas o rúbricas de evaluación, etc. En este sentido, la IA no sustituye la labor docente, sino que actúa como un **asistente que amplía las posibilidades de creación y planificación**, permitiendo dedicar más tiempo a la toma de decisiones pedagógicas y al acompañamiento del alumnado.

El objetivo no es aprender a usar una herramienta concreta, sino **desarrollar una forma de trabajo en la que la inteligencia artificial se convierta en un apoyo útil, crítico y responsable para la práctica docente**.

# 1.1 Conceptos ¿Qué es y qué no es la Inteligencia Artificial?

[![image.png](https://libros.catedu.es/uploads/images/gallery/2026-01/scaled-1680-/fi6image.png)](https://libros.catedu.es/uploads/images/gallery/2026-01/fi6image.png)

<article class="text-token-text-primary w-full focus:outline-none [--shadow-height:45px] has-data-writing-block:pointer-events-none has-data-writing-block:-mt-(--shadow-height) has-data-writing-block:pt-(--shadow-height) [&:has([data-writing-block])>*]:pointer-events-auto scroll-mt-[calc(var(--header-height)+min(200px,max(70px,20svh)))]" data-scroll-anchor="false" data-testid="conversation-turn-10" data-turn="assistant" data-turn-id="f452f0d6-4866-4fef-9a46-5b1f8d0e9a97" dir="auto" id="bkmrk-una-historia-escrita" tabindex="-1">#### ¿Qué es la IA? Una historia escrita mucho antes de los ordenadores

Mucho antes de que existieran pantallas, datos o código, la humanidad ya imaginaba inteligencias creadas por su propia mano. En los mitos de la Grecia clásica, el fuego del conocimiento no solo servía para iluminar, sino también para dar vida. **<span class="hover:entity-accent entity-underline inline cursor-pointer align-baseline"><span class="whitespace-normal">Hefesto</span></span>**, el dios artesano, no era un guerrero ni un sabio: era un creador. En su fragua nacían objetos que se movían solos, sirvientes de oro que obedecían, criaturas mecánicas que parecían tener voluntad. Entre todas ellas destacaba **<span class="hover:entity-accent entity-underline inline cursor-pointer align-baseline"><span class="whitespace-normal">Talos</span></span>**, un gigante de bronce que rodeaba incansable la isla de Creta, vigilando, decidiendo, actuando. No pensaba como un humano, pero cumplía una función que hoy llamaríamos “inteligente”. Aquellos relatos no hablaban de tecnología, hablaban de una aspiración: crear algo que hiciera por nosotros lo que antes solo hacíamos nosotros.

Durante siglos esa idea quedó atrapada en la imaginación, hasta que la historia dio un giro práctico. Con la Revolución Industrial, las máquinas dejaron de ser sueños para convertirse en presencia cotidiana. Los telares automáticos, las locomotoras, las fábricas humeantes transformaron la relación entre el ser humano y su trabajo. Las máquinas no entendían, pero trabajaban sin descanso; no decidían, pero repetían con precisión. Por primera vez, una creación humana sustituía de forma sistemática una capacidad humana. No la mente, todavía, pero sí el cuerpo. Y con ese cambio nació una pregunta silenciosa: si una máquina puede hacer el trabajo de mis manos, ¿podrá algún día hacer el trabajo de mi cabeza?

El siglo XX llevó esa pregunta al lugar más inesperado: el interior del cerebro. Los científicos empezaron a comprender que la inteligencia no era una lista de instrucciones, sino un proceso de aprendizaje. El cerebro no ejecuta órdenes como una máquina clásica; aprende, se equivoca, ajusta, mejora. De ahí surgió una idea tan simple como revolucionaria: imitar ese proceso mediante modelos artificiales. Así nació la neurona artificial, una versión extremadamente simplificada de una neurona biológica, pero suficiente para cambiar el rumbo de la informática. Ya no se trataba de decirle a la máquina qué hacer, sino de permitirle aprender cómo hacerlo.

En ese contexto aparece una figura clave, **<span class="hover:entity-accent entity-underline inline cursor-pointer align-baseline"><span class="whitespace-normal">Alan Turing</span></span>**, que en mitad del siglo XX planteó una pregunta que todavía resuena hoy: no si las máquinas pueden pensar, sino si pueden comportarse como si pensaran. Poco después, en una reunión de verano en **<span class="hover:entity-accent entity-underline inline cursor-pointer align-baseline"><span class="whitespace-normal">Dartmouth College</span></span>**, se acuñó por primera vez el término “Inteligencia Artificial”. Aquellos investigadores eran optimistas; creían que en pocas décadas existirían máquinas con inteligencia humana. No ocurrió así. La realidad fue más lenta, pero también más profunda.

Durante años, la IA avanzó a trompicones, limitada por la falta de datos y de potencia de cálculo. Hasta que llegó internet, llegaron los ordenadores potentes y, con ellos, una explosión de aprendizaje automático. En 2016 se produjo uno de esos momentos que marcan época. **<span class="hover:entity-accent entity-underline inline cursor-pointer align-baseline"><span class="whitespace-normal">DeepMind</span></span>** presentó **<span class="hover:entity-accent entity-underline inline cursor-pointer align-baseline"><span class="whitespace-normal">AlphaGo</span></span>**, un sistema capaz de vencer al campeón mundial **<span class="hover:entity-accent entity-underline inline cursor-pointer align-baseline"><span class="whitespace-normal">Lee Sedol</span></span>** en un juego considerado durante décadas inaccesible para las máquinas. No fue solo la victoria lo que sorprendió al mundo, sino una jugada concreta, inesperada, creativa, que ningún humano había imaginado. Por primera vez, una máquina no solo imitaba al ser humano, sino que encontraba caminos nuevos.

Pocos años después, la misma tecnología protagonizó otro hito silencioso pero aún más profundo. Con **<span class="hover:entity-accent entity-underline inline cursor-pointer align-baseline"><span class="whitespace-normal">AlphaFold</span></span>**, la inteligencia artificial resolvía un problema científico abierto durante más de medio siglo: predecir la estructura de las proteínas. Ya no se trataba de ganar a una persona, sino de colaborar con la ciencia, acelerar descubrimientos y ampliar el conocimiento humano. La IA dejaba de ser una curiosidad para convertirse en una herramienta transformadora.

#### ¿De que hablamos cuando hablamos de Inteligencia Artificial?

<div class="text-base my-auto mx-auto [--thread-content-margin:--spacing(4)] @w-sm/main:[--thread-content-margin:--spacing(6)] @w-lg/main:[--thread-content-margin:--spacing(16)] px-(--thread-content-margin)"><div class="[--thread-content-max-width:40rem] @w-lg/main:[--thread-content-max-width:48rem] mx-auto max-w-(--thread-content-max-width) flex-1 group/turn-messages focus-visible:outline-hidden relative flex w-full min-w-0 flex-col agent-turn" tabindex="-1"><div class="flex max-w-full flex-col grow"><div class="min-h-8 text-message relative flex w-full flex-col items-end gap-2 text-start break-words whitespace-normal [.text-message+&]:mt-1" data-message-author-role="assistant" data-message-id="97d71851-91b5-46ad-b10f-d8a054b2b991" data-message-model-slug="gpt-5-2" dir="auto"><div class="flex w-full flex-col gap-1 empty:hidden first:pt-[1px]">  
</div></div></div></div></div>La **Inteligencia Artificial (IA)** es un conjunto amplio de técnicas y enfoques que permiten a las máquinas **aprender a partir de datos** y realizar tareas que tradicionalmente asociábamos a la inteligencia humana, como comprender textos, reconocer imágenes, interpretar sonidos o tomar decisiones. En el núcleo de la IA moderna se encuentra el **aprendizaje automático o Machine Learning (ML)**, que entrena modelos capaces de mejorar con la experiencia, sin necesidad de programar cada regla de forma explícita. Dentro de este ámbito destaca el **aprendizaje profundo o Deep Learning (DL)**, basado en redes neuronales con múltiples capas, que ha impulsado los grandes avances recientes en visión artificial, reconocimiento de voz y generación de contenido.

Para que todo esto sea posible, la IA no trabaja directamente con palabras, imágenes o sonidos tal como los percibimos los humanos. Antes de aprender, **todo se convierte en números**. Un texto se transforma en secuencias numéricas que representan palabras o fragmentos de palabras; una imagen se convierte en una matriz de píxeles con valores numéricos; y un audio se representa como una señal digital compuesta por miles de muestras. Sobre estas representaciones numéricas se aplican técnicas de **procesamiento del lenguaje natural (NLP)** en el caso del texto, modelos de visión artificial para la imagen y redes especializadas para el audio.

Los desarrollos más avanzados en el ámbito del lenguaje son los **modelos de lenguaje de gran tamaño o LLMs (Large Language Models)**, que generan texto prediciendo, paso a paso, la palabra o fragmento más probable a partir de los anteriores. A partir de estos modelos surgen los **agentes de IA**, sistemas que no solo generan respuestas, sino que pueden planificar acciones, utilizar herramientas externas, combinar información de distintos formatos (texto, imagen o audio) y encadenar decisiones para alcanzar un objetivo determinado.

En ningún caso la IA se basa en conciencia, intención o comprensión real del mundo. Su funcionamiento descansa en la **detección de patrones**, el cálculo de **probabilidades** y la toma de decisiones basadas en grandes volúmenes de ejemplos previos. Aunque sus resultados puedan parecer inteligentes, creativos o humanos, la IA no entiende lo que hace: **opera sobre números y elige la opción más probable según su entrenamiento**, lo que hace imprescindible el criterio humano, especialmente en contextos educativos.

#### En esencia, los sistemas de IA actuales

<div class="text-base my-auto mx-auto [--thread-content-margin:--spacing(4)] @w-sm/main:[--thread-content-margin:--spacing(6)] @w-lg/main:[--thread-content-margin:--spacing(16)] px-(--thread-content-margin)"><div class="[--thread-content-max-width:40rem] @w-lg/main:[--thread-content-max-width:48rem] mx-auto max-w-(--thread-content-max-width) flex-1 group/turn-messages focus-visible:outline-hidden relative flex w-full min-w-0 flex-col agent-turn" tabindex="-1"><div class="flex max-w-full flex-col grow"><div class="min-h-8 text-message relative flex w-full flex-col items-end gap-2 text-start break-words whitespace-normal [.text-message+&]:mt-1" data-message-author-role="assistant" data-message-id="97d71851-91b5-46ad-b10f-d8a054b2b991" data-message-model-slug="gpt-5-2" dir="auto"><div class="flex w-full flex-col gap-1 empty:hidden first:pt-[1px]"><div class="markdown prose dark:prose-invert w-full break-words light markdown-new-styling">- Aprenden a partir de datos, no de reglas escritas una a una.
- Mejoran con la experiencia, igual que un alumno que practica.
- Funcionan bien en tareas concretas y delimitadas.
- Dependen totalmente de cómo y con qué datos han sido entrenados.

</div></div></div></div></div></div>#### Ejemplos de aplicación de IA

<div class="text-base my-auto mx-auto [--thread-content-margin:--spacing(4)] @w-sm/main:[--thread-content-margin:--spacing(6)] @w-lg/main:[--thread-content-margin:--spacing(16)] px-(--thread-content-margin)"><div class="[--thread-content-max-width:40rem] @w-lg/main:[--thread-content-max-width:48rem] mx-auto max-w-(--thread-content-max-width) flex-1 group/turn-messages focus-visible:outline-hidden relative flex w-full min-w-0 flex-col agent-turn" tabindex="-1"><div class="flex max-w-full flex-col grow"><div class="min-h-8 text-message relative flex w-full flex-col items-end gap-2 text-start break-words whitespace-normal [.text-message+&]:mt-1" data-message-author-role="assistant" data-message-id="97d71851-91b5-46ad-b10f-d8a054b2b991" data-message-model-slug="gpt-5-2" dir="auto"><div class="flex w-full flex-col gap-1 empty:hidden first:pt-[1px]"><div class="markdown prose dark:prose-invert w-full break-words light markdown-new-styling">- Sistemas de recomendación en plataformas de vídeo o música.
- Reconocimiento facial y de voz en dispositivos móviles.
- Traducción automática entre idiomas.
- Detección de fraude bancario.
- Generación de textos, imágenes, vídeo, audio o código.
- Predicción de valores numéricos como demanda, consumo energético o tráfico.

</div></div></div></div></div></div>#### La aplicación de la IA en el ámbito educativo

</article><article class="text-token-text-primary w-full focus:outline-none [--shadow-height:45px] has-data-writing-block:pointer-events-none has-data-writing-block:-mt-(--shadow-height) has-data-writing-block:pt-(--shadow-height) [&:has([data-writing-block])>*]:pointer-events-auto scroll-mt-[calc(var(--header-height)+min(200px,max(70px,20svh)))]" data-scroll-anchor="false" data-testid="conversation-turn-10" data-turn="assistant" data-turn-id="f452f0d6-4866-4fef-9a46-5b1f8d0e9a97" dir="auto" id="bkmrk-en-el-sector-educati" tabindex="-1">En el sector educativo es quizá donde más valor adquiere la aplicación de la IA.

Queremos distinguir tres grupos claros dónde resulta de gran utulidad su aplicación

##### Aplicaciones de la IA orientadas al profesorado

**Diseño y mejora de materiales didácticos**  
Uso de IA para planificar o diseñar actividades, ajustar explicaciones, secuencias o adaptar recursos.

**Apoyo en la atención a la diversidad**  
Identificación de perfiles de aprendizaje y necesidades específicas para adaptar tareas, ritmos y apoyos sin recurrir únicamente a medidas generales.

**Seguimiento del progreso real del alumnado**  
Sistemas que analizan evolución, errores recurrentes y ritmo de aprendizaje, permitiendo detectar estancamientos o mejoras que no siempre se reflejan en una nota puntual.

**Reducción de carga administrativa y repetitiva**  
Automatización de tareas como generación de informes, resúmenes de evidencias o preparación de rúbricas base, liberando tiempo para la docencia directa.

##### Aplicaciones de la IA orientadas al alumnado

**Itinerarios de aprendizaje personalizados**  
Adaptación del nivel de dificultad, tipo de actividades y ritmo de trabajo en función del progreso real, favoreciendo la motivación y el aprendizaje autónomo.

**Tutoría inteligente fuera del aula**  
Sistemas que acompañan al alumnado en el estudio autónomo, ofreciendo pistas, preguntas guiadas y retroalimentación progresiva en lugar de respuestas directas.

**Simulación de contextos profesionales reales**  
Agentes de IA que recrean situaciones de empresa, laboratorio o entorno laboral (incidencias, toma de decisiones, negociación), especialmente útiles en FP.

**Refuerzo del aprendizaje metacognitivo**  
Ayuda al alumnado a comprender en qué se equivoca, por qué y cómo mejorar, fomentando la reflexión sobre su propio proceso de aprendizaje.

**Accesibilidad y adaptación de contenidos**  
Conversión de materiales a formatos accesibles (texto simplificado, audio, apoyos visuales), atendiendo a diversidad funcional y estilos de aprendizaje.

**Entrenamiento en competencias transversales**  
Práctica guiada de habilidades como comunicación escrita, pensamiento crítico o planificación, con retroalimentación inmediata y personalizada.

##### Aplicaciones de la IA orientadas a la dirección y gestión del centro

**Análisis global de datos educativos del centro**  
Identificación de patrones en resultados académicos, asistencia, repetición o abandono para tomar decisiones estratégicas basadas en evidencias.

**Optimización de la organización y recursos**  
Apoyo en la creación de grupos, asignación de recursos, planificación de horarios o detección de sobrecargas, mejorando la eficiencia organizativa.

**Evaluación de programas y metodologías**  
Análisis del impacto real de proyectos educativos, planes de innovación o cambios metodológicos, más allá de percepciones subjetivas.

**Mejora de la comunicación institucional**  
Análisis de encuestas, reclamaciones o feedback de familias y alumnado para detectar problemas recurrentes y áreas de mejora.

**Apoyo a la toma de decisiones estratégicas**  
Uso de modelos predictivos para anticipar tendencias (matrícula, abandono, resultados) y planificar actuaciones a medio y largo plazo.

[![image.png](https://libros.catedu.es/uploads/images/gallery/2026-03/scaled-1680-/Wi2image.png)](https://libros.catedu.es/uploads/images/gallery/2026-03/Wi2image.png)

#### Qué NO es la Inteligencia Artificial

##### No es una mente humana

Aunque a veces “hable bien” o dé respuestas complejas, la IA no entiende lo que dice ni tiene intención alguna. No sabe cuándo duda, no distingue lo importante de lo trivial por criterio propio y no posee sentido común.

##### No es infalible

Los sistemas de IA pueden equivocarse, inventar respuestas plausibles pero falsas o fallar estrepitosamente fuera de su contexto de entrenamiento. Su apariencia de seguridad no garantiza que tengan razón.

##### No es neutral ni objetiva

La IA aprende de datos creados por personas. Si esos datos contienen sesgos, errores o injusticias, el sistema los reproducirá e incluso los amplificará. Por eso, su uso exige supervisión humana y pensamiento crítico.

##### No todo lo digital es IA

Un programa clásico sigue instrucciones fijas. Un sistema de IA aprende y se adapta. Una calculadora, una hoja de cálculo con fórmulas o un software que siempre hace lo mismo no son inteligencia artificial, aunque sean digitales.

</article>Una de las ideas más importantes que conviene transmitir al profesorado cuando se habla de inteligencia artificial es entender **lo que la IA no es**. En el discurso público a menudo se presenta la inteligencia artificial como si fuera una mente comparable a la humana, capaz de comprender, razonar o incluso tener intención. Sin embargo, los sistemas actuales funcionan de una manera mucho más limitada y concreta.

Los modelos de lenguaje que hoy utilizamos —los que están detrás de muchos chatbots y asistentes digitales— no comprenden realmente el mundo. Su funcionamiento se basa en algo mucho más simple desde el punto de vista conceptual: **predecir qué palabra o fragmento de texto es más probable que aparezca a continuación** en función del contexto que reciben.

Durante el entrenamiento, estos modelos analizan enormes cantidades de texto y aprenden patrones estadísticos sobre cómo se combinan las palabras. Cuando reciben una frase como entrada, calculan probabilidades y eligen el siguiente token —la siguiente unidad de texto— más probable. Después repiten el proceso una y otra vez hasta generar una respuesta completa.

Desde fuera, el resultado puede parecer muy sofisticado: frases coherentes, explicaciones complejas o incluso textos creativos. Pero detrás de ese comportamiento no hay comprensión, intención ni experiencia. Algunos investigadores han descrito estos sistemas mediante la metáfora del **“loro estocástico”**, una imagen que sugiere que los modelos de lenguaje son capaces de producir frases plausibles repitiendo patrones estadísticos del lenguaje sin entender realmente su significado.

Para el profesorado esta idea es especialmente importante. En el aula es fácil que los estudiantes —y a veces también los adultos— atribuyan a estas herramientas capacidades humanas que en realidad no poseen. La IA no tiene conciencia, no tiene emociones, no tiene empatía y tampoco posee valores. No puede comprender la situación personal de un estudiante, detectar su inseguridad ante un problema difícil o percibir cuándo una explicación necesita adaptarse para que alguien realmente la entienda.

La educación, además, es mucho más que transmisión de información. Un profesor no solo explica contenidos; interpreta el contexto de la clase, motiva al alumnado, gestiona dinámicas sociales, transmite valores y ayuda a construir criterio. Ese componente humano —la empatía, la experiencia pedagógica, la relación personal con los estudiantes— está completamente fuera del alcance de los sistemas actuales de inteligencia artificial.

Por eso, aunque la IA puede convertirse en una herramienta extraordinariamente útil para el profesorado —ayudando a generar materiales, preparar actividades, resumir información o diseñar ejercicios— no puede sustituir el papel educativo del docente. Su funcionamiento es fundamentalmente estadístico y depende de los datos con los que ha sido entrenada. Puede producir respuestas convincentes, pero también puede equivocarse, inventar información o reproducir errores presentes en los datos.

En este sentido, quizá la idea más importante para transmitir en el ámbito educativo es que la inteligencia artificial no reemplaza al profesor, sino que **amplía las herramientas disponibles para enseñar**. La IA puede ayudar a organizar información, generar ejemplos o explorar nuevas formas de aprendizaje, pero la tarea de educar —formar pensamiento crítico, transmitir valores y acompañar el desarrollo de las personas— sigue siendo una actividad profundamente humana.

# 1.2 Tipos de aprendizaje o cómo aprenden las máquinas

#### Aprender: una palabra común para procesos muy distintos

Hablar de aprendizaje parece, a primera vista, algo sencillo. Aprendemos desde que nacemos: a hablar, a caminar, a resolver problemas, a convivir con otros. En el aula, aprender significa comprender un contenido, practicarlo, equivocarse, corregir y, poco a poco, hacerlo propio. Cuando trasladamos esta palabra al ámbito de la Inteligencia Artificial, el término es el mismo, pero el proceso es muy distinto.

Cuando decimos que una máquina “aprende”, no lo hace porque entienda lo que está haciendo ni porque tenga una intención de mejorar. Aprende porque **ajusta su comportamiento a partir de ejemplos**, del mismo modo que un alumno mejora cuando recibe práctica y retroalimentación, aunque en el caso de la máquina todo ocurre a nivel numérico y estadístico. La IA no trabaja con ideas, trabaja con datos; no interpreta significados, detecta patrones.

Un ejemplo sencillo ayuda a aclararlo. Si un alumno aprende a reconocer tipos de texto leyendo muchos ejemplos y recibiendo correcciones del profesor, la máquina aprende de forma parecida: analiza miles de textos, compara sus predicciones con el resultado esperado y va ajustando sus respuestas. La diferencia es que el alumno comprende por qué algo es un texto narrativo o argumentativo, mientras que la máquina solo aprende qué combinaciones de palabras suelen aparecer en cada caso.

A partir de esta idea general, no todas las máquinas aprenden del mismo modo. Algunas lo hacen con ejemplos corregidos, otras explorando datos sin respuestas previas y otras aprendiendo a base de ensayo y error, según las consecuencias de sus acciones. Curiosamente, estas formas de aprendizaje tienen muchos paralelismos con la educación humana: aprendizaje guiado, aprendizaje por descubrimiento y aprendizaje por experiencia.

Comprender **cómo aprenden las máquinas** no solo nos permite usar mejor la Inteligencia Artificial, sino que también nos invita a reflexionar sobre **cómo enseñamos y cómo aprenden nuestros alumnos y alumnas**. Con esta base, podemos ahora describir los principales tipos de aprendizaje que utilizan los sistemas de IA y entender en qué contextos se aplica cada uno.

#### Tipos de aprendizaje

Cuando hablamos de *aprendizaje* en Inteligencia Artificial conviene detenerse un momento y ajustar expectativas, especialmente en el ámbito educativo. Las máquinas **no aprenden como aprendemos las personas**. No sienten curiosidad, no tienen intención de mejorar ni conciencia de lo que hacen. Y, sin embargo, aprenden.

En IA, aprender significa algo muy concreto: **ajustar un modelo matemático a partir de datos** para que, con el tiempo, cometa menos errores en una tarea concreta. No hay comprensión del contenido, sino detección de regularidades numéricas. Donde una persona entiende un concepto, una máquina identifica patrones estadísticos. Esta diferencia es esencial para comprender tanto el potencial como los límites de la IA en educación.

##### El aprendizaje automático como núcleo de la IA moderna

El corazón de la Inteligencia Artificial actual es el **aprendizaje automático o Machine Learning (ML)**. A diferencia de la programación clásica —en la que el ser humano escribe reglas explícitas—, en el aprendizaje automático **no se le indica a la máquina cómo resolver el problema**, sino que se le muestran ejemplos para que descubra por sí misma qué funciona mejor.

Un paralelismo muy útil para el profesorado es el siguiente: programar un sistema tradicional se parece a dar una receta paso a paso; entrenar un sistema de IA se parece más a poner muchos ejemplos corregidos y dejar que el sistema extraiga conclusiones. El resultado suele ser más flexible y potente, aunque también más difícil de explicar.

A partir de esta idea general, podemos distinguir **varios tipos de aprendizaje**, según cómo se presentan los datos y qué tipo de información recibe el sistema durante su entrenamiento.

##### Aprendizaje supervisado: aprender con corrección

El **aprendizaje supervisado** es probablemente el tipo de aprendizaje automático que resulta más fácil de entender para un profesor, porque su lógica se parece bastante a la forma tradicional en que enseñamos en el aula. En este enfoque, el sistema aprende a partir de ejemplos en los que ya conocemos la respuesta correcta. Dicho de otra manera, el modelo recibe datos de entrada junto con la solución esperada, y a partir de muchos ejemplos aprende la relación entre ambos para poder hacer predicciones sobre casos nuevos.

Podemos imaginarlo como un proceso muy parecido al de **aprender con ejercicios resueltos o corregidos**. El sistema analiza muchos ejemplos y, cuando comete un error, ajusta sus parámetros internos para mejorar la próxima vez. Con el tiempo, ese proceso le permite detectar patrones en los datos y aplicar lo aprendido a situaciones que no había visto antes. En términos técnicos, el objetivo es que el modelo aprenda la relación entre unas variables de entrada y una salida conocida, de manera que pueda predecir esa salida en datos nuevos.

Dentro del aprendizaje supervisado suelen distinguirse dos grandes tipos de tareas. La primera es la **clasificación**, que consiste en asignar una categoría a un elemento. Por ejemplo, decidir si un correo es spam o no, o clasificar una imagen como perro o gato. La segunda es la **regresión**, que se utiliza cuando el objetivo es predecir un valor numérico continuo, como estimar la temperatura, el precio de una vivienda o las ventas futuras de un producto.

Desde el punto de vista educativo, este tipo de aprendizaje tiene aplicaciones cada vez más interesantes. En investigación educativa se utilizan algoritmos de aprendizaje supervisado para **analizar datos académicos y predecir el rendimiento de los estudiantes**, lo que permite detectar con antelación posibles dificultades o riesgo de abandono escolar. También se emplea en sistemas de evaluación automática, en plataformas de aprendizaje adaptativo o en herramientas que analizan grandes conjuntos de datos educativos para comprender mejor cómo progresa el alumnado.

La principal ventaja del aprendizaje supervisado es su **precisión y capacidad predictiva**, especialmente cuando se dispone de buenos datos. Sin embargo, su mayor debilidad es precisamente esa dependencia de los datos. El modelo solo puede aprender a partir de los ejemplos que recibe. Si los datos están mal etiquetados, contienen errores o reflejan sesgos, el sistema aprenderá esos mismos problemas y los reproducirá en sus predicciones.

Para el profesorado de educación secundaria, comprender esta idea es especialmente útil porque permite explicar al alumnado uno de los principios fundamentales de la inteligencia artificial actual: **las máquinas no aprenden por comprensión, sino por comparación de ejemplos**. En cierto sentido, el aprendizaje supervisado se parece mucho a un estudiante que practica con muchos ejercicios resueltos hasta que empieza a reconocer patrones y a resolver problemas nuevos por sí mismo.

<div class="no-scrollbar flex min-h-36 flex-nowrap gap-0.5 overflow-auto sm:gap-1 sm:overflow-hidden xl:min-h-44 mt-1 mb-5 [&:not(:first-child)]:mt-4" id="bkmrk--4"><div class="border-token-border-default relative w-32 shrink-0 overflow-hidden rounded-xl border-[0.5px] md:shrink max-h-64 sm:w-[calc((100%-0.5rem)/3)] rounded-s-xl"><div>![https://www.ceupe.com/images/easyblog_articles/3266/aprendizaje-supervisado-ejemplo.png](https://www.ceupe.com/images/easyblog_articles/3266/aprendizaje-supervisado-ejemplo.png)</div></div><div class="border-token-border-default relative w-32 shrink-0 overflow-hidden rounded-xl border-[0.5px] md:shrink max-h-64 sm:w-[calc((100%-0.5rem)/3)] align-center">*Esquema de aprendizaje supervisado en el que se presentan ejemplos categorizados o etiquetados*</div></div>##### Aprendizaje no supervisado: descubrir sin que nadie explique

El **aprendizaje no supervisado** es un tipo de aprendizaje automático que funciona de una forma muy distinta al aprendizaje supervisado. En este caso, el sistema no recibe ejemplos con la respuesta correcta ni etiquetas que indiquen qué debe aprender. En lugar de eso, el algoritmo analiza grandes cantidades de datos sin clasificar e intenta descubrir por sí mismo **patrones, estructuras o relaciones internas** dentro de esa información.

Dicho de una manera sencilla, la máquina observa los datos y busca similitudes entre ellos. Si encuentra elementos que se parecen entre sí, los agrupa automáticamente en conjuntos o **clusters**. Este proceso se conoce como agrupamiento o *clustering* y es una de las técnicas más comunes del aprendizaje no supervisado. La idea es que los datos que pertenecen a un mismo grupo compartan características similares, mientras que los que pertenecen a grupos distintos sean más diferentes entre sí.

Para un profesor de educación secundaria, puede resultar útil imaginar este proceso como cuando un docente observa una clase durante varias semanas y empieza a identificar patrones en el comportamiento o en la forma de trabajar de los estudiantes. Sin necesidad de que nadie lo indique explícitamente, puede detectar grupos de alumnado que tienen hábitos de estudio similares, ritmos de aprendizaje parecidos o formas de participación semejantes. El aprendizaje no supervisado funciona de manera parecida: el sistema observa los datos y descubre regularidades que no estaban previamente definidas.

En el ámbito educativo, este tipo de aprendizaje no suele utilizarse tanto para calificar o evaluar directamente al alumnado, sino para **comprender mejor fenómenos complejos dentro de los datos educativos**. Por ejemplo, puede servir para identificar perfiles de estudiantes con comportamientos similares en una plataforma digital de aprendizaje, detectar patrones de uso de recursos educativos o descubrir relaciones entre variables académicas que no se habían considerado previamente.

Sin embargo, hay una idea fundamental que conviene subrayar desde una perspectiva pedagógica. Aunque el algoritmo pueda encontrar agrupaciones o patrones en los datos, **no entiende el significado educativo de esos resultados**. El sistema puede detectar que ciertos estudiantes presentan comportamientos parecidos, pero no puede interpretar por qué ocurre eso ni qué implicaciones pedagógicas tiene. Esa interpretación siempre corresponde al profesorado.

Por esta razón, el aprendizaje no supervisado no sustituye el papel del docente. Más bien funciona como una herramienta que puede ofrecer nuevas perspectivas sobre grandes volúmenes de datos. En lugar de reemplazar la mirada pedagógica del profesor, amplía su capacidad para analizar información compleja y detectar patrones que de otro modo podrían pasar desapercibidos. En última instancia, la máquina puede identificar estructuras en los datos, pero **el sentido educativo de esas estructuras lo aporta siempre la interpretación humana**.

<div class="no-scrollbar flex min-h-36 flex-nowrap gap-0.5 overflow-auto sm:gap-1 sm:overflow-hidden xl:min-h-44 mt-1 mb-5 [&:not(:first-child)]:mt-4" id="bkmrk--6"><div class="border-token-border-default relative w-32 shrink-0 overflow-hidden rounded-xl border-[0.5px] md:shrink max-h-64 sm:w-[calc((100%-0.5rem)/3)] rounded-s-xl">  
</div><div class="border-token-border-default relative w-32 shrink-0 overflow-hidden rounded-xl border-[0.5px] md:shrink max-h-64 sm:w-[calc((100%-0.5rem)/3)]"><div>![https://uk.mathworks.com/discovery/unsupervised-learning/_jcr_content/thumbnail.adapt.1200.medium.png/1730872445777.png](https://uk.mathworks.com/discovery/unsupervised-learning/_jcr_content/thumbnail.adapt.1200.medium.png/1730872445777.png)</div><div class="align-center">*Esquema aprendizaje no supervisado en el que se forman agrupaciones de datos sin etiquetar*</div></div><div class="border-token-border-default relative w-32 shrink-0 overflow-hidden rounded-xl border-[0.5px] md:shrink max-h-64 sm:w-[calc((100%-0.5rem)/3)] rounded-e-xl">  
</div></div>##### ![https://codideep.com/img/blogpost/imagenportada/202506050000001.png](https://codideep.com/img/blogpost/imagenportada/202506050000001.png)

#####  

##### Aprendizaje por refuerzo

El **aprendizaje por refuerzo** es un tipo de aprendizaje automático que se basa en una idea muy sencilla y bastante intuitiva: **aprender actuando y observando las consecuencias**. En lugar de recibir ejemplos con la respuesta correcta —como ocurre en el aprendizaje supervisado— el sistema interactúa con un entorno, toma decisiones y recibe una señal que le indica si esa acción ha sido buena o mala. Esa señal suele llamarse **recompensa o penalización**, y el objetivo del sistema es aprender a actuar de manera que, con el tiempo, consiga la mayor recompensa posible.

Podemos imaginar este proceso de forma parecida a cómo aprenden muchas personas o animales: probando cosas, observando el resultado y ajustando su comportamiento. Si una acción produce un resultado positivo, el sistema tenderá a repetirla; si produce un resultado negativo, intentará evitarla en el futuro. Con el tiempo, mediante miles o millones de intentos, el modelo aprende qué decisiones son más adecuadas en cada situación.

En este tipo de aprendizaje suelen aparecer tres elementos básicos. Por un lado está el **agente**, que es el sistema que toma decisiones. Luego está el **entorno**, que es el mundo o situación donde actúa el agente. Y finalmente está la **recompensa**, que es la señal que indica si la acción tomada ha sido favorable o no. El agente va probando distintas acciones y aprende gradualmente qué estrategias le permiten maximizar la recompensa a largo plazo.

Uno de los ejemplos más famosos de aprendizaje por refuerzo es **AlphaGo**, el sistema desarrollado por DeepMind para jugar al juego de mesa Go. Este programa comenzó aprendiendo a partir de partidas humanas, pero después siguió mejorando jugando millones de partidas contra sí mismo. En ese proceso fue ajustando su comportamiento en función de si ganaba o perdía, lo que le permitió descubrir estrategias nuevas que incluso sorprendieron a jugadores profesionales.

Este ejemplo es interesante porque muestra que el aprendizaje por refuerzo no se limita a imitar comportamientos existentes. Cuando el sistema tiene libertad para explorar muchas posibilidades, puede encontrar soluciones eficaces que los humanos no habían considerado.

En el ámbito educativo, este enfoque resulta especialmente interesante cuando se trabaja con **entornos interactivos o simulaciones**. Por ejemplo, en simuladores de aprendizaje, videojuegos educativos o laboratorios virtuales, un agente puede aprender progresivamente cómo actuar dentro del entorno. También se investiga su uso en sistemas educativos inteligentes que aprenden **cuándo intervenir para ayudar al estudiante y cuándo dejar que explore por sí mismo**.

En definitiva, el aprendizaje por refuerzo introduce una idea muy poderosa dentro del Machine Learning: en lugar de aprender solo a partir de ejemplos, los sistemas pueden **aprender actuando, experimentando y ajustando su comportamiento en función de las consecuencias**. Esto abre la puerta a aplicaciones muy interesantes en ámbitos como la robótica, los videojuegos, la optimización de procesos y también en entornos educativos basados en simulación y experimentación.

##### El resultado: los modelos

Cuando entrenamos un sistema de **Machine Learning**, el objetivo final es construir un **modelo**. Ese modelo es, en esencia, una función matemática o estadística que ha aprendido a relacionar ciertos datos de entrada con un resultado. Una vez entrenado, ese modelo puede utilizar lo aprendido para analizar datos nuevos y producir una respuesta. Esa respuesta suele tomar dos formas principales: **clasificar algo en una categoría o predecir un valor**.

En el primer caso hablamos de **modelos de clasificación**. Su objetivo es asignar un elemento a una categoría concreta. El modelo analiza las características de un dato y decide a qué grupo pertenece. Este tipo de modelos se utiliza, por ejemplo, para determinar si un correo es spam o no, para identificar si una imagen contiene un gato o un perro, o para clasificar opiniones en positivas o negativas. En este tipo de problemas el resultado no es un número continuo, sino una **etiqueta o clase** previamente definida.

En el segundo caso hablamos de **modelos de predicción o regresión**. Aquí el objetivo no es asignar una categoría, sino estimar un valor numérico. El modelo intenta aprender la relación entre distintas variables y producir una predicción. Por ejemplo, puede estimar el precio de una vivienda a partir de su tamaño y ubicación, predecir la temperatura del día siguiente o calcular cuántos productos se venderán la próxima semana. En estos casos el resultado es una **cantidad continua**, no una categoría.

Ambos tipos de modelos se entrenan normalmente con **datos históricos**. El sistema analiza muchos ejemplos del pasado, detecta patrones y aprende relaciones entre variables. Una vez finalizado el entrenamiento, ese conocimiento se utiliza para analizar situaciones nuevas. Por ejemplo, si un modelo ha aprendido cómo se comportan ciertos datos financieros, podrá estimar tendencias futuras; si ha aprendido a distinguir imágenes de distintos objetos, podrá identificar nuevas imágenes que nunca había visto.

En la práctica existen muchos algoritmos diferentes que permiten construir modelos de **Machine Learning**, como los árboles de decisión, las regresiones estadísticas o los métodos de vecinos más cercanos. Sin embargo, en las últimas décadas ha ganado un protagonismo especial un tipo concreto de modelos: las **redes neuronales profundas**, que constituyen el núcleo del **Deep Learning**.

![https://codificandobits.com/media/red-neuronal-profunda-1.png](https://codificandobits.com/media/red-neuronal-profunda-1.png)

*Esquema de funcionamiento de una red neuronal profunda, formada por muchas capas que procesan cada aspecto de la imagen o de la información con la que se entrena*

El Deep Learning es un subcampo del Machine Learning que utiliza redes neuronales con muchas capas capaces de aprender representaciones cada vez más complejas de los datos. Estas redes permiten detectar patrones muy sofisticados en información difícil de describir mediante reglas simples, como imágenes, sonido, vídeo o lenguaje natural. Gracias a este enfoque, los sistemas pueden aprender directamente a partir de grandes volúmenes de datos sin necesidad de programar manualmente las características que deben analizar.

Este desarrollo de redes profundas ha sido uno de los factores clave que ha impulsado los avances recientes de la inteligencia artificial. Dentro de este contexto apareció una arquitectura especialmente influyente: los **transformers**, introducidos en 2017 en el artículo científico *Attention Is All You Need*. Esta arquitectura se basa en mecanismos de atención que permiten al modelo analizar relaciones entre distintas partes de un texto o de una secuencia de datos de manera muy eficiente.

Los transformers han supuesto un cambio importante porque permiten entrenar modelos mucho más grandes y manejar contextos más amplios que las arquitecturas anteriores. Gracias a ello se han convertido en la base tecnológica de muchos sistemas actuales de inteligencia artificial, especialmente de los **modelos de lenguaje de gran tamaño (LLM)** y de gran parte de las aplicaciones de **IA generativa** que hoy conocemos, como los asistentes conversacionales, los generadores de texto o los sistemas que crean imágenes y otros contenidos.

En definitiva, aunque el Machine Learning incluye muchos algoritmos diferentes, el desarrollo del **Deep Learning y de las arquitecturas basadas en transformers** ha sido el elemento que ha permitido dar el salto hacia los sistemas actuales capaces de generar texto, analizar lenguaje natural o crear contenido digital de forma cada vez más sofisticada.

Desde una perspectiva educativa, lo interesante es entender que estos modelos no “piensan” ni comprenden los fenómenos que analizan. Lo que hacen es **aprender relaciones estadísticas entre datos**. Si esas relaciones son suficientemente claras y los datos son de calidad, el modelo puede llegar a producir resultados muy útiles. Pero su funcionamiento sigue siendo, en última instancia, el de un sistema que aprende patrones para **clasificar o predecir**, no el de una inteligencia que entiende realmente el mundo.



<div class="no-scrollbar flex min-h-36 flex-nowrap gap-0.5 overflow-auto sm:gap-1 sm:overflow-hidden xl:min-h-44 mt-1 mb-5 [&:not(:first-child)]:mt-4" id="bkmrk-esquema-de-funcionam-1"><div class="border-token-border-default relative w-32 shrink-0 overflow-hidden rounded-xl border-[0.5px] md:shrink max-h-64 sm:w-[calc((100%-0.5rem)/3)] rounded-s-xl"><div>![https://upload.wikimedia.org/wikipedia/commons/7/78/Esquema_aprendizaje.jpg](https://upload.wikimedia.org/wikipedia/commons/7/78/Esquema_aprendizaje.jpg)</div><div class="align-center">*Esquema de funcionamiento de los modelos automáticos que predicen un valor (supervisado) o un grupo (no supervisado)*</div><div class="align-center"></div></div><div class="border-token-border-default relative w-32 shrink-0 overflow-hidden rounded-xl border-[0.5px] md:shrink max-h-64 sm:w-[calc((100%-0.5rem)/3)]">  
</div></div><div class="no-scrollbar flex min-h-36 flex-nowrap gap-0.5 overflow-auto sm:gap-1 sm:overflow-hidden xl:min-h-44 mt-1 mb-5 [&:not(:first-child)]:mt-4" id="bkmrk--10"><div class="border-token-border-default relative w-32 shrink-0 overflow-hidden rounded-xl border-[0.5px] md:shrink max-h-64 sm:w-[calc((100%-0.5rem)/3)]">  
</div><div class="border-token-border-default relative w-32 shrink-0 overflow-hidden rounded-xl border-[0.5px] md:shrink max-h-64 sm:w-[calc((100%-0.5rem)/3)] rounded-e-xl">  
</div></div>##### Cómo aprenden las máquinas y los humanos: el paralelismo educativo

Llegados a este punto, resulta casi inevitable comparar el aprendizaje de las máquinas con el aprendizaje humano. Aunque los mecanismos sean muy diferentes, el paralelismo resulta muy útil desde el punto de vista educativo, porque permite explicar la inteligencia artificial con conceptos que el profesorado conoce bien.

Gran parte del aprendizaje humano se parece al **aprendizaje supervisado**. En el aula, el alumnado aprende a partir de explicaciones, ejemplos y correcciones del profesorado. Cuando un estudiante resuelve un ejercicio y se equivoca, ese error no es simplemente un fallo, sino una señal que permite ajustar el razonamiento y mejorar en el siguiente intento. Algo muy parecido ocurre en muchos sistemas de aprendizaje automático: el modelo recibe ejemplos con la respuesta correcta, compara su predicción con el resultado esperado y ajusta sus parámetros internos para mejorar.

Pero las personas también aprendemos de otras formas. A menudo descubrimos patrones sin que nadie nos los explique directamente. Observamos cómo funcionan las cosas, detectamos regularidades y construimos significado a partir de la experiencia. Este tipo de aprendizaje recuerda al **aprendizaje no supervisado**, en el que los algoritmos analizan datos sin respuestas previas y buscan agrupaciones, estructuras o relaciones internas.

Existe además un tipo de aprendizaje muy habitual en educación que podríamos llamar **semisupervisado**. Ocurre cuando el alumnado recibe algunas orientaciones iniciales, pero tiene que investigar, experimentar o resolver problemas abiertos. Es lo que sucede en muchos proyectos, investigaciones o situaciones de aprendizaje donde no hay una única solución correcta. Curiosamente, este enfoque también está ganando importancia en inteligencia artificial, donde los sistemas combinan pequeñas cantidades de datos etiquetados con grandes volúmenes de datos sin etiquetar.

Por último, también aprendemos mediante **refuerzo**. Las consecuencias de nuestras acciones influyen en cómo actuamos en el futuro. El éxito, el reconocimiento, la frustración o la satisfacción son señales que guían nuestro comportamiento. En el aprendizaje por refuerzo de las máquinas ocurre algo parecido: los algoritmos ajustan sus decisiones en función de recompensas o penalizaciones. Sin embargo, existe una diferencia fundamental. En las personas, esas recompensas están cargadas de significado emocional, social y cultural.

En el fondo, las máquinas y las personas aprenden de maneras que, en apariencia, pueden parecer similares, pero que tienen una diferencia esencial. Las máquinas optimizan funciones matemáticas y buscan patrones estadísticos en los datos. Las personas, en cambio, aprendemos construyendo **sentido**: interpretamos, relacionamos ideas, damos significado a lo que aprendemos y lo conectamos con nuestra experiencia.

Comprender cómo aprenden las máquinas es importante para poder utilizarlas correctamente, pero también es necesario entender sus límites. Uno de los más conocidos es el problema del **sesgo**. Los modelos de inteligencia artificial aprenden a partir de datos humanos y, por tanto, pueden reproducir errores, prejuicios o desigualdades presentes en esos datos. Si los datos de entrenamiento están sesgados, el sistema aprenderá esos mismos sesgos y los reproducirá en sus decisiones.

Otro límite importante es la **opacidad**. Muchos modelos avanzados, especialmente los basados en deep learning, funcionan como una especie de “caja negra”. Esto significa que pueden producir resultados muy precisos, pero no siempre es fácil comprender exactamente cómo han llegado a esa conclusión.

Existe además un riesgo más sutil: la **apariencia de inteligencia**. Los sistemas de IA pueden expresarse con gran seguridad incluso cuando se equivocan, lo que puede generar una falsa sensación de fiabilidad. Entender que estos sistemas no comprenden el mundo, sino que predicen patrones, es una de las claves para desarrollar pensamiento crítico en el alumnado.

Por eso, en el contexto educativo, la inteligencia artificial debe entenderse siempre como **una herramienta**, no como un sustituto del pensamiento humano ni del criterio pedagógico. Puede ayudar a analizar información, generar materiales o personalizar el aprendizaje, pero la interpretación de los resultados, la transmisión de valores y la construcción de significado siguen siendo tareas profundamente humanas.

En última instancia, podría resumirse con una idea sencilla para el aula:

Las máquinas pueden aprender patrones.  
Las personas, además de aprender, **comprenden por qué y para qué aprenden**.

Y precisamente ahí es donde el papel del profesorado sigue siendo insustituible.

<div class="no-scrollbar flex min-h-36 flex-nowrap gap-0.5 overflow-auto sm:gap-1 sm:overflow-hidden xl:min-h-44 mt-1 mb-5 [&:not(:first-child)]:mt-4" id="bkmrk--2"><div class="border-token-border-default relative w-32 shrink-0 overflow-hidden rounded-xl border-[0.5px] md:shrink max-h-64 sm:w-[calc((100%-0.5rem)/3)] rounded-s-xl">  
</div><div class="border-token-border-default relative w-32 shrink-0 overflow-hidden rounded-xl border-[0.5px] md:shrink max-h-64 sm:w-[calc((100%-0.5rem)/3)]">[![image.png](https://libros.catedu.es/uploads/images/gallery/2026-03/scaled-1680-/iCXimage.png)](https://libros.catedu.es/uploads/images/gallery/2026-03/iCXimage.png)</div></div><div class="no-scrollbar flex min-h-36 flex-nowrap gap-0.5 overflow-auto sm:gap-1 sm:overflow-hidden xl:min-h-44 mt-1 mb-5 [&:not(:first-child)]:mt-4" id="bkmrk--14"><div class="border-token-border-default relative w-32 shrink-0 overflow-hidden rounded-xl border-[0.5px] md:shrink max-h-64 sm:w-[calc((100%-0.5rem)/3)]">  
</div><div class="border-token-border-default relative w-32 shrink-0 overflow-hidden rounded-xl border-[0.5px] md:shrink max-h-64 sm:w-[calc((100%-0.5rem)/3)] rounded-e-xl">  
</div></div>Comprender cómo aprenden las máquinas es imprescindible para usarlas bien, pero **no es suficiente**. Igual de importante es entender sus límites.

El primero es el **sesgo**. La IA aprende de datos humanos y, por tanto, hereda errores, prejuicios y desigualdades presentes en esos datos. Un sistema entrenado con información parcial o injusta reproducirá esas mismas distorsiones, a menudo de forma invisible.

El segundo límite es la **opacidad**. Muchos modelos, especialmente los basados en Deep Learning, funcionan como una “caja negra”: ofrecen resultados muy precisos, pero difíciles de explicar. En educación, esto obliga a extremar la prudencia cuando se utilizan para evaluar, clasificar o tomar decisiones relevantes.

El tercero es la **apariencia de inteligencia**. Los sistemas de IA pueden expresarse con seguridad incluso cuando se equivocan, lo que puede generar una falsa sensación de fiabilidad. Comprender que la IA no entiende, sino que **predice**, es clave para desarrollar pensamiento crítico en el alumnado.

[![image.png](https://libros.catedu.es/uploads/images/gallery/2026-03/scaled-1680-/SOximage.png)](https://libros.catedu.es/uploads/images/gallery/2026-03/SOximage.png)

*Imagen autoexplicativa que demuestra el estado actual de las cosas. Humanos consumiendo información y máquinas aprendiendo*

---

> **Las máquinas aprenden con datos; las personas aprenden con sentido, valores y acompañamiento.**

# 1.3 Cómo aprender de los datos, Machine Learning

## 1.3 Cómo aprender de los datos

#### Machine Learning (ML): enseñar a las máquinas con ejemplos

<div class="no-scrollbar flex min-h-36 flex-nowrap gap-0.5 overflow-auto sm:gap-1 sm:overflow-hidden xl:min-h-44 mt-1 mb-5 [&:not(:first-child)]:mt-4" id="bkmrk-"></div>En el capítulo anterior hemos visto que las máquinas no aprenden de una única manera. Distinguimos **aprendizaje supervisado**, **no supervisado**, **semisupervisado** y **por refuerzo**, categorías que, curiosamente, tienen un paralelismo muy claro con la educación humana. El **Machine Learning (ML)** no es algo distinto a esos tipos de aprendizaje, sino el **marco general** que los hace posibles en la práctica cuando trabajamos con datos reales.

Por tanto, cuando ahora hablamos de *cómo aprender de los datos*, no estamos empezando desde cero, sino **profundizando en cómo esos tipos de aprendizaje se implementan en sistemas reales**. El Machine Learning es el puente entre los datos y el comportamiento “inteligente” de la máquina, del mismo modo que la enseñanza es el puente entre la experiencia y el aprendizaje del alumnado.

#### Aprender no es entender: una comparación necesaria

Uno de los errores más habituales al hablar de Machine Learning es asumir que aprender equivale a comprender. No es así, ni en las máquinas ni, en muchos casos, en las personas.

Existe un ejemplo muy conocido en neurociencia que ayuda mucho a entender esta diferencia. Personas que han nacido ciegas y recuperan la visión en la edad adulta, gracias a avances médicos, **no son capaces de interpretar lo que ven**. Sus ojos funcionan, pero su cerebro nunca aprendió durante la infancia a reconocer formas, distancias, rostros o profundidad. Perciben luz, colores y movimiento, pero no significado. Necesitan un largo proceso de aprendizaje visual, y aun así su percepción nunca llega a ser equivalente a la de alguien que aprendió a ver desde pequeño.

Este caso humano es un paralelismo casi perfecto del Machine Learning.  
Una máquina puede recibir imágenes, textos o sonidos perfectamente convertidos en datos numéricos, pero **si no ha sido entrenada con suficientes ejemplos, no “ve”, no “lee” y no “escucha” nada**. Igual que en las personas, es el aprendizaje previo el que da sentido a la percepción. Sin datos y sin experiencia, solo hay estímulos sin significado.

#### ¿Qué significa realmente aprender de los datos?

Aprender de los datos no consiste en almacenar información como en un archivo. Consiste en **extraer patrones**. Un sistema de Machine Learning analiza grandes volúmenes de ejemplos y ajusta sus parámetros internos para que ciertas respuestas sean más probables que otras en el futuro.

Desde el punto de vista de los tipos de aprendizaje vistos en el capítulo anterior, esto puede hacerse de varias maneras. En el aprendizaje supervisado, el sistema aprende comparando sus predicciones con respuestas correctas. En el no supervisado, descubre estructuras internas sin que nadie le diga qué buscar. En el aprendizaje por refuerzo, ajusta su comportamiento en función de las consecuencias de sus acciones. En todos los casos, el mecanismo es el mismo: **datos → números → patrones → decisiones**.

No hay comprensión conceptual, pero sí una capacidad muy potente de **generalización**, que es lo que hace útil al Machine Learning en contextos complejos como la educación.

#### El ciclo del Machine Learning explicado para docentes

Aunque por dentro los modelos puedan parecer opacos, el proceso del Machine Learning sigue un ciclo que resulta muy familiar para cualquier docente.

1\. Todo comienza con la **recopilación de datos**. Se trata de r**ecoger ejemplos (los datos): i**gual que cuando enseñamos a un niño o niña qué es un triángulo mostrándole muchos dibujos, un sistema de *Machine Learning* necesita muchos ejemplos para aprender. En educación, estos ejemplos pueden ser datos como tiempos de respuesta, registros de asistencia, uso de plataformas digitales o resultados de actividades competenciales.

<p class="callout warning">Desde el punto de vista educativo y legal, es recomendable utilizar conjuntos de datos sintéticos, anonimizados, **evitando el uso directo de producciones** reales del alumnado en **sistemas de terceros**</p>

<p class="callout danger">Recordemos que, según la normativa de protección de datos como el **RGPD y la LOPDGDD**, el profesorado debe evitar introducir datos personales identificables en herramientas externas de IA y utilizar, siempre que sea posible, **datos anonimizados** o ejemplos ficticios. Es importante asegurarse también de que los datos utilizados respetan la privacidad del alumnado y se emplean únicamente con fines educativos legítimos</p>

2\. **Preparar los ejemplos:** Las máquinas necesitan que los datos estén organizados y en un formato que puedan analizar: antes de poder aprender, esos datos deben limpiarse, organizarse y transformarse en números, ya que la máquina no trabaja con significados, sino con valores numéricos. Es parecido a cuando un docente revisa ejercicios y los clasifica: correctos, incorrectos, incompletos…

3\. **Aprender a partir de los ejemplos**. A continuación tiene lugar el **entrenamiento**. El sistema analiza los datos y ajusta su comportamiento interno aplicando alguno de los tipos de aprendizaje estudiados: supervisado, no supervisado o por refuerzo. En esta fase el sistema intenta encontrar patrones, por ejemplo, puede detectar que el alumnado que entrega pocas tareas y participa poco suele tener más dificultades. La máquina no “entiende” como una persona, pero identifica combinaciones de datos que suelen repetirse.

4\. Comprobar si ha aprendido: **evaluación con datos nuevos**. Es parecido a cuando enseñamos algo en clase y luego ponemos un ejercicio diferente para ver si el alumnado ha entendido la idea o solo ha memorizado un ejemplo. En Machine Learning es fundamental comprobar si el modelo generaliza o si simplemente ha memorizado. Este paso conecta directamente con la evaluación educativa **y también recuerda la necesidad de revisar críticamente los resultados de la IA, ya que las decisiones pedagógicas deben seguir siendo responsabilidad del docente.**

Finalmente, el modelo se utiliza en situaciones reales, siempre bajo **supervisión humana**, especialmente cuando se trata de decisiones que afectan a personas.

![https://cdn.prod.website-files.com/64a7eed956ba9b9a3c62401d/64e3840f756417834cea5270_Feature%20image%20-%20The%20anatomy%20of%20a%20machine%20learning%20pipeline.jpg](https://cdn.prod.website-files.com/64a7eed956ba9b9a3c62401d/64e3840f756417834cea5270_Feature%20image%20-%20The%20anatomy%20of%20a%20machine%20learning%20pipeline.jpg)

*Esquema de aprendizaje en ML, se entrena al modelo con datos y luego se testea con datos nuevos para valorar su eficacia*

[![image.png](https://libros.catedu.es/uploads/images/gallery/2026-03/scaled-1680-/UPsimage.png)](https://libros.catedu.es/uploads/images/gallery/2026-03/UPsimage.png)

*Otra versión del esquema anterior. Al final siempre buscamos la obtención de un modelo*

#### Un ejemplo educativo completo: aprender a anticipar dificultades

Imaginemos un centro educativo que quiere detectar de forma temprana dificultades de aprendizaje. En lugar de esperar al suspenso final, decide analizar datos históricos de cursos anteriores: asistencia, entregas, resultados parciales, participación y uso de recursos digitales.

<p class="callout warning">Siempre teniendo en cuenta que el tratamiento de estos datos debe cumplir con la normativa de protección de datos y **realizarse dentro de los sistemas autorizados** del propio centro o de la administración educativa, **evitando compartir información personal con herramientas externas.**</p>

Aplicando **aprendizaje supervisado**, se entrenan modelos con ejemplos reales de alumnado que tuvo dificultades y alumnado que no las tuvo. El sistema aprende combinaciones de factores que suelen anticipar problemas académicos.

El resultado no es una decisión automática, sino una **señal de alerta**. El Machine Learning no sustituye al tutor ni al orientador, pero proporciona información objetiva que ayuda a intervenir antes y mejor. El aprendizaje de la máquina se convierte así en un apoyo al aprendizaje humano.

#### Modelos sencillos frente a modelos complejos

Otro aspecto importante, especialmente en educación, es que **no siempre necesitamos modelos complejos**. Aunque el aprendizaje profundo ha impulsado grandes avances, muchos problemas educativos se resuelven mejor con modelos simples, más transparentes y más fáciles de explicar.

Esto conecta con lo aprendido en el capítulo anterior: el tipo de aprendizaje elegido debe responder al problema educativo, no al atractivo tecnológico. En muchos casos, entender por qué el modelo toma una decisión es más importante que ganar unas décimas de precisión.

#### Aprender haciendo: herramientas educativas de Machine Learning

Una de las mejores formas de comprender el Machine Learning es **vivir el proceso de entrenamiento**. En este sentido, existen herramientas educativas que permiten trabajar con ML de forma accesible en el aula. Una de las más conocidas es **<span class="hover:entity-accent entity-underline inline cursor-pointer align-baseline"><span class="whitespace-normal">Machine Learning for Kids</span></span>**, que permite entrenar modelos sencillos a partir de ejemplos aportados por el alumnado, sin necesidad de programar.

Además de ML for Kids, en el ámbito educativo y formativo se utilizan también otras herramientas y entornos como:

- [**Teachable Machine de google**](https://teachablemachine.withgoogle.com/)
- [**Scratch + extensiones de IA del MIT**](https://scratch.mit.edu/search/projects?q=AI)
- [**Orange Data Mining**](https://orangedatamining.com/)
- [**Google Colab para programadores**](https://colab.research.google.com/)
- [**AutoML de Google**](https://cloud.google.com/automl?hl=es-419)

El valor pedagógico de estas herramientas no está en el resultado final, sino en el proceso: el alumnado comprende que **si los datos son pobres, el modelo aprende mal**, y que mejorar el aprendizaje implica mejorar los ejemplos.

#### El error como motor del aprendizaje

Igual que ocurre en los tipos de aprendizaje estudiados en el capítulo anterior, el error desempeña un papel central en el Machine Learning. Cuando un modelo falla, no se corrige escribiendo una regla, sino **añadiendo mejores ejemplos** o ajustando los datos de entrenamiento.

Este enfoque conecta directamente con la evaluación formativa. Tanto las máquinas como las personas **aprenden cuando el error se convierte en información**, no en castigo.

#### Límites, ética y responsabilidad educativa

Trabajar con Machine Learning en educación implica una responsabilidad especial. Los modelos aprenden de datos pasados, no del potencial futuro del alumnado. Pueden reproducir sesgos, simplificar realidades complejas o generar etiquetas que condicionen expectativas.

Por eso, el Machine Learning debe entenderse siempre como **una herramienta de apoyo al profesorado**, nunca como un sustituto del criterio pedagógico. La máquina detecta patrones; el docente entiende personas, contextos y trayectorias.

#### Conclusión

El Machine Learning nos recuerda que aprender es un proceso acumulativo. Sin ejemplos, no hay aprendizaje. Sin experiencia, no hay interpretación. Esto es cierto para las máquinas… y también para las personas.

El caso de quienes recuperan la visión en la edad adulta nos enseña que **ver no es solo recibir estímulos, sino haber aprendido a interpretarlos**. La IA puede aprender rápido, pero no comprende. Las personas aprenden más despacio, pero dan sentido a lo aprendido.

> **Las máquinas aprenden de los datos; la educación enseña a comprender el mundo.**

# 1.4 Entendiendo las redes neuronales, Deep Learning

#### Deep Learning (DL): cuando las máquinas aprenden representaciones complejas

<div class="flex flex-col text-sm pb-25" id="bkmrk-el-deep-learning-%28ap"><article class="text-token-text-primary w-full focus:outline-none [--shadow-height:45px] has-data-writing-block:pointer-events-none has-data-writing-block:-mt-(--shadow-height) has-data-writing-block:pt-(--shadow-height) [&:has([data-writing-block])>*]:pointer-events-auto scroll-mt-[calc(var(--header-height)+min(200px,max(70px,20svh)))]" data-scroll-anchor="true" data-testid="conversation-turn-166" data-turn="assistant" data-turn-id="request-69b67a86-0404-8397-8181-e93bce4ddc0c-17" dir="auto" tabindex="-1">El **Deep Learning (aprendizaje profundo)** es una parte del **Machine Learning** que se centra en el uso de **redes neuronales artificiales con múltiples capas** para construir modelos capaces de aprender patrones complejos a partir de grandes cantidades de datos. Mientras que muchos algoritmos clásicos de Machine Learning trabajan con modelos relativamente simples, el Deep Learning utiliza estructuras más profundas en las que la información pasa por varias capas sucesivas de procesamiento.

Una red neuronal profunda está formada, en términos generales, por tres tipos de capas: una **capa de entrada**, que recibe los datos; una o varias **capas ocultas**, donde se realiza el procesamiento; y una **capa de salida**, que produce el resultado final. Cada capa está compuesta por unidades llamadas **neuronas artificiales**, que realizan operaciones matemáticas sobre los datos que reciben y transmiten el resultado a la siguiente capa.

Lo que hace que un sistema sea “profundo” es precisamente el número de capas intermedias. En lugar de transformar los datos en un único paso, como ocurre en muchos algoritmos tradicionales, el Deep Learning los transforma **progresivamente**, capa tras capa. Cada capa aprende a representar la información con un nivel mayor de abstracción. Por ejemplo, en un sistema que analiza imágenes, las primeras capas pueden detectar bordes o colores, las siguientes pueden identificar formas, y las capas más profundas pueden reconocer objetos completos.

Este enfoque permite construir modelos capaces de aprender relaciones muy complejas entre los datos. Las redes profundas pueden modelar funciones no lineales muy sofisticadas y detectar patrones que serían difíciles de describir mediante reglas manuales. Por esa razón, el Deep Learning se ha convertido en el paradigma dominante en muchas áreas de la inteligencia artificial moderna, especialmente en problemas que implican grandes volúmenes de información como imágenes, audio o lenguaje natural.

Otro aspecto importante es que, a diferencia de muchos métodos tradicionales de Machine Learning, las redes profundas **aprenden automáticamente las características relevantes de los datos**. En enfoques clásicos era habitual que los programadores tuvieran que definir manualmente qué rasgos debía analizar el sistema. En Deep Learning, en cambio, las capas de la red descubren por sí mismas qué representaciones son útiles para resolver la tarea.

Gracias a esta capacidad, el Deep Learning ha permitido avances muy importantes en campos como la visión artificial, el reconocimiento de voz o el procesamiento del lenguaje natural. De hecho, muchas de las tecnologías actuales de inteligencia artificial —incluidos los modelos generativos y los grandes modelos de lenguaje— se basan precisamente en arquitecturas de redes neuronales profundas.

En resumen, el Deep Learning puede entenderse como una evolución del Machine Learning en la que los modelos se construyen mediante **redes neuronales con múltiples capas de procesamiento**, capaces de aprender representaciones cada vez más complejas de los datos y de abordar problemas que antes resultaban muy difíciles para los sistemas informáticos.

</article></div><div class="no-scrollbar flex min-h-36 flex-nowrap gap-0.5 overflow-auto sm:gap-1 sm:overflow-hidden xl:min-h-44 mt-1 mb-5 [&:not(:first-child)]:mt-4" id="bkmrk-"><div class="border-token-border-default relative w-32 shrink-0 overflow-hidden rounded-xl border-[0.5px] md:shrink max-h-64 sm:w-[calc((100%-0.5rem)/3)] rounded-s-xl"><div>![https://miro.medium.com/v2/resize%3Afit%3A1156/1%2AToPT8jnb5mtnikmiB42hpQ.png](https://miro.medium.com/v2/resize%3Afit%3A1156/1%2AToPT8jnb5mtnikmiB42hpQ.png)</div><div class="align-center">*Esquema general de una red neuronal multicapa*</div></div><div class="border-token-border-default relative w-32 shrink-0 overflow-hidden rounded-xl border-[0.5px] md:shrink max-h-64 sm:w-[calc((100%-0.5rem)/3)] rounded-e-xl">  
</div></div>#### Del Machine Learning al Deep Learning: una evolución lógica

En los capítulos anteriores hemos visto **cómo aprenden las máquinas** y qué entendemos por *Machine Learning*: aprender a partir de datos siguiendo distintos enfoques (supervisado, no supervisado, semisupervisado y por refuerzo). El **Deep Learning (DL)** no cambia esa lógica, pero **la amplifica**.

La diferencia fundamental no está en *qué* se aprende, sino en *cómo*. El Deep Learning utiliza **redes neuronales con muchas capas**, capaces de aprender representaciones cada vez más complejas sin que una persona tenga que indicar explícitamente qué características son importantes. En lugar de decirle a la máquina “fíjate en esto”, se le dan datos y se deja que **descubra por sí misma los niveles de información relevantes**.

Por eso, el Deep Learning ha sido decisivo en ámbitos donde la complejidad del dato —texto, imagen, audio o vídeo— hacía imposible escribir reglas manuales.

#### Aprender a interpretar: una analogía humana clave

Volvemos a una analogía muy potente desde el punto de vista educativo. Cuando una persona nace ciega y recupera la visión en la edad adulta, sus ojos comienzan a funcionar, pero su cerebro **no sabe interpretar lo que recibe**. No reconoce objetos ni caras; ve estímulos sin significado. Solo tras un largo proceso de aprendizaje empieza a construir una interpretación del mundo visual.

El Deep Learning funciona de forma muy similar. Una imagen no es “un perro”, un audio no es “una voz” y un texto no es “una idea”. Para la máquina, todo son números. Las primeras capas de una red neuronal profunda aprenden patrones simples; las siguientes, combinaciones más complejas; y las últimas, estructuras de alto nivel. El significado **no está dado**, se construye a partir del aprendizaje progresivo.

#### Redes neuronales profundas: aprender por niveles

Una red neuronal profunda transforma la información **capa a capa**. Cada capa aprende algo distinto y lo pasa a la siguiente. Cuantas más capas, más compleja puede ser la representación aprendida.

En educación, el paralelismo es claro: no se pasa directamente de datos a comprensión profunda. El aprendizaje humano también es gradual. El Deep Learning imita esa progresión, aunque sin conciencia ni comprensión real.![https://serokell.io/files/9w/9wrzg5vi.Deep_Learning_in_Computer_Vision_pic2.png](https://serokell.io/files/9w/9wrzg5vi.Deep_Learning_in_Computer_Vision_pic2.png)

*Esquema de una red que aprende imágenes, en cada capa se detectan diferentes aspectos de mayor detalle*

#### Modelos reales de Deep Learning según el tipo de dato

Uno de los grandes valores del Deep Learning es que **la misma idea funciona para distintos tipos de información**, cambiando el modelo concreto. Veamos algunos ejemplos reales y conocidos, aplicables a diferentes ámbitos.

**Modelos de DL aplicado al texto**

En el procesamiento del lenguaje natural, el Deep Learning se apoya en **modelos basados en transformers**, capaces de manejar el contexto y las relaciones entre palabras a gran escala.

Ejemplos de modelos reales:

- **GPT** (familia de modelos generativos de lenguaje)
- **BERT**
- **RoBERTa**
- **T5**
- **LLaMA**
- **Mistral**

Estos modelos se utilizan para:

- generar textos,
- resumir documentos,
- responder preguntas,
- analizar sentimientos,
- clasificar y corregir textos.

Aunque puedan parecer “inteligentes”, su funcionamiento se basa en **predecir la siguiente palabra más probable** a partir de enormes cantidades de texto previamente analizado.

**Modelos de DL aplicado al audio**

En el ámbito del audio, el Deep Learning ha revolucionado el reconocimiento y la generación de voz. Las redes neuronales profundas aprenden a transformar ondas sonoras en representaciones lingüísticas.

Ejemplos de modelos reales:

- **Whisper** (transcripción de audio a texto)
- **Wav2Vec**
- **DeepSpeech**
- **Conformer**
- **Tacotron**
- **WaveNet**

Estos modelos permiten:

- transcribir clases grabadas,
- crear subtítulos automáticos,
- generar voz sintética,
- mejorar la accesibilidad educativa.

Aquí, las capas iniciales trabajan con frecuencias y ritmos; las posteriores, con fonemas y palabras completas.

**Modelos de DL aplicado a imagen**

En visión artificial, el Deep Learning se apoya en **redes convolucionales** y modelos visuales profundos que aprenden a reconocer patrones espaciales.

Ejemplos de modelos reales:

- **ResNet**
- **VGG**
- **Inception**
- **EfficientNet**
- **YOLO**
- **Vision Transformer (ViT)**

Estos modelos se utilizan para:

- reconocimiento de objetos y personas,
- análisis de imágenes médicas o educativas,
- detección de gestos,
- clasificación y etiquetado automático de imágenes.

Las primeras capas detectan bordes y colores; las últimas reconocen objetos completos.

**Modelos de DL aplicado a vídeo**

El vídeo añade una dimensión adicional: el **tiempo**. Los modelos de Deep Learning para vídeo combinan análisis de imagen con secuencias temporales.

Ejemplos de modelos reales:

- **I3D**
- **SlowFast**
- **C3D**
- **TimeSformer**
- **Video Swin Transformer**

Estos modelos permiten:

- analizar prácticas grabadas,
- detectar acciones o comportamientos,
- estudiar movimientos y posturas,
- indexar grandes repositorios audiovisuales.

En educación, esto abre posibilidades en FP, educación física, artes escénicas o formación técnica.

#### Herramientas y entornos para aplicar el Deep Learning

> El uso de estas herramientas requiere un cierto conocimiento previo de tecnologías o lenguajes como python

Hoy en día el **Deep Learning** no se utiliza de forma aislada, sino que forma parte de un ecosistema de herramientas y plataformas que permiten crear, entrenar o utilizar modelos de inteligencia artificial en distintos contextos. Muchas de estas tecnologías se apoyan en redes neuronales profundas y permiten trabajar con datos de texto, imagen, audio o vídeo. Entre las más conocidas se encuentran **TensorFlow, PyTorch o Keras**, que son bibliotecas utilizadas para construir y entrenar modelos de aprendizaje profundo. Estas herramientas permiten definir redes neuronales, entrenarlas con datos y utilizarlas posteriormente para realizar predicciones o clasificaciones.

A su alrededor han aparecido también otras plataformas que facilitan el uso de estos modelos en aplicaciones más complejas. Por ejemplo, **Hugging Face** proporciona repositorios de modelos ya entrenados que pueden reutilizarse para tareas como procesamiento de lenguaje natural, análisis de texto o generación de contenido. Herramientas como **LangChain** permiten integrar modelos de lenguaje en aplicaciones más amplias, conectándolos con bases de datos, buscadores o sistemas externos.

Existen además entornos pensados para experimentar o aprender con estos modelos sin necesidad de instalar software complejo. Un ejemplo muy utilizado en educación es **Google Colab**, que permite ejecutar código Python directamente desde el navegador y trabajar con bibliotecas de aprendizaje automático utilizando recursos en la nube, incluso con acceso a GPU.

Junto a estas herramientas más técnicas también han aparecido plataformas que intentan acercar la inteligencia artificial a un público más amplio. **Teachable Machine**, por ejemplo, permite crear pequeños modelos de reconocimiento de imágenes o sonidos mediante una interfaz visual, algo muy útil en contextos educativos para entender los principios del aprendizaje automático.

Por último, herramientas como **AutoML** automatizan parte del proceso de creación de modelos, seleccionando algoritmos o ajustando parámetros de forma automática para facilitar el desarrollo de sistemas de Machine Learning sin necesidad de diseñar todo el modelo manualmente.

En conjunto, todas estas tecnologías forman parte del ecosistema actual del Deep Learning. No es imprescindible dominarlas todas para comprender la inteligencia artificial, pero sí resulta importante entender qué tipo de aprendizaje y qué modelos hay detrás de cada herramienta. En el fondo, muchas de estas plataformas utilizan las mismas ideas fundamentales del Machine Learning y del Deep Learning: redes neuronales, grandes conjuntos de datos y algoritmos capaces de aprender patrones complejos a partir de la información disponible.

#### Deep Learning y los tipos de aprendizaje ya estudiados

Conviene recordar que el **Deep Learning** no es un tipo de aprendizaje diferente dentro de la inteligencia artificial, sino una **tecnología o arquitectura de modelos** basada en redes neuronales profundas que puede entrenarse utilizando distintos enfoques de Machine Learning. Es decir, las redes profundas pueden aprender de varias maneras: mediante aprendizaje supervisado, cuando se entrenan con datos etiquetados; mediante aprendizaje no supervisado, cuando descubren estructuras o patrones en grandes conjuntos de datos; mediante aprendizaje semisupervisado, combinando pequeñas cantidades de datos etiquetados con muchos datos sin etiquetar; o mediante aprendizaje por refuerzo, donde el sistema aprende a partir de la interacción con un entorno y de recompensas o penalizaciones asociadas a sus acciones.

Un ejemplo muy conocido de esta combinación es **AlphaGo**, el sistema desarrollado por DeepMind para jugar al juego de mesa Go. Este sistema utilizaba **redes neuronales profundas** que inicialmente aprendieron observando partidas humanas y después mejoraron mediante **aprendizaje por refuerzo jugando millones de partidas contra sí mismo**. De este modo, el sistema fue capaz de desarrollar estrategias muy complejas, incluso algunas que sorprendieron a jugadores profesionales.

En el ámbito educativo, el Deep Learning abre posibilidades que hace apenas unos años resultaban difíciles de imaginar. Gracias a estas redes profundas es posible trabajar con **grandes volúmenes de información compleja**, como textos largos, audio, imágenes o vídeo, lo que permite desarrollar herramientas de análisis, accesibilidad o generación de contenidos educativos mucho más avanzadas. Por ejemplo, pueden utilizarse para analizar textos académicos, reconocer voz en herramientas de aprendizaje de idiomas o generar materiales didácticos a partir de diferentes fuentes de información.

Sin embargo, también es importante mantener una cierta prudencia pedagógica. Los modelos basados en Deep Learning suelen ser muy eficaces, pero su funcionamiento interno puede resultar difícil de interpretar, lo que a menudo se describe como el problema de la **“caja negra”**. En otras palabras, el sistema puede ofrecer resultados muy precisos sin que siempre podamos explicar con claridad cómo ha llegado a esa conclusión. Por este motivo, en educación su uso debe entenderse como **una herramienta de apoyo**, útil para analizar información o generar recursos, pero no como un sistema que tome decisiones educativas de forma autónoma.

#### Conclusión

El Deep Learning ha demostrado que las máquinas pueden aprender representaciones extremadamente complejas a partir de datos. Pero también nos recuerda una lección clave para la educación:

> **Las máquinas aprenden patrones profundos; las personas aprenden significados profundos.**

# 1.5 Modelos de Lenguaje, tipos y aplicaciones

En los últimos años, una de las áreas de la Inteligencia Artificial que más ha avanzado es la relacionada con el **lenguaje humano**. Los sistemas actuales son capaces de leer textos, resumir información, traducir entre idiomas o responder preguntas de forma bastante natural. Este conjunto de tecnologías se conoce como **Procesamiento del Lenguaje Natural**, o *Natural Language Processing (NLP)*.

Para entenderlo de forma sencilla, podemos pensar en estos sistemas como **lectores muy rápidos que han leído millones de textos**. A partir de ese entrenamiento, aprenden cómo suelen aparecer las palabras juntas, qué estructuras tienen las frases o cómo se organizan las ideas en un texto.

Un símil útil para explicarlo es el de un estudiante que ha leído muchos libros. Con el tiempo, ese estudiante empieza a reconocer patrones: sabe cómo se construyen las frases, cómo se explican ciertos conceptos o qué palabras suelen aparecer en determinados contextos. Los modelos de lenguaje funcionan de una forma similar, aunque a una escala mucho mayor.

Por ejemplo, cuando utilizamos un sistema como *ChatGPT* para pedir un resumen de un texto o para generar una explicación de un concepto, el modelo no está “pensando” en el sentido humano. Lo que hace es **predecir qué palabras tienen más probabilidad de aparecer a continuación en una frase**, basándose en los patrones que aprendió durante su entrenamiento.

Este tipo de modelos se conocen como **modelos de lenguaje** porque están diseñados precisamente para trabajar con lenguaje. Su tarea básica consiste en **predecir la siguiente palabra dentro de una secuencia de texto**, pero a partir de esta capacidad básica se pueden construir muchas aplicaciones diferentes: traducción automática, asistentes conversacionales, análisis de textos o generación de contenido.

En el ámbito educativo, estas herramientas pueden utilizarse para **explicar conceptos, generar ejemplos, resumir textos o apoyar la elaboración de materiales didácticos**. Sin embargo, también es importante recordar que los modelos de lenguaje no comprenden el mundo como lo hace una persona. Su conocimiento se basa en patrones estadísticos aprendidos a partir de grandes cantidades de datos.

Por ello, una buena forma de trabajar con estas herramientas en el aula es entenderlas como **un asistente que ayuda a explorar el lenguaje y la información**, pero cuyo resultado siempre debe ser revisado críticamente por el usuario. De esta manera, los modelos de lenguaje pueden convertirse en una herramienta interesante para apoyar el aprendizaje y al mismo tiempo reflexionar sobre cómo funcionan los sistemas actuales de Inteligencia Artificial.

<div class="flex flex-col text-sm pb-25" id="bkmrk-procesamiento-del-le"><article class="text-token-text-primary w-full focus:outline-none [--shadow-height:45px] has-data-writing-block:pointer-events-none has-data-writing-block:-mt-(--shadow-height) has-data-writing-block:pt-(--shadow-height) [&:has([data-writing-block])>*]:pointer-events-auto scroll-mt-[calc(var(--header-height)+min(200px,max(70px,20svh)))]" data-scroll-anchor="true" data-testid="conversation-turn-56" data-turn="assistant" data-turn-id="request-69b67a86-0404-8397-8181-e93bce4ddc0c-22" dir="auto" tabindex="-1">#### Procesamiento del Lenguaje Natural (NLP)

El **Procesamiento del Lenguaje Natural**, conocido habitualmente como **NLP (Natural Language Processing)**, es la rama de la Inteligencia Artificial que se ocupa de que los ordenadores puedan **analizar, comprender y trabajar con textos escritos o hablados en lenguaje humano**.

Podemos imaginarlo como el conjunto de técnicas que permiten a una máquina hacer tareas que normalmente asociamos a la lectura o al análisis del lenguaje. Por ejemplo, identificar las palabras importantes de un texto, clasificar documentos, detectar el tema principal de un artículo o responder preguntas.

Un símil útil para entenderlo en el aula es el de un **profesor que corrige muchos exámenes**. Con el tiempo, el profesor aprende a reconocer rápidamente ciertas palabras clave o estructuras que indican si el alumno ha entendido el tema. Los sistemas de NLP hacen algo parecido: analizan los textos buscando patrones que permitan interpretar su contenido.

[![image.png](https://libros.catedu.es/uploads/images/gallery/2026-03/scaled-1680-/HHbimage.png)](https://libros.catedu.es/uploads/images/gallery/2026-03/HHbimage.png)

Antes de la aparición de los modelos de lenguaje actuales, muchas aplicaciones de **procesamiento del lenguaje natural (NLP)** se basaban en métodos estadísticos relativamente simples pero muy eficaces. Uno de los más conocidos es **TF-IDF (Term Frequency – Inverse Document Frequency)**, una técnica que permite estimar qué palabras son más importantes dentro de un texto comparándolas con el resto de documentos de una colección. La idea es sencilla: una palabra que aparece muchas veces en un documento suele ser relevante para ese texto, pero si esa misma palabra aparece en casi todos los documentos —como ocurre con artículos o preposiciones— su valor informativo es menor. TF-IDF combina estas dos medidas para identificar qué términos caracterizan realmente un documento dentro de un conjunto más amplio de textos.

Durante años, este tipo de técnicas fue fundamental en numerosas aplicaciones de análisis de texto. Se utilizaban en buscadores para ordenar documentos según su relevancia, en sistemas de recomendación, en clasificación automática de textos o para detectar temas dominantes dentro de grandes colecciones de documentos. A partir de estos métodos también surgieron otras tareas habituales del procesamiento del lenguaje natural, como identificar si un mensaje es spam o no, analizar el tono de una opinión para detectar sentimientos positivos o negativos, localizar nombres o fechas dentro de un texto o generar resúmenes automáticos de documentos.

Durante mucho tiempo, todas estas aplicaciones se resolvieron combinando **estadística, lingüística y reglas programadas manualmente**. Aunque estos enfoques eran relativamente simples comparados con los modelos actuales de inteligencia artificial, constituyeron la base de muchas herramientas de análisis de texto y permitieron desarrollar gran parte del procesamiento automático del lenguaje antes de la llegada de las redes neuronales profundas y los modelos generativos modernos.

<div class="text-base my-auto mx-auto pb-10 [--thread-content-margin:var(--thread-content-margin-xs,calc(var(--spacing)*4))] @w-sm/main:[--thread-content-margin:var(--thread-content-margin-sm,calc(var(--spacing)*6))] @w-lg/main:[--thread-content-margin:var(--thread-content-margin-lg,calc(var(--spacing)*16))] px-(--thread-content-margin)"><div class="[--thread-content-max-width:40rem] @w-lg/main:[--thread-content-max-width:48rem] mx-auto max-w-(--thread-content-max-width) flex-1 group/turn-messages focus-visible:outline-hidden relative flex w-full min-w-0 flex-col agent-turn" tabindex="-1"><div class="flex max-w-full flex-col gap-4 grow"><div class="min-h-8 text-message relative flex w-full flex-col items-end gap-2 text-start break-words whitespace-normal [.text-message+&]:mt-1" data-message-author-role="assistant" data-message-id="fb421290-28bc-4be7-aac9-e7df37ff42d1" data-message-model-slug="gpt-5-3" dir="auto"><div class="flex w-full flex-col gap-1 empty:hidden">  
</div></div></div></div></div>Sin embargo, el campo del NLP ha experimentado una auténtica revolución desde la aparición de una nueva arquitectura de modelos llamada **Transformers**, presentada en 2017 en el famoso artículo *“Attention is All You Need”*.

Los modelos basados en transformers son capaces de analizar el contexto completo de una frase y comprender mejor las relaciones entre palabras. Gracias a esta arquitectura se han desarrollado los actuales **modelos de lenguaje de gran tamaño (LLM)**, como GPT, Gemini o Claude.

Esto ha permitido que muchas tareas de procesamiento del lenguaje que antes requerían sistemas complejos y específicos ahora puedan resolverse con **un único modelo capaz de realizar múltiples tareas**: traducir, resumir, responder preguntas o generar texto.

En otras palabras, técnicas clásicas como TF-IDF o los modelos estadísticos tradicionales siguen siendo importantes para entender los fundamentos del NLP, pero los modelos actuales basados en transformers han ampliado enormemente las capacidades de los sistemas de lenguaje.

<div class="text-base my-auto mx-auto pb-10 [--thread-content-margin:var(--thread-content-margin-xs,calc(var(--spacing)*4))] @w-sm/main:[--thread-content-margin:var(--thread-content-margin-sm,calc(var(--spacing)*6))] @w-lg/main:[--thread-content-margin:var(--thread-content-margin-lg,calc(var(--spacing)*16))] px-(--thread-content-margin)"><div class="[--thread-content-max-width:40rem] @w-lg/main:[--thread-content-max-width:48rem] mx-auto max-w-(--thread-content-max-width) flex-1 group/turn-messages focus-visible:outline-hidden relative flex w-full min-w-0 flex-col agent-turn" tabindex="-1"><div class="flex max-w-full flex-col gap-4 grow"><div class="min-h-8 text-message relative flex w-full flex-col items-end gap-2 text-start break-words whitespace-normal [.text-message+&]:mt-1" data-message-author-role="assistant" data-message-id="fb421290-28bc-4be7-aac9-e7df37ff42d1" data-message-model-slug="gpt-5-3" dir="auto"><div class="flex w-full flex-col gap-1 empty:hidden"><div class="markdown prose dark:prose-invert w-full wrap-break-word light markdown-new-styling"><div class="text-base my-auto mx-auto pb-10 [--thread-content-margin:var(--thread-content-margin-xs,calc(var(--spacing)*4))] @w-sm/main:[--thread-content-margin:var(--thread-content-margin-sm,calc(var(--spacing)*6))] @w-lg/main:[--thread-content-margin:var(--thread-content-margin-lg,calc(var(--spacing)*16))] px-(--thread-content-margin)"><div class="[--thread-content-max-width:40rem] @w-lg/main:[--thread-content-max-width:48rem] mx-auto max-w-(--thread-content-max-width) flex-1 group/turn-messages focus-visible:outline-hidden relative flex w-full min-w-0 flex-col agent-turn" tabindex="-1"><div class="flex max-w-full flex-col gap-4 grow"><div class="min-h-8 text-message relative flex w-full flex-col items-end gap-2 text-start break-words whitespace-normal [.text-message+&]:mt-1" data-message-author-role="assistant" data-message-id="fb421290-28bc-4be7-aac9-e7df37ff42d1" data-message-model-slug="gpt-5-3" dir="auto"><div class="flex w-full flex-col gap-1 empty:hidden"><div class="markdown prose dark:prose-invert w-full wrap-break-word light markdown-new-styling">  
</div></div></div></div></div></div></div></div></div></div></div></div>[![image.png](https://libros.catedu.es/uploads/images/gallery/2026-03/scaled-1680-/pSbimage.png)](https://libros.catedu.es/uploads/images/gallery/2026-03/pSbimage.png)

*Arquitectura de los modelos Transformers publicada por primera vez por Google en el 2017*

<div class="text-base my-auto mx-auto pb-10 [--thread-content-margin:var(--thread-content-margin-xs,calc(var(--spacing)*4))] @w-sm/main:[--thread-content-margin:var(--thread-content-margin-sm,calc(var(--spacing)*6))] @w-lg/main:[--thread-content-margin:var(--thread-content-margin-lg,calc(var(--spacing)*16))] px-(--thread-content-margin)"><div class="[--thread-content-max-width:40rem] @w-lg/main:[--thread-content-max-width:48rem] mx-auto max-w-(--thread-content-max-width) flex-1 group/turn-messages focus-visible:outline-hidden relative flex w-full min-w-0 flex-col agent-turn" tabindex="-1"><div class="flex max-w-full flex-col gap-4 grow"><div class="min-h-8 text-message relative flex w-full flex-col items-end gap-2 text-start break-words whitespace-normal [.text-message+&]:mt-1" data-message-author-role="assistant" data-message-id="fb421290-28bc-4be7-aac9-e7df37ff42d1" data-message-model-slug="gpt-5-3" dir="auto"><div class="flex w-full flex-col gap-1 empty:hidden"><div class="markdown prose dark:prose-invert w-full wrap-break-word light markdown-new-styling">Desde el punto de vista educativo, el NLP puede entenderse como **un conjunto de herramientas para analizar grandes cantidades de texto**. En un mundo donde cada día se generan millones de documentos, artículos y mensajes, estas técnicas permiten organizar la información, detectar patrones y extraer conocimiento.</div></div></div></div></div></div>Para el profesorado de asignaturas científicas o tecnológicas, explicar el NLP también puede ser una buena oportunidad para conectar **lingüística, estadística y computación**, mostrando cómo el lenguaje humano puede estudiarse y analizarse mediante modelos matemáticos y algoritmos.

#### De los Transformers a la IA generativa

Durante muchos años, las técnicas de **Procesamiento del Lenguaje Natural (NLP)** se centraron principalmente en analizar textos: clasificar documentos, detectar palabras clave o traducir frases sencillas. Sin embargo, la aparición de los **modelos basados en transformers** supuso un cambio profundo en este campo y abrió la puerta a lo que hoy conocemos como **IA generativa**.

El punto de inflexión llegó en 2017 con la publicación del artículo científico **“Attention is All You Need”**, donde se presentó la arquitectura de los **transformers**. Este tipo de modelos introdujo un mecanismo llamado **atención**, que permite analizar las relaciones entre todas las palabras de una frase al mismo tiempo. Gracias a esto, los sistemas pueden comprender mejor el contexto completo de un texto.

Un símil útil para entenderlo es imaginar que, cuando leemos una frase, no analizamos cada palabra de forma aislada. En realidad, nuestro cerebro conecta unas palabras con otras para comprender el significado global. El mecanismo de atención de los transformers intenta hacer algo parecido: **relacionar cada palabra con las demás para interpretar mejor el mensaje**.

Gracias a esta arquitectura, los modelos de lenguaje comenzaron a entrenarse con cantidades enormes de texto procedente de libros, artículos, páginas web o documentos. Durante el entrenamiento, el modelo aprende a **predecir la siguiente palabra dentro de una secuencia**, pero al hacerlo también aprende patrones complejos del lenguaje.

Este proceso dio lugar a los **Large Language Models (LLM)** o modelos de lenguaje de gran tamaño, como GPT, BERT, LLaMA o Gemini. Estos modelos no solo pueden analizar textos, sino también **generarlos**: redactar explicaciones, resumir información, traducir entre idiomas o mantener conversaciones.

Aquí es donde aparece el concepto de **IA generativa**. Mientras que los sistemas de IA tradicionales se centraban en clasificar o analizar información, los modelos actuales pueden **crear contenido nuevo** a partir de lo que han aprendido durante el entrenamiento.

Por ejemplo, un modelo generativo puede:

- redactar un texto explicativo
- generar código de programación
- crear preguntas para un examen
- producir imágenes a partir de descripciones
- sintetizar música o voz

Aunque estas aplicaciones parecen muy distintas, muchas de ellas comparten la misma idea fundamental: **aprender patrones en grandes conjuntos de datos y utilizarlos para generar nuevos resultados**.

En el ámbito educativo, esta evolución ha transformado las posibilidades de uso de la IA. Los modelos de lenguaje ya no solo sirven para analizar textos, sino que pueden actuar como **asistentes para generar materiales didácticos, ejemplos, explicaciones o actividades**.

No obstante, es importante recordar que estos sistemas no “piensan” ni comprenden el mundo como lo hacen las personas. Funcionan identificando patrones estadísticos en los datos con los que fueron entrenados. Por ello, sus resultados siempre deben interpretarse con sentido crítico.

En resumen, la combinación del **NLP tradicional con la arquitectura de los transformers** ha permitido el desarrollo de los actuales sistemas de **IA generativa**, capaces de producir texto, imágenes, audio o vídeo. mediante los llamados LLMs o modelos de lenguaje. Esta evolución representa uno de los avances más significativos de la inteligencia artificial en las últimas décadas y está teniendo un impacto directo en ámbitos como la educación, la ciencia o la comunicación.

#### Los Modelos de Lenguaje

##### Los modelos de lenguaje (LLM)

Los **Large Language Models (LLM)** son modelos de inteligencia artificial diseñados para comprender y generar lenguaje natural. Se entrenan con enormes cantidades de texto y utilizan redes neuronales basadas en la arquitectura **transformer** para aprender patrones del lenguaje y producir respuestas coherentes. Estos modelos pueden realizar tareas como responder preguntas, resumir documentos, traducir idiomas o generar código.

Aunque todos los LLM comparten principios tecnológicos similares, pueden clasificarse según distintos criterios: su grado de apertura, la forma en que se ejecutan y algunas características técnicas fundamentales.

##### Tipos de LLM según su acceso

**Modelos propietarios o cerrados**

Los modelos cerrados son desarrollados por empresas que no publican completamente el modelo ni los datos con los que se entrenó. Normalmente se utilizan mediante **APIs en la nube** o plataformas online.

Ejemplos conocidos incluyen modelos como GPT de OpenAI, Gemini de Google o Claude de Anthropic. Estos sistemas suelen ofrecer un rendimiento muy alto porque están entrenados con grandes infraestructuras de computación y enormes conjuntos de datos, pero su uso depende de las condiciones y servicios de la empresa que los desarrolla.

**Modelos abiertos**

Los modelos abiertos (open source u open weight) publican total o parcialmente sus parámetros para que puedan descargarse y ejecutarse localmente o modificarse.

Ejemplos de este tipo de modelos son Llama, Mistral o algunas versiones de Qwen. Estos modelos permiten a investigadores y desarrolladores experimentar con ellos, entrenarlos con nuevos datos o integrarlos en sistemas propios sin depender completamente de servicios externos.

##### Modelos online y modelos locales

**Modelos online**

Muchos LLM se utilizan **a través de internet mediante APIs**. El usuario envía una consulta al servidor del modelo y recibe una respuesta generada por el sistema.

Este enfoque tiene varias ventajas:

- no requiere hardware potente
- permite acceder a modelos muy grandes
- el proveedor se encarga de las actualizaciones

Sin embargo, también implica dependencia de internet, posibles costes por uso y menor control sobre los datos enviados.

**Modelos ejecutados localmente**

Los modelos abiertos pueden ejecutarse **directamente en un ordenador o servidor local**. Esto permite trabajar sin conexión a internet y mantener los datos dentro de la propia infraestructura.

Este enfoque es especialmente interesante para investigación, entornos educativos o aplicaciones que requieren mayor privacidad.

##### Parámetros técnicos importantes

Para comprender cómo funcionan los LLM conviene conocer algunos conceptos técnicos básicos.

**Tokens**

Los modelos de lenguaje no trabajan exactamente con palabras completas, sino con **tokens**, que son fragmentos de texto. Un token puede ser una palabra, una parte de palabra o incluso un signo de puntuación. Los modelos generan texto prediciendo el siguiente token más probable en una secuencia.

**Contexto**

El **context window** o ventana de contexto es la cantidad de tokens que el modelo puede analizar al mismo tiempo. Cuanto mayor es el contexto, más información puede tener en cuenta el modelo al generar una respuesta.

**Tokens de entrenamiento**

Los LLM se entrenan con cantidades gigantescas de texto, que pueden alcanzar **billones de tokens**. Cuantos más datos de entrenamiento tenga el modelo, mayor será su capacidad para aprender patrones complejos del lenguaje.

**Tamaño del modelo**

El tamaño de un LLM se mide normalmente por su número de **parámetros**, que son las variables internas de la red neuronal que el modelo ajusta durante el entrenamiento. En general, un mayor número de parámetros permite representar patrones más complejos, aunque también requiere más recursos computacionales.

#####  

##### Tabla de algunos LLM populares

<div class="TyagGW_tableContainer"><div class="group TyagGW_tableWrapper flex flex-col-reverse w-fit" tabindex="-1"><table class="w-fit min-w-(--thread-content-width)" data-end="4778" data-start="4168" style="width: 96.0714%;"><thead data-end="4228" data-start="4168"><tr data-end="4228" data-start="4168"><th class="" data-col-size="sm" data-end="4177" data-start="4168" style="width: 16.053%;">Modelo</th><th class="" data-col-size="sm" data-end="4202" data-start="4177" style="width: 24.8895%;">Empresa / Organización</th><th class="" data-col-size="sm" data-end="4209" data-start="4202" style="width: 16.4948%;">Tipo</th><th class="" data-col-size="md" data-end="4228" data-start="4209" style="width: 42.5626%;">Características</th></tr></thead><tbody data-end="4778" data-start="4259"><tr data-end="4323" data-start="4259"><td data-col-size="sm" data-end="4275" data-start="4259" style="width: 16.053%;">GPT (ChatGPT)</td><td data-col-size="sm" data-end="4284" data-start="4275" style="width: 24.8895%;">OpenAI</td><td data-col-size="sm" data-end="4294" data-start="4284" style="width: 16.4948%;">Cerrado</td><td data-col-size="md" data-end="4323" data-start="4294" style="width: 42.5626%;">Muy extendido, multimodal</td></tr><tr data-end="4390" data-start="4324"><td data-col-size="sm" data-end="4333" data-start="4324" style="width: 16.053%;">Gemini</td><td data-col-size="sm" data-end="4351" data-start="4333" style="width: 24.8895%;">Google DeepMind</td><td data-col-size="sm" data-end="4361" data-start="4351" style="width: 16.4948%;">Cerrado</td><td data-col-size="md" data-end="4390" data-start="4361" style="width: 42.5626%;">Multimodal, gran contexto</td></tr><tr data-end="4453" data-start="4391"><td data-col-size="sm" data-end="4400" data-start="4391" style="width: 16.053%;">Claude</td><td data-col-size="sm" data-end="4412" data-start="4400" style="width: 24.8895%;">Anthropic</td><td data-col-size="sm" data-end="4422" data-start="4412" style="width: 16.4948%;">Cerrado</td><td data-col-size="md" data-end="4453" data-start="4422" style="width: 42.5626%;">Fuerte enfoque en seguridad</td></tr><tr data-end="4509" data-start="4454"><td data-col-size="sm" data-end="4462" data-start="4454" style="width: 16.053%;">Llama</td><td data-col-size="sm" data-end="4469" data-start="4462" style="width: 24.8895%;">Meta</td><td data-col-size="sm" data-end="4479" data-start="4469" style="width: 16.4948%;">Abierto</td><td data-col-size="md" data-end="4509" data-start="4479" style="width: 42.5626%;">Muy usado en investigación</td></tr><tr data-end="4575" data-start="4510"><td data-col-size="sm" data-end="4520" data-start="4510" style="width: 16.053%;">Mistral</td><td data-col-size="sm" data-end="4533" data-start="4520" style="width: 24.8895%;">Mistral AI</td><td data-col-size="sm" data-end="4543" data-start="4533" style="width: 16.4948%;">Abierto</td><td data-col-size="md" data-end="4575" data-start="4543" style="width: 42.5626%;">Modelos eficientes y rápidos</td></tr><tr data-end="4638" data-start="4576"><td data-col-size="sm" data-end="4583" data-start="4576" style="width: 16.053%;">Qwen</td><td data-col-size="sm" data-end="4593" data-start="4583" style="width: 24.8895%;">Alibaba</td><td data-col-size="sm" data-end="4611" data-start="4593" style="width: 16.4948%;">Abierto / mixto</td><td data-col-size="md" data-end="4638" data-start="4611" style="width: 42.5626%;">Multilingüe y adaptable</td></tr><tr data-end="4700" data-start="4639"><td data-col-size="sm" data-end="4648" data-start="4639" style="width: 16.053%;">Falcon</td><td data-col-size="sm" data-end="4654" data-start="4648" style="width: 24.8895%;">TII</td><td data-col-size="sm" data-end="4664" data-start="4654" style="width: 16.4948%;">Abierto</td><td data-col-size="md" data-end="4700" data-start="4664" style="width: 42.5626%;">Popular en proyectos open source</td></tr><tr data-end="4778" data-start="4701"><td data-col-size="sm" data-end="4712" data-start="4701" style="width: 16.053%;">DeepSeek</td><td data-col-size="sm" data-end="4723" data-start="4712" style="width: 24.8895%;">DeepSeek</td><td data-col-size="sm" data-end="4733" data-start="4723" style="width: 16.4948%;">Abierto</td><td data-col-size="md" data-end="4778" data-start="4733" style="width: 42.5626%;">Alto rendimiento en código y razonamiento</td></tr></tbody></table>

</div></div></article></div>

# 1.6 Aplicaciones de procesamiento de lenguaje natural

#### Introducción al Procesamiento del Lenguaje Natural (NLP)

El **Procesamiento del Lenguaje Natural**, conocido como **NLP (Natural Language Processing)**, es una rama de la Inteligencia Artificial que se ocupa de desarrollar sistemas capaces de **analizar, interpretar y generar lenguaje humano**. Su objetivo es permitir que los ordenadores puedan trabajar con textos o con lenguaje hablado de una forma cada vez más cercana a cómo lo hacen las personas.

Para entenderlo de forma sencilla, podemos pensar que el NLP intenta resolver un problema muy concreto: **cómo hacer que una máquina entienda el lenguaje que usamos cada día**. Mientras que los ordenadores trabajan internamente con números y operaciones matemáticas, las personas nos comunicamos mediante palabras, frases y significados. El NLP actúa como un puente entre estos dos mundos.

Un símil útil es imaginar a un ordenador como si fuera **un lector que intenta aprender un idioma**. Al principio solo ve secuencias de palabras, pero a medida que analiza muchos textos empieza a reconocer patrones: qué palabras suelen aparecer juntas, cómo se construyen las frases o qué estructuras se utilizan para expresar una idea.

Durante muchos años, los sistemas de NLP se basaron en reglas lingüísticas y técnicas estadísticas relativamente simples. Por ejemplo, podían contar cuántas veces aparecía una palabra en un documento o identificar estructuras gramaticales básicas. Con el tiempo, estos métodos evolucionaron hacia modelos más complejos capaces de aprender directamente a partir de grandes cantidades de datos.

Hoy en día, gracias al desarrollo del **Machine Learning y las redes neuronales**, los sistemas de NLP pueden realizar tareas que antes parecían muy difíciles para una máquina. Entre ellas se encuentran la traducción automática, el análisis de sentimientos en textos, la clasificación de documentos o la generación de respuestas en lenguaje natural.

Estas tecnologías están presentes en muchas aplicaciones cotidianas. Los asistentes virtuales, los traductores automáticos, los buscadores de internet o los chatbots utilizan técnicas de procesamiento del lenguaje natural para interactuar con los usuarios.

En definitiva, el NLP busca que los ordenadores puedan **trabajar con el lenguaje humano de forma cada vez más eficaz**, permitiendo nuevas formas de interacción entre personas y sistemas informáticos. Este campo se ha convertido en una de las áreas más activas de la inteligencia artificial y está en la base de muchas de las herramientas digitales que utilizamos actualmente.

[![image.png](https://libros.catedu.es/uploads/images/gallery/2026-03/scaled-1680-/YToimage.png)](https://libros.catedu.es/uploads/images/gallery/2026-03/YToimage.png)

#### Aplicación del NLP en el entorno educativo desde la perspectiva del profesorado

El **Procesamiento del Lenguaje Natural (NLP)** ha transformado profundamente la forma en que los docentes pueden trabajar con la información en el aula. Si durante muchos años estas tecnologías se utilizaron principalmente para analizar textos o realizar traducciones automáticas, hoy los modelos de lenguaje permiten **generar contenidos, organizar información, diseñar actividades y analizar datos educativos**.

Para el profesorado, el NLP puede entenderse como una herramienta que permite **trabajar con el lenguaje y los contenidos educativos de forma flexible**, facilitando tareas que van desde la creación de materiales hasta el análisis de información académica.

#### Generación de contenidos en distintos formatos

Una de las aplicaciones más interesantes del NLP en educación es la capacidad de generar **contenidos educativos de diferentes tipos y formatos** a partir de una misma fuente de información.

A partir de un tema o de un texto, los sistemas de IA pueden ayudar al profesorado a crear explicaciones, ejemplos, actividades o incluso propuestas de recursos multimedia. Por ejemplo, un modelo de lenguaje puede generar el guion de un vídeo educativo, sugerir ideas para ilustraciones que acompañen una explicación o diseñar preguntas que luego se integren en un juego interactivo.

Esto permite que el profesor pueda transformar un mismo contenido en distintos formatos: texto explicativo, presentación visual, cuestionarios, juegos educativos o incluso simulaciones. De esta manera, el NLP actúa como una herramienta que facilita **la creación rápida de recursos didácticos adaptados a diferentes metodologías de enseñanza**.

#### Apoyo en la presentación y organización de contenidos

Otra aplicación importante del NLP es el apoyo en la **organización y presentación de contenidos educativos**. Los modelos de lenguaje pueden ayudar a estructurar un tema, generar esquemas o identificar las ideas principales de un documento.

Esto resulta especialmente útil cuando el profesorado trabaja con grandes cantidades de información o con textos complejos que necesitan ser reorganizados para su uso en el aula. Por ejemplo, un docente puede utilizar estas herramientas para transformar un artículo científico en una explicación accesible para estudiantes de secundaria, o para crear una secuencia didáctica a partir de varios documentos.

En este sentido, el NLP funciona como un asistente que ayuda a **ordenar la información y convertirla en materiales más claros y estructurados**.

#### Generación de evaluaciones y actividades de aprendizaje

Las tecnologías basadas en NLP también pueden ayudar al profesorado a diseñar **actividades de evaluación y aprendizaje** de diferentes tipos.

A partir de un tema o de un documento, los sistemas pueden generar preguntas tipo test, ejercicios de comprensión, actividades de reflexión o propuestas de debate. También pueden sugerir diferentes niveles de dificultad o crear variantes de una misma prueba para adaptarla a distintos grupos de estudiantes.

Además, el NLP puede utilizarse para diseñar actividades más dinámicas, como juegos de preguntas, escenarios de simulación o actividades interactivas. Esto permite que la evaluación no se limite únicamente a exámenes tradicionales, sino que incorpore **diferentes formas de comprobar el aprendizaje**.

#### Análisis de información académica

Otra línea de aplicación del NLP en educación consiste en el **análisis de información académica y documental**. Las herramientas basadas en procesamiento del lenguaje permiten analizar grandes cantidades de texto, identificar patrones o extraer información relevante.

Por ejemplo, pueden utilizarse para analizar trabajos escritos, resumir documentos extensos o detectar los conceptos clave dentro de un conjunto de textos. También pueden ayudar a comparar diferentes fuentes de información o a organizar bibliografía relacionada con un tema.

En el ámbito educativo, esto puede resultar útil para el profesorado cuando trabaja con artículos científicos, materiales de investigación o documentos curriculares, ya que permite **explorar grandes volúmenes de información de forma más eficiente**.

#### Una herramienta transversal para el trabajo docente

En conjunto, el NLP puede convertirse en una herramienta transversal que apoye distintas dimensiones del trabajo docente: la creación de contenidos, la organización de materiales, el diseño de actividades y el análisis de información académica.

Desde esta perspectiva, los modelos de lenguaje no sustituyen el criterio pedagógico del profesorado, pero sí pueden actuar como **un asistente que ayuda a explorar ideas, generar recursos y estructurar información**.

Utilizadas de forma crítica y reflexiva, estas tecnologías pueden contribuir a enriquecer la práctica docente y a facilitar nuevas formas de enseñanza adaptadas a un entorno educativo cada vez más digital y multimodal.

# 1.7 Agentes: herramientas, memoria y planificación

En los últimos años ha comenzado a hablarse cada vez más de **agentes de inteligencia artificial**. Aunque el término puede sonar técnico, la idea es bastante sencilla: un agente es un sistema de IA que no solo responde a una pregunta, sino que **puede realizar varias acciones para resolver una tarea más compleja**.

Una forma fácil de entenderlo es compararlo con un **asistente que trabaja por pasos**. Mientras que un chatbot tradicional responde a una pregunta concreta, un agente puede organizar una serie de acciones: buscar información, analizarla, utilizar herramientas externas y finalmente generar una respuesta.

Desde el punto de vista educativo, esto abre posibilidades interesantes, ya que estos sistemas pueden actuar como **asistentes más completos para tareas relacionadas con el aprendizaje, la investigación o la preparación de materiales**.

#### De conversar a actuar: el siguiente paso natural

En la sección anterior hemos visto cómo los **chatbots** y los **asistentes** utilizan el **Procesamiento del Lenguaje Natural (NLP)** para conversar con personas, responder preguntas y ofrecer ayuda contextual. Sin embargo, en los últimos años ha aparecido un nuevo concepto que marca un cambio profundo en la forma en que interactuamos con la Inteligencia Artificial: **los agentes**.

Un **agente de IA** no se limita a generar respuestas en lenguaje natural. Su rasgo distintivo es que **tiene un objetivo** y es capaz de **actuar para alcanzarlo**, utilizando herramientas, recordando información relevante y planificando una secuencia de pasos. Esta capacidad convierte a los agentes en sistemas mucho más potentes… y también más delicados desde el punto de vista educativo.

#### **Qué define realmente a un agente de IA**

Un agente puede entenderse como la combinación de tres elementos clave:

1. **Un modelo de lenguaje** que le permite razonar de forma aproximada y comunicarse.
2. **Un conjunto de herramientas** que le permiten interactuar con el mundo digital.
3. **Un sistema de memoria y planificación** que le permite mantener coherencia y avanzar hacia un objetivo.

La diferencia fundamental respecto a un asistente es que el agente **no espera instrucciones paso a paso**. Una vez definido el objetivo, decide qué hacer, en qué orden y con qué recursos.

En educación, esta diferencia es crítica:  
un agente no solo apoya el aprendizaje, **puede influir en cómo se desarrolla**.

#### Uso de herramientas

Uno de los elementos clave de los agentes es la capacidad de utilizar **herramientas externas**. Un agente puede conectarse a diferentes servicios o recursos para completar una tarea.

Por ejemplo, puede:

- consultar información en internet
- analizar un documento
- generar una gráfica
- ejecutar código
- crear una simulación

En el aula, esto significa que un sistema de IA podría ayudar al alumnado a **explorar un problema desde distintas perspectivas**. Por ejemplo, ante una pregunta sobre el cambio climático, el agente podría buscar datos, generar una visualización y explicar el fenómeno paso a paso.

Para el profesorado, esto también abre la posibilidad de diseñar actividades en las que el alumnado utilice la IA no solo para obtener respuestas, sino para **investigar, contrastar información y construir explicaciones más completas**.

#### Memoria

Otro aspecto importante de los agentes es la **memoria**. Mientras que muchos sistemas de IA tradicionales responden únicamente a una interacción concreta, los agentes pueden mantener cierta memoria del contexto o de interacciones anteriores.

Podemos imaginarlo como un profesor que recuerda lo que se ha trabajado en clases anteriores. Gracias a esa memoria, puede adaptar sus explicaciones o retomar un tema desde el punto donde se dejó.

En sistemas educativos basados en IA, la memoria podría permitir que el asistente recuerde qué temas ha trabajado el alumno, qué dudas ha planteado o qué tipo de ejercicios le resultan más difíciles. Esto permitiría desarrollar herramientas más cercanas a un **acompañamiento personalizado del aprendizaje**.

#### Planificación

El tercer elemento fundamental es la **planificación**. Un agente puede descomponer una tarea compleja en varios pasos y ejecutarlos de forma organizada.

Por ejemplo, si se le pide investigar un tema, podría seguir un proceso como este:

1. Buscar información relevante.
2. Analizar los documentos encontrados.
3. Resumir los conceptos principales.
4. Generar una explicación adaptada al nivel del alumno.

Este tipo de funcionamiento se parece bastante al proceso que seguimos cuando realizamos una investigación o cuando preparamos una clase. Por eso, desde la perspectiva educativa, los agentes pueden convertirse en herramientas interesantes para **organizar tareas complejas y estructurar procesos de aprendizaje**.

#### Posibilidades en el aula

Para el profesorado, los agentes de IA no deben entenderse como sustitutos del trabajo docente, sino como **herramientas que pueden ampliar las posibilidades del aprendizaje**.

Por ejemplo, podrían utilizarse para:

- crear asistentes que ayuden a explorar un tema paso a paso
- diseñar actividades de investigación guiada
- generar simulaciones o análisis de datos
- apoyar proyectos educativos complejos

También pueden servir para enseñar al alumnado cómo trabajar con sistemas de IA de forma crítica, comprendiendo sus capacidades y sus limitaciones.

En definitiva, los agentes representan un paso más en la evolución de la inteligencia artificial: sistemas que no solo generan respuestas, sino que **pueden organizar acciones, utilizar herramientas y colaborar en la resolución de problemas**. En el contexto educativo, esto abre nuevas posibilidades para diseñar experiencias de aprendizaje más exploratorias, interactivas y adaptadas al contexto del aula.

[![image.png](https://libros.catedu.es/uploads/images/gallery/2026-03/scaled-1680-/ydzimage.png)](https://libros.catedu.es/uploads/images/gallery/2026-03/ydzimage.png)

<div class="no-scrollbar flex min-h-36 flex-nowrap gap-0.5 overflow-auto sm:gap-1 sm:overflow-hidden xl:min-h-44 mt-1 mb-5 [&:not(:first-child)]:mt-4" id="bkmrk-cuando-la-ia-deja-de-1"><div class="border-token-border-default relative w-32 shrink-0 overflow-hidden rounded-xl border-[0.5px] md:shrink max-h-64 sm:w-[calc((100%-0.5rem)/3)] rounded-s-xl"><div>  
</div><div class="align-center">*Cuando la IA deja de responder y empieza a actuar*</div></div></div><div class="align-center" id="bkmrk--6"></div><div class="no-scrollbar flex min-h-36 flex-nowrap gap-0.5 overflow-auto sm:gap-1 sm:overflow-hidden xl:min-h-44 mt-1 mb-5 [&:not(:first-child)]:mt-4" id="bkmrk--7"><div class="border-token-border-default relative w-32 shrink-0 overflow-hidden rounded-xl border-[0.5px] md:shrink max-h-64 sm:w-[calc((100%-0.5rem)/3)] rounded-e-xl">  
</div></div>#### Ejemplos educativos de agentes

En contextos educativos, los agentes pueden utilizarse con mucho valor si se diseñan con cuidado:

- **Agentes tutores** que acompañan el estudio autónomo, proponiendo preguntas y pistas en lugar de respuestas directas.
- **Agentes de proyecto** que ayudan a organizar tareas largas, recordando plazos y criterios.
- **Agentes de apoyo al profesorado** que recopilan información, analizan datos o preparan borradores.
- **Agentes de simulación** en FP, que recrean situaciones profesionales complejas y reaccionan a las decisiones del alumnado.

En todos los casos, el agente **no sustituye al docente**, sino que amplía su capacidad de acompañamiento.

#### Riesgos específicos de los agentes en educación

Precisamente por su potencia, los agentes plantean riesgos que no aparecen con simples chatbots:

- Pueden tomar demasiadas decisiones por el alumnado o el profesorado.
- Pueden reducir la autonomía si se usan sin límites.
- Pueden generar dependencia.
- Pueden actuar sobre información sensible si no se controla su acceso a herramientas y memoria.

Por eso, el uso educativo de agentes exige:

- objetivos muy claros,
- límites técnicos bien definidos,
- supervisión humana constante,
- reflexión pedagógica previa.

#### Herramientas y entornos para gestión de agentes

En el ecosistema actual de la inteligencia artificial están apareciendo cada vez más **herramientas y entornos que permiten crear y utilizar agentes**. Estos sistemas facilitan que los modelos de lenguaje no se limiten a responder preguntas, sino que puedan **organizar tareas, utilizar herramientas externas y ejecutar procesos de forma automática**.

Para entenderlo de forma sencilla, podemos imaginar estos entornos como **plataformas que permiten construir asistentes inteligentes más complejos**, capaces de realizar varias acciones encadenadas. En lugar de un simple *chatbot* que responde a una pregunta, estos sistemas permiten diseñar agentes que investigan información, utilizan aplicaciones externas, analizan datos o generan resultados a partir de varios pasos.

Desde el punto de vista educativo o profesional, no es necesario dominar todas estas herramientas para comprender el concepto. Lo importante es entender **qué tipo de capacidades hacen posibles**.

En paralelo al desarrollo de frameworks técnicos para crear agentes de IA, han aparecido numerosas **plataformas visuales o de bajo código (low-code / no-code)** que permiten construir sistemas basados en agentes sin necesidad de conocimientos avanzados de programación.

Estas herramientas están diseñadas para que los usuarios puedan **definir objetivos, conectar fuentes de información y automatizar procesos mediante interfaces gráficas**, donde las acciones se organizan en forma de flujos de trabajo o bloques funcionales.

Desde la perspectiva educativa, esto es especialmente interesante porque permite experimentar con el concepto de agentes sin entrar necesariamente en aspectos técnicos complejos.

##### Automatización basada en agentes

Además de los entornos de desarrollo tradicionales, están apareciendo herramientas orientadas a la **automatización de tareas mediante agentes**. En estos sistemas, la inteligencia artificial se utiliza para coordinar procesos que antes requerían intervención humana constante.

Por ejemplo, un agente puede automatizar tareas como:

- recopilar información de distintas fuentes
- analizar documentos
- generar informes
- organizar datos
- ejecutar procesos repetitivos

En muchos casos, estos sistemas combinan **modelos de lenguaje con herramientas externas**, como bases de datos, servicios web o aplicaciones de análisis. El agente interpreta una solicitud, decide qué herramientas utilizar y ejecuta los pasos necesarios para completar la tarea.

---

##### Plataformas visuales para crear agentes

Entre las herramientas que permiten crear agentes sin necesidad de programación destacan varias plataformas que utilizan **interfaces visuales o sistemas de automatización**.

**<span class="hover:entity-accent entity-underline inline cursor-pointer align-baseline"><span class="whitespace-normal">n8n</span></span>**  
Es una plataforma de automatización de flujos de trabajo que permite conectar diferentes aplicaciones, servicios web y modelos de IA. Los procesos se construyen mediante nodos visuales que representan acciones o herramientas. En combinación con modelos de lenguaje, puede utilizarse para crear agentes que analicen información, generen contenido o ejecuten tareas automáticas.

**<span class="hover:entity-accent entity-underline inline cursor-pointer align-baseline"><span class="whitespace-normal">Flowise</span></span>**  
Permite crear agentes conectando modelos de lenguaje, herramientas y bases de datos mediante una interfaz gráfica. Está especialmente orientado a construir aplicaciones basadas en IA sin necesidad de escribir código.

**<span class="hover:entity-accent entity-underline inline cursor-pointer align-baseline"><span class="whitespace-normal">Langflow</span></span>**  
Ofrece una interfaz visual para trabajar con componentes de modelos de lenguaje y agentes, permitiendo construir flujos de trabajo de forma gráfica.

**<span class="hover:entity-accent entity-underline inline cursor-pointer align-baseline"><span class="whitespace-normal">Dust</span></span>**  
Está orientado a crear asistentes que trabajan con documentos y bases de conocimiento. Permite diseñar agentes que consultan información y generan respuestas estructuradas.

**<span class="hover:entity-accent entity-underline inline cursor-pointer align-baseline"><span class="whitespace-normal">Zapier</span></span>**  
Tradicionalmente conocido por la automatización entre aplicaciones, ahora incorpora capacidades de IA que permiten crear agentes capaces de gestionar tareas automáticas entre diferentes servicios.

**<span class="hover:entity-accent entity-underline inline cursor-pointer align-baseline"><span class="whitespace-normal">Make</span></span>**  
Otra plataforma de automatización visual que permite conectar aplicaciones y crear flujos de trabajo complejos. Con la integración de modelos de lenguaje, estos flujos pueden comportarse como agentes que interpretan información y ejecutan acciones.

Este tipo de plataformas permite crear sistemas en los que la inteligencia artificial actúa como **coordinadora de procesos**. En lugar de limitarse a responder preguntas, el agente puede:

- buscar información en varias fuentes
- analizar documentos o datos
- generar contenido o informes
- activar procesos en otras aplicaciones
- organizar información automáticamente

En esencia, el agente funciona como un **intermediario inteligente entre distintas herramientas y fuentes de información**.

El campo de los agentes de IA está evolucionando muy rápidamente y aparecen nuevas herramientas con frecuencia. Sin embargo, desde el punto de vista conceptual lo importante es comprender la idea central: los agentes permiten que los modelos de IA **pasen de responder preguntas a ejecutar procesos más complejos**.

En el ámbito educativo, entender esta evolución puede ser especialmente interesante, ya que abre la puerta a nuevas formas de trabajar con la información, automatizar tareas o diseñar experiencias de aprendizaje más interactivas.

[![image.png](https://libros.catedu.es/uploads/images/gallery/2026-03/scaled-1680-/qD6image.png)](https://libros.catedu.es/uploads/images/gallery/2026-03/qD6image.png)

*Web de la herramienta n8n que facilita la automatización sin código*

#### Plataformas avanzadas para construir agentes

Existen distintos entornos de desarrollo que permiten crear agentes conectando modelos de lenguaje con herramientas, datos y procesos.

Muchos de ellos requieren un conocimiento técnico que queda fuera del objeto de este curso. Sin embargo queremos hacer una mención a los mismos por completar el contenido de esta sección.

Por ejemplo, **LangChain** es uno de los *frameworks* más conocidos para construir aplicaciones basadas en modelos de lenguaje. Permite conectar un modelo con documentos, bases de datos o APIs y crear sistemas que ejecutan diferentes pasos para resolver una tarea.

Otro entorno muy utilizado es **LlamaIndex**, que está orientado especialmente a conectar modelos de lenguaje con colecciones de documentos o bases de conocimiento. Esto permite crear agentes que pueden buscar información en grandes conjuntos de datos antes de generar una respuesta.

También han aparecido proyectos experimentales como **Auto-GPT**, que exploran la idea de agentes capaces de organizar tareas de forma más autónoma. En estos sistemas el agente puede dividir un objetivo en varias subtareas y ejecutarlas de forma progresiva.

En la misma línea encontramos herramientas como **CrewAI**, que permiten crear varios agentes que colaboran entre sí. Cada agente puede tener un rol distinto (investigador, analista, redactor, etc.), y el sistema coordina su trabajo para alcanzar un objetivo común.

Por otro lado, **Semantic Kernel**, desarrollado inicialmente por Microsoft, es un entorno que permite integrar modelos de lenguaje dentro de aplicaciones y automatizar tareas mediante agentes.

#### *Agentic* AI y sistemas multiagente

En la evolución reciente de la inteligencia artificial ha comenzado a utilizarse cada vez más el concepto de **Agentic AI**. Este término hace referencia a sistemas de IA que no solo generan respuestas, sino que **actúan de forma más autónoma para alcanzar objetivos**, utilizando herramientas, memoria y planificación.

En lugar de limitarse a responder a una pregunta concreta, estos sistemas pueden organizar una serie de pasos para completar una tarea. Por ejemplo, pueden buscar información, analizar documentos, generar un informe y presentar un resultado final. Este enfoque se aproxima más a la idea de un **asistente que ejecuta procesos completos**, no solo a un modelo que produce texto.

Una evolución natural de este enfoque son los **sistemas multiagente**, en los que varios agentes trabajan de forma coordinada. Cada agente puede tener un rol específico dentro del sistema: uno puede encargarse de buscar información, otro de analizarla y otro de generar una explicación o un informe final.

Podemos imaginarlo como un pequeño equipo de trabajo donde cada miembro tiene una función distinta y todos colaboran para resolver un problema.

En el ámbito educativo, este tipo de sistemas puede resultar interesante para diseñar entornos donde la IA ayude a **investigar información, organizar contenidos o simular procesos complejos**. Sin embargo, al igual que ocurre con otras tecnologías de inteligencia artificial, su uso debe estar siempre orientado a apoyar el aprendizaje y no a sustituir el proceso educativo.

[![image.png](https://libros.catedu.es/uploads/images/gallery/2026-03/scaled-1680-/Snkimage.png)](https://libros.catedu.es/uploads/images/gallery/2026-03/Snkimage.png)

#### CONCLUSIONES

Los **agentes de inteligencia artificial** representan un paso más en la evolución de la IA aplicada al ámbito educativo. Frente a los sistemas anteriores, que se limitaban principalmente a responder preguntas o generar textos, los agentes introducen nuevas capacidades: pueden **organizar tareas, utilizar herramientas externas, recordar información relevante y planificar procesos para alcanzar un objetivo**.

Esto supone un cambio importante en la forma en que interactuamos con la tecnología. La IA deja de ser únicamente un sistema que produce respuestas y pasa a convertirse en una herramienta capaz de **participar en procesos más complejos**, como buscar información, analizar documentos o coordinar diferentes acciones.

Sin embargo, precisamente por esa mayor capacidad, los agentes deben utilizarse **con especial sentido pedagógico** cuando se incorporan al entorno educativo.

En el aula, estas tecnologías no pueden entenderse como sustitutos del aprendizaje humano ni del criterio del profesorado. El objetivo no es delegar el proceso educativo en la máquina, sino aprovechar sus capacidades para **apoyar, enriquecer y ampliar las experiencias de aprendizaje**.

Podríamos expresarlo con una idea sencilla:  
**las máquinas pueden planificar acciones, pero la educación tiene como finalidad formar personas**.

Por ello, el valor de los agentes en educación depende en gran medida de cómo se diseñen y utilicen. Cuando se integran con objetivos claros, con límites bien definidos y con una orientación pedagógica adecuada, pueden convertirse en **herramientas valiosas para investigar, explorar información o automatizar tareas de apoyo**.

En cambio, si se utilizan sin reflexión didáctica, el problema no será tecnológico, sino educativo. La clave no está únicamente en la potencia de la herramienta, sino en **cómo se integra dentro del proceso de enseñanza y aprendizaje**.

Desde esta perspectiva, los agentes de IA deben entenderse como un nuevo recurso dentro del ecosistema educativo: una tecnología con grandes posibilidades, pero cuyo verdadero valor dependerá siempre del **criterio pedagógico con el que se utilice en el aula**.

[![image.png](https://libros.catedu.es/uploads/images/gallery/2026-03/scaled-1680-/uyjimage.png)](https://libros.catedu.es/uploads/images/gallery/2026-03/uyjimage.png)

*Un esquema general del panorama actual incluyendo la tecnología agéntica*