1.5 Modelos de Lenguaje, tipos y aplicaciones

1.5
En Entenderlos yúltimos años, una de las áreas de la Inteligencia Artificial que más ha avanzado es la relacionada con el lenguaje humano. Los sistemas actuales son capaces de leer textos, resumir información, traducir entre idiomas o responder preguntas de forma bastante natural. Este conjunto de tecnologías se conoce como Procesamiento del Lenguaje Natural, o Natural Language Processing (NLP).

Para entenderlo de forma sencilla, podemos pensar en estos sistemas como lectores muy rápidos que han leído millones de textos. A partir de ese entrenamiento, aprenden cómo suelen aparecer las palabras juntas, qué estructuras tienen las frases o cómo se organizan las ideas en un texto.

Un símil útil para explicarlo es el de un estudiante que ha leído muchos libros. Con el tiempo, ese estudiante empieza a reconocer patrones: sabe cómo se construyen las frases, cómo se explican ciertos conceptos o qué palabras suelen aparecer en determinados contextos. Los modelos de lenguaje funcionan de una forma similar, aunque a una escala mucho mayor.

Por ejemplo, cuando utilizamos un sistema como ChatGPT para pedir un resumen de un texto o para generar una explicación de un concepto, el modelo no está “pensando” en el sentido humano. Lo que hace es predecir qué palabras tienen más probabilidad de aparecer a continuación en una frase, basándose en los patrones que aprendió durante su entrenamiento.

Este tipo de modelos se conocen como modelos de lenguaje porque están diseñados precisamente para trabajar con lenguaje. Su tarea básica consiste en predecir la siguiente palabra dentro de una secuencia de texto, pero a partir de esta capacidad básica se pueden construir muchas aplicaciones diferentes: traducción automática, asistentes conversacionales, análisis de textos o generación de contenido.

En el ámbito educativo, estas herramientas pueden utilizarse para explicar conceptos, generar ejemplos, resumir textos o apoyar la elaboración de materiales didácticos. Sin embargo, también es importante recordar que los modelos de lenguaje no comprenden el mundo como lo hace una persona. Su conocimiento se basa en patrones estadísticos aprendidos a partir de grandes cantidades de datos.

Por ello, una buena forma de trabajar con estas herramientas en el aula es entenderlas como un asistente que ayuda a explorar el lenguaje

y la información, pero cuyo resultado siempre debe ser revisado críticamente por el usuario. De esta manera, los modelos de lenguaje pueden convertirse en una herramienta interesante para apoyar el aprendizaje y al mismo tiempo reflexionar sobre cómo funcionan los sistemas actuales de Inteligencia Artificial.

Procesamiento del Lenguaje Natural (NLP): del conteo de palabras a los modelos de lenguaje

El lenguaje como dato: un reto central de la IA

El lenguaje humano es, probablemente, el tipo de información más complejo con el que trabajamos en educación. No solo transmite información, sino también intención, matices, emociones, ironía y contexto cultural. Durante mucho tiempo, esta complejidad hizo que el lenguaje fuera un terreno especialmente difícil para la Inteligencia Artificial.

El Procesamiento del Lenguaje Natural, conocido habitualmente como NLP (~~NLP)~~Natural Language Processing), ~~surge~~es ~~precisamente~~la rama de la Inteligencia Artificial que se ocupa de que los ordenadores puedan analizar, comprender y trabajar con textos escritos o hablados en lenguaje humano.

Podemos imaginarlo como el conjunto de técnicas que permiten a una máquina hacer tareas que normalmente asociamos a la lectura o al análisis del lenguaje. Por ejemplo, identificar las palabras importantes de un texto, clasificar documentos, detectar el tema principal de un artículo o responder preguntas.

Un símil útil para ~~abordar~~entenderlo ~~este~~en ~~reto:~~el ~~permitir~~aula es el de un profesor que ~~las~~corrige ~~máquinas~~muchos ~~analicen,~~exámenes. ~~clasifiquen,~~Con ~~comparen,~~el ~~transformen~~tiempo, el profesor aprende a reconocer rápidamente ciertas palabras clave o ~~generen~~estructuras ~~textos~~que indican si el alumno ha entendido el tema. Los sistemas de ~~forma~~NLP ~~automática.~~hacen ~~Como~~algo yaparecido: ~~hemos~~analizan ~~visto~~los textos buscando patrones que permitan interpretar su contenido.

Algunas técnicas clásicas de NLP

Antes de la aparición de los modelos actuales, muchas aplicaciones de procesamiento del lenguaje se basaban en ~~capítulos~~métodos ~~anteriores,~~estadísticos larelativamente ~~clave está en aceptar una idea fundamental:~~
~~las máquinas~~ ~~no entienden el lenguaje~~simples, pero ~~pueden~~muy ~~trabajar con él~~ ~~si lo transformamos adecuadamente.~~útiles.

Antes
Uno de “entender”, hay que contar: el lenguaje convertido en números

~~El primer paso en cualquier sistema de NLP es siempre el mismo:~~ ~~convertir el texto en números~~.
~~Una máquina no ve frases ni ideas; ve vectores numéricos. La historia del NLP es, en buena medida, la historia de~~ ~~cómo representar el lenguaje de forma numérica~~.

~~Durante muchos años,~~ los ~~enfoques~~algoritmos más ~~eficaces no fueron modelos complejos, sino métodos relativamente sencillos basados en una idea muy intuitiva:~~

~~las palabras que aparecen muchas veces en un texto nos dicen algo sobre ese texto~~.

~~Aquí~~conocidos es ~~donde entran en juego técnicas clásicas como~~ ~~Bag of Words~~ ~~y, sobre todo,~~ TF-IDF.

~~TF-IDF: una idea simple con un impacto enorme~~

~~TF-IDF~~ (Term Frequency – Inverse Document ~~Frequency~~)Frequency). esEsta ~~uno~~técnica dese ~~los~~utiliza ~~conceptos~~para identificar las palabras más importantes ~~del~~dentro ~~NLP~~de ~~clásico~~un ~~y sigue siendo~~ ~~muy útil hoy en día~~~~, incluso en sistemas modernos.~~documento.

La idea es ~~sorprendentemente~~bastante ~~sencilla:~~intuitiva. Si una palabra aparece muchas veces en un texto, probablemente sea relevante para ese documento. Pero si esa misma palabra aparece en todos los documentos de una colección (por ejemplo “el”, “la” o “de”), entonces su valor informativo es menor.

TF-IDF combina estas dos ideas para calcular qué palabras son realmente significativas dentro de un texto. Este tipo de técnica se ha utilizado durante años en aplicaciones como:

buscadores de documentos

sistemas de recomendación

clasificación automática de textos

detección de temas en grandes colecciones de documentos

En el ámbito educativo, este tipo de algoritmos se pueden explicar fácilmente con ejemplos sencillos, como analizar qué palabras caracterizan un artículo científico o un texto periodístico.

Otras tareas habituales del NLP

A partir de estas técnicas se desarrollaron muchas aplicaciones prácticas. Algunas de las más conocidas son:

TFClasificación ~~(frecuencia~~de ~~del~~textos, ~~término)~~por ejemplo para identificar si un mensaje es spam o no.

Análisis de sentimiento, ~~mide~~utilizado ~~cuántas~~para ~~veces~~detectar ~~aparece~~si una ~~palabra~~opinión enes positiva o negativa.

Extracción de información, que permite localizar nombres, fechas o lugares dentro de un texto.
~~IDF~~Resumen ~~(frecuencia~~automático, ~~inversa~~donde enel ~~documentos)~~sistema ~~reduce~~identifica lalas ~~importancia~~frases más importantes de ~~las~~un ~~palabras que aparecen en muchos textos distintos.~~documento.

~~resultado~~

~~que:~~

~~palabras~~Durante ~~muy~~muchos ~~frecuentes~~años, ~~pero~~estas ~~poco informativas (“el”, “de”, “y”) pesan poco,~~

~~palabras menos frecuentes pero más específicas pesan mucho.~~

~~En lugar de preguntarse~~ ~~“¿qué significa esta palabra?”~~~~, el sistema~~tareas se ~~pregunta:~~
resolvieron combinando ~~“¿qué~~estadística, ~~palabras~~lingüística ~~distinguen~~y ~~este~~reglas ~~texto~~programadas manualmente.

La revolución de los demás?”modelos Transformers

Sin

Unembargo, ejemploel educativocampo muydel claro

NLP ha experimentado una auténtica revolución desde la aparición de una nueva arquitectura de modelos llamada Transformers, presentada en 2017 en el famoso artículo “Attention is All You Need”.

~~Imaginemos~~Los modelos basados en transformers son capaces de analizar el contexto completo de una frase y comprender mejor las relaciones entre palabras. Gracias a esta arquitectura se han desarrollado los actuales modelos de lenguaje de gran tamaño (LLM), como GPT, Gemini o Claude.

Esto ha permitido que ~~tenemos~~muchas ~~redacciones~~tareas de ~~alumnado~~procesamiento ~~sobre~~del ~~distintos~~lenguaje ~~temas:~~que ~~cambio~~antes ~~climático,~~requerían ~~redes~~sistemas ~~sociales~~complejos y ~~deporte.~~
Laespecíficos ~~palabra~~ahora ~~“clima”~~puedan ~~aparecerá~~resolverse ~~muchas~~con ~~veces en textos sobre medioambiente, pero muy poco en los demás.~~
~~TF-IDF asignará a esa palabra~~ un ~~peso~~único ~~alto~~modelo encapaz ~~esos~~de ~~textos,~~realizar ~~porque~~múltiples ~~ayuda~~tareas: atraducir, ~~distinguir~~resumir, elresponder ~~tema~~.preguntas o generar texto.

En ~~cambio,~~otras ~~palabras como~~ ~~“persona”~~ o ~~“importante”~~ ~~aparecerán en casi todos los textos y, aunque sean frecuentes,~~ ~~no ayudan a diferenciar~~~~. TF-IDF les asignará un peso bajo.~~

~~Así, cada texto se convierte en un~~ ~~vector numérico~~ ~~que representa su contenido de forma aproximada, pero útil.~~

Aplicaciones reales de TF-IDF en educación

~~Aunque hoy hablemos mucho de modelos profundos y LLMs,~~palabras, técnicas clásicas como TF-IDF o los modelos estadísticos tradicionales siguen ~~teniendo~~siendo ~~aplicaciones~~importantes ~~muy~~para ~~prácticas~~entender los fundamentos del NLP, pero los modelos actuales basados en ~~contextos~~transformers ~~educativos.~~

han

~~Algunos~~ampliado ~~ejemplos~~enormemente nolas ~~triviales:~~

~~Detección~~capacidades de ~~temas~~los ~~predominantes en documentos largos~~
~~Analizar qué conceptos aparecen con mayor peso en un proyecto o memoria.~~

~~Análisis~~sistemas de ~~encuestas abiertas~~
~~Extraer palabras clave y tendencias en respuestas abiertas de alumnado o familias.~~lenguaje.

~~Búsqueda~~

~~inteligente~~

~~repositorios~~
~~educativos~~
~~Encontrar~~

~~documentos~~

~~relevantes~~

~~solo por coincidencia literal, sino por peso semántico aproximado.~~

~~Primer filtrado previo a modelos más complejos~~
~~Reducir ruido y volumen de datos antes de aplicar Deep Learning.~~

Desde el punto de vista ~~docente, TF-IDF tiene una ventaja clara:~~ ~~es interpretable~~.
~~Podemos explicar por qué una palabra pesa más que otra, algo mucho más difícil en modelos profundos.~~

Del conteo a la relación: el salto conceptual del NLP moderno

~~Las técnicas clásicas como TF-IDF no capturan relaciones profundas entre palabras. No saben que~~ ~~“profesor”~~ y ~~“docente”~~ ~~están relacionados, ni que~~ ~~“aprender”~~ y ~~“estudiar”~~ ~~se parecen en significado.~~

~~Aquí es donde~~educativo, el NLP ~~moderno~~puede daentenderse ~~el salto gracias al~~como ~~Deep~~un ~~Learning~~conjunto de herramientas para analizar grandes cantidades de texto. En ~~lugar~~un mundo donde cada día se generan millones de ~~representar~~documentos, ~~palabras~~artículos ~~solo~~y ~~por~~mensajes, suestas ~~frecuencia,~~técnicas ~~los~~permiten ~~modelos~~organizar ~~aprenden~~la ~~representaciones~~información, ~~distribuidas~~detectar ~~que~~patrones ~~capturan~~y ~~relaciones~~extraer conocimiento.

Para el profesorado de ~~contexto.~~asignaturas ~~Palabras~~científicas ~~que~~o ~~aparecen~~tecnológicas, ~~en contextos similares acaban teniendo representaciones numéricas similares.~~

~~Sin embargo —y esto es importante para el aula—,~~explicar el NLP ~~moderno~~también puede ser una buena oportunidad para conectar nolingüística, ~~sustituye completamente~~ ~~a técnicas como TF-IDF. En muchos casos:~~

~~TF-IDF es suficiente,~~

~~es más rápido,~~

~~más transparente,~~

~~y más fácil de justificar pedagógicamente.~~

NLP clásicoestadística y NLPcomputación, profundo:mostrando una convivencia necesaria

~~Desde una perspectiva educativa, es útil entender~~cómo el ~~NLP como una~~ ~~evolución~~~~, no como una ruptura.~~

~~Primero, contamos palabras (frecuencia).~~

~~Luego, ponderamos su importancia (TF-IDF).~~

~~Después, aprendemos relaciones entre palabras (modelos profundos).~~

~~Finalmente, generamos~~ lenguaje ~~(LLMs).~~
humano

puede

~~Cada nivel añade potencia, pero también complejidad~~estudiarse y ~~opacidad.~~analizarse Enmediante ~~educación,~~modelos ~~no siempre interesa llegar al último nivel~~.

NLPmatemáticos y aprendizaje humano: un espejo imperfecto

Resulta interesante comparar el NLP con cómo aprendemos lenguaje las personas. Un niño empieza reconociendo palabras, luego relaciones simples y, con el tiempo, significados complejos. El NLP recorre un camino parecido, pero sin intención ni comprensión.algoritmos.

~~TF-IDF~~ ~~se parece a una fase muy temprana: reconocer qué palabras importan más.~~
~~Los modelos profundos se parecen a una fase avanzada: captar contexto y relaciones.~~
~~Pero falta algo esencial:~~ ~~la experiencia humana del significado~~.

Herramientas donde aparecen técnicas NLP clásicas y modernas (solo referencia)

~~En contextos educativos y formativos, el NLP —desde TF-IDF hasta modelos profundos— aparece en herramientas y entornos como:~~

~~scikit-learn~~

~~spaCy~~

~~NLTK~~

~~Hugging Face~~

~~Orange Data Mining~~

~~Weka~~

~~Google Colab~~

~~Muchas de estas herramientas combinan técnicas clásicas (como TF-IDF) con modelos modernos, lo que las hace especialmente útiles para la enseñanza.~~

Conclusión

~~El Procesamiento del Lenguaje Natural nos enseña una lección muy valiosa para la educación:~~
~~no todo aprendizaje complejo empieza siendo profundo~~.

~~A veces, contar bien es más útil que intentar comprenderlo todo.~~
~~TF-IDF, con su aparente simplicidad, sigue siendo una herramienta poderosa porque es~~ ~~comprensible, explicable y pedagógicamente honesta~~.

~~Las máquinas pueden analizar palabras; el profesorado ayuda a construir significado.~~