Skip to main content

1.4 Entendiendo las redes neuronales, Deep Learning

1.4 Aprender con muchas capas

Deep Learning (DL): cuando las máquinas aprenden representaciones complejas

https://miro.medium.com/v2/resize%3Afit%3A1156/1%2AToPT8jnb5mtnikmiB42hpQ.png
https://codificandobits.com/media/red-neuronal-profunda-1.pnghttps://serokell.io/files/9w/9wrzg5vi.Deep_Learning_in_Computer_Vision_pic2.png
https://images.tandf.co.uk/common/jackets/crclarge/978100334/9781003348689.jpghttps://developer-blogs.nvidia.com/wp-content/uploads/2022/07/Fig-3.png

Del Machine Learning al Deep Learning: una evolución naturallógica

En ellos capítulocapítulos anterioranteriores hemos visto cómo el Machine Learning permite aaprenden las máquinas y qué entendemos por Machine Learning: aprender a partir de datos siguiendo distintos tiposenfoques de aprendizaje: (supervisado, no supervisado, semisupervisado y por refuerzo.refuerzo). Sin embargo, muchos de los grandes avances recientes en Inteligencia Artificial no se explican solo por la idea de aprender con datos, sino por cómo se aprende de ellos.

Aquí es donde aparece elEl Deep Learning (DL) ono aprendizajecambia profundo.esa Nológica, es un concepto completamente nuevo ni una ruptura con lo anterior, sino unapero evoluciónla natural del Machine Learningamplifica.

La diferencia fundamental no está en elqué tipose de aprendizaje,aprende, sino en lacómo. estructura interna del modelo: elEl Deep Learning utiliza redes neuronales con muchas capas, capaces de aprender representaciones cada vez más complejas desin losque datos.

una

Sipersona entenga elque Machineindicar Learning tradicional el ser humano todavía debía decidirexplícitamente qué características eranson importantes,importantes. En lugar de decirle a la máquina “fíjate en esto”, se le dan datos y se deja que descubra por sí misma los niveles de información relevantes.

Por eso, el Deep Learning ha sido decisivo en ámbitos donde la propiacomplejidad máquinadel aprendedato qué—texto, esimagen, relevanteaudio yo quévídeo— no,hacía siempreimposible aescribir partirreglas de ejemplos.manuales.


VerAprender noa es entender:interpretar: una analogía necesariahumana clave

ParaVolvemos comprendera quéuna aportaanalogía muy potente desde el Deeppunto Learning,de convienevista recuperareducativo. Cuando una ideapersona yanace mencionada en el capítulo anterior. Las personas que nacen ciegasciega y recuperanrecupera la visión en la edad adultaadulta, recibensus estímulosojos visuales,comienzan a funcionar, pero su cerebro no sabensabe interpretarlosinterpretar lo que recibe. VenNo formas,reconoce coloresobjetos yni movimiento,caras; perove noestímulos objetos,sin distanciassignificado. oSolo rostros.tras Necesitanun añoslargo proceso de aprendizaje para empezarempieza a darconstruir sentidouna ainterpretación lodel quemundo perciben.visual.

El Deep Learning actúa de forma muy similar. Una imagen, un sonido o un texto son, para la máquina, solo números. Una red neuronal profunda no “ve” una cara ni “escucha” una voz; aprende a detectar patrones simples en las primeras capas (bordes, tonos, frecuencias) y patrones cada vez más complejos en las capas posteriores (formas, estructuras, relaciones). El significado no está en los datos, emerge del aprendizaje progresivo.

Esta idea es clave para entender por qué el Deep Learning funciona tan bien en tareas complejas y, al mismo tiempo, por qué es tan difícil de explicar.


Qué es realmente una red neuronal profunda

Una red neuronal está formada por capas de unidades simples conectadas entre sí. Cada capa transforma la información que recibe y la pasa a la siguiente. En una red poco profunda, estas transformaciones son limitadas. En una red profunda, con muchas capas intermedias, las transformaciones se encadenan y permiten capturar relaciones muy complejas.

En términos educativos, podríamos hacer un paralelismo con el aprendizaje humano. Un alumno no pasa de reconocer letras a comprender un texto literario complejo en un solo paso. Aprende primero a identificar letras, luego palabras, después frases, ideas y finalmente significados abstractos. El Deep Learning funciona de forma parecida:muy similar. Una imagen no es “un perro”, un audio no es “una voz” y un texto no es “una idea”. Para la máquina, todo son números. Las primeras capas de una red neuronal profunda aprenden patrones simples; las siguientes, combinaciones más complejas; y las últimas, estructuras de alto nivel. El significado aprendeno porestá nivelesdado., se construye a partir del aprendizaje progresivo.


PorRedes quéneuronales profundas: aprender por niveles

Una red neuronal profunda transforma la información capa a capa. Cada capa aprende algo distinto y lo pasa a la siguiente. Cuantas más capas, más compleja puede ser la representación aprendida.

En educación, el paralelismo es claro: no se pasa directamente de datos a comprensión profunda. El aprendizaje humano también es gradual. El Deep Learning imita esa progresión, aunque sin conciencia ni comprensión real.


Modelos reales de Deep Learning según el tipo de dato

Uno de los grandes valores del Deep Learning es que la misma idea funciona para distintos tipos de información, cambiando el modelo concreto. Veamos algunos ejemplos reales y conocidos, aplicables a diferentes ámbitos.


Deep Learning aplicado al texto

En el procesamiento del lenguaje natural, el Deep Learning se apoya en modelos basados en transformers, capaces de manejar el contexto y las relaciones entre palabras a gran escala.

Ejemplos de modelos reales:

  • GPT (familia de modelos generativos de lenguaje)

  • BERT

  • RoBERTa

  • T5

  • LLaMA

  • Mistral

Estos modelos se utilizan para:

  • generar textos,

  • resumir documentos,

  • responder preguntas,

  • analizar sentimientos,

  • clasificar y corregir textos.

Aunque puedan parecer “inteligentes”, su funcionamiento se basa en predecir la siguiente palabra más probable a partir de enormes cantidades de texto previamente analizado.


Deep Learning aplicado al audio

En el ámbito del audio, el Deep Learning ha cambiadorevolucionado el reconocimiento y la IAgeneración

Durantede años,voz. lasLas redes neuronales existieron,profundas peroaprenden noa tuvierontransformar unondas impactosonoras real.en Faltabanrepresentaciones treslingüísticas.

cosas fundamentales: grandes volúmenes

Ejemplos de datos,modelos potenciareales:

  • Whisper (transcripción de cálculoaudio suficientea texto)

  • Wav2Vec

  • DeepSpeech

  • Conformer

  • Tacotron

  • WaveNet

Estos modelos permiten:

  • transcribir clases grabadas,

  • crear subtítulos automáticos,

  • generar voz sintética,

  • mejorar la accesibilidad educativa.

Aquí, las capas iniciales trabajan con frecuencias y técnicasritmos; delas entrenamientoposteriores, eficaces.con Cuandofonemas estosy trespalabras elementoscompletas.

se
combinaron,

Deep Learning aplicado a imagen

En visión artificial, el Deep Learning empezóse apoya en redes convolucionales y modelos visuales profundos que aprenden a destacarreconocer claramentepatrones frente a otros enfoques.espaciales.

GraciasEjemplos ade él,modelos lareales:

IA
    ha
  • logrado

    ResNet

    avances
  • espectaculares
  • en:

    VGG

  • Inception

  • EfficientNet

  • YOLO

  • Vision Transformer (ViT)

Estos modelos se utilizan para:

  • reconocimiento de imágenes,

  • reconocimientoobjetos y síntesis de voz,

  • traducción automática,personas,

  • análisis de texto,imágenes médicas o educativas,

  • generacióndetección de contenido.gestos,

  • clasificación y etiquetado automático de imágenes.

MuchosLas primeras capas detectan bordes y colores; las últimas reconocen objetos completos.


Deep Learning aplicado a vídeo

El vídeo añade una dimensión adicional: el tiempo. Los modelos de losDeep sistemasLearning quepara hoyvídeo parecencombinan “inteligentes”análisis sede apoyanimagen directamentecon secuencias temporales.

Ejemplos de modelos reales:

  • I3D

  • SlowFast

  • C3D

  • TimeSformer

  • Video Swin Transformer

Estos modelos permiten:

  • analizar prácticas grabadas,

  • detectar acciones o comportamientos,

  • estudiar movimientos y posturas,

  • indexar grandes repositorios audiovisuales.

En educación, esto abre posibilidades en DeepFP, Learning,educación aunquefísica, elartes usuarioescénicas noo seaformación consciente de ello.técnica.


Deep Learning y los distintos tipos de aprendizaje ya estudiados

EsConviene importante subrayarrecordar que el Deep Learning no sustituyees aun los tipostipo de aprendizaje vistosdistinto, anteriormente.sino Aluna contrario,tecnología que puede entrenarse siguiendo los utiliza.enfoques vistos en capítulos anteriores.

UnaPuede red neuronal profunda puede entrenarse:aprender:

  • de forma supervisada, (con ejemplos etiquetados;etiquetados),

  • de forma no supervisada, (descubriendo estructuras internas;estructuras),

  • de forma semisupervisada, combinando ambos enfoques;

  • o mediante aprendizaje por refuerzo, interactuando con un entorno..

El famoso caso de AlphaGo, desarrollado por DeepMind, combina Deepredes Learningneuronales profundas con aprendizaje por refuerzo.refuerzo Elpara sistemaalcanzar noun solorendimiento aprendióextraordinario. deNo partidasentiende humanas,el sinojuego, quepero desarrollóha sus propiasaprendido estrategias jugandoextremadamente contra sí mismo millones de veces.


Deep Learning, texto, imagen y audio

Uno de los puntos fuertes del Deep Learning es su capacidad para trabajar con distintos tipos de datos, siempre bajo una misma lógica: todo se convierte en números.

En imágenes, las primeras capas aprenden a detectar bordes y colores; las siguientes, formas; las últimas, objetos completos.
En audio, las capas iniciales capturan frecuencias y ritmos; las posteriores, fonemas, palabras y patrones del habla.
En texto, las redes aprenden relaciones entre palabras, contexto y estructura del lenguaje.

Esta capacidad de aprender representaciones profundas explica por qué el Deep Learning es la base de los modelos de lenguaje, de los sistemas de visión artificial y de muchas aplicaciones multimodales actuales.complejas.


Deep Learning en educación: oportunidadespotencial realesy prudencia

En el ámbito educativo, elEl Deep Learning abrepermite posibilidades muy potentes, siempre que se utilice con criterio pedagógico.

Permite, por ejemplo:

  • analizar textos largos y complejos producidos por el alumnado,

  • trabajar con audiotextos largos, audio, imagen y vídeovídeo, enalgo procesosimpensable dehace evaluación,

    pocos
  • años.
  • En

    detectareducación, patronesesto deabre aprendizajela difíciles de observarpuerta a simpleanálisis vista,más ricos y a una mayor accesibilidad.

  • mejorar la accesibilidad mediante reconocimiento de voz e imagen.

Sin embargo, también plantea retos importantes. Losestos modelos profundos son difíciles de explicar. Funcionan muy bien, pero no siempre sabemos por qué. Por eso, su uso educativo debe ser siempre complementario, lonunca quedecisorio obligapor a extremar la cautela cuando se utilizan para evaluar o clasificar a personas.solo.


Herramientas basadasy enentornos donde aparece el Deep Learning (solo referencia)

En contextos educativos y formativos, elEl Deep Learning está presentepresente, —de forma visibledirecta o invisible—indirectamente, en herramientasentornos y entornosherramientas como:

  • TensorFlow

  • PyTorch

  • Keras

  • Hugging Face

  • Google Colab

  • Teachable Machine

  • AutoML

El objetivo educativo noNo es dominarimprescindible estasdominarlas, herramientas,pero sinosí entender comprender qué hacentipo yde quéaprendizaje límiteshay tienendetrás.


El error, otra vez, como motor del aprendizaje

Al igual que en el Machine Learning, el error es fundamental en el Deep Learning. Las redes neuronales profundas ajustan millones de parámetros reduciendo progresivamente el error entre lo que predicen y lo que deberían haber predicho.

Este proceso recuerda de nuevo al aprendizaje humano: nadie aprende algo complejo a la primera. El progreso surge de iterar, equivocarse y reajustar. La diferencia es que la máquina puede hacerlo millones de veces sin cansarse.


Límites y riesgos del Deep Learning en educación

El Deep Learning no es neutral ni infalible. Aprende de datos históricos, puede amplificar sesgos y, sobre todo, es difícil de interpretar. En educación, esto obliga a ser especialmente prudentes.

Un modelo profundo puede acertar mucho, pero si no sabemos por qué acierta, no debe tomar decisiones críticas sobre el alumnado. El criterio humano sigue siendo insustituible.


Cierre de la secciónConclusión

El Deep Learning ha llevado a la Inteligencia Artificial a niveles impensables hace apenas unos años. Ha demostrado que, con suficientes datos y capas de aprendizaje, una máquina puede manejar tareas extremadamente complejas.

Pero también nos recuerda algo esencial para la educación:
aprender no es solo detectar patrones, sino comprender, contextualizar y dar sentido.

Las máquinas pueden aprender profundamente.
Las personas aprendemos significativamente.

El Deep Learning amplía lo que las máquinas pueden hacer;aprender representaciones extremadamente complejas a partir de datos. Pero también nos recuerda una lección clave para la educación:

Las máquinas aprenden patrones profundos; las personas aprenden significados profundos.

El Deep Learning amplía las capacidades técnicas.
La educación define parael qué merece la pena hacerlo.
sentido.