1.4 Entendiendo las redes neuronales, Deep Learning

1.4 Aprender con muchas capas

Deep Learning (DL): cuando las máquinas aprenden representaciones complejas

https://miro.medium.com/v2/resize%3Afit%3A1156/1%2AToPT8jnb5mtnikmiB42hpQ.png

https://serokell.io/files/9w/9wrzg5vi.Deep_Learning_in_Computer_Vision_pic2.png

https://developer-blogs.nvidia.com/wp-content/uploads/2022/07/Fig-3.png

Del Machine Learning al Deep Learning: una evolución naturallógica

En ellos ~~capítulo~~capítulos ~~anterior~~anteriores hemos visto cómo el ~~Machine Learning~~ ~~permite a~~aprenden las máquinas y qué entendemos por Machine Learning: aprender a partir de datos siguiendo distintos ~~tipos~~enfoques ~~de aprendizaje:~~ (supervisado, no supervisado, semisupervisado y por ~~refuerzo.~~refuerzo). ~~Sin embargo, muchos de los grandes avances recientes en Inteligencia Artificial no se explican solo por la idea de aprender con datos, sino por~~ ~~cómo~~ ~~se aprende de ellos.~~

~~Aquí es donde aparece el~~El Deep Learning (DL) ono ~~aprendizaje~~cambia ~~profundo.~~esa Nológica, ~~es un concepto completamente nuevo ni una ruptura con lo anterior, sino una~~pero ~~evolución~~la ~~natural del Machine Learning~~amplifica.

La diferencia fundamental no está en elqué ~~tipo~~se ~~de aprendizaje,~~aprende, sino en lacómo. ~~estructura interna del modelo: el~~El Deep Learning utiliza redes neuronales con muchas capas, capaces de aprender representaciones cada vez más complejas desin ~~los~~que ~~datos.~~

una

Sipersona entenga elque ~~Machine~~indicar ~~Learning tradicional el ser humano todavía debía decidir~~explícitamente qué características ~~eran~~son ~~importantes,~~importantes. En lugar de decirle a la máquina “fíjate en esto”, se le dan datos y se deja que descubra por sí misma los niveles de información relevantes.

Por eso, el Deep Learning ha sido decisivo en ámbitos donde la ~~propia~~complejidad ~~máquina~~del ~~aprende~~dato ~~qué~~—texto, esimagen, ~~relevante~~audio yo ~~qué~~vídeo— no,hacía ~~siempre~~imposible aescribir ~~partir~~reglas ~~de ejemplos.~~manuales.

VerAprender noa es entender:interpretar: una analogía necesariahumana clave

~~Para~~Volvemos ~~comprender~~a ~~qué~~una ~~aporta~~analogía muy potente desde el ~~Deep~~punto ~~Learning,~~de ~~conviene~~vista ~~recuperar~~educativo. Cuando una ~~idea~~persona yanace ~~mencionada en el capítulo anterior. Las personas que nacen ciegas~~ciega y ~~recuperan~~recupera la visión en la edad ~~adulta~~adulta, ~~reciben~~sus ~~estímulos~~ojos ~~visuales,~~comienzan a funcionar, pero su cerebro no ~~saben~~sabe ~~interpretarlos~~interpretar lo que recibe. ~~Ven~~No ~~formas,~~reconoce ~~colores~~objetos yni ~~movimiento,~~caras; ~~pero~~ve noestímulos ~~objetos,~~sin ~~distancias~~significado. oSolo ~~rostros.~~tras ~~Necesitan~~un ~~años~~largo proceso de aprendizaje ~~para empezar~~empieza a ~~dar~~construir ~~sentido~~una ainterpretación lodel ~~que~~mundo ~~perciben.~~visual.

~~El Deep Learning actúa de forma muy similar. Una imagen, un sonido o un texto son, para la máquina,~~ ~~solo números~~. Una red neuronal profunda no “ve” una cara ni “escucha” una voz; aprende a detectar patrones simples en las primeras capas (bordes, tonos, frecuencias) y patrones cada vez más complejos en las capas posteriores (formas, estructuras, relaciones). El significado no está en los datos, ~~emerge del aprendizaje progresivo~~.

~~Esta idea es clave para entender por qué el Deep Learning funciona tan bien en tareas complejas y, al mismo tiempo, por qué es tan difícil de explicar.~~

Qué es realmente una red neuronal profunda

~~Una~~ ~~red neuronal~~ está formada por capas de unidades simples conectadas entre sí. Cada capa transforma la información que recibe y la pasa a la siguiente. En una red poco profunda, estas transformaciones son limitadas. En una red profunda, con muchas capas intermedias, las transformaciones se encadenan y permiten capturar relaciones muy complejas.

En términos educativos, podríamos hacer un paralelismo con el aprendizaje humano. Un alumno no pasa de reconocer letras a comprender un texto literario complejo en un solo paso. Aprende primero a identificar letras, luego palabras, después frases, ideas y finalmente significados abstractos. El Deep Learning funciona de forma ~~parecida:~~muy similar. Una imagen no es “un perro”, un audio no es “una voz” y un texto no es “una idea”. Para la máquina, todo son números. Las primeras capas de una red neuronal profunda aprenden patrones simples; las siguientes, combinaciones más complejas; y las últimas, estructuras de alto nivel. El significado ~~aprende~~no ~~por~~está ~~niveles~~dado., se construye a partir del aprendizaje progresivo.

PorRedes quéneuronales profundas: aprender por niveles

Una red neuronal profunda transforma la información capa a capa. Cada capa aprende algo distinto y lo pasa a la siguiente. Cuantas más capas, más compleja puede ser la representación aprendida.

En educación, el paralelismo es claro: no se pasa directamente de datos a comprensión profunda. El aprendizaje humano también es gradual. El Deep Learning imita esa progresión, aunque sin conciencia ni comprensión real.

Modelos reales de Deep Learning según el tipo de dato

Uno de los grandes valores del Deep Learning es que la misma idea funciona para distintos tipos de información, cambiando el modelo concreto. Veamos algunos ejemplos reales y conocidos, aplicables a diferentes ámbitos.

Deep Learning aplicado al texto

En el procesamiento del lenguaje natural, el Deep Learning se apoya en modelos basados en transformers, capaces de manejar el contexto y las relaciones entre palabras a gran escala.

Ejemplos de modelos reales:

GPT (familia de modelos generativos de lenguaje)

BERT

RoBERTa

LLaMA

Mistral

Estos modelos se utilizan para:

generar textos,

resumir documentos,

responder preguntas,

analizar sentimientos,

clasificar y corregir textos.

Aunque puedan parecer “inteligentes”, su funcionamiento se basa en predecir la siguiente palabra más probable a partir de enormes cantidades de texto previamente analizado.

Deep Learning aplicado al audio

En el ámbito del audio, el Deep Learning ha ~~cambiado~~revolucionado el reconocimiento y la IAgeneración

~~Durante~~de ~~años,~~voz. ~~las~~Las redes neuronales ~~existieron,~~profundas ~~pero~~aprenden noa ~~tuvieron~~transformar unondas ~~impacto~~sonoras ~~real.~~en ~~Faltaban~~representaciones ~~tres~~lingüísticas.

~~cosas fundamentales: grandes volúmenes~~

Ejemplos de ~~datos,~~modelos ~~potencia~~reales:

Whisper (transcripción de ~~cálculo~~audio ~~suficiente~~a texto)

Wav2Vec

DeepSpeech

Conformer

Tacotron

WaveNet

Estos modelos permiten:

transcribir clases grabadas,

crear subtítulos automáticos,

generar voz sintética,

mejorar la accesibilidad educativa.

Aquí, las capas iniciales trabajan con frecuencias y ~~técnicas~~ritmos; delas ~~entrenamiento~~posteriores, ~~eficaces.~~con ~~Cuando~~fonemas ~~estos~~y ~~tres~~palabras ~~elementos~~completas.

~~combinaron,~~

Deep Learning aplicado a imagen

En visión artificial, el Deep Learning ~~empezó~~se apoya en redes convolucionales y modelos visuales profundos que aprenden a ~~destacar~~reconocer ~~claramente~~patrones ~~frente a otros enfoques.~~espaciales.

~~Gracias~~Ejemplos ade ~~él,~~modelos lareales:

~~logrado~~
ResNet
~~avances~~

~~espectaculares~~

~~en:~~
VGG

Inception

EfficientNet

YOLO

Vision Transformer (ViT)

Estos modelos se utilizan para:

reconocimiento de ~~imágenes,~~

~~reconocimiento~~objetos y ~~síntesis de voz,~~

~~traducción automática,~~personas,
análisis de ~~texto,~~imágenes médicas o educativas,
~~generación~~detección de ~~contenido.~~gestos,

clasificación y etiquetado automático de imágenes.

~~Muchos~~Las primeras capas detectan bordes y colores; las últimas reconocen objetos completos.

Deep Learning aplicado a vídeo

El vídeo añade una dimensión adicional: el tiempo. Los modelos de ~~los~~Deep ~~sistemas~~Learning ~~que~~para ~~hoy~~vídeo ~~parecen~~combinan ~~“inteligentes”~~análisis sede ~~apoyan~~imagen ~~directamente~~con secuencias temporales.

Ejemplos de modelos reales:

I3D

SlowFast

C3D

TimeSformer

Video Swin Transformer

Estos modelos permiten:

analizar prácticas grabadas,

detectar acciones o comportamientos,

estudiar movimientos y posturas,

indexar grandes repositorios audiovisuales.

En educación, esto abre posibilidades en ~~Deep~~FP, ~~Learning,~~educación ~~aunque~~física, elartes ~~usuario~~escénicas noo ~~sea~~formación ~~consciente de ello.~~técnica.

Deep Learning y los distintos tipos de aprendizaje ya estudiados

EsConviene ~~importante subrayar~~recordar que el Deep Learning no ~~sustituye~~es aun ~~los tipos~~tipo de aprendizaje ~~vistos~~distinto, ~~anteriormente.~~sino Aluna ~~contrario,~~tecnología que puede entrenarse siguiendo los ~~utiliza.~~enfoques vistos en capítulos anteriores.

~~Una~~Puede ~~red neuronal profunda puede entrenarse:~~aprender:

de forma supervisada, (con ejemplos ~~etiquetados;~~etiquetados),
~~de forma~~ no supervisada, (descubriendo ~~estructuras internas;~~estructuras),
~~de forma~~ semisupervisada, ~~combinando ambos enfoques;~~
o mediante aprendizaje por refuerzo~~, interactuando con un entorno.~~.

El ~~famoso~~ caso de AlphaGo, desarrollado por DeepMind, combina ~~Deep~~redes ~~Learning~~neuronales profundas con aprendizaje por ~~refuerzo.~~refuerzo Elpara ~~sistema~~alcanzar noun ~~solo~~rendimiento ~~aprendió~~extraordinario. deNo ~~partidas~~entiende ~~humanas,~~el ~~sino~~juego, ~~que~~pero ~~desarrolló~~ha ~~sus propias~~aprendido estrategias ~~jugando~~extremadamente ~~contra sí mismo millones de veces.~~

Deep Learning, texto, imagen y audio

~~Uno de los puntos fuertes del Deep Learning es su capacidad para trabajar con distintos tipos de datos, siempre bajo una misma lógica:~~ ~~todo se convierte en números~~.

~~En imágenes, las primeras capas aprenden a detectar bordes y colores; las siguientes, formas; las últimas, objetos completos.~~
~~En audio, las capas iniciales capturan frecuencias y ritmos; las posteriores, fonemas, palabras y patrones del habla.~~
~~En texto, las redes aprenden relaciones entre palabras, contexto y estructura del lenguaje.~~

~~Esta capacidad de aprender representaciones profundas explica por qué el Deep Learning es la base de los~~ ~~modelos de lenguaje~~~~, de los sistemas de visión artificial y de muchas aplicaciones multimodales actuales.~~complejas.

Deep Learning en educación: oportunidadespotencial realesy prudencia

~~En el ámbito educativo, el~~El Deep Learning ~~abre~~permite ~~posibilidades muy potentes, siempre que se utilice con criterio pedagógico.~~

~~Permite, por ejemplo:~~

~~analizar textos largos y complejos producidos por el alumnado,~~

trabajar con ~~audio~~textos largos, audio, imagen y ~~vídeo~~vídeo, enalgo ~~procesos~~impensable dehace ~~evaluación,~~
pocos

años.

En
~~detectar~~educación, ~~patrones~~esto deabre ~~aprendizaje~~la ~~difíciles de observar~~puerta a ~~simple~~análisis ~~vista,~~más ricos y a una mayor accesibilidad.

~~mejorar la accesibilidad mediante reconocimiento de voz e imagen.~~

Sin embargo, ~~también plantea retos importantes. Los~~estos modelos ~~profundos~~ son difíciles de explicar. Funcionan muy bien, pero no siempre sabemos por qué. Por eso, su uso educativo debe ser siempre complementario, lonunca ~~que~~decisorio ~~obliga~~por así ~~extremar la cautela cuando se utilizan para evaluar o clasificar a personas.~~solo.

Herramientas basadasy enentornos donde aparece el Deep Learning (solo referencia)

~~En contextos educativos y formativos, el~~El Deep Learning está ~~presente~~presente, ~~—de forma visible~~directa o ~~invisible—~~indirectamente, en ~~herramientas~~entornos y ~~entornos~~herramientas como:

TensorFlow
PyTorch
Keras
Hugging Face
Google Colab
Teachable Machine
AutoML

~~El objetivo educativo no~~No es ~~dominar~~imprescindible ~~estas~~dominarlas, ~~herramientas,~~pero ~~sino~~sí entender ~~comprender~~ qué ~~hacen~~tipo yde ~~qué~~aprendizaje ~~límites~~hay ~~tienen~~detrás.

El error, otra vez, como motor del aprendizaje

Al igual que en el Machine Learning, el error es fundamental en el Deep Learning. Las redes neuronales profundas ajustan millones de parámetros reduciendo progresivamente el error entre lo que predicen y lo que deberían haber predicho.

~~Este proceso recuerda de nuevo al aprendizaje humano: nadie aprende algo complejo a la primera. El progreso surge de~~ ~~iterar, equivocarse y reajustar~~~~. La diferencia es que la máquina puede hacerlo millones de veces sin cansarse.~~

Límites y riesgos del Deep Learning en educación

~~El Deep Learning no es neutral ni infalible. Aprende de datos históricos, puede amplificar sesgos y, sobre todo,~~ ~~es difícil de interpretar~~~~. En educación, esto obliga a ser especialmente prudentes.~~

~~Un modelo profundo puede acertar mucho, pero si no sabemos por qué acierta,~~ ~~no debe tomar decisiones críticas~~ ~~sobre el alumnado. El criterio humano sigue siendo insustituible.~~

Cierre de la secciónConclusión

El Deep Learning ha ~~llevado a la Inteligencia Artificial a niveles impensables hace apenas unos años. Ha~~ demostrado ~~que, con suficientes datos y capas de aprendizaje, una máquina puede manejar tareas extremadamente complejas.~~

~~Pero también nos recuerda algo esencial para la educación:~~
~~aprender no es solo detectar patrones, sino~~ ~~comprender, contextualizar y dar sentido~~.

~~Las máquinas pueden aprender profundamente.~~
~~Las personas aprendemos~~ ~~significativamente~~.

~~El Deep Learning amplía lo~~ que las máquinas pueden ~~hacer;~~aprender representaciones extremadamente complejas a partir de datos. Pero también nos recuerda una lección clave para la educación:

Las máquinas aprenden patrones profundos; las personas aprenden significados profundos.

El Deep Learning amplía las capacidades técnicas.
La educación define ~~para~~el ~~qué merece la pena hacerlo.~~sentido.