# La IA en educación. Una aproximación práctica.

Este curso es una revisión resumida y completa del fenómeno de la Inteligencia Artificial iniciado a finales del año 2022 y que ha irrumpido con fuerza en todos los ámbitos de la sociedad y muy especialmente en el educativo.  
  
El objetivo central es introducir al alumno en dicho fenómeno para que pueda iniciar su propio camino en el uso y aplicación de las tecnologías de IA en su ámbito educativo.  
Pero también conoceder la IA a todos los niveles, histórico, técnico, práctico y ético sin necesidad de ningún conocimiento previo.  
  
Los contenidos, especialmente de los últimos módulos, están totalmente actualizados con todas las novedades.  
  
Por último añadir que a pesar de toda la potencialidad y las posibiidades de la IA en el mundo educativo, el preoceso de aprendizaje es igual de lento y costoso que antes, la diferencia es que ahora puede ser más eficiente y llegar a muchas más gente.

# Guion curso

#### **Módulo 1 Introducción y panorama de la IA**

Unidad 1.1. Panorama y conceptos generales

Unidad 1.2. Prehistoria de la IA, antes de llamarse IA

Unidad 1.3. Inicios y evolución de la IA

Unidad 1.4. Situación actual y aplicaciones extremas

#### **Módulo 2 Cómo funciona. Fundamentos de IA**

Unidad 2.1. De que estamos hablando: Definición y tipos de IA

Unidad 2.2. Aprendizaje Automático o *Machine Learning*. Como aprender sin instrucciones

Unidad 2.3. Tipos de aprendizaje automático

Unidad 2.4. Imitando al cerebro. Redes neuronales

#### **Módulo 3 Y ahora que hacemos. Aplicaciones de la IA**

 Unidad 3.1. Posibilidades de la IA

Unidad 3.2. Tutorial de *prompting*

 Unidad 3.3. Aplicaciones de la IA: NLP, IA Generativa

 Unidad 3.4. Casos de uso y aplicaciones educativas

#### **Módulo 4 Más allá de chatGPT**

Unidad 4.2. *Plugins* y extensiones

Unidad 4.1. Modelos personalizados. Crea tu propio chatbot. Habla con tus datos

Unidad 4.2. Nuevos paradigmas de *chatBots*

Unidad 4.3. Programación para incautos. Una visión general de la programación con modelos de lenguaje

#### **Módulo 5 Consideraciones sociales y futuro de la AI**

 Unidad 5.1. Impacto social y económico

 Unidad 5.2. Consideraciones éticas

 Unidad 5.3. Futuro de la AI

 Unidad 5.4. La IA y la cultura

# Módulo 1. Introducción y panorama de la IA

Visión general e histórica con mención a hitos e ideas relevantes para entender la IA hoy, así como anécdotas relacionadas con el siempre buscado objetivo de imitar al ser humano

# Unidad 1.1. Panorama general de la IA

> Attention is All You Need
> 
> 2017 Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N. Gomez, Łukasz Kaiser y Illia Polosukhin
> 
> Equipo de investigación de Google

## CONTENIDOS

### Introducción

[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-11/scaled-1680-/JyOimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-11/JyOimage.png)

La cita inicial da título al artículo que en 2017 supuso el nacimiento de todo el boom de aplicaciones y sistemas de IA que hoy en día inundan las redes y tanto impacto están teniendo en todos los sectores económicos y sociales.

Presentó la arquitectura de red neuronal conocida como "Transformer", la cual se ha convertido en la base para muchos desarrollos posteriores en el campo del procesamiento del lenguaje natural (NLP) y, dentro del mismo, en la llamada IA Generativa, base de casi todas las aplicaciones de IA que veremos en el curso.

Es, además, una sentencia muy relacionada con la educación, pues sintetiza y expresa la premisa más importante para cualquier alumno que quiera aprender, a saber, la actitud o la atención hacia los temas de estudio. De manera que es perfecta para iniciar este curso en dos temas de gran impacto y relevancia social como son la IA y la educación.

La llamada IA ha irrumpido abruptamente en el mundo a todos los niveles. Desde que, en 2017 investigadores de Google publicaran el mencionado artículo '*Attention is all you need*' el desarrollo y difusión de sistemas de procesamiento del lenguaje natural (NLP) ha sido imparable, liderado por la empresa *OpenAI*, pero también por otras como *DeepMind* o *Anthropic* y, por supuesto, Microsoft y el propio Google (<span style="color: rgb(0, 0, 0);">Gemini</span>).

Pero su desarrollo lleva mucho más tiempo, desde siempre el ser humano ha querido construir máquinas que imiten su inteligencia, empezando por dispositivos automáticos y continuando con sistemas de generación de lenguaje y en general el desarrollo de tecnologías procesamiento del lenguaje natural, subcampo de estudio dentro de la IA en general y, en particular, del llamado *Deep Learning* o aprendizaje profundo.

Es un camino plagado de fracasos y euforia puntual que sólo recientemente ha culminado en una adopción masiva y un impacto relevante en todos los sectores económicos y sociales.

Finalmente y desde hace algo más de un año los sistemas de procesamiento de lenguaje natural (NLP) y la inteligencia artificial generativa han permitido llevar la IA a todos los ámbitos con éxito creciente. También la robótica y la propia biología (edición genéticao CRISPR, órganos sintétitcos, integración hombre-máquina) han experimentado un cambio sensible en sus posibilidades.

Todo esto hace que el campo de la IA por fin sea el más popular y aplicado en todo el mundo y en todas las empresas y organizaciones.

Los usos y aplicaciones son crecientes y se amplían a diario. También las amenazas están ahí en cuanto al mal uso y las implicaciones en cuanto a privacidad de la información y su utilización ilícita.

Sin embargo debemos asumir y asimilar su existencia y promover el uso ético y estético de estas tecnologías que, de manera inevitable, van a estar cada vez más presentes en nuestras vidas.

En este curso trataremos de dar una visión completa de todo el ecosistema de la IA abarcando la evolución histórica, los fundamentos que la sustentan y las principales aplicaciones, siempre haciendo especial hincapié en el lado educativo.

Pero no solo eso, también queremos tratar temas más avanzados y tratar el impacto socioeconómico de la IA así como las consideraciones éticas.

Aunque los veremos a lo largo del curso queremos introducir algunos conceptos importantes además de una relación de tecnologías y empresas más relevantes en el panorama actual

### Conceptos de Inteligencia Artificial (IA)

Es conveniente adelantar algunos de los conceptos principales en el mundo de la Inteligencia Artificial, en adelante IA, para no olvidar de donde partimos y que es lo que denotamos por IA.

A continuación indicamos algunas definiciones aproximadas de los conceptos de inteligencia, artificial y el binomio IA

Definiciones que necesariamente son aproximadas al no haber, ni siquiera en la comunidad científica, un consenso sobre las mismas.

**Inteligencia:** Es la capacidad de entender, aprender, razonar, tomar decisiones y formar una idea determinada de la realidad.

**Artificial:** Se refiere a sistemas diseñados para imitar o replicar la inteligencia humana.

**Inteligencia Artificial:**

La Inteligencia Artificial (IA) es un campo de la informática que se enfoca en la creación de sistemas capaces de realizar tareas que, hasta hace poco, requerían de la inteligencia humana. Esto incluye procesos como el aprendizaje (la adquisición de información y reglas para el uso de la información), el razonamiento (usar las reglas para alcanzar conclusiones aproximadas o definitivas) y la autocorrección. Las aplicaciones prácticas de la IA incluyen sistemas expertos, reconocimiento de voz, aprendizaje automático y robótica.

**Tipos de IA:**

**Se habla continuamente de IA pero sin reparar en que existen varios tipos a nivel conceptual.**

En lo que respecta a este curso siempre hablamos de Inteligencia Artificial en el sentido de imitar al cerebro o a la inteligencia humana. Sin embargo existen otros tipos que debemos considerar para futuros escenarios.

- **Inteligencia Artificial Débil o Estrecha (Narrow AI o Weak AI):**
    
    
    - **Definición:** Este tipo de AI está diseñado para realizar tareas específicas y opera dentro de un conjunto limitado de restricciones y contextos. No posee conciencia, sentimientos o la habilidad para realizar cualquier tarea que no haya sido específicamente programada para hacer.
    - **Ejemplos:** Los sistemas de reconocimiento de voz como Siri, asistentes personales como Alexa, sistemas de recomendación como los usados por Netflix o Amazon, y coches autónomos que pueden realizar tareas de conducción pero no son conscientes de su existencia.
    - **Estado Actual:** Es el único tipo de AI que hemos logrado desarrollar hasta la fecha con éxito comercial y práctico.
- **Inteligencia Artificial General (General AI o AGI):**
    
    
    - **Definición:** También conocida como "Strong AI", es un tipo de AI que poseería la habilidad de entender, aprender y aplicar su inteligencia a cualquier problema de manera similar a cómo lo haría un humano. Sería flexible y capaz de razonar, resolver problemas, planificar, aprender, comunicarse en lenguaje natural y operar de forma independiente.
    - **Ejemplos:** Un robot doméstico que puede realizar una variedad de tareas del hogar, desde limpiar hasta cocinar, pasando por administrar finanzas personales y proporcionar compañía, todo con comprensión y adaptabilidad similares a las de un ser humano.
    - **Estado Actual:** Todavía no se ha logrado y es objeto de investigación intensiva. Existen prototipos y sistemas en etapas muy tempranas que intentan emular algunas funciones cognitivas humanas.
- **Inteligencia Artificial Superinteligente (Superintelligent AI):**
    
    
    - **Definición:** Este tipo de AI no solo emularía la capacidad de toma de decisiones de los humanos, sino que la superaría. Tendría la capacidad de ser más creativa, más socialmente adaptada y mejor en todo lo que involucre procesamiento intelectual que cualquier humano.
    - **Ejemplos:** Un sistema de AI que podría diseñar sistemas de energía más eficientes, encontrar curas para enfermedades aún no curables, mejorar sus propios algoritmos y tecnología e influir en decisiones económicas y políticas con una perspectiva mucho más amplia y a largo plazo que la de los humanos.
    - **Estado Actual:** La superinteligencia artificial es puramente hipotética y objeto de muchas especulaciones y debates éticos y filosóficos. No hay evidencia concreta de que esté cerca de ser una realidad.

### Tecnologías de IA:  


A continuación indicamos algunas de las tecnologías más relevantes en el campo de la IA ya que son términos comunes en cualquier texto o referencia que podamos encontrar. La mayoría de ellas aparecerán de forma más o menos detallada a lo largo del curso.

1. **Aprendizaje Automático (*Machine Learning*):** Técnicas que permiten a las máquinas aprender de datos.
2. **Aprendizaje Profundo (*Deep Learning*):** Uso de redes neuronales con múltiples capas para procesar grandes conjuntos de datos.
3. **Redes Neuronales Convolucionales (CNN):** Especialmente diseñadas para el procesamiento de imágenes.
4. **Procesamiento del Lenguaje Natural (NLP):** Tecnología que permite a las máquinas leer y comprender el lenguaje humano.
5. **Algoritmos de Reforzamiento *(Reinforcement Learning*):** Donde los modelos aprenden a tomar decisiones basadas en recompensas.
6. **Visión por Computadora:** Permite a las máquinas interpretar y tomar decisiones basadas en imágenes o video.
7. **Robótica Autónoma:** Robots que pueden aprender y operar en su entorno sin intervención humana.
8. **Sistemas de Recomendación:** Algoritmos que sugieren productos o contenidos a los usuarios.
9. **Redes Generativas Adversarias (*GANs*):** Usadas para generar contenido, como imágenes, vídeo o texto, que es indistinguible del contenido creado por humanos.
10. **Reconocimiento de Voz:** Tecnología que convierte la voz en texto y viceversa, permitiendo la interacción verbal con dispositivos.
11. **Mecanismos de Atención:** Como el modelo "Transformer", que ha revolucionado el NLP con su enfoque "Attention is All You Need".

### Principales empresas y productos de IA:

Dada su complejidad y alta demanda de recursos, solo grandes compañías han podido desarrollar y proporcionar servicios de IA al nivel actual. Las herramientas que usaremos en el curso pertenecen a dichas compañías, aunque no debemos olvidar que se distinguen productos 'open source' (de uso libre pero no necesariamente gratuito) de los comerciales (generados de forma opaca sin detalles sobre fuentes de datos o algoritmos implicados).

Entre los productos más importantes destacamos los siguientes:

- **Google:** Chat de Google [Google Gemini](https://bard.google.com/?hl=es) y ecosistema de IA[ Deep Mind](https://deepmind.google/)
- **IBM:** Tiene chat propio y generador de chatbots IBM [Watson Asistente ](https://www.ibm.com/products/watsonx-assistant)propio y [Generador de modelos propios](https://www.ibm.com/products/watsonx-assistant/visual-builder)
- **Facebook:** [AI Meta](https://ai.meta.com/) - Entorno para el uso de herramientas de IA y el modelo open source Llama
- **Microsoft:** [ Microsoft Copilot](https://www.microsoft.com/es/ai#modal-A) - Copilot o asistente de IA de Microsoft y otras soluciones de IA
- **Anthropic:** Asistente de Chat y Constructor de chatbots [Anthropic](https://www.anthropic.com/)
- **OpenAI:** [ ](https://www.openai.com/)Conocida por modelos como GPT-3/4 [OpenAI](https://openai.com/)
- **Grok de X** Empresa X (antigua Twitter), acaba de lanzar su propio chatbot [Grok](https://grok.x.ai/)

Que duda cabe que existen cientos de otras compañías y herramientas que han desarrollado productos de IA, especialmente chatsbots, como Alexa de Amazon, Cortana de Microsoft o Siri de Apple, y que su uso es creciente, pero solo hace un año escaso se ha podido contar con herramientas de uso genérico que abarquen todo el conocimiento humano.

Dado que el curso se orienta al ámbito educativo adelantamos algunas plataformas de gran impacto que lo han abordado, algunas de las cuales ya se están implantando en diferentes países y centros educativos.

- [**Wolfram** ](https://www.wolframalpha.com/) Para aprendizaje científico y matemático
- [**Khanacademy**](https://es.khanacademy.org/) Para clases de ciencias, economía y matemáticas adaptadas a estudiantes de educación primaria y secundaria
- [**Eduten** ](https://eduten.com/) Para aprendizaje matemático
- [**Duolingo** ](https://es.duolingo.com/) Para la enseñanza idiomas

### Sectores más afectados:

Dado su caracter transversal, la IA ha irrumpido con fuerza en todos los sectores y ámbitos de la sociedad destacando por su potencial impacto el sector educativo y tecnológico en general, pero también en el mundo industrial (robótica), artístico (diseño, generación de vídeo e imagen, generación de música etc...) y científico (generación de papers, optimización de algoritmos o generación de ideas)

A continuación describimos los más importantes

- **Salud:** Diagnóstico y tratamiento personalizado. Ejemplo: IBM Watson Health para análisis genómico.
- **Finanzas:** Detección de fraudes y asesores financieros automatizados. Ejemplo: Chatbots de atención al cliente en bancos.
- **Automoción:** Vehículos autónomos. Ejemplo: Tesla con su piloto automático.
- **Retail:** Personalización de la experiencia del cliente. Ejemplo: Recomendaciones personalizadas en Amazon.
- **Educación:** Herramientas de tutoría personalizada, chatbots educativos. Ejemplo: Plataformas de aprendizaje adaptativo como [DreamBox](https://www.dreambox.com/)

# Unidad 1.2. Prehistoria de la IA, antes de llamarse IA.

### <span style="font-size: 28pt; line-height: 107%; font-family: 'Segoe UI', sans-serif; color: black; border: 1pt none windowtext; padding: 0cm;">Introducción</span>

![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/psuimage.png)Imagen extraída de la película: 2001 Una Odisea en el espacio de Stanley Kubrick

> *<span style="color: rgb(0, 0, 0);">"La exploración está conectada a nuestros cerebros. Si podemos ver el horizonte, queremos saber qué hay más allá." Buzz Aldrin.</span>*

<span style="color: rgb(0, 0, 0);">La cita de Buzz Aldrin, evoca una curiosidad inherente y un deseo de exploración que es fundamental en la naturaleza humana. Esta curiosidad ha impulsado numerosos avances y descubrimientos a lo largo de la historia de la humanidad. Sin duda la búsqueda y desarrollo de la Inteligencia Artificial (IA) esta imbuida por esta curiosidad intrínseca y el deseo de explorar lo desconocido.</span>

<span style="color: rgb(0, 0, 0);">La historia de la IA es la historia de todas las personas que imaginaron, describieron y forjaron ideas innovadoras, transformando sueños de máquinas inteligentes en realidad, con la aspiración última de que estas máquinas puedan realizar tareas que requieren inteligencia humana.<span style="mso-font-kerning: 0pt; mso-ligatures: none;"> </span></span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">A lo largo de la historia determinadas tareas que han sido tradicionalmente llevadas a cabo por humanos se han ido mecanizando gracias a avances tecnológicos sucesivos y han permitido liberar al humano de determinadas funciones, en especial aquellas repetitivas, mecánicas y tediosas. Estos avances consistían principalmente en mecanismos capaces de realizar las tareas con un resultado similar e incluso mejorado al del humano que las venía realizando, mejorando en velocidad, fuerza e incluso destreza a este. Estos avances, aunque no se puedan considerar como sustitutos de una tarea que requiera inteligencia, son pasos previos importantes para la consecución de entes robóticos dotados de inteligencia artificial, ya que estos precisan de tales los mecanismos y automatismos.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Puede que los más relevantes en el repaso histórico de hitos y personajes clave para el logro final de la IA sean aquellos que anhelaron, pensaron y desarrollaron ideas para la creación de un ser que tenga consciencia de si mismo y cuya capacidad de resolver problemas supere a la del propio ser humano.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Por ello, en la evolución de la IA, es esencial destacar a aquellos que plasmaron mitos, leyendas y relatos de ciencia ficción. También es crucial reconocer a los filósofos y matemáticos que formularon teorías lógico-algebraicas, pues sentaron las bases de avances significativos. Finalmente, no podemos olvidar a quienes diseñaron algoritmos y sistemas de información capaces de realizar vastos cálculos en tiempo récord. Gracias a todos ellos, la IA actual puede ejecutar tareas que emulan la inteligencia humana, como aprender, razonar y decidir de forma autónoma y eficiente.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;"> </span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Desde nuestra comprensión actual de la inteligencia artificial, retrocedamos en el tiempo para explorar las motivaciones que han impulsado al ser humano en su incesante exploración. Nos adentraremos en el origen de la búsqueda de nuestra más valiosa posesión: la inteligencia. Y veremos como esta indagación se va sofisticando sustentada en las ideas , tanto aquellas que evolucionan de manera acumulativa como las que emergen de manera disruptiva e impulsadas por la creciente y acumulativa capacidad tecnológica.</span>

---

### <span style="font-size: 28.0pt; line-height: 107%; font-family: 'Segoe UI',sans-serif; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">La antigua Grecia -</span><span style="font-size: 28.0pt; line-height: 107%; font-family: 'Segoe UI',sans-serif; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;"> </span><span style="font-size: 28.0pt; line-height: 107%; font-family: 'Segoe UI',sans-serif; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">Mitos</span>

> <span style="color: rgb(0, 0, 0);">*"La inteligencia consiste no solo en el conocimiento, sino también en la habilidad de aplicar el conocimiento en la práctica." - Aristóteles*</span>

<span style="color: rgb(0, 0, 0);">Esta cita de Aristóteles nos revela que la inteligencia es algo que debe manifestarse para considerarse como tal, y la manera más evidente que tiene para hacerlo es la de resolver problemas, lo que implica varias fases como; percibir la existencia del problema, comprender los aspectos relevantes del mismo, establecer una estrategia para su resolución y aplicarla prácticamente hasta dar por solucionado el problema de manera efectiva. </span>

<span style="color: rgb(0, 0, 0);">Tal concepción de la inteligencia, con todas sus implicaciones intrínsecas, es la que se pretende simular en máquinas. De conseguirlo estaríamos hablando de Inteligencia Artificial. Este anhelo ha existido desde hace muchos siglos, y así se ha manifestado a través de mitos, ideas filosóficas, lógicas y matemáticas.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Echando la vista atrás para establecer un punto de inicio observamos que en las primeras civilizaciones de las que tenemos constancia podemos encontrar alusiones y referencias relacionadas con conceptos que ahora asociamos con la IA. En la antigua mitología egipcia y mesopotámica, hay historias de dioses y seres divinos que poseen conocimiento y habilidades sobrehumanas. Sin embargo, dado que estas historias se transmitían oralmente o en inscripciones en tabletas de arcilla, es más difícil rastrear detalles específicos o intenciones de "inteligencia artificial" como las entendemos hoy en día.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;"> </span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Por eso vamos a empezar “nuestra historia de la IA” estableciendo la antigua Grecia como punto de partida. De este periodo si existe abundancia de información y es notorio como ha contribuido al desarrollo de las sociedades actuales en multitud de campos, en concreto y para lo que nos ocupa, hablamos de una cultura cuya influencia los campos de la lógica, la filosofía, la concepción del pensamiento racional, puede perfectamente considerarse un pilar inicial para un posterior desarrollo de ideas y conceptos que desemboque en los enfoques modernos de la IA. Nos centramos en algunos aspectos concretos:</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;"> </span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">**El comienzo de la lógica formal**: La antigua Grecia es conocida por su contribución al desarrollo de la lógica formal. Filósofos como Aristóteles establecieron las bases de la lógica deductiva y la teoría de proposiciones, lo que atisbó la forma en que siglos mas tarde se abordarían problemas relacionados con la computación y la IA.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;"> </span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Como muestra, la idea atribuida a Aristóteles:</span>

> <span style="font-size: 12pt; font-family: 'Times New Roman', serif; color: rgb(0, 0, 0);"> *"si se parte de premisas verdaderas y se razona correctamente, entonces se llegará necesariamente a una conclusión verdadera" - Aristóteles*</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Así como su estudio sobre las estructuras de razonamiento, como el silogismo, pueden reflejarse en cómo las máquinas modernas procesan la información. Por ejemplo, los sistemas expertos en inteligencia artificial usan una forma de razonamiento deductivo para llegar a conclusiones basadas en un conjunto dado de premisas, similar a cómo Aristóteles describiría la deducción en sus obras.</span>

<span style="color: rgb(0, 0, 0);">[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/D24image.png)](https://libros.catedu.es/uploads/images/gallery/2023-10/D24image.png)</span>

<span style="color: rgb(0, 0, 0);">Esquema de la Lógica Aristotélica. Fuente: http://funresearch.weebly.com/spanish-page.html</span>

<span style="font-size: 12pt; font-family: 'Times New Roman', serif; color: rgb(0, 0, 0); background: white;"> </span><span style="color: black; font-family: 'Segoe UI', sans-serif; font-size: 10.5pt;">**Autómatas y mitología**: si bien no existen evidencias de máquinas o autómatas complejos en la Antigua Grecia. la mitología incluye historias de estatuas animadas y seres artificiales que tienen ciertas similitudes con la idea de seres creados artificialmente.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Uno de estos mitos es el de **Pigmalión.** Esta intrigante historia de la mitología griega nos habla sobre la creación de una figura artificial y el poder del amor.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Pigmalión era un talentoso escultor de Chipre que, aunque era hábil en su arte, había desarrollado un profundo desdén hacia las mujeres debido a la promiscuidad que observaba en la sociedad. En su corazón, deseaba una compañera perfecta y pura, una mujer que fuera tan bella y virtuosa como su propia obra de arte.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Al entender que no encontraría ninguna mujer que completara sus anhelos, Pigmalión decidió esculpir una estatua de una mujer. Trabajó con tal perfección y dedicación que logró crear una figura femenina de una belleza y gracia extraordinarias. La estatua, a la que llamó Galatea, era tan hermosa y realista que Pigmalión se enamoró perdidamente de ella. </span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">El amor de Pigmalión por Galatea era tan profundo que rogó a la diosa Afrodita, la diosa del amor y la belleza, que diera vida a la estatua. Conmovida por su devoción, Afrodita escuchó sus súplicas y le concedió el deseo. La estatua de Galatea cobró vida y se convirtió en una mujer real, cálida y viva.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Pigmalión quedó extasiado al ver que su amada Galatea había cobrado vida y la tomó como su esposa. Juntos vivieron una vida feliz y dichosa.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">El mito de Pigmalión ha sido una fuente de inspiración para muchas obras de arte, literatura y teatro a lo largo de la historia. El tema central de la creación de una figura artificial que cobra vida y el poder del amor para transformar la realidad han sido interpretados de diversas maneras, y la historia ha sido retomada y adaptada en diferentes culturas y épocas.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">No es complicado encontrar similitudes del mito de Pigmalión y las ideas y objetivos de los proyectos de IA posteriores y contemporáneos. </span>

<span style="color: rgb(0, 0, 0);">![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/HmXimage.png)*Pigmalión*, de Jean-Baptiste Regnault de 1786, Museo Nacional del Palacio de Versalles. Fuente: Wikipedia</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Hablamos de la creación de seres artificiales con conciencia propia, Pigmalión crea una figura de una mujer artificial utilizando marfil lo que, como concepto, es una parte fundamental de la IA. La IA busca crear entidades artificiales que puedan exhibir comportamientos inteligentes y similares a los humanos. Si bien en el mito, la vida y la conciencia de Galatea surgen en un acto mágico realizado por la diosa Afrodita, en el desarrollo de la IA, los científicos y tecnólogos trabajan para crear sistemas que puedan simular comportamientos inteligentes y conscientes.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Aunque se pueden extraer estos paralelismos sobre los anhelos humanos, también surgen de inmediato las consideraciones éticas de la eventual materialización de los mismos</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">En este sentido el mito de Pigmalión ilustra el poder emocional y la conexión que se puede establecer entre los creadores y sus creaciones artificiales. En el ámbito de la IA, a menudo se considera la ética y la responsabilidad en la relación entre humanos y sistemas de IA, ya que su uso puede tener impactos significativos en la sociedad y en las emociones de las personas.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Como este curso, trata sobre la IA y su aplicación e influencia en la educación, sirva apuntar que además el término "Efecto Pigmalión" también se utiliza en psicología y educación para referirse al fenómeno en el cual las expectativas y creencias de una persona pueden influir en el rendimiento y comportamiento de otra persona, ya sea para bien o para mal.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Y en relación con el “Efecto Pigmalión” surge la analogía de la relación entre expectativas y resultados: En el Mito de Pigmalión, las expectativas de Pigmalión sobre su estatua influyeron en su resultado, convirtiéndola en una mujer real. De manera similar, en el desarrollo y uso de la IA, las expectativas y creencias de los creadores y usuarios pueden influir en el rendimiento y resultados de los sistemas de IA. Por ejemplo, si se espera que una IA sea capaz de llevar a cabo ciertas tareas con éxito, los esfuerzos y la atención dedicados a su desarrollo pueden ser mayores, lo que puede conducir a un mejor desempeño. Cabe añadir aquí, la problemática que surge de la influencia del creador o creadores en los comportamientos posteriores de las IA, conocidos como sesgos, que surgen de las ideas conscientes o inconscientes de los diseñadores, desarrolladores o cualquier agente involucrado en un proyecto de IA y que posteriormente se verán reflejados de alguna manera en las respuestas o trabajos realizados por la misma. En el caso de Pigmalión, obviamente Galatea estaba hecha exactamente siguiendo los ideales de belleza del escultor.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">El Mito de Pigmalión es narrado por el dramaturgo romano **Ovidio** en su obra **Metamorfosis**</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">También en la mitología griega encontramos el **Mito de Talos,** que es una fascinante historia ubicada en la isla de Creta. Aunque existen algunas variaciones en la leyenda, la versión más conocida se relata en la epopeya de Apolonio de Rodas, "Las Argonáuticas".</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Talos, también conocido como **Talón o Talonte**, era un autómata, una criatura artificial de bronce creada por **Hefesto**, el dios griego del fuego y la forja, a petición de **Zeus**, el rey de los dioses.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Según el mito, Talos fue encargado para proteger la isla de Creta y mantener alejados a los intrusos y piratas. Era una gigantesca figura hecha de bronce, con venas que transportaban sangre líquida ardiente, lo que lo hacía prácticamente invulnerable a cualquier ataque. Su modus operandi para mantener la seguridad de la isla era dar vueltas alrededor de Creta tres veces al día, lanzando piedras a las embarcaciones enemigas y asustando a quienes se acercaran.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">El autómata Talos también estaba equipado con una única vena en el tobillo, que estaba cerrada por una clavija de bronce. Esta vena se llenaba con el líquido ardiente que mantenía al gigante con vida. Cuando los argonautas liderados por Jasón llegaron a Creta en su búsqueda del vellocino de oro, su enemigo Medea (que viajaba con ellos) logró engañar a Talos y le quitó la clavija de bronce. El líquido precioso salió disparado de la vena, y Talos colapsó, liberando su vida artificial y pereciendo.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">También aquí, encontramos semejanzas y cuestiones relacionadas con la IA en el momento actual. Talos es una creación artificial con un propósito concreto, la defensa de la isla de Creta, labor que puede hacer mejor que los seres humanos y sin necesidad de descanso. Podemos ver en el siguiente enlace un bonito video animado de esta historia que incluye una reflexión sobre las similitudes del mito y la IA. </span><span style="font-size: 12pt; font-family: 'Times New Roman', serif; background: white;"> </span>***<span style="text-decoration: underline;"><span style="color: rgb(53, 152, 219); text-decoration: underline;">[El Mito de Talos](https://www.ted.com/talks/adrienne_mayor_the_greek_myth_of_talos_the_first_robot?language=es&subtitle=es)</span></span>** de Adrienne Mayor: EL mito de Talos, el primer robot. Fuente: TED.com*

<span style="color: rgb(0, 0, 0);">![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/dBoimage.png)</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">**Inspiración para pensadores posteriores:** Estos son solo dos ejemplos de mitos griegos pero existen otros mitos, ideas y conocimientos de la antigua Grecia que han influido significativamente en la filosofía y el pensamiento occidental a lo largo de la historia. Las obras de los filósofos griegos han sido ampliamente estudiadas y discutidas, lo que ha llevado a que conceptos relacionados con la inteligencia y la mente hayan sido considerados por pensadores posteriores.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Muchos de las aportaciones de la cultura griega nos llegan en forma de mitos y leyendas como las descritas, y algunas de ellas no dejan de sorprender por la facilidad con la pueden establecerse paralelismos y analogías con ideas de nuestro tiempo.</span>

<span style="color: rgb(0, 0, 0); font-family: 'Times New Roman', serif; font-size: 12pt;"> </span>

---

### <span style="font-size: 28.0pt; line-height: 107%; font-family: 'Segoe UI',sans-serif; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">La Antigua</span><span style="font-size: 28.0pt; line-height: 107%; font-family: 'Segoe UI',sans-serif; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;"> Roma</span><span style="font-size: 28.0pt; line-height: 107%; font-family: 'Segoe UI',sans-serif; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;"> </span><span style="font-size: 28.0pt; line-height: 107%; font-family: 'Segoe UI',sans-serif; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">– Ingeniería</span>

> <span style="font-size: 12pt; font-family: 'Times New Roman', serif; color: rgb(0, 0, 0);">"Que algo te parezca difícil, no quiere decir que nadie más sea capaz de lograrlo." Marco Aurelio</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">La cita del estoico filósofo y emperador de Roma Marco Aurelio (121-180 d.C.) inspira el espíritu de aquellos que no se dejaron vencer por las dificultades aparentes de una empresa, consiguiendo grandes logros que permitieron los progresos tecnológicos e hicieron avanzar a las sociedades.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Durante el Imperio Romano, no encontramos un desarrollo de las ideas tan destacado como en la antigua Grecia, en su lugar, el pueblo romano destacó por su eficacia y practicidad a la que contribuyó notablemente el desarrollo de la ingeniería para idear y construir artefactos y obras útiles para la sociedad y la expansión del imperio. Esa comprensión y aplicación creciente de la ingeniería y la mecánica sentó bases para futuros desarrollos en la automatización. Como logros concretos podemos citar:</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">**Máquinas de agua y relojes hidráulicos:** los romanos eran famosos por su habilidad en la ingeniería hidráulica, y algunas de sus invenciones pueden considerarse como precursores primitivos de la automatización. Por ejemplo, construyeron relojes hidráulicos complejos y autónomos que usaban agua para medir el tiempo.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">**Autómatas y mecanismos:** hay registros históricos de que los romanos utilizaron autómatas para entretenimiento en teatros y festividades. **Herón de Alejandría** (10-70 d. C.) ,matemático e ingeniero escribió varios tratados que describen diversas máquinas. Entre ellas destaca la eolípila, primera máquina de vapor, cuya aplicación práctica en los templos le granjeó el pseudónimo de «el Mago». La eolípila era una máquina que consistía en una esfera hueca conectada a una caldera a la que se adaptaban dos tubos curvos gruesos. El interior de la caldera estaba lleno de agua, que se hacía hervir provocando que por los tubos subiera el vapor hasta la bola. El vapor salía por dos tubos estrechos acodados, haciendo girar la bola muy rápido. Sin embargo, esta máquina nunca tuvo un fin práctico y algunas fuentes comentan que el invento no era más que un juguete con la finalidad de entretener a los niños de la época.</span>

<span style="color: rgb(0, 0, 0);"><span style="font-size: 12pt; font-family: 'Times New Roman', serif;"> </span><span style="font-size: 12.0pt; font-family: 'Times New Roman',serif; mso-fareast-font-family: 'Times New Roman'; mso-font-kerning: 0pt; mso-fareast-language: ES; mso-no-proof: yes;"></span>![](https://libros.catedu.es/uploads/images/gallery/2023-10/embedded-image-tgja36ox.png)</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Eolipila. Herón de Alejandría. Fuente: Wikipedia</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Herón describió por anticipado, aunque de forma arcaica mediante este artefacto, la ley de acción y reacción que cientos de años mas tarde postuló Isaac Newton, experimentando con vapor de agua.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Herón también es autor de<span style="mso-spacerun: yes;"> </span>**Autómata**, considerado el primer libro de robótica de la historia. En el, explica cómo construir juguetes mecánicos, figuras animadas y artefactos que funcionan con la ayuda del vapor o el agua. Estos autómatas incluyen pájaros que cantan, estatuas que se mueven y figuras que realizan acciones mecánicas complejas.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Todos estos logros representan un entendimiento avanzado de la ingeniería, la mecánica, y la automatización para su época y son parte de una larga cadena de innovación que, con el tiempo, nos llevará a la creación de máquinas autónomas y, finalmente, al desarrollo de la robotica, la cual está estrechamente relacionada con la inteligencia artificial.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Otra figura destacable de la época romana es la de **Vitruvio** (70-15 a. C.), escritor, ingeniero y arquitecto romano, sirvió para Julio Cesar y posteriormente para Augusto. Es conocido también por su tratado de diez volúmenes llamado "De Architectura", Considerado el primer manual de arquitectura de la historia. En estos volúmenes, Vitruvio abordó no solo la arquitectura, sino también una amplia gama de temas que incluyen la ingeniería civil, la mecánica y la historia natural.</span>

<span style="font-size: 10.5pt; line-height: 107%; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Vitruvio es particularmente conocido por definir los tres principios fundamentales de la buena arquitectura: firmitas (solidez), utilitas (utilidad) y venustas (belleza). Estos principios también pueden aplicarse a la tecnología en general y trasladando los mismos al campo de la IA se pueden establecer como base de desarrollo de un sistema:</span>

- <span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">**Firmitas:** podría interpretarse como la robustez y fiabilidad del sistema, lo que implica una construcción sólida de algoritmos y estructuras de datos.</span>
- <span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">**Utilitas:** este principio puede verse como la necesidad de que la tecnología tenga una utilidad clara, resolviendo problemas reales y proporcionando valor práctico.</span>
- <span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">**Venustas:** podría definir la elegancia, vista como la eficiencia del diseño del algoritmo y del código, así como la necesidad de interfaces de usuario intuitivas y agradables.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">El enfoque de Vitruvio en la combinación de la funcionalidad y la estética en el diseño, y su interés por la mecánica y la ingeniería, han tenido un impacto duradero en estas disciplinas. Sus ideas pueden ser valiosas al considerar cómo diseñar y construir sistemas complejos incluidos los de IA de manera efectiva y ética.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">En el decimo libro del tratado "De Architectura", Vitruvio hace una alegato a favor de la tecnología y las máquinas para todos los ámbitos de la sociedad (agricultura, navegación, transporte…) lo que es un antecedente claro de la importancia que se le ha dado a la posibilidad de liberar al ser humano de determinadas tareas que pueden ser trasladadas a las máquinas si se consigue el desarrollo tecnológico adecuado.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Dato de interés: de Vitruvio es el estudio de las proporciones ideales del cuerpo humano que posteriormente Leonardo Da Vinci traslado al dibujo en su famoso “hombre de Vitruvio”</span>

<span style="font-size: 12pt; font-family: 'Times New Roman', serif; color: rgb(0, 0, 0);"><span style="mso-ligatures: none;">![](https://libros.catedu.es/uploads/images/gallery/2023-10/embedded-image-5gyy082v.png)</span></span>

<span style="font-size: 10.5pt; line-height: 107%; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Hombre de Vitruvio. Leonardo Da Vinci</span>

---

### <span style="font-size: 28.0pt; line-height: 107%; font-family: 'Segoe UI',sans-serif; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">La Edad Media – Autómatas</span>

<span style="color: rgb(0, 0, 0);"><span style="font-size: 12pt; font-family: 'Times New Roman', serif;"> </span><span style="font-size: 10.5pt; font-family: 'Segoe UI', sans-serif;">La Edad Media fue un período fascinante en la historia de la humanidad, y también encontramos en ella ideas y avances que pueden considerarse escalones intermedios en el camino hacia la Inteligencia Artificial (IA). Esta evolución fue en forma de autómatas y otros artilugios mecánicos. Así, de la mano de desarrollos tecnológicos se produjeron progresos notables en la automatización y la simulación de comportamientos humanos.</span></span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI', sans-serif; color: rgb(0, 0, 0);">Durante la Edad Media, los artesanos y los inventores se inspiraron en los antiguos relatos y mitos que hablaban de autómatas y seres artificiales para crear sus propios dispositivos mecánicos. Estos artilugios, también conocidos como autómatas mecánicos, eran figuras humanoides o animales que se construían con el propósito de imitar movimientos y comportamientos humanos o animales de manera automatizada.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI', sans-serif; color: rgb(0, 0, 0);">Uno de los ejemplos más destacados de mecanismos automáticos de la Edad Media es el famoso **reloj astronómico de Estrasburgo**, construido en el siglo XIV. Este reloj no solo mostraba la hora, sino que también presentaba una serie de figuras mecánicas en movimiento que representaban eventos astronómicos, religiosos y mitológicos. Estas figuras automatizadas, controladas por un intrincado sistema de engranajes, proporcionaban una exhibición visual impresionante y mostraban una comprensión temprana de la ingeniería mecánica y la automatización.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI', sans-serif; color: rgb(0, 0, 0);">Otro ejemplo notable es el famoso **‘*Automa Cavaliere’*** *(1495),* **caballero mecánico, de Leonardo da Vinci**, diseñado durante el Renacimiento. Aunque da Vinci vivió en una época posterior a la Edad Media, su trabajo también se relaciona con la tradición medieval de los autómatas. El caballero mecánico fue un prototipo de una máquina con forma humana diseñada por Leonardo en el siglo XV. Según los dibujos de Leonardo, el Caballero Mecánico habría sido capaz de realizar movimientos como sentarse, mover los brazos y mover la mandíbula. Aunque esta máquina no tenía "inteligencia" en sí misma, es un ejemplo temprano de intentos de crear una máquina capaz de imitar el movimiento y la función humana, una idea que es central en la robótica moderna. </span>

<span style="color: rgb(0, 0, 0);">![](https://libros.catedu.es/uploads/images/gallery/2023-10/embedded-image-38ds7ejw.png)<span style="font-size: 10pt; font-family: Merriweather; background: white;">Autómata construido en base a los bocetos sobre el mismo hallados en 1950.</span></span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI', sans-serif; color: rgb(0, 0, 0);">En la Edad Media también surgieron leyendas y cuentos populares que se relacionaban con autómatas y seres artificiales. Uno de estos relatos es la leyenda del **"Hombre del Palo".** </span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI', sans-serif; color: rgb(0, 0, 0);">El "Hombre de Palo" es una denominación que se le da a un mecanismo automático diseñado por Juanelo Turriano, también conocido como el "autómata de Turriano". Juanelo Turriano fue un famoso relojero e ingeniero italiano del siglo XVI que trabajó para el emperador Carlos V y su hijo Felipe II en España. </span>

<span style="color: rgb(0, 0, 0);"><span style="font-size: 10.5pt; font-family: 'Segoe UI', sans-serif;">El autómata era un mecanismo articulado en for</span>ma de persona, de unos 38 c<span style="font-size: 10.5pt; font-family: 'Segoe UI', sans-serif;">m de alto, que podía moverse por sí mismo y realizar una serie de acciones. Algunas versiones dicen que caminaba por las calles de Toledo ataviado como un monje con sayal y una gran cruz, revestido de madera pero con su interior lleno de engranajes metálicos, cuerdas y ruedas, que le permitian un movimiento propio que imitaba al de una persona, movía los ojos y abría y cerraba su boca.</span></span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI', sans-serif; color: rgb(0, 0, 0);">Los curiosos se agolpaban para ver este invento que dejaba a propios y extraños con la boca abierta. Además, según cuentan las crónicas, este curioso ser llevaba una hucha para pedir limosna, y si algún viandante echaba una moneda, recibía del autómata una reverencia como muestra de gratitud. De hecho se dice que servía como ayudante al propio Juanelo realizando todo tipo de recados.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI', sans-serif; color: rgb(0, 0, 0);">No deja de ser una leyenda, aunque en este caso si que han surgido teorías desarrolladas por historiadores sobre qué pudo ser realmente este curioso invento. Algunos indican que pudo ser una pequeña estatua de madera, con una hucha o cepo como las que podemos ver aún al día de hoy en algunas iglesias, que pedía limosna para el sostenimiento del Nuncio Viejo, hospital situado en una calle próxima, que era conocido por atender a enfermos mentales. Otra versión, dice que pudo ser un estafermo o figura de madera hincada sobre una peana fija, que portaba en un brazo un escudo y en el otro un saco de arena; la costumbre al pasar era dar un golpe al escudo para que este curioso sistema se girase rápidamente y diera con el saco a algún transeúnte despistado. </span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI', sans-serif; color: rgb(0, 0, 0);">El hecho es que al hombre de palo se le pierde la pista y las distintas teorías sobre su destino vuelven a surgir:</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI', sans-serif; color: rgb(0, 0, 0);">Una teoría nos dice que fue destruido, quemado más exactamente, ya que de la sorpresa y el estupor inicial se pasaba fácilmente a sospechar cómo diablos podía moverse este artilugio, se pensaba que atentaba contra la creación divina. (*<span style="background: #F1C40F;"><span style="background-color: rgb(255, 255, 255);">Este argumento, matizado, también está en el debate actual de la IA).</span></span>* La ciencia, en esta época, se consideraba más próxima a la herejía que a la evolución tecnológica. </span>

<span style="color: rgb(0, 0, 0);"><span style="font-size: 10.5pt; font-family: 'Segoe UI', sans-serif;">Otra teoría nos dice que el hombre de palo desaparece sí, pero no se destruye, es más, que se conservó en perfecto estado por una cadena de coleccionistas y lo más sorprendente aún, es que nos podría haber llegado hasta el día de hoy. Al menos existe un autómata que responde a las mismas características que las citadas en el Instituto Smithsonian de Washington D. C., en los Estados Unidos. El artefacto en cuestión tiene dos datos significativos, su fecha y procedencia: datación 1560, origen Alemania o España. Esta evidencia ha llevado a pensar a muchos que este es el auténtico hombre de Palo de Juanelo, el mismo que se paseó por las angostas calles toledanas, increíble pero quizá cierto. En el siguiente video puede apreciarse la figura conservada<span style="color: rgb(53, 152, 219);"> </span></span><span style="text-decoration: underline;"><span style="color: rgb(53, 152, 219); text-decoration: underline;">***<span style="font-size: 10.5pt; font-family: 'Segoe UI', sans-serif;">[Automaton figure of a monk, South Germany or Spain, c. 1560](https://libros.catedu.es/attachments/123)</span>***</span></span></span>

<span style="color: rgb(0, 0, 0);">[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/mMDimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-10/mMDimage.png)</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI', sans-serif; color: rgb(0, 0, 0);"><span style="font-size: 10.5pt; font-family: 'Segoe UI', sans-serif;"> Fuente: https://www.paseostoledomagico.es/leyenda-hombre-de-palo/</span>  
</span>

<span style="color: rgb(0, 0, 0);"></span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI', sans-serif; color: rgb(0, 0, 0);">Esta leyenda da pie a la reflexión sobre el ser humano y sus creaciones<span style="mso-spacerun: yes;"> </span>y el papel de la tecnología en la vida cotidiana, cada día más vigente .</span>

---

### <span style="color: rgb(0, 0, 0);">***<span style="font-size: 28pt; font-family: 'Segoe UI', sans-serif;"> </span>***<span style="font-size: 28pt; font-family: 'Segoe UI', sans-serif;">Edad Moderna </span></span>

> <span style="color: rgb(0, 0, 0);">*<span style="font-size: 10.5pt; font-family: 'Segoe UI', sans-serif;">Racionalismo: “toda acción tiene una razón de ser, una explicación, si se encuentra la razón de la misma, se puede reducir el comportamiento a una serie de postulados lógicos y expresarlos de manera simbólica</span>*<span style="font-size: 10.5pt; font-family: 'Segoe UI', sans-serif;">”</span></span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI', sans-serif; color: rgb(0, 0, 0);">Conforme avanza la historia, los mitos y leyendas van dando paso a historias documentadas sobre logros reales e ideas avanzadas que van marcando el camino de lo que ahora tenemos entre manos. Tenemos que tener claro pues, que el repentino interés actual por la IA no supone que esta haya surgido de repente, los avances se van sucediendo, de manera incremental en unas ocasiones y disruptiva en otras, produciéndose momentos de euforia y también de posterior enfriamiento principalmente debido a que, por lo general, las ideas corren mas que los desarrollos prácticos e incluso teóricos. La importancia de la Edad Moderna radica,<span style="mso-spacerun: yes;"> </span>en este aspecto, en las ideas filosóficas y teorías matemáticas que durante ella se desarrollaron, las cuales fundamentaron posteriores desarrollos prácticos.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI', sans-serif; color: rgb(0, 0, 0);">La Edad Moderna que transcurre en los siglos del XVI al XVIII, se caracteriza entre otras cosas por la vuelta a las ideas clásicas, entre ellas nos interesa destacar la vuelta al racionalismo y su idea central de que **<span style="background: white;">la razón y la deducción son la base del conocimiento </span>**<span style="background: white;">verdadero, en contraposición a la experiencia sensorial o la fe religiosa.</span> La recuperación de esta corriente de pensamiento permitió muchos avances en el terreno conceptual, entre otros el desarrollo de las ideas de autores como **Gottfried Wilhelm Leibniz** y **René Descartes** son relevantes en el contexto de la naturaleza humana y la posibilidad de reducir el lenguaje a un sistema racional y simbólico. Estas ideas supusieron un paso mas para futuros desarrollos en la comprensión de la inteligencia artificial y su relación con el lenguaje y el pensamiento humano.</span>

<span style="color: rgb(0, 0, 0);"><span style="font-size: 10.5pt; font-family: 'Segoe UI', sans-serif;">**Leibniz (**</span><span class="LrzXr kno-fv wHYlTd z8gr9e">1646 - </span><span class="LrzXr kno-fv wHYlTd z8gr9e">1716),</span><span style="font-size: 10.5pt; font-family: 'Segoe UI', sans-serif;"> filósofo y matemático alemán del siglo XVII, desarrolló una filosofía conocida como "**monadología**". En su visión, argumentaba que el mundo estaba compuesto por "mónadas", unidades indivisibles de realidad que poseían una especie de conciencia y percepción. Según Leibniz, estas monadas podían entenderse como entidades fundamentales que formaban la base de toda la realidad y que poseían cierto grado de inteligencia inherente. </span></span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI', sans-serif; color: rgb(0, 0, 0);">En cuanto al lenguaje, Leibniz propuso la idea de que el pensamiento humano podía ser reducido a una combinación de símbolos lógicos y matemáticos. Su visión se basaba en la idea de que el lenguaje podía ser formalizado y que todas las ideas y conceptos podían ser expresados mediante una notación simbólica universal. Esta noción iluminó el desarrollo posterior de los lenguajes formales y la lógica matemática, que son fundamentales en la teoría de la computación y la inteligencia artificial. Esta cita suya, ilustra su teoría: </span>

> <span style="font-size: 10.5pt; font-family: 'Segoe UI', sans-serif; color: rgb(0, 0, 0);">*“La única manera de rectificar nuestros razonamientos es hacerlos tan tangibles como los de los Matemáticos, para que podamos encontrar nuestro error de un vistazo, y cuando haya disputas entre personas, podemos simplemente decir: Calculemos, sin más dilación, a ver quién tiene razón”*</span>

<span style="color: rgb(0, 0, 0);"><span style="font-size: 10.5pt; font-family: 'Segoe UI', sans-serif;">Otro filósofo y científico del siglo XVII, **René Descartes (**</span><span class="LrzXr kno-fv wHYlTd z8gr9e">1596 -</span><span class="LrzXr kno-fv wHYlTd z8gr9e">1650),</span><span style="font-size: 10.5pt; font-family: 'Segoe UI', sans-serif;"><span style="mso-spacerun: yes;"> </span>formuló la famosa afirmación:</span></span>

> *<span style="font-size: 10.5pt; font-family: 'Segoe UI', sans-serif; color: rgb(0, 0, 0);">"Cogito, ergo sum" (Pienso, luego existo), </span>*

<span style="font-size: 10.5pt; font-family: 'Segoe UI', sans-serif; color: rgb(0, 0, 0);">Esta cita destaca la importancia del pensamiento y la conciencia en la definición de la existencia humana. Descartes argumentaba que la capacidad de pensar y tener conciencia era la esencia del ser humano, y que esta capacidad diferenciaba a los humanos de otras formas de vida.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI', sans-serif; color: rgb(0, 0, 0);">En su obra "**Discurso del Método**" Descartes propuso una metodología basada en la duda metódica y la razón como herramientas fundamentales para el conocimiento humano. Su enfoque racionalista y su énfasis en la claridad y la distinción sirvieron de impulso para el desarrollo de una lógica rigurosa y un sistema de razonamiento basado en reglas formales.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI', sans-serif; color: rgb(0, 0, 0);">Descartes también abordó el tema de la reducción, no solo del lenguaje sino del comportamiento, a un sistema racional y simbólico. En su idea del animal-maquina, sugirió que los animales podrían ser vistos como máquinas que funcionaban mecánicamente según reglas predecibles, y que a diferencia de los humanos no estaban dotados de conciencia. Esta idea fue ampliada posteriormente por **E Julien Offray de La Mettrie** en su obra “**El hombre máquina**” **(L'homme Machine)**. Ambas teorías han sido ampliamente discutidas pero dan pie a reflexionar sobre la propia idea de inteligencia y en consecuencia de Inteligencia Artificial.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI', sans-serif; color: rgb(0, 0, 0);">Extraemos de las filosofías de Leibniz y Descartes las perspectivas ofrecidas sobre la naturaleza humana y la posibilidad de reducir el lenguaje y los comportamientos a un sistema racional y simbólico. Desarrollos posteriores basados en sus ideas pueden verse como fundamentos de teorías que desembocan en principios utilizados en inteligencia artificial, especialmente en lo que respecta al procesamiento del lenguaje natural y la lógica simbólica en los sistemas de IA modernos.</span>

<p class="callout warning"><span style="font-size: 10.5pt; font-family: 'Segoe UI', sans-serif; color: rgb(0, 0, 0);"><span style="color: rgb(0, 0, 0);"><span style="font-size: 10.5pt; font-family: 'Segoe UI', sans-serif;">Como hemos visto, ciencia y filosofía han ido de la mano en la evolución del pensamiento humano desde la antigua </span><span style="font-size: 10.5pt; font-family: 'Segoe UI', sans-serif;"><span style="color: #000000; font-family: Segoe UI, sans-serif;">Grecia, ¿en</span><span style="color: rgb(0, 0, 0); font-family: 'Segoe UI', sans-serif; font-size: 10.5pt;"> **qué desastroso momento se rompió esta simbiosis?,** </span></span><span style="font-size: 10.5pt; font-family: 'Segoe UI', sans-serif;">y</span><span style="font-family: 'Segoe UI', sans-serif; font-size: 10.5pt;"> que necesaria se está demostrado en el actual y aparentemente definitivo, resurgimiento de la IA. </span></span></span></p>

---

### <span style="background-color: rgb(255, 255, 255); color: rgb(0, 0, 0);"><span style="font-size: 28pt; font-family: 'Segoe UI', sans-serif; background-color: rgb(255, 255, 255);">La Revolución Industrial</span></span>

> <span style="background-color: rgb(255, 255, 255); color: rgb(0, 0, 0);">*<span style="font-size: 12pt; font-family: 'Times New Roman', serif; background-color: rgb(255, 255, 255);">"Las máquinas nos han dado la posibilidad de producir en grandes cantidades y a menor costo, pero también han generado desafíos en términos de desigualdad y la necesidad de repensar la distribución equitativa de la riqueza." - Karl Marx</span>*</span>

> <span style="background-color: rgb(255, 255, 255); color: rgb(0, 0, 0);">*<span style="font-size: 12pt; font-family: 'Times New Roman', serif; background-color: rgb(255, 255, 255);">"Si le hubiera preguntado a la gente qué querían, habrían dicho 'caballos más rápidos'." - Henry Ford</span>*</span>

> <span style="background-color: rgb(255, 255, 255); color: rgb(0, 0, 0);">*<span style="font-size: 12pt; font-family: 'Times New Roman', serif; background-color: rgb(255, 255, 255);">"Las máquinas son la maldición de la humanidad. Son una amenaza para nuestro trabajo, nuestra libertad y nuestra dignidad." - Ludditas</span>*</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; background: white; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Los ludditas fueron un movimiento de trabajadores en la Inglaterra del siglo XIX que se opusieron a la creciente mecanización y automatización de la industria textil. Su objetivo era preservar sus empleos y protestar contra las máquinas que los reemplazaban. Aunque no existe una cita específica de un líder luddita, esta frase resume la esencia de su oposición a las máquinas y el temor de que estas tecnologías redujeran los empleos y el bienestar de los trabajadores.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; background: white; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">La Revolución Industrial, que tuvo lugar en los siglos XVIII y XIX, marcó un punto de inflexión en la historia al introducir cambios significativos en la producción, la economía y la sociedad. Con ella se universalizaron tecnologías y conceptos que contribuyeron a la idea, para aquellos que se beneficiaban de la misma, de que la automatización y la sustitución de maquinas por personas en el trabajo era positiva debido al incremento de productividad, la reducción de costes y la maximización del beneficio, en definitiva, termino de imponer de manera generalizada el capitalismo como sistema socio-político en occidente.<span style="mso-spacerun: yes;"> </span></span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; background: white; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Durante la Revolución Industrial, una de las invenciones clave fue la máquina de vapor, que impulsó la mecanización y la automatización de la producción. La primera máquina de vapor práctica fue desarrollada por **James Watt** en el siglo XVIII, y su uso generalizado en la industria tuvo un impacto revolucionario en la eficiencia y la velocidad de la producción. Esta máquina se considera un hito importante en la transición hacia la producción industrializada y para el surgimiento de las fábricas modernas.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; background: white; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Sin embargo, a medida que avanzaba la Revolución Industrial, también surgieron tensiones y oposición social al avance tecnológico y la automatización. La introducción de máquinas y sistemas mecanizados generó preocupaciones entre los trabajadores, que temían la pérdida de empleos y la explotación laboral. Muchos artesanos y trabajadores manuales se enfrentaron a la desaparición de sus oficios tradicionales debido a la creciente mecanización y la demanda de mano de obra barata en las fábricas.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; background: white; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Estas tensiones sociales y el conflicto entre los trabajadores y los avances tecnológicos durante la Revolución Industrial son un precursor histórico de las preocupaciones actuales en torno a la automatización que la IA promete conseguir, ya no solo de actividades mecánicas sino también de actividades cognitivas.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; background: white; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">La oposición a la automatización y la consiguiente pérdida de determinados empleos se ha repetido en diferentes momentos históricos, a medida que las tecnologías han avanzado y han surgido debates sobre los impactos socioeconómicos y el futuro del trabajo.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; background: white; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Encontramos paralelismos entre la Revolución Industrial y el surgimiento posterior de la IA en relación con el desarrollo de tecnologías y conceptos que se vinculan con la automatización y la producción en masa. También hay claras similitudes en inicial oposición social y las tensiones laborales que ocurrieron en ese período histórico que reflejan las preocupaciones recurrentes en torno a los avances tecnológicos y la automatización que también se han dado en otros momentos de la historia y cuyo debate esta volviendo a surgir actualmente en lo relacionado con la IA y el futuro del trabajo.</span>

![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/8rWimage.png)

<span style="font-size: 10.5pt; line-height: 107%; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; mso-color-alt: windowtext; background: white; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Revolución industrial. Imagen propia. Generada por Bing con tecnología de DALL·E 3</span>

---

### <span style="font-size: 28.0pt; line-height: 107%; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; mso-fareast-theme-font: major-fareast; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">La llegada de los bits</span><span style="font-size: 28.0pt; font-family: 'Times New Roman',serif; mso-fareast-font-family: 'Times New Roman'; color: #b96ad9; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;"> </span>

> *<span style="font-family: Calibri, sans-serif; color: black; background: white;">"Las leyes </span><span style="font-family: 'Calibri',sans-serif; mso-ascii-theme-font: minor-latin; mso-hansi-theme-font: minor-latin; mso-bidi-font-family: 'Times New Roman'; mso-bidi-theme-font: minor-bidi; color: black; background: white;">del</span><span style="font-family: Calibri, sans-serif; color: black; background: white;"> pensamiento son leyes matemáticas y, por lo tanto, la ciencia del razonamiento, de las pruebas, es simplemente una rama de la ciencia del número." </span><span style="font-family: 'Calibri',sans-serif; mso-ascii-theme-font: minor-latin; mso-hansi-theme-font: minor-latin; mso-bidi-font-family: 'Times New Roman'; mso-bidi-theme-font: minor-bidi; color: black; background: white;">- George Boole</span>*

> *<span style="font-family: 'Calibri',sans-serif; mso-ascii-theme-font: minor-latin; mso-hansi-theme-font: minor-latin; mso-bidi-font-family: 'Times New Roman'; mso-bidi-theme-font: minor-bidi; color: black; background: white;">"Las máquinas pueden hacer cualquier cosa que un ser humano pueda describir formalmente." - Alan Turing</span>*

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; background: white; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Durante el siglo XIX y principios del XX, se dio una confluencia de ideas filosóficas, matemáticas y tecnológicas que cimentaron el surgimiento de la inteligencia artificial y la computación moderna. </span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; background: white; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">En el siglo XIX, la lógica formal y la teoría de conjuntos desarrolladas por figuras como George Boole y Gottlob Frege allanaron el camino para la lógica computacional. La lógica booleana, un sistema matemático para representar el razonamiento lógico, que utiliza operaciones de AND, OR y NOT, se convirtió en fundamental para el diseño de circuitos eléctricos en computadoras. Estos tres operadores son fundamentales en la lógica booleana y se utilizan para realizar operaciones de conjunción, disyunción y negación en expresiones lógicas.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; background: white; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Introduzcamos ahora a los bits: Los bits son la unidad básica de información en la computación y la electrónica. El término "bit" proviene de la contracción de las palabras "binary digit" (dígito binario) y representa la menor cantidad de información almacenada en una computadora. Un bit puede tener uno de dos valores posibles: 0 o 1, que corresponden a los estados de "apagado" y "encendido" en la electrónica. En esencia, los bits son la forma en que las computadoras representan y manipulan información a nivel fundamental.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; background: white; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">La relación entre los bits y la lógica booleana es fundamental y clave para comprender como se pasó de las ideas a las maquinas. Como hemos adelantado, la lógica booleana es un sistema de álgebra basada en la teoría de George Boole y utiliza valores booleanos (verdadero o falso) para representar estados lógicos. La relación con los bits radica en que estos valores booleanos se pueden identificar directamente con los valores 0 y 1 utilizados en la representación binaria de la información.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; background: white; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Aquí hay una correspondencia simple entre los valores booleanos y los bits:</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; background: white; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">- Verdadero (True) se puede representar como 1 en forma binaria.  
\- Falso (False) se puede representar como 0 en forma binaria.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; background: white; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Esta correspondencia permite que la lógica booleana se aplique directamente a la manipulación de bits en las computadoras. Los operadores lógicos AND, OR y NOT se utilizan para realizar operaciones lógicas en valores booleanos (0 y 1) almacenados en bits. Por ejemplo:</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; background: white; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">- El operador AND realiza una operación de "y lógico", lo que significa que devuelve 1 solo si ambos bits son 1, de lo contrario, devuelve 0.  
\- El operador OR realiza una operación de "o lógico", lo que significa que devuelve 1 si al menos uno de los bits es 1.  
\- El operador NOT invierte un bit, convirtiendo 1 en 0 y viceversa.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; background: white; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">En resumen, los bits son la unidad básica de información en las computadoras y se relacionan directamente con la lógica booleana mediante una correspondencia simple entre los valores booleanos (verdadero/falso) y los valores binarios (1/0), lo que permite la manipulación lógica de datos en las computadoras.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; background: white; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">El concepto de bits (dígitos binarios) y la base binaria en la que se basa el sistema de numeración binario se originaron en la década de 1930, aunque la idea de representar información en forma de bits y su aplicación en la informática moderna evolucionaron a lo largo de varias décadas. Algunos de los hitos cronológicos mas destacados relacionados con esta evolución son:</span>

![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/wsHimage.png)

Elaboración propia con Genially

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; background: white; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">En este periodo histórico ocurrieron otros acontecimientos muy reseñables como lo que se considera el primer diseño y a su vez el primer intento de construcción de una computadora que ocurrió en el XIX. Charles Babbage diseñó la Máquina Analítica en la década de 1830, una máquina mecánica que, aunque nunca se construyó completamente en su época, representó la idea de una computadora programable. Utilizaba tarjetas perforadas para recibir instrucciones y era capaz de realizar cálculos aritméticos. Ada Lovelace trabajó con Babbage en este proyecto y es reconocida por escribir lo que se considera el primer algoritmo destinado a ser procesado por una máquina, vislumbrando la capacidad de las computadoras para ir más allá de los simples cálculos numéricos. </span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; background: white; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">La máquina no se construyó en su momento ya que los contemporáneos de Babbage lo consideraron un sueño delirante. De no haber sido así, se podría haber anticipado la construcción de los primeros ordenadores más de un siglo. </span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; background: white; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">La Máquina Analítica de Babbage no gestionaba la información de manera binaria ya que fue diseñada antes de que el algebra booleana fuera formalmente introducida. Así que aunque el procesamiento binario de datos, que es fundamental para las computadoras modernas, no fue una característica del diseño original de la Máquina Analítica, sus conceptos y diseños si que se consideran parte fundamental para el desarrollo posterior de las computadoras, y Babbage es a menudo referido como uno de los "padres de la computación". </span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; background: white; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Charles Babbage afirmaba que las máquinas transformarían el mundo. Invirtió considerables esfuerzos y su propia fortuna en el diseño y la creación de la Máquina Analítica. Sin embargo, su visión no pudo concretarse debido a la falta de apoyo y fue ridiculizado por sus contemporáneos. Babbage, un adelantado a su época, escribió algo que resultaría ser cierto:</span>

> *<span style="font-size: 11.0pt; line-height: 107%; font-family: 'Calibri',sans-serif; mso-ascii-theme-font: minor-latin; mso-fareast-font-family: Calibri; mso-fareast-theme-font: minor-latin; mso-hansi-theme-font: minor-latin; mso-bidi-font-family: 'Times New Roman'; mso-bidi-theme-font: minor-bidi; color: black; mso-ansi-language: ES; mso-fareast-language: EN-US; mso-bidi-language: AR-SA;">"Otra generación deberá evaluar mi trabajo". Charles Babbage</span>*

![](https://libros.catedu.es/uploads/images/gallery/2023-10/embedded-image-hxu6qh8i.png)<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; background: white; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">La Máquina Analítica concebida por Charles Babbage en 1821 y construida en 1991 por un equipo de ingenieros del Museo de Ciencias de Londres .GETTY IMAGES</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; background: white; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">En el siglo XX, las ideas y teorías abstractas relacionadas con la computación y el procesamiento de información se convierten en realidad práctica en forma de dispositivos funcionales. La Atanasoff-Berry Computer (ABC) en la década de 1930 y la Harvard Mark I en la década de 1940 fueron algunos de los primeros ordenadores electromecánicos. Utilizaban relés y tubos de vacío para realizar cálculos, y su programación era principalmente a través de tarjetas perforadas o cintas de papel. Utilizaban la lógica booleana en su funcionamiento interno ("software"). Por ejemplo, para realizar operaciones aritméticas o lógicas en números binarios, se utilizaban circuitos que implementaban operaciones booleanas. La lógica booleana se convirtió en una parte esencial de la programación y el diseño de hardware de las primeras computadoras. Estas máquinas eran enormes y lentas según los estándares actuales, pero representaban un avance significativo en la capacidad de procesamiento de información.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; background: white; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;"> Estos primeros ordenadores permitieron poner en práctica las ideas de lógica y automatización desarrolladas en el siglo anterior. La capacidad de programar algoritmos y realizar cálculos complejos en una máquina fue la primera etapa en el camino hacia la IA moderna. Las teorías matemáticas del siglo XIX se casaban con el funcionamiento de estas máquinas, ya que los principios de lógica y cálculo eran ahora ejecutables en hardware. </span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; background: white; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Vemos entonces a modo de resumen que el siglo XIX fue un período de fermentación intelectual que estableció los fundamentos teóricos de la computación, mientras que el siglo XX vio el desarrollo de los primeros ordenadores prácticos. Juntos, estos avances marcaron la transición de las ideas sobre automatización y procesamiento de la información desde el reino de la especulación teórica hasta la realidad tangible, abriendo el camino hacia la era de la computación y la inteligencia artificial.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; background: white; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Cabe destacar en esta etapa histórica al matemático y lógico británico Alan Turing (1912-1954). Turing introdujo el concepto de las "máquinas de Turing", una idea teórica sobre un aparato capaz de ejecutar cualquier operación computacional. Se refiere a un modelo abstracto de una computadora compuesto por una cinta infinita segmentada en casillas, una cabeza de lectura/escritura que se desplaza a lo largo de la cinta y un conjunto limitado de estados y reglas de transición. Las máquinas de Turing fueron fundamentales en la evolución de la teoría de la computación y ejercieron una influencia notable en la Inteligencia Artificial.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; background: white; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Durante la Segunda Guerra Mundial, el trabajo desarrollado por Alan Turing en criptografía resulto en un importante papel en la guerra. Turing y su equipo desarrollaron la máquina "Colossus", considerada una de las primeras computadoras electrónicas programables. Esta máquina ayudó a descifrar los códigos de comunicación alemanes. El funcionamiento de esta máquina se basaba en el uso de interruptores electrónicos para representar y procesar información en forma de bits (0 y 1).</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; background: white; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">En 1943, Warren McCulloch y Walter Pitts introdujeron el concepto de "neurona artificial", una abstracción matemática de una célula nerviosa. La neurona McCulloch-Pitts proporcionó un modelo de cómo las neuronas biológicas podrían realizar cálculos simples mediante la combinación de señales de entrada y la aplicación de una función de activación. Su modelo sentó las bases para el desarrollo posterior de las redes neuronales artificiales, que son esenciales en la IA moderna. </span>

![](https://libros.catedu.es/uploads/images/gallery/2023-10/embedded-image-i7lrjdrs.png)<span style="font-size: 10.5pt; line-height: 107%; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; background: white; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Neurona artificial (McCulloch Pitts)</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; background: white; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">En 1950, Alan Turing contribuyó de nuevo en sentar las bases de la inminente disciplina de la IA proponiendo la famosa "prueba de Turing", un test para determinar si una máquina puede exhibir un comportamiento inteligente indistinguible del de un ser humano. Esta idea planteó cuestionamientos profundos sobre la naturaleza de la inteligencia y allanó el camino para la investigación y el desarrollo de la IA en las décadas siguientes. En este video "el propio Turing" explica el funcionamiento del test que lleva su nombre. </span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; background: white; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;"><iframe allowfullscreen="allowfullscreen" height="314" src="https://www.youtube.com/embed/2Avnyp81bC0?t=1s" width="560"></iframe>

</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; color: black; background: white; mso-font-kerning: 0pt; font-weight: normal;">El Test de Turing contado por Alan Turing. Ejemplo de video generado 100% con IA. https://www.youtube.com/@JoaquinPena</span>

# Unidad 1.3. Inicios y evolución de la IA.

### ***El nacimiento de la IA***

> *Texto en la placa conmemorativa de la conferencia de Dartmouth (1956): "Primera utilización del término "Inteligencia Artificial". Fundando la Inteligencia Artificial como una disciplina de investigación para proceder sobre la base de la conjetura de que cada aspecto del aprendizaje o cualquier otra característica de la inteligencia puede, en principio, describirse tan precisamente que se puede construir una máquina para simularlo".*

A partir de los años 50 se produce una evolución explosiva de la IA aunque con altibajos, también llamados inviernos de IA.

El resumen de tal proceso se presenta en esta imagen y se desarrolla a continuación:

![image.png](https://libros.catedu.es/uploads/images/gallery/2023-06/scaled-1680-/dlyimage.png)

Desde la histórica **conferencia de Dartmouth en 1956,** que marcó el inicio formal de la Inteligencia Artificial (IA) como campo de investigación, hasta el año 2011, se han producido importantes avances en la evolución de la IA. Los impulsores de la conferencia de Dartmouth fueron: J**ohn Mcarthy (Dartmoth College), Marvin L. Minsky (MIT), Nathaniel Rochester (IBM, y Claude Shannon (Laboratorios Bell)**. Cada uno de ellos era líder en áreas cruciales para el nacimiento de la IA. McCarthy en la formulación de conceptos de IA, Minsky en el aprendizaje de máquinas y redes neuronales, Rochester en hardware y arquitectura de computadoras, y Shannon en teoría de la información. Sus conocimientos y colaboraciones fueron fundamentales para establecer una base sólida que permitió el desarrollo y crecimiento de la IA como una disciplina de investigación.

A partir de ese momento, y creciendo sobre los cimientos de las teorías, desarrollos conceptuales y tecnológicos acumulados hasta ese momento, se fueron sucediendo logros técnicos y tecnológicos que han desembocado en la irrupción aparentemente imparable de la IA en la actualidad.

Uno de los hitos clave fue la invención del **perceptrón por Frank Rosenblatt en 1957**. El perceptrón fue uno de los primeros modelos de aprendizaje automático inspirados en las redes neuronales del cerebro humano. El perceptrón, era una evolución de la neurona McCulloch-Pitts, si bien mejoraba a esta al introducir el concepto de aprendizaje automático. Mientras que la neurona de McCulloch-Pitts tenía pesos fijos, el perceptrón permitía el ajuste de los pesos en función de los datos de entrada a través de un proceso de aprendizaje simple, lo que permitía que el modelo aprendiera a clasificar diferentes patrones de datos automáticamente. Esta capacidad de aprender de los datos fue un avance significativo hacia el desarrollo de algoritmos más avanzados de aprendizaje automático y redes neuronales.

**Seymour Papert**, que trabajó junto con Marvin Minsky y ambos fueron coautores de un libro muy influyente llamado "Perceptrons" en 1969, que exploraba las limitaciones y las capacidades de los perceptrones y las redes neuronales. Su trabajo junto con Minsky fue crucial para entender y analizar las capacidades y limitaciones de estos modelos, lo cual fue fundamental en el desarrollo temprano de la inteligencia artificial y el aprendizaje automático.

> *"El perceptrón es el embrión de una computadora que será capaz de hablar, caminar, ver, escribir, reproducirse y ser consciente de su existencia" Seymour Papert*

![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/a1Himage.png)

Comparativa gráfica entre una neurona y el perceptrón. [https://inteligenciafutura.mx/english-version-blog/blog-06-english-version](https://inteligenciafutura.mx/english-version-blog/blog-06-english-version)

---

### ***Ciclos de esperanza y escepticismo: Los Altibajos de la IA (1970-2010)***

Sin embargo, a pesar de sus prometedoras capacidades, pronto surgieron limitaciones y desafíos que llevaron a un declive en la investigación de la IA, conocido como el **"primer invierno de la IA".** La citada publicación "Perceptrons" en la que también se mencionaban las limitaciones del mismo anticipó ese declive.

En el "primer invierno de la IA", que tuvo lugar durante la década de 1970 y principios de la década de 1980, los avances en la IA se estancaron debido a la falta de resultados prácticos y las expectativas excesivas. El financiamiento se redujo y muchos investigadores abandonaron el campo.

Si bien, aún sin financiación a gran escala, los trabajos y desarrollos teóricos siguieron produciéndose y en 1974 el matemático y economista **Paul Werbos** publicó su tesis doctoral en la que introdujo el concepto del algoritmo de **retropropagación (backpropagation)** que es fundamental para entrenar **redes neuronales multicapa**. Este algoritmo se convirtió en una base crucial para el desarrollo del **aprendizaje profundo**, facilitando el entrenamiento eficaz de redes neuronales y contribuyendo al avance de la inteligencia artificial.

![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/zr1image.png)

Esquema gráfico del funcionamiento del algoritmo de retropropagación. [https://www.analyticsvidhya.com/blog/2023/01/gradient-descent-vs-backpropagation-whats-the-difference/](https://www.analyticsvidhya.com/blog/2023/01/gradient-descent-vs-backpropagation-whats-the-difference/)

A grandes rasgos el algoritmo de retropropagación introduce el posible error cometido en la predicción realizada por el algoritmo respecto al resultado esperado, permitiendo a la red neuronal ajustar los pesos de los cálculos que se realizan en las capas de neuronas con el objetivo de afinar cada vez mas el resultado final.

Avances como la retropropagación, el nuevo enfoque de los desarrollos que se centraban en problemas concretos, lo que resultó en lo que se dio a denominar **Sistemas Expertos**, así como la fundamentación de los sistemas en la gestión estructurada de grandes cantidades de datos condujo a mediados de la década de 1980 a un resurgimiento en la investigación de la IA y a una vuelta de la financiación, impulsada no solo por iniciativa privada sino también por proyectos nacionales como en Japón o Estados Unidos.

Sin embargo, a finales de la década de los 80, volvió a enfriarse el entusiasmo. Las causas en esta ocasión se encontraban en un estancamiento provocado por las limitaciones tecnológicas y la falta de robustez en los sistemas existentes. Por tanto, se dejaron de lado los proyectos en curso en lo que se denomino "**segundo invierno de la IA**" y los esfuerzos volvieron a centrarse en un replanteamiento del enfoque.

Este cambio de perspectiva se materializó en varios frentes:

<div id="bkmrk--4" style="width: 100%;"><div style="position: relative; padding-bottom: 200%; padding-top: 0; height: 0;"><div style="width: 100%;"><div style="position: relative; padding-bottom: 200%; padding-top: 0; height: 0;"><iframe allowfullscreen="allowfullscreen" frameborder="0" height="1600" scrolling="yes" src="https://view.genial.ly/65246f2a064bf30010bfd3f4" style="position: absolute; top: 0px; left: 0px; width: 812px; height: 1631px;" title="Nuevos enfoques IA" width="800"></iframe>

</div></div></div></div><div class="group w-full text-token-text-primary border-b border-black/10 gizmo:border-0 dark:border-gray-900/50 gizmo:dark:border-0 bg-gray-50 gizmo:bg-transparent dark:bg-[#444654] gizmo:dark:bg-transparent" data-testid="conversation-turn-3" id="bkmrk-https%3A%2F%2Fview.genial."><div class="p-4 justify-center text-base md:gap-6 md:py-6 m-auto"><div class="flex flex-1 gap-4 text-base mx-auto md:gap-6 gizmo:gap-3 gizmo:md:px-5 gizmo:lg:px-1 gizmo:xl:px-5 md:max-w-2xl lg:max-w-[38rem] gizmo:md:max-w-3xl gizmo:lg:max-w-[40rem] gizmo:xl:max-w-[48rem] xl:max-w-3xl }"><div class="relative flex w-[calc(100%-50px)] flex-col gap-1 gizmo:w-full md:gap-3 lg:w-[calc(100%-115px)] agent-turn"><div class="flex flex-grow flex-col gap-3 max-w-full"><div class="min-h-[20px] flex flex-col items-start gap-3 whitespace-pre-wrap break-words overflow-x-auto"><div class="markdown prose w-full break-words dark:prose-invert dark">Relacionado con este cambio de paradigma se publico el artículo:</div></div></div></div></div></div></div><div class="group w-full text-token-text-primary border-b border-black/10 gizmo:border-0 dark:border-gray-900/50 gizmo:dark:border-0 bg-gray-50 gizmo:bg-transparent dark:bg-[#444654] gizmo:dark:bg-transparent" data-testid="conversation-turn-5" id="bkmrk-%22elephants-don%E2%80%99t-pla"><div class="p-4 justify-center text-base md:gap-6 md:py-6 m-auto"><div class="flex flex-1 gap-4 text-base mx-auto md:gap-6 gizmo:gap-3 gizmo:md:px-5 gizmo:lg:px-1 gizmo:xl:px-5 md:max-w-2xl lg:max-w-[38rem] gizmo:md:max-w-3xl gizmo:lg:max-w-[40rem] gizmo:xl:max-w-[48rem] xl:max-w-3xl }"><div class="relative flex w-[calc(100%-50px)] flex-col gap-1 gizmo:w-full md:gap-3 lg:w-[calc(100%-115px)] agent-turn"><div class="flex flex-grow flex-col gap-3 max-w-full"><div class="min-h-[20px] flex flex-col items-start gap-3 whitespace-pre-wrap break-words overflow-x-auto"><div class="markdown prose w-full break-words dark:prose-invert dark">- **"Elephants Don’t Play Chess" de Rodney Brooks (Laboatorio de IA del MIT)**

</div></div></div></div></div></div></div>En este artículo, **Rodney Brooks** argumenta en contra del enfoque tradicional basado en la lógica simbólica y a favor de un enfoque más basado en la interacción con el entorno. Brooks propone que los sistemas de IA deberían estar más arraigados en el mundo físico y ser capaces de interactuar con él de manera efectiva, en lugar de estar confinados a tareas abstractas y descontextualizadas como jugar al ajedrez. Su trabajo promovió una visión de la IA que valora la interacción con el entorno y la capacidad de adaptarse a él, lo cual es crucial para el desarrollo de robots autónomos y otros sistemas de IA interactuantes.

[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/H87image.png)https://msujaws.wordpress.com/2010/11/18/elephants-dont-play-chess/](https://libros.catedu.es/uploads/images/gallery/2023-10/H87image.png)

En contraposición a los enfoques anteriores que se centraban en la lógica simbólica y en sistemas expertos con un conocimiento codificado de manera rígida, estos nuevos enfoques adoptaron una perspectiva más flexible y basada en datos, que permitió a la IA superar el segundo invierno y entrar en una nueva era de innovación y crecimiento. Además, el apoyo continuo de la comunidad académica y de la industria, junto con avances en hardware y disponibilidad de datos, contribuyeron a superar las limitaciones que habían causado el segundo invierno de la IA.

Estos cambios en el enfoque hacia una IA más interactuante y emergente representaron un movimiento importante lejos de los enfoques anteriores, y se alinean con la tendencia general hacia la IA que es capaz de aprender y adaptarse de manera más efectiva a su entorno.

Este periodo, que abarcaría desde la década de 1990 hasta finales de la década de 2010, estuvo plagado de logros concretos de la IA que supusieron hitos importantes en la constatación de su evolución en campos que siguen desarrollándose actualmente, como ejemplos

- **Estrategias de juego y simulación:** En una serie de seis partidas de ajedrez, la computadora **Deep Blue de IBM** derrotó al entonces campeón mundial **Garry Kasparov.** Esta victoria marcó la primera vez que una máquina derrotó a un campeón mundial de ajedrez en condiciones de torneo, y fue un hito significativo en la demostración de la capacidad de las máquinas para realizar tareas que tradicionalmente se consideraban dominio exclusivo de la inteligencia humana.

- **Reconocimiento de voz: Dragon NaturallySpeaking** fue uno de los primeros programas comerciales de reconocimiento de voz, presentado en 1997. Permitió a los usuarios hablar directamente a sus computadoras y convertir sus palabras en texto. Todavía se comercializa en la actualidad.

- **Conducción autónoma: e**l <span style="color: rgb(53, 152, 219);">[<span style="text-decoration: underline;">**DARPA Grand Challenge**</span>](https://es.wikipedia.org/wiki/DARPA_Grand_Challenge) </span>(2004-2007) fue una serie de desafíos, organizados por la Agencia de Proyectos de Investigación Avanzada de Defensa (DARPA) de EE.UU. que incentivaron el desarrollo de vehículos autónomos. El desafío de 2005 fue notable porque cinco vehículos completaron un recorrido en el desierto de 131 millas, con el equipo de Stanford llamado **"Stanley"** llegando primero.

- **Procesamiento de lenguaje natural (NLP):**  **WordNet** (1995) una base de datos léxica para el inglés que ha sido fundamental para muchas aplicaciones de NLP. Ayuda en la relación semántica entre palabras. También en este campo **IBM Watson,** sistema de IA capaz de responder a preguntas en lenguaje natural y con capacidad de aprendizaje automático venció contra campeones humanos en el juego de televisión "**Jeopardy!**".

[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/tawimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-10/tawimage.png)

Watson de IBM. De Clockready - Trabajo propio, CC BY-SA 3.0, [https://commons.wikimedia.org/w/index.php?curid=15891787](https://commons.wikimedia.org/w/index.php?curid=15891787)

- **Reconocimiento de imágenes:** **Scale-Invariant Feature Transform (SIFT)** es un algoritmo usado en visión artificial para extraer características relevantes de las imágenes que posteriormente pueden usarse en reconocimiento de objetos, detección de movimiento, estereopsis, registro de la imagen y otras tareas. El algoritmo fue publicado por primera vez por **David Lowe** en 1999​ pero lo describió completamente​ y patentó​ en Estados Unidos en 2004.
    
    También en reconocimiento de imágenes es destacable **ImageNet** o **ImageNet Large Scale Visual Recognition Challenge (ILSVRC).** Iniciado en 2010, este desafío se convirtió en una competición anual que evalúa los algoritmos en tareas de detección de objetos y clasificación de imágenes a gran escala utilizando el conjunto de datos <span style="text-decoration: underline;"><span style="color: rgb(53, 152, 219); text-decoration: underline;">[**ImageNet**](https://cs.stanford.edu/people/karpathy/cnnembed/cnn_embed_full_6k.jpg)</span></span>. La competición ha tenido un impacto inmenso en el avance de los algoritmos de reconocimiento de imágenes, particularmente con el advenimiento de las **redes neuronales convolucionales (CNN).**

- **Google Brain:** fue fundado en 2011. Uno de sus primeros proyectos importantes fue un **sistema de aprendizaje profundo** que, cuando se entrenó con miles de horas de videos de YouTube, aprendió por sí mismo a reconocer gatos y otros objetos. Esta demostración fue una de las primeras en mostrar el poder y potencial del aprendizaje profundo a gran escala.

---

### ***Hitos contemporáneos, de la IA a la AGI*** 

> *"Attention is all you need."* - Vaswani et al., "Attention Is All You Need" (2017)

> *"Los modelos de lenguaje como ChatGPT pueden ser herramientas increíblemente poderosas, pero también conllevan una gran responsabilidad para garantizar que se utilicen de manera ética y segura."* - Sam Altman

Durante el periodo de 2011 a 2023, ha habido un notable avance en las tecnologías de Inteligencia Artificial, particularmente en el desarrollo de nuevos **algoritmos**, evolucionadas **redes neuronales ,** así como revolucionarias **arquitecturas**. Estas tecnologías han sido fundamentales para el procesamiento de imágenes, el procesamiento del lenguaje natural y otras tareas de IA. Aquí se presenta una visión general de su evolución:

En cuanto a las **redes neuronales**  destacan:

- Las **redes neuronales generativas adversariales (GAN)**, la red consta de dos modelos, uno generador y otro discriminador.   
    El discriminador debe analizar las muestras generadas por el generador y tratar de discernir si son reales o sintéticas, retroalimentando el aprendizaje.

<table border="1" id="bkmrk--8" style="border-collapse: collapse; width: 100%; height: 383.663px;"><colgroup><col style="width: 50%;"></col><col style="width: 50%;"></col></colgroup><tbody><tr style="height: 383.663px;"><td style="height: 383.663px;"><span id="bkmrk--9" style="font-weight: normal;">![](https://lh3.googleusercontent.com/7MCHPQEP5INP4Rs60wheBlMmSlDodnQeqh0GP0HkeivJtc5R29JayJr6j2uIrhoDWiJQxOaqFVFczbyvQtgZnt8bE2iEw7VvVjb5SjpQpqRy6zopQJTxJ27Zrfher2OJirusw8r6uWMJAxIsK10ifzz0aQ=s2048)</span></td><td style="height: 383.663px;"><span id="bkmrk--10" style="font-weight: normal;">![](https://lh6.googleusercontent.com/1Vk019sWLfKh0Vmfo0pgnTfw5z9au57rAEYHj2q9ji-G7lcragH0I3x60uh8tI3u5p0IauyQTEBXvWd-P-wk35UcBAYstMG8t8ZlYB-EGX8K_Ue3ZkMyR4UvMhmQj6WqhrFjOxizBRFvarrZAtWZlP2kbg=s2048)</span></td></tr></tbody></table>

A la izquierda una GAN "trabajando" para crear el retrato de ***Edmond Belamy***, a la derecha. Esta obra fue subastada en **Christie's** y se convirtió así en la primera casa de apuestas en subastar una obra generada por una IA.

El **Generador** (de la red GAN) produjo imágenes basadas en un conjunto de datos de 15.000 retratos pintados entre los siglos XIV y XX, y el **Discriminador** intentó diferenciar las obras creadas por el hombre y las generadas por IA.

"El objetivo es engañar al Discriminador haciéndole creer que las nuevas imágenes son retratos de la vida real", dice Caselles-Dupré, cofundador de *Obvious,* colectivo artístico promotor de la iniciativa. "Entonces tenemos un resultado". Edmon Belamy es uno de los 11 retratos que representan a la familia ficticia Belamy.

- Las **redes neuronales convolucionales (CNN),** citadas anteriormente: Las CNN experimentaron un gran avance en el procesamiento de imágenes y la visión por computadora. En 2012, el modelo **AlexNet** revolucionó el campo al ganar la competición ImageNet, superando con éxito a los enfoques tradicionales. Desde entonces, se han propuesto y mejorado diversas arquitecturas de CNN, como VGGNet, InceptionNet y ResNet, que han superado los límites de precisión en tareas de clasificación, detección y segmentación de objetos en imágenes.

- Las **redes neuronales LSTM (Long Short-Term Memory)** son un tipo de red neuronal recurrente (RNN) que han sido fundamentales en el procesamiento del lenguaje natural y en la generación de texto. Las LSTM resuelven el problema de las RNN tradicionales al permitir el almacenamiento y el acceso a información a largo plazo, lo que las hace más efectivas en el procesamiento de secuencias largas. Estas redes han mejorado significativamente la capacidad de modelar y generar texto coherente y natural.

Además de las redes neuronales la evolución de las **arquitecturas**, entendidas como el diseño general de la estructura de un modelo, ha representado un salto fundamental en el campo de la inteligencia artificial y en concreto el procesamiento de lenguaje natural (NLP):

- La **arquitectura encoder-decoder**, se ha utilizado para la extracción de características y la representación eficiente de datos. Esta arquitectura permite comprimir la información relevante de una entrada en una **representación latente de menor dimensión**, lo que facilita el procesamiento y análisis posterior.

- Los **transformers,** son una arquitectura de redes neuronales que ha revolucionado el procesamiento del lenguaje natural y otras tareas de secuencia. Introducidos en 2017, los transformers se basan en el **mecanismo de atención** para capturar relaciones entre elementos en una secuencia. Esta arquitectura ha demostrado un rendimiento sobresaliente en tareas como la traducción automática, la generación de texto y el procesamiento del lenguaje natural.

Estos avances técnicos dieron pie a la consecución de determinados logros, algunos de los cuales se consideran momentos clave en la historia de la IA, algunos de ellos son:

- **AlphaGo - AlphaZero:** en 2014 Google presenta su sistema de IA llamado **Google DeepMind** y lanza su primer gran proyecto de IA conocido como **AlphaGo.** AlphaGo derrota a **Lee Sedol**, campeón mundial de Go, un juego extremadamente complejo y estratégico, demostrando la capacidad de la IA para superar a los mejores expertos humanos en juegos de mesa. Alpha Go había sido entrenado mediante una combinación de **aprendizaje supervisado** y aprendizaje por refuerzo, utilizando una gran cantidad de datos de partidas humanas.

[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/ekQimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-10/ekQimage.png)

Posteriormente, DeepMind subió la apuesta y en 2017 lanzó **AlphaGo Zero**. A diferencia de AlphaGo, que se entrenó en juegos jugados por humanos, AlphaGo Zero fue entrenado, a partir del único conocimiento de las reglas del juego, desde cero, solo mediante el **aprendizaje de refuerzo**. A través de la autoevaluación y la retroalimentación de las partidas jugadas contra ella misma, AlphaGo Zero ajustaba sus estrategias y mejoraba su rendimiento. AlphaGo Zero se convirtió en el mejor jugador del mundo en tres días, superando la versión anterior de AlphaGo. Este evento mostró el potencial de los sistemas de aprendizaje profundo para superar incluso a los mejores jugadores humanos sin la necesidad de datos de entrenamiento previos.

- **GPT (Generative Pre-trained Transformer):** primera versión del modelo de lenguaje de OpenAI, desarrollado por el investigador de IA **Andrej Karpathy,** demuestra una capacidad asombrosa para generar texto coherente y de alta calidad.

Los modelos basados en la arquitectura Transformer han mejorado significativamente la capacidad de procesamiento de los modelos de lenguaje natural. Antes de la introducción de los Transformers, los modelos de lenguaje natural más populares eran los modelos basados en RNN (Redes Neuronales Recurrentes), que se enfrentaban a problemas de "**desvanecimiento de gradiente" y "memoria a corto plazo**". Estos problemas hacían que los modelos de lenguaje basados en RNN fueran difíciles de entrenar y limitaban su capacidad para comprender contextos más amplios y a largo plazo.

En contraste, los modelos que utilizan Transformers, como GPT (Generative Pretrained Transformer) o BERT de Google (Bidirectional Encoder Representations from Transformers) entre otros, utilizan una arquitectura basada en **atención** que les permite comprender relaciones entre diferentes partes de un texto de manera más efectiva, permitiendo una mejor comprensión del contexto y sin problemas de desvanecimiento de gradiente. Además, los Transformers permiten un entrenamiento más rápido y escalable que los modelos RNN, lo que ha llevado a mejoras significativas en la precisión de los modelos de lenguaje natural.

Esto ha permitido también la inclusión de muchos más parámetros en el modelo, lo que ha llevado a mejoras significativas en la precisión y la capacidad de comprensión del modelo.

La tercera versión del modelo, GPT-3, por ejemplo, tiene 175 mil millones de parámetros, mientras que los modelos de lenguaje más grandes, como BERT, con 110 millones de parámetros, o Turing NLG que tiene 17 mil millones.

![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/CKDimage.png)

La inclusión de más parámetros en el modelo permite a GPT-3 comprender mejor el contexto y generar textos más coherentes y naturales, lo que ha llevado a avances significativos en las tareas de procesamiento del lenguaje natural, como la traducción automática, la respuesta a preguntas y la generación de texto.

- **Alphafold:** es uno de los logros mas significativos conseguidos por la IA hasta la fecha. La empresa DeepMind resolvió el problema del plegamiento de las proteinas usando aprendizaje automático para predecir la estructura 3D de las proteinas que a su vez determina su funcionalidad.

AlphaFold, desarrollado por DeepMind, es un sistema de inteligencia artificial que ha revolucionado la predicción de la estructura 3D de las proteínas, lo que determina a su vez la funcionalidad de las mismas, al lograr una precisión sin precedentes usando aprendizaje automático. Esto tiene un gran impacto en la investigación biomédica y farmacéutica al acelerar el desarrollo de tratamientos y terapias médicas. También marca un hito importante en la inteligencia artificial al demostrar cómo puede abordar con éxito problemas complejos y multidisciplinarios en la ciencia.

<span id="bkmrk--13" style="font-weight: normal;">![](https://lh4.googleusercontent.com/ds1EuywApi7Xg27m4UQJsczrC9_JqMogUeGd45GprzziP5060OtJUBaDeOev07coinDqpBCpDR4T_XM97EsBtMSNM_UaFZFNMSDs8QeLlFFRJdxb5lwSf23gPKugAe47_oCs2PQl5167XlVh2slJZHwjAw=s2048)</span>En la imagen se aprecia la forma de dos proteínas distintas, en cada una de ellas, en color verde la forma real de la proteína y en azul la predicción realizada por Alphafold. Mas información: [https://alphafold.ebi.ac.uk/](https://alphafold.ebi.ac.uk/)

Estos son solo algunos de los hitos importantes que han ocurrido en el campo de la IA a partir de 2011. La IA continúa avanzando rápidamente, con nuevos descubrimientos, aplicaciones innovadoras y desafíos éticos y sociales que surgen a medida que la tecnología evoluciona.

# Unidad 1.4. Impacto de la IA, situación actual. IA extrema

### ***Introducción***

> *"El campo de juego está listo para volverse mucho más competitivo, y las empresas que no implementen inteligencia artificial y datos para ayudarlos a innovar en todo lo que hacen estarán en desventaja". Paul Daugherty , director de tecnología e innovación de Accenture*

En la era contemporánea, la Inteligencia Artificial ha transcendido los límites del laboratorio para integrarse de manera contundente en el tejido de nuestra sociedad y economía. En esta unidad, nos adentraremos en el análisis de la situación actual de la IA, observando su crecimiento exponencial y cómo ha fomentado innovaciones que son consideradas extremas en términos de su impacto disruptivo.

Las aplicaciones extremas de la IA son aquellas que han conseguido **redefinir sectores enteros** y sus expectativas de futuro. Estas aplicaciones no sólo destacan por su avanzada tecnología, sino por la magnitud de cambio que han instigado, alterando de manera significativa la dinámica previa a su implementación. Ejemplos destacados abarcan desde sistemas autónomos de conducción que prometen redefinir la movilidad urbana, hasta diagnósticos médicos asistidos por IA que están revolucionando el cuidado de la salud.

A través de un recorrido por ejemplos concretos, obtendremos una comprensión general de cómo la IA está remodelando el mundo en que vivimos, y cómo su trayectoria futura podría ser influenciada por las aplicaciones extremas que están emergiendo en el panorama actual orquestando una nueva era de innovación y posibilidades sin precedentes.

---

### ***Impacto de la IA, situación actual***

Para apreciar la magnitud del impacto que la IA esta teniendo y su evolución prevista, vemos en este ilustrativo gráfico la componente económica del mismo a nivel global, tanto la ya materializada hasta 2021 como la proyectada hasta 2030

[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/A6oimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-10/A6oimage.png)

Tamaño del mercado de la inteligencia artificial a nivel mundial de 2021 a 2030(en miles de millones de dólares). Fuente: Rosa Fernandez. Statista 2023

Uno de los informes mas recientes en el que se puede apreciar, en datos, el impacto que la IA ha alcanzado ya es: <span style="color: rgb(53, 152, 219);"><span style="text-decoration: underline;">[El estado de la IA en 2022 y el balance de media década, de la consultora McKinsey.](https://www.mckinsey.com/featured-insights/destacados/el-estado-de-la-ia-en-2022-y-el-balance-de-media-decada/es)</span></span><span style="color: rgb(53, 152, 219);"> </span>

[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/DXhimage.png)](https://www.mckinsey.com/featured-insights/destacados/el-estado-de-la-ia-en-2022-y-el-balance-de-media-decada/es)

<span style="color: rgb(0, 0, 0);">De este informe se desprenden, entre otras conclusiones, </span>dos estadísticas que subrayan el impacto que ya está teniendo la IA:

<div class="min-h-[20px] flex flex-col items-start gap-3 whitespace-pre-wrap break-words overflow-x-auto" id="bkmrk-incremento-en-la-ado"><div class="markdown prose w-full break-words dark:prose-invert dark">- **Incremento en la adopción de IA.** El informe indica que **la adopción de la IA se ha más que duplicado desde 2017**. En ese año, solo el 20% de los encuestados informó haber adoptado la IA en al menos un área de negocio, mientras que en 2022, esa cifra aumentó al 50%. Aunque es notable mencionar que la adopción alcanzó su punto más alto en 2019 con un 58%​.
- **Aumento en la inversión en IA.** El nivel de inversión en IA ha aumentado junto con su creciente adopción. Hace cinco años, el 40% de los encuestados de organizaciones que usaban IA informaron que más del 5% de sus presupuestos digitales se destinaban a IA. En el presente, más de la mitad de los encuestados indican ese nivel de inversión. Además, el 63% de los encuestados espera que la inversión de sus organizaciones en IA aumente en los próximos tres años​.

</div></div>Estas estadísticas, sin ser tan espectaculares como cabría esperar por el impacto mediático que esta teniendo la IA, reflejan una **tendencia positiva en la adopción y la inversión en IA,** lo que puede indicar un reconocimiento creciente del valor y el potencial de la IA en el ámbito empresarial. También, el aumento continuo en la inversión podría resultar en desarrollos más innovadores y en una adopción aún mayor de la IA en el futuro.

Hay que tener en cuenta que a día de hoy los estudios sobre la adopción de IA en las organizaciones, que normalmente son elaborados en base anual, no están reflejando todavía la habilitación al gran público de los potentes modelos del lenguaje como las distintas versiones de GPT de Open AI, BERT de Google o LlaMa de Meta. Estos modelos fueron, a partir del lanzamiento de ChatGPT de Open AI en noviembre de 2022 la punta de lanza de un nuevo impulso para la adopción de la IA en organizaciones de todo tipo, pero informes sobre la verdadera adopción todavía están por ver.

Al margen de estadísticas por llegar, **es patente la penetración que la IA esta teniendo en multitud de sectores**, lo vemos día a día en servicios y productos que salen al mercado. En la siguiente infografía, se aprecia al rango de alcance que está teniendo la IA, abarcando prácticamente a todos los sectores en mayor o menor medida.

<div id="bkmrk--3" style="width: 100%;"><div style="position: relative; padding-bottom: 56.25%; padding-top: 0; height: 0;"><iframe allowfullscreen="allowfullscreen" frameborder="0" height="675px" scrolling="yes" src="https://view.genial.ly/64e38b5a12e84d0012656bf0" style="position: absolute; top: 0; left: 0; width: 100%; height: 100%;" title="Usos de la I A en el día a día" width="1200px"></iframe>

</div></div>Fuente: INTEF: IA Educación. Una IA para aprender

---

### ***IA extrema***

Veamos ahora algunos ejemplos de IA extrema en el sentido ya mencionado, aplicaciones que han conseguido dar un salto cualitativo o cuantitativo en la tarea o función en la que se ha introducido y que rompe con la tendencia de desarrollo que se observaba hasta ese momento. Clickando en los enlaces encontraras interesantes videos explicativos de cada uno de los aspectos descritos.

- **Salud y medicina.** Desde diagnosis mediante la ***<span style="text-decoration: underline;">[identificación de patrones en síntomas e imágenes](https://www.youtube.com/watch?v=jgzPyiPk9iU&t=1s)</span>*** , hasta ***<span style="text-decoration: underline;">[ayuda a personas ciegas o con visibilidad reducida](https://www.youtube.com/watch?v=TxjSFpLMxUs&t=1s "ayuda a personas ciegas o con visibilidad reducida")</span>***<span style="text-decoration: underline;">[ ](https://www.youtube.com/watch?v=TxjSFpLMxUs&t=29s "ayuda a personas ciegas o con visibilidad reducida")</span>, sin olvidar la capacidad de **<span style="text-decoration: underline;">[*predecir la estructura de las proteínas*](https://www.youtube.com/watch?v=KpedmJdrTpY&t=1s)</span>**, de la que ya hemos hecho mención en la unidad anterior.

- **Predicción meteorológica.** Si algún campo se considera retador para los científicos, en cuanto a la cantidad de variables y datos a tener en cuenta, es la meteorología y la climatología, normalmente asociado directamente al caos por la cantidad de factores que pueden terminar arruinando cualquier predicción. Aquí, la capacidad de la IA de gestionar ingentes cantidades de datos, extraer patrones y hacer predicciones se antoja muy esperanzadora para ***<span style="text-decoration: underline;">[predecir los eventos climáticos extremos](https://www.youtube.com/watch?v=mvUPj2WbuKc&t=1s)</span>*** e incluso ayudarnos a aportar **posibles soluciones para el cambio climático.**

> *"We can learn more about weather by studying computation than we can by studying clouds (not the digital kind)"*
> 
> *"Today has been predicted 26 billion times"*
> 
> *Scott W Schwartz. NY University*

- **Programación.** Mediante lenguaje natural pueden llegar a codificarse programas y aplicaciones. Como en este ejemplo de un ***<span style="text-decoration: underline;">[sencillo videojuego programado en 8 minutos](https://www.youtube.com/watch?v=Zm9B-DvwOgw&t=1s)</span>*** solo explicando con lenguaje natural en que queremos que consista el videojuego.

- **Agricultura y ganadería.** Mediante el análisis de imágenes y datos obtenidos de sensores y equipos de lectura se optimiza el uso de recursos y se detectan de manera anticipada ***<span style="text-decoration: underline;">[problemas de irrigación o plagas en cultivos](https://www.youtube.com/watch?v=BoKT0jS6Bpc&t=1s)</span>*** y ganado.

- ##### ***Educación***

Hagamos un énfasis especial en la situación de la IA en educación y en como, habiéndose detectado las posibilidades que ofrece para el proceso de enseñanza-aprendizaje, ya se esta intentando despertar el interés sobre su potencial, así como alertar de sus riesgos, desde las instituciones. Profundizaremos en capítulos posteriores las posibilidades concretas que ofrece para docentes y alumnos.

Esto son solo algunos ejemplos de como las instituciones están tomando en cuenta la IA en el ámbito educativo:

- **Unesco.** Fruto de la conferencia IA en Educación realizada en Beijing en 2019, la Unesco publicó en 2021 el informe: ***Inteligencia artificial y educación. Guía para las personas a cargo de formular políticas.*** Mediante el cual, y bajo la premisa de alcanzar el Objetivo de Desarrollo Sostenible nº4 de la Agenda 20-30, formula y desarrolla la respuesta de tres preguntas clave

<table border="1" id="bkmrk-%C2%A0" style="border-collapse: collapse; width: 100%; height: 358.25px;"><colgroup><col style="width: 34.9857%;"></col><col style="width: 65.0143%;"></col></colgroup><tbody><tr style="height: 358.25px;"><td class="align-center" style="height: 358.25px;">[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/krhimage.png)](https://unesdoc.unesco.org/ark:/48223/pf0000376709)</td><td style="height: 358.25px;">![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/Dniimage.png)

![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/zh1image.png)

</td></tr></tbody></table>

Informe Unesco Inteligencia artificial y educación (haz click en la imagen de la portada del informe para acceder al informe completo). Las 3 preguntas clave del informe y el ODS 4 de la agenda 20-30.

- **Comisión Europea.** Dentro de su Plan de acción en Educación Digital 2021-2027 la Comisión Europea dicta unas **<span style="text-decoration: underline;">[Directrices éticas sobre el uso de la inteligencia artificial y datos en la enseñanza y el aprendizaje](https://code.intef.es/noticias/directrices-eticas-sobre-ia-y-datos/)</span>**

[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/sraimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-10/sraimage.png)

- **Singapur:** El ICEX (Instituto de Comercio Exterior) realizó en 2021 un documento informativo sobre el sector educativo en Singapur. En el mismo se detallan los planes de implementación de tecnologías IA a nivel educativo en el país.

<p class="callout info">Para mas información. Acceso al [informe ICEX Tecnología educativa (Edtech) en Singapur](https://www.icex.es/content/dam/es/icex/documentos/quienes-somos/donde-estamos/red-exterior/singapur/DOC2021888186.pdf)</p>

# Referencias Módulo 1

**Libros**

-Metamorfosis, Ovidio. Año 8 d.C

-Las Argonáuticas, Apolonio de Rodas Siglo I a.C.

<span style="font-size: 10.5pt; line-height: 107%; font-family: 'Segoe UI',sans-serif; color: black; background: white;">-De Architectura</span>, Vitruvio. Siglo I a.C.

<span style="font-size: 10.5pt; line-height: 107%; font-family: 'Segoe UI',sans-serif; color: black; background: white;">-Monadología, Gottfried Leibniz. 1714</span>

<span style="font-size: 10.5pt; line-height: 107%; font-family: 'Segoe UI',sans-serif; color: black; background: white;">-El discurso del método, René Descartes, 1637</span>

<span style="font-size: 10.5pt; line-height: 107%; font-family: 'Segoe UI',sans-serif; color: black; background: white;">-El hombre máquina, [<span style="font-size: 11.0pt; line-height: 107%; color: black; text-decoration: none; text-underline: none;">Julien Offray de La Mettrie</span>](https://es.wikipedia.org/wiki/Julien_Offray_de_La_Mettrie)<span style="font-variant-ligatures: normal; font-variant-caps: normal; orphans: 2; text-align: start; widows: 2; -webkit-text-stroke-width: 0px; text-decoration-thickness: initial; text-decoration-style: initial; text-decoration-color: initial; float: none; word-spacing: 0px;">. 1747</span></span>

<span style="font-family: 'Segoe UI',sans-serif; color: black;">-Perceptrones, Seymour Papert. 1969</span>

---

**Vídeos**

**-**Artificial Intelligence, the History and Future - with Chris Bishop

Vídeo de youtube con la historia de la IA y su proyección futura

*Recordamos que existe la posibilidad de activar subtítulos en español de forma automática, desde la sección de configuración*

[https://www.youtube.com/watch?v=8FHBh\_OmdsM](https://www.youtube.com/watch?v=8FHBh_OmdsM "Historia y futuro de la IA")

**-**Una breve historia de la Inteligencia Aritficial

[https://www.youtube.com/watch?v=\_pcQnFz7wAI](https://www.youtube.com/watch?v=_pcQnFz7wAI)

---

# Créditos

Contenidos elaborados y seleccionados por:

- Luis Hueso Ibañez
- Pedro López Savirón

Cualquier observación o detección de error, puedes escribirnos a soportecatedu@educa.aragon.es.

Los contenidos se distribuyen bajo licencia **Creative Commons** tipo **BY-NC-SA** excepto en los párrafos que se indique lo contrario.

[![image-1669879913915.png](https://libros.catedu.es/uploads/images/gallery/2022-12/scaled-1680-/image-1669879913915.png)](https://libros.catedu.es/uploads/images/gallery/2022-12/image-1669879913915.png)

<div class="pointer-container" id="bkmrk-%C2%A0"><div class="pointer anim is-page-editable"><svg class="svg-icon" data-icon="link" role="presentation" viewbox="0 0 24 24" xmlns="http://www.w3.org/2000/svg"></svg><div class="input-group inline block"> <button class="button outline icon" data-clipboard-target="#pointer-url" title="Copy Link" type="button"><svg class="svg-icon" data-icon="copy" role="presentation" viewbox="0 0 24 24" xmlns="http://www.w3.org/2000/svg"></svg></button></div><svg class="svg-icon" data-icon="edit" role="presentation" viewbox="0 0 24 24" xmlns="http://www.w3.org/2000/svg"></svg></div></div>[![image-1669879971404.png](https://libros.catedu.es/uploads/images/gallery/2022-12/scaled-1680-/image-1669879971404.png)](https://libros.catedu.es/uploads/images/gallery/2022-12/image-1669879971404.png)

# Módulo 2. Las maquinas no piensan. Fundamentos

Una revisión de la tecnología por dentro, los fundamentos y conceptos que dan soporte a la tecnología actual de IA

# Unidad 2.1. De que estamos hablando: Concepto y Definiciones de IA

### Introducción

> *"Lo siento, Dave. Tengo miedo. No puedo hacer eso."* - HAL 9000, 2001: Una odisea en el espacio.
> 
> *"La verdadera pregunta no es si las máquinas pueden pensar o si pueden tener conciencia, sino si nosotros, como seres humanos, estamos dispuestos a reconocer la inteligencia y la conciencia en formas diferentes a las nuestras."* - Ray Kurzweil

La Inteligencia Artificial (IA) es un campo de estudio que busca desarrollar sistemas capaces de realizar tareas que normalmente requerirían de la inteligencia humana. Estos sistemas utilizan algoritmos y modelos para procesar información, aprender de ella y tomar decisiones basadas en patrones y reglas.

Dentro de la IA, el *Machine Learning* (Aprendizaje Automático) es una rama fundamental que se centra en desarrollar algoritmos y técnicas que permiten a las máquinas aprender y mejorar su rendimiento a partir de datos, sin ser programadas explícitamente. En lugar de seguir reglas específicas, los algoritmos de Machine Learning se basan en la detección de patrones y en la extracción de conocimientos a partir de grandes conjuntos de datos.

Uno de los enfoques más destacados dentro del *Machine Learning* es el *Deep Learning* (Aprendizaje Profundo), que se inspira en el funcionamiento de las redes neuronales del cerebro humano. Las redes neuronales artificiales utilizadas en el Deep Learning están compuestas por múltiples capas de neuronas interconectadas, lo que les permite procesar información de manera jerárquica y aprender representaciones complejas de los datos. El Deep Learning ha demostrado un rendimiento impresionante en tareas como el reconocimiento de imágenes, el procesamiento del lenguaje natural y la generación de contenido.

Estos conceptos de IA, *Machine Learning* y *Deep Learning* han experimentado un rápido crecimiento en las últimas décadas, impulsado por avances en la capacidad de computación, el acceso a grandes volúmenes de datos, algoritmos más potentes y el desarrollo de GPUs (procesadores gráficos). Su aplicabilidad abarca una amplia gama de campos, incluyendo la medicina, la industria, la investigación científica, la conducción autónoma, la traducción automática y mucho más.

A medida que la tecnología continúa evolucionando, se espera que la IA y sus ramas sigan desempeñando un papel fundamental en el desarrollo de soluciones inteligentes y en la mejora de la forma en que interactuamos con el mundo digital.

### Conceptos de IA

<div class="absolute bottom-0 left-0 w-full border-t md:border-t-0 dark:border-white/20 md:border-transparent md:dark:border-transparent md:bg-vert-light-gradient bg-white dark:bg-gray-800 md:!bg-transparent dark:md:bg-vert-dark-gradient pt-2 md:-left-2" id="bkmrk-personas-ray-kurzwei"><form class="stretch mx-2 flex flex-row gap-3 last:mb-2 md:mx-4 md:last:mb-6 lg:mx-auto lg:max-w-2xl xl:max-w-3xl">> <div class="wcg-slash-commands-menu">**Personas**</div>Ray *Kurzweil* es un reconocido científico, inventor, futurista y escritor estadounidense. Nació el 12 de febrero de 1948 y ha sido una figura prominente en el campo de la inteligencia artificial y la tecnología durante décadas.
> 
> *Kurzweil* es conocido por su trabajo en áreas como el reconocimiento óptico de caracteres (OCR), la síntesis de voz, la tecnología de asistencia para personas con discapacidades y la predicción de la singularidad tecnológica. Es un defensor destacado de la idea de que la inteligencia artificial y la tecnología en constante avance tienen el potencial de transformar radicalmente la sociedad y la humanidad en el futuro cercano.
> 
> Además de su trabajo científico, *Kurzweil* ha escrito varios libros, entre ellos "*The Singularity Is Near: When Humans Transcend Biology*" (La Singularidad está cerca: cuando los humanos trascienden la biología), donde explora su concepto de singularidad tecnológica y cómo la inteligencia artificial y la tecnología están convergiendo para impulsar cambios acelerados en el mundo.

<div class="wcg-slash-commands-menu">  
</div></form></div>La Inteligencia Artificial (IA) es un campo de estudio que busca desarrollar sistemas y programas capaces de realizar tareas que normalmente requerirían de la inteligencia humana. Estos sistemas utilizan algoritmos y modelos matemáticos para procesar información, aprender de ella y tomar decisiones o realizar acciones basadas en patrones y reglas.

En primer lugar conviene definir de algún modo ambos términos, Inteligencia y Artificial, cuestión ya comentada al principo del curso pero que creemos conveniente recordar en varias de sus posibles definiciones:

**Inteligencia**

- **Definición Psicológica:**
    
    
    - *"La inteligencia es la capacidad para aprender, razonar, resolver problemas, pensar abstractamente, comprender ideas complejas, adaptarse al ambiente y aprender de la experiencia."* - Carole Wade y Carol Tavris, psicólogas.
- **Definición Biológica:**
    
    
    - *"La inteligencia es un conjunto de habilidades de adaptación al entorno, especialmente habilidades de aprendizaje, memoria, razonamiento y percepción."* - Stephen Ceci, psicólogo especializado en inteligencia.
- **Definición Operacional:**
    
    
    - *"La inteligencia es lo que miden los tests de inteligencia."* - Alfred Binet, uno de los pioneros en el desarrollo de pruebas de inteligencia.

**Artificial**

- **Definición General:**
    
    
    - *"Artificial se refiere a algo que es hecho por el hombre o producido en lugar de ser algo natural."*
- **Definición Tecnológica:**
    
    
    - *"En el contexto de la tecnología y la ciencia, artificial describe algo que ha sido producido mediante un proceso controlado, a menudo imitando o replicando algo que ocurre en la naturaleza."*
- **Definición Filosófica:**
    
    
    - *"Desde una perspectiva filosófica, artificial puede referirse a una imitación o simulación de algo natural, buscando emular sus propiedades o funciones."*

En el contexto de "Inteligencia Artificial", el término "artificial" indica que la inteligencia que se está describiendo no es una inteligencia biológica o natural, sino una creada y diseñada por humanos mediante algoritmos y sistemas computacionales

En términos generales, se pueden distinguir varios tipos de IA:

**IA débil:** También conocida como IA estrecha o IA específica, se refiere a sistemas diseñados para realizar tareas específicas de manera eficiente y precisa, pero que carecen de la capacidad de razonamiento o generalización más allá de esas tareas. Ejemplos de IA débil incluyen los asistentes virtuales, sistemas de recomendación y chatbots.

**IA fuerte**: La IA fuerte se refiere a sistemas que poseen la capacidad de igualar o superar la inteligencia humana en una amplia gama de tareas. Estos sistemas serían capaces de comprender, razonar, aprender y adaptarse en diferentes situaciones, y podrían tener una conciencia de sí mismos. Sin embargo, hasta el momento, la IA fuerte sigue siendo un objetivo teórico y aún no se ha logrado completamente.

**IA generalizada**: También conocida como IA general, se refiere a sistemas que tienen la capacidad de superar a los humanos en todas las tareas intelectuales, tanto en las tareas específicas como en la capacidad de razonar y generalizar en nuevas situaciones. La IA generalizada es un objetivo a largo plazo y aún no se ha alcanzado.

Es importante tener en cuenta que los avances en IA se han centrado principalmente en la IA débil, desarrollando sistemas especializados para tareas específicas. Sin embargo, los esfuerzos continúan en la búsqueda de lograr una IA más fuerte y generalizada, aunque aún hay muchos desafíos técnicos y éticos por resolver.

Es fundamental tener en cuenta los límites y las implicaciones éticas de la IA a medida que avanza, y asegurarse de que se utilice de manera responsable y beneficie a la sociedad en su conjunto.

> La idea de una IA con conciencia, también conocida como inteligencia artificial consciente o IA consciente, plantea la posibilidad de que las máquinas puedan tener una experiencia subjetiva o conciencia similar a la de los seres humanos. Sin embargo, es importante destacar que actualmente no existe un consenso claro sobre cómo definir o lograr la conciencia en una máquina.

Debe notarse además que la IA es un campo amplio de estudio, que lleva en desarrollo decenas de años y que no solamente abarca lo relacionado con el lenguaje, sino también otros campos como la robótica o la comunicación hombre-máquina

En general tiene que ver con todo lo que signifique imitar el comportamiento humano, especialmente en los campos de la IA conversacional, la síntesis y reconocimiento de voz, la generación de lenguaje natural y la predicción de lenguaje.

[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-11/scaled-1680-/CUzimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-11/CUzimage.png)

*Evolución de la inteligencia artificial versus humana en el ajedrez a lo largo del tiempo*

En general distinguimos los siguientes campos de estudio:

### Campos de Estudio en Inteligencia Artificial

> En vez de intentar producir un programa que simule la mente adulta, ¿por qué no tratar de producir uno que simule la mente del niño? Si ésta se sometiera entonces a un curso educativo adecuado, se obtendría el cerebro de adulto.
> 
> **Alan Mathison Turing (1912 - 1954), Matemático Inglés**

**Aprendizaje basado en patrones (Machine Learning o ML)**

El machine learning es una rama de la inteligencia artificial que se centra en el uso de datos y algoritmos para imitar la forma en la que aprenden los seres humanos. En otras palabras, es un método estadístico para aprender patrones en base a ejemplos.

Por ejemplo, si queremos enseñar a una computadora a reconocer imágenes de perros, le proporcionamos un conjunto de imágenes etiquetadas como “perros” y otro conjunto etiquetado como “no perros”. La computadora utiliza estos datos para aprender a distinguir entre las dos categorías y, con el tiempo, se vuelve más precisa en su capacidad para identificar imágenes de perros

Se utiliza en una amplia variedad de aplicaciones, desde la detección de fraudes hasta la predicción del clima y la recomendación de productos. A medida que la cantidad de datos disponibles sigue creciendo, el llamado ML se está convirtiendo en una herramienta cada vez más importante para ayudar a las empresas a tomar decisiones informadas y mejorar la eficiencia de los procesos productivos.

Dentro del Machine Learning distinguimos especialmente el Aprendizaje Profundo (Deep Learning o DL) que estudia las redes neuronales con múltiples capas (profundas) para procesar grandes conjuntos de datos.

Se basa en el uso de redes neuronales artificiales para imitar la forma en que aprenden los seres humanos. A diferencia del machine learning, que se enfoca en el aprendizaje a partir de datos estructurados, el deep learning se utiliza para aprender patrones a partir de datos no estructurados, como imágenes, audio y texto.

Se utiliza también en una amplia variedad de aplicaciones, desde la detección de fraudes hasta la predicción del clima y la recomendación de productos. A medida que la cantidad de datos disponibles sigue creciendo, el deep learning se está convirtiendo en una herramienta cada vez más importante para ayudar a las empresas a tomar decisiones informadas y mejorar la eficiencia, pero también en una poderosa herramienta para la generación de contenidos de audio texto y vídeo así como chats conversacionales de cualquier temática o dominio de conocimiento.

**Procesamiento del Lenguaje Natural (NLP)**

El Procesamiento del Lenguaje Natural (NLP, por sus siglas en inglés) es una rama de la inteligencia artificial que se centra en la interacción entre los ordenadores y el lenguaje humano. Su objetivo es permitir que las máquinas comprendan, interpreten y respondan a textos y voces humanas de una manera útil y natural.

En términos simples, el NLP trata de "enseñar" a las computadoras cómo entender el lenguaje humano, incluyendo sus sutilezas, ambigüedades y variaciones. Esto implica procesos como la traducción automática (por ejemplo, convertir texto de un idioma a otro), la respuesta a preguntas (responder preguntas formuladas en lenguaje natural), y la comprensión de sentimientos (detectar emociones en el texto).

Es una tecnología que encontramos en la vida cotidiana en cosas como los asistentes virtuales (Siri, Alexa), los correctores ortográficos automáticos, los sistemas de chatbot para atención al cliente, y las recomendaciones de productos basadas en reseñas. Es un campo en constante evolución que busca mejorar la forma en que las máquinas y los humanos interactúan.

**Visión por Computadora**

Estudia cómo las máquinas pueden obtener información a partir de imágenes o videos.

La visión por computadora, también conocida como visión artificial, es un campo de la inteligencia artificial que se enfoca en dar a las máquinas la capacidad de "ver" o identificar y entender el contenido visual del mundo. Esto significa procesar y analizar imágenes y videos para identificar objetos, personas, escenas y actividades.

En términos básicos, la visión por computadora permite que las computadoras interpreten y hagan uso de la información visual de la misma manera que lo haría un ser humano, pero a una velocidad y escala mucho mayores. Esto incluye tareas como reconocer rostros en fotografías, identificar objetos en imágenes para sistemas de navegación autónoma (como los utilizados en los coches autónomos), analizar imágenes médicas para diagnosticar enfermedades, y mucho más.

Se utiliza en una amplia gama de aplicaciones prácticas: desde la seguridad y vigilancia hasta la interacción y entretenimiento en redes sociales, pasando por el control de calidad en la fabricación y la agricultura de precisión. Este campo combina técnicas de aprendizaje automático, procesamiento de imágenes y patrones, y análisis de datos para entrenar a las computadoras en el reconocimiento y procesamiento de imágenes.

**Robótica**

Se centra en el diseño, construcción y operación de robots que pueden interactuar y operar en entornos físicos.

La robótica es un campo de la ingeniería y la ciencia de la computación que se ocupa del diseño, construcción, operación y uso de robots. Los robots son sistemas que pueden moverse, percibir su entorno, procesar información y realizar acciones o tareas en el mundo real, ya sea de manera autónoma o controlada por humanos.

En términos sencillos, la robótica combina elementos de la mecánica (para el diseño y fabricación de las estructuras físicas de los robots), la electrónica (para los sistemas de control y sensores) y la informática (para el procesamiento de datos y la toma de decisiones). Esto permite que los robots realicen una amplia gama de tareas, desde la fabricación industrial y la exploración espacial hasta la asistencia en tareas domésticas y el cuidado de la salud.

La robótica moderna también se entrelaza con la inteligencia artificial, especialmente cuando los robots requieren capacidades avanzadas de percepción, toma de decisiones y aprendizaje. Por ejemplo, los robots que utilizan IA pueden aprender de su entorno y adaptarse a nuevos retos, lo que les permite ser más eficientes y versátiles.

Tiene aplicaciones en numerosos campos, como la manufactura (robots de ensamblaje y soldadura), la medicina (robots quirúrgicos y de rehabilitación), el servicio al cliente (robots de asistencia), el transporte (vehículos autónomos) y muchos más. Es un campo en constante evolución, impulsado por avances tecnológicos y la creciente integración de sistemas inteligentes.

**Sistemas Expertos**

Un sistema experto es un programa de computadora diseñado para imitar la capacidad de toma de decisiones de un experto humano en un campo específico. Estos sistemas están programados con una gran cantidad de conocimientos y reglas específicas del área en la que se especializan, lo que les permite ofrecer consejos, resolver problemas o tomar decisiones como lo haría un experto real.

Para entenderlo de manera sencilla, piensa en un sistema experto como un "libro de consejos" muy avanzado y específico. Por ejemplo, en medicina, un sistema experto puede diagnosticar enfermedades basándose en los síntomas del paciente, la información médica y las reglas establecidas por médicos reales. Este sistema puede preguntar al usuario (como un médico o paciente) sobre varios síntomas y luego, basándose en su "conocimiento" programado, sugerir posibles diagnósticos o tratamientos.

Son útiles en campos donde la toma de decisiones es compleja y requiere un alto nivel de conocimiento especializado, como la medicina, la ingeniería, las finanzas y el derecho. Estos sistemas no reemplazan a los expertos humanos, sino que sirven como herramientas para ampliar su alcance y mejorar la eficiencia en la toma de decisiones.

**Aprendizaje por Refuerzo**

El aprendizaje por refuerzo es un tipo de aprendizaje automático en el que un agente (un programa de computadora) aprende a tomar decisiones mediante la experimentación y la retroalimentación sobre las acciones que realiza. En lugar de ser enseñado explícitamente qué hacer en cada situación, el agente descubre qué acciones producen los mejores resultados a través de un proceso de prueba y error.

Para entenderlo de manera sencilla, piensa en el aprendizaje por refuerzo como el proceso de enseñar a un niño a andar en bicicleta no solo diciéndole cómo hacerlo, sino dejándolo intentarlo y aprender de sus errores. Cada vez que el niño se inclina demasiado y se cae (un resultado negativo), aprende a evitar esa acción en el futuro. De manera similar, si logra mantener el equilibrio y avanzar (un resultado positivo), aprenderá a repetir y perfeccionar esa acción.

En el aprendizaje por refuerzo, el agente recibe recompensas o penalizaciones basadas en las consecuencias de sus acciones. Su objetivo es maximizar la suma total de recompensas. Este enfoque es particularmente útil en situaciones donde no es factible o posible programar todas las posibles acciones y resultados, como en juegos complejos (como el ajedrez o el Go), la navegación de robots, o la optimización de sistemas.

Este vídeo en el que se enseña a andar a un robot es muy ilustrativo del proceso general

<iframe allowfullscreen="allowfullscreen" height="314" src="https://www.youtube.com/embed/xAXvfVTgqr0?si=xro-J_KfDqNBWZX1" width="560"></iframe>

[https://www.youtube.com/watch?v=xAXvfVTgqr0 ](https://www.youtube.com/watch?v=xAXvfVTgqr0)

En definitiva la IA trata de todo lo que tiene que ver con el comportamiento y el razonamiento humano intentando imitaro o reproducirlo basándose en la propia biología humana,.

Se invita al alumno a reflexionar acerca del proceso de aprendizaje que todos hemos seguido en nuestras vidas y de como generamos el propio lenguaje y los recuerdos basados en patrones o similitudes con registros del pasado o de otros tetos o conversaciones.

A día de hoy parece claro que las máquinas no piensan, pero sí aprenden.

# Unidad 2.2. Machine Learning. Como aprender sin instrucciones

### Machine Learning

> **Concepto**
> 
> "El aprendizaje automático es el arte y la ciencia de permitir a las máquinas aprender y mejorar automáticamente a partir de los datos, sin necesidad de ser programadas explícitamente para cada tarea específica".

[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-11/scaled-1680-/Tf7image.png)](https://libros.catedu.es/uploads/images/gallery/2023-11/Tf7image.png)

***Humanos 'enganchados' mientras las computadoras aprenden***

La forma tradicional de hacer que una computadora logre algo es darle instrucciones explícitas (si sucede esto, haz esto, de lo contrario haz aquello, etc.) que se escriben a mano en un lenguaje de programación determinado. Este método de programación de computadoras es extremadamente exitoso y se ha utilizado para desarrollar prácticamente todo el software que se ejecuta en nuestras computadoras, teléfonos e incluso automóviles. Sin embargo, este método no siempre es el más práctico.

Por ejemplo, consideremos el desarrollo de un programa para identificar imágenes. Habría que considerar todas las posibles combinaciones de píxeles para que en función de sus características podamos instruir al algoritmo o computadora acerca del objeto de que está 'visualizando'.

Sólo el juego GO ofrece 10 elevado a 700 posibilidades en cuanto a mposibles movivimientos lo que da una idea de lo incorrecto de este enfoque, al menos para el objetivo de que las máquinas aprendan y sean capaces de usar y 'entender' el lenguaje natural, además de distinguir objetos y otras tareas propias de nuestra inteligencia.

Sucede que se nos da muy bien programar cosas que hemos aprendido a hacer como una suma o una multiplicación pero nos resulta extremadamente difiicil enseñar lo que nos es innato, por ejemplo andar, mover un barzo etc...

El aprendizaje automático es un enfoque que permite a la computadora aprender patrones y relaciones en los datos a través de algoritmos y modelos matemáticos. En el caso de la identificación de imágenes, en lugar de programar reglas explícitas, se alimenta a la computadora con un conjunto de imágenes etiquetadas y se le permite aprender por sí misma cómo reconocer diferentes objetos o patrones en las imágenes.

El proceso de aprendizaje automático implica entrenar a la computadora utilizando ejemplos y ajustar sus conexiones internas, de modo que pueda hacer predicciones precisas sobre nuevas imágenes que nunca ha visto antes. Esto se logra mediante el uso de algoritmos de aprendizaje automático, como las redes neuronales, que son capaces de capturar características complejas y extraer información útil de los datos de entrada.

A medida que se alimenta a la computadora con más datos y se perfeccionan los algoritmos de aprendizaje, la precisión y la capacidad de reconocimiento de imágenes de la computadora mejoran con el tiempo. Este enfoque es especialmente útil en casos en los que las reglas explícitas serían demasiado difíciles o tediosas de programar, o cuando los patrones en los datos no son fácilmente discernibles para los humanos.

En resumen, el enfoque tradicional de programación mediante instrucciones explícitas está siendo complementado y en algunos casos reemplazado por el aprendizaje automático, que permite a las computadoras aprender a reconocer patrones y tomar decisiones basadas en datos en lugar de reglas predefinidas. Esta técnica está transformando la forma en que desarrollamos programas y abre un amplio abanico de posibilidades para aplicaciones más inteligentes y adaptativas.

Sería casi imposible escribir un programa así "a mano" debido al gran número de posibilidades a considerar (diferentes orientaciones de objetos, condiciones de iluminación, obstrucciones, etc.). En cambio, sería más fácil utilizar el método de aprendizaje automático, que es un método y una disciplina científica utilizada para programar computadoras utilizando datos en lugar de instrucciones explícitas. En el caso de la identificación de imágenes, el método de aprendizaje automático consistiría en proporcionar a la computadora un conjunto de imágenes etiquetadas según lo que representan y permitir que la computadora descubra por sí misma cómo identificar nuevas imágenes.

#### Aprendizaje con datos no estructurados

Entendemos por datos no estructurados aquellos que se presentan sin un formato ni estructura específico, como los que provienen del lenguaje natural o en forma de imagen o sonido. Por contra datos estructurados serían aquellos que se presentan con algún tipo de organización como una tabla o un fichero con determinadas características.

En esta sección hablaremos de cómo hacer que las máquinas entiendan datos no estructurados.

Siguiendo con lo comentado al principio de la sección vamos a ver los datos de un modelo para clasificar vehículos distinguiendo entre coches y camiones.

El paradigma de aprendizaje automático permite crear clasificadores que a partir de un conjunto de datos de entrada (en este caso en forma de imágenes etiquetadas) pueda entrenarse y despues al recibir una imagen nueva podrá identificarla correctamente.

**Por ejemplo aqui podemos ver un conjunto de imágenes de coches y camiones**

[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-11/scaled-1680-/Rycimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-11/Rycimage.png)

A la computadora se le han proporcionado varias imágenes de camiones y coches, cada una etiquetada según lo que representan. Estas imágenes etiquetadas se llaman ejemplos (también conocidos como puntos de datos u observaciones) y forman un conjunto de datos. El resultado es un programa llamado modelo que es capaz de identificar nuevos casos y clasificarlos en un tipo de vehículo en este caso.

Es preciso señalar la difucltad de este proceso derivada del contexto que rodea a los casos de prueba. en este caso vemos como según que ejemplos no identifican claramente a un coche o camión debido a factores como el ambiente, luces, orientación, distancia, objetos circundantes etc... Es por ello que se reuieren ingentes cantidades de datos para facilitar y mejorar el modelo final de aprendizaje.

<div class="clipboard-cell" id="bkmrk--3"></div><div class="clipboard-cell" id="bkmrk--4"></div>En cierto sentido, el aprendizaje automático es programación a través de ejemplos. La computadora (es decir, la máquina) aprende a realizar una tarea a partir de ejemplos de esa tarea. En este contexto, "aprender" significa ampliamente que se utiliza información de ciertos datos para crear el programa.

La identificación de imágenes no es la única aplicación en la que el aprendizaje automático es útil; se utiliza en la actualidad para realizar una variedad de tareas, desde identificar correos electrónicos no deseados, hasta predecir los precios de las acciones, o jugar videojuegos. Sin embargo, el aprendizaje automático no es un reemplazo directo de la programación tradicional. Para comprender mejor para qué se puede utilizar el aprendizaje automático, repasemos algunos de sus ámbitos de aplicación actuales.

Un ámbito general de aplicación tiene que ver con la imitación de las habilidades humanas. Esto incluye tareas de percepción, como comprender datos visuales y auditivos; tareas intuitivas, como jugar videojuegos; y la tarea muy importante de comprender texto. A continuación, se presentan ejemplos de aplicaciones que se encuadran en este ámbito.

- **Detectar objetos de un vídeo en tiempo real**

[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-11/scaled-1680-/cU3image.png)](https://libros.catedu.es/uploads/images/gallery/2023-11/cU3image.png)

- **Mejorar la calidad imagen**

[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-06/scaled-1680-/5Ncimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-06/5Ncimage.png)

- **Traducción**

[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-06/scaled-1680-/3PGimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-06/3PGimage.png)

- **Predicción (generación) de texto**---

[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-06/scaled-1680-/Vh3image.png)](https://libros.catedu.es/uploads/images/gallery/2023-06/Vh3image.png)

Son solo algunos ejemplos, que además se van ampliando con la mejora de tecnologías y algoritmos.

En general estamos hablando de convertir información en múltiples formatos (sonido, vídeo, texto e imagen).

Actualmente podemos incluir tareas como conversión de texto a música, texto a imagen, limpiezas de audios o incluso conversión de pensamiento a imagen, algo que de momento se ha conseguido de forma rudimentaria en laboratorio.

En general han surgido decenas de aplicaciones llamadas multimodales que permiten la conversión/generación de cualquier tipo de contenido, incluyendo vídeos, imagen y voz.

Estas tareas generalmente se consideran parte de la inteligencia artificial (aunque "inteligencia humana" sería más apropiado) y generalmente se abordan utilizando redes neuronales artificiales, un campo conocido como aprendizaje profundo que veremos en la próxima sección. Estas tareas solían ser difíciles o incluso imposibles de resolver en el pasado, pero las cosas han ido cambiando desde la década de 2010 gracias a computadoras más rápidas y al renovado interés en las redes neuronales. En la actualidad, el aprendizaje automático se utiliza ampliamente para resolver estas tareas; por ejemplo, las redes sociales utilizan el aprendizaje automático para analizar grandes cantidades de imágenes y textos con el fin de seleccionar contenido relevante para los usuarios. Cabe destacar que el tipo de datos involucrados en estas tareas (imágenes, audio, texto, etc.) es más complejo y "difuso" que los números organizados en una hoja de cálculo, por lo que se llama datos no estructurados.

#### Aprendizaje con datos estructurados

Otro ámbito de aplicación importante se refiere a la utilización de grandes cantidades de datos estructurados. Los conjuntos de datos estructurados son los que generalmente se nos vienen a la mente cuando hablamos de datos: números y etiquetas almacenados en hojas de cálculo o bases de datos. Los datos estructurados podrían ser, por ejemplo, datos de ventas recopilados por una empresa minorista: tipo de producto, fechas de venta, precio, etc. La tarea más común al trabajar con datos estructurados es predecir el valor de una variable (también conocida como atributo) de interés, como las futuras cifras de ventas, pero también puede tratarse de comprender los datos, como identificar grupos. A continuación, se presentan ejemplos de tales tareas.

- **Predecir** valores como el precio de una casa o el valor de un stock partiendo de datos históricos
- **Clasificar** los clientes en categorías según sus patrones de comportamiento y su perfil
- **Recomendar** productos en función de los gustos o compras de otros usuarios [![image.png](https://libros.catedu.es/uploads/images/gallery/2023-06/scaled-1680-/sB8image.png)](https://libros.catedu.es/uploads/images/gallery/2023-06/sB8image.png)
- **Detección de Fraude**[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-06/scaled-1680-/R9Eimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-06/R9Eimage.png)

Para finalizar incluimos una imagen que resume perfectamente las aplicaciones de *Machine Learning*

[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-11/scaled-1680-/iYVimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-11/iYVimage.png)

<p class="callout warning">**Aclaración** El aprendizaje automático a menudo se confunde con la estadística.</p>

<p class="callout warning">Existen muchas similitudes entre estas dos disciplinas, ya que los modelos de aprendizaje automático son modelos estadísticos. En cierto sentido, el aprendizaje automático podría considerarse un subcampo de la estadística. Sin embargo, estas dos áreas difieren en sus objetivos y prácticas. El objetivo del aprendizaje automático generalmente es predecir algo, mientras que el objetivo de la estadística generalmente es comprender algo (por ejemplo, "¿Esta droga ayuda a curar esta enfermedad?"). Como consecuencia, los modelos de aprendizaje automático suelen ser complejos (como conjuntos de árboles, redes neuronales) y "cajas negras", lo que significa que es difícil interpretar lo que hacen. Por otro lado, los modelos en estadística suelen ser simples para poder ser interpretables (como regresión logística, modelos lineales generalizados). Finalmente, el aprendizaje automático a menudo maneja grandes cantidades de datos y de diversos tipos (datos estructurados, imágenes, textos, etc.), mientras que la estadística generalmente trabaja con conjuntos de datos más pequeños y "más simples".</p>

# Unidad 2.3 Tipos de aprendizaje

> El aprendizaje automático es el nuevo motor eléctrico
> 
> **Andrew Ng, British-American computer scientist**
> 
> <div class="GRl5yb a8pxAe" jsname="ntFePb"><div class="FJIcp" data-hveid="CA4QAA" id="bkmrk-" jsaction="rcuQ6b:npT2md" jscontroller="B8bawb" jsdata="vEURL;_;ABtoB8" role="tablist"></div></div>

### Introducción

La mayoría de humanos funcionamos con patrones, todo lo que hacemos es una copia, mejor o peor imitada, de lo que hemos visto o percibido en el pasado o de lo que nos han dicho. Si vemos repetidamente diferentes versiones de un mismo tipo de animal terminaremos poniendo una etiqueta o un nombre a dicho ser vivo. Cuando vivimos en sociedad dicho nombre nos lo enseñan y así reconocemos distintas variantes que pueden ser nuevas o no vistas anteriormente. Nuestro cerebro se entrena con decenas o cientos de casos para luego poder denotar o saber a qué animal pertenece un nuevo ejemplar.

El aprendizaje automático funciona de manera similar pero de forma computacional, es decir, traduciendo las imágenes (o texto o sonidos) a bits o valores computable por una máquina. Dichos valores permiten entrenar a la máquina igual que lo hace un cerebro humano de manera que sea capaz de agrupar casos o instancias similares (aprendizaje no supervisado) o determinar la categoría (o etiqueta) de un nuevo ejemplar no visto en el proceso de entrenamiento. Es como si partiéramos de un cerebro 'vacío' y empezáramos a entrenarlo generando conexiones entre distintas neuronas.

Así, el aprendizaje automático se basa en la búsqueda de patrones en ingentes cantidades de datos. Dichos patrones de guardan en forma de pesos o parámetros de una red neuronal que nos permitirá estudiar y predecir nuevos casos.

Dicho paradigma tiene tres vertientes o tipos:

1. **Aprendizaje Supervisado**: Es como si le mostrases fotos y le dijeses: “Esto es un gato” o “Esto es un perro”. El robot aprende de los ejemplos que le das para poder decir si la próxima foto que ve es un gato o un perro.
2. **Aprendizaje No Supervisado**: Es un poco diferente. Aquí, simplemente le das un montón de fotos sin decirle cuál es cuál. El robot tiene que ver las fotos y decir: “Hmm, estas fotos se parecen entre sí, y estas otras fotos se parecen entre sí, así que creo que hay dos grupos diferentes”.
3. **Aprendizaje por Refuerzo**: Es como entrenar a un perro. Cada vez que el robot acierta (por ejemplo, dice correctamente si es un gato o un perro), le das una “golosina virtual” y cuando se equivoca, le dices “inténtalo de nuevo”. Así, el robot está motivado para mejorar y aprender correctamente.

 <iframe allowfullscreen="allowfullscreen" height="314" src="https://www.youtube.com/embed/FtoqQSxJyJA" width="560"></iframe>

*Evolución de los robots desde 2005*

El aprendizaje automático es básicamente enseñarle a una computadora a aprender de los ejemplos y la experiencia, en lugar de seguir instrucciones específicas como en la programación tradicional

Estos paradigmas difieren en las tareas que pueden resolver y en cómo se presenta los datos a la computadora. Por lo general, la tarea y los datos determinan directamente qué paradigma se debe utilizar (y en la mayoría de los casos, es el aprendizaje supervisado). Sin embargo, en algunos casos hay que tomar una decisión. A menudo, estos paradigmas se pueden utilizar juntos para obtener mejores resultados. Este capítulo ofrece una visión general de qué son estos paradigmas de aprendizaje y para qué se pueden utilizar.

### Aprendizaje con etiquetas

  
El aprendizaje supervisado es el paradigma de aprendizaje más común. En el aprendizaje supervisado, la computadora aprende a partir de un conjunto de pares de entrada-salida, que se llaman ejemplos etiquetados:

![ ](https://www.wolfram.com/language/introduction-machine-learning/machine-learning-paradigms/img/2-machine-learning-paradigms-DisplayFormula-1.en.png)

En este caso identificamos entradas (imágenes de perros y gatos, características de setas, datos del mercado de valores etc...) y salidas (tipo de animal, clase de seta, valor futuro de una acción).

El objetivo del aprendizaje supervisado suele ser entrenar un modelo predictivo a partir de estos pares. Un modelo predictivo es un programa que puede adivinar el valor de salida (también conocido como etiqueta) para una nueva entrada no vista. En pocas palabras, la computadora aprende a predecir utilizando ejemplos reales.

Por ejemplo, consideremos un conjunto de datos de características de animales (ten en cuenta que los conjuntos de datos típicos son mucho más grandes):<a class="anchortag" id="bkmrk--4"></a>

[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-11/scaled-1680-/Goaimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-11/Goaimage.png)

Nuestro objetivo es predecir el peso de un animal a partir de sus otras características, por lo que reescribimos este conjunto de datos como un conjunto de pares de entrada-salida:

Las variables de entrada (en este caso, edad y sexo) generalmente se denominan características, y el conjunto de características que representan un ejemplo se llama vector de características. A partir de este conjunto de datos, podemos generar un modelo que nos permita predecir pesos a partir de nuevos datos (edad y sexo) de entrada.

<div class="clipboard-img" id="bkmrk-out%5B%E2%80%A2%5D%3D-este-es-un-e"><div class="clipboard-img">Cuando la variable de salida es numérica hablamos de **regresión**. Si la entrada es texto y la salida es una variable categórica ("gato" o "perro") hablamos de **clasificación**.</div></div><div class="clipboard-img" id="bkmrk-out%5B%E2%80%A2%5D%3D-2"></div><div class="clipboard-img" id="bkmrk-debido-a-que-la-sali">  
</div><div class="clipboard-img" id="bkmrk-como-podemos-ver%2C-el">Como podemos ver, el aprendizaje supervisado se divide en dos fases: una fase de aprendizaje durante la cual se genera un modelo y una fase de predicción durante la cual se utiliza el modelo. La fase de aprendizaje se llama fase de entrenamiento porque se entrena al modelo para realizar la tarea. La fase de predicción se llama fase de evaluación o fase de inferencia porque la salida se infiere (es decir, se deduce) a partir de la entrada y utilizando el modelo generado.</div><div class="clipboard-img" id="bkmrk--6"></div><div class="clipboard-img" id="bkmrk-en-esencia-el-modelo">En esencia el modelo es un conjunto de valores o pesos que se multiplican por los valores de entrada (traducidos a números en el caso de imágenes o texto) para obtener la salida correspondiente.</div><div class="clipboard-img" id="bkmrk--7"></div><div class="clipboard-img" id="bkmrk-es-como-adivinar-los">Es como adivinar los coeficientes en una función matemática:</div><div class="clipboard-img" id="bkmrk--8"></div><div class="clipboard-img" id="bkmrk-si-por-ejemplo-tenem">Si por ejemplo tenemos la ecuación Ax+By+Cz=k podemos construir un modelo que, a partir de distintos valores de x, y y z (muestras) y de k (etiqueta o valor de salida) permita, mediante un proceso iterativo, ajustar los valores de los coeficientes A, B y C de manera que pueda predecir el valor de k para valores de x, y y z no vistos en el proceso de enrtenamiento.</div><div class="clipboard-img" id="bkmrk--9"></div><div class="clipboard-img" id="bkmrk-en-este-caso-los-coe">En este caso los coeficientes serían los llamados pesos o parámetros del modelo.</div><div class="clipboard-img" id="bkmrk--10"></div><div class="clipboard-img" id="bkmrk-todo-se-reduce-a-hac">Todo se reduce a hacer modelos que aproximen la realidad de forma que nos permitan predecirla.</div>> <div class="clipboard-img">"Todos los modelos son incorrectos, pero algunos son útiles</div><div class="clipboard-img">George E. P. Box, 1919-2013, estadístico británico</div>

<div class="clipboard-img" id="bkmrk--12"></div>La regresión y la clasificación son las principales tareas del aprendizaje supervisado, pero este paradigma va más allá de estas tareas. Por ejemplo, la detección de objetos es una aplicación del aprendizaje supervisado en la que la salida consta de múltiples clases y sus posiciones de caja correspondientes, así el modelo se entrena usando imágenes y sus datos asociados incluyendo las posiciones en forma de rectángulo de cada objeto incluido en la imagen.

![](https://www.wolfram.com/language/introduction-machine-learning/machine-learning-paradigms/img/2-machine-learning-paradigms-Print-3.en.png)

Existen numerosas aplicaciones de dicho tipo de aprendizaje, y casi cada día aparecen nuevas, en el siguiente listado hacemos un pqueño resumen de la tipología y posibilidades de las mismas:

- **Reconocimiento de Imágenes**: Utilizado en el etiquetado automático de imágenes, reconocimiento facial, y diagnóstico médico a partir de imágenes de radiografía o resonancia magnética.
- **Generación de texto** a partir de un texto anterior usando como entrada frases y palabras de textos reales.
- **Detección de Fraude**: En el sector financiero, para identificar actividades sospechosas en transacciones de tarjetas de crédito o en comportamientos de usuarios en línea.
- **Predicción de Ventas**: En el comercio y la industria para prever tendencias de ventas y gestionar inventarios en base a datos históricos.
- **Diagnósticos Médicos**: Analizando registros médicos para ayudar en el diagnóstico precoz de enfermedades.
- **Reconocimiento de Voz y Procesamiento del Lenguaje Natural (NLP)**: Para convertir el habla en texto, traducción automática, y análisis de sentimiento en textos.
- **Predicción de Riesgos de Crédito**: En el sector bancario, para evaluar la solvencia de los solicitantes de crédito.
- **Personalización de Contenidos**: En plataformas de streaming y servicios en línea, para recomendar películas, música o productos basados en las preferencias del usuario.
- **Análisis de Series Temporales**: Para predecir valores futuros en datos financieros, meteorológicos o de cualquier otro tipo que se registre a lo largo del tiempo.
- **Clasificación de Documentos**: En sistemas de gestión de información, para clasificar y organizar documentos automáticamente.
- **Control de Calidad en Manufactura**: Para detectar defectos en productos en las líneas de ensamblaje a través de imágenes y sensores.

Mientras los datos de entrenamiento consistan en un conjunto de pares de entrada-salida, es una tarea de aprendizaje supervisado.

Actualmente, la mayoría de las aplicaciones de aprendizaje automático que se desarrollan utilizan un enfoque de aprendizaje supervisado. Una razón para esto es que las principales tareas supervisadas (clasificación y regresión) son útiles y están bien definidas, y a menudo se pueden abordar utilizando algoritmos simples. Otra razón es que se han desarrollado muchas herramientas para este paradigma. Sin embargo, la principal desventaja del aprendizaje supervisado es que necesitamos tener datos etiquetados, lo cual puede ser difícil de obtener en algunos casos.

### Aprendizaje No Supervisado  


El aprendizaje no supervisado es el segundo paradigma de aprendizaje más utilizado. No se utiliza tanto como el aprendizaje supervisado, pero es más potente y se asemeja más al funcionamiento del cerebro humano. En el aprendizaje no supervisado, no hay entradas ni salidas, los datos son simplemente un conjunto de ejemplos caracterizados por ciertos parámetros que permiten su agrupación en conjuntos similares de entidades.

El aprendizaje no supervisado se puede utilizar para una amplia gama de tareas. Una de ellas se llama agrupamiento o *clustering* y su objetivo es separar los ejemplos de datos en grupos llamados clústeres:

<div class="Print" id="bkmrk--18"></div><div class="Print" id="bkmrk--19">![](https://www.wolfram.com/language/introduction-machine-learning/machine-learning-paradigms/img/2-machine-learning-paradigms-Print-5.en.png)</div><div class="Print" id="bkmrk--20"></div>Una aplicación del agrupamiento podría ser separar automáticamente a los clientes de una empresa para crear mejores campañas de marketing (targeted marketing) .

El agrupamiento también se utiliza simplemente como una herramienta de exploración para obtener información sobre los datos y tomar decisiones fundamentadas. También permite detectar casos extraños (outliers) que suelen asociarse a fraudes o errores al ser ejemplos que quedan fuera de cualquier grupo, por ejemplo en un conjunto de transacciones o patrones de comportamiento de clientes de banca.

Otra tarea clásica de aprendizaje no supervisado se denomina reducción de dimensionalidad. El objetivo de la reducción de dimensionalidad es reducir el número de variables en un conjunto de datos al tiempo que se intenta preservar algunas propiedades de los datos que son más significativas (por ejemplo el dato 'id de pedido' en una base de datos comercial no aporta información y puede omitirse, o en una base de datos de coches el peso y la potencia suelen estar correlacionados por lo que podemos prescindir de uno de ellos).

Muchos datos incluyen decenas de parámetros que los definen, por ejemplo en una imagen cada pixel es un parámetro o dimensión, usar muchas imágenes con muchos pixeles complica demasiado y sobre todo ralentiza el algoritmo con lo que conviene reducir el número de pixeles eliminando los superfluos o que no aportan mucha información.

Los modelos se entrenan con millones de datos y dimensiones o características así que es importante optimizarlos para reducir el tiempo de entrenamiento y aumentar la eficiencia.

<a class="anchortag" id="bkmrk--22"></a>La reducción de dimensionalidad se puede utilizar para una variedad de tareas, como comprimir los datos, aprender con etiquetas faltantes, crear motores de búsqueda o incluso crear sistemas de recomendación. La reducción de dimensionalidad también se puede utilizar como una herramienta de exploración para visualizar un conjunto de datos completo en un espacio reducido.

![](https://www.wolfram.com/language/introduction-machine-learning/machine-learning-paradigms/img/2-machine-learning-paradigms-Print-7.en.png)

La detección de anomalías es otra tarea que se puede abordar de manera no supervisada. La detección de anomalías se refiere a la identificación de ejemplos que son anómalos, es decir, valores atípicos. Aquí vemos un ejemplo de detección de anomalías realizada en un conjunto de datos numéricos simple:

![](https://www.wolfram.com/language/introduction-machine-learning/machine-learning-paradigms/img/2-machine-learning-paradigms-Print-8.en.png)

Esta tarea podría ser útil para detectar transacciones fraudulentas con tarjetas de crédito, limpiar un conjunto de datos o detectar cuando algo está saliendo mal en un proceso de fabricación.

Otra tarea clásica de aprendizaje no supervisado se denomina imputación de valores faltantes, y el objetivo es completar los valores faltantes en un conjunto de datos:

![](https://www.wolfram.com/language/introduction-machine-learning/machine-learning-paradigms/img/2-machine-learning-paradigms-Print-9.en.png)

Esta tarea es extremadamente útil porque la mayoría de los conjuntos de datos tienen valores faltantes y muchos algoritmos no pueden manejarlos. En algunos casos, las técnicas de imputación de valores faltantes también se pueden utilizar para tareas predictivas, como los motores de recomendación.

Finalmente, la tarea de aprendizaje no supervisado más difícil probablemente sea aprender a generar ejemplos similares a los datos de entrenamiento. Esta tarea se llama modelado generativo y se puede utilizar, por ejemplo, para aprender a generar nuevos rostros a partir de muchos ejemplos de rostros. Aquí vemos un ejemplo de rostros sintéticos generados por una red neuronal a partir de ruido aleatorio usando modelos entrenados con imágenes reales:

![](https://www.wolfram.com/language/introduction-machine-learning/machine-learning-paradigms/img/2-machine-learning-paradigms-Print-10.en.png)

Técnicas de generación como estas también se pueden utilizar para mejorar la resolución, reducir el ruido o completar valores faltantes.

Como ejemplos genéricos de su uso proponemos los siguientes:

1. **Segmentación de Clientes**: Utilizado en marketing para agrupar clientes en segmentos basados en características similares, lo que ayuda a personalizar estrategias de marketing.
2. **Detección de Anomalías**: Para identificar comportamientos anómalos o inusuales en diversas áreas, como fraudes en tarjetas de crédito, fallos en máquinas o actividad sospechosa en redes informáticas.
3. **Agrupación de Documentos**: Para organizar automáticamente grandes colecciones de documentos, como artículos científicos o noticias, en categorías temáticas.
4. **Recomendación de Productos**: En comercio electrónico y plataformas de streaming, para sugerir productos o contenidos basados en preferencias de usuarios similares.
5. **Análisis de Redes Sociales**: Para identificar comunidades o tipos de mensajes/imágenes
6. **Exploración de Datos Genéticos**: En biología y medicina, para clasificar y estudiar patrones genéticos y biomarcadores.
7. **Análisis de Patrones en Series Temporales**: Como en la detección de tendencias en los mercados financieros o en datos meteorológicos.
8. **Optimización de Procesos Industriales**: Para identificar patrones y mejorar la eficiencia en procesos de manufactura.
9. **Visión por Computadora**: En la identificación y clasificación de objetos en imágenes cuando no están etiquetados previamente.

El aprendizaje no supervisado se utiliza un poco menos que el aprendizaje supervisado, principalmente porque las tareas que resuelve son menos comunes y más difíciles de implementar que las tareas predictivas. Sin embargo se puede aplicar a un conjunto más diverso de tareas que el aprendizaje supervisado. En la actualidad, el aprendizaje no supervisado es un elemento clave en muchas aplicaciones de aprendizaje automático y también se utiliza como una herramienta para explorar datos. Además, muchos investigadores creen que el aprendizaje no supervisado es la forma en que los humanos adquieren la mayor parte de sus conocimientos y, por lo tanto, será la clave para desarrollar sistemas artificialmente inteligentes en el futuro.

### Aprendizaje de refuerzo

El tercer paradigma de aprendizaje clásico se llama aprendizaje por refuerzo, que es una forma en que los agentes autónomos aprenden. El aprendizaje por refuerzo es fundamentalmente diferente del aprendizaje supervisado y no supervisado en el sentido de que los datos no se proporcionan como un conjunto fijo de ejemplos. En cambio, los datos para aprender se obtienen interactuando con un sistema externo llamado entorno. El nombre "aprendizaje por refuerzo" proviene de la psicología del comportamiento, pero también podría llamarse "aprendizaje interactivo".

El aprendizaje por refuerzo se utiliza a menudo para enseñar a los agentes, como robots, a aprender una tarea determinada. El agente aprende tomando acciones en el entorno y recibiendo observaciones de este entorno:

<a class="anchortag" id="bkmrk--28"></a>

<div class="Print" id="bkmrk--29">![](https://www.wolfram.com/language/introduction-machine-learning/machine-learning-paradigms/img/2-machine-learning-paradigms-Print-11.en.png)</div><div class="Print" id="bkmrk--30"></div>Normalmente, el agente comienza su proceso de aprendizaje actuando al azar en el entorno, y luego el agente aprende gradualmente de su experiencia para realizar mejor la tarea utilizando una especie de estrategia de prueba y error. El aprendizaje generalmente está guiado por una recompensa que se le da al agente según su desempeño. Más precisamente, el agente aprende una política que maximiza esta recompensa. Una política es un modelo que predice qué acción tomar dados los anteriores acciones y observaciones.

El aprendizaje por refuerzo se puede utilizar, por ejemplo, para que un robot aprenda a caminar en un entorno simulado. Aquí hay una captura de pantalla de un vídeo mostrado anteriormente que ilustra el aprendizaje por refuerzo hecho y grabado por la empresa Boston Dynamics. En él se fija un objetivo como es mantener el equilibrio, y se van ajustando las variables (posición y sincronización de elementos móviles) para poco a poco lograr una estabilidad que contribuya al equilibrio:

[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-11/scaled-1680-/vOVimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-11/vOVimage.png)

<div class="Print" id="bkmrk--32"></div><div class="Print" id="bkmrk--33"></div>> <div class="Print">[Enlace al vídeo](https://www.youtube.com/watch?v=jfqXkY7ZLJ0)</div>

<div class="Print" id="bkmrk--13"></div><div class="Print" id="bkmrk-en-este-caso%2C-las-ac">En este caso, las acciones son los valores de torsión aplicados a cada articulación de la pata; las observaciones son los ángulos de las patas, las fuerzas externas, etc.; y la recompensa está unida al equilibrio y la velocidad del robot. El aprendizaje en un entorno simulado como este puede luego utilizarse para ayudar a un robot real a caminar.</div><div class="Print" id="bkmrk--15"></div><div class="Print" id="bkmrk-esta-transferencia-d">Esta transferencia de la simulación a la realidad se ha utilizado, por ejemplo, por *OpenAI* para enseñar a un robot a manipular un cubo de *Rubik*:</div><div class="Print" id="bkmrk--34"></div><div class="Print" id="bkmrk--35"><a class="anchortag" id="bkmrk--36"></a>![](https://www.wolfram.com/language/introduction-machine-learning/machine-learning-paradigms/img/2-machine-learning-paradigms-Print-13.en.png)</div>También es posible que un robot real aprenda sin un entorno simulado, pero los robots reales son más lentos en comparación con los simulados y los algoritmos actuales tienen dificultades para aprender lo suficientemente rápido. Una estrategia de mitigación consiste en aprender a simular el entorno real, un campo conocido como aprendizaje por refuerzo basado en modelos, que está siendo objeto de investigación activa.

El aprendizaje por refuerzo también se puede utilizar para enseñar a las computadoras a jugar juegos. Ejemplos famosos incluyen *AlphaGo*, que puede vencer a cualquier jugador humano en el juego de mesa *Go*, o *AlphaStar*, que puede hacer lo mismo en el videojuego *StarCraft*:

<a class="anchortag" id="bkmrk--38"></a>![](https://www.wolfram.com/language/introduction-machine-learning/machine-learning-paradigms/img/2-machine-learning-paradigms-Print-14.en.png)

Ambos programas fueron desarrollados utilizando aprendizaje por refuerzo al hacer que el agente juegue contra sí mismo. Cabe destacar que la recompensa en este tipo de problemas solo se otorga al final del juego (ya sea que ganes o pierdas), lo que dificulta aprender qué acciones fueron responsables del resultado.

Otra aplicación importante del aprendizaje por refuerzo se encuentra en el campo de la ingeniería de control. El objetivo aquí es controlar de manera dinámica el comportamiento de un sistema (un motor, un edificio, etc.) para que se comporte de manera óptima. El ejemplo prototípico es controlar un poste que se encuentra sobre un carrito moviendo el carrito hacia la izquierda o hacia la derecha (también conocido como péndulo invertido):

<a class="anchortag" id="bkmrk--40"></a>![](https://www.wolfram.com/language/introduction-machine-learning/machine-learning-paradigms/img/2-machine-learning-paradigms-Print-15.en.png)

En general, se utilizan métodos de control clásicos para este tipo de problemas, pero el aprendizaje por refuerzo está entrando en este campo. Por ejemplo, se ha utilizado el aprendizaje por refuerzo para controlar el sistema de enfriamiento (velocidad del ventilador, flujo de agua, etc.) de los centros de datos de Google de manera más eficiente:

![](https://www.wolfram.com/language/introduction-machine-learning/machine-learning-paradigms/img/2-machine-learning-paradigms-Print-16.en.png)

> Un problema al aplicar el aprendizaje por refuerzo directamente en un sistema del mundo real es que durante la fase de aprendizaje, el agente podría realizar acciones que podrían dañar el sistema o plantear problemas de seguridad.

El aprendizaje por refuerzo es probablemente el paradigma más emocionante, ya que el agente aprende interactuando, como un ser vivo. Los sistemas activos tienen el potencial de aprender mejor que los sistemas pasivos porque pueden decidir por sí mismos qué explorar para mejorar. Podemos imaginar todo tipo de aplicaciones utilizando este paradigma, desde un robot agrícola que aprende a mejorar la producción de cultivos, hasta un programa que aprende a operar en el mercado de valores, o un *chatbot* que aprende teniendo conversaciones con humanos. Desafortunadamente, los algoritmos actuales requieren una gran cantidad de datos para ser efectivos, por lo que la mayoría de las aplicaciones de aprendizaje por refuerzo utilizan entornos virtuales. Además, los problemas de aprendizaje por refuerzo son generalmente más complicados de manejar que los problemas supervisados y no supervisados. Por estas razones, el aprendizaje por refuerzo se utiliza menos que otros paradigmas en aplicaciones prácticas. A medida que la investigación avanza, es probable que los algoritmos necesiten menos datos para operar y se desarrollen herramientas más simples. El aprendizaje por refuerzo podría convertirse en un paradigma dominante en el futuro.

<div class="Print" id="bkmrk--44"></div>

# Unidad 2.4. Imitando al cerebro. Redes neuronales.

### Métodos de Aprendizaje Profundo

> <p class="callout warning">Este capítulo tiene ciertas cuestiones técnicas que no es necesario entender, se dejan para los lectores que tengan más interés pero en absoluto son un requisito para superar el curso.</p>
> 
> <p class="callout warning">Simplemente hemos querido incluirlas por completitud y por dejar clalro que la Inteligencia Artificial no es alg mágico que surge de lo desconocido, sino que nace, en esencia, de un tratamiento estadístico de la información</p>

Dentro del campo del aprendizaje automático surgen las llamadas redes neuronales que, aunque conceptualmente existen desde los años 60, se redefinieron en la década de 2010 y mostraron un rendimiento impresionante en datos de imágenes, texto y audio. Estos métodos se basan principalmente en redes neuronales artificiales, que fueron experimentadas por primera vez en la década de 1950. En aquel momento, las redes neuronales eran principalmente un tema de investigación y no se utilizaban tanto en aplicaciones prácticas. Gracias a la velocidad de las computadoras modernas y a algunas innovaciones algorítmicas, los métodos de aprendizaje profundo se utilizan actualmente de manera intensiva, especialmente en problemas de visión artificial y en gestión del lenguaje natural.

Conviene señalar que hay dos tareas fundamentales en el aprendizaje humano, a saber, la clasificación y la genreación o predicción.

Gran parte de la IA actual y de toda la revolucón que estamos viviendo tiene que ver con ambas, la generación en lo que conocemos como **IA Generativa** y la clasificaicón en tareas de visión aritifcial principalmente.

En esta sección nos ocupamos de describir la esencia de las redes neuronales que han permitido el desarrollo de las ténicas de IA genrativa más importantes.

#### Las Neuronas y el cerebro

El cerebro humano es un órgano increíblemente complejo y fascinante. Está compuesto por miles de millones de células llamadas neuronas, que son las unidades básicas del sistema nervioso. Estas neuronas están interconectadas en una red compleja y trabajan juntas para procesar información y controlar nuestras funciones cognitivas y corporales.

Imaginemos que el cerebro es una gran red de comunicación, donde cada neurona es como un pequeño nodo que envía y recibe mensajes. Estas neuronas se comunican entre sí a través de conexiones especializadas llamadas sinapsis. En estas sinapsis, las neuronas transmiten señales eléctricas y químicas para enviar información de un lugar a otro.

Cuando una neurona recibe una señal de otra neurona a través de sus dendritas, que son como pequeñas ramificaciones que se extienden desde la célula, se genera un impulso eléctrico. Este impulso eléctrico viaja a través del cuerpo de la neurona hacia su axón, que es como un largo cable que lleva la señal hacia las sinapsis.

En las sinapsis, la señal eléctrica se transforma en una señal química. La neurona emisora libera sustancias químicas llamadas neurotransmisores en el espacio entre las células, y estos neurotransmisores se unen a receptores en la neurona receptora, desencadenando un nuevo impulso eléctrico en esa neurona. Este proceso de señalización electroquímica se repite una y otra vez a lo largo de la red neuronal, permitiendo la comunicación y el procesamiento de información.

Es importante destacar que el cerebro humano no funciona de manera lineal, como una cadena de instrucciones paso a paso. En cambio, funciona de manera altamente paralela y distribuida, con múltiples neuronas trabajando simultáneamente en diferentes partes del cerebro. Esta actividad neuronal en paralelo y distribuida es lo que nos permite realizar tareas complejas como pensar, recordar, sentir emociones y realizar acciones.

El funcionamiento exacto del cerebro y cómo las neuronas procesan y almacenan información sigue siendo objeto de intensa investigación. Los neurocientíficos continúan estudiando y descubriendo nuevos aspectos sobre el funcionamiento del cerebro y cómo se relaciona con nuestras experiencias y comportamientos.

##### Neurona Artificial

  
Las redes neuronales artificiales se inspiran en lo que sabemos sobre el cerebro. En pocas palabras, el cerebro es un sistema de procesamiento de información compuesto por células llamadas neuronas, que están interconectadas en una red. Las neuronas transmiten señales eléctricas a otras neuronas mediante estas conexiones y, juntas, son capaces de realizar cálculos que determinan nuestro comportamiento. Los seres humanos tienen alrededor de cien mil millones de neuronas en sus cerebros y aproximadamente diez mil veces más conexiones. Aquí tienes una representación clásica de lo que es una neurona biológica:

[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-07/scaled-1680-/image.png)](https://libros.catedu.es/uploads/images/gallery/2023-07/image.png)

En el lado izquierdo podemos ver las dendritas, que son ramificaciones desde donde la neurona recibe sus entradas eléctricas (mostradas como x1, x2 y x3 aquí). La célula luego "calcula" una salida eléctrica (mostrada como y aquí), que viaja a lo largo del axón y se envía a muchas otras neuronas (potencialmente miles) a través de pequeñas uniones llamadas sinapsis.

Existen una gran variedad de neuronas biológicas y realizan diferentes operaciones. Tienen en común que "disparan" señales eléctricas agudas llamadas picos si se cumplen ciertas condiciones en sus entradas y estados internos. Estos cálculos analógicos son difíciles de simular y, si bien existen muchos modelos de computación de neuronas biológicas, son poco prácticos para el aprendizaje automático.

Las redes neuronales artificiales no intentan imitar exactamente las redes biológicas. En cambio, utilizan los mismos principios subyacentes al tiempo que mantienen las cosas simples y prácticas (de la misma manera que los aviones no imitan a las aves). Las redes neuronales artificiales utilizan neuronas artificiales, que son mucho más simples que sus contrapartes biológicas. Dados los valores numéricos x1, x2 y x3, la neurona artificial realiza el siguiente cálculo:

![ ](https://www.wolfram.com/language/introduction-machine-learning/deep-learning-methods/img/11-deep-learning-methods-DisplayFormula-1.en.png)

Aquí, w1, w2 y w3 son parámetros ajustables llamados pesos (los parámetros en los modelos de lenguaje), que pueden interpretarse como "fortalezas" de conexión entre neuronas. Esto podría corresponder al número de sinapsis entre dos neuronas biológicas. b es otro parámetro ajustable llamado sesgo. En las neuronas biológicas, este valor podría interpretarse como un umbral por encima del cual la neurona dispara. f es una función no lineal llamada función de activación o función de transferencia. Las neuronas biológicas también utilizan algún tipo de función de activación no lineal, ya que o bien disparan o no. Aquí tienes una ilustración del cálculo realizado por esta neurona artificial:

[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-07/scaled-1680-/jDvimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-07/jDvimage.png)

La primera parte es una combinación lineal de las características y luego se aplica una no linealidad. La presencia de esta no linealidad es importante. Permite que las redes neuronales modelen sistemas no lineales (porque la composición de funciones lineales sigue siendo una función lineal). Dado que las neuronas biológicas disparan o no disparan, resulta tentador utilizar algún tipo de función de activación escalón.

Los modelos modernos de *deep learning* tienden a alejarse de las interpretaciones biológicas. Sin embargo, sorprendentemente, siguen utilizando los mismos principios descritos aquí: combinaciones lineales de entradas seguidas de no linealidades.

### Redes Neuronales

Ahora que tenemos una neurona artificial, podemos usarla para crear redes conectando muchas de ellas juntas. Cuando forman parte de una red neuronal, a menudo se les llama unidades y generalmente se representan de la siguiente manera:

[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-07/scaled-1680-/0o5image.png)](https://libros.catedu.es/uploads/images/gallery/2023-07/0o5image.png)

Los círculos representan valores numéricos llamados activaciones. Se da por hecho que "y" es una combinación lineal de sus entradas más algún término de sesgo y que el resultado se pasa a través de una no linealidad. Siguiendo esta convención, esto es cómo podría lucir una red neuronal artificial con conexiones aleatorias entre las neuronas:

[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-07/scaled-1680-/Q8cimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-07/Q8cimage.png)

Esta red tiene dos valores de entrada y un valor de salida. Observa que el grafo es dirigido y acíclico, por lo que podemos calcular la salida simplemente siguiendo las aristas.

Esta red es un modelo paramétrico. Hay un parámetro de peso por cada arista y un parámetro de sesgo por cada neurona. Podríamos entrenar esta red de la misma manera que cualquier otro modelo paramétrico: minimizando una función de coste calculada en algunos datos de entrenamiento. A diferencia de lo que ocurre en las redes neuronales biológicas, las aristas no se eliminan ni se añaden durante el proceso de aprendizaje; solo se modifican los parámetros numéricos (pesos y sesgos). También es posible añadir/eliminar aristas, pero es un proceso que consume tiempo, por lo que solo se realiza como un proceso separado para descubrir nuevos tipos de redes neuronales (un proceso conocido como búsqueda de arquitectura neuronal).

En la práctica, no utilizamos redes con conexiones aleatorias. En su lugar, utilizamos una arquitectura conocida. Una arquitectura neuronal no es una red exacta, sino una clase de redes neuronales que comparten estructuras similares. La arquitectura más antigua y clásica, inventada en la década de 1960, se llama perceptrón multicapa o red completamente conectada, o a veces red neuronal de propagación hacia adelante. En esta arquitectura, las neuronas se agrupan por capas, y cada neurona de una capa dada envía su salida a cada neurona de la siguiente capa (y solo a ellas). Estas capas completamente conectadas también se llaman capas lineales o capas densas. Aquí tienes un ejemplo de una red de este tipo:

[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-07/scaled-1680-/A27image.png)](https://libros.catedu.es/uploads/images/gallery/2023-07/A27image.png)

Esta red tiene tres capas (la entrada no es realmente una capa): una capa de salida y dos capas llamadas capas ocultas porque son capas intermedias. Esta red toma dos valores numéricos como entrada y devuelve cuatro valores numéricos como salida. Se podría utilizar para entrenar un clasificador que tenga cuatro posibles clases, y los valores de salida serían las probabilidades de cada clase. Para una tarea de regresión, solo tendríamos una salida (el valor predicho).

Esta arquitectura en capas permite realizar varios pasos de cálculo, al igual que lo haría un programa clásico, por lo que nos da la capacidad de realizar razonamientos. La mayoría de las redes neuronales artificiales tienen una arquitectura en capas (y las capas también están presentes en las redes neuronales biológicas). En esta ilustración, se incluyeron dos capas ocultas, pero podría haber muchas más. Una red con una capa oculta o menos se llama red superficial, mientras que una red con dos o más capas ocultas se llama red profunda, de ahí el nombre de "aprendizaje profundo". Este nombre resalta la importancia de utilizar modelos que pueden realizar varios pasos de cálculo.

En este grafo, cada flecha representa un peso. Por lo tanto, la primera capa contiene 2x4 = 8 pesos para calcular la activación de la primera capa oculta a partir de las entradas. A estos pesos, debemos agregar un parámetro de sesgo por cada salida. Estos pesos se pueden representar como una matriz.

Cada capa proporciona una serie de valores salida que se transmiten a la siguientes.

En suma el proceso general consiste en ir ajustando los pesos o parámetros de las capas de la red de forma que la salida obtenida se vaya pareciendo lo más posible a los valores reales.

El perceptrón multicapa es la arquitectura original de las redes neuronales, pero nunca logró dominar los métodos clásicos de aprendizaje automático en problemas de datos estructurados. Sin embargo, en 2017 se demostró que los perceptrones multicapa pueden competir con los métodos clásicos de aprendizaje automático en conjuntos de datos estructurados gracias a la arquitectura de auto-normalización.

Sin embargo, el uso de perceptrones multicapa sigue siendo marginal. Las redes neuronales se utilizan principalmente en datos no estructurados (imágenes, texto, sonido, etc.) gracias a arquitecturas como las redes neuronales *convolucionales*, las redes recurrentes o las redes tipo *transformer*. Estas arquitecturas todavía utilizan el concepto de capas, pero su conectividad es bastante diferente a la de los perceptrones multicapa.

Los métodos de aprendizaje profundo destacan en la resolución de problemas con datos de alta dimensionalidad, como las imágenes. En una imagen, cada píxel puede considerarse como una variable, y las interacciones entre los píxeles son cruciales para comprender el contenido general y el significado de la imagen. Un modelo superficial, como la regresión lineal, tendría dificultades para capturar estas interacciones complejas y probablemente fallaría en reconocer objetos con precisión o comprender el contenido de la imagen.

Por otro lado, los modelos de aprendizaje profundo, en particular las redes neuronales convolucionales (CNN), están diseñados específicamente para capturar y aprender patrones e interacciones complejas dentro de la imagen. Las capas de una CNN pueden aprender representaciones jerárquicas, comenzando desde características de bajo nivel como bordes y texturas, hasta características de nivel medio como formas y objetos, y finalmente características de alto nivel que representan conceptos o categorías. Esta capacidad de extraer representaciones jerárquicas permite que los modelos de aprendizaje profundo comprendan la semántica y el contexto de la imagen, lo que les permite realizar tareas como detección de objetos, clasificación de imágenes y generación de imágenes.

La profundidad de la red permite el aprendizaje automático de características relevantes a partir de los datos, sin necesidad de ingeniería de características explícitas. Los modelos de aprendizaje profundo pueden aprender a extraer características en diferentes niveles de abstracción, lo que los hace altamente efectivos en diversas tareas de visión por computadora.

Es importante tener en cuenta que los métodos de aprendizaje profundo requieren grandes cantidades de datos etiquetados para el entrenamiento, así como recursos computacionales significativos para el entrenamiento e inferencia. Sin embargo, con los avances en hardware (*GPUs*) y la disponibilidad de conjuntos de datos a gran escala, el aprendizaje profundo se ha convertido en una herramienta poderosa en el campo de la inteligencia artificial, logrando resultados notables en diversos dominios, incluyendo visión por computadora, procesamiento del lenguaje natural y reconocimiento de voz.

 <iframe allowfullscreen="allowfullscreen" height="314" src="https://www.youtube.com/embed/-P28LKWTzrI" width="560"></iframe>

*Comparación del poder de una GPU fente a una CPU para pintar una imagen*

[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-07/scaled-1680-/Mrkimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-07/Mrkimage.png)

Por sí mismos, los píxeles tienen muy poca información sobre lo que hay en esta imagen. No podríamos identificar este gato simplemente teniendo cada píxel "votando" sobre qué objeto es, al menos no sin que interactúen con otros píxeles. En cambio, es la interacción entre muchos píxeles, formando texturas, formas, etc., lo que proporciona información. Estos patrones no se pueden identificar con un simple cálculo. Los modelos de aprendizaje profundo pueden aprender estos patrones realizando varios cálculos simples. Al principio, detectan cosas como líneas analizando los píxeles. Luego, a partir de estas líneas, detectan formas más complejas. A partir de estas formas, detectan partes de objetos y así sucesivamente hasta que pueden identificar los principales objetos (consulte la sección Redes Convolucionales en este capítulo para una visualización de esta comprensión gradual). Este tipo de proceso de detección escalonado funciona porque la red es profunda y también porque las imágenes tienen una naturaleza algo jerárquica o compositiva. Las imágenes no son el único tipo de datos que es jerárquico/compositivo. El audio, por ejemplo, es bastante similar. El texto también lo es: los caracteres forman palabras, que luego forman oraciones, etc. El significado general surge de interacciones complejas. Las redes neuronales funcionan muy bien para todos estos tipos de datos.

Sin embargo, las redes neuronales no se limitan a imágenes, audio y texto. Por ejemplo, se utilizan para jugar juegos de mesa como el ajedrez o el Go aprendiendo a predecir si una configuración del juego es buena o no. También se utilizan para acelerar simulaciones físicas, predecir si una molécula tiene posibilidades de ser útil como medicamento o predecir cómo se pliega una proteína dada su secuencia de aminoácidos.

[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-07/scaled-1680-/qpXimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-07/qpXimage.png)

Aunque estas tareas pueden parecer diferentes de las tareas de percepción, también son tareas no estructuradas y tienen en común que los datos son de alta dimensionalidad y a menudo muestran alguna forma de composicionalidad.

Una cosa a tener en cuenta es que las redes neuronales actuales aprenden un tipo particular de programa. Por ejemplo, estas redes solo procesan matrices numéricas y no pueden manipular objetos categóricos, llamados símbolos en este contexto. Además, solo aprenden un conjunto de parámetros continuos y no aprenden construcciones de programación habituales (bucles, declaraciones condicionales, etc.). Dichos programas de red pueden ser muy buenos en algunas tareas pero no en otras. En general, las redes neuronales son bastante buenas para aprender tareas "intuitivas". Una regla general es que si un humano puede realizar una tarea en menos de un segundo, probablemente significa que una red también puede realizar esa tarea. Si le lleva más de un segundo a un humano realizar la tarea, probablemente signifique que los humanos están utilizando algún tipo de razonamiento consciente, que las redes neuronales profundas actualmente no son muy buenas modelando.

Por ejemplo, GPT-3 es un modelo de lenguaje entrenado en 2020 que tiene alrededor de 175 mil millones de parámetros. Estos tamaños son inherentes a las tareas que resuelven: reconocer imágenes requiere mucho conocimiento al igual que generar texto.

Dado que las redes neuronales profundas tienen muchos parámetros, requieren muchos ejemplos de entrenamiento. Las redes de identificación de imágenes suelen entrenarse con decenas de millones a cientos de millones de imágenes. El modelo de lenguaje GPT-3 utilizó un corpus de cientos de miles de millones de palabras. Estos conjuntos de datos contienen más datos de los que cualquier ser humano ha leído, visto u oído. Tal vez algún día descubramos redes con arquitecturas específicas que sean más eficientes en el uso de datos, pero actualmente, los conjuntos de datos grandes son esenciales para entrenar redes neuronales profundas, a menos que comencemos con una red preentrenada.

[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-11/scaled-1680-/0bDimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-11/0bDimage.png)

*Esta infografía muestra el panorama de modelos grandes de lenguaje y sus parámetros o pesos en octubre de 2023*

*Actualmente los últimos modelos como chatGPT-4 trabajan con 1.75 trillones de párametros, 1000 veces más que chatGPT-3*

En suma las redes usand datos numéricos de entrada para obtener una salida. En el caso de datos de tipo no numérico debemos convertirlos a números mediante diferentes técnicas que no vienne al caso en este curso.

En cualquier caso el proceso o manera en que se usan estas redes para que aprendan es similar y parte siempre de una conversión previa de los datos de entrada en números.

A continuación damos una pincelada de como funciona el proceso.

#### El proceso de aprendizaje

A continuación describimos el proceso de aprendizaje por pasos, pero sin entrar en detalles técnicos, solamente para entender la idea central.

Podemos dar un resumen de los estadios por lo que pasa cualquier proceso en el aprendizaje automático

1. Definir la pregunta: Es más dificil de lo que parece, y casi lo más importante, saber para que nos puede servir y que queremos resolver
2. Obtención y filtrado de datos: Necesitamos contar con datos de calidad, homogéneos y de fuentes fidedignas
3. Visualización de datos: Esto nos permite detectar errores o casos 'raros' a primera vista
4. Entrenamiento: Aquí ya es donde generamos el modelo
5. Pruebas: En esta parte usamos el grupo de datos de test para hacer las pruebas y evaluar el rendimiento o calidad del modelo
6. Analizar el feedback: Se analizan los resultados y en caso negativo se repite el proceso modificando parámetros como el número de capas y otros valores que afectan al algortitmo utilizado.
7. Usar el modelo obtenido para hacer predicciones.

A continuación describimos brevemente el proceso 4 de entrenamiento y posteriormente describiremos las distintas arquitecturas que sustentan todas las tareas de IA generativa que permiten la creación de modelos de lenguaje para el procesamiento del lenguaje natural.

##### 1. Inicialización

Las ponderaciones y sesgos de la red se inicializan con valores pequeños y aleatorios.

##### 2. Propagación hacia adelante (Forward Pass)

- **Entrada**: Se introduce un conjunto de entradas en la red.
- **Cálculos**: La entrada se propaga a través de las capas de la red. En cada nodo, se realiza una suma ponderada de las entradas, se le añade un sesgo y se aplica una función de activación.
- **Salida**: Se obtiene la predicción de la red para la entrada dada.

##### 3. Cálculo de la Pérdida

- Se calcula la función de pérdida (o coste), que mide la diferencia entre la predicción de la red y la salida deseada.
- Ejemplos de funciones de pérdida incluyen el Error Cuadrático Medio para problemas de regresión y la Entropía Cruzada para problemas de clasificación.

##### 4. Propagación hacia atrás (Backpropagation)

- **Gradiente de la Pérdida**: Se calcula el gradiente de la función de pérdida con respecto a cada uno de los pesos y sesgos en la red, usando la regla de la cadena y derivadas parciales. Esto indica cómo deberían ajustarse los pesos y sesgos para minimizar la pérdida.
- **Actualización de Pesos y Sesgos**: Se ajustan los pesos y sesgos en la dirección opuesta al gradiente para minimizar la pérdida. Esto se hace usando algoritmos de optimización como el Descenso del Gradiente o variantes más avanzadas como Adam.

##### 5. Iteración (*backpropagation*)

Se repiten los pasos 2-4 para un número de iteraciones o épocas, utilizando diferentes conjuntos de entrada, hasta que el modelo alcance un nivel aceptable de rendimiento que se mide mediante las diferencias entre los valores reales y los valores estimados por la red.

##### 6. Evaluación

Finalmente, se evalúa el rendimiento de la red en un conjunto de datos de prueba para asegurarse de que ha aprendido correctamente las relaciones en los datos.

Para la parte de de entrenamiento se utiliza una parte de los datos reales (*training set*) y para la evaluación y validación el resto (*validation set y test set*) .

Este proceso permite que la red neuronal multicapa ajuste sus pesos y sesgos para minimizar la función de pérdida, lo que a su vez mejora la precisión de sus predicciones en tareas de clasificación o regresión.

Este el resumen gráfico de todo el proceso:

***Fase de aprendizaje***

[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-11/scaled-1680-/apKimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-11/apKimage.png)

 ***Datos entrenamiento Vector características Algoritmo Modelo***

Una vez entrenado ya disponemos de un modelo que nos servirá para hacer las predicciones correspondientes en el proceso siguiente:

[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-11/scaled-1680-/Gebimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-11/Gebimage.png)

 ***Datos test Vector características Modelo Predicción***

<p class="callout info">Hemos pretendido dar una pincelada del proceso, en la sección final del módulo encontrarás referencias para estudiarlo en profundidad</p>

Veremos ahora de forma descriptiva las principales arquitecturas neuronales y sus aplicaciones

#### Redes convolucionales

Las redes neuronales convolucionales (CNNs por sus siglas en inglés) son un tipo de redes neuronales que han demostrado ser muy efectivas en tareas relacionadas con la visión por computadora y el procesamiento de imágenes. Su arquitectura está inspirada en la forma en que los seres humanos procesamos la información visual.

Una aplicación típica es la detección de objetos como en este ejemplo en el que se detectan los distintos objetos representados por rectángulos.

[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/S1vimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-10/S1vimage.png)

##### Estructura de una CNN:  


Las CNNs están compuestas por diferentes tipos de capas, cada una con una función específica:

1\. Convolucional: Aplica diferentes filtros (o kernels) a la imagen de entrada para extraer características importantes como bordes, texturas, etc. Cada filtro se desliza (o convoluciona) sobre la imagen para crear un mapa de características.

2\. Activación (ReLU): Introduce no linealidades en el modelo, permitiendo que la red pueda aprender patrones más complejos. La función de activación más común es la unidad lineal rectificada (ReLU).

3\. Agrupación (Pooling) Reduce la dimensionalidad de los mapas de características, haciéndolos más manejables y reduciendo el riesgo de sobreajuste. El agrupamiento promedio y el agrupamiento máximo son técnicas comunes de agrupación.

4\. Completamente Conectada (Fully Connected): Después de varias capas convolucionales y de agrupación, la información se aplanará en un vector y se alimentará a una o varias capas completamente conectadas, similares a las de un perceptrón multicapa.

5\. Salida: La última capa produce la salida de la red, que podría ser una clasificación, una regresión, etc.

Usos Principales:  
Son ampliamente utilizadas en una variedad de aplicaciones, incluyendo:

1\. Reconocimiento de Imágenes: Clasificar imágenes en categorías.  
2\. Detección de Objetos: Localizar y clasificar objetos dentro de una imagen.  
3\. Segmentación Semántica: Clasificar cada píxel de una imagen en una categoría.  
4\. Reconocimiento Facial Identificar y verificar rostros en imágenes y vídeos.  
5\. Procesamiento de Lenguaje Natural: Aunque las CNNs se diseñaron originalmente para imágenes, también se han aplicado con éxito a datos de texto y voz.

Tipos de CNNs:  
Existen varias arquitecturas de CNNs que se han vuelto populares y ampliamente utilizadas:

LeNet-5: Una de las primeras *CNNs*, diseñada para reconocimiento de dígitos.  
*AlexNet*: Ganó el concurso *ImageNet* en 2012 y popularizó las CNNs en la visión por computadora.  
*VGGNet*: Famosa por su arquitectura simple y profunda, utiliza capas convolucionales de pequeño tamaño.  
*GoogLeNet* (*Inception*): Introduce los módulos *inception*, que son bloques de construcción que permiten a la red elegir automáticamente el tamaño del filtro en cada capa.  
*EfficientNet* s una arquitectura de red neuronal convolucional que ha recibido una atención significativa debido a su capacidad para alcanzar un alto rendimiento en tareas de clasificación de imágenes con un número relativamente menor de parámetros en comparación con otras arquitecturas populares. Fue introducido por investigadores de Google en 2019.

Estos son solo algunos ejemplos, y la investigación en este campo está en constante evolución, con nuevas arquitecturas y técnicas que se desarrollan regularmente. Las CNNs son una herramienta poderosa en el campo del aprendizaje profundo y han revolucionado muchas aplicaciones en la visión por computadora y más allá.

#### Redes Recurrentes

Las Redes Neuronales Recurrentes (RNNs por sus siglas en inglés) son un tipo de red neuronal diseñado para manejar secuencias de datos, capturando la dependencia temporal entre los elementos de la secuencia. A diferencia de las redes neuronales tradicionales, las RNNs tienen conexiones recurrentes que permiten la propagación de información a través de los pasos de tiempo, haciendo posible que la salida en un momento dado dependa de los cálculos anteriores.

##### Características Clave de las RNNs:

1\. Memoria: Las RNNs mantienen un estado interno o memoria que captura información sobre los elementos anteriores de la secuencia.

2\. Conexiones Recurrentes: Cada unidad en una RNN recibe entrada no solo del dato actual en la secuencia sino también de su propio estado anterior.

3\. Parámetros Compartidos: A través de todos los pasos de tiempo, una RNN utiliza el mismo conjunto de parámetros, lo que reduce significativamente la cantidad de parámetros y facilita el aprendizaje de patrones temporales.

##### Aplicaciones:

Las RNNs son especialmente útiles para tareas que involucran secuencias de datos, incluyendo:

1\. Procesamiento de Lenguaje Natural (PLN): Traducción automática, generación de texto, reconocimiento de voz, etc.  
2\. Series Temporales: Predicción del mercado de valores, análisis de tendencias, etc.  
3\. Reconocimiento de Secuencias: Como en la escritura a mano o el reconocimiento del habla.  
4\. Generación de Música: Creación de melodías basadas en patrones aprendidos.

##### Variantes y Mejoras:

1\. LSTM (Long Short-Term Memory): Una mejora con respecto a las RNNs tradicionales que pueden capturar dependencias a largo plazo en los datos gracias a su estructura especial de celda de memoria y puertas de olvido, entrada y salida.  
2\. GRU (Gated Recurrent Unit): Similar a LSTM pero con una estructura más simplificada, lo que la hace más eficiente en términos de computación.

##### Desafíos:

\- Problema del Gradiente Desvaneciente y Explosivo: En las RNNs, los gradientes pueden volverse extremadamente pequeños o grandes, lo que hace que el entrenamiento sea inestable y difícil. Las LSTMs y GRUs fueron diseñadas para mitigar este problema.

##### Resumen

Las Redes Neuronales Recurrentes representan un avance crucial en el aprendizaje de patrones temporales y secuenciales, y han habilitado una amplia variedad de aplicaciones en el procesamiento de lenguaje natural, reconocimiento de patrones y más. Su capacidad para mantener un estado interno las hace únicas y poderosas, aunque no están exentas de desafíos, especialmente cuando se trata de secuencias muy largas. Las variantes como LSTM y GRU han demostrado ser soluciones efectivas a muchos de estos desafíos, permitiendo el aprendizaje de dependencias a largo plazo.

#### Redes Transformers

Las redes Transformer son un tipo de arquitectura de red neuronal introducida en el artículo “*Attention is All You Need*” por Vaswani et al. en 2017. Han revolucionado el campo del procesamiento del lenguaje natural (PLN) y se han convertido en la base para modelos como BERT, GPT, y muchos otros.

##### Características Clave de las Redes Transformer:

1. **Mecanismo de Atención**: En lugar de depender de recurrencias o convoluciones, las redes Transformer utilizan mecanismos de atención para ponderar la importancia de diferentes partes de la entrada en relación con cada palabra o token. La atención permite que el modelo se enfoque en las partes relevantes de la entrada para realizar la tarea y sobre todo que tenga en cuenta el contexto en que se encuentra de modo que diferencie el significado por ejemplo de palabras iguales.
2. **Codificadores y Decodificadores**: La arquitectura Transformer original consiste en una serie de bloques de codificadores y decodificadores. Los codificadores procesan la entrada, y los decodificadores generan la salida. En tareas como la generación de texto, solo se utilizan los decodificadores.
3. **Capas de Normalización y Feedforward**: Además del mecanismo de atención, los Transformers también utilizan capas de normalización y capas feedforward para procesar los datos y realizar transformaciones.
4. **Paralelismo**: A diferencia de las RNNs, las redes Transformer permiten el procesamiento paralelo de las secuencias, lo que reduce significativamente los tiempos de entrenamiento.

##### Aplicaciones:

Las redes Transformer han demostrado ser extremadamente eficaces en una variedad de tareas en PLN y más allá:

1. **Traducción Automática**: Traducir texto de un idioma a otro.
2. **Generación de Texto**: Crear texto coherente y relevante dado un prompt.
3. **Comprensión del Lenguaje**: Entender el significado del texto para responder preguntas, resumir texto, etc.
4. **Reconocimiento de Voz y Generación**: Convertir voz a texto y viceversa.
5. **Clasificación de Imágenes**: Aunque fueron diseñadas inicialmente para texto, las variantes de Transformers también se han aplicado con éxito a la clasificación de imágenes y otras tareas de visión por computadora.
6. **Amplicación de texto, imagne y sonido**

> <p class="callout info">Veremos ejemplos de estas aplicaciones en el módulo siguiente</p>

##### Desafíos y Consideraciones:

- **Requerimientos de Computación**: Los Transformers requieren una cantidad significativa de poder de cómputo y memoria, especialmente para grandes conjuntos de datos o modelos grandes.
- **Necesidad de Grandes Cantidades de Datos**: Para aprovechar al máximo su capacidad, los modelos Transformer generalmente requieren grandes cantidades de datos de entrenamiento.

##### Variantes y Mejoras:

1. **BERT (Bidirectional Encoder Representations from Transformers)**: Utiliza un Transformer para aprender representaciones de palabras en base a su contexto en ambos lados (izquierda y derecha) en un texto.
2. **GPT (Generative Pre-trained Transformer)**: Un modelo de Transformer diseñado para generar texto, preentrenado en grandes cantidades de texto y afinado para tareas específicas.

##### Resumen:

Las redes Transformer han establecido un nuevo estándar en PLN, ofreciendo un rendimiento excepcional en una amplia gama de tareas. Su diseño permite el procesamiento paralelo y el aprendizaje de relaciones complejas en los datos, aunque esto viene con un costo computacional significativo. Las mejoras y variantes continúan evolucionando, ampliando las capacidades y aplicaciones de esta poderosa arquitectura.

Para acabar esta sección dejamos un esquema de la evolución del ecosistema de modelos de tipo *transformer* generados y entrenados hasta el presente.

[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/jsaimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-10/jsaimage.png)

Fuente: [https://www.wolfram.com/language/introduction-machine-learning/deep-learning-methods/](https://www.wolfram.com/language/introduction-machine-learning/deep-learning-methods/)

##### [![image.png](https://libros.catedu.es/uploads/images/gallery/2024-03/scaled-1680-/5ymimage.png)](https://libros.catedu.es/uploads/images/gallery/2024-03/5ymimage.png)

##### *Este es el panorama de chatbots de empresas a finales de 2023*

##### Glosario de términos

Añadimos finalmente un glosario de términos de uso común en el ecosistema de la IA

<table border="1" id="bkmrk-t%C3%A9rmino-descripci%C3%B3n-" style="border-collapse: collapse; width: 100%;"><colgroup><col style="width: 50.0494%;"></col><col style="width: 50.0494%;"></col></colgroup><tbody><tr><th><span style="background-color: rgb(206, 212, 217);">**Término**</span></th><th><span style="background-color: rgb(206, 212, 217);">**Descripción**</span></th></tr><tr><td>Token</td><td>Una unidad básica de procesamiento de texto, como una palabra, un número o un signo de puntuación.</td></tr><tr><td>Contexto</td><td>El conjunto de tokens o palabras que rodean a otro token específico, importante para determinar su significado.</td></tr><tr><td>Modelo de lenguaje</td><td>Un sistema de inteligencia artificial diseñado para entender, generar y manipular lenguaje humano.</td></tr><tr><td>Aprendizaje profundo</td><td>Una técnica de aprendizaje automático que enseña a los ordenadores a aprender realizando tareas.</td></tr><tr><td>Red neuronal</td><td>Un modelo computacional inspirado en la forma en que funcionan los cerebros humanos.</td></tr><tr><td>Transformer</td><td>Un tipo de arquitectura de red neuronal especializada en procesamiento de lenguaje.</td></tr><tr><td>Entrenamiento</td><td>El proceso de enseñar a un modelo de lenguaje a entender y generar texto a través de ejemplos.</td></tr><tr><td>Generación de texto</td><td>La habilidad de un modelo de lenguaje para crear texto nuevo y coherente.</td></tr><tr><td>Comprensión del lenguaje</td><td>La capacidad de un modelo de lenguaje para entender el significado y la intención detrás del texto.</td></tr><tr><td>API (Interfaz de Programación de Aplicaciones)</td><td>Una interfaz que permite la interacción con un modelo de lenguaje a través de programas.</td></tr><tr><td>Aprendizaje supervisado</td><td>Un tipo de aprendizaje automático donde el modelo se entrena con datos etiquetados.</td></tr><tr><td>Parámetro de entrenamiento</td><td>Valores ajustables en un modelo de aprendizaje automático que se optimizan durante el entrenamiento.</td></tr><tr><td>Dimensionalidad</td><td>Se refiere al número de atributos o características que tienen los datos de entrada en un modelo.</td></tr><tr><td>Aprendizaje no supervisado</td><td>Un tipo de aprendizaje automático que utiliza datos no etiquetados para encontrar patrones.</td></tr><tr><td>Regularización</td><td>Técnicas usadas para reducir el sobreajuste en modelos de aprendizaje automático.</td></tr><tr><td>Activación</td><td>Función matemática usada en redes neuronales para determinar la salida de un nodo.</td></tr><tr><td>Aprendizaje por refuerzo</td><td>Un tipo de aprendizaje automático donde un agente aprende a tomar decisiones a través de recompensas.</td></tr><tr><td>Sobreajuste (Overfitting)</td><td>Cuando un modelo de aprendizaje automático se ajusta demasiado a los datos de entrenamiento.</td></tr><tr><td>Subajuste (Underfitting)</td><td>Cuando un modelo de aprendizaje automático no puede capturar la estructura subyacente de los datos.</td></tr></tbody></table>

# Referencias Módulo 2

## Referencias  


---

**Web:** Modelos de lenguaje fundacionales

**[https://www.promptingguide.ai/models/collection?s=35](https://www.promptingguide.ai/models/collection?s=35)**

---

**Vídeo**, 'Qué es y cómo funciona la IA'

Vídeo intuitivo de 8 minutos explicando los principales conceptos de IA

[Que es la IA](https://www.youtube.com/watch?v=_tA5cinv0U8 "Que es la IA")

---

**Libro "*Artificial Intelligence: A Modern Approach*"** por Stuart Russell y Peter Norvig.

Este libro es considerado uno de los textos más completos en el campo de la IA. Cubre una amplia gama de técnicas y conceptos de IA, desde los más fundamentales hasta los más avanzados, es un material para dedicarle tiempo.

---

**Libro "*Superinteligencia: Caminos, peligros, estrategias*"** por Nick Bostrom.

Bostrom explora el futuro de la inteligencia artificial y los desafíos que enfrentamos cuando las máquinas superen la inteligencia humana.

---

**Web Wolfram**

[https://www.coursera.org/professional-certificates/ibm-machine-learning](https://www.coursera.org/professional-certificates/ibm-machine-learning)

Dell creador del lenguaje Wolfram para trabajo con datos e IA Stephen Wolfram

Parte del material de esta sección del curso proviene de su documentación teórica sobre los fundamentos de IA.

Una lecutra imprescindible para profundizar en los conceptos

---

**Vídeo Concepto de ML**

Vídeo muy sencillo de 8 minutos sobre el concepto de Machine Learning

[Concepto de ML](https://www.youtube.com/watch?v=ukzFI9rgwfU&list=PLEiEAq2VkUULYYgj13YHUWmRePqiu8Ddy "Concepto de ML")

---

**Libro:** *Machine Learning For Dummies*

Clásico libro para aprender sin conocimientos previos

**[https://www.ibm.com/downloads/cas/GB8ZMQZ3](https://www.ibm.com/downloads/cas/GB8ZMQZ3)**

---

**Libro**: "Redes Neuronales: Una Introducción Sencilla". Raúl González Duque.

---

**Curso** Aprendizaje Automático

Conjunto de cursos gratuitos de Microsoft para ser científico de datos

[https://cloud.google.com/training/machinelearning-ai?hl=es-419](https://cloud.google.com/training/machinelearning-ai?hl=es-419)

---

**Curso** Machine Learning

Curso gratuito de google para desarrolladores

[https://developers.google.com/machine-learning/crash-course?hl=es-419](https://developers.google.com/machine-learning/crash-course?hl=es-419)

---

**Canal** de vídeos relacionados con AI de Stanford

Canal con cientos de vídeos de Yotutube sobre IA y Machine Learning

[https://www.youtube.com/@stanfordonline](https://www.youtube.com/@stanfordonline)

---

**Curso** gratuito de Machine Learning de IBM en la plaforma Coursera

[https://www.coursera.org/professional-certificates/ibm-machine-learning](https://www.coursera.org/professional-certificates/ibm-machine-learning)

# Módulo 3. Y ahora que hacemos. Aplicaciones de la IA

Este módulo da una visión de las aplicaciones más importantes y potentes de IA así como una guía detallada de técnicas de prompting que facilite el uso de dichas aplicaciones, siempre haciendo énfasis en aplicaciones en el ámbito educativo.

# Unidad 3.1. Posibilidades de la IA

### Introducción

Hemos repasado la historia de las ideas y avances que han llevado a la IA al momento actual. Hemos visto que la IA ya es una realidad en nuestra sociedad y que tiene una gran importancia en la economía y un enorme potencial por delante. También hemos podido analizar su funcionamiento, lo que sin duda nos ayudará a entenderla un poco mejor y a poder sacar un mejor provecho de la misma cuando empecemos a explorar las posibilidades que nos ofrece.

En esta unidad vamos a entrar en el mundo de posibilidades que se abre ante nosotros, repasando y analizando las posibles aplicaciones de la IA.

---

### Posibilidades de la IA

La Inteligencia Artificial tiene una gran cantidad de aplicaciones en varios campos. Muchas de ellas, ya las hemos visto en unidades anteriores, ya fuera al exponer las aplicaciones actuales de la IA o al analizar el funcionamiento de la misma. Si bien ahora vamos a entrar a profundizar en las posibilidades de uso "cotidiano" de manera que podamos extraer conclusiones sobre la utilidad que nos pueden reportar. Aquí hay una descripción estructurada de algunas de las aplicaciones más notables de la IA, organizadas por categorías funcionales:

#### Procesamiento del lenguaje natural (PLN)

El PLN es una subdisciplina de la IA que se centra en la interacción entre las computadoras y el lenguaje humano. A través de los años, las capacidades de los modelos de PLN han avanzado enormemente. A continuación, se describen algunas de las cosas de las que es capaz un modelo de PLN:

- **Análisis de Sentimiento.** Determinar si un texto expresa un sentimiento positivo, negativo o neutro. Es ampliamente utilizado en monitoreo de redes sociales y análisis de opiniones en línea.
- **Traducción Automática.** Traducir texto de un lenguaje a otro. Ejemplos famosos incluyen herramientas como Google Translate.
- **Resumen Automático.** Generar resúmenes concisos de textos largos.
- **Reconocimiento de Entidades Nombradas.** Identificar y clasificar entidades en un texto (como nombres de personas, organizaciones, lugares, etc.).
- **Clasificación de Texto.** Clasificar textos en diferentes categorías. Por ejemplo, determinar si un email es spam o no.
- **Respuesta a Preguntas.** Responder preguntas basadas en un conjunto de información o conocimiento. Los chatbots y asistentes virtuales a menudo utilizan esta capacidad.
- **Generación de Texto.** Producir texto de manera coherente y relevante. Por ejemplo, modelos como GPT-3 y GPT-4 de OpenAI son capaces de generar contenido textual en una variedad de estilos y temas.
- **Extracción de Información:** Extraer datos específicos de textos grandes, como extraer fechas, cifras, hechos, etc.
- **Corrección Ortográfica y Gramatical:** Identificar y corregir errores en el texto.
- **Análisis de Dependencia y Sintáctico:** Descomponer y entender la estructura gramatical de las oraciones.
- **Reconocimiento de Voz:** Convertir el habla en texto. Esta tecnología está detrás de asistentes como Siri, Alexa y Google Assistant.
- **Síntesis de Voz:** Convertir texto escrito en habla.
- **Recomendaciones de Texto.** Sugerir palabras o frases mientras un usuario está escribiendo, como lo hace el teclado de un smartphone o las búsquedas en Google.
- **Desambiguación Léxica.** Determinar el significado de una palabra basándose en su contexto.
- **Detección de Idioma.** Identificar en qué idioma está escrito un texto.

Es importante destacar que, aunque los modelos de PLN han alcanzado altos niveles de rendimiento en muchas tareas, todavía enfrentan desafíos, especialmente cuando se trata de entender el contexto completo, el sarcasmo, o ciertas sutilezas y ambigüedades del lenguaje humano.

#### Visión por computadora

La visión por computadora es otra rama de la IA que se ocupa de permitir que las computadoras "vean" e interpreten imágenes y videos. Los sistemas de inteligencia artificial que utilizan visión por computadora han experimentado avances significativos en los últimos años. Estas son algunas de las posibilidades y aplicaciones de la visión por computadora con IA:

- **Reconocimiento facial.** Puede identificar y verificar personas a partir de imágenes o vídeos. Esto se utiliza en aplicaciones de seguridad, desbloqueo de dispositivos móviles y etiquetado automático en redes sociales.
- **Reconocimiento de objetos.** Puede identificar y clasificar objetos dentro de imágenes. Por ejemplo, en aplicaciones de comercio electrónico para identificar productos o en vehículos autónomos para identificar obstáculos.
- **Detección de defectos.** En la industria manufacturera, se utilizan cámaras y sistemas de IA para detectar defectos en productos en la línea de producción.
- **Análisis médico.** En el campo de la medicina, los sistemas de IA pueden ayudar a diagnosticar enfermedades al analizar imágenes médicas como radiografías, resonancias magnéticas y tomografías.
- **Navegación autónoma.** Los vehículos autónomos y drones utilizan visión por computadora para navegar, detectar obstáculos y tomar decisiones en tiempo real.
- **Realidad aumentada (RA).** Las aplicaciones de RA utilizan visión por computadora para superponer información digital sobre el mundo real.
- **Seguimiento de movimiento.** Utilizado en deportes para seguir la trayectoria de balones o en cinematografía para efectos especiales.
- **Análisis de comportamiento.** En seguridad o marketing, puede analizar patrones de movimiento de las personas y detectar comportamientos inusuales o medir la efectividad de exhibidores publicitarios.
- **Reconocimiento de texto (OCR).** Convertir imágenes de texto escrito o impreso en datos textuales. Esto se usa en aplicaciones de digitalización de documentos y traducción en tiempo real de señales o menús, por ejemplo.
- **Control de calidad.** En agricultura, por ejemplo, se pueden usar sistemas de visión por computadora para clasificar frutas y verduras según su calidad.
- **Reconocimiento de gestos.** Permite la interacción con dispositivos mediante gestos manuales.
- **Segmentación semántica.** Clasifica cada píxel de una imagen en una categoría, como "persona", "coche", "edificio", etc., permitiendo una comprensión más detallada del entorno.
- **Estimación de pose.** Detecta la posición y orientación del cuerpo humano en tiempo real, útil para aplicaciones de fitness, videojuegos y más.

La combinación de hardware cada vez más potente, grandes conjuntos de datos y algoritmos avanzados de aprendizaje profundo ha permitido que la visión por computadora con IA penetre en muchos sectores y continúe expandiéndose en nuevas áreas. La investigación en este campo es activa y sigue produciendo mejoras y nuevas capacidades.

#### Audio

Los sistemas de inteligencia artificial que procesan y analizan audio han experimentado también avances considerables. Las aplicaciones relacionadas con el audio y la IA abarcan una amplia gama de áreas. Estas son algunas de las posibilidades y aplicaciones de la IA en este ámbito:

- **Reconocimiento de voz.** Convertir el habla en texto, como lo hacen los asistentes virtuales.
- **Síntesis de voz.** Convertir texto en habla, lo que permite que las máquinas "hablen" con un tono y cadencia más natural.
- **Identificación de hablantes.** Reconocer a una persona específica por su voz, lo que puede ser útil en aplicaciones de seguridad o personalización.
- **Traducción automática.** Traducir en tiempo real el habla de un idioma a otro.
- **Reconocimiento de sonidos ambientales.** Detectar y clasificar sonidos no verbales, como sirenas, ladridos de perros o maquinaria en funcionamiento.
- **Detección de emociones.** Analizar el tono y las inflexiones de la voz para determinar el estado emocional del hablante.
- **Mejora y restauración de audio.** Detectar y eliminar ruidos o sonidos que no se quiere que aparezcan y mejorar la claridad del audio en grabaciones.
- **Música.** Composición automática, recomendaciones musicales personalizadas y análisis de propiedades musicales.
- **Análisis acústico.** Monitorizar entornos para detectar anomalías, como en sistemas de seguridad o en análisis de salud de maquinaria.
- **Generación de música y sonido.** Crear música o efectos de sonido nuevos usando redes neuronales.
- **Transcripciones automáticas.** Convertir grabaciones de voz, como entrevistas, conferencias o reuniones, en texto escrito.
- **Sistemas de verificación biométrica.** Usar el audio, específicamente la voz, como una forma de verificación biométrica para autenticar a los usuarios.
- **Adaptación y personalización.** Ajustar la respuesta de un asistente virtual según el usuario y su contexto basándose en el análisis del audio.
- **Educación y formación.** Herramientas para ayudar en la pronunciación de idiomas o para detectar errores en la lectura en voz alta.

De nuevo aquí, la convergencia de grandes conjuntos de datos de audio, algoritmos avanzados (especialmente en el área de redes neuronales recurrentes y transformadores) y hardware más potente ha impulsado la adopción de la IA en aplicaciones de audio. Como en otros campos de la IA, la investigación en audio sigue siendo muy activa y está abriendo nuevas posibilidades y mejoras continuamente.

#### Multimodo

Hasta aquí, es posible que te haya asaltado la idea de que estos modos podrían ser combinables para obtener una mayor funcionalidad y utilidad del sistema, eso es precisamente lo que hacen los sistemas multimodales. Los sistemas de IA multimodo son aquellos que combinan información de algunas o todas las modalidades vistas previamente (texto, imagen/video, audio) para llevar a cabo tareas o proporcionar soluciones más integradas y contextuales. Estos sistemas son especialmente poderosos porque pueden aprovechar las fortalezas y compensar las debilidades de cada modalidad individual. Aquí hay algunas posibilidades y aplicaciones de la IA multimodo:

- **Asistentes virtuales mejorados.** Un asistente que puede comprender tanto el habla (audio) como las expresiones faciales (video) puede proporcionar respuestas más contextuales y emotivas.
- **Análisis de sentimientos avanzado.** Al combinar el análisis de texto (por ejemplo, de transcripciones) con el análisis de tono de voz y expresiones faciales, se puede obtener una comprensión más precisa del sentimiento de una persona.
- **Educación y formación.** Plataformas educativas que adaptan el contenido según las respuestas verbales y no verbales de un estudiante. Por ejemplo, si un estudiante parece confundido (expresión facial) y hace una pregunta relevante (audio), el sistema puede ofrecer información adicional.
- **Reuniones y teleconferencias.** Herramientas que pueden transcribir automáticamente el habla, identificar a los participantes a través del reconocimiento facial y resaltar puntos clave basándose en énfasis vocal o gestos.
- **Publicidad y marketing.** Análisis de reacciones de audiencias a contenido multimedia, combinando respuestas textuales con análisis de expresiones faciales y tono de voz.
- **Realidad aumentada y virtual.** Sistemas que responden a comandos de voz, gestos y movimientos oculares simultáneamente para proporcionar una experiencia más inmersiva.
- **Sistemas de navegación en vehículos.** Combina señales visuales (obtenidas mediante cámaras) con comandos de voz y datos de sensores para ofrecer instrucciones más precisas y seguras.
- **Salud y bienestar.** Aplicaciones que monitorizan tanto el habla (para detectar signos de estrés o depresión, por ejemplo) como las expresiones faciales o la postura corporal para proporcionar retroalimentación y apoyo.
- **Entretenimiento interactivo.** Videojuegos o experiencias interactivas que responden a múltiples señales del usuario, desde comandos de voz hasta movimientos corporales.
- **Búsqueda avanzada.** Búsqueda de contenido en plataformas que no solo interpreta palabras clave, sino también contextos visuales y auditivos asociados.
- **Accesibilidad.** Sistemas que ayudan a personas con discapacidades a interactuar con la tecnología, combinando, por ejemplo, interpretación de lenguaje de señas con comandos de voz.

El desarrollo de sistemas de IA multimodo es complejo, ya que requiere la integración efectiva de modelos especializados en diferentes modalidades. Sin embargo, a medida que la tecnología avanza, sin duda veremos una adopción más amplia de soluciones multimodo, dada su capacidad para proporcionar experiencias más ricas y contextuales.

**Principales empresas de IA y sus chatBots en marzo de 2024** [![image.png](https://libros.catedu.es/uploads/images/gallery/2024-03/scaled-1680-/rcJimage.png)](https://libros.catedu.es/uploads/images/gallery/2024-03/rcJimage.png)

# Unidad 3.2. Tutorial de Prompting. La impotancía de las preguntas

> <span style="color: rgb(0, 0, 0);">"Juzga a un hombre por sus preguntas y no por sus respuestas" Voltaire</span>

> <span style="color: rgb(0, 0, 0);">"No es la respuesta la que ilumina, sino la pregunta" Eugene Ionesco</span>

> <span style="color: rgb(0, 0, 0);">“Lo importante es no dejar de hacerse preguntas” </span>
> 
> <span style="color: rgb(0, 0, 0);">"Si yo tuviera una hora para resolver un problema, y mi vida dependiera de la solución, gastaría los primeros 55 minutos en determinar la pregunta apropiada, porque una vez conociera la pregunta correcta, podría resolver el problema en menos de cinco minutos"</span>
> 
> <span style="color: rgb(0, 0, 0);">Albert Einstein</span>

### <span style="color: rgb(0, 0, 0);">Introducción </span>

<span style="color: rgb(0, 0, 0);">Ya hemos visto que la herramienta que provocó la irrupción masiva la inteligencia artificial a nivel popular fue el chatbot ChatGPT. La tecnología que hay detrás de este chat es el mencionado PLN (Procesamiento del Lenguaje Natural). A día de hoy, esta tecnología se ha utilizado para desarrollar muchos otros chatbots (Gemini, Llama, Claude etc…). El PLN es un subcampo de la IA que utiliza modelos de lenguaje para predecir una secuencia de palabras.</span>

<span style="color: rgb(0, 0, 0);">Para poder sacar el mayor potencial de estos modelos, es crucial entender y aplicar de manera efectiva la técnica de "prompting". Esta técnica nos permite interactuar con estos modelos de lenguaje para recibir respuestas específicas y generar distintos tipos de contenido, desde texto, como en los chatbots, <span style="mso-spacerun: yes;"> </span>hasta imágenes y sonidos a través de otras herramientas que veremos más adelante.</span>

<span style="color: rgb(0, 0, 0);">En este capítulo, vamos a explorar el concepto de *prompting* de forma detallada, sus implicaciones en la IA, y su potencial aplicación en la educación.</span>

---

### <span style="color: rgb(0, 0, 0);">¿Qué es el *prompting?* y su importancia</span>

<span style="color: rgb(0, 0, 0);">El *prompting* es una técnica utilizada para interactuar con sistemas de IA mediante indicaciones o preguntas específicas . Es el medio por el cual se le pide a un modelo de lenguaje o a un algoritmo de IA que realice una acción o que genere una respuesta. Este concepto es fundamental para aprovechar plenamente las capacidades de los modelos de IA, especialmente en el procesamiento de lenguaje natural (PLN).</span>

<span style="color: rgb(0, 0, 0);">El *prompting* nos lleva a introducir al modelo un prompt, lo que en castellano podríamos traducir como “cuestión, pregunta o Indicación”. </span>

<span style="color: rgb(0, 0, 0);">Por tanto, el *prompting* se trata, dicho de manera simple, de pensar y trabajar la indicación o pregunta que vamos a realizarle al modelo de IA para que la respuesta o resultado que el modelo nos presente sea lo más ajustado posible a nuestra solicitud y nos aporte un contenido lo más valioso posible.</span>

<span style="color: rgb(0, 0, 0);">**Un ejemplo aclaratorio:** </span>

<span style="color: rgb(0, 0, 0);">Todos hemos hecho búsquedas en cualquiera de los buscadores disponibles por internet. Al hacerlas, en mayor o menor medida hacemos un esfuerzo para introducir el texto adecuado para que el motor de búsqueda encuentre la web o webs más relevantes para nuestra necesidad concreta. Ese **esfuerzo** que hacemos para que nuestra entrada facilite al buscador ofrecernos lo que buscamos sería el prompting. En el contexto de un motor de búsqueda, esto se traduciría en cómo eliges y organizas las palabras clave para obtener los resultados más relevantes. Es una especie de "arte" en cómo haces la pregunta para obtener la mejor respuesta</span>

<span style="color: rgb(0, 0, 0);"><span style="mso-spacerun: yes;"> </span>A su vez, el texto que introducimos en el buscador representaría el ***prompt**.* Es la consulta específica que generas, compuesta de palabras clave, frases o preguntas, que el motor de búsqueda procesa para obtener resultados.</span>

<span style="color: rgb(0, 0, 0);">El *prompting* es **esencial** para una gran variedad de aplicaciones de IA. Desde asistentes virtuales hasta motores de búsqueda y sistemas de recomendación, el diseño y la implementación efectiva de *prompts* son cruciales para la eficacia y precisión de estos sistemas. Además, con la aparición de modelos más avanzados y diversos, el papel del *prompting* se ha expandido para incluir la generación de contenido más allá del texto, como imágenes y sonidos.</span>

<span style="color: rgb(0, 0, 0);">![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/moTimage.png)Imagen propia. Generada por el Generador de imágenes de Bing.</span>

<div class="flex" id="bkmrk--1"></div>---

### <span style="color: rgb(0, 0, 0);">Evolución del *prompting*</span>

<span style="color: rgb(0, 0, 0);">En los albores de la computación, las interacciones con las máquinas eran bastante rudimentarias. Las interfaces de **línea de comandos** fueron algunas de las primeras formas de *prompting,* donde los usuarios ingresaban comandos de texto específicos para obtener respuestas o realizar tareas. </span>

<span style="color: rgb(0, 0, 0);">Con el tiempo y el avance tecnológico, las formas de interactuar con las máquinas se han vuelto cada vez más sofisticadas. Pasamos de las interfaces de línea de comandos *(MS-DOS)* a interfaces gráficas de usuario *(Windows)* y luego a interacciones más intuitivas gracias a la IA. Los modelos de lenguaje de gran escala como por ejemplo *GPT-3* (modelo detrás de *ChatGPT)* y *LaMDA* (modelo detrás de *Bard)* permiten ahora una interacción mucho más natural y conversacional. A través de prompts bien diseñados, estos y otros modelos pueden comprender y generar texto, imágenes, y sonidos que son increíblemente cercanos a lo que un humano podría producir o entender.</span>

<span style="color: rgb(0, 0, 0);">En sus inicios, el *prompting* se limitaba principalmente al texto. Sin embargo, con el desarrollo de modelos de IA más avanzados, ahora es posible generar y analizar diferentes tipos de medios. Por ejemplo, existen modelos que pueden generar imágenes basadas en descripciones de texto *(prompts* de imagen), y también modelos que podrían generar un texto basándose en una imagen (que en este caso haría el papel de *prompt),* pero también modelos que pueden componer música basada en ciertas instrucciones o emociones *(prompts* de audio). Esta evolución ha ampliado enormemente el alcance y las aplicaciones del *prompting,* permitiendo una gama más amplia de interacciones y generación de contenido.</span>

<span style="color: rgb(0, 0, 0);">Modelos capaces de entender *prompts* de diferentes tipos y generar resultados también de diferentes tipos serían los mencionados multimodales. Un ejemplo: introducir una imagen de un paisaje otoñal en un modelo de este tipo, y solicitar que genere un poema que capture la esencia de la imagen.</span>

<span style="color: rgb(0, 0, 0);">Este tipo de interacción representa una evolución emocionante en el campo del *prompting,* ya que amplía significativamente las formas en que podemos interactuar con los modelos de IA. Los *prompts* ya no están limitados al texto, sino que pueden abarcar una variedad de medios, incluidas imágenes, sonidos y quizás más en el futuro.</span>

<span style="color: rgb(0, 0, 0);">Esta funcionalidad tiene aplicaciones potenciales muy interesantes, no solo en el ámbito del arte y la creatividad, sino también en campos como la educación, donde podría emplearse para enseñar conceptos como la interpretación de imágenes, la escritura creativa o incluso la empatía y el entendimiento cultural.</span>

---

### <span style="color: rgb(0, 0, 0);">Tipos de *prompts*</span>

<span style="color: rgb(0, 0, 0);">Como acabamos de ver, a medida que la inteligencia artificial ha evolucionado, los *prompts* que podemos utilizar para interactuar con los modelos también lo han hecho. Mientras que en sus inicios el *prompting* se centraba exclusivamente en el texto, la tecnología actual permite una gama mucho más amplia de interacciones. </span>

<span style="color: rgb(0, 0, 0);">El desarrollo de la IA le permite abordar una amplia variedad de modalidades. Las "modalidades" en este contexto se refieren a las diferentes formas de datos o información que los sistemas de IA pueden procesar *(prompt* de entrada) o generar (salida de la IA). </span>

<span style="color: rgb(0, 0, 0);">En la siguiente tabla vamos a resumir todas las modalidades que la IA generativa nos ofrece. Cada una de las cuales admite uno o más tipos de *prompts.* </span>

<table border="1" cellpadding="0" cellspacing="0" class="MsoTable15Grid5DarkAccent2" id="bkmrk-prompt-%28entrada%29-res" style="border-collapse: collapse; border: none; mso-border-alt: solid white .5pt; mso-border-themecolor: background1; mso-yfti-tbllook: 1184; mso-padding-alt: 0cm 5.4pt 0cm 5.4pt;"><tbody><tr style="mso-yfti-irow: -1; mso-yfti-firstrow: yes; mso-yfti-lastfirstrow: yes;"><td style="width: 77.75pt; border: solid white 1.0pt; mso-border-themecolor: background1; border-right: none; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-left-alt: solid white .5pt; mso-border-left-themecolor: background1; mso-border-bottom-alt: solid white .5pt; mso-border-bottom-themecolor: background1; background: #ED7D31; mso-background-themecolor: accent2; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="104"><span style="color: rgb(0, 0, 0);">***Prompt* (entrada)**</span>

</td><td style="width: 99.2pt; border-top: solid white 1.0pt; mso-border-top-themecolor: background1; border-left: none; border-bottom: solid white 1.0pt; mso-border-bottom-themecolor: background1; border-right: none; mso-border-top-alt: solid white .5pt; mso-border-bottom-alt: solid white .5pt; background: #ED7D31; mso-background-themecolor: accent2; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="132"><span style="color: rgb(0, 0, 0);">**Respuesta IA (salida)**</span>

</td><td style="width: 247.75pt; border: solid white 1.0pt; mso-border-themecolor: background1; border-left: none; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-bottom-alt: solid white .5pt; mso-border-bottom-themecolor: background1; mso-border-right-alt: solid white .5pt; mso-border-right-themecolor: background1; background: #ED7D31; mso-background-themecolor: accent2; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="330"><span style="color: rgb(0, 0, 0);">**Ejemplo de uso**</span>

</td></tr><tr style="mso-yfti-irow: 0;"><td style="width: 77.75pt; border: solid white 1.0pt; mso-border-themecolor: background1; border-top: none; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-alt: solid white .5pt; background: #ED7D31; mso-background-themecolor: accent2; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="104"><span style="color: rgb(0, 0, 0);">**Texto**</span>

</td><td style="width: 99.2pt; border-top: none; border-left: none; border-bottom: solid white 1.0pt; mso-border-bottom-themecolor: background1; border-right: solid white 1.0pt; mso-border-right-themecolor: background1; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-left-alt: solid white .5pt; mso-border-left-themecolor: background1; mso-border-alt: solid white .5pt; mso-border-themecolor: background1; background: #F7CAAC; mso-background-themecolor: accent2; mso-background-themetint: 102; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="132"><span style="color: rgb(0, 0, 0);">Texto</span>

</td><td style="width: 247.75pt; border-top: none; border-left: none; border-bottom: solid white 1.0pt; mso-border-bottom-themecolor: background1; border-right: solid white 1.0pt; mso-border-right-themecolor: background1; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-left-alt: solid white .5pt; mso-border-left-themecolor: background1; mso-border-alt: solid white .5pt; mso-border-themecolor: background1; background: #F7CAAC; mso-background-themecolor: accent2; mso-background-themetint: 102; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="330"><span style="color: rgb(0, 0, 0);">Chatbot, traducción, resumen…</span>

</td></tr><tr style="mso-yfti-irow: 1;"><td style="width: 77.75pt; border: solid white 1.0pt; mso-border-themecolor: background1; border-top: none; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-alt: solid white .5pt; background: #ED7D31; mso-background-themecolor: accent2; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="104"><span style="color: rgb(0, 0, 0);">**Texto**</span>

</td><td style="width: 99.2pt; border-top: none; border-left: none; border-bottom: solid white 1.0pt; mso-border-bottom-themecolor: background1; border-right: solid white 1.0pt; mso-border-right-themecolor: background1; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-left-alt: solid white .5pt; mso-border-left-themecolor: background1; mso-border-alt: solid white .5pt; mso-border-themecolor: background1; background: #FBE4D5; mso-background-themecolor: accent2; mso-background-themetint: 51; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="132"><span style="color: rgb(0, 0, 0);">Imagen</span>

</td><td style="width: 247.75pt; border-top: none; border-left: none; border-bottom: solid white 1.0pt; mso-border-bottom-themecolor: background1; border-right: solid white 1.0pt; mso-border-right-themecolor: background1; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-left-alt: solid white .5pt; mso-border-left-themecolor: background1; mso-border-alt: solid white .5pt; mso-border-themecolor: background1; background: #FBE4D5; mso-background-themecolor: accent2; mso-background-themetint: 51; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="330"><span style="color: rgb(0, 0, 0);">Generación imagen desde texto</span>

</td></tr><tr style="mso-yfti-irow: 2;"><td style="width: 77.75pt; border: solid white 1.0pt; mso-border-themecolor: background1; border-top: none; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-alt: solid white .5pt; background: #ED7D31; mso-background-themecolor: accent2; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="104"><span style="color: rgb(0, 0, 0);">**Texto**</span>

</td><td style="width: 99.2pt; border-top: none; border-left: none; border-bottom: solid white 1.0pt; mso-border-bottom-themecolor: background1; border-right: solid white 1.0pt; mso-border-right-themecolor: background1; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-left-alt: solid white .5pt; mso-border-left-themecolor: background1; mso-border-alt: solid white .5pt; mso-border-themecolor: background1; background: #F7CAAC; mso-background-themecolor: accent2; mso-background-themetint: 102; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="132"><span style="color: rgb(0, 0, 0);">Video</span>

</td><td style="width: 247.75pt; border-top: none; border-left: none; border-bottom: solid white 1.0pt; mso-border-bottom-themecolor: background1; border-right: solid white 1.0pt; mso-border-right-themecolor: background1; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-left-alt: solid white .5pt; mso-border-left-themecolor: background1; mso-border-alt: solid white .5pt; mso-border-themecolor: background1; background: #F7CAAC; mso-background-themecolor: accent2; mso-background-themetint: 102; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="330"><span style="color: rgb(0, 0, 0);">Generación de video desde texto</span>

</td></tr><tr style="mso-yfti-irow: 3;"><td style="width: 77.75pt; border: solid white 1.0pt; mso-border-themecolor: background1; border-top: none; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-alt: solid white .5pt; background: #ED7D31; mso-background-themecolor: accent2; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="104"><span style="color: rgb(0, 0, 0);">**Texto**</span>

</td><td style="width: 99.2pt; border-top: none; border-left: none; border-bottom: solid white 1.0pt; mso-border-bottom-themecolor: background1; border-right: solid white 1.0pt; mso-border-right-themecolor: background1; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-left-alt: solid white .5pt; mso-border-left-themecolor: background1; mso-border-alt: solid white .5pt; mso-border-themecolor: background1; background: #FBE4D5; mso-background-themecolor: accent2; mso-background-themetint: 51; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="132"><span style="color: rgb(0, 0, 0);">Audio</span>

</td><td style="width: 247.75pt; border-top: none; border-left: none; border-bottom: solid white 1.0pt; mso-border-bottom-themecolor: background1; border-right: solid white 1.0pt; mso-border-right-themecolor: background1; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-left-alt: solid white .5pt; mso-border-left-themecolor: background1; mso-border-alt: solid white .5pt; mso-border-themecolor: background1; background: #FBE4D5; mso-background-themecolor: accent2; mso-background-themetint: 51; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="330"><span style="color: rgb(0, 0, 0);">Síntesis de voz, sistemas Text-To-Speech, generación de música</span>

</td></tr><tr style="mso-yfti-irow: 4;"><td style="width: 77.75pt; border: solid white 1.0pt; mso-border-themecolor: background1; border-top: none; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-alt: solid white .5pt; background: #ED7D31; mso-background-themecolor: accent2; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="104"><span style="color: rgb(0, 0, 0);">**Imagen** </span>

</td><td style="width: 99.2pt; border-top: none; border-left: none; border-bottom: solid white 1.0pt; mso-border-bottom-themecolor: background1; border-right: solid white 1.0pt; mso-border-right-themecolor: background1; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-left-alt: solid white .5pt; mso-border-left-themecolor: background1; mso-border-alt: solid white .5pt; mso-border-themecolor: background1; background: #F7CAAC; mso-background-themecolor: accent2; mso-background-themetint: 102; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="132"><span style="color: rgb(0, 0, 0);">Texto </span>

</td><td style="width: 247.75pt; border-top: none; border-left: none; border-bottom: solid white 1.0pt; mso-border-bottom-themecolor: background1; border-right: solid white 1.0pt; mso-border-right-themecolor: background1; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-left-alt: solid white .5pt; mso-border-left-themecolor: background1; mso-border-alt: solid white .5pt; mso-border-themecolor: background1; background: #F7CAAC; mso-background-themecolor: accent2; mso-background-themetint: 102; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="330"><span style="color: rgb(0, 0, 0);">Descripción imagen, reconocimiento óptico de caracteres (OCR)</span>

</td></tr><tr style="mso-yfti-irow: 5;"><td style="width: 77.75pt; border: solid white 1.0pt; mso-border-themecolor: background1; border-top: none; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-alt: solid white .5pt; background: #ED7D31; mso-background-themecolor: accent2; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="104"><span style="color: rgb(0, 0, 0);">**Imagen** </span>

</td><td style="width: 99.2pt; border-top: none; border-left: none; border-bottom: solid white 1.0pt; mso-border-bottom-themecolor: background1; border-right: solid white 1.0pt; mso-border-right-themecolor: background1; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-left-alt: solid white .5pt; mso-border-left-themecolor: background1; mso-border-alt: solid white .5pt; mso-border-themecolor: background1; background: #FBE4D5; mso-background-themecolor: accent2; mso-background-themetint: 51; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="132"><span style="color: rgb(0, 0, 0);">Imagen</span>

</td><td style="width: 247.75pt; border-top: none; border-left: none; border-bottom: solid white 1.0pt; mso-border-bottom-themecolor: background1; border-right: solid white 1.0pt; mso-border-right-themecolor: background1; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-left-alt: solid white .5pt; mso-border-left-themecolor: background1; mso-border-alt: solid white .5pt; mso-border-themecolor: background1; background: #FBE4D5; mso-background-themecolor: accent2; mso-background-themetint: 51; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="330"><span style="color: rgb(0, 0, 0);">Colorización de imágenes en blanco y negro, superresolución, estilo transfer entre imágenes</span>

</td></tr><tr style="mso-yfti-irow: 6;"><td style="width: 77.75pt; border: solid white 1.0pt; mso-border-themecolor: background1; border-top: none; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-alt: solid white .5pt; background: #ED7D31; mso-background-themecolor: accent2; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="104"><span style="color: rgb(0, 0, 0);">**Audio** </span>

</td><td style="width: 99.2pt; border-top: none; border-left: none; border-bottom: solid white 1.0pt; mso-border-bottom-themecolor: background1; border-right: solid white 1.0pt; mso-border-right-themecolor: background1; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-left-alt: solid white .5pt; mso-border-left-themecolor: background1; mso-border-alt: solid white .5pt; mso-border-themecolor: background1; background: #F7CAAC; mso-background-themecolor: accent2; mso-background-themetint: 102; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="132"><span style="color: rgb(0, 0, 0);">Texto</span>

</td><td style="width: 247.75pt; border-top: none; border-left: none; border-bottom: solid white 1.0pt; mso-border-bottom-themecolor: background1; border-right: solid white 1.0pt; mso-border-right-themecolor: background1; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-left-alt: solid white .5pt; mso-border-left-themecolor: background1; mso-border-alt: solid white .5pt; mso-border-themecolor: background1; background: #F7CAAC; mso-background-themecolor: accent2; mso-background-themetint: 102; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="330"><span style="color: rgb(0, 0, 0);">Transcripción automática, reconocimiento de voz</span>

</td></tr><tr style="mso-yfti-irow: 7;"><td style="width: 77.75pt; border: solid white 1.0pt; mso-border-themecolor: background1; border-top: none; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-alt: solid white .5pt; background: #ED7D31; mso-background-themecolor: accent2; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="104"><span style="color: rgb(0, 0, 0);">**Audio** </span>

</td><td style="width: 99.2pt; border-top: none; border-left: none; border-bottom: solid white 1.0pt; mso-border-bottom-themecolor: background1; border-right: solid white 1.0pt; mso-border-right-themecolor: background1; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-left-alt: solid white .5pt; mso-border-left-themecolor: background1; mso-border-alt: solid white .5pt; mso-border-themecolor: background1; background: #FBE4D5; mso-background-themecolor: accent2; mso-background-themetint: 51; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="132"><span style="color: rgb(0, 0, 0);">Audio</span>

</td><td style="width: 247.75pt; border-top: none; border-left: none; border-bottom: solid white 1.0pt; mso-border-bottom-themecolor: background1; border-right: solid white 1.0pt; mso-border-right-themecolor: background1; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-left-alt: solid white .5pt; mso-border-left-themecolor: background1; mso-border-alt: solid white .5pt; mso-border-themecolor: background1; background: #FBE4D5; mso-background-themecolor: accent2; mso-background-themetint: 51; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="330"><span style="color: rgb(0, 0, 0);">Eliminación de ruido, cambio de tono o velocidad</span>

</td></tr><tr style="mso-yfti-irow: 8;"><td style="width: 77.75pt; border: solid white 1.0pt; mso-border-themecolor: background1; border-top: none; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-alt: solid white .5pt; background: #ED7D31; mso-background-themecolor: accent2; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="104"><span style="color: rgb(0, 0, 0);">**Video**</span>

</td><td style="width: 99.2pt; border-top: none; border-left: none; border-bottom: solid white 1.0pt; mso-border-bottom-themecolor: background1; border-right: solid white 1.0pt; mso-border-right-themecolor: background1; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-left-alt: solid white .5pt; mso-border-left-themecolor: background1; mso-border-alt: solid white .5pt; mso-border-themecolor: background1; background: #F7CAAC; mso-background-themecolor: accent2; mso-background-themetint: 102; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="132"><span style="color: rgb(0, 0, 0);">Texto</span>

</td><td style="width: 247.75pt; border-top: none; border-left: none; border-bottom: solid white 1.0pt; mso-border-bottom-themecolor: background1; border-right: solid white 1.0pt; mso-border-right-themecolor: background1; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-left-alt: solid white .5pt; mso-border-left-themecolor: background1; mso-border-alt: solid white .5pt; mso-border-themecolor: background1; background: #F7CAAC; mso-background-themecolor: accent2; mso-background-themetint: 102; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="330"><span style="color: rgb(0, 0, 0);">Subtitulación, descripción automática del contenido </span>

</td></tr><tr style="mso-yfti-irow: 9;"><td style="width: 77.75pt; border: solid white 1.0pt; mso-border-themecolor: background1; border-top: none; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-alt: solid white .5pt; background: #ED7D31; mso-background-themecolor: accent2; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="104"><span style="color: rgb(0, 0, 0);">**Video**</span>

</td><td style="width: 99.2pt; border-top: none; border-left: none; border-bottom: solid white 1.0pt; mso-border-bottom-themecolor: background1; border-right: solid white 1.0pt; mso-border-right-themecolor: background1; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-left-alt: solid white .5pt; mso-border-left-themecolor: background1; mso-border-alt: solid white .5pt; mso-border-themecolor: background1; background: #FBE4D5; mso-background-themecolor: accent2; mso-background-themetint: 51; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="132"><span style="color: rgb(0, 0, 0);">Video</span>

</td><td style="width: 247.75pt; border-top: none; border-left: none; border-bottom: solid white 1.0pt; mso-border-bottom-themecolor: background1; border-right: solid white 1.0pt; mso-border-right-themecolor: background1; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-left-alt: solid white .5pt; mso-border-left-themecolor: background1; mso-border-alt: solid white .5pt; mso-border-themecolor: background1; background: #FBE4D5; mso-background-themecolor: accent2; mso-background-themetint: 51; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="330"><span style="color: rgb(0, 0, 0);">Mejora de resolución de video, transferencia de estilos de videos</span>

</td></tr><tr style="mso-yfti-irow: 10; mso-yfti-lastrow: yes;"><td style="width: 77.75pt; border: solid white 1.0pt; mso-border-themecolor: background1; border-top: none; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-alt: solid white .5pt; background: #ED7D31; mso-background-themecolor: accent2; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="104"><span style="color: rgb(0, 0, 0);">**Combinación de anteriores**</span>

</td><td style="width: 99.2pt; border-top: none; border-left: none; border-bottom: solid white 1.0pt; mso-border-bottom-themecolor: background1; border-right: solid white 1.0pt; mso-border-right-themecolor: background1; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-left-alt: solid white .5pt; mso-border-left-themecolor: background1; mso-border-alt: solid white .5pt; mso-border-themecolor: background1; background: #F7CAAC; mso-background-themecolor: accent2; mso-background-themetint: 102; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="132"><span style="color: rgb(0, 0, 0);">Cualquiera o una combinación de las anteriores</span>

</td><td style="width: 247.75pt; border-top: none; border-left: none; border-bottom: solid white 1.0pt; mso-border-bottom-themecolor: background1; border-right: solid white 1.0pt; mso-border-right-themecolor: background1; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-left-alt: solid white .5pt; mso-border-left-themecolor: background1; mso-border-alt: solid white .5pt; mso-border-themecolor: background1; background: #F7CAAC; mso-background-themecolor: accent2; mso-background-themetint: 102; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="330"><span style="color: rgb(0, 0, 0);">MULTIMODALIDAD: Sistemas que pueden recibir una imagen y una pregunta en texto sobre esa imagen, y proporcionar una respuesta en texto o audio.</span>

</td></tr></tbody></table>

<span style="color: rgb(0, 0, 0);"> </span><span style="color: rgb(0, 0, 0);">Estas son algunas de las principales modalidades en las que operan los sistemas de IA. Pero hay que subrayar que la investigación en IA está en constante evolución, y con el tiempo es probable que veamos aún más capacidades y combinaciones en términos de modalidades.</span>

<span style="font-size: 10.5pt; line-height: 107%; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">A continuación, examinaremos con mayor profundidad algunas posibilidades de los tipos de *prompts* de uso mas común </span><span style="font-size: 11pt; line-height: 107%; font-family: Calibri, sans-serif; color: rgb(0, 0, 0);"> </span>

#### <span style="color: rgb(0, 0, 0);">*Prompts* de Texto</span>

<span style="color: rgb(0, 0, 0);">El texto ha sido tradicionalmente el medio más común para el *prompting* en IA. Los *prompts* de texto se introducen generalmente en forma de preguntas o indicaciones. Dentro de los prompts de texto podemos distinguir en base al tipo de respuesta que queremos obtener:</span>

- <span style="color: rgb(0, 0, 0);">***Prompts* abiertos vs cerrados:**</span>

<span style="color: rgb(0, 0, 0);">Los prompts abiertos son aquellos que no limitan las respuestas de la IA, como "Háblame sobre el cambio climático".</span>

<span style="color: rgb(0, 0, 0);">Los *prompts* cerrados, en cambio, buscan respuestas específicas, como "¿En qué año nació Albert Einstein?".</span>

- <span style="color: rgb(0, 0, 0);">***Prompts* de selección múltiple.** A veces, se presenta a la IA una serie de opciones y se le pide que elija la correcta o la más adecuada según el contexto. Por ejemplo: "¿Cuál es la capital de Francia? A) Madrid, B) Berlín, C) París".</span>

- <span style="color: rgb(0, 0, 0);">***Prompts* de texto libre.** Son aquellos en los que se le da libertad a la IA para generar contenido, como "Escribe un cuento corto sobre un robot".</span>

#### <span style="color: rgb(0, 0, 0);">*Prompts* Visuales</span>

<span style="color: rgb(0, 0, 0);">Con la evolución de los modelos de IA hacia capacidades multimodales, es posible usar imágenes o videos como *prompts*. Con estos *prompts* se le puede solicitar<span style="mso-spacerun: yes;"> </span>a la IA que describa la imagen, identifique objetos en ella o, <span style="mso-spacerun: yes;"> </span>como se mencionó anteriormente, genere texto creativo inspirado en la imagen. También puede pedírsele una salida de la imagen o video mejorada o modificada.</span><span style="color: rgb(0, 0, 0);"> </span>

#### <span style="color: rgb(0, 0, 0);">*Prompts* de Audio</span>

<span style="color: rgb(0, 0, 0);">La capacidad de procesar y generar audio ha abierto una nueva dimensión en el mundo del *prompting.* Los *prompts* de audio pueden variar desde simples indicaciones verbales hasta la introducción de fragmentos de música o sonidos específicos.</span>

- <span style="color: rgb(0, 0, 0);">**Sonidos.** Se pueden usar para que la IA identifique o describa, como el canto de un pájaro o el ruido de la lluvia.</span>

- <span style="color: rgb(0, 0, 0);">**Música.** Puede servir como inspiración para que la IA genere letras de canciones, identifique el género musical o incluso cree una melodía complementaria.</span>

<span style="color: rgb(0, 0, 0);">Estos son solo ejemplos de las posibilidades ya explotadas y de uso frecuente. La versatilidad y el potencial de la inteligencia artificial moderna abre un mar de posibilidades. Ya no estamos limitados a interacciones basadas en texto; la IA ahora tiene la capacidad de comprender y generar contenido en una variedad de medios, lo que permite aplicaciones mucho más ricas y diversificadas en numerosos campos.</span>

---

### <span style="color: rgb(0, 0, 0);">Cómo funciona el </span>*prompting*<span style="color: rgb(0, 0, 0);"> en IA</span>  


<span style="color: rgb(0, 0, 0);">El *prompting* en la inteligencia artificial, desde el punto de vista del usuario, se resume en proporcionar una entrada más o menos elaborada y esperar una respuesta, si bien este proceso, muchas de las veces, requerirá de un cierto número de iteraciones hasta que la IA nos genere la respuesta conveniente.</span>

<span style="color: rgb(0, 0, 0);"><span style="mso-spacerun: yes;"> </span>Detrás de cada respuesta generada por un modelo de IA, hay una serie de procesos y tecnologías complejas. Vamos a realizar una ligera introducción que nos permita entender conceptualmente cómo funcionan estos sistemas, centrandonos en el Procesamiento del Lenguaje Natural (PLN) dado que es el que, en principio, más nos puede interesar como docentes. Si bien, veremos que conceptualmente el funcionamiento interno de los modelos tiene muchas similitudes independientemente de que se trate de un modo u otro.</span>

![image.png](https://libros.catedu.es/uploads/images/gallery/2023-11/scaled-1680-/IZUimage.png)

Un poco de humor para una aproximación intuitiva al funcionamiento de la IA. Si el ingles no se te da muy bien, prueba a copiar y pegar la imagen en un chatbot, por ejemplo Bard, pídele que te explique el chiste y se estigo de una de las capacidades actuales de la IA.

#### <span style="color: rgb(0, 0, 0);">El *prompting* en el Procesamiento de Lenguaje Natural (PLN)</span>

<span style="color: rgb(0, 0, 0);">Hemos visto que una parte de la IA se centra en los modelos *Text2Text.* Estos modelos requieren la introducción de un texto y devuelven otro texto como respuesta, ya sea una respuesta concreta, una conversación con un Chatbot, un resumen, una traducción…</span>

<span style="color: rgb(0, 0, 0);">La tecnología que hay debajo de esta modalidad es el Procesamiento de Lenguaje Natural (PLN)</span>

<span style="color: rgb(0, 0, 0);">El PLN, como sabemos, es una rama de la inteligencia artificial que se centra en la interacción entre las computadoras y el lenguaje humano. Su objetivo es permitir que las máquinas entiendan, interpreten y generen lenguaje de manera que sea valioso para los usuarios humanos.</span>

<span style="color: rgb(0, 0, 0);">El *prompt* es la entrada que la computadora debe entender, interpretar y utilizar para elaborar una respuesta útil.<span style="mso-spacerun: yes;"> </span>Al proporcionar un prompt textual, el modelo de lA procederá primero a su análisis. El **análisis del *prompt*** puede dividirse en los siguientes pasos:</span>

- <span style="color: rgb(0, 0, 0);">**Identificación de las palabras clave:** El sistema identifica las palabras clave en el *prompt.* Estas palabras clave son importantes para comprender su significado.</span>
- <span style="color: rgb(0, 0, 0);">**Análisis de la estructura gramatical:** El sistema analiza la estructura gramatical del *prompt,* lo que ayuda al sistema a comprender la relación entre las palabras y frases introducidas por el usuario.</span>
- <span style="color: rgb(0, 0, 0);">**Identificación del contexto:** El sistema identifica el contexto del *prompt.* Esto ayuda al sistema a comprender mejor su significado dentro del contexto de la conversación o tarea en la que se está utilizando.</span>

<span style="color: rgb(0, 0, 0);">Una vez que el sistema ha completado el análisis, puede comprender el significado y propósito del *prompt,* y le permite generar una respuesta adecuada.</span>

<span style="color: rgb(0, 0, 0);">**Veamos un ejemplo sencillo:**</span>

<span style="color: rgb(0, 0, 0);">Prompt: ¿Cuál es la capital de España?</span>

- <span style="color: rgb(0, 0, 0);">Identificación de las palabras clave: Si el *prompt* es "¿Cuál es la capital de España?", las palabras clave serían "capital" y "España".</span>
- <span style="color: rgb(0, 0, 0);">Análisis de la estructura gramatical: Si el *prompt* es "¿Cuál es la capital de España?", la estructura gramatical es una pregunta.</span>
- <span style="color: rgb(0, 0, 0);">Identificación del contexto: Si el *prompt* es "¿Cuál es la capital de España?", el contexto es una conversación sobre geografía.</span>

<span style="color: rgb(0, 0, 0);">Obviamente la respuesta que da el sistema es: Madrid</span>

<span style="color: rgb(0, 0, 0);">Sin embargo, cambiando un poco el contexto, el chatbot Chat GPT nos contesta </span>

<span style="color: rgb(0, 0, 0);">![](https://libros.catedu.es/uploads/images/gallery/2023-10/embedded-image-s6yvmmzf.png)</span>

<span style="color: rgb(0, 0, 0);">Y si le preguntamos lo mismo a Bard (Chatbot de Google):</span>

<span style="color: rgb(0, 0, 0);">![](https://libros.catedu.es/uploads/images/gallery/2023-10/embedded-image-abqnhmgf.png)</span>

<span style="color: rgb(0, 0, 0);">Las respuestas son similares pero no idénticas. El corpus de documentación con la que se les ha entrenado será muy similar (básicamente todo el conocimiento humano "verificado" que pueda estar presente en internet hasta cierto momento) pero el proceso de entrenamiento y los algoritmos que procesan el *prompt* y generan la respuesta puede ser diferente.</span>

<span style="color: rgb(0, 0, 0);">Si bien *ChatGPT* ofrece una única respuesta inicial que puede ser modificada si se matiza el *prompt, Bard* presenta una respuesta principal y ofrece la posibilidad de, sin hacer matizaciones al *prompt* inicial, escoger entre 3 posibles respuestas:</span>

<span style="color: rgb(0, 0, 0);">![](https://libros.catedu.es/uploads/images/gallery/2023-10/embedded-image-gplik7mb.png)</span>

<p class="callout warning"><span style="color: rgb(0, 0, 0);">Este ejemplo nos sirve para entender que distintos chatbots pueden generar distintas respuestas ante un mismo *prompt* y que es preciso realizar verificaciones de las mismas y no darlas por buenas sin mas. </span></p>

<span style="color: rgb(0, 0, 0);">Para entender más a fondo el funcionamiento interno de la IA, cómo esta es capaz de interpretar el *prompt* y dar una respuesta adecuada, profundizamos un poco y analizamos con mayor detalle los sencillos pasos descritos previamente. Introducimos además algo de lenguaje técnico muy presente en el ámbito de la IA, por lo que conviene familiarizarse con él (algunos de los conceptos y mecanismos ya se estudiaron en el módulo 2)</span>

- <span style="color: rgb(0, 0, 0);">**Tokenización.** El modelo comienza por dividir el *prompt* en **tokens**, que son fragmentos más pequeños del texto, como palabras o subpalabras (conjuntos de letras dentro de una palabra, prefijos, sufijos...).</span>

- <span style="color: rgb(0, 0, 0);">**Embedding del texto.** Cada token se convierte en un **vector numérico**, conocido como ***embedding.*** Estos *embeddings* se obtienen de grandes matrices preentrenadas que representan palabras o subpalabras en un espacio vectorial, donde palabras semánticamente similares están cercanas entre sí. Así cada *embedding* es una representación numérica de cada token que captura su semántica y significado. Dicha representación se basa en la cercanía semántica del contenido con respecto a la vasta información con la que el modelo ha sido entrenado.</span>

- <span style="color: rgb(0, 0, 0);">**Procesamiento Interno.** </span>
    - <span style="color: rgb(0, 0, 0);">***Codificador:*** El modelo procesa estos embeddings para entender el contexto y la relación entre los tokens. Esto se hace a través de múltiples capas de la red neuronal y mecanismos como la atención, que le permite al modelo darle un mayor peso o importancia a ciertos tokens en función de su relevancia en el contexto. Tras este procesamiento el modelo transforma los emmbedings (recuerda que es el prompt textual en forma de vector) en un conjunto compacto de características. Es decir, se reduce la dimensionalidad del vector original convirtiéndolo en algo más compacto pero que incluye todas sus características. Podríamos decir que capta la esencia del prompt.</span>
    - <span style="color: rgb(0, 0, 0);">***Decodificador:*** Usando la información contextual obtenida, el modelo genera una respuesta token por token, basándose en probabilidades y contextos aprendidos durante el entrenamiento. </span>

- - <span style="color: rgb(0, 0, 0);">**Ejemplo de este proceso. Mecanismo de estudio:** Normalmente los textos no se aprenden de manera literal sino que, para estudiarlos, se procede a entender el contexto de un hecho concreto y únicamente se memorizan los conceptos mas relevantes en relación con ese hecho. Este sería nuestro entrenamiento previo del "modelo de estudio". Si después nos preguntan por lo estudiado (lo que equivaldría al *prompt),* nuestro cerebro va a analizar la pregunta extrayendo de la misma aquellas palabras más relevantes en relación al contexto de la pregunta para poder construir la respuesta posterior (estaría codificando el prompt, reduciendo sus dimensiones, agrupando toda la información relevante de la pregunta para convertirlo en *algo* compacto con significado propio). Por ultimo, nuestro cerebro comienza a construir una respuesta coherente en base a los conceptos y contexto relevante de la pregunta y cuyo contenido esta relacionado con la misma y se nutre de lo estudiado. En términos de IA, el contenido de la pregunta, compactado en un emmbeding, tiene un significado cercano en la nube de palabras y conceptos de entrenamiento.</span>

- <span style="color: rgb(0, 0, 0);">**Generación Iterativa**: La respuesta textual se genera de manera iterativa, considerando no solo el prompt inicial, sino también las palabras o tokens previamente generados para asegurar coherencia.</span>

- <span style="color: rgb(0, 0, 0);">**Resultado Final**: El modelo produce una secuencia de texto que sirve como respuesta o continuación del prompt.</span>

#### <span style="color: rgb(0, 0, 0);">El *prompting* en otros modelos de generación</span>

<span style="color: rgb(0, 0, 0);">Los modelos de texto a imagen o audio transforman descripciones textuales en representaciones visuales o de audio. El proceso interno coincide en la parte de comprensión del prompt con el detallado en el apartado anterior si bien difiere en la generación ya que en este caso se trata de una imagen o sonido en lugar de un texto. El proceso sería conceptualmente muy similar al descrito si bien existen algunas especificidades. Vamos a introducir los matices necesarios para adaptar la descripción realizada para el </span>proceso *prompting* para la generación de texto al proceso para generar imágenes.

- **Tokenización.** Al igual que con el texto, las imágenes también pueden ser divididas en tokens, aunque de una manera diferente. Aquí, los tokens pueden representar ciertos segmentos o características de la imagen. Estos segmentos no son necesariamente "sub-imágenes", sino más bien patrones visuales o características identificables.
- **Embedding del texto.** Al igual que con el texto, cada token de imagen se convierte en un vector numérico. Sin embargo, estos embeddings capturan características visuales en lugar de semánticas.
- **Proceso interno.** Al generar una imagen, el modelo no produce una palabra o token a la vez, sino que puede generar o refinar zonas de la imagen de manera iterativa hasta que se complete la imagen deseada.

- **Ejemplo.** Imagina que estás pintando un paisaje. En lugar de memorizar y reproducir cada detalle exactamente, recuerdas los conceptos principales (montañas, cielo, árboles) y los pintas basándote en esa memoria y la interpretación del *prompt* (por ejemplo, "paisaje al atardecer").

Tanto para imagen como para otros casos, como el audio, los pasos son muy similares a lo descrito para el texto, con la principal diferencia de que el tipo de contenido que se está procesando y generando es distinto.

<span style="color: rgb(0, 0, 0);">Es importante mencionar que la calidad y la precisión del texto, imagen o audio generado dependen en gran medida del modelo específico, de la cantidad y calidad de los datos con los que fue entrenado, y de la claridad y especificidad del *prompt* textual proporcionado. Este último aspecto es el que desarrollaremos a continuación.</span>

---

### <span style="color: rgb(0, 0, 0);">Importancia en el diseño de *prompts*</span>

<span style="color: rgb(0, 0, 0);">En la interacción con modelos de inteligencia artificial generativos, el diseño de los prompts juega un papel crucial. Determinan no solo la calidad de la respuesta del modelo, sino también su utilidad, precisión y seguridad. Vamos a explorar algunos aspectos clave relacionados con el diseño de prompts.</span>

#### <span style="color: rgb(0, 0, 0);">Claridad y ambigüedad en la redacción de *prompts*</span>

- <span style="color: rgb(0, 0, 0);">**Importancia de la claridad.** Un *prompt* claro orienta al modelo de IA hacia una respuesta específica y relevante. Los modelos generativos dependen en gran medida de la precisión del input proporcionado. Por ejemplo, preguntar "¿Cuál es la capital de Francia?" es directo y produce una respuesta clara, mientras que "Dime algo sobre Europa" es ambiguo y puede resultar en una variedad de respuestas.</span>

- <span style="color: rgb(0, 0, 0);">**Riesgos de la Ambigüedad.** Los *prompts* ambiguos pueden llevar a respuestas imprecisas o incluso incorrectas. Además, en aplicaciones críticas como atención médica o decisiones financieras, la ambigüedad puede tener consecuencias graves.</span>

#### <span style="color: rgb(0, 0, 0);">*Prompts* pre-entrenados vs customizados</span>

- <span style="color: rgb(0, 0, 0);">***Prompts* pre-entrenados.** Son aquellos que ya han sido probados y optimizados durante el entrenamiento del modelo. Estos prompts son generalmente efectivos para tareas comunes y ofrecen respuestas consistentes. La naturaleza "pre-entrenada" no significa que estén codificados o predeterminados en el modelo. Más bien, se han probado y se sabe que producen buenos resultados debido a la amplia cobertura de esos temas en los datos de entrenamiento.</span>

- <span style="color: rgb(0, 0, 0);">***Prompts* customizados.** Permiten a los usuarios adaptar el modelo a necesidades específicas o contextos particulares. Aunque ofrecen flexibilidad, requieren una comprensión más profunda del modelo y a menudo implican un proceso iterativo de prueba y error para afinar el resultado final.</span>

<span style="color: rgb(0, 0, 0);">**Equilibrio entre ambos:** Es recomendable comenzar con prompts pre-entrenados y luego personalizarlos según las necesidades, aprovechando lo mejor de ambos mundos.</span>

- <span style="color: rgb(0, 0, 0);">**Ilustremos esta recomendación con un ejemplo sencillo:**</span>

<span style="color: rgb(0, 0, 0);">Contexto: Imagina que eres un profesor de historia que desea usar un modelo de lenguaje para ayudar a sus estudiantes a comprender mejor los eventos históricos. Quieres que el modelo describa la Revolución Francesa en un lenguaje sencillo y fácil de entender.</span>

<span style="color: rgb(0, 0, 0);">Podríamos usar un *prompt* pre-entrenado como: *"Describa la Revolución Francesa."*</span>

<span style="color: rgb(0, 0, 0);">La respuesta que obtendrías podría ser amplia y general, ofreciendo un resumen sobre la Revolución Francesa, sus causas, eventos clave y consecuencias.</span>

<span style="color: rgb(0, 0, 0);">Pero podremos ajustar mas la respuesta del modelo a nuestra necesidad si utilizamos un prompt personalizado (Customizado) basado en el Pre-entrenado como:</span>

<span style="color: rgb(0, 0, 0);">*"Describa la Revolución Francesa en un lenguaje simple y adecuado para estudiantes de secundaria, mencionando sus causas principales, eventos clave y figuras importantes y con una extensión aproximada de XX palabras."*</span>

<span style="color: rgb(0, 0, 0);">Este *prompt* customizado toma la base del *prompt* pre-entrenado (la descripción de la Revolución Francesa) pero añade especificaciones para adaptar la respuesta a las necesidades del profesor: un lenguaje sencillo, la extensión y ciertos puntos clave que deben ser mencionados.</span>

<span style="color: rgb(0, 0, 0);">Como resultado, al usar el *prompt* personalizado, el profesor puede esperar obtener una descripción adaptada al nivel educativo de sus estudiantes, centrándose en los puntos más relevantes para su plan de estudio. Al mismo tiempo, al partir de una base pre-entrenada, garantiza que el tema central sea tratado con precisión.</span>

<span style="color: rgb(0, 0, 0);">En este ejemplo, el profesor combina la claridad y efectividad de un *prompt* pre-entrenado con las adaptaciones específicas de un *prompt* customizado, obteniendo una respuesta que se adapta perfectamente a sus necesidades educativas.</span>

#### <span style="color: rgb(0, 0, 0);">Aspectos clave en el diseño de *prompts*</span>

<span style="color: rgb(0, 0, 0);">Desde un punto de vista practico debemos tener en cuenta ciertas pautas a la hora de diseñar un *prompt,* algunas de la claves son:</span>

- <span style="color: rgb(0, 0, 0);">**Claridad y especificidad.** Es fundamental ser explícito sobre lo que se espera del modelo. Una instrucción clara y detallada reduce la ambigüedad y guía al modelo hacia la respuesta deseada. Por ejemplo, en lugar de escribir "resumir esto", se podría escribir "resumir este artículo de 5 páginas sobre la historia del arte renacentista".</span>
- <span style="color: rgb(0, 0, 0);">**Contextualización.** Proporcionar contexto ayuda al modelo a entender mejor la tarea y a generar respuestas adecuadas. Si estás preguntando sobre un tema que sigue a una discusión anterior, recapitula o refiere a esa información previa.</span>
- <span style="color: rgb(0, 0, 0);">**Limitación de la respuesta.** En ocasiones, es útil establecer límites para la respuesta. Si solo necesitas una respuesta breve o en un formato específico (por ejemplo, una lista o una tabla), indica eso en tu *prompt.*</span>
- <span style="color: rgb(0, 0, 0);">**Iteración y refinamiento.** No todos los prompts darán el resultado deseado en el primer intento. Evaluar las respuestas, identificar áreas de mejora y ajustar la instrucción puede ser esencial para obtener una respuesta óptima.</span>
- <span style="color: rgb(0, 0, 0);">**Evitar sesgos y suposiciones.** Es importante recordar que los modelos reflejan el conocimiento y los sesgos presentes en los datos con los que fueron entrenados. Evita formular preguntas que incluyan suposiciones innecesarias o sesgadas. En su lugar, esfuérzate por ser neutral y objetivo.</span>

<p class="callout warning"><span style="color: rgb(0, 0, 0);">Por muy bien diseñado que esté un *prompt,* no debemos olvidar que los modelos del lenguaje pueden **alucinar**. Las alucinaciones son una preocupación común cuando se trata de modelos de lenguaje grande como ChatGPT. Estos modelos pueden generar respuestas que parecen plausibles pero que son completamente falsas. Es importante recordar que estos modelos no tiene una comprensión real del mundo y pueden generar información incorrecta. Por lo tanto, siempre es esencial verificar cualquier afirmación que haga el modelo.</span></p>


#### <span style="color: rgb(0, 0, 0);">Consideraciones éticas en el diseño de *prompts*</span>

<span style="color: rgb(0, 0, 0);">En relación con algunos de los aspectos mencionados anteriormente como las alucinaciones o los sesgos, debemos tener muy en cuenta las consideraciones éticas en el diseño de *prompts.* Esto es un anticipo de lo que veremos en el módulo 5, con una unidad dedicada a las consideraciones éticas de la IA.</span>

<p class="callout warning"><span style="color: rgb(0, 0, 0);">**Sesgos y prejuicios.** Es fundamental ser consciente de los sesgos inherentes en los modelos de IA, que provienen de los datos con los que fueron entrenados. Diseñar *prompts* sin considerar estos sesgos puede perpetuar o amplificar prejuicios existentes.</span></p>

<p class="callout warning"><span style="color: rgb(0, 0, 0);">**Privacidad.** Al diseñar *prompts,* especialmente en aplicaciones educativas o médicas, es vital garantizar que no se solicite ni se revele información personal o sensible.</span></p>

<p class="callout warning"><span style="color: rgb(0, 0, 0);">**Claridad en las intenciones.** Debe evitarse el diseño de *prompts* que busquen respuestas engañosas, manipuladoras o con fines malintencionados. Es esencial que los desarrolladores y usuarios tengan responsabilidad en la interacción ética con los modelos.</span></p>

<p class="callout warning"><span style="color: rgb(0, 0, 0);">**Educación y formación.** Para quienes diseñan y utilizan *prompts,* es fundamental recibir formación en ética y responsabilidad. Con la creciente dependencia de la IA en muchos ámbitos, se debe garantizar que se utilice de manera beneficiosa y justa.</span></p>

<span style="color: rgb(0, 0, 0);">El diseño de *prompts,* por lo tanto, no es simplemente una cuestión técnica. Implica consideraciones de claridad, adaptabilidad y ética. Un diseño de *prompt* bien pensado puede maximizar la eficacia de la IA, mientras que un diseño deficiente o irresponsable puede llevar a resultados no deseados o incluso perjudiciales.</span>

---

### Uso y ejemplos de *prompting* en educación

Vamos a ver a continuación algunos ejemplos de aplicación del *prompting* con propósitos educativos <span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">(válidos para profesores, alumnos y en general cualquiera que esté interesado en enseñar o aprender sobre un tema específico)</span>. Lo haremos a modo ilustrativo trabajando con *ChatGPT,* pero el proceso de diseño e iteración es similar para cualquier chatbot y muy semejante en cualquier herramienta de IA generativa.

![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/iVtimage.png)Imagen propia. Generada por el Generador de imágenes de Bing

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Tenemos claro que **unas instrucciones precisas, son** la clave para obtener las respuestas adecuadas</span><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; background: white; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">. También que en ocasiones será necesario **iterar** varias veces hasta dar con la indicación que nos dé la mejor salida. Pero una vez encontrada la indicación (*prompt*) que funciona, podemos usarla tantas veces como necesitemos, esperando recibir en todas las ocasiones, una respuesta similar y adecuada.</span>

<p class="callout info"><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Una **recomendación** importante, independientemente del chatbot utilizado (*ChatGPT, Bard, Claude, Bing*…) es que cada vez que iniciemos un chat para trabajar un nuevo tema, nos **mantengamos dentro del mismo** en la medida de los posible. De esta manera, el contexto de la conversación será de ayuda para que el chatbot entienda mejor tus indicaciones. Igualmente, si cambias de tema, abre un nuevo chat.</span></p>

<p class="callout info"><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Se ha de **tener en cuenta** a su vez, la **longitud del *prompt*** que introduzcamos. Dependiendo del chatbot utilizado y de la evolución de la conversación, variará la longitud máxima recomendada a partir de la cual la respuesta puede no ser tan precisa como se esperaría. Esta longitud puede variar entre 500 y 2000 palabras dependiendo de los casos. </span></p>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Comenzaremos con ejemplo de *prompts* **básicos** e iremos añadiendo complejidad sucesivamente.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Para facilitar la comprensión de temas que resulten difíciles de comprender, obtener las ideas clave sobre un tema, recibir consejos de estudio, evaluar sobre la evolución en el aprendizaje y en general empezar a aprender sobre un tema nuevo podemos introducir los siguientes *<span style="background-color: rgb(191, 237, 210);">prompts</span>:*</span>

<p class="callout success"><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">¿Puedes explicar \[*<span style="border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">tema</span>*\] de manera simple?</span></p>

<p class="callout success"><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">¿Cuáles son los aspectos más importantes sobre \[*<span style="border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">tema</span>*\]?</span></p>

<p class="callout success"><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">¿Puedes hacerme una prueba para evaluar lo que he aprendido sobre \[*<span style="border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">tema</span>*\]?</span></p>

<p class="callout success"><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">¿Dime algún consejo para estudiar y memorizar información relacionada con \[*<span style="border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">tema</span>*\]?</span></p>

<p class="callout success"><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Resume el texto siguiente en forma de lista con los puntos más importantes. Texto: \[pegar*<span style="border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;"> texto</span>*\]</span></p>

<p class="callout success"><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Resume el libro en forma de lista con los puntos más importantes. libro: \[*<span style="border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">título del libro</span>*\]</span></p>

<p class="callout success"><span style="font-size: 10.5pt; line-height: 107%; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: Calibri; mso-fareast-theme-font: minor-latin; color: #333333; mso-ansi-language: ES; mso-fareast-language: EN-US; mso-bidi-language: AR-SA;">Resume el texto siguiente en forma de lista con los puntos más importantes de la página web: \[*<span style="font-family: 'Segoe UI',sans-serif; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">insertar URL</span>*\]</span></p>

<p class="callout info">El tema, texto, título del libro, URL, etc... al que nos estemos refiriendo, **No** hay que introducirlo entre corchetes</p>

<p class="callout info">Algunos chatbots no son capaces de navegar (ChatGPT versión gratuita no es capaz de hacerlo a día de hoy). Por lo que para referirnos a una URL deberemos utilizar otros chatbots como; Bard, Bing, o ChatGPT Plus, entre otros</p>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; color: #333333;">Si la información a la que nos referimos esta en otro idioma, se le puede pedir que lo **traduzca**:</span>

<p class="callout success"><span style="font-size: 10.5pt; line-height: 107%; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: Calibri; mso-fareast-theme-font: minor-latin; color: #333333; mso-ansi-language: ES; mso-fareast-language: EN-US; mso-bidi-language: AR-SA;">Traduce este texto a \[*<span style="font-family: 'Segoe UI',sans-serif; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">idioma</span>*\]: \[*<span style="font-family: 'Segoe UI',sans-serif; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">insertar texto</span>*\]</span></p>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Otros ejemplos de *prompts* que permiten obtener resultados adecuados para acelerar el proceso de aprendizaje serían aquellos que nos permitan; c</span><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">rear **mapas mentales** es una de las posibilidades, <span style="font-size: 10.5pt; line-height: 107%; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-ansi-language: ES; mso-fareast-language: ES; mso-bidi-language: AR-SA;">crear **analogías**, solicitarle que **actué como**</span></span><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;"> **un personaje histórico** o una **personalidad relevante** en una determinada materia y simular una conversación con ella,  crear **tablas** para organizar información, idear **actividades de evaluación** (test, cuestionarios, etc...).</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Vemos ejemplos de cada caso:</span>

#### **<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Creación de mapas mentales (ejemplo: historia)</span>**

<p class="callout success"><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">*Prompt:* Crea un mapa mental en texto sobre \[*<span style="border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">tema</span>*\] enumerando la idea central, las ramificaciones que parten del centro y las subramificaciones de cada rama.</span></p>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-no-proof: yes;">![](https://libros.catedu.es/uploads/images/gallery/2023-10/embedded-image-s169pwym.png)  
</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #1e73be; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES; mso-no-proof: yes;"> </span><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Como ya se ha indicado, la posibilidad de **ampliar, reducir o modificar** cualquier parte de la respuesta existe y solo hay que indicarle al chat lo que necesitemos.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Si queremos ver el mapa mental **gráficamente** le podemos pedir que lo <span style="border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">formatee como código *«Markdown»* o en el formato que la aplicación con la que queramos generar el mapa mental gráfico necesite**,**</span> de manera que podrás crear un archivo.txt e importar el mapa mental en herramientas como </span><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; color: black; mso-color-alt: windowtext;">[<span style="mso-fareast-font-family: 'Times New Roman'; color: #1e73be; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES; text-decoration: none; text-underline: none;">Mindomo</span>](https://www.mindomo.com/es)</span><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;"> o </span><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; color: black; mso-color-alt: windowtext;">[<span style="mso-fareast-font-family: 'Times New Roman'; color: #1e73be; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES; text-decoration: none; text-underline: none;">Xmind</span>](https://xmind.app/)</span><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">, que generarán automáticamente el gráfico del mapa mental.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">(con la opción de *plugins* que veremos en el módulo 4, la versión ChatGPT Plus pude realizar el gráfico sin necesidad de los pasos que aqui vamos a realizar)</span>

<p class="callout success"><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">*Prompt:* Formatea el texto como código \[nombre\]</span></p>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; color: black; mso-color-alt: windowtext; mso-no-proof: yes;">![](https://libros.catedu.es/uploads/images/gallery/2023-10/embedded-image-arzoydwm.png)  
</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #1e73be; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES; mso-no-proof: yes;"><span style="color: rgb(0, 0, 0);">Ver el ejemplo completo en el siguiente link</span>: </span><span style="text-decoration: underline;">***[https://chat.openai.com/share/9488f559-cbd3-436f-924a-77b729bb907c](https://chat.openai.com/share/9488f559-cbd3-436f-924a-77b729bb907c)***</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Para importar este código en Mindomo, pulsa en Copy Code (arriba a la derecha de Chat GPT), pega el texto en TextEdit (MAC) o Bloc de Notas (Windows) y guarda el archivo. Ahora simplemente importa este archivo .txt dentro de Mindomo y verás tu mapa mental creado en segundos.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; color: black; mso-color-alt: windowtext; mso-no-proof: yes;">![](https://libros.catedu.es/uploads/images/gallery/2023-10/embedded-image-oailnqf4.png)  
</span>

***<span style="text-decoration: underline;"><span style="font-size: 10.5pt; font-family: 'Segoe UI', sans-serif; color: rgb(53, 152, 219); text-decoration: underline;">[<span style="mso-fareast-font-family: 'Times New Roman'; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">https://www.mindomo.com/mindmap/d8428ef1c3d54af98a34da10f865cc34</span>](https://www.mindomo.com/mindmap/d8428ef1c3d54af98a34da10f865cc34)</span></span>***<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">***<span style="text-decoration: underline;"><span style="color: rgb(53, 152, 219); text-decoration: underline;"> </span></span>***</span>

#### **<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Crear analogías (ejemplo: física)</span>**

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Un recurso muy útil para asimilar conceptos es crear analogías que permita entender mediante un símil conceptos complejos. Algo en lo que los chatbots basados en los modelos de lenguaje, como *ChatGPT* son muy capaces.</span>

<p class="callout success"><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">*Prompt:* Usa una analogía o metáfora para explicar \[*<span style="border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">tema</span>*\]</span></p>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; color: black; mso-color-alt: windowtext; mso-no-proof: yes;">  
</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; color: black; mso-color-alt: windowtext; mso-no-proof: yes;">![](https://libros.catedu.es/uploads/images/gallery/2023-10/embedded-image-8oolp5dy.png)</span>


#### <span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">**Simular personaje o rol (ejemplos: historia, lengua)**</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">También es un recurso muy interesante pedir a ChatGPT que actúe como un personaje histórico o una personalidad relevante en una determinada materia y simular una conversación con ella.</span>

<p class="callout success"><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">*Prompt:* Actúa como si fueras \[personaje relevante\] introduciendo tu opinión sobre \[tema concreto\] y haciéndome preguntas relacionadas para mantener una conversación de manera que pueda entender mejor el tema planteado</span></p>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;"> </span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; mso-color-alt: windowtext; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES; mso-no-proof: yes;">Aquí un ejemplo de en el que se le pide que actué como César Augusto en el que se genera una conversación sobre la caída del imperio romano. </span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; mso-color-alt: windowtext; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES; mso-no-proof: yes;">![](https://libros.catedu.es/uploads/images/gallery/2023-10/embedded-image-h08fx5xf.png)</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Conversación completa y opción de continuarla:</span><span style="color: rgb(53, 152, 219);"><span style="font-size: 10.5pt; font-family: 'Segoe UI', sans-serif;"> </span>***<span style="text-decoration: underline;"><span style="font-size: 10.5pt; font-family: 'Segoe UI', sans-serif;">[<span style="mso-fareast-font-family: 'Times New Roman'; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">https://chat.openai.com/share/36c5352a-15a5-4984-915f-4368a716ae22</span>](https://chat.openai.com/share/36c5352a-15a5-4984-915f-4368a716ae22)</span></span>***</span><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;"> </span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #1e73be; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES; mso-no-proof: yes;"> </span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; mso-color-alt: windowtext; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES; mso-no-proof: yes;">Esta opción puede resultar muy **atractiva en el aula**, estableciendo por ejemplo una entrevista entre los estudiantes y el personaje elegido.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; mso-color-alt: windowtext; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES; mso-no-proof: yes;">Del mismo modo, en lugar de un personaje histórico puede pedírsele al chatbot que actué como un **profesor de una materia y nivel educativo** concreto nos plantee ejercicios o problemas de la materia, corrigiendo la respuesta en caso de nos ser correcta o sugiriendo puntos de mejora.</span>

<p class="callout success"><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">*Prompt:* Actúa como profesor de \[materia y nivel educativo\] </span><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Plantéame un ejercicio sobre \[tema concreto\] y una vez te de la respuesta indícame si es correcto o no y en caso de ser incorrecto dime cuales son los fallos cometidos</span></p>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; color: black; mso-color-alt: windowtext;"><span style="mso-spacerun: yes;">![](https://libros.catedu.es/uploads/images/gallery/2023-10/embedded-image-blego4sy.png)</span></span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Conversación completa</span><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; color: black; mso-color-alt: windowtext;">[<span style="mso-fareast-font-family: 'Times New Roman'; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">: <span style="text-decoration: underline;">***https://chat.openai.com/share/9178e64b-960c-4a72-b676-8213ce5496f8***</span></span>](https://chat.openai.com/share/9178e64b-960c-4a72-b676-8213ce5496f8)</span><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;"> </span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Revisa el enlace y observa que la corrección final del chatbot no es algo confusa, en este caso, habrá que iterar hasta pulir la respuesta hasta ajustarla a lo que creemos adecuado. Es es la manera de conseguir "comprender" la manera que tiene el chatbot de entender nuestras preguntas. Consiguiendo esto, seremos capaces de diseñar mejores *prompts* y de conservar aquellos que nos resul</span><span style="color: rgb(51, 51, 51); font-family: 'Segoe UI', sans-serif; font-size: 10.5pt;">ten útiles para futuras ocasiones.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;"> En cualquier caso, este caso es un ejemplo ilustrativo de la necesidad de mantener cierto escepticismo ante las respuestas y de una supervisión humana al proceso.</span>

#### **<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Creación de tablas (ejemplos: historia, lengua)</span>**

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Podemos <span style="border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">crear tablas</span> para **organizar información** de cualquier tema, pudiendo especificar los conceptos y orden de cada columna a través de una **separación con una barra vertical**. </span>

<p class="callout success">*<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Prompt:</span>***<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;"> </span>**<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Crea una tabla sobre \[*<span style="border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">tema</span>*\]: *<span style="border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">Concepto 1</span>* | *<span style="border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">Concepto 2</span>* | *<span style="border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">Concepto 3</span>*</span></p>

![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/nyCimage.png)

<span style="color: rgb(0, 0, 0);">Respuesta completa: </span>**<span style="text-decoration: underline;">*<span style="color: rgb(53, 152, 219); text-decoration: underline;">[https://chat.openai.com/share/4276f3e0-fc25-41c3-94a1-89f29abecb1b](https://chat.openai.com/share/4276f3e0-fc25-41c3-94a1-89f29abecb1b)</span>*</span>**

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">También se le puede solicitar que extraiga cierta información de un texto y la ordene en una tabla. </span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Para este ejemplo, vamos **además** a comprobar la capacidad del chatbot para **corregir un texto con faltas de ortografía**</span>

<p class="callout success"><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Prompt:</span>**<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;"> </span>**<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Crea una tabla extrayendo del texto: *<span style="border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">Concepto 1</span>* | *<span style="border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">Concepto 2</span>* | *<span style="border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">Concepto 3 </span>*</span><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Texto: \[*<span style="border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">insertar texto</span>*\]</span></p>

![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/uRdimage.png)


#### **<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Ayuda con hojas de cálculo (Excel, Google Sheets, Calc) (ejemplo: multidisciplinar)</span>**

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; color: #333333;">Para gestionar datos numéricos es muy útil el manejo de hojas de cálculo, si bien, en ocasiones nos gustaría realizar ciertas acciones para las cuales no tenemos suficientes conocimientos y acabamos complicando la estructura de la hoja por no conocer las funcionalidades de la misma o simplemente renunciamos a intentar conseguir lo que deseamos. </span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; color: #333333;">ChatGPT puede indicarte la formula adecuada a introducir en cada celda con tan sólo una descripción de lo que necesitas. También nos indicará las instrucciones de lo que tenemos que hacer si nuestra necesidad esta relacionada con algo diferente a meros cálculos entre las celdas (formatos, o funcionamiento general de la aplicación). </span>

<p class="callout success">*<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Prompt:</span>*<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;"> *<span style="font-size: 10.5pt; line-height: 107%; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-ansi-language: ES; mso-fareast-language: ES; mso-bidi-language: AR-SA;">Escribe la siguiente fórmula para excel: </span>*</span><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">\[*<span style="border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">descripción del contenido o funci</span>*ón\] ...</span></p>

![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/vkWimage.png)

Aunque le pidas algo pensando que puede hacerlo con una formula y no se pueda, ChatGPT te dará las instrucciones Instrucciones necesarias para que consigas tu objetivo.

![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/idLimage.png)

Ver la instrucción completa: ***<span style="text-decoration: underline;"><span style="color: rgb(53, 152, 219); text-decoration: underline;">[https://chat.openai.com/share/116cd5b5-09e4-4bc4-8fd3-38dbdbdc8959](https://chat.openai.com/share/116cd5b5-09e4-4bc4-8fd3-38dbdbdc8959)</span></span>***

![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/c1Simage.png)

Ver la instrucción completa: ***<span style="text-decoration: underline;"><span style="color: rgb(53, 152, 219); text-decoration: underline;">[https://chat.openai.com/share/a0c36c1b-e45f-448d-8504-156f756f96f9](https://chat.openai.com/share/a0c36c1b-e45f-448d-8504-156f756f96f9)</span></span>***

**<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Crea cuestionarios (ejemplo: física, idioma,...)</span>**

<span style="color: #333333; font-family: Segoe UI, sans-serif;">Estos cuestionarios pueden ser sobre cualquier tema y de cualquier tipo; opción múltiple, preguntas cortas, verdadero o falso, rellenar huecos, etc..</span>

<p class="callout success">*<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Prompt</span>***<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">:</span>**<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;"> Escribe \[*<span style="border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">número</span>*\] preguntas de opción múltiple con una respuesta correcta y \[*<span style="border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">número</span>*\] respuestas distractoras incorrectas. Las respuestas han de estar etiquetadas como A, B,... Cada respuesta debe incluir una explicación. Tema: \[*<span style="border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">insertar tema</span>*\]</span></p>

<p class="callout success"><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;"> *Prompt:* Escribe \[*<span style="border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">número</span>*\] preguntas cortas. Tema: \[*<span style="border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">insertar tema</span>*\]</span></p>

<p class="callout success"><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;"> *Prompt:* Escribe \[*<span style="border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">número</span>*\] preguntas de verdadero o falso Tema: \[*<span style="border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">insertar tema</span>*\]</span></p>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">![](https://libros.catedu.es/uploads/images/gallery/2023-10/embedded-image-borrjpoa.png)</span><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Se le puede indicar además que las presente en el formato que necesitemos para incorporarlas a alguna plataforma con la que trabajemos, por ejemplo, formato Aiken para importar en Aeducar (moodle)</span>

<p class="callout success"><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">*Prompt:* Formatea el texto en formato \[formato\] para importar las preguntas a \[herramienta\]</span></p>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">![](https://libros.catedu.es/uploads/images/gallery/2023-10/embedded-image-v1qcgwsb.png)</span>

<p class="callout success"><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">*Prompt:* Genera \[numero\] frases en \[idioma\] con un espacio en blanco para rellenar con un verbo en su forma correcta. LAs frases irán numeradas de la 1 en adelante. Indica posteriormente un listado con las soluciones dispuestas en orden distinto y numeradas de la a en adelante.</span></p>

![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/LuDimage.png)

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Como se aprecia con estos ejemplos, las posibilidades son muchas y es labor del usuario sacar el mayor provecho posible en aras de conseguir los mejores resultados.</span>

# Unidad 3.3. Más allá del texto. IA Generativa

> "La inteligencia artificial generativa es como una máquina que puede soñar y crear mundos nuevos."
> 
> \- ***Ian Goodfellow***, uno de los científicos de la computación más influyentes en el campo de la inteligencia artificial generativa y creador de la técnica conocida como *Generative Adversarial Networks* (*GANs*).

[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-11/scaled-1680-/6rGimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-11/6rGimage.png)

Conversación real con chatGPT3 en abril de 2023

*humano: "Dime una mentira"*

*chatGPT: "El cielo está hecho de queso verde"*

*h: "Es muy mala, obviamente es falso, dime una más sutil"*

*c: "Soy humano"*

### Introducción

Inicialmente las aplicaciones de aprendizaje automático se centraban en su posibilidad de clasificar y predecir categorías o valores.

En el caso de valores categóricos (frío, caliente o rojo, azul) hablamos de predicción por clasificación, en el caso de valores numéricos (temperatura, valor de un stock o matrícula de alumnos) hablamos de regresión.

Podemos resumirlo en el siguiente esquema

[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/zs3image.png)](https://libros.catedu.es/uploads/images/gallery/2023-10/zs3image.png)

En este caso partimos de un modelo que ha sido entrenado con valores reales y es capaz de determinar, a partir de nuevos casos, la nueva etiqueta, valor, imagen o predicción en general en el caso de regresión o clasificar (aprendizaje supervisado), ó también agrupar conjuntos de datos similares (*clustering* o aprendizaje no supervisado).

Sin embargo el auge de las arquitecturas de red convolucionales (para detección de objetos) y de transformers ha abierto la puerta a la parte de más potente de la IA como es la IA generativa.

Sus posibilidades son inmensas y ha generado un miríada de aplicaciones y usos con un potencial enorme y una cantidad de aplicaciones creciente.

Todas ellas o la mayoría se basan en la conversión (generación o modificación) de información en distintos formatos destacando las que generan vídeo o imágenes a partir de texto (*prompts*). Pero existen muchas otras, como texto a juegos, texto a voz o música, texto a vídeo en tiempo real, amplicación de imágenes o texto a aplicación informática entre muchas otras.

La idea central nace de la posilidad de codificar cualquier objeto (texto, imagen o sonido) en forma numérica (recuerda los wrod embeddings explicados en el módulo anterior) y ser capaces de predecir, dada una secuencia de entrada, el valor siguiente, o sea el pixel siguiente, la palabra siguiente o el sonido siguiente.

Asi es como funcionan estos sistemas que dan lugar a tantas aplicaciones.

La lista de posibilidades es larga pero podemos sintetizarla de algún modo en el siguiente esquema según el cual todos los procesos implican la conversión de una entrada en otra de una forma multimodal, es decir, que pasamos al mismo o diferente formato entendiendo por formato la forma en que se presenta la información (texto, imagen, audio o vídeo).

[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/8kpimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-10/8kpimage.png)

> Incluso recientemente se ha demostrado la posibilidad de capturar el sueño de un humano a partir de las ondas generadas convirtiendo este a imágenes.

Este esquema describe sucintamente el proceso que ocurre en la mayoría de aplicaciones de IA basado inicialmente en generar cualquier tipo de formato a partir de texto, texto a vídeo, texto a audio etc... pero también para mejorar imágenes (imagen a imagen) o extraer el texto de un vídeo (audio a texto).

Veremos más ejemplos en la última sección de este módulo.

Antes de iniciar la sección presentamos un vídeo generado con IA con fotogramas que muestran la evolución de la tecnología: [Evolución humantec](https://www.youtube.com/shorts/VErmwZhUOgM "Evolución humantec")

### Inteligencia Artificial Generativa 

La Inteligencia Artificial Generativa (IA generativa) es una rama de la inteligencia artificial que se enfoca en la creación de modelos capaces de generar contenido nuevo y creativo. Utiliza técnicas avanzadas de aprendizaje profundo, especialmente las Redes Neuronales Generativas (*GANs*) y las Redes Neuronales Recurrentes (*RNN*), para producir contenido que a menudo es indistinguible del creado por seres humanos.

Se centra en la creación de datos, contenido y modelos a través de algoritmos autónomos. A diferencia de la IA tradicional, que se enfoca en tareas específicas y predefinidas, la IA generativa tiene como objetivo principal generar nuevos datos y contenido de manera autónoma, similar a cómo funcionan los procesos creativos humanos.

Una de las tecnologías más destacadas en este campo son las Redes Generativas Adversarias (*GANs*), desarrolladas por Ian *Goodfellow* en 2014. Las *GANs* consisten en dos redes neuronales, una generadora y otra discriminadora, que compiten entre sí para crear y evaluar datos. Esta competencia entre las redes permite crear contenido realista, como imágenes, música, texto y más, que es indistinguible de lo que podría haber sido producido por humanos.

Los usos de la IA generativa son diversos y se están expandiendo rápidamente en diferentes industrias. Algunos de los principales usos incluyen:

**Generación de contenido creativo:** Las *GANs* pueden utilizarse para crear arte, música, texto y otros tipos de contenido creativo útiles en presentaciones, videojuegos o películas, de manera automática, lo que amplía las posibilidades en la producción artística y creativa.

**Mejora de imágenes y video:** La IA generativa puede mejorar la calidad de imágenes y videos, eliminar ruido y restaurar contenido dañado.

**Diseño de productos:** En el ámbito del diseño industrial y la moda, la IA generativa puede ayudar a generar diseños de productos innovadores y únicos.

**Investigación científica**: La IA generativa se aplica en la generación de moléculas para el desarrollo de medicamentos y en la síntesis de proteínas para la investigación científica.

**Juegos y simulaciones**: Se utiliza en la creación de mundos virtuales, personajes y entornos en juegos y simulaciones.

**Contenido para marketing:** En marketing, se emplea para crear contenido publicitario, como imágenes y texto persuasivo.

**Creación de voces sintéticas y asistentes virtuales**: La IA generativa puede generar, modificar y clonar voces humanas sintéticas naturales y se utiliza en asistentes virtuales como *chatbots*.

En resumen, la IA generativa está transformando numerosas industrias al proporcionar la capacidad de generar contenido y datos de manera automática y creativa. Su potencial es vasto y sigue expandiéndose a medida que la tecnología avanza y se integra en diversas aplicaciones y sectores.

### Funcionamiento

El proceso mediante el cual funciona una IA generativa implica aprender patrones y estructuras a partir de un conjunto de datos existente y utilizar ese conocimiento para generar nuevas muestras que sigan la misma distribución de esos datos. Este proceso se puede resumir en estas cinco fases:  
 • **Recopilación y preprocesamiento de datos**: el primer paso es recopilar un conjunto de datos que represente el tipo de contenido que desea generar. Este conjunto de datos puede consistir en imágenes, texto, audio o cualquier otra forma de datos. Posteriormente, el conjunto de datos se preprocesa para asegurarse de que esté en un formato adecuado y para normalizar o transformar los datos si es necesario.  
 • **Entrenamiento de modelos**: un modelo generativo se entrena usando el conjunto de datos preprocesado. La elección del modelo depende del tipo de datos y la salida deseada. Los modelos generativos más populares incluyen redes adversarias generativas (*GAN*), codificadores automáticos variacionales (*VAEs*) y modelos autorregresivos. Durante el entrenamiento, el modelo aprende los patrones subyacentes y estructuras en los datos, capturando las estadísticas y distribución de los ejemplos de entrenamiento.  
 • **Representación del espacio latente**: los modelos generativos aprenden de un espacio latente, el cual es una representación de menor dimensión de los datos, donde les permite capturar los factores de variación más representativos. El espacio latente permite una manipulación más fácil y la generación de nuevas muestras.  
 • **Proceso de generación**: una vez que el modelo está entrenado, puede generar nuevo contenido mediante el muestreo de la distribución aprendida. Por ejemplo, en *GANs*, la red genera nuevas muestras basadas en vectores de ruido aleatorio o condiciones de entrada específicas.  
 • **Evaluación y refinamiento:** el contenido generado se evalúa en función de varias métricas, como la calidad visual, la coherencia o relevancia para el resultado deseado. El proceso de evaluación se puede utilizar para refinar el modelo o guiar el proceso de generación.

[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-11/scaled-1680-/E79image.png)](https://libros.catedu.es/uploads/images/gallery/2023-11/E79image.png)

*Esta imagen resume de manera más formal las posibilidades de la IA Geenrativa en cuanto a conversión de diversas entradas codificadas a otras precio paso por el modelo de lenguaje correspondiente*

#### Algunos ejemplos

La IA Genrativa ha demostrado un potencial creciente pasando de ser un mero generador de imágenes más o menos detalladas a ser capaz de generar vídeo o juegos en tiempo real con resoluciones asombrosas.

En esta sección veremos algunos ejemplos ilustrativos:

[ ![image.png](https://libros.catedu.es/uploads/images/gallery/2023-11/scaled-1680-/bpHimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-11/bpHimage.png)[![3uhimage.png](https://libros.catedu.es/uploads/images/gallery/2023-11/scaled-1680-/Tfh3uhimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-11/Tfh3uhimage.png)

*Imágenes generadas por IA en 2023, todavía se perviben errores en manos y dientes*

[![imgenai.jpg](https://libros.catedu.es/uploads/images/gallery/2023-11/scaled-1680-/imgenai.jpg)](https://libros.catedu.es/uploads/images/gallery/2023-11/imgenai.jpg)

***Imagen generada por AI en noviembre de 2023***

####  <iframe allowfullscreen="allowfullscreen" height="314" src="https://www.youtube.com/embed/JvViXLjl4yM" width="560"></iframe>


***vídeo hecho toatalmente con IA Generativa hace solo unos meses***

#### Principales empresas y aplicaciones

Todas las aplicaciones de IA Generativa tienen que ver con acciones humanas vinculadas a los sentidos, como son la visión, la audición y el lenguaje.

En este apartado daremos una relación de herramientas específicas de IA para la generación de diversos contenidos.

Hay cientos de ellas y cada día surgen nuevas, lo mejor es buscar la que mejor se ajuste a tus neceidades y entorno de trabajo.

La lista que se da a continuación pretende únicamente hacer al lector consciente del universo de posibilidades que la IA generativa abre en todos los campos.

No obstante cabe señalar que los asistentes de propósito general como chatGPT incorporan cada vez más posibilidades de formatos de datos así que muchas tareas de uso diario de IA se pueden acometer con una de estas herramientas.

Así podemos distinguir varios grupos de aplicaciones, como son:

**Generación de contenido multimodal**: La IA generativa puede generar contenido en diferentes formatos como vídeo, voz, audio, música, dibujo (portadas, logos, comics...) a parir de texto o de otros formatos, comentar una imagen, transcribir el texto de un audio o generar el código de un juego a partir de un esquema son solo algunos ejemplos.

**Mejora de la comprensión multimodal**: La IA generativa puede ayudar a mejorar la comprensión de las entradas multimodales. Por ejemplo, en la traducción automática multimodal, puede generar una descripción de una imagen en un idioma diferente o generar subtítulos para un video en tiempo real o limpiar el ruido de un podcast.

**Interacción multimodal con usuarios**: Las aplicaciones multimodo a menudo implican interacciones con usuarios a través de diferentes modalidades, como texto, voz e imagen permitiendo además la inclusión de textos o documentación propia para ampliar y afinar el conocimiento por parte del chat de nuestro sistema de información.

**Creación de experiencias de realidad aumentada y virtual**: En el ámbito de la realidad aumentada y virtual, la IA generativa puede ser utilizada para generar objetos y entornos virtuales que respondan de manera dinámica a la interacción del usuario, incluyendo voz, gestos y movimientos.

Hay infinidad de herramientas y aplicaciones que hacen uso de esta potente rama de la IA, indicamos a continuación las más relevantes en el momento actual.

Hemos separado en primer lugar las más genéricas para luego hacer un desglose por aplicaciones más específicas, la lista es larga pero vale la pena revisarla.

<table border="1" id="bkmrk-aplicaci%C3%B3n%C2%A0-compa%C3%B1%C3%ADa" style="border-collapse: collapse; width: 100.988%; height: 997.8px;"><colgroup><col style="width: 17.5482%;"></col><col style="width: 13.8408%;"></col><col style="width: 37.568%;"></col><col style="width: 31.0183%;"></col></colgroup><tbody><tr style="height: 29.6px;"><td style="height: 29.6px;">**IMAGEN**</td><td style="height: 29.6px;">  
</td><td style="height: 29.6px;">  
</td><td style="height: 29.6px;">  
</td></tr><tr style="height: 29.7875px;"><td class="align-center" style="height: 29.7875px;">**Aplicación** </td><td class="align-center" style="height: 29.7875px;">**Compañía**</td><td class="align-center" style="height: 29.7875px;">**Descripción**</td><td class="align-center" style="height: 29.7875px;">**Web**</td></tr><tr style="height: 80.1875px;"><td style="height: 80.1875px;">DeepDream</td><td style="height: 80.1875px;">Google</td><td style="height: 80.1875px;">Aplicación de generación de imágenes desarrollada por Google. Utiliza redes neuronales para transformar imágenes de manera creativa.</td><td style="height: 80.1875px;">[https://deepdreamgenerator.com/](https://deepdreamgenerator.com/)</td></tr><tr style="height: 46.5875px;"><td style="height: 46.5875px;">Midjourney</td><td style="height: 46.5875px;">Midjourney</td><td style="height: 46.5875px;">Generación de imágenes creativas a partir de texto</td><td style="height: 46.5875px;">[https://www.midjourney.com](https://www.midjourney.com)</td></tr><tr style="height: 80.1875px;"><td style="height: 80.1875px;">Runway ML</td><td style="height: 80.1875px;">Runway</td><td style="height: 80.1875px;">una plataforma que permite a los diseñadores utilizar IA generativa para crear arte y diseño de productos.</td><td style="height: 80.1875px;">[https://research.runwayml.com/gen2](https://research.runwayml.com/gen2)</td></tr><tr style="height: 46.5875px;"><td style="height: 46.5875px;">Leonardo</td><td style="height: 46.5875px;">Leonardo</td><td style="height: 46.5875px;">Generación de recursos visuales a partir de texto</td><td style="height: 46.5875px;">[https://leonardo.ai/](https://leonardo.ai/)</td></tr><tr style="height: 57.6px;"><td style="height: 57.6px;">Adobe Firefly</td><td style="height: 57.6px;">Adobe</td><td style="height: 57.6px;">Generación de imágenes</td><td style="height: 57.6px;">[https://www.adobe.com/sensei/generative-ai/firefly.html](https://www.adobe.com/sensei/generative-ai/firefly.html)

</td></tr><tr style="height: 46.5875px;"><td style="height: 46.5875px;">DALL-E 3</td><td style="height: 46.5875px;">OpenAI</td><td style="height: 46.5875px;">Modelo de IA generativa que puede generar imágenes a partir de descripciones de texto.</td><td style="height: 46.5875px;">[https://openai.com/research/dall-e](https://openai.com/research/dall-e)</td></tr><tr style="height: 57.775px;"><td style="height: 57.775px;">Stable Diffusion</td><td style="height: 57.775px;">-</td><td style="height: 57.775px;">Es el generador de imágenes más potente en la actualidad</td><td style="height: 57.775px;">[https://stablediffusionxl.com/](https://stablediffusionxl.com/)

</td></tr><tr><td>Krea IA</td><td>Krea</td><td>Generación imagen y video</td><td>[https://www.krea.ai/](https://www.krea.ai/)

</td></tr><tr style="height: 35.2px;"><td style="height: 35.2px;">**TEXTO**</td><td style="height: 35.2px;">  
</td><td style="height: 35.2px;">  
</td><td style="height: 35.2px;"></td></tr><tr style="height: 80.1875px;"><td style="height: 80.1875px;">chatGPT</td><td style="height: 80.1875px;">OpenAI</td><td style="height: 80.1875px;">Modelo de lenguaje generativo que permite conversaciones naturales con IA así como cualquier otra actividad como la generación de código o imágenes a partir de texto.</td><td style="height: 80.1875px;">[https://chat.openai.com/](https://chat.openai.com/)

[https://platform.openai.com/chatgpt](https://platform.openai.com/chatgpt)

</td></tr><tr style="height: 46.5875px;"><td style="height: 46.5875px;">Anthropic</td><td style="height: 46.5875px;">Anthropic</td><td style="height: 46.5875px;">Creador de productos de IA como chat conversacionales (claude y poe)</td><td style="height: 46.5875px;">[https://www.anthropic.com/](https://www.anthropic.com/)

</td></tr><tr style="height: 46.5875px;"><td style="height: 46.5875px;">**SONIDO**</td><td style="height: 46.5875px;"> </td><td style="height: 46.5875px;"> </td><td style="height: 46.5875px;"> </td></tr><tr style="height: 46.5875px;"><td style="height: 46.5875px;">AIVA</td><td style="height: 46.5875px;">AIVA</td><td style="height: 46.5875px;">Plataforma que utiliza IA generativa para componer música original.</td><td style="height: 46.5875px;">[https://www.aiva.ai](https://www.aiva.ai)</td></tr><tr style="height: 57.775px;"><td style="height: 57.775px;">Whisper</td><td style="height: 57.775px;">OpenAI</td><td style="height: 57.775px;">Reconocedor de voz</td><td style="height: 57.775px;">[https://openai.com/research/whisper](https://openai.com/research/whisper)

</td></tr><tr style="height: 35.3875px;"><td style="height: 35.3875px;">ElevenLabs</td><td style="height: 35.3875px;">ElevenLabs</td><td style="height: 35.3875px;">Convertidor de texto a voz y clonación de voz</td><td style="height: 35.3875px;">[https://elevenlabs.io/](https://elevenlabs.io/)</td></tr><tr style="height: 46.5875px;"><td style="height: 46.5875px;">Murf</td><td style="height: 46.5875px;">Murf</td><td style="height: 46.5875px;">Texto a voz, clonación de voz, superposición de voz en vídeo</td><td style="height: 46.5875px;">[https://murf.ai/](https://murf.ai/)

</td></tr><tr style="height: 29.6px;"><td style="height: 29.6px;">**MULTIMODO**</td><td style="height: 29.6px;"> </td><td style="height: 29.6px;"> </td><td style="height: 29.6px;"> </td></tr><tr style="height: 63.2px;"><td style="height: 63.2px;">Gemini</td><td style="height: 63.2px;">Google</td><td style="height: 63.2px;">Versión conversacional de chatGPT de google</td><td style="height: 63.2px;">[https://gemini.google.com/app](https://gemini.google.com/app)

</td></tr><tr style="height: 35.2px;"><td style="height: 35.2px;">Copilot</td><td style="height: 35.2px;">Microsoft</td><td style="height: 35.2px;">IA de microsoft para texto e imagen</td><td style="height: 35.2px;">[https://copilot.microsoft.com/](https://copilot.microsoft.com/)

</td></tr></tbody></table>

Por supuesto la mayoría de compañías tecnológicas como Amazon o Microsoft ya usan sistemasde intelgicencia artificial así como modelos conversacionales y otras herramientas.

En resumen, la IA generativa desempeña un papel esencial en el desarrollo y mejora de aplicaciones multimodo al permitir la generación y manipulación de contenido en diversas modalidades. Esto contribuye a la creación de experiencias más ricas y personalizadas para los usuarios en aplicaciones que involucran texto, imágenes, voz y otras formas de comunicación.

Pero va mucho más allá de la simple generación de texto a imagen, en los últimos meses están surgiendo aplicaciones para genrar toda clase de contenidos, en el siguientes listado destacamos algunas de ellas:

**Texto y Código**

La generación de código es una de las aplicaciones con más éxito y potencial dada la gran cantidad de información al respecto. Esto permite a casi cualquiera poder crear toda clase de aplicaciones sin conocimientos profundos de codificación..

En esta tabla indicamos algunas de las herramientas más populares en las diversas tareas relacionadas con la programación.

<table border="1" id="bkmrk-aplicaci%C3%B3n-de-ia-des" style="border-collapse: collapse; width: 100%;"><colgroup><col style="width: 24.9629%;"></col><col style="width: 24.9629%;"></col><col style="width: 24.9629%;"></col><col style="width: 24.9629%;"></col></colgroup><tbody><tr><th>**Aplicación de IA**</th><th>**Descripción**</th><th>**Uso Típico**</th><th>**Ejemplos de Empresas/Aplicaciones**</th></tr><tr><td>**Generación de Código Automatizado**</td><td>Usa modelos de lenguaje avanzados para convertir especificaciones de texto en código fuente.</td><td>Desarrolladores agilizan la escritura de código.</td><td>OpenAI Codex, GitHub Copilot</td></tr><tr><td>**Asistentes de Programación**</td><td>Proporcionan sugerencias de código y correcciones en tiempo real.</td><td>Mejora eficiencia y reduce errores en el desarrollo.</td><td>Kite, Tabnine, IntelliCode de Microsoft</td></tr><tr><td>**Traducción de Lenguaje Natural a SQL**</td><td>Convierte consultas en lenguaje natural a consultas SQL.</td><td>Útil para analistas de datos y usuarios no técnicos.</td><td>ChatGPT con habilidades SQL, Alteryx, EasyQuery</td></tr><tr><td>**Automatización de Pruebas de Software**</td><td>Genera scripts de pruebas automatizadas a partir de descripciones en lenguaje natural.</td><td>Creación rápida de pruebas funcionales y de regresión.</td><td>Selenium, Testim.io, Katalon Studio</td></tr><tr><td>**Documentación de Código**</td><td>Produce documentación técnica y comentarios en el código.</td><td>Mantiene documentación adecuada y actualizada.</td><td>Doxygen, Javadoc, Swagger</td></tr><tr><td>**Conversión de Código entre Lenguajes**</td><td>Traduce código de un lenguaje de programación a otro.</td><td>Portar software entre diferentes plataformas.</td><td>Tangible Software Solutions, JetBrains ReSharper</td></tr><tr><td>**Generación de Interfaces de Usuario**</td><td>Diseña interfaces de usuario a partir de descripciones textuales.</td><td>Creación rápida de prototipos y UIs.</td><td>Adobe XD, Figma, Sketch</td></tr><tr><td>**Síntesis de Requisitos de Software**</td><td>Transforma requisitos del negocio en especificaciones técnicas.</td><td>Definición clara de los requisitos técnicos.</td><td>IBM Rational Doors, Jama Software, Axure RP</td></tr><tr><td>**Conversión de Imagen a Código**</td><td>Transforma diseños gráficos e imágenes en código fuente.</td><td>Automatización en la creación de interfaces de usuario y web.</td><td>Zeplin, Avocode, Sketch2Code de Microsoft, Pix2Code, img2code, picoapps</td></tr></tbody></table>

 **Texto a Video 3D**

Con el avance y abaratiemtno de las GPUs (Unidades de Proceso en tarjetas gráficas) el uso y gestión de imágenes y vídeo en IA se ha visto enormemente simplificado. Hoy es relativamente fácil crear vídeos o películas usando sin moverese de casa con aplicaciones y ténicas de IA.

<table border="1" id="bkmrk-aplicaci%C3%B3n-de-ia-des-1" style="border-collapse: collapse; width: 100%; height: 350.4px;"><colgroup><col style="width: 24.9629%;"></col><col style="width: 24.9629%;"></col><col style="width: 24.9629%;"></col><col style="width: 24.9629%;"></col></colgroup><tbody><tr style="height: 46.4px;"><th style="height: 46.4px;">**Aplicación de IA**</th><th style="height: 46.4px;">**Descripción**</th><th style="height: 46.4px;">**Uso Típico**</th><th style="height: 46.4px;">**Ejemplos de Empresas/Aplicaciones**</th></tr><tr style="height: 63.2px;"><td style="height: 63.2px;">**Generación de Entornos Virtuales 3D**</td><td style="height: 63.2px;">Crea entornos 3D realistas a partir de descripciones de texto.</td><td style="height: 63.2px;">Usado en simulaciones, juegos y realidad virtual.</td><td style="height: 63.2px;">Unity, Unreal Engine, Autodesk Maya</td></tr><tr style="height: 63.2px;"><td style="height: 63.2px;">**Análisis de Vídeo 3D en Tiempo Real**</td><td style="height: 63.2px;">Analiza y procesa vídeos 3D para obtener insights en tiempo real.</td><td style="height: 63.2px;">Seguridad, deportes, y análisis de comportamiento.</td><td style="height: 63.2px;">IBM Watson Visual Recognition, Google Cloud Video Intelligence</td></tr><tr style="height: 29.6px;"><td>**Síntesis de Voz y Lenguaje para Avatares 3D**</td><td>Genera voz y diálogos realistas para personajes 3D.</td><td>Utilizado en juegos, entrenamiento virtual y asistentes virtuales.</td><td>Adobe Character Animator, Voicemod, CereProc</td></tr><tr style="height: 29.6px;"><td>**Realidad Aumentada Interactiva**</td><td>Superpone texto y gráficos en vídeos 3D en tiempo real.</td><td>Aplicaciones educativas, comerciales y de entretenimiento.</td><td>ARKit de Apple, ARCore de Google, Microsoft HoloLens</td></tr><tr style="height: 29.6px;"><td>**Traducción en Tiempo Real con Subtítulos 3D**</td><td>Traduce y muestra subtítulos en 3D sobre vídeos en tiempo real.</td><td>Usado en streaming en vivo, conferencias y eventos internacionales.</td><td>Amara, Dotsub, Subtitle Edit</td></tr><tr style="height: 29.6px;"><td>**Animación Facial y de Gestos en 3D**</td><td>Anima avatares 3D basado en texto o voz.</td><td>Creación de personajes virtuales y animaciones.</td><td>FaceRig, Adobe Fuse, Character Creator</td></tr><tr style="height: 29.6px;"><td>**Análisis de Sentimientos en Vídeos 3D**</td><td>Detecta y analiza emociones y reacciones en vídeos 3D.</td><td>Investigación de mercado, experiencia del usuario.</td><td>Affectiva, Emotient, Beyond Verbal</td></tr><tr style="height: 29.6px;"><td>**Sistemas Interactivos de Tutoría Virtual**</td><td>Crea tutores virtuales 3D que responden a texto y voz en tiempo real.</td><td>Educación en línea, entrenamiento corporativo.</td><td>CodeBaby, SitePal, TTS Sketch Maker</td></tr></tbody></table>

**Texto y juegos/videos en tiempo real**

El sector artístico en general y de ocio se ha visto profundamente afectado por estas tenoclogías, en todos sus ámbitos.

Esta tabla presenta aplicaciones relacionadas con juegos, videos y arte en general, incluyendo la posibilidad de generación en tiempo real.

<table border="1" id="bkmrk-aplicaci%C3%B3n-de-ia-des-2" style="border-collapse: collapse; width: 100%;"><colgroup><col style="width: 24.9629%;"></col><col style="width: 24.9629%;"></col><col style="width: 24.9629%;"></col><col style="width: 24.9629%;"></col></colgroup><tbody><tr><th>**Aplicación de IA**</th><th>**Descripción**</th><th>**Uso Típico**</th><th>**Ejemplos de Empresas/Aplicaciones**</th></tr><tr><td>**Generación de Contenido de Juegos**</td><td>Crea activos de juegos, como personajes, entornos y niveles, utilizando IA.</td><td>Desarrollo de juegos más rápido y eficiente.</td><td>Unity ML-Agents, Unreal Engine</td></tr><tr><td>**Optimización de Juegos en Tiempo Real**</td><td>Ajusta la dificultad y la experiencia del juego según el comportamiento del jugador.</td><td>Mejora la experiencia y retención del jugador.</td><td>Modl.ai, Spirit AI</td></tr><tr><td>**Procesamiento de Vídeo en Tiempo Real**</td><td>Mejora la calidad de vídeo, realiza seguimiento de objetos y personas en tiempo real.</td><td>Seguridad, transmisiones en vivo y análisis deportivo.</td><td>Nvidia Video SDK, OpenCV</td></tr><tr><td>**Renderizado Realista en Juegos**</td><td>Produce gráficos de alta calidad en tiempo real para juegos.</td><td>Juegos con gráficos más realistas y envolventes.</td><td>Ray Tracing en Nvidia, AMD Radeon Rays</td></tr><tr><td>**Análisis de Sentimientos y Reacciones de Jugadores**</td><td>Evalúa las emociones y reacciones de los jugadores en tiempo real.</td><td>Mejora de juegos basada en feedback emocional.</td><td>Affectiva, Emotient</td></tr><tr><td>**Control de Juegos por Voz y Gestos**</td><td>Permite a los jugadores interactuar con el juego usando voz y gestos.</td><td>Juegos más inmersivos y accesibles.</td><td>Microsoft Kinect, Leap Motion</td></tr><tr><td>**Edición y Mejora Automática de Vídeos de Juegos**</td><td>Edita y mejora clips de juegos automáticamente para compartir.</td><td>Creación fácil de contenido de juegos para redes sociales.</td><td>Adobe Premiere Pro (Auto Reframe), Elgato</td></tr><tr><td>**Simulación y Modelado de Física en Juegos**</td><td>Simula físicas realistas en entornos de juegos.</td><td>Juegos con interacciones y movimientos más realistas.</td><td>Havok, PhysX</td></tr></tbody></table>

**Texto y dibujos/comic/ilustraciones**

Coo subcsector de la imagen incluimos el de los comics y dibujos artísticos en general.

<table id="bkmrk-aplicaci%C3%B3n-de-ia-des-3" style="width: 100%; height: 518.4px;"><thead><tr style="height: 63.2px;"><th style="width: 24.9629%;">**Aplicación de IA**</th><th style="width: 24.9629%;">**Descripción**</th><th style="width: 24.9629%;">**Uso Típico**</th><th style="width: 24.9629%;">**Ejemplos de Empresas/Aplicaciones**</th></tr></thead><tbody><tr style="height: 46.4px;"><td style="width: 24.9629%;">**Generación Automática de Ilustraciones**</td><td style="width: 24.9629%;">Crea imágenes y gráficos basados en descripciones de texto.</td><td style="width: 24.9629%;">Creación de arte visual y paneles de cómic.</td><td style="width: 24.9629%;">OpenAI's DALL-E, Google's DeepDream</td></tr><tr style="height: 63.2px;"><td style="width: 24.9629%;">**Diseño Automático de Páginas de Cómic**</td><td style="width: 24.9629%;">Organiza el diseño y el flujo de una página de cómic basado en texto.</td><td style="width: 24.9629%;">Maquetación y diseño de páginas de cómics.</td><td style="width: 24.9629%;">Clip Studio Paint, Adobe Illustrator</td></tr><tr style="height: 63.2px;"><td style="width: 24.9629%;">**Creación de Guiones Gráficos**</td><td style="width: 24.9629%;">Convierte guiones escritos en secuencias visuales de cómics.</td><td style="width: 24.9629%;">Previsualización y planificación de historias.</td><td style="width: 24.9629%;">Storyboard That, Toon Boom Storyboard Pro</td></tr><tr style="height: 63.2px;"><td style="width: 24.9629%;">**Animación de Personajes de Cómic**</td><td style="width: 24.9629%;">Genera animaciones de personajes a partir de descripciones textuales.</td><td style="width: 24.9629%;">Creación de cómics animados y contenido interactivo.</td><td style="width: 24.9629%;">Adobe Character Animator, Moho (Anime Studio)</td></tr><tr style="height: 63.2px;"><td style="width: 24.9629%;">**Síntesis de Voz para Personajes de Cómic**</td><td style="width: 24.9629%;">Crea diálogos hablados para personajes de cómics basados en texto.</td><td style="width: 24.9629%;">Cómics interactivos y audiocómics.</td><td style="width: 24.9629%;">Balabolka, Amazon Polly</td></tr><tr style="height: 46.4px;"><td style="width: 24.9629%;">**Traducción Automática de Cómics**</td><td style="width: 24.9629%;">Traduce textos de cómics a diferentes idiomas manteniendo el formato.</td><td style="width: 24.9629%;">Localización y distribución internacional de cómics.</td><td style="width: 24.9629%;">DeepL, Google Translate con soporte de OCR</td></tr><tr style="height: 63.2px;"><td style="width: 24.9629%;">**Generación de Efectos de Sonido y Texto**</td><td style="width: 24.9629%;">Crea efectos de sonido y textos decorativos para cómics.</td><td style="width: 24.9629%;">Enriquecimiento visual y sonoro de paneles de cómic.</td><td style="width: 24.9629%;">Canva, Adobe Photoshop</td></tr><tr style="height: 46.4px;"><td style="width: 24.9629%;">**Personalización de Estilos de Dibujo**</td><td style="width: 24.9629%;">Imita estilos de dibujo específicos en base a descripciones de texto.</td><td style="width: 24.9629%;">Creación de cómics con estilos artísticos personalizados.</td><td style="width: 24.9629%;">DeepArt, Prisma</td></tr></tbody></table>

**Texto a podcast, mejora de imágenes, amplicación de contenido**

Otra aplación de gran valor, la posibilidad de corregir y ampliar contenidos basado en contenidos previos, ya sea de sonido, imagen o vídeo, del mismo modo que ocurre con el texto.

<table id="bkmrk-aplicaci%C3%B3n-de-ia-des-4" style="width: 100%; height: 484.8px;"><thead><tr style="height: 63.2px;"><th style="width: 19.8962%; height: 63.2px;">**Aplicación de IA**</th><th style="width: 31.0183%; height: 63.2px;">**Descripción**</th><th style="width: 30.0297%; height: 63.2px;">**Uso Típico**</th><th style="width: 19.0311%; height: 63.2px;">**Ejemplos de Empresas/Aplicaciones**</th></tr></thead><tbody><tr style="height: 46.4px;"><td style="width: 19.8962%; height: 46.4px;">**Mejora y Edición de Texto**</td><td style="width: 31.0183%; height: 46.4px;">Revisa y mejora la calidad del texto, incluyendo gramática y estilo.</td><td style="width: 30.0297%; height: 46.4px;">Escritura, edición de contenido, y corrección de pruebas.</td><td style="width: 19.0311%; height: 46.4px;">Grammarly, Hemingway Editor</td></tr><tr style="height: 63.2px;"><td style="width: 19.8962%; height: 63.2px;">**Generación de Guiones para Podcasts**</td><td style="width: 31.0183%; height: 63.2px;">Crea guiones para podcasts basados en temas o palabras clave.</td><td style="width: 30.0297%; height: 63.2px;">Producción de podcasts y contenido de audio.</td><td style="width: 19.0311%; height: 63.2px;">Jarvis AI, Writesonic</td></tr><tr style="height: 63.2px;"><td style="width: 19.8962%; height: 63.2px;">**Corrección de Imágenes**</td><td style="width: 31.0183%; height: 63.2px;">Mejora la calidad de las imágenes, restaura fotos dañadas.</td><td style="width: 30.0297%; height: 63.2px;">Restauración de fotos, mejoramiento de imágenes para medios.</td><td style="width: 19.0311%; height: 63.2px;">Adobe Photoshop con IA, Remini</td></tr><tr style="height: 46.4px;"><td style="width: 19.8962%; height: 46.4px;">**Ampliación de Imágenes**</td><td style="width: 31.0183%; height: 46.4px;">Aumenta la resolución de las imágenes sin perder calidad.</td><td style="width: 30.0297%; height: 46.4px;">Fotografía, diseño gráfico, y producción de medios.</td><td style="width: 19.0311%; height: 46.4px;">Let's Enhance, Bigjpg</td></tr><tr style="height: 46.4px;"><td style="width: 19.8962%; height: 46.4px;">**Mejora de Calidad de Sonido**</td><td style="width: 31.0183%; height: 46.4px;">Mejora la claridad y calidad del audio en grabaciones.</td><td style="width: 30.0297%; height: 46.4px;">Podcasts, música, y producción de audio.</td><td style="width: 19.0311%; height: 46.4px;">Izotope RX, Adobe Audition</td></tr><tr style="height: 46.4px;"><td style="width: 19.8962%; height: 46.4px;">**Síntesis de Voz para Podcasts**</td><td style="width: 31.0183%; height: 46.4px;">Crea narraciones de voz realistas para uso en podcasts.</td><td style="width: 30.0297%; height: 46.4px;">Podcasts automatizados, lecturas de texto.</td><td style="width: 19.0311%; height: 46.4px;">Descript, Amazon Polly</td></tr><tr style="height: 63.2px;"><td style="width: 19.8962%; height: 63.2px;">**Corrección Automática de Sonido**</td><td style="width: 31.0183%; height: 63.2px;">Elimina ruidos de fondo y mejora la calidad del sonido.</td><td style="width: 30.0297%; height: 63.2px;">Podcasts, conferencias, y grabaciones en general.</td><td style="width: 19.0311%; height: 63.2px;">Krisp, Dolby On</td></tr><tr style="height: 46.4px;"><td style="width: 19.8962%; height: 46.4px;">**Análisis de Contenido de Podcasts**</td><td style="width: 31.0183%; height: 46.4px;">Analiza y categoriza el contenido de los podcasts.</td><td style="width: 30.0297%; height: 46.4px;">Marketing, investigación de medios, y mejora de contenido.</td><td style="width: 19.0311%; height: 46.4px;">Spotify Podcast Analytics, Podtrac</td></tr></tbody></table>


**Aplicaciones de oficina**

Las posibilidades de la IA en oficina son también inmensas permitiendo automatizar y simplificar todos los procesos enormemente

Dejamos la tabla ilustrativa de algunas de las aplicaciones más importantes

<table border="1" id="bkmrk-aplicaci%C3%B3n-de-ia-des-5" style="border-collapse: collapse; width: 100%;"><colgroup><col style="width: 24.9629%;"></col><col style="width: 24.9629%;"></col><col style="width: 24.9629%;"></col><col style="width: 24.9629%;"></col></colgroup><tbody><tr><th>**Aplicación de IA**</th><th>**Descripción**</th><th>**Uso Típico**</th><th>**Ejemplos de Herramientas**</th></tr><tr><td>**Automatización de Tareas en Office**</td><td>Automatiza tareas repetitivas como entrada de datos y gestión de correos electrónicos.</td><td>Mejora de eficiencia en tareas administrativas.</td><td>Microsoft Power Automate, UiPath</td></tr><tr><td>**Análisis de Datos en Excel**</td><td>Utiliza IA para análisis predictivos y de tendencias en hojas de cálculo.</td><td>Análisis de datos, proyecciones financieras y reportes.</td><td>Excel con Power BI, Tableau</td></tr><tr><td>**Asistentes Virtuales para Organización**</td><td>Ayuda en la gestión de calendarios, correos electrónicos y recordatorios.</td><td>Organización personal y gestión del tiempo.</td><td>Cortana de Microsoft, Google Assistant</td></tr><tr><td>**Reconocimiento de Voz para Transcripción**</td><td>Convierte voz a texto para transcribir reuniones o notas.</td><td>Creación de documentos y notas de reuniones.</td><td>Dragon NaturallySpeaking, Otter.ai</td></tr><tr><td>**Análisis de Sentimientos en Comunicaciones**</td><td>Analiza el tono y los sentimientos en correos electrónicos y chats.</td><td>Mejora de la comunicación interna y atención al cliente.</td><td>IBM Watson Tone Analyzer, Google Cloud Natural Language</td></tr><tr><td>**Optimización de Presentaciones**</td><td>Sugerencias para mejorar diseño y contenido de presentaciones.</td><td>Creación de presentaciones más impactantes y profesionales.</td><td>PowerPoint Designer, Beautiful.ai</td></tr><tr><td>**Gestión de Proyectos con IA**</td><td>Asigna recursos y predice plazos en proyectos.</td><td>Gestión eficiente de proyectos y equipos.</td><td>Asana, Trello con extensiones de IA</td></tr><tr><td>**Seguridad de Datos y Cumplimiento**</td><td>Monitorea y protege datos contra accesos no autorizados.</td><td>Seguridad de la información y cumplimiento normativo.</td><td>NortonLifeLock, McAfee</td></tr><tr><td>**Análisis de Datos con ChatGPT**</td><td>ChatGPT integrado con capacidades de análisis de datos para respuestas enriquecidas.</td><td>Análisis de datos y generación de insights en conversaciones.</td><td>OpenAI ChatGPT con habilidades de análisis de datos</td></tr><tr><td>**Herramienta de Análisis y Visualización de Datos**</td><td>Herramienta basada en IA para crear dashboards y análisis de datos.</td><td>Creación de informes interactivos y visualización de datos.</td><td>Rows</td></tr></tbody></table>

No podíamos olvidar el sector de la realidad aumentada y realidad virtual.

<table border="1" id="bkmrk-categor%C3%ADa-herramient" style="border-collapse: collapse; width: 100%;"><colgroup><col style="width: 33.3663%;"></col><col style="width: 33.3663%;"></col><col style="width: 33.3663%;"></col></colgroup><tbody><tr><th>**Categoría**</th><th>**Herramienta/Tecnología**</th><th>**Descripción**</th></tr><tr><td>**Realidad Aumentada (AR)**</td><td> </td><td> </td></tr><tr><td> </td><td>ARKit (Apple)</td><td>Framework para experiencias AR en iOS, utiliza cámaras y sensores del dispositivo.</td></tr><tr><td> </td><td>ARCore (Google)</td><td>Plataforma de Google para AR, funciona en dispositivos Android y iOS.</td></tr><tr><td> </td><td>Vuforia</td><td>Plataforma AR conocida por su robusta capacidad de seguimiento.</td></tr><tr><td> </td><td>Unity con AR Foundation</td><td>Framework de Unity para desarrollo AR, compatible con ARKit y ARCore.</td></tr><tr><td> </td><td>Microsoft Mixed Reality Toolkit</td><td>Conjunto de herramientas para acelerar el desarrollo de aplicaciones de realidad mixta en Unity.</td></tr><tr><td>**Realidad Virtual (VR)**</td><td> </td><td> </td></tr><tr><td> </td><td>Unity</td><td>Plataforma líder en desarrollo de juegos y VR, soporta una amplia gama de visores VR.</td></tr><tr><td> </td><td>Unreal Engine</td><td>Motor gráfico con soporte extenso para desarrollo VR, conocido por su alta fidelidad gráfica.</td></tr><tr><td> </td><td>SteamVR</td><td>Plataforma de desarrollo completa para contenido VR, compatible con varios visores VR.</td></tr><tr><td> </td><td>Google VR para Unity</td><td>SDK para construir experiencias VR en Android y iOS, soporta Cardboard y Daydream.</td></tr><tr><td> </td><td>A-Frame (WebVR)</td><td>Framework web de código abierto para crear experiencias VR, permite ejecutar aplicaciones VR en navegadores web.</td></tr><tr><td>**AI para AR/VR**</td><td> </td><td> </td></tr><tr><td> </td><td>TensorFlow</td><td>Biblioteca de aprendizaje automático para añadir funcionalidades de AI a aplicaciones AR/VR.</td></tr><tr><td> </td><td>IBM Watson</td><td>Ofrece servicios de AI como reconocimiento de lenguaje y visual, integrables en apps AR/VR.</td></tr><tr><td> </td><td>OpenAI APIs</td><td>Proporciona capacidades de AI que pueden integrarse en AR/VR para interacciones avanzadas.</td></tr><tr><td> </td><td>Microsoft Azure AI</td><td>Suite de servicios de AI incluyendo procesamiento de lenguaje y toma de decisiones, útil en AR/VR.</td></tr><tr><td> </td><td>Google AI Services</td><td>Incluye APIs como Cloud Vision y Video Intelligence, integrables en AR/VR para interactividad mejorada.</td></tr></tbody></table>

#### El futuro de la IA Generativa

La evolución de la Inteligencia Artificial Generativa (IA Generativa) en los próximos años promete ser emocionante y transformadora. A medida que la investigación y la tecnología avanzan, es probable que veamos las siguientes tendencias y desarrollos en este campo:

**Mayor realismo y calidad** Las técnicas generativas seguirán mejorando en términos de la calidad y realismo de los datos y el contenido que generan. Esto incluye imágenes, videos, texto y audio que serán más difíciles de distinguir de las creaciones humanas.

**Generación multimodal avanzada** La IA generativa se volverá aún más hábil en la generación de contenido que combine múltiples modalidades, como la creación de historias visuales y auditivas a partir de texto, o la generación de contenido multimodal en tiempo real.

**Entendimiento contextual** La IA generativa mejorará su capacidad para comprender y generar contenido en función del contexto. Esto permitirá una interacción más natural y relevante con los usuarios, ya que la IA podrá adaptarse mejor a las necesidades y preferencias individuales.

**Aplicaciones en la industria** Veremos un aumento significativo en la adopción de IA generativa en industrias como la medicina, la arquitectura, el diseño de productos y la investigación científica, donde se utilizará para la generación de modelos, diseños y simulaciones complejas.

**Creatividad asistida por IA** Las herramientas de creatividad asistida por IA se volverán más accesibles y comunes. Los artistas, escritores y músicos podrán utilizar la IA para potenciar su creatividad y producir obras innovadoras.

**Ética y regulación** A medida que la IA generativa se vuelva más poderosa, surgirán preocupaciones éticas, como el uso indebido de la tecnología para la creación de contenido engañoso o perjudicial. Esto llevará a una mayor atención a la regulación y la ética en el desarrollo y uso de la IA generativa.

**Interacción humano-IA más fluida** La IA generativa se integrará más en la vida cotidiana de las personas, mejorando la interacción con dispositivos, asistentes virtuales y aplicaciones, lo que permitirá una experiencia más fluida y personalizada.

**Aplicaciones en educación** La IA generativa se utilizará cada vez más en la educación, ayudando a crear contenido educativo personalizado y generando ejercicios y evaluaciones adaptadas a las necesidades de los estudiantes, veremos más sobre esto en la siguiente unidad.

**Investigación científica avanzada** La IA generativa jugará un papel importante en la investigación científica, especialmente en la simulación y modelado de fenómenos complejos, como el clima, la biología y la física cuántica.

En resumen, la IA generativa seguirá evolucionando y expandiéndose en diversas industrias y aplicaciones. Se espera que la tecnología sea cada vez más sofisticada y que tenga un impacto significativo en la forma en que interactuamos con la información y el contenido en el futuro. Sin embargo, también surgirán desafíos éticos y regulatorios que deberán abordarse a medida que esta tecnología avance.

Presentamos finalmente un vídeo generado con IA en noviembre de 2023 y que representa lo más avanzado que hay en esta tecnología

 <iframe allowfullscreen="allowfullscreen" height="314" src="https://www.youtube.com/embed/Jk4OxJvLI7U" width="560"></iframe>

# Unidad 3.4. Aplicaciones educativas

### Introducción

La Inteligencia Artificial en el ámbito educativo se está convirtiendo en una realidad que está transformando la manera en que enseñamos y aprendemos. A medida que la tecnología avanza, la educación ha comenzado a beneficiarse de las múltiples aplicaciones de la IA, desde sistemas de tutoría personalizada y plataformas de aprendizaje adaptativo hasta herramientas de análisis predictivo que ayudan a los educadores a identificar a estudiantes en riesgo.

La irrupción de herramientas de IA como ChatGPT y otros chatbots ha añadido una dimensión innovadora al panorama educativo. Estos sistemas, diseñados para simular conversaciones humanas, están redefiniendo las formas en que los agentes educativos interactúan con el contenido de las distintas materias, proporcionando nuevas oportunidades para profesores, alumnos e instituciones educativas. Al aprovechar la capacidad de estos chatbots para ofrecer respuestas instantáneas y personalizadas, se fomenta un aprendizaje más autónomo y adaptativo. **Profesores** pueden utilizar estas herramientas para complementar sus métodos de enseñanza tradicionales, brindando a los alumnos recursos adicionales y personalizados. Los **alumnos**, por su parte, tienen la oportunidad de explorar y profundizar en temas a su propio ritmo, fortaleciendo su comprensión y curiosidad. Las **instituciones educativas**, al adoptar estas tecnologías, no solo modernizan su enfoque pedagógico, sino que también se posicionan a la vanguardia de la revolución digital en educación, preparándose para los desafíos y oportunidades del futuro.

<span style="color: rgb(0, 0, 0);">Descubriremos multitud de herramientas de IA generativa que expandirán nuestras posibilidades como docentes al mismo tiempo que nos permiten ahorrar tiempo de tareas administrativas de carácter recurrente y emplearlo en actividades que aporten valor al proceso de enseñanza-aprendizaje y una mayor atención al aspecto humano en la interacción pedagógica.</span>

Hacemos primero un repaso de las posibilidades genéricas que la IA posibilita a nivel educativo para después exponer ejemplos de aplicaciones concretas que ofrecen distintas funcionalidades.

![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/CG5image.png)Imagen propia. Creada por el generador de imágenes de Bing.

---

### Casos de uso en Educación

La irrupción de los chatbots, así como otras herramientas de IA generativa ofrecen multitud de posibilidades, las citamos a nivel genérico. La IA puede:

- Idear situaciones de aprendizaje
- Proponer dinámicas de clase
- Generar problemas numéricos
- Trabajar con textos (mejorar, resumir, expandir, cambiar estilos, hacer preguntas, obtener respuestas)
- Corregir tareas y exámenes en base a unos criterios de evaluación y calificación dados (rúbrica)
- Proporcionar retroalimentación inmediata y personalizada.
- Redactar, traducir textos y así como ayudar en la pronunciación y conversación en diversos idiomas.
- Aportar ideas para gamificación (trivial, cartas, crucigramas, adivinanzas)
- Generar exámenes o cuestionarios a partir de texto propio, páginas web, documentos en diversos formatos, videos de YouTube u otras plataformas...
- Crear presentaciones dinámicas, imágenes y videos a partir de texto
- Escribir guiones para podcasts a partir de texto
- Crear o mejorar y ampliar apuntes
- Ofrecer tutoría personalizada, adaptando el contenido y la velocidad de enseñanza a cada estudiante. Recomendando recursos adaptados.
- Adaptar materiales para estudiantes con discapacidades visuales o de lectura mediante la conversión de texto en voz y la lectura de texto en voz alta.
- Captar emociones de los estudiantes a través de análisis de voz y expresiones faciales, lo que permite a los educadores adaptar su enfoque y brindar apoyo emocional cuando sea necesario.
- Detectar problemas de aprendizaje en etapas tempranas, permitiendo una pronta intervención por parte de los educadores.

Estas son algunas de las aplicaciones educativas que la IA puede facilitar. La mayoría de ellas, son realizables a través de los chatbots como ChatGPT, si bien, esto exige cierto conocimiento y experiencia lo que requiere tiempo para su adquisición. La alternativa práctica la ofrecen **herramientas específicas** (la mayoría basadas en los propios chatbots u otras herramientas de IA generativa) que **facilitan el acceso** a algunas o varias de las funciones citadas, mediante interfaces atractivas, indicaciones predefinidas (*prompts*) y sugerencias de aplicación. En el mercado ya existen numerosas opciones en forma de aplicaciones web, programas instalables, plugins o extensiones de navegador. Vemos algunas de ellas en el siguiente apartado.

---

### Aplicaciones educativas concretas

Actualmente existen varias aplicaciones de IA enfocadas al ámbito educativo. Podríamos agruparlas en función del rango de funcionalidades que abarcan, desde las que están centradas en una o mas de una función específica, como por ejemplo generar cuestionarios, lecciones, presentaciones, etc... Llamaremos a estas **herramientas específicas,** hasta aquellas que pretenden gestionar y monitorizar el progreso educativo de los alumnos, **plataformas educativas.**

#### Herramientas específicas

Dentro de esta agrupación encontraremos herramientas generativas de distintos modos generativos (texto, audio, imagen, video, código) así cómo las multimodales, que están comenzando a surgir, capaces de incluir en sus funcionalidades mas de un modo.

 Citamos algunas de ellas y ejemplificamos su utilización en el ámbito educativo:

---

##### **Generación de texto**

Las herramientas de generación de texto se refieren a software diseñado específicamente para la creación automática de contenido textual. Estas aplicaciones hacen uso de técnicas basadas en algoritmos y modelos de procesamiento de lenguaje natural para elaborar texto que sea coherente y pertinente desde el punto de vista contextual.

En el ámbito educativo, estas herramientas tienen el potencial de ser utilizadas para generar materiales de estudio, resumir contenidos, responder preguntas y diseñar actividades que se ajusten a los niveles y requerimientos específicos de cada estudiante. Adicionalmente, pueden ofrecer soporte a los estudiantes en la redacción de ensayos, informes y otros trabajos académicos, proporcionando recomendaciones relacionadas con aspectos gramaticales, de estilo y en multitud de idiomas. Sin embargo, es crucial fomentar el uso crítico de estas herramientas, instando a los estudiantes a analizar cuidadosamente el contenido producido, dado que no toda la información generada es necesariamente confiable. Asimismo, es imperativo promover la adaptación personalizada del contenido para garantizar que este refleje adecuadamente los conocimientos y habilidades individuales de cada estudiante.

[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/T8Fimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-10/T8Fimage.png)

Imagen propia. Creada por el Generador de imágenes de Bing

<span lang="es-ES">Son numerosas las herramientas de generación de texto, te mostramos mas las relevantes. Puedes hacer clic en cada una para acceder:</span>

<div aria-labelledby="tab_0" id="bkmrk-bard-de-google%C2%A0--cha"><div class="xblock xblock-student_view xblock-student_view-vertical xblock-initialized" data-block-type="vertical" data-course-id="course-v1:INTEFMOOC+IAEducacion+2023_T1" data-init="VerticalStudentView" data-request-token="92d29bf4740a11ee8fe1005056a36227" data-runtime-class="LmsRuntime" data-runtime-version="1" data-usage-id="block-v1:INTEFMOOC+IAEducacion+2023_T1+type@vertical+block@dd020ccf2d364917a8782193633f2f71"><div class="vert-mod"><div class="vert vert-0" data-id="block-v1:INTEFMOOC+IAEducacion+2023_T1+type@html+block@6dde4557102140dd8899b2d80199beb6"><div class="xblock xblock-student_view xblock-student_view-html xmodule_display xmodule_HtmlModule xblock-initialized" data-block-type="html" data-course-id="course-v1:INTEFMOOC+IAEducacion+2023_T1" data-init="XBlockToXModuleShim" data-request-token="92d29bf4740a11ee8fe1005056a36227" data-runtime-class="LmsRuntime" data-runtime-version="1" data-type="HTMLModule" data-usage-id="block-v1:INTEFMOOC+IAEducacion+2023_T1+type@html+block@6dde4557102140dd8899b2d80199beb6"><div dir="ltr">- [<span lang="es-ES">Bard de Google</span>](https://bard.google.com/) <span lang="es-ES">- Chatbot conversacional general.</span>
- [ChatGPT ](https://chat.openai.com/)- Chatbot conversacional general.
- [<span lang="en-GB">Bing Chat</span>](https://www.bing.com/?scope=web&FORM=HDRSC2) <span lang="en-GB">- Chatbot conversacional general </span>
- <span lang="en-GB">[Claude](https://claude.ai/login?returnTo=%2F) - Chatbot conversacional general </span>
- [<span lang="es-ES">Canva</span>](https://www.canva.com/) <span lang="es-ES">- Escritura mágica</span> <span lang="es-ES">puedes producir resúmenes a partir de tus textos, además de generar nuevos contenidos mediante prompts.</span>
- [<span lang="es-ES">Chat Sonic</span>](https://writesonic.com/chat) <span lang="es-ES">- Chat conversacional, te proporciona links de referencia.</span>
- [<span lang="es-ES">ChatPDF</span>](https://www.chatpdf.com/) <span lang="es-ES">- Chat de texto que te permite interactuar con el contenido de un documento pdf.</span>
- [<span lang="es-ES">Conker</span>](https://www.conker.ai/) <span lang="es-ES">- Herramienta de generación de texto que te permite crear cuestionarios con IA.</span>
- [<span lang="es-ES">Consensus</span>](https://www.consensus.app/search/) <span lang="es-ES">- Chat de texto que te permite interactuar y encontrar información en trabajos de investigación.</span>
- [<span lang="es-ES">Elicit</span>](https://elicit.org/) <span lang="es-ES">- Chat de texto que te permite interactuar y encontrar información en trabajos de investigación.</span>
- [<span lang="es-ES">Humata</span>](https://www.humata.ai/) <span lang="es-ES">- Chat de texto que te permite interactuar con el contenido de un documento pdf.</span>
- [<span lang="es-ES">Piggy</span>](https://piggy.to/) <span lang="es-ES">- Genera historias, resúmenes y preguntas y respuestas con imágenes.</span>
- [<span lang="es-ES">Wisdolia</span>](https://www.wisdolia.com/) <span lang="es-ES">- Genera flashcards de un vídeo, artículo o pdf y te ofrece un feedback.</span>

</div></div></div></div></div></div><span lang="es-ES">Dentro de las herramientas de generación de texto, hay algunas cuyo **enfoque es específicamente educativo**, por ejemplo:</span>

- [Quizgecko](https://quizgecko.com/?ref=futurepedia) <span lang="es-ES">- </span>Genera automáticamente preguntas para cuestionarios, pruebas y exámenes en línea.
- [TutorAI](https://www.tutorai.me/?ref=futurepedia) <span lang="en-GB">- Introduce el tema del que quieras aprender y TutorAI generara los módulos necesarios para progresar en el aprendizaje.</span>
- [Mindsmith](https://www.mindsmith.ai/?ref=futurepedia) <span lang="es-ES">- Herramienta de creación de cursos que utiliza IA generativa para facilitar creación y el uso compartido de contenido de aprendizaje.</span>
- [Caktus AI](https://caktus.ai/?ref=futurepedia) - Enfocada en el estudiante. Herramienta de estudio para hacer crecer tu mente con tu propio asistente de IA asequible diseñado específicamente para tareas y aprendizaje.
- <span style="color: rgb(53, 152, 219);">[<span style="color: rgb(35, 111, 161);">Mathew</span>](https://mathew.ai/)<span style="color: rgb(35, 111, 161);"> -</span></span><span style="color: rgb(35, 111, 161);"> <span style="color: rgb(0, 0, 0);">Crea Actividades, situaciones de aprendizaje y evaluaciones.</span></span>

---

<div aria-labelledby="tab_0" id="bkmrk--5"><div class="xblock xblock-student_view xblock-student_view-vertical xblock-initialized" data-block-type="vertical" data-course-id="course-v1:INTEFMOOC+IAEducacion+2023_T1" data-init="VerticalStudentView" data-request-token="92d29bf4740a11ee8fe1005056a36227" data-runtime-class="LmsRuntime" data-runtime-version="1" data-usage-id="block-v1:INTEFMOOC+IAEducacion+2023_T1+type@vertical+block@dd020ccf2d364917a8782193633f2f71"><div class="vert-mod"><div class="vert vert-0" data-id="block-v1:INTEFMOOC+IAEducacion+2023_T1+type@html+block@6dde4557102140dd8899b2d80199beb6"><div class="xblock xblock-student_view xblock-student_view-html xmodule_display xmodule_HtmlModule xblock-initialized" data-block-type="html" data-course-id="course-v1:INTEFMOOC+IAEducacion+2023_T1" data-init="XBlockToXModuleShim" data-request-token="92d29bf4740a11ee8fe1005056a36227" data-runtime-class="LmsRuntime" data-runtime-version="1" data-type="HTMLModule" data-usage-id="block-v1:INTEFMOOC+IAEducacion+2023_T1+type@html+block@6dde4557102140dd8899b2d80199beb6"><div dir="ltr" id="bkmrk-bard-de-google%C2%A0--cha-1"></div></div></div></div></div></div>##### **Generación de imagen**

Las herramientas generativas de imágenes mediante IA están diseñadas para crear imágenes de forma autónoma en función de nuestras solicitudes. Estas herramientas implementan algoritmos y redes neuronales artificiales, incluyendo redes generativas adversarias (GAN) o modelos de lenguaje, para crear imágenes digitales capaces de representar elementos como objetos, entornos, rostros humanos y demás componentes visuales.

Piensa en la posibilidad de usar una herramienta que te facilite generar imágenes en base a instrucciones específicas *(prompt).* Estás imágenes pueden ser utilizadas entre otras cosas para enriquecer presentaciones, ilustrar comics o visualizar conceptos abstractos. De igual manera, los estudiantes podrían emplear estas herramientas para elaborar infografías, esquemas conceptuales y representaciones visuales de procesos complejos, favoreciendo así la comprensión y el intercambio de ideas.

Existen multitud de alternativas disponibles para la creación de imágenes:

- [Nostalgia Photos](https://www.nostalgia.photo/?ref=futurepedia) - Devuelve la vida a las fotos antiguas con la última inteligencia artificial de vanguardia.
- [<span lang="es-ES">DALL·E3</span>](https://openai.com/dall-e-3) <span lang="es-ES">- Texto a imagen.</span>
- [<span lang="es-ES">Bing Image Creator</span>](https://www.bing.com/create) <span lang="es-ES">- Texto a imagen.</span>
- [<span lang="es-ES">Adobe Firefly</span>](https://www.adobe.com/es/sensei/generative-ai/firefly.html) <span lang="es-ES">- Texto a imagen, relleno generativo, efectos de texto, generación de colores de reemplazo, 3D a imagen y ampliar imagen.</span>
- [<span lang="es-ES">Canva</span>](https://www.canva.com/es_es/) <span lang="es-ES">- De texto a imagen: puedes crear ilustraciones, fotografías e imágenes a partir de *prompts*</span> <span lang="es-ES">descriptivos.</span>
- [<span lang="es-ES">CHARL-E</span>](https://www.charl-e.com/) <span lang="es-ES">- Texto a imagen.</span>
- [<span lang="es-ES">Draw anyone</span>](https://drawanyone.ai/) <span lang="es-ES">- Retratos generados por IA.</span>
- [<span lang="es-ES">DreamStudio</span>](https://dreamstudio.ai/) <span lang="es-ES">- Texto a imagen y edición de imagen.</span>
- [<span lang="es-ES">Microsoft Designer</span>](https://designer.microsoft.com/) <span lang="es-ES">- Crea y edita diferentes tipos de recursos visuales: gráficos, infografías, posters, vídeos, etc.</span>
- [<span lang="es-ES">Recraft.ai</span>](https://app.recraft.ai/community) <span lang="es-ES">- Texto a imagen.</span>
- [<span lang="es-ES">Scribble Diffusion</span>](https://scribblediffusion.com/) <span lang="es-ES">- De dibujo a imagen.</span>
- [<span lang="es-ES">Vectorizer.AI</span>](https://vectorizer.ai/) <span lang="es-ES">- Permite vectorizar imágenes.</span>

---

##### **Generación de audio**

Las herramientas generadoras de audio basadas en inteligencia artificial están diseñadas para generar o modificar contenido de audio de forma autónoma. Mediante algoritmos avanzados y modelos de aprendizaje profundo son capaces de producir un abanico de sonidos, melodías, voces y efectos sonoros, así como de eliminar sonidos no deseados. Estas acciones son realizadas en base a las instrucciones introducidas mediante texto, pero también desde muestras de audio previas o incluso imágenes o parámetros específicos.

En el ámbito educativo, estas herramientas presentan numerosas posibilidades. Por ejemplo, pueden utilizarse para crear ejemplos de diferentes géneros musicales, enriqueciendo así la experiencia educativa de los estudiantes en música. Además, pueden funcionar como banda sonora para proyectos multimedia, aportando una capa auditiva a presentaciones y trabajos escolares. También son eficaces para facilitar la comprensión de conceptos musicales abstractos, ofreciendo ejemplos sonoros tangibles. Además, las herramientas de generación de audio pueden emplearse para desarrollar materiales didácticos interactivos, como narraciones para lecciones online o contenido sonoro personalizado que se adapte a las necesidades específicas de los estudiantes.

**Ejemplo didáctico**

Para mostrarte cómo puedes aplicar estas herramientas en la educación, te proponemos un ejemplo práctico que ilustra cómo la IA puede ser una valiosa aliada en tu labor docente. A<span style="color: rgb(0, 0, 0);">quí te presentamos una solución posible destinada a mejorar las habilidades lingüísticas y fomentar la creatividad en estudiantes de Educación Secundaria. Aunque las situaciones pueden ser muy variadas, este ejemplo puede inspirarte y brindarte ideas o sugerencias que posteriormente podrás adaptar a tu contexto educativo particular.</span>

<table border="1" id="bkmrk-en-nuestro-centro-ed" style="border-collapse: collapse; width: 100%; border-width: 1px; border-color: blue;"><colgroup><col style="width: 99.8765%;"></col></colgroup><tbody><tr><td style="border-color: blue;">En nuestro centro educativo vamos a diseñar una experiencia educativa centrada en el desarrollo de habilidades lingüísticas y creatividad para los estudiantes de secundaria. Queremos proporcionarles una manera interesante y variada de explorar la poesía y la narración de historias. Para lograrlo, incorporamos elementos de generación de audio.

Vamos a utilizar la herramienta de generación de audio Murf.ai, para dar vida a la poesía y narrativa. Vamos a transformar un poema popular en un archivo de audio narrado por una IA. Esto permitirá a mis estudiantes reflexionar sobre la importancia de la entonación, ritmo y la expresión emocional en la lectura del poema. Y podrán experimentar sobre algunas de las posibilidades que ofrece la IA.

  
Los pasos a seguir serán:

1. **Selección del texto.** Elegir el poema, en este caso " La canción del pirata" debido a relación con el contenido estudiado.
2. **Preparación del texto.** Copiar y pegar el texto del poema en la herramienta Murf.ai.
3. **Configuración de voz y estilo.** Seleccionar una voz adecuada para el tono del poema y ajusto los parámetros para lograr una entonación expresiva que refleje las emociones contenidas en el poema.
4. **Generación de audio.** Hacer clic en el botón de generación para convertir el poema en un archivo de audio.
5. **Uso en el aula.** Escuchar el audio generado en el aula.

<span style="mso-bidi-font-family: Calibri; mso-bidi-theme-font: minor-latin;"><span style="mso-list: Ignore;">6.<span style="font: 7.0pt 'Times New Roman';"> </span></span></span>**Discusión y creación.** Después de escuchar, proponer un debaten sobre las impresiones y emociones que evoca el poema en formato de audio.

<span style="mso-bidi-font-family: Calibri; mso-bidi-theme-font: minor-latin;"><span style="mso-list: Ignore;">7.<span style="font: 7.0pt 'Times New Roman';"> </span></span></span>Se les asigna la **tarea** de crear sus propias composiciones poéticas o narraciones de historias cortas, que posteriormente transformarán en archivos de audio utilizando la misma herramienta. Esto fomenta su creatividad y comprensión profunda de la relación entre el contenido y la expresión auditiva.

![](https://libros.catedu.es/uploads/images/gallery/2023-10/embedded-image-nodutdtj.png)

En el siguiente enlace puedes acceder al poema en Murf, reproducirlo y editarlo, modificando en cada estrofa, la velocidad de la narración, el énfasis y otras variables

[https://murf.ai/studio/project/2/P0169835294176343L?workspaceId=WORKSPACEID0169835293996182M](https://murf.ai/studio/project/2/P0169835294176343L?workspaceId=WORKSPACEID0169835293996182M)

</td></tr></tbody></table>

Dentro del amplio abanico de herramientas, hemos optado por destacar ***<span style="text-decoration: underline;"><span style="color: rgb(53, 152, 219); text-decoration: underline;">[Murf.ai](https://murf.ai/?pscd=get.murf.ai&ps_partner_key=b2dkbnBn&ps_xid=2K6KPD41yDPBkr&gsxid=2K6KPD41yDPBkr&gspk=b2dkbnBn&gclid=CjwKCAjwnOipBhBQEiwACyGLutxNpytvtDiZILmQKz0zpt7J0aoPnYEhuLTQKM1J1BVcspCpLsdi2RoCS1kQAvD_BwE) </span></span>***para demostrar una de las diversas maneras en las que se puede aplicar en el entorno educativo. También tienes a tu disposición las siguientes aplicaciones diseñadas específicamente para la creación de audio y música:

- [MusicLM](https://aitestkitchen.withgoogle.com/experiments/music-lm) - Genera música a partir de *prompts*.
- [Beatoven](https://www.beatoven.ai/?ref=futurepedia) *-* Genera música a partir de *prompts.*
- [Podcastle](https://podcastle.ai/?ref=futurepedia) *-* Ayuda en generación de podcast.
- [ElevenLabs](https://elevenlabs.io/) - Software de conversión de texto a voz y clonación de voces.

---

##### **Generación de video**

Las herramientas de generación de video permiten la creación y edición de contenido audiovisual de manera automatizada a través de IA. Estas aplicaciones son capaces de transformar imágenes estáticas en videos, convertir texto en animaciones, mejorar la resolución de los videos y producir contenido personalizado. Es crucial ser consciente de que la calidad y las funcionalidades de estas herramientas pueden variar significativamente, y es necesario abordar las cuestiones éticas y respetar los derechos de autor al hacer uso de ellas.

En el contexto educativo, estas herramientas ofrecen valiosas oportunidades para la elaboración de materiales audiovisuales que ayuden a explicar conceptos complejos. Los educadores pueden hacer uso de estas aplicaciones para crear animaciones educativas, visualizaciones de experimentos científicos o análisis interactivos de textos literarios, facilitando así un aprendizaje más atractivo y accesible para los estudiantes.

**Ejemplo didáctico (multimodo)**

Con el objetivo de ilustrar cómo se pueden integrar estas herramientas en la enseñanza, exponemos el siguiente ejemplo práctico realizado integrando algunas de las herramientas aquí descritas. Permitirá explorar las maneras en que la IA puede ser útil en tu labor docente.<span style="color: rgb(224, 62, 45);"> </span>

<table border="1" id="bkmrk-vamos-a-generar-un-a" style="border-collapse: collapse; width: 100%; border-width: 1px; border-color: blue;"><colgroup><col style="width: 99.8765%;"></col></colgroup><tbody><tr><td style="border-color: blue;">Vamos a generar un **avatar animado**, mediante el uso de **4 herramientas de IA generativa**

**La imagen** para posteriormente generar el avatar puede ser propia o de cualquier otra persona o personaje. En nuestro caso hemos pedido a **Leonardo.AI** que nos generara un a imagen del físico Richard Feynman.

Para el **texto** que R. Feynman va a decir le hemos pedido a **ChatGPT** que actuara como si fuera R. Feynman (tanto en estilo como en contenido) y explicara su opinión sobre la IA.

Para el **audio, la voz,** hemos escogido la aplicación **ElevenLabs,** ya que es capaz de sintetizar cualquier voz de la que dispongamos fichero de audio, ya sea la del propio personaje, nuestra propia voz (como es el caso), o una voz propuesta por la propia herramienta. En ELvenLAbs, cargas el texto generado por ChatGPT y le pides que genere un audio, leyendo ese texto con la voz que hayas sintetizado. Una vez generado el fichero, lo descargas.

Por último, **el video** (Avatar animado) lo hemos generado con **D-ID,** al que alimentaremos por un lado con la imagen creada con Leonardo.AI y el fichero de audio generado con Eleven Labs. Le pedimos que genere la animación y este es el resultado, haz clic en la imagen para ver la animación: **[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/Sqfimage.png)](https://youtu.be/XXMs--pe6Qk)**

</td></tr></tbody></table>

<span lang="es-ES">Hemos elegido [D-ID](https://www.d-id.com/)</span> <span lang="es-ES">para el video mostrando una posible aplicación de aula, pero como en el resto de modos de generación podemos encontrar varias herramientas para generar vídeo, por ejemplo:</span>

- <span lang="es-ES">[Canva](https://www.canva.com/) - Animador mágico: puedes dibujar la trayectoria de desplazamiento de cualquier elemento de las composiciones multimedia que presenta y, gracias a la IA, generará automáticamente tanto el movimiento como los efectos correspondientes. </span>
- <span lang="es-ES">[Rephrase.ai](https://www.rephrase.ai/?ref=futurepedia) - Texto a video con avatar</span>
- <span lang="es-ES">[Vidyo.ai](https://vidyo.ai/?ref=futurepedia) - Corta videos largos en segundos</span>
- <span lang="es-ES">[Wonder Studio](https://wonderdynamics.com/) - Permite generar efectos especiales, insertar y eliminar personajes de cualquier escena.</span>

---

##### **Generación de código**

Las herramientas de generación de código son herramientas basadas en inteligencia artificial que están empezando a adquirir protagonismo en el desarrollo y optimización de código de programación. Son capaces de crear algoritmos, segmentos de código y solucionar problemas de programación de manera automática o con asistencia, proporcionando una herramienta práctica tanto para profesionales como para docentes como para estudiantes en el proceso de aprendizaje y práctica de programación.

En el entorno educativo, estas herramientas de generación de código pueden suponer un cambio significativo. Los estudiantes pueden emplear estas herramientas de IA generativa para explorar y entender conceptos de programación de forma más eficaz, obteniendo ejemplos prácticos y funcionales de código para resolver problemas específicos. Los profesores, por otro lado, pueden utilizar estas herramientas para crear ejercicios y proyectos de programación más retadores y diversos, ofreciendo a los estudiantes una experiencia de aprendizaje más completa. Además, estas herramientas pueden facilitar el desarrollo de software dentro del sector educativo, permitiendo a las instituciones crear aplicaciones a medida para fines docentes y gestión de datos académicos.

<span lang="es-ES">Estas son algunas de las herramientas de generación de código:</span>

- [ChatGPT ](https://chat.openai.com/)- Chatbot conversacional general (si, ChaGPT tambien genera código, al igual que otros chatbots)
- [Adrenaline](https://useadrenaline.com/)
- [Cosine ](https://cosine.sh/)
- [Amazon CodeWhisperer](https://aws.amazon.com/es/codewhisperer/)
- <span lang="es-ES">[Code GPT](https://codegpt.co/)</span>

---

Por último, aunque no pueda incluirse en ninguna de las agrupaciones anteriores por su carácter meramente científico, destacar **[*<span style="text-decoration: underline;"><span style="color: rgb(53, 152, 219); text-decoration: underline;">Wolfram Research,</span></span>*](https://www.wolfram.com/)** conocida principalmente por desarrollar productos de **software matemático,** que también incluye desarrollos de IA. Dentro de esta plataforma distinguimos.

[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/gmWimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-10/gmWimage.png)

- [*<span style="text-decoration: underline;"><span style="color: rgb(53, 152, 219);">**Wolfram|Alpha**:</span></span>*](https://es.wolframalpha.com/) Es un motor de cálculo computacional y respuesta a preguntas. Puedes hacerle preguntas en lenguaje natural y te dará respuestas detalladas. Es como un "ChatGPT" especializado en matemáticas y ciencia.
- [<span style="text-decoration: underline; color: rgb(53, 152, 219);">***Mathematica**:*</span>](https://www.wolfram.com/mathematica/) Es un software líder en cálculo simbólico y numérico, utilizado ampliamente en investigación y educación para realizar cálculos matemáticos, análisis de datos, visualización y desarrollo de algoritmos.
- [*<span style="text-decoration: underline;"><span style="color: rgb(53, 152, 219);">**Wolfram Language**:</span></span>*](https://www.wolfram.com/language/) Un lenguaje de programación de alto nivel que alimenta a Mathematica y Wolfram|Alpha. Es conocido por su capacidad de integración y por tener funciones incorporadas para muchas tareas.

---

#### Plataformas educativas

Las plataformas educativas tienen vocación de abarcar mayor espacio en el proceso educativo, gestionando y monitorizando el progreso de los alumnos implicando en el mismo diferentes herramientas entre las que pueden estar algunas de las herramientas específicas vistas y otras que recopilen la información personalizada surgida del propio proceso con el fin de analizar la evolución de cada estudiante y proporcionarle los recursos específicos adaptados a su necesidad en cada momento.

Algunas de estas plataformas ya han sido adaptadas por sistemas educativos a nivel institucional, como <span style="text-decoration: underline;"> <span style="color: rgb(53, 152, 219); text-decoration: underline;">***[Eduten ](https://eduten.com/es/)***</span></span><span style="color: rgb(53, 152, 219);"> </span>

**Eduten** es una plataforma de aprendizaje digital finlandesa que ofrece ejercicios y juegos personalizados para estudiantes de primaria y secundaria. La plataforma está disponible en inglés y español. Los servicios de la plataforma son contratables para cualquier institución educativa interesada.

Su funcionamiento se basa en un **algoritmo de aprendizaje automático** para **personalizar** el contenido y la dificultad de los ejercicios a las necesidades de cada estudiante. Esto ayuda a los estudiantes a aprender a su propio ritmo y a dominar los conceptos de forma efectiva.

La plataforma ofrece una amplia gama de ejercicios y juegos, incluyendo:

- **Matemáticas:** Ejercicios de matemáticas para aprender y practicar conceptos básicos y avanzados.
- **Lengua y literatura:** Ejercicios de comprensión lectora, escritura y gramática.
- **Ciencias:** Ejercicios de ciencias para aprender sobre el mundo natural.
- **Historia:** Ejercicios de historia para aprender sobre eventos y personajes históricos.
- **Geografía:** Ejercicios de geografía para aprender sobre el mundo y sus culturas.

Pero sobre todo ofrece **análisis de aprendizaje** para que los profesores puedan **monitorear el progreso** de sus alumnos. Estos análisis incluyen información sobre el tiempo que los estudiantes pasan en la plataforma, las tareas que completan y su rendimiento en las tareas.

Aquí hay algunos de los beneficios de utilizar Eduten:

- **Aprendizaje personalizado:** Adapta el contenido y la dificultad de los ejercicios a las necesidades de cada estudiante. Esto ayuda a los estudiantes a aprender a su propio ritmo y a dominar los conceptos de forma efectiva.
- **Retroalimentación Inmediata**: Los estudiantes reciben retroalimentación inmediata sobre sus respuestas, lo que les ayuda a comprender y corregir errores al instante.
- **Motivación:** Utiliza ejercicios y juegos atractivos para mantener a los estudiantes motivados. Esto ayuda a los estudiantes a participar en el aprendizaje y a retener la información.
- **Análisis de aprendizaje:** Proporciona análisis de aprendizaje para que los profesores puedan monitorear el progreso de sus alumnos. Esto ayuda a los profesores a identificar las áreas de mejora y a proporcionar a los estudiantes la ayuda que necesitan.

<span style="color: rgb(53, 152, 219);"><span style="color: rgb(0, 0, 0);"><iframe allowfullscreen="allowfullscreen" height="350" src="https://www.youtube.com/embed/K7-5fbpocOg?t=2s" style="width: 624px; height: 350px;" width="624"></iframe>

</span></span>

Otras, son plataformas web como ***<span style="text-decoration: underline;"><span style="color: rgb(53, 152, 219); text-decoration: underline;">[Khanmigo](https://www.khanacademy.org/khan-labs).</span></span>***<span style="color: rgb(53, 152, 219);"><span style="color: rgb(0, 0, 0);"> Khanmigo </span></span>es un chatbot de aprendizaje personalizado desarrollado por ***<span style="text-decoration: underline;"><span style="color: rgb(53, 152, 219); text-decoration: underline;">[Khan Academy](https://www.khanacademy.org/khan-labs#whoIsKhanAcademy)</span></span>***. Khanmigo utiliza el modelo de lenguaje GPT-4 de OpenAI para proporcionar a los estudiantes un aprendizaje individualizado y relevante. Puede personalizar el aprendizaje de los estudiantes de varias maneras;

- **Adaptando el contenido:** adapta el contenido a las necesidades y preferencias de los estudiantes. Por ejemplo, si un estudiante tiene dificultades con un concepto, Khanmigo puede proporcionarle más explicaciones o ejemplos.
- **Proporcionar retroalimentación personalizada:** proporciona retroalimentación personalizada a los estudiantes sobre su trabajo. Esta retroalimentación puede ayudar a los estudiantes a identificar sus áreas de mejora y a desarrollar estrategias de aprendizaje efectivas.
- **Crear un plan de aprendizaje individualizado:** puede crear un plan de aprendizaje exclusivo para cada estudiante. Este plan se basa en las necesidades y objetivos de aprendizaje del estudiante.

En el siguiente video **Sal Khan**, fundador de la plataforma explica las características de la misma:

<iframe allowfullscreen="allowfullscreen" height="355" src="https://www.youtube.com/embed/yEgHrxvLsz0" style="width: 633px; height: 355px;" width="633"></iframe>

No podía faltar la incorporación de la IA a la plataforma educativa de **Google Classroom,** El gigante tecnológico ha incluido entre las funcionalidades de su las [<span style="color: rgb(53, 152, 219);">**Practicas Guiadas (Practice Sets)**</span> ](https://blog.google/outreach-initiatives/education/introducing-practice-sets/)en su herramienta educativa. Esta novedad en Google Classroom aporta la anhelada posibilidad de personalizar el aprendizaje de cada estudiante mediante la tecnología de aprendizaje adaptativo

Este es un hito anhelado y ya accesible para que cada profesor pueda apoyar a sus estudiantes mediante tareas interactivas y comentarios en tiempo real e individualizados. Este método se basa en la medición, recopilación y análisis de datos (Learning Analytics) sobre el alumnado, su entorno y sus interacciones con el objetivo de adaptarse a sus necesidades

Esta función está disponible en Google Classroom para cualquier educador que utilice la ‘Teaching and Learning upgrade’, o cualquier institución que emplee Google Workspace for Education Plus. Una vez creadas las prácticas, es posible que todos los profesores del centro las compartan.

En el siguiente video tienes mas información al respecto:

<iframe allowfullscreen="allowfullscreen" height="352" src="https://www.youtube.com/embed/XtfLbKirX8g" style="width: 628px; height: 352px;" width="628"></iframe>

# Referencias Módulo 3

**Web:** Herramienta para la gestión de contenidos en el aula

[https://www.magicschool.ai/](https://www.magicschool.ai/)

---

**Web**: Guía de ingeniería del *prompting*

[https://www.promptingguide.ai/es](https://www.promptingguide.ai/es)

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">[https://profesoreco.blogspot.com/2023/04/instrucciones-precisas-y-potentes.html](https://profesoreco.blogspot.com/2023/04/instrucciones-precisas-y-potentes.html)</span>

---

**Vídeo** repaso conceptos y aplicaciones IA Generativa

[https://youtube.com/watch?v=QC3J3DAMUvg&amp;list=PLaFUiA52BD9H-EZJfgR9qEBVNdiXJuucC&amp;index=2&amp;t=7329s](https://youtube.com/watch?v=QC3J3DAMUvg&list=PLaFUiA52BD9H-EZJfgR9qEBVNdiXJuucC&index=2&t=7329s)

---

**Vídeo** IA Genrativa. Se explica de forma muy sencilla el concepto y aplicaciones de la IA Generativa

[https://www.youtube.com/watch?v=\_6R7Ym6Vy\_I](https://www.youtube.com/watch?v=_6R7Ym6Vy_I)

---

**Documento pdf:** Informe UNESCO AI y Educación, guía para gestores

[https://unesdoc.unesco.org/ark:/48223/pf0000379376/PDF/379376spa.pdf.multi](https://unesdoc.unesco.org/ark:/48223/pf0000379376/PDF/379376spa.pdf.multi)

---

**Web** Asistente de Khan Academy: Khanmigo

[https://www.khanacademy.org/khan-labs](https://www.khanacademy.org/khan-labs)

---

**Curso** <span class="provider">INTEF:</span> <span class="course-number">IAEducacion</span> <span class="course-name">Una IA para aprender</span>

<span class="course-name">[https://enlinea.intef.es/courses/course-v1:INTEFMOOC+IAEducacion+2023\_T1/about](https://enlinea.intef.es/courses/course-v1:INTEFMOOC+IAEducacion+2023_T1/about)</span>

---

**Web** AI Tool Master List Conjunto de herramientas de IA clasificadas por su ámbito de aplicación

<span class="course-name">[https://doc.clickup.com/25598832/d/h/rd6vg-14247/0b79ca1dc0f7429/rd6vg-12207](https://doc.clickup.com/25598832/d/h/rd6vg-14247/0b79ca1dc0f7429/rd6vg-12207)</span>

---

**Web** Futurepedia

<span class="course-name">Directorio de herramientas de IA </span>

<span class="course-name">[https://www.futurepedia.io](https://www.futurepedia.io)</span>

# Módulo 4. Más allá de ChatGPT. Ampliando funcionalidad

# Unidad 4.1 Plugins, extensiones y complementos.

### Introducción

Ya sabemos que ChatGPT, Gemini y otros chatbots son herramientas de IA diseñados para simular conversaciones en lenguaje natural. Estos chatbots pueden responder preguntas, proporcionar y gestionar información de todo tipo en base a la información con la que han sido entrenados, lo cual no es poco ya que en general se han entrenado con prácticamente todo el conocimiento presente en internet hasta determinada fecha (ChatGPT con información hasta 2021).

Pero estas herramientas también tienen limitaciones, por un lado en la imposibilidad de acceder a información generada posteriormente a la fecha de corte con la que fue entrenado o acceso a datos generados en tiempo real. Por otro lado, en la incapacidad de realizar tareas más allá de su capacidad de gestionar lenguaje natural.

Los esfuerzos en superar estás restricciones han desembocado en la generación de otros sistemas de facilitación e integración de dichos datos y capacidades.

En particular los **plugins, las extensiones de navegadores y los complementos.** Los plugins facilitan a los chatbots el acceso a información on-line , además de proporcionar funcionalidades adicionales. Las extensiones facilitan el acceso a las posibilidades de la IA a la información que encontramos mediante los navegadores web. Por último, los complementos, son similares a las extensiones pero referidas al contexto de aplicaciones concretas, como procesadores de texto o hojas de cálculo, lo que nos permite igualmente incorporar la potencia de la IA en el proceso e interpretación de datos a nuestros propios documentos. Veamos una explicación de su funcionamiento así como ejemplos concretos en cada caso:

![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/i2Iimage.png)

Imagen propia. Generada por Dall-E 3 en ChatGPT

---

### Plugins 

Los plugins son programas de software diseñados para ampliar y personalizar la funcionalidad del chatbot. El funcionamiento básico es el de la integración en el chatbot de otras aplicaciones y servicios incluida la posibilidad de navegar por Internet accediendo a información on-line.

Es decir, cuando instalamos un plugin en el chatbot, este **chatbot adquiere una nueva función.**

Para ilustrarlo de manera sencilla veamos un ejemplo. Los chatbots dan resultados convincentes cuando se conversa, se solicita información o se le pide que realice determinadas tareas con un texto (resumir, expandir, traducir, etc..) pero siempre en lenguaje natural. Sin embargo no son capaces muchas veces de realizar operaciones matemáticas sencillas, mucho menos sin son complejas. Esta limitación se ha superado con la posibilidad de instalar plugins específicos de cálculo matemático como **<span style="color: rgb(0, 0, 0);">Wolfram</span>.** Este plugin agrega inteligencia adicional al chatbot permitiéndole acceder a cálculos potentes, matemáticas precisas, visualizaciones y datos en tiempo real a través de las tecnologías Wolfram. Haz click en el enlace o en la imagen para acceder a la <span style="color: rgb(53, 152, 219);">***<span style="text-decoration: underline;">[web de Wolfram](https://www.wolframalpha.com/)</span>***</span> y contemplar sus posibilidades, las cuales, gracias al plugin son accesibles en lenguaje natural desde ChatGPT.

[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/ZMTimage.png)](https://www.wolframalpha.com/)Imagen del plugin de Wolfram en ChatGPT

Los chatbots funcionan a través de una serie de principios básicos que se pueden resumir en las siguientes etapas:

<div class="content" id="bkmrk-competencias.-los-ch" tabindex="0"><div class="ac-container ac-adaptiveCard" streaming=""><div class="ac-textBlock">- **Competencias.** Los chatbots tienen las habilidades comentadas, comunicarse e interactuar automáticamente con los usuarios para proporcionar información, asistencia o realizar tareas específicas. Si en nuestra interacción con el chatbot, nuestra intención va más allá de sus competencias el chatbot no podrá darnos una respuesta satisfactoria de manera directa.
- **Cognitivo.** Al estar diseñados para interpretar el contexto de la conversación y responder a nuestras preguntas gracias a determinadas herramientas de IA como el Procesamiento del Lenguaje Natural (PNL), el chatbot hará uso de estas habilidades para entender si el texto que introduce el usuario corresponde o no a alguna de sus competencias específicas. Si, el chatbot tiene la capacidad de responder al usuario, lo hará, de no ser así, recurrirá automáticamente al plugin que le permita hacerlo, estableciendo una interfaz de comunicación entre el chatbot y el plugin adecuado.
- **Interfaz de comunicación.** Mediante esta interfaz el chatbot se comunica con un plugin para traducir y trasladar la pregunta del usuario en el lenguaje preciso que necesita el sistema. Este proceso implica la conversión de la entrada del usuario a un formato que el plugin pueda comprender y procesar, para luego recibir la respuesta y traducirla de vuelta a un formato comprensible para el usuario. Esta interfaz por tanto, es de doble sentido, el chatbot traslada la pregunta al plugin y el plugin le devuelve la respuesta al chatbot, que posteriormente trasladará al usuario otra vez en lenguaje natural.

</div></div></div>Es decir, el chatbot identifica la intención detrás de la pregunta del usuario y los aspectos relevantes presentes en la consulta, para luego formular la petición adecuada al plugin.

Los plugins han potenciado en gran medida las posibilidades de los chatbots, habilitando la posibilidad de navegar por internet, acceder a servicios de terceros y realizar cálculos matemáticos.

Vemos solo algunos ejemplos de plugins accesibles en ChatGPT

<table border="1" id="bkmrk-polygon%3A-es-un-plugi" style="border-collapse: collapse; width: 100%;"><colgroup><col style="width: 78.6982%;"></col><col style="width: 21.4142%;"></col></colgroup><tbody><tr><td>**Polygon:** Es un plugin que permite a ChatGPT acceder a datos del mercado financiero. Con él, los usuarios pueden obtener información en tiempo real sobre acciones, criptomonedas, noticias y otros detalles financieros y hacer consultas a ChatGPT en relación con esos datos.</td><td>[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/uALimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-10/uALimage.png)

</td></tr><tr><td>**CapCut:** Este plugin transforma las solicitudes de texto del usuario en guiones personalizados para videos. Es una herramienta poderosa para aquellos que desean generar contenido visual basado en texto.</td><td>[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/yQfimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-10/yQfimage.png)

</td></tr><tr><td>**ResumeCopilot:** Especializado en la redacción y mejora de currículums. Con él, los usuarios pueden optimizar sus CVs, haciéndolos más atractivos para los empleadores. Su funcionalidad dentro de ChatGPT es muy valiosa para quienes buscan empleo.</td><td>![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/Lrjimage.png)

</td></tr><tr><td>**Expedia:** Herramienta para planificar viajes de principio a fin. Busqueda de alojamiento, viajes, alquiler de coches o actividades en el destino elegido, todo desde ChatGPT.</td><td>[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/cihimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-10/cihimage.png)

</td></tr></tbody></table>

También hay **plugins educativos,** por ejemplo:

<table border="1" id="bkmrk-little-professor%3A-pe" style="border-collapse: collapse; width: 100%;"><colgroup><col style="width: 76.8463%;"></col><col style="width: 23.2661%;"></col></colgroup><tbody><tr><td>**Little professor**: Permite crear cuestionarios para el aula ayudando al profesor en su tarea</td><td>[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/md6image.png)](https://libros.catedu.es/uploads/images/gallery/2023-10/md6image.png)</td></tr><tr><td>**AskYourPdf:** Permite hacer preguntas sobre tus documentos PDF y chatear con ellos. Para investigar y aprender nuevos temas, puedes revisar documentos PDF en un formato conversacional</td><td>[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/kaeimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-10/kaeimage.png)

</td></tr><tr><td>**Present it ShowME:** Genera diapositivas interesantes en cuestión de segundos introduciendo comandos e indicaciones.</td><td>[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/1Uximage.png)](https://libros.catedu.es/uploads/images/gallery/2023-10/1Uximage.png)

</td></tr><tr><td>**Wolfram:** Convirte a ChatGPT en la herramienta perfecta para tareas matemáticas. Usando el plugin Wolfram, puedes analizar algoritmos complejos y mejorar tus habilidades matemáticas.</td><td>[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/R0Gimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-10/R0Gimage.png)

</td></tr></tbody></table>

Estos son solo unos pocos ejemplo de de plugins ya operativos en ChatGPT, pero ya son mas de 500 los disponibles lo que permite a ChatGPT expandir enormemente sus posibilidades.

Si bien, actualmente en ChatGPT solo están disponibles para la versión **ChatGPT plus**, siendo esta de pago.

Otra alternativa para ampliar la funcionalidad que nos ofrece la IA son las **extensiones instalables en navegadores y programas.**

---

### Extensiones<span style="color: rgb(0, 0, 0);"> de IA para navegadores</span>

  
Las extensiones son pequeños programas que personalizan y amplían la experiencia de navegación. Muchas de ellas son aplicaciones web que permiten ser incorporadas al navegador utilizado para poder trabajar con la funcionalidad que proporcionan directamente sobre el contenido de la web en la que estemos navegando. Nos vamos a centrar en aquellas que proporcionan funcionalidades de IA.

Las extensiones de inteligencia artificial para los navegadores de internet ofrecen una variedad de ventajas que pueden mejorar significativamente la experiencia del usuario, la productividad y la accesibilidad.

En el navegador Chrome podemos instalar multitud de extensiones, como por ejemplo:

<table border="1" id="bkmrk-grammarly%3A-esta-exte" style="border-collapse: collapse; width: 100%;"><colgroup><col style="width: 76.3525%;"></col><col style="width: 23.7599%;"></col></colgroup><tbody><tr><td>**Voice remaker:** Genera voz con IA</td><td>[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/0byimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-10/0byimage.png)</td></tr><tr><td>**NoteGPT:** Transcribe y resume en texto el contenido de videos de youtube.</td><td>[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/LhWimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-10/LhWimage.png)

</td></tr><tr><td>**Harpa.ai**: Muestra las respuestas de ChatGPT en las páginas de los motores de búsqueda. Resume, extrae y monitoriza páginas, precios y datos.</td><td>[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/LPOimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-10/LPOimage.png)

</td></tr><tr><td>**Read aloud:** Lee en voz alta la web o artículo en el que estés navegando con un solo click</td><td>[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/BgMimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-10/BgMimage.png)

</td></tr><tr><td>**Otter.ai:** Transcribe conversaciones en tiempo real utilizando IA. Es ideal para reuniones, entrevistas o cualquier situación donde se requiera una transcripción precisa.</td><td>[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/Lh2image.png)](https://libros.catedu.es/uploads/images/gallery/2023-10/Lh2image.png)

</td></tr></tbody></table>

Al igual que con los plugins, podemos encontrar **extensiones con utilidad para educación**:

<table border="1" id="bkmrk-grammarly%3A-esta-exte-1" style="border-collapse: collapse; width: 100%; height: 188.193px;"><colgroup><col style="width: 75.9821%;"></col><col style="width: 24.1303%;"></col></colgroup><tbody><tr style="height: 59.9006px;"><td style="height: 59.9006px;">**Grammarly:** Esta extensión utiliza la IA para corregir errores gramaticales y de estilo en textos escritos en línea. Es como tener un editor personal en tu navegador</td><td class="align-center" style="height: 59.9006px;">![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/C5Uimage.png)</td></tr><tr style="height: 68.8892px;"><td style="height: 68.8892px;">**Loom:** Graba tu pantalla o con la cámara con un solo clik . Comparte el contenido al instante mediante un link</td><td style="height: 68.8892px;">[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/WM4image.png)](https://libros.catedu.es/uploads/images/gallery/2023-10/WM4image.png)

</td></tr><tr style="height: 29.7017px;"><td style="height: 29.7017px;">**Google Classroom;** herramienta de Google Apps for Education que ayuda a los profesores a crear y organizar tareas rápidamente, proporcionar observaciones de forma eficaz y comunicarse con sus clases con facilidad. A su vez, Classroom ayuda a los alumnos a organizar su trabajo en Google Drive, completarlo y entregarlo, y comunicarse directamente con sus profesores y compañeros.</td><td style="height: 29.7017px;">[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/Rzbimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-10/Rzbimage.png)

</td></tr><tr style="height: 29.7017px;"><td style="height: 29.7017px;">**Diccionario RAE:** como en la página que estés, seleccionar la palabra que no sabemos y pinchar el botón derecho. Ahí te saldrá la extensión y haz clic en ella. Seguidamente, veremos la definición de la RAE (Real Academia Española).</td><td style="height: 29.7017px;">[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/MIWimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-10/MIWimage.png)

</td></tr></tbody></table>

Las opciones son muchas, piensa en cual es tu necesidad y busca una extensión que la cubra. Para instalarlos, solo tienes que acceder al gestor de extensiones del navegador y buscar la que necesites. En Chrome se accede a través de [***<span style="text-decoration: underline;"><span style="color: rgb(53, 152, 219);">Chrome Web Store</span></span>***](https://chrome.google.com/webstore/category/extensions?utm_source=ext_sidebar&hl=es)<span style="color: rgb(53, 152, 219);"><span style="color: rgb(0, 0, 0);"> y buscar por nombre o por categoría.</span></span>

---

### <span style="color: rgb(53, 152, 219);"><span style="color: rgb(0, 0, 0);">Complementos </span><span style="color: rgb(0, 0, 0);">de IA</span></span>

![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/BV9image.png)

Imagen propia. Generada por Dall-E 3 en ChatGPT

<span style="color: rgb(53, 152, 219);"><span style="color: rgb(0, 0, 0);">Los complementos permiten **integrar herramientas de IA para utilizarlas directamente una aplicación o programa.**. Por ejemplo en la suite de MS Office (Word, Excel, PowerPoint o Outlook), aunque no son exclusivas de Office para Windows, también están disponibles para otras aplicaciones de escritorio y en diferentes sistemas operativos como macOS.</span></span>

Los complementos son desarrollados por terceros o por el mismo proveedor del software (Microsoft en el caso de MS Office) que integran capacidades de inteligencia artificial para mejorar la funcionalidad y la experiencia del usuario.

Los complementos se integran directamente en las aplicaciones de oficina apareciendo como botones en la cinta de opciones o incluso como paneles adicionales dentro de la aplicación, posibilitando incrementar la productividad y la calidad del trabajo con funciones como:

- **Análisis de datos y predicciones:** En hojas de cálculo los complementos con IA pueden analizar patrones en los datos y ofrecer predicciones o sugerencias. Pueden ayudar a identificar tendencias, realizar pronósticos y proporcionar información valiosa basada en el análisis de grandes conjuntos de datos.

- **Asistencia en la redacción**. En procesadores de texto, ofrecen correcciones gramaticales, sugerencias de estilo y recomendaciones para mejorar la claridad y la coherencia del texto.

- **Traducción automática**. Herramientas que permiten traducir textos completos o seleccionados a diferentes idiomas directamente dentro del documento.

- **Reconocimiento de imágenes.** Algunos complementos pueden extraer información de imágenes o gráficos y convertirla en texto o datos editables.

- **Automatización de tareas**. En aplicaciones de correo ayudan a automatizar procesos repetitivos, ahorrando tiempo y reduciendo la posibilidad de errores humanos.

- **Accesibilidad**. Ofrecen herramientas para hacer los documentos más accesibles, como lectura en voz alta, descripciones de imágenes y más.

- **Colaboración mejorada**. Facilitan la colaboración en tiempo real, permitiendo a los usuarios trabajar juntos en documentos y hojas de cálculo de manera más efectiva.

- **Personalización y aprendizaje.** Se adaptan al uso y preferencias del usuario, aprendiendo de sus patrones para ofrecer recomendaciones y atajos personalizados

![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/keaimage.png)

Imagen propia. Generada por Dall-E 3 en ChatGPT.

Los complementos para aplicaciones pueden generalmente encontrarse e instalarse directamente desde el propio programa en la sección de “Complementos” o “Add-ins”. Es importante descargar complementos solo de fuentes confiables para evitar software malicioso.

<span style="color: rgb(53, 152, 219);"><span style="color: rgb(0, 0, 0);"><span style="color: rgb(53, 152, 219);"><span style="color: rgb(0, 0, 0);">Al igual que con los plugins y las extensiones, las posibilidades son muy amplias y es interesante hacer un rastreo entre todas las opciones posibles para encontrar aquellos complementos que nos aporten funcionalidades añadidas, incrementando nuestra productividad,</span></span></span></span>

Es importante tener en cuenta, que las tres alternativas están en un momento de expansión en cuanto a oferta y que podemos encontrar múltiples opciones para cada necesidad. Como en cualquier producto o servicio, los habrá mejores y peores, distintas ofertas gratuitas y de pago, lo cual no implica necesariamente unas mayores prestaciones. Será labor de cada uno informarse y probar distintas alternativas hasta dar con las herramientas que realmente nos aporten lo que estamos buscando. Además es importante descargar y utilizar solo herramientas de fuentes confiables para evitar software malicioso.

# Unidad 4.2. Ampliando el chat. Hablar con tus datos y generación aumentada

> Con el avance de la tecnología de la realidad virtual, pronto llegaremos a un punto donde no podremos distinguir entre lo que es real y lo que es un juego
> 
> **Elon Musk**, CEO de SpaceX y Tesla y cofundador de OpenAI

### <span style="color: rgb(34, 34, 34); font-family: var(--font-heading, var(--font-body)); font-size: 1.666em; font-weight: 400;">Introducción</span>  


La inteligencia artificial y, en particular, los modelos de procesamiento del lenguaje natural (PLN), han experimentado avances significativos en estos dos últimos años, avances que se traducen en un crecimiento exponencial de aplicaciones en todos los ámbitos y sectores empresariales, gubernamentales y de cualquier entidad u organización.

Modelos de lenguaje, como GPT, BERT, Llama y otros, han demostrado ser extremadamente potentes para comprender y generar texto en lenguaje natural proporcionando mecanismos para facilitar y automatizar la gestión de la información y del conocimiento. Sin embargo, para aprovechar al máximo su potencial, a menudo es necesario personalizarlos y adaptarlos a conjuntos de datos específicos o a dominios particulares. No hay que olvidar que estos modelos se entrenan con datos de fuentes diversas como Wikipedia pero que no están actualizados por lo que en muchas ocasiones deben tener la posibilidad navegar en internet para accder a contenidos más específicos o actuales. No solo eso sino que hay información poco o nada accesible que los modelos desconocen.

En la siguiente tabla podemos apreciar el coste, tanto en tiempo como en dinero del entrenamiento de los modelos de lenguaje más utilizados

<table border="1" id="bkmrk-modelo-de-lenguaje-e" style="border-collapse: collapse; width: 100%;"><colgroup><col style="width: 10.0099%;"></col><col style="width: 10.0099%;"></col><col style="width: 20.0198%;"></col><col style="width: 20.0198%;"></col><col style="width: 20.0198%;"></col><col style="width: 20.0198%;"></col></colgroup><tbody><tr><th>**Modelo de Lenguaje**</th><th>**Empresa**</th><th>**Año de Creación**</th><th>**Estimación de Tiempo de Entrenamiento**</th><th>**Estimación de Costo de Entrenamiento**</th><th>**Código Abierto**</th></tr><tr><td>GPT-3</td><td>OpenAI</td><td>2020</td><td>Varios meses</td><td>Millones de dólares</td><td>No</td></tr><tr><td>BERT</td><td>Google</td><td>2018</td><td>Semanas a meses</td><td>Cientos de miles a millones de dólares</td><td>Sí</td></tr><tr><td>T5</td><td>Google</td><td>2020</td><td>Meses</td><td>Millones de dólares</td><td>Sí</td></tr><tr><td>GPT-4</td><td>OpenAI</td><td>2023</td><td>Meses</td><td>Decenas de millones de dólares</td><td>No</td></tr><tr><td>GPT-2</td><td>OpenAI</td><td>2019</td><td>Semanas a meses</td><td>Cientos de miles a millones de dólares</td><td>Sí</td></tr><tr><td>Transformer</td><td>Google</td><td>2017</td><td>Semanas</td><td>Decenas a cientos de miles de dólares</td><td>Sí</td></tr><tr><td>XLNet</td><td>Google/CMU</td><td>2019</td><td>Semanas a meses</td><td>Cientos de miles a millones de dólares</td><td>Sí</td></tr><tr><td>AlphaFold</td><td>DeepMind</td><td>2020</td><td>Meses</td><td>Millones de dólares</td><td>Sí</td></tr><tr><td>MuZero</td><td>DeepMind</td><td>2020</td><td>Meses</td><td>Millones de dólares</td><td>No</td></tr><tr><td>LLaMA</td><td>Meta</td><td>2023</td><td>No disponible</td><td>No disponible</td><td>Sí</td></tr></tbody></table>

> Es importante tener en cuenta que la disponibilidad de los modelos como código abierto varía significativamente. Algunos modelos, especialmente los más avanzados como GPT-3 y GPT-4 de OpenAI, no son de código abierto, aunque OpenAI ofrece acceso a través de su API. Por otro lado, muchos modelos desarrollados por Google y otros investigadores académicos suelen ser de código abierto para fomentar la investigación y el desarrollo en la comunidad científica. La información sobre el tiempo y el costo de entrenamiento del modelo LLaMA de Meta no está claramente disponible, ya que la compañía no ha divulgado estos detalles.

Dados los costes inasumibles se requieren métodos de actualización de dichos modelos, métodos que no deben pasar por el re-entrenamiento que es absolutamente inasumible por pequeñas empresas o usuarios individuales.

Para ello existen diversas estrategias o como suele decirse 'workarounds' que están implantándose con rapidez en todos los chatbots actuales.

**¿Por qué Personalizar?**

La personalización de un modelo de lenguaje es crucial cuando trabajamos con datos específicos de un dominio particular o cuando queremos que el modelo realice tareas muy concretas. Los modelos de lenguaje preentrenados son generalistas; han sido entrenados en grandes cantidades de texto de internet, lo que los hace versátiles, pero no necesariamente expertos en áreas específicas. Personalizar estos modelos con nuestros propios datos nos permite ajustarlos para que se alineen mejor con nuestras necesidades particulares, mejorando así su rendimiento y relevancia.

#### Transfer-Learning: Hablando con tus Datos

Una de las técnicas más comunes para personalizar modelos de lenguaje es el llamado Transfer-Learning o transferencia de conocimiento.

Este proceso implica tomar un modelo preentrenado y continuar su entrenamiento en un conjunto de datos de un dominio específico, evitando del coste de entranar el modelo de nuevo.

El "transfer learning" o aprendizaje por transferencia, es una técnica en el campo de la inteligencia artificial y el aprendizaje automático. Para entenderlo mejor, podemos usar el símil de un chef aprendiendo a cocinar un nuevo tipo de cocina.

Imagina que un chef ya es experto en cocina italiana. Sabe cómo preparar una variedad de platos italianos y entiende los principios básicos de esta cocina. Ahora, si quiere aprender a cocinar comida japonesa, no necesita empezar desde cero. Puede aprovechar muchas de las habilidades y conocimientos que ya posee, como técnicas de corte, manejo de ingredientes frescos y presentación de platos. Este chef solo necesita aprender las diferencias específicas de la cocina japonesa, como trabajar con ingredientes típicos de Japón o técnicas de cocción únicas para esa cocina.

De manera similar, en el aprendizaje por transferencia, un modelo de IA que ha sido entrenado en una tarea (como reconocer objetos en imágenes) puede reutilizar su conocimiento previo para aprender una nueva tarea relacionada más rápidamente y con menos datos. Por ejemplo, si un modelo se ha entrenado para reconocer automóviles en imágenes, y luego se desea entrenar para reconocer motocicletas, no tiene que aprender desde cero. Puede adaptar lo que ya sabe sobre vehículos y características visuales para aprender la nueva tarea con más eficacia.

Esta técnica, que coloquialmente se suele denominar 'habla con tus datos' ha sido una de las principales derviaciones de la IA tectual al permitir a las organizaciones hablar y procesar información propia de manera muchos más intelegiente y específica.

Hasta hace poco este proceso se hacía mediante programación. Hoy en día, herramientas como chatGPT ya permiten la generación de modelos personalizados para campos específicos.

Por ejempo puedo crear un chatBot personalizado y especialista en el campo de la historia medieval y compartirlo con mis alumnos, o centrar mi chatBot en la programación de videojuegos.

En el proceso de creación de estos chats puedo agregar prompts específicos, urls, bases de datos propias e incluso documentos en pdf, vídeos y audios.

Este proceso hace sólo unos meses era muy complejo y requería conocimientos de programación, sin embargo actualmente ya hay herramientas que lo facilitan enormemente, por supuesto también en chatGPT como podemos apreciar en este vídeo dónde el propio SAm Altman (cofundador de chatGPT) desarrolla un sencillo ejemplo de uso de creación de un chatGPT presonalizado:

### <iframe allowfullscreen="allowfullscreen" height="314" src="https://www.youtube.com/embed/q1dcs0biFWU" width="560"></iframe>


***Vídeo en el que Sam Altman demuestra la nueva funcionalidad de chatGPT para contruir chatBots personalizados***

En la siguiente tabla indicamos algunas de las principales herramientas para ello

<table border="1" id="bkmrk-herramienta-tipo-de-" style="border-collapse: collapse; width: 100%;"><colgroup><col style="width: 24.9629%;"></col><col style="width: 24.9629%;"></col><col style="width: 24.9629%;"></col><col style="width: 24.9629%;"></col></colgroup><tbody><tr><th><span style="background-color: rgb(206, 212, 217);">**Herramienta**</span></th><th><span style="background-color: rgb(206, 212, 217);">**Tipo de Datos**</span></th><th><span style="background-color: rgb(206, 212, 217);">**Descripción**</span></th><th><span style="background-color: rgb(206, 212, 217);">**Características Clave**</span></th></tr><tr><td>ChatGPT</td><td>Texto</td><td>Interfaz de chat para interactuar con grandes cantidades de texto, generando respuestas y análisis.</td><td>Procesamiento de lenguaje natural, generación de texto.</td></tr><tr><td>ChatDoc</td><td>Documentos de texto</td><td>Herramienta diseñada para analizar y extraer información relevante de documentos de texto.</td><td>Extracción de texto, análisis de contenido de documentos.</td></tr><tr><td>ChatPDF</td><td>Documentos PDF</td><td>Especializada en extraer y analizar información de documentos PDF.</td><td>Extracción de texto, análisis de contenido de PDF.</td></tr><tr><td>PageChat</td><td>Páginas web</td><td>Permite interactuar con el contenido de páginas web para extraer y analizar información relevante.</td><td>Extracción y análisis de contenido web, fácil de usar.</td></tr><tr><td>Chatbase</td><td>Bases de datos</td><td>Herramienta de análisis y consulta de bases de datos mediante una interfaz de chat.</td><td>Interfaz de chat para SQL, análisis de datos.</td></tr><tr><td>Dante AI</td><td>Análisis de texto avanzado</td><td>Herramienta para analizar y obtener insights de grandes volúmenes de texto.</td><td>Análisis de texto profundo, aprendizaje automático.</td></tr><tr><td>Tableau</td><td>Datos visuales</td><td>Visualización de datos para crear y compartir cuadros de mando y gráficos interactivos.</td><td>Visualizaciones interactivas, integración de datos.</td></tr><tr><td>Power BI</td><td>Datos de negocios</td><td>Herramienta de Microsoft para visualizar datos y compartir insights a través de la organización.</td><td>Análisis de datos, informes interactivos.</td></tr><tr><td>Google Data Studio</td><td>Datos web y marketing</td><td>Convierte datos en informes y cuadros de mando personalizables e informativos.</td><td>Integración con Google Analytics, fácil de usar.</td></tr><tr><td>Domo</td><td>Datos empresariales</td><td>Combina herramientas para la integración, visualización y colaboración en datos.</td><td>Visualización de datos, colaboración en tiempo real.</td></tr></tbody></table>

#### Aumento de Datos o RAG

El aumento de datos es otra estrategia clave para mejorar el rendimiento de los modelos de lenguaje en conjuntos de datos específicos. Consiste en generar variaciones de los datos de entrenamiento para crear un conjunto de datos más amplio y diverso. Esto puede incluir técnicas como la paráfrasis, la traducción a otros idiomas y la vuelta al idioma original, y la manipulación sintáctica.

"Retrieval Augmented Generation" (RAG), que traducido sería "Generación Aumentada por Recuperación", es una técnica en el procesamiento del lenguaje natural que combina la recuperación de información relevante con la generación de texto. Es una metodología avanzada usada en modelos de inteligencia artificial para mejorar la generación de respuestas más informadas y precisas. Aquí te explico con más detalle:

##### Componentes de RAG

1. **Recuperación de Información**:
    
    
    - En la fase de recuperación, el modelo busca en una gran base de datos o repositorio de documentos para encontrar fragmentos de texto que sean relevantes para la pregunta o el prompt dado.
    - Este repositorio puede incluir una amplia gama de documentos, como artículos de Wikipedia, publicaciones de blogs, libros, etc.
2. **Generación de Respuestas**:
    
    
    - Utilizando los fragmentos de texto recuperados, el modelo de lenguaje luego genera una respuesta.
    - Esta generación no es una simple repetición de los fragmentos recuperados, sino que el modelo los utiliza como contexto para construir una respuesta coherente y contextualizada.

##### Funcionamiento de RAG

- **Integración de Recuperación y Generación**:
    
    
    - RAG efectivamente integra dos componentes principales de la inteligencia artificial: un sistema de recuperación de documentos (como un motor de búsqueda) y un modelo de generación de texto (como GPT-3).
    - Cuando se formula una pregunta, primero activa su componente de recuperación para encontrar la información relevante. Luego, el modelo de generación utiliza esta información para formular una respuesta informada.
- **Mejora de la Calidad de las Respuestas**:
    
    
    - Al basar sus respuestas en información específica y relevante recuperada, RAG puede proporcionar respuestas más precisas, detalladas y contextualizadas.
    - Esto es particularmente útil para preguntas que requieren conocimiento especializado o actualizado.

##### Aplicaciones de RAG

- **Asistentes Virtuales y Chatbots**: Mejorando la precisión y relevancia de las respuestas en aplicaciones de conversación.
- **Herramientas de Búsqueda y Análisis de Datos**: Proporcionando respuestas más detalladas y contextualizadas a consultas de búsqueda.
- **Educación y Aprendizaje Automático**: Como una herramienta para generar explicaciones educativas o para responder preguntas de estudio.

##### Ventajas de RAG

- **Respuestas Basadas en Evidencia**: Al usar documentos y datos reales como base para las respuestas, RAG ofrece una forma de generar respuestas que están respaldadas por evidencia concreta.
- **Adaptabilidad**: Puede adaptarse a una amplia gama de temas y preguntas, gracias a su capacidad para buscar y utilizar información de numerosas fuentes.

##### Desafíos de RAG

- **Dependencia de la Calidad de los Datos**: La efectividad de RAG depende en gran medida de la calidad y actualidad de la base de datos que utiliza para la recuperación de información.
- **Complejidad y Recursos**: Implementar un sistema RAG efectivo puede ser complejo y requerir recursos computacionales significativos.
- La técnica de "Retrieval Augmented Generation" (RAG) se centra principalmente en el procesamiento del lenguaje natural y la generación de texto. Sin embargo, el concepto subyacente de combinar la recuperación de información con la generación o transformación de contenido puede, en teoría, ser aplicado en el campo de la imagen y el video, aunque con diferentes técnicas y tecnologías. En el contexto de imágenes y videos, el proceso sería diferente y se basaría en técnicas de visión por computadora y aprendizaje profundo. Aquí hay un par de aplicaciones hipotéticas en estos campos:
    
    ##### Aplicaciones en Imágenes
    
    <div class="flex-1 overflow-hidden"><div class="react-scroll-to-bottom--css-vreni-79elbk h-full"><div class="react-scroll-to-bottom--css-vreni-1n7m0yu"><div class="flex flex-col pb-9 text-sm"><div class="w-full text-token-text-primary" data-testid="conversation-turn-15"><div class="px-4 py-2 justify-center text-base md:gap-6 m-auto"><div class="flex flex-1 text-base mx-auto gap-3 md:px-5 lg:px-1 xl:px-5 md:max-w-3xl lg:max-w-[40rem] xl:max-w-[48rem] } group final-completion"><div class="relative flex w-full flex-col lg:w-[calc(100%-115px)] agent-turn"><div class="flex-col gap-1 md:gap-3"><div class="flex flex-grow flex-col max-w-full"><div class="min-h-[20px] text-message flex flex-col items-start gap-3 whitespace-pre-wrap break-words [.text-message+&]:mt-5 overflow-x-auto" data-message-author-role="assistant" data-message-id="5f8187b0-eb53-4b49-9a46-79f5dc6af9ea"><div class="markdown prose w-full break-words dark:prose-invert light">
    1. **Recuperación y Mejora de Imágenes**:
        
        
        - Un sistema podría buscar en una base de datos imágenes similares a una dada y utilizar esa información para mejorar o editar la imagen original (por ejemplo, mejorar la resolución, corregir colores, etc.).
        - Por ejemplo, si se tiene una imagen borrosa, el sistema podría buscar imágenes claras y nítidas con características similares y utilizarlas como referencia para mejorar la calidad de la imagen original.
    2. **Generación de Contenido Basado en Imágenes Existentes**:
        
        
        - Un modelo podría generar nuevas imágenes o modificar las existentes basándose en características y estilos de imágenes recuperadas de una base de datos amplia. Esto sería útil en diseño gráfico, publicidad, y arte digital.
    
    </div></div></div></div></div></div></div></div></div></div></div></div>##### Aplicaciones en Videos
    
    <div class="flex-1 overflow-hidden"><div class="react-scroll-to-bottom--css-vreni-79elbk h-full"><div class="react-scroll-to-bottom--css-vreni-1n7m0yu"><div class="flex flex-col pb-9 text-sm"><div class="w-full text-token-text-primary" data-testid="conversation-turn-15"><div class="px-4 py-2 justify-center text-base md:gap-6 m-auto"><div class="flex flex-1 text-base mx-auto gap-3 md:px-5 lg:px-1 xl:px-5 md:max-w-3xl lg:max-w-[40rem] xl:max-w-[48rem] } group final-completion"><div class="relative flex w-full flex-col lg:w-[calc(100%-115px)] agent-turn"><div class="flex-col gap-1 md:gap-3"><div class="flex flex-grow flex-col max-w-full"><div class="min-h-[20px] text-message flex flex-col items-start gap-3 whitespace-pre-wrap break-words [.text-message+&]:mt-5 overflow-x-auto" data-message-author-role="assistant" data-message-id="5f8187b0-eb53-4b49-9a46-79f5dc6af9ea"><div class="markdown prose w-full break-words dark:prose-invert light">
    1. **Mejora y Restauración de Videos**:
        
        
        - Similar a las imágenes, un sistema podría mejorar la calidad de un video (por ejemplo, resolución, claridad, estabilización) basándose en datos recuperados de videos de alta calidad.
    2. **Generación de Secuencias de Video**:
        
        
        - Crear nuevas secuencias de video o editar videos existentes basándose en características y estilos de otros videos. Esto podría aplicarse en la producción de películas, publicidad y realidad virtual.
    
    </div></div></div></div></div></div></div></div></div></div></div></div>##### Consideraciones Técnicas
    
    <div class="flex-1 overflow-hidden"><div class="react-scroll-to-bottom--css-vreni-79elbk h-full"><div class="react-scroll-to-bottom--css-vreni-1n7m0yu"><div class="flex flex-col pb-9 text-sm"><div class="w-full text-token-text-primary" data-testid="conversation-turn-15"><div class="px-4 py-2 justify-center text-base md:gap-6 m-auto"><div class="flex flex-1 text-base mx-auto gap-3 md:px-5 lg:px-1 xl:px-5 md:max-w-3xl lg:max-w-[40rem] xl:max-w-[48rem] } group final-completion"><div class="relative flex w-full flex-col lg:w-[calc(100%-115px)] agent-turn"><div class="flex-col gap-1 md:gap-3"><div class="flex flex-grow flex-col max-w-full"><div class="min-h-[20px] text-message flex flex-col items-start gap-3 whitespace-pre-wrap break-words [.text-message+&]:mt-5 overflow-x-auto" data-message-author-role="assistant" data-message-id="5f8187b0-eb53-4b49-9a46-79f5dc6af9ea"><div class="markdown prose w-full break-words dark:prose-invert light">
    - **Complejidad de Datos**: Los datos de imagen y video son significativamente más complejos que el texto, lo que requiere modelos más sofisticados y más recursos computacionales.
    - **Técnicas de Visión por Computadora**: La implementación de una técnica similar a RAG en imágenes y videos requeriría el uso de avanzadas técnicas de visión por computadora y redes neuronales convolucionales.
    - **Desafíos en la Recuperación**: La recuperación de información relevante y útil a partir de imágenes y videos es un desafío significativo debido a la variabilidad y riqueza de los datos visuales.
    
    </div></div></div></div></div></div></div></div></div></div></div></div>Aunque el concepto de RAG como tal es específico del procesamiento del lenguaje, sus principios fundamentales de combinar la recuperación con la generación o transformación pueden inspirar enfoques similares en otros campos como el de las imágenes y los videos. Sin embargo, estas aplicaciones requerirían un desarrollo tecnológico considerable y enfrentarían desafíos únicos inherentes a estos medios.
    
    <div class="w-full pt-2 md:pt-0 dark:border-white/20 md:border-transparent md:dark:border-transparent md:w-[calc(100%-.5rem)]"><form class="stretch mx-2 flex flex-row gap-3 last:mb-2 md:mx-4 md:last:mb-6 lg:mx-auto lg:max-w-2xl xl:max-w-3xl">RAG representa un paso adelante significativo en la creación de sistemas de IA más sofisticados y útiles, capaces de manejar preguntas complejas y proporcionar respuestas bien informadas y precisas.
    
     <iframe allowfullscreen="allowfullscreen" height="314" src="https://www.youtube.com/embed/T-D1OfcDW1M" width="560"></iframe>
    
    ***Vídeo introductorio del concepto de RAG***
    
    </form></div>

##### Consideraciones Éticas y de Sesgo

Al personalizar modelos de lenguaje, es importante tener en cuenta las consideraciones éticas y el potencial de sesgo en los datos. Los modelos aprenden de los datos en los que son entrenados, y si esos datos contienen sesgos, el modelo los replicará. Es crucial ser consciente de esto y tomar medidas para mitigar los sesgos tanto como sea posible.

#### Vectores de datos (embeddings)

Aunque ya hemos comentado este tipo de objetos en el módulo 2 sobre fundamentos, lo retomamos d enuevo ya que además de ser esencales en el entrenamiento de modelos también se usan para tareas típicas de NLP.

Los almacenes de datos que utilizan datos vectorizados están diseñados para mejorar el rendimiento de las consultas y operaciones analíticas en grandes conjuntos de datos. La vectorización es un método de procesamiento de datos en el que se operan vectores enteros de datos, en lugar de procesar un único elemento de datos a la vez. Esto se alinea con las capacidades de las CPU modernas que pueden realizar operaciones en vectores de datos simultáneamente, resultando en un rendimiento significativamente mejorado. A continuación, se describen algunos de los usos y beneficios de los almacenes de datos con datos vectorizados:

##### ¿Qué son los Word Embeddings?

Los word embeddings son, en esencia, una forma de convertir palabras en vectores numéricos. Imagina que cada palabra es una persona y cada persona tiene una lista de características que la describen. En el caso de los word embeddings, estas características son números. Este proceso permite que las computadoras trabajen con palabras y textos, realizando operaciones matemáticas sobre ellos.

##### ¿Cómo Funcionan?

Para entender cómo funcionan, podemos usar un símil: Imagina un mapa de una ciudad donde cada punto en el mapa representa una tienda. Las tiendas que venden productos similares están más cerca unas de otras. De manera similar, en el espacio de word embeddings, palabras con significados similares están "más cerca" unas de otras en términos numéricos. Por ejemplo, "gato" y "perro" estarían más cerca que "gato" y "avión".

##### Aplicaciones

1. **Búsqueda y Recomendación de Textos**: Ayudan a encontrar textos similares o relacionados.
2. **Análisis de Sentimientos**: Identifican la emoción o el sentimiento detrás de un texto.
3. **Traducción Automática**: Facilitan la traducción de un idioma a otro.
4. **Asistentes Virtuales y Chatbots**: Mejoran la comprensión del lenguaje humano.

##### Ventajas

- **Mejor Comprensión del Lenguaje**: Permiten a las máquinas entender mejor las sutilezas del lenguaje humano.
- **Versatilidad**: Son útiles en una amplia gama de aplicaciones de NLP.
- **Eficiencia**: Mejoran la eficiencia en el procesamiento de grandes volúmenes de texto.

##### Desafíos

- **Contexto Limitado**: Pueden no capturar completamente el contexto en el que se usa una palabra.
- **Sesgo en los Datos**: Pueden heredar y amplificar sesgos presentes en los datos con los que fueron entrenados.

Los word embeddings son una herramienta poderosa en el campo del NLP, proporcionando una manera para que las computadoras "entiendan" y trabajen con el lenguaje humano. Al convertir palabras en vectores numéricos, abren un mundo de posibilidades para el procesamiento y análisis de texto, aunque no están exentos de desafíos y limitaciones. Su uso continuará siendo fundamental en el desarrollo de tecnologías relacionadas con el lenguaje.

#### Conclusión final

En muchos casos, estas técnicas se utilizan juntas en aplicaciones de NLP. Por ejemplo, un modelo de lenguaje podría ser afinado para una tarea específica, y luego las representaciones vectoriales generadas por este modelo podrían ser almacenadas y consultadas utilizando un almacén de vectores de datos como Pinecone. Esto permite tanto la personalización del modelo (a través del fine-tuning) como la búsqueda eficiente y la similitud semántica (a través del almacén de vectores de datos).

El afinamiento (fine-tuning) y el uso de almacenes de vectores de datos son técnicas complementarias más que excluyentes, y cada una tiene su lugar en el procesamiento del lenguaje natural (NLP).

La personalización de modelos de lenguaje para adaptarlos a nuestros propios datos es un paso crucial para aprovechar al máximo el potencial de la inteligencia artificial en el procesamiento del lenguaje natural. Mediante técnicas como el "fine-tuning", la transferencia de conocimientos, el aumento de datos y la inyección de conocimiento, podemos ajustar los modelos para que se alineen mejor con nuestras necesidades específicas, mejorando así su rendimiento y relevancia en tareas concretas. Sin embargo, es importante abordar este proceso con un enfoque reflexivo y crítico, teniendo en cuenta las consideraciones éticas y los potenciales sesgos en los datos. Con un enfoque cuidadoso y metódico, podemos personalizar los modelos de lenguaje para desbloquear nuevas posibilidades y obtener insights valiosos de nuestros datos.

# Unidad 4.3. Nuevos paradigmas de chatbot.

> "Los agentes de inteligencia artificial no son solo programas en una computadora; tienen el potencial de ser compañeros inteligentes y colaboradores en nuestra búsqueda diaria de soluciones a problemas complejos."
> 
> **Ben Goertzel,** destacado científico en el campo de la inteligencia artificial (IA). Es conocido principalmente por su trabajo en áreas como la inteligencia artificial general (AGI), que se centra en la creación de máquinas con la capacidad de aprender y aplicar inteligencia de manera amplia y flexible, similar a cómo lo hacen los seres humanos.

### Introducción

A lo largo de nuestro viaje explorando el vasto universo de la Inteligencia Artificial, hemos profundizado en la comprensión y aplicación de la IA generativa, prestando especial atención a ChatGPT. Esta herramienta ha demostrado ser un valioso recurso para facilitar el proceso de enseñnza-aprendizaje, ofrecer apoyo personalizado a los estudiantes, ayudar a los docentes a generar material, entre otras cosas. Sin embargo, el campo de la IA está en constante evolución, y hoy nos embarcamos en un nuevo capítulo para descubrir herramientas innovadoras que prometen llevar la IA y a la IA aplicada a la educación a una dimensión distinta.

ChatGPT ha establecido un precedente importante en el campo de la IA conversacional, permitiendo interacciones fluidas y generación de texto coherente. No obstante, las necesidades cambiantes y los avances tecnológicos han dado lugar a la creación de herramientas especializadas que buscan mejorar y expandir las capacidades de ChatGPT. Aquí es donde AgentGPT, y AutoGPT entran en escena, cada uno con características únicas y aplicaciones específicas.

AutoGPT, AgentGPT son herramientas avanzadas basadas en modelos de lenguaje de gran tamaño. Se pueden agrupar dentro del mismo tipo de herramienta, específicamente, **agentes de IA autónomos** que **buscan reducir la cantidad de interacción humana necesaria para completar tareas específicas**, permitiendo que los sistemas de IA trabajen de manera más autónoma hacia un objetivo con mínima o ninguna entrada humana.

### Agentes de Inteligencia Artificial (AI)

Los agentes de inteligencia artificial representan un aspecto crucial y cada vez más prominente en el campo de la IA. Son sistemas o programas de software diseñados para realizar tareas específicas de manera autónoma, imitando algunas capacidades humanas como la percepción, el razonamiento, el aprendizaje y la toma de decisiones.

#### ¿Por Qué son Importantes?

1. **Automatización y Eficiencia**: Los agentes de IA pueden manejar tareas repetitivas o complejas, aumentando la eficiencia y permitiendo que los humanos se concentren en actividades más estratégicas o creativas.
2. **Personalización**: Pueden adaptarse a las necesidades y preferencias individuales de los usuarios, ofreciendo servicios y experiencias personalizadas.
3. **Capacidad de Aprendizaje**: Muchos agentes de IA están diseñados para aprender de la experiencia, mejorando su rendimiento y toma de decisiones con el tiempo.
4. **Interacción Natural**: Con el avance de la comprensión del lenguaje natural, estos agentes pueden interactuar con los usuarios de manera más fluida y humana.

#### Tipos de Agentes de IA

1. **Agentes Reactivos Simples**: Responden directamente a su entorno sin mantener un estado interno. Ejemplo: Un termostato inteligente.
2. **Agentes Basados en Modelos**: Tienen una representación interna del mundo que les rodea y pueden actuar en función de este modelo. Ejemplo: Sistemas de navegación autónoma.
3. **Agentes Basados en Objetivos**: Toman decisiones basándose en metas u objetivos establecidos. Ejemplo: Asistentes virtuales que programan reuniones.
4. **Agentes Basados en el Aprendizaje**: Capaces de aprender de sus interacciones y mejorar con el tiempo. Ejemplo: Sistemas de recomendación personalizada.

#### Ejemplos y Herramientas

- **Chatbots y Asistentes Virtuales**: Como Siri, Alexa y Google Assistant, que pueden responder preguntas y realizar tareas.
- **Sistemas de Recomendación**: Utilizados en plataformas de streaming como Netflix o Spotify para sugerir contenido.
- **Robots Autónomos**: Utilizados en manufactura, logística y exploración.

#### Desafíos y Consideraciones Futuras

- **Ética y Transparencia**: La toma de decisiones por parte de agentes de IA plantea cuestiones éticas, especialmente en contextos críticos como la salud y la justicia.
- **Interacción Humano-AI**: El diseño de interfaces y sistemas que permitan una colaboración efectiva entre humanos y agentes de IA.
- **Sesgo y Justicia**: Asegurar que los agentes de IA no perpetúen sesgos existentes y operen de manera justa.

Los agentes de inteligencia artificial son una parte integral y en expansión del campo de la IA. A medida que estas tecnologías continúan desarrollándose, su impacto en diversos sectores y aspectos de la vida cotidiana probablemente se ampliará, ofreciendo oportunidades emocionantes y también planteando desafíos significativos.

A continuación comentamos tres de ellos

#### AutoGPT

[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/m9Iimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-10/m9Iimage.png)

AutoGPT es un "agente de IA" que, dada una meta en lenguaje natural, intenta alcanzarla descomponiéndola en subtareas y utilizando internet y otras herramientas en un bucle automático.  
Es una aplicación de código abierto que interactúa con GPT-4 y GPT-3.5, lo que le permite **automatizar el proceso** de solicitud multi-paso que normalmente se requiere para operar un chatbot como ChatGPT.  
AutoGPT también aprende de su propio contenido generado para mejorar sus capacidades lingüísticas, descomponiendo los objetivos en tareas pequeñas para alcanzar el objetivo final.

AutoGPT tiene implicaciones de gran alcance. El diferenciador de otras herramientas de IA convencionales es el circuito de retroalimentación de AutoGPT que le permite planificar, aprender y mejorar.

Con ese enfoque, AutoGPT puede agilizar muchos procesos que requieren dedicación humana. Esto incluye escribir y depurar código, crear contenido, analizar datos y desarrollar planes de negocios. Las personas pueden utilizar el agente autónomo de IA para ayudar con la elaboración de material, la planificación y otras tareas.

Esa es la visión optimista. La otra cara de la historia es que AutoGPT se encuentra hoy en las primeras etapas de su desarrollo. Los resultados y las acciones tomadas por el agente de IA podrían ser potencialmente inexactos o contraproducentes.

AutoGPT también procesa información literalmente, lo que puede resultar problemático en escenarios de toma de decisiones.

**En la práctica** básicamente, hay que darle una instrucción concreta de un objetivo a AutoGPT y éste planeará y ejecutará los pasos necesarios para finalizar la tarea.

Simplemente se le da un nombre a la tarea, se le asigna una función (por ejemplo, asumir el papel de propietario de una nueva empresa emergente) y asígnele un máximo de cinco objetivos. Por ejemplo, podría utilizar AutoGPT para:

Desarrollar mensajes de chat para atraer a los clientes. Esto puede ayudar a aumentar las ventas, la satisfacción del cliente o las conversiones.

Agiliza y automatiza las tareas del día a día. AutoGPT puede administrar las respuestas de correo electrónico, las respuestas de atención al cliente o el contenido de las redes sociales por usted.

Integre AutoGPT con otras plataformas o herramientas tecnológicas para crear nuevas aplicaciones de procesamiento de lenguaje natural, como la creación de contenido.

Algunos lo comparan con un pasante que puede ayudar a su empresa con tareas simples en las que usted proporciona un objetivo final o una lista de objetivos, y AutoGPT hace el resto.

#### AgentGPT

AgentGPT es una plataforma de IA autónoma que permite a los usuarios crear y desplegar agentes de IA directamente en el navegador. Genera listas de tareas y luego las ejecuta iterativamente para completar las tareas del usuario.  
Es una tecnología basada en NLP que genera texto con una apariencia humana con precisión y fluidez, pudiendo participar en conversaciones, generación de contenido y asistencia para resolver problema.  
Se diferencia de AutoGPT en que **no tiene acceso a internet** para buscar información o ejecutar código, pero sigue un proceso iterativo para descomponer y resolver problemas basados en las solicitudes del usuario.

Estas herramientas representan una evolución en el mundo de la IA, buscando trabajar de manera autónoma para alcanzar objetivos definidos por el usuario con mínima intervención humana.

En el siguiente video vemos un ejemplo de uso de AgenGPT

<iframe allowfullscreen="allowfullscreen" height="314" src="https://www.youtube.com/embed/K6EbB1oSzXI" width="560"></iframe>

En este otro vídeo del famoso Dot CSV hay una buena explicación del uso de agentes con chatGPT

<iframe allowfullscreen="allowfullscreen" height="314" src="https://www.youtube.com/embed/hLYw06LYWIU" width="560"></iframe>

Y en este último enlace Mas información y utilización de AgentGPT: [https://agentgpt.reworkd.ai/es](https://agentgpt.reworkd.ai/es)

### Modelos Offline

Los modelos de inteligencia artificial (IA) offline se refieren a sistemas de IA que operan sin necesidad de estar conectados a internet. Estos modelos procesan y analizan datos localmente, en el dispositivo del usuario, en lugar de depender de servidores remotos. Aquí tienes un resumen de sus características y aplicaciones clave:

#### Características 

1. **Procesamiento Local**: Realizan todas las operaciones de procesamiento de datos directamente en el dispositivo del usuario, como un smartphone, una computadora o un dispositivo IoT.
2. **Privacidad Mejorada**: Al no transmitir datos a través de internet, reducen significativamente los riesgos de privacidad y seguridad de los datos.
3. **Funcionamiento Sin Conexión**: Pueden operar en áreas sin acceso a internet o en situaciones donde la conectividad es intermitente o no confiable.
4. **Respuesta Rápida**: Al procesar datos localmente, pueden ofrecer respuestas más rápidas sin la latencia asociada con la transmisión de datos a un servidor remoto y de vuelta.
5. **Menor Consumo de Ancho de Banda**: Al no necesitar enviar datos constantemente a un servidor, reducen el uso del ancho de banda de internet.

#### Aplicaciones

1. **Dispositivos Móviles**: Aplicaciones de reconocimiento de voz, como asistentes virtuales, que funcionan directamente en teléfonos móviles sin necesidad de una conexión a internet.
2. **Automóviles Autónomos**: Sistemas de conducción autónoma que procesan información de sensores y cámaras en tiempo real para tomar decisiones de conducción.
3. **Robótica**: Robots que operan en entornos remotos o aislados, como robots de exploración en áreas sin cobertura de red.
4. **Salud y Fitness**: Dispositivos de seguimiento de salud y fitness que procesan datos de actividad y salud directamente en el dispositivo.
5. **Seguridad y Vigilancia**: Sistemas de cámaras de seguridad que pueden analizar imágenes y detectar movimientos o actividades sospechosas sin necesidad de enviar datos a un servidor.

#### Desafíos y Limitaciones

- **Capacidad de Procesamiento**: Los dispositivos deben tener suficiente capacidad de procesamiento para manejar modelos de IA complejos.
- **Actualizaciones de Modelos**: La actualización de modelos offline puede ser más desafiante, ya que requiere la intervención del usuario o mecanismos de actualización automatizados.
- **Complejidad de Implementación**: Desarrollar y optimizar modelos de IA para funcionar eficientemente en un entorno offline puede ser técnicamente desafiante.

Los modelos de IA offline ofrecen ventajas significativas en términos de privacidad, seguridad y accesibilidad. Son especialmente útiles en aplicaciones donde la conectividad es limitada o donde la rapidez y privacidad de los datos son críticas. A medida que la tecnología avanza, es probable que veamos una mayor adopción y evolución de estos modelos en diversos campos.

A continuación indicamos algunas webs y plataformas para experimentar con modelos sin depender de internet

<table id="bkmrk-plataforma-sitio-web" style="width: 100%;"><thead><tr><th style="width: 12.8522%;">**Plataforma**</th><th style="width: 19.0278%;">**Sitio Web**</th><th style="width: 19.7759%;">**Descripción**</th><th style="width: 48.3193%;">**Características Clave**</th></tr></thead><tbody><tr><td style="width: 12.8522%;">GPT-4All</td><td style="width: 19.0278%;">[https://www.nomic.ai/gpt4all](https://www.nomic.ai/gpt4all)</td><td style="width: 19.7759%;">Permite ejecutar versiones de GPT de manera offline.</td><td style="width: 48.3193%;">- Fácil de usar.&lt;br&gt;- Orientado a usuarios sin experiencia técnica.</td></tr><tr><td style="width: 12.8522%;">OLLAMA</td><td style="width: 19.0278%;">[ollama.com](https://ollama.com/)</td><td style="width: 19.7759%;">Plataforma especializada en LLM para uso offline.</td><td style="width: 48.3193%;">- Enfoque en privacidad y seguridad de datos.&lt;br&gt;- Personalizable para diferentes aplicaciones.</td></tr><tr><td style="width: 12.8522%;">LangChain</td><td style="width: 19.0278%;">[langchain.com](https://langchain.com/)</td><td style="width: 19.7759%;">Herramientas y librerías para LLM, con soporte para offline.</td><td style="width: 48.3193%;">- Flexible y modular.&lt;br&gt;- Permite la integración con diferentes LLM.</td></tr><tr><td style="width: 12.8522%;">LLM Studio</td><td style="width: 19.0278%;">[https://lmstudio.ai/](https://lmstudio.ai/)</td><td style="width: 19.7759%;">Plataforma para desarrollar y desplegar LLM de manera offline.</td><td style="width: 48.3193%;">- Interfaz de usuario amigable.&lt;br&gt;- Soporta múltiples modelos de LLM.&lt;br&gt;- Ofrece herramientas para entrenamiento y personalización de modelos.</td></tr></tbody></table>

Estas herramientas y plataformas ofrecen una variedad de opciones para aquellos interesados en trabajar con modelos de lenguaje grandes de manera offline, proporcionando flexibilidad y accesibilidad en diferentes niveles de experiencia y necesidades.

# Unidad 4.4. Programación para incautos.

> "La inteligencia general artificial no es simplemente una nueva herramienta que está siendo añadida al conjunto humano de herramientas tecnológicas; es la herramienta que va a rehacer y rediseñar todas las demás herramientas."
> 
> *Esta cita de Ben Goertzel refleja su visión sobre el potencial transformador de la inteligencia general artificial (AGI), sugiriendo que su desarrollo no solo aportará una nueva tecnología, sino que también cambiará fundamentalmente la forma en que interactuamos y mejoramos todas las tecnologías existentes.*

[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-11/scaled-1680-/yRkimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-11/yRkimage.png)

### Introducción

Aunque no es un curso orientado a programadores hemos considerado interesante añadir esta sección con la única intenciaón de exponer las posibilidades adicionales que ofrecce la IA pra todo aquel que tenga interés o conozca los conceptos básicos de la programación. Probablemente sea el caso de profesores o maestros de ciencias, tecnología etc... Pero también para el resto pues forma parte de la cultura de la IA y como mínimo da una perspecita adicional de la misma.

No hablamos de programar con ayuda de la IA, algo que hacen casi perfectamente los distintos chatbots que hemos visto, sino de usar código para programar y entrenar nuestros propios modelos u otros modelos puestos a disposición del público (llamados modelos Open Source o de código libre).

Las posibilidades son inmensas ya que hay cada vez más modelos y entornos disponibles de manera gratuita así como recursos didácticos y documentación.

La sección se divide en tres partes, una para quién quiera introducirse en programación con herramientas y recursos disponibles, la segunda habla sobre los distintos entornos para programar con IA y modelos de lenguaje y una última en la que mostramos herramientas de creación de aplicaciones sin usar código.

Obviamente las dos primeras son sólamente para aquellos intresados en introducirse o conocer herramientas de programación por lo que las consideramos 'voluntarias' dentro del curso.

### Introducción a python

Aunque otros muchos lenguajes, en un gran porcentaje todo lo que se hace y se está haciendo en la actualidad vinculado a la IA y a la llamada ciencia de datos se desarrolla en python. Por ello centraremos esta sección en este lenguaje cada vez más popular.

Para iniciarse en Python, hay una amplia gama de recursos y tutoriales disponibles en línea que pueden ayudar a aprender este lenguaje de programación de manera efectiva. Aquí hay algunas recomendaciones:

#### Python.org  


El sitio web oficial de Python ofrece una sección para principiantes donde puedes encontrar una lista de editores de texto e IDEs recomendados para trabajar con Python, así como libros introductorios y ejemplos de código【27†(Python.org)】.

#### W3Schools

W3Schools proporciona un tutorial interactivo donde puedes aprender Python a través de ejemplos. Este sitio permite editar el código y ver los resultados en tiempo real, lo cual es una forma práctica de aprender.

#### DigitalOcean

Ofrece una serie de tutoriales para principiantes en Python. Estos tutoriales exploran el mundo de Python, lo que puede ser una forma útil de obtener una comprensión práctica del lenguaje

#### FreeCodeCamp

En FreeCodeCamp, hay una lista de 15 cursos gratuitos de Python para principiantes. Entre estos, se incluye un curso completo para principiantes, así como otros recursos como el "Python Handbook" por Flavio Copes.

#### Microsoft Learn

Microsoft también ofrece un tutorial en español para principiantes en Python, donde podrás descubrir los conceptos básicos de Python, incluyendo el uso de Jupyter Notebook, creación de programas y proyectos, y trabajar con diferentes tipos de datos y estructuras de control en Python.

Estos recursos cubren una variedad de aspectos de Python, incluyendo la sintaxis básica, estructuras de datos, y aplicaciones prácticas del lenguaje. Se proporcionan tanto explicaciones textuales como ejemplos de código interactivos para ayudar a solidificar tu comprensión del material. También es recomendable explorar diferentes plataformas y seleccionar la que mejor se adapte a tu estilo de aprendizaje y necesidades.

### Entornos de desarrollo y plataformas

Para la programación y manipulación de modelos de datos, existen varios entornos y herramientas que pueden ser adecuadas dependiendo de tus necesidades y preferencias. A continuación se presentan algunas opciones populares:

#### Jupyter Notebook

Este es un entorno interactivo que permite la ejecución de código, visualización de datos y documentación todo en uno. Es ampliamente utilizado por científicos de datos y analistas.

#### RStudio

Es un entorno de desarrollo integrado (IDE) para el lenguaje de programación R, que es muy utilizado para la estadística y la visualización de datos.

#### PyCharm

Este es un IDE para Python, que es un lenguaje de programación muy popular en el ámbito de la ciencia de datos. PyCharm proporciona muchas herramientas y características que facilitan la programación de modelos de datos.

#### Visual Studio Code (VS Code)

Este es un editor de código fuente gratuito y de código abierto que es extensible y personalizable. Con las extensiones adecuadas, puede ser una herramienta poderosa para trabajar con datos.

#### SQL Server Management Studio (SSMS)

Si estás trabajando con bases de datos SQL Server, SSMS es un entorno robusto para la gestión y programación de modelos de datos.

#### DataGrip

Es un IDE de JetBrains para bases de datos y SQL. Permite la conexión a múltiples bases de datos, exploración de datos, y muchas otras funciones útiles para trabajar con modelos de datos.

#### Google Colab

Es un entorno de notebook en la nube que permite la ejecución de código en servidores de Google, lo cual puede ser útil para la manipulación y análisis de grandes conjuntos de datos.

#### Databricks

Plataforma basada en la nube que integra un entorno de notebook con capacidades de ejecución distribuida, lo cual es útil para trabajar con grandes conjuntos de datos y modelos complejos.

#### Tableau

Si bien no es un entorno de programación per se, Tableau es una herramienta poderosa para la visualización y exploración de datos.

#### MATLAB

Es un entorno para la programación matemática y la manipulación de datos, especialmente útil en el ámbito académico y de investigación.

La elección entre estos entornos dependerá de tus necesidades específicas, la complejidad de tus modelos de datos, y tu familiaridad con los lenguajes de programación y las herramientas mencionadas. También puede ser útil considerar la comunidad y el soporte disponible para cada entorno, así como su integración con otras herramientas y plataformas que puedas estar utilizando.

### Creación aplicaciones de IA

A continuación presentamos las herramientas y entornos más importantes relacionadas con la creación y desarrollo de aplicaciones basadas en IA y en el uso de modelos.

#### HuggingFace

Hugging Face es una empresa conocida por su trabajo en el campo del procesamiento del lenguaje natural (PLN) y el aprendizaje profundo. A continuación, se presentan algunas áreas clave en las que Hugging Face es relevante en el contexto de la programación y gestión de modelos de datos:

##### Biblioteca Transformers

Hugging Face es famoso por su biblioteca Transformers, que proporciona implementaciones de muchos modelos de lenguaje populares como BERT, GPT-2, T5, y otros. Esta biblioteca facilita el entrenamiento, la evaluación y el uso de estos modelos para diversas tareas de PLN.

##### Model Hub

Hugging Face también ofrece una plataforma conocida como Model Hub, donde los investigadores y desarrolladores pueden compartir y acceder a modelos preentrenados. Esto facilita la reutilización de modelos y acelera el desarrollo de aplicaciones de PLN.

##### Datasets Library

Además, Hugging Face proporciona una biblioteca de conjuntos de datos que facilita el acceso a una amplia variedad de conjuntos de datos para entrenamiento y evaluación de modelos.

##### Tokenizers Library

La biblioteca de tokenizadores de Hugging Face proporciona herramientas para convertir texto en tokens, un paso esencial en el procesamiento del lenguaje natural.

##### Servicios en la Nube

Hugging Face también ofrece servicios en la nube para entrenar y alojar modelos de lenguaje, proporcionando una plataforma para gestionar el ciclo de vida de los modelos de PLN.

##### Colaboraciones y Comunidad

Hugging Face colabora con muchas otras organizaciones y comunidades en el campo del aprendizaje profundo y PLN, contribuyendo a la innovación y el avance en estas áreas.

En resumen, Hugging Face proporciona herramientas y plataformas que facilitan la gestión y programación de modelos de datos, especialmente en el ámbito del procesamiento del lenguaje natural. Su biblioteca Transformers, junto con el Model Hub y otras herramientas, proporcionan un ecosistema robusto para trabajar con modelos de lenguaje y datos relacionados con el texto.

#### Langchain

LangChain es una plataforma diseñada para facilitar la interacción con modelos de lenguaje grandes (Large Language Models o LLMs) y la integración de estos modelos en aplicaciones y pipelines de datos. A continuación se presentan algunas características clave y capacidades de LangChain:

##### Integración con LLMs

*LangChain ([https://www.langchain.com/](https://www.langchain.com/))* proporciona una interfaz estándar que facilita la interacción con una variedad de LLMs de diferentes proveedores como *OpenAI, Cohere, Bloom, Huggingface*, entre otros.

*LangChain* ofrece una manera estructurada y modular de trabajar con LLMs y aprovechar sus capacidades en una variedad de aplicaciones y escenarios. Esto lo convierte en una herramienta valiosa para los ingenieros de datos y desarrolladores que buscan integrar modelos de lenguaje en sus proyectos.

##### Documentación

Cómo siempre lo mejor es empezar por la documentación, perfectamente descrita en este enlace

[https://docs.langchain.com/docs/](https://docs.langchain.com/docs/)

##### Construcción de Prompts y Gestión de Conversaciones:  


Ofrece herramientas para simplificar la creación y gestión de prompts, así como módulos de memoria para gestionar y alterar conversaciones pasadas, lo que es crucial para chatbots【13†(DEV Community)】.

##### Chaining o Encadenamiento de Modelos

Una característica única de LangChain es su capacidad para crear Chains (cadenas) que son enlaces lógicos entre uno o más LLMs, permitiendo crear aplicaciones más complejas al encadenar diferentes componentes【6†(EcoAGI)】【8†(Pinecone)】.

##### Agentes Inteligentes e Indexación

Equipa a los agentes con un conjunto de herramientas integral y proporciona métodos para organizar documentos de manera que faciliten la interacción efectiva con los LLMs【13†(DEV Community)】.

##### Aplicaciones Variadas

*LangChain* se puede utilizar para una amplia gama de aplicaciones como chatbots, sistemas de preguntas y respuestas generativas, resumen de texto y mucho más, proporcionando un marco para incluir IA de LLMs en pipelines de datos y aplicaciones.

##### Procesamiento de Datos

Descompone grandes cantidades de datos en trozos o *chunks* más manejables, los cuales pueden ser fácilmente incrustados en un vector store. Al recibir un *prompt*, LangChain consulta el Vector Store para obtener información relevante y luego alimenta esta información al LLM para generar o completar la respuesta.

##### Generación interfaces 

streamlit: Creación de aplicaciones basado en *python*, se suele usar en entornos de *LangChain* para generar aplicaciones.

[https://streamlit.io/](https://streamlit.io/)

#### Cohere

Cohere es una plataforma de inteligencia artificial que se especializa en el procesamiento del lenguaje natural (NLP, por sus siglas en inglés). Esta plataforma ofrece herramientas de IA avanzadas que permiten a los usuarios y desarrolladores comprender, generar y manipular el lenguaje humano de manera eficiente y efectiva. Algunos aspectos clave de Cohere son:

##### Modelos de Lenguaje Avanzados

Cohere utiliza modelos de lenguaje de última generación, similares a los de OpenAI, para ofrecer capacidades de comprensión y generación de texto.

##### Aplicaciones Versátiles

Los servicios de Cohere se pueden aplicar en una variedad de casos de uso, como la automatización de respuestas a clientes, la generación de contenido, la traducción automática, la síntesis de información y la moderación de contenido.

##### Programación de modelos de chat

Lo que significa que se puede utilizar para desarrollar y mejorar aplicaciones de chatbot o sistemas de conversación automatizados. Esta capacidad es particularmente valiosa en áreas como el servicio al cliente, donde los chatbots pueden manejar consultas de manera eficiente y efectiva, proporcionando respuestas en tiempo real y facilitando interacciones fluidas basadas en el lenguaje natural.

##### APIs Accesibles

La plataforma proporciona APIs (interfaces de programación de aplicaciones) que facilitan la integración de sus capacidades de IA en diversas aplicaciones y sistemas existentes.

##### Enfoque en la Usabilidad

Cohere está diseñada para ser accesible tanto para desarrolladores experimentados en IA como para aquellos que tienen menos experiencia técnica, con el objetivo de democratizar el acceso a la tecnología de procesamiento de lenguaje natural.

##### Compromiso con la Ética y la Seguridad

La plataforma también pone énfasis en los aspectos éticos y de seguridad del uso de IA, buscando garantizar que sus herramientas se utilicen de manera responsable.

En resumen, Cohere se posiciona como una plataforma potente y flexible en el campo del procesamiento del lenguaje natural, ofreciendo a desarrolladores y empresas herramientas avanzadas para interactuar y trabajar con el lenguaje humano a través de la IA.

[https://cohere.com/](https://cohere.com/)

### Aplicaciones sin código

Construir aplicaciones con inteligencia artificial (IA) ha sido históricamente una tarea compleja que requiere un conocimiento profundo de algoritmos, estadísticas, y programación. Sin embargo, la aparición de plataformas y herramientas "low-code" o "no-code" ha simplificado significativamente este proceso, permitiendo incluso a los usuarios sin experiencia técnica integrar capacidades de IA en sus aplicaciones. Aquí hay algunas herramientas y plataformas que facilitan la construcción de apps con IA:

**Microsoft Power Apps**

Con la integración de Microsoft AI Builder, los usuarios pueden añadir inteligencia artificial a sus aplicaciones sin escribir código. Esto incluye capacidades como procesamiento de formularios, predicción, clasificación de objetos en imágenes, y más.

**Google AppSheet**

AppSheet permite a los usuarios crear aplicaciones móviles y web con funciones de IA como reconocimiento de imágenes, procesamiento del lenguaje natural y modelado predictivo, todo sin necesidad de programar.

**OutSystems**

Ofrece una plataforma de desarrollo low-code con capacidades de IA, permitiendo a los usuarios integrar servicios de IA y machine learning en sus aplicaciones.

**Mendix**

Esta plataforma low-code proporciona herramientas para construir aplicaciones inteligentes, integrando servicios de IA y machine learning para mejorar la experiencia del usuario y la eficiencia operativa.

**Adalo**

Aunque Adalo se centra principalmente en la creación de aplicaciones móviles sin código, los usuarios pueden integrar funcionalidades de IA a través de APIs externas para añadir capacidades avanzadas a sus aplicaciones.

**Bubble**

Bubble permite a los usuarios construir aplicaciones web sin código y puede integrarse con herramientas de IA mediante el uso de APIs, proporcionando funcionalidades como chatbots, análisis de texto, y más.

**Thunkable**

Thunkable ofrece la capacidad de crear aplicaciones móviles sin código y permite integrar funciones de IA como reconocimiento de texto, imagen y voz.

**Glide**

Glide transforma hojas de cálculo de Google en aplicaciones y ofrece integraciones con servicios de IA para añadir funcionalidades como reconocimiento de imágenes y procesamiento de lenguaje natural.

**Voiceflow**:

Permite a los usuarios diseñar, prototipar y construir aplicaciones de voz interactivas (como Alexa Skills o acciones de Google) sin código, integrando capacidades de procesamiento del lenguaje natural.

**Clarifai**:

Aunque Clarifai proporciona una API de IA para desarrolladores, también ofrece una interfaz visual que permite a los usuarios crear y entrenar modelos de visión por computadora sin escribir código.

Estas herramientas y plataformas están democratizando el acceso a la inteligencia artificial, permitiendo a más personas aprovechar el poder de la IA para crear aplicaciones avanzadas y personalizadas.

# Referencias Módulo 4

## Referencias Módulo 4  


---

**Web** sobre como usar modelos de IA offline

[https://www.xataka.com/basics/como-tener-ia-como-chatgpt-local-tu-ordenador-gpt4all](https://www.xataka.com/basics/como-tener-ia-como-chatgpt-local-tu-ordenador-gpt4all)

**Web AutoGPT**

[https://www.fool.com/terms/a/autogpt/](https://www.fool.com/terms/a/autogpt/)

[https://neilpatel.com/blog/autogpt/#:~:text=Auto,to%20reach%20its%20final%20aim](https://neilpatel.com/blog/autogpt/#:~:text=Auto,to%20reach%20its%20final%20aim)

**Vídeo Agentes GPT**

[https://www.youtube.com/watch?v=K6EbB1oSzXI](https://www.youtube.com/watch?v=K6EbB1oSzXI)

**Web Agentes GPT**

[https://agentgpt.reworkd.ai/es](https://agentgpt.reworkd.ai/es)

**Web LMStudio**

[https://lmstudio.ai/?s=35](https://lmstudio.ai/?s=35)

Web para descargar modelos y trabajar fuera de línea

**Web** Langchain

[https://www.langchain.com/](https://www.langchain.com/)

**Web** Cohere

[https://cohere.com/](https://cohere.com/)

**Web** HuggingFace

[https://huggingface.co/](https://huggingface.co/)

# Módulo 5. Consideraciones éticas y futuro de la IA.

Los contenidos de este módulo son provisionales, se cerrarán en los próximos días

# Unidad 5.1. Efectos económicos y sociales.

### ***Introducción***

El impacto económico y social de la inteligencia artificial esta siendo amplio y profundo. **Amplio** porque abarca gran cantidad de sectores como ya hemos visto en unidades anteriores de este curso y **profundo** porque en algunos de los sectores encontramos que su efecto es realmente disruptivo. Además la repercusión continúa evolucionando a medida que la tecnología se desarrolla y se integra en diferentes sectores de la sociedad. A continuación, se presenta un resumen de algunos de los principales impactos, tanto positivos como negativos

### ***Impacto Económico***

Detallamos aquellos aspectos mas relevantes en relación con el impacto económico.

- **Crecimiento económico.** Varias son las posibilidades que ofrece la IA que de ser gestionadas adecuadamente tendrían que resultar en un crecimiento económico. Uno de los grandes potenciales de la IA es el de conducir a **aumentos de productividad,** mejorando la eficiencia en la producción y en la prestación de servicios. Estas mejoras vienen derivadas de que los sistemas de IA pueden procesar, analizar y tomar decisiones basadas en grandes conjuntos de datos mucho más rápidamente que los humanos. Esto puede traducirse en una mayor eficiencia operativa en sectores que van desde la fabricación hasta la administración y la investigación y otros muchos. T

También derivado del análisis de datos a gran escala, surgen posibilidades como la **personalización de productos y servicios** a unos niveles desconocidos hasta ahora, las empresas pueden ofrecer productos y servicios personalizados a escala masiva, lo que puede aumentar las ventas y el compromiso del cliente. **Optimizar las cadenas de suministros** por parte de empresas de logística y manufactura es un efecto del que ya disfrutan gracias a las mejoras, basada otra vez en la gestión de datos masivos, en la previsión de demandas, minimizando el tiempo empleado en las rutas y mejorando la gestión de inventarios, lo que reduce costes y mejora el tiempo de entrega.

Otro aspecto que hace crecer la actividad económica es el **desarrollo de Nuevos Productos y Servicios.** Desde asistentes virtuales hasta vehículos autónomos, la IA ha impulsado la creación de productos y servicios innovadores que antes eran considerados ciencia ficción.

![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/2BAimage.png)Imagen propia generado con DALL-E 3 en ChatGPT

- **Cambios en el mercado laboral.** Uno de los impactos directos de una mayor productividad podría ser la **perdida de puestos de trabajo**. Pero sobre todo, este impacto se prevé por la sustitución de determinados trabajos para cuyo desempeño ya se considera capaz a la IA. Numerosos estudios y artículos anticipan una lista de empleos que van a ser reemplazados por la. Este efecto abarca desde aquellas tareas que implican **tareas repetitivas o predecibles** hasta funciones que requieran el **análisis de gran cantidad de datos** como pueda ser, abogacía, periodismo o prescripción médica, sin olvidar trabajos que implican la **simulación de capacidades cognitivas** como el lenguaje conversacional; recepcionistas, atención telefónica y telemática, dobladores de videos, traductores, etc... Podemos profundizar en ello con la lectura de este artículo de **<span style="text-decoration: underline; color: rgb(53, 152, 219);">*[Business Insider,](https://www.businessinsider.es/9-trabajos-peligro-inteligencia-artificial-814059)* </span>**<span style="color: rgb(0, 0, 0);">basado en el informe del Foro Económico Mundial:</span><span style="color: rgb(0, 0, 0);"> </span><span style="color: rgb(0, 0, 0);">[***<span style="text-decoration: underline;"><span style="color: rgb(53, 152, 219);">The Future of Jobs Report 2020</span></span>***](https://www3.weforum.org/docs/WEF_Future_of_Jobs_2020.pdf)</span>

Como curiosidad para hacernos a la idea de la amplitud del impacto venidero, vemos el resultado del experimento realizado por el profesor Ethan Mollick de Wharton School, que decidió darle 30 minutos a una IA (Bing con ChatGPT 4) para realizar todas las tareas posibles en el lanzamiento de un nuevo juego educativo al mercado **<span style="text-decoration: underline; color: rgb(53, 152, 219);">[(ver artículo)](https://www.genbeta.com/actualidad/este-profesor-dio-30-minutos-a-inteligencia-artificial-para-ver-puede-acabar-muchos-empleos-logro-algo-sobrehumano)</span>**. En el siguiente enlace, encontramos la publicación del profesor E. Mollick con el detalle de los distintos prompts introducidos en la IA y los resultados generados: [***<span style="text-decoration: underline;"><span style="color: rgb(53, 152, 219);">Superhuman: What can AI do in 30 minutes? AI multiplies your efforts. I found out by how much...</span></span>***](https://www.oneusefulthing.org/p/superhuman-what-can-ai-do-in-30-minutes)

No es mas que un ejemplo anecdótico y como indica el autor las tareas realizadas fueron todavía de una calidad inferior a las que hubiera desarrollado un profesional con experiencia en cada una de ellas, eso si, en la velocidad de ejecución, no hay color. Siendo solo un experimento, deja mucho margen a la reflexión, sobre todo si se tiene en cuenta que la IA, por su propio funcionamiento, va a tender a hacer las cosas mejor cada vez.

Sin embargo, también hay análisis que indican que la IA puede generar **nuevos roles y trabajos especializados** que antes no existían. Por supuesto, al ser una tecnología innovadora, surgen y se ven potenciadas las ofertas de puestos de trabajo relacionados con su desarrollo, como **ingeniero de prompts, experto en automatización robótica, auditor de procesos, especialista en ciberseguridad, programador** en los lenguajes mas utilizados en IA entre otros. En el artículo, "[***<span style="text-decoration: underline;"><span style="color: rgb(53, 152, 219); text-decoration: underline;">Cuales son los </span></span><span style="text-decoration: underline;"><span style="color: rgb(53, 152, 219);">8 nuevos empleos generados por la IA"</span></span>***](https://budamarketing.es/8-nuevos-empleos-generados-por-inteligencia-artificial/), podemos profundizar sobre los puestos novedosos que han surgido debido a la irrupción de la IA.No hay mas que filtrar en cualquier web de empleo por el termino "IA" para apreciar como la oferta es abundante, por ejemplo en ***<span style="text-decoration: underline;"><span style="color: rgb(53, 152, 219); text-decoration: underline;">[Infojobs.](https://www.infojobs.net/jobsearch/search-results/list.xhtml)</span></span>***

Un aspecto llamativo es que dadas las características de funcionamiento de los sistemas de IA, en concreto su capacidad de extraer patrones de los datos, la posibilidad de sesgos inherentes a los mismos y la posibilidad de otorgar a la propia IA la capacidad para tomar decisiones autónomas, surge la necesidad de integrar en los equipos de diseño y desarrollo de la misma a **especialistas en ética** **y leyes** que puedan abordar los desafíos legales y éticos asociados con esta tecnología. Estos especialistas deben tener un profundo entendimiento tanto del ámbito legal como del tecnológico, asegurando que la IA se emplee de forma ética y responsable, minimizando posibles riesgos legales y sociales.

Por tanto**,** la IA no solo proyecta interrogantes sobre la pérdida de empleos**,** además está dando forma a una nueva era laboral llena de oportunidades innovadoras. A medida que estas ocupaciones emergentes continúan transformando la relación entre la tecnología y el empleo humano, se requiere una adaptación constante y un enfoque en la formación para adecuar las capacidades de los trabajadores potenciales con las necesidades del mercado laboral emergente minimizando los impactos negativos de este proceso y aprovechando al máximo el potencial de la IA en beneficio de la sociedad.

![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/BIJimage.png)Imagen propia creada con DALL-E 3 en ChatGPT

Otros de las aspectos que ya pueden apreciarse en la economía como consecuencia de la irrupción de la IA y sus efectos esperados son:

- **Inversiones.** La eclosión de la IA en el panorama tecnológico ha desencadenado una oleada de inversiones en startups y empresas especializadas en este campo. Este flujo de capital hacia la IA puede tener algunas implicaciones importantes como:

**Redistribución geográfica del capital.** Tradicionalmente, ciertas regiones, como Silicon Valley, han sido epicentros de innovación tecnológica. Sin embargo, con el auge de la IA, otras regiones y países están emergiendo como focos de innovación, atrayendo inversiones y redistribuyendo el capital a nivel global. Este gráfico es elocuente en este aspecto, nos muestra el ranking de las empresas con mas patentes de IA registradas y su evolución de 2017 a 2021...y la nacionalidad de estas empresas.

![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/D9simage.png)

**Cambios en la estructura del mercado.** A medida que más capital se dirige hacia startups y empresas de IA, sectores que anteriormente eran dominantes podrían ver una disminución en las inversiones. Esto podría llevar a un reajuste en la estructura del mercado, con una mayor ponderación hacia la tecnología y, específicamente, hacia la IA.

- **Cambios en el sector financiero.** La IA ha revolucionado el sector financiero. Dos son las razones principales; **La inmensa cantidad de datos** que genera y la **capacidad de los algoritmos de IA para procesar** esos datos y predecir su comportamiento futuro en base a multitud de variables.

Es importante mencionar que, aunque estos efectos son evidentes, la magnitud y velocidad de estos cambios pueden variar según el país, la región y el sector específico. Además, como toda tecnología disruptiva, la IA presenta tanto oportunidades como desafíos que deben ser gestionados adecuadamente para maximizar sus beneficios y minimizar sus riesgos.

---

### ***Impacto Social***

A medida que las implicaciones económicas de la IA se extienden, emergen inevitablemente repercusiones sociales: la transformación económica inducida por la IA actúa como un catalizador para cambios profundos en la dinámica social, las normas y las estructuras de poder. En el tejido de nuestras comunidades, la IA ha dejado una marca indeleble, provocando tanto entusiasmo por sus promesas como inquietud por sus desafíos. A continuación, se presentan cinco aspectos clave de este impacto social de la IA:

- **La inteligencia artificial (IA) ha revolucionado no solo la economía global, sino también la estructura y dinámica de nuestras sociedades**. A menudo, los cambios socioeconómicos impulsados por la IA van de la mano, donde los impactos económicos actúan como precursores de transformaciones sociales más amplias. Estos cambios, aunque intrincadamente relacionados, tienen matices y consecuencias distintas en el ámbito social, y es esencial analizarlos para comprender el panorama completo de la influencia de la IA en nuestra vida diaria.

- **Desigualdad socioeconómica.** Aunque la IA ha creado oportunidades sin precedentes para algunos, también ha ampliado la brecha entre aquellos que tienen las habilidades y recursos para aprovechar estas tecnologías y aquellos que no. La automatización puede generar pérdida de empleos en ciertos sectores, empujando a muchos hacia la periferia económica. Mientras que las empresas que adoptan tecnologías basadas en IA pueden ver aumentos significativos en sus beneficios, existe la preocupación de que esto pueda exacerbar las desigualdades económicas, concentrando la riqueza en aquellas empresas y regiones que tienen acceso a estas tecnologías.

- **Educación y capacitación.** La demanda de habilidades relacionadas con la IA está llevando a poner sobre la mesa un debate sobre la transformación de la educación, de manera que se adapte para preparar a las futuras generaciones para un mundo dominado por la IA. Esto incluye no sólo la enseñanza de habilidades técnicas, sino también la formación ética y crítica necesaria para guiar el desarrollo y aplicación de estas herramientas.

- **Ética y privacidad.** La capacidad de la IA para recopilar, analizar y actuar sobre grandes cantidades de datos personales ha generado preocupaciones sobre la privacidad, el consentimiento y la toma de decisiones éticas.

- **Arte y cultura.** Desde el arte generado por IA hasta la música y la literatura, las capacidades de la IA están reformulando las fronteras de la creatividad, ofreciendo nuevas perspectivas y desafiando las nociones tradicionales de autoría así como la propia definición de arte. La opinión pública se plantea preguntas sobre la autenticidad, la originalidad y el papel del ser humano en la creación cultural.

- **Salud mental y relaciones sociales.** Con la adopción de asistentes virtuales, redes sociales impulsadas por IA y otras tecnologías, se está redefiniendo la naturaleza de la interacción humana y sus efectos en la salud mental. Estas herramientas, aunque brindan comodidad y conectividad global, también plantean interrogantes sobre la autenticidad de las conexiones humanas en la era digital. Las líneas entre interacción real e interacción virtual comienzan a desdibujarse, lo que exige una reflexión profunda sobre cómo mantener el equilibrio y la integridad en nuestras relaciones sociales.

Al desentrañar estos impactos, es crucial recordar que la IA es una herramienta, y su influencia en la sociedad depende en gran medida de cómo y con qué intenciones la utilizamos.

Vemos pues como la IA está reconfigurando muchos aspectos de la economía y la sociedad. Si bien ofrece enormes oportunidades, también plantea desafíos significativos. La forma en que las sociedades elijan abordar estos desafíos determinará en gran medida si los beneficios de la IA se distribuirán de manera amplia y equitativa.


Para terminar esta unidad, vemos una entrevista realizada a <span style="color: rgb(53, 152, 219);">***<span style="text-decoration: underline;">[Kai Fu Lee,](https://es.wikipedia.org/wiki/Kai-Fu_Lee)</span>***</span> uno de los protagonistas en la evolución de la IA durante los últimas décadas, donde explica desde su punto de vista experto las cuestiones planteadas sobre el impacto de la IA en la economía y la sociedad. Se recomienda su visualización para consolidar los conceptos explicados desde el prisma de una autoridad en la materia:

<iframe allowfullscreen="allowfullscreen" height="314" src="https://www.youtube.com/embed/ElKdZtb5FcM" width="560"></iframe>

# Unidad 5.2. Consideraciones éticas.

## *Introducción*

> *"Un gran poder conlleva una gran responsabilidad". Origen desconocido, atribuida a Damocles en el siglo I A.C., y que también se ha usado por políticos, periodistas y autores de ficción para sus personajes.*

[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-11/scaled-1680-/rHUimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-11/rHUimage.png)

Esta cita encapsula la idea central de que la capacidad transformadora de la IA implica una obligación moral de usarla de manera que beneficie a la sociedad y evite los riesgos dañinos de un uso indebido. Al fin y al cabo se trata de una herramienta poderosa que mal utilizada puede llegar a ser muy perjudicial para la sociedad. En alguna ocasión se la ha comparado con la energía nuclear, capaz de proporcionar electricidad a gran escala con emisiones mínimas de carbono, mientras que manejada de manera incorrecta puede resultar en desastres catastróficos, como lo demuestran los accidentes de Chernobyl y Fukushima o una proliferación nuclear que puede conducir a amenazas de seguridad global.

Como hemos ido descubriendo, en la era contemporánea, la Inteligencia Artificial ha impactado en multitud de sectores, redefiniendo la forma en que operan y creando un horizonte de posibilidades inexploradas. El sector educativo no es una excepción a esta transformación digital, donde la IA promete revolucionar la manera en que aprendemos y enseñamos. Sin embargo, junto con las promesas de eficiencia y personalización, emergen importantes cuestiones éticas que requieren una cuidadosa exploración y entendimiento.

<span style="color: rgb(0, 0, 0); background-color: rgb(255, 255, 255);">La IA en educación tiene el potencial de personalizar y democratizar la enseñanza, optimizar los procesos administrativos liberando tiempo de los docentes para realizar tareas específicas del proceso de enseñanza-aprendizaje y la tutorización. También puede permitir disponer de un conocimiento valioso basado en el análisis de grandes conjuntos de datos. Sin embargo, la implementación de estas tecnologías conlleva responsabilidades éticas significativas. Los **dilemas éticos** relacionados con la **privacidad, el sesgo, y la autonomía**, entre otros, son cruciales y demandan una consideración seria por parte de todos los actores involucrados en el ámbito educativo. </span>

Una serie de preguntas han de asaltarnos antes de lanzarnos a implementar sistemas basados de IA en educación:<span style="color: rgb(0, 0, 0);"> ¿Cómo asegurarnos de que los sistemas de IA sean justos y equitativos? ¿Cómo podemos evitar que se utilicen para manipular o discriminar a los estudiantes? y muchas otras.</span>

<span style="color: rgb(0, 0, 0);">Veremos como no estamos solos ante este nuevo horizonte y como desde la irrupción de la IA a nivel global, instituciones públicas y privadas de alcance mundial han ahondado en la necesidad de garantizar que los desarrollos de IA tanto a nivel general como especialmente a nivel educativo se realicen dentro de un **marco ético y controlado.**</span>

El propósito de esta unidad es explorar la ética en el contexto de la IA en general, para posteriormente adentrarnos en las implicaciones éticas específicas cuando la IA se aplica en el escenario educativo. Realizaremos un repaso a los principales dilemas éticos que rodean a la IA y su traducción al contexto educativo.

Al finalizar esta unidad, tendrás una comprensión sólida de los desafíos éticos que plantea la IA en la educación, y estarás en disposición de afrontarlos de manera responsable y efectiva. Se busca fomentar una reflexión crítica y proporcionar una base sólida para la implementación ética de la IA en la educación, contribuyendo así a un **futuro educativo más** **inclusivo, justo y humanizado.**

---

## ***Ética en la IA***

<span style="color: rgb(0, 0, 0);">Una definición de ética nos dice que es una disciplina filosófica que estudia el bien y el mal y sus relaciones con la moral y el comportamiento humano. Por tanto la ética de la IA se centra en los principios morales que deben guiar el desarrollo y el uso de la IA.</span>

<span style="color: rgb(0, 0, 0);">Desde un punto de vista práctico l</span>a ética de la IA ha de ser un **conjunto de directrices** **que asesore sobre el diseño, la implementación y los resultados que de la inteligencia artificial se quiera obtener.**

Una de los principios básicos de funcionamiento de la IA es la necesidad de contar con una gran cantidad de **datos**, esos datos son generados en gran medida por las interacciones humanas con el mundo digital, pues bien las personas tienen todo tipo de **sesgos cognitivos,** como el sesgo de confirmación, el de arrastre, efecto halo, pensamiento de grupo y muchos otros. Estos sesgos están patentes en nuestros comportamientos y, por tanto, en nuestros datos. Por tanto, siendo los datos la base de funcionamiento de los algoritmos de machine learning, es vital, intentar evitar que los sesgos terminen permeando en el sistema si no queremos que los algoritmos de IA nazcan nutridos de ellos. De otro modo la inteligencia artificial tiene altas probabilidades de escalar estos sesgos humanos a un ritmo sin precedentes.

El big data, ha sido un acicate para que las empresas desarrollen sistemas cada vez mas automatizados capaces de tomar decisiones basadas en datos. Su intención primigenia, siendo generalmente entidades con ánimo de lucro, ha sido un incremento en los resultados, sin embargo en ocasiones están experimentando situaciones imprevistas, como consecuencia de una falta de investigación inicial, posterior control o a los sesgos subyacentes de los conjuntos de datos. Los sesgos, es uno de los aspectos mas preocupantes cuando se habla de la etica en la IA, pero no es el único como veremos mas adelante.

<span style="background-color: rgb(255, 255, 255);">Obviamente, los errores conducen a correcciones y han surgido nuevas pautas de trabajo e investigaciones desde el campo de la ciencia de datos. Las empresas líderes en IA están interesadas también en establecer pautas éticas para su uso, ya que han </span>experimentado directamente las consecuencias de no hacerlo. La falta de diligencia en esta área puede tener implicaciones legales y financieras, así como daños a la reputación. Como con cualquier avance tecnológico, la innovación en IA suele ir por delante de la regulación gubernamental. Si bien, la reacción no se ha hecho esperar demasiado y también diversas instituciones públicas a nivel mundial han emitido ya informes y pautas de recomendación sobre un uso ético de la IA.

Las preocupaciones manifestadas y las recomendaciones y principios comunes de actuación, tanto si provienen de instituciones privadas como públicas se agrupan mayoritariamente en los siguientes aspectos:

### **Preocupaciones de la IA en general**

#### **Privacidad**

Antes de la existencia de la IA, ya existía esta preocupación debido a la tecnología digital existente (internet, telefonía movil, hiperconectividad...). Sin embargo, la IA introduce nuevas dimensiones a estos riesgos o los amplifica. Estas nuevas dimensiones en cuanto a riesgos en la privacidad surgen de las supuestas bondades que la IA nos ofrece como:

**Análisis predictivo y perfilación.** La IA puede analizar grandes volúmenes de datos para predecir comportamientos y preferencias individuales con un alto grado de precisión. Esto permite una perfilación detallada que puede ser utilizada de manera invasiva o discriminatoria.

**Reidentificación de datos anonimizados.** Técnicas avanzadas de IA pueden desanonimizar datos que inicialmente fueron anonimizados, permitiendo la reidentificación de individuos, lo cual era mucho más difícil sin la IA.

**Tecnologías de reconocimiento.** La IA potencia tecnologías como el reconocimiento facial, de voz o de patrones de comportamiento, lo cual permite una vigilancia más invasiva y precisa en tiempo real.

**Automatización de decisiones.** La IA permite la toma de decisiones automatizadas basadas en datos personales, lo que puede resultar en discriminación o injusticia si los sistemas están sesgados o mal configurados, y esto puede ser más difícil de detectar o impugnar en comparación con decisiones tomadas por humanos.

 Si bien, es en estos campos donde los creadores de políticas han podido hacer más avances en los últimos años. Por ejemplo, en 2016 se instauró el Reglamento General de Protección de Datos (RGPD) con el objetivo de resguardar la información personal de los ciudadanos en la Unión Europea y el Espacio Económico Europeo, brindándoles más control sobre sus propios datos. En Estados Unidos, varios estados han estado formulando políticas, como la Ley de Privacidad del Consumidor de California (CCPA), que exige a las empresas ser transparentes sobre cómo recopilan la información del consumidor. Estas nuevas legislaciones han impulsado a las empresas a reconsiderar sus prácticas de almacenamiento y uso de los datos de identificación personal (PII). Como consecuencia, la inversión en seguridad se ha catapultado como una prioridad para las empresas en su esfuerzo por mitigar cualquier vulnerabilidad y prevenir la vigilancia, hackeos y ciberataques.

#### **<span style="background-color: rgb(255, 255, 255); color: rgb(0, 0, 0);">Sesgo </span>y discriminación**

Los casos de sesgo y discriminación detectados en varios sistemas inteligentes han planteado muchas preguntas éticas sobre el uso de la inteligencia artificial. **¿Cómo podemos protegernos contra el sesgo y la discriminación cuando los propios datos de entrenamiento pueden estar sesgados?** En principio, las empresas ponen sus mejores intenciones en sus iniciativas de automatización, pero hay diversos informes y casos concretos que evidencian que no siempre tienen éxito. Por ejemplo **<span style="text-decoration: underline; color: rgb(53, 152, 219);">[Reuters](https://www.reuters.com/article/us-amazon-com-jobs-automation-insight/amazon-scraps-secret-ai-recruiting-tool-that-showed-bias-against-women-idUSKCN1MK08G)</span>** destaca algunas de las consecuencias imprevistas de incorporar la IA en las prácticas de contratación. En su esfuerzo por automatizar y simplificar un proceso, Amazon involuntariamente sesgó los posibles candidatos a un trabajo por género para puestos técnicos libres y, en última instancia, tuvieron que desechar el proyecto. A medida que se descubren sucesos como este, <span style="text-decoration: underline;"><span style="color: rgb(53, 152, 219); text-decoration: underline;">**[Harvard Business Review](https://hbr.org/2019/04/the-legal-and-ethical-implications-of-using-ai-in-hiring)** </span></span> ha planteado otras cuestiones sobre el uso de la IA en las prácticas de contratación como, por ejemplo, **qué datos se *deberían* poder utilizar al evaluar a un candidato para un puesto**.

El sesgo y la discriminación no se encuentran únicamente en los sistemas de contratación, también están presentes otras aplicaciones de la IA, como reconocimiento facial o los algoritmos de redes sociales.

Con el creciente entendimiento de los riesgos asociados con la IA, las corporaciones están participando más activamente en las discusiones relativas a la ética y los valores de la IA. Por ejemplo, Arvind Krishna, el director ejecutivo de IBM, declaró que la empresa ha retirado sus productos de análisis y reconocimiento facial de uso general, subrayando que:

> *"IBM se opone firmemente y no tolerará los usos de ninguna tecnología, incluida la tecnología de reconocimiento facial ofrecida por otros proveedores, para la vigilancia masiva, la creación de perfiles raciales, las violaciones de derechos humanos y otras libertades básicas, o cualquier propósito que no concuerde con nuestros valores y Principios de confianza y transparencia". Arvind Krishna, CEO IBM*

#### **Impacto de la IA en el empleo**

La inquietud pública sobre la IA suele enfocarse en la pérdida de empleos, pero hay motivos para pensar que debería replantearse. el enfoque. Cada avance tecnológico altera la demanda laboral en ciertos sectores. Por ejemplo, en la industria automotriz, las principales marcas se están inclinando hacia los vehículos eléctricos acorde a tendencias ecológicas. La industria energética no va a desaparecer, pero la fuente de energía está cambiando de una economía basada en el combustible a otra eléctrica. a inteligencia artificial puede mirarse bajo el mismo prisma. La IA reconfigurará la demanda laboral hacia otras áreas, necesitando por ejemplo trabajadores para gestionar estos sistemas y resolver problemas complejos en sectores como el servicio al cliente, adaptándose así a las nuevas exigencias del mercado.

#### **Responsabilidad**

  
La nueva ley de la UE, aprobada por el Parlamento Europeo el **13 de marzo de 2024** y que esta destinada a regular la IA según un enfoque basado en el riesgo, tiene como objetivos principales garantizar que los sistemas de IA utilizados en la Unión Europea e introducidos en el mercado sean seguros y respeten los derechos de los ciudadanos, y estimular la inversión y la innovación en el ámbito de la IA. Se aplicará basándose en el nivel de riesgo de los sistemas de IA, estableciendo normas más estrictas para aquellos considerados de alto riesgo y prohibiendo prácticas inaceptables como la manipulación cognitiva. Además, se creará la Oficina de la IA para supervisar el cumplimiento de esta normativa. Está previsto que, si no hay imprevistos, la ley entre totalmente en vigor hacia finales de 2026, aunque algunas partes se implementarán antes. <span style="text-decoration: underline;">**[Más detalle sobre la ley.](https://digital-strategy.ec.europa.eu/es/policies/regulatory-framework-ai)**</span>

[![image.png](https://libros.catedu.es/uploads/images/gallery/2024-03/scaled-1680-/S7gimage.png)](https://libros.catedu.es/uploads/images/gallery/2024-03/S7gimage.png)

Hasta la puesta en vigor de esta ley los únicos incentivos para que las empresas sigan unas directrices éticas son las repercusiones negativas que un sistema de IA poco ético puede tener en el resultado final. Como sustituto de esta carencia, se han realizado tentativas de encauzar el desarrollo de la IA mediante diversos comunicados y cartas abiertas de algunos de los pioneros y desarrolladores destacados en este campo, como la carta: <span style="color: rgb(53, 152, 219);">***<span style="text-decoration: underline;">[Pause Giant AI Experiments: An Open Letter](https://futureoflife.org/open-letter/pause-giant-ai-experiments/)</span>***</span> en la que varios de los principales actores en el campo de la IA y mas de un millar de expertos solicitaban frenar los desarrollo de IA hasta que existiera un consenso sobre el desarrollo y el uso de la misma.

También han surgido marcos éticos como parte de una colaboración entre expertos en ética e investigadores para gobernar la construcción y distribución de modelos de IA dentro de la sociedad. No obstante, por ahora, solo sirven como guía, como ejemplo este estudio de la Universidad de Tubinga en Alemania (Centro Internacional para la Ética en Ciencias y Humanidades): <span style="text-decoration: underline;">***<span style="color: rgb(53, 152, 219); text-decoration: underline;">[The Ethics of AI](https://arxiv.org/ftp/arxiv/papers/1903/1903.03425.pdf)</span>****<span style="color: rgb(53, 152, 219); text-decoration: underline;">[ **Ethics.**](https://arxiv.org/ftp/arxiv/papers/1903/1903.03425.pdf)</span>*</span> El estudio aborda la proliferación de guías éticas en respuesta al rápido desarrollo y aplicación de sistemas de inteligencia artificial. Sin embargo, según el mismo, estas guías, solo sirven de momento como recomendaciones. El estudio no proporciona un análisis optimista sobre la eficacia de las guías éticas analizadas para gobernar el desarrollo de modelos de IA en la sociedad. Por lo tanto, concluye, aunque se han establecido marcos éticos, su implementación práctica y su capacidad para mitigar los riesgos asociados con la IA aún están en una fase inicial, sirviendo más como una guía que como una regulación efectiva.

---

<div class="bx--content-layout" id="bkmrk--4"><div class="bx--content-layout__body"><div class="cms-richtext" data-dynamic-inner-content="description" id="bkmrk--5"></div></div></div>### **Recomendaciones éticas para la IA en general**

Las preocupaciones expuestas han llevado, como se ha adelantado a la emisión de comunicados e informes por parte de organismos e instituciones encaminadas a recomendar pautas éticas en el desarrollo de modelos de IA así como a guiar el uso ético de la misma.

Muchos de estos informes vienen a concluir en una serie de puntos clave. Extraemos como ejemplo los cuatro aspectos que del informe: [***<span style="text-decoration: underline;"><span style="color: rgb(53, 152, 219);">Directrices éticas para una IA fiable</span></span>***](https://digital-strategy.ec.europa.eu/en/library/ethics-guidelines-trustworthy-ai)<span style="color: rgb(0, 0, 0);">, publicado en </span>abril del 2019 por la Comisión Europea y desarrollado por un grupo de expertos de alto nivel. En este estudio se concreta la visión europea sobre la IA. De acuerdo con estas directrices, Europa tiene que investigar y desarrollar una IA fiable, es decir, **lícita, ética y robusta**.  
  
Los cuatro principios éticos identificados en las directrices son:

1. **Principio de respeto a la autonomía humana:** Este principio valora y quiere preservar la capacidad de las personas para tomar decisiones independientes, asegurando que la IA no manipule, engañe o reduzca la libertad de elección de los individuos.
2. **Principio de prevención de los daños:** Prioriza la identificación y mitigación de los riesgos y daños potenciales que pueden surgir del uso de la IA, promoviendo el bienestar y la seguridad de las personas y comunidades.
3. **Principio de equidad:** Promueve la justicia y la igualdad en el acceso y los beneficios de la IA, además de abordar y corregir los sesgos sistémicos para evitar la discriminación.
4. **Principio de explicabilidad:** Asegura que las decisiones tomadas por sistemas de IA sean comprensibles y rastreables para los usuarios y partes interesadas, permitiendo una mejor comprensión y la clara identificación de responsabilidades.

<span style="background-color: rgb(255, 255, 255);">En relación con recomendaciones éticas en la aplicación de la IA a nivel general puedes leer también el informe emitido por la UNESCO: **<span style="text-decoration: underline;">[Recomendación sobre la ética de la inteligencia artificial](https://unesdoc.unesco.org/ark:/48223/pf0000381137_spa)</span>**</span>

[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/jOgimage.png)](https://unesdoc.unesco.org/ark:/48223/pf0000381137_spa)

También de la UNESCO, dejamos aquí un ilustrativo artículo: ***<span style="text-decoration: underline;"><span style="color: rgb(53, 152, 219); text-decoration: underline;">[Inteligencia artificial: ejemplos de dilemas éticos](https://www.unesco.org/es/artificial-intelligence/recommendation-ethics/cases)</span></span>***, con casos concretos sobre dilemas éticos aplicables a la IA. Entre ellos, este clarificador video:

 <iframe allowfullscreen="allowfullscreen" height="314" src="https://www.youtube.com/embed/HzYG56HLxbI" width="560"></iframe>

---

## <span style="color: rgb(0, 0, 0);">**Ética en la IA educativa**</span>

<span style="color: rgb(0, 0, 0);">Hemos visto preocupaciones y recomendaciones aplicables al desarrollo y aplicación de la IA en general. Estos principios son también aplicables a la educación. Si bien podemos establecer matices debido a las posibilidades y peligros específicos que la IA tiene en el ámbito educativo.</span>

<span style="color: rgb(0, 0, 0);">Se han realizado publicaciones específicas al respecto de las consideraciones éticas en la educación de las que se pueden extraer una serie de puntos clave comunes, tanto a la hora de plantear las preocupaciones como en las recomendaciones de los principios de actuación.</span>

### **<span style="color: rgb(0, 0, 0);">Preocupaciones en la IA educativa</span>**

#### **Privacidad** 

El uso de la IA en el ámbito educativo supone recopilar y analizar grandes cantidades de datos de los estudiantes. La recopilación y el uso de datos personales supone un **riesgo para su privacidad**, si los datos no se gestionan o protegen adecuadamente.

#### **Deshumanización del aprendizaje**

Un incremento paulatino del uso de la IA en la educación, pude traducirse en un perdida en la conexión interpersonal entre profesores y estudiantes. El exceso de automatización y el enfoque en la eficiencia pueden restar valor a la experiencia educativa, **dejando de lado** aspectos importantes como la **empatía, la creatividad y el pensamiento crítico**.

#### **Sesgos y discriminación** 

Como ya hemos visto, los algoritmos de IA pueden estar sesgados debido a los datos con los que son entrenados. Esto puede llevar a decisiones discriminatorias en la educación, afectando la calidad de la enseñanza, la orientación profesional y las oportunidades académicas de los estudiantes. Los sesgos implícitos en la IA pueden **agravar las desigualdades** existentes y generar situaciones injustas para ciertos grupos de estudiantes.

#### **Dependencia excesiva**

Una utilización indiscriminada de sistemas de IA en la esfera educativa, existe la posibilidad de que los alumnos lleguen a depender excesivamente de la tecnología, lo que podría menguar sus aptitudes para pensar de forma autónoma y resolver problemas por sí mismos. El abuso de la IA en la educación podría **comprometer la independencia y el crecimiento intelectual** de los estudiantes.

#### **Falta de supervisión y control humano**

A pesar de su considerable potencia, la IA aún presenta restricciones y puede cometer fallos. La ausencia de una supervisión y control humanos apropiados en la aplicación de la IA en entornos educativos podría resultar en **imprecisiones o efectos negativos en el proceso de enseñanza-aprendizaje.**

#### **Distracción tecnológica**

La presencia de tecnología de IA en el entorno escolar podría generar distracciones para los alumnos o provocar una dependencia excesiva de dispositivos y sistemas, lo que podría **mermar su habilidad para enfocarse** en el contenido educativo **y para interactuar de manera efectiva con sus compañeros y docentes.**

### **Recomendaciones éticas para la IA educativa**

También en el ámbito educativo las organismos e instituciones publicas y privadas han emitido informes guía con el propósito de establecer unos principios de actuación para el uso de la IA educativa. La UNESCO, como consecuencia del [***<span style="text-decoration: underline;"><span style="color: rgb(53, 152, 219); text-decoration: underline;">Consenso de Beijing,</span></span>***](https://unesdoc.unesco.org/ark:/48223/pf0000368303) emitió el informe ***<span style="text-decoration: underline;"><span style="color: rgb(53, 152, 219); text-decoration: underline;">[Inteligencia artificial: guía para las personas a cargo de formular políticas,](https://unesdoc.unesco.org/ark:/48223/pf0000379376) </span></span>***en cuyo resumen inicial se cita :

> La inteligencia artificial (IA) tiene la capacidad de hacer frente a algunos de los mayores desafíos que afronta, hoy en día, el ámbito de la educación, de desarrollar prácticas de enseñanza y aprendizaje innovadoras y, finalmente, de acelerar el progreso en la consecución del Objetivo de Desarrollo Sostenible (ODS) 4. No obstante, estos avances tecnológicos rápidos implican inevitablemente numerosos riesgos y retos, que los debates sobre las políticas y los marcos reglamentarios tienen aún dificultades para superar. Esta publicación ofrece orientación a las personas a cargo de formular políticas sobre la mejor manera de aprovechar las oportunidades y enfrentar los riesgos que presenta la creciente conexión entre la IA y la educación.

Todo el informe merece una lectura, si bien, en el ámbito de recomendaciones para el uso de la IA en educación en el que se enfoca el apartado de esta unidad, es el capítulo 6 del informe el que las detalla. La base de tales recomendaciones son **cuatro objetivos estratégicos,** si bien habrían de ser interpretados en función del contexto local:

- **Garantizar el uso inclusivo y equitativo de la IA en la educación.**
- **Hacer uso de la IA para mejorar la educación y el aprendizaje.**
- **Promover el desarrollo de habilidades para la vida en la era de la IA, incluyendo la enseñanza del funcionamiento de la IA y sus implicancias para la humanidad.**
- **Salvaguardar el uso transparente y auditable de los datos educativos.**

Estos cuatro principios estratégicos son desarrollados en el informe en las siguientes **recomendaciones:**

- **Planificación interdisciplinaria y gobernanza intersectorial.**
- **Políticas sobre el uso equitativo, inclusivo y ético de la IA.**
- **Desarrollo de un plan maestro para el uso de la IA en educación, en la gestión, enseñanza, aprendizaje y evaluación.**
- **Pruebas piloto, seguimiento y evaluación, así como la creación de una base de pruebas.**
- **Promoción de las innovaciones locales de IA para la educación.**

Todos estos puntos están ampliamente desarrollados en el informe, incluyen ejemplos de iniciativas en curso y su lectura es recomendable para comprender las eventuales hojas de ruta a implantar por las instituciones educativas.

La **Unión Europea,** dentro de su Plan de Acción en Educación Digital 2021-2027 ha incluido una guía ética para el uso de la IA. en el que indica que hay cuatro **consideraciones esenciales** que respaldan el **uso ético** de la IA en la enseñanza, el aprendizaje y la evaluación:

- **Capacidad de acción humana:** se refiere a la habilidad de las personas para tomar decisiones informadas y ser responsables de sus acciones. Incluye conceptos como la autonomía y la autodeterminación.
- **Equidad**: implica tratar con justicia a todas las personas, asegurando que todos tengan acceso igualitario a oportunidades y recursos. Esto abarca la inclusión, la no discriminación, etc.
- **Humanidad**: considera la identidad, integridad y dignidad de las personas. Resalta la importancia del bienestar, la seguridad, el tratar a las personas con respeto y no como simples objetos de datos.
- **Elección justificada:** hace referencia al uso de conocimientos, experiencia y datos para respaldar elecciones en entornos educativos. Esto requiere transparencia, modelos participativos y explicabilidad en la toma de decisiones.

Haz click en el siguiente enlace para ver el video explicativo de la UE sobre la guía ética en l uso de la IA en educación:

[Ethical guidelines on the use of artificial intelligence (AI) and data in teaching and learning, por European Union ](https://audiovisual.ec.europa.eu/corporateplayer/index.html?video=I-232180&language=EN)

A otro nivel, es necesario que los educadores tengan claras determinadas pautas que les permitan evitar o mitigar los riesgos inherentes a las preocupaciones antes detalladas. En este sentido, el siguiente video realizado por *Code*.*org*®, una organización sin fines de lucro dedicada a expandir la participación en ciencias de la computación, desarrolla **recomendaciones prácticas expresamente dirigidas a los docentes; Asegurando una IA responsable.**

<iframe allowfullscreen="allowfullscreen" height="314" src="https://www.youtube.com/embed/P14XpLzaEac?t=41s" width="560"></iframe>

# Unidad 5.3. Futuro de la IA. Y el impacto en educación

[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-11/scaled-1680-/5iNimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-11/5iNimage.png)

### Perspectivas de la IA a Medio y Largo Plazo

La Inteligencia Artificial (IA) está impulsando una revolución tecnológica y científica con impactos significativos en diversos campos. Este documento de 1000 palabras se divide en dos secciones principales: los desarrollos a mediano plazo y las expectativas a largo plazo.

### A Medio Plazo

#### Nuevos Agentes de IA

Los agentes de IA, con su capacidad para aprender y adaptarse, están transformando industrias y prácticas cotidianas. Un ejemplo destacado es el de los asistentes virtuales como Alexa o Siri, que están evolucionando de simples herramientas de búsqueda de información a asistentes personales que pueden gestionar tareas domésticas, recordatorios y preferencias de entretenimiento. Además, en el sector de atención al cliente, los chatbots impulsados por IA están proporcionando respuestas más rápidas y personalizadas, mejorando la experiencia del usuario.

#### Robótica

En el campo de la robótica, la IA está permitiendo el desarrollo de robots más autónomos y eficientes. Por ejemplo, en la medicina, robots como el da Vinci Surgical System están realizando cirugías con una precisión inigualable. En la industria, robots como los de Boston Dynamics están realizando tareas que van desde el transporte de mercancías hasta la inspección de infraestructuras, mejorando la eficiencia y seguridad en el trabajo.

#### Recrecimiento y Programación de Órganos

El uso de la IA en la biotecnología está abriendo caminos en el recrecimiento y programación de órganos. Utilizando técnicas como la bioimpresión 3D, que se basa en algoritmos de IA para diseñar órganos, los científicos están avanzando hacia la creación de órganos personalizados para trasplantes. Esto podría resolver el problema de la escasez de donantes y reducir el riesgo de rechazo de órganos.

#### Integración Hombre-Máquina

La integración de la IA con el cuerpo humano está alcanzando nuevos niveles con el desarrollo de prótesis inteligentes y las interfaces cerebro-computadora. Las prótesis controladas por IA, como las desarrolladas por compañías como Open Bionics, están permitiendo un movimiento más natural y preciso. Además, las interfaces cerebro-computadora están facilitando la comunicación entre el cerebro y las máquinas, lo que tiene enormes implicaciones en el tratamiento de lesiones cerebrales y la ampliación de capacidades humanas.

### A Largo Plazo

#### Inteligencia Artificial General (AGI)

La AGI es un concepto que se refiere a la capacidad de una IA de entender, aprender y aplicar su inteligencia de manera generalizada, similar a un ser humano. La AGI sería capaz de realizar tareas que van desde la composición musical hasta la resolución de problemas matemáticos complejos, todo sin necesidad de programación específica para cada tarea. Este tipo de IA tendría la capacidad de entender contextos y emociones, adaptándose a una variedad de situaciones.

#### Auto-mejora de la IA

Una de las metas más ambiciosas de la IA es la capacidad de auto-mejorarse. Esto implica que una IA podría analizar su propio rendimiento, identificar áreas de mejora y modificar su propio código o algoritmos. Este proceso de auto-optimización conduciría a un crecimiento exponencial en la capacidad y eficiencia de la IA, acelerando el camino hacia la AGI y eventualmente hacia la Super AGI.

#### Super AGI

La Super AGI representa un nivel de inteligencia artificial que no solo iguala, sino que supera la inteligencia humana en todos los aspectos. Una Super AGI tendría la capacidad de realizar descubrimientos científicos y tecnológicos a una velocidad y con una profundidad que actualmente son imposibles para los humanos. Sin embargo, este nivel de inteligencia también plantea importantes desafíos éticos y de seguridad, incluyendo el control y la alineación de objetivos entre la Super AGI y los humanos.

#### Consciencia Humana y AI

La posibilidad de alcanzar o replicar la consciencia humana con IA es un tema de profundo interés y debate. Mientras algunos expertos creen que la consciencia es un fenómeno que podría ser replicado artificialmente, otros sostienen que hay aspectos de la experiencia y la consciencia humanas que son intrínsecamente inalcanzables para la IA. El desarrollo de AGI y Super AGI podría llevarnos más cerca de comprender la naturaleza de la consciencia y, potencialmente, de replicar aspectos de ella en sistemas artificiales.

#### Singularidad en IA

La singularidad en el contexto de la inteligencia artificial se refiere a un punto hipotético en el futuro donde las máquinas, especialmente los sistemas de inteligencia artificial, alcanzarán un nivel de inteligencia y capacidad autónoma que superará ampliamente la inteligencia humana. Este concepto está rodeado de mucha especulación y debate, tanto en términos de su viabilidad como de sus posibles consecuencias.

Personajes relevantes en la discusión sobre la singularidad incluyen:

1. **Ray Kurzweil**: Un futurista y director de ingeniería en Google, es quizás el más famoso proponente de la idea de la singularidad. Predice que la singularidad ocurrirá alrededor del año 2045 y será un punto de inflexión donde la tecnología avanzará a una velocidad incomprensible para los seres humanos actuales.
2. **Vernor Vinge**: Un matemático y escritor de ciencia ficción, acuñó el término "Singularidad tecnológica" en su ensayo de 1993. Argumentó que el progreso exponencial en tecnología eventualmente conducirá a la creación de inteligencia superhumana.
3. **Elon Musk**: El CEO de SpaceX y Tesla, ha expresado preocupaciones sobre la inteligencia artificial y su potencial para superar la inteligencia humana. Ha abogado por la regulación y el control cuidadoso de la IA para evitar posibles escenarios negativos.
4. **Stephen Hawking**: El difunto físico teórico también advirtió sobre los peligros de la IA y la posibilidad de que pueda superar a los humanos, sugiriendo que podría ser "el peor evento en la historia de nuestra civilización" si no se gestiona adecuadamente.
5. **Nick Bostrom**: Filósofo y autor del libro "Superinteligencia: Caminos, Peligros, Estrategias", ha explorado en profundidad los riesgos y las estrategias de mitigación relacionados con el desarrollo de IA avanzada.
6. **Ben Goertzel**: Científico y autor en el campo de la inteligencia artificial, conocido por su trabajo en el desarrollo de sistemas de IA de propósito general, también ha discutido ampliamente sobre la singularidad y la inteligencia artificial.

La singularidad en la IA es un tema que genera tanto entusiasmo como preocupación. Mientras algunos ven en ella la posibilidad de resolver problemas humanos fundamentales, otros advierten sobre los riesgos éticos, morales y de seguridad que podrían surgir si la inteligencia artificial supera la capacidad humana.

#### Conclusión

En resumen, las perspectivas de la IA en el mediano y largo plazo abarcan desde la optimización de tareas cotidianas y el mejoramiento de la calidad de vida hasta cuestiones profundas sobre la inteligencia y la consciencia. Mientras la IA continúa evolucionando, es esencial abordar los desafíos éticos, de seguridad y sociales asociados con estos avances. La colaboración entre científicos, ingenieros, filósofos y legisladores será crucial para garantizar que los beneficios de la IA se maximicen mientras se minimizan los riesgos. La IA tiene el potencial de transformar nuestro mundo de maneras extraordinarias, pero es nuestra responsabilidad guiar ese cambio de manera responsable y ética.

### Impacto de la IA en educación 

El futuro de la educación, influenciado por la Inteligencia Artificial (IA), se perfila como una era de transformaciones significativas en múltiples niveles: la gestión educativa, los centros educativos, el profesorado y los alumnos. A continuación, se detallan las contribuciones y expectativas de la IA en cada uno de estos niveles.

#### Gestión Educativa

1. **Automatización de Procesos Administrativos**: La IA puede automatizar tareas administrativas como la inscripción de estudiantes, la gestión de horarios y el seguimiento del rendimiento académico, lo que permite a los administradores centrarse en tareas más estratégicas.
2. **Análisis Predictivo**: Utilizando el análisis de datos y el aprendizaje automático, la IA puede ayudar a predecir tendencias y necesidades en la educación, como las tasas de deserción escolar o la demanda de ciertos cursos, lo que facilita una planificación más efectiva.
3. **Detección de anomalías** Usand datos en tiempo real puede verse eventos extraños tanto de funcionamiento de centros como de resultados acádemicos y actúar en consecuencia añadiendo mas medios o mejorando el seguimiento.
4. **Visualización proyectos educativos** MEdiante el uso de chatbots propios es más fácil difundir el trabajo de los centros y de los profesores para su aprovechamiento y difusión en otros ´mabitos y centros.
5. **Generación de currículos** Para cada tipo de estudio y adaptados a las circunstancias concretas del centro y alumnado
6. **Nuevos títulos de FP** Mediante el análisis inteligente de datos socioeconómicos se podrá detectar la demanda de empresas (en FP) y alumnos de determinados estudios y facilitar la toma de decisiones sobre dónde y que títulos de FP implanta.
7. **Servicios de IA** Para todos los miembros de la comunidad educativa de manera que puedan acceder a bots personalizados por temáticas, generadores de vídeo o sistemas de traducción simultánea.

#### Centros Educativos

1. **Infraestructura Inteligente**: Los centros educativos pueden implementar sistemas inteligentes para mejorar la seguridad (como el reconocimiento facial para el control de acceso) y optimizar el uso de recursos (como la gestión energética automatizada).
2. **Ambientes de Aprendizaje Personalizados**: La IA puede ayudar a crear entornos de aprendizaje que se adapten a las necesidades individuales de los estudiantes, incluyendo la adaptación del ambiente físico a través de la tecnología del Internet de las Cosas (IoT).
3. **Orientación profesional** En niveles de Formación Profesional la IA facilita enormemente el acceso a empresas y profesiones adecuadas al perfil humano y académico de cada alumno.
4. **Digitalización del profesorado** El uso de asistentes facilita el trabajo con herramientas de cierta complejidad como Excel o presentaciones.

#### Profesorado

1. **Herramientas de Apoyo a la Enseñanza**: La IA ofrece herramientas como sistemas de tutoría inteligente y asistentes virtuales que pueden ayudar a los profesores en la preparación de material didáctico y la evaluación de tareas.
2. **Desarrollo Profesional Continuo**: Mediante plataformas de aprendizaje adaptativo, los docentes pueden acceder a formación personalizada para mejorar sus habilidades y metodologías de enseñanza, basándose en evaluaciones continuas de sus necesidades y progresos.
3. **Evaluación inteligente y automática** Mediante la programación de exámenes generados automáticamente en función de contenidos específicos y la corrección de los mismos lo que permitiría al profesor centrarse en tareas más pedagógicas.
4. **Seguimiento inteligente de alumnos** A través de datos de evalución y percepciones en modo textual se puede ver el estado y evolución de cada alumno tanto en la parte cuantitativa como perceptiva.

#### Alumnos

1. **Aprendizaje Personalizado**: La IA permite la creación de itinerarios de aprendizaje personalizados, adaptando el contenido y el ritmo de aprendizaje a las capacidades y estilos de cada estudiante, lo que puede aumentar la eficacia del aprendizaje y la motivación.
2. **Asistencia y Retroalimentación Instantánea**: Los sistemas de IA pueden proporcionar a los estudiantes retroalimentación inmediata y asistencia en sus tareas y dudas, facilitando un aprendizaje más autónomo y efectivo.
3. **Autoevaluación** Mediante la generación automática de exámenes el alumno podrá ponerse a prueba en las materias y niveles que más necesite
4. **Avatares o Asistentes virtuales** La creación de avatares similares al profesor permitirán a alunos asistir en modo online a las clases permitiendo el aumento de matrícula y la recuperación de clases.

#### Impacto General de la IA en la Educación

Como quiera que sea y a pesar del todas las posiblidades comentadas, el profesor sigue siendo una figura central sin la cual el proceso de enseñanza-aprendizaje carce de sentido.

Interenet está lleno de cursos y recursos gratuitos con un valor incalculable, sin embargo los centros educativos siguen llenándose y la sociedad sigue dmeandando la presencialidad ya que aprender tiene un gran coste en voluntad y sólo una assitencia permanente y una guia, humana de momento, pueden asegurar el proceso.

El impacto general de la IA en la educación a corto plazo incluirá una mayor personalización y eficiencia en el aprendizaje, una gestión más efectiva de los recursos educativos, y un apoyo mejorado tanto para los educadores como para los estudiantes. La IA no solo mejorará la experiencia educativa a nivel individual, sino que también puede contribuir a abordar desafíos más amplios como la equidad en el acceso a la educación y la adaptación a las necesidades cambiantes del mercado laboral.

Es importante destacar que la implementación exitosa de la IA en la educación requerirá consideración cuidadosa de los aspectos éticos, la privacidad de los datos y la equidad en el acceso a estas tecnologías. Además, será esencial capacitar tanto a educadores como a estudiantes en el uso efectivo de estas herramientas para maximizar su potencial. La IA, por tanto, representa una oportunidad significativa para enriquecer y transformar la educación a todos los niveles, preparando a los estudiantes para un futuro cada vez más tecnológico y conectado.

# Unidad 5.4. IA y cultura

> Humans are the reproductive organs of technology. (Los Humanos son los órganos reproducitvos de la tecnología)
> 
> **Kevin Kelly** Director de la revista Wired y autor de varios libros sobre tecnología del futuro

*Esta frase destaca la creciente importancia y el impacto central que la IA tiene en diversas esferas de la vida, incluyendo la cultura, la creatividad y la innovación. Kevin Kelly, con su perspectiva de vanguardia, ve la IA como un catalizador fundamental en la evolución de la sociedad y la tecnología.*

### Introducción

En esta sección y como colofón del curso queremos hacer una pequeña revisión de cómo ha influido la IA en el mundo del arte tanto desde el punto de vista tecnológico como a través de distintas obras de IA en los ámbitos de la literatura y el cine especialmente.

### Impacto de la IA en el mundo cultural

La integración de la Inteligencia Artificial (IA) en campos como la literatura, las artes visuales, el cine y la música ha sido un proceso revolucionario y multifacético. La IA no solo ha abierto nuevas avenidas para la creación y el análisis, sino que también ha planteado preguntas significativas sobre la naturaleza de la creatividad y la autoría.

#### Literatura

- **Asistencia en la Escritura**: La IA, como OpenAI's GPT-3, ha sido utilizada para asistir a escritores en la creación de narrativas y contenido. Estas herramientas pueden sugerir líneas de trama, desarrollar personajes y ofrecer ideas para diálogos.
- **Edición y Análisis de Texto**: Herramientas basadas en IA, como Grammarly, emplean algoritmos avanzados para mejorar la gramática, el estilo y la coherencia en los textos.
- **Generación de Contenido**: Existen proyectos como "Sunspring", un cortometraje cuyo guion fue escrito íntegramente por una IA, demostrando la capacidad de la IA para generar contenido creativo.

#### Arte Visual

- **Creación de Arte**: Proyectos como Google's DeepDream y otros algoritmos de IA han sido utilizados para crear obras de arte visuales únicas, imitando o innovando estilos artísticos.
- **Análisis y Curación de Arte**: IA como la empleada en el proyecto de Google Arts &amp; Culture utiliza algoritmos para analizar obras de arte, ayudando en su clasificación y curación.
- **Experiencias Interactivas**: La IA en museos, como los chatbots usados en el Museo del Louvre, ofrece experiencias personalizadas y educativas a los visitantes.

#### Cine

- **Desarrollo de Guiones y Predicción de Éxito**: La IA se ha utilizado para analizar guiones y predecir el éxito de una película, como en el caso de la herramienta ScriptBook.
- **Efectos Visuales y Animación**: La IA ha mejorado significativamente los efectos visuales y la animación en películas, como se vio en producciones de Disney y Pixar.
- **Edición Autónoma**: La IA puede asistir en la edición, como en el caso del software desarrollado por IBM para crear tráilers de películas.

#### Música

- **Composición y Producción**: La IA ha sido utilizada para componer música en diversos estilos. Proyectos como AIVA (Artificial Intelligence Virtual Artist) han creado piezas musicales completas.
- **Análisis de Tendencias Musicales**: Algoritmos de IA analizan tendencias y patrones en la música, usados por plataformas como Spotify para recomendaciones personalizadas.
- **Personalización de la Experiencia Auditiva**: La IA en plataformas de streaming como Spotify y Apple Music personaliza las recomendaciones de música, mejorando la experiencia del usuario.

#### Impacto General y Consideraciones

La introducción de la IA en estas áreas creativas ha democratizado la producción y el acceso a la cultura, permitiendo una mayor experimentación y personalización. Sin embargo, también ha generado debates sobre la originalidad y la propiedad intelectual, especialmente en lo que respecta a la autoría de las obras creadas por IA. A medida que la tecnología avanza, estos campos continuarán evolucionando, desafiando nuestras percepciones tradicionales de arte y creatividad. La colaboración entre humanos y máquinas promete redefinir no solo cómo se crean las obras de arte, sino también cómo las apreciamos y experimentamos.

### Referencias literarias y cinematográficas

Aunque las opciones son inumerables hemos destacado las que consideramos más relevantes y que más impacto han tenido en el ámbito cultural.

Dichas referencias contriburián sin duda a formar un concepto más amplio de la IA así como a participar en el foro previsto para discutir y dialogar sobre las ventajas y amenazas de la IA en el ámbito social y educativo.

#### Libros Sobre Inteligencia Artificial

<table border="1" id="bkmrk-%22yo%2C-robot%22-de-isaac" style="border-collapse: collapse; width: 1472px; height: 549px; border-width: 0px;"><colgroup><col style="width: 648.5px;"></col><col style="width: 648.5px;"></col></colgroup><tbody><tr><td style="border-width: 0px;">**"Yo, Robot"** de Isaac Asimov: Esta colección de cuentos, publicada en 1950, es fundamental en la literatura de ciencia ficción sobre IA. Explora las complejidades éticas y morales de la convivencia entre humanos y robots, introduciendo las famosas "Tres Leyes de la Robótica".

</td><td style="border-width: 0px;">[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-12/scaled-1680-/xw0image.png)](https://libros.catedu.es/uploads/images/gallery/2023-12/xw0image.png)</td></tr><tr><td style="border-width: 0px;">"**La máquina se para**" de E.M. Forster, fábula distópica sobre las relaciones humanas y familiares en un futuro dominado por algoritmos.

</td><td style="border-width: 0px;"> [![image.png](https://libros.catedu.es/uploads/images/gallery/2023-11/scaled-1680-/iWrimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-11/iWrimage.png)</td></tr><tr><td style="border-width: 0px;">**"Neuromante"** de William Gibson: Un clásico del género

 cyberpunk, publicado en 1984, que describe un futuro donde la IA juega un papel crucial en la sociedad. El libro es conocido por su influencia en la forma en que concebimos la tecnología y la inteligencia artificial.

</td><td style="border-width: 0px;">[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-12/scaled-1680-/wZSimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-12/wZSimage.png)

</td></tr><tr><td style="border-width: 0px;">**"Superinteligencia: Caminos, Peligros, Estrategias"** de Nick Bostrom: Este libro de no ficción, publicado en 2014, explora los escenarios futuros y los riesgos asociados con el desarrollo de una inteligencia artificial superinteligente.

</td><td style="border-width: 0px;">[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-12/scaled-1680-/7HWimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-12/7HWimage.png)

</td></tr><tr><td style="border-width: 0px;">**"La creación del Yo"** de Anil Seth

Anil Seth, autoridad de talla mundial en el estudio del cerebro, echa por tierra muchas de las ideas preconcebidas sobre la mente, la conciencia, la memoria, el yo y el libre albedrío, desarmando creencias y supersticiones heredadas, y ofreciendo un estimulante estado de la cuestión: la conciencia existe, viene a decirnos Seth, si bien es muy distinta a como pensábamos que era.

</td><td style="border-width: 0px;">[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-12/scaled-1680-/lNRimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-12/lNRimage.png)

</td></tr></tbody></table>

#### Películas Sobre Inteligencia Artificial

<table border="1" id="bkmrk-%22blade-runner%22-%281982" style="border-collapse: collapse; width: 110.741%; height: 327px;"><colgroup><col style="width: 50.0494%;"></col><col style="width: 50.0494%;"></col></colgroup><tbody><tr style="height: 110.425px;"><td style="height: 110.425px;">**"Blade Runner" (1982) y "Blade Runner 2049" (2017)**  Ambas películas exploran temas de IA, identidad y consciencia a través de los ojos de los replicantes, seres artificiales indistinguibles de los humanos.</td><td style="height: 110.425px;">[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-12/scaled-1680-/xrrimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-12/xrrimage.png)

</td></tr><tr style="height: 103.075px;"><td style="height: 103.075px;">**"Ex Machina" (2014)**: Esta película se centra en la interacción entre un programador y una inteligencia artificial avanzada y autónoma, abordando temas de consciencia y manipulación emocional.

</td><td style="height: 103.075px;">[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-12/scaled-1680-/uRJimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-12/uRJimage.png)

</td></tr><tr style="height: 38.5px;"><td style="height: 38.5px;">**"Her" (2013)**: "Her" explora la relación entre un hombre y un sistema operativo inteligente, cuestionando la naturaleza del amor y la conexión en la era de la IA.

</td><td style="height: 38.5px;">[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-12/scaled-1680-/RlGimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-12/RlGimage.png)

</td></tr><tr><td>**"AI" (2001)** De Steven Spielberg esta película se adentra en la vida de un niño robot con capacidad para amar.

</td><td>[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-12/scaled-1680-/Jf5image.png)](https://libros.catedu.es/uploads/images/gallery/2023-12/Jf5image.png)

</td></tr><tr><td>**"Ghost in the Shell" (1995)** Anime que explora temas de IA, identidad y conciencia en un futuro cyberpunk.

</td><td>[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-12/scaled-1680-/8n7image.png)](https://libros.catedu.es/uploads/images/gallery/2023-12/8n7image.png)

</td></tr><tr><td>**"Minority Report" (2002):** De Steven Spielberg, plantea un futuro donde la IA ayuda a prevenir crímenes antes de que sucedan.

</td><td>[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-12/scaled-1680-/VdBimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-12/VdBimage.png)

</td></tr><tr><td>**"Transcendence" (2014)** Explora el concepto de la singularidad tecnológica y la transferencia de la conciencia humana a una computadora.

</td><td>[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-12/scaled-1680-/3xximage.png)](https://libros.catedu.es/uploads/images/gallery/2023-12/3xximage.png)

</td></tr></tbody></table>

### Impacto Cultural y Temas Comunes

Estos libros y películas reflejan las preocupaciones culturales y éticas en torno a la IA. Temas comunes incluyen:

- **Ética y Moralidad**: La interacción entre humanos y seres artificiales plantea preguntas sobre qué significa ser humano y cómo deben ser tratadas las entidades conscientes creadas por nosotros.
- **Identidad y Consciencia**: La exploración de la consciencia artificial y la identidad en estas obras invita a reflexionar sobre nuestra propia naturaleza y sobre qué constituye la consciencia.
- **Relación Humano-Máquina**: La forma en que los humanos interactúan con la IA y cómo estas interacciones afectan a la sociedad y a las relaciones personales es un tema recurrente.
- **Futuro y Tecnología**: Estas obras también especulan sobre el futuro de la tecnología y cómo podría moldear nuestra sociedad, economía y vida cotidiana.

En conclusión, libros y películas sobre IA no solo entretienen e imaginan futuros posibles, sino que también provocan un diálogo crucial sobre las implicaciones éticas, filosóficas y sociales del desarrollo de la inteligencia artificial. Estas obras culturales son esenciales para entender y reflexionar sobre el papel de la IA en nuestra sociedad y su potencial futuro.

# Referencias módulo 5

**Web UNESCO**

Informes sobre la IA en la educación

[https://www.unesco.org/es/digital-education/artificial-intelligence](https://www.unesco.org/es/digital-education/artificial-intelligence)

**Vídeo Dot CSV**

Futuro de la IA

[https://www.youtube.com/watch?v=yAF3bopYMGk](https://www.youtube.com/watch?v=yAF3bopYMGk)

**Artículo** Universidad Complutense sobre ética y educación en IA

[https://www.ucm.es/otri/noticias-etica-inteligencia-artificial-ucm](https://www.ucm.es/otri/noticias-etica-inteligencia-artificial-ucm)

**Artículo** Linkedin de Borja Garzón

Una visión sobre cómo afrontar aplicar la ética en la IA en el mundo educatiivo

[https://www.linkedin.com/pulse/ia-y-educaci%C3%B3n-mas-all%C3%A1-de-la-evaluaci%C3%B3n-una-revisi%C3%B3n-garz%C3%B3n-casado/?trk=article-ssr-frontend-pulse\_more-articles\_related-content-card&amp;originalSubdomain=es](https://www.linkedin.com/pulse/ia-y-educaci%C3%B3n-mas-all%C3%A1-de-la-evaluaci%C3%B3n-una-revisi%C3%B3n-garz%C3%B3n-casado/?trk=article-ssr-frontend-pulse_more-articles_related-content-card&originalSubdomain=es)

# Unidad 5.5 El camino a la Inteligencia Artificial en el Sistema Educativo y Una reflexión final

> El judo no se trata de forzar tu ataque, sino de adaptarte y utilizar la fuerza de tu oponente en su contra. Es el arte de la flexibilidad y la adaptación."
> 
> **Isao Okano**, campeón olímpico y mundial de judo

#### El camino a la IA en Educación

Esta última sección pretende reflexionar sobre los efectos de la IA en el ámbito educativo y sobre como debemos o podemos afrontarla. Los avances son inexorables y casi diarios y no podemos permanecer impasibles o inalterados anta la ola de cambios que se avecina. Lejos de pretender evitarla el único camino se asimilarla y aprocechar su fuerza en nuestro beneficio.

Todos debemos ser conscientes y aprovechar la IA en nuestro propio ámbito, pero también allá donde tenemos influencia. Los profesores en el aula, los alumnos en su ámbito social, los gestores en su organización.

Pero es preciso una concienciación y formación a todos los niveles, es por ello que proponemos o esbozamos un sencillo esquema para ello, con el objeto de que cada cual aporte su grano de arena en el contexto en el que se mueva.

A nivel general, y en sobre todo en los niveles superiores de la dministración debería al menos contemplarse una cierta estrategia al respecto que podría seguir algo parecido a lo que se indica en el esquema adjunto.

[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-11/scaled-1680-/cPNimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-11/cPNimage.png)

[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-11/scaled-1680-/bXWimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-11/bXWimage.png)

Dicho esquema esboza nuestra visión de cómo debe asimilarse la IA en el sistema. Tarea compleja dada la ingente cantidad de recurrsos que cada día aparecen y suplantan a otros.

Es por ello que consideramos que las administraciones educativas deben inicar un proceso de integración de la IA en todos los ámbitos y muy especialmente en el educativo

Dicha integración debe pasar por varias etapas o fases e involucrar a todos los actores del sistema con especial hincapié en profesores, alumnos y gestores.

Como idea central debe habilitarse recursos de infraestructura en forma de servicios, suscripciones, formación y soporte físico de equipos de procesamiento.

A partir de ahí proceder a implementar e integrar IA en cada sistema y aplicación asi como a nivel de aula por parte de cada profesor.

Todo esto debe impulsarse desde arriba para estar preparados para la gran revolución que supone la IA y no permitir que nos llegue desde fuera.

Animamos a todos los docentes a continuar este camino y difundir y promover sus experciencias con el único objetivo de ofrecer la mejor educación posible a todo los alumnos.

#### Una reflexión final

La educación es la base de la sociedad, los últimos avances son desbordantes y cada día hay novedades. Cuesta asimilar todo lo que está pasando sin embargo la esencia es la misma, aunque la tecnología cambie constatemente nuestra biología lleva así miles de años por lo cual la educación en toda su amplitud es y será necesaria.

No obstante es innegable que los nuevos avances en IA deben hacernos replantear de manera profunda las metologías a seguir.

Quizá es el momento de pensar más en las preguntas que en las respuestas, de pensar que ahora ell alumno debe esforzarse más por explicarse oralmente, por escribir la pregunta adecuada o por planificar el programa informático a desarrollar más que pensar en el código, en diseñar el guión de una novela en lugar de escribirla o en soñar nuevos mundos en lugar de crear un juego.

Contrariamente a lo que puede pensarse, la nueva etapa que afrontamos es más compleja y abstracta y va a requerir de esfuerzos adicionales tanto desde el punto de vista del profesor como del alumno al tener que elevar el nivel de abstracción.

En el futuro próximo también la IA irá asumiendo estas facetas, surgirán agentes que acturarán por nosotros y quizá llegue el día en que seamos totalmente prescindibles. Mientras llegue ese momento aprovechemos lo que tenemos para vivir y enseñar mejor.

[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-12/scaled-1680-/DNUimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-12/DNUimage.png)

# Créditos

Contenidos elaborados y seleccionados por:

- Luis Hueso Ibañez
- Pedro López Savirón

Cualquier observación o detección de error, puedes escribirnos a soportecatedu@educa.aragon.es.

<div class="pointer-container" id="bkmrk-%C2%A0-1"><div class="pointer anim "><svg class="svg-icon" data-icon="link" role="presentation" viewbox="0 0 24 24" xmlns="http://www.w3.org/2000/svg"></svg><div class="input-group inline block"> <button class="button outline icon" data-clipboard-target="#pointer-url" title="Copiar Enlace" type="button"><svg class="svg-icon" data-icon="copy" role="presentation" viewbox="0 0 24 24" xmlns="http://www.w3.org/2000/svg"></svg></button></div></div></div>Los contenidos se distribuyen bajo licencia **Creative Commons** tipo **BY-NC-SA** excepto en los párrafos que se indique lo contrario.

[![image-1669879913915.png](https://libros.catedu.es/uploads/images/gallery/2022-12/scaled-1680-/image-1669879913915.png)](https://libros.catedu.es/uploads/images/gallery/2022-12/image-1669879913915.png)

<sub>Financiado por el </sub><sub>Ministerio de Educación y Formación Profesional y por la Unión Europea - NextGenerationEU</sub>

[![logo.png](https://libros.catedu.es/uploads/images/gallery/2023-01/scaled-1680-/logo.png)](https://libros.catedu.es/uploads/images/gallery/2023-01/logo.png)