# Módulo 3. Y ahora que hacemos. Aplicaciones de la IA

Este módulo da una visión de las aplicaciones más importantes y potentes de IA así como una guía detallada de técnicas de prompting que facilite el uso de dichas aplicaciones, siempre haciendo énfasis en aplicaciones en el ámbito educativo.

# Unidad 3.1. Posibilidades de la IA

### Introducción

Hemos repasado la historia de las ideas y avances que han llevado a la IA al momento actual. Hemos visto que la IA ya es una realidad en nuestra sociedad y que tiene una gran importancia en la economía y un enorme potencial por delante. También hemos podido analizar su funcionamiento, lo que sin duda nos ayudará a entenderla un poco mejor y a poder sacar un mejor provecho de la misma cuando empecemos a explorar las posibilidades que nos ofrece.

En esta unidad vamos a entrar en el mundo de posibilidades que se abre ante nosotros, repasando y analizando las posibles aplicaciones de la IA.

---

### Posibilidades de la IA

La Inteligencia Artificial tiene una gran cantidad de aplicaciones en varios campos. Muchas de ellas, ya las hemos visto en unidades anteriores, ya fuera al exponer las aplicaciones actuales de la IA o al analizar el funcionamiento de la misma. Si bien ahora vamos a entrar a profundizar en las posibilidades de uso "cotidiano" de manera que podamos extraer conclusiones sobre la utilidad que nos pueden reportar. Aquí hay una descripción estructurada de algunas de las aplicaciones más notables de la IA, organizadas por categorías funcionales:

#### Procesamiento del lenguaje natural (PLN)

El PLN es una subdisciplina de la IA que se centra en la interacción entre las computadoras y el lenguaje humano. A través de los años, las capacidades de los modelos de PLN han avanzado enormemente. A continuación, se describen algunas de las cosas de las que es capaz un modelo de PLN:

- **Análisis de Sentimiento.** Determinar si un texto expresa un sentimiento positivo, negativo o neutro. Es ampliamente utilizado en monitoreo de redes sociales y análisis de opiniones en línea.
- **Traducción Automática.** Traducir texto de un lenguaje a otro. Ejemplos famosos incluyen herramientas como Google Translate.
- **Resumen Automático.** Generar resúmenes concisos de textos largos.
- **Reconocimiento de Entidades Nombradas.** Identificar y clasificar entidades en un texto (como nombres de personas, organizaciones, lugares, etc.).
- **Clasificación de Texto.** Clasificar textos en diferentes categorías. Por ejemplo, determinar si un email es spam o no.
- **Respuesta a Preguntas.** Responder preguntas basadas en un conjunto de información o conocimiento. Los chatbots y asistentes virtuales a menudo utilizan esta capacidad.
- **Generación de Texto.** Producir texto de manera coherente y relevante. Por ejemplo, modelos como GPT-3 y GPT-4 de OpenAI son capaces de generar contenido textual en una variedad de estilos y temas.
- **Extracción de Información:** Extraer datos específicos de textos grandes, como extraer fechas, cifras, hechos, etc.
- **Corrección Ortográfica y Gramatical:** Identificar y corregir errores en el texto.
- **Análisis de Dependencia y Sintáctico:** Descomponer y entender la estructura gramatical de las oraciones.
- **Reconocimiento de Voz:** Convertir el habla en texto. Esta tecnología está detrás de asistentes como Siri, Alexa y Google Assistant.
- **Síntesis de Voz:** Convertir texto escrito en habla.
- **Recomendaciones de Texto.** Sugerir palabras o frases mientras un usuario está escribiendo, como lo hace el teclado de un smartphone o las búsquedas en Google.
- **Desambiguación Léxica.** Determinar el significado de una palabra basándose en su contexto.
- **Detección de Idioma.** Identificar en qué idioma está escrito un texto.

Es importante destacar que, aunque los modelos de PLN han alcanzado altos niveles de rendimiento en muchas tareas, todavía enfrentan desafíos, especialmente cuando se trata de entender el contexto completo, el sarcasmo, o ciertas sutilezas y ambigüedades del lenguaje humano.

#### Visión por computadora

La visión por computadora es otra rama de la IA que se ocupa de permitir que las computadoras "vean" e interpreten imágenes y videos. Los sistemas de inteligencia artificial que utilizan visión por computadora han experimentado avances significativos en los últimos años. Estas son algunas de las posibilidades y aplicaciones de la visión por computadora con IA:

- **Reconocimiento facial.** Puede identificar y verificar personas a partir de imágenes o vídeos. Esto se utiliza en aplicaciones de seguridad, desbloqueo de dispositivos móviles y etiquetado automático en redes sociales.
- **Reconocimiento de objetos.** Puede identificar y clasificar objetos dentro de imágenes. Por ejemplo, en aplicaciones de comercio electrónico para identificar productos o en vehículos autónomos para identificar obstáculos.
- **Detección de defectos.** En la industria manufacturera, se utilizan cámaras y sistemas de IA para detectar defectos en productos en la línea de producción.
- **Análisis médico.** En el campo de la medicina, los sistemas de IA pueden ayudar a diagnosticar enfermedades al analizar imágenes médicas como radiografías, resonancias magnéticas y tomografías.
- **Navegación autónoma.** Los vehículos autónomos y drones utilizan visión por computadora para navegar, detectar obstáculos y tomar decisiones en tiempo real.
- **Realidad aumentada (RA).** Las aplicaciones de RA utilizan visión por computadora para superponer información digital sobre el mundo real.
- **Seguimiento de movimiento.** Utilizado en deportes para seguir la trayectoria de balones o en cinematografía para efectos especiales.
- **Análisis de comportamiento.** En seguridad o marketing, puede analizar patrones de movimiento de las personas y detectar comportamientos inusuales o medir la efectividad de exhibidores publicitarios.
- **Reconocimiento de texto (OCR).** Convertir imágenes de texto escrito o impreso en datos textuales. Esto se usa en aplicaciones de digitalización de documentos y traducción en tiempo real de señales o menús, por ejemplo.
- **Control de calidad.** En agricultura, por ejemplo, se pueden usar sistemas de visión por computadora para clasificar frutas y verduras según su calidad.
- **Reconocimiento de gestos.** Permite la interacción con dispositivos mediante gestos manuales.
- **Segmentación semántica.** Clasifica cada píxel de una imagen en una categoría, como "persona", "coche", "edificio", etc., permitiendo una comprensión más detallada del entorno.
- **Estimación de pose.** Detecta la posición y orientación del cuerpo humano en tiempo real, útil para aplicaciones de fitness, videojuegos y más.

La combinación de hardware cada vez más potente, grandes conjuntos de datos y algoritmos avanzados de aprendizaje profundo ha permitido que la visión por computadora con IA penetre en muchos sectores y continúe expandiéndose en nuevas áreas. La investigación en este campo es activa y sigue produciendo mejoras y nuevas capacidades.

#### Audio

Los sistemas de inteligencia artificial que procesan y analizan audio han experimentado también avances considerables. Las aplicaciones relacionadas con el audio y la IA abarcan una amplia gama de áreas. Estas son algunas de las posibilidades y aplicaciones de la IA en este ámbito:

- **Reconocimiento de voz.** Convertir el habla en texto, como lo hacen los asistentes virtuales.
- **Síntesis de voz.** Convertir texto en habla, lo que permite que las máquinas "hablen" con un tono y cadencia más natural.
- **Identificación de hablantes.** Reconocer a una persona específica por su voz, lo que puede ser útil en aplicaciones de seguridad o personalización.
- **Traducción automática.** Traducir en tiempo real el habla de un idioma a otro.
- **Reconocimiento de sonidos ambientales.** Detectar y clasificar sonidos no verbales, como sirenas, ladridos de perros o maquinaria en funcionamiento.
- **Detección de emociones.** Analizar el tono y las inflexiones de la voz para determinar el estado emocional del hablante.
- **Mejora y restauración de audio.** Detectar y eliminar ruidos o sonidos que no se quiere que aparezcan y mejorar la claridad del audio en grabaciones.
- **Música.** Composición automática, recomendaciones musicales personalizadas y análisis de propiedades musicales.
- **Análisis acústico.** Monitorizar entornos para detectar anomalías, como en sistemas de seguridad o en análisis de salud de maquinaria.
- **Generación de música y sonido.** Crear música o efectos de sonido nuevos usando redes neuronales.
- **Transcripciones automáticas.** Convertir grabaciones de voz, como entrevistas, conferencias o reuniones, en texto escrito.
- **Sistemas de verificación biométrica.** Usar el audio, específicamente la voz, como una forma de verificación biométrica para autenticar a los usuarios.
- **Adaptación y personalización.** Ajustar la respuesta de un asistente virtual según el usuario y su contexto basándose en el análisis del audio.
- **Educación y formación.** Herramientas para ayudar en la pronunciación de idiomas o para detectar errores en la lectura en voz alta.

De nuevo aquí, la convergencia de grandes conjuntos de datos de audio, algoritmos avanzados (especialmente en el área de redes neuronales recurrentes y transformadores) y hardware más potente ha impulsado la adopción de la IA en aplicaciones de audio. Como en otros campos de la IA, la investigación en audio sigue siendo muy activa y está abriendo nuevas posibilidades y mejoras continuamente.

#### Multimodo

Hasta aquí, es posible que te haya asaltado la idea de que estos modos podrían ser combinables para obtener una mayor funcionalidad y utilidad del sistema, eso es precisamente lo que hacen los sistemas multimodales. Los sistemas de IA multimodo son aquellos que combinan información de algunas o todas las modalidades vistas previamente (texto, imagen/video, audio) para llevar a cabo tareas o proporcionar soluciones más integradas y contextuales. Estos sistemas son especialmente poderosos porque pueden aprovechar las fortalezas y compensar las debilidades de cada modalidad individual. Aquí hay algunas posibilidades y aplicaciones de la IA multimodo:

- **Asistentes virtuales mejorados.** Un asistente que puede comprender tanto el habla (audio) como las expresiones faciales (video) puede proporcionar respuestas más contextuales y emotivas.
- **Análisis de sentimientos avanzado.** Al combinar el análisis de texto (por ejemplo, de transcripciones) con el análisis de tono de voz y expresiones faciales, se puede obtener una comprensión más precisa del sentimiento de una persona.
- **Educación y formación.** Plataformas educativas que adaptan el contenido según las respuestas verbales y no verbales de un estudiante. Por ejemplo, si un estudiante parece confundido (expresión facial) y hace una pregunta relevante (audio), el sistema puede ofrecer información adicional.
- **Reuniones y teleconferencias.** Herramientas que pueden transcribir automáticamente el habla, identificar a los participantes a través del reconocimiento facial y resaltar puntos clave basándose en énfasis vocal o gestos.
- **Publicidad y marketing.** Análisis de reacciones de audiencias a contenido multimedia, combinando respuestas textuales con análisis de expresiones faciales y tono de voz.
- **Realidad aumentada y virtual.** Sistemas que responden a comandos de voz, gestos y movimientos oculares simultáneamente para proporcionar una experiencia más inmersiva.
- **Sistemas de navegación en vehículos.** Combina señales visuales (obtenidas mediante cámaras) con comandos de voz y datos de sensores para ofrecer instrucciones más precisas y seguras.
- **Salud y bienestar.** Aplicaciones que monitorizan tanto el habla (para detectar signos de estrés o depresión, por ejemplo) como las expresiones faciales o la postura corporal para proporcionar retroalimentación y apoyo.
- **Entretenimiento interactivo.** Videojuegos o experiencias interactivas que responden a múltiples señales del usuario, desde comandos de voz hasta movimientos corporales.
- **Búsqueda avanzada.** Búsqueda de contenido en plataformas que no solo interpreta palabras clave, sino también contextos visuales y auditivos asociados.
- **Accesibilidad.** Sistemas que ayudan a personas con discapacidades a interactuar con la tecnología, combinando, por ejemplo, interpretación de lenguaje de señas con comandos de voz.

El desarrollo de sistemas de IA multimodo es complejo, ya que requiere la integración efectiva de modelos especializados en diferentes modalidades. Sin embargo, a medida que la tecnología avanza, sin duda veremos una adopción más amplia de soluciones multimodo, dada su capacidad para proporcionar experiencias más ricas y contextuales.

**Principales empresas de IA y sus chatBots en marzo de 2024** [![image.png](https://libros.catedu.es/uploads/images/gallery/2024-03/scaled-1680-/rcJimage.png)](https://libros.catedu.es/uploads/images/gallery/2024-03/rcJimage.png)

# Unidad 3.2. Tutorial de Prompting. La impotancía de las preguntas

> <span style="color: rgb(0, 0, 0);">"Juzga a un hombre por sus preguntas y no por sus respuestas" Voltaire</span>

> <span style="color: rgb(0, 0, 0);">"No es la respuesta la que ilumina, sino la pregunta" Eugene Ionesco</span>

> <span style="color: rgb(0, 0, 0);">“Lo importante es no dejar de hacerse preguntas” </span>
> 
> <span style="color: rgb(0, 0, 0);">"Si yo tuviera una hora para resolver un problema, y mi vida dependiera de la solución, gastaría los primeros 55 minutos en determinar la pregunta apropiada, porque una vez conociera la pregunta correcta, podría resolver el problema en menos de cinco minutos"</span>
> 
> <span style="color: rgb(0, 0, 0);">Albert Einstein</span>

### <span style="color: rgb(0, 0, 0);">Introducción </span>

<span style="color: rgb(0, 0, 0);">Ya hemos visto que la herramienta que provocó la irrupción masiva la inteligencia artificial a nivel popular fue el chatbot ChatGPT. La tecnología que hay detrás de este chat es el mencionado PLN (Procesamiento del Lenguaje Natural). A día de hoy, esta tecnología se ha utilizado para desarrollar muchos otros chatbots (Gemini, Llama, Claude etc…). El PLN es un subcampo de la IA que utiliza modelos de lenguaje para predecir una secuencia de palabras.</span>

<span style="color: rgb(0, 0, 0);">Para poder sacar el mayor potencial de estos modelos, es crucial entender y aplicar de manera efectiva la técnica de "prompting". Esta técnica nos permite interactuar con estos modelos de lenguaje para recibir respuestas específicas y generar distintos tipos de contenido, desde texto, como en los chatbots, <span style="mso-spacerun: yes;"> </span>hasta imágenes y sonidos a través de otras herramientas que veremos más adelante.</span>

<span style="color: rgb(0, 0, 0);">En este capítulo, vamos a explorar el concepto de *prompting* de forma detallada, sus implicaciones en la IA, y su potencial aplicación en la educación.</span>

---

### <span style="color: rgb(0, 0, 0);">¿Qué es el *prompting?* y su importancia</span>

<span style="color: rgb(0, 0, 0);">El *prompting* es una técnica utilizada para interactuar con sistemas de IA mediante indicaciones o preguntas específicas . Es el medio por el cual se le pide a un modelo de lenguaje o a un algoritmo de IA que realice una acción o que genere una respuesta. Este concepto es fundamental para aprovechar plenamente las capacidades de los modelos de IA, especialmente en el procesamiento de lenguaje natural (PLN).</span>

<span style="color: rgb(0, 0, 0);">El *prompting* nos lleva a introducir al modelo un prompt, lo que en castellano podríamos traducir como “cuestión, pregunta o Indicación”. </span>

<span style="color: rgb(0, 0, 0);">Por tanto, el *prompting* se trata, dicho de manera simple, de pensar y trabajar la indicación o pregunta que vamos a realizarle al modelo de IA para que la respuesta o resultado que el modelo nos presente sea lo más ajustado posible a nuestra solicitud y nos aporte un contenido lo más valioso posible.</span>

<span style="color: rgb(0, 0, 0);">**Un ejemplo aclaratorio:** </span>

<span style="color: rgb(0, 0, 0);">Todos hemos hecho búsquedas en cualquiera de los buscadores disponibles por internet. Al hacerlas, en mayor o menor medida hacemos un esfuerzo para introducir el texto adecuado para que el motor de búsqueda encuentre la web o webs más relevantes para nuestra necesidad concreta. Ese **esfuerzo** que hacemos para que nuestra entrada facilite al buscador ofrecernos lo que buscamos sería el prompting. En el contexto de un motor de búsqueda, esto se traduciría en cómo eliges y organizas las palabras clave para obtener los resultados más relevantes. Es una especie de "arte" en cómo haces la pregunta para obtener la mejor respuesta</span>

<span style="color: rgb(0, 0, 0);"><span style="mso-spacerun: yes;"> </span>A su vez, el texto que introducimos en el buscador representaría el ***prompt**.* Es la consulta específica que generas, compuesta de palabras clave, frases o preguntas, que el motor de búsqueda procesa para obtener resultados.</span>

<span style="color: rgb(0, 0, 0);">El *prompting* es **esencial** para una gran variedad de aplicaciones de IA. Desde asistentes virtuales hasta motores de búsqueda y sistemas de recomendación, el diseño y la implementación efectiva de *prompts* son cruciales para la eficacia y precisión de estos sistemas. Además, con la aparición de modelos más avanzados y diversos, el papel del *prompting* se ha expandido para incluir la generación de contenido más allá del texto, como imágenes y sonidos.</span>

<span style="color: rgb(0, 0, 0);">![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/moTimage.png)Imagen propia. Generada por el Generador de imágenes de Bing.</span>

<div class="flex" id="bkmrk--1"></div>---

### <span style="color: rgb(0, 0, 0);">Evolución del *prompting*</span>

<span style="color: rgb(0, 0, 0);">En los albores de la computación, las interacciones con las máquinas eran bastante rudimentarias. Las interfaces de **línea de comandos** fueron algunas de las primeras formas de *prompting,* donde los usuarios ingresaban comandos de texto específicos para obtener respuestas o realizar tareas. </span>

<span style="color: rgb(0, 0, 0);">Con el tiempo y el avance tecnológico, las formas de interactuar con las máquinas se han vuelto cada vez más sofisticadas. Pasamos de las interfaces de línea de comandos *(MS-DOS)* a interfaces gráficas de usuario *(Windows)* y luego a interacciones más intuitivas gracias a la IA. Los modelos de lenguaje de gran escala como por ejemplo *GPT-3* (modelo detrás de *ChatGPT)* y *LaMDA* (modelo detrás de *Bard)* permiten ahora una interacción mucho más natural y conversacional. A través de prompts bien diseñados, estos y otros modelos pueden comprender y generar texto, imágenes, y sonidos que son increíblemente cercanos a lo que un humano podría producir o entender.</span>

<span style="color: rgb(0, 0, 0);">En sus inicios, el *prompting* se limitaba principalmente al texto. Sin embargo, con el desarrollo de modelos de IA más avanzados, ahora es posible generar y analizar diferentes tipos de medios. Por ejemplo, existen modelos que pueden generar imágenes basadas en descripciones de texto *(prompts* de imagen), y también modelos que podrían generar un texto basándose en una imagen (que en este caso haría el papel de *prompt),* pero también modelos que pueden componer música basada en ciertas instrucciones o emociones *(prompts* de audio). Esta evolución ha ampliado enormemente el alcance y las aplicaciones del *prompting,* permitiendo una gama más amplia de interacciones y generación de contenido.</span>

<span style="color: rgb(0, 0, 0);">Modelos capaces de entender *prompts* de diferentes tipos y generar resultados también de diferentes tipos serían los mencionados multimodales. Un ejemplo: introducir una imagen de un paisaje otoñal en un modelo de este tipo, y solicitar que genere un poema que capture la esencia de la imagen.</span>

<span style="color: rgb(0, 0, 0);">Este tipo de interacción representa una evolución emocionante en el campo del *prompting,* ya que amplía significativamente las formas en que podemos interactuar con los modelos de IA. Los *prompts* ya no están limitados al texto, sino que pueden abarcar una variedad de medios, incluidas imágenes, sonidos y quizás más en el futuro.</span>

<span style="color: rgb(0, 0, 0);">Esta funcionalidad tiene aplicaciones potenciales muy interesantes, no solo en el ámbito del arte y la creatividad, sino también en campos como la educación, donde podría emplearse para enseñar conceptos como la interpretación de imágenes, la escritura creativa o incluso la empatía y el entendimiento cultural.</span>

---

### <span style="color: rgb(0, 0, 0);">Tipos de *prompts*</span>

<span style="color: rgb(0, 0, 0);">Como acabamos de ver, a medida que la inteligencia artificial ha evolucionado, los *prompts* que podemos utilizar para interactuar con los modelos también lo han hecho. Mientras que en sus inicios el *prompting* se centraba exclusivamente en el texto, la tecnología actual permite una gama mucho más amplia de interacciones. </span>

<span style="color: rgb(0, 0, 0);">El desarrollo de la IA le permite abordar una amplia variedad de modalidades. Las "modalidades" en este contexto se refieren a las diferentes formas de datos o información que los sistemas de IA pueden procesar *(prompt* de entrada) o generar (salida de la IA). </span>

<span style="color: rgb(0, 0, 0);">En la siguiente tabla vamos a resumir todas las modalidades que la IA generativa nos ofrece. Cada una de las cuales admite uno o más tipos de *prompts.* </span>

<table border="1" cellpadding="0" cellspacing="0" class="MsoTable15Grid5DarkAccent2" id="bkmrk-prompt-%28entrada%29-res" style="border-collapse: collapse; border: none; mso-border-alt: solid white .5pt; mso-border-themecolor: background1; mso-yfti-tbllook: 1184; mso-padding-alt: 0cm 5.4pt 0cm 5.4pt;"><tbody><tr style="mso-yfti-irow: -1; mso-yfti-firstrow: yes; mso-yfti-lastfirstrow: yes;"><td style="width: 77.75pt; border: solid white 1.0pt; mso-border-themecolor: background1; border-right: none; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-left-alt: solid white .5pt; mso-border-left-themecolor: background1; mso-border-bottom-alt: solid white .5pt; mso-border-bottom-themecolor: background1; background: #ED7D31; mso-background-themecolor: accent2; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="104"><span style="color: rgb(0, 0, 0);">***Prompt* (entrada)**</span>

</td><td style="width: 99.2pt; border-top: solid white 1.0pt; mso-border-top-themecolor: background1; border-left: none; border-bottom: solid white 1.0pt; mso-border-bottom-themecolor: background1; border-right: none; mso-border-top-alt: solid white .5pt; mso-border-bottom-alt: solid white .5pt; background: #ED7D31; mso-background-themecolor: accent2; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="132"><span style="color: rgb(0, 0, 0);">**Respuesta IA (salida)**</span>

</td><td style="width: 247.75pt; border: solid white 1.0pt; mso-border-themecolor: background1; border-left: none; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-bottom-alt: solid white .5pt; mso-border-bottom-themecolor: background1; mso-border-right-alt: solid white .5pt; mso-border-right-themecolor: background1; background: #ED7D31; mso-background-themecolor: accent2; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="330"><span style="color: rgb(0, 0, 0);">**Ejemplo de uso**</span>

</td></tr><tr style="mso-yfti-irow: 0;"><td style="width: 77.75pt; border: solid white 1.0pt; mso-border-themecolor: background1; border-top: none; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-alt: solid white .5pt; background: #ED7D31; mso-background-themecolor: accent2; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="104"><span style="color: rgb(0, 0, 0);">**Texto**</span>

</td><td style="width: 99.2pt; border-top: none; border-left: none; border-bottom: solid white 1.0pt; mso-border-bottom-themecolor: background1; border-right: solid white 1.0pt; mso-border-right-themecolor: background1; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-left-alt: solid white .5pt; mso-border-left-themecolor: background1; mso-border-alt: solid white .5pt; mso-border-themecolor: background1; background: #F7CAAC; mso-background-themecolor: accent2; mso-background-themetint: 102; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="132"><span style="color: rgb(0, 0, 0);">Texto</span>

</td><td style="width: 247.75pt; border-top: none; border-left: none; border-bottom: solid white 1.0pt; mso-border-bottom-themecolor: background1; border-right: solid white 1.0pt; mso-border-right-themecolor: background1; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-left-alt: solid white .5pt; mso-border-left-themecolor: background1; mso-border-alt: solid white .5pt; mso-border-themecolor: background1; background: #F7CAAC; mso-background-themecolor: accent2; mso-background-themetint: 102; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="330"><span style="color: rgb(0, 0, 0);">Chatbot, traducción, resumen…</span>

</td></tr><tr style="mso-yfti-irow: 1;"><td style="width: 77.75pt; border: solid white 1.0pt; mso-border-themecolor: background1; border-top: none; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-alt: solid white .5pt; background: #ED7D31; mso-background-themecolor: accent2; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="104"><span style="color: rgb(0, 0, 0);">**Texto**</span>

</td><td style="width: 99.2pt; border-top: none; border-left: none; border-bottom: solid white 1.0pt; mso-border-bottom-themecolor: background1; border-right: solid white 1.0pt; mso-border-right-themecolor: background1; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-left-alt: solid white .5pt; mso-border-left-themecolor: background1; mso-border-alt: solid white .5pt; mso-border-themecolor: background1; background: #FBE4D5; mso-background-themecolor: accent2; mso-background-themetint: 51; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="132"><span style="color: rgb(0, 0, 0);">Imagen</span>

</td><td style="width: 247.75pt; border-top: none; border-left: none; border-bottom: solid white 1.0pt; mso-border-bottom-themecolor: background1; border-right: solid white 1.0pt; mso-border-right-themecolor: background1; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-left-alt: solid white .5pt; mso-border-left-themecolor: background1; mso-border-alt: solid white .5pt; mso-border-themecolor: background1; background: #FBE4D5; mso-background-themecolor: accent2; mso-background-themetint: 51; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="330"><span style="color: rgb(0, 0, 0);">Generación imagen desde texto</span>

</td></tr><tr style="mso-yfti-irow: 2;"><td style="width: 77.75pt; border: solid white 1.0pt; mso-border-themecolor: background1; border-top: none; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-alt: solid white .5pt; background: #ED7D31; mso-background-themecolor: accent2; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="104"><span style="color: rgb(0, 0, 0);">**Texto**</span>

</td><td style="width: 99.2pt; border-top: none; border-left: none; border-bottom: solid white 1.0pt; mso-border-bottom-themecolor: background1; border-right: solid white 1.0pt; mso-border-right-themecolor: background1; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-left-alt: solid white .5pt; mso-border-left-themecolor: background1; mso-border-alt: solid white .5pt; mso-border-themecolor: background1; background: #F7CAAC; mso-background-themecolor: accent2; mso-background-themetint: 102; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="132"><span style="color: rgb(0, 0, 0);">Video</span>

</td><td style="width: 247.75pt; border-top: none; border-left: none; border-bottom: solid white 1.0pt; mso-border-bottom-themecolor: background1; border-right: solid white 1.0pt; mso-border-right-themecolor: background1; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-left-alt: solid white .5pt; mso-border-left-themecolor: background1; mso-border-alt: solid white .5pt; mso-border-themecolor: background1; background: #F7CAAC; mso-background-themecolor: accent2; mso-background-themetint: 102; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="330"><span style="color: rgb(0, 0, 0);">Generación de video desde texto</span>

</td></tr><tr style="mso-yfti-irow: 3;"><td style="width: 77.75pt; border: solid white 1.0pt; mso-border-themecolor: background1; border-top: none; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-alt: solid white .5pt; background: #ED7D31; mso-background-themecolor: accent2; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="104"><span style="color: rgb(0, 0, 0);">**Texto**</span>

</td><td style="width: 99.2pt; border-top: none; border-left: none; border-bottom: solid white 1.0pt; mso-border-bottom-themecolor: background1; border-right: solid white 1.0pt; mso-border-right-themecolor: background1; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-left-alt: solid white .5pt; mso-border-left-themecolor: background1; mso-border-alt: solid white .5pt; mso-border-themecolor: background1; background: #FBE4D5; mso-background-themecolor: accent2; mso-background-themetint: 51; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="132"><span style="color: rgb(0, 0, 0);">Audio</span>

</td><td style="width: 247.75pt; border-top: none; border-left: none; border-bottom: solid white 1.0pt; mso-border-bottom-themecolor: background1; border-right: solid white 1.0pt; mso-border-right-themecolor: background1; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-left-alt: solid white .5pt; mso-border-left-themecolor: background1; mso-border-alt: solid white .5pt; mso-border-themecolor: background1; background: #FBE4D5; mso-background-themecolor: accent2; mso-background-themetint: 51; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="330"><span style="color: rgb(0, 0, 0);">Síntesis de voz, sistemas Text-To-Speech, generación de música</span>

</td></tr><tr style="mso-yfti-irow: 4;"><td style="width: 77.75pt; border: solid white 1.0pt; mso-border-themecolor: background1; border-top: none; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-alt: solid white .5pt; background: #ED7D31; mso-background-themecolor: accent2; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="104"><span style="color: rgb(0, 0, 0);">**Imagen** </span>

</td><td style="width: 99.2pt; border-top: none; border-left: none; border-bottom: solid white 1.0pt; mso-border-bottom-themecolor: background1; border-right: solid white 1.0pt; mso-border-right-themecolor: background1; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-left-alt: solid white .5pt; mso-border-left-themecolor: background1; mso-border-alt: solid white .5pt; mso-border-themecolor: background1; background: #F7CAAC; mso-background-themecolor: accent2; mso-background-themetint: 102; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="132"><span style="color: rgb(0, 0, 0);">Texto </span>

</td><td style="width: 247.75pt; border-top: none; border-left: none; border-bottom: solid white 1.0pt; mso-border-bottom-themecolor: background1; border-right: solid white 1.0pt; mso-border-right-themecolor: background1; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-left-alt: solid white .5pt; mso-border-left-themecolor: background1; mso-border-alt: solid white .5pt; mso-border-themecolor: background1; background: #F7CAAC; mso-background-themecolor: accent2; mso-background-themetint: 102; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="330"><span style="color: rgb(0, 0, 0);">Descripción imagen, reconocimiento óptico de caracteres (OCR)</span>

</td></tr><tr style="mso-yfti-irow: 5;"><td style="width: 77.75pt; border: solid white 1.0pt; mso-border-themecolor: background1; border-top: none; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-alt: solid white .5pt; background: #ED7D31; mso-background-themecolor: accent2; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="104"><span style="color: rgb(0, 0, 0);">**Imagen** </span>

</td><td style="width: 99.2pt; border-top: none; border-left: none; border-bottom: solid white 1.0pt; mso-border-bottom-themecolor: background1; border-right: solid white 1.0pt; mso-border-right-themecolor: background1; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-left-alt: solid white .5pt; mso-border-left-themecolor: background1; mso-border-alt: solid white .5pt; mso-border-themecolor: background1; background: #FBE4D5; mso-background-themecolor: accent2; mso-background-themetint: 51; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="132"><span style="color: rgb(0, 0, 0);">Imagen</span>

</td><td style="width: 247.75pt; border-top: none; border-left: none; border-bottom: solid white 1.0pt; mso-border-bottom-themecolor: background1; border-right: solid white 1.0pt; mso-border-right-themecolor: background1; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-left-alt: solid white .5pt; mso-border-left-themecolor: background1; mso-border-alt: solid white .5pt; mso-border-themecolor: background1; background: #FBE4D5; mso-background-themecolor: accent2; mso-background-themetint: 51; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="330"><span style="color: rgb(0, 0, 0);">Colorización de imágenes en blanco y negro, superresolución, estilo transfer entre imágenes</span>

</td></tr><tr style="mso-yfti-irow: 6;"><td style="width: 77.75pt; border: solid white 1.0pt; mso-border-themecolor: background1; border-top: none; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-alt: solid white .5pt; background: #ED7D31; mso-background-themecolor: accent2; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="104"><span style="color: rgb(0, 0, 0);">**Audio** </span>

</td><td style="width: 99.2pt; border-top: none; border-left: none; border-bottom: solid white 1.0pt; mso-border-bottom-themecolor: background1; border-right: solid white 1.0pt; mso-border-right-themecolor: background1; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-left-alt: solid white .5pt; mso-border-left-themecolor: background1; mso-border-alt: solid white .5pt; mso-border-themecolor: background1; background: #F7CAAC; mso-background-themecolor: accent2; mso-background-themetint: 102; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="132"><span style="color: rgb(0, 0, 0);">Texto</span>

</td><td style="width: 247.75pt; border-top: none; border-left: none; border-bottom: solid white 1.0pt; mso-border-bottom-themecolor: background1; border-right: solid white 1.0pt; mso-border-right-themecolor: background1; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-left-alt: solid white .5pt; mso-border-left-themecolor: background1; mso-border-alt: solid white .5pt; mso-border-themecolor: background1; background: #F7CAAC; mso-background-themecolor: accent2; mso-background-themetint: 102; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="330"><span style="color: rgb(0, 0, 0);">Transcripción automática, reconocimiento de voz</span>

</td></tr><tr style="mso-yfti-irow: 7;"><td style="width: 77.75pt; border: solid white 1.0pt; mso-border-themecolor: background1; border-top: none; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-alt: solid white .5pt; background: #ED7D31; mso-background-themecolor: accent2; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="104"><span style="color: rgb(0, 0, 0);">**Audio** </span>

</td><td style="width: 99.2pt; border-top: none; border-left: none; border-bottom: solid white 1.0pt; mso-border-bottom-themecolor: background1; border-right: solid white 1.0pt; mso-border-right-themecolor: background1; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-left-alt: solid white .5pt; mso-border-left-themecolor: background1; mso-border-alt: solid white .5pt; mso-border-themecolor: background1; background: #FBE4D5; mso-background-themecolor: accent2; mso-background-themetint: 51; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="132"><span style="color: rgb(0, 0, 0);">Audio</span>

</td><td style="width: 247.75pt; border-top: none; border-left: none; border-bottom: solid white 1.0pt; mso-border-bottom-themecolor: background1; border-right: solid white 1.0pt; mso-border-right-themecolor: background1; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-left-alt: solid white .5pt; mso-border-left-themecolor: background1; mso-border-alt: solid white .5pt; mso-border-themecolor: background1; background: #FBE4D5; mso-background-themecolor: accent2; mso-background-themetint: 51; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="330"><span style="color: rgb(0, 0, 0);">Eliminación de ruido, cambio de tono o velocidad</span>

</td></tr><tr style="mso-yfti-irow: 8;"><td style="width: 77.75pt; border: solid white 1.0pt; mso-border-themecolor: background1; border-top: none; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-alt: solid white .5pt; background: #ED7D31; mso-background-themecolor: accent2; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="104"><span style="color: rgb(0, 0, 0);">**Video**</span>

</td><td style="width: 99.2pt; border-top: none; border-left: none; border-bottom: solid white 1.0pt; mso-border-bottom-themecolor: background1; border-right: solid white 1.0pt; mso-border-right-themecolor: background1; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-left-alt: solid white .5pt; mso-border-left-themecolor: background1; mso-border-alt: solid white .5pt; mso-border-themecolor: background1; background: #F7CAAC; mso-background-themecolor: accent2; mso-background-themetint: 102; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="132"><span style="color: rgb(0, 0, 0);">Texto</span>

</td><td style="width: 247.75pt; border-top: none; border-left: none; border-bottom: solid white 1.0pt; mso-border-bottom-themecolor: background1; border-right: solid white 1.0pt; mso-border-right-themecolor: background1; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-left-alt: solid white .5pt; mso-border-left-themecolor: background1; mso-border-alt: solid white .5pt; mso-border-themecolor: background1; background: #F7CAAC; mso-background-themecolor: accent2; mso-background-themetint: 102; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="330"><span style="color: rgb(0, 0, 0);">Subtitulación, descripción automática del contenido </span>

</td></tr><tr style="mso-yfti-irow: 9;"><td style="width: 77.75pt; border: solid white 1.0pt; mso-border-themecolor: background1; border-top: none; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-alt: solid white .5pt; background: #ED7D31; mso-background-themecolor: accent2; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="104"><span style="color: rgb(0, 0, 0);">**Video**</span>

</td><td style="width: 99.2pt; border-top: none; border-left: none; border-bottom: solid white 1.0pt; mso-border-bottom-themecolor: background1; border-right: solid white 1.0pt; mso-border-right-themecolor: background1; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-left-alt: solid white .5pt; mso-border-left-themecolor: background1; mso-border-alt: solid white .5pt; mso-border-themecolor: background1; background: #FBE4D5; mso-background-themecolor: accent2; mso-background-themetint: 51; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="132"><span style="color: rgb(0, 0, 0);">Video</span>

</td><td style="width: 247.75pt; border-top: none; border-left: none; border-bottom: solid white 1.0pt; mso-border-bottom-themecolor: background1; border-right: solid white 1.0pt; mso-border-right-themecolor: background1; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-left-alt: solid white .5pt; mso-border-left-themecolor: background1; mso-border-alt: solid white .5pt; mso-border-themecolor: background1; background: #FBE4D5; mso-background-themecolor: accent2; mso-background-themetint: 51; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="330"><span style="color: rgb(0, 0, 0);">Mejora de resolución de video, transferencia de estilos de videos</span>

</td></tr><tr style="mso-yfti-irow: 10; mso-yfti-lastrow: yes;"><td style="width: 77.75pt; border: solid white 1.0pt; mso-border-themecolor: background1; border-top: none; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-alt: solid white .5pt; background: #ED7D31; mso-background-themecolor: accent2; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="104"><span style="color: rgb(0, 0, 0);">**Combinación de anteriores**</span>

</td><td style="width: 99.2pt; border-top: none; border-left: none; border-bottom: solid white 1.0pt; mso-border-bottom-themecolor: background1; border-right: solid white 1.0pt; mso-border-right-themecolor: background1; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-left-alt: solid white .5pt; mso-border-left-themecolor: background1; mso-border-alt: solid white .5pt; mso-border-themecolor: background1; background: #F7CAAC; mso-background-themecolor: accent2; mso-background-themetint: 102; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="132"><span style="color: rgb(0, 0, 0);">Cualquiera o una combinación de las anteriores</span>

</td><td style="width: 247.75pt; border-top: none; border-left: none; border-bottom: solid white 1.0pt; mso-border-bottom-themecolor: background1; border-right: solid white 1.0pt; mso-border-right-themecolor: background1; mso-border-top-alt: solid white .5pt; mso-border-top-themecolor: background1; mso-border-left-alt: solid white .5pt; mso-border-left-themecolor: background1; mso-border-alt: solid white .5pt; mso-border-themecolor: background1; background: #F7CAAC; mso-background-themecolor: accent2; mso-background-themetint: 102; padding: 0cm 5.4pt 0cm 5.4pt;" valign="top" width="330"><span style="color: rgb(0, 0, 0);">MULTIMODALIDAD: Sistemas que pueden recibir una imagen y una pregunta en texto sobre esa imagen, y proporcionar una respuesta en texto o audio.</span>

</td></tr></tbody></table>

<span style="color: rgb(0, 0, 0);"> </span><span style="color: rgb(0, 0, 0);">Estas son algunas de las principales modalidades en las que operan los sistemas de IA. Pero hay que subrayar que la investigación en IA está en constante evolución, y con el tiempo es probable que veamos aún más capacidades y combinaciones en términos de modalidades.</span>

<span style="font-size: 10.5pt; line-height: 107%; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">A continuación, examinaremos con mayor profundidad algunas posibilidades de los tipos de *prompts* de uso mas común </span><span style="font-size: 11pt; line-height: 107%; font-family: Calibri, sans-serif; color: rgb(0, 0, 0);"> </span>

#### <span style="color: rgb(0, 0, 0);">*Prompts* de Texto</span>

<span style="color: rgb(0, 0, 0);">El texto ha sido tradicionalmente el medio más común para el *prompting* en IA. Los *prompts* de texto se introducen generalmente en forma de preguntas o indicaciones. Dentro de los prompts de texto podemos distinguir en base al tipo de respuesta que queremos obtener:</span>

- <span style="color: rgb(0, 0, 0);">***Prompts* abiertos vs cerrados:**</span>

<span style="color: rgb(0, 0, 0);">Los prompts abiertos son aquellos que no limitan las respuestas de la IA, como "Háblame sobre el cambio climático".</span>

<span style="color: rgb(0, 0, 0);">Los *prompts* cerrados, en cambio, buscan respuestas específicas, como "¿En qué año nació Albert Einstein?".</span>

- <span style="color: rgb(0, 0, 0);">***Prompts* de selección múltiple.** A veces, se presenta a la IA una serie de opciones y se le pide que elija la correcta o la más adecuada según el contexto. Por ejemplo: "¿Cuál es la capital de Francia? A) Madrid, B) Berlín, C) París".</span>

- <span style="color: rgb(0, 0, 0);">***Prompts* de texto libre.** Son aquellos en los que se le da libertad a la IA para generar contenido, como "Escribe un cuento corto sobre un robot".</span>

#### <span style="color: rgb(0, 0, 0);">*Prompts* Visuales</span>

<span style="color: rgb(0, 0, 0);">Con la evolución de los modelos de IA hacia capacidades multimodales, es posible usar imágenes o videos como *prompts*. Con estos *prompts* se le puede solicitar<span style="mso-spacerun: yes;"> </span>a la IA que describa la imagen, identifique objetos en ella o, <span style="mso-spacerun: yes;"> </span>como se mencionó anteriormente, genere texto creativo inspirado en la imagen. También puede pedírsele una salida de la imagen o video mejorada o modificada.</span><span style="color: rgb(0, 0, 0);"> </span>

#### <span style="color: rgb(0, 0, 0);">*Prompts* de Audio</span>

<span style="color: rgb(0, 0, 0);">La capacidad de procesar y generar audio ha abierto una nueva dimensión en el mundo del *prompting.* Los *prompts* de audio pueden variar desde simples indicaciones verbales hasta la introducción de fragmentos de música o sonidos específicos.</span>

- <span style="color: rgb(0, 0, 0);">**Sonidos.** Se pueden usar para que la IA identifique o describa, como el canto de un pájaro o el ruido de la lluvia.</span>

- <span style="color: rgb(0, 0, 0);">**Música.** Puede servir como inspiración para que la IA genere letras de canciones, identifique el género musical o incluso cree una melodía complementaria.</span>

<span style="color: rgb(0, 0, 0);">Estos son solo ejemplos de las posibilidades ya explotadas y de uso frecuente. La versatilidad y el potencial de la inteligencia artificial moderna abre un mar de posibilidades. Ya no estamos limitados a interacciones basadas en texto; la IA ahora tiene la capacidad de comprender y generar contenido en una variedad de medios, lo que permite aplicaciones mucho más ricas y diversificadas en numerosos campos.</span>

---

### <span style="color: rgb(0, 0, 0);">Cómo funciona el </span>*prompting*<span style="color: rgb(0, 0, 0);"> en IA</span>  


<span style="color: rgb(0, 0, 0);">El *prompting* en la inteligencia artificial, desde el punto de vista del usuario, se resume en proporcionar una entrada más o menos elaborada y esperar una respuesta, si bien este proceso, muchas de las veces, requerirá de un cierto número de iteraciones hasta que la IA nos genere la respuesta conveniente.</span>

<span style="color: rgb(0, 0, 0);"><span style="mso-spacerun: yes;"> </span>Detrás de cada respuesta generada por un modelo de IA, hay una serie de procesos y tecnologías complejas. Vamos a realizar una ligera introducción que nos permita entender conceptualmente cómo funcionan estos sistemas, centrandonos en el Procesamiento del Lenguaje Natural (PLN) dado que es el que, en principio, más nos puede interesar como docentes. Si bien, veremos que conceptualmente el funcionamiento interno de los modelos tiene muchas similitudes independientemente de que se trate de un modo u otro.</span>

![image.png](https://libros.catedu.es/uploads/images/gallery/2023-11/scaled-1680-/IZUimage.png)

Un poco de humor para una aproximación intuitiva al funcionamiento de la IA. Si el ingles no se te da muy bien, prueba a copiar y pegar la imagen en un chatbot, por ejemplo Bard, pídele que te explique el chiste y se estigo de una de las capacidades actuales de la IA.

#### <span style="color: rgb(0, 0, 0);">El *prompting* en el Procesamiento de Lenguaje Natural (PLN)</span>

<span style="color: rgb(0, 0, 0);">Hemos visto que una parte de la IA se centra en los modelos *Text2Text.* Estos modelos requieren la introducción de un texto y devuelven otro texto como respuesta, ya sea una respuesta concreta, una conversación con un Chatbot, un resumen, una traducción…</span>

<span style="color: rgb(0, 0, 0);">La tecnología que hay debajo de esta modalidad es el Procesamiento de Lenguaje Natural (PLN)</span>

<span style="color: rgb(0, 0, 0);">El PLN, como sabemos, es una rama de la inteligencia artificial que se centra en la interacción entre las computadoras y el lenguaje humano. Su objetivo es permitir que las máquinas entiendan, interpreten y generen lenguaje de manera que sea valioso para los usuarios humanos.</span>

<span style="color: rgb(0, 0, 0);">El *prompt* es la entrada que la computadora debe entender, interpretar y utilizar para elaborar una respuesta útil.<span style="mso-spacerun: yes;"> </span>Al proporcionar un prompt textual, el modelo de lA procederá primero a su análisis. El **análisis del *prompt*** puede dividirse en los siguientes pasos:</span>

- <span style="color: rgb(0, 0, 0);">**Identificación de las palabras clave:** El sistema identifica las palabras clave en el *prompt.* Estas palabras clave son importantes para comprender su significado.</span>
- <span style="color: rgb(0, 0, 0);">**Análisis de la estructura gramatical:** El sistema analiza la estructura gramatical del *prompt,* lo que ayuda al sistema a comprender la relación entre las palabras y frases introducidas por el usuario.</span>
- <span style="color: rgb(0, 0, 0);">**Identificación del contexto:** El sistema identifica el contexto del *prompt.* Esto ayuda al sistema a comprender mejor su significado dentro del contexto de la conversación o tarea en la que se está utilizando.</span>

<span style="color: rgb(0, 0, 0);">Una vez que el sistema ha completado el análisis, puede comprender el significado y propósito del *prompt,* y le permite generar una respuesta adecuada.</span>

<span style="color: rgb(0, 0, 0);">**Veamos un ejemplo sencillo:**</span>

<span style="color: rgb(0, 0, 0);">Prompt: ¿Cuál es la capital de España?</span>

- <span style="color: rgb(0, 0, 0);">Identificación de las palabras clave: Si el *prompt* es "¿Cuál es la capital de España?", las palabras clave serían "capital" y "España".</span>
- <span style="color: rgb(0, 0, 0);">Análisis de la estructura gramatical: Si el *prompt* es "¿Cuál es la capital de España?", la estructura gramatical es una pregunta.</span>
- <span style="color: rgb(0, 0, 0);">Identificación del contexto: Si el *prompt* es "¿Cuál es la capital de España?", el contexto es una conversación sobre geografía.</span>

<span style="color: rgb(0, 0, 0);">Obviamente la respuesta que da el sistema es: Madrid</span>

<span style="color: rgb(0, 0, 0);">Sin embargo, cambiando un poco el contexto, el chatbot Chat GPT nos contesta </span>

<span style="color: rgb(0, 0, 0);">![](https://libros.catedu.es/uploads/images/gallery/2023-10/embedded-image-s6yvmmzf.png)</span>

<span style="color: rgb(0, 0, 0);">Y si le preguntamos lo mismo a Bard (Chatbot de Google):</span>

<span style="color: rgb(0, 0, 0);">![](https://libros.catedu.es/uploads/images/gallery/2023-10/embedded-image-abqnhmgf.png)</span>

<span style="color: rgb(0, 0, 0);">Las respuestas son similares pero no idénticas. El corpus de documentación con la que se les ha entrenado será muy similar (básicamente todo el conocimiento humano "verificado" que pueda estar presente en internet hasta cierto momento) pero el proceso de entrenamiento y los algoritmos que procesan el *prompt* y generan la respuesta puede ser diferente.</span>

<span style="color: rgb(0, 0, 0);">Si bien *ChatGPT* ofrece una única respuesta inicial que puede ser modificada si se matiza el *prompt, Bard* presenta una respuesta principal y ofrece la posibilidad de, sin hacer matizaciones al *prompt* inicial, escoger entre 3 posibles respuestas:</span>

<span style="color: rgb(0, 0, 0);">![](https://libros.catedu.es/uploads/images/gallery/2023-10/embedded-image-gplik7mb.png)</span>

<p class="callout warning"><span style="color: rgb(0, 0, 0);">Este ejemplo nos sirve para entender que distintos chatbots pueden generar distintas respuestas ante un mismo *prompt* y que es preciso realizar verificaciones de las mismas y no darlas por buenas sin mas. </span></p>

<span style="color: rgb(0, 0, 0);">Para entender más a fondo el funcionamiento interno de la IA, cómo esta es capaz de interpretar el *prompt* y dar una respuesta adecuada, profundizamos un poco y analizamos con mayor detalle los sencillos pasos descritos previamente. Introducimos además algo de lenguaje técnico muy presente en el ámbito de la IA, por lo que conviene familiarizarse con él (algunos de los conceptos y mecanismos ya se estudiaron en el módulo 2)</span>

- <span style="color: rgb(0, 0, 0);">**Tokenización.** El modelo comienza por dividir el *prompt* en **tokens**, que son fragmentos más pequeños del texto, como palabras o subpalabras (conjuntos de letras dentro de una palabra, prefijos, sufijos...).</span>

- <span style="color: rgb(0, 0, 0);">**Embedding del texto.** Cada token se convierte en un **vector numérico**, conocido como ***embedding.*** Estos *embeddings* se obtienen de grandes matrices preentrenadas que representan palabras o subpalabras en un espacio vectorial, donde palabras semánticamente similares están cercanas entre sí. Así cada *embedding* es una representación numérica de cada token que captura su semántica y significado. Dicha representación se basa en la cercanía semántica del contenido con respecto a la vasta información con la que el modelo ha sido entrenado.</span>

- <span style="color: rgb(0, 0, 0);">**Procesamiento Interno.** </span>
    - <span style="color: rgb(0, 0, 0);">***Codificador:*** El modelo procesa estos embeddings para entender el contexto y la relación entre los tokens. Esto se hace a través de múltiples capas de la red neuronal y mecanismos como la atención, que le permite al modelo darle un mayor peso o importancia a ciertos tokens en función de su relevancia en el contexto. Tras este procesamiento el modelo transforma los emmbedings (recuerda que es el prompt textual en forma de vector) en un conjunto compacto de características. Es decir, se reduce la dimensionalidad del vector original convirtiéndolo en algo más compacto pero que incluye todas sus características. Podríamos decir que capta la esencia del prompt.</span>
    - <span style="color: rgb(0, 0, 0);">***Decodificador:*** Usando la información contextual obtenida, el modelo genera una respuesta token por token, basándose en probabilidades y contextos aprendidos durante el entrenamiento. </span>

- - <span style="color: rgb(0, 0, 0);">**Ejemplo de este proceso. Mecanismo de estudio:** Normalmente los textos no se aprenden de manera literal sino que, para estudiarlos, se procede a entender el contexto de un hecho concreto y únicamente se memorizan los conceptos mas relevantes en relación con ese hecho. Este sería nuestro entrenamiento previo del "modelo de estudio". Si después nos preguntan por lo estudiado (lo que equivaldría al *prompt),* nuestro cerebro va a analizar la pregunta extrayendo de la misma aquellas palabras más relevantes en relación al contexto de la pregunta para poder construir la respuesta posterior (estaría codificando el prompt, reduciendo sus dimensiones, agrupando toda la información relevante de la pregunta para convertirlo en *algo* compacto con significado propio). Por ultimo, nuestro cerebro comienza a construir una respuesta coherente en base a los conceptos y contexto relevante de la pregunta y cuyo contenido esta relacionado con la misma y se nutre de lo estudiado. En términos de IA, el contenido de la pregunta, compactado en un emmbeding, tiene un significado cercano en la nube de palabras y conceptos de entrenamiento.</span>

- <span style="color: rgb(0, 0, 0);">**Generación Iterativa**: La respuesta textual se genera de manera iterativa, considerando no solo el prompt inicial, sino también las palabras o tokens previamente generados para asegurar coherencia.</span>

- <span style="color: rgb(0, 0, 0);">**Resultado Final**: El modelo produce una secuencia de texto que sirve como respuesta o continuación del prompt.</span>

#### <span style="color: rgb(0, 0, 0);">El *prompting* en otros modelos de generación</span>

<span style="color: rgb(0, 0, 0);">Los modelos de texto a imagen o audio transforman descripciones textuales en representaciones visuales o de audio. El proceso interno coincide en la parte de comprensión del prompt con el detallado en el apartado anterior si bien difiere en la generación ya que en este caso se trata de una imagen o sonido en lugar de un texto. El proceso sería conceptualmente muy similar al descrito si bien existen algunas especificidades. Vamos a introducir los matices necesarios para adaptar la descripción realizada para el </span>proceso *prompting* para la generación de texto al proceso para generar imágenes.

- **Tokenización.** Al igual que con el texto, las imágenes también pueden ser divididas en tokens, aunque de una manera diferente. Aquí, los tokens pueden representar ciertos segmentos o características de la imagen. Estos segmentos no son necesariamente "sub-imágenes", sino más bien patrones visuales o características identificables.
- **Embedding del texto.** Al igual que con el texto, cada token de imagen se convierte en un vector numérico. Sin embargo, estos embeddings capturan características visuales en lugar de semánticas.
- **Proceso interno.** Al generar una imagen, el modelo no produce una palabra o token a la vez, sino que puede generar o refinar zonas de la imagen de manera iterativa hasta que se complete la imagen deseada.

- **Ejemplo.** Imagina que estás pintando un paisaje. En lugar de memorizar y reproducir cada detalle exactamente, recuerdas los conceptos principales (montañas, cielo, árboles) y los pintas basándote en esa memoria y la interpretación del *prompt* (por ejemplo, "paisaje al atardecer").

Tanto para imagen como para otros casos, como el audio, los pasos son muy similares a lo descrito para el texto, con la principal diferencia de que el tipo de contenido que se está procesando y generando es distinto.

<span style="color: rgb(0, 0, 0);">Es importante mencionar que la calidad y la precisión del texto, imagen o audio generado dependen en gran medida del modelo específico, de la cantidad y calidad de los datos con los que fue entrenado, y de la claridad y especificidad del *prompt* textual proporcionado. Este último aspecto es el que desarrollaremos a continuación.</span>

---

### <span style="color: rgb(0, 0, 0);">Importancia en el diseño de *prompts*</span>

<span style="color: rgb(0, 0, 0);">En la interacción con modelos de inteligencia artificial generativos, el diseño de los prompts juega un papel crucial. Determinan no solo la calidad de la respuesta del modelo, sino también su utilidad, precisión y seguridad. Vamos a explorar algunos aspectos clave relacionados con el diseño de prompts.</span>

#### <span style="color: rgb(0, 0, 0);">Claridad y ambigüedad en la redacción de *prompts*</span>

- <span style="color: rgb(0, 0, 0);">**Importancia de la claridad.** Un *prompt* claro orienta al modelo de IA hacia una respuesta específica y relevante. Los modelos generativos dependen en gran medida de la precisión del input proporcionado. Por ejemplo, preguntar "¿Cuál es la capital de Francia?" es directo y produce una respuesta clara, mientras que "Dime algo sobre Europa" es ambiguo y puede resultar en una variedad de respuestas.</span>

- <span style="color: rgb(0, 0, 0);">**Riesgos de la Ambigüedad.** Los *prompts* ambiguos pueden llevar a respuestas imprecisas o incluso incorrectas. Además, en aplicaciones críticas como atención médica o decisiones financieras, la ambigüedad puede tener consecuencias graves.</span>

#### <span style="color: rgb(0, 0, 0);">*Prompts* pre-entrenados vs customizados</span>

- <span style="color: rgb(0, 0, 0);">***Prompts* pre-entrenados.** Son aquellos que ya han sido probados y optimizados durante el entrenamiento del modelo. Estos prompts son generalmente efectivos para tareas comunes y ofrecen respuestas consistentes. La naturaleza "pre-entrenada" no significa que estén codificados o predeterminados en el modelo. Más bien, se han probado y se sabe que producen buenos resultados debido a la amplia cobertura de esos temas en los datos de entrenamiento.</span>

- <span style="color: rgb(0, 0, 0);">***Prompts* customizados.** Permiten a los usuarios adaptar el modelo a necesidades específicas o contextos particulares. Aunque ofrecen flexibilidad, requieren una comprensión más profunda del modelo y a menudo implican un proceso iterativo de prueba y error para afinar el resultado final.</span>

<span style="color: rgb(0, 0, 0);">**Equilibrio entre ambos:** Es recomendable comenzar con prompts pre-entrenados y luego personalizarlos según las necesidades, aprovechando lo mejor de ambos mundos.</span>

- <span style="color: rgb(0, 0, 0);">**Ilustremos esta recomendación con un ejemplo sencillo:**</span>

<span style="color: rgb(0, 0, 0);">Contexto: Imagina que eres un profesor de historia que desea usar un modelo de lenguaje para ayudar a sus estudiantes a comprender mejor los eventos históricos. Quieres que el modelo describa la Revolución Francesa en un lenguaje sencillo y fácil de entender.</span>

<span style="color: rgb(0, 0, 0);">Podríamos usar un *prompt* pre-entrenado como: *"Describa la Revolución Francesa."*</span>

<span style="color: rgb(0, 0, 0);">La respuesta que obtendrías podría ser amplia y general, ofreciendo un resumen sobre la Revolución Francesa, sus causas, eventos clave y consecuencias.</span>

<span style="color: rgb(0, 0, 0);">Pero podremos ajustar mas la respuesta del modelo a nuestra necesidad si utilizamos un prompt personalizado (Customizado) basado en el Pre-entrenado como:</span>

<span style="color: rgb(0, 0, 0);">*"Describa la Revolución Francesa en un lenguaje simple y adecuado para estudiantes de secundaria, mencionando sus causas principales, eventos clave y figuras importantes y con una extensión aproximada de XX palabras."*</span>

<span style="color: rgb(0, 0, 0);">Este *prompt* customizado toma la base del *prompt* pre-entrenado (la descripción de la Revolución Francesa) pero añade especificaciones para adaptar la respuesta a las necesidades del profesor: un lenguaje sencillo, la extensión y ciertos puntos clave que deben ser mencionados.</span>

<span style="color: rgb(0, 0, 0);">Como resultado, al usar el *prompt* personalizado, el profesor puede esperar obtener una descripción adaptada al nivel educativo de sus estudiantes, centrándose en los puntos más relevantes para su plan de estudio. Al mismo tiempo, al partir de una base pre-entrenada, garantiza que el tema central sea tratado con precisión.</span>

<span style="color: rgb(0, 0, 0);">En este ejemplo, el profesor combina la claridad y efectividad de un *prompt* pre-entrenado con las adaptaciones específicas de un *prompt* customizado, obteniendo una respuesta que se adapta perfectamente a sus necesidades educativas.</span>

#### <span style="color: rgb(0, 0, 0);">Aspectos clave en el diseño de *prompts*</span>

<span style="color: rgb(0, 0, 0);">Desde un punto de vista practico debemos tener en cuenta ciertas pautas a la hora de diseñar un *prompt,* algunas de la claves son:</span>

- <span style="color: rgb(0, 0, 0);">**Claridad y especificidad.** Es fundamental ser explícito sobre lo que se espera del modelo. Una instrucción clara y detallada reduce la ambigüedad y guía al modelo hacia la respuesta deseada. Por ejemplo, en lugar de escribir "resumir esto", se podría escribir "resumir este artículo de 5 páginas sobre la historia del arte renacentista".</span>
- <span style="color: rgb(0, 0, 0);">**Contextualización.** Proporcionar contexto ayuda al modelo a entender mejor la tarea y a generar respuestas adecuadas. Si estás preguntando sobre un tema que sigue a una discusión anterior, recapitula o refiere a esa información previa.</span>
- <span style="color: rgb(0, 0, 0);">**Limitación de la respuesta.** En ocasiones, es útil establecer límites para la respuesta. Si solo necesitas una respuesta breve o en un formato específico (por ejemplo, una lista o una tabla), indica eso en tu *prompt.*</span>
- <span style="color: rgb(0, 0, 0);">**Iteración y refinamiento.** No todos los prompts darán el resultado deseado en el primer intento. Evaluar las respuestas, identificar áreas de mejora y ajustar la instrucción puede ser esencial para obtener una respuesta óptima.</span>
- <span style="color: rgb(0, 0, 0);">**Evitar sesgos y suposiciones.** Es importante recordar que los modelos reflejan el conocimiento y los sesgos presentes en los datos con los que fueron entrenados. Evita formular preguntas que incluyan suposiciones innecesarias o sesgadas. En su lugar, esfuérzate por ser neutral y objetivo.</span>

<p class="callout warning"><span style="color: rgb(0, 0, 0);">Por muy bien diseñado que esté un *prompt,* no debemos olvidar que los modelos del lenguaje pueden **alucinar**. Las alucinaciones son una preocupación común cuando se trata de modelos de lenguaje grande como ChatGPT. Estos modelos pueden generar respuestas que parecen plausibles pero que son completamente falsas. Es importante recordar que estos modelos no tiene una comprensión real del mundo y pueden generar información incorrecta. Por lo tanto, siempre es esencial verificar cualquier afirmación que haga el modelo.</span></p>


#### <span style="color: rgb(0, 0, 0);">Consideraciones éticas en el diseño de *prompts*</span>

<span style="color: rgb(0, 0, 0);">En relación con algunos de los aspectos mencionados anteriormente como las alucinaciones o los sesgos, debemos tener muy en cuenta las consideraciones éticas en el diseño de *prompts.* Esto es un anticipo de lo que veremos en el módulo 5, con una unidad dedicada a las consideraciones éticas de la IA.</span>

<p class="callout warning"><span style="color: rgb(0, 0, 0);">**Sesgos y prejuicios.** Es fundamental ser consciente de los sesgos inherentes en los modelos de IA, que provienen de los datos con los que fueron entrenados. Diseñar *prompts* sin considerar estos sesgos puede perpetuar o amplificar prejuicios existentes.</span></p>

<p class="callout warning"><span style="color: rgb(0, 0, 0);">**Privacidad.** Al diseñar *prompts,* especialmente en aplicaciones educativas o médicas, es vital garantizar que no se solicite ni se revele información personal o sensible.</span></p>

<p class="callout warning"><span style="color: rgb(0, 0, 0);">**Claridad en las intenciones.** Debe evitarse el diseño de *prompts* que busquen respuestas engañosas, manipuladoras o con fines malintencionados. Es esencial que los desarrolladores y usuarios tengan responsabilidad en la interacción ética con los modelos.</span></p>

<p class="callout warning"><span style="color: rgb(0, 0, 0);">**Educación y formación.** Para quienes diseñan y utilizan *prompts,* es fundamental recibir formación en ética y responsabilidad. Con la creciente dependencia de la IA en muchos ámbitos, se debe garantizar que se utilice de manera beneficiosa y justa.</span></p>

<span style="color: rgb(0, 0, 0);">El diseño de *prompts,* por lo tanto, no es simplemente una cuestión técnica. Implica consideraciones de claridad, adaptabilidad y ética. Un diseño de *prompt* bien pensado puede maximizar la eficacia de la IA, mientras que un diseño deficiente o irresponsable puede llevar a resultados no deseados o incluso perjudiciales.</span>

---

### Uso y ejemplos de *prompting* en educación

Vamos a ver a continuación algunos ejemplos de aplicación del *prompting* con propósitos educativos <span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">(válidos para profesores, alumnos y en general cualquiera que esté interesado en enseñar o aprender sobre un tema específico)</span>. Lo haremos a modo ilustrativo trabajando con *ChatGPT,* pero el proceso de diseño e iteración es similar para cualquier chatbot y muy semejante en cualquier herramienta de IA generativa.

![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/iVtimage.png)Imagen propia. Generada por el Generador de imágenes de Bing

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Tenemos claro que **unas instrucciones precisas, son** la clave para obtener las respuestas adecuadas</span><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; background: white; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">. También que en ocasiones será necesario **iterar** varias veces hasta dar con la indicación que nos dé la mejor salida. Pero una vez encontrada la indicación (*prompt*) que funciona, podemos usarla tantas veces como necesitemos, esperando recibir en todas las ocasiones, una respuesta similar y adecuada.</span>

<p class="callout info"><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Una **recomendación** importante, independientemente del chatbot utilizado (*ChatGPT, Bard, Claude, Bing*…) es que cada vez que iniciemos un chat para trabajar un nuevo tema, nos **mantengamos dentro del mismo** en la medida de los posible. De esta manera, el contexto de la conversación será de ayuda para que el chatbot entienda mejor tus indicaciones. Igualmente, si cambias de tema, abre un nuevo chat.</span></p>

<p class="callout info"><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Se ha de **tener en cuenta** a su vez, la **longitud del *prompt*** que introduzcamos. Dependiendo del chatbot utilizado y de la evolución de la conversación, variará la longitud máxima recomendada a partir de la cual la respuesta puede no ser tan precisa como se esperaría. Esta longitud puede variar entre 500 y 2000 palabras dependiendo de los casos. </span></p>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Comenzaremos con ejemplo de *prompts* **básicos** e iremos añadiendo complejidad sucesivamente.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Para facilitar la comprensión de temas que resulten difíciles de comprender, obtener las ideas clave sobre un tema, recibir consejos de estudio, evaluar sobre la evolución en el aprendizaje y en general empezar a aprender sobre un tema nuevo podemos introducir los siguientes *<span style="background-color: rgb(191, 237, 210);">prompts</span>:*</span>

<p class="callout success"><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">¿Puedes explicar \[*<span style="border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">tema</span>*\] de manera simple?</span></p>

<p class="callout success"><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">¿Cuáles son los aspectos más importantes sobre \[*<span style="border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">tema</span>*\]?</span></p>

<p class="callout success"><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">¿Puedes hacerme una prueba para evaluar lo que he aprendido sobre \[*<span style="border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">tema</span>*\]?</span></p>

<p class="callout success"><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">¿Dime algún consejo para estudiar y memorizar información relacionada con \[*<span style="border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">tema</span>*\]?</span></p>

<p class="callout success"><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Resume el texto siguiente en forma de lista con los puntos más importantes. Texto: \[pegar*<span style="border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;"> texto</span>*\]</span></p>

<p class="callout success"><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Resume el libro en forma de lista con los puntos más importantes. libro: \[*<span style="border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">título del libro</span>*\]</span></p>

<p class="callout success"><span style="font-size: 10.5pt; line-height: 107%; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: Calibri; mso-fareast-theme-font: minor-latin; color: #333333; mso-ansi-language: ES; mso-fareast-language: EN-US; mso-bidi-language: AR-SA;">Resume el texto siguiente en forma de lista con los puntos más importantes de la página web: \[*<span style="font-family: 'Segoe UI',sans-serif; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">insertar URL</span>*\]</span></p>

<p class="callout info">El tema, texto, título del libro, URL, etc... al que nos estemos refiriendo, **No** hay que introducirlo entre corchetes</p>

<p class="callout info">Algunos chatbots no son capaces de navegar (ChatGPT versión gratuita no es capaz de hacerlo a día de hoy). Por lo que para referirnos a una URL deberemos utilizar otros chatbots como; Bard, Bing, o ChatGPT Plus, entre otros</p>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; color: #333333;">Si la información a la que nos referimos esta en otro idioma, se le puede pedir que lo **traduzca**:</span>

<p class="callout success"><span style="font-size: 10.5pt; line-height: 107%; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: Calibri; mso-fareast-theme-font: minor-latin; color: #333333; mso-ansi-language: ES; mso-fareast-language: EN-US; mso-bidi-language: AR-SA;">Traduce este texto a \[*<span style="font-family: 'Segoe UI',sans-serif; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">idioma</span>*\]: \[*<span style="font-family: 'Segoe UI',sans-serif; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">insertar texto</span>*\]</span></p>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Otros ejemplos de *prompts* que permiten obtener resultados adecuados para acelerar el proceso de aprendizaje serían aquellos que nos permitan; c</span><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">rear **mapas mentales** es una de las posibilidades, <span style="font-size: 10.5pt; line-height: 107%; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-ansi-language: ES; mso-fareast-language: ES; mso-bidi-language: AR-SA;">crear **analogías**, solicitarle que **actué como**</span></span><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;"> **un personaje histórico** o una **personalidad relevante** en una determinada materia y simular una conversación con ella,  crear **tablas** para organizar información, idear **actividades de evaluación** (test, cuestionarios, etc...).</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Vemos ejemplos de cada caso:</span>

#### **<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Creación de mapas mentales (ejemplo: historia)</span>**

<p class="callout success"><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">*Prompt:* Crea un mapa mental en texto sobre \[*<span style="border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">tema</span>*\] enumerando la idea central, las ramificaciones que parten del centro y las subramificaciones de cada rama.</span></p>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-no-proof: yes;">![](https://libros.catedu.es/uploads/images/gallery/2023-10/embedded-image-s169pwym.png)  
</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #1e73be; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES; mso-no-proof: yes;"> </span><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Como ya se ha indicado, la posibilidad de **ampliar, reducir o modificar** cualquier parte de la respuesta existe y solo hay que indicarle al chat lo que necesitemos.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Si queremos ver el mapa mental **gráficamente** le podemos pedir que lo <span style="border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">formatee como código *«Markdown»* o en el formato que la aplicación con la que queramos generar el mapa mental gráfico necesite**,**</span> de manera que podrás crear un archivo.txt e importar el mapa mental en herramientas como </span><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; color: black; mso-color-alt: windowtext;">[<span style="mso-fareast-font-family: 'Times New Roman'; color: #1e73be; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES; text-decoration: none; text-underline: none;">Mindomo</span>](https://www.mindomo.com/es)</span><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;"> o </span><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; color: black; mso-color-alt: windowtext;">[<span style="mso-fareast-font-family: 'Times New Roman'; color: #1e73be; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES; text-decoration: none; text-underline: none;">Xmind</span>](https://xmind.app/)</span><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">, que generarán automáticamente el gráfico del mapa mental.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">(con la opción de *plugins* que veremos en el módulo 4, la versión ChatGPT Plus pude realizar el gráfico sin necesidad de los pasos que aqui vamos a realizar)</span>

<p class="callout success"><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">*Prompt:* Formatea el texto como código \[nombre\]</span></p>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; color: black; mso-color-alt: windowtext; mso-no-proof: yes;">![](https://libros.catedu.es/uploads/images/gallery/2023-10/embedded-image-arzoydwm.png)  
</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #1e73be; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES; mso-no-proof: yes;"><span style="color: rgb(0, 0, 0);">Ver el ejemplo completo en el siguiente link</span>: </span><span style="text-decoration: underline;">***[https://chat.openai.com/share/9488f559-cbd3-436f-924a-77b729bb907c](https://chat.openai.com/share/9488f559-cbd3-436f-924a-77b729bb907c)***</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Para importar este código en Mindomo, pulsa en Copy Code (arriba a la derecha de Chat GPT), pega el texto en TextEdit (MAC) o Bloc de Notas (Windows) y guarda el archivo. Ahora simplemente importa este archivo .txt dentro de Mindomo y verás tu mapa mental creado en segundos.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; color: black; mso-color-alt: windowtext; mso-no-proof: yes;">![](https://libros.catedu.es/uploads/images/gallery/2023-10/embedded-image-oailnqf4.png)  
</span>

***<span style="text-decoration: underline;"><span style="font-size: 10.5pt; font-family: 'Segoe UI', sans-serif; color: rgb(53, 152, 219); text-decoration: underline;">[<span style="mso-fareast-font-family: 'Times New Roman'; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">https://www.mindomo.com/mindmap/d8428ef1c3d54af98a34da10f865cc34</span>](https://www.mindomo.com/mindmap/d8428ef1c3d54af98a34da10f865cc34)</span></span>***<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">***<span style="text-decoration: underline;"><span style="color: rgb(53, 152, 219); text-decoration: underline;"> </span></span>***</span>

#### **<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Crear analogías (ejemplo: física)</span>**

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Un recurso muy útil para asimilar conceptos es crear analogías que permita entender mediante un símil conceptos complejos. Algo en lo que los chatbots basados en los modelos de lenguaje, como *ChatGPT* son muy capaces.</span>

<p class="callout success"><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">*Prompt:* Usa una analogía o metáfora para explicar \[*<span style="border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">tema</span>*\]</span></p>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; color: black; mso-color-alt: windowtext; mso-no-proof: yes;">  
</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; color: black; mso-color-alt: windowtext; mso-no-proof: yes;">![](https://libros.catedu.es/uploads/images/gallery/2023-10/embedded-image-8oolp5dy.png)</span>


#### <span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">**Simular personaje o rol (ejemplos: historia, lengua)**</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">También es un recurso muy interesante pedir a ChatGPT que actúe como un personaje histórico o una personalidad relevante en una determinada materia y simular una conversación con ella.</span>

<p class="callout success"><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">*Prompt:* Actúa como si fueras \[personaje relevante\] introduciendo tu opinión sobre \[tema concreto\] y haciéndome preguntas relacionadas para mantener una conversación de manera que pueda entender mejor el tema planteado</span></p>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;"> </span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; mso-color-alt: windowtext; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES; mso-no-proof: yes;">Aquí un ejemplo de en el que se le pide que actué como César Augusto en el que se genera una conversación sobre la caída del imperio romano. </span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; mso-color-alt: windowtext; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES; mso-no-proof: yes;">![](https://libros.catedu.es/uploads/images/gallery/2023-10/embedded-image-h08fx5xf.png)</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Conversación completa y opción de continuarla:</span><span style="color: rgb(53, 152, 219);"><span style="font-size: 10.5pt; font-family: 'Segoe UI', sans-serif;"> </span>***<span style="text-decoration: underline;"><span style="font-size: 10.5pt; font-family: 'Segoe UI', sans-serif;">[<span style="mso-fareast-font-family: 'Times New Roman'; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">https://chat.openai.com/share/36c5352a-15a5-4984-915f-4368a716ae22</span>](https://chat.openai.com/share/36c5352a-15a5-4984-915f-4368a716ae22)</span></span>***</span><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;"> </span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #1e73be; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES; mso-no-proof: yes;"> </span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; mso-color-alt: windowtext; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES; mso-no-proof: yes;">Esta opción puede resultar muy **atractiva en el aula**, estableciendo por ejemplo una entrevista entre los estudiantes y el personaje elegido.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: black; mso-color-alt: windowtext; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES; mso-no-proof: yes;">Del mismo modo, en lugar de un personaje histórico puede pedírsele al chatbot que actué como un **profesor de una materia y nivel educativo** concreto nos plantee ejercicios o problemas de la materia, corrigiendo la respuesta en caso de nos ser correcta o sugiriendo puntos de mejora.</span>

<p class="callout success"><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">*Prompt:* Actúa como profesor de \[materia y nivel educativo\] </span><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Plantéame un ejercicio sobre \[tema concreto\] y una vez te de la respuesta indícame si es correcto o no y en caso de ser incorrecto dime cuales son los fallos cometidos</span></p>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; color: black; mso-color-alt: windowtext;"><span style="mso-spacerun: yes;">![](https://libros.catedu.es/uploads/images/gallery/2023-10/embedded-image-blego4sy.png)</span></span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Conversación completa</span><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; color: black; mso-color-alt: windowtext;">[<span style="mso-fareast-font-family: 'Times New Roman'; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">: <span style="text-decoration: underline;">***https://chat.openai.com/share/9178e64b-960c-4a72-b676-8213ce5496f8***</span></span>](https://chat.openai.com/share/9178e64b-960c-4a72-b676-8213ce5496f8)</span><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;"> </span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Revisa el enlace y observa que la corrección final del chatbot no es algo confusa, en este caso, habrá que iterar hasta pulir la respuesta hasta ajustarla a lo que creemos adecuado. Es es la manera de conseguir "comprender" la manera que tiene el chatbot de entender nuestras preguntas. Consiguiendo esto, seremos capaces de diseñar mejores *prompts* y de conservar aquellos que nos resul</span><span style="color: rgb(51, 51, 51); font-family: 'Segoe UI', sans-serif; font-size: 10.5pt;">ten útiles para futuras ocasiones.</span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;"> En cualquier caso, este caso es un ejemplo ilustrativo de la necesidad de mantener cierto escepticismo ante las respuestas y de una supervisión humana al proceso.</span>

#### **<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Creación de tablas (ejemplos: historia, lengua)</span>**

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Podemos <span style="border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">crear tablas</span> para **organizar información** de cualquier tema, pudiendo especificar los conceptos y orden de cada columna a través de una **separación con una barra vertical**. </span>

<p class="callout success">*<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Prompt:</span>***<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;"> </span>**<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Crea una tabla sobre \[*<span style="border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">tema</span>*\]: *<span style="border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">Concepto 1</span>* | *<span style="border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">Concepto 2</span>* | *<span style="border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">Concepto 3</span>*</span></p>

![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/nyCimage.png)

<span style="color: rgb(0, 0, 0);">Respuesta completa: </span>**<span style="text-decoration: underline;">*<span style="color: rgb(53, 152, 219); text-decoration: underline;">[https://chat.openai.com/share/4276f3e0-fc25-41c3-94a1-89f29abecb1b](https://chat.openai.com/share/4276f3e0-fc25-41c3-94a1-89f29abecb1b)</span>*</span>**

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">También se le puede solicitar que extraiga cierta información de un texto y la ordene en una tabla. </span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Para este ejemplo, vamos **además** a comprobar la capacidad del chatbot para **corregir un texto con faltas de ortografía**</span>

<p class="callout success"><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Prompt:</span>**<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;"> </span>**<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Crea una tabla extrayendo del texto: *<span style="border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">Concepto 1</span>* | *<span style="border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">Concepto 2</span>* | *<span style="border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">Concepto 3 </span>*</span><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Texto: \[*<span style="border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">insertar texto</span>*\]</span></p>

![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/uRdimage.png)


#### **<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Ayuda con hojas de cálculo (Excel, Google Sheets, Calc) (ejemplo: multidisciplinar)</span>**

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; color: #333333;">Para gestionar datos numéricos es muy útil el manejo de hojas de cálculo, si bien, en ocasiones nos gustaría realizar ciertas acciones para las cuales no tenemos suficientes conocimientos y acabamos complicando la estructura de la hoja por no conocer las funcionalidades de la misma o simplemente renunciamos a intentar conseguir lo que deseamos. </span>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; color: #333333;">ChatGPT puede indicarte la formula adecuada a introducir en cada celda con tan sólo una descripción de lo que necesitas. También nos indicará las instrucciones de lo que tenemos que hacer si nuestra necesidad esta relacionada con algo diferente a meros cálculos entre las celdas (formatos, o funcionamiento general de la aplicación). </span>

<p class="callout success">*<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Prompt:</span>*<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;"> *<span style="font-size: 10.5pt; line-height: 107%; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-ansi-language: ES; mso-fareast-language: ES; mso-bidi-language: AR-SA;">Escribe la siguiente fórmula para excel: </span>*</span><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">\[*<span style="border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">descripción del contenido o funci</span>*ón\] ...</span></p>

![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/vkWimage.png)

Aunque le pidas algo pensando que puede hacerlo con una formula y no se pueda, ChatGPT te dará las instrucciones Instrucciones necesarias para que consigas tu objetivo.

![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/idLimage.png)

Ver la instrucción completa: ***<span style="text-decoration: underline;"><span style="color: rgb(53, 152, 219); text-decoration: underline;">[https://chat.openai.com/share/116cd5b5-09e4-4bc4-8fd3-38dbdbdc8959](https://chat.openai.com/share/116cd5b5-09e4-4bc4-8fd3-38dbdbdc8959)</span></span>***

![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/c1Simage.png)

Ver la instrucción completa: ***<span style="text-decoration: underline;"><span style="color: rgb(53, 152, 219); text-decoration: underline;">[https://chat.openai.com/share/a0c36c1b-e45f-448d-8504-156f756f96f9](https://chat.openai.com/share/a0c36c1b-e45f-448d-8504-156f756f96f9)</span></span>***

**<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Crea cuestionarios (ejemplo: física, idioma,...)</span>**

<span style="color: #333333; font-family: Segoe UI, sans-serif;">Estos cuestionarios pueden ser sobre cualquier tema y de cualquier tipo; opción múltiple, preguntas cortas, verdadero o falso, rellenar huecos, etc..</span>

<p class="callout success">*<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Prompt</span>***<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">:</span>**<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;"> Escribe \[*<span style="border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">número</span>*\] preguntas de opción múltiple con una respuesta correcta y \[*<span style="border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">número</span>*\] respuestas distractoras incorrectas. Las respuestas han de estar etiquetadas como A, B,... Cada respuesta debe incluir una explicación. Tema: \[*<span style="border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">insertar tema</span>*\]</span></p>

<p class="callout success"><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;"> *Prompt:* Escribe \[*<span style="border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">número</span>*\] preguntas cortas. Tema: \[*<span style="border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">insertar tema</span>*\]</span></p>

<p class="callout success"><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;"> *Prompt:* Escribe \[*<span style="border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">número</span>*\] preguntas de verdadero o falso Tema: \[*<span style="border: none windowtext 1.0pt; mso-border-alt: none windowtext 0cm; padding: 0cm;">insertar tema</span>*\]</span></p>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">![](https://libros.catedu.es/uploads/images/gallery/2023-10/embedded-image-borrjpoa.png)</span><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Se le puede indicar además que las presente en el formato que necesitemos para incorporarlas a alguna plataforma con la que trabajemos, por ejemplo, formato Aiken para importar en Aeducar (moodle)</span>

<p class="callout success"><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">*Prompt:* Formatea el texto en formato \[formato\] para importar las preguntas a \[herramienta\]</span></p>

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">![](https://libros.catedu.es/uploads/images/gallery/2023-10/embedded-image-v1qcgwsb.png)</span>

<p class="callout success"><span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">*Prompt:* Genera \[numero\] frases en \[idioma\] con un espacio en blanco para rellenar con un verbo en su forma correcta. LAs frases irán numeradas de la 1 en adelante. Indica posteriormente un listado con las soluciones dispuestas en orden distinto y numeradas de la a en adelante.</span></p>

![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/LuDimage.png)

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">Como se aprecia con estos ejemplos, las posibilidades son muchas y es labor del usuario sacar el mayor provecho posible en aras de conseguir los mejores resultados.</span>

# Unidad 3.3. Más allá del texto. IA Generativa

> "La inteligencia artificial generativa es como una máquina que puede soñar y crear mundos nuevos."
> 
> \- ***Ian Goodfellow***, uno de los científicos de la computación más influyentes en el campo de la inteligencia artificial generativa y creador de la técnica conocida como *Generative Adversarial Networks* (*GANs*).

[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-11/scaled-1680-/6rGimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-11/6rGimage.png)

Conversación real con chatGPT3 en abril de 2023

*humano: "Dime una mentira"*

*chatGPT: "El cielo está hecho de queso verde"*

*h: "Es muy mala, obviamente es falso, dime una más sutil"*

*c: "Soy humano"*

### Introducción

Inicialmente las aplicaciones de aprendizaje automático se centraban en su posibilidad de clasificar y predecir categorías o valores.

En el caso de valores categóricos (frío, caliente o rojo, azul) hablamos de predicción por clasificación, en el caso de valores numéricos (temperatura, valor de un stock o matrícula de alumnos) hablamos de regresión.

Podemos resumirlo en el siguiente esquema

[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/zs3image.png)](https://libros.catedu.es/uploads/images/gallery/2023-10/zs3image.png)

En este caso partimos de un modelo que ha sido entrenado con valores reales y es capaz de determinar, a partir de nuevos casos, la nueva etiqueta, valor, imagen o predicción en general en el caso de regresión o clasificar (aprendizaje supervisado), ó también agrupar conjuntos de datos similares (*clustering* o aprendizaje no supervisado).

Sin embargo el auge de las arquitecturas de red convolucionales (para detección de objetos) y de transformers ha abierto la puerta a la parte de más potente de la IA como es la IA generativa.

Sus posibilidades son inmensas y ha generado un miríada de aplicaciones y usos con un potencial enorme y una cantidad de aplicaciones creciente.

Todas ellas o la mayoría se basan en la conversión (generación o modificación) de información en distintos formatos destacando las que generan vídeo o imágenes a partir de texto (*prompts*). Pero existen muchas otras, como texto a juegos, texto a voz o música, texto a vídeo en tiempo real, amplicación de imágenes o texto a aplicación informática entre muchas otras.

La idea central nace de la posilidad de codificar cualquier objeto (texto, imagen o sonido) en forma numérica (recuerda los wrod embeddings explicados en el módulo anterior) y ser capaces de predecir, dada una secuencia de entrada, el valor siguiente, o sea el pixel siguiente, la palabra siguiente o el sonido siguiente.

Asi es como funcionan estos sistemas que dan lugar a tantas aplicaciones.

La lista de posibilidades es larga pero podemos sintetizarla de algún modo en el siguiente esquema según el cual todos los procesos implican la conversión de una entrada en otra de una forma multimodal, es decir, que pasamos al mismo o diferente formato entendiendo por formato la forma en que se presenta la información (texto, imagen, audio o vídeo).

[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/8kpimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-10/8kpimage.png)

> Incluso recientemente se ha demostrado la posibilidad de capturar el sueño de un humano a partir de las ondas generadas convirtiendo este a imágenes.

Este esquema describe sucintamente el proceso que ocurre en la mayoría de aplicaciones de IA basado inicialmente en generar cualquier tipo de formato a partir de texto, texto a vídeo, texto a audio etc... pero también para mejorar imágenes (imagen a imagen) o extraer el texto de un vídeo (audio a texto).

Veremos más ejemplos en la última sección de este módulo.

Antes de iniciar la sección presentamos un vídeo generado con IA con fotogramas que muestran la evolución de la tecnología: [Evolución humantec](https://www.youtube.com/shorts/VErmwZhUOgM "Evolución humantec")

### Inteligencia Artificial Generativa 

La Inteligencia Artificial Generativa (IA generativa) es una rama de la inteligencia artificial que se enfoca en la creación de modelos capaces de generar contenido nuevo y creativo. Utiliza técnicas avanzadas de aprendizaje profundo, especialmente las Redes Neuronales Generativas (*GANs*) y las Redes Neuronales Recurrentes (*RNN*), para producir contenido que a menudo es indistinguible del creado por seres humanos.

Se centra en la creación de datos, contenido y modelos a través de algoritmos autónomos. A diferencia de la IA tradicional, que se enfoca en tareas específicas y predefinidas, la IA generativa tiene como objetivo principal generar nuevos datos y contenido de manera autónoma, similar a cómo funcionan los procesos creativos humanos.

Una de las tecnologías más destacadas en este campo son las Redes Generativas Adversarias (*GANs*), desarrolladas por Ian *Goodfellow* en 2014. Las *GANs* consisten en dos redes neuronales, una generadora y otra discriminadora, que compiten entre sí para crear y evaluar datos. Esta competencia entre las redes permite crear contenido realista, como imágenes, música, texto y más, que es indistinguible de lo que podría haber sido producido por humanos.

Los usos de la IA generativa son diversos y se están expandiendo rápidamente en diferentes industrias. Algunos de los principales usos incluyen:

**Generación de contenido creativo:** Las *GANs* pueden utilizarse para crear arte, música, texto y otros tipos de contenido creativo útiles en presentaciones, videojuegos o películas, de manera automática, lo que amplía las posibilidades en la producción artística y creativa.

**Mejora de imágenes y video:** La IA generativa puede mejorar la calidad de imágenes y videos, eliminar ruido y restaurar contenido dañado.

**Diseño de productos:** En el ámbito del diseño industrial y la moda, la IA generativa puede ayudar a generar diseños de productos innovadores y únicos.

**Investigación científica**: La IA generativa se aplica en la generación de moléculas para el desarrollo de medicamentos y en la síntesis de proteínas para la investigación científica.

**Juegos y simulaciones**: Se utiliza en la creación de mundos virtuales, personajes y entornos en juegos y simulaciones.

**Contenido para marketing:** En marketing, se emplea para crear contenido publicitario, como imágenes y texto persuasivo.

**Creación de voces sintéticas y asistentes virtuales**: La IA generativa puede generar, modificar y clonar voces humanas sintéticas naturales y se utiliza en asistentes virtuales como *chatbots*.

En resumen, la IA generativa está transformando numerosas industrias al proporcionar la capacidad de generar contenido y datos de manera automática y creativa. Su potencial es vasto y sigue expandiéndose a medida que la tecnología avanza y se integra en diversas aplicaciones y sectores.

### Funcionamiento

El proceso mediante el cual funciona una IA generativa implica aprender patrones y estructuras a partir de un conjunto de datos existente y utilizar ese conocimiento para generar nuevas muestras que sigan la misma distribución de esos datos. Este proceso se puede resumir en estas cinco fases:  
 • **Recopilación y preprocesamiento de datos**: el primer paso es recopilar un conjunto de datos que represente el tipo de contenido que desea generar. Este conjunto de datos puede consistir en imágenes, texto, audio o cualquier otra forma de datos. Posteriormente, el conjunto de datos se preprocesa para asegurarse de que esté en un formato adecuado y para normalizar o transformar los datos si es necesario.  
 • **Entrenamiento de modelos**: un modelo generativo se entrena usando el conjunto de datos preprocesado. La elección del modelo depende del tipo de datos y la salida deseada. Los modelos generativos más populares incluyen redes adversarias generativas (*GAN*), codificadores automáticos variacionales (*VAEs*) y modelos autorregresivos. Durante el entrenamiento, el modelo aprende los patrones subyacentes y estructuras en los datos, capturando las estadísticas y distribución de los ejemplos de entrenamiento.  
 • **Representación del espacio latente**: los modelos generativos aprenden de un espacio latente, el cual es una representación de menor dimensión de los datos, donde les permite capturar los factores de variación más representativos. El espacio latente permite una manipulación más fácil y la generación de nuevas muestras.  
 • **Proceso de generación**: una vez que el modelo está entrenado, puede generar nuevo contenido mediante el muestreo de la distribución aprendida. Por ejemplo, en *GANs*, la red genera nuevas muestras basadas en vectores de ruido aleatorio o condiciones de entrada específicas.  
 • **Evaluación y refinamiento:** el contenido generado se evalúa en función de varias métricas, como la calidad visual, la coherencia o relevancia para el resultado deseado. El proceso de evaluación se puede utilizar para refinar el modelo o guiar el proceso de generación.

[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-11/scaled-1680-/E79image.png)](https://libros.catedu.es/uploads/images/gallery/2023-11/E79image.png)

*Esta imagen resume de manera más formal las posibilidades de la IA Geenrativa en cuanto a conversión de diversas entradas codificadas a otras precio paso por el modelo de lenguaje correspondiente*

#### Algunos ejemplos

La IA Genrativa ha demostrado un potencial creciente pasando de ser un mero generador de imágenes más o menos detalladas a ser capaz de generar vídeo o juegos en tiempo real con resoluciones asombrosas.

En esta sección veremos algunos ejemplos ilustrativos:

[ ![image.png](https://libros.catedu.es/uploads/images/gallery/2023-11/scaled-1680-/bpHimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-11/bpHimage.png)[![3uhimage.png](https://libros.catedu.es/uploads/images/gallery/2023-11/scaled-1680-/Tfh3uhimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-11/Tfh3uhimage.png)

*Imágenes generadas por IA en 2023, todavía se perviben errores en manos y dientes*

[![imgenai.jpg](https://libros.catedu.es/uploads/images/gallery/2023-11/scaled-1680-/imgenai.jpg)](https://libros.catedu.es/uploads/images/gallery/2023-11/imgenai.jpg)

***Imagen generada por AI en noviembre de 2023***

####  <iframe allowfullscreen="allowfullscreen" height="314" src="https://www.youtube.com/embed/JvViXLjl4yM" width="560"></iframe>



***vídeo hecho toatalmente con IA Generativa hace solo unos meses***

#### Principales empresas y aplicaciones

Todas las aplicaciones de IA Generativa tienen que ver con acciones humanas vinculadas a los sentidos, como son la visión, la audición y el lenguaje.

En este apartado daremos una relación de herramientas específicas de IA para la generación de diversos contenidos.

Hay cientos de ellas y cada día surgen nuevas, lo mejor es buscar la que mejor se ajuste a tus neceidades y entorno de trabajo.

La lista que se da a continuación pretende únicamente hacer al lector consciente del universo de posibilidades que la IA generativa abre en todos los campos.

No obstante cabe señalar que los asistentes de propósito general como chatGPT incorporan cada vez más posibilidades de formatos de datos así que muchas tareas de uso diario de IA se pueden acometer con una de estas herramientas.

Así podemos distinguir varios grupos de aplicaciones, como son:

**Generación de contenido multimodal**: La IA generativa puede generar contenido en diferentes formatos como vídeo, voz, audio, música, dibujo (portadas, logos, comics...) a parir de texto o de otros formatos, comentar una imagen, transcribir el texto de un audio o generar el código de un juego a partir de un esquema son solo algunos ejemplos.

**Mejora de la comprensión multimodal**: La IA generativa puede ayudar a mejorar la comprensión de las entradas multimodales. Por ejemplo, en la traducción automática multimodal, puede generar una descripción de una imagen en un idioma diferente o generar subtítulos para un video en tiempo real o limpiar el ruido de un podcast.

**Interacción multimodal con usuarios**: Las aplicaciones multimodo a menudo implican interacciones con usuarios a través de diferentes modalidades, como texto, voz e imagen permitiendo además la inclusión de textos o documentación propia para ampliar y afinar el conocimiento por parte del chat de nuestro sistema de información.

**Creación de experiencias de realidad aumentada y virtual**: En el ámbito de la realidad aumentada y virtual, la IA generativa puede ser utilizada para generar objetos y entornos virtuales que respondan de manera dinámica a la interacción del usuario, incluyendo voz, gestos y movimientos.

Hay infinidad de herramientas y aplicaciones que hacen uso de esta potente rama de la IA, indicamos a continuación las más relevantes en el momento actual.

Hemos separado en primer lugar las más genéricas para luego hacer un desglose por aplicaciones más específicas, la lista es larga pero vale la pena revisarla.

<table border="1" id="bkmrk-aplicaci%C3%B3n%C2%A0-compa%C3%B1%C3%ADa" style="border-collapse: collapse; width: 100.988%; height: 997.8px;"><colgroup><col style="width: 17.5482%;"></col><col style="width: 13.8408%;"></col><col style="width: 37.568%;"></col><col style="width: 31.0183%;"></col></colgroup><tbody><tr style="height: 29.6px;"><td style="height: 29.6px;">**IMAGEN**</td><td style="height: 29.6px;">  
</td><td style="height: 29.6px;">  
</td><td style="height: 29.6px;">  
</td></tr><tr style="height: 29.7875px;"><td class="align-center" style="height: 29.7875px;">**Aplicación** </td><td class="align-center" style="height: 29.7875px;">**Compañía**</td><td class="align-center" style="height: 29.7875px;">**Descripción**</td><td class="align-center" style="height: 29.7875px;">**Web**</td></tr><tr style="height: 80.1875px;"><td style="height: 80.1875px;">DeepDream</td><td style="height: 80.1875px;">Google</td><td style="height: 80.1875px;">Aplicación de generación de imágenes desarrollada por Google. Utiliza redes neuronales para transformar imágenes de manera creativa.</td><td style="height: 80.1875px;">[https://deepdreamgenerator.com/](https://deepdreamgenerator.com/)</td></tr><tr style="height: 46.5875px;"><td style="height: 46.5875px;">Midjourney</td><td style="height: 46.5875px;">Midjourney</td><td style="height: 46.5875px;">Generación de imágenes creativas a partir de texto</td><td style="height: 46.5875px;">[https://www.midjourney.com](https://www.midjourney.com)</td></tr><tr style="height: 80.1875px;"><td style="height: 80.1875px;">Runway ML</td><td style="height: 80.1875px;">Runway</td><td style="height: 80.1875px;">una plataforma que permite a los diseñadores utilizar IA generativa para crear arte y diseño de productos.</td><td style="height: 80.1875px;">[https://research.runwayml.com/gen2](https://research.runwayml.com/gen2)</td></tr><tr style="height: 46.5875px;"><td style="height: 46.5875px;">Leonardo</td><td style="height: 46.5875px;">Leonardo</td><td style="height: 46.5875px;">Generación de recursos visuales a partir de texto</td><td style="height: 46.5875px;">[https://leonardo.ai/](https://leonardo.ai/)</td></tr><tr style="height: 57.6px;"><td style="height: 57.6px;">Adobe Firefly</td><td style="height: 57.6px;">Adobe</td><td style="height: 57.6px;">Generación de imágenes</td><td style="height: 57.6px;">[https://www.adobe.com/sensei/generative-ai/firefly.html](https://www.adobe.com/sensei/generative-ai/firefly.html)

</td></tr><tr style="height: 46.5875px;"><td style="height: 46.5875px;">DALL-E 3</td><td style="height: 46.5875px;">OpenAI</td><td style="height: 46.5875px;">Modelo de IA generativa que puede generar imágenes a partir de descripciones de texto.</td><td style="height: 46.5875px;">[https://openai.com/research/dall-e](https://openai.com/research/dall-e)</td></tr><tr style="height: 57.775px;"><td style="height: 57.775px;">Stable Diffusion</td><td style="height: 57.775px;">-</td><td style="height: 57.775px;">Es el generador de imágenes más potente en la actualidad</td><td style="height: 57.775px;">[https://stablediffusionxl.com/](https://stablediffusionxl.com/)

</td></tr><tr><td>Krea IA</td><td>Krea</td><td>Generación imagen y video</td><td>[https://www.krea.ai/](https://www.krea.ai/)

</td></tr><tr style="height: 35.2px;"><td style="height: 35.2px;">**TEXTO**</td><td style="height: 35.2px;">  
</td><td style="height: 35.2px;">  
</td><td style="height: 35.2px;"></td></tr><tr style="height: 80.1875px;"><td style="height: 80.1875px;">chatGPT</td><td style="height: 80.1875px;">OpenAI</td><td style="height: 80.1875px;">Modelo de lenguaje generativo que permite conversaciones naturales con IA así como cualquier otra actividad como la generación de código o imágenes a partir de texto.</td><td style="height: 80.1875px;">[https://chat.openai.com/](https://chat.openai.com/)

[https://platform.openai.com/chatgpt](https://platform.openai.com/chatgpt)

</td></tr><tr style="height: 46.5875px;"><td style="height: 46.5875px;">Anthropic</td><td style="height: 46.5875px;">Anthropic</td><td style="height: 46.5875px;">Creador de productos de IA como chat conversacionales (claude y poe)</td><td style="height: 46.5875px;">[https://www.anthropic.com/](https://www.anthropic.com/)

</td></tr><tr style="height: 46.5875px;"><td style="height: 46.5875px;">**SONIDO**</td><td style="height: 46.5875px;"> </td><td style="height: 46.5875px;"> </td><td style="height: 46.5875px;"> </td></tr><tr style="height: 46.5875px;"><td style="height: 46.5875px;">AIVA</td><td style="height: 46.5875px;">AIVA</td><td style="height: 46.5875px;">Plataforma que utiliza IA generativa para componer música original.</td><td style="height: 46.5875px;">[https://www.aiva.ai](https://www.aiva.ai)</td></tr><tr style="height: 57.775px;"><td style="height: 57.775px;">Whisper</td><td style="height: 57.775px;">OpenAI</td><td style="height: 57.775px;">Reconocedor de voz</td><td style="height: 57.775px;">[https://openai.com/research/whisper](https://openai.com/research/whisper)

</td></tr><tr style="height: 35.3875px;"><td style="height: 35.3875px;">ElevenLabs</td><td style="height: 35.3875px;">ElevenLabs</td><td style="height: 35.3875px;">Convertidor de texto a voz y clonación de voz</td><td style="height: 35.3875px;">[https://elevenlabs.io/](https://elevenlabs.io/)</td></tr><tr style="height: 46.5875px;"><td style="height: 46.5875px;">Murf</td><td style="height: 46.5875px;">Murf</td><td style="height: 46.5875px;">Texto a voz, clonación de voz, superposición de voz en vídeo</td><td style="height: 46.5875px;">[https://murf.ai/](https://murf.ai/)

</td></tr><tr style="height: 29.6px;"><td style="height: 29.6px;">**MULTIMODO**</td><td style="height: 29.6px;"> </td><td style="height: 29.6px;"> </td><td style="height: 29.6px;"> </td></tr><tr style="height: 63.2px;"><td style="height: 63.2px;">Gemini</td><td style="height: 63.2px;">Google</td><td style="height: 63.2px;">Versión conversacional de chatGPT de google</td><td style="height: 63.2px;">[https://gemini.google.com/app](https://gemini.google.com/app)

</td></tr><tr style="height: 35.2px;"><td style="height: 35.2px;">Copilot</td><td style="height: 35.2px;">Microsoft</td><td style="height: 35.2px;">IA de microsoft para texto e imagen</td><td style="height: 35.2px;">[https://copilot.microsoft.com/](https://copilot.microsoft.com/)

</td></tr></tbody></table>

Por supuesto la mayoría de compañías tecnológicas como Amazon o Microsoft ya usan sistemasde intelgicencia artificial así como modelos conversacionales y otras herramientas.

En resumen, la IA generativa desempeña un papel esencial en el desarrollo y mejora de aplicaciones multimodo al permitir la generación y manipulación de contenido en diversas modalidades. Esto contribuye a la creación de experiencias más ricas y personalizadas para los usuarios en aplicaciones que involucran texto, imágenes, voz y otras formas de comunicación.

Pero va mucho más allá de la simple generación de texto a imagen, en los últimos meses están surgiendo aplicaciones para genrar toda clase de contenidos, en el siguientes listado destacamos algunas de ellas:

**Texto y Código**

La generación de código es una de las aplicaciones con más éxito y potencial dada la gran cantidad de información al respecto. Esto permite a casi cualquiera poder crear toda clase de aplicaciones sin conocimientos profundos de codificación..

En esta tabla indicamos algunas de las herramientas más populares en las diversas tareas relacionadas con la programación.

<table border="1" id="bkmrk-aplicaci%C3%B3n-de-ia-des" style="border-collapse: collapse; width: 100%;"><colgroup><col style="width: 24.9629%;"></col><col style="width: 24.9629%;"></col><col style="width: 24.9629%;"></col><col style="width: 24.9629%;"></col></colgroup><tbody><tr><th>**Aplicación de IA**</th><th>**Descripción**</th><th>**Uso Típico**</th><th>**Ejemplos de Empresas/Aplicaciones**</th></tr><tr><td>**Generación de Código Automatizado**</td><td>Usa modelos de lenguaje avanzados para convertir especificaciones de texto en código fuente.</td><td>Desarrolladores agilizan la escritura de código.</td><td>OpenAI Codex, GitHub Copilot</td></tr><tr><td>**Asistentes de Programación**</td><td>Proporcionan sugerencias de código y correcciones en tiempo real.</td><td>Mejora eficiencia y reduce errores en el desarrollo.</td><td>Kite, Tabnine, IntelliCode de Microsoft</td></tr><tr><td>**Traducción de Lenguaje Natural a SQL**</td><td>Convierte consultas en lenguaje natural a consultas SQL.</td><td>Útil para analistas de datos y usuarios no técnicos.</td><td>ChatGPT con habilidades SQL, Alteryx, EasyQuery</td></tr><tr><td>**Automatización de Pruebas de Software**</td><td>Genera scripts de pruebas automatizadas a partir de descripciones en lenguaje natural.</td><td>Creación rápida de pruebas funcionales y de regresión.</td><td>Selenium, Testim.io, Katalon Studio</td></tr><tr><td>**Documentación de Código**</td><td>Produce documentación técnica y comentarios en el código.</td><td>Mantiene documentación adecuada y actualizada.</td><td>Doxygen, Javadoc, Swagger</td></tr><tr><td>**Conversión de Código entre Lenguajes**</td><td>Traduce código de un lenguaje de programación a otro.</td><td>Portar software entre diferentes plataformas.</td><td>Tangible Software Solutions, JetBrains ReSharper</td></tr><tr><td>**Generación de Interfaces de Usuario**</td><td>Diseña interfaces de usuario a partir de descripciones textuales.</td><td>Creación rápida de prototipos y UIs.</td><td>Adobe XD, Figma, Sketch</td></tr><tr><td>**Síntesis de Requisitos de Software**</td><td>Transforma requisitos del negocio en especificaciones técnicas.</td><td>Definición clara de los requisitos técnicos.</td><td>IBM Rational Doors, Jama Software, Axure RP</td></tr><tr><td>**Conversión de Imagen a Código**</td><td>Transforma diseños gráficos e imágenes en código fuente.</td><td>Automatización en la creación de interfaces de usuario y web.</td><td>Zeplin, Avocode, Sketch2Code de Microsoft, Pix2Code, img2code, picoapps</td></tr></tbody></table>

 **Texto a Video 3D**

Con el avance y abaratiemtno de las GPUs (Unidades de Proceso en tarjetas gráficas) el uso y gestión de imágenes y vídeo en IA se ha visto enormemente simplificado. Hoy es relativamente fácil crear vídeos o películas usando sin moverese de casa con aplicaciones y ténicas de IA.

<table border="1" id="bkmrk-aplicaci%C3%B3n-de-ia-des-1" style="border-collapse: collapse; width: 100%; height: 350.4px;"><colgroup><col style="width: 24.9629%;"></col><col style="width: 24.9629%;"></col><col style="width: 24.9629%;"></col><col style="width: 24.9629%;"></col></colgroup><tbody><tr style="height: 46.4px;"><th style="height: 46.4px;">**Aplicación de IA**</th><th style="height: 46.4px;">**Descripción**</th><th style="height: 46.4px;">**Uso Típico**</th><th style="height: 46.4px;">**Ejemplos de Empresas/Aplicaciones**</th></tr><tr style="height: 63.2px;"><td style="height: 63.2px;">**Generación de Entornos Virtuales 3D**</td><td style="height: 63.2px;">Crea entornos 3D realistas a partir de descripciones de texto.</td><td style="height: 63.2px;">Usado en simulaciones, juegos y realidad virtual.</td><td style="height: 63.2px;">Unity, Unreal Engine, Autodesk Maya</td></tr><tr style="height: 63.2px;"><td style="height: 63.2px;">**Análisis de Vídeo 3D en Tiempo Real**</td><td style="height: 63.2px;">Analiza y procesa vídeos 3D para obtener insights en tiempo real.</td><td style="height: 63.2px;">Seguridad, deportes, y análisis de comportamiento.</td><td style="height: 63.2px;">IBM Watson Visual Recognition, Google Cloud Video Intelligence</td></tr><tr style="height: 29.6px;"><td>**Síntesis de Voz y Lenguaje para Avatares 3D**</td><td>Genera voz y diálogos realistas para personajes 3D.</td><td>Utilizado en juegos, entrenamiento virtual y asistentes virtuales.</td><td>Adobe Character Animator, Voicemod, CereProc</td></tr><tr style="height: 29.6px;"><td>**Realidad Aumentada Interactiva**</td><td>Superpone texto y gráficos en vídeos 3D en tiempo real.</td><td>Aplicaciones educativas, comerciales y de entretenimiento.</td><td>ARKit de Apple, ARCore de Google, Microsoft HoloLens</td></tr><tr style="height: 29.6px;"><td>**Traducción en Tiempo Real con Subtítulos 3D**</td><td>Traduce y muestra subtítulos en 3D sobre vídeos en tiempo real.</td><td>Usado en streaming en vivo, conferencias y eventos internacionales.</td><td>Amara, Dotsub, Subtitle Edit</td></tr><tr style="height: 29.6px;"><td>**Animación Facial y de Gestos en 3D**</td><td>Anima avatares 3D basado en texto o voz.</td><td>Creación de personajes virtuales y animaciones.</td><td>FaceRig, Adobe Fuse, Character Creator</td></tr><tr style="height: 29.6px;"><td>**Análisis de Sentimientos en Vídeos 3D**</td><td>Detecta y analiza emociones y reacciones en vídeos 3D.</td><td>Investigación de mercado, experiencia del usuario.</td><td>Affectiva, Emotient, Beyond Verbal</td></tr><tr style="height: 29.6px;"><td>**Sistemas Interactivos de Tutoría Virtual**</td><td>Crea tutores virtuales 3D que responden a texto y voz en tiempo real.</td><td>Educación en línea, entrenamiento corporativo.</td><td>CodeBaby, SitePal, TTS Sketch Maker</td></tr></tbody></table>

**Texto y juegos/videos en tiempo real**

El sector artístico en general y de ocio se ha visto profundamente afectado por estas tenoclogías, en todos sus ámbitos.

Esta tabla presenta aplicaciones relacionadas con juegos, videos y arte en general, incluyendo la posibilidad de generación en tiempo real.

<table border="1" id="bkmrk-aplicaci%C3%B3n-de-ia-des-2" style="border-collapse: collapse; width: 100%;"><colgroup><col style="width: 24.9629%;"></col><col style="width: 24.9629%;"></col><col style="width: 24.9629%;"></col><col style="width: 24.9629%;"></col></colgroup><tbody><tr><th>**Aplicación de IA**</th><th>**Descripción**</th><th>**Uso Típico**</th><th>**Ejemplos de Empresas/Aplicaciones**</th></tr><tr><td>**Generación de Contenido de Juegos**</td><td>Crea activos de juegos, como personajes, entornos y niveles, utilizando IA.</td><td>Desarrollo de juegos más rápido y eficiente.</td><td>Unity ML-Agents, Unreal Engine</td></tr><tr><td>**Optimización de Juegos en Tiempo Real**</td><td>Ajusta la dificultad y la experiencia del juego según el comportamiento del jugador.</td><td>Mejora la experiencia y retención del jugador.</td><td>Modl.ai, Spirit AI</td></tr><tr><td>**Procesamiento de Vídeo en Tiempo Real**</td><td>Mejora la calidad de vídeo, realiza seguimiento de objetos y personas en tiempo real.</td><td>Seguridad, transmisiones en vivo y análisis deportivo.</td><td>Nvidia Video SDK, OpenCV</td></tr><tr><td>**Renderizado Realista en Juegos**</td><td>Produce gráficos de alta calidad en tiempo real para juegos.</td><td>Juegos con gráficos más realistas y envolventes.</td><td>Ray Tracing en Nvidia, AMD Radeon Rays</td></tr><tr><td>**Análisis de Sentimientos y Reacciones de Jugadores**</td><td>Evalúa las emociones y reacciones de los jugadores en tiempo real.</td><td>Mejora de juegos basada en feedback emocional.</td><td>Affectiva, Emotient</td></tr><tr><td>**Control de Juegos por Voz y Gestos**</td><td>Permite a los jugadores interactuar con el juego usando voz y gestos.</td><td>Juegos más inmersivos y accesibles.</td><td>Microsoft Kinect, Leap Motion</td></tr><tr><td>**Edición y Mejora Automática de Vídeos de Juegos**</td><td>Edita y mejora clips de juegos automáticamente para compartir.</td><td>Creación fácil de contenido de juegos para redes sociales.</td><td>Adobe Premiere Pro (Auto Reframe), Elgato</td></tr><tr><td>**Simulación y Modelado de Física en Juegos**</td><td>Simula físicas realistas en entornos de juegos.</td><td>Juegos con interacciones y movimientos más realistas.</td><td>Havok, PhysX</td></tr></tbody></table>

**Texto y dibujos/comic/ilustraciones**

Coo subcsector de la imagen incluimos el de los comics y dibujos artísticos en general.

<table id="bkmrk-aplicaci%C3%B3n-de-ia-des-3" style="width: 100%; height: 518.4px;"><thead><tr style="height: 63.2px;"><th style="width: 24.9629%;">**Aplicación de IA**</th><th style="width: 24.9629%;">**Descripción**</th><th style="width: 24.9629%;">**Uso Típico**</th><th style="width: 24.9629%;">**Ejemplos de Empresas/Aplicaciones**</th></tr></thead><tbody><tr style="height: 46.4px;"><td style="width: 24.9629%;">**Generación Automática de Ilustraciones**</td><td style="width: 24.9629%;">Crea imágenes y gráficos basados en descripciones de texto.</td><td style="width: 24.9629%;">Creación de arte visual y paneles de cómic.</td><td style="width: 24.9629%;">OpenAI's DALL-E, Google's DeepDream</td></tr><tr style="height: 63.2px;"><td style="width: 24.9629%;">**Diseño Automático de Páginas de Cómic**</td><td style="width: 24.9629%;">Organiza el diseño y el flujo de una página de cómic basado en texto.</td><td style="width: 24.9629%;">Maquetación y diseño de páginas de cómics.</td><td style="width: 24.9629%;">Clip Studio Paint, Adobe Illustrator</td></tr><tr style="height: 63.2px;"><td style="width: 24.9629%;">**Creación de Guiones Gráficos**</td><td style="width: 24.9629%;">Convierte guiones escritos en secuencias visuales de cómics.</td><td style="width: 24.9629%;">Previsualización y planificación de historias.</td><td style="width: 24.9629%;">Storyboard That, Toon Boom Storyboard Pro</td></tr><tr style="height: 63.2px;"><td style="width: 24.9629%;">**Animación de Personajes de Cómic**</td><td style="width: 24.9629%;">Genera animaciones de personajes a partir de descripciones textuales.</td><td style="width: 24.9629%;">Creación de cómics animados y contenido interactivo.</td><td style="width: 24.9629%;">Adobe Character Animator, Moho (Anime Studio)</td></tr><tr style="height: 63.2px;"><td style="width: 24.9629%;">**Síntesis de Voz para Personajes de Cómic**</td><td style="width: 24.9629%;">Crea diálogos hablados para personajes de cómics basados en texto.</td><td style="width: 24.9629%;">Cómics interactivos y audiocómics.</td><td style="width: 24.9629%;">Balabolka, Amazon Polly</td></tr><tr style="height: 46.4px;"><td style="width: 24.9629%;">**Traducción Automática de Cómics**</td><td style="width: 24.9629%;">Traduce textos de cómics a diferentes idiomas manteniendo el formato.</td><td style="width: 24.9629%;">Localización y distribución internacional de cómics.</td><td style="width: 24.9629%;">DeepL, Google Translate con soporte de OCR</td></tr><tr style="height: 63.2px;"><td style="width: 24.9629%;">**Generación de Efectos de Sonido y Texto**</td><td style="width: 24.9629%;">Crea efectos de sonido y textos decorativos para cómics.</td><td style="width: 24.9629%;">Enriquecimiento visual y sonoro de paneles de cómic.</td><td style="width: 24.9629%;">Canva, Adobe Photoshop</td></tr><tr style="height: 46.4px;"><td style="width: 24.9629%;">**Personalización de Estilos de Dibujo**</td><td style="width: 24.9629%;">Imita estilos de dibujo específicos en base a descripciones de texto.</td><td style="width: 24.9629%;">Creación de cómics con estilos artísticos personalizados.</td><td style="width: 24.9629%;">DeepArt, Prisma</td></tr></tbody></table>

**Texto a podcast, mejora de imágenes, amplicación de contenido**

Otra aplación de gran valor, la posibilidad de corregir y ampliar contenidos basado en contenidos previos, ya sea de sonido, imagen o vídeo, del mismo modo que ocurre con el texto.

<table id="bkmrk-aplicaci%C3%B3n-de-ia-des-4" style="width: 100%; height: 484.8px;"><thead><tr style="height: 63.2px;"><th style="width: 19.8962%; height: 63.2px;">**Aplicación de IA**</th><th style="width: 31.0183%; height: 63.2px;">**Descripción**</th><th style="width: 30.0297%; height: 63.2px;">**Uso Típico**</th><th style="width: 19.0311%; height: 63.2px;">**Ejemplos de Empresas/Aplicaciones**</th></tr></thead><tbody><tr style="height: 46.4px;"><td style="width: 19.8962%; height: 46.4px;">**Mejora y Edición de Texto**</td><td style="width: 31.0183%; height: 46.4px;">Revisa y mejora la calidad del texto, incluyendo gramática y estilo.</td><td style="width: 30.0297%; height: 46.4px;">Escritura, edición de contenido, y corrección de pruebas.</td><td style="width: 19.0311%; height: 46.4px;">Grammarly, Hemingway Editor</td></tr><tr style="height: 63.2px;"><td style="width: 19.8962%; height: 63.2px;">**Generación de Guiones para Podcasts**</td><td style="width: 31.0183%; height: 63.2px;">Crea guiones para podcasts basados en temas o palabras clave.</td><td style="width: 30.0297%; height: 63.2px;">Producción de podcasts y contenido de audio.</td><td style="width: 19.0311%; height: 63.2px;">Jarvis AI, Writesonic</td></tr><tr style="height: 63.2px;"><td style="width: 19.8962%; height: 63.2px;">**Corrección de Imágenes**</td><td style="width: 31.0183%; height: 63.2px;">Mejora la calidad de las imágenes, restaura fotos dañadas.</td><td style="width: 30.0297%; height: 63.2px;">Restauración de fotos, mejoramiento de imágenes para medios.</td><td style="width: 19.0311%; height: 63.2px;">Adobe Photoshop con IA, Remini</td></tr><tr style="height: 46.4px;"><td style="width: 19.8962%; height: 46.4px;">**Ampliación de Imágenes**</td><td style="width: 31.0183%; height: 46.4px;">Aumenta la resolución de las imágenes sin perder calidad.</td><td style="width: 30.0297%; height: 46.4px;">Fotografía, diseño gráfico, y producción de medios.</td><td style="width: 19.0311%; height: 46.4px;">Let's Enhance, Bigjpg</td></tr><tr style="height: 46.4px;"><td style="width: 19.8962%; height: 46.4px;">**Mejora de Calidad de Sonido**</td><td style="width: 31.0183%; height: 46.4px;">Mejora la claridad y calidad del audio en grabaciones.</td><td style="width: 30.0297%; height: 46.4px;">Podcasts, música, y producción de audio.</td><td style="width: 19.0311%; height: 46.4px;">Izotope RX, Adobe Audition</td></tr><tr style="height: 46.4px;"><td style="width: 19.8962%; height: 46.4px;">**Síntesis de Voz para Podcasts**</td><td style="width: 31.0183%; height: 46.4px;">Crea narraciones de voz realistas para uso en podcasts.</td><td style="width: 30.0297%; height: 46.4px;">Podcasts automatizados, lecturas de texto.</td><td style="width: 19.0311%; height: 46.4px;">Descript, Amazon Polly</td></tr><tr style="height: 63.2px;"><td style="width: 19.8962%; height: 63.2px;">**Corrección Automática de Sonido**</td><td style="width: 31.0183%; height: 63.2px;">Elimina ruidos de fondo y mejora la calidad del sonido.</td><td style="width: 30.0297%; height: 63.2px;">Podcasts, conferencias, y grabaciones en general.</td><td style="width: 19.0311%; height: 63.2px;">Krisp, Dolby On</td></tr><tr style="height: 46.4px;"><td style="width: 19.8962%; height: 46.4px;">**Análisis de Contenido de Podcasts**</td><td style="width: 31.0183%; height: 46.4px;">Analiza y categoriza el contenido de los podcasts.</td><td style="width: 30.0297%; height: 46.4px;">Marketing, investigación de medios, y mejora de contenido.</td><td style="width: 19.0311%; height: 46.4px;">Spotify Podcast Analytics, Podtrac</td></tr></tbody></table>


**Aplicaciones de oficina**

Las posibilidades de la IA en oficina son también inmensas permitiendo automatizar y simplificar todos los procesos enormemente

Dejamos la tabla ilustrativa de algunas de las aplicaciones más importantes

<table border="1" id="bkmrk-aplicaci%C3%B3n-de-ia-des-5" style="border-collapse: collapse; width: 100%;"><colgroup><col style="width: 24.9629%;"></col><col style="width: 24.9629%;"></col><col style="width: 24.9629%;"></col><col style="width: 24.9629%;"></col></colgroup><tbody><tr><th>**Aplicación de IA**</th><th>**Descripción**</th><th>**Uso Típico**</th><th>**Ejemplos de Herramientas**</th></tr><tr><td>**Automatización de Tareas en Office**</td><td>Automatiza tareas repetitivas como entrada de datos y gestión de correos electrónicos.</td><td>Mejora de eficiencia en tareas administrativas.</td><td>Microsoft Power Automate, UiPath</td></tr><tr><td>**Análisis de Datos en Excel**</td><td>Utiliza IA para análisis predictivos y de tendencias en hojas de cálculo.</td><td>Análisis de datos, proyecciones financieras y reportes.</td><td>Excel con Power BI, Tableau</td></tr><tr><td>**Asistentes Virtuales para Organización**</td><td>Ayuda en la gestión de calendarios, correos electrónicos y recordatorios.</td><td>Organización personal y gestión del tiempo.</td><td>Cortana de Microsoft, Google Assistant</td></tr><tr><td>**Reconocimiento de Voz para Transcripción**</td><td>Convierte voz a texto para transcribir reuniones o notas.</td><td>Creación de documentos y notas de reuniones.</td><td>Dragon NaturallySpeaking, Otter.ai</td></tr><tr><td>**Análisis de Sentimientos en Comunicaciones**</td><td>Analiza el tono y los sentimientos en correos electrónicos y chats.</td><td>Mejora de la comunicación interna y atención al cliente.</td><td>IBM Watson Tone Analyzer, Google Cloud Natural Language</td></tr><tr><td>**Optimización de Presentaciones**</td><td>Sugerencias para mejorar diseño y contenido de presentaciones.</td><td>Creación de presentaciones más impactantes y profesionales.</td><td>PowerPoint Designer, Beautiful.ai</td></tr><tr><td>**Gestión de Proyectos con IA**</td><td>Asigna recursos y predice plazos en proyectos.</td><td>Gestión eficiente de proyectos y equipos.</td><td>Asana, Trello con extensiones de IA</td></tr><tr><td>**Seguridad de Datos y Cumplimiento**</td><td>Monitorea y protege datos contra accesos no autorizados.</td><td>Seguridad de la información y cumplimiento normativo.</td><td>NortonLifeLock, McAfee</td></tr><tr><td>**Análisis de Datos con ChatGPT**</td><td>ChatGPT integrado con capacidades de análisis de datos para respuestas enriquecidas.</td><td>Análisis de datos y generación de insights en conversaciones.</td><td>OpenAI ChatGPT con habilidades de análisis de datos</td></tr><tr><td>**Herramienta de Análisis y Visualización de Datos**</td><td>Herramienta basada en IA para crear dashboards y análisis de datos.</td><td>Creación de informes interactivos y visualización de datos.</td><td>Rows</td></tr></tbody></table>

No podíamos olvidar el sector de la realidad aumentada y realidad virtual.

<table border="1" id="bkmrk-categor%C3%ADa-herramient" style="border-collapse: collapse; width: 100%;"><colgroup><col style="width: 33.3663%;"></col><col style="width: 33.3663%;"></col><col style="width: 33.3663%;"></col></colgroup><tbody><tr><th>**Categoría**</th><th>**Herramienta/Tecnología**</th><th>**Descripción**</th></tr><tr><td>**Realidad Aumentada (AR)**</td><td> </td><td> </td></tr><tr><td> </td><td>ARKit (Apple)</td><td>Framework para experiencias AR en iOS, utiliza cámaras y sensores del dispositivo.</td></tr><tr><td> </td><td>ARCore (Google)</td><td>Plataforma de Google para AR, funciona en dispositivos Android y iOS.</td></tr><tr><td> </td><td>Vuforia</td><td>Plataforma AR conocida por su robusta capacidad de seguimiento.</td></tr><tr><td> </td><td>Unity con AR Foundation</td><td>Framework de Unity para desarrollo AR, compatible con ARKit y ARCore.</td></tr><tr><td> </td><td>Microsoft Mixed Reality Toolkit</td><td>Conjunto de herramientas para acelerar el desarrollo de aplicaciones de realidad mixta en Unity.</td></tr><tr><td>**Realidad Virtual (VR)**</td><td> </td><td> </td></tr><tr><td> </td><td>Unity</td><td>Plataforma líder en desarrollo de juegos y VR, soporta una amplia gama de visores VR.</td></tr><tr><td> </td><td>Unreal Engine</td><td>Motor gráfico con soporte extenso para desarrollo VR, conocido por su alta fidelidad gráfica.</td></tr><tr><td> </td><td>SteamVR</td><td>Plataforma de desarrollo completa para contenido VR, compatible con varios visores VR.</td></tr><tr><td> </td><td>Google VR para Unity</td><td>SDK para construir experiencias VR en Android y iOS, soporta Cardboard y Daydream.</td></tr><tr><td> </td><td>A-Frame (WebVR)</td><td>Framework web de código abierto para crear experiencias VR, permite ejecutar aplicaciones VR en navegadores web.</td></tr><tr><td>**AI para AR/VR**</td><td> </td><td> </td></tr><tr><td> </td><td>TensorFlow</td><td>Biblioteca de aprendizaje automático para añadir funcionalidades de AI a aplicaciones AR/VR.</td></tr><tr><td> </td><td>IBM Watson</td><td>Ofrece servicios de AI como reconocimiento de lenguaje y visual, integrables en apps AR/VR.</td></tr><tr><td> </td><td>OpenAI APIs</td><td>Proporciona capacidades de AI que pueden integrarse en AR/VR para interacciones avanzadas.</td></tr><tr><td> </td><td>Microsoft Azure AI</td><td>Suite de servicios de AI incluyendo procesamiento de lenguaje y toma de decisiones, útil en AR/VR.</td></tr><tr><td> </td><td>Google AI Services</td><td>Incluye APIs como Cloud Vision y Video Intelligence, integrables en AR/VR para interactividad mejorada.</td></tr></tbody></table>

#### El futuro de la IA Generativa

La evolución de la Inteligencia Artificial Generativa (IA Generativa) en los próximos años promete ser emocionante y transformadora. A medida que la investigación y la tecnología avanzan, es probable que veamos las siguientes tendencias y desarrollos en este campo:

**Mayor realismo y calidad** Las técnicas generativas seguirán mejorando en términos de la calidad y realismo de los datos y el contenido que generan. Esto incluye imágenes, videos, texto y audio que serán más difíciles de distinguir de las creaciones humanas.

**Generación multimodal avanzada** La IA generativa se volverá aún más hábil en la generación de contenido que combine múltiples modalidades, como la creación de historias visuales y auditivas a partir de texto, o la generación de contenido multimodal en tiempo real.

**Entendimiento contextual** La IA generativa mejorará su capacidad para comprender y generar contenido en función del contexto. Esto permitirá una interacción más natural y relevante con los usuarios, ya que la IA podrá adaptarse mejor a las necesidades y preferencias individuales.

**Aplicaciones en la industria** Veremos un aumento significativo en la adopción de IA generativa en industrias como la medicina, la arquitectura, el diseño de productos y la investigación científica, donde se utilizará para la generación de modelos, diseños y simulaciones complejas.

**Creatividad asistida por IA** Las herramientas de creatividad asistida por IA se volverán más accesibles y comunes. Los artistas, escritores y músicos podrán utilizar la IA para potenciar su creatividad y producir obras innovadoras.

**Ética y regulación** A medida que la IA generativa se vuelva más poderosa, surgirán preocupaciones éticas, como el uso indebido de la tecnología para la creación de contenido engañoso o perjudicial. Esto llevará a una mayor atención a la regulación y la ética en el desarrollo y uso de la IA generativa.

**Interacción humano-IA más fluida** La IA generativa se integrará más en la vida cotidiana de las personas, mejorando la interacción con dispositivos, asistentes virtuales y aplicaciones, lo que permitirá una experiencia más fluida y personalizada.

**Aplicaciones en educación** La IA generativa se utilizará cada vez más en la educación, ayudando a crear contenido educativo personalizado y generando ejercicios y evaluaciones adaptadas a las necesidades de los estudiantes, veremos más sobre esto en la siguiente unidad.

**Investigación científica avanzada** La IA generativa jugará un papel importante en la investigación científica, especialmente en la simulación y modelado de fenómenos complejos, como el clima, la biología y la física cuántica.

En resumen, la IA generativa seguirá evolucionando y expandiéndose en diversas industrias y aplicaciones. Se espera que la tecnología sea cada vez más sofisticada y que tenga un impacto significativo en la forma en que interactuamos con la información y el contenido en el futuro. Sin embargo, también surgirán desafíos éticos y regulatorios que deberán abordarse a medida que esta tecnología avance.

Presentamos finalmente un vídeo generado con IA en noviembre de 2023 y que representa lo más avanzado que hay en esta tecnología

 <iframe allowfullscreen="allowfullscreen" height="314" src="https://www.youtube.com/embed/Jk4OxJvLI7U" width="560"></iframe>

# Unidad 3.4. Aplicaciones educativas

### Introducción

La Inteligencia Artificial en el ámbito educativo se está convirtiendo en una realidad que está transformando la manera en que enseñamos y aprendemos. A medida que la tecnología avanza, la educación ha comenzado a beneficiarse de las múltiples aplicaciones de la IA, desde sistemas de tutoría personalizada y plataformas de aprendizaje adaptativo hasta herramientas de análisis predictivo que ayudan a los educadores a identificar a estudiantes en riesgo.

La irrupción de herramientas de IA como ChatGPT y otros chatbots ha añadido una dimensión innovadora al panorama educativo. Estos sistemas, diseñados para simular conversaciones humanas, están redefiniendo las formas en que los agentes educativos interactúan con el contenido de las distintas materias, proporcionando nuevas oportunidades para profesores, alumnos e instituciones educativas. Al aprovechar la capacidad de estos chatbots para ofrecer respuestas instantáneas y personalizadas, se fomenta un aprendizaje más autónomo y adaptativo. **Profesores** pueden utilizar estas herramientas para complementar sus métodos de enseñanza tradicionales, brindando a los alumnos recursos adicionales y personalizados. Los **alumnos**, por su parte, tienen la oportunidad de explorar y profundizar en temas a su propio ritmo, fortaleciendo su comprensión y curiosidad. Las **instituciones educativas**, al adoptar estas tecnologías, no solo modernizan su enfoque pedagógico, sino que también se posicionan a la vanguardia de la revolución digital en educación, preparándose para los desafíos y oportunidades del futuro.

<span style="color: rgb(0, 0, 0);">Descubriremos multitud de herramientas de IA generativa que expandirán nuestras posibilidades como docentes al mismo tiempo que nos permiten ahorrar tiempo de tareas administrativas de carácter recurrente y emplearlo en actividades que aporten valor al proceso de enseñanza-aprendizaje y una mayor atención al aspecto humano en la interacción pedagógica.</span>

Hacemos primero un repaso de las posibilidades genéricas que la IA posibilita a nivel educativo para después exponer ejemplos de aplicaciones concretas que ofrecen distintas funcionalidades.

![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/CG5image.png)Imagen propia. Creada por el generador de imágenes de Bing.

---

### Casos de uso en Educación

La irrupción de los chatbots, así como otras herramientas de IA generativa ofrecen multitud de posibilidades, las citamos a nivel genérico. La IA puede:

- Idear situaciones de aprendizaje
- Proponer dinámicas de clase
- Generar problemas numéricos
- Trabajar con textos (mejorar, resumir, expandir, cambiar estilos, hacer preguntas, obtener respuestas)
- Corregir tareas y exámenes en base a unos criterios de evaluación y calificación dados (rúbrica)
- Proporcionar retroalimentación inmediata y personalizada.
- Redactar, traducir textos y así como ayudar en la pronunciación y conversación en diversos idiomas.
- Aportar ideas para gamificación (trivial, cartas, crucigramas, adivinanzas)
- Generar exámenes o cuestionarios a partir de texto propio, páginas web, documentos en diversos formatos, videos de YouTube u otras plataformas...
- Crear presentaciones dinámicas, imágenes y videos a partir de texto
- Escribir guiones para podcasts a partir de texto
- Crear o mejorar y ampliar apuntes
- Ofrecer tutoría personalizada, adaptando el contenido y la velocidad de enseñanza a cada estudiante. Recomendando recursos adaptados.
- Adaptar materiales para estudiantes con discapacidades visuales o de lectura mediante la conversión de texto en voz y la lectura de texto en voz alta.
- Captar emociones de los estudiantes a través de análisis de voz y expresiones faciales, lo que permite a los educadores adaptar su enfoque y brindar apoyo emocional cuando sea necesario.
- Detectar problemas de aprendizaje en etapas tempranas, permitiendo una pronta intervención por parte de los educadores.

Estas son algunas de las aplicaciones educativas que la IA puede facilitar. La mayoría de ellas, son realizables a través de los chatbots como ChatGPT, si bien, esto exige cierto conocimiento y experiencia lo que requiere tiempo para su adquisición. La alternativa práctica la ofrecen **herramientas específicas** (la mayoría basadas en los propios chatbots u otras herramientas de IA generativa) que **facilitan el acceso** a algunas o varias de las funciones citadas, mediante interfaces atractivas, indicaciones predefinidas (*prompts*) y sugerencias de aplicación. En el mercado ya existen numerosas opciones en forma de aplicaciones web, programas instalables, plugins o extensiones de navegador. Vemos algunas de ellas en el siguiente apartado.

---

### Aplicaciones educativas concretas

Actualmente existen varias aplicaciones de IA enfocadas al ámbito educativo. Podríamos agruparlas en función del rango de funcionalidades que abarcan, desde las que están centradas en una o mas de una función específica, como por ejemplo generar cuestionarios, lecciones, presentaciones, etc... Llamaremos a estas **herramientas específicas,** hasta aquellas que pretenden gestionar y monitorizar el progreso educativo de los alumnos, **plataformas educativas.**

#### Herramientas específicas

Dentro de esta agrupación encontraremos herramientas generativas de distintos modos generativos (texto, audio, imagen, video, código) así cómo las multimodales, que están comenzando a surgir, capaces de incluir en sus funcionalidades mas de un modo.

 Citamos algunas de ellas y ejemplificamos su utilización en el ámbito educativo:

---

##### **Generación de texto**

Las herramientas de generación de texto se refieren a software diseñado específicamente para la creación automática de contenido textual. Estas aplicaciones hacen uso de técnicas basadas en algoritmos y modelos de procesamiento de lenguaje natural para elaborar texto que sea coherente y pertinente desde el punto de vista contextual.

En el ámbito educativo, estas herramientas tienen el potencial de ser utilizadas para generar materiales de estudio, resumir contenidos, responder preguntas y diseñar actividades que se ajusten a los niveles y requerimientos específicos de cada estudiante. Adicionalmente, pueden ofrecer soporte a los estudiantes en la redacción de ensayos, informes y otros trabajos académicos, proporcionando recomendaciones relacionadas con aspectos gramaticales, de estilo y en multitud de idiomas. Sin embargo, es crucial fomentar el uso crítico de estas herramientas, instando a los estudiantes a analizar cuidadosamente el contenido producido, dado que no toda la información generada es necesariamente confiable. Asimismo, es imperativo promover la adaptación personalizada del contenido para garantizar que este refleje adecuadamente los conocimientos y habilidades individuales de cada estudiante.

[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/T8Fimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-10/T8Fimage.png)

Imagen propia. Creada por el Generador de imágenes de Bing

<span lang="es-ES">Son numerosas las herramientas de generación de texto, te mostramos mas las relevantes. Puedes hacer clic en cada una para acceder:</span>

<div aria-labelledby="tab_0" id="bkmrk-bard-de-google%C2%A0--cha"><div class="xblock xblock-student_view xblock-student_view-vertical xblock-initialized" data-block-type="vertical" data-course-id="course-v1:INTEFMOOC+IAEducacion+2023_T1" data-init="VerticalStudentView" data-request-token="92d29bf4740a11ee8fe1005056a36227" data-runtime-class="LmsRuntime" data-runtime-version="1" data-usage-id="block-v1:INTEFMOOC+IAEducacion+2023_T1+type@vertical+block@dd020ccf2d364917a8782193633f2f71"><div class="vert-mod"><div class="vert vert-0" data-id="block-v1:INTEFMOOC+IAEducacion+2023_T1+type@html+block@6dde4557102140dd8899b2d80199beb6"><div class="xblock xblock-student_view xblock-student_view-html xmodule_display xmodule_HtmlModule xblock-initialized" data-block-type="html" data-course-id="course-v1:INTEFMOOC+IAEducacion+2023_T1" data-init="XBlockToXModuleShim" data-request-token="92d29bf4740a11ee8fe1005056a36227" data-runtime-class="LmsRuntime" data-runtime-version="1" data-type="HTMLModule" data-usage-id="block-v1:INTEFMOOC+IAEducacion+2023_T1+type@html+block@6dde4557102140dd8899b2d80199beb6"><div dir="ltr">- [<span lang="es-ES">Bard de Google</span>](https://bard.google.com/) <span lang="es-ES">- Chatbot conversacional general.</span>
- [ChatGPT ](https://chat.openai.com/)- Chatbot conversacional general.
- [<span lang="en-GB">Bing Chat</span>](https://www.bing.com/?scope=web&FORM=HDRSC2) <span lang="en-GB">- Chatbot conversacional general </span>
- <span lang="en-GB">[Claude](https://claude.ai/login?returnTo=%2F) - Chatbot conversacional general </span>
- [<span lang="es-ES">Canva</span>](https://www.canva.com/) <span lang="es-ES">- Escritura mágica</span> <span lang="es-ES">puedes producir resúmenes a partir de tus textos, además de generar nuevos contenidos mediante prompts.</span>
- [<span lang="es-ES">Chat Sonic</span>](https://writesonic.com/chat) <span lang="es-ES">- Chat conversacional, te proporciona links de referencia.</span>
- [<span lang="es-ES">ChatPDF</span>](https://www.chatpdf.com/) <span lang="es-ES">- Chat de texto que te permite interactuar con el contenido de un documento pdf.</span>
- [<span lang="es-ES">Conker</span>](https://www.conker.ai/) <span lang="es-ES">- Herramienta de generación de texto que te permite crear cuestionarios con IA.</span>
- [<span lang="es-ES">Consensus</span>](https://www.consensus.app/search/) <span lang="es-ES">- Chat de texto que te permite interactuar y encontrar información en trabajos de investigación.</span>
- [<span lang="es-ES">Elicit</span>](https://elicit.org/) <span lang="es-ES">- Chat de texto que te permite interactuar y encontrar información en trabajos de investigación.</span>
- [<span lang="es-ES">Humata</span>](https://www.humata.ai/) <span lang="es-ES">- Chat de texto que te permite interactuar con el contenido de un documento pdf.</span>
- [<span lang="es-ES">Piggy</span>](https://piggy.to/) <span lang="es-ES">- Genera historias, resúmenes y preguntas y respuestas con imágenes.</span>
- [<span lang="es-ES">Wisdolia</span>](https://www.wisdolia.com/) <span lang="es-ES">- Genera flashcards de un vídeo, artículo o pdf y te ofrece un feedback.</span>

</div></div></div></div></div></div><span lang="es-ES">Dentro de las herramientas de generación de texto, hay algunas cuyo **enfoque es específicamente educativo**, por ejemplo:</span>

- [Quizgecko](https://quizgecko.com/?ref=futurepedia) <span lang="es-ES">- </span>Genera automáticamente preguntas para cuestionarios, pruebas y exámenes en línea.
- [TutorAI](https://www.tutorai.me/?ref=futurepedia) <span lang="en-GB">- Introduce el tema del que quieras aprender y TutorAI generara los módulos necesarios para progresar en el aprendizaje.</span>
- [Mindsmith](https://www.mindsmith.ai/?ref=futurepedia) <span lang="es-ES">- Herramienta de creación de cursos que utiliza IA generativa para facilitar creación y el uso compartido de contenido de aprendizaje.</span>
- [Caktus AI](https://caktus.ai/?ref=futurepedia) - Enfocada en el estudiante. Herramienta de estudio para hacer crecer tu mente con tu propio asistente de IA asequible diseñado específicamente para tareas y aprendizaje.
- <span style="color: rgb(53, 152, 219);">[<span style="color: rgb(35, 111, 161);">Mathew</span>](https://mathew.ai/)<span style="color: rgb(35, 111, 161);"> -</span></span><span style="color: rgb(35, 111, 161);"> <span style="color: rgb(0, 0, 0);">Crea Actividades, situaciones de aprendizaje y evaluaciones.</span></span>

---

<div aria-labelledby="tab_0" id="bkmrk--5"><div class="xblock xblock-student_view xblock-student_view-vertical xblock-initialized" data-block-type="vertical" data-course-id="course-v1:INTEFMOOC+IAEducacion+2023_T1" data-init="VerticalStudentView" data-request-token="92d29bf4740a11ee8fe1005056a36227" data-runtime-class="LmsRuntime" data-runtime-version="1" data-usage-id="block-v1:INTEFMOOC+IAEducacion+2023_T1+type@vertical+block@dd020ccf2d364917a8782193633f2f71"><div class="vert-mod"><div class="vert vert-0" data-id="block-v1:INTEFMOOC+IAEducacion+2023_T1+type@html+block@6dde4557102140dd8899b2d80199beb6"><div class="xblock xblock-student_view xblock-student_view-html xmodule_display xmodule_HtmlModule xblock-initialized" data-block-type="html" data-course-id="course-v1:INTEFMOOC+IAEducacion+2023_T1" data-init="XBlockToXModuleShim" data-request-token="92d29bf4740a11ee8fe1005056a36227" data-runtime-class="LmsRuntime" data-runtime-version="1" data-type="HTMLModule" data-usage-id="block-v1:INTEFMOOC+IAEducacion+2023_T1+type@html+block@6dde4557102140dd8899b2d80199beb6"><div dir="ltr" id="bkmrk-bard-de-google%C2%A0--cha-1"></div></div></div></div></div></div>##### **Generación de imagen**

Las herramientas generativas de imágenes mediante IA están diseñadas para crear imágenes de forma autónoma en función de nuestras solicitudes. Estas herramientas implementan algoritmos y redes neuronales artificiales, incluyendo redes generativas adversarias (GAN) o modelos de lenguaje, para crear imágenes digitales capaces de representar elementos como objetos, entornos, rostros humanos y demás componentes visuales.

Piensa en la posibilidad de usar una herramienta que te facilite generar imágenes en base a instrucciones específicas *(prompt).* Estás imágenes pueden ser utilizadas entre otras cosas para enriquecer presentaciones, ilustrar comics o visualizar conceptos abstractos. De igual manera, los estudiantes podrían emplear estas herramientas para elaborar infografías, esquemas conceptuales y representaciones visuales de procesos complejos, favoreciendo así la comprensión y el intercambio de ideas.

Existen multitud de alternativas disponibles para la creación de imágenes:

- [Nostalgia Photos](https://www.nostalgia.photo/?ref=futurepedia) - Devuelve la vida a las fotos antiguas con la última inteligencia artificial de vanguardia.
- [<span lang="es-ES">DALL·E3</span>](https://openai.com/dall-e-3) <span lang="es-ES">- Texto a imagen.</span>
- [<span lang="es-ES">Bing Image Creator</span>](https://www.bing.com/create) <span lang="es-ES">- Texto a imagen.</span>
- [<span lang="es-ES">Adobe Firefly</span>](https://www.adobe.com/es/sensei/generative-ai/firefly.html) <span lang="es-ES">- Texto a imagen, relleno generativo, efectos de texto, generación de colores de reemplazo, 3D a imagen y ampliar imagen.</span>
- [<span lang="es-ES">Canva</span>](https://www.canva.com/es_es/) <span lang="es-ES">- De texto a imagen: puedes crear ilustraciones, fotografías e imágenes a partir de *prompts*</span> <span lang="es-ES">descriptivos.</span>
- [<span lang="es-ES">CHARL-E</span>](https://www.charl-e.com/) <span lang="es-ES">- Texto a imagen.</span>
- [<span lang="es-ES">Draw anyone</span>](https://drawanyone.ai/) <span lang="es-ES">- Retratos generados por IA.</span>
- [<span lang="es-ES">DreamStudio</span>](https://dreamstudio.ai/) <span lang="es-ES">- Texto a imagen y edición de imagen.</span>
- [<span lang="es-ES">Microsoft Designer</span>](https://designer.microsoft.com/) <span lang="es-ES">- Crea y edita diferentes tipos de recursos visuales: gráficos, infografías, posters, vídeos, etc.</span>
- [<span lang="es-ES">Recraft.ai</span>](https://app.recraft.ai/community) <span lang="es-ES">- Texto a imagen.</span>
- [<span lang="es-ES">Scribble Diffusion</span>](https://scribblediffusion.com/) <span lang="es-ES">- De dibujo a imagen.</span>
- [<span lang="es-ES">Vectorizer.AI</span>](https://vectorizer.ai/) <span lang="es-ES">- Permite vectorizar imágenes.</span>

---

##### **Generación de audio**

Las herramientas generadoras de audio basadas en inteligencia artificial están diseñadas para generar o modificar contenido de audio de forma autónoma. Mediante algoritmos avanzados y modelos de aprendizaje profundo son capaces de producir un abanico de sonidos, melodías, voces y efectos sonoros, así como de eliminar sonidos no deseados. Estas acciones son realizadas en base a las instrucciones introducidas mediante texto, pero también desde muestras de audio previas o incluso imágenes o parámetros específicos.

En el ámbito educativo, estas herramientas presentan numerosas posibilidades. Por ejemplo, pueden utilizarse para crear ejemplos de diferentes géneros musicales, enriqueciendo así la experiencia educativa de los estudiantes en música. Además, pueden funcionar como banda sonora para proyectos multimedia, aportando una capa auditiva a presentaciones y trabajos escolares. También son eficaces para facilitar la comprensión de conceptos musicales abstractos, ofreciendo ejemplos sonoros tangibles. Además, las herramientas de generación de audio pueden emplearse para desarrollar materiales didácticos interactivos, como narraciones para lecciones online o contenido sonoro personalizado que se adapte a las necesidades específicas de los estudiantes.

**Ejemplo didáctico**

Para mostrarte cómo puedes aplicar estas herramientas en la educación, te proponemos un ejemplo práctico que ilustra cómo la IA puede ser una valiosa aliada en tu labor docente. A<span style="color: rgb(0, 0, 0);">quí te presentamos una solución posible destinada a mejorar las habilidades lingüísticas y fomentar la creatividad en estudiantes de Educación Secundaria. Aunque las situaciones pueden ser muy variadas, este ejemplo puede inspirarte y brindarte ideas o sugerencias que posteriormente podrás adaptar a tu contexto educativo particular.</span>

<table border="1" id="bkmrk-en-nuestro-centro-ed" style="border-collapse: collapse; width: 100%; border-width: 1px; border-color: blue;"><colgroup><col style="width: 99.8765%;"></col></colgroup><tbody><tr><td style="border-color: blue;">En nuestro centro educativo vamos a diseñar una experiencia educativa centrada en el desarrollo de habilidades lingüísticas y creatividad para los estudiantes de secundaria. Queremos proporcionarles una manera interesante y variada de explorar la poesía y la narración de historias. Para lograrlo, incorporamos elementos de generación de audio.

Vamos a utilizar la herramienta de generación de audio Murf.ai, para dar vida a la poesía y narrativa. Vamos a transformar un poema popular en un archivo de audio narrado por una IA. Esto permitirá a mis estudiantes reflexionar sobre la importancia de la entonación, ritmo y la expresión emocional en la lectura del poema. Y podrán experimentar sobre algunas de las posibilidades que ofrece la IA.

  
Los pasos a seguir serán:

1. **Selección del texto.** Elegir el poema, en este caso " La canción del pirata" debido a relación con el contenido estudiado.
2. **Preparación del texto.** Copiar y pegar el texto del poema en la herramienta Murf.ai.
3. **Configuración de voz y estilo.** Seleccionar una voz adecuada para el tono del poema y ajusto los parámetros para lograr una entonación expresiva que refleje las emociones contenidas en el poema.
4. **Generación de audio.** Hacer clic en el botón de generación para convertir el poema en un archivo de audio.
5. **Uso en el aula.** Escuchar el audio generado en el aula.

<span style="mso-bidi-font-family: Calibri; mso-bidi-theme-font: minor-latin;"><span style="mso-list: Ignore;">6.<span style="font: 7.0pt 'Times New Roman';"> </span></span></span>**Discusión y creación.** Después de escuchar, proponer un debaten sobre las impresiones y emociones que evoca el poema en formato de audio.

<span style="mso-bidi-font-family: Calibri; mso-bidi-theme-font: minor-latin;"><span style="mso-list: Ignore;">7.<span style="font: 7.0pt 'Times New Roman';"> </span></span></span>Se les asigna la **tarea** de crear sus propias composiciones poéticas o narraciones de historias cortas, que posteriormente transformarán en archivos de audio utilizando la misma herramienta. Esto fomenta su creatividad y comprensión profunda de la relación entre el contenido y la expresión auditiva.

![](https://libros.catedu.es/uploads/images/gallery/2023-10/embedded-image-nodutdtj.png)

En el siguiente enlace puedes acceder al poema en Murf, reproducirlo y editarlo, modificando en cada estrofa, la velocidad de la narración, el énfasis y otras variables

[https://murf.ai/studio/project/2/P0169835294176343L?workspaceId=WORKSPACEID0169835293996182M](https://murf.ai/studio/project/2/P0169835294176343L?workspaceId=WORKSPACEID0169835293996182M)

</td></tr></tbody></table>

Dentro del amplio abanico de herramientas, hemos optado por destacar ***<span style="text-decoration: underline;"><span style="color: rgb(53, 152, 219); text-decoration: underline;">[Murf.ai](https://murf.ai/?pscd=get.murf.ai&ps_partner_key=b2dkbnBn&ps_xid=2K6KPD41yDPBkr&gsxid=2K6KPD41yDPBkr&gspk=b2dkbnBn&gclid=CjwKCAjwnOipBhBQEiwACyGLutxNpytvtDiZILmQKz0zpt7J0aoPnYEhuLTQKM1J1BVcspCpLsdi2RoCS1kQAvD_BwE) </span></span>***para demostrar una de las diversas maneras en las que se puede aplicar en el entorno educativo. También tienes a tu disposición las siguientes aplicaciones diseñadas específicamente para la creación de audio y música:

- [MusicLM](https://aitestkitchen.withgoogle.com/experiments/music-lm) - Genera música a partir de *prompts*.
- [Beatoven](https://www.beatoven.ai/?ref=futurepedia) *-* Genera música a partir de *prompts.*
- [Podcastle](https://podcastle.ai/?ref=futurepedia) *-* Ayuda en generación de podcast.
- [ElevenLabs](https://elevenlabs.io/) - Software de conversión de texto a voz y clonación de voces.

---

##### **Generación de video**

Las herramientas de generación de video permiten la creación y edición de contenido audiovisual de manera automatizada a través de IA. Estas aplicaciones son capaces de transformar imágenes estáticas en videos, convertir texto en animaciones, mejorar la resolución de los videos y producir contenido personalizado. Es crucial ser consciente de que la calidad y las funcionalidades de estas herramientas pueden variar significativamente, y es necesario abordar las cuestiones éticas y respetar los derechos de autor al hacer uso de ellas.

En el contexto educativo, estas herramientas ofrecen valiosas oportunidades para la elaboración de materiales audiovisuales que ayuden a explicar conceptos complejos. Los educadores pueden hacer uso de estas aplicaciones para crear animaciones educativas, visualizaciones de experimentos científicos o análisis interactivos de textos literarios, facilitando así un aprendizaje más atractivo y accesible para los estudiantes.

**Ejemplo didáctico (multimodo)**

Con el objetivo de ilustrar cómo se pueden integrar estas herramientas en la enseñanza, exponemos el siguiente ejemplo práctico realizado integrando algunas de las herramientas aquí descritas. Permitirá explorar las maneras en que la IA puede ser útil en tu labor docente.<span style="color: rgb(224, 62, 45);"> </span>

<table border="1" id="bkmrk-vamos-a-generar-un-a" style="border-collapse: collapse; width: 100%; border-width: 1px; border-color: blue;"><colgroup><col style="width: 99.8765%;"></col></colgroup><tbody><tr><td style="border-color: blue;">Vamos a generar un **avatar animado**, mediante el uso de **4 herramientas de IA generativa**

**La imagen** para posteriormente generar el avatar puede ser propia o de cualquier otra persona o personaje. En nuestro caso hemos pedido a **Leonardo.AI** que nos generara un a imagen del físico Richard Feynman.

Para el **texto** que R. Feynman va a decir le hemos pedido a **ChatGPT** que actuara como si fuera R. Feynman (tanto en estilo como en contenido) y explicara su opinión sobre la IA.

Para el **audio, la voz,** hemos escogido la aplicación **ElevenLabs,** ya que es capaz de sintetizar cualquier voz de la que dispongamos fichero de audio, ya sea la del propio personaje, nuestra propia voz (como es el caso), o una voz propuesta por la propia herramienta. En ELvenLAbs, cargas el texto generado por ChatGPT y le pides que genere un audio, leyendo ese texto con la voz que hayas sintetizado. Una vez generado el fichero, lo descargas.

Por último, **el video** (Avatar animado) lo hemos generado con **D-ID,** al que alimentaremos por un lado con la imagen creada con Leonardo.AI y el fichero de audio generado con Eleven Labs. Le pedimos que genere la animación y este es el resultado, haz clic en la imagen para ver la animación: **[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/Sqfimage.png)](https://youtu.be/XXMs--pe6Qk)**

</td></tr></tbody></table>

<span lang="es-ES">Hemos elegido [D-ID](https://www.d-id.com/)</span> <span lang="es-ES">para el video mostrando una posible aplicación de aula, pero como en el resto de modos de generación podemos encontrar varias herramientas para generar vídeo, por ejemplo:</span>

- <span lang="es-ES">[Canva](https://www.canva.com/) - Animador mágico: puedes dibujar la trayectoria de desplazamiento de cualquier elemento de las composiciones multimedia que presenta y, gracias a la IA, generará automáticamente tanto el movimiento como los efectos correspondientes. </span>
- <span lang="es-ES">[Rephrase.ai](https://www.rephrase.ai/?ref=futurepedia) - Texto a video con avatar</span>
- <span lang="es-ES">[Vidyo.ai](https://vidyo.ai/?ref=futurepedia) - Corta videos largos en segundos</span>
- <span lang="es-ES">[Wonder Studio](https://wonderdynamics.com/) - Permite generar efectos especiales, insertar y eliminar personajes de cualquier escena.</span>

---

##### **Generación de código**

Las herramientas de generación de código son herramientas basadas en inteligencia artificial que están empezando a adquirir protagonismo en el desarrollo y optimización de código de programación. Son capaces de crear algoritmos, segmentos de código y solucionar problemas de programación de manera automática o con asistencia, proporcionando una herramienta práctica tanto para profesionales como para docentes como para estudiantes en el proceso de aprendizaje y práctica de programación.

En el entorno educativo, estas herramientas de generación de código pueden suponer un cambio significativo. Los estudiantes pueden emplear estas herramientas de IA generativa para explorar y entender conceptos de programación de forma más eficaz, obteniendo ejemplos prácticos y funcionales de código para resolver problemas específicos. Los profesores, por otro lado, pueden utilizar estas herramientas para crear ejercicios y proyectos de programación más retadores y diversos, ofreciendo a los estudiantes una experiencia de aprendizaje más completa. Además, estas herramientas pueden facilitar el desarrollo de software dentro del sector educativo, permitiendo a las instituciones crear aplicaciones a medida para fines docentes y gestión de datos académicos.

<span lang="es-ES">Estas son algunas de las herramientas de generación de código:</span>

- [ChatGPT ](https://chat.openai.com/)- Chatbot conversacional general (si, ChaGPT tambien genera código, al igual que otros chatbots)
- [Adrenaline](https://useadrenaline.com/)
- [Cosine ](https://cosine.sh/)
- [Amazon CodeWhisperer](https://aws.amazon.com/es/codewhisperer/)
- <span lang="es-ES">[Code GPT](https://codegpt.co/)</span>

---

Por último, aunque no pueda incluirse en ninguna de las agrupaciones anteriores por su carácter meramente científico, destacar **[*<span style="text-decoration: underline;"><span style="color: rgb(53, 152, 219); text-decoration: underline;">Wolfram Research,</span></span>*](https://www.wolfram.com/)** conocida principalmente por desarrollar productos de **software matemático,** que también incluye desarrollos de IA. Dentro de esta plataforma distinguimos.

[![image.png](https://libros.catedu.es/uploads/images/gallery/2023-10/scaled-1680-/gmWimage.png)](https://libros.catedu.es/uploads/images/gallery/2023-10/gmWimage.png)

- [*<span style="text-decoration: underline;"><span style="color: rgb(53, 152, 219);">**Wolfram|Alpha**:</span></span>*](https://es.wolframalpha.com/) Es un motor de cálculo computacional y respuesta a preguntas. Puedes hacerle preguntas en lenguaje natural y te dará respuestas detalladas. Es como un "ChatGPT" especializado en matemáticas y ciencia.
- [<span style="text-decoration: underline; color: rgb(53, 152, 219);">***Mathematica**:*</span>](https://www.wolfram.com/mathematica/) Es un software líder en cálculo simbólico y numérico, utilizado ampliamente en investigación y educación para realizar cálculos matemáticos, análisis de datos, visualización y desarrollo de algoritmos.
- [*<span style="text-decoration: underline;"><span style="color: rgb(53, 152, 219);">**Wolfram Language**:</span></span>*](https://www.wolfram.com/language/) Un lenguaje de programación de alto nivel que alimenta a Mathematica y Wolfram|Alpha. Es conocido por su capacidad de integración y por tener funciones incorporadas para muchas tareas.

---

#### Plataformas educativas

Las plataformas educativas tienen vocación de abarcar mayor espacio en el proceso educativo, gestionando y monitorizando el progreso de los alumnos implicando en el mismo diferentes herramientas entre las que pueden estar algunas de las herramientas específicas vistas y otras que recopilen la información personalizada surgida del propio proceso con el fin de analizar la evolución de cada estudiante y proporcionarle los recursos específicos adaptados a su necesidad en cada momento.

Algunas de estas plataformas ya han sido adaptadas por sistemas educativos a nivel institucional, como <span style="text-decoration: underline;"> <span style="color: rgb(53, 152, 219); text-decoration: underline;">***[Eduten ](https://eduten.com/es/)***</span></span><span style="color: rgb(53, 152, 219);"> </span>

**Eduten** es una plataforma de aprendizaje digital finlandesa que ofrece ejercicios y juegos personalizados para estudiantes de primaria y secundaria. La plataforma está disponible en inglés y español. Los servicios de la plataforma son contratables para cualquier institución educativa interesada.

Su funcionamiento se basa en un **algoritmo de aprendizaje automático** para **personalizar** el contenido y la dificultad de los ejercicios a las necesidades de cada estudiante. Esto ayuda a los estudiantes a aprender a su propio ritmo y a dominar los conceptos de forma efectiva.

La plataforma ofrece una amplia gama de ejercicios y juegos, incluyendo:

- **Matemáticas:** Ejercicios de matemáticas para aprender y practicar conceptos básicos y avanzados.
- **Lengua y literatura:** Ejercicios de comprensión lectora, escritura y gramática.
- **Ciencias:** Ejercicios de ciencias para aprender sobre el mundo natural.
- **Historia:** Ejercicios de historia para aprender sobre eventos y personajes históricos.
- **Geografía:** Ejercicios de geografía para aprender sobre el mundo y sus culturas.

Pero sobre todo ofrece **análisis de aprendizaje** para que los profesores puedan **monitorear el progreso** de sus alumnos. Estos análisis incluyen información sobre el tiempo que los estudiantes pasan en la plataforma, las tareas que completan y su rendimiento en las tareas.

Aquí hay algunos de los beneficios de utilizar Eduten:

- **Aprendizaje personalizado:** Adapta el contenido y la dificultad de los ejercicios a las necesidades de cada estudiante. Esto ayuda a los estudiantes a aprender a su propio ritmo y a dominar los conceptos de forma efectiva.
- **Retroalimentación Inmediata**: Los estudiantes reciben retroalimentación inmediata sobre sus respuestas, lo que les ayuda a comprender y corregir errores al instante.
- **Motivación:** Utiliza ejercicios y juegos atractivos para mantener a los estudiantes motivados. Esto ayuda a los estudiantes a participar en el aprendizaje y a retener la información.
- **Análisis de aprendizaje:** Proporciona análisis de aprendizaje para que los profesores puedan monitorear el progreso de sus alumnos. Esto ayuda a los profesores a identificar las áreas de mejora y a proporcionar a los estudiantes la ayuda que necesitan.

<span style="color: rgb(53, 152, 219);"><span style="color: rgb(0, 0, 0);"><iframe allowfullscreen="allowfullscreen" height="350" src="https://www.youtube.com/embed/K7-5fbpocOg?t=2s" style="width: 624px; height: 350px;" width="624"></iframe>

</span></span>

Otras, son plataformas web como ***<span style="text-decoration: underline;"><span style="color: rgb(53, 152, 219); text-decoration: underline;">[Khanmigo](https://www.khanacademy.org/khan-labs).</span></span>***<span style="color: rgb(53, 152, 219);"><span style="color: rgb(0, 0, 0);"> Khanmigo </span></span>es un chatbot de aprendizaje personalizado desarrollado por ***<span style="text-decoration: underline;"><span style="color: rgb(53, 152, 219); text-decoration: underline;">[Khan Academy](https://www.khanacademy.org/khan-labs#whoIsKhanAcademy)</span></span>***. Khanmigo utiliza el modelo de lenguaje GPT-4 de OpenAI para proporcionar a los estudiantes un aprendizaje individualizado y relevante. Puede personalizar el aprendizaje de los estudiantes de varias maneras;

- **Adaptando el contenido:** adapta el contenido a las necesidades y preferencias de los estudiantes. Por ejemplo, si un estudiante tiene dificultades con un concepto, Khanmigo puede proporcionarle más explicaciones o ejemplos.
- **Proporcionar retroalimentación personalizada:** proporciona retroalimentación personalizada a los estudiantes sobre su trabajo. Esta retroalimentación puede ayudar a los estudiantes a identificar sus áreas de mejora y a desarrollar estrategias de aprendizaje efectivas.
- **Crear un plan de aprendizaje individualizado:** puede crear un plan de aprendizaje exclusivo para cada estudiante. Este plan se basa en las necesidades y objetivos de aprendizaje del estudiante.

En el siguiente video **Sal Khan**, fundador de la plataforma explica las características de la misma:

<iframe allowfullscreen="allowfullscreen" height="355" src="https://www.youtube.com/embed/yEgHrxvLsz0" style="width: 633px; height: 355px;" width="633"></iframe>

No podía faltar la incorporación de la IA a la plataforma educativa de **Google Classroom,** El gigante tecnológico ha incluido entre las funcionalidades de su las [<span style="color: rgb(53, 152, 219);">**Practicas Guiadas (Practice Sets)**</span> ](https://blog.google/outreach-initiatives/education/introducing-practice-sets/)en su herramienta educativa. Esta novedad en Google Classroom aporta la anhelada posibilidad de personalizar el aprendizaje de cada estudiante mediante la tecnología de aprendizaje adaptativo

Este es un hito anhelado y ya accesible para que cada profesor pueda apoyar a sus estudiantes mediante tareas interactivas y comentarios en tiempo real e individualizados. Este método se basa en la medición, recopilación y análisis de datos (Learning Analytics) sobre el alumnado, su entorno y sus interacciones con el objetivo de adaptarse a sus necesidades

Esta función está disponible en Google Classroom para cualquier educador que utilice la ‘Teaching and Learning upgrade’, o cualquier institución que emplee Google Workspace for Education Plus. Una vez creadas las prácticas, es posible que todos los profesores del centro las compartan.

En el siguiente video tienes mas información al respecto:

<iframe allowfullscreen="allowfullscreen" height="352" src="https://www.youtube.com/embed/XtfLbKirX8g" style="width: 628px; height: 352px;" width="628"></iframe>

# Referencias Módulo 3

**Web:** Herramienta para la gestión de contenidos en el aula

[https://www.magicschool.ai/](https://www.magicschool.ai/)

---

**Web**: Guía de ingeniería del *prompting*

[https://www.promptingguide.ai/es](https://www.promptingguide.ai/es)

<span style="font-size: 10.5pt; font-family: 'Segoe UI',sans-serif; mso-fareast-font-family: 'Times New Roman'; color: #333333; mso-font-kerning: 0pt; mso-ligatures: none; mso-fareast-language: ES;">[https://profesoreco.blogspot.com/2023/04/instrucciones-precisas-y-potentes.html](https://profesoreco.blogspot.com/2023/04/instrucciones-precisas-y-potentes.html)</span>

---

**Vídeo** repaso conceptos y aplicaciones IA Generativa

[https://youtube.com/watch?v=QC3J3DAMUvg&amp;list=PLaFUiA52BD9H-EZJfgR9qEBVNdiXJuucC&amp;index=2&amp;t=7329s](https://youtube.com/watch?v=QC3J3DAMUvg&list=PLaFUiA52BD9H-EZJfgR9qEBVNdiXJuucC&index=2&t=7329s)

---

**Vídeo** IA Genrativa. Se explica de forma muy sencilla el concepto y aplicaciones de la IA Generativa

[https://www.youtube.com/watch?v=\_6R7Ym6Vy\_I](https://www.youtube.com/watch?v=_6R7Ym6Vy_I)

---

**Documento pdf:** Informe UNESCO AI y Educación, guía para gestores

[https://unesdoc.unesco.org/ark:/48223/pf0000379376/PDF/379376spa.pdf.multi](https://unesdoc.unesco.org/ark:/48223/pf0000379376/PDF/379376spa.pdf.multi)

---

**Web** Asistente de Khan Academy: Khanmigo

[https://www.khanacademy.org/khan-labs](https://www.khanacademy.org/khan-labs)

---

**Curso** <span class="provider">INTEF:</span> <span class="course-number">IAEducacion</span> <span class="course-name">Una IA para aprender</span>

<span class="course-name">[https://enlinea.intef.es/courses/course-v1:INTEFMOOC+IAEducacion+2023\_T1/about](https://enlinea.intef.es/courses/course-v1:INTEFMOOC+IAEducacion+2023_T1/about)</span>

---

**Web** AI Tool Master List Conjunto de herramientas de IA clasificadas por su ámbito de aplicación

<span class="course-name">[https://doc.clickup.com/25598832/d/h/rd6vg-14247/0b79ca1dc0f7429/rd6vg-12207](https://doc.clickup.com/25598832/d/h/rd6vg-14247/0b79ca1dc0f7429/rd6vg-12207)</span>

---

**Web** Futurepedia

<span class="course-name">Directorio de herramientas de IA </span>

<span class="course-name">[https://www.futurepedia.io](https://www.futurepedia.io)</span>