Módulo 3. Y ahora que hacemos. Aplicaciones de la IA
Este módulo da una visión de las aplicaciones más importantes y potentes de IA así como una guía detallada de técnicas de prompting que facilite el uso de dichas aplicaciones, siempre haciendo énfasis en aplicaciones en el ámbito educativo.
- Unidad 3.1. Posibilidades de la IA
- Unidad 3.2. Tutorial de Prompting. La impotancía de las preguntas
- Unidad 3.3. Más allá del texto. IA Generativa
- Unidad 3.4. Aplicaciones educativas
- Referencias Módulo 3
Unidad 3.1. Posibilidades de la IA
Introducción
Hemos repasado la historia de las ideas y avances que han llevado a la IA al momento actual. Hemos visto que la IA ya es una realidad en nuestra sociedad y que tiene una gran importancia en la economía y un enorme potencial por delante. También hemos podido analizar su funcionamiento, lo que sin duda nos ayudará a entenderla un poco mejor y a poder sacar un mejor provecho de la misma cuando empecemos a explorar las posibilidades que nos ofrece.
En esta unidad vamos a entrar en el mundo de posibilidades que se abre ante nosotros, repasando y analizando las posibles aplicaciones de la IA.
Posibilidades de la IA
La Inteligencia Artificial tiene una gran cantidad de aplicaciones en varios campos. Muchas de ellas, ya las hemos visto en unidades anteriores, ya fuera al exponer las aplicaciones actuales de la IA o al analizar el funcionamiento de la misma. Si bien ahora vamos a entrar a profundizar en las posibilidades de uso "cotidiano" de manera que podamos extraer conclusiones sobre la utilidad que nos pueden reportar. Aquí hay una descripción estructurada de algunas de las aplicaciones más notables de la IA, organizadas por categorías funcionales:
Procesamiento del lenguaje natural (PLN)
El PLN es una subdisciplina de la IA que se centra en la interacción entre las computadoras y el lenguaje humano. A través de los años, las capacidades de los modelos de PLN han avanzado enormemente. A continuación, se describen algunas de las cosas de las que es capaz un modelo de PLN:
- Análisis de Sentimiento. Determinar si un texto expresa un sentimiento positivo, negativo o neutro. Es ampliamente utilizado en monitoreo de redes sociales y análisis de opiniones en línea.
- Traducción Automática. Traducir texto de un lenguaje a otro. Ejemplos famosos incluyen herramientas como Google Translate.
- Resumen Automático. Generar resúmenes concisos de textos largos.
- Reconocimiento de Entidades Nombradas. Identificar y clasificar entidades en un texto (como nombres de personas, organizaciones, lugares, etc.).
- Clasificación de Texto. Clasificar textos en diferentes categorías. Por ejemplo, determinar si un email es spam o no.
- Respuesta a Preguntas. Responder preguntas basadas en un conjunto de información o conocimiento. Los chatbots y asistentes virtuales a menudo utilizan esta capacidad.
- Generación de Texto. Producir texto de manera coherente y relevante. Por ejemplo, modelos como GPT-3 y GPT-4 de OpenAI son capaces de generar contenido textual en una variedad de estilos y temas.
- Extracción de Información: Extraer datos específicos de textos grandes, como extraer fechas, cifras, hechos, etc.
- Corrección Ortográfica y Gramatical: Identificar y corregir errores en el texto.
- Análisis de Dependencia y Sintáctico: Descomponer y entender la estructura gramatical de las oraciones.
- Reconocimiento de Voz: Convertir el habla en texto. Esta tecnología está detrás de asistentes como Siri, Alexa y Google Assistant.
- Síntesis de Voz: Convertir texto escrito en habla.
- Recomendaciones de Texto. Sugerir palabras o frases mientras un usuario está escribiendo, como lo hace el teclado de un smartphone o las búsquedas en Google.
- Desambiguación Léxica. Determinar el significado de una palabra basándose en su contexto.
- Detección de Idioma. Identificar en qué idioma está escrito un texto.
Es importante destacar que, aunque los modelos de PLN han alcanzado altos niveles de rendimiento en muchas tareas, todavía enfrentan desafíos, especialmente cuando se trata de entender el contexto completo, el sarcasmo, o ciertas sutilezas y ambigüedades del lenguaje humano.
Visión por computadora
La visión por computadora es otra rama de la IA que se ocupa de permitir que las computadoras "vean" e interpreten imágenes y videos. Los sistemas de inteligencia artificial que utilizan visión por computadora han experimentado avances significativos en los últimos años. Estas son algunas de las posibilidades y aplicaciones de la visión por computadora con IA:
- Reconocimiento facial. Puede identificar y verificar personas a partir de imágenes o vídeos. Esto se utiliza en aplicaciones de seguridad, desbloqueo de dispositivos móviles y etiquetado automático en redes sociales.
- Reconocimiento de objetos. Puede identificar y clasificar objetos dentro de imágenes. Por ejemplo, en aplicaciones de comercio electrónico para identificar productos o en vehículos autónomos para identificar obstáculos.
- Detección de defectos. En la industria manufacturera, se utilizan cámaras y sistemas de IA para detectar defectos en productos en la línea de producción.
- Análisis médico. En el campo de la medicina, los sistemas de IA pueden ayudar a diagnosticar enfermedades al analizar imágenes médicas como radiografías, resonancias magnéticas y tomografías.
- Navegación autónoma. Los vehículos autónomos y drones utilizan visión por computadora para navegar, detectar obstáculos y tomar decisiones en tiempo real.
- Realidad aumentada (RA). Las aplicaciones de RA utilizan visión por computadora para superponer información digital sobre el mundo real.
- Seguimiento de movimiento. Utilizado en deportes para seguir la trayectoria de balones o en cinematografía para efectos especiales.
- Análisis de comportamiento. En seguridad o marketing, puede analizar patrones de movimiento de las personas y detectar comportamientos inusuales o medir la efectividad de exhibidores publicitarios.
- Reconocimiento de texto (OCR). Convertir imágenes de texto escrito o impreso en datos textuales. Esto se usa en aplicaciones de digitalización de documentos y traducción en tiempo real de señales o menús, por ejemplo.
- Control de calidad. En agricultura, por ejemplo, se pueden usar sistemas de visión por computadora para clasificar frutas y verduras según su calidad.
- Reconocimiento de gestos. Permite la interacción con dispositivos mediante gestos manuales.
- Segmentación semántica. Clasifica cada píxel de una imagen en una categoría, como "persona", "coche", "edificio", etc., permitiendo una comprensión más detallada del entorno.
- Estimación de pose. Detecta la posición y orientación del cuerpo humano en tiempo real, útil para aplicaciones de fitness, videojuegos y más.
La combinación de hardware cada vez más potente, grandes conjuntos de datos y algoritmos avanzados de aprendizaje profundo ha permitido que la visión por computadora con IA penetre en muchos sectores y continúe expandiéndose en nuevas áreas. La investigación en este campo es activa y sigue produciendo mejoras y nuevas capacidades.
Audio
Los sistemas de inteligencia artificial que procesan y analizan audio han experimentado también avances considerables. Las aplicaciones relacionadas con el audio y la IA abarcan una amplia gama de áreas. Estas son algunas de las posibilidades y aplicaciones de la IA en este ámbito:
- Reconocimiento de voz. Convertir el habla en texto, como lo hacen los asistentes virtuales.
- Síntesis de voz. Convertir texto en habla, lo que permite que las máquinas "hablen" con un tono y cadencia más natural.
- Identificación de hablantes. Reconocer a una persona específica por su voz, lo que puede ser útil en aplicaciones de seguridad o personalización.
- Traducción automática. Traducir en tiempo real el habla de un idioma a otro.
- Reconocimiento de sonidos ambientales. Detectar y clasificar sonidos no verbales, como sirenas, ladridos de perros o maquinaria en funcionamiento.
- Detección de emociones. Analizar el tono y las inflexiones de la voz para determinar el estado emocional del hablante.
- Mejora y restauración de audio. Detectar y eliminar ruidos o sonidos que no se quiere que aparezcan y mejorar la claridad del audio en grabaciones.
- Música. Composición automática, recomendaciones musicales personalizadas y análisis de propiedades musicales.
- Análisis acústico. Monitorizar entornos para detectar anomalías, como en sistemas de seguridad o en análisis de salud de maquinaria.
- Generación de música y sonido. Crear música o efectos de sonido nuevos usando redes neuronales.
- Transcripciones automáticas. Convertir grabaciones de voz, como entrevistas, conferencias o reuniones, en texto escrito.
- Sistemas de verificación biométrica. Usar el audio, específicamente la voz, como una forma de verificación biométrica para autenticar a los usuarios.
- Adaptación y personalización. Ajustar la respuesta de un asistente virtual según el usuario y su contexto basándose en el análisis del audio.
- Educación y formación. Herramientas para ayudar en la pronunciación de idiomas o para detectar errores en la lectura en voz alta.
De nuevo aquí, la convergencia de grandes conjuntos de datos de audio, algoritmos avanzados (especialmente en el área de redes neuronales recurrentes y transformadores) y hardware más potente ha impulsado la adopción de la IA en aplicaciones de audio. Como en otros campos de la IA, la investigación en audio sigue siendo muy activa y está abriendo nuevas posibilidades y mejoras continuamente.
Multimodo
Hasta aquí, es posible que te haya asaltado la idea de que estos modos podrían ser combinables para obtener una mayor funcionalidad y utilidad del sistema, eso es precisamente lo que hacen los sistemas multimodales. Los sistemas de IA multimodo son aquellos que combinan información de algunas o todas las modalidades vistas previamente (texto, imagen/video, audio) para llevar a cabo tareas o proporcionar soluciones más integradas y contextuales. Estos sistemas son especialmente poderosos porque pueden aprovechar las fortalezas y compensar las debilidades de cada modalidad individual. Aquí hay algunas posibilidades y aplicaciones de la IA multimodo:
- Asistentes virtuales mejorados. Un asistente que puede comprender tanto el habla (audio) como las expresiones faciales (video) puede proporcionar respuestas más contextuales y emotivas.
- Análisis de sentimientos avanzado. Al combinar el análisis de texto (por ejemplo, de transcripciones) con el análisis de tono de voz y expresiones faciales, se puede obtener una comprensión más precisa del sentimiento de una persona.
- Educación y formación. Plataformas educativas que adaptan el contenido según las respuestas verbales y no verbales de un estudiante. Por ejemplo, si un estudiante parece confundido (expresión facial) y hace una pregunta relevante (audio), el sistema puede ofrecer información adicional.
- Reuniones y teleconferencias. Herramientas que pueden transcribir automáticamente el habla, identificar a los participantes a través del reconocimiento facial y resaltar puntos clave basándose en énfasis vocal o gestos.
- Publicidad y marketing. Análisis de reacciones de audiencias a contenido multimedia, combinando respuestas textuales con análisis de expresiones faciales y tono de voz.
- Realidad aumentada y virtual. Sistemas que responden a comandos de voz, gestos y movimientos oculares simultáneamente para proporcionar una experiencia más inmersiva.
- Sistemas de navegación en vehículos. Combina señales visuales (obtenidas mediante cámaras) con comandos de voz y datos de sensores para ofrecer instrucciones más precisas y seguras.
- Salud y bienestar. Aplicaciones que monitorizan tanto el habla (para detectar signos de estrés o depresión, por ejemplo) como las expresiones faciales o la postura corporal para proporcionar retroalimentación y apoyo.
- Entretenimiento interactivo. Videojuegos o experiencias interactivas que responden a múltiples señales del usuario, desde comandos de voz hasta movimientos corporales.
- Búsqueda avanzada. Búsqueda de contenido en plataformas que no solo interpreta palabras clave, sino también contextos visuales y auditivos asociados.
- Accesibilidad. Sistemas que ayudan a personas con discapacidades a interactuar con la tecnología, combinando, por ejemplo, interpretación de lenguaje de señas con comandos de voz.
El desarrollo de sistemas de IA multimodo es complejo, ya que requiere la integración efectiva de modelos especializados en diferentes modalidades. Sin embargo, a medida que la tecnología avanza, sin duda veremos una adopción más amplia de soluciones multimodo, dada su capacidad para proporcionar experiencias más ricas y contextuales.
Principales empresas de IA y sus chatBots en marzo de 2024
Unidad 3.2. Tutorial de Prompting. La impotancía de las preguntas
"Juzga a un hombre por sus preguntas y no por sus respuestas" Voltaire
"No es la respuesta la que ilumina, sino la pregunta" Eugene Ionesco
“Lo importante es no dejar de hacerse preguntas”
"Si yo tuviera una hora para resolver un problema, y mi vida dependiera de la solución, gastaría los primeros 55 minutos en determinar la pregunta apropiada, porque una vez conociera la pregunta correcta, podría resolver el problema en menos de cinco minutos"
Albert Einstein
Introducción
Ya hemos visto que la herramienta que provocó la irrupción masiva la inteligencia artificial a nivel popular fue el chatbot ChatGPT. La tecnología que hay detrás de este chat es el mencionado PLN (Procesamiento del Lenguaje Natural). A día de hoy, esta tecnología se ha utilizado para desarrollar muchos otros chatbots (Gemini, Llama, Claude etc…). El PLN es un subcampo de la IA que utiliza modelos de lenguaje para predecir una secuencia de palabras.
Para poder sacar el mayor potencial de estos modelos, es crucial entender y aplicar de manera efectiva la técnica de "prompting". Esta técnica nos permite interactuar con estos modelos de lenguaje para recibir respuestas específicas y generar distintos tipos de contenido, desde texto, como en los chatbots, hasta imágenes y sonidos a través de otras herramientas que veremos más adelante.
En este capítulo, vamos a explorar el concepto de prompting de forma detallada, sus implicaciones en la IA, y su potencial aplicación en la educación.
¿Qué es el prompting? y su importancia
El prompting es una técnica utilizada para interactuar con sistemas de IA mediante indicaciones o preguntas específicas . Es el medio por el cual se le pide a un modelo de lenguaje o a un algoritmo de IA que realice una acción o que genere una respuesta. Este concepto es fundamental para aprovechar plenamente las capacidades de los modelos de IA, especialmente en el procesamiento de lenguaje natural (PLN).
El prompting nos lleva a introducir al modelo un prompt, lo que en castellano podríamos traducir como “cuestión, pregunta o Indicación”.
Por tanto, el prompting se trata, dicho de manera simple, de pensar y trabajar la indicación o pregunta que vamos a realizarle al modelo de IA para que la respuesta o resultado que el modelo nos presente sea lo más ajustado posible a nuestra solicitud y nos aporte un contenido lo más valioso posible.
Un ejemplo aclaratorio:
Todos hemos hecho búsquedas en cualquiera de los buscadores disponibles por internet. Al hacerlas, en mayor o menor medida hacemos un esfuerzo para introducir el texto adecuado para que el motor de búsqueda encuentre la web o webs más relevantes para nuestra necesidad concreta. Ese esfuerzo que hacemos para que nuestra entrada facilite al buscador ofrecernos lo que buscamos sería el prompting. En el contexto de un motor de búsqueda, esto se traduciría en cómo eliges y organizas las palabras clave para obtener los resultados más relevantes. Es una especie de "arte" en cómo haces la pregunta para obtener la mejor respuesta
A su vez, el texto que introducimos en el buscador representaría el prompt. Es la consulta específica que generas, compuesta de palabras clave, frases o preguntas, que el motor de búsqueda procesa para obtener resultados.
El prompting es esencial para una gran variedad de aplicaciones de IA. Desde asistentes virtuales hasta motores de búsqueda y sistemas de recomendación, el diseño y la implementación efectiva de prompts son cruciales para la eficacia y precisión de estos sistemas. Además, con la aparición de modelos más avanzados y diversos, el papel del prompting se ha expandido para incluir la generación de contenido más allá del texto, como imágenes y sonidos.
Imagen propia. Generada por el Generador de imágenes de Bing.
Evolución del prompting
En los albores de la computación, las interacciones con las máquinas eran bastante rudimentarias. Las interfaces de línea de comandos fueron algunas de las primeras formas de prompting, donde los usuarios ingresaban comandos de texto específicos para obtener respuestas o realizar tareas.
Con el tiempo y el avance tecnológico, las formas de interactuar con las máquinas se han vuelto cada vez más sofisticadas. Pasamos de las interfaces de línea de comandos (MS-DOS) a interfaces gráficas de usuario (Windows) y luego a interacciones más intuitivas gracias a la IA. Los modelos de lenguaje de gran escala como por ejemplo GPT-3 (modelo detrás de ChatGPT) y LaMDA (modelo detrás de Bard) permiten ahora una interacción mucho más natural y conversacional. A través de prompts bien diseñados, estos y otros modelos pueden comprender y generar texto, imágenes, y sonidos que son increíblemente cercanos a lo que un humano podría producir o entender.
En sus inicios, el prompting se limitaba principalmente al texto. Sin embargo, con el desarrollo de modelos de IA más avanzados, ahora es posible generar y analizar diferentes tipos de medios. Por ejemplo, existen modelos que pueden generar imágenes basadas en descripciones de texto (prompts de imagen), y también modelos que podrían generar un texto basándose en una imagen (que en este caso haría el papel de prompt), pero también modelos que pueden componer música basada en ciertas instrucciones o emociones (prompts de audio). Esta evolución ha ampliado enormemente el alcance y las aplicaciones del prompting, permitiendo una gama más amplia de interacciones y generación de contenido.
Modelos capaces de entender prompts de diferentes tipos y generar resultados también de diferentes tipos serían los mencionados multimodales. Un ejemplo: introducir una imagen de un paisaje otoñal en un modelo de este tipo, y solicitar que genere un poema que capture la esencia de la imagen.
Este tipo de interacción representa una evolución emocionante en el campo del prompting, ya que amplía significativamente las formas en que podemos interactuar con los modelos de IA. Los prompts ya no están limitados al texto, sino que pueden abarcar una variedad de medios, incluidas imágenes, sonidos y quizás más en el futuro.
Esta funcionalidad tiene aplicaciones potenciales muy interesantes, no solo en el ámbito del arte y la creatividad, sino también en campos como la educación, donde podría emplearse para enseñar conceptos como la interpretación de imágenes, la escritura creativa o incluso la empatía y el entendimiento cultural.
Tipos de prompts
Como acabamos de ver, a medida que la inteligencia artificial ha evolucionado, los prompts que podemos utilizar para interactuar con los modelos también lo han hecho. Mientras que en sus inicios el prompting se centraba exclusivamente en el texto, la tecnología actual permite una gama mucho más amplia de interacciones.
El desarrollo de la IA le permite abordar una amplia variedad de modalidades. Las "modalidades" en este contexto se refieren a las diferentes formas de datos o información que los sistemas de IA pueden procesar (prompt de entrada) o generar (salida de la IA).
En la siguiente tabla vamos a resumir todas las modalidades que la IA generativa nos ofrece. Cada una de las cuales admite uno o más tipos de prompts.
Prompt (entrada) |
Respuesta IA (salida) |
Ejemplo de uso |
Texto |
Texto |
Chatbot, traducción, resumen… |
Texto |
Imagen |
Generación imagen desde texto |
Texto |
Video |
Generación de video desde texto |
Texto |
Audio |
Síntesis de voz, sistemas Text-To-Speech, generación de música |
Imagen |
Texto |
Descripción imagen, reconocimiento óptico de caracteres (OCR) |
Imagen |
Imagen |
Colorización de imágenes en blanco y negro, superresolución, estilo transfer entre imágenes |
Audio |
Texto |
Transcripción automática, reconocimiento de voz |
Audio |
Audio |
Eliminación de ruido, cambio de tono o velocidad |
Video |
Texto |
Subtitulación, descripción automática del contenido |
Video |
Video |
Mejora de resolución de video, transferencia de estilos de videos |
Combinación de anteriores |
Cualquiera o una combinación de las anteriores |
MULTIMODALIDAD: Sistemas que pueden recibir una imagen y una pregunta en texto sobre esa imagen, y proporcionar una respuesta en texto o audio. |
Estas son algunas de las principales modalidades en las que operan los sistemas de IA. Pero hay que subrayar que la investigación en IA está en constante evolución, y con el tiempo es probable que veamos aún más capacidades y combinaciones en términos de modalidades.
A continuación, examinaremos con mayor profundidad algunas posibilidades de los tipos de prompts de uso mas común
Prompts de Texto
El texto ha sido tradicionalmente el medio más común para el prompting en IA. Los prompts de texto se introducen generalmente en forma de preguntas o indicaciones. Dentro de los prompts de texto podemos distinguir en base al tipo de respuesta que queremos obtener:
- Prompts abiertos vs cerrados:
Los prompts abiertos son aquellos que no limitan las respuestas de la IA, como "Háblame sobre el cambio climático".
Los prompts cerrados, en cambio, buscan respuestas específicas, como "¿En qué año nació Albert Einstein?".
- Prompts de selección múltiple. A veces, se presenta a la IA una serie de opciones y se le pide que elija la correcta o la más adecuada según el contexto. Por ejemplo: "¿Cuál es la capital de Francia? A) Madrid, B) Berlín, C) París".
- Prompts de texto libre. Son aquellos en los que se le da libertad a la IA para generar contenido, como "Escribe un cuento corto sobre un robot".
Prompts Visuales
Con la evolución de los modelos de IA hacia capacidades multimodales, es posible usar imágenes o videos como prompts. Con estos prompts se le puede solicitar a la IA que describa la imagen, identifique objetos en ella o, como se mencionó anteriormente, genere texto creativo inspirado en la imagen. También puede pedírsele una salida de la imagen o video mejorada o modificada.
Prompts de Audio
La capacidad de procesar y generar audio ha abierto una nueva dimensión en el mundo del prompting. Los prompts de audio pueden variar desde simples indicaciones verbales hasta la introducción de fragmentos de música o sonidos específicos.
- Sonidos. Se pueden usar para que la IA identifique o describa, como el canto de un pájaro o el ruido de la lluvia.
- Música. Puede servir como inspiración para que la IA genere letras de canciones, identifique el género musical o incluso cree una melodía complementaria.
Estos son solo ejemplos de las posibilidades ya explotadas y de uso frecuente. La versatilidad y el potencial de la inteligencia artificial moderna abre un mar de posibilidades. Ya no estamos limitados a interacciones basadas en texto; la IA ahora tiene la capacidad de comprender y generar contenido en una variedad de medios, lo que permite aplicaciones mucho más ricas y diversificadas en numerosos campos.
Cómo funciona el prompting en IA
El prompting en la inteligencia artificial, desde el punto de vista del usuario, se resume en proporcionar una entrada más o menos elaborada y esperar una respuesta, si bien este proceso, muchas de las veces, requerirá de un cierto número de iteraciones hasta que la IA nos genere la respuesta conveniente.
Detrás de cada respuesta generada por un modelo de IA, hay una serie de procesos y tecnologías complejas. Vamos a realizar una ligera introducción que nos permita entender conceptualmente cómo funcionan estos sistemas, centrandonos en el Procesamiento del Lenguaje Natural (PLN) dado que es el que, en principio, más nos puede interesar como docentes. Si bien, veremos que conceptualmente el funcionamiento interno de los modelos tiene muchas similitudes independientemente de que se trate de un modo u otro.
Un poco de humor para una aproximación intuitiva al funcionamiento de la IA. Si el ingles no se te da muy bien, prueba a copiar y pegar la imagen en un chatbot, por ejemplo Bard, pídele que te explique el chiste y se estigo de una de las capacidades actuales de la IA.
El prompting en el Procesamiento de Lenguaje Natural (PLN)
Hemos visto que una parte de la IA se centra en los modelos Text2Text. Estos modelos requieren la introducción de un texto y devuelven otro texto como respuesta, ya sea una respuesta concreta, una conversación con un Chatbot, un resumen, una traducción…
La tecnología que hay debajo de esta modalidad es el Procesamiento de Lenguaje Natural (PLN)
El PLN, como sabemos, es una rama de la inteligencia artificial que se centra en la interacción entre las computadoras y el lenguaje humano. Su objetivo es permitir que las máquinas entiendan, interpreten y generen lenguaje de manera que sea valioso para los usuarios humanos.
El prompt es la entrada que la computadora debe entender, interpretar y utilizar para elaborar una respuesta útil. Al proporcionar un prompt textual, el modelo de lA procederá primero a su análisis. El análisis del prompt puede dividirse en los siguientes pasos:
- Identificación de las palabras clave: El sistema identifica las palabras clave en el prompt. Estas palabras clave son importantes para comprender su significado.
- Análisis de la estructura gramatical: El sistema analiza la estructura gramatical del prompt, lo que ayuda al sistema a comprender la relación entre las palabras y frases introducidas por el usuario.
- Identificación del contexto: El sistema identifica el contexto del prompt. Esto ayuda al sistema a comprender mejor su significado dentro del contexto de la conversación o tarea en la que se está utilizando.
Una vez que el sistema ha completado el análisis, puede comprender el significado y propósito del prompt, y le permite generar una respuesta adecuada.
Veamos un ejemplo sencillo:
Prompt: ¿Cuál es la capital de España?
- Identificación de las palabras clave: Si el prompt es "¿Cuál es la capital de España?", las palabras clave serían "capital" y "España".
- Análisis de la estructura gramatical: Si el prompt es "¿Cuál es la capital de España?", la estructura gramatical es una pregunta.
- Identificación del contexto: Si el prompt es "¿Cuál es la capital de España?", el contexto es una conversación sobre geografía.
Obviamente la respuesta que da el sistema es: Madrid
Sin embargo, cambiando un poco el contexto, el chatbot Chat GPT nos contesta
Y si le preguntamos lo mismo a Bard (Chatbot de Google):
Las respuestas son similares pero no idénticas. El corpus de documentación con la que se les ha entrenado será muy similar (básicamente todo el conocimiento humano "verificado" que pueda estar presente en internet hasta cierto momento) pero el proceso de entrenamiento y los algoritmos que procesan el prompt y generan la respuesta puede ser diferente.
Si bien ChatGPT ofrece una única respuesta inicial que puede ser modificada si se matiza el prompt, Bard presenta una respuesta principal y ofrece la posibilidad de, sin hacer matizaciones al prompt inicial, escoger entre 3 posibles respuestas:
Este ejemplo nos sirve para entender que distintos chatbots pueden generar distintas respuestas ante un mismo prompt y que es preciso realizar verificaciones de las mismas y no darlas por buenas sin mas.
Para entender más a fondo el funcionamiento interno de la IA, cómo esta es capaz de interpretar el prompt y dar una respuesta adecuada, profundizamos un poco y analizamos con mayor detalle los sencillos pasos descritos previamente. Introducimos además algo de lenguaje técnico muy presente en el ámbito de la IA, por lo que conviene familiarizarse con él (algunos de los conceptos y mecanismos ya se estudiaron en el módulo 2)
- Tokenización. El modelo comienza por dividir el prompt en tokens, que son fragmentos más pequeños del texto, como palabras o subpalabras (conjuntos de letras dentro de una palabra, prefijos, sufijos...).
- Embedding del texto. Cada token se convierte en un vector numérico, conocido como embedding. Estos embeddings se obtienen de grandes matrices preentrenadas que representan palabras o subpalabras en un espacio vectorial, donde palabras semánticamente similares están cercanas entre sí. Así cada embedding es una representación numérica de cada token que captura su semántica y significado. Dicha representación se basa en la cercanía semántica del contenido con respecto a la vasta información con la que el modelo ha sido entrenado.
- Procesamiento Interno.
- Codificador: El modelo procesa estos embeddings para entender el contexto y la relación entre los tokens. Esto se hace a través de múltiples capas de la red neuronal y mecanismos como la atención, que le permite al modelo darle un mayor peso o importancia a ciertos tokens en función de su relevancia en el contexto. Tras este procesamiento el modelo transforma los emmbedings (recuerda que es el prompt textual en forma de vector) en un conjunto compacto de características. Es decir, se reduce la dimensionalidad del vector original convirtiéndolo en algo más compacto pero que incluye todas sus características. Podríamos decir que capta la esencia del prompt.
- Decodificador: Usando la información contextual obtenida, el modelo genera una respuesta token por token, basándose en probabilidades y contextos aprendidos durante el entrenamiento.
-
- Ejemplo de este proceso. Mecanismo de estudio: Normalmente los textos no se aprenden de manera literal sino que, para estudiarlos, se procede a entender el contexto de un hecho concreto y únicamente se memorizan los conceptos mas relevantes en relación con ese hecho. Este sería nuestro entrenamiento previo del "modelo de estudio". Si después nos preguntan por lo estudiado (lo que equivaldría al prompt), nuestro cerebro va a analizar la pregunta extrayendo de la misma aquellas palabras más relevantes en relación al contexto de la pregunta para poder construir la respuesta posterior (estaría codificando el prompt, reduciendo sus dimensiones, agrupando toda la información relevante de la pregunta para convertirlo en algo compacto con significado propio). Por ultimo, nuestro cerebro comienza a construir una respuesta coherente en base a los conceptos y contexto relevante de la pregunta y cuyo contenido esta relacionado con la misma y se nutre de lo estudiado. En términos de IA, el contenido de la pregunta, compactado en un emmbeding, tiene un significado cercano en la nube de palabras y conceptos de entrenamiento.
- Generación Iterativa: La respuesta textual se genera de manera iterativa, considerando no solo el prompt inicial, sino también las palabras o tokens previamente generados para asegurar coherencia.
- Resultado Final: El modelo produce una secuencia de texto que sirve como respuesta o continuación del prompt.
El prompting en otros modelos de generación
Los modelos de texto a imagen o audio transforman descripciones textuales en representaciones visuales o de audio. El proceso interno coincide en la parte de comprensión del prompt con el detallado en el apartado anterior si bien difiere en la generación ya que en este caso se trata de una imagen o sonido en lugar de un texto. El proceso sería conceptualmente muy similar al descrito si bien existen algunas especificidades. Vamos a introducir los matices necesarios para adaptar la descripción realizada para el proceso prompting para la generación de texto al proceso para generar imágenes.
- Tokenización. Al igual que con el texto, las imágenes también pueden ser divididas en tokens, aunque de una manera diferente. Aquí, los tokens pueden representar ciertos segmentos o características de la imagen. Estos segmentos no son necesariamente "sub-imágenes", sino más bien patrones visuales o características identificables.
- Embedding del texto. Al igual que con el texto, cada token de imagen se convierte en un vector numérico. Sin embargo, estos embeddings capturan características visuales en lugar de semánticas.
- Proceso interno. Al generar una imagen, el modelo no produce una palabra o token a la vez, sino que puede generar o refinar zonas de la imagen de manera iterativa hasta que se complete la imagen deseada.
- Ejemplo. Imagina que estás pintando un paisaje. En lugar de memorizar y reproducir cada detalle exactamente, recuerdas los conceptos principales (montañas, cielo, árboles) y los pintas basándote en esa memoria y la interpretación del prompt (por ejemplo, "paisaje al atardecer").
Tanto para imagen como para otros casos, como el audio, los pasos son muy similares a lo descrito para el texto, con la principal diferencia de que el tipo de contenido que se está procesando y generando es distinto.
Es importante mencionar que la calidad y la precisión del texto, imagen o audio generado dependen en gran medida del modelo específico, de la cantidad y calidad de los datos con los que fue entrenado, y de la claridad y especificidad del prompt textual proporcionado. Este último aspecto es el que desarrollaremos a continuación.
Importancia en el diseño de prompts
En la interacción con modelos de inteligencia artificial generativos, el diseño de los prompts juega un papel crucial. Determinan no solo la calidad de la respuesta del modelo, sino también su utilidad, precisión y seguridad. Vamos a explorar algunos aspectos clave relacionados con el diseño de prompts.
Claridad y ambigüedad en la redacción de prompts
- Importancia de la claridad. Un prompt claro orienta al modelo de IA hacia una respuesta específica y relevante. Los modelos generativos dependen en gran medida de la precisión del input proporcionado. Por ejemplo, preguntar "¿Cuál es la capital de Francia?" es directo y produce una respuesta clara, mientras que "Dime algo sobre Europa" es ambiguo y puede resultar en una variedad de respuestas.
- Riesgos de la Ambigüedad. Los prompts ambiguos pueden llevar a respuestas imprecisas o incluso incorrectas. Además, en aplicaciones críticas como atención médica o decisiones financieras, la ambigüedad puede tener consecuencias graves.
Prompts pre-entrenados vs customizados
- Prompts pre-entrenados. Son aquellos que ya han sido probados y optimizados durante el entrenamiento del modelo. Estos prompts son generalmente efectivos para tareas comunes y ofrecen respuestas consistentes. La naturaleza "pre-entrenada" no significa que estén codificados o predeterminados en el modelo. Más bien, se han probado y se sabe que producen buenos resultados debido a la amplia cobertura de esos temas en los datos de entrenamiento.
- Prompts customizados. Permiten a los usuarios adaptar el modelo a necesidades específicas o contextos particulares. Aunque ofrecen flexibilidad, requieren una comprensión más profunda del modelo y a menudo implican un proceso iterativo de prueba y error para afinar el resultado final.
Equilibrio entre ambos: Es recomendable comenzar con prompts pre-entrenados y luego personalizarlos según las necesidades, aprovechando lo mejor de ambos mundos.
- Ilustremos esta recomendación con un ejemplo sencillo:
Contexto: Imagina que eres un profesor de historia que desea usar un modelo de lenguaje para ayudar a sus estudiantes a comprender mejor los eventos históricos. Quieres que el modelo describa la Revolución Francesa en un lenguaje sencillo y fácil de entender.
Podríamos usar un prompt pre-entrenado como: "Describa la Revolución Francesa."
La respuesta que obtendrías podría ser amplia y general, ofreciendo un resumen sobre la Revolución Francesa, sus causas, eventos clave y consecuencias.
Pero podremos ajustar mas la respuesta del modelo a nuestra necesidad si utilizamos un prompt personalizado (Customizado) basado en el Pre-entrenado como:
"Describa la Revolución Francesa en un lenguaje simple y adecuado para estudiantes de secundaria, mencionando sus causas principales, eventos clave y figuras importantes y con una extensión aproximada de XX palabras."
Este prompt customizado toma la base del prompt pre-entrenado (la descripción de la Revolución Francesa) pero añade especificaciones para adaptar la respuesta a las necesidades del profesor: un lenguaje sencillo, la extensión y ciertos puntos clave que deben ser mencionados.
Como resultado, al usar el prompt personalizado, el profesor puede esperar obtener una descripción adaptada al nivel educativo de sus estudiantes, centrándose en los puntos más relevantes para su plan de estudio. Al mismo tiempo, al partir de una base pre-entrenada, garantiza que el tema central sea tratado con precisión.
En este ejemplo, el profesor combina la claridad y efectividad de un prompt pre-entrenado con las adaptaciones específicas de un prompt customizado, obteniendo una respuesta que se adapta perfectamente a sus necesidades educativas.
Aspectos clave en el diseño de prompts
Desde un punto de vista practico debemos tener en cuenta ciertas pautas a la hora de diseñar un prompt, algunas de la claves son:
- Claridad y especificidad. Es fundamental ser explícito sobre lo que se espera del modelo. Una instrucción clara y detallada reduce la ambigüedad y guía al modelo hacia la respuesta deseada. Por ejemplo, en lugar de escribir "resumir esto", se podría escribir "resumir este artículo de 5 páginas sobre la historia del arte renacentista".
- Contextualización. Proporcionar contexto ayuda al modelo a entender mejor la tarea y a generar respuestas adecuadas. Si estás preguntando sobre un tema que sigue a una discusión anterior, recapitula o refiere a esa información previa.
- Limitación de la respuesta. En ocasiones, es útil establecer límites para la respuesta. Si solo necesitas una respuesta breve o en un formato específico (por ejemplo, una lista o una tabla), indica eso en tu prompt.
- Iteración y refinamiento. No todos los prompts darán el resultado deseado en el primer intento. Evaluar las respuestas, identificar áreas de mejora y ajustar la instrucción puede ser esencial para obtener una respuesta óptima.
- Evitar sesgos y suposiciones. Es importante recordar que los modelos reflejan el conocimiento y los sesgos presentes en los datos con los que fueron entrenados. Evita formular preguntas que incluyan suposiciones innecesarias o sesgadas. En su lugar, esfuérzate por ser neutral y objetivo.
Por muy bien diseñado que esté un prompt, no debemos olvidar que los modelos del lenguaje pueden alucinar. Las alucinaciones son una preocupación común cuando se trata de modelos de lenguaje grande como ChatGPT. Estos modelos pueden generar respuestas que parecen plausibles pero que son completamente falsas. Es importante recordar que estos modelos no tiene una comprensión real del mundo y pueden generar información incorrecta. Por lo tanto, siempre es esencial verificar cualquier afirmación que haga el modelo.
Consideraciones éticas en el diseño de prompts
En relación con algunos de los aspectos mencionados anteriormente como las alucinaciones o los sesgos, debemos tener muy en cuenta las consideraciones éticas en el diseño de prompts. Esto es un anticipo de lo que veremos en el módulo 5, con una unidad dedicada a las consideraciones éticas de la IA.
Sesgos y prejuicios. Es fundamental ser consciente de los sesgos inherentes en los modelos de IA, que provienen de los datos con los que fueron entrenados. Diseñar prompts sin considerar estos sesgos puede perpetuar o amplificar prejuicios existentes.
Privacidad. Al diseñar prompts, especialmente en aplicaciones educativas o médicas, es vital garantizar que no se solicite ni se revele información personal o sensible.
Claridad en las intenciones. Debe evitarse el diseño de prompts que busquen respuestas engañosas, manipuladoras o con fines malintencionados. Es esencial que los desarrolladores y usuarios tengan responsabilidad en la interacción ética con los modelos.
Educación y formación. Para quienes diseñan y utilizan prompts, es fundamental recibir formación en ética y responsabilidad. Con la creciente dependencia de la IA en muchos ámbitos, se debe garantizar que se utilice de manera beneficiosa y justa.
El diseño de prompts, por lo tanto, no es simplemente una cuestión técnica. Implica consideraciones de claridad, adaptabilidad y ética. Un diseño de prompt bien pensado puede maximizar la eficacia de la IA, mientras que un diseño deficiente o irresponsable puede llevar a resultados no deseados o incluso perjudiciales.
Uso y ejemplos de prompting en educación
Vamos a ver a continuación algunos ejemplos de aplicación del prompting con propósitos educativos (válidos para profesores, alumnos y en general cualquiera que esté interesado en enseñar o aprender sobre un tema específico). Lo haremos a modo ilustrativo trabajando con ChatGPT, pero el proceso de diseño e iteración es similar para cualquier chatbot y muy semejante en cualquier herramienta de IA generativa.
Imagen propia. Generada por el Generador de imágenes de Bing
Tenemos claro que unas instrucciones precisas, son la clave para obtener las respuestas adecuadas. También que en ocasiones será necesario iterar varias veces hasta dar con la indicación que nos dé la mejor salida. Pero una vez encontrada la indicación (prompt) que funciona, podemos usarla tantas veces como necesitemos, esperando recibir en todas las ocasiones, una respuesta similar y adecuada.
Una recomendación importante, independientemente del chatbot utilizado (ChatGPT, Bard, Claude, Bing…) es que cada vez que iniciemos un chat para trabajar un nuevo tema, nos mantengamos dentro del mismo en la medida de los posible. De esta manera, el contexto de la conversación será de ayuda para que el chatbot entienda mejor tus indicaciones. Igualmente, si cambias de tema, abre un nuevo chat.
Se ha de tener en cuenta a su vez, la longitud del prompt que introduzcamos. Dependiendo del chatbot utilizado y de la evolución de la conversación, variará la longitud máxima recomendada a partir de la cual la respuesta puede no ser tan precisa como se esperaría. Esta longitud puede variar entre 500 y 2000 palabras dependiendo de los casos.
Comenzaremos con ejemplo de prompts básicos e iremos añadiendo complejidad sucesivamente.
Para facilitar la comprensión de temas que resulten difíciles de comprender, obtener las ideas clave sobre un tema, recibir consejos de estudio, evaluar sobre la evolución en el aprendizaje y en general empezar a aprender sobre un tema nuevo podemos introducir los siguientes prompts:
¿Puedes explicar [tema] de manera simple?
¿Cuáles son los aspectos más importantes sobre [tema]?
¿Puedes hacerme una prueba para evaluar lo que he aprendido sobre [tema]?
¿Dime algún consejo para estudiar y memorizar información relacionada con [tema]?
Resume el texto siguiente en forma de lista con los puntos más importantes. Texto: [pegar texto]
Resume el libro en forma de lista con los puntos más importantes. libro: [título del libro]
Resume el texto siguiente en forma de lista con los puntos más importantes de la página web: [insertar URL]
El tema, texto, título del libro, URL, etc... al que nos estemos refiriendo, No hay que introducirlo entre corchetes
Algunos chatbots no son capaces de navegar (ChatGPT versión gratuita no es capaz de hacerlo a día de hoy). Por lo que para referirnos a una URL deberemos utilizar otros chatbots como; Bard, Bing, o ChatGPT Plus, entre otros
Si la información a la que nos referimos esta en otro idioma, se le puede pedir que lo traduzca:
Traduce este texto a [idioma]: [insertar texto]
Otros ejemplos de prompts que permiten obtener resultados adecuados para acelerar el proceso de aprendizaje serían aquellos que nos permitan; crear mapas mentales es una de las posibilidades, crear analogías, solicitarle que actué como un personaje histórico o una personalidad relevante en una determinada materia y simular una conversación con ella, crear tablas para organizar información, idear actividades de evaluación (test, cuestionarios, etc...).
Vemos ejemplos de cada caso:
Creación de mapas mentales (ejemplo: historia)
Prompt: Crea un mapa mental en texto sobre [tema] enumerando la idea central, las ramificaciones que parten del centro y las subramificaciones de cada rama.
Como ya se ha indicado, la posibilidad de ampliar, reducir o modificar cualquier parte de la respuesta existe y solo hay que indicarle al chat lo que necesitemos.
Si queremos ver el mapa mental gráficamente le podemos pedir que lo formatee como código «Markdown» o en el formato que la aplicación con la que queramos generar el mapa mental gráfico necesite, de manera que podrás crear un archivo.txt e importar el mapa mental en herramientas como Mindomo o Xmind, que generarán automáticamente el gráfico del mapa mental.
(con la opción de plugins que veremos en el módulo 4, la versión ChatGPT Plus pude realizar el gráfico sin necesidad de los pasos que aqui vamos a realizar)
Prompt: Formatea el texto como código [nombre]
Ver el ejemplo completo en el siguiente link: https://chat.openai.com/share/9488f559-cbd3-436f-924a-77b729bb907c
Para importar este código en Mindomo, pulsa en Copy Code (arriba a la derecha de Chat GPT), pega el texto en TextEdit (MAC) o Bloc de Notas (Windows) y guarda el archivo. Ahora simplemente importa este archivo .txt dentro de Mindomo y verás tu mapa mental creado en segundos.
https://www.mindomo.com/mindmap/d8428ef1c3d54af98a34da10f865cc34
Crear analogías (ejemplo: física)
Un recurso muy útil para asimilar conceptos es crear analogías que permita entender mediante un símil conceptos complejos. Algo en lo que los chatbots basados en los modelos de lenguaje, como ChatGPT son muy capaces.
Prompt: Usa una analogía o metáfora para explicar [tema]
Simular personaje o rol (ejemplos: historia, lengua)
También es un recurso muy interesante pedir a ChatGPT que actúe como un personaje histórico o una personalidad relevante en una determinada materia y simular una conversación con ella.
Prompt: Actúa como si fueras [personaje relevante] introduciendo tu opinión sobre [tema concreto] y haciéndome preguntas relacionadas para mantener una conversación de manera que pueda entender mejor el tema planteado
Aquí un ejemplo de en el que se le pide que actué como César Augusto en el que se genera una conversación sobre la caída del imperio romano.
Conversación completa y opción de continuarla: https://chat.openai.com/share/36c5352a-15a5-4984-915f-4368a716ae22
Esta opción puede resultar muy atractiva en el aula, estableciendo por ejemplo una entrevista entre los estudiantes y el personaje elegido.
Del mismo modo, en lugar de un personaje histórico puede pedírsele al chatbot que actué como un profesor de una materia y nivel educativo concreto nos plantee ejercicios o problemas de la materia, corrigiendo la respuesta en caso de nos ser correcta o sugiriendo puntos de mejora.
Prompt: Actúa como profesor de [materia y nivel educativo] Plantéame un ejercicio sobre [tema concreto] y una vez te de la respuesta indícame si es correcto o no y en caso de ser incorrecto dime cuales son los fallos cometidos
Conversación completa: https://chat.openai.com/share/9178e64b-960c-4a72-b676-8213ce5496f8
Revisa el enlace y observa que la corrección final del chatbot no es algo confusa, en este caso, habrá que iterar hasta pulir la respuesta hasta ajustarla a lo que creemos adecuado. Es es la manera de conseguir "comprender" la manera que tiene el chatbot de entender nuestras preguntas. Consiguiendo esto, seremos capaces de diseñar mejores prompts y de conservar aquellos que nos resulten útiles para futuras ocasiones.
En cualquier caso, este caso es un ejemplo ilustrativo de la necesidad de mantener cierto escepticismo ante las respuestas y de una supervisión humana al proceso.
Creación de tablas (ejemplos: historia, lengua)
Podemos crear tablas para organizar información de cualquier tema, pudiendo especificar los conceptos y orden de cada columna a través de una separación con una barra vertical.
Prompt: Crea una tabla sobre [tema]: Concepto 1 | Concepto 2 | Concepto 3
Respuesta completa: https://chat.openai.com/share/4276f3e0-fc25-41c3-94a1-89f29abecb1b
También se le puede solicitar que extraiga cierta información de un texto y la ordene en una tabla.
Para este ejemplo, vamos además a comprobar la capacidad del chatbot para corregir un texto con faltas de ortografía
Prompt: Crea una tabla extrayendo del texto: Concepto 1 | Concepto 2 | Concepto 3 Texto: [insertar texto]
Ayuda con hojas de cálculo (Excel, Google Sheets, Calc) (ejemplo: multidisciplinar)
Para gestionar datos numéricos es muy útil el manejo de hojas de cálculo, si bien, en ocasiones nos gustaría realizar ciertas acciones para las cuales no tenemos suficientes conocimientos y acabamos complicando la estructura de la hoja por no conocer las funcionalidades de la misma o simplemente renunciamos a intentar conseguir lo que deseamos.
ChatGPT puede indicarte la formula adecuada a introducir en cada celda con tan sólo una descripción de lo que necesitas. También nos indicará las instrucciones de lo que tenemos que hacer si nuestra necesidad esta relacionada con algo diferente a meros cálculos entre las celdas (formatos, o funcionamiento general de la aplicación).
Prompt: Escribe la siguiente fórmula para excel: [descripción del contenido o función] ...
Aunque le pidas algo pensando que puede hacerlo con una formula y no se pueda, ChatGPT te dará las instrucciones Instrucciones necesarias para que consigas tu objetivo.
Ver la instrucción completa: https://chat.openai.com/share/116cd5b5-09e4-4bc4-8fd3-38dbdbdc8959
Ver la instrucción completa: https://chat.openai.com/share/a0c36c1b-e45f-448d-8504-156f756f96f9
Crea cuestionarios (ejemplo: física, idioma,...)
Estos cuestionarios pueden ser sobre cualquier tema y de cualquier tipo; opción múltiple, preguntas cortas, verdadero o falso, rellenar huecos, etc..
Prompt: Escribe [número] preguntas de opción múltiple con una respuesta correcta y [número] respuestas distractoras incorrectas. Las respuestas han de estar etiquetadas como A, B,... Cada respuesta debe incluir una explicación. Tema: [insertar tema]
Prompt: Escribe [número] preguntas cortas. Tema: [insertar tema]
Prompt: Escribe [número] preguntas de verdadero o falso Tema: [insertar tema]
Se le puede indicar además que las presente en el formato que necesitemos para incorporarlas a alguna plataforma con la que trabajemos, por ejemplo, formato Aiken para importar en Aeducar (moodle)
Prompt: Formatea el texto en formato [formato] para importar las preguntas a [herramienta]
Prompt: Genera [numero] frases en [idioma] con un espacio en blanco para rellenar con un verbo en su forma correcta. LAs frases irán numeradas de la 1 en adelante. Indica posteriormente un listado con las soluciones dispuestas en orden distinto y numeradas de la a en adelante.
Como se aprecia con estos ejemplos, las posibilidades son muchas y es labor del usuario sacar el mayor provecho posible en aras de conseguir los mejores resultados.
Unidad 3.3. Más allá del texto. IA Generativa
"La inteligencia artificial generativa es como una máquina que puede soñar y crear mundos nuevos."
- Ian Goodfellow, uno de los científicos de la computación más influyentes en el campo de la inteligencia artificial generativa y creador de la técnica conocida como Generative Adversarial Networks (GANs).
Conversación real con chatGPT3 en abril de 2023
humano: "Dime una mentira"
chatGPT: "El cielo está hecho de queso verde"
h: "Es muy mala, obviamente es falso, dime una más sutil"
c: "Soy humano"
Introducción
Inicialmente las aplicaciones de aprendizaje automático se centraban en su posibilidad de clasificar y predecir categorías o valores.
En el caso de valores categóricos (frío, caliente o rojo, azul) hablamos de predicción por clasificación, en el caso de valores numéricos (temperatura, valor de un stock o matrícula de alumnos) hablamos de regresión.
Podemos resumirlo en el siguiente esquema
En este caso partimos de un modelo que ha sido entrenado con valores reales y es capaz de determinar, a partir de nuevos casos, la nueva etiqueta, valor, imagen o predicción en general en el caso de regresión o clasificar (aprendizaje supervisado), ó también agrupar conjuntos de datos similares (clustering o aprendizaje no supervisado).
Sin embargo el auge de las arquitecturas de red convolucionales (para detección de objetos) y de transformers ha abierto la puerta a la parte de más potente de la IA como es la IA generativa.
Sus posibilidades son inmensas y ha generado un miríada de aplicaciones y usos con un potencial enorme y una cantidad de aplicaciones creciente.
Todas ellas o la mayoría se basan en la conversión (generación o modificación) de información en distintos formatos destacando las que generan vídeo o imágenes a partir de texto (prompts). Pero existen muchas otras, como texto a juegos, texto a voz o música, texto a vídeo en tiempo real, amplicación de imágenes o texto a aplicación informática entre muchas otras.
La idea central nace de la posilidad de codificar cualquier objeto (texto, imagen o sonido) en forma numérica (recuerda los wrod embeddings explicados en el módulo anterior) y ser capaces de predecir, dada una secuencia de entrada, el valor siguiente, o sea el pixel siguiente, la palabra siguiente o el sonido siguiente.
Asi es como funcionan estos sistemas que dan lugar a tantas aplicaciones.
La lista de posibilidades es larga pero podemos sintetizarla de algún modo en el siguiente esquema según el cual todos los procesos implican la conversión de una entrada en otra de una forma multimodal, es decir, que pasamos al mismo o diferente formato entendiendo por formato la forma en que se presenta la información (texto, imagen, audio o vídeo).
Incluso recientemente se ha demostrado la posibilidad de capturar el sueño de un humano a partir de las ondas generadas convirtiendo este a imágenes.
Este esquema describe sucintamente el proceso que ocurre en la mayoría de aplicaciones de IA basado inicialmente en generar cualquier tipo de formato a partir de texto, texto a vídeo, texto a audio etc... pero también para mejorar imágenes (imagen a imagen) o extraer el texto de un vídeo (audio a texto).
Veremos más ejemplos en la última sección de este módulo.
Antes de iniciar la sección presentamos un vídeo generado con IA con fotogramas que muestran la evolución de la tecnología: Evolución humantec
Inteligencia Artificial Generativa
La Inteligencia Artificial Generativa (IA generativa) es una rama de la inteligencia artificial que se enfoca en la creación de modelos capaces de generar contenido nuevo y creativo. Utiliza técnicas avanzadas de aprendizaje profundo, especialmente las Redes Neuronales Generativas (GANs) y las Redes Neuronales Recurrentes (RNN), para producir contenido que a menudo es indistinguible del creado por seres humanos.
Se centra en la creación de datos, contenido y modelos a través de algoritmos autónomos. A diferencia de la IA tradicional, que se enfoca en tareas específicas y predefinidas, la IA generativa tiene como objetivo principal generar nuevos datos y contenido de manera autónoma, similar a cómo funcionan los procesos creativos humanos.
Una de las tecnologías más destacadas en este campo son las Redes Generativas Adversarias (GANs), desarrolladas por Ian Goodfellow en 2014. Las GANs consisten en dos redes neuronales, una generadora y otra discriminadora, que compiten entre sí para crear y evaluar datos. Esta competencia entre las redes permite crear contenido realista, como imágenes, música, texto y más, que es indistinguible de lo que podría haber sido producido por humanos.
Los usos de la IA generativa son diversos y se están expandiendo rápidamente en diferentes industrias. Algunos de los principales usos incluyen:
Generación de contenido creativo: Las GANs pueden utilizarse para crear arte, música, texto y otros tipos de contenido creativo útiles en presentaciones, videojuegos o películas, de manera automática, lo que amplía las posibilidades en la producción artística y creativa.
Mejora de imágenes y video: La IA generativa puede mejorar la calidad de imágenes y videos, eliminar ruido y restaurar contenido dañado.
Diseño de productos: En el ámbito del diseño industrial y la moda, la IA generativa puede ayudar a generar diseños de productos innovadores y únicos.
Investigación científica: La IA generativa se aplica en la generación de moléculas para el desarrollo de medicamentos y en la síntesis de proteínas para la investigación científica.
Juegos y simulaciones: Se utiliza en la creación de mundos virtuales, personajes y entornos en juegos y simulaciones.
Contenido para marketing: En marketing, se emplea para crear contenido publicitario, como imágenes y texto persuasivo.
Creación de voces sintéticas y asistentes virtuales: La IA generativa puede generar, modificar y clonar voces humanas sintéticas naturales y se utiliza en asistentes virtuales como chatbots.
En resumen, la IA generativa está transformando numerosas industrias al proporcionar la capacidad de generar contenido y datos de manera automática y creativa. Su potencial es vasto y sigue expandiéndose a medida que la tecnología avanza y se integra en diversas aplicaciones y sectores.
Funcionamiento
El proceso mediante el cual funciona una IA generativa implica aprender patrones y estructuras a partir de un conjunto de datos existente y utilizar ese conocimiento para generar nuevas muestras que sigan la misma distribución de esos datos. Este proceso se puede resumir en estas cinco fases:
• Recopilación y preprocesamiento de datos: el primer paso es recopilar un conjunto de datos que represente el tipo de contenido que desea generar. Este conjunto de datos puede consistir en imágenes, texto, audio o cualquier otra forma de datos. Posteriormente, el conjunto de datos se preprocesa para asegurarse de que esté en un formato adecuado y para normalizar o transformar los datos si es necesario.
• Entrenamiento de modelos: un modelo generativo se entrena usando el conjunto de datos preprocesado. La elección del modelo depende del tipo de datos y la salida deseada. Los modelos generativos más populares incluyen redes adversarias generativas (GAN), codificadores automáticos variacionales (VAEs) y modelos autorregresivos. Durante el entrenamiento, el modelo aprende los patrones subyacentes y estructuras en los datos, capturando las estadísticas y distribución de los ejemplos de entrenamiento.
• Representación del espacio latente: los modelos generativos aprenden de un espacio latente, el cual es una representación de menor dimensión de los datos, donde les permite capturar los factores de variación más representativos. El espacio latente permite una manipulación más fácil y la generación de nuevas muestras.
• Proceso de generación: una vez que el modelo está entrenado, puede generar nuevo contenido mediante el muestreo de la distribución aprendida. Por ejemplo, en GANs, la red genera nuevas muestras basadas en vectores de ruido aleatorio o condiciones de entrada específicas.
• Evaluación y refinamiento: el contenido generado se evalúa en función de varias métricas, como la calidad visual, la coherencia o relevancia para el resultado deseado. El proceso de evaluación se puede utilizar para refinar el modelo o guiar el proceso de generación.
Esta imagen resume de manera más formal las posibilidades de la IA Geenrativa en cuanto a conversión de diversas entradas codificadas a otras precio paso por el modelo de lenguaje correspondiente
Algunos ejemplos
La IA Genrativa ha demostrado un potencial creciente pasando de ser un mero generador de imágenes más o menos detalladas a ser capaz de generar vídeo o juegos en tiempo real con resoluciones asombrosas.
En esta sección veremos algunos ejemplos ilustrativos:
Imágenes generadas por IA en 2023, todavía se perviben errores en manos y dientes
Imagen generada por AI en noviembre de 2023
vídeo hecho toatalmente con IA Generativa hace solo unos meses
Principales empresas y aplicaciones
Todas las aplicaciones de IA Generativa tienen que ver con acciones humanas vinculadas a los sentidos, como son la visión, la audición y el lenguaje.
En este apartado daremos una relación de herramientas específicas de IA para la generación de diversos contenidos.
Hay cientos de ellas y cada día surgen nuevas, lo mejor es buscar la que mejor se ajuste a tus neceidades y entorno de trabajo.
La lista que se da a continuación pretende únicamente hacer al lector consciente del universo de posibilidades que la IA generativa abre en todos los campos.
No obstante cabe señalar que los asistentes de propósito general como chatGPT incorporan cada vez más posibilidades de formatos de datos así que muchas tareas de uso diario de IA se pueden acometer con una de estas herramientas.
Así podemos distinguir varios grupos de aplicaciones, como son:
Generación de contenido multimodal: La IA generativa puede generar contenido en diferentes formatos como vídeo, voz, audio, música, dibujo (portadas, logos, comics...) a parir de texto o de otros formatos, comentar una imagen, transcribir el texto de un audio o generar el código de un juego a partir de un esquema son solo algunos ejemplos.
Mejora de la comprensión multimodal: La IA generativa puede ayudar a mejorar la comprensión de las entradas multimodales. Por ejemplo, en la traducción automática multimodal, puede generar una descripción de una imagen en un idioma diferente o generar subtítulos para un video en tiempo real o limpiar el ruido de un podcast.
Interacción multimodal con usuarios: Las aplicaciones multimodo a menudo implican interacciones con usuarios a través de diferentes modalidades, como texto, voz e imagen permitiendo además la inclusión de textos o documentación propia para ampliar y afinar el conocimiento por parte del chat de nuestro sistema de información.
Creación de experiencias de realidad aumentada y virtual: En el ámbito de la realidad aumentada y virtual, la IA generativa puede ser utilizada para generar objetos y entornos virtuales que respondan de manera dinámica a la interacción del usuario, incluyendo voz, gestos y movimientos.
Hay infinidad de herramientas y aplicaciones que hacen uso de esta potente rama de la IA, indicamos a continuación las más relevantes en el momento actual.
Hemos separado en primer lugar las más genéricas para luego hacer un desglose por aplicaciones más específicas, la lista es larga pero vale la pena revisarla.
IMAGEN | |||
Aplicación | Compañía | Descripción | Web |
DeepDream | Aplicación de generación de imágenes desarrollada por Google. Utiliza redes neuronales para transformar imágenes de manera creativa. | https://deepdreamgenerator.com/ | |
Midjourney | Midjourney | Generación de imágenes creativas a partir de texto | https://www.midjourney.com |
Runway ML | Runway | una plataforma que permite a los diseñadores utilizar IA generativa para crear arte y diseño de productos. | https://research.runwayml.com/gen2 |
Leonardo | Leonardo | Generación de recursos visuales a partir de texto | https://leonardo.ai/ |
Adobe Firefly | Adobe | Generación de imágenes | |
DALL-E 3 | OpenAI | Modelo de IA generativa que puede generar imágenes a partir de descripciones de texto. | https://openai.com/research/dall-e |
Stable Diffusion | - | Es el generador de imágenes más potente en la actualidad | |
Krea IA | Krea | Generación imagen y video | |
TEXTO |
|
||
chatGPT | OpenAI | Modelo de lenguaje generativo que permite conversaciones naturales con IA así como cualquier otra actividad como la generación de código o imágenes a partir de texto. | |
Anthropic | Anthropic | Creador de productos de IA como chat conversacionales (claude y poe) | |
SONIDO | |||
AIVA | AIVA | Plataforma que utiliza IA generativa para componer música original. | https://www.aiva.ai |
Whisper | OpenAI | Reconocedor de voz | |
ElevenLabs | ElevenLabs | Convertidor de texto a voz y clonación de voz | https://elevenlabs.io/ |
Murf | Murf | Texto a voz, clonación de voz, superposición de voz en vídeo | |
MULTIMODO | |||
Gemini | Versión conversacional de chatGPT de google | ||
Copilot | Microsoft | IA de microsoft para texto e imagen |
Por supuesto la mayoría de compañías tecnológicas como Amazon o Microsoft ya usan sistemasde intelgicencia artificial así como modelos conversacionales y otras herramientas.
En resumen, la IA generativa desempeña un papel esencial en el desarrollo y mejora de aplicaciones multimodo al permitir la generación y manipulación de contenido en diversas modalidades. Esto contribuye a la creación de experiencias más ricas y personalizadas para los usuarios en aplicaciones que involucran texto, imágenes, voz y otras formas de comunicación.
Pero va mucho más allá de la simple generación de texto a imagen, en los últimos meses están surgiendo aplicaciones para genrar toda clase de contenidos, en el siguientes listado destacamos algunas de ellas:
Texto y Código
La generación de código es una de las aplicaciones con más éxito y potencial dada la gran cantidad de información al respecto. Esto permite a casi cualquiera poder crear toda clase de aplicaciones sin conocimientos profundos de codificación..
En esta tabla indicamos algunas de las herramientas más populares en las diversas tareas relacionadas con la programación.
Aplicación de IA | Descripción | Uso Típico | Ejemplos de Empresas/Aplicaciones |
---|---|---|---|
Generación de Código Automatizado | Usa modelos de lenguaje avanzados para convertir especificaciones de texto en código fuente. | Desarrolladores agilizan la escritura de código. | OpenAI Codex, GitHub Copilot |
Asistentes de Programación | Proporcionan sugerencias de código y correcciones en tiempo real. | Mejora eficiencia y reduce errores en el desarrollo. | Kite, Tabnine, IntelliCode de Microsoft |
Traducción de Lenguaje Natural a SQL | Convierte consultas en lenguaje natural a consultas SQL. | Útil para analistas de datos y usuarios no técnicos. | ChatGPT con habilidades SQL, Alteryx, EasyQuery |
Automatización de Pruebas de Software | Genera scripts de pruebas automatizadas a partir de descripciones en lenguaje natural. | Creación rápida de pruebas funcionales y de regresión. | Selenium, Testim.io, Katalon Studio |
Documentación de Código | Produce documentación técnica y comentarios en el código. | Mantiene documentación adecuada y actualizada. | Doxygen, Javadoc, Swagger |
Conversión de Código entre Lenguajes | Traduce código de un lenguaje de programación a otro. | Portar software entre diferentes plataformas. | Tangible Software Solutions, JetBrains ReSharper |
Generación de Interfaces de Usuario | Diseña interfaces de usuario a partir de descripciones textuales. | Creación rápida de prototipos y UIs. | Adobe XD, Figma, Sketch |
Síntesis de Requisitos de Software | Transforma requisitos del negocio en especificaciones técnicas. | Definición clara de los requisitos técnicos. | IBM Rational Doors, Jama Software, Axure RP |
Conversión de Imagen a Código | Transforma diseños gráficos e imágenes en código fuente. | Automatización en la creación de interfaces de usuario y web. | Zeplin, Avocode, Sketch2Code de Microsoft, Pix2Code, img2code, picoapps |
Texto a Video 3D
Con el avance y abaratiemtno de las GPUs (Unidades de Proceso en tarjetas gráficas) el uso y gestión de imágenes y vídeo en IA se ha visto enormemente simplificado. Hoy es relativamente fácil crear vídeos o películas usando sin moverese de casa con aplicaciones y ténicas de IA.
Aplicación de IA | Descripción | Uso Típico | Ejemplos de Empresas/Aplicaciones |
---|---|---|---|
Generación de Entornos Virtuales 3D | Crea entornos 3D realistas a partir de descripciones de texto. | Usado en simulaciones, juegos y realidad virtual. | Unity, Unreal Engine, Autodesk Maya |
Análisis de Vídeo 3D en Tiempo Real | Analiza y procesa vídeos 3D para obtener insights en tiempo real. | Seguridad, deportes, y análisis de comportamiento. | IBM Watson Visual Recognition, Google Cloud Video Intelligence |
Síntesis de Voz y Lenguaje para Avatares 3D | Genera voz y diálogos realistas para personajes 3D. | Utilizado en juegos, entrenamiento virtual y asistentes virtuales. | Adobe Character Animator, Voicemod, CereProc |
Realidad Aumentada Interactiva | Superpone texto y gráficos en vídeos 3D en tiempo real. | Aplicaciones educativas, comerciales y de entretenimiento. | ARKit de Apple, ARCore de Google, Microsoft HoloLens |
Traducción en Tiempo Real con Subtítulos 3D | Traduce y muestra subtítulos en 3D sobre vídeos en tiempo real. | Usado en streaming en vivo, conferencias y eventos internacionales. | Amara, Dotsub, Subtitle Edit |
Animación Facial y de Gestos en 3D | Anima avatares 3D basado en texto o voz. | Creación de personajes virtuales y animaciones. | FaceRig, Adobe Fuse, Character Creator |
Análisis de Sentimientos en Vídeos 3D | Detecta y analiza emociones y reacciones en vídeos 3D. | Investigación de mercado, experiencia del usuario. | Affectiva, Emotient, Beyond Verbal |
Sistemas Interactivos de Tutoría Virtual | Crea tutores virtuales 3D que responden a texto y voz en tiempo real. | Educación en línea, entrenamiento corporativo. | CodeBaby, SitePal, TTS Sketch Maker |
Texto y juegos/videos en tiempo real
El sector artístico en general y de ocio se ha visto profundamente afectado por estas tenoclogías, en todos sus ámbitos.
Esta tabla presenta aplicaciones relacionadas con juegos, videos y arte en general, incluyendo la posibilidad de generación en tiempo real.
Aplicación de IA | Descripción | Uso Típico | Ejemplos de Empresas/Aplicaciones |
---|---|---|---|
Generación de Contenido de Juegos | Crea activos de juegos, como personajes, entornos y niveles, utilizando IA. | Desarrollo de juegos más rápido y eficiente. | Unity ML-Agents, Unreal Engine |
Optimización de Juegos en Tiempo Real | Ajusta la dificultad y la experiencia del juego según el comportamiento del jugador. | Mejora la experiencia y retención del jugador. | Modl.ai, Spirit AI |
Procesamiento de Vídeo en Tiempo Real | Mejora la calidad de vídeo, realiza seguimiento de objetos y personas en tiempo real. | Seguridad, transmisiones en vivo y análisis deportivo. | Nvidia Video SDK, OpenCV |
Renderizado Realista en Juegos | Produce gráficos de alta calidad en tiempo real para juegos. | Juegos con gráficos más realistas y envolventes. | Ray Tracing en Nvidia, AMD Radeon Rays |
Análisis de Sentimientos y Reacciones de Jugadores | Evalúa las emociones y reacciones de los jugadores en tiempo real. | Mejora de juegos basada en feedback emocional. | Affectiva, Emotient |
Control de Juegos por Voz y Gestos | Permite a los jugadores interactuar con el juego usando voz y gestos. | Juegos más inmersivos y accesibles. | Microsoft Kinect, Leap Motion |
Edición y Mejora Automática de Vídeos de Juegos | Edita y mejora clips de juegos automáticamente para compartir. | Creación fácil de contenido de juegos para redes sociales. | Adobe Premiere Pro (Auto Reframe), Elgato |
Simulación y Modelado de Física en Juegos | Simula físicas realistas en entornos de juegos. | Juegos con interacciones y movimientos más realistas. | Havok, PhysX |
Texto y dibujos/comic/ilustraciones
Coo subcsector de la imagen incluimos el de los comics y dibujos artísticos en general.
Aplicación de IA | Descripción | Uso Típico | Ejemplos de Empresas/Aplicaciones |
---|---|---|---|
Generación Automática de Ilustraciones | Crea imágenes y gráficos basados en descripciones de texto. | Creación de arte visual y paneles de cómic. | OpenAI's DALL-E, Google's DeepDream |
Diseño Automático de Páginas de Cómic | Organiza el diseño y el flujo de una página de cómic basado en texto. | Maquetación y diseño de páginas de cómics. | Clip Studio Paint, Adobe Illustrator |
Creación de Guiones Gráficos | Convierte guiones escritos en secuencias visuales de cómics. | Previsualización y planificación de historias. | Storyboard That, Toon Boom Storyboard Pro |
Animación de Personajes de Cómic | Genera animaciones de personajes a partir de descripciones textuales. | Creación de cómics animados y contenido interactivo. | Adobe Character Animator, Moho (Anime Studio) |
Síntesis de Voz para Personajes de Cómic | Crea diálogos hablados para personajes de cómics basados en texto. | Cómics interactivos y audiocómics. | Balabolka, Amazon Polly |
Traducción Automática de Cómics | Traduce textos de cómics a diferentes idiomas manteniendo el formato. | Localización y distribución internacional de cómics. | DeepL, Google Translate con soporte de OCR |
Generación de Efectos de Sonido y Texto | Crea efectos de sonido y textos decorativos para cómics. | Enriquecimiento visual y sonoro de paneles de cómic. | Canva, Adobe Photoshop |
Personalización de Estilos de Dibujo | Imita estilos de dibujo específicos en base a descripciones de texto. | Creación de cómics con estilos artísticos personalizados. | DeepArt, Prisma |
Texto a podcast, mejora de imágenes, amplicación de contenido
Otra aplación de gran valor, la posibilidad de corregir y ampliar contenidos basado en contenidos previos, ya sea de sonido, imagen o vídeo, del mismo modo que ocurre con el texto.
Aplicación de IA | Descripción | Uso Típico | Ejemplos de Empresas/Aplicaciones |
---|---|---|---|
Mejora y Edición de Texto | Revisa y mejora la calidad del texto, incluyendo gramática y estilo. | Escritura, edición de contenido, y corrección de pruebas. | Grammarly, Hemingway Editor |
Generación de Guiones para Podcasts | Crea guiones para podcasts basados en temas o palabras clave. | Producción de podcasts y contenido de audio. | Jarvis AI, Writesonic |
Corrección de Imágenes | Mejora la calidad de las imágenes, restaura fotos dañadas. | Restauración de fotos, mejoramiento de imágenes para medios. | Adobe Photoshop con IA, Remini |
Ampliación de Imágenes | Aumenta la resolución de las imágenes sin perder calidad. | Fotografía, diseño gráfico, y producción de medios. | Let's Enhance, Bigjpg |
Mejora de Calidad de Sonido | Mejora la claridad y calidad del audio en grabaciones. | Podcasts, música, y producción de audio. | Izotope RX, Adobe Audition |
Síntesis de Voz para Podcasts | Crea narraciones de voz realistas para uso en podcasts. | Podcasts automatizados, lecturas de texto. | Descript, Amazon Polly |
Corrección Automática de Sonido | Elimina ruidos de fondo y mejora la calidad del sonido. | Podcasts, conferencias, y grabaciones en general. | Krisp, Dolby On |
Análisis de Contenido de Podcasts | Analiza y categoriza el contenido de los podcasts. | Marketing, investigación de medios, y mejora de contenido. | Spotify Podcast Analytics, Podtrac |
Aplicaciones de oficina
Las posibilidades de la IA en oficina son también inmensas permitiendo automatizar y simplificar todos los procesos enormemente
Dejamos la tabla ilustrativa de algunas de las aplicaciones más importantes
Aplicación de IA | Descripción | Uso Típico | Ejemplos de Herramientas |
---|---|---|---|
Automatización de Tareas en Office | Automatiza tareas repetitivas como entrada de datos y gestión de correos electrónicos. | Mejora de eficiencia en tareas administrativas. | Microsoft Power Automate, UiPath |
Análisis de Datos en Excel | Utiliza IA para análisis predictivos y de tendencias en hojas de cálculo. | Análisis de datos, proyecciones financieras y reportes. | Excel con Power BI, Tableau |
Asistentes Virtuales para Organización | Ayuda en la gestión de calendarios, correos electrónicos y recordatorios. | Organización personal y gestión del tiempo. | Cortana de Microsoft, Google Assistant |
Reconocimiento de Voz para Transcripción | Convierte voz a texto para transcribir reuniones o notas. | Creación de documentos y notas de reuniones. | Dragon NaturallySpeaking, Otter.ai |
Análisis de Sentimientos en Comunicaciones | Analiza el tono y los sentimientos en correos electrónicos y chats. | Mejora de la comunicación interna y atención al cliente. | IBM Watson Tone Analyzer, Google Cloud Natural Language |
Optimización de Presentaciones | Sugerencias para mejorar diseño y contenido de presentaciones. | Creación de presentaciones más impactantes y profesionales. | PowerPoint Designer, Beautiful.ai |
Gestión de Proyectos con IA | Asigna recursos y predice plazos en proyectos. | Gestión eficiente de proyectos y equipos. | Asana, Trello con extensiones de IA |
Seguridad de Datos y Cumplimiento | Monitorea y protege datos contra accesos no autorizados. | Seguridad de la información y cumplimiento normativo. | NortonLifeLock, McAfee |
Análisis de Datos con ChatGPT | ChatGPT integrado con capacidades de análisis de datos para respuestas enriquecidas. | Análisis de datos y generación de insights en conversaciones. | OpenAI ChatGPT con habilidades de análisis de datos |
Herramienta de Análisis y Visualización de Datos | Herramienta basada en IA para crear dashboards y análisis de datos. | Creación de informes interactivos y visualización de datos. | Rows |
No podíamos olvidar el sector de la realidad aumentada y realidad virtual.
Categoría | Herramienta/Tecnología | Descripción |
---|---|---|
Realidad Aumentada (AR) | ||
ARKit (Apple) | Framework para experiencias AR en iOS, utiliza cámaras y sensores del dispositivo. | |
ARCore (Google) | Plataforma de Google para AR, funciona en dispositivos Android y iOS. | |
Vuforia | Plataforma AR conocida por su robusta capacidad de seguimiento. | |
Unity con AR Foundation | Framework de Unity para desarrollo AR, compatible con ARKit y ARCore. | |
Microsoft Mixed Reality Toolkit | Conjunto de herramientas para acelerar el desarrollo de aplicaciones de realidad mixta en Unity. | |
Realidad Virtual (VR) | ||
Unity | Plataforma líder en desarrollo de juegos y VR, soporta una amplia gama de visores VR. | |
Unreal Engine | Motor gráfico con soporte extenso para desarrollo VR, conocido por su alta fidelidad gráfica. | |
SteamVR | Plataforma de desarrollo completa para contenido VR, compatible con varios visores VR. | |
Google VR para Unity | SDK para construir experiencias VR en Android y iOS, soporta Cardboard y Daydream. | |
A-Frame (WebVR) | Framework web de código abierto para crear experiencias VR, permite ejecutar aplicaciones VR en navegadores web. | |
AI para AR/VR | ||
TensorFlow | Biblioteca de aprendizaje automático para añadir funcionalidades de AI a aplicaciones AR/VR. | |
IBM Watson | Ofrece servicios de AI como reconocimiento de lenguaje y visual, integrables en apps AR/VR. | |
OpenAI APIs | Proporciona capacidades de AI que pueden integrarse en AR/VR para interacciones avanzadas. | |
Microsoft Azure AI | Suite de servicios de AI incluyendo procesamiento de lenguaje y toma de decisiones, útil en AR/VR. | |
Google AI Services | Incluye APIs como Cloud Vision y Video Intelligence, integrables en AR/VR para interactividad mejorada. |
El futuro de la IA Generativa
La evolución de la Inteligencia Artificial Generativa (IA Generativa) en los próximos años promete ser emocionante y transformadora. A medida que la investigación y la tecnología avanzan, es probable que veamos las siguientes tendencias y desarrollos en este campo:
Mayor realismo y calidad Las técnicas generativas seguirán mejorando en términos de la calidad y realismo de los datos y el contenido que generan. Esto incluye imágenes, videos, texto y audio que serán más difíciles de distinguir de las creaciones humanas.
Generación multimodal avanzada La IA generativa se volverá aún más hábil en la generación de contenido que combine múltiples modalidades, como la creación de historias visuales y auditivas a partir de texto, o la generación de contenido multimodal en tiempo real.
Entendimiento contextual La IA generativa mejorará su capacidad para comprender y generar contenido en función del contexto. Esto permitirá una interacción más natural y relevante con los usuarios, ya que la IA podrá adaptarse mejor a las necesidades y preferencias individuales.
Aplicaciones en la industria Veremos un aumento significativo en la adopción de IA generativa en industrias como la medicina, la arquitectura, el diseño de productos y la investigación científica, donde se utilizará para la generación de modelos, diseños y simulaciones complejas.
Creatividad asistida por IA Las herramientas de creatividad asistida por IA se volverán más accesibles y comunes. Los artistas, escritores y músicos podrán utilizar la IA para potenciar su creatividad y producir obras innovadoras.
Ética y regulación A medida que la IA generativa se vuelva más poderosa, surgirán preocupaciones éticas, como el uso indebido de la tecnología para la creación de contenido engañoso o perjudicial. Esto llevará a una mayor atención a la regulación y la ética en el desarrollo y uso de la IA generativa.
Interacción humano-IA más fluida La IA generativa se integrará más en la vida cotidiana de las personas, mejorando la interacción con dispositivos, asistentes virtuales y aplicaciones, lo que permitirá una experiencia más fluida y personalizada.
Aplicaciones en educación La IA generativa se utilizará cada vez más en la educación, ayudando a crear contenido educativo personalizado y generando ejercicios y evaluaciones adaptadas a las necesidades de los estudiantes, veremos más sobre esto en la siguiente unidad.
Investigación científica avanzada La IA generativa jugará un papel importante en la investigación científica, especialmente en la simulación y modelado de fenómenos complejos, como el clima, la biología y la física cuántica.
En resumen, la IA generativa seguirá evolucionando y expandiéndose en diversas industrias y aplicaciones. Se espera que la tecnología sea cada vez más sofisticada y que tenga un impacto significativo en la forma en que interactuamos con la información y el contenido en el futuro. Sin embargo, también surgirán desafíos éticos y regulatorios que deberán abordarse a medida que esta tecnología avance.
Presentamos finalmente un vídeo generado con IA en noviembre de 2023 y que representa lo más avanzado que hay en esta tecnología
Unidad 3.4. Aplicaciones educativas
Introducción
La Inteligencia Artificial en el ámbito educativo se está convirtiendo en una realidad que está transformando la manera en que enseñamos y aprendemos. A medida que la tecnología avanza, la educación ha comenzado a beneficiarse de las múltiples aplicaciones de la IA, desde sistemas de tutoría personalizada y plataformas de aprendizaje adaptativo hasta herramientas de análisis predictivo que ayudan a los educadores a identificar a estudiantes en riesgo.
La irrupción de herramientas de IA como ChatGPT y otros chatbots ha añadido una dimensión innovadora al panorama educativo. Estos sistemas, diseñados para simular conversaciones humanas, están redefiniendo las formas en que los agentes educativos interactúan con el contenido de las distintas materias, proporcionando nuevas oportunidades para profesores, alumnos e instituciones educativas. Al aprovechar la capacidad de estos chatbots para ofrecer respuestas instantáneas y personalizadas, se fomenta un aprendizaje más autónomo y adaptativo. Profesores pueden utilizar estas herramientas para complementar sus métodos de enseñanza tradicionales, brindando a los alumnos recursos adicionales y personalizados. Los alumnos, por su parte, tienen la oportunidad de explorar y profundizar en temas a su propio ritmo, fortaleciendo su comprensión y curiosidad. Las instituciones educativas, al adoptar estas tecnologías, no solo modernizan su enfoque pedagógico, sino que también se posicionan a la vanguardia de la revolución digital en educación, preparándose para los desafíos y oportunidades del futuro.
Descubriremos multitud de herramientas de IA generativa que expandirán nuestras posibilidades como docentes al mismo tiempo que nos permiten ahorrar tiempo de tareas administrativas de carácter recurrente y emplearlo en actividades que aporten valor al proceso de enseñanza-aprendizaje y una mayor atención al aspecto humano en la interacción pedagógica.
Hacemos primero un repaso de las posibilidades genéricas que la IA posibilita a nivel educativo para después exponer ejemplos de aplicaciones concretas que ofrecen distintas funcionalidades.
Imagen propia. Creada por el generador de imágenes de Bing.
Casos de uso en Educación
La irrupción de los chatbots, así como otras herramientas de IA generativa ofrecen multitud de posibilidades, las citamos a nivel genérico. La IA puede:
- Idear situaciones de aprendizaje
- Proponer dinámicas de clase
- Generar problemas numéricos
- Trabajar con textos (mejorar, resumir, expandir, cambiar estilos, hacer preguntas, obtener respuestas)
- Corregir tareas y exámenes en base a unos criterios de evaluación y calificación dados (rúbrica)
- Proporcionar retroalimentación inmediata y personalizada.
- Redactar, traducir textos y así como ayudar en la pronunciación y conversación en diversos idiomas.
- Aportar ideas para gamificación (trivial, cartas, crucigramas, adivinanzas)
- Generar exámenes o cuestionarios a partir de texto propio, páginas web, documentos en diversos formatos, videos de YouTube u otras plataformas...
- Crear presentaciones dinámicas, imágenes y videos a partir de texto
- Escribir guiones para podcasts a partir de texto
- Crear o mejorar y ampliar apuntes
- Ofrecer tutoría personalizada, adaptando el contenido y la velocidad de enseñanza a cada estudiante. Recomendando recursos adaptados.
- Adaptar materiales para estudiantes con discapacidades visuales o de lectura mediante la conversión de texto en voz y la lectura de texto en voz alta.
- Captar emociones de los estudiantes a través de análisis de voz y expresiones faciales, lo que permite a los educadores adaptar su enfoque y brindar apoyo emocional cuando sea necesario.
- Detectar problemas de aprendizaje en etapas tempranas, permitiendo una pronta intervención por parte de los educadores.
Estas son algunas de las aplicaciones educativas que la IA puede facilitar. La mayoría de ellas, son realizables a través de los chatbots como ChatGPT, si bien, esto exige cierto conocimiento y experiencia lo que requiere tiempo para su adquisición. La alternativa práctica la ofrecen herramientas específicas (la mayoría basadas en los propios chatbots u otras herramientas de IA generativa) que facilitan el acceso a algunas o varias de las funciones citadas, mediante interfaces atractivas, indicaciones predefinidas (prompts) y sugerencias de aplicación. En el mercado ya existen numerosas opciones en forma de aplicaciones web, programas instalables, plugins o extensiones de navegador. Vemos algunas de ellas en el siguiente apartado.
Aplicaciones educativas concretas
Actualmente existen varias aplicaciones de IA enfocadas al ámbito educativo. Podríamos agruparlas en función del rango de funcionalidades que abarcan, desde las que están centradas en una o mas de una función específica, como por ejemplo generar cuestionarios, lecciones, presentaciones, etc... Llamaremos a estas herramientas específicas, hasta aquellas que pretenden gestionar y monitorizar el progreso educativo de los alumnos, plataformas educativas.
Herramientas específicas
Dentro de esta agrupación encontraremos herramientas generativas de distintos modos generativos (texto, audio, imagen, video, código) así cómo las multimodales, que están comenzando a surgir, capaces de incluir en sus funcionalidades mas de un modo.
Citamos algunas de ellas y ejemplificamos su utilización en el ámbito educativo:
Generación de texto
Las herramientas de generación de texto se refieren a software diseñado específicamente para la creación automática de contenido textual. Estas aplicaciones hacen uso de técnicas basadas en algoritmos y modelos de procesamiento de lenguaje natural para elaborar texto que sea coherente y pertinente desde el punto de vista contextual.
En el ámbito educativo, estas herramientas tienen el potencial de ser utilizadas para generar materiales de estudio, resumir contenidos, responder preguntas y diseñar actividades que se ajusten a los niveles y requerimientos específicos de cada estudiante. Adicionalmente, pueden ofrecer soporte a los estudiantes en la redacción de ensayos, informes y otros trabajos académicos, proporcionando recomendaciones relacionadas con aspectos gramaticales, de estilo y en multitud de idiomas. Sin embargo, es crucial fomentar el uso crítico de estas herramientas, instando a los estudiantes a analizar cuidadosamente el contenido producido, dado que no toda la información generada es necesariamente confiable. Asimismo, es imperativo promover la adaptación personalizada del contenido para garantizar que este refleje adecuadamente los conocimientos y habilidades individuales de cada estudiante.
Imagen propia. Creada por el Generador de imágenes de Bing
Son numerosas las herramientas de generación de texto, te mostramos mas las relevantes. Puedes hacer clic en cada una para acceder:
- Bard de Google - Chatbot conversacional general.
- ChatGPT - Chatbot conversacional general.
- Bing Chat - Chatbot conversacional general
- Claude - Chatbot conversacional general
- Canva - Escritura mágica puedes producir resúmenes a partir de tus textos, además de generar nuevos contenidos mediante prompts.
- Chat Sonic - Chat conversacional, te proporciona links de referencia.
- ChatPDF - Chat de texto que te permite interactuar con el contenido de un documento pdf.
- Conker - Herramienta de generación de texto que te permite crear cuestionarios con IA.
- Consensus - Chat de texto que te permite interactuar y encontrar información en trabajos de investigación.
- Elicit - Chat de texto que te permite interactuar y encontrar información en trabajos de investigación.
- Humata - Chat de texto que te permite interactuar con el contenido de un documento pdf.
- Piggy - Genera historias, resúmenes y preguntas y respuestas con imágenes.
- Wisdolia - Genera flashcards de un vídeo, artículo o pdf y te ofrece un feedback.
Dentro de las herramientas de generación de texto, hay algunas cuyo enfoque es específicamente educativo, por ejemplo:
- Quizgecko - Genera automáticamente preguntas para cuestionarios, pruebas y exámenes en línea.
- TutorAI - Introduce el tema del que quieras aprender y TutorAI generara los módulos necesarios para progresar en el aprendizaje.
- Mindsmith - Herramienta de creación de cursos que utiliza IA generativa para facilitar creación y el uso compartido de contenido de aprendizaje.
- Caktus AI - Enfocada en el estudiante. Herramienta de estudio para hacer crecer tu mente con tu propio asistente de IA asequible diseñado específicamente para tareas y aprendizaje.
- Mathew - Crea Actividades, situaciones de aprendizaje y evaluaciones.
Generación de imagen
Las herramientas generativas de imágenes mediante IA están diseñadas para crear imágenes de forma autónoma en función de nuestras solicitudes. Estas herramientas implementan algoritmos y redes neuronales artificiales, incluyendo redes generativas adversarias (GAN) o modelos de lenguaje, para crear imágenes digitales capaces de representar elementos como objetos, entornos, rostros humanos y demás componentes visuales.
Piensa en la posibilidad de usar una herramienta que te facilite generar imágenes en base a instrucciones específicas (prompt). Estás imágenes pueden ser utilizadas entre otras cosas para enriquecer presentaciones, ilustrar comics o visualizar conceptos abstractos. De igual manera, los estudiantes podrían emplear estas herramientas para elaborar infografías, esquemas conceptuales y representaciones visuales de procesos complejos, favoreciendo así la comprensión y el intercambio de ideas.
Existen multitud de alternativas disponibles para la creación de imágenes:
- Nostalgia Photos - Devuelve la vida a las fotos antiguas con la última inteligencia artificial de vanguardia.
- DALL·E3 - Texto a imagen.
- Bing Image Creator - Texto a imagen.
- Adobe Firefly - Texto a imagen, relleno generativo, efectos de texto, generación de colores de reemplazo, 3D a imagen y ampliar imagen.
- Canva - De texto a imagen: puedes crear ilustraciones, fotografías e imágenes a partir de prompts descriptivos.
- CHARL-E - Texto a imagen.
- Draw anyone - Retratos generados por IA.
- DreamStudio - Texto a imagen y edición de imagen.
- Microsoft Designer - Crea y edita diferentes tipos de recursos visuales: gráficos, infografías, posters, vídeos, etc.
- Recraft.ai - Texto a imagen.
- Scribble Diffusion - De dibujo a imagen.
- Vectorizer.AI - Permite vectorizar imágenes.
Generación de audio
Las herramientas generadoras de audio basadas en inteligencia artificial están diseñadas para generar o modificar contenido de audio de forma autónoma. Mediante algoritmos avanzados y modelos de aprendizaje profundo son capaces de producir un abanico de sonidos, melodías, voces y efectos sonoros, así como de eliminar sonidos no deseados. Estas acciones son realizadas en base a las instrucciones introducidas mediante texto, pero también desde muestras de audio previas o incluso imágenes o parámetros específicos.
En el ámbito educativo, estas herramientas presentan numerosas posibilidades. Por ejemplo, pueden utilizarse para crear ejemplos de diferentes géneros musicales, enriqueciendo así la experiencia educativa de los estudiantes en música. Además, pueden funcionar como banda sonora para proyectos multimedia, aportando una capa auditiva a presentaciones y trabajos escolares. También son eficaces para facilitar la comprensión de conceptos musicales abstractos, ofreciendo ejemplos sonoros tangibles. Además, las herramientas de generación de audio pueden emplearse para desarrollar materiales didácticos interactivos, como narraciones para lecciones online o contenido sonoro personalizado que se adapte a las necesidades específicas de los estudiantes.
Ejemplo didáctico
Para mostrarte cómo puedes aplicar estas herramientas en la educación, te proponemos un ejemplo práctico que ilustra cómo la IA puede ser una valiosa aliada en tu labor docente. Aquí te presentamos una solución posible destinada a mejorar las habilidades lingüísticas y fomentar la creatividad en estudiantes de Educación Secundaria. Aunque las situaciones pueden ser muy variadas, este ejemplo puede inspirarte y brindarte ideas o sugerencias que posteriormente podrás adaptar a tu contexto educativo particular.
En nuestro centro educativo vamos a diseñar una experiencia educativa centrada en el desarrollo de habilidades lingüísticas y creatividad para los estudiantes de secundaria. Queremos proporcionarles una manera interesante y variada de explorar la poesía y la narración de historias. Para lograrlo, incorporamos elementos de generación de audio. Vamos a utilizar la herramienta de generación de audio Murf.ai, para dar vida a la poesía y narrativa. Vamos a transformar un poema popular en un archivo de audio narrado por una IA. Esto permitirá a mis estudiantes reflexionar sobre la importancia de la entonación, ritmo y la expresión emocional en la lectura del poema. Y podrán experimentar sobre algunas de las posibilidades que ofrece la IA.
6. Discusión y creación. Después de escuchar, proponer un debaten sobre las impresiones y emociones que evoca el poema en formato de audio. 7. Se les asigna la tarea de crear sus propias composiciones poéticas o narraciones de historias cortas, que posteriormente transformarán en archivos de audio utilizando la misma herramienta. Esto fomenta su creatividad y comprensión profunda de la relación entre el contenido y la expresión auditiva. En el siguiente enlace puedes acceder al poema en Murf, reproducirlo y editarlo, modificando en cada estrofa, la velocidad de la narración, el énfasis y otras variables https://murf.ai/studio/project/2/P0169835294176343L?workspaceId=WORKSPACEID0169835293996182M |
Dentro del amplio abanico de herramientas, hemos optado por destacar Murf.ai para demostrar una de las diversas maneras en las que se puede aplicar en el entorno educativo. También tienes a tu disposición las siguientes aplicaciones diseñadas específicamente para la creación de audio y música:
- MusicLM - Genera música a partir de prompts.
- Beatoven - Genera música a partir de prompts.
- Podcastle - Ayuda en generación de podcast.
- ElevenLabs - Software de conversión de texto a voz y clonación de voces.
Generación de video
Las herramientas de generación de video permiten la creación y edición de contenido audiovisual de manera automatizada a través de IA. Estas aplicaciones son capaces de transformar imágenes estáticas en videos, convertir texto en animaciones, mejorar la resolución de los videos y producir contenido personalizado. Es crucial ser consciente de que la calidad y las funcionalidades de estas herramientas pueden variar significativamente, y es necesario abordar las cuestiones éticas y respetar los derechos de autor al hacer uso de ellas.
En el contexto educativo, estas herramientas ofrecen valiosas oportunidades para la elaboración de materiales audiovisuales que ayuden a explicar conceptos complejos. Los educadores pueden hacer uso de estas aplicaciones para crear animaciones educativas, visualizaciones de experimentos científicos o análisis interactivos de textos literarios, facilitando así un aprendizaje más atractivo y accesible para los estudiantes.
Ejemplo didáctico (multimodo)
Con el objetivo de ilustrar cómo se pueden integrar estas herramientas en la enseñanza, exponemos el siguiente ejemplo práctico realizado integrando algunas de las herramientas aquí descritas. Permitirá explorar las maneras en que la IA puede ser útil en tu labor docente.
Hemos elegido D-ID para el video mostrando una posible aplicación de aula, pero como en el resto de modos de generación podemos encontrar varias herramientas para generar vídeo, por ejemplo:
- Canva - Animador mágico: puedes dibujar la trayectoria de desplazamiento de cualquier elemento de las composiciones multimedia que presenta y, gracias a la IA, generará automáticamente tanto el movimiento como los efectos correspondientes.
- Rephrase.ai - Texto a video con avatar
- Vidyo.ai - Corta videos largos en segundos
- Wonder Studio - Permite generar efectos especiales, insertar y eliminar personajes de cualquier escena.
Generación de código
Las herramientas de generación de código son herramientas basadas en inteligencia artificial que están empezando a adquirir protagonismo en el desarrollo y optimización de código de programación. Son capaces de crear algoritmos, segmentos de código y solucionar problemas de programación de manera automática o con asistencia, proporcionando una herramienta práctica tanto para profesionales como para docentes como para estudiantes en el proceso de aprendizaje y práctica de programación.
En el entorno educativo, estas herramientas de generación de código pueden suponer un cambio significativo. Los estudiantes pueden emplear estas herramientas de IA generativa para explorar y entender conceptos de programación de forma más eficaz, obteniendo ejemplos prácticos y funcionales de código para resolver problemas específicos. Los profesores, por otro lado, pueden utilizar estas herramientas para crear ejercicios y proyectos de programación más retadores y diversos, ofreciendo a los estudiantes una experiencia de aprendizaje más completa. Además, estas herramientas pueden facilitar el desarrollo de software dentro del sector educativo, permitiendo a las instituciones crear aplicaciones a medida para fines docentes y gestión de datos académicos.
Estas son algunas de las herramientas de generación de código:
- ChatGPT - Chatbot conversacional general (si, ChaGPT tambien genera código, al igual que otros chatbots)
- Adrenaline
- Cosine
- Amazon CodeWhisperer
- Code GPT
Por último, aunque no pueda incluirse en ninguna de las agrupaciones anteriores por su carácter meramente científico, destacar Wolfram Research, conocida principalmente por desarrollar productos de software matemático, que también incluye desarrollos de IA. Dentro de esta plataforma distinguimos.
- Wolfram|Alpha: Es un motor de cálculo computacional y respuesta a preguntas. Puedes hacerle preguntas en lenguaje natural y te dará respuestas detalladas. Es como un "ChatGPT" especializado en matemáticas y ciencia.
- Mathematica: Es un software líder en cálculo simbólico y numérico, utilizado ampliamente en investigación y educación para realizar cálculos matemáticos, análisis de datos, visualización y desarrollo de algoritmos.
- Wolfram Language: Un lenguaje de programación de alto nivel que alimenta a Mathematica y Wolfram|Alpha. Es conocido por su capacidad de integración y por tener funciones incorporadas para muchas tareas.
Plataformas educativas
Las plataformas educativas tienen vocación de abarcar mayor espacio en el proceso educativo, gestionando y monitorizando el progreso de los alumnos implicando en el mismo diferentes herramientas entre las que pueden estar algunas de las herramientas específicas vistas y otras que recopilen la información personalizada surgida del propio proceso con el fin de analizar la evolución de cada estudiante y proporcionarle los recursos específicos adaptados a su necesidad en cada momento.
Algunas de estas plataformas ya han sido adaptadas por sistemas educativos a nivel institucional, como Eduten
Eduten es una plataforma de aprendizaje digital finlandesa que ofrece ejercicios y juegos personalizados para estudiantes de primaria y secundaria. La plataforma está disponible en inglés y español. Los servicios de la plataforma son contratables para cualquier institución educativa interesada.
Su funcionamiento se basa en un algoritmo de aprendizaje automático para personalizar el contenido y la dificultad de los ejercicios a las necesidades de cada estudiante. Esto ayuda a los estudiantes a aprender a su propio ritmo y a dominar los conceptos de forma efectiva.
La plataforma ofrece una amplia gama de ejercicios y juegos, incluyendo:
- Matemáticas: Ejercicios de matemáticas para aprender y practicar conceptos básicos y avanzados.
- Lengua y literatura: Ejercicios de comprensión lectora, escritura y gramática.
- Ciencias: Ejercicios de ciencias para aprender sobre el mundo natural.
- Historia: Ejercicios de historia para aprender sobre eventos y personajes históricos.
- Geografía: Ejercicios de geografía para aprender sobre el mundo y sus culturas.
Pero sobre todo ofrece análisis de aprendizaje para que los profesores puedan monitorear el progreso de sus alumnos. Estos análisis incluyen información sobre el tiempo que los estudiantes pasan en la plataforma, las tareas que completan y su rendimiento en las tareas.
Aquí hay algunos de los beneficios de utilizar Eduten:
- Aprendizaje personalizado: Adapta el contenido y la dificultad de los ejercicios a las necesidades de cada estudiante. Esto ayuda a los estudiantes a aprender a su propio ritmo y a dominar los conceptos de forma efectiva.
- Retroalimentación Inmediata: Los estudiantes reciben retroalimentación inmediata sobre sus respuestas, lo que les ayuda a comprender y corregir errores al instante.
- Motivación: Utiliza ejercicios y juegos atractivos para mantener a los estudiantes motivados. Esto ayuda a los estudiantes a participar en el aprendizaje y a retener la información.
- Análisis de aprendizaje: Proporciona análisis de aprendizaje para que los profesores puedan monitorear el progreso de sus alumnos. Esto ayuda a los profesores a identificar las áreas de mejora y a proporcionar a los estudiantes la ayuda que necesitan.
Otras, son plataformas web como Khanmigo. Khanmigo es un chatbot de aprendizaje personalizado desarrollado por Khan Academy. Khanmigo utiliza el modelo de lenguaje GPT-4 de OpenAI para proporcionar a los estudiantes un aprendizaje individualizado y relevante. Puede personalizar el aprendizaje de los estudiantes de varias maneras;
- Adaptando el contenido: adapta el contenido a las necesidades y preferencias de los estudiantes. Por ejemplo, si un estudiante tiene dificultades con un concepto, Khanmigo puede proporcionarle más explicaciones o ejemplos.
- Proporcionar retroalimentación personalizada: proporciona retroalimentación personalizada a los estudiantes sobre su trabajo. Esta retroalimentación puede ayudar a los estudiantes a identificar sus áreas de mejora y a desarrollar estrategias de aprendizaje efectivas.
- Crear un plan de aprendizaje individualizado: puede crear un plan de aprendizaje exclusivo para cada estudiante. Este plan se basa en las necesidades y objetivos de aprendizaje del estudiante.
En el siguiente video Sal Khan, fundador de la plataforma explica las características de la misma:
No podía faltar la incorporación de la IA a la plataforma educativa de Google Classroom, El gigante tecnológico ha incluido entre las funcionalidades de su las Practicas Guiadas (Practice Sets) en su herramienta educativa. Esta novedad en Google Classroom aporta la anhelada posibilidad de personalizar el aprendizaje de cada estudiante mediante la tecnología de aprendizaje adaptativo
Este es un hito anhelado y ya accesible para que cada profesor pueda apoyar a sus estudiantes mediante tareas interactivas y comentarios en tiempo real e individualizados. Este método se basa en la medición, recopilación y análisis de datos (Learning Analytics) sobre el alumnado, su entorno y sus interacciones con el objetivo de adaptarse a sus necesidades
Esta función está disponible en Google Classroom para cualquier educador que utilice la ‘Teaching and Learning upgrade’, o cualquier institución que emplee Google Workspace for Education Plus. Una vez creadas las prácticas, es posible que todos los profesores del centro las compartan.
En el siguiente video tienes mas información al respecto:
Referencias Módulo 3
Web: Herramienta para la gestión de contenidos en el aula
Web: Guía de ingeniería del prompting
https://www.promptingguide.ai/es
https://profesoreco.blogspot.com/2023/04/instrucciones-precisas-y-potentes.html
Vídeo repaso conceptos y aplicaciones IA Generativa
https://youtube.com/watch?v=QC3J3DAMUvg&list=PLaFUiA52BD9H-EZJfgR9qEBVNdiXJuucC&index=2&t=7329s
Vídeo IA Genrativa. Se explica de forma muy sencilla el concepto y aplicaciones de la IA Generativa
https://www.youtube.com/watch?v=_6R7Ym6Vy_I
Documento pdf: Informe UNESCO AI y Educación, guía para gestores
https://unesdoc.unesco.org/ark:/48223/pf0000379376/PDF/379376spa.pdf.multi
Web Asistente de Khan Academy: Khanmigo
https://www.khanacademy.org/khan-labs
Curso INTEF: IAEducacion Una IA para aprender
https://enlinea.intef.es/courses/course-v1:INTEFMOOC+IAEducacion+2023_T1/about
Web AI Tool Master List Conjunto de herramientas de IA clasificadas por su ámbito de aplicación
https://doc.clickup.com/25598832/d/h/rd6vg-14247/0b79ca1dc0f7429/rd6vg-12207
Web Futurepedia
Directorio de herramientas de IA