Módulo 3. Y ahora que hacemos. Aplicaciones de la IA

Este módulo da una visión de las aplicaciones más importantes y potentes de IA así como una guía detallada de técnicas de prompting que facilite el uso de dichas aplicaciones, siempre haciendo énfasis en aplicaciones en el ámbito educativo.

Unidad 3.1. Posibilidades de la IA

Introducción

Hemos repasado la historia de las ideas y avances que han llevado a la IA al momento actual. Hemos visto que la IA ya es una realidad en nuestra sociedad y que tiene una gran importancia en la economía y un enorme potencial por delante. También hemos podido analizar su funcionamiento, lo que sin duda nos ayudará a entenderla un poco mejor y a poder sacar un mejor provecho de la misma cuando empecemos a explorar las posibilidades que  nos ofrece.

En esta unidad vamos a entrar en el mundo de posibilidades que se abre ante nosotros, repasando y analizando las posibles aplicaciones de la IA.


Posibilidades de la IA

La Inteligencia Artificial tiene una gran cantidad de aplicaciones en varios campos. Muchas de ellas, ya las hemos visto en unidades anteriores, ya fuera al exponer las aplicaciones actuales de la IA o al analizar el funcionamiento de la misma. Si bien ahora vamos a entrar a profundizar en las posibilidades de uso "cotidiano" de manera que podamos extraer conclusiones sobre la utilidad que nos pueden reportar. Aquí hay una descripción estructurada de algunas de las aplicaciones más notables de la IA, organizadas por categorías funcionales:

Procesamiento del lenguaje natural (PLN)

El PLN es una subdisciplina de la IA que se centra en la interacción entre las computadoras y el lenguaje humano. A través de los años, las capacidades de los modelos de PLN han avanzado enormemente. A continuación, se describen algunas de las cosas de las que es capaz un modelo de PLN:

Es importante destacar que, aunque los modelos de PLN han alcanzado altos niveles de rendimiento en muchas tareas, todavía enfrentan desafíos, especialmente cuando se trata de entender el contexto completo, el sarcasmo, o ciertas sutilezas y ambigüedades del lenguaje humano.

Visión por computadora

La visión por computadora es otra rama de la IA que se ocupa de permitir que las computadoras "vean" e interpreten imágenes y videos. Los sistemas de inteligencia artificial que utilizan visión por computadora han experimentado avances significativos en los últimos años. Estas son algunas de las posibilidades y aplicaciones de la visión por computadora con IA:

La combinación de hardware cada vez más potente, grandes conjuntos de datos y algoritmos avanzados de aprendizaje profundo ha permitido que la visión por computadora con IA penetre en muchos sectores y continúe expandiéndose en nuevas áreas. La investigación en este campo es activa y sigue produciendo mejoras y nuevas capacidades.

Audio

Los sistemas de inteligencia artificial que procesan y analizan audio han experimentado también avances considerables. Las aplicaciones relacionadas con el audio y la IA abarcan una amplia gama de áreas. Estas son algunas de las posibilidades y aplicaciones de la IA en este ámbito:

De nuevo aquí, la convergencia de grandes conjuntos de datos de audio, algoritmos avanzados (especialmente en el área de redes neuronales recurrentes y transformadores) y hardware más potente ha impulsado la adopción de la IA en aplicaciones de audio. Como en otros campos de la IA, la investigación en audio sigue siendo muy activa y está abriendo nuevas posibilidades y mejoras continuamente.

Multimodo

Hasta aquí, es posible que te haya asaltado la idea de que estos modos podrían ser combinables para obtener una mayor funcionalidad y utilidad del sistema, eso es precisamente lo que hacen los sistemas multimodales. Los sistemas de IA multimodo son aquellos que combinan información de algunas o todas las modalidades vistas previamente (texto, imagen/video, audio) para llevar a cabo tareas o proporcionar soluciones más integradas y contextuales. Estos sistemas son especialmente poderosos porque pueden aprovechar las fortalezas y compensar las debilidades de cada modalidad individual. Aquí hay algunas posibilidades y aplicaciones de la IA multimodo:

El desarrollo de sistemas de IA multimodo es complejo, ya que requiere la integración efectiva de modelos especializados en diferentes modalidades. Sin embargo, a medida que la tecnología avanza, sin duda veremos una adopción más amplia de soluciones multimodo, dada su capacidad para proporcionar experiencias más ricas y contextuales.

 

Principales empresas de IA y sus chatBots en marzo de 2024 image.png

Unidad 3.2. Tutorial de Prompting. La impotancía de las preguntas

"Juzga a un hombre por sus preguntas y no por sus respuestas" Voltaire

"No es la respuesta la que ilumina, sino la pregunta" Eugene Ionesco

“Lo importante es no dejar de hacerse preguntas” 

"Si yo tuviera una hora para resolver un problema, y mi vida dependiera de la solución, gastaría los primeros 55 minutos en determinar la pregunta apropiada, porque una vez conociera la pregunta correcta, podría resolver el problema en menos de cinco minutos"

Albert Einstein

Introducción 

Ya hemos visto que la herramienta que provocó la irrupción masiva la inteligencia artificial a nivel popular fue el chatbot ChatGPT. La tecnología que hay detrás de este chat es el mencionado PLN (Procesamiento del Lenguaje Natural). A día de hoy, esta tecnología se ha utilizado para desarrollar muchos otros chatbots (Gemini, Llama, Claude etc…). El PLN es un subcampo de la IA que utiliza modelos de lenguaje para predecir una secuencia de palabras.

Para poder sacar el mayor potencial de estos modelos, es crucial entender y aplicar de manera efectiva la técnica de "prompting". Esta técnica nos permite interactuar con estos modelos de lenguaje para recibir respuestas específicas y generar distintos tipos de contenido, desde texto, como en los chatbots,  hasta imágenes y sonidos a través de otras herramientas que veremos más adelante.

En este capítulo, vamos a explorar el concepto de prompting de forma detallada, sus implicaciones en la IA, y su potencial aplicación en la educación.


¿Qué es el prompting? y su importancia

El prompting es una técnica utilizada para interactuar con sistemas de IA mediante indicaciones o preguntas específicas . Es el medio por el cual se le pide a un modelo de lenguaje o a un algoritmo de IA que realice una acción o que genere una respuesta. Este concepto es fundamental para aprovechar plenamente las capacidades de los modelos de IA, especialmente en el procesamiento de lenguaje natural (PLN).

El prompting nos lleva a introducir al modelo un prompt, lo que en castellano podríamos traducir como “cuestión, pregunta o Indicación”.

Por tanto, el prompting se trata, dicho de manera simple, de pensar y trabajar la indicación o pregunta que vamos a realizarle al modelo de IA para que la respuesta o resultado que el modelo nos presente sea lo más ajustado posible a nuestra solicitud y nos aporte un contenido lo más valioso posible.

Un ejemplo aclaratorio:

Todos hemos hecho búsquedas en cualquiera de los buscadores disponibles por internet. Al hacerlas, en mayor o menor medida hacemos un esfuerzo para introducir el texto adecuado para que el motor de búsqueda encuentre la web o webs más relevantes para nuestra necesidad concreta. Ese esfuerzo que hacemos para que nuestra entrada facilite al buscador ofrecernos lo que buscamos sería el prompting. En el contexto de un motor de búsqueda, esto se traduciría en cómo eliges y organizas las palabras clave para obtener los resultados más relevantes. Es una especie de "arte" en cómo haces la pregunta para obtener la mejor respuesta

 A su vez, el texto que introducimos en el buscador representaría el prompt. Es la consulta específica que generas, compuesta de palabras clave, frases o preguntas, que el motor de búsqueda procesa para obtener resultados.

El prompting es esencial para una gran variedad de aplicaciones de IA. Desde asistentes virtuales hasta motores de búsqueda y sistemas de recomendación, el diseño y la implementación efectiva de prompts son cruciales para la eficacia y precisión de estos sistemas. Además, con la aparición de modelos más avanzados y diversos, el papel del prompting se ha expandido para incluir la generación de contenido más allá del texto, como imágenes y sonidos.

image.pngImagen propia. Generada por el Generador de imágenes de Bing.


Evolución del prompting

En los albores de la computación, las interacciones con las máquinas eran bastante rudimentarias. Las interfaces de línea de comandos fueron algunas de las primeras formas de prompting, donde los usuarios ingresaban comandos de texto específicos para obtener respuestas o realizar tareas. 

Con el tiempo y el avance tecnológico, las formas de interactuar con las máquinas se han vuelto cada vez más sofisticadas. Pasamos de las interfaces de línea de comandos (MS-DOS) a interfaces gráficas de usuario (Windows) y luego a interacciones más intuitivas gracias a la IA. Los modelos de lenguaje de gran escala como por ejemplo GPT-3 (modelo detrás de ChatGPT) y LaMDA (modelo detrás de Bard) permiten ahora una interacción mucho más natural y conversacional. A través de prompts bien diseñados, estos y otros modelos pueden comprender y generar texto, imágenes, y sonidos que son increíblemente cercanos a lo que un humano podría producir o entender.

En sus inicios, el prompting se limitaba principalmente al texto. Sin embargo, con el desarrollo de modelos de IA más avanzados, ahora es posible generar y analizar diferentes tipos de medios. Por ejemplo, existen modelos que pueden generar imágenes basadas en descripciones de texto (prompts de imagen), y también modelos que podrían generar un texto basándose en una imagen (que en este caso haría el papel de prompt), pero también modelos que pueden componer música basada en ciertas instrucciones o emociones (prompts de audio). Esta evolución ha ampliado enormemente el alcance y las aplicaciones del prompting, permitiendo una gama más amplia de interacciones y generación de contenido.

Modelos capaces de entender prompts de diferentes tipos y generar resultados también de diferentes tipos serían los mencionados multimodales. Un ejemplo: introducir una imagen de un paisaje otoñal en un modelo de este tipo, y solicitar que genere un poema que capture la esencia de la imagen.

Este tipo de interacción representa una evolución emocionante en el campo del prompting, ya que amplía significativamente las formas en que podemos interactuar con los modelos de IA. Los prompts ya no están limitados al texto, sino que pueden abarcar una variedad de medios, incluidas imágenes, sonidos y quizás más en el futuro.

Esta funcionalidad tiene aplicaciones potenciales muy interesantes, no solo en el ámbito del arte y la creatividad, sino también en campos como la educación, donde podría emplearse para enseñar conceptos como la interpretación de imágenes, la escritura creativa o incluso la empatía y el entendimiento cultural.


Tipos de prompts

Como acabamos de ver, a medida que la inteligencia artificial ha evolucionado, los prompts que podemos utilizar para interactuar con los modelos también lo han hecho. Mientras que en sus inicios el prompting se centraba exclusivamente en el texto, la tecnología actual permite una gama mucho más amplia de interacciones. 

El desarrollo de la IA le permite abordar una amplia variedad de modalidades. Las "modalidades" en este contexto se refieren a las diferentes formas de datos o información que los sistemas de IA pueden procesar (prompt de entrada) o generar (salida de la IA).

En la siguiente tabla vamos a resumir todas las modalidades que la IA generativa nos ofrece. Cada una de las cuales admite uno o más tipos de prompts. 

Prompt (entrada)

Respuesta IA (salida)

Ejemplo de uso

Texto

Texto

Chatbot, traducción, resumen…

Texto

Imagen

Generación imagen desde texto

Texto

Video

Generación de video desde texto

Texto

Audio

Síntesis de voz, sistemas Text-To-Speech, generación de música

Imagen

Texto

Descripción imagen, reconocimiento óptico de caracteres (OCR)

Imagen

Imagen

Colorización de imágenes en blanco y negro, superresolución, estilo transfer entre imágenes

Audio

Texto

Transcripción automática, reconocimiento de voz

Audio

Audio

Eliminación de ruido, cambio de tono o velocidad

Video

Texto

Subtitulación, descripción automática del contenido

Video

Video

Mejora de resolución de video, transferencia de estilos de videos

Combinación de anteriores

Cualquiera o una combinación de las anteriores

MULTIMODALIDAD: Sistemas que pueden recibir una imagen y una pregunta en texto sobre esa imagen, y proporcionar una respuesta en texto o audio.

 Estas son algunas de las principales modalidades en las que operan los sistemas de IA. Pero hay que subrayar que la investigación en IA está en constante evolución, y con el tiempo es probable que veamos aún más capacidades y combinaciones en términos de modalidades.

A continuación, examinaremos con mayor profundidad algunas posibilidades de los tipos de prompts de uso mas común  

Prompts de Texto

El texto ha sido tradicionalmente el medio más común para el prompting en IA. Los prompts de texto se introducen generalmente en forma de preguntas o indicaciones. Dentro de los prompts de texto podemos distinguir en base al tipo de respuesta que queremos obtener:

Los prompts abiertos son aquellos que no limitan las respuestas de la IA, como "Háblame sobre el cambio climático".

Los prompts cerrados, en cambio, buscan respuestas específicas, como "¿En qué año nació Albert Einstein?".

Prompts Visuales

Con la evolución de los modelos de IA hacia capacidades multimodales, es posible usar imágenes o videos como prompts. Con estos prompts se le puede solicitar  a la IA que describa la imagen, identifique objetos en ella o,  como se mencionó anteriormente, genere texto creativo inspirado en la imagen. También puede pedírsele una salida de la imagen o video mejorada o modificada. 

Prompts de Audio

La capacidad de procesar y generar audio ha abierto una nueva dimensión en el mundo del prompting. Los prompts de audio pueden variar desde simples indicaciones verbales hasta la introducción de fragmentos de música o sonidos específicos.

Estos son solo ejemplos de las posibilidades ya explotadas y de uso frecuente. La versatilidad y el potencial de la inteligencia artificial moderna abre un mar de posibilidades. Ya no estamos limitados a interacciones basadas en texto; la IA ahora tiene la capacidad de comprender y generar contenido en una variedad de medios, lo que permite aplicaciones mucho más ricas y diversificadas en numerosos campos.


Cómo funciona el prompting en IA

El prompting en la inteligencia artificial, desde el punto de vista del usuario, se resume en proporcionar una entrada más o menos elaborada y esperar una respuesta, si bien este proceso, muchas de las veces, requerirá de un cierto número de iteraciones hasta que la IA nos genere la respuesta conveniente.

 Detrás de cada respuesta generada por un modelo de IA, hay una serie de procesos y tecnologías complejas. Vamos a realizar una ligera introducción que nos permita entender conceptualmente cómo funcionan estos sistemas, centrandonos en el Procesamiento del Lenguaje Natural (PLN) dado que es el que, en principio, más nos puede interesar como docentes. Si bien, veremos que conceptualmente el funcionamiento interno de los modelos tiene muchas similitudes independientemente de que se trate de un modo u otro.

image.png

Un poco de humor para una aproximación intuitiva al funcionamiento de la IA. Si el ingles no se te da muy bien, prueba a copiar y pegar la imagen en un chatbot, por ejemplo Bard, pídele que te explique el chiste y se estigo de una de las capacidades actuales de la IA.

El prompting en el Procesamiento de Lenguaje Natural (PLN)

Hemos visto que una parte de la IA se centra en los modelos Text2Text. Estos modelos requieren la introducción de un texto y devuelven otro texto como respuesta, ya sea una respuesta concreta, una conversación con un Chatbot, un resumen, una traducción…

La tecnología que hay debajo de esta modalidad es el Procesamiento de Lenguaje Natural (PLN)

El PLN, como sabemos, es una rama de la inteligencia artificial que se centra en la interacción entre las computadoras y el lenguaje humano. Su objetivo es permitir que las máquinas entiendan, interpreten y generen lenguaje de manera que sea valioso para los usuarios humanos.

El prompt es la entrada que la computadora debe entender, interpretar y utilizar para elaborar una respuesta útil.  Al proporcionar un prompt textual, el modelo de lA procederá primero a su análisis. El análisis del prompt puede dividirse en los siguientes pasos:

Una vez que el sistema ha completado el análisis, puede comprender el significado y propósito del prompt, y le permite generar una respuesta adecuada.

Veamos un ejemplo sencillo:

Prompt: ¿Cuál es la capital de España?

Obviamente la respuesta que da el sistema es: Madrid

Sin embargo, cambiando un poco el contexto, el chatbot Chat GPT nos contesta 

Y si le preguntamos lo mismo a Bard (Chatbot de Google):

Las respuestas son similares pero no idénticas. El corpus de documentación con la que se les ha entrenado será muy similar (básicamente todo el conocimiento humano "verificado" que pueda estar presente en internet hasta cierto momento) pero el proceso de entrenamiento y los algoritmos que procesan el prompt y generan la respuesta puede ser diferente.

Si bien ChatGPT ofrece una única respuesta inicial que puede ser modificada si se matiza el prompt, Bard presenta una respuesta principal y ofrece la posibilidad de, sin hacer matizaciones al prompt inicial, escoger entre 3 posibles respuestas:

Este ejemplo nos sirve para entender que distintos chatbots pueden generar distintas respuestas ante un mismo prompt y que es preciso realizar verificaciones de las mismas y no darlas por buenas sin mas. 

Para entender más a fondo el funcionamiento interno de la IA, cómo esta es capaz de interpretar el prompt y dar una respuesta adecuada, profundizamos un poco y analizamos con mayor detalle los sencillos pasos descritos previamente. Introducimos además algo de lenguaje técnico muy presente en el ámbito de la IA, por lo que conviene familiarizarse con él (algunos de los conceptos y mecanismos ya se estudiaron en el módulo 2)

El prompting en otros modelos de generación

Los modelos de texto a imagen o audio transforman descripciones textuales en representaciones visuales o de audio. El proceso interno coincide en la parte de comprensión del prompt con el detallado en el apartado anterior si bien difiere en la generación ya que en este caso se trata de una imagen o sonido en lugar de un texto. El proceso sería conceptualmente muy similar al descrito si bien existen algunas especificidades. Vamos a introducir los matices necesarios para adaptar la descripción realizada para el proceso prompting para la generación de texto al proceso para generar imágenes.

Tanto para imagen como para otros casos, como el audio, los pasos son muy similares a lo descrito para el texto, con la principal diferencia de que el tipo de contenido que se está procesando y generando es distinto.

Es importante mencionar que la calidad y la precisión del texto, imagen o audio generado dependen en gran medida del modelo específico, de la cantidad y calidad de los datos con los que fue entrenado, y de la claridad y especificidad del prompt textual proporcionado. Este último aspecto es el que desarrollaremos a continuación.


Importancia en el diseño de prompts

En la interacción con modelos de inteligencia artificial generativos, el diseño de los prompts juega un papel crucial. Determinan no solo la calidad de la respuesta del modelo, sino también su utilidad, precisión y seguridad. Vamos a explorar algunos aspectos clave relacionados con el diseño de prompts.

Claridad y ambigüedad en la redacción de prompts

Prompts pre-entrenados vs customizados

Equilibrio entre ambos: Es recomendable comenzar con prompts pre-entrenados y luego personalizarlos según las necesidades, aprovechando lo mejor de ambos mundos.

Contexto: Imagina que eres un profesor de historia que desea usar un modelo de lenguaje para ayudar a sus estudiantes a comprender mejor los eventos históricos. Quieres que el modelo describa la Revolución Francesa en un lenguaje sencillo y fácil de entender.

Podríamos usar un prompt pre-entrenado como: "Describa la Revolución Francesa."

La respuesta que obtendrías podría ser amplia y general, ofreciendo un resumen sobre la Revolución Francesa, sus causas, eventos clave y consecuencias.

Pero podremos ajustar mas la respuesta del modelo a nuestra necesidad si utilizamos un prompt personalizado (Customizado) basado en el Pre-entrenado como:

"Describa la Revolución Francesa en un lenguaje simple y adecuado para estudiantes de secundaria, mencionando sus causas principales, eventos clave y figuras importantes y con una extensión aproximada de XX palabras."

Este prompt customizado toma la base del prompt pre-entrenado (la descripción de la Revolución Francesa) pero añade especificaciones para adaptar la respuesta a las necesidades del profesor: un lenguaje sencillo, la extensión y ciertos puntos clave que deben ser mencionados.

Como resultado, al usar el prompt personalizado, el profesor puede esperar obtener una descripción adaptada al nivel educativo de sus estudiantes, centrándose en los puntos más relevantes para su plan de estudio. Al mismo tiempo, al partir de una base pre-entrenada, garantiza que el tema central sea tratado con precisión.

En este ejemplo, el profesor combina la claridad y efectividad de un prompt pre-entrenado con las adaptaciones específicas de un prompt customizado, obteniendo una respuesta que se adapta perfectamente a sus necesidades educativas.

Aspectos clave en el diseño de prompts

Desde un punto de vista practico debemos tener en cuenta ciertas pautas a la hora de diseñar un prompt, algunas de la claves son:

Por muy bien diseñado que esté un prompt, no debemos olvidar que los modelos del lenguaje pueden alucinar. Las alucinaciones son una preocupación común cuando se trata de modelos de lenguaje grande como ChatGPT. Estos modelos pueden generar respuestas que parecen plausibles pero que son completamente falsas. Es importante recordar que estos modelos no tiene una comprensión real del mundo y pueden generar información incorrecta. Por lo tanto, siempre es esencial verificar cualquier afirmación que haga el modelo.

Consideraciones éticas en el diseño de prompts

En relación con algunos de los aspectos mencionados anteriormente como las alucinaciones o los sesgos, debemos tener muy en cuenta las consideraciones éticas en el diseño de prompts. Esto es un anticipo de lo que veremos en el módulo 5, con una unidad dedicada a las consideraciones éticas de la IA.

Sesgos y prejuicios. Es fundamental ser consciente de los sesgos inherentes en los modelos de IA, que provienen de los datos con los que fueron entrenados. Diseñar prompts sin considerar estos sesgos puede perpetuar o amplificar prejuicios existentes.

Privacidad. Al diseñar prompts, especialmente en aplicaciones educativas o médicas, es vital garantizar que no se solicite ni se revele información personal o sensible.

Claridad en las intenciones. Debe evitarse el diseño de prompts que busquen respuestas engañosas, manipuladoras o con fines malintencionados. Es esencial que los desarrolladores y usuarios tengan responsabilidad en la interacción ética con los modelos.

Educación y formación. Para quienes diseñan y utilizan prompts, es fundamental recibir formación en ética y responsabilidad. Con la creciente dependencia de la IA en muchos ámbitos, se debe garantizar que se utilice de manera beneficiosa y justa.

El diseño de prompts, por lo tanto, no es simplemente una cuestión técnica. Implica consideraciones de claridad, adaptabilidad y ética. Un diseño de prompt bien pensado puede maximizar la eficacia de la IA, mientras que un diseño deficiente o irresponsable puede llevar a resultados no deseados o incluso perjudiciales.


Uso y ejemplos de prompting en educación

Vamos a ver a continuación algunos ejemplos de aplicación del prompting con propósitos educativos (válidos para profesores, alumnos y en general cualquiera que esté interesado en enseñar o aprender sobre un tema específico). Lo haremos a modo ilustrativo trabajando con ChatGPT, pero el proceso de diseño e iteración es similar para cualquier chatbot y muy semejante en cualquier herramienta de IA generativa.

image.pngImagen propia. Generada por el Generador de imágenes de Bing

Tenemos claro que unas instrucciones precisas, son la clave para obtener las respuestas adecuadas. También que en ocasiones será necesario iterar varias veces hasta dar con la indicación que nos dé la mejor salida. Pero una vez encontrada la indicación (prompt) que funciona, podemos usarla tantas veces como necesitemos, esperando recibir en todas las ocasiones, una respuesta similar y adecuada.

Una recomendación importante, independientemente del chatbot utilizado (ChatGPT, Bard, Claude, Bing…) es que cada vez que iniciemos un chat para trabajar un nuevo tema, nos mantengamos dentro del mismo en la medida de los posible. De esta manera, el contexto de la conversación será de ayuda para que el chatbot entienda mejor tus indicaciones. Igualmente, si cambias de tema, abre un nuevo chat.

Se ha de tener en cuenta a su vez, la longitud del prompt que introduzcamos. Dependiendo del chatbot utilizado y de la evolución de la conversación, variará la longitud máxima recomendada a partir de la cual la respuesta puede no ser tan precisa como se esperaría. Esta longitud puede variar entre 500 y 2000 palabras dependiendo de los casos.

Comenzaremos con ejemplo de prompts básicos e iremos añadiendo complejidad sucesivamente.

Para facilitar la comprensión de temas que resulten difíciles de comprender, obtener las ideas clave sobre un tema, recibir consejos de estudio, evaluar sobre la evolución en el aprendizaje y en general empezar a aprender sobre un tema nuevo podemos introducir los siguientes prompts:

¿Puedes explicar [tema] de manera simple?

¿Cuáles son los aspectos más importantes sobre [tema]?

¿Puedes hacerme una prueba para evaluar lo que he aprendido sobre [tema]?

¿Dime algún consejo para estudiar y memorizar información relacionada con [tema]?

Resume el texto siguiente en forma de lista con los puntos más importantes. Texto: [pegar texto]

Resume el libro en forma de lista con los puntos más importantes. libro: [título del libro]

Resume el texto siguiente en forma de lista con los puntos más importantes de la página web: [insertar URL]

El tema, texto, título del libro, URL, etc... al que nos estemos refiriendo, No hay que introducirlo entre corchetes

Algunos chatbots no son capaces de navegar (ChatGPT versión gratuita no es capaz de hacerlo a día de hoy). Por lo que para referirnos a una URL deberemos utilizar otros chatbots como; Bard, Bing, o ChatGPT Plus, entre otros

Si la información a la que nos referimos esta en otro idioma, se le puede pedir que lo traduzca:

Traduce este texto a [idioma]: [insertar texto]

Otros ejemplos de prompts que permiten obtener resultados adecuados para acelerar el proceso de aprendizaje serían aquellos que nos permitan;  crear mapas mentales es una de las posibilidades, crear analogías, solicitarle que actué como un personaje histórico o una personalidad relevante en una determinada materia y simular una conversación con ella,  crear tablas para organizar información, idear actividades de evaluación (test, cuestionarios, etc...).

Vemos ejemplos de cada caso:

Creación de mapas mentales (ejemplo: historia)

Prompt: Crea un mapa mental en texto sobre [tema] enumerando la idea central, las ramificaciones que parten del centro y las subramificaciones de cada rama.


 Como ya se ha indicado, la posibilidad de ampliar, reducir o modificar cualquier parte de la respuesta existe y solo hay que indicarle al chat lo que necesitemos.

Si queremos ver el mapa mental gráficamente le podemos pedir que lo formatee como código «Markdown» o en el formato que la aplicación con la que queramos generar el mapa mental gráfico necesite, de manera que podrás crear un archivo.txt e importar el mapa mental en herramientas como Mindomo o Xmind, que generarán automáticamente el gráfico del mapa mental.

(con la opción de plugins que veremos en el módulo 4, la versión ChatGPT Plus pude realizar el gráfico sin necesidad de los pasos que aqui vamos a realizar)

Prompt: Formatea el texto como código [nombre]


Ver el ejemplo completo en el siguiente linkhttps://chat.openai.com/share/9488f559-cbd3-436f-924a-77b729bb907c

Para importar este código en Mindomo, pulsa en Copy Code (arriba a la derecha de Chat GPT), pega el texto en TextEdit (MAC) o Bloc de Notas (Windows) y guarda el archivo. Ahora simplemente importa este archivo .txt dentro de Mindomo y verás tu mapa mental creado en segundos.


https://www.mindomo.com/mindmap/d8428ef1c3d54af98a34da10f865cc34 

Crear analogías (ejemplo: física)

Un recurso muy útil para asimilar conceptos es crear analogías que permita entender mediante un símil conceptos complejos. Algo en lo que los chatbots basados en los modelos de lenguaje, como ChatGPT son muy capaces.

Prompt: Usa una analogía o metáfora para explicar [tema]


Simular personaje o rol (ejemplos: historia, lengua)

También es un recurso muy interesante pedir a ChatGPT que actúe como un personaje histórico o una personalidad relevante en una determinada materia y simular una conversación con ella.

Prompt: Actúa como si fueras [personaje relevante] introduciendo tu opinión sobre [tema concreto] y haciéndome preguntas relacionadas para mantener una conversación de manera que pueda entender mejor el tema planteado

 

Aquí un ejemplo de en el que se le pide que actué como César Augusto en el que se genera una conversación sobre la caída del imperio romano. 

Conversación completa y opción de continuarla: https://chat.openai.com/share/36c5352a-15a5-4984-915f-4368a716ae22

 

Esta opción puede resultar muy atractiva en el aula, estableciendo por ejemplo una entrevista entre los estudiantes y el personaje elegido.

Del mismo modo, en lugar de un personaje histórico puede pedírsele al chatbot que actué como un profesor de una materia y nivel educativo concreto nos plantee ejercicios o problemas de la materia, corrigiendo la respuesta en caso de nos ser correcta o sugiriendo puntos de mejora.

Prompt: Actúa como profesor de [materia y nivel educativo] Plantéame un ejercicio sobre [tema concreto] y una vez te de la respuesta indícame si es correcto o no y en caso de ser incorrecto dime cuales son los fallos cometidos

Conversación completa: https://chat.openai.com/share/9178e64b-960c-4a72-b676-8213ce5496f8

Revisa el enlace y observa que la corrección final del chatbot no es algo confusa, en este caso, habrá que iterar hasta pulir la respuesta hasta ajustarla a lo que creemos adecuado. Es es la manera de conseguir "comprender" la manera que tiene el chatbot de entender nuestras preguntas. Consiguiendo esto, seremos capaces de diseñar mejores prompts y de conservar aquellos que nos resulten útiles para futuras ocasiones.

 En cualquier caso, este caso es un ejemplo ilustrativo de la necesidad de mantener cierto escepticismo ante las respuestas y de una supervisión humana al proceso.

Creación de tablas (ejemplos: historia, lengua)

Podemos crear tablas para organizar información de cualquier tema, pudiendo especificar los conceptos y orden de cada columna a través de una separación con una barra vertical

Prompt: Crea una tabla sobre [tema]: Concepto 1 | Concepto 2 | Concepto 3

image.png

Respuesta completa: https://chat.openai.com/share/4276f3e0-fc25-41c3-94a1-89f29abecb1b

También se le puede solicitar que extraiga cierta información de un texto y la ordene en una tabla. 

Para este ejemplo, vamos además a comprobar la capacidad del chatbot para corregir un texto con faltas de ortografía

Prompt: Crea una tabla extrayendo del texto: Concepto 1 | Concepto 2 | Concepto 3          Texto: [insertar texto]

image.png

Ayuda con hojas de cálculo (Excel, Google Sheets, Calc) (ejemplo: multidisciplinar)

Para gestionar datos  numéricos es muy útil el manejo de hojas de cálculo, si bien, en ocasiones nos gustaría realizar ciertas acciones para las cuales no tenemos suficientes conocimientos y acabamos complicando la estructura de la hoja por no conocer las funcionalidades de la misma o simplemente renunciamos a intentar conseguir lo que deseamos.

ChatGPT puede indicarte la formula adecuada a introducir en cada celda con tan sólo una descripción de lo que necesitas. También nos indicará las instrucciones de lo que tenemos que hacer si nuestra necesidad esta relacionada con algo diferente a meros cálculos entre las celdas (formatos, o funcionamiento general de la aplicación). 

Prompt: Escribe la siguiente fórmula para excel: [descripción del contenido o función] ...

image.png

Aunque le pidas algo pensando que puede hacerlo con una formula y no se pueda, ChatGPT te dará las instrucciones Instrucciones necesarias para que consigas tu objetivo.

image.png

Ver la instrucción completa: https://chat.openai.com/share/116cd5b5-09e4-4bc4-8fd3-38dbdbdc8959

image.png

Ver la instrucción completa: https://chat.openai.com/share/a0c36c1b-e45f-448d-8504-156f756f96f9

Crea cuestionarios (ejemplo: física, idioma,...)

Estos cuestionarios pueden ser sobre cualquier tema y de cualquier tipo; opción múltiple, preguntas cortas, verdadero o falso, rellenar huecos, etc..

Prompt: Escribe [número] preguntas de opción múltiple con una respuesta correcta y [número] respuestas distractoras incorrectas. Las respuestas han de estar etiquetadas como A, B,... Cada respuesta debe incluir una explicación. Tema: [insertar tema]

 Prompt: Escribe [número] preguntas cortas. Tema: [insertar tema]

 Prompt: Escribe [número] preguntas de verdadero o falso Tema: [insertar tema]

Se le puede indicar además que las presente en el formato que necesitemos para incorporarlas a alguna plataforma con la que trabajemos, por ejemplo, formato Aiken para importar en Aeducar (moodle)

Prompt: Formatea el texto en formato [formato] para importar las preguntas a [herramienta]

Prompt: Genera [numero] frases en [idioma] con un espacio en blanco para rellenar con un verbo en su forma correcta. LAs frases irán numeradas de la 1 en adelante. Indica posteriormente un listado con las soluciones dispuestas en orden distinto y numeradas de la a en adelante.

image.png

Como se aprecia con estos ejemplos, las posibilidades son muchas y es labor del usuario sacar el mayor provecho posible en aras de conseguir los mejores resultados.

Unidad 3.3. Más allá del texto. IA Generativa


"La inteligencia artificial generativa es como una máquina que puede soñar y crear mundos nuevos."

- Ian Goodfellow, uno de los científicos de la computación más influyentes en el campo de la inteligencia artificial generativa y creador de la técnica conocida como Generative Adversarial Networks (GANs).

image.png

Conversación real con chatGPT3 en abril de 2023

humano: "Dime una mentira"

chatGPT: "El cielo está hecho de queso verde"

h: "Es muy mala, obviamente es falso, dime una más sutil"

c: "Soy humano"

Introducción

Inicialmente las aplicaciones de aprendizaje automático se centraban en su posibilidad de clasificar y predecir categorías o valores.

En el caso de valores categóricos (frío, caliente o rojo, azul) hablamos de predicción por clasificación, en el caso de valores numéricos (temperatura, valor de un stock o matrícula de alumnos) hablamos de regresión.

Podemos resumirlo en el siguiente esquema

image.png

En este caso partimos de un modelo que ha sido entrenado con valores reales y es capaz de determinar, a partir de nuevos casos, la nueva etiqueta, valor, imagen o predicción en general en el caso de regresión o clasificar (aprendizaje supervisado), ó también agrupar conjuntos de datos similares (clustering o aprendizaje no supervisado).

Sin embargo el auge de las arquitecturas de red convolucionales (para detección de objetos) y de transformers ha abierto la puerta a la parte de más potente de la IA como es la IA generativa.

Sus posibilidades son inmensas y ha generado un miríada de aplicaciones y usos con un potencial enorme y una cantidad de aplicaciones creciente.

Todas ellas o la mayoría se basan en la conversión (generación o modificación) de información en distintos formatos destacando las que generan vídeo o imágenes a partir de texto (prompts). Pero existen muchas otras, como texto a juegos, texto a voz o música, texto a vídeo en tiempo real, amplicación de imágenes o texto a aplicación informática entre muchas otras.

La idea central nace de la posilidad de codificar cualquier objeto (texto, imagen o sonido) en forma numérica (recuerda los wrod embeddings explicados en el módulo anterior) y ser capaces de predecir, dada una secuencia de entrada, el valor siguiente, o sea el pixel siguiente, la palabra siguiente o el sonido siguiente.

Asi es como funcionan estos sistemas que dan lugar a tantas aplicaciones.

La lista de posibilidades es larga pero podemos sintetizarla de algún modo en el siguiente esquema según el cual todos los procesos implican la conversión de una entrada en otra de una forma multimodal, es decir, que pasamos al mismo o diferente formato entendiendo por formato la forma en que se presenta la información (texto, imagen, audio o vídeo).

image.png

Incluso recientemente se ha demostrado la posibilidad de capturar el sueño de un humano a partir de las ondas generadas convirtiendo este a imágenes.

Este esquema describe sucintamente el proceso que ocurre en la mayoría de aplicaciones de IA basado inicialmente en generar cualquier tipo de formato a partir de texto, texto a vídeo, texto a audio etc... pero también para mejorar imágenes (imagen a imagen) o extraer el texto de un vídeo (audio a texto). 

Veremos más ejemplos en la última sección de este módulo.

Antes de iniciar la sección presentamos un vídeo generado con IA con fotogramas que muestran la evolución de la tecnología: Evolución humantec

Inteligencia Artificial Generativa 

La Inteligencia Artificial Generativa (IA generativa) es una rama de la inteligencia artificial que se enfoca en la creación de modelos capaces de generar contenido nuevo y creativo. Utiliza técnicas avanzadas de aprendizaje profundo, especialmente las Redes Neuronales Generativas (GANs) y las Redes Neuronales Recurrentes (RNN), para producir contenido que a menudo es indistinguible del creado por seres humanos.

Se centra en la creación de datos, contenido y modelos a través de algoritmos autónomos. A diferencia de la IA tradicional, que se enfoca en tareas específicas y predefinidas, la IA generativa tiene como objetivo principal generar nuevos datos y contenido de manera autónoma, similar a cómo funcionan los procesos creativos humanos.

Una de las tecnologías más destacadas en este campo son las Redes Generativas Adversarias (GANs), desarrolladas por Ian Goodfellow en 2014. Las GANs consisten en dos redes neuronales, una generadora y otra discriminadora, que compiten entre sí para crear y evaluar datos. Esta competencia entre las redes permite crear contenido realista, como imágenes, música, texto y más, que es indistinguible de lo que podría haber sido producido por humanos.

Los usos de la IA generativa son diversos y se están expandiendo rápidamente en diferentes industrias. Algunos de los principales usos incluyen:

Generación de contenido creativo: Las GANs pueden utilizarse para crear arte, música, texto y otros tipos de contenido creativo útiles en presentaciones, videojuegos o películas, de manera automática, lo que amplía las posibilidades en la producción artística y creativa.

Mejora de imágenes y video: La IA generativa puede mejorar la calidad de imágenes y videos, eliminar ruido y restaurar contenido dañado.

Diseño de productos: En el ámbito del diseño industrial y la moda, la IA generativa puede ayudar a generar diseños de productos innovadores y únicos.

Investigación científica: La IA generativa se aplica en la generación de moléculas para el desarrollo de medicamentos y en la síntesis de proteínas para la investigación científica.

Juegos y simulaciones: Se utiliza en la creación de mundos virtuales, personajes y entornos en juegos y simulaciones.

Contenido para marketing: En marketing, se emplea para crear contenido publicitario, como imágenes y texto persuasivo.

Creación de voces sintéticas y asistentes virtuales: La IA generativa puede generar, modificar y clonar voces humanas sintéticas naturales y se utiliza en asistentes virtuales como chatbots.

En resumen, la IA generativa está transformando numerosas industrias al proporcionar la capacidad de generar contenido y datos de manera automática y creativa. Su potencial es vasto y sigue expandiéndose a medida que la tecnología avanza y se integra en diversas aplicaciones y sectores.

Funcionamiento

El proceso mediante el cual funciona una IA generativa implica aprender patrones y estructuras a partir de un conjunto de datos existente y utilizar ese conocimiento para generar nuevas muestras que sigan la misma distribución de esos datos. Este proceso se puede resumir en estas cinco fases:
    • Recopilación y preprocesamiento de datos: el primer paso es recopilar un conjunto de datos que represente el tipo de contenido que desea generar. Este conjunto de datos puede consistir en imágenes, texto, audio o cualquier otra forma de datos. Posteriormente, el conjunto de datos se preprocesa para asegurarse de que esté en un formato adecuado y para normalizar o transformar los datos si es necesario.
    • Entrenamiento de modelos: un modelo generativo se entrena usando el conjunto de datos preprocesado. La elección del modelo depende del tipo de datos y la salida deseada. Los modelos generativos más populares incluyen redes adversarias generativas (GAN), codificadores automáticos variacionales (VAEs) y modelos autorregresivos. Durante el entrenamiento, el modelo aprende los patrones subyacentes y estructuras en los datos, capturando las estadísticas y distribución de los ejemplos de entrenamiento.
    • Representación del espacio latente: los modelos generativos aprenden de un espacio latente, el cual es una representación de menor dimensión de los datos, donde les permite capturar los factores de variación más representativos. El espacio latente permite una manipulación más fácil y la generación de nuevas muestras.
    • Proceso de generación: una vez que el modelo está entrenado, puede generar nuevo contenido mediante el muestreo de la distribución aprendida. Por ejemplo, en GANs, la red genera nuevas muestras basadas en vectores de ruido aleatorio o condiciones de entrada específicas.
    • Evaluación y refinamiento: el contenido generado se evalúa en función de varias métricas, como la calidad visual, la coherencia o relevancia para el resultado deseado. El proceso de evaluación se puede utilizar para refinar el modelo o guiar el proceso de generación.

image.png

Esta imagen resume de manera más formal las posibilidades de la IA Geenrativa en cuanto a conversión de diversas entradas codificadas a otras precio paso por el modelo de lenguaje correspondiente

Algunos ejemplos

La IA Genrativa ha demostrado un potencial creciente pasando de ser un mero generador de imágenes más o menos detalladas a ser capaz de generar vídeo o juegos en tiempo real con resoluciones asombrosas.

En esta sección veremos algunos ejemplos ilustrativos:

                           image.png3uhimage.png

Imágenes generadas por IA en 2023, todavía se perviben errores en manos y dientes

imgenai.jpg

Imagen generada por AI en noviembre de 2023

                         

vídeo hecho toatalmente con IA Generativa hace solo unos meses

Principales empresas y aplicaciones

Todas las aplicaciones de IA Generativa tienen que ver con acciones humanas vinculadas a los sentidos, como son la visión, la audición y el lenguaje.

En este apartado daremos una relación de herramientas específicas de IA para la generación de diversos contenidos.

Hay cientos de ellas y cada día surgen nuevas, lo mejor es buscar la que mejor se ajuste a tus neceidades y entorno de trabajo.

La lista que se da a  continuación pretende únicamente hacer al lector consciente del universo de posibilidades que la IA generativa abre en todos los campos.

No obstante cabe señalar que los asistentes de propósito general como chatGPT incorporan cada vez más posibilidades de formatos de datos así que muchas tareas de uso diario de IA se pueden acometer con una de estas herramientas.

Así podemos distinguir varios grupos de aplicaciones, como son:

Generación de contenido multimodal: La IA generativa puede generar contenido en diferentes formatos como vídeo, voz, audio, música, dibujo (portadas, logos, comics...) a parir de texto o de otros formatos, comentar una imagen, transcribir el texto de un audio o generar el código de un juego a partir de un esquema son solo algunos ejemplos.

Mejora de la comprensión multimodal: La IA generativa puede ayudar a mejorar la comprensión de las entradas multimodales. Por ejemplo, en la traducción automática multimodal, puede generar una descripción de una imagen en un idioma diferente o generar subtítulos para un video en tiempo real o limpiar el ruido de un podcast.

Interacción multimodal con usuarios: Las aplicaciones multimodo a menudo implican interacciones con usuarios a través de diferentes modalidades, como texto, voz e imagen permitiendo además la inclusión de textos o documentación propia para ampliar y afinar el conocimiento por parte del chat de nuestro sistema de información.

Creación de experiencias de realidad aumentada y virtual: En el ámbito de la realidad aumentada y virtual, la IA generativa puede ser utilizada para generar objetos y entornos virtuales que respondan de manera dinámica a la interacción del usuario, incluyendo voz, gestos y movimientos.

Hay infinidad de herramientas y aplicaciones que hacen uso de esta potente rama de la IA, indicamos a continuación las más relevantes en el momento actual.

Hemos separado en primer lugar las más genéricas para luego hacer un desglose por aplicaciones más específicas, la lista es larga pero vale la pena revisarla.

IMAGEN


Aplicación  Compañía Descripción Web
DeepDream Google Aplicación de generación de imágenes desarrollada por Google. Utiliza redes neuronales para transformar imágenes de manera creativa. https://deepdreamgenerator.com/
Midjourney Midjourney Generación de imágenes creativas a partir de texto https://www.midjourney.com
Runway ML Runway una plataforma que permite a los diseñadores utilizar IA generativa para crear arte y diseño de productos. https://research.runwayml.com/gen2
Leonardo Leonardo Generación de recursos visuales a partir de texto https://leonardo.ai/
Adobe Firefly Adobe Generación de imágenes

https://www.adobe.com/sensei/generative-ai/firefly.html

DALL-E 3 OpenAI Modelo de IA generativa que puede generar imágenes a partir de descripciones de texto. https://openai.com/research/dall-e
Stable Diffusion - Es el generador de imágenes más potente en la actualidad

https://stablediffusionxl.com/

Krea IA Krea Generación imagen y video

https://www.krea.ai/

TEXTO


chatGPT OpenAI Modelo de lenguaje generativo que permite conversaciones naturales con IA así como cualquier otra actividad como la generación de código o imágenes a partir de texto.

https://chat.openai.com/

https://platform.openai.com/chatgpt

Anthropic Anthropic Creador de productos de IA como chat conversacionales (claude y poe)

https://www.anthropic.com/

SONIDO      
AIVA AIVA Plataforma que utiliza IA generativa para componer música original. https://www.aiva.ai
Whisper OpenAI Reconocedor de voz

https://openai.com/research/whisper

ElevenLabs ElevenLabs Convertidor de texto a voz y clonación de voz https://elevenlabs.io/
Murf Murf Texto a voz, clonación de voz, superposición de voz en vídeo

https://murf.ai/

MULTIMODO      
Gemini Google Versión conversacional de chatGPT de google

https://gemini.google.com/app

Copilot Microsoft IA de microsoft para texto e imagen

https://copilot.microsoft.com/

Por supuesto la mayoría de compañías tecnológicas como Amazon o Microsoft ya usan sistemasde intelgicencia artificial así como modelos conversacionales y otras herramientas.

En resumen, la IA generativa desempeña un papel esencial en el desarrollo y mejora de aplicaciones multimodo al permitir la generación y manipulación de contenido en diversas modalidades. Esto contribuye a la creación de experiencias más ricas y personalizadas para los usuarios en aplicaciones que involucran texto, imágenes, voz y otras formas de comunicación.

Pero va mucho más allá de la simple generación de texto a imagen, en los últimos meses están surgiendo aplicaciones para genrar toda clase de contenidos, en el siguientes listado destacamos algunas de ellas:

Texto y Código

La generación de código es una de las aplicaciones con más éxito y potencial dada la gran cantidad de información al respecto. Esto permite a casi cualquiera poder crear toda clase de aplicaciones sin conocimientos profundos de codificación..

En esta tabla indicamos algunas de las herramientas más populares en las diversas tareas relacionadas con la programación.

Aplicación de IA Descripción Uso Típico Ejemplos de Empresas/Aplicaciones
Generación de Código Automatizado Usa modelos de lenguaje avanzados para convertir especificaciones de texto en código fuente. Desarrolladores agilizan la escritura de código. OpenAI Codex, GitHub Copilot
Asistentes de Programación Proporcionan sugerencias de código y correcciones en tiempo real. Mejora eficiencia y reduce errores en el desarrollo. Kite, Tabnine, IntelliCode de Microsoft
Traducción de Lenguaje Natural a SQL Convierte consultas en lenguaje natural a consultas SQL. Útil para analistas de datos y usuarios no técnicos. ChatGPT con habilidades SQL, Alteryx, EasyQuery
Automatización de Pruebas de Software Genera scripts de pruebas automatizadas a partir de descripciones en lenguaje natural. Creación rápida de pruebas funcionales y de regresión. Selenium, Testim.io, Katalon Studio
Documentación de Código Produce documentación técnica y comentarios en el código. Mantiene documentación adecuada y actualizada. Doxygen, Javadoc, Swagger
Conversión de Código entre Lenguajes Traduce código de un lenguaje de programación a otro. Portar software entre diferentes plataformas. Tangible Software Solutions, JetBrains ReSharper
Generación de Interfaces de Usuario Diseña interfaces de usuario a partir de descripciones textuales. Creación rápida de prototipos y UIs. Adobe XD, Figma, Sketch
Síntesis de Requisitos de Software Transforma requisitos del negocio en especificaciones técnicas. Definición clara de los requisitos técnicos. IBM Rational Doors, Jama Software, Axure RP
Conversión de Imagen a Código Transforma diseños gráficos e imágenes en código fuente. Automatización en la creación de interfaces de usuario y web. Zeplin, Avocode, Sketch2Code de Microsoft, Pix2Code, img2code, picoapps

 Texto a Video 3D 

Con el avance y abaratiemtno de las GPUs (Unidades de Proceso en tarjetas gráficas) el uso y gestión de imágenes y vídeo en IA se ha visto enormemente simplificado. Hoy es relativamente fácil crear vídeos o películas usando sin moverese de casa con aplicaciones y ténicas de IA.

Aplicación de IA Descripción Uso Típico Ejemplos de Empresas/Aplicaciones
Generación de Entornos Virtuales 3D Crea entornos 3D realistas a partir de descripciones de texto. Usado en simulaciones, juegos y realidad virtual. Unity, Unreal Engine, Autodesk Maya
Análisis de Vídeo 3D en Tiempo Real Analiza y procesa vídeos 3D para obtener insights en tiempo real. Seguridad, deportes, y análisis de comportamiento. IBM Watson Visual Recognition, Google Cloud Video Intelligence
Síntesis de Voz y Lenguaje para Avatares 3D Genera voz y diálogos realistas para personajes 3D. Utilizado en juegos, entrenamiento virtual y asistentes virtuales. Adobe Character Animator, Voicemod, CereProc
Realidad Aumentada Interactiva Superpone texto y gráficos en vídeos 3D en tiempo real. Aplicaciones educativas, comerciales y de entretenimiento. ARKit de Apple, ARCore de Google, Microsoft HoloLens
Traducción en Tiempo Real con Subtítulos 3D Traduce y muestra subtítulos en 3D sobre vídeos en tiempo real. Usado en streaming en vivo, conferencias y eventos internacionales. Amara, Dotsub, Subtitle Edit
Animación Facial y de Gestos en 3D Anima avatares 3D basado en texto o voz. Creación de personajes virtuales y animaciones. FaceRig, Adobe Fuse, Character Creator
Análisis de Sentimientos en Vídeos 3D Detecta y analiza emociones y reacciones en vídeos 3D. Investigación de mercado, experiencia del usuario. Affectiva, Emotient, Beyond Verbal
Sistemas Interactivos de Tutoría Virtual Crea tutores virtuales 3D que responden a texto y voz en tiempo real. Educación en línea, entrenamiento corporativo. CodeBaby, SitePal, TTS Sketch Maker

Texto y juegos/videos en tiempo real

El sector artístico en general y de ocio se ha visto profundamente afectado por estas tenoclogías, en todos sus ámbitos.

Esta tabla presenta aplicaciones relacionadas con juegos, videos y arte en general, incluyendo la posibilidad de generación en tiempo real.

Aplicación de IA Descripción Uso Típico Ejemplos de Empresas/Aplicaciones
Generación de Contenido de Juegos Crea activos de juegos, como personajes, entornos y niveles, utilizando IA. Desarrollo de juegos más rápido y eficiente. Unity ML-Agents, Unreal Engine
Optimización de Juegos en Tiempo Real Ajusta la dificultad y la experiencia del juego según el comportamiento del jugador. Mejora la experiencia y retención del jugador. Modl.ai, Spirit AI
Procesamiento de Vídeo en Tiempo Real Mejora la calidad de vídeo, realiza seguimiento de objetos y personas en tiempo real. Seguridad, transmisiones en vivo y análisis deportivo. Nvidia Video SDK, OpenCV
Renderizado Realista en Juegos Produce gráficos de alta calidad en tiempo real para juegos. Juegos con gráficos más realistas y envolventes. Ray Tracing en Nvidia, AMD Radeon Rays
Análisis de Sentimientos y Reacciones de Jugadores Evalúa las emociones y reacciones de los jugadores en tiempo real. Mejora de juegos basada en feedback emocional. Affectiva, Emotient
Control de Juegos por Voz y Gestos Permite a los jugadores interactuar con el juego usando voz y gestos. Juegos más inmersivos y accesibles. Microsoft Kinect, Leap Motion
Edición y Mejora Automática de Vídeos de Juegos Edita y mejora clips de juegos automáticamente para compartir. Creación fácil de contenido de juegos para redes sociales. Adobe Premiere Pro (Auto Reframe), Elgato
Simulación y Modelado de Física en Juegos Simula físicas realistas en entornos de juegos. Juegos con interacciones y movimientos más realistas. Havok, PhysX

Texto y dibujos/comic/ilustraciones

Coo subcsector de la imagen incluimos el de los comics y dibujos artísticos en general.

Aplicación de IA Descripción Uso Típico Ejemplos de Empresas/Aplicaciones
Generación Automática de Ilustraciones Crea imágenes y gráficos basados en descripciones de texto. Creación de arte visual y paneles de cómic. OpenAI's DALL-E, Google's DeepDream
Diseño Automático de Páginas de Cómic Organiza el diseño y el flujo de una página de cómic basado en texto. Maquetación y diseño de páginas de cómics. Clip Studio Paint, Adobe Illustrator
Creación de Guiones Gráficos Convierte guiones escritos en secuencias visuales de cómics. Previsualización y planificación de historias. Storyboard That, Toon Boom Storyboard Pro
Animación de Personajes de Cómic Genera animaciones de personajes a partir de descripciones textuales. Creación de cómics animados y contenido interactivo. Adobe Character Animator, Moho (Anime Studio)
Síntesis de Voz para Personajes de Cómic Crea diálogos hablados para personajes de cómics basados en texto. Cómics interactivos y audiocómics. Balabolka, Amazon Polly
Traducción Automática de Cómics Traduce textos de cómics a diferentes idiomas manteniendo el formato. Localización y distribución internacional de cómics. DeepL, Google Translate con soporte de OCR
Generación de Efectos de Sonido y Texto Crea efectos de sonido y textos decorativos para cómics. Enriquecimiento visual y sonoro de paneles de cómic. Canva, Adobe Photoshop
Personalización de Estilos de Dibujo Imita estilos de dibujo específicos en base a descripciones de texto. Creación de cómics con estilos artísticos personalizados. DeepArt, Prisma

Texto a podcast, mejora de imágenes, amplicación de contenido

Otra aplación de gran valor, la posibilidad de corregir y ampliar contenidos basado en contenidos previos, ya sea de sonido, imagen o vídeo, del mismo modo que ocurre con el texto.

Aplicación de IA Descripción Uso Típico Ejemplos de Empresas/Aplicaciones
Mejora y Edición de Texto Revisa y mejora la calidad del texto, incluyendo gramática y estilo. Escritura, edición de contenido, y corrección de pruebas. Grammarly, Hemingway Editor
Generación de Guiones para Podcasts Crea guiones para podcasts basados en temas o palabras clave. Producción de podcasts y contenido de audio. Jarvis AI, Writesonic
Corrección de Imágenes Mejora la calidad de las imágenes, restaura fotos dañadas. Restauración de fotos, mejoramiento de imágenes para medios. Adobe Photoshop con IA, Remini
Ampliación de Imágenes Aumenta la resolución de las imágenes sin perder calidad. Fotografía, diseño gráfico, y producción de medios. Let's Enhance, Bigjpg
Mejora de Calidad de Sonido Mejora la claridad y calidad del audio en grabaciones. Podcasts, música, y producción de audio. Izotope RX, Adobe Audition
Síntesis de Voz para Podcasts Crea narraciones de voz realistas para uso en podcasts. Podcasts automatizados, lecturas de texto. Descript, Amazon Polly
Corrección Automática de Sonido Elimina ruidos de fondo y mejora la calidad del sonido. Podcasts, conferencias, y grabaciones en general. Krisp, Dolby On
Análisis de Contenido de Podcasts Analiza y categoriza el contenido de los podcasts. Marketing, investigación de medios, y mejora de contenido. Spotify Podcast Analytics, Podtrac

Aplicaciones de oficina

Las posibilidades de la IA en oficina son también inmensas permitiendo automatizar y simplificar todos los procesos enormemente

Dejamos la tabla ilustrativa de algunas de las aplicaciones más importantes

Aplicación de IA Descripción Uso Típico Ejemplos de Herramientas
Automatización de Tareas en Office Automatiza tareas repetitivas como entrada de datos y gestión de correos electrónicos. Mejora de eficiencia en tareas administrativas. Microsoft Power Automate, UiPath
Análisis de Datos en Excel Utiliza IA para análisis predictivos y de tendencias en hojas de cálculo. Análisis de datos, proyecciones financieras y reportes. Excel con Power BI, Tableau
Asistentes Virtuales para Organización Ayuda en la gestión de calendarios, correos electrónicos y recordatorios. Organización personal y gestión del tiempo. Cortana de Microsoft, Google Assistant
Reconocimiento de Voz para Transcripción Convierte voz a texto para transcribir reuniones o notas. Creación de documentos y notas de reuniones. Dragon NaturallySpeaking, Otter.ai
Análisis de Sentimientos en Comunicaciones Analiza el tono y los sentimientos en correos electrónicos y chats. Mejora de la comunicación interna y atención al cliente. IBM Watson Tone Analyzer, Google Cloud Natural Language
Optimización de Presentaciones Sugerencias para mejorar diseño y contenido de presentaciones. Creación de presentaciones más impactantes y profesionales. PowerPoint Designer, Beautiful.ai
Gestión de Proyectos con IA Asigna recursos y predice plazos en proyectos. Gestión eficiente de proyectos y equipos. Asana, Trello con extensiones de IA
Seguridad de Datos y Cumplimiento Monitorea y protege datos contra accesos no autorizados. Seguridad de la información y cumplimiento normativo. NortonLifeLock, McAfee
Análisis de Datos con ChatGPT ChatGPT integrado con capacidades de análisis de datos para respuestas enriquecidas. Análisis de datos y generación de insights en conversaciones. OpenAI ChatGPT con habilidades de análisis de datos
Herramienta de Análisis y Visualización de Datos Herramienta basada en IA para crear dashboards y análisis de datos. Creación de informes interactivos y visualización de datos. Rows

No podíamos olvidar el sector de la realidad aumentada y realidad virtual. 

Categoría Herramienta/Tecnología Descripción
Realidad Aumentada (AR)    
  ARKit (Apple) Framework para experiencias AR en iOS, utiliza cámaras y sensores del dispositivo.
  ARCore (Google) Plataforma de Google para AR, funciona en dispositivos Android y iOS.
  Vuforia Plataforma AR conocida por su robusta capacidad de seguimiento.
  Unity con AR Foundation Framework de Unity para desarrollo AR, compatible con ARKit y ARCore.
  Microsoft Mixed Reality Toolkit Conjunto de herramientas para acelerar el desarrollo de aplicaciones de realidad mixta en Unity.
Realidad Virtual (VR)    
  Unity Plataforma líder en desarrollo de juegos y VR, soporta una amplia gama de visores VR.
  Unreal Engine Motor gráfico con soporte extenso para desarrollo VR, conocido por su alta fidelidad gráfica.
  SteamVR Plataforma de desarrollo completa para contenido VR, compatible con varios visores VR.
  Google VR para Unity SDK para construir experiencias VR en Android y iOS, soporta Cardboard y Daydream.
  A-Frame (WebVR) Framework web de código abierto para crear experiencias VR, permite ejecutar aplicaciones VR en navegadores web.
AI para AR/VR    
  TensorFlow Biblioteca de aprendizaje automático para añadir funcionalidades de AI a aplicaciones AR/VR.
  IBM Watson Ofrece servicios de AI como reconocimiento de lenguaje y visual, integrables en apps AR/VR.
  OpenAI APIs Proporciona capacidades de AI que pueden integrarse en AR/VR para interacciones avanzadas.
  Microsoft Azure AI Suite de servicios de AI incluyendo procesamiento de lenguaje y toma de decisiones, útil en AR/VR.
  Google AI Services Incluye APIs como Cloud Vision y Video Intelligence, integrables en AR/VR para interactividad mejorada.

El futuro de la IA Generativa

La evolución de la Inteligencia Artificial Generativa (IA Generativa) en los próximos años promete ser emocionante y transformadora. A medida que la investigación y la tecnología avanzan, es probable que veamos las siguientes tendencias y desarrollos en este campo:

Mayor realismo y calidad Las técnicas generativas seguirán mejorando en términos de la calidad y realismo de los datos y el contenido que generan. Esto incluye imágenes, videos, texto y audio que serán más difíciles de distinguir de las creaciones humanas.

Generación multimodal avanzada La IA generativa se volverá aún más hábil en la generación de contenido que combine múltiples modalidades, como la creación de historias visuales y auditivas a partir de texto, o la generación de contenido multimodal en tiempo real.

Entendimiento contextual La IA generativa mejorará su capacidad para comprender y generar contenido en función del contexto. Esto permitirá una interacción más natural y relevante con los usuarios, ya que la IA podrá adaptarse mejor a las necesidades y preferencias individuales.

Aplicaciones en la industria Veremos un aumento significativo en la adopción de IA generativa en industrias como la medicina, la arquitectura, el diseño de productos y la investigación científica, donde se utilizará para la generación de modelos, diseños y simulaciones complejas.

Creatividad asistida por IA Las herramientas de creatividad asistida por IA se volverán más accesibles y comunes. Los artistas, escritores y músicos podrán utilizar la IA para potenciar su creatividad y producir obras innovadoras.

Ética y regulación A medida que la IA generativa se vuelva más poderosa, surgirán preocupaciones éticas, como el uso indebido de la tecnología para la creación de contenido engañoso o perjudicial. Esto llevará a una mayor atención a la regulación y la ética en el desarrollo y uso de la IA generativa.

Interacción humano-IA más fluida La IA generativa se integrará más en la vida cotidiana de las personas, mejorando la interacción con dispositivos, asistentes virtuales y aplicaciones, lo que permitirá una experiencia más fluida y personalizada.

Aplicaciones en educación La IA generativa se utilizará cada vez más en la educación, ayudando a crear contenido educativo personalizado y generando ejercicios y evaluaciones adaptadas a las necesidades de los estudiantes, veremos más sobre esto en la siguiente unidad.

Investigación científica avanzada La IA generativa jugará un papel importante en la investigación científica, especialmente en la simulación y modelado de fenómenos complejos, como el clima, la biología y la física cuántica.

En resumen, la IA generativa seguirá evolucionando y expandiéndose en diversas industrias y aplicaciones. Se espera que la tecnología sea cada vez más sofisticada y que tenga un impacto significativo en la forma en que interactuamos con la información y el contenido en el futuro. Sin embargo, también surgirán desafíos éticos y regulatorios que deberán abordarse a medida que esta tecnología avance.

Presentamos finalmente un vídeo generado con IA en noviembre de 2023 y que representa lo más avanzado que hay en esta tecnología

                                 

Unidad 3.4. Aplicaciones educativas

Introducción

La Inteligencia Artificial en el ámbito educativo se está convirtiendo en una realidad que está transformando la manera en que enseñamos y aprendemos. A medida que la tecnología avanza, la educación ha comenzado a beneficiarse de las múltiples aplicaciones de la IA, desde sistemas de tutoría personalizada y plataformas de aprendizaje adaptativo hasta herramientas de análisis predictivo que ayudan a los educadores a identificar a estudiantes en riesgo.

La irrupción de herramientas de IA como ChatGPT y otros chatbots ha añadido una dimensión innovadora al panorama educativo. Estos sistemas, diseñados para simular conversaciones humanas, están redefiniendo las formas en que los  agentes educativos  interactúan con el contenido de las distintas materias, proporcionando nuevas oportunidades para profesores, alumnos e instituciones educativas. Al aprovechar la capacidad de estos chatbots para ofrecer respuestas instantáneas y personalizadas, se fomenta un aprendizaje más autónomo y adaptativo. Profesores pueden utilizar estas herramientas para complementar sus métodos de enseñanza tradicionales, brindando a los alumnos recursos adicionales y personalizados. Los alumnos, por su parte, tienen la oportunidad de explorar y profundizar en temas a su propio ritmo, fortaleciendo su comprensión y curiosidad. Las instituciones educativas, al adoptar estas tecnologías, no solo modernizan su enfoque pedagógico, sino que también se posicionan a la vanguardia de la revolución digital en educación, preparándose para los desafíos y oportunidades del futuro.

Descubriremos multitud de herramientas de IA generativa que expandirán nuestras posibilidades como docentes al mismo tiempo que nos permiten ahorrar tiempo de tareas administrativas de carácter recurrente y emplearlo en actividades que aporten valor al proceso de enseñanza-aprendizaje y una mayor atención al aspecto humano en la interacción pedagógica.

Hacemos primero un repaso de las posibilidades genéricas que la IA posibilita a nivel educativo para después exponer ejemplos de aplicaciones concretas que ofrecen distintas funcionalidades.

image.pngImagen propia. Creada por el generador de imágenes de Bing.


Casos de uso en Educación

La irrupción de los chatbots, así como otras herramientas de IA generativa ofrecen multitud de posibilidades, las citamos a nivel genérico. La IA puede:

Estas son algunas de las aplicaciones educativas que la IA puede facilitar. La mayoría de ellas, son realizables a través de los chatbots como ChatGPT, si bien, esto exige cierto conocimiento y experiencia lo que requiere tiempo para su adquisición. La alternativa práctica la ofrecen herramientas específicas (la mayoría basadas en los propios chatbots u otras herramientas de IA generativa) que facilitan el acceso a algunas o varias de las funciones citadas, mediante interfaces atractivas, indicaciones predefinidas  (prompts) y sugerencias de aplicación. En el mercado ya existen numerosas opciones en forma de aplicaciones web, programas instalables, plugins o extensiones de navegador. Vemos algunas de ellas en el siguiente apartado.


Aplicaciones educativas concretas

Actualmente existen varias aplicaciones de IA enfocadas al ámbito educativo. Podríamos agruparlas en función del rango de funcionalidades que abarcan, desde las que están centradas en una o mas de una función específica, como por ejemplo generar cuestionarios, lecciones, presentaciones, etc... Llamaremos a estas herramientas específicas, hasta aquellas que pretenden gestionar y monitorizar el progreso educativo de los alumnos, plataformas educativas. 

Herramientas específicas

Dentro de esta agrupación encontraremos herramientas generativas de distintos modos generativos (texto, audio, imagen, video, código) así cómo las multimodales, que están comenzando a surgir, capaces de incluir en sus funcionalidades mas de un modo.

 Citamos algunas de ellas y ejemplificamos su utilización en el ámbito educativo:


Generación de texto

Las herramientas de generación de texto se refieren a software diseñado específicamente para la creación automática de contenido textual. Estas aplicaciones hacen uso de técnicas basadas en algoritmos y modelos de procesamiento de lenguaje natural para elaborar texto que sea coherente y pertinente desde el punto de vista contextual.

En el ámbito educativo, estas herramientas tienen el potencial de ser utilizadas para generar materiales de estudio, resumir contenidos, responder preguntas y diseñar actividades que se ajusten a los niveles y requerimientos específicos de cada estudiante. Adicionalmente, pueden ofrecer soporte a los estudiantes en la redacción de ensayos, informes y otros trabajos académicos, proporcionando recomendaciones relacionadas con aspectos gramaticales, de estilo y en multitud de idiomas. Sin embargo, es crucial fomentar el uso crítico de estas herramientas, instando a los estudiantes a analizar cuidadosamente el contenido producido, dado que no toda la información generada es necesariamente confiable. Asimismo, es imperativo promover la adaptación personalizada del contenido para garantizar que este refleje adecuadamente los conocimientos y habilidades individuales de cada estudiante.

image.png

Imagen propia. Creada por el Generador de imágenes de Bing

Son numerosas las herramientas de generación de texto, te mostramos mas las relevantes. Puedes hacer clic en cada una para acceder: 

  • Bard de Google - Chatbot conversacional general. 
  • ChatGPT - Chatbot conversacional general. 
  • Bing Chat - Chatbot conversacional general 
  • Claude - Chatbot conversacional general 
  • Canva - Escritura mágica puedes producir resúmenes a partir de tus textos, además de generar nuevos contenidos mediante prompts.  
  • Chat Sonic - Chat conversacional, te proporciona links de referencia. 
  • ChatPDF - Chat de texto que te permite interactuar con el contenido de un documento pdf. 
  • Conker - Herramienta de generación de texto que te permite crear cuestionarios con IA. 
  • Consensus - Chat de texto que te permite interactuar y encontrar información en trabajos de investigación. 
  • Elicit - Chat de texto que te permite interactuar y encontrar información en trabajos de investigación. 
  • Humata - Chat de texto que te permite interactuar con el contenido de un documento pdf. 
  • Piggy - Genera historias, resúmenes y preguntas y respuestas con imágenes. 
  • Wisdolia - Genera flashcards de un vídeo, artículo o pdf y te ofrece un feedback.

Dentro de las herramientas de generación de texto, hay algunas cuyo enfoque es específicamente educativo, por ejemplo:


Generación de imagen

Las herramientas generativas de imágenes mediante IA están diseñadas para crear imágenes de forma autónoma en función de nuestras solicitudes. Estas herramientas implementan algoritmos y redes neuronales artificiales, incluyendo redes generativas adversarias (GAN) o modelos de lenguaje, para crear imágenes digitales capaces de representar elementos como objetos, entornos, rostros humanos y demás componentes visuales.

Piensa en la posibilidad de usar una herramienta que te facilite generar imágenes en base a instrucciones específicas (prompt). Estás imágenes pueden ser utilizadas entre otras cosas para enriquecer presentaciones, ilustrar comics o visualizar conceptos abstractos. De igual manera, los estudiantes podrían emplear estas herramientas para elaborar infografías, esquemas conceptuales y representaciones visuales de procesos complejos, favoreciendo así la comprensión y el intercambio de ideas.

Existen multitud de alternativas disponibles para la creación de imágenes:


Generación de audio

Las herramientas generadoras de audio basadas en inteligencia artificial están diseñadas para generar o modificar contenido de audio de forma autónoma. Mediante algoritmos avanzados y modelos de aprendizaje profundo son capaces de producir un abanico de sonidos, melodías, voces y efectos sonoros, así como de eliminar sonidos no deseados. Estas acciones son realizadas en base a las instrucciones introducidas mediante texto, pero también desde muestras de audio previas o incluso imágenes o parámetros específicos.

En el ámbito educativo, estas herramientas presentan numerosas posibilidades. Por ejemplo, pueden utilizarse para crear ejemplos de diferentes géneros musicales, enriqueciendo así la experiencia educativa de los estudiantes en música. Además, pueden funcionar como banda sonora para proyectos multimedia, aportando una capa auditiva a presentaciones y trabajos escolares. También son eficaces para facilitar la comprensión de conceptos musicales abstractos, ofreciendo ejemplos sonoros tangibles. Además, las herramientas de generación de audio pueden emplearse para desarrollar materiales didácticos interactivos, como narraciones para lecciones online o contenido sonoro personalizado que se adapte a las necesidades específicas de los estudiantes.

Ejemplo didáctico

Para mostrarte cómo puedes aplicar estas herramientas en la educación, te proponemos un ejemplo práctico que ilustra cómo la IA puede ser una valiosa aliada en tu labor docente. Aquí te presentamos una solución posible destinada a mejorar las habilidades lingüísticas y fomentar la creatividad en estudiantes de Educación Secundaria. Aunque las situaciones pueden ser muy variadas, este ejemplo puede inspirarte y brindarte ideas o sugerencias que posteriormente podrás adaptar a tu contexto educativo particular.

En nuestro centro educativo vamos a diseñar una experiencia educativa centrada en el desarrollo de habilidades lingüísticas y creatividad para los estudiantes de secundaria. Queremos proporcionarles una manera interesante y variada de explorar la poesía y la narración de historias. Para lograrlo, incorporamos elementos de generación de audio.

Vamos a utilizar la herramienta de generación de audio Murf.ai, para dar vida a la poesía y narrativa. Vamos a transformar un poema popular en un archivo de audio narrado por una IA. Esto permitirá a mis estudiantes reflexionar sobre la importancia de la entonación, ritmo y la expresión emocional en la lectura del poema. Y podrán experimentar sobre algunas de las posibilidades que ofrece la IA.


Los pasos a seguir serán:

  1. Selección del texto. Elegir el poema, en este caso " La canción del pirata" debido a relación con el contenido estudiado.
  2. Preparación del texto. Copiar y pegar el texto del poema en la herramienta Murf.ai.
  3. Configuración de voz y estilo. Seleccionar una voz adecuada para el tono del poema y ajusto los parámetros para lograr una entonación expresiva que refleje las emociones contenidas en el poema.
  4. Generación de audio. Hacer clic en el botón de generación para convertir el poema en un archivo de audio. 
  5. Uso en el aula. Escuchar el audio generado en el aula.

6.       Discusión y creación. Después de escuchar, proponer un debaten sobre las impresiones y emociones que evoca el poema en formato de audio.

7.       Se les asigna la tarea de crear sus propias composiciones poéticas o narraciones de historias cortas, que posteriormente transformarán en archivos de audio utilizando la misma herramienta. Esto fomenta su creatividad y comprensión profunda de la relación entre el contenido y la expresión auditiva.

En el siguiente enlace puedes acceder al poema en Murf, reproducirlo y editarlo, modificando en cada estrofa, la velocidad de la narración, el énfasis y otras variables

https://murf.ai/studio/project/2/P0169835294176343L?workspaceId=WORKSPACEID0169835293996182M

Dentro del amplio abanico de herramientas, hemos optado por destacar Murf.ai para demostrar una de las diversas maneras en las que se puede aplicar en el entorno educativo. También tienes a tu disposición las siguientes aplicaciones diseñadas específicamente para la creación de audio y música:


Generación de video

Las herramientas de generación de video permiten la creación y edición de contenido audiovisual de manera automatizada a través de IA. Estas aplicaciones son capaces de transformar imágenes estáticas en videos, convertir texto en animaciones, mejorar la resolución de los videos y producir contenido personalizado. Es crucial ser consciente de que la calidad y las funcionalidades de estas herramientas pueden variar significativamente, y es necesario abordar las cuestiones éticas y respetar los derechos de autor al hacer uso de ellas.

En el contexto educativo, estas herramientas ofrecen valiosas oportunidades para la elaboración de materiales audiovisuales que ayuden a explicar conceptos complejos. Los educadores pueden hacer uso de estas aplicaciones para crear animaciones educativas, visualizaciones de experimentos científicos o análisis interactivos de textos literarios, facilitando así un aprendizaje más atractivo y accesible para los estudiantes.

Ejemplo didáctico (multimodo)

Con el objetivo de ilustrar cómo se pueden integrar estas herramientas en la enseñanza, exponemos el siguiente ejemplo práctico realizado integrando algunas de las herramientas aquí descritas. Permitirá explorar las maneras en que la IA puede ser útil en tu labor docente. 

Vamos a generar un avatar animado, mediante el uso de 4 herramientas de IA generativa

 

La imagen para posteriormente generar el avatar puede ser propia o de cualquier otra persona o personaje. En nuestro caso hemos pedido a Leonardo.AI que nos generara un a imagen del físico Richard Feynman.

 

Para el texto que R. Feynman va a decir le hemos pedido a ChatGPT que actuara como si fuera R. Feynman (tanto en estilo como en contenido) y explicara su opinión sobre la IA.

 

Para el audio, la voz, hemos escogido la aplicación ElevenLabs, ya que es capaz de sintetizar cualquier voz de la que dispongamos fichero de audio, ya sea la del propio personaje, nuestra propia voz (como es el caso), o una voz propuesta por la propia herramienta. En ELvenLAbs, cargas el texto generado por ChatGPT y le pides que genere un audio, leyendo ese texto con la voz que hayas sintetizado. Una vez generado el fichero, lo descargas.

 

Por último, el video (Avatar animado) lo hemos generado con D-ID, al que alimentaremos por un lado con la imagen creada con Leonardo.AI y el fichero de audio generado con Eleven Labs. Le pedimos que genere la animación y este es el resultado, haz clic en la imagen para ver la animación: image.png

 

Hemos elegido D-ID para el video mostrando una posible aplicación de aula, pero como en el resto de modos de generación podemos encontrar varias herramientas para generar vídeo, por ejemplo:


Generación de código

Las herramientas de generación de código son herramientas basadas en inteligencia artificial que están empezando a adquirir protagonismo en el desarrollo y optimización de código de programación. Son capaces de crear algoritmos, segmentos de código y solucionar problemas de programación de manera automática o con asistencia, proporcionando una herramienta práctica tanto para profesionales como para docentes como para estudiantes en el proceso de aprendizaje y práctica de programación.

En el entorno educativo, estas herramientas de generación de código pueden suponer un cambio significativo. Los estudiantes pueden emplear estas herramientas de IA generativa para explorar y entender conceptos de programación de forma más eficaz, obteniendo ejemplos prácticos y funcionales de código para resolver problemas específicos. Los profesores, por otro lado, pueden utilizar estas herramientas para crear ejercicios y proyectos de programación más retadores y diversos, ofreciendo a los estudiantes una experiencia de aprendizaje más completa. Además, estas herramientas pueden facilitar el desarrollo de software dentro del sector educativo, permitiendo a las instituciones crear aplicaciones a medida para fines docentes y gestión de datos académicos.

Estas son algunas de las herramientas de generación de código:


Por último, aunque no pueda incluirse en ninguna de las agrupaciones anteriores por su carácter meramente científico, destacar Wolfram Research,  conocida principalmente por desarrollar productos de software matemático, que también incluye desarrollos de IA. Dentro de esta plataforma distinguimos.

image.png


Plataformas educativas

Las plataformas educativas tienen vocación de abarcar mayor espacio en el proceso educativo, gestionando y monitorizando el progreso de los alumnos implicando en el mismo diferentes herramientas entre las que pueden estar algunas de las herramientas específicas vistas y otras que recopilen la información personalizada surgida del propio proceso con el fin de analizar la evolución de cada estudiante y proporcionarle los recursos específicos adaptados a su necesidad en cada momento.

Algunas de estas plataformas ya han sido adaptadas por sistemas educativos a nivel institucional, como  Eduten   

Eduten es una plataforma de aprendizaje digital finlandesa que ofrece ejercicios y juegos personalizados para estudiantes de primaria y secundaria. La plataforma está disponible en inglés y español. Los servicios de la plataforma son contratables para cualquier institución educativa interesada.

Su funcionamiento se basa en un algoritmo de aprendizaje automático para personalizar el contenido y la dificultad de los ejercicios a las necesidades de cada estudiante. Esto ayuda a los estudiantes a aprender a su propio ritmo y a dominar los conceptos de forma efectiva.

La plataforma ofrece una amplia gama de ejercicios y juegos, incluyendo:

Pero sobre todo ofrece análisis de aprendizaje para que los profesores puedan monitorear el progreso de sus alumnos. Estos análisis incluyen información sobre el tiempo que los estudiantes pasan en la plataforma, las tareas que completan y su rendimiento en las tareas.

Aquí hay algunos de los beneficios de utilizar Eduten:

Otras, son  plataformas web como Khanmigo.  Khanmigo es un chatbot de aprendizaje personalizado desarrollado por Khan Academy. Khanmigo utiliza el modelo de lenguaje GPT-4 de OpenAI para proporcionar a los estudiantes un aprendizaje individualizado y relevante. Puede personalizar el aprendizaje de los estudiantes de varias maneras; 

En el siguiente video Sal Khan, fundador de la plataforma explica las características de la misma:

No podía faltar la incorporación de la IA a la plataforma educativa de Google Classroom, El gigante tecnológico ha incluido entre las  funcionalidades de su las Practicas Guiadas (Practice Sets) en su herramienta educativa. Esta novedad en Google Classroom aporta la anhelada posibilidad de personalizar el aprendizaje de cada estudiante mediante la tecnología de aprendizaje adaptativo

Este es un hito anhelado y ya accesible para que cada profesor pueda apoyar a sus estudiantes mediante tareas interactivas y comentarios en tiempo real e individualizados. Este método se basa en la medición, recopilación y análisis de datos (Learning Analytics) sobre el alumnado, su entorno y sus interacciones con el objetivo de adaptarse a sus necesidades

Esta función está disponible en Google Classroom para cualquier educador que utilice la ‘Teaching and Learning upgrade’, o cualquier institución que emplee Google Workspace for Education Plus. Una vez creadas las prácticas, es posible que todos los profesores del centro las compartan.

En el siguiente video tienes mas información al respecto:

Referencias Módulo 3

Web: Herramienta para la gestión de contenidos en el aula

https://www.magicschool.ai/


Web: Guía de ingeniería del prompting

 

https://www.promptingguide.ai/es

https://profesoreco.blogspot.com/2023/04/instrucciones-precisas-y-potentes.html


Vídeo repaso conceptos y aplicaciones IA Generativa

https://youtube.com/watch?v=QC3J3DAMUvg&list=PLaFUiA52BD9H-EZJfgR9qEBVNdiXJuucC&index=2&t=7329s


Vídeo IA Genrativa. Se explica de forma muy sencilla el concepto y aplicaciones de la IA Generativa

https://www.youtube.com/watch?v=_6R7Ym6Vy_I


Documento pdf: Informe UNESCO AI y Educación, guía para gestores

https://unesdoc.unesco.org/ark:/48223/pf0000379376/PDF/379376spa.pdf.multi


Web Asistente de Khan Academy: Khanmigo

https://www.khanacademy.org/khan-labs


Curso INTEF: IAEducacion Una IA para aprender

https://enlinea.intef.es/courses/course-v1:INTEFMOOC+IAEducacion+2023_T1/about


Web AI Tool Master List Conjunto de herramientas de IA clasificadas por su ámbito de aplicación

https://doc.clickup.com/25598832/d/h/rd6vg-14247/0b79ca1dc0f7429/rd6vg-12207


Web Futurepedia

Directorio de herramientas de IA 

https://www.futurepedia.io