Skip to main content

Unidad 3.3. Más allá del texto. IA Generativa


"La inteligencia artificial generativa es como una máquinamáquina que puede soñarsoñar y crear mundos nuevos."

- Ian Goodfellow, uno de los científicoscientíficos de la computacióncomputación másmás influyentes en el campo de la inteligencia artificial generativa y creador de la técnicatécnica conocida como Generative Adversarial Networks (GANs).

image.png

ConversaciónConversación real con chatGPT3 en abril de 2023

humano: "Dime una mentira"

chatGPT: "El cielo estáestá hecho de queso verde"

h: "Es muy mala, obviamente es falso, dime una másmás sutil"

c: "Soy humano"

IntroducciónIntroducción

Inicialmente las aplicaciones de aprendizaje automáticoautomático se centraban en su posibilidad de clasificar y predecir categoríascategorías o valores.

En el caso de valores categóricoscategóricos (frío,frío, caliente o rojo, azul) hablamos de predicciónpredicción por clasificación,clasificación, en el caso de valores numéricosnuméricos (temperatura, valor de un stock o matrículamatrícula de alumnos) hablamos de regresión.regresión.

Podemos resumirlo en el siguiente esquema

image.png

En este caso partimos de un modelo que ha sido entrenado con valores reales y es capaz de determinar, a partir de nuevos casos, la nueva etiqueta, valor, imagen o predicciónpredicción en general en el caso de regresiónregresión o clasificar (aprendizaje supervisado), óó tambiéntambién agrupar conjuntos de datos similares (clustering o aprendizaje no supervisado).

Sin embargo el auge de las arquitecturas de red convolucionales (para deteccióndetección de objetos) y de transformers ha abierto la puerta a la parte de másmás potente de la IA como es la IA generativa.

Sus posibilidades son inmensas y ha generado un miríadamiríada de aplicaciones y usos con un potencial enorme y una cantidad de aplicaciones creciente.

Todas ellas o la mayoríamayoría se basan en la conversiónconversión (generacióngeneración o modificación)modificación) de informacióninformación en distintos formatos destacando las que generan vídeovídeo o imágenesimágenes a partir de texto (prompts). Pero existen muchas otras, como texto a juegos, texto a voz o música,música, texto a vídeovídeo en tiempo real, amplicaciónamplicación de imágenesimágenes o texto a aplicaciónaplicación informáticainformática entre muchas otras.

La idea central nace de la posilidad de codificar cualquier objeto (texto, imagen o sonido) en forma numéricanumérica (recuerda los wrod embeddings explicados en el módulomódulo anterior) y ser capaces de predecir, dada una secuencia de entrada, el valor siguiente, o sea el pixel siguiente, la palabra siguiente o el sonido siguiente.

Asi es como funcionan estos sistemas que dan lugar a tantas aplicaciones.

La lista de posibilidades es larga pero podemos sintetizarla de algúnalgún modo en el siguiente esquema segúnsegún el cual todos los procesos implican la conversiónconversión de una entrada en otra de una forma multimodal, es decir, que pasamos al mismo o diferente formato entendiendo por formato la forma en que se presenta la informacióninformación (texto, imagen, audio o vídeo)vídeo).

image.png

Incluso recientemente se ha demostrado la posibilidad de capturar el sueñosueño de un humano a partir de las ondas generadas convirtiendo este a imágenes.imágenes.

Este esquema describe sucintamente el proceso que ocurre en la mayoríamayoría de aplicaciones de IA basado inicialmente en generar cualquier tipo de formato a partir de texto, texto a vídeo,vídeo, texto a audio etc... pero tambiéntambién para mejorar imágenesimágenes (imagen a imagen) o extraer el texto de un vídeovídeo (audio a texto). 

Veremos másmás ejemplos en la últimaúltima secciónsección de este módulo.módulo.

Antes de iniciar la secciónsección presentamos un vídeovídeo generado con IA con fotogramamas que muestran la evoluciónevolución de la tecnolgíatecnolgía

 

Inteligencia Artificial Generativa 

La Inteligencia Artificial Generativa (IA generativa) es una rama de la inteligencia artificial que se enfoca en la creacióncreación de modelos capaces de generar contenido nuevo y creativo. Utiliza técnicastécnicas avanzadas de aprendizaje profundo, especialmente las Redes Neuronales Generativas (GANs) y las Redes Neuronales Recurrentes (RNN), para producir contenido que a menudo es indistinguible del creado por seres humanos.

Se centra en la creacióncreación de datos, contenido y modelos a travéstravés de algoritmos autónomos.autónomos. A diferencia de la IA tradicional, que se enfoca en tareas específicasespecíficas y predefinidas, la IA generativa tiene como objetivo principal generar nuevos datos y contenido de manera autónoma,autónoma, similar a cómocómo funcionan los procesos creativos humanos.

Una de las tecnologíastecnologías másmás destacadas en este campo son las Redes Generativas Adversarias (GANs), desarrolladas por Ian Goodfellow en 2014. Las GANs consisten en dos redes neuronales, una generadora y otra discriminadora, que compiten entre para crear y evaluar datos. Esta competencia entre las redes permite crear contenido realista, como imágenes,imágenes, música,música, texto y más,más, que es indistinguible de lo que podríapodría haber sido producido por humanos.

Los usos de la IA generativa son diversos y se estánestán expandiendo rápidamenterápidamente en diferentes industrias. Algunos de los principales usos incluyen:

GeneraciónGeneración de contenido creativo: Las GANs pueden utilizarse para crear arte, música,música, texto y otros tipos de contenido creativo útilesútiles en presentaciones, videojuegos o películas,películas, de manera automática,automática, lo que amplíaamplía las posibilidades en la producciónproducción artísticaartística y creativa.

Mejora de imágenesimágenes y video: La IA generativa puede mejorar la calidad de imágenesimágenes y videos, eliminar ruido y restaurar contenido dañado.dañado.

DiseñoDiseño de productos: En el ámbitoámbito del diseñodiseño industrial y la moda, la IA generativa puede ayudar a generar diseñosdiseños de productos innovadores y únicos.únicos.

InvestigaciónInvestigación científicacientífica: La IA generativa se aplica en la generacióngeneración de moléculasmoléculas para el desarrollo de medicamentos y en la síntesissíntesis de proteínasproteínas para la investigacióninvestigación científica.científica.

Juegos y simulaciones: Se utiliza en la creacióncreación de mundos virtuales, personajes y entornos en juegos y simulaciones.

Contenido para marketing: En marketing, se emplea para crear contenido publicitario, como imágenesimágenes y texto persuasivo.

CreaciónCreación de voces sintéticassintéticas y asistentes virtuales: La IA generativa puede generar, modificar y clonar voces humanas sintéticassintéticas naturales y se utiliza en asistentes virtuales como chatbots.

En resumen, la IA generativa estáestá transformando numerosas industrias al proporcionar la capacidad de generar contenido y datos de manera automáticaautomática y creativa. Su potencial es vasto y sigue expandiéndoseexpandiéndose a medida que la tecnologíatecnología avanza y se integra en diversas aplicaciones y sectores.

Funcionamiento

El proceso mediante el cual funciona una IA generativa implica aprender patrones y estructuras a partir de un conjunto de datos existente y utilizar ese conocimiento para generar nuevas muestras que sigan la misma distribucióndistribución de esos datos. Este proceso se puede resumir en estas cinco fases:
    RecopilaciónRecopilación y preprocesamiento de datos: el primer paso es recopilar un conjunto de datos que represente el tipo de contenido que desea generar. Este conjunto de datos puede consistir en imágenes,imágenes, texto, audio o cualquier otra forma de datos. Posteriormente, el conjunto de datos se preprocesa para asegurarse de que estéesté en un formato adecuado y para normalizar o transformar los datos si es necesario.
    Entrenamiento de modelos: un modelo generativo se entrena usando el conjunto de datos preprocesado. La elecciónelección del modelo depende del tipo de datos y la salida deseada. Los modelos generativos másmás populares incluyen redes adversarias generativas (GAN), codificadores automáticosautomáticos variacionales (VAEs) y modelos autorregresivos. Durante el entrenamiento, el modelo aprende los patrones subyacentes y estructuras en los datos, capturando las estadísticasestadísticas y distribucióndistribución de los ejemplos de entrenamiento.
    RepresentaciónRepresentación del espacio latente: los modelos generativos aprenden de un espacio latente, el cual es una representaciónrepresentación de menor dimensióndimensión de los datos, donde les permite capturar los factores de variaciónvariación másmás representativos. El espacio latente permite una manipulaciónmanipulación másmás fácilfácil y la generacióngeneración de nuevas muestras.
    Proceso de generacióngeneración: una vez que el modelo estáestá entrenado, puede generar nuevo contenido mediante el muestreo de la distribucióndistribución aprendida. Por ejemplo, en GANs, la red genera nuevas muestras basadas en vectores de ruido aleatorio o condiciones de entrada específicas.específicas.
    EvaluaciónEvaluación y refinamiento: el contenido generado se evalúaevalúa en funciónfunción de varias métricas,métricas, como la calidad visual, la coherencia o relevancia para el resultado deseado. El proceso de evaluaciónevaluación se puede utilizar para refinar el modelo o guiar el proceso de generación.generación.

image.png

Esta imagen resume de manera másmás formal las posibilidades de la IA Geenrativa en cuanto a conversiónconversión de diversas entradas codificadas a otras precio paso por el modelo de lenguaje correspondiente

Algunos ejemplos

La IA Genrativa ha demostrado un potencial creciente pasando de ser un mero generador de imágenesimágenes másmás o menos detalladas a ser capaz de generar vídeovídeo o juegos en tiempo real con resoluciones asombrosas.

En esta secciónsección veremos algunos ejemplos ilustrativos:

                           image.png3uhimage.png

ImágenesImágenes generadas por IA en 2023, todavíatodavía se perviben errores en manos y dientes

imgenai.jpg

Imagen generada por AI en noviembre de 2023

                         

vídeovídeo hecho toatalmente con IA Generativa hace solo unos meses

Principales empresas y aplicaciones

Todas las aplicaciones de IA Generativa tienen que ver con acciones humanas vinculadas a los sentidos, como son la visión,visión, la audiciónaudición y el lenguaje.

En este apartado daremos una relaciónrelación de herramientas específicasespecíficas de IA para la generacióngeneración de diversos contenidos.

Hay cientos de ellas y cada díadía surgen nuevas, lo mejor es buscar la que mejor se ajuste a tus neceidades y entorno de trabajo.

La lista que se da a  continuacióncontinuación pretende únicamenteúnicamente hacer al lector consciente del universo de posibilidades que la IA generativa abre en todos los campos.

No obstante cabe señalarseñalar que los asistentes de propósitopropósito general como chatGPT incorporan cada vez másmás posibilidades de formatos de datos asíasí que muchas tareas de uso diario de IA se pueden acometer con una de estas herramientas.

AsíAsí podemos distinguir varios grupos de aplicaciones, como son:

GeneraciónGeneración de contenido multimodal: La IA generativa puede generar contenido en diferentes formatos como vídeo,vídeo, voz, audio, música,música, dibujo (portadas, logos, comics...) a parir de texto o de otros formatos, comentar una imagen, transcribir el texto de un audio o generar el códigocódigo de un juego a partir de un esquema son solo algunos ejemplos.

Mejora de la comprensióncomprensión multimodal: La IA generativa puede ayudar a mejorar la comprensióncomprensión de las entradas multimodales. Por ejemplo, en la traduccióntraducción automáticaautomática multimodal, puede generar una descripcióndescripción de una imagen en un idioma diferente o generar subtítulossubtítulos para un video en tiempo real o limpiar el ruido de un podcast.

InteracciónInteracción multimodal con usuarios: Las aplicaciones multimodo a menudo implican interacciones con usuarios a travéstravés de diferentes modalidades, como texto, voz e imagen permitiendo ademásademás la inclusióninclusión de textos o documentacióndocumentación propia para ampliar y afinar el conocimiento por parte del chat de nuestro sistema de información.información.

CreaciónCreación de experiencias de realidad aumentada y virtual: En el ámbitoámbito de la realidad aumentada y virtual, la IA generativa puede ser utilizada para generar objetos y entornos virtuales que respondan de manera dinámicadinámica a la interaccióninteracción del usuario, incluyendo voz, gestos y movimientos.

Hay infinidad de herramientas y aplicaciones que hacen uso de esta potente rama de la IA, indicamos a continuacióncontinuación las másmás relevantes en el momento actual.

Hemos separado en primer lugar las másmás genéricasgenéricas para luego hacer un desglose por aplicaciones másmás específicas,específicas, la lista es larga pero vale la pena revisarla.

IMAGEN


AplicaciónAplicación  CompañíaCompañía DescripciónDescripción Web
DeepDream Google AplicaciónAplicación de generacióngeneración de imágenesimágenes desarrollada por Google. Utiliza redes neuronales para transformar imágenesimágenes de manera creativa. https://deepdreamgenerator.com/
Midjourney Midjourney GeneraciónGeneración de imágenesimágenes creativas a partir de texto https://www.midjourney.com
Runway ML Runway una plataforma que permite a los diseñadoresdiseñadores utilizar IA generativa para crear arte y diseñodiseño de productos. https://research.runwayml.com/gen2
Leonardo Leonardo GeneraciónGeneración de recursos visuales a partir de texto https://leonardo.ai/
Adobe Firefly Adobe GeneraciónGeneración de imágenesimágenes

https://www.adobe.com/sensei/generative-ai/firefly.html

DALL-E 3 OpenAI Modelo de IA generativa que puede generar imágenesimágenes a partir de descripciones de texto. https://openai.com/research/dall-e
Stable Diffusion - Es el generador de imágenesimágenes másmás potente en la actualidad

https://stablediffusionxl.com/

Krea IA Krea GeneraciónGeneración imagen y video

https://www.krea.ai/

TEXTO


chatGPT OpenAI Modelo de lenguaje generativo que permite conversaciones naturales con IA asíasí como cualquier otra actividad como la generacióngeneración de códigocódigo o imágenesimágenes a partir de texto.

https://chat.openai.com/

https://platform.openai.com/chatgpt

Anthropic Anthropic Creador de productos de IA como chat conversacionales (claude y poe)

https://www.anthropic.com/

SONIDO      
AIVA AIVA Plataforma que utiliza IA generativa para componer músicamúsica original. https://www.aiva.ai
Whisper OpenAI Reconocedor de voz

https://openai.com/research/whisper

ElevenLabs ElevenLabs Convertidor de texto a voz y clonaciónclonación de voz https://elevenlabs.io/
Murf Murf Texto a voz, clonaciónclonación de voz, superposiciónsuperposición de voz en vídeovídeo

https://murf.ai/

MULTIMODO      
BardGemini Google VersiónVersión conversacional de chatGPT de google

https://bard.gemini.google.com/?hl=esapp

Copilot Microsoft IA de microsoft para texto e imagen

https://copilot.microsoft.com/

Por supuesto la mayoríamayoría de compañíascompañías tecnológicastecnológicas como Amazon o Microsoft ya usan sistemasde intelgicencia artificial asíasí como modelos conversacionales y otras herramientas.

En resumen, la IA generativa desempeñadesempeña un papel esencial en el desarrollo y mejora de aplicaciones multimodo al permitir la generacióngeneración y manipulaciónmanipulación de contenido en diversas modalidades. Esto contribuye a la creacióncreación de experiencias másmás ricas y personalizadas para los usuarios en aplicaciones que involucran texto, imágenes,imágenes, voz y otras formas de comunicación.comunicación.

Pero va mucho másmás alláallá de la simple generacióngeneración de texto a imagen, en los últimosúltimos meses estánestán surgiendo aplicaciones para genrar toda clase de contenidos, en el siguientes listado destacamos algunas de ellas:

Texto y CódigoCódigo

La generacióngeneración de códigocódigo es una de las aplicaciones con másmás éxitoéxito y potencial dada la gran cantidad de informacióninformación al respecto. Esto permite a casi cualquiera poder crear toda clase de aplicaciones sin conocimientos profundos de codificación.codificación..

En esta tabla indicamos algunas de las herramientas másmás populares en las diversas tareas relacionadas con la programación.programación.

AplicaciónAplicación de IA DescripciónDescripción Uso TípicoTípico Ejemplos de Empresas/Aplicaciones
GeneraciónGeneración de CódigoCódigo Automatizado Usa modelos de lenguaje avanzados para convertir especificaciones de texto en códigocódigo fuente. Desarrolladores agilizan la escritura de código.código. OpenAI Codex, GitHub Copilot
Asistentes de ProgramaciónProgramación Proporcionan sugerencias de códigocódigo y correcciones en tiempo real. Mejora eficiencia y reduce errores en el desarrollo. Kite, Tabnine, IntelliCode de Microsoft
TraducciónTraducción de Lenguaje Natural a SQL Convierte consultas en lenguaje natural a consultas SQL. ÚtilÚtil para analistas de datos y usuarios no técnicos.técnicos. ChatGPT con habilidades SQL, Alteryx, EasyQuery
AutomatizaciónAutomatización de Pruebas de Software Genera scripts de pruebas automatizadas a partir de descripciones en lenguaje natural. CreaciónCreación rápidarápida de pruebas funcionales y de regresión.regresión. Selenium, Testim.io, Katalon Studio
DocumentaciónDocumentación de CódigoCódigo Produce documentacióndocumentación técnicatécnica y comentarios en el código.código. Mantiene documentacióndocumentación adecuada y actualizada. Doxygen, Javadoc, Swagger
ConversiónConversión de CódigoCódigo entre Lenguajes Traduce códigocódigo de un lenguaje de programaciónprogramación a otro. Portar software entre diferentes plataformas. Tangible Software Solutions, JetBrains ReSharper
GeneraciónGeneración de Interfaces de Usuario DiseñaDiseña interfaces de usuario a partir de descripciones textuales. CreaciónCreación rápidarápida de prototipos y UIs. Adobe XD, Figma, Sketch
SíntesisSíntesis de Requisitos de Software Transforma requisitos del negocio en especificaciones técnicas.técnicas. DefiniciónDefinición clara de los requisitos técnicos.técnicos. IBM Rational Doors, Jama Software, Axure RP
ConversiónConversión de Imagen a CódigoCódigo Transforma diseñosdiseños gráficosgráficos e imágenesimágenes en códigocódigo fuente. AutomatizaciónAutomatización en la creacióncreación de interfaces de usuario y web. Zeplin, Avocode, Sketch2Code de Microsoft, Pix2Code, img2code, picoapps

 Texto a Video 3D 

Con el avance y abaratiemtno de las GPUs (Unidades de Proceso en tarjetas gráficas)gráficas) el uso y gestióngestión de imágenesimágenes y vídeovídeo en IA se ha visto enormemente simplificado. Hoy es relativamente fácilfácil crear vídeosvídeos o películaspelículas usando sin moverese de casa con aplicaciones y ténicasténicas de IA.

AplicaciónAplicación de IA DescripciónDescripción Uso TípicoTípico Ejemplos de Empresas/Aplicaciones
GeneraciónGeneración de Entornos Virtuales 3D Crea entornos 3D realistas a partir de descripciones de texto. Usado en simulaciones, juegos y realidad virtual. Unity, Unreal Engine, Autodesk Maya
AnálisisAnálisis de VídeoVídeo 3D en Tiempo Real Analiza y procesa vídeosvídeos 3D para obtener insights en tiempo real. Seguridad, deportes, y análisisanálisis de comportamiento. IBM Watson Visual Recognition, Google Cloud Video Intelligence
SíntesisSíntesis de Voz y Lenguaje para Avatares 3D Genera voz y diálogosdiálogos realistas para personajes 3D. Utilizado en juegos, entrenamiento virtual y asistentes virtuales. Adobe Character Animator, Voicemod, CereProc
Realidad Aumentada Interactiva Superpone texto y gráficosgráficos en vídeosvídeos 3D en tiempo real. Aplicaciones educativas, comerciales y de entretenimiento. ARKit de Apple, ARCore de Google, Microsoft HoloLens
TraducciónTraducción en Tiempo Real con SubtítulosSubtítulos 3D Traduce y muestra subtítulossubtítulos en 3D sobre vídeosvídeos en tiempo real. Usado en streaming en vivo, conferencias y eventos internacionales. Amara, Dotsub, Subtitle Edit
AnimaciónAnimación Facial y de Gestos en 3D Anima avatares 3D basado en texto o voz. CreaciónCreación de personajes virtuales y animaciones. FaceRig, Adobe Fuse, Character Creator
AnálisisAnálisis de Sentimientos en VídeosVídeos 3D Detecta y analiza emociones y reacciones en vídeosvídeos 3D. InvestigaciónInvestigación de mercado, experiencia del usuario. Affectiva, Emotient, Beyond Verbal
Sistemas Interactivos de TutoríaTutoría Virtual Crea tutores virtuales 3D que responden a texto y voz en tiempo real. EducaciónEducación en línea,línea, entrenamiento corporativo. CodeBaby, SitePal, TTS Sketch Maker

Texto y juegos/videos en tiempo real

El sector artísticoartístico en general y de ocio se ha visto profundamente afectado por estas tenoclogías,tenoclogías, en todos sus ámbitos.ámbitos.

Esta tabla presenta aplicaciones relacionadas con juegos, videos y arte en general, incluyendo la posibilidad de generacióngeneración en tiempo real.

AplicaciónAplicación de IA DescripciónDescripción Uso TípicoTípico Ejemplos de Empresas/Aplicaciones
GeneraciónGeneración de Contenido de Juegos Crea activos de juegos, como personajes, entornos y niveles, utilizando IA. Desarrollo de juegos másmás rápidorápido y eficiente. Unity ML-Agents, Unreal Engine
OptimizaciónOptimización de Juegos en Tiempo Real Ajusta la dificultad y la experiencia del juego segúnsegún el comportamiento del jugador. Mejora la experiencia y retenciónretención del jugador. Modl.ai, Spirit AI
Procesamiento de VídeoVídeo en Tiempo Real Mejora la calidad de vídeo,vídeo, realiza seguimiento de objetos y personas en tiempo real. Seguridad, transmisiones en vivo y análisisanálisis deportivo. Nvidia Video SDK, OpenCV
Renderizado Realista en Juegos Produce gráficosgráficos de alta calidad en tiempo real para juegos. Juegos con gráficosgráficos másmás realistas y envolventes. Ray Tracing en Nvidia, AMD Radeon Rays
AnálisisAnálisis de Sentimientos y Reacciones de Jugadores EvalúaEvalúa las emociones y reacciones de los jugadores en tiempo real. Mejora de juegos basada en feedback emocional. Affectiva, Emotient
Control de Juegos por Voz y Gestos Permite a los jugadores interactuar con el juego usando voz y gestos. Juegos másmás inmersivos y accesibles. Microsoft Kinect, Leap Motion
EdiciónEdición y Mejora AutomáticaAutomática de VídeosVídeos de Juegos Edita y mejora clips de juegos automáticamenteautomáticamente para compartir. CreaciónCreación fácilfácil de contenido de juegos para redes sociales. Adobe Premiere Pro (Auto Reframe), Elgato
SimulaciónSimulación y Modelado de FísicaFísica en Juegos Simula físicasfísicas realistas en entornos de juegos. Juegos con interacciones y movimientos másmás realistas. Havok, PhysX

Texto y dibujos/comic/ilustraciones

Coo subcsector de la imagen incluimos el de los comics y dibujos artísticosartísticos en general.

AplicaciónAplicación de IA DescripciónDescripción Uso TípicoTípico Ejemplos de Empresas/Aplicaciones
GeneraciónGeneración AutomáticaAutomática de Ilustraciones Crea imágenesimágenes y gráficosgráficos basados en descripciones de texto. CreaciónCreación de arte visual y paneles de cómic.cómic. OpenAI's DALL-E, Google's DeepDream
DiseñoDiseño AutomáticoAutomático de PáginasPáginas de CómicCómic Organiza el diseñodiseño y el flujo de una páginapágina de cómiccómic basado en texto. MaquetaciónMaquetación y diseñodiseño de páginaspáginas de cómics.cómics. Clip Studio Paint, Adobe Illustrator
CreaciónCreación de Guiones GráficosGráficos Convierte guiones escritos en secuencias visuales de cómics.cómics. PrevisualizaciónPrevisualización y planificaciónplanificación de historias. Storyboard That, Toon Boom Storyboard Pro
AnimaciónAnimación de Personajes de CómicCómic Genera animaciones de personajes a partir de descripciones textuales. CreaciónCreación de cómicscómics animados y contenido interactivo. Adobe Character Animator, Moho (Anime Studio)
SíntesisSíntesis de Voz para Personajes de CómicCómic Crea diálogosdiálogos hablados para personajes de cómicscómics basados en texto. CómicsCómics interactivos y audiocómics.audiocómics. Balabolka, Amazon Polly
TraducciónTraducción AutomáticaAutomática de CómicsCómics Traduce textos de cómicscómics a diferentes idiomas manteniendo el formato. LocalizaciónLocalización y distribucióndistribución internacional de cómics.cómics. DeepL, Google Translate con soporte de OCR
GeneraciónGeneración de Efectos de Sonido y Texto Crea efectos de sonido y textos decorativos para cómics.cómics. Enriquecimiento visual y sonoro de paneles de cómic.cómic. Canva, Adobe Photoshop
PersonalizaciónPersonalización de Estilos de Dibujo Imita estilos de dibujo específicosespecíficos en base a descripciones de texto. CreaciónCreación de cómicscómics con estilos artísticosartísticos personalizados. DeepArt, Prisma

Texto a podcast, mejora de imágenes,imágenes, amplicaciónamplicación de contenido

Otra aplaciónaplación de gran valor, la posibilidad de corregir y ampliar contenidos basado en contenidos previos, ya sea de sonido, imagen o vídeo,vídeo, del mismo modo que ocurre con el texto.

AplicaciónAplicación de IA DescripciónDescripción Uso TípicoTípico Ejemplos de Empresas/Aplicaciones
Mejora y EdiciónEdición de Texto Revisa y mejora la calidad del texto, incluyendo gramáticagramática y estilo. Escritura, ediciónedición de contenido, y correccióncorrección de pruebas. Grammarly, Hemingway Editor
GeneraciónGeneración de Guiones para Podcasts Crea guiones para podcasts basados en temas o palabras clave. ProducciónProducción de podcasts y contenido de audio. Jarvis AI, Writesonic
CorrecciónCorrección de ImágenesImágenes Mejora la calidad de las imágenes,imágenes, restaura fotos dañadas.dañadas. RestauraciónRestauración de fotos, mejoramiento de imágenesimágenes para medios. Adobe Photoshop con IA, Remini
AmpliaciónAmpliación de ImágenesImágenes Aumenta la resoluciónresolución de las imágenesimágenes sin perder calidad. Fotografía,Fotografía, diseñodiseño gráfico,gráfico, y producciónproducción de medios. Let's Enhance, Bigjpg
Mejora de Calidad de Sonido Mejora la claridad y calidad del audio en grabaciones. Podcasts, música,música, y producciónproducción de audio. Izotope RX, Adobe Audition
SíntesisSíntesis de Voz para Podcasts Crea narraciones de voz realistas para uso en podcasts. Podcasts automatizados, lecturas de texto. Descript, Amazon Polly
CorrecciónCorrección AutomáticaAutomática de Sonido Elimina ruidos de fondo y mejora la calidad del sonido. Podcasts, conferencias, y grabaciones en general. Krisp, Dolby On
AnálisisAnálisis de Contenido de Podcasts Analiza y categoriza el contenido de los podcasts. Marketing, investigacióninvestigación de medios, y mejora de contenido. Spotify Podcast Analytics, Podtrac

Aplicaciones de oficina

Las posibilidades de la IA en oficina son tambiéntambién inmensas permitiendo automatizar y simplificar todos los procesos enormemente

Dejamos la tabla ilustrativa de algunas de las aplicaciones másmás importantes

AplicaciónAplicación de IA DescripciónDescripción Uso TípicoTípico Ejemplos de Herramientas
AutomatizaciónAutomatización de Tareas en Office Automatiza tareas repetitivas como entrada de datos y gestióngestión de correos electrónicos.electrónicos. Mejora de eficiencia en tareas administrativas. Microsoft Power Automate, UiPath
AnálisisAnálisis de Datos en Excel Utiliza IA para análisisanálisis predictivos y de tendencias en hojas de cálculo.cálculo. AnálisisAnálisis de datos, proyecciones financieras y reportes. Excel con Power BI, Tableau
Asistentes Virtuales para OrganizaciónOrganización Ayuda en la gestióngestión de calendarios, correos electrónicoselectrónicos y recordatorios. OrganizaciónOrganización personal y gestióngestión del tiempo. Cortana de Microsoft, Google Assistant
Reconocimiento de Voz para TranscripciónTranscripción Convierte voz a texto para transcribir reuniones o notas. CreaciónCreación de documentos y notas de reuniones. Dragon NaturallySpeaking, Otter.ai
AnálisisAnálisis de Sentimientos en Comunicaciones Analiza el tono y los sentimientos en correos electrónicoselectrónicos y chats. Mejora de la comunicacióncomunicación interna y atenciónatención al cliente. IBM Watson Tone Analyzer, Google Cloud Natural Language
OptimizaciónOptimización de Presentaciones Sugerencias para mejorar diseñodiseño y contenido de presentaciones. CreaciónCreación de presentaciones másmás impactantes y profesionales. PowerPoint Designer, Beautiful.ai
GestiónGestión de Proyectos con IA Asigna recursos y predice plazos en proyectos. GestiónGestión eficiente de proyectos y equipos. Asana, Trello con extensiones de IA
Seguridad de Datos y Cumplimiento Monitorea y protege datos contra accesos no autorizados. Seguridad de la informacióninformación y cumplimiento normativo. NortonLifeLock, McAfee
AnálisisAnálisis de Datos con ChatGPT ChatGPT integrado con capacidades de análisisanálisis de datos para respuestas enriquecidas. AnálisisAnálisis de datos y generacióngeneración de insights en conversaciones. OpenAI ChatGPT con habilidades de análisisanálisis de datos
Herramienta de AnálisisAnálisis y VisualizaciónVisualización de Datos Herramienta basada en IA para crear dashboards y análisisanálisis de datos. CreaciónCreación de informes interactivos y visualizaciónvisualización de datos. Rows

No podíamospodíamos olvidar el sector de la realidad aumentada y realidad virtual. 

CategoríaCategoría Herramienta/TecnologíaTecnología DescripciónDescripción
Realidad Aumentada (AR)    
  ARKit (Apple) Framework para experiencias AR en iOS, utiliza cámarascámaras y sensores del dispositivo.
  ARCore (Google) Plataforma de Google para AR, funciona en dispositivos Android y iOS.
  Vuforia Plataforma AR conocida por su robusta capacidad de seguimiento.
  Unity con AR Foundation Framework de Unity para desarrollo AR, compatible con ARKit y ARCore.
  Microsoft Mixed Reality Toolkit Conjunto de herramientas para acelerar el desarrollo de aplicaciones de realidad mixta en Unity.
Realidad Virtual (VR)    
  Unity Plataforma líderlíder en desarrollo de juegos y VR, soporta una amplia gama de visores VR.
  Unreal Engine Motor gráficográfico con soporte extenso para desarrollo VR, conocido por su alta fidelidad gráfica.gráfica.
  SteamVR Plataforma de desarrollo completa para contenido VR, compatible con varios visores VR.
  Google VR para Unity SDK para construir experiencias VR en Android y iOS, soporta Cardboard y Daydream.
  A-Frame (WebVR) Framework web de códigocódigo abierto para crear experiencias VR, permite ejecutar aplicaciones VR en navegadores web.
AI para AR/VR    
  TensorFlow Biblioteca de aprendizaje automáticoautomático para añadirañadir funcionalidades de AI a aplicaciones AR/VR.
  IBM Watson Ofrece servicios de AI como reconocimiento de lenguaje y visual, integrables en apps AR/VR.
  OpenAI APIs Proporciona capacidades de AI que pueden integrarse en AR/VR para interacciones avanzadas.
  Microsoft Azure AI Suite de servicios de AI incluyendo procesamiento de lenguaje y toma de decisiones, útilútil en AR/VR.
  Google AI Services Incluye APIs como Cloud Vision y Video Intelligence, integrables en AR/VR para interactividad mejorada.

El futuro de la IA Generativa

La evoluciónevolución de la Inteligencia Artificial Generativa (IA Generativa) en los próximospróximos añosaños promete ser emocionante y transformadora. A medida que la investigacióninvestigación y la tecnologíatecnología avanzan, es probable que veamos las siguientes tendencias y desarrollos en este campo:

Mayor realismo y calidad Las técnicastécnicas generativas seguiránseguirán mejorando en términostérminos de la calidad y realismo de los datos y el contenido que generan. Esto incluye imágenes,imágenes, videos, texto y audio que seránserán másmás difícilesdifíciles de distinguir de las creaciones humanas.

GeneraciónGeneración multimodal avanzada La IA generativa se volverávolverá aúnaún másmás hábilhábil en la generacióngeneración de contenido que combine múltiplesmúltiples modalidades, como la creacióncreación de historias visuales y auditivas a partir de texto, o la generacióngeneración de contenido multimodal en tiempo real.

Entendimiento contextual La IA generativa mejorarámejorará su capacidad para comprender y generar contenido en funciónfunción del contexto. Esto permitirápermitirá una interaccióninteracción másmás natural y relevante con los usuarios, ya que la IA podrápodrá adaptarse mejor a las necesidades y preferencias individuales.

Aplicaciones en la industria Veremos un aumento significativo en la adopciónadopción de IA generativa en industrias como la medicina, la arquitectura, el diseñodiseño de productos y la investigacióninvestigación científica,científica, donde se utilizaráutilizará para la generacióngeneración de modelos, diseñosdiseños y simulaciones complejas.

Creatividad asistida por IA Las herramientas de creatividad asistida por IA se volveránvolverán másmás accesibles y comunes. Los artistas, escritores y músicosmúsicos podránpodrán utilizar la IA para potenciar su creatividad y producir obras innovadoras.

ÉticaÉtica y regulaciónregulación A medida que la IA generativa se vuelva másmás poderosa, surgiránsurgirán preocupaciones éticas,éticas, como el uso indebido de la tecnologíatecnología para la creacióncreación de contenido engañosoengañoso o perjudicial. Esto llevarállevará a una mayor atenciónatención a la regulaciónregulación y la éticaética en el desarrollo y uso de la IA generativa.

InteracciónInteracción humano-IA másmás fluida La IA generativa se integraráintegrará másmás en la vida cotidiana de las personas, mejorando la interaccióninteracción con dispositivos, asistentes virtuales y aplicaciones, lo que permitirápermitirá una experiencia másmás fluida y personalizada.

Aplicaciones en educacióneducación La IA generativa se utilizaráutilizará cada vez másmás en la educación,educación, ayudando a crear contenido educativo personalizado y generando ejercicios y evaluaciones adaptadas a las necesidades de los estudiantes, veremos másmás sobre esto en la siguiente unidad.

InvestigaciónInvestigación científicacientífica avanzada La IA generativa jugarájugará un papel importante en la investigacióninvestigación científica,científica, especialmente en la simulaciónsimulación y modelado de fenómenosfenómenos complejos, como el clima, la biologíabiología y la físicafísica cuántica.cuántica.

En resumen, la IA generativa seguiráseguirá evolucionando y expandiéndoseexpandiéndose en diversas industrias y aplicaciones. Se espera que la tecnologíatecnología sea cada vez másmás sofisticada y que tenga un impacto significativo en la forma en que interactuamos con la informacióninformación y el contenido en el futuro. Sin embargo, tambiéntambién surgiránsurgirán desafíosdesafíos éticoséticos y regulatorios que deberándeberán abordarse a medida que esta tecnologíatecnología avance.

Presentamos finalmente un vídeovídeo generado con IA en noviembre de 2023 y que representa lo másmás avanzado que hay en esta tecnologíatecnología