# Unidad 4.2. Ampliando el chat. Hablar con tus datos y generación aumentada > Con el avance de la tecnología de la realidad virtual, pronto llegaremos a un punto donde no podremos distinguir entre lo que es real y lo que es un juego > > **Elon Musk**, CEO de SpaceX y Tesla y cofundador de OpenAI ### Introducción La inteligencia artificial y, en particular, los modelos de procesamiento del lenguaje natural (PLN), han experimentado avances significativos en estos dos últimos años, avances que se traducen en un crecimiento exponencial de aplicaciones en todos los ámbitos y sectores empresariales, gubernamentales y de cualquier entidad u organización. Modelos de lenguaje, como GPT, BERT, Llama y otros, han demostrado ser extremadamente potentes para comprender y generar texto en lenguaje natural proporcionando mecanismos para facilitar y automatizar la gestión de la información y del conocimiento. Sin embargo, para aprovechar al máximo su potencial, a menudo es necesario personalizarlos y adaptarlos a conjuntos de datos específicos o a dominios particulares. No hay que olvidar que estos modelos se entrenan con datos de fuentes diversas como Wikipedia pero que no están actualizados por lo que en muchas ocasiones deben tener la posibilidad navegar en internet para accder a contenidos más específicos o actuales. No solo eso sino que hay información poco o nada accesible que los modelos desconocen. En la siguiente tabla podemos apreciar el coste, tanto en tiempo como en dinero del entrenamiento de los modelos de lenguaje más utilizados
**Modelo de Lenguaje** | **Empresa** | **Año de Creación** | **Estimación de Tiempo de Entrenamiento** | **Estimación de Costo de Entrenamiento** | **Código Abierto** |
---|---|---|---|---|---|
GPT-3 | OpenAI | 2020 | Varios meses | Millones de dólares | No |
BERT | 2018 | Semanas a meses | Cientos de miles a millones de dólares | Sí | |
T5 | 2020 | Meses | Millones de dólares | Sí | |
GPT-4 | OpenAI | 2023 | Meses | Decenas de millones de dólares | No |
GPT-2 | OpenAI | 2019 | Semanas a meses | Cientos de miles a millones de dólares | Sí |
Transformer | 2017 | Semanas | Decenas a cientos de miles de dólares | Sí | |
XLNet | Google/CMU | 2019 | Semanas a meses | Cientos de miles a millones de dólares | Sí |
AlphaFold | DeepMind | 2020 | Meses | Millones de dólares | Sí |
MuZero | DeepMind | 2020 | Meses | Millones de dólares | No |
LLaMA | Meta | 2023 | No disponible | No disponible | Sí |
**Herramienta** | **Tipo de Datos** | **Descripción** | **Características Clave** |
---|---|---|---|
ChatGPT | Texto | Interfaz de chat para interactuar con grandes cantidades de texto, generando respuestas y análisis. | Procesamiento de lenguaje natural, generación de texto. |
ChatDoc | Documentos de texto | Herramienta diseñada para analizar y extraer información relevante de documentos de texto. | Extracción de texto, análisis de contenido de documentos. |
ChatPDF | Documentos PDF | Especializada en extraer y analizar información de documentos PDF. | Extracción de texto, análisis de contenido de PDF. |
PageChat | Páginas web | Permite interactuar con el contenido de páginas web para extraer y analizar información relevante. | Extracción y análisis de contenido web, fácil de usar. |
Chatbase | Bases de datos | Herramienta de análisis y consulta de bases de datos mediante una interfaz de chat. | Interfaz de chat para SQL, análisis de datos. |
Dante AI | Análisis de texto avanzado | Herramienta para analizar y obtener insights de grandes volúmenes de texto. | Análisis de texto profundo, aprendizaje automático. |
Tableau | Datos visuales | Visualización de datos para crear y compartir cuadros de mando y gráficos interactivos. | Visualizaciones interactivas, integración de datos. |
Power BI | Datos de negocios | Herramienta de Microsoft para visualizar datos y compartir insights a través de la organización. | Análisis de datos, informes interactivos. |
Google Data Studio | Datos web y marketing | Convierte datos en informes y cuadros de mando personalizables e informativos. | Integración con Google Analytics, fácil de usar. |
Domo | Datos empresariales | Combina herramientas para la integración, visualización y colaboración en datos. | Visualización de datos, colaboración en tiempo real. |