3.1 Algoritmos y análisis de textos: una relación fructífera
El reconocimiento de patrones lingüísticos por medios informáticos revolucionó,revolucionó ya.los estudios filológicos mucho antes de la generalización de los LLM. Un caso célebre es el de la búsqueda de la identidad de la escritora italiana Elena Ferrante: https://revistas.uned.es/index.php/RHD/article/download/30928/25262
Pero el uso de ordenadores en la disciplina que se conoce como estilometría ya se había utilizado desde los años 60, cuando se aplicó a las epístolas de san Pablo en el Nuevo Testamento. La búsqueda de la presencia o ausencia de estilemas (rasgos estilísticos ) se venía utilizando desde el siglo XIX para confirmar o rechazar la atribución de una obra a Platón, a Shakespeare o a Lope de Vega, pero las posibilidades se multiplicaron con el uso de bases de datos y herramientas informáticas creadas con ese propósito.
Pero el estudio estadístico del lenguaje no solo se había utilizado para estudiar la teoría de textos atribuidos, y sus aplicaciones ya se habían generalizado, muchos años antes de que apareciera la IA, a campos tan variados como el espionaje, las previsiones de resultados electorales y los estudios de mercado.
Una vez más, la aparición de la inteligencia artificial generativa, y en concreto de los LLM, ha permitido que los análisis, reservados hasta ahora a los expertos con conocimientos especializados, estén al alcance de cualquier curioso que sea capaz de crear un prompt adecuado en lenguaje natural.
1. Análisis de sentimiento
Consiste en detectar si un texto expresa opinión positiva, negativa o neutral.
Ejemplos:
-
Analizar reseñas de clientes en Amazon o TripAdvisor para saber si un producto o hotel gusta o no.
-
Analizar comentarios sobre una marca en X (Twitter) para medir la reputación.
-
Estudiar opiniones políticas en redes durante elecciones.
Ejemplo práctico:
Una empresa analiza 50.000 comentarios de clientes para detectar quejas frecuentes sobre el servicio.
2. Clasificación automática de textos
La IA puede clasificar documentos en categorías automáticamente.
Ejemplos:
-
Clasificar correos en spam / no spam (como hace Gmail).
-
Clasificar noticias por tema: política, economía, deporte.
-
Clasificar incidencias de clientes por tipo de problema.
3. Extracción de información (Named Entity Recognition)
La IA identifica personas, lugares, organizaciones, fechas, etc. dentro de un texto.
Ejemplos:
-
Extraer nombres de empresas y personas de artículos de prensa.
-
Analizar contratos para identificar partes firmantes.
-
Analizar noticias para detectar menciones a empresas como Apple o Google.
Ejemplo:
Texto:
“El presidente Pedro Sánchez visitó Barcelona el lunes.”
La IA detecta:
-
Persona: Pedro Sánchez
-
Lugar: Barcelona
-
Fecha: lunes
4. Resumen automático
La IA puede generar resúmenes de textos largos.
Ejemplos:
-
Resumir informes empresariales.
-
Resumir artículos científicos.
-
Resumir reuniones o entrevistas.
Herramientas como ChatGPT o Notion AI se usan mucho para esto.
5. Detección de temas (Topic Modeling)
La IA detecta los temas principales en un conjunto grande de documentos.
Ejemplos:
-
Analizar miles de noticias para ver qué temas dominan la agenda.
-
Analizar foros para detectar problemas recurrentes.
-
Analizar publicaciones científicas para ver tendencias de investigación.
6. Detección de plagio o similitud
La IA compara textos para detectar copias o similitudes.
Ejemplos:
-
Universidades usan herramientas como Turnitin para detectar plagio en trabajos.
-
Editoriales comparan manuscritos para evitar duplicaciones.
7. Análisis lingüístico avanzado
La IA puede analizar estructura del lenguaje.
Ejemplos:
-
Detectar complejidad del lenguaje en libros.
-
Analizar estilo de un autor.
-
Detectar discurso de odio o toxicidad en redes sociales.
💡 Ejemplo completo de aplicación real:
Un periódico analiza 100.000 tweets sobre una elección en Spain:
-
La IA clasifica los tweets por tema.
-
Analiza sentimiento.
-
Extrae nombres de políticos.
-
Genera resúmenes de tendencias.
Resultado: un informe sobre la conversación pública en redes.