2.2 Veracidad: sesgos, alucinaciones y deepfakes

El uso de sistemas de inteligencia artificial plantea importantes cuestiones relacionadas con la la fiabilidad de la ~~información~~información que producen: pueden incorporar sesgos, producir alucinaciones y ~~también~~también facilitar la ~~creación~~creación de contenidos manipulados, como los deepfakes, que imitan de forma convincente ~~imágenes,~~imágenes, voces o ~~vídeos~~vídeos de personas reales. Todo ello hace necesario analizar con ~~atención~~atención la veracidad de los contenidos generados por la IA y fomentar un uso ~~crítico~~crítico de estas herramientas, especialmente en el ~~ámbito~~ámbito educativo.

Sesgos y discriminacióndiscriminación

Un sesgo puede entenderse como una tendencia a favorecer o perjudicar a alguien o algo de manera ~~sistemática.~~sistemática.

En la vida cotidiana, los sesgos aparecen cuando nuestras decisiones o juicios no son completamente neutrales, sino que ~~están~~están influidos por experiencias previas, estereotipos o ~~información~~información incompleta. Por ejemplo, si una persona cree que los estudiantes que hablan ~~más~~más en clase son siempre los que mejor aprenden, ~~podría~~podría valorar ~~más~~más sus intervenciones y prestar menos ~~atención~~atención a quienes participan menos, aunque estos ~~también~~también comprendan bien el contenido.

Cuando hablamos de sesgos en la inteligencia artificial, nos referimos a algo similar: los sistemas de IA pueden producir resultados que favorecen o perjudican a determinados grupos de personas, ~~categorías,~~categorías, resultados o situaciones de forma ~~sistemática,~~sistemática, generando errores recurrentes en las predicciones o decisiones automatizadas.

Esto ocurre porque los algoritmos aprenden a partir de datos generados por personas y por la sociedad, que ya pueden contener desigualdades o representaciones incompletas de la realidad. Como resultado, la IA puede reproducir o amplificar esas tendencias, perpetuando esas disparidades o estereotipos sociales existentes.

El origen de los sesgos en la inteligencia artificial es ~~multifacético~~multifacético y puede surgir en diferentes etapas del proceso de ~~creación~~creación y uso de un sistema. Ferrara (2023) distingue principalmente tres ~~orígenes:~~orígenes:

Sesgo de datos: ocurre cuando los datos utilizados para entrenar los modelos no son representativos o ~~están~~están incompletos. Esto sucede si los datos provienen de fuentes ya sesgadas, contienen errores o carecen de ~~información~~información importante sobre ciertos grupos. Los modelos de aprendizaje ~~automático~~automático aprenden y replican estos patrones de sesgo presentes en los datos de entrenamiento. Por ejemplo, ~~según~~según el informe de la OCDE los modelos de IA suelen basarse de forma abrumadora en culturas occidentales y de habla inglesa, perjudicando especialmente a hablantes de otras lenguas y dialectos ~~específicos~~ específicos y silenciando realidades o valores que no resultan convenientes para los intereses de quienes programan el algoritmo.

Dentro de este tipo de sesgo, podemos integrar el sesgo ~~histórico~~histórico, que aparece cuando los datos reflejan desigualdades del pasado y estas se trasladan a las decisiones automatizadas.
Sesgo ~~algorítmico:~~algorítmico: este sesgo es inherente al ~~diseño~~diseño e ~~implementación~~implementación del algoritmo. Surge cuando los algoritmos se basan en suposiciones sesgadas o utilizan criterios que priorizan ciertos atributos de manera que generan resultados injustos. Es decir, cuando el propio ~~diseño~~diseño del sistema favorece ciertos resultados.
Sesgo del usuario: se produce cuando las personas que utilizan los sistemas introducen sus propios prejuicios de forma consciente o inconsciente. Esto puede ocurrir al proporcionar datos de entrenamiento sesgados por parte de la persona que desarrolla el sistema o por el propio usuario en sus interacciones con la IA, de manera que reflejen sus prejuicios personales.

~~Además,~~Además, en el ~~artículo~~artículo de Jeff Shuford, encontramos una tabla donde se describen siguientes tipos de sesgos:

Sesgo de Muestreo	Se da cuando los datos de entrenamiento no representan a la ~~población~~población a la que sirven, como un algoritmo de reconocimiento facial entrenado mayoritariamente con personas blancas.
Sesgo de ~~Representación~~Representación	Sucede cuando el conjunto de datos no modela con ~~precisión~~precisión a la ~~población,~~población, como bases de datos ~~médicas~~médicas que subrepresentan a las mujeres.
Sesgo de ~~Confirmación~~Confirmación	Ocurre cuando el sistema de IA se utiliza para confirmar prejuicios o creencias preexistentes de sus creadores o usuarios.
Sesgo de ~~Medición~~Medición	Emerge cuando el sistema de ~~recolección~~recolección de datos sobrerrepresenta o subrepresenta ~~sistemáticamente~~sistemáticamente a ciertos grupos.
Sesgo de ~~Interacción~~Interacción	Aparece cuando la IA ~~interactúa~~interactúa con los humanos de forma sesgada, como un chatbot que responde de manera distinta a hombres y mujeres.
Sesgo Generativo	~~Específico~~Específico de modelos de IA generativa (como DALL-E o GPT), donde los resultados reflejan de manera desproporcionada patrones o perspectivas ~~específicas~~específicas de los datos de entrenamiento. Por ejemplo, al solicitar ~~imágenes~~imágenes de "CEOs", los modelos suelen producir mayoritariamente ~~imágenes~~imágenes de hombres, y al solicitar ~~imágenes~~imágenes de "criminales", tienden a mostrar de forma abrumadora a personas de color.

En la siguiente imagen no ~~sólo~~sólo percibimos el sesgo generativo, sino ~~también~~también un sesgo de idioma ya que probablemente el modelo se ~~entrenó~~entrenó en lengua inglesa donde "teacher" no tiene ~~género.~~ género.

Imagen generada con Bing Image Creator (2023)

En ~~relación~~relación a este ~~último~~último sesgo y los modelos de IA generativa (IAGen), es menester mencionar de forma ~~explícita~~explícita las siguientes ~~problemáticas~~problemáticas derivadas del mismo:

~~Amplificación~~Amplificación de Estereotipos: Los modelos de IAGen pueden reproducir y amplificar estereotipos sociales al generar contenido. Por ejemplo cuando la IA representa ~~sistemáticamente~~sistemáticamente a las enfermeras como mujeres y a los doctores como hombres.
Riesgo de las Realidades ~~Sintéticas:~~Sintéticas: Se advierte que, a medida que avanzamos en la ~~creación~~creación de realidades ~~sintéticas~~sintéticas cada vez ~~más~~más sofisticadas, existe el peligro de que sesgos sutiles se infiltren y moldeen la sociedad de formas no deseadas y potencialmente ~~dañinas.~~dañinas.
Impacto de los Datos de Internet: Los modelos de IAGen entrenados con ~~imágenes~~imágenes o textos ~~extraídos~~extraídos de internet suelen heredar las disparidades existentes en el mundo real, lo que contamina sus resultados generados.

Como docentes, es importante ~~añadir~~añadir el el sesgo de ~~automatización~~automatización: tendencia humana a favorecer las sugerencias de los sistemas IA e ignorar el resto.

El impacto de estos sesgos es profundo, ya que pueden perpetuar desigualdades sociales, reforzar estereotipos ~~dañinos~~dañinos y limitar el acceso a servicios esenciales como la salud o el empleo.

~~Según~~Según la OCDE, aproximadamente cuatro de cada diez docentes temen que la IA pueda amplificar sesgos que refuercen conceptos ~~erróneos~~erróneos en los estudiantes.

El algoritmo tiene el poder de iluminar partes de la realidad y dejar a oscuras, silenciadas, realidades no convenientes a los intereses que lo programan.

Tres proyecciones de una misma realidad

Como vemos, esto no es solo debido a unas malas intenciones del ~~diseñador~~diseñador sino ~~también~~también a la cantidad ~~histórica~~histórica de datos estructurados generados por cada uno de los sectores de la sociedad en ~~función~~función de su riqueza, ~~país~~país de origen o de razones ~~históricas.~~históricas. El riesgo socioeducativo es la ~~desmaterialización~~desmaterialización de la diversidad.

Si bien es cierto, como docentes debemos tener en cuenta que toda ~~selección~~selección de ~~contenidos~~contenidos, parte de un sesgo, o, al menos, de una perspectiva y todos los docentes seleccionamos en un ~~océano~~océano infinito de contenidos aquellos que trabajamos con nuestro alumnado. Para ello disponemos del ~~currículo~~currículo pero ~~también~~también de nuestra perspectiva personal y humana en ese tercer nivel de ~~concreción~~concreción que es nuestra ~~programación~~programación de aula. Si bien parece inevitable partir de un cierto sesgo, si se pueden valorar los objetivos y motivaciones de cada ~~selección~~selección de ~~información.~~ información.

El abordaje del ~~análisis~~análisis ~~crítico~~crítico de los sistemas inteligentes implica partir del hecho de que los datos y los algoritmos no vienen dados, responden a los contextos ~~históricos,~~históricos, ~~políticos,~~políticos, sociales, culturales de su ~~producción~~producción y existe una ~~dimensión~~dimensión subjetiva tanto en la ~~producción~~producción como en la ~~mediación~~mediación ~~algorítmica~~algorítmica (Martins 2024).

Alucinaciones

~~Además~~Además de los sesgos, otro aspecto importante que afecta a la fiabilidad de los sistemas de inteligencia artificial es su capacidad de generar ~~información~~información incorrecta que parece plausible. Mientras que los sesgos se refieren a tendencias ~~sistemáticas~~sistemáticas que pueden favorecer o perjudicar determinados resultados o grupos de personas, los sistemas de IA generativa ~~también~~también pueden producir afirmaciones, datos o referencias que no son verdaderos. Este ~~fenómeno~~fenómeno se conoce como alucinaciones de la inteligencia artificial.

Podemos definir las alucinaciones como los contenidos generados por la IA que parecen coherentes y convincentes, pero que en realidad son inventados o no ~~están~~están respaldados por ~~información~~información verificable.

Este ~~fenómeno~~fenómeno ocurre porque los sistemas de IA generativa no "entienden" realmente la ~~información~~información que procesan, sino que generan contenido ~~basándose~~basándose en patrones ~~estadísticos.~~estadísticos.

Un ejemplo que se hizo viral fue el caso Mata y la ~~aerolínea~~aerolínea Avianca en 2023:

El abogado de un hombre que ~~demandó~~demandó a una ~~aerolínea~~aerolínea por ~~daños~~daños personales ~~utilizó~~utilizó ChatGPT para preparar una ~~presentación,~~presentación, pero el bot de inteligencia artificial ~~entregó~~entregó casos falsos que el abogado ~~presentó~~presentó ~~después~~después ante el tribunal, lo que ~~llevó~~llevó a un juez a considerar sanciones mientras la comunidad ~~jurídica~~jurídica lidia con uno de los primeros casos de "alucinaciones" de IA que hacen acto de presencia en los tribunales.

Revista Forbes Argentina

Este tipo de errores pone de relieve la importancia de verificar siempre la ~~información~~información producida por sistemas de IA antes de utilizarla como fuente.

El ~~fenómeno~~fenómeno de ~~las~~ las alucinaciones en la IA representa un ~~desafío~~desafío profundo para la verdad educativa, ya que estos sistemas ~~están~~están ~~diseñados~~diseñados para priorizar la verosimilitud sobre la veracidad. Como advierte la OCDE (2026), estos modelos pueden generar ~~información~~información que resulta totalmente plausible y bien estructurada pero que es fundamentalmente ~~errónea,~~errónea, llegando incluso a fabricar citas ~~bibliográficas~~bibliográficas inexistentes. Esto crea una suerte de "caverna digital" donde alumnado y docentes pueden terminar interactuando con "sombras ~~lingüísticas"~~lingüísticas": proyecciones ~~estadísticas~~estadísticas de textos que no tienen nada que ver con la realidad del mundo.

Imagen de ~~@philosophymeme0~~ @philosophymeme0

En contextos educativos es imprescindible tener este ~~fenómeno~~fenómeno en cuenta, ya que premisa falsa introducida por la IA puede descarrilar todo el proceso de aprendizaje de un estudiante.

Aceptar estos resultados sin un filtro riguroso transforma el aula en un espacio de "infodemia", donde el tsunami de datos desaloja la ~~acción~~acción racional y la ~~comprensión~~comprensión profunda.

Para contrarrestar este riesgo, los docentes debemos tratar de ser el ~~último~~último "~~guía~~guía de la ~~razón~~razón humana", ejerciendo su juicio profesional para validar y respaldar cada resultado antes de que sea integrado en el proceso de aprendizaje. El objetivo es que nuestro alumnado no caiga en una confianza ciega en la "~~razón"~~razón" ~~algorítmica~~algorítmica (sesgo de ~~automatización)~~automatización), a ~~través~~través de una ~~alfabetización~~alfabetización ~~crítica~~crítica que permita usar la IA como un amplificador del saber humano.

Pieter Brueghel el Viejo (1568). La ~~parábola~~parábola de los ciegos [ ~~Óleo~~ Óleo sobre tabla]. Museo di Capodimonte de ~~Nápoles~~Nápoles https://es.wikipedia.org/wiki/La_par%C3%A1bola_de_los_ciegos

Dejadlos: son ciegos que ~~guían~~guían a ciegos. Y si un ciego ~~guía~~guía a otro ciego, los dos ~~caerán~~caerán en el hoyo

Mateo 15, 14.

~~Además,~~Además, para mitigar las alucinaciones, la OCDE alude al uso de de ~~técnicas~~técnicas como la ~~Generación~~Generación Aumentada por ~~Recuperación~~Recuperación (RAG), que ancla las respuestas en bases de datos confiables como libros de texto, y de la que hablaremos en el curso 2 de este itinerario "IA y ~~diseño~~diseño curricular". Por otro lado, ~~algunos~~ algunos enfoques ~~pedagógicos~~pedagógicos proponen permitir que los docentes ajusten el "porcentaje de ~~alucinación~~alucinación" de las herramientas para fomentar el pensamiento ~~crítico~~crítico de los alumnos al obligarlos a verificar la ~~información.~~información.

Comprender los tipos de sesgo y las alucinaciones es fundamental para analizar ~~críticamente~~críticamente el funcionamiento y uso de la IA especialmente en contextos como la ~~educación,~~educación, donde la veracidad de la ~~información~~información es esencial.

Deepfakes

Las ~~tecnologías~~tecnologías de la IA ~~desempeñan~~desempeñan una ~~función~~función cada vez ~~más~~más importante en el procesamiento, la ~~estructuración~~estructuración y el suministro de ~~información;~~información; las cuestiones del periodismo automatizado y del suministro ~~algorítmico~~algorítmico de noticias y la ~~moderación~~moderación y la ~~conservación~~conservación de contenidos en los medios sociales y los buscadores son solo algunos ejemplos que plantean cuestiones relacionadas con el acceso a la ~~información,~~información, la ~~desinformación,~~desinformación, la ~~información~~información ~~errónea,~~errónea, el discurso de odio, la ~~aparición~~aparición de nuevas formas de narrativa social, la ~~discriminación,~~discriminación, la libertad de ~~expresión,~~expresión, la privacidad y la ~~alfabetización~~alfabetización ~~mediática~~mediática e informacional, entre otras (UNESCO 2022).

Aunque la la ~~desinformación~~desinformación no es un ~~fenómeno~~fenómeno nuevo, la IA permite producirla a gran escala y con menor esfuerzo, lo que incrementa el riesgo de que los usuarios compartan contenidos sin comprobar su autenticidad. Los sistemas de IA pueden generar textos, ~~imágenes,~~imágenes, audios o ~~vídeos~~vídeos con gran apariencia de realismo, lo que facilita la ~~producción~~producción y ~~difusión~~difusión de contenidos ~~engañosos.~~engañosos. En el contexto digital actual, donde gran parte de la ~~información~~información circula a ~~través~~través de redes sociales y plataformas en ~~línea,~~línea, esta capacidad puede contribuir a la ~~propagación~~propagación de noticias falsas (fake news) o contenidos manipulados que resultan ~~difíciles~~difíciles de distinguir de la ~~información~~información verificada.

Un caso especialmente relevante es el de los deepfakes, es decir, ~~vídeos,~~vídeos, ~~imágenes~~imágenes o audios generados o manipulados mediante IA que imitan de manera muy convincente la apariencia o la voz de una persona real. Es decir, la IAGen permite crear ~~imágenes,~~imágenes, ~~vídeos~~vídeos o audios falsos que pueden representar a una persona diciendo o haciendo algo que nunca ~~ocurrió.~~ocurrió. Estos contenidos pueden utilizarse con fines ~~humorísticos~~humorísticos o creativos, pero ~~también~~también para difundir ~~desinformación,~~desinformación, suplantar identidades o manipular la ~~opinión~~opinión ~~pública.~~ pública.

~~Aquí~~Aquí puedes consultar ~~imágenes~~imágenes deepfakes que se hicieron virales en 2023 como este ~~vídeo~~vídeo de un supuesto Morgan Freeman:

~~Además,~~Además, la creciente ~~sofisticación~~sofisticación y el avance de estas ~~tecnologías~~tecnologías hace cada vez ~~más~~más complicado detectar las manipulaciones ~~únicamente~~únicamente mediante la ~~observación~~observación directa, por lo que se vuelve necesario desarrollar herramientas ~~técnicas~~técnicas y competencias ~~críticas~~críticas para evaluar la credibilidad de la ~~información.~~información.

Comparison AI of Will Smith eating spaghetti from 2023 vs 2026 is going viral pic.twitter.com/nS1Dl49irC
—— kira 👾 (@kirawontmiss) February 12, 2026

Conviene destacar a este respecto, que la ~~Ley~~ Ley de IA introduce obligaciones de informar que un contenido ~~está~~está hecho con IA cuando pueda surgir un riesgo por falta de transparencia en torno a su uso:

En algunos casos, el resultado de la IA generativa debe estar visiblemente etiquetado, como en el caso de los ~~«deepfakes»~~«deepfakes» y los textos destinados a informar al ~~público~~público sobre asuntos de ~~interés~~interés ~~público.~~público.

En el ~~ámbito~~ámbito educativo, estas cuestiones tienen implicaciones importantes: puede derivar en situaciones graves como la ~~creación~~creación y ~~difusión~~difusión de contenidos manipulados de de alumnado o profesorado, incluidos montajes de ~~carácter~~carácter sexual o desnudos falsos, que se comparten ~~rápidamente~~rápidamente a ~~través~~través de redes sociales o por WhatsApp. Este tipo de ~~prácticas~~prácticas puede convertirse en una forma de ciberacoso, con consecuencias ~~psicológicas,~~psicológicas, sociales y reputacionales muy serias para las personas afectadas.

En la siguiente ~~gráfica~~gráfica del estudio ““Hand in Hand: ~~Schools’~~Schools’ Embrace of AI Connected to Increased Risks to ~~Students”~~Students”, vemos ~~cómo~~cómo los deepfakes son un tema destacado en los centros educativos con una creciente conciencia entre las familias:

Hand in Hand: ~~Schools’~~Schools’ Embrace of AI Connected to Increased Risks to Students

Por ello, los centros educativos se enfrentan al reto de prevenir, detectar y abordar estas situaciones, promoviendo una ~~educación~~educación digital responsable, el respeto a la privacidad y la conciencia sobre las implicaciones ~~éticas~~éticas y legales del uso de estas ~~tecnologías.~~tecnologías.

En este sentido, conviene hacer consciente tanto al profesorado como al alumnado ~~del~~ del derecho de imagen, (lo veremos en el ~~capítulo~~capítulo cuatro de este curso), ya que:

La ley ~~prohíbe~~prohíbe captar, difundir o utilizar la imagen de alguien sin su consentimiento expreso, y esto incluye modificar una ~~fotografía~~fotografía mediante herramientas de inteligencia artificial, crear montajes o aplicar filtros sobre la imagen de alguien sin su ~~autorización,~~autorización, aunque sea sin mala ~~intención.~~intención.

~~Además,~~Además, la ~~educación~~educación debe reforzar el desarrollo de de competencias de ~~alfabetización~~alfabetización ~~mediática~~mediática y digital, que incluyan la capacidad de contrastar fuentes, identificar ~~señales~~señales de ~~desinformación~~desinformación y analizar ~~críticamente~~críticamente los contenidos generados por IA..

En commonsense.org hay una ~~página~~página destinada a IA y centros educativos con diversos juegos; concretamente ~~aquí~~aquí puedes seleccionar edades y nivel de juego para adivinar ~~qué~~qué cartel de ~~película~~película ha sido creado o generado por IA.

En esta ~~página~~página puedes jugar a adivinar ~~qué~~qué persona es real y ~~cuál~~cuál ha sido generada por IA

Puntos clave

La ~~supervisión~~supervisión humana se considera el salvaguarda ~~ético~~ético fundamental para corregir la deriva ~~lógica~~lógica y las inexactitudes de la IA.
Siempre se ha de evaluar cualquier resultado generado por la IA, tanto para respaldarlo como para rechazarlo o modificarlo, ~~asegurándonos~~asegurándonos en el ~~ámbito~~ámbito educativo de la calidad ~~pedagógica~~pedagógica que aporta.
Aprender a evaluar la veracidad de la ~~información~~información se convierte en una habilidad clave para participar de manera informada y responsable en la sociedad digital.

~~Así~~Así pues, es vital desarrollar la "~~alfabetización~~alfabetización en IA" tanto en alumnado como en profesorado para que puedan evaluar ~~críticamente~~críticamente la credibilidad de la ~~información~~información y reconocer sesgos potenciales. Y por supuesto, para ello es necesario que haya un desarrollo del pensamiento ~~crítico~~crítico a ~~través~~través del fomento de lo que Maryanne Wolf denomina como lectura profunda (deep Reading).

Lectura profunda es el estado en el que usamos la corteza cerebral para realizar ~~analogías~~analogías e inferencias. Este proceso es fundamental para desarrollar un pensamiento ~~crítico~~crítico y ~~analítico~~analítico; sin ~~él,~~él, solo se obtiene ~~información~~información superficial. Cuando se logra fluidez, el cerebro utiliza rutas ~~más~~más ~~rápidas~~rápidas y eficientes, lo que libera tiempo para generar pensamientos ~~más~~más profundos e integrar sentimientos con la experiencia personal. Si dejamos de practicarla, ~~podríamos~~podríamos perder la capacidad de comprender contenidos complejos y de involucrar nuestra ~~imaginación.~~imaginación.