4. Corrección asistida por IA sin vulnerar datos personales

No basta con conocer tipos de instrumentos; también hay que saber qué hace que un instrumento sea bueno. En términos teóricos, un instrumento de evaluación debe ser válido, fiable, claro, pertinente y manejable. La validez se refiere a si realmente evalúa lo que pretende evaluar. La fiabilidad se relaciona con la consistencia de los resultados. La claridad afecta a la comprensión del alumnado y del profesorado. La pertinencia indica si el instrumento encaja con la tarea. La manejabilidad tiene que ver con el tiempo real de uso en el aula.

La IA puede mejorar el lenguaje y proponer versiones más limpias, pero no garantiza por sí sola estos criterios. Por eso es recomendable revisar siempre si el instrumento evita ambigüedades, si no sobrecarga al docente y si permite recoger evidencias suficientes para tomar decisiones fundamentadas.

4.1. Corrección automática vs. corrección asistida: diferencias clave
4.2. Qué información puede introducirse en una herramienta de IA
4.3. Estrategias para trabajar con textos y evidencias sin datos identificativos
4.4. Uso de rúbricas, listas de cotejo y criterios de evaluación como base para la corrección con IA
4.5. Supervisión docente y validación de resultados

4.1. Corrección automática vs. corrección asistida: diferencias clave

La corrección automática suele implicar que un sistema da una puntuación o juicio con mínima intervención docente. Puede ser útil en ejercicios cerrados, test o comprobaciones muy objetivas, pero resulta limitada para tareas complejas.

La corrección asistida, en cambio, usa la IA como herramienta de apoyo al análisis (propone borradores, identifica patrones) y a la redacción de observaciones (resume errores, sugiere comentarios), pero el docente conserva el control final revisando y validando todo antes de emitir una calificación. En educación, esta segunda opción es mucho más segura y pedagógicamente más sólida.

Esta diferencia es importante porque una nota automática puede dar la impresión de neutralidad, aunque en realidad esté basada en reglas poco transparentes o sesgadas. En evaluación educativa, esto es especialmente delicado porque una decisión errónea puede afectar al aprendizaje, a la autoestima y a la trayectoria escolar del alumnado.

Ejemplo comparativo:

Corrección automática: la IA califica una redacción con un número sin justificación pedagógica clara.
Corrección asistida: la IA identifica problemas de estructura y propone comentarios; el docente revisa, ajusta y decide la calificación.

La segunda opción es más defendible desde el punto de vista pedagógico y legal.

Aránzazu Cortés + Chat GPT

La recomendación operativa es empezar cada tarea con una muestra de calibración y no pasar al lote completo hasta comprobar que la salida es coherente con el criterio docente. Esa lógica coincide con la literatura reciente sobre sistemas híbridos y con la prevención del sesgo de automatización.

Por tanto, la corrección asistida por IA puede ser una aliada muy potente si se usa con prudencia. Permite agilizar tareas repetitivas, detectar patrones de error, redactar feedback y organizar evidencias. Pero en evaluación no todo puede automatizarse, porque la corrección no es solo una operación técnica: implica interpretación pedagógica, sensibilidad contextual y responsabilidad profesional.

Además, cuando se trabaja con datos de alumnado, entran en juego derechos especialmente sensibles. La protección de datos en el ámbito educativo es una cuestión central, y la AEPD insiste en la necesidad de extremar cautelas con menores, plataformas digitales y análisis de información escolar. Por eso, la corrección asistida debe diseñarse desde la minimización de datos y la supervisión docente.

La evaluación de aprendizajes puede afectar al itinerario educativo y, por eso, el marco europeo considera especialmente sensibles los sistemas usados para evaluar resultados de aprendizaje o monitorizar alumnado. Por tanto, la IA debe servir para ahorrar tiempo en tareas mecánicas, no para delegar decisiones sustantivas.

4.2. Qué información puede introducirse en una herramienta de IA

Uno de los puntos clave es decidir qué información puede compartirse con una herramienta de IA. La regla básica es la minimización: introducir solo lo necesario y, si es posible, sin datos identificativos directos. En contexto escolar, esto es especialmente importante cuando hablamos de menores, trabajos académicos, observaciones de conducta o informes de evaluación.

Por tanto, en una herramienta de IA solo debería introducirse información necesaria, mínima y, cuando sea posible, anonimizada o pseudonimizada. No conviene subir nombres, apellidos, fotografías, números de expediente, direcciones, ni documentos con identificación directa salvo que exista base legal, garantías técnicas y autorización institucional clara.

Información recomendable para trabajar con IA:

Textos o fragmentos anónimos o seudonimizados, es decir, sin nombre del autor.
Respuestas codificadas o separadas por códigos.
Fragmentos aislados de producciones o producciones anonimizadas estrictamente necesarios.
Datos o tablas de resultados agregados de grupo.
Descriptores de desempeño (criterios, rúbricas, listas y escalas) sin nombre de alumnado, es decir, listas con identificadores neutrales. Por ejemplo, "Alumno 03".

Información que conviene evitar:

Datos identificativos directos: Nombre y apellidos, foto o voz identificable.
Identificadores oficiales: correo o número de expediente.
Informes completos con datos personales.
Informes completos con información sensible.
Producciones con metadatos personales no depurados.
Imágenes con rostros reconocibles.
Capturas de pantalla con nombres visibles o contexto fácilmente reidentificable.
Información sensible sin base legal clara (datos de menores sin necesidad pedagógica clara).

La lógica es sencilla: si la IA no necesita el dato para cumplir su función, no debe recibirlo. Esto reduce riesgos de reidentificación, filtración y uso indebido de información.

Checklist de privacidad y cumplimiento

4.3. Estrategias para trabajar con textos y evidencias sin datos identificativos

La anonimización es una estrategia básica para poder usar IA con cierto nivel de seguridad. No consiste solo en borrar el nombre, sino en eliminar o sustituir toda información que permita identificar a una persona directa o indirectamente, es decir, reducir la reidentificación por contexto, contenido o metadatos.

En educación, esto implica revisar no solo el encabezado, sino también el contenido, los metadatos y cualquier pista contextual.

En evaluación, una estrategia sencilla es separar identidad y evidencia mediante códigos, y trabajar únicamente con el texto o el producto que se va a analizar.

Flujo seguro recomendado:

Recoger la evidencia.
Sustituir nombres por códigos.
Eliminar datos del documento.
Revisar que no haya pistas evidentes de identidad.
Introducir solo el fragmento necesario en la IA.
Verificar la respuesta generada.
Archivar la versión original en entorno institucional seguro.

Ejemplo práctico:

Documento original: “María Pérez, 4.º ESO B”.

Versión para IA: “Alumno 07, 4.º ESO”.

Fragmento enviado: solo el texto de la redacción o el apartado relevante.

A veces basta con cambiar un nombre por un código, pero otras veces es necesario eliminar referencias a profesores, lugares, proyectos o circunstancias familiares que podrían hacer reconocible al alumno. Cuanto más sensible sea la información, más estricta debe ser la revisión.

Herramientas y niveles de madurez

La decisión no debe hacerse por “marca”, sino por madurez de gobernanza. La siguiente tabla resume el uso más prudente en centros.

Nivel	Herramientas tipo	Uso recomendable	Condición de datos	Requisitos contractuales y riesgos
Exploración básica	ChatGPT personal, Claude consumer, Gemini Apps	Ideación de actividades, borradores de rúbricas, ejemplos ficticios	Sin datos reales del alumnado	En Gemini Apps, una parte de los chats puede revisarse por humanos y utilizarse para mejorar servicios; ciertos datos revisados pueden conservarse hasta 3 años. En servicios individuales de OpenAI, los datos de versiones para individuos pueden usarse para entrenamiento. En Claude consumer, inputs/outputs pueden usarse para entrenar salvo opt-out.
Entorno institucional gestionado	ChatGPT Business/Edu/API	Creación de instrumentos, revisión de textos seudonimizados, feedback asistido	Datos minimizados y seudonimizados	OpenAI indica que por defecto no entrena con datos de Business, Enterprise, Edu ni API; ofrece DPA, controles de retención y, en API, casos con zero data retention.
Suite corporativa integrada	Microsoft 365 Copilot	Comentado de documentos, resúmenes y borradores en ecosistema M365	Solo con permisos bien gobernados	Microsoft indica que prompts, respuestas y datos de Graph no se usan para entrenar LLM fundacionales; funciona dentro del perímetro M365. Riesgo principal: permisos mal configurados. Además, algunos modelos Anthropic en experiencias Copilot quedan fuera del EU Data Boundary.
Plataforma cloud avanzada	Vertex AI / Google Cloud	Pipelines con JSON, RAG institucional, despliegues controlados	Datos institucionales bajo diseño técnico y jurídico	Google afirma que no usará datos para entrenar o afinar modelos sin permiso previo; aun así, puede haber logging para abuso y ciertos servicios de grounding almacenan prompts y salidas 30 días.
Servicios comerciales B2B	Anthropic Commercial / API	Corrección asistida o feedback si el centro contrata servicio empresarial	Datos minimizados y contrato	Anthropic establece en términos comerciales que el cliente conserva inputs y outputs y que Anthropic no puede entrenar modelos con Customer Content; además incorpora DPA. En consumo, la política es distinta.
Autoalojada / local	Gemma 4 + Ollama u otra infraestructura propia	Mayor soberanía, pruebas con datos internos, prototipos avanzados	Puede admitir datos reales si la arquitectura lo justifica y el centro controla todo el entorno	Gemma 4 se publica bajo licencia Apache 2.0, con soporte para JSON estructurado y despliegue on-prem; Google la presenta como apta para control total de datos e infraestructura. Ollama permite ejecución local sencilla e integración vía CLI/API. Riesgos: seguridad del servidor, evaluación del modelo, coste de mantenimiento.

Sobre herramientas edtech específicas como MagicSchool, sí existe evidencia reciente de uso docente en generación de rúbricas, con buena percepción como borrador inicial y necesidad clara de edición humana.

¿Cómo decidir qué herramienta usar?

Aránzazu Cortés + Chat GPT

4.4. Uso de rúbricas, listas de cotejo y criterios de evaluación como base para la corrección con IA

La corrección asistida funciona mejor cuando parte de instrumentos muy claros. Las rúbricas y listas de cotejo son la base ideal para la corrección asistida porque convierten la valoración en evaluación de criterios visibles y explícitos y permiten que la IA trabaje sobre categorías definidas por el docente y ayude a comparar una evidencia con esos criterios proponiendo observaciones y redactando el feedback, pero siempre dentro de la estructura definida por el docente. Esto mejora la consistencia del feedback y evita comentarios genéricos del tipo “deberías mejorar” sin especificar qué ni cómo.

Ejemplos de uso práctico de flujo:

El docente define una rúbrica para un texto argumentativo.

La IA analiza una versión anonimizada del texto.

La IA devuelve observaciones según criterios: tesis, estructura, argumentos, cohesión y corrección lingüística.

El profesor valida y decide la calificación final.

El docente define una rúbrica de exposición oral.

La IA recibe la transcripción anonimizada.

La IA devuelve observaciones vinculadas a criterios.

El docente valida, corrige y ajusta la calificación.

Ejemplo de feedback asistido:

La tesis está presente y se identifica con claridad. El texto, sin embargo, necesita mejorar la conexión entre argumentos mediante conectores como ‘por otra parte’ o ‘además’. La conclusión recupera la idea principal, pero no cierra del todo el razonamiento.

Este tipo de respuesta es útil porque convierte la corrección en una orientación pedagógica, no solo en un veredicto.

Esto reduce tiempo y mejora la coherencia, especialmente cuando hay muchos trabajos. Además, favorece una retroalimentación más homogénea entre grupos o profesores.

Plantilla de prompt para corrección asistida con texto anonimizado

Analiza este texto anonimizado usando exclusivamente la rúbrica adjunta. No pongas nota final. Indica, por criterio, el nivel estimado, una evidencia textual y una sugerencia breve de mejora. Si faltan datos para valorar un criterio, indícalo explícitamente.

Actúa como asistente de evaluación, no como evaluador final.

Vas a analizar un texto anonimizado de alumnado usando exclusivamente esta rúbrica:
[pegar rúbrica]

Tu tarea:
- asignar un nivel provisional por criterio,
- justificar cada propuesta con una evidencia literal del texto,
- señalar incertidumbres o ambigüedades,
- redactar feedback breve, accionable y comprensible para el alumno,
- NO dar calificación final global.

Devuelve una tabla con estas columnas:
criterio | nivel_provisional | evidencia_textual | duda_detectada | sugerencia_de_mejora
Si falta evidencia suficiente, escribe “requiere revisión docente”.

Este último prompt es especialmente potente porque obliga a la IA a trabajar como asistente de evidencia, no como juez final.

Plantilla JSON para corrección asistida

{
  "id_anonimo": "ALU_07",
  "tarea": "texto_argumentativo",
  "puntuaciones": {
    "C1": 3,
    "C2": 2,
    "C3": 3,
    "C4": 2
  },
  "evidencias": [
    {
      "criterio": "C1",
      "fragmento": "El uso del móvil debería limitarse en clase..."
    }
  ],
  "feedback_breve": "La tesis es clara; conviene reforzar la conexión entre argumentos.",
  "requiere_revision_docente": true
}

La utilidad de estas salidas estructuradas es doble: reducen ambigüedad y facilitan exportaciones a hojas de cálculo, scripts o LMS.

Prompt innovador para salida LMS

Devuelve el análisis en JSON con campos id_anonimo, criterio, nivel, evidencia, comentario, requiere_revision_docente. No añadas texto fuera del JSON.

Prompt para feedback adaptado

Reescribe este feedback con lenguaje comprensible para nivel, tono motivador y dos pasos concretos de mejora.

4.5. Supervisión docente y validación de resultados

La supervisión del docente es irrenunciable e indispensable. La IA puede detectar patrones, pero no comprende por completo el contexto del aula, las características del grupo, la evolución del alumno ni los objetivos específicos de una situación didáctica. Además, la IA puede equivocarse, sesgarse o interpretar mal una evidencia. Por eso, cualquier resultado generado por IA debe ser entendido como borrador, no como decisión final.

Además, en educación hay un problema de fondo: la IA puede parecer segura incluso cuando se equivoca. Por eso es importante que el profesorado mantenga una actitud crítica y no delegue en la herramienta la interpretación de evidencias complejas. La IA debe ahorrar tiempo en tareas mecánicas, no desplazar el juicio profesional.

En evaluación, un comentario aparentemente convincente no equivale a una valoración válida. La decisión final debe mantenerse siempre en manos del profesorado, que conoce el contexto, el nivel real del grupo y las circunstancias del alumnado.

Regla práctica útil:

La IA propone o sugiere.
El docente dispone: interpreta y decide.

Prompt para validación docente

Revisa si la siguiente propuesta de corrección es coherente con la rúbrica. Señala posibles sobrevaloraciones, infravaloraciones o inferencias no justificadas por la evidencia.

Ejemplo completo de aplicación o corrección asistida

Imagina una actividad de 2.º de ESO: redactar un texto argumentativo sobre el uso del móvil en clase. El proceso podría ser este:

El alumnado entrega el texto con un código.

El docente elimina datos personales.

La IA revisa ortografía, estructura y presencia de tesis, argumentos y conclusión.

La IA genera un borrador de feedback: “La tesis es clara, pero faltan conectores argumentativos y ejemplos”.

El docente revisa el resultado, comprueba si la observación es correcta y añade matices.

La calificación final la decide el profesor con ayuda de la rúbrica.

Imaginemos una actividad de 1.º de Bachillerato: comentario crítico sobre un texto periodístico. El proceso podría ser este:

El alumnado entrega el texto con un código.

El docente elimina nombres y datos personales.

La IA revisa estructura, argumentación, uso de conectores y coherencia.

La IA propone un borrador de feedback.

El docente revisa si la observación es correcta, añade matices y ajusta la valoración.

Posible salida de la IA:

"El texto presenta una postura clara, pero necesita ejemplos más concretos para sostener el argumento. La coherencia global es adecuada, aunque algunos párrafos podrían unirse mejor mediante conectores.”

Ese comentario puede ser útil, pero solo si el profesor comprueba que refleja fielmente el texto. Si el alumno ya había hecho esa conexión y la IA no la detecta, o si la IA sobreestima un error menor, la intervención docente corrige el sesgo.