# 6. Conclusión final: evaluación con IA al servicio del aprendizaje En evaluación, la IA funciona mejor como **co-diseñadora de instrumentos** y como **asistente de análisis y feedback**, no como sustituta del juicio profesional docente. Esto no es solo una cuestión pedagógica; también es jurídica. El Reglamento Europeo de IA considera de **alto riesgo** los sistemas destinados a **evaluar resultados de aprendizaje** o a **monitorizar alumnado durante pruebas** y exige supervisión humana, prevención del sesgo de automatización y posibilidad de ignorar, revertir o detener la salida del sistema. El RGPD obliga a aplicar minimización, limitación temporal, privacidad desde el diseño y seudonimización cuando proceda; además, si un proveedor trata datos por cuenta del centro, debe existir contrato o acto jurídico equivalente de encargado del tratamiento. # Recomendaciones La primera recomendación es utilizar siempre la IA en evaluación como **tecnología de andamiaje**, no de sustitución. Esto cambia el discurso desde “la máquina corrige” a “la máquina ayuda a preparar mejores decisiones humanas”. Esa formulación está mejor alineada con el marco legal europeo, con la investigación reciente y con las expectativas de confianza de alumnado y familias. La segunda es enseñar una regla institucional sencilla: **criterio antes que herramienta; herramienta antes que automatización**. Primero se define qué se quiere valorar; después se elige instrumento; después se decide si la IA puede ayudar y en qué fase concreta. Esta secuencia evita uno de los errores más frecuentes: introducir una herramienta porque “hace rúbricas” o “corrige textos” y adaptar después la evaluación a lo que la herramienta puede hacer. La tercera es incluir una **checklist de privacidad previa al uso**. Algo tan simple como estas cinco preguntas mejora mucho el cumplimiento real: qué finalidad exacta persigo; qué dato es estrictamente necesario; puedo sustituirlo por código o extracto; el entorno tiene garantías contractuales y de acceso; quién valida el resultado. Esta lógica se deriva del principio de minimización del RGPD y de la necesidad de validación humana señalada tanto por UNESCO como por la literatura reciente. La cuarta es recomendar **formatos de salida verificables**. Pedir comentarios “bonitos” es menos útil que pedir salidas con estructura: criterio, nivel provisional, evidencia, duda, mejora sugerida. Los formatos estructurados ayudan a revisar, moderar en departamento, exportar a hojas de cálculo y detectar incoherencias. Las guías oficiales de las herramientas de IA recogen explícitamente el valor de pedir salidas estructuradas cuando el contenido va a reutilizarse en flujos posteriores. La quinta es introducir un pequeño apartado sobre **alfabetización evaluativa del alumnado**. Cuanto más claro sea para estudiantes qué papel juega la IA en la tarea —si se permite, si se limita, si se documenta, si solo la usa el docente para diseñar feedback— menos conflicto habrá sobre integridad académica y más fácil será que la evaluación siga siendo percibida como justa. # Bibliografía - BOE, currículo LOMLOE en ESO y definición de evaluación y criterios. [\[1\]](https://www.boe.es/buscar/act.php?id=BOE-A-2022-4975) - RGPD: minimización, seudonimización, contratos con encargados, conservación y DPD. [\[2\]](https://eur-lex.europa.eu/eli/reg/2016/679/oj/eng) - Reglamento Europeo de IA: educación como ámbito de alto riesgo y supervisión humana. [\[3\]](https://eur-lex.europa.eu/eli/reg/2024/1689/oj/eng) - UNESCO, Guidance for generative AI in education and research. [\[4\]](https://www.unesco.org/en/articles/guidance-generative-ai-education-and-research) - OpenAI, Enterprise privacy y guías de prompt engineering / structured outputs. [\[5\]](https://openai.com/enterprise-privacy/) - Microsoft, Data, Privacy, and Security for Microsoft 365 Copilot. [\[6\]](https://learn.microsoft.com/en-us/copilot/microsoft-365/microsoft-365-copilot-privacy) - Google, Gemini Apps Privacy Hub y Vertex AI zero data retention. [\[7\]](https://support.google.com/gemini/answer/13594961?hl=en) - Anthropic, Privacy Policy y Commercial Terms. [\[8\]](https://www.anthropic.com/legal/privacy) - AI Assessment Scale y estudios recientes sobre rúbricas y feedback híbrido. [\[9\]](https://arxiv.org/abs/2412.09029) - Ingeniería de prompts. [\[10\]](https://platform.openai.com/docs/guides/prompt-engineering) - Salidas estructuradas. [\[11\]](https://developers.openai.com/api/docs/guides/structured-outputs) - Rúbricas. [\[12\]](https://platform.openai.com/docs/guides/prompt-engineering) - Evaluación asistida. [\[13\]](https://arxiv.org/abs/2411.03659) - Feedback. [\[14\]](https://arxiv.org/abs/2512.18306) - Gemma 4. [\[15\]](https://blog.google/innovation-and-ai/technology/developers-tools/gemma-4/)