El verdadero riesgo no está en la IA. Está en los datos.

Cuando hablamos de inteligencia artificial en educación, solemos mirar primero a la herramienta. Nos preguntamos qué genera, qué corrige, qué resume, qué explica o qué permite automatizar. Es normal que ocurra así, porque lo visible de la IA es precisamente su respuesta: el texto que produce, el feedback que redacta, la actividad que propone o el patrón que dice haber detectado.

Pero en educación hay una pregunta anterior, menos llamativa y mucho más importante:

¿qué información le estamos entregando para que pueda hacer todo eso?

La IA no trabaja en el vacío. Trabaja con datos. Y cuando esos datos proceden del aula, rara vez son neutros. Pueden ser respuestas de alumnos, tareas escritas, ejercicios corregidos, proyectos, grabaciones, imágenes, resultados, informes de progreso, interacciones con una plataforma, trazas de aprendizaje o patrones de error.

A veces esa información no incluye nombres ni apellidos. A veces está separada de cualquier listado oficial. A veces se organiza mediante códigos internos o identificadores diseñados precisamente para reducir la exposición del alumno. Todo eso importa, y puede reducir mucho el riesgo. Pero no elimina la necesidad de pensar bien qué estamos haciendo.

Porque el verdadero problema no es que una IA pueda ayudarnos a analizar evidencias de aprendizaje. Eso puede ser pedagógicamente muy valioso. El problema aparece cuando trabajamos con datos reales sin finalidad clara, sin minimización, sin garantías, sin control sobre la herramienta o sin una política de conservación y destrucción razonable.

La cuestión no es impedir que la IA trabaje con aprendizaje real. La cuestión es evitar que el aprendizaje real se convierta en dato expuesto sin criterio.

Sin datos reales, el análisis educativo se queda corto

Conviene empezar por una afirmación clara: si queremos que la IA ayude de verdad a mejorar el feedback, detectar dificultades o comprender qué está ocurriendo en un grupo, en muchos casos tendrá que trabajar con evidencias reales.

Un ejemplo inventado puede servir para preparar una explicación. Una actividad simulada puede ayudar a diseñar materiales. Un caso ficticio puede ser útil para formar al profesorado. Pero si un docente quiere saber qué errores se repiten en una clase, qué tipo de razonamiento está fallando, qué conceptos no han quedado consolidados o qué parte de una tarea está generando bloqueo, necesita mirar producciones reales.

Esto vale para cualquier asignatura. En Lengua, una respuesta escrita puede mostrar problemas de coherencia o argumentación. En Historia, una explicación puede revelar si el alumno comprende causas y consecuencias o solo enumera hechos. En Matemáticas, un procedimiento puede mostrar en qué paso se rompe el razonamiento. En Ciencias, una justificación puede indicar si el alumno entiende el concepto o solo reproduce vocabulario. En Idiomas, una producción puede revelar patrones lingüísticos. En cualquier etapa y materia, el aprendizaje deja huellas.

La IA puede ayudar a leer esas huellas con más orden, especialmente cuando el volumen de evidencias es alto. Puede agrupar errores, detectar repeticiones, sugerir categorías de intervención o ayudar al profesor a preparar feedback más preciso. Esa posibilidad no debe descartarse por miedo. Debe diseñarse bien.

La alternativa no puede ser fingir que la IA solo debe trabajar con materiales abstractos. Si la herramienta nunca entra en contacto con evidencias reales, su impacto se reduce. Pero si entra sin control, el riesgo aumenta. Ahí está el equilibrio que necesitamos construir.

El dato educativo no siempre parece dato personal

Uno de los errores más frecuentes es pensar que solo hay datos personales cuando aparece el nombre del alumno. El RGPD define dato personal como toda información sobre una persona física identificada o identificable, directa o indirectamente. Por eso, quitar el nombre puede ser una buena medida, pero no siempre convierte automáticamente la información en anónima.

En educación esto es especialmente importante, porque muchas evidencias de aprendizaje pueden decir mucho sobre un alumno aunque no incluyan su nombre. Una respuesta puede contener referencias personales. Una grabación puede identificar la voz. Una imagen puede mostrar a un menor. Un informe puede revelar dificultades persistentes. Una interacción con una plataforma puede mostrar hábitos, bloqueos, errores o necesidades de apoyo.

Incluso una producción aparentemente académica puede ser muy reveladora. No porque sea “sensible” en el sentido cotidiano de la palabra, sino porque forma parte de la historia de aprendizaje de una persona concreta. Y esa historia debe tratarse con cuidado.

Esto no significa que no pueda analizarse. Significa que no debemos tratarla como si fuera material neutro.

Anonimizar no es simplemente quitar el nombre

Aquí aparece una distinción fundamental: anonimización y seudonimización.

En el lenguaje cotidiano solemos decir “lo he anonimizado” cuando en realidad queremos decir “he quitado el nombre”. Pero desde protección de datos esa diferencia importa. La anonimización real implica que la persona ya no pueda ser identificada razonablemente. La seudonimización, en cambio, reduce la identificación directa, pero mantiene alguna posibilidad de vinculación mediante información adicional separada y protegida. El RGPD recoge esta distinción al definir la seudonimización como el tratamiento de datos personales de manera que no puedan atribuirse a una persona sin utilizar información adicional, siempre que esa información se conserve separada y con medidas de protección.

Esto no convierte la seudonimización en una mala práctica. Al contrario. Puede ser una medida muy potente.

Lo que no conviene es venderla como anonimización absoluta si durante el curso necesitamos mantener algún tipo de seguimiento formativo. Si el docente necesita relacionar un identificador con un proceso de aprendizaje para poder intervenir mejor, probablemente estamos ante una identificación pedagógica interna controlada, no ante anonimato total.

Y eso está bien, siempre que se diga con precisión y se diseñe con rigor.

Sin nombre no significa necesariamente sin datos personales. Pero reducir la trazabilidad sí puede ser una medida muy valiosa de protección.

El Student ID como medida de reducción de riesgo

Un Student ID bien diseñado puede ser una pieza importante de una arquitectura responsable de IA educativa. No hablamos de sustituir el nombre por “Alumno 17” y dejar una lista accesible que permita reconstruir la identidad sin dificultad. Eso sería una protección débil.

Hablamos de identificadores que no incorporan nombre, iniciales, curso, grupo ni patrones evidentes; que no permiten inferir la identidad del alumno; que no se vinculan con listados visibles; que se usan solo para una finalidad pedagógica concreta; que tienen acceso restringido; y que se destruyen al final del periodo en el que dejan de ser necesarios.

Ese diseño reduce mucho el riesgo, especialmente si además se eliminan referencias personales innecesarias de las producciones, se limita la información compartida y se evita introducir datos que no aportan nada al análisis.

La idea no es esconder una práctica dudosa detrás de un código. La idea es construir una separación razonable entre la identidad civil o escolar del alumno y las evidencias que se analizan con finalidad formativa.

Hay que asumir, eso sí, que si alguien autorizado conserva temporalmente la posibilidad de vincular ese ID con el proceso de un alumno para poder hacer seguimiento, seguimos estando en un marco que requiere responsabilidad. Pero eso no invalida el sistema. Lo hace más honesto.

Un Student ID robusto no es una excusa para desentenderse de los datos. Es una forma de tomárselos en serio.

La minimización no empobrece el análisis

Uno de los principios básicos del RGPD es la minimización de datos: los datos personales deben ser adecuados, pertinentes y limitados a lo necesario para los fines del tratamiento. En educación, este principio tiene una traducción muy concreta: no debemos darle a la IA más información de la que necesita para cumplir la finalidad pedagógica que hemos definido.

Esto no significa mutilar tanto la evidencia que pierda sentido. Si el objetivo es analizar la calidad de una argumentación, necesitaremos la respuesta completa o una parte suficiente de ella. Si el objetivo es detectar errores de procedimiento, necesitaremos el desarrollo del ejercicio. Si queremos observar patrones de comprensión lectora, necesitaremos respuestas reales.

Pero muchas veces añadimos información por comodidad, no por necesidad. Nombre, grupo, comentarios personales, contexto familiar, datos de comportamiento, referencias internas o detalles que no aportan nada al análisis pueden eliminarse sin empobrecer la intervención pedagógica.

La minimización no consiste en usar menos IA. Consiste en usarla mejor.

Permite formular una pregunta profesional: ¿qué necesita realmente la herramienta para ayudarme a mejorar este proceso de aprendizaje? Todo lo que no responda a esa finalidad debería desaparecer o quedar fuera.

El riesgo de las herramientas externas

El problema se vuelve más delicado cuando el análisis se realiza en herramientas externas al entorno controlado del centro. Muchas aplicaciones de IA son fáciles de usar, rápidas y aparentemente gratuitas, pero al introducir información de alumnos no estamos simplemente “probando una herramienta”. Podemos estar comunicando datos a un tercero o utilizando un servicio cuyas condiciones no han sido valoradas por el centro.

La AEPD ya había advertido sobre el uso de aplicaciones que almacenan datos de alumnos en la nube y sobre la necesidad de que los centros educativos gestionen adecuadamente estos tratamientos. Esta cuestión adquiere todavía más importancia con la IA, porque el valor de la herramienta aumenta precisamente cuando recibe más contexto.

Por eso, no puede recaer todo sobre la intuición individual del docente. Un profesor puede actuar con buena intención y, aun así, introducir información en un entorno que no debería utilizarse con datos reales de alumnos. Hace falta una política de centro que distinga herramientas autorizadas, usos permitidos, datos que pueden tratarse y situaciones que requieren consulta previa.

La buena intención no sustituye un marco institucional.

Feedback, patrones y perfiles

Uno de los usos más prometedores de la IA consiste en analizar evidencias de aprendizaje para detectar patrones. Esto puede ayudar a un profesor a comprender mejor una clase: qué errores se repiten, qué instrucciones no han sido comprendidas, qué criterios de la rúbrica generan más dificultad o qué tipo de feedback necesita el grupo.

Ese análisis puede ser muy valioso. Pero también hay que cuidar cómo se formula y cómo se conserva.

No es lo mismo detectar patrones para ajustar la enseñanza que construir perfiles permanentes de alumnos sin finalidad clara. No es lo mismo analizar un conjunto de producciones para preparar una intervención que acumular durante años informes individualizados generados por IA sin una política de conservación. No es lo mismo un uso formativo y limitado que una capa invisible de seguimiento automatizado.

El peligro no está en detectar patrones. El peligro está en convertir cualquier rastro de aprendizaje en un perfil acumulativo que nadie revisa, nadie explica y nadie sabe cuánto tiempo se conserva.

En este punto, la finalidad vuelve a ser decisiva. Si el análisis sirve para mejorar el feedback, ajustar una secuencia didáctica o preparar una intervención concreta, estamos ante una lógica formativa. Si empieza a condicionar decisiones académicas, clasificar alumnos o producir diagnósticos cerrados, entramos en un terreno más sensible.

La evaluación de impacto no es burocracia cuando el riesgo es real

El RGPD exige realizar una evaluación de impacto relativa a la protección de datos cuando sea probable que un tratamiento, especialmente si utiliza nuevas tecnologías, entrañe un alto riesgo para los derechos y libertades de las personas. Entre los supuestos especialmente relevantes están las evaluaciones sistemáticas de aspectos personales basadas en tratamientos automatizados que puedan servir de base para decisiones con efectos significativos.

Esto no significa que cualquier uso puntual de IA en el aula requiera automáticamente una evaluación de impacto. Conviene evitar el alarmismo. Pero sí significa que ciertos usos deben mirarse con mucha más seriedad: análisis sistemáticos de rendimiento, generación de perfiles de aprendizaje, herramientas que recomiendan itinerarios, sistemas que evalúan automáticamente producciones o plataformas que tratan datos de menores a gran escala.

En esos casos, la protección de datos no es una molestia administrativa. Es parte del diseño educativo responsable.

Porque la pregunta no es solo si el sistema funciona. También hay que preguntarse qué ocurre si se equivoca, si conserva más información de la necesaria, si condiciona decisiones, si alguien interpreta sus salidas como diagnóstico definitivo o si los datos se reutilizan para fines no previstos.

Menores, confianza y educación digital

La LOPDGDD reconoce el derecho a la educación digital y sitúa el uso crítico, seguro y responsable de los medios digitales dentro del sistema educativo. También incorpora previsiones específicas sobre protección de menores en Internet. Esto no impide el uso de IA en educación, pero obliga a entenderlo dentro de una cultura de responsabilidad.

Los alumnos no son usuarios abstractos. Son personas en formación. Muchas veces no comprenden del todo qué implica subir información a una herramienta, aceptar condiciones, grabarse, compartir una producción o interactuar con un sistema que puede conservar trazas de esa interacción.

Por eso el centro debe pensar no solo en lo que la IA permite, sino en lo que enseña su uso. Si un alumno aprende que cualquier producción puede circular por herramientas externas sin explicación, estamos educando mal. Si aprende que sus evidencias pueden analizarse con finalidad formativa, con protección, con límites y bajo responsabilidad docente, estamos construyendo una cultura digital mucho más sólida.

La protección de datos no debe presentarse como enemiga de la innovación. Debe presentarse como una condición de confianza.

La posición de PedagoIA

PedagoIA no defiende una escuela paralizada por el miedo a los datos. Pero tampoco una escuela que confunde finalidad educativa con permiso para usar cualquier información en cualquier herramienta.

La IA puede ayudar mucho precisamente porque puede trabajar con evidencias reales de aprendizaje. Puede hacer visible lo que antes quedaba disperso, ayudar a detectar patrones, mejorar la calidad del feedback y permitir intervenciones más ajustadas. Negar esa posibilidad sería reducir artificialmente su valor educativo.

Pero esa posibilidad exige diseño.

Finalidad clara. Minimización. Seudonimización robusta cuando proceda. Herramientas adecuadas. Acceso restringido. Conservación limitada. Supervisión docente. Destrucción de correspondencias cuando dejen de ser necesarias. Ausencia de decisiones automáticas sobre el alumno.

Estas condiciones no son un obstáculo para usar IA. Son lo que permite usarla de forma defendible.

La pregunta no es si una producción real puede ser analizada con ayuda de IA. La pregunta es si el centro y el docente han diseñado las condiciones para que ese análisis sirva al aprendizaje sin exponer innecesariamente al alumno.

La IA necesita datos para funcionar.

La educación necesita confianza para tener sentido.

Y una escuela que quiera integrar IA con seriedad tendrá que proteger ambas cosas: la posibilidad de analizar el aprendizaje real y el derecho del alumno a no convertirse en un conjunto de datos tratado sin criterio.

El verdadero riesgo no está siempre en la IA.

Muchas veces está en olvidar que detrás de cada dato educativo hay una persona aprendiendo.

Fuentes normativas consultadas

Reglamento (UE) 2016/679, Reglamento General de Protección de Datos. En particular, definiciones de dato personal y seudonimización, principios relativos al tratamiento de datos personales, minimización y evaluación de impacto relativa a la protección de datos.
Ley Orgánica 3/2018, de Protección de Datos Personales y garantía de los derechos digitales. En particular, artículos sobre derecho a la educación digital y protección de menores en Internet.
Agencia Española de Protección de Datos, Guía para centros educativos y orientaciones sobre aplicaciones que almacenan datos de alumnos en la nube.

Más artículos Solicitar formación