FODA de experiencias de evaluación basadas en IA
Los autores de las universidades turcas de Bingöl y de Bayburt detectaron la necesidad de una valoración de las dimensiones pedagógica, técnica y ética de sistemas que soportan sus procesos de evaluación en línea de los aprendizajes con inteligencia artificial (AI-SOAE, por sus siglas en inglés). Realizaron una revisión sistemática que usó metodología PRISMA y que aplicó un análisis FODA (fortalezas, oportunidades, debilidades y amenazas) a una muestra de 98 artículos publicados entre 2018 y 2025.
Los métodos tradicionales para evaluar resultan inadecuados para valorar el desempeño de estudiantes en línea, de una forma objetiva, personalizada y veloz. Por ello se han desarrollado los análisis de los logros del estudiantado soportados en IA, con lo que es posible identificar tempranamente brechas y aportar retroalimentación inmediata. Estos sistemas se han beneficiado con la integración de grandes modelos de lenguaje. La evaluación de preguntas abiertas, la generación de retroalimentaciones basadas en rúbricas y los apoyos a la evaluación formativa son ejemplos de estos avances. Con ello, se reduce la carga de trabajo del docente, se acelera el proceso de calificación y se enriquece la experiencia a partir de información personalizada sobre el desempeño de cada estudiante. También es posible crear pruebas adaptativas con conjuntos dinámicos de preguntas de acuerdo con el nivel de cada estudiante.
El propósito del estudio fue evaluar el uso justo, sustentable y ético de estas tecnologías en educación al examinar las fortalezas y debilidades de sistemas AI-SOAE en el marco del análisis FODA, con base en literatura contemporánea. FODA es una aproximación desarrollada en la década de 1960 para el análisis estratégico en organizaciones. Se usó también el modelo TAM (de aceptación de la tecnología, desarrollado por Davis en 1989) que se fundamenta en la premisa de que los usuarios tienden a aceptar la tecnología con base en su percepción de utilidad y facilidad de uso.
Iniciaron con una muestra de 1,005 estudios, pero al aplicar los filtros de criterios de inclusión y exclusión, al eliminar los artículos repetidos en las diferentes bases (WoS, Scopus y ERIC) y al desechar aquellos que no eran artículos, no estaban escritos en inglés, no eran de acceso abierto o no resultaban directamente relacionados con el tema, la muestra se redujo a 98. El análisis de contenido se llevó a cabo en dos fases: los temas se extrajeron con código abierto y después se categorizaron en el marco FODA. Es decir, el análisis temático se hizo y los temas resultantes se clasificaron en las categorías FODA, con lo que este marco se usó no solo como una herramienta descriptiva sino con una función sintética y analítica.
Los resultados indican lo siguiente. Las principales fortalezas de los sistemas AI_SOAE, en orden de importancia, fueron: retroalimentación, personalización, evaluación avanzada, validez y confiabilidad, al igual que eficiencia y apoyo en decisiones con base en datos. Ello indica que los sistemas están madurando en cuanto a aspectos tanto técnicos como funcionales en la educación superior. El uso de evaluaciones adaptativas, analíticas del aprendizaje y modelos de aprendizaje profundo permiten una evaluación más precisa y dinámica del desempeño del estudiante, lo que puede describirse con un “incremento en la resolución”, con la posibilidad que ofrecen estos sistemas de aportar valoraciones más precisas y objetivas.
En cuanto a las debilidades, las tres categorías principales que surgieron son: problemas técnicos, sesgos y limitaciones del algoritmo, así como experiencias y percepciones negativas. Además de las problemáticas con la corroboración de datos biométricos y el monitoreo que afectan la experiencia de los estudiantes, es importante mencionar que estos sistemas impactan sus niveles de estrés y ansiedad. Por otra parte, en cuanto a sesgos y prejuicios, se hace necesario abordar dimensiones como equidad, transparencia y explicabilidad, en particular al adaptarse a contextos culturales, lingüísticos y pedagógicos diferentes.
En lo relativo a las oportunidades, surgieron cuatro categorías: transformación pedagógica, desarrollo de procesos de evaluación, integración tecnológica y transformación digital, así como competencia institucional y cambio cultural. Ello lleva a considerar la innovación pedagógica, la internacionalización y la digitalización institucional como avenidas potenciales de desarrollo.
Finalmente, en cuanto a las amenazas, se delinearon seis categorías: falta de información y conciencia, falta de guía, vacíos de investigación, privacidad y seguridad de datos, dificultades en la implementación, preocupaciones sobre integridad académica, así como inquietudes sobre derechos humanos, justicia y ética. Estos elementos apuntan a que no existen suficientes lineamientos, protocolos y políticas como apoyo a los usuarios.
Concluyen que los sistemas AI_SOAE demuestran su potencial para contribuir a la calidad en educación superior, así como que las fortalezas y oportunidades halladas soportan la sustentabilidad del aprendizaje a través de funcionalidades como la retroalimentación válida e inmediata, las trayectorias adaptativas y los ciclos de evaluación. También resulta importante atender las debilidades y amenazas para crear ecosistemas de aprendizaje sostenibles.
Üstün, A.G., Kayali,B. y Yavuz,N. (2026). Artificial intelligence supported online assessment and evaluation in higher education: A systematic review with SWOT analysis. SAGE Open, 1-26. DOI: 10.1177/21582440261423669