
Estudio revela los desafíos para eliminar datos sensibles en sistemas de inteligencia artificial
- Admin
- julio 9, 2025
- Tecnología
- ChatGPT, derecho al olvido, Inteligencia Artificial, protección de datos, Seguridad Digital
- 0 Comments
Una investigación realizada por la Universitat Rovira i Virgili (URV) en Tarragona, España, ha puesto de manifiesto las dificultades que existen para aplicar el “desaprendizaje” en modelos de inteligencia artificial (IA). El estudio subraya la necesidad de desarrollar métodos más eficaces que permitan la eliminación segura de información personal o delicada en estos sistemas.
El equipo analizó la eficacia de las técnicas actuales para borrar datos en modelos de lenguaje avanzados, como ChatGPT, Mixtral, Bard o Copilot. Estas herramientas buscan eliminar contenido personal, erróneo o discriminatorio, pero los resultados indican que no hay un método infalible para garantizar su supresión total, excepto reentrenar el modelo desde cero excluyendo la información problemática.
Este hallazgo plantea un conflicto con el derecho al olvido, establecido en el Reglamento General de Protección de Datos (RGPD) de la Unión Europea, que exige la eliminación de datos personales cuando lo solicite el afectado. Las empresas detrás de estos sistemas entrenan sus modelos con cantidades masivas de datos para optimizar su funcionamiento, lo que complica la identificación y eliminación selectiva de información específica.
Enfoques para el desaprendizaje en IA
Los investigadores identifican dos estrategias principales: la primera implica reentrenar el modelo por completo, un proceso con alto costo computacional; la segunda, más ágil, intenta borrar solo ciertos conocimientos sin reconstruir el sistema, aunque sin garantías absolutas.
Además, el estudio señala que aún se desconoce con exactitud cómo se almacena la información en estos modelos, incluso para sus propios desarrolladores.
Como conclusión, los expertos destacan la urgencia de diseñar nuevos métodos de entrenamiento que integren el desaprendizaje desde el inicio, como estructurar los datos en módulos que permitan suprimir segmentos específicos sin afectar el rendimiento global del sistema.
Con informaciones de EFE
Las imágenes utilizadas en este artículo fueron extraídas de Pexels.com bajo su licencia libre de uso comercial.
Leave A Comment