Análisis / Cumplimiento y gobernanza

Anonimización vs. seudonimización vs. agregación, explicadas

DataSupplier·15 min de lectura

Estos tres términos se usan a menudo indistintamente, pero bajo el GDPR significan cosas muy distintas, con consecuencias muy distintas para el uso de los datos. Acertar con la distinción es lo que hace que un conjunto de datos sea seguro para compartir, analizar o entrenar un modelo. Esta guía explica cada uno, los riesgos y cómo elegir.

Cobertura en toda la UE. DataSupplier localiza y entrega estos datos en los 27 países de la Unión Europea —incluidos Alemania, Francia, España, Italia, Países Bajos y Polonia— y en el EEE, en el formato y la cadencia que necesite.

Por qué importa la distinción

Que los datos estén anonimizados, seudonimizados o meramente agregados determina si el GDPR sigue aplicándose, qué puede hacer con ellos y cuánto riesgo de reidentificación asume. Tratar los datos seudonimizados como si fueran anónimos es uno de los errores más comunes, y más costosos, de los proyectos de datos.

Anonimización

La anonimización impide de forma irreversible la identificación de personas. Bien hecha, los datos anonimizados quedan fuera del ámbito del GDPR, porque ya no son datos personales. El listón, sin embargo, es alto: los datos solo son anónimos si las personas no pueden ser reidentificadas por ningún medio que razonablemente pueda emplearse, teniendo en cuenta otros conjuntos de datos disponibles. Una anonimización débil que pueda revertirse, o vencerse al vincularla con otros datos, no cumple.

Seudonimización

La seudonimización sustituye los identificadores por tokens, de modo que los datos ya no pueden atribuirse a una persona sin información adicional guardada por separado. Es una salvaguarda valiosa, explícitamente fomentada por el GDPR, pero los datos seudonimizados siguen siendo datos personales y permanecen dentro del ámbito del Reglamento. Reducen el riesgo; no eliminan las obligaciones.

Agregación

La agregación combina registros en estadísticas a nivel de grupo, como totales o promedios por área o segmento. Los resultados agregados pueden ser anónimos si los grupos son lo bastante grandes y el diseño impide inferir sobre individuos, pero las celdas pequeñas o las combinaciones inusuales aún pueden revelar la identidad. La agregación es potente para la analítica y la elaboración de informes, pero debe diseñarse, no darse por hecha.

El riesgo de reidentificación

El riesgo central en los tres es la reidentificación por vinculación: combinar un conjunto de datos «seguro» con otros datos para singularizar a personas. Los cuasiidentificadores como el código postal, la fecha de nacimiento y el sexo pueden, juntos, identificar a una proporción sorprendente de una población. Existen técnicas como la k-anonimidad, la l-diversidad y la privacidad diferencial para gestionar esto, cada una con compromisos entre privacidad y utilidad.

Los datos sintéticos como alternativa

Cuando incluso los datos reales bien tratados son demasiado arriesgados o no están disponibles, los datos sintéticos —generados para reflejar la estructura y las estadísticas del original sin contener registros reales— pueden permitir avanzar en el desarrollo, las pruebas y parte de la analítica. Cada vez se usan junto a la anonimización en lugar de en su lugar.

Cómo elegir

Parta del caso de uso y del apetito de riesgo. Si el objetivo es eliminar por completo las obligaciones del GDPR y el uso puede tolerar cierta pérdida de detalle, una anonimización robusta o la agregación pueden encajar. Si necesita datos a nivel de registro para una finalidad controlada, la seudonimización con salvaguardas sólidas suele ser la respuesta. Sea cual sea la elección, documente la técnica, el riesgo residual y el razonamiento, porque evidenciar la decisión forma parte del cumplimiento.

Puntos clave

Los datos anonimizados quedan fuera del GDPR; los seudonimizados no.
La anonimización debe resistir la reidentificación por cualquier medio razonablemente probable.
La agregación puede ser anónima, pero solo si se diseña para impedir la inferencia.
Documente la técnica, el riesgo residual y el razonamiento.

Este artículo es información general, no asesoramiento jurídico. Confirme las obligaciones para su situación con asesores cualificados.

Fuentes y lecturas adicionales

EUR-Lex: Reglamento (UE) 2016/679 (GDPR), incluidos los considerandos sobre anonimización y seudonimización.
Grupo de Trabajo del Artículo 29: Dictamen 05/2014 sobre técnicas de anonimización.
Comité Europeo de Protección de Datos (CEPD): orientación sobre seudonimización.
ENISA: informes sobre seudonimización de datos y riesgo de reidentificación.

¿Necesita datos seguros para usar?

Anonimizamos, seudonimizamos, agregamos o generamos datos sintéticos según su caso de uso, con la técnica documentada y el razonamiento del riesgo residual. Obtenga un presupuesto sin compromiso.

Solicitar presupuesto Reservar una llamada de 30 minutos

Relacionado

GDPR para datos externos: bases legales, roles y transferencias → Datos sintéticos: empiece a desarrollar antes de que los datos de producción estén listos →