La anonimización de los datos y la nueva Guía publicada por la AEPD
El pasado 2 de noviembre de 2022, la Agencia española de Protección de Datos (AEPD) ha publicado una “Guía básica de anonimización” elaborada por la Autoridad Nacional de Protección de Datos de Singapur (PDPC) y que, contando con la colaboración de la referida autoridad, ha sido traducida al castellano por su relevancia y valor didáctico para responsables, encargados de tratamientos y delegados de protección de datos tambien a nivel local.
En este sentido, la Guía en cuestión tiene como objetivo principal proporcionar una unas guidelines o recomendaciones prácticas sobre cómo proceder a la anonimización y desidentificación de datos.
Además, la Guía se complementa con una herramienta gratuita y descargable para que todo tipo de organizaciones puedan anonimizar los datos tratados correctamente y mediante la implementación de técnicas sencillas que permitan conseguir el fin perseguido.
¿Qué es la anonimización de los datos?
La anonimización de los datos es aquella técnica mediante la cual un conjunto de datos deja de guardar relación con una persona física identificada o identificable, siendo la finalidad de esta práctica la de ofrecer mayores garantías de privacidad a los usuarios por parte de las empresas (Considerando 26 del Reglamento General de Protección de Datos – RGPD)
En términos más técnicos, se trata de un proceso mediante el cual se procede a la alteración de los datos, codificando e encriptando los identificadores clave de los mismos, de tal forma que la información quede almacenada de manera segura y se a muy complicado la identificación del titular de los referidos datos.
Anonimización vs seudonimización
La gran diferencia entre los tratamientos de anonimización y seudonimización consiste en que, mientras que con la aplicación de las técnicas de anonimización se genera un único y nuevo conjunto de datos, el tratamiento de seudonimización genera dos nuevos conjuntos de datos: (a) los datos anonimizados y, por ende, no atribuibles a una persona física identificada o identificables, y (b) información adicional que permite revertir el proceso de la anonimización para la reidentificación del sujeto al que corresponden dichos datos.
Es decir, los datos se considerarán anonimizados en la medida en que dicho proceso no pueda ser revertido y que no exista una probabilidad razonable de que la persona cuyos datos han sido anonimizados pueda ser identificada, motivo por el cual dichos datos no entrarían dentro del ámbito de aplicación del RGPD. Por su parte, los datos seudonimizados seguirán siendo considerados como datos personales en tanto en cuanto dicho proceso puede ser revertido y el hecho de que no se suprime el vínculo entre los datos y ello puesto que, junto con los datos seudonimizados, existe información adicional que, aunque figura por separado y esté sujeta a medidas técnicas y organizativas, si es utilizada puede suponer la identificación de los individuos.
Recomendaciones de la AEPD sobre la anonimización de datos personales
Una de las principales recomendaciones de la AEPD para la adecuada anonimización de los datos personales tratados por grandes y pequeñas empresas es el uso del valor conocido como “k-anonimidad” mediante el cual se podrá medir o comprobar la efectividad real del proceso de anonimización llevado a cabo por parte de un responsable sobre un conjunto de datos.
El proceso de k-anonimización se puede conseguir a través de dos procesos: la generalización o la eliminación de datos, los cuales básicamente consisten en sustituir variables de información concreta por otras más genéricas, conservando el dato relevante y generalizando o eliminando otros, sin que esto suponga introducir datos nuevos o erróneos.
No obstante lo anterior, se ha de tener en cuenta que conseguir una buena k-anonimización puede suponer la perdida de fidelidad de los datos, cuestión que será irrelevante si los datos que se pierden no son necesarios para la finalidad del tratamiento. En el caso de que se pierda información relevante, se debe intentar conseguir un equilibrio entre el riesgo para los sujetos de ser identificado y la potencial pérdida de fidelidad del resultado.