Czym jest anonimizacja i pseudonimizacja danych? Dlaczego nie powinniśmy używać tych pojęć zamiennie? Jakie błędy najczęściej popełniają pracownicy w przypadku stosowania niniejszych rozwiązań oraz ich nazewnictwa?
Pseudonimizacja i anonimizacja to pojęcia, które dosyć często występują w odniesieniu do przetwarzania danych. Pomimo tego, że oba te terminy nierozerwalnie związane są z ochroną danych osobowych, to znacznie się od siebie różnią. Pracownicy wielokrotnie stosują je zmiennie w formie synonimicznej lub korzystają z nieistniejącego pojęcia zbudowanego z połączenia tych dwóch terminów jakim jest pseudoANOnimizacja.
Słowo pseudoANOnimizacja to pojęcie merytorycznie niepoprawne, stanowiące BŁĄD.
Czym jest zatem anonimizacja danych?
Termin oznacza nieodwracalne uniemożliwienie zidentyfikowania określonej osoby. Inaczej mówiąc, anonimizacja oznacza, że w efekcie naszych działań nie jest możliwe ustalenie, jakiej osoby fizycznej dotyczy dany dokument, zestawienie czy informacja. Z uwagi na to, że po dokonaniu anonimizacji nie jest możliwe zidentyfikowanie, jakiej osoby fizycznej dotyczy informacja, dokumenty anonimizowane nie podlegają zasadom ochrony danych. Inaczej mówiąc, nie stosuje się w takim przypadku przepisów RODO. Anonimizacja zdaje się być dobrym rozwiązaniem tylko wtedy, gdy administrator chciałby zapewnić całkowite i nieodwracalne wyłączenie dostępu do danych.
Powszechnie znanym sposobem anonimizacji danych występujących na papierze było zakreślanie danych czarnym markerem (a czasem dodatkowe kserowanie pozakreślanej strony, w celu uniemożliwienia „przebijania” tekstu spod zamazanego fragmentu). Z takimi sposobami anonimizacji dokumentów można było się spotkać przykładowo w prokuraturach. Po dokonaniu anonimizacji, administrator nie posiada w zasadzie żadnych technicznych możliwości przywrócenia tekstu do stanu oryginalnego i ponownego ujawnienia usuniętych danych.
Pseudonimizacja
Drugie ze wskazanych pojęć, tj. „pseudonimizacja” oznacza przetworzenie danych osobowych w taki sposób, by nie można ich było przypisać konkretnej osobie, której one dotyczą, bez użycia dodatkowego „klucza”. Mówiąc prościej, to użycie zamiast np. imienia i nazwiska – liczby. Wymóg jest jeden, klucz z właściwymi danymi do odszyfrowania powinny być przechowywane osobno. Dzięki czemu nawet jeśli doszłoby do wycieku, osoba nieupoważniona niewiele by się z tych danych dowiedziała. Pseudonimizacja jest procesem odwracalnym.
Tym co odróżnia pseudonimizację od anonimizacji, jest jeden istotny szczegół. Dane, które są speudonimizowane można przypisać do konkretnych osób fizycznych (np. za pomocą odpowiedniego programu lub specjalnego klucza). W przypadku danych zanonimizowanych, takie przypisanie nie jest możliwe.
Pamiętaj!
- Dane osobowe, które zostały speudonimizowane, dalej są danymi osobowymi. Czyli jeśli speudonimizujemy naszą bazę danych, jednocześnie wciąż mogąc w każdej chwili przypisać te pseudonimowane dane do konkretnych zidentyfikowanych lub możliwych do zidentyfikowania osób (np. znanych nam z imienia i nazwiska), to wciąż przetwarzamy dane osobowe i podlegamy pod RODO.
- Jeśli przetwarzamy zanonimizowane informacje, nie mamy szans na odwrócenie procesu i identyfikację osób. W tym przypadku w ogóle nie stosujemy RODO! Twórcy adresują tę furtkę przede wszystkim do celów badań naukowych i statystycznych.
Mamy nadzieję, że nasz wpis przedstawił praktyczną stronę rozumienia powyższych pojęć i ich właściwe wykorzystanie w codziennej pracy.
Zespół CUI