Selv når din data er anonymiseret, kan du ofte identificeres

Selvom du bliver lovet anonymitet, kan du ikke altid være sikker på, om din identitet i realiteten bliver holdt skjult. (Foto: Shutterstock)

Selvom du bliver lovet anonymitet, kan du ikke altid være sikker på, om din identitet i realiteten bliver holdt skjult. (Foto: Shutterstock)

Kilde: 
24 juli 2019

Du har sikkert prøvet at svare på et spørgeskema, der har forsikret dig om, at din besvarelse er fuldstændig anonym. Men hvor sikker kan man egentlig være på dette?

Ikke særligt sikker, ifølge et nyt studie, der er blevet udgivet af tidsskriftet Nature Communications.

Det skriver Technology Review, ifølge Version2.

Forskere og virksomheder bruger ofte anonymisering, når de skal dele datasæt, for at undgå at blive ramt af GDPR-regler. Men denne anonymisering består ofte blot af at fjerne de mest åbenlyse informationer som navn og CPR-nummer.

Og ifølge det nye studie er dette er ikke altid nok, da man let kan identificere folk uden disse informationer.

I studiet kommer forskerne blandt andet frem til, at man ved hjælp af 15 egenskaber kan identificere 99,98 procent af alle mennesker i den amerikanske stat Massachusetts.

Forskere og virksomheder forsøger ofte at imødegå dette problem ved at sample dataene. Det vil sige, at de kun offentliggør en lille del af deres data. Dermed bliver det sværere at afgøre, om en søgning med kun et resultat nødvendigvis er en specifik person, da der kan være andre med tilsvarende egenskaber i den ikke offentliggjorte data.

Forskerne bag det nye studie er dog kommet frem til, at man alene ved hjælp af fødselsdato, postnummer og køn kan identificere enhver amerikaner med hele 83 procents sikkerhed.

Det fulde studie kan læses i tidsskriftet Nature Communications.

jsj

Ovenstående er udvalgt og resumeret af Videnskab.dk, men redaktionen har ikke udført selvstændig research. Gå til den oprindelige kilde for flere detaljer.