Kvindelige politikere er oftest ‘smukke’ eller ‘hysteriske’, mens de mandlige politikere er ‘modige’ og ‘selvstændige’.
Der er forskel, på de ord, sprogmodeller knytter til kvindelige politikere og deres mandlige kolleger, når modellerne for eksempel skal give auto-forslag til søgninger på Google og andre søgemaskiner.
Det viser et igangværende studie udført af forskere fra Københavns-, Zürich og Cambridge Universitet, skriver Københavns Universitet i en pressemeddelelse.
Medforfatter på projektet Isabella Augenstein, lektor på Københavns Universitet, forklarer i pressemeddelelsen, at alt imens computerne ofte knytter ord, der beskriver udseende, svagheder og familiemæssige status, til kvinderne, så kan deres mandlige kolleger omvendt forvente at blive beskrevet ud fra deres handlekraft og politiske overbevisning.
»Hvor kvinderne beskrives med ord som ’hysterisk’ og ’skrøbelig’, bliver de mandlige politikere behæftet med ord som ’selvstændig’ og ’modig,« udtaler hun, ifølge Københavns Universitet.
Det er problematisk, da det kan forstærke den måde, vi tænker og taler om hinanden på ude i virkeligheden, lyder det fra Isabella Augenstein.
Der er tale om et igangværende forskningsprojekt, hvor forskerne er dykket ned i et større datasæt for at kigge nærmere på, hvordan 250.000 politikere beskrives i sprogmodeller på tværs af seks sprog: Engelsk, arabisk, hindu, spansk, russisk og kinesisk, skriver Københavns Universitet.
Datasættet bygger på en liste over politikerne på et opslagsværk ved navn wikidata, og navnene er efterfølgende blevet sat ind i en sprogmodel, der kan komme med det mest sandsynlige adjektiv i en sætning.
Sprogmodellerne trækker ikke kun på data fra hjemmesider, sociale medier og Wikipedia, men også fra den måde, vi skriver om hinanden på, lyder det i pressemeddelelsen.
Ifølge Isabelle Augenstein kan det derfor være en udfordring at få bugt med de stereotype og sexistiske kategoriseringer, skriver Københavns Universitet.
»Løsningen er dobbeltsidig. Vi skal forsøge at holde en god tone, når vi skriver på nettet. Samtidig bør vi overveje at basere sprogmodeller på data, der i mindre grad indeholder sexistiske og racistiske vendinger. Herhjemme kunne man eksempelvis basere modellerne på tekstdata fra kilder med høj kvalitet, eksempelvis Danmarks Radio, hvor de sproglige standarder generelt er højere end på sociale medier, og andre lande kunne gøre noget tilsvarende,« siger hun.
rf