
Forskarna Neil Fasching och Yphtach Lelkes har nu genomfört en stor jämförande analys av AI-system som modererar innehåll online. Forskarna finner betydande skillnader i hur artificiella intelligensspråkmodeller klassificerar hatpropaganda, med särskilt stora variationer när det gäller språk om vissa grupper.
Flera av de ledande AI-företagen lovar automatisk moderering av innehåll i sina produkter. Flera av de stora sociala medieplattformarna använder också artificiell intelligens för att moderera inlägg och kommentarer.
”Privata teknikföretag har i praktiken blivit de som bestämmer vilket språk som är tillåtet på den digitala offentliga arenan, men de gör det utan någon konsekvent standard”, säger forskaren Yphtach Lelkes i ett pressmeddelande.
”Forskningen visar att system för innehållsmoderering är mycket inkonsekventa i hur de bedömer identiska hatiska yttranden, där vissa system flaggar innehåll som skadligt medan andra anser det acceptabelt”, säger Fasching i pressmeddelandet.
Detta var särskilt tydligt när forskarna testade uttalanden om utbildning, ekonomisk klass eller personliga intressen. När uttalandena handlade om etnicitet, kön eller sexuell läggning var modellerna mer konsekventa.
Detta tyder på att vissa grupper får bättre skydd än andra – och att systemen reagerar starkare på hat mot traditionellt ”skyddade” grupper, enligt forskarna.
Professor Jonas R. Kunst vid BI Norwegian Business School forskar bland annat om digital påverkan. Han säger att studien visar att språkmodeller inte för oss närmare en objektiv sanning om vad hatpropaganda är. ”Modellerna är bara en återspegling av träningsdata, som är djupt kulturellt betingade, samt de designval och värderingar som utvecklarna har byggt in i systemet. Detta ger teknikföretagen en enorm makt att definiera gränserna för den offentliga debatten”, säger Kunst till forskning.no.
”Modellernas inbyggda förståelse är kalibrerad efter den amerikanska sociala och politiska verkligheten. Detta skapar en allvarlig snedvridning, eftersom den norska förståelsen av hatpropaganda är formad av en annan historia och kultur.”