Skrevet af DavidK Udgivet  0 kommentarer

Misinformation fra IT-universitetet

Den lidt mere underlødige pseudo-forskning er nu også sevet ind på STEM-studierne

Betragt 𝕏'et her nedenfor til venstre, skrevet af en Luca Rossi som er lektor på IT Universitetet:

Se original tweet.

En dansk oversættelse kunne se nogenlunde sådan her ud:


Vi fortsætter vor undersøgelse af #hatespeech på danske sociale medier. Vi ser fortsat, som observeret de senere måneder, at muslimer er det primære mål, samt bekymrende lange reaktionstider fra de forskellige SoMe-platforme


Se, det er noget af en påstand som kunne være interessant at få belyst med transparente tal og statistik. Sådan er videnskab jo - det er ikke "gæt et tal" - men især ønskværdigt fordi det strider med stort set al anden statistik og forskning, man kan finde udgivet om emnet.

Se f.eks Carlsbergfondets meget tilbundsgående analyse fra 2022, "Danskernes oplevelse af had på sociale medier", som er virkelig detaljeret og tegner et noget andet billede. 

Rossi nøjes med at bakke sin påstand op med fem Powerpoint-slides. Her er de tre første :


 Det ser ud som om - men vi ved det ikke, Rossi leverer hverken kilde eller datasæt - at søjlediagrammerne herover repræsenterer et døgns klager på de forskellige platforme.  Vi kan se at

  • Der blev i overvejende grad klaget på Facebook og twitter
  • Begge er generelt forbløffende hurtige til at svare tilbage indenfor 24 timer. I Facebook's tilfælde i 31% af tilfældene; i twitters tilfælde i 17% af tilfældene. 
  • Ud af 222 klager fjernede Facebook 45 opslag, eller 20%. Ud af 224 klager fjernede twitter 50 opslag, eller 22%.
  • Ift "anmeldelser uden feedback" angives for Facebook 84 ud af 222, 38%; for twitter 79 ud af 224, 35%.

Men hov, dette betyder at 62% hhv. 65% fik en slags feedback over deres klage.  Og dette betyder også - det har Rossi pudsigt nok ikke har ulejliget sig med at vise - at flertallet faktisk fik feedback, men at denne feedback i overvejende grad var negativ, eller et afslag! Altså at indberetningen eller klagen blev vurderet som grundløs eller uberettiget. 

For hvor mange negative afslag der præcis er givet, kan vi regne ud ved at trække mængden af uafklarede og fjernede opslag fra det totale antal indberetninger. I Facebooks tilfælde kan vi regne ud at det drejer sig om 93 afslag.  I twitters tilfælde handler det om 95 afslag.

Med andre ord: Antallet af folk som aktivt får afslag er omtrent dobbelt så stort som antallet af dem som får medhold.  Hvis vi antager at de sociale mediers klagesystemer rent faktisk virker, og det gør Rossi i sit udgangspunkt, det eneste han bemærker er langsommelighed, så må den umiddelbare konklusion være, at alt for mange klager af andre grunde end den de angiver. Ellers havde de jo fået medhold. 

Og selvom vi ikke ved det, er det en nærliggende hypothese, at dem som ikke har fået direkte feedback - det svarer stort set til samme andel som har fået afslag - slet og ret har lavet en indberetning af så ringe kvalitet, at hverken Facebook eller twitter / 𝕏 har fundet det umagen værd at levere denne feedback.

Og det fører os til de sidste to og ret opsigtsvækkende slides :


Igen, i forhold til "begrundelser for indberetning", hvad er donut-grafen baseret på? Hverken Facebook eller twitter har så detaljerede klageforme, at man kan angive "had rettet imod muslimer", "alderisme" eller "anti-roma".  Og det ved alle som har prøvet at fabrikere en indberetning eller selv har modtaget en. 

Kategorierne er også overlappende i helt usædvanlig grad, og fokuserer på samme snævre emner.  Der er ikke den store forskel på "racisme", "xenofobi", "anti-roma", "hudfarve" (og 7 andre), de ville være helt meningsløse at implementere for en virksomhed som t.ex Facebook. Det kan derudover undre, at der er så mange kategorier der banalt set drejer sig om kun to forskellige grupper: Indvandrere og LGBT. På et helt døgn er der slet ingen der har klaget over hadtale mod f.eks kristne eller politisk observans? Det sidste er klart det som danskerne hyppigst oplever som "hadtale", ifølge Calsbergsfondet. 

Så måske taler vi om et lille udsnit af et datasæt der består af langt flere indberetninger. Man har støvsøget majoriteten væk, og delt resten op i flere forskellige kategorier. Det ser ikke blot lidt mere fint og tankevækkende ud, det har også potentiale til at give marginale indberetningskategorier meget mere vægt. Og det giver jo bedre overskrifter ...

Her mangler vi virkelig information. Den eneste mulighed er faktisk, at Rossi eller hvem der nu har fabrikeret slidesne' har været i kontakt med indberetterne selv, altså som respondenter via en særlig klageform som ITU eller anden part har stillet til rådighed, og der har de så selv formuleret eller beskrevet en særlig grund til deres klage. Det er ikke noget, som man kan hente ud af SoMe-tjenesternes API'er. Og eneste mulighed i den forbindelse er, at Rossi & co selv har stillet nogle bestemte valgmuligheder til rådighed, for at kunne få nogenlunde ensartede data.

Det er der ikke noget i vejen med, men pludselig har vi en forureningskilde, der ikke har så meget med Facebook eller twitters klagesystemer at gøre, og ikke har med de begrundelser at gøre, som deres moderatorer har handlet ud fra.

Hvad værre er, og her taler vi om sidste slide, så er der absolut ingen forbindelse mellem påstandene i konklusionen og de fire forudgående slides :

Den mest prævalente form for hadtale fundet på Facebook og Twitter var had rettet imod muslimer (ca 45%)

  1. Rossi går i sin konklusion ud fra, at alle dem som har indberettet en klage ikke blot har ret men også fået medhold. Det første ved vi ikke noget om, systemet kan i princippet sagtens være pilskævt,- det andet modsiger hans egne tal fuldkommen, vi er ikke engang i nærheden.
  2. Der var dobbelt så mange som ikke fik medhold i deres indberetning, som fik medhold. Selv hvis vi tog tallene fra slide 4 alvorligt, ville de 45% pludselig være konverteret om til omtrent 9%, altså baseret på at ~20% af klagerne får medhold. Det er jo først "hadtale" i det øjeblik det rent faktisk bedømmes som "hadtale".
  3. Vi ved ingenting om, hvordan fordelingen ift. medhold i indberetninger indenfor de forskellige kategorier ser ud. I praksis kunne samtlige af disse 45% omkring "had rettet mod muslimer" være lige præcis de sager hvor indberetter ikke har fået medhold, eller hvor indberetningen har været af så lav kvalitet, at den ikke blev taget alvorligt.
  4. Et enkelt døgns indberetninger er et ufatteligt smalt talmateriale - så lille at det ikke kan bruges til en pind, det kan nærmest kun bruges til misinformation. Det kan ikke vise en tendens eller noget som helst om virkeligheden, i bedste fald være et slags et øjebliksbillede for den pågældende dag.  Selv hvis vi antager det hele er korrekt, også kategorierne osv, hvad skete der så det pågældende døgn?

Ja, i virkeligheden kunne man blot ved at se på tallene, nå til om ikke en omvendt så en noget anderledes konklusion:

De sociale medier er overbebyrdede af grundløse klager og indberetninger. Nogle grupper bruger klagesystemet mere end andre, uden nødvendigvis at få mere medhold. Her er der to muligheder

  1. Klagesystemet og Rossis tal fortæller mere om visse brugergruppers følelser, dvs. deres egen personlige opfattelse af at være udsat for "hadtale", i de fleste tilfælde ikke om en neutral eller objektiv version af "hadtale"
  2. Klagesystemet og Rossis tal fortæller, at visse brugergrupper i højere grad end andre har taget klagesystemet til sig - det er så at sige blevet weaponized som en slags måde at lukke debatter på, eller som chikaneinstrument. At de ikke får mere medhold i deres indberetninger kunne være indikation på dette. ​

Hvad er egentlig kilden?

Man kan naturligvis møjsommeligt indtaste GA101084457, og så finder man lignende grafik fra diverse lande og / eller organisationer med flotte akronyme navne. 

Der er tydeligvis udviklet en slags fællesskabelon for at udbrede undersøgelserne, perfekt ned til den lyserøde markering som Rossi også bedriver på sit sidste slide - se f.eks her, her og her ... Rossis slides kan ikke fremfindes, akkurat som tallene eller undersøgelsen - hvis den findes - heller ikke kan, men der er et identisk ITU-Fact-sheet-No1.pdf, som man kan gætte på er en slags test.

​​​

0 kommentarer. Skriv en kommentar som gæst eller opret dig som bruger. Gæstekommentarer godkendes før de vises.