lördag 25 februari 2017

Dags för statistiksnack



Det är ohyggligt lätt att gå bort sig i statistikens irrgångar. Till exempel är det vanligt att tro att när två saker samvarierar på ett diagram, så orsakas den ena saken av den andra. Varpå statistiknörden svarar "correlation is not causation". Vad det innebär, och annat matnyttigt, kan man läsa här.

Varför är det så, då? Om vi ser att brotten ökar när invandringen ökar, nog är det väl självklart vad som händer?

Nix. För det första vet vi inte vilken som är den drivande faktorn. En precis lika möjlig hypotes är att syrier och afghaner är konfliktälskande folk - en hypotes som inte direkt motsägs av situationen i deras hemländer. När brottsligheten ökar i Sverige kommer då det att funka som socker för flugor, och mängden hitresande syrier och afghaner naturligt öka.

För det andra så spelar slumpen oss spratt. Upprepar man ett test tillräckligt ofta kommer till sist det osannolika att hända. Om vi om och om igen upprepar ett test som avser prova om högerpopulism orsakar cancer så kommer vi till sist få ett test som säger att så är fallet. Ritar vi slumpvis tagna faktorer i diagram får vi till sist diagram som visar på att saker samvarierar - oavsett om de har några (direkta) orsakssamband eller ej. Som det klassiska exemplet från min första statistikkurs på den goda korrelationen mellan storkar och spädbarn i Tyskland.

Vad gör en klok person då, när en ser en sådan däringa graf om att brottsligheten går upp?

Som ingenjör och naturvetenskapsman skulle jag genast börja fundera på rimliga - och orimliga - förklaringsmodeller. Jag skulle leta upp fler variabler än afghaner, som till exempel tillgång till bostäder, fungerande arbetsmarknad, tillgång till vapen, alkoholproblematik, zombieinvasion eller vad som nu skulle kunna tänkas påverka. Hade detta varit ett ingenjörsproblem hade jag sedan varierat faktorerna, randomiserat för att undvika systematiska försöksplaneringsfel, och mätt hur mycket de påverkar. Det är dock svårt att göra med människor utanför kommunistiska diktaturer, varför man får hitta andra vägar framåt.


Trots att statistiska grundkurser varnar för lättvindiga antaganden av orsakssamband, går folk i fällan hela tiden. Några exempel:


På brittiska vänsterbloggen "Left foot forward" hittade jag ett inlägg där de sågade statistik som sades visa att invandring orsakar brott. Som följande graf:


De påpekade att den för ögat uppenbara samvariationen inte automatiskt innebar att invandrarna orsakade våldtäkterna. Helt korrekt.

Sen stökar de till det för sig. De påpekar att våldtäktsbegreppet vidgats 2005, och hävdar att det är hela skälet till att grafen ser ut som den gör. (Sen missar de att ännu en utvidgning skedde 2013, vilket hade ytterligare stärkt deras hypotes).

Är det inte så, då? Svaret är att det svarar inte grafen heller på. Grafen ger inga orsakssamband. Det kan vara så att hela ökningen beror på nya definitioner. Eller att ökningen beror på kåta invandrare. Eller att de två förklaringsmodellerna delar på äran. Eller att invandringen faktiskt rejält dämpat ökningen, som annars hade varit ännu större. Eller att det är "intervention by aliens" som orsakat alltihop. Riktiga aliens alltså, såna där gubbar från Mars. Återigen: bilden ger inga förklaringar, eller kausala samband som ägghuvudena brukar kalla det. Det kan finnas hur många dolda faktorer som helst bakom bilden.

Vad skulle kunna ge information? Tja, till exempel om BRÅ publicerade statistik för hurpass överrepresenterade invandrare av olika kategorier är. Om man där till exempel ser att, procentuellt sett,  somaliska invandrare är tio gånger mer förekommande i brottsstatistiken än svenskar, så kan man ju raskt forma hypotesen att det vore smart att inte ta in fler somalier om man vill ha färre våldtäkter i landet. Eller, om man har annan ideologisk färg, gå ut på gator och torg och demonstrera emot det rasistiska svenska rättsväsendet. Statistik tas fram i mängd av BRÅ, även för sexualbrott, men om det finns någon bra sammanställning uppspaltat på gärningsmannens härkomst vete sjutton.



På facebook sågade Anders Nilsson(S) Tino Sanandajis siffror. "Tinos siffror", ni vet. Varpå Tino kom in i tråden och tussarna började ryka. Tråden har högt underhållningsvärde.

Jag hoppas att jag förstår Nilsson rätt här. Såvitt jag fattar det så anser han att Sanandajis tes är:
"...omfattningen av brottslighet, arbetslöshet och beroende av försörjningsstöd beror på att vi har många immigranter..."
 Jag måste erkänna att jag själv omfattar den tesen. Om vi inte hade tagit emot invandrare skulle inte K- och M-falangerna i Malmö (som består just av invandrare) ägnat år åt att ta livet av varandra. Om vi inte hade tagit emot hundratusentals invandrare utan utbildning hade dessa invandrare inte varit arbetslösa och beroende av försörjningsstöd. Ja, inte i Sverige, i alla fall.

Nilsson anser att tesen är fel. För att visa att tesen är fel, gör han en jämförelse med Finland. Resonemanget går så här:
  1. Finland och Sverige är väldigt lika: socialt, ekonomiskt och kulturellt.
  2. Antag att invandring orsakar brottslighet.
  3. Sverige har mycket större antal invandrare än Finland.
  4. Alltså: då måste Sverige ha mycket större brottslighet än Finland.
  5. Men: Finland har faktiskt större brottslighet. Alltså är antagandet i punkt 2 ovan falskt.
Någon som ser Nilssons argumentationsfel? Just det. De dolda variablerna.

Vi vet inte vad som ligger bakom skillnaderna mellan Sverige och Finland. Skillnader som, för övrigt, funnits långt före någondera land var invandrarland. Jo, lite "vet" vi ju, som det där att alla finnar är snabba att dra kniv och att de råsuper vodka. Och att de talar så obegripligt att ingen förstår dem, vilket nog kan driva vem som helst att ta till nävarna i desperation.
Efter denna drift med vårt finska broderfolk, som vi svenskar i ärlighetens namn borde vara förbannat ödmjuka gentemot efter att finnarna tampats med den ryska björnen och kommit undan med nationen i behåll: tillbaka till allvaret. Precis som med våldtäktsgrafen tidigare så kan det vara vad som helst som gör att siffrorna ser ut som de gör. Nokias kollaps, Löfvens smidiga näringspolitik, finska vs svenska polisers attityd till invandrarbrottslighet, osv.

Sanandaji kontrar med denna bild, som visar hur brotten minskat i både Finland (blå linje) och Sverige (gul linje).



Här blir det riktigt kul. Nilssons meningsbröder hävdar här att grafen tydligt visar att Sanandaji har fel. Brottsligheten har ju sjunkit i Sverige, samtidigt som invandringen ökat. Då kan ju inte invandring orsaka brottslighet. Sanandaji däremot hävdar att grafen tyder på att den höga invandringen till Sverige är orsaken till att Sveriges brottslighet inte sjunkit lika snabbt som övriga västländer, här exemplifierat med Finland.

Återigen: grafen bevisar ingenting. Den är endast underlag för vidare undersökningar.


Lite senare kommer Nilsson med ett intressant uttalande:
"Sanandaji ger utförligt svar på frågan om vem som löper risk att hamna i brottslighet, arbetslöshet och fattigdom - men inte vad det är som bestämmer omfattningen av dessa missförhållanden i samhället."

Här finns lite att bita i! Äntligen kommer vi in på förklaringsmodeller.

Jag tror att både höger och vänster är överens om att fattigdom och misär är en god grogrund för brott. Som Ann Heberlein uttrycker det, så bränner medelklasstanter inga bilar. Att släppa in invandrare i landet är alltså inte per se en väg fram till kriminalitet. En våg av indiska programmerare på våra IT-bolag kommer inte orsaka krav på änkebränning, eller våldtäkter av det slag vi fått rapporterat om från Indien. Om vi däremot tar emot en halvmiljon analfabeta indier från landsbygden, knökar in dem i Rosengård, utestänger dem från (den vita...) arbetsmarknaden via kollektivavtal och låter polisbilarna stå på tomgång på behörigt avstånd medan kravallerna pågår, ja då har vi allt krattat manegen.

Vi har tagit in en stor mängd invandrare på ett sätt som gör att de hamnar i fattigdom. Fattigdom orsakar kriminalitet. Vad kan vi förvänta oss? Att strida om ifall det är invandringen eller fattigdomen som orsakar kriminaliteten är då mest en lek med ord, väl?

Nja. Det spelar viss roll när vi ska diskutera åtgärder. Om fattigdomen är det enda problemet så är det ju bara att ösa pengar över våra problemområden tills invånarna inte längre är fattiga. Då kommer alla problem försvinna. Om vi nu för ett ögonblick bortser från att vi inte har oändligt med pengar, och inte heller oändligt med lärare, socialassistenter och poliser. Men när vi väl har tillsatt tillräckligt med pengar, så återstår kulturella problem. Klankulturer, hederskulturer och så vidare. Kulturer som tyvärr inte byts ut mot ett folkpartistiskt sinnelag vid passage av svenska gränsen.


Ett sista citat från Nilsson:
"Om Sverige utmärker sig i internationell jämförelse är det att dessa missförhållanden är mindre utbredda här än i länder med större klyftor, oavsett att immigrationen och i synnerhet flyktingimmigrationen har varit större hos oss än på många andra håll."
Här anser jag att Nilsson är helt fel ute. Tvärtom. Det är i länder med stora klyftor som migranterna har en chans att integreras. Länder där jobb som skoputsare, toalettvakt och matkassepackare fortfarande existerar. Länder där de syrier och afghaner som faktiskt har utbildning har lättare att få användning för sin utbildning.

3 kommentarer:

  1. http://www.tylervigen.com/spurious-correlations

    SvaraRadera
  2. För att spä på osäkerhetskalkylen ytterligare i jämförelsen mellan Sverige och Finland så kan man nog tänka sig att det i Finland fortfarande lönar sig att anmäla brottslighet till polisen medan det i Sverige knappast är lönt! Folk skiter i att anmäla brott för man vet att polisen inte gör ett skit och dessutom, invandrare undviker i stort sett att anmäla brott till polisen vilket gör att statistiken för Sveriges del blir bättre än den i verkligheten är.

    Benny

    SvaraRadera
  3. Fast om man trots vetskapen om bristen på säker kausalitet använder korrelation som grund för sina beslut kommer man väl i genomsnitt få bättre resultat än om man singlar slant? Eller tänker jag fel här?

    SvaraRadera