2. Begrepp och metoder

Här lär du dig mer om statistiska begrepp och metoder.

Avsnittet innehåller tre delar och allt material är fritt att dela och använda.

  1. Utbildningstexter
  2. En powerpoint:
    Begrepp och metoder, ppt Powerpoint, 1.2 MB, öppnas i nytt fönster.
  3. Film:

Kan du engelska och vill lära dig mer om statistik och även göra statistiska beräkningar?
Då är det här en bra webbplats: https://www.socscistatistics.com/default.aspx Länk till annan webbplats, öppnas i nytt fönster.

Urval, rekrytering och kontrollgrupp

Urval

Kan du inte fråga varje person i den grupp du är intresserad av så behöver du göra ett urval. Till exempel så frågar vi inte alla svenskar när vi vill veta något om alla svenskar. Istället gör vi ett urval. Då kan det räcka med att fråga några tusen personer och ändå kan vi använda det för att dra slutsatser om alla.

För att det ska fungera behöver vi ha gjort ett representativt urval. Det betyder att sammansättningen av personer i ditt urval liknar sammansättningen av personer i hela gruppen.

Vi gör urval för att det är praktiskt, för att spara pengar och för att vi inte ska störa fler personer med våra frågor än vad som behövs för att få pålitliga svar.

Urval brukar ofta baseras på till exempel kön, ålder, utbildningsbakgrund, inkomst. Men man kan också göra andra typer av urval.

På Begripsam försöker vi till exempel ta reda på om personer anser att internet är svårt på grund av den funktionsnedsättning de har. Då har vi gjort ett urval av funktionsnedsättningar och diagnoser som vi tror kan påverka internetanvändningen. Vi utgår från att en person som till exempel har astma inte skulle koppla svårigheter att använda internet till den diagnosen medan en person med dyslexi kanske skulle göra det. Så vi har gjort ett urval.

Vill du fråga medlemmar i din intresseorganisation kanske du inte behöver göra ett urval. Då kanske du kan ställa frågor till allihop på en gång.

Hur många svar behövs?

För att du ska kunna lita på dina resultat så behöver du ta bort så mycket slump som möjligt. Är det få personer som svarar är risken för snedvridna resultat stor. Då behöver du tolka ditt resultat med större försiktighet än om du har många svar. Det kan vara så att även ett litet antal svar ger en korrekt bild, men risken är helt enkelt större att bilden inte är korrekt.

Det är svårt att säga exakt hur många svar du behöver. Det beror också på hur du tänker presentera resultatet.

Har du ett litet antal svar och sedan börjar dela upp svaren i exempelvis ålderskategorier så märker du snabbt att det blir mycket få individer i varje kategori.

När vi gör vår undersökning SMFOI, Svenskarna med funktionsnedsättning och internet, har vi som mål att få in minst 100 svar från varje kategori. Det lyckas vi inte med för alla. Vi har tagit fram rapporter för de grupper där vi har över 25 svar. Det är en liten grupp men flera av dessa grupper är också mycket små. Då har vi tänkt att eftersom ingen annan har bättre undersökningar och situationen ofta är helt okänd för dessa grupper så publicerar vi resultatet. Men vi är tydliga med att man behöver vara försiktig med hur resultatet ska tolkas.

Rekrytering

På något sätt behöver du få tag i de personer som du vill ska delta i din undersökjning. Det kallas rekrytering. Har du ett register över dina medlemmar kanske det är underlaget för rekrytering. Andra sätt är att köpa eller få adresser/kontaktuppgifter av någon som har ett register. Det kan du till exempel göra för att få urval ur hela befolkningen.

En speciell form av rekrytering är självrekrytering. Det betyder att du öppet annonserar att du gör en undersökning och uppmanar personer som hör till din målgrupp att delta. När vi i Begripsam exempelvis hjälpte myndigheten Trafikanalys att undersöka tillgängligheten i kollektivtrafiken så uppmanade vi alla som hade synpunkter att delta.

Snöbollsrekrytering

Snöbollsrekrytering kallas det när en deltagare i en undersökning uppmanar andra personer att också delta i undersökningen. Liknelsen är att man får en boll i rullning. Det finns exempel på att en sådan kedja kan ge flera hundra svar. Att denna typ av rekrytering fungerar bygger på att

  • det är stor sannolikhet att en individ i din målgrupp känner en eller flera individer som också är i målgruppen
  • en individ i målgruppen har stor trovärdighet när den rekommenderar en annan individ i målgruppen att också delta i undersökningen.

Kontrollgrupp

Så fort någon frågar "Ja, men hur är det jämfört med..." så kan du behöva ha en kontrollgrupp. Om vi till exempel undersöker hur personer med funktionsnedsättning använder internet så uppstår ju intresset av att veta hur motsvarande användning ser ut bland personer som inte har funktionsnedsättning. I ett sådant exempel blir personer som inte har funktionsnedsättning en kontrollgrupp.

Illustrationen nedan visar hur du från att ha gjort ditt urval skapat både den grupp du vill undersöka och en grupp att jämföra med. När du fått ditt resultat så kan du analysera om det finns skillnader och likheter mellan den grupp du undersöker och din kontrollgrupp.

Schematisk bild över ett urval inom en population och hur man kan jämföra ett resultat mot en kontrollgrupp.

Det ger ofta starkare argument om du kan jämföra och visa att det finns skillnader mellan exempelvis hur dina medlemmar har det mot hur hela befolkningen har det. Då kan du påvisa olika klyftor i samhället och argumentera för att dessa är orättvisa.

Att undersöka små grupper

Skuggundersökning

Med skuggundersökning menar vi att man utgår från en stor och viktig undersökning, men där denna inte ger en tillräckligt detaljerad bild av hur det är för personer med funktionsnedsättningar. I vårt exempel är Svenskarna med funktionsnedsättning och internet en skuggundersökning.

De stora befolkningsundersökningar som görs angående användningen av internet har för få deltagare med funktionsnedsättning. Och många grupper är inte representerade alls. Därför kan man inte dela upp resultatet utifrån exempelvis personers diagnoser eller funktionsnedsättningar.

I avvaktan på att dessa undersökningar bättre börjar representera också personer med funktionsnedsättningar, vilket är en uteckling som går mycket långsamt, så anser vi att man behöver göra kompletterande undersökningar där det säkert ingår personer med funktionsnedsättningar.

Då kan man dessutom göra undersökningarna mer tillgängliga. Se mer om det i avsnitt 1 av utbildningen.

Små grupper - rare populations

Personer med funktionsnedsättningar kan delas in i många grupper. Det kan ske utifrån diagnos eller funktionsnedsättning. Många av dessa grupper är små, och kan vara promille eller enstaka procent av hela befolkningen. Att slumpvis hitta sådana personer skulle kräva så stora urval att ingen i praktiken vill arbeta på det sättet. Istället behövs andra metoder.

I forskningslitteratur kallas detta för "sampling rare populations". Det finns ingen exakt gräns men om en grupp är mindre än tio procent av den totala populationen så brukar den räknas som ovanlig.

För att få tag i personer som tillhör så små grupper kan det behövas:

  • Tillgång till särskilda register eller samarbete med organisationer där dessa personer kan finnas.
  • Tillgång till sociala medier där dessa personer kan vara engagerade.
  • Uppsökande verksamhet, att själv ta sig till platser eller evenemang där personer som tillhör små grupper kan finnas.
  • Snöbollsrekrytering (se ovan), där man utnyttjar att en person som tillhör en liten grupp ofta känner andra personer som hör till samma grupp.

Har du ett resultat från en liten grupp kan du använda en kontrollgrupp från hela befolkningen för att kunna göra jämförelser.

Statistiska begrepp

Kvalitativa och kvantitativa frågor

Enkelt uttryckt kan man säga att en kvalitativ fråga svarar på "hur är det" medan den kvantitativa frågan svarar på "hur många tycker det". När du ställer en kvalitativ fråga så vill du få en djupare förståelse för något. Det svarsalternativ du då bör erbjuda är ett textfält, där deltagarna kan svara med sina egna ord. Om du gör din underökning online kanske du också kan erbjuda möjligheten att prata in svaret, för de som tycker det är svårt att skriva.

Kvantitativa frågor handlar om att räkna ihop hur många som svarar på det ena eller det andra sättet. Då är fasta svarsalternativ eller skalor dina svarsalternativ.

Det är din undersökningsfråga som avgör om du behöver använda kvalitativa eller kvantitativa frågor.

Bakgrundsfråga och undersökningsfråga

En bakgrundsfråga är ofta en fråga om förhållanden och egenskaper hos de individer som svarar. Sådana faktorer kan till exempel vara demografiska eller socio-ekonomiska.

  • Med demografiska menas frågor om kön, ålder, var man bor geografiskt etc.
  • Med socio-ekonomiska menas till exempel utbildning, inkomst, om man behöver hjälp av någon i sin vardag.

En bakgrundsfråga kan också vara vilken funktionsnedsättning en person har.

En undersökningsfråga är helt enkelt den fråga du vill ha svar på.

Tycker du att internet är svårt? Det är en typisk undersökningsfråga för oss på Begripsam. Tillsammans med över 100 andra frågor vi är intresserade av.

Det är en viktig funktionshinderpolitisk sak att frågan om funktionsnedsättning ska behandlas som en bakgrundsfråga och inte som en undersökningsfråga. På det sättet kan man ta fram ett resultat grupperat efter personers funktionsnedsättningar och till exempel jämföra det med personer som inte har funktionsnedsättning.

Beskrivande och jämförande statistik

Ofta presenteras statistik i två steg:

  1. Ett beskrivande steg som visar resultatet utifrån de frågor som ställdes. Ofta i form av diagram.
  2. Ett jämförande steg där olika data jämförs med varandra för att tydliggöra skillnader och likheter.

I vår exempelundersökning Svenskarna med funktionsnedsättning och internet kan vi till exempel se hur många som har tillgång till en smart mobiltelefon. Det är beskrivande statistik. Men när vi gör jämförande statistik ser vi att bland ungdomar upp till 24 år är det en stor skillnad mellan ungdomar med eller utan funktionsnedsättning. Minst tillgång till en smart telefon har ungdomar med intellektuell funktionsnedsättning. Då handlar det om jämförande statistik

Representativitet

Representativitet handlar om frågan: Till vilka andra utöver mitt urval kan jag generalisera resultatet?

Ett exempel:

Om du gör en medlemsundersökning så kan du behöva fundera på hur representativa dina medlemmar är jämfört med personer som har samma diagnos/funktionsnedsättning men som inte är medlemmar.

Bilden nedan beskriver hur du i din analys behöver pröva om ditt resultat är överförbart till en större grupp än den undersökta.

Schematisk bild som visar hur man behöver pröva om ens resultat är överförbart till en större grupp än den undersökta.

För att avgöra om det är möjligt att generalisera behöver du fundera på om ditt urval kan ge missvisande svar för hela gruppen. Du kanske till exempel har nått betydligt fler yngre personer eller personer med hög utbildning än vad som egentligen är representativt för hela gruppen?

Här handlar det alltså att fundera på om du med hjälp av ditt resultat, som har kommit fram via ett urval, kan säga vad som gäller för hela gruppen.

Statistisk signifikans

Med det menas att du är säker på att ditt resultat inte beror på slumpen. Det brukar också uttryckas som att en skillnad mellan två värden är statistiskt säkerställd. För att komma fram till detta behöver du använda ett konfidensintervall. Det betyder med vilken säkerhet som du kan säga att det ”sanna” medelvärdet ligger inom en viss intervall. I många undersökningar är konfidensintervallet 95%.

Felmarginal

När du laborerar med urval finns alltid en risk att ditt urval inte är helt representativt gentemot hela populationen. Ditt resultat är troligen aldrig det exakt sanna värdet. Det finns en osäkerhet eller felmarginal. Felmarginalen är den största förväntade skillnaden mellan det sanna värdet och det värde urvalet visar. Beroende på hur stor precision du vill ha i din undersökning kan du använda olika stora felmarginaler.

Medelvärde och medianvärde

Både medelvärde och median kan användas för att säga något om genomsnittet för den grupp du har undersökt.

  • För att räkna ut ett medelvärde summerar du alla värden i ett svar och dividerar med antalet svar.
  • För att räkna ut en median så sorterar du alla svar i stigande ordning och det svar som då hamnar i mitten blir medianen.

Median brukar användas om man har många extremvärden. Då får inte dessa lika stort genomslag som då du räknar ut medelvärde. Här kan begreppet varians också vara viktigt. Det anger det högsta och det lägsta vårdet som förekommer i dina svar.

Genomsnitt är ett lurigt värde när det kommer till statistik om funktionsnedsättning. Om du ser att en undersökning säger att "så här är det för personer med funktionsnedsättning" så är det ett medelvärde av vad personer med många olika svårigheter har svarat. Sådana genomsnittliga värden kan dölja att den fanns vissa grupper som upplevde betydande svårigheter medan andra grupper inte alls upplevde svårigheter. Då blir genomsnittliga värden, hur de än räknats fram missvisande. På engelska talar man om att problem blir "averaged out", vilket kan översättas med att problemen blir osynliga eftersom medelvärdet ser okej ut.

Extremanvändare

Med extremanvändare menar vi de användare som har de största svårigheterna. I vissa undersökningar är det mycket viktigare att veta exempelvis vilka svårigheter dessa individer upplever. Om samhället ska vara universellt utformat, vilket är den politiska inriktningen, så måste det fungera för extremanvändarna. Därför borde dessa användare sätta normen för hur saker ska fungera.

Missvisande resultat

Du behöver alltid fundera på om ditt resultat kan vara missvisande. Det finns två vanligt förekommande skäl till att ett resultat kan vara missvisande:

  • Bias
  • Confounder

Bias uppstår när det finns ett systematiskt fel. Det handlar oftast om omedvetna snedvridningar av ett resultat. När Begripsam undersöker om personer med funktionsnedsättning tycker att internet är svårt så vet vi att vi har en snedvridning. De personer som tycker att internet är svårast är också de som tycker att det är svårast att svara på enkäter. Det betyder att våra resultat behöver tolkas utifrån den kunskapen.

Schematisk bild över bias.

Ibland uppstår bias också för att det förekommer förutfattade meningar. Ett känt sådant exempel är vikingagraven i Sigtuna. Alla forskare (män) trodde att den begravda personen var en man eftersom det var så många föremål i graven som tydde på att personen varit en mäktig krigare. Det är nog sant. Men lika sant är att personen var en kvinna, vilket visades av DNA-analyser.

Confounder är en störande faktor. I exemplet ovan tycks det finnas ett starkt samband mellan att personer som dricker mycket kaffe också får lungcancer. Men djupare analyser visade sig att många som drack mycket kaffe också vara rökare. Och det är rökning, inte kaffedrickande, som orsakar luncancer.

Schematisk illustration av confounder

Du kan behöva tänka igenom noga vad som är orsak och verkan innan du presenterar dina slutsatser.