Page content

Data-analyse: waar te beginnen?

Data-analyse: waar te beginnen?

Data-analyse komt aan bod wanneer je kwantitatieve (telbare) data hebt verzameld. Er zijn vele verschillende technieken voor statistische data-analyse beschikbaar. Voordat je met data-analyse aan de slag kunt dien je de data goed te verwerken zodat deze geschikt is voor de analyses die je wilt doen.

Data verwerken

Enquêtedata dient in een database zoals Excel of SPSS ingevoerd of geëxporteerd te worden, waarbij rekening gehouden dient te worden met het aanmaken van de juiste velden en juiste instellingen, zodat de data klaar geschikt is voor de gewenste analyses. In deze YouTube video wordt in lekentaal uitgelegd hoe je data in SPSS invoert. We gaan hier niet al te diep in op hoe er geteld, gemeten en getoetst moet worden. Daar zijn reeds verscheidene goede naslagwerken voor beschikbaar. ‘Discovering Statistics with SPSS’ van Andy Field (de rock star onder de SPSS-deskundigen) alsmede zijn YouTube-kanaal kan ik ten zeerste aanraden. Zijn uitleg is helder en wordt met de nodige humor gebracht. Voor specifiekere instructies over statistiek met SPSS verwijs ik je dan ook hier naartoe. Om je op weg te helpen lopen we een paar handige overzichten langs waarmee je kunt bepalen welke analyses je moet doen om jouw onderzoeksvraag te beantwoorden.

Data analyseren

Nu kan de data-analyse beginnen. Afhankelijk van het doel van het onderzoek en het type variabelen dien je de berekening van een of meerdere kengetallen (‘summary statistics’ of ‘descriptive statistics’), statistische toetsen of regressieanalyses te doen.

Kengetallen

Kengetallen geven in één getal een samenvatting over een dataset. Kengetallen kunnen gaan over één variabele (bijv. gemiddelde, mediaan, modus, variantie, standaarddeviatie) of over de relatie tussen twee variabelen (bijv. correlatiecoëfficiënt). Hier een instructievideo over het berekenen van enkele simpele kengetallen met SPSS. Tabel 1 bevat een overzicht van typen kengetallen over één variabele, terwijl in Tabel 2 onder meer de kengetallen voor de relatie tussen twee variabelen zijn terug te vinden.

kengetallenvinder

Tabel 1. Kengetallenvinder (Bron: AMC Clinical Research Unit)

Statistische toets

Een statistische toets doet op basis van een steekproef met een bepaalde betrouwbaarheid de uitspraak of een hypothese waar is of niet. Afhankelijk van het type data zijn er verschillende toetsen beschikbaar (Tabel 3). Een statistische toets doet met een bepaalde betrouwbaarheid (vaak 95%, soms 99%) een uitspraak. Een gewenste betrouwbaarheid (deze kun je zelf kiezen) van 95% wil zeggen dat de conclusie in 95 van de 100 gevallen juist zou zijn en dus in 5 gevallen onjuist. De onbetrouwbaarheid of het zogenaamde significatieniveau wordt uitgedrukt in alfa (α). Het uitvoeren van een toets met een alfa van 5% wil zeggen dat de kans dat de nulhypothese onterecht wordt verworpen 5% is. De uitkomst van een toets wordt uitgedrukt met de p-waarde (of significantie), die aangeeft wat de daadwerkelijke kans is dat je de nulhypothese ten onrechte verwerpt gegeven de gebruikte steekproef. Een p-waarde kleiner dan alfa (p < α) wordt verworpen, terwijl een p-waarde gelijk aan of groter dan alfa niet wordt verworpen.

analysevinder

Tabel 2. Analysevinder (Bron: AMC Clinical Research Unit)

Regressie-analyse

Hypothesen kun je ook toetsen met een regressieanalyse. Waar je met een statistische toets slechts kunt toetsen óf er een verband is tussen twee variabelen (of verschil tussen twee populaties), laat een regressieanalyse zien hoe een verband eruit ziet door een lijn te trekken door een puntenwolk. Afhankelijk van het type uitkomstdata zijn er verschillende regressieanalyses beschikbaar (verspreid over Tabel 2 en 3). De enkelvoudige lineaire regressie (Tabel 2) en de meervoudige lineaire regressie zijn de meest simpele en de meest voorkomende varianten.

toetsvinder

Tabel 3. Toetsvinder (Bron: AMC Clinical Research Unit)

Figuur 1 (onder) bevat een aantal voorbeelden van regressielijnen.

regressie

Figuur 1. Regressielijnen

Wellicht zijn al die verschillende toetsen en analyses met ingewikkelde namen wat overweldigend, maar de ervaring leert dat je met Google en YouTube een heel eind komt, zeker als je eenmaal weet welke analyses je moet doen.

    Comment Section

    4 reacties op “Data-analyse: waar te beginnen?


    Door Kjeld op 6 september 2016

    Hallo Luuk,
    In mijn scriptie zou ik ook graag verwijzen naar de kengetallenvinder tabel. Het probleem is dat ik in de bron: Netwerk Kwalitatief Onderzoek AMC – UvA (2002). Richtlijnen voor kwaliteitsborging in
    gezondheids(zorg)onderzoek: Kwalitatief onderzoek. Amsterdam. , niet de tabel terug kan vinden.
    De gids is overigens wel top!


    Door Luuk Tubbing op 6 september 2016

    Hallo Kjeld, het zou kunnen dat deze auteur/organisatie meerdere publicaties heeft in 2002 en deze niet allen online terug zijn te vinden. Zelf heb ik bij het AMC gewerkt en deze tabellen ooit op een blaadje gekregen. Ik kan helaas niet meer achterhalen uit welke exacte bron deze komen. Bovendien raad ik je aan om vooral naar standaardwerken te refereren en liever niet naar rapporten of websites, zeker als het om methodische bronnen gaat. Dit blogartikel (en het rapport waar ik naar verwijs) is bedoeld om je te helpen in het denken en uiteraard geen wetenschappelijke publicatie. Succes! Groeten, Luuk



    Plaats een reactie


    *