arrow_drop_up arrow_drop_down
Data-analyse: waar te beginnen?

Data-analyse: waar te beginnen?

Data-analyse komt aan bod wanneer je kwantitatieve (telbare) data hebt verzameld. Er zijn vele verschillende technieken voor statistische data-analyse beschikbaar. Voordat je met data-analyse aan de slag kunt dien je de data goed te verwerken zodat deze geschikt is voor de analyses die je wilt doen.Bol.com Algemeen

Data verwerken

Enquêtedata dient in een database zoals Excel of SPSS ingevoerd of geëxporteerd te worden, waarbij rekening gehouden dient te worden met het aanmaken van de juiste velden en juiste instellingen, zodat de data klaar geschikt is voor de gewenste analyses. We gaan hier niet al te diep in op hoe er geteld, gemeten en getoetst moet worden. Daar zijn reeds verscheidene goede naslagwerken voor beschikbaar. ‘Discovering Statistics with SPSS’ van Andy Field (de rock star onder de SPSS-deskundigen) kan ik ten zeerste aanraden. Zijn uitleg is helder en wordt met de nodige humor gebracht. Voor specifiekere instructies over statistiek met SPSS verwijs ik je dan ook hier naartoe. Om je op weg te helpen lopen we een paar handige overzichten langs waarmee je kunt bepalen welke analyses je moet doen om jouw onderzoeksvraag te beantwoorden.

Data analyseren

Nu kan de data-analyse beginnen. Afhankelijk van het doel van het onderzoek en het type variabelen dien je de berekening van een of meerdere kengetallen (‘summary statistics’ of ‘descriptive statistics’), statistische toetsen of regressieanalyses te doen.

Kengetallen

Kengetallen geven in één getal een samenvatting over een dataset. Kengetallen kunnen gaan over één variabele (bijv. gemiddelde, mediaan, modus, variantie, standaarddeviatie) of over de relatie tussen twee variabelen (bijv. correlatiecoëfficiënt). Tabel 1 bevat een overzicht van typen kengetallen over één variabele, terwijl in Tabel 2 onder meer de kengetallen voor de relatie tussen twee variabelen zijn terug te vinden.kengetallenvinderTabel 1. Kengetallenvinder (Bron: AMC Clinical Research Unit)

Statistische toets

Een statistische toets doet op basis van een steekproef met een bepaalde betrouwbaarheid de uitspraak of een hypothese waar is of niet. Afhankelijk van het type data zijn er verschillende toetsen beschikbaar (Tabel 3). Een statistische toets doet met een bepaalde betrouwbaarheid (vaak 95%, soms 99%) een uitspraak. Een gewenste betrouwbaarheid (deze kun je zelf kiezen) van 95% wil zeggen dat de conclusie in 95 van de 100 gevallen juist zou zijn en dus in 5 gevallen onjuist. De onbetrouwbaarheid of het zogenaamde significatieniveau wordt uitgedrukt in alfa (α). Het uitvoeren van een toets met een alfa van 5% wil zeggen dat de kans dat de nulhypothese onterecht wordt verworpen 5% is. De uitkomst van een toets wordt uitgedrukt met de p-waarde (of significantie), die aangeeft wat de daadwerkelijke kans is dat je de nulhypothese ten onrechte verwerpt gegeven de gebruikte steekproef. Een p-waarde kleiner dan alfa (p < α) wordt verworpen, terwijl een p-waarde gelijk aan of groter dan alfa niet wordt verworpen. analysevinder
Tabel 2. Analysevinder (Bron: AMC Clinical Research Unit)

Regressie-analyse

Hypothesen kun je ook toetsen met een regressieanalyse. Waar je met een statistische toets slechts kunt toetsen óf er een verband is tussen twee variabelen (of verschil tussen twee populaties), laat een regressieanalyse zien hoe een verband eruit ziet door een lijn te trekken door een puntenwolk. Afhankelijk van het type uitkomstdata zijn er verschillende regressieanalyses beschikbaar (verspreid over Tabel 2 en 3). De enkelvoudige lineaire regressie (Tabel 2) en de meervoudige lineaire regressie zijn de meest simpele en de meest voorkomende varianten.toetsvinder
Tabel 3. Toetsvinder (Bron: AMC Clinical Research Unit)
Figuur 1 (onder) bevat een aantal voorbeelden van regressielijnen. regressie
Wellicht zijn al die verschillende toetsen en analyses met ingewikkelde namen wat overweldigend, maar de ervaring leert dat je met Google en YouTube een heel eind komt, zeker als je eenmaal weet welke analyses je moet doen.

Hulp nodig met SPSS? Schakel één van onze ervaren en betrokken scriptiecoaches in

Klik hier om een gratis en vrijblijvend oriëntatiegesprek aan te vragen >>
Kasper
Door

Kasper

op 02 Jun 2020

Goedemiddag, Voor onze masterproef willen wij nagaan of het spontaan imiteren van gebaren een impact heeft op de frequentie dat een persoon ‘euhm’ zegt. Wij hebben als hypothese dat door het imiteren van gebaren de ‘euhm’-frequentie zal dalen. We hebben 2 testcondities afgenomen, met dezelfde 30 proefpersonen. De 1e testconditie was er één waarbij de proefpersonen gewoon spontaan moesten spreken en waarbij wij als onderzoekers de ‘euhm’-frequentie gemeten hebben. In de 2e testconditie moesten diezelfde personen een verhaal navertellen dat verteld werd door een externe verteller, waarbij de verteller spontane gebaren gebruikte. We hebben hier opnieuw de ‘euhm’-frequentie gemeten en ook de imitatiescore (de mate waarin een persoon de gebaren van de verteller zal overnemen). Onze hypothese is dat personen met een hogere imitatiescore in conditie 2, een groter verschil hebben in ‘euhm-frequentie tussen hun 2 condities, en dat het imiteren van gebaren dus een positieve invloed heeft op het vlot spreken. Eerst dachten we eraan om een MEERVOUDIGE LINEAIRE REGRESSIE toe te passen met: AV=’euhm’-frequentie conditie2. OV1=’euhm’-frequentie conditie1. OV2=imitatiescore. Omdat het allemaal kwantitatieve variabelen zijn. Maar nu beginnen we toch te twijfelen over het feit dat het misschien geen onafhankelijke variabelen zijn. Weet iemand hier raad mee? Alvast bedankt!

Kasper
Door

Kasper

op 11 Jun 2020

Alweer bedankt Luuk! Ik denk dat ik begrijp dat we de repeated measures moeten toepassen om het antwoord te krijgen op de vraag of de personen geholpen zijn met de gebaren (nagaan of er een significant verschil is tussen de 2 condities). Maar hoe we daar bovenop ook te weten komen of de personen met een hogere imitatiescore meer geholpen zijn met de gebaren dan personen met een lagere imitatiescore begrijp ik nog niet goed. Groeten

Luuk Tubbing
Kasper
Door

Kasper

op 03 Jun 2020

Dag Luuk, Alvast heel erg bedankt voor uw antwoord. Het is inderdaad niet zo eenvoudig uit te leggen. Als we enkel conditie 2 gebruiken, krijgen we volgens ons een antwoord op de vraag of personen die beter imiteren, gemiddeld een lagere euhm-frequentie hebben en dus vloeiender spreken, dan personen die minder goed imiteren. Dat is niet helemaal waar we naar op zoek zijn. We willen namelijk te weten komen of personen ‘geholpen’ zijn met het imiteren van gebaren. Anders gezegd: We willen weten of het imiteren van gebaren (imitatiescore), de personen helpt om vloeiender te spreken (lagere euhm-frequentie te halen), dan wanneer ze niet kunnen imiteren (zoals in conditie 1). In het beste geval willen we daarbovenop ook weten of personen die beter imiteren (een hogere imitatiescore), een groter voordeel hebben dan personen die minder goed imiteren (een lagere imitatiescore) ten opzichte van de conditie waar ze niet konden imiteren. Hopelijk is dit een betere schets van ons onderzoek en onze zoektocht naar een bijpassende statistische analyse. Groeten, Kasper

Luuk Tubbing
Door

Luuk Tubbing

op 04 Jun 2020

Hoi Kasper, bovenop (of eerder voorafgaand aan) het model uit mijn eerste antwoord krijg je dan een model waarbij je twee groepen (condities) met elkaar gaat vergelijken (met vs zonder imitatie). Met een t-toets kun je vaststellen of het verschil in de euhm-frequentie tussen deze twee groepen significant is. Als de groepen dezelfde personen bevatten dan gaat om het een gepaarde t-toets (repeated measures). Als de groepen verschillende personen bevat dan de onafhankelijke t-toets. Helder?

Luuk Tubbing
Door

Luuk Tubbing

op 02 Jun 2020

Hoi Kasper, Uit jouw beschrijving begrijp ik dat de euhm-frequentie de AV en de imitatiescore de OV. Wat is de toegevoegde waarde van conditie 1? Uit jouw beschrijving maak ik op dat je met alleen conditie 2 al het doel van het onderzoek bereikt. Groeten, Luuk

Roan
Door

Roan

op 11 May 2020

Goedemiddag, Momenteel ben ik bezig met mijn afstudeeronderzoek en heb ik literatuur geschreven en aan de hand hiervan criteria opgesteld. Aan de hand van een enquête heb ik steekproefsgewijs onderzoek gedaan naar de wensen en behoeften van de generatie Z (mijn onderzoeksonderwerp) bij een werkgever en hoe zij vinden dat het momenteel bij de huidige werkgever (Bedrijf X) wordt ervaren. Om deze kwantitatieve data te toetsen heb ik een 6tal interviews gedaan om de resultaten uit de enquête te toetsen. Daarnaast heb ik ook aantal exit interviews gehouden om dus triangulatie in mijn onderzoek te verkrijgen Momenteel ben ik bezig met het schrijven van een GAP analyse waarbij ik dus in kaart breng wat de GAP is tussen de huidige situatie en de gewenste situatie. Echter kan ik hier niet een passende data analyse bij vinden. Wat is de beste vorm van data analyseren hiervoor?

Luuk Tubbing
Door

Luuk Tubbing

op 12 May 2020

Beste Roan, voor een kwantitatieve gap analyse zul je twee metingen met elkaar moeten vergelijken (wens/verwachting vs. werkelijkheid). Er zijn allerlei kwantitatieve en kwalitatieve en methoden om deze vergelijking te doen. Als je zowel de wens als de werkelijkheid hebt gekwantificeerd aan de hand van exact dezelfde variabelen dan kun je toetsen of het verschil statistisch significant is (bijv. met een T-Toets of ANOVA). Verder kun lijstjes met wens vs. werkelijkheid met elkaar vergelijken en beschrijven in hoeverre deze verschillen. Je kunt ook een matrix maken waarin een op aantal elementen o.b.v. een score van 1-5 het belang vs. de werkelijkheid vergelijkt. Bijv. belang van duurzaamheid = 5, werkelijkheid = 3, verschilscore = -2. Als je hier niet direct naar hebt gevraagd zul je zelf tot een onderbouwd oordeel moeten komen om deze scores toe te kennen. Helder? Kom je hier verder mee? Groeten, Luuk

http://www.takebuseleven.com/cheap-weeks-car-insurance.html
Door

http://www.takebuseleven.com/cheap-weeks-car-insurance.html

op 07 Mar 2017

Damn, I wish I could think of something smart like that!

kredit raten berechnung formel ändern
Door

kredit raten berechnung formel ändern

op 15 Dec 2016

Kudos to you! I hadn't thought of that!

Kjeld
Door

Kjeld

op 06 Sep 2016

Hallo Luuk, In mijn scriptie zou ik ook graag verwijzen naar de kengetallenvinder tabel. Het probleem is dat ik in de bron: Netwerk Kwalitatief Onderzoek AMC – UvA (2002). Richtlijnen voor kwaliteitsborging in gezondheids(zorg)onderzoek: Kwalitatief onderzoek. Amsterdam. , niet de tabel terug kan vinden. De gids is overigens wel top!

Luuk Tubbing
Door

Luuk Tubbing

op 06 Sep 2016

Hallo Kjeld, het zou kunnen dat deze auteur/organisatie meerdere publicaties heeft in 2002 en deze niet allen online terug zijn te vinden. Zelf heb ik bij het AMC gewerkt en deze tabellen ooit op een blaadje gekregen. Ik kan helaas niet meer achterhalen uit welke exacte bron deze komen. Bovendien raad ik je aan om vooral naar standaardwerken te refereren en liever niet naar rapporten of websites, zeker als het om methodische bronnen gaat. Dit blogartikel (en het rapport waar ik naar verwijs) is bedoeld om je te helpen in het denken en uiteraard geen wetenschappelijke publicatie. Succes! Groeten, Luuk

Reactie plaatsen