Page content

One-way ANOVA met SPSS

One-way ANOVA met SPSS

De one-way ANOVA (staat voor Analysis of Variance, oftewel variantieanalyse) wordt gebruikt om te bepalen of er statistisch significante verschillen zijn tussen de gemiddelden van twee of meer onafhankelijke (niet-gerelateerde) groepen. Je kunt de one-way ANOVA bijvoorbeeld gebruiken om te begrijpen of het geluksniveau verschilt tussen Nederlandse, Belgische en Duitse studenten. Het is belangrijk om te beseffen dat de one-way ANOVA je niet kan vertellen welke specifieke groepen statistisch significant van elkaar verschillen; het vertelt je alleen dat ten minste twee groepen verschillend waren. Als je drie of meer groepen in je onderzoeksopzet hebt, is het belangrijk om te bepalen welke van deze groepen van elkaar verschillen. Dit kun je doen met behulp van een zogenaamde post-hoc test.

In dit artikel lees je wat het verschil is tussen een one-way ANOVA met de lineaire regressie en onafhankelijke t-toets, wat de aannames zijn van een one-way ANOVA, hoe je een one-way ANOVA, inclusief een post-hoc test, uitvoert in SPSS, hoe je de output interpreteert en hoe je de resultaten rapporteert in je scriptie.

Verschil met lineaire regressie-analyse en onafhankelijke t-toets

Een regressieanalyse gebruik je om een specifieke samenhang tussen twee of meer variabelen vast te stellen, terwijl een ANOVA verschillen tussen de gemiddelden van twee of meer groepen vaststelt. Stel dat je het verband tussen leeftijd en salaris wilt bepalen. Met een lineaire regressie-analyse stel je dan vast hoeveel salaris erbij komt voor elk extra levensjaar. Met een one-way ANOVA kun je bijvoorbeeld vaststellen of het salaris van mensen uit verschillende (twee of meer) beroepsgroepen significant van elkaar verschillen.

Wanneer het om slechts twee onafhankelijke groepen gaat kun je ook de onafhankelijke t-toets gebruiken. Deze toets is iets eenvoudiger om uit te voeren dan de one-way ANOVA. Nu denk je misschien dat je met meer dan twee groepen gewoon meerdere t-toetsen kunt uitvoeren om alle groepen 1-op-1 te vergelijken. In vergelijking met een one-way ANOVA geeft het uitvoeren van meerdere t-toetsen met twee groepen echter een grotere kans op het maken van een type I-fout (verwerpen van een ware nulhypothese)

Aannames one-way ANOVA

Voor de one-way ANOVA gelden zes aannames of criteria waaraan de data moeten voldoen om een geldig resultaat te geven:

  • Aanname #1: De afhankelijke variabele is gemeten op een interval- of ratio meetschaal (continue meetschaal). Voorbeelden zijn werktijd (gemeten in uren), intelligentie (gemeten met IQ-score), gewicht (gemeten in kg), etc.
  • Aanname #2: De onafhankelijke variabele bestaat ​​uit twee of meer categorische, onafhankelijke groepen. Meestal wordt een one-way ANOVA vanaf drie groepen gebruikt, maar twee is ook mogelijk (de eenvoudigere onafhankelijke t-toets volstaat dan). Voorbeelden van dergelijke groepen zijn etniciteit (bijv. Kaukasisch, Afrikaans, Latijns-Amerikaans), lichamelijke activiteitsniveau (bijv. zittend, laag, matig, hoog), beroep (bijv. chirurg, arts, verpleegster, tandarts, psychiater), etc.
  • Aanname #3: Waarnemingen zijn onafhankelijk. Er is geen relatie tussen de waarnemingen binnen elke groep of tussen de groepen. Er moeten bijvoorbeeld verschillende deelnemers in elke groep zijn en geen deelnemers die in meer dan één groep zitten. Dit criterium is onderdeel van het onderzoeksontwerp en niet iets dat je kunt toetsen. Als jouw onderzoek niet aan deze aanname voldoet, zal je een andere statistische toets moeten gebruiken (bijv. een repeated measures ANOVA). Als je niet zeker weet of jouw onderzoek aan deze aanname voldoet, kun je onze toetsvinder gebruiken.
  • Aanname #4: Er mogen geen significante uitschieters (outliers) zijn. Outliers zijn datapunten binnen de dataset die niet het gebruikelijke patroon volgen. Bijvoorbeeld in een onderzoek naar de jaarinkomens van 100 zelfstandig ondernemers, waarbij het gemiddelde inkomen € 38.000 was met slechts een kleine variatie tussen de ondernemers, had één ondernemer een inkomen van € 1.500.000, wat zeer ongebruikelijk is. Door deze outlier geeft het gemiddelde van de groep een vertekent beeld, waardoor de validiteit van de resultaten afneemt. Met SPSS kun je outliers gelukkig gemakkelijk detecteren en elimineren.
  • Aanname #5: De afhankelijke variabele is ongeveer normaal verdeeld voor elke categorie van de onafhankelijke variabele. De one-way ANOVA vereist slechts ‘ongeveer’ normaal verdeelde data, omdat deze vrij ‘robuust’ is tegen schendingen van de normaliteit. Dit betekent dat de aanname een beetje kan worden geschonden en toch geldige resultaten kan opleveren. Je kunt toetsen op normaliteit met behulp van de Shapiro-Wilk of Kolmogorov-smirnov toets.
  • Aanname #6: Er moet homogeniteit van varianties (homoscedasticiteit) zijn. Je kunt deze aanname toetsen met SPSS met behulp van Levene’s toets voor homogeniteit van varianties. Als de data niet aan deze aanname voldoen, moet je een Welch ANOVA uitvoeren in plaats van een one-way ANOVA en een andere post-hoc-toets gebruiken.

In de praktijk voegt het controleren van deze zes aannames slechts een beetje extra tijd toe aan de analyse. Wees niet verbaasd als een of meer van deze aannames worden geschonden (d.w.z. er wordt niet aan voldaan). Dit is niet ongebruikelijk bij het werken met data uit de echte wereld (in tegenstelling tot voorbeelden uit boeken). Maak je echter geen zorgen; er zijn vaak oplossingen om deze schendingen te verhelpen.

Aannames #4, #5 en #6 controleer je met behulp van statistiek. Voordat je dit doet; zorg ervoor dat de data voldoen aan aannames #1, #2 en #3.

Dataset in SPSS

Aan de hand van een voorbeeld gaan we de one-way ANOVA uitvoeren in SPSS. De fictieve dataset die we gebruiken bestaat uit de jaarsalarissen (in euro’s) van personen uit drie verschillende beroepsgroepen: politieagenten, verplegers en accountants. In SPSS hebben we deze drie groepen voor analyse gescheiden door een groepsvariabele te maken met de naam ‘profession’ (de onafhankelijke variabele), waarbij we ‘police’ coderen met een 1, ‘nurse’ met een 2 en ‘accountant’ met een 3. Het salaris werd ingevoerd onder de variabelenaam ‘salary’ (de afhankelijke variabele).

Uitvoeren one-way ANOVA met SPSS

Open SPSS met de betreffende dataset en ga in het menu bovenin naar Analyze –> Compare Means –> One-Way ANOVA…

one-way-anova-menuHet one-way ANOVA venster wordt getoond. Selecteer de afhankelijke variabele salary en klik op de pijl bij het vak Dependent List. Selecteer de onafhankelijke variabele profession en klik op de pijl bij het vak Factor:

one-way-anova-venster

Klik op de knop Post hoc…. In de voorbeeld gaan we ervan uit dat de varianties gelijk zijn, waardoor je Tukey kunt gebruiken. Vink het Tukey-selectievakje aan zoals hieronder weergegeven:

one-way-anova-post-hoc

Klik op Continue. Klik vervolgens op de knop Opties. Vink het selectievakje Descriptive aan zoals hieronder weergegeven:

one-way-anova-optionsBij het toetsen van enkele van de aannames (zie bovenstaande kop Aannames one-way ANOVA) van de one-way ANOVA moet je meer van deze selectievakjes aanvinken.

Klik op Continue en vervolgens op OK. Nu wordt de output uitgedraaid.

Interpreteren SPSS output

De Descriptives tabel (zie hieronder) biedt een aantal zeer nuttige beschrijvende statistieken, waaronder het gemiddelde, de standaarddeviatie en 95% betrouwbaarheidsintervallen voor de afhankelijke variabele (salary) voor elke afzonderlijke groep (police, nurse, accountant), evenals wanneer alle groepen worden gecombineerd (Total). Deze cijfers zijn handig bij het beschrijven van de data.

one-way-anova-descriptives

De ANOVA-tabel laat zien of er een statistisch significant verschil is tussen de groepsgemiddelden. We kunnen zien dat de significantiewaarde 0,000 is (p = 0,000). Dit is lager dan 0,05. Daarom is er sprake van een statistisch significant verschil in het gemiddelde salaris tussen de verschillende beroepsgroepen. Dit is leuk om te weten, maar we weten niet welke van de specifieke groepen statistisch verschilden. Gelukkig kunnen we dit achterhalen in de tabel met meerdere vergelijkingen die de resultaten van de Tukey post-hoc-test bevat.

anova-tabel

Uit de resultaten tot nu toe weten we dat er statistisch significante verschillen zijn tussen de groepen als geheel. Onderstaande tabel, Multiple Comparisons, laat zien welke groepen van elkaar verschilden. De Tukey post-hoc-test heeft over het algemeen de voorkeur als post hoc-tests bij een one-way ANOVA, maar er zijn er nog veel meer. We kunnen aan onderstaande tabel zien dat er geen statistisch significant verschil in salaris is tussen politieagenten en verpleegkundigen (p = 0,265), wel tussen politieagenten en accountants (p = 0,000) en verpleegkundigen en accountants (p = 0,000).

one-way-anova-multiple-comparisons

Rapporteren resultaten

Op basis van bovenstaande resultaten kun je de resultaten van het onderzoek als volgt rapporteren (in het Engels, omdat dit de meest gebruikte taal is voor scripties met statistische analyse in Nederland):

There was a statistically significant difference between groups as determined by one-way ANOVA (F(2,87) = 22.341, p = .000). A Tukey post hoc test revealed that the salary of police officers (33289 ± 6705 euro, p = 0,000) and nurses (37094 ± 7393 euro, p = 0,000) was statistically significantly lower compared to accountants (48856 ± 12872 euro). There was no statistically significant difference between police officers and nurses (p = .265).

Let op: dit omvat niet de resultaten van het toetsen van aannames of eventuele effectgrootteberekeningen.

    Comment Section

    0 reacties op “One-way ANOVA met SPSS

    Plaats een reactie


    *