T-toets met SPSS

De t-toets (Engels: t test) is de meest eenvoudige toets om twee gemiddelden te vergelijken van normaal verdeelde populaties. De t-toets wordt gebruikt om de hypothese te toetsen of er een significant verschil is tussen twee groepen of condities. Een voorbeeld van zo'n hypothese is "mannen en vrouwen verschillen van lengte". Met de t-toets kun je dus snel en eenvoudig vaststellen of twee groepen (voor drie of meer groepen gebruik je de ANOVA) of condities gemiddeld van elkaar verschillen. De toets houdt echter geen rekening met de spreiding van de datapunten of variabelen die deze gemiddelden beïnvloeden. Er zijn twee varianten van de t-toets:

Onafhankelijke t-toets (Independent t-test): gebruik je wanneer je gemiddelden van twee verschillende steekproeven vergelijkt. Bijvoorbeeld het vergelijken van de gemiddelde lengte van Nederlanders en Duitsers.
Gepaarde t-toets (Paired-samples t-test): ook wel afhankelijke t-toets (Dependent t-test) genoemd, gebruik je wanneer je twee metingen of condities van dezelfde steekproef wilt vergelijken. Bijvoorbeeld een voor- en nameting bij een onderzoek naar het effect van een dieet.

De principes achter de t-toets

Beide varianten van de t-toets zijn op soortgelijke principes gebaseerd:

We hebben data van twee steekproeven verzameld en berekenen de steekproefgemiddelden. Deze gemiddelden kunnen beetje of veel verschillen.
Als de steekproeven uit dezelfde populatie komen, verwachten we dat hun gemiddelden ongeveer gelijk zijn. Door toeval kan dit afwijken.
We vergelijken het verschil tussen de steekproefgemiddelden die we hebben verzameld met het verschil tussen de steekproefgemiddelden die we zouden verwachten als er geen effect zou zijn (d.w.z. als de nulhypothese waar zou zijn). We gebruiken de standaardfoutals een maat voor de variabiliteit tussen steekproefgemiddelden. Als de standaardfout klein is, verwachten we kleine verschillen in steekproefgemiddelden. Wanneer de standaardfout groot is verwachten we grote verschillen. Als het verschil tussen de steekproeven die groter is dan wat we verwachten op basis van de standaardfout dan kunnen we een van deze twee dingen aannemen:
- Er is geen effect en steekproefgemiddelden in de populatie fluctueren veel en we hebben bij toeval twee steekproeven verzameld die atypisch zijn voor de populatie waaruit ze genomen zijn.
- De twee steekproeven komen uit verschillende populaties, maar zijn wel typerend voor hun populatie. In dit scenario vertegenwoordigt het verschil tussen de voorbeelden een echt verschil tussen de steekproeven (en dus wordt de nulhypothese verworpen).
Hoe groter het waargenomen verschil, des te aannemelijker het is dat de tweede uitleg klopt, oftewel: de twee steekproefgemiddelden verschillen niet door toeval, maar vanwege de verschillende condities of eigenschappen van de twee groepen.

T-toets met SPSS

IBM SPSS Statistics is het meest gebruikte softwarepakket voor statistische analyse in sociaal wetenschappelijk onderzoek, zoals bedrijfskunde, sociologie en politicologie. Met SPSS is een t-toets vrij eenvoudig uit te voeren. Check voordat je begint eerst of de t-toets wel past bij jouw vraagstuk, dataset en type variabelen (gebruik de Toetsvinder). Een t-toets is een parametrische toets. Check of jouw dataset voldoet aan de de aannames van een parametrische toets. Als jouw dataset door al deze checks is gekomen, volg dan onderstaande stappen om de toets uit te voeren in SPSS.

Uitvoeren onafhankelijke t-toets

Ga in het menu naar Analyze –> Compare Means –> Independent-Samples T Test. Verplaats de te toetsen variabele naar de Test Variable(s) box en de groeperende variabele naar de Grouping Variable box. Onderstaande voorbeeld gaat over een onderzoek naar een medicijn voor bloeddrukverlaging. We vergelijken of mensen die een nieuw medicijn (New Drug) nemen een hogere bloeddrukdaling (Bloeddruk_verschil) hebben dan mensen die niet dit nieuwe medicijn krijgen (Control).

onafhankelijke-t-toets-spss-variable

In de toegekende Grouping Variable wordt niet automatisch verschillende groepen herkend. Klik op deze variabele en vervolgens op Define Groups... Voer vervolgens twee verschillende getallen in voor Group 1 en Group 2, bijvoorbeeld 1 en 2, en klik op Continue.

onafhankelijke-t-toets-spss-define-groups

onafhankelijke-t-toets-spss-define-groups

Klik op OK om de analyse uit te voeren.

Interpreteren output onafhankelijke t-toets

De SPSS output van de onafhankelijke t-toets bestaat uit twee tabellen. De eerste tabel (Group Statistics) geeft summary statistics voor de twee groepen, waaronder de steekproefomvang (N), het gemiddelde (Mean) en standaarddeviatie (Std. Deviation). In het voorbeeld zien we dat de groep die het nieuwe medicijn heeft gebruikt (Newdrug) duidelijk een hogere gemiddelde bloeddrukdaling heeft dan de controlegroep (Control), namelijk 13,44 tegen 4,95. We weten nu nog niet of dit verschil statistisch significant is.

onafhankelijke-t-toets-spss-output-group-stats

onafhankelijke-t-toets-spss-output-group-stats

De tweede tabel (Independent Samples Test) bevat de belangrijkste toetsstatistieken. Hieruit kunnen we aflezen of het zojuist waargenomen verschil al dan niet op toeval berust. De eerste kolom gaat over de Levene’s test. Deze geeft aan of er gelijkheid in variantie bestaat tussen de 2 groepen. We nemen pas aan dat er geen gelijkheid in varianties is als de Levene’s toets significant is. Dat is het geval als Sig. kleiner of gelijk is aan 0,05. In onderstaande voorbeeld is de gegeven waarde ,001. Er is dus geen gelijkheid in varianties. Daarom kijken we naar de onderste rij in de tabel (Equal variances not assumed). We hebben de gemiddelden van de groepen Newdrug en Control vergeleken. Het verschil tussen deze twee gemiddelden staat in de kolom Mean Difference. Je wilt weten of dit verschil significant is. Dit is het geval als we met 95% of meer zekerheid kunnen zeggen dat dit verschil bestaat. Oftewel, wanneer de Sig. (2-tailed) ,05 of lager is. In onderstaande voorbeeld heeft Sig. een waarde van 0,001. We mogen dus stellen dat er een significant verschil is tussen de gemiddelde bloeddrukdalingen van groepen Newdrug en Control. In de eerste tabel zagen we dat dit aangetoonde verschil in het 'voordeel' van Newdrug uitvalt.

Rapporteren resultaten onafhankelijke t-toets

Voor rapportage van toetsresultaten in wetenschappelijke publicaties, waaronder scripties, zijn schrijfstijlen en richtlijnen afgesproken (bijvoorbeeld zoals opgenomen in de APA-stijl). Een rapportage voorbeeld voor bovenstaande SPSS output:

Gemiddeld hadden participanten die het nieuwe medicijn namen (gem. = 13,44; SD = 5,73) een grotere bloeddrukdaling dan participanten uit de controlegroep (gem. = 4,95; SD = 2,25). Dit verschil, p = 0,000, is significant.

Uitvoeren gepaarde t-toets

Ga in het menu naar Analyze –> Compare Means –> Paired-Samples T Test. We werken met hetzelfde voorbeeld als bij de onafhankelijke t-toets hier boven. Nu willen we vaststellen of mensen een significante bloeddrukverlaging hebben nadat ze een nieuw medicijn nemen. We plaatsen de gepaarde metingen (voor- en nameting, Bloeddruk_voor en Bloeddruk_na) in de eerste rij in de Paired Variables box. Klik vervolgens op OK om de analyse uit te voeren.

gepaarde-t-toets-spss-variables

Interpreteren output onafhankelijke t-toets

De SPSS output van de onafhankelijke t-toets bestaat uit drie tabellen. De eerste tabel (Paired Samples Statistics) geeft summary statistics voor de twee metingen, waaronder gemiddelde (Mean), steekproefomvang (N) en standaarddeviatie (Std. Deviation). In het voorbeeld zien we dat de participanten in de voormeting een hogere gemiddelde bloeddruk (99,22) hadden dan bij de nameting (85,78). We weten nu nog niet of dit verschil statistisch significant is.

t-toets-output-paired-samples-stats

De tweede tabel toont de Pearson-correlatie tussen de twee metingen. Bij herhaalde metingen is het mogelijk dat de experimentele omstandigheden correleren. De gegevens komen in beide situaties van dezelfde mensen, waardoor je enige constantheid in de antwoorden of metingen verwacht. SPSS geeft de waarde van Pearson's r (tussen 1 en -1, waarbij 1 hoog positief is en -1 hoog negatief) en de tweezijdige significantiewaarde. Ons voorbeeld levert een lage correlatie op (r = 0,366), maar de correlatie is (net) niet significant omdat de p-waarde (Sig.) groter is dan 0,05.

t-toets-output-paired-samples-correlations

t-toets-output-paired-samples-correlations

De derde tabel toont de belangrijkste toetsstatistieken. Hieruit lezen we af of het verschil tussen de gemiddelden van de twee metingen groot genoeg was om geen toevalsresultaat te zijn. In de eerste kolom (Mean) staat de gemiddelde verschilscore tussen de twee metingen. In ons geval is de bloeddruk gemiddeld 13,44 lager in de nameting in vergelijking met de voormeting. De Sig. heeft een waarde van 0,000. We stellen dus vast dat er een significant verschil is tussen de gemiddelde voor- en nametingen. In de eerste tabel zagen we dat dit aangetoonde verschil in het 'voordeel' van de nameting uitvalt.

t-toets-output-paired-samples-test

Rapporteren resultaten gepaarde t-toets

Een rapportage voorbeeld voor bovenstaande SPSS output:

Gemiddeld hadden participanten voordat ze het medicijn namen (gem. = 99,22; SD = 6,05) een hogere bloeddruk dan nadat ze het medicijn namen (gem. = 85,78; SD = 3,29). Dit verschil, p = 0,000, is significant.

Een korte vraag? Stel deze hieronder. Uitgebreidere hulp nodig? Schakel de hulp in van één van onze scriptiecoaches.

Reactie plaatsen

Sneller afstuderen met een scriptiecoach?

Meld je nu aan