Page content

Normaliteit kwantificeren met cijfers

Normaliteit kwantificeren met cijfers

Normaliteit kwantificeren met cijfers is in tegenstelling tot het bekijken van histogrammen niet subjectief en gevoelig voor misbruik. Na het visueel inspecteren van de verdeling gaan we deze dus kwantificeren kijken we naar uitschieters (outliers). Dit doen we met het Frequencies… commando (Analyze –> Descriptive Statistics –> Frequencies). Het volgende dialoogvenster verschijnt dan:

normaliteit-kwantificeren-frequencies

Links staan alle variabelen vermeld en rechts degenen die in de analyse worden geïncludeerd. Door de gewenste variabele(n) te selecteren en vervolgens op de knop in het midden te klikken worden ze naar rechts verplaatst. SPSS produceert een standaard een frequentieverdeling van alles scores in tabelvorm.

Je kunt echter met de dialoogvensters Statistics en Charts (toegankelijk via bovenstaande venster) zelf kiezen welke statistieken en grafieken je wilt zien.

normaliteit-kwantificeren-frequencies-statisticsIn het Statictics dialoogvenster kun je verscheidene manieren kiezen waarop een verdeling van scores wordt beschreven, zoals centrummaten (gemiddelde, modus, mediaan), maten van variabiliteit (bereik, standaarddeviatie, variantie, kwartielen). Welke karakteristieken van jouw data interessant zijn voor jouw onderzoek hangt van het doel af. Doorgaans worden gemiddelde, modus, mediaan, standaarddeviatie, variantie en range gebruikt.

normaliteit-kwantificeren-frequencies-chartsIn het Charts dialoogventster kun je kiezen of, en zo ja, welke grafieken van de frequentieverdeling worden weergegeven. We hebben het in dit artikel over kwantitatieve beschrijving van de frequentieverdeling, dus dit laten we voor hier achterwege.

Wanneer je de gepaste opties geselecteerd hebt, keer je terug naar het algemene Frequencies dialoogvenster (zie bovenaan deze pagina) door op Continue te klikken. Vervolgens kies je voor OK om de analyse te laten uitvoeren.

De SPSS Output lezen

Onderstaande SPSS Output bestaat uit een tabel met beschrijvende statistieken voor de twee variabelen uit het voorbeeld (een voor- en nameting bij behandeling met een medicijn). Uit de tabel kunnen we aflezen dat de gemiddelde symptoomscore voor inname van het medicijn 98,30 was en na behandeling met het medicijn 88,60.

Andere belangrijke maten zijn skewness (scheefheid) en kurtosis (platheid). Deze dienen nul te zijn in een perfecte normale verdeling. Positieve waarden van skewness duiden op een ophoping van scores aan de linkerkant van de verdeling en negatieve waarden een ophoping aan de rechterkant van de verdeling. Positieve waarden van kurtosis duiden op een puntige en smalle verdeling en negatieve waarden op een platte en brede verdeling. In onderstaande voorbeeld is in de voormeting sprake van een hoge positieve kurtosis en skewness in de nameting vrijwel geen kortosis (bijna nul) en enige skewdness (0,268).

normaliteit-kwantificeren-output-statistics

Skewness en kurtosis omzetten naar z-scores

Hoewel de de waarden van skewness en kurtosis op zelfzich informatief zijn, kunnen we deze converteren naar z-scores. Het omzetten van scores naar een z-score is handig omdat (1) we skewness en kurtosis waarden kunnen vergelijken in verschillende steekproeven waar verschillende maten zijn gebruikt en (2) we kunnen zien hoe waarschijnlijk het is dat onze waarden van skew en kurtosis optreden.

Klik hier om alles over z-scores te weten te komen >>

Om een score naar een z-score te transformeren trek je simpelweg de het gemiddelde van de verdeling af (in dit geval 0) en deel je deze door de standaarddeviatie van de verdeling (in dit geval gebruiken van de standaardfout).

normaliteit-kwantificeren-skewness-en-kurtosis-z-score

In bovenstaande vergelijkingen worden de waarden van S (skewness) en K (kurtosis) en hun standaardfouten door SPSS berekend. Deze z-scores kunnen worden vergeleken met waarden die je zou verwachten door toeval (d.w.z. bekende waarden voor de normale verdeling weergegeven in z-score tabel). Een absolute waarde groter dan 1,96 is dus significant bij p < 0,05, boven de 2,58 significant bij p < 0,01 en absolute waarden boven de 3,29 zijn significant bij p < 0,001. Grote steekproeven zullen aanleiding geven tot lage standaard fouten. Als de steekproefomvang groot is, komen er dus significante waarden voort zelfs uit kleine afwijkingen van normaliteit. In kleinere steekproeven is het OK om uit te kijken naar waarden boven de 1,96. Echter, in grote steekproeven dient dit criterium verhoogd te worden naar 2.58 en in zeer grote steekproeven, vanwege het eerder beschreven probleem van lage standaardfouten, mag geen criterium worden toegepast. Als je een grote steekproef hebt (200 of meer) is het belangrijker om visueel te kijken naar de vorm van de verdeling en te kijken naar de waarde van de skewness en kurtosis statistieken in plaats van de berekening van hun significantie.

Voor het effect van behandeling met het medicijn in bovenstaande voorbeeld is de z-score voor skewness 0,740 / 0,337 = 2,20 voor de behandeling en 0,268 / 0,337 = 0,780 na de behandeling. Zowel voor als na de behandeling is dus sprake van een positieve skew, waarvan alleen de eerste significant is bij bij p < 0,05. De kurtosis z-scores zijn: 0,979 / 0,662 = 1,48 voor de behandeling en -0,005 / 0,662 = -0,008. Hiervan is alleen de eerste significant bij p < 0,05.

    Comment Section

    0 reacties op “Normaliteit kwantificeren met cijfers

    Plaats een reactie


    *