Page content

Correlatie

Correlatie

Correlatie is een gestandaardiseerde maat voor de samenhang tussen twee variabelen. Wanneer men spreekt over een correlatie, dan zegt men dat een verandering in de ene variabele samengaat met een soortgelijke verandering in de andere. Correlatie wordt uitgedrukt in een gestandaardiseerd getal tussen 1 en -1, waarbij 1 een perfecte positieve correlatie is, 0 geen correlatie en -1 een perfecte negatieve correlatie. Bijvoorbeeld, wanneer de AEX-index met 5% stijgt wanneer de DOW Jones met 5% stijgt, is er sprake van een perfecte positieve correlatie. Echter, wanneer de AEX-index met 5% daalt wanneer de DOW Jones met 5% stijgt, dan gaat het om een perfecte negatieve correlatie.

correlatie-positief-negatief-neutraal

Covariatie vs. Correlatie

De statistische termen covariatie en correlatie lijken erg op elkaar. Beiden drukken de samenhang tussen variabelen uit. Echter worden ze op verschillende wijzen uitgedrukt en berekend. Waar correlatie een gestandaardiseerde maat is (de correlatie-coëfficiënt), welke nooit boven de 1 of onder de -1 kan vallen, wordt covariatie berekent aan de hand van de eenheden van de twee variabelen. Dit maakt het moeilijk om twee verschillende covariatiewaarden van verschillende datasets met elkaar te vergelijken.

Correlatie-coëfficiënt berekenen

Doorgaans wordt de correlatie berekend met de Pearson collelatie-coëfficiënt, welke wordt uitgedrukt in r. Een r-waarde onder de 0.10 wordt ‘klein’ genoemd, tussen 0.10 en 0.3 ‘klein tot gemiddeld’, tussen 0.30 en 0.50 ‘gemiddeld tot groot’ en boven de 0.50 ‘groot’. Onderstaande voorbeeld kan dus groot worden genoemd.

correlatie-voorbeeld

 

Spearmans rangcorrelatiecoëfficiënt, kortweg Spearmans rho, is een alternatieve maat. Deze is gebaseerd op rangnummers van data en niet op de data zelf. Daarmee is het een verdelingvrije maat en geschikt om de correlatie tussen ordinale variabelen te meten. De Spearman is minder gevoelig voor outliers dan de Pearson.

Causaliteit en correlatie
causaliteit

Causaliteit, oorzakelijkheid of de wet van oorzaak en gevolg betekent dat gebeurtenissen plaatsvinden als gevolg van bepaalde andere gebeurtenissen die daaraan vooraf gegaan zijn. In het algemeen kun je spreken van een causaal verband tussen twee gebeurtenissen als aan de volgende drie voorwaarden is voldaan:

  1. Covariantie of correlatie: beide variabelen veranderen altijd samen
  2. De oorzaak gaat vooraf aan het gevolg
  3. Er is geen derde variabele, zoals een modererende of onafhankelijke variabele

Causaliteit of correlatie? Een voorbeeld:

  • Op zonnige dagen wordt meer ijs verkocht
  • Op zonnige dagen verdrinken er meer kinderen verdrinken

Uit bovenstaande feiten kun je geen causaliteit afleiden tussen de verkoop van ijs en het verdrinken van kinderen. Hoewel beide variabelen samen veranderen (correlatie) is het onduidelijk of de oorzaak vooraf gaat aan het gevolg en zijn er andere variabelen in het spel (in ieder geval ‘zonnige dagen’). Ook kun je op basis van deze gegevens geen causaliteit aantonen tussen zonnige dagen en de verkoop van ijs of het verdrinken van kinderen. De verkoop van ijs en het verdrinken van kinderen zijn namelijk geen onvermijdelijk gevolg van een zonnige dag. Het maakt hierbij niet uit of je honderd of honderdduizend waarnemingen hebt verzameld.

    Comment Section

    0 reacties op “Correlatie

    Plaats een reactie


    *