HYPOTHESEN TOETSEN EN REGRESSIEANALYSE Overzicht
Correlatie

Theorie

In een spreidingsdiagram van twee statistische variabelen `x` en `y` zet je alle combinaties `(x,y)` als een puntenwolk in een assenstelsel. Of er een sterk lineair statistisch verband bestaat tussen de variabelen wordt bepaald door de correlatiecoëfficiënt `r_(xy)`. Er geldt: `r_(xy) = (Sigma_(i=1)^N (x_i - x)(y_i - y))/(N * sigma_x * sigma_y)`.

  • Als `r_(xy) = 1` dan is er een perfecte positieve correlatie tussen `x` en `y`. De punten van de puntenwolk liggen dan precies op een stijgende lijn.
  • Als `r_(xy) = 0` dan is er geen enkele correlatie tussen `x` en `y`.
  • Als `r_(xy) = -1` dan is er een perfecte negatieve correlatie tussen `x` en `y`. De punten van de puntenwolk liggen dan precies op een dalende lijn.

De correlatie tussen `x` en `y` wordt beter naarmate `r_(xy)` dichter bij `1` of `-1` ligt.