HYPOTHESEN TOETSEN EN REGRESSIEANALYSE Overzicht
Regressie

Uitleg

Als er tussen twee variabelen `x` en `y` een goede correlatie bestaat, bestaat er een lineair (statistisch) verband tussen. Maar hoe stel je daarbij een formule op? Een regressielijn moet uiteraard door het punt `(bar(x),bar(y))` gaan. De richtingscoëfficiënt (het hellingsgetal) van die lijn kun je op dit moment echter alleen nog maar schatten.
De beroemde wiskundige Carl Friedrich Gauss bedacht daarvoor in de negentiende eeuw de methode van de kleinste kwadraten. Stel je voor dat je een regressielijn wilt maken van de vorm `y = a*x + b`. Je gaat dan uit van een regressielijn van `y` op `x`.
Gauss' methode houdt nu in dat de som van de kwadraten van de verticale afwijkingen van de meetpunten tot deze regressielijn zo klein mogelijk moet zijn. Dat betekent dat

`sum_(i=1)^n (g_i - (a * l_i + b))^2`

minimaal moet zijn. Gauss vond dat dit het geval is als

`a = (sum_()^() (l_i - l)(g_i - g))/(N * sigma_x^2)`

Deze formule lijkt erg op die van de correlatiecoëfficiënt. In feite is `a = r_(xy) * (sigma_y)/(sigma_x)`. En hiermee heb je een snelle manier gevonden om het hellingsgetal `a` te vinden.

Inleiding
Uitleg
Theorie
Voorbeeld 1
Voorbeeld 2
Opgaven