Correlatie

Antwoorden bij de opgaven

    1. Op het oog zeker!
    2. Waarschijnlijk wel tussen de 0,9 en de 1.
    3. Een lineaire functie, dus een functie van de vorm `y = ax + b`.
    4. Je deelt door de standaarddeviaties.
  1. Doen.
  2. Gebruik de grafische rekenmachine of werk met Excel.
    Je vindt `r_(cs) ~~ 0,64`
  3. Gebruik de grafische rekenmachine of werk met Excel.
    Je vindt `r_(cs) ~~ 0,89`
    1. Het gemiddelde is ongeveer 69,5 en de standaarddeviatie is ongeveer 14,92.
    2. Het gemiddelde is ongeveer 71,4 en de standaarddeviatie is ongeveer 13,96.
    3. Omdat je werkt met klassenmiddens als je ze berekent met je grafische rekenmachine en/of omdat je afleest van normaal waarschijnlijkheidpapier.
    4. Je gebruikt de klassenmiddens en maakt combinaties zoals `(75,65)` (eerst de Mathgrade en dan de Physicsgrade) en die komt dan 5 keer voor. En zo ga je met de rest door.
    5. Ja, dat kan wel. Dan moet je alle 100 mogelijke combinaties (klassenmiddens!) onder elkaar invoeren in bijvoorbeeld Excel.
    6. Doen met behulp van Excel.
    7. Er is een redelijke correlatie.
  4. Haakjes uitwerken geeft:



    Daaruit volgt:



    en dus:



    1. Nee, toch?
    2. Een statistisch verband ligt wel voor de hand want beiden zullen toenemen met mooi zomerweer. Maar een causaal verband is er niet, een stijging van de verkoop van zonnebrillen is geen gevolg van een toenemende ijsverkoop (en omgekeerd ook niet).
    1. Gebruik je grafische rekenmachine.
    2. `r_(vz) ~~ 0,70`
    3. Ja, hoewel de correlatie niet heel erg sterk is.
    1. Gebruik je grafische rekenmachine.
    2. `r_(Lv) ~~ 0,59`, dus een zwakke correlatie.
    3. De correlatie wordt duidelijk beter!
    4. `r ~~ 0,90`.
    5. Uit `log(v) = a * log(L) + b` volgt: `v = 10^b * L^a`.
    1. Gebruik je grafische rekenmachine (of Excel). `c` op de verticale as is logisch, want de veronderstelling is dat `c` afhangt van `a`.
    2. `r_(ca) ~~ -0,91` er is dus een sterke correlatie en er bestaat een statistisch verband (zie commentaar bij c).
    3. Dit onderzoekje zou kunnen leiden tot de conclusie dat er een statistisch verband bestaat tussen beide. Dat is echter nogal gewaagd, want er zijn veel te weinig gegevens. Verder is er maar sprake van onderzoek bij één vak.
    1. Bij een maatsysteem voor kleding is het van belang te weten of er een verband bestaat tussen bijvoorbeeld iemands lengte en zijn beenmaat, of taillebreedte, e.d. Want bij het maken van kleding wil je bij één maat alle verhoudingen van het kledingstuk juist hebben.
      Bijvoorbeeld bij voetlengte en voetbreedte gaat het er om dat je bij de juiste schoenmaat (die is gebaseerd op de voetlengte) een correcte schoenbreedte hebt.
    2. Je maakt weer een puntenwolk gebaseerd op de (hier gegeven) klassenmiddens, rekening houdend met het aantal keren dat een combinatie voorkomt.
    3. Zie het antwoord bij b.
      Als je één grote tabel hebt met alle ruwe gegevens van elk van de 5001 onderzochte vrouwen, dan kun je met bijvoorbeeld Excel gemakkelijk de correlatiecoëfficiënt berekenen.