Statistiek: verbanden zoeken tussen variabelen

In het rekenblad Excel2013 kun je mooi statistieken zichtbaar maken. Je kunt Excel ook gebruiken om statistische variabelen te vergelijken en te zoeken naar verbanden ertussen. Bij dit practicum hoort het rekenblad

Gegevens 154 leerlingen

Dat moet je eerst met behulp van de rechtermuisknop downloaden en via "Doel opslaan als..." opslaan onder een eigen naam als Stat[..].xls, waarbij [..] je eigen naam is.

Het is wel van belang dat je met diagrammen, centrummaten en spreidingsmaten in Excel kunt werken. Als je dat niet beheerst, doe dan eerst het practicum "Statistisch onderzoek: data presenteren en vergelijken".

Inhoud:

Een kruistabel maken

Open jouw bestand Stat[...].xlsx.
Je wilt kijken naar een eventuele relatie tussen de statistische variabelen wisgroep (de gekozen soort wiskunde, A of B) en geslacht (jongen of meisje) met behulp van een kruistabel, in Excel heet dit een draaitabel. In zo'n kruistabel zet je bijvoorbeeld horizontaal de soort wiskunde, dus wisgroep uit en verticaal het geslacht. Je wilt dan zien hoeveel personen van welk geslacht een bepaalde soort wiskunde hebben gekozen.

Maak een kruistabel voor de variabelen cijfwis en profiel op een nieuw werkblad.

Een spreidingsdiagram maken

Je wilt bij de jongens kijken naar een eventueel statistisch verband tussen de variabelen lengte en gewicht met behulp van een spreidingsdiagram. Dat doe je zo:

Je ziet dat Excel standaard de linker kolom op de horizontale as zet, dat zijn hier de gewichten. Maar wellicht heb je liever de lengte op de horizontale as. Dan rechtsklik je op het grafiekgebied en kies je "Gegevens selecteren". Rij en kolom verwisselen helpt niet, je moet naar "Legendagegevens reeks" en daar "Bewerken" kiezen.
Je krijgt dan een vensters waarin de reeks X-waarden en de reeks Y-waarden zijn te zien. Die twee moet je omwisselen, dat gaat het snelst door de kolomletters om te wisselen: hier worden de D's veranderd in E's en omgekeerd. Nu krijg je de lengtes op de horizontale as.

Trendlijn en correlatiecoëfficiënt

Nu heb je wel een puntenwolk, maar daarmee heb je nog geen verband tussen y (gewichten) en x (lengtes). Dit verband kun je zichtbaar maken met een zogenaamde trendlijn. Excel tekent die lijn voor je, maar of hij enige serieuze betekenis heeft hangt af van de correlatiecoëfficiënt R. R heeft waarden uit het interval [-1,1]. Hoe dichter R bij 1 of -1 ligt, hoe beter het verband. Als R dicht bij 0 ligt is de correlatie slecht. De trendlijn en de bijbehorende correlatiecoëfficiënt vind je zo:

Omdat de correlatie behoorlijk goed is, geeft de trendlijn een (statistisch) verband tussen y en x weer. Die lijn heet ook wel de regressielijn. Daarmee kun je dan redelijk voorspellen hoe zwaar iemand in deze groep zou moeten zijn als je zijn lengte weet.

Het practicum afsluiten

Gebruik het bestand met gegevens van 154 leerlingen en probeer de volgende vragen te beantwoorden. Motiveer je antwoord op de beschreven manier.