Statistiek: data presenteren en (deel)groepen vergelijken

In het rekenblad Excel2013 kun je mooi statistieken zichtbaar maken. Daarmee kun je verschillen tussen (deel)groepen mooi in beeld brengen. Verder beschikt Excel over allerlei statistische functies om de statistieken mee samen te vatten. Bij dit practicum hoort het rekenblad

Gegevens 154 leerlingen

Dat moet je eerst met behulp van de rechtermuisknop downloaden en via "Doel opslaan als..." opslaan onder een eigen naam als Stat[..].xlsx, waarbij [..] je eigen naam is.

Het is wel van belang dat je met eenvoudige formules in Excel kunt werken. Als je dat niet beheerst, doe dan eerst van de Basistechnieken het practicum "Tafels".

Inhoud:

Invoegtoepassingen instellen

Voor dit practicum heb je een aantal invoegtoepassingen nodig: op het tabblad "Gegevens" moet helemaal rechts bovenaan de invoegtoepassing "Gegevensanalyse" staan. Als dit niet het geval is, moet je die eerst nog toevoegen:

Nu zul je op het tabblad "Gegevens" de invoegtoepassing "Gegevensanalyse" zien.

Een frequentietabel maken

Open jouw bestand Stat[...].xlsx.
Als het goed is tref je de gegevens van 154 leerlingen in 4 havo aan. Er zijn gegevens van 11 statistische variabelen verzameld. In de werkmap wordt omschreven wat onder elke variabele wordt verstaan.

Je wilt de lengtes van jongens en meisjes vergelijken om de verschillen tussen beide deelgroepen te kunnen bekijken. Je maakt dan frequentietabellen en histogrammen voor beide groepen afzonderlijk. Maak eerst een nieuw werkblad met alleen de variabelen waarmee je wilt werken. Dat doe je zo:

Je hebt nu een werkblad om te werken met geslacht, lengte en gewicht.

Sla steeds tussentijds je reslutaten op!

Nu wil je overzichtelijke frequentietabellen en diagrammen maken om te kunnen vergelijken. Daartoe maak je een geschikte klassenindeling, van ongeveer 10 klassen. Excel kan een bijpassende frequentietabel voor je maken. Daarmee wordt het vervelende "turven" overbodig.
Je doet dit eerst voor de variabele lengte. Zo maak je een overzicht van de kleinste en de grootste lengtes.

Je weet nu welke verschillende lengtes er voorkomen. Als het goed is lopen ze vanaf 156 tot en met 200. Daarmee maak je een klassenindeling, bijvoorbeeld 156 t/m 160, 161 t/m 165, etc.

Je hebt nu nette frequentietabellen voor de lengtes van de 154 leerlingen.
Wil je liever relatieve frequentietabellen?
Je moet dan elke frequentie delen door het totaal en (om procenten te krijgen) vermenigvuldigen met 100.
Sla weer je werkmap op!

Diagrammen om verschillen te zien

Je hebt in het voorgaande deel al gezien dat je met "Gegevensanalyse" door "Histogram" te kiezen, meteen een histogram kunt maken bij een frequentieverdeling.

Diagrammen kun je ook maken op het tabblad "Invoegen". Een histogram voor de lengtes van de jongens gaat zo:

Als het goed is krijg je een histogram zoals dat hierboven te zien.
Je hebt natuurlijk wel gezien dat je ook achteraf de grafiek kunt opmaken door met je rechter muisknop de verschillende gedeelten van de grafiek te selecteren. En je kunt ook andere soorten diagrammen maken. Experimenteer maar even. Als je jongens en meisjes op deze manier wilt vergelijken, moet je met relatieve frequenties werken.

De statistische functies

Je kunt eenvoudig alle centrum en spreidingsmaten door Excel laten berekenen. Dat doe je zoveel mogelijk vanuit de ruwe data! Hieronder zie je hoe je in een zelf gekozen cel de centrum- en de spreidingsmaten van de lengtes van de jongens bepaalt:

MODUS.ENKELV, MEDIAAN, e.d. zijn een statistische functies in Excel. Je kunt gewoon hun naam na het = teken invoeren in de cel, maar je kunt ze ook vinden met de knop: fX op de bovenbalk of in het menu "Formules" bij "functie invoegen". Als je daarop drukt wordt de wizard functies ingeschakeld. Kies in het venster dat nu verschijnt "Statistisch" en je vindt de hele lijst met statistische functies. Zoek daarin de juiste functie en klik daarop. Je krijgt nu een venster te zien, waarin je kunt invoeren: E2:E70. Dat zijn de cellen waarin de waarnemingen staan. (Je kunt die cellen ook met de muis selecteren.) Kies [OK] en je vindt de juiste waarde in de gewenste cel.

Boxplots

Om de lengtes van jongens en meisjes met elkaar te vergelijken kun je boxplots maken. Dan heb je eerst een paar gegevens nodig om ze te maken. Je moet de twee kwartielen, het minimum en het maximum van de gegeven waarden en de twee medianen bepalen. Dat laat je Excel in een tabel zetten zoals die je hiernaast ziet.
Omdat Excel geen boxplot optie kent, ga je een gestapeld staafdiagram ombouwen tot een boxplot. De box wordt begrensd door de ondergrens Q1 en de bovengrens Q3. Het middelste getal is de mediaan. Het gestapelde staafdiagram bestaat nu uit drie blokken: het eerste blok is vanaf 0 tot "onder" = Q1, het tweede blok loopt van "onder" tot "midden" = Mediaan - Q1 en het derde blok loopt van "midden" tot "boven" = Q3 - Mediaan.
De twee "snorharen" ("whiskers") van de boxplot maak je met behulp van foutbalken: fout onder = Q1 - minimum en fout boven = maximum - Q3. Nu ga je als volgt te werk:

Je hebt nu twee horizontale boxplots boven elkaar. Waarschijnlijk wil je de assen nog aanpassen (waarden van 150 tot 210 zijn op de horizontale as wel genoeg). En wellicht wil je de boxplots nog van kleuren voorzien. Ga vooral je gang.

Ga na, dat al de berekende statistische maten mee veranderen als je een lengtes en/of gewichten in de tabel verandert. Het uitbreiden van de tabel is ook niet al te moeilijk, je hoeft dan maar een kleine aanpassing in de formules aan te brengen.
Sla je resultaten op!

Opmerking:
Excel berekent kwartielen op afwijkende manier. De methode die het programma hanteert is geïntroduceerd door door J.Freund en B. Perles. Zij hanteren de volgende definities (n = aantal waarnemingen):
eerste kwartiel Q1: kijk naar waarneming (n+3)/4
mediaan Q2: kijk naar waarneming (n+1)/2
derde kwartiel Q3: kijk naar waarneming (3n+1)/4
(Natuurlijk moeten dan wel eerst alle waarnemingen op volgorde zijn gezet door sorteren.)
De kwartielen in Excel wijken daarom iets af van de gangbare kwartielen!

Cumulatieve frequenties

Stel je wilt de frequentietabellen van de lengtes van jongens en meisjes vergelijken met behulp van cumulatieve frequentiepolygonen.

Stel je wilt verdeling van de wiskundecijfers per profiel (CM, EM, NG en NT) bekijken. Deze vier frequentieverdelingen wil je vergelijken. Maak eerst een nieuw werkblad met de variabelen geslacht, cijfwis en profiel.
In dat werkblad ga je dan zo te werk:

Je hebt nu geleerd om cumulatieve frequentiepolygonen te maken.

Het practicum afsluiten

Gebruik het bestand met gegevens van 154 leerlingen en probeer elk van de volgende vragen te beantwoorden met behulp van tabellen, diagrammen, centrummaten en spreidingsmaten. Bekijk daarbij goed in je wiskundeboek welke tabellen, diagrammen, centrummaten en spreidingsmaten zinvol zijn in de genoemde situaties. Motiveer het gebruik van de juste diagrammen en maten.