Statistiek: gegevens 154 leerlingen

In het rekenblad Excel kun je mooi statistieken zichtbaar maken. Verder beschikt Excel over allerlei statistische functies. Bij dit practicum hoort het rekenblad

Gegevens 154 leerlingen

Dat moet je eerst met behulp van de rechtermuisknop downloaden en via "Doel opslaan als..." opslaan onder een eigen naam als Stat[..].xls, waarbij [..] je eigen naam is.

Het is wel van belang dat je met eenvoudige formules in Excel kunt werken. Als je dat niet beheerst, doe dan eerst het practicum "Tafels in XL".

Inhoud:


Een frequentietabel maken

Als het goed is tref je de gegevens van 154 leerlingen aan. Er zijn gegevens van 11 statistische variabelen verzameld. In de werkmap wordt omschreven wat onder elke variabele wordt verstaan.

Je wilt de lengtes van jongens en meisjes vergelijken. Je maakt dan frequentietabellen en histogrammen voor beide groepen afzonderlijk. Maak eerst een nieuw werkblad met alleen de variabelen waarmee je wilt werken. Dat doe je zo:

Je hebt nu een werkblad om te werken met geslacht, lengte en gewicht.

Sla steeds tussentijds je reslutaten op!

Excel kan ook een klassenindeling en een bijpassende frequentietabel voor je maken. Daarmee wordt het vervelende "turven" overbodig.
Je doet dit eerst voor de variabele lengte. Eerst maak je een overzicht van de kleinste en de grootste lengtes.

Je weet nu welke verschillende lengtes er voorkomen. Als het goed is lopen ze vanaf 156 tot en met 200.

Je hebt nu nette frequentietabellen voor de lengtes van de 154 leerlingen.

Sla weer je werkmap op!


Diagrammen maken

Excel kent de wizard Grafieken. Hij wordt geactiveerd met de knop waarop een klein staafdiagrammetje staat. Je kunt daarmee diagrammen maken. Een histogram voor de lengtes van de jongens gaat zo:

Als het goed is krijg je nu het gewenste histogram te zien.
Je hebt natuurlijk wel gezien dat je ook achteraf de grafiek kunt opmaken door met je rechter muisknop de verschillende gedeelten van de grafiek te selecteren. En je kunt ook andere soorten diagrammen maken. Experimenteer maar even.


Klassenindelingen en relatieve frequenties

Soms wil je je gegevens groeperen in klassen.
Je gaat dit eerst doen voor de lengtes van de jongens en de meisjes.
De klassen worden 155 –< 160, 160 –< 165, ..., 200 –< 205.

Wil je liever relatieve frequentietabellen?
Je moet dan elke frequentie delen door het totaal en (om procenten te krijgen) vermenigvuldigen met 100.

Bij de eerste frequentietabel voor de jongens ging je uit van de ruwe data. Om daarbij een lijst met relatieve frequenties te maken ga je als volgt te werk:

Je hebt nu klassenindelingen gemaakt en gewerkt met relatiev frequenties.


De statistische functies

Je kunt nu eenvoudig alle centrum en spreidingsmaten door Excel laten berekenen. Dat doe je zoveel mogelijk vanuit de ruwe data! Hieronder zie je hoe je in een zelf gekozen cel de centrum- en de spreidingsmaten van de lengtes van de jongens bepaalt:

MODUS, MEDIAAN, e.d. zijn een statistische functies in Excel. Je kunt gewoon hun naam na het =teken invoeren in de cel, maar je kunt ze ook vinden met de knop: fX op de bovenbalk of in het menu "Invoegen". Als je daarop drukt wordt de wizard functies ingeschakeld.

Kies in het venster dat nu verschijnt Statistisch en je vindt de hele lijst met statistische functies. Zoek daarin de juiste functie en klik daarop en kies Volgende. Je krijgt nu een venster te zien, waarin je kunt invoeren: E2:E70. Dat zijn de cellen waarin de waarnemingen staan. (Je kunt die cellen ook met de muis selecteren.) Kies "Voltooien" en je vindt de juiste waarde in de gewenste cel.

Om de boxplots van de jongens en de meisjes met elkaar te vergelijken heb je eerst een paar gegevens nodig om ze te maken. Je moet de twee kwartielen, het minimum en het maximum van de gegeven waarden en de twee medianen bepalen. Dat laat je Excel in een tabel zetten zoals die je hiernaast ziet.
Denk er wel om dat de er tabel precies zo uit moet zien!
Nu ga je als volgt te werk:

Opmerking:
Excel berekent kwartielen op afwijkende manier. De methode die het programma hanteert is geïntroduceerd door door J.Freund en B. Perles. Zij hanteren de volgende definities (n = aantal waarnemingen):
eerste kwartiel Q1: kijk naar waarneming (n+3)/4
mediaan Q2: kijk naar waarneming (n+1)/2
derde kwartiel Q3: kijk naar waarneming (3n+1)/4
(Natuurlijk moeten dan wel eerst alle waarnemingen op volgorde zijn gezet door sorteren.)
De kwartielen in Excel wijken daarom iets af van de gangbare kwartielen!

Ga na, dat al de berekende statistische maten mee veranderen als je een lengtes en/of gewichten in de tabel verandert. Het uitbreiden van de tabel is ook niet al te moeilijk, je hoeft dan maar een kleine aanpassing in de formules aan te brengen.
Sla je resultaten op!


Cumulatieve frequenties

Je wilt de frequentietabellen van de lengtes van jongens en meisjes vergelijken met behulp van cumulatieve frequentiepolygonen.

Je wilt verdeling van de wiskundecijfers per profiel (CM, EM, NG en NT) bekijken. Deze vier frequentieverdelingen wil je vergelijken. Maak eerst een nieuw werkblad met de variabelen geslacht, cijfwis en profiel.
In dat werkblad ga je dan zo te werk:

Je hebt nu wel geleerd om cumulatieve frequentiepolygonen te maken, zowel bij kwalitatieve als kwantitatieve variabelen.


Het practicum afsluiten

Verzamel zelf gegevens over de lengtes en gewichten in jouw eigen klas (of liefst van meerdere klassen). Maak daarvan mooie tabellen met centrum- en spreidingsmaten voor jongens en meisjes afzonderlijk. Maak er ook mooie grafieken bij.