Statistiek: steekproeven en uitspraken

Bij statistiek draait het allemaal om onderzoek. Het doel ervan is uitspraken doen waarbij je (deel)groepen vergelijkt, of een verband zoekt tussen twee statistische variabelen. Deze uitspraken moeten onderbouwd worden met cijfers, diagrammen en berekeningen. Maar je kunt bij een onderzoek nooit alle Nederlanders of alle jongeren onderzoeken. Je moet bij een onderzoek een goede steekproef uit alle Nederlanders of uit alle jongeren bekijken en daar toch conclusies uit trekken. Hoe doe je dat op een verantwoorde wijze? Dat ga je in dit practicum zien. Je gebruikt hierbij het bestand:

Steekproeven uit havo examenkandidaten

Je ziet daarin met welke betrouwbaarheid je bijvoorbeeld het percentage jongens onder de examenleerlingen havo van een school kunt schatten met behulp van een steekproef. En hoe je bij dezelfde school het gemiddelde CE-cijfer voor bijvoorbeeld Nederlands kunt schatten met behulp van een steekproef.

Inhoud:

Een steekproef trekken met toevalsgetallen

Als bijvoorbeeld uit een groep van 124 wielrenners een steekproef van 10 wilt trekken voor een dopingcontrole, dan kies je uit hun rugnummers 1 t/m 124 een tiental willekeurige nummers. Je laat zuiver het toeval bepalen welke rugnummers dat zijn, dus je werkt met toevalsgetallen.

Toevalsgetallen genereren in Excel gaat zo:

Als je tien van die toevalsgetallen wilt hebben, dan zet je in tien cellen =AFRONDEN(ASELECT()*(124-1)+1;0).
In Excel zit bij "Formules" de mogelijkheid om je werkblad steeds te vernieuwen en zo dus steeds nieuwe steekproeven te trekken, zie figuur hiernaast.

Populatiegemiddelde schatten uit steekproefgemiddelde

Als het goed is tref je op het eerste werkblad de gegevens van 259 havo examenkandidaten van een bepaalde school in een bepaald jaar aan. Je wilt nu het gemiddelde CE-cijfer voor Nederlands schatten door van een aselecte steekproef van 30 leerlingen het cijfer te gebruiken. Op het tweede werkblad zie je een steekproef van 30 leerlingen. Zo'n steekproef kan Excel zelf aanmaken, zoals je ziet.
Je ziet dat het steekproefgemiddelde een redelijke schatting geeft van het populatiegemiddelde. De bijbehorende betrouwbaarheidsintervallen zie je ernaast. In Excel zit bij "Formules" de mogelijkheid om je werkblad steeds te vernieuwen en zo dus steeds nieuwe steekproeven te trekken, zie figuur hiernaast. Bekijk wat er dan gebeurt en hoe het toeval een rol speelt bij steekproeven en het schatten van het populatiegemiddelde.

Je gaat nu zelf zo'n werkblad maken voor het vak Engels. Daarop maak je een steekproef van 40 leerlingen om het populatiegemiddelde te schatten.

Populatieproportie schatten uit steekproefproportie

Als het goed is tref je op het eerste werkblad de gegevens van 259 havo examenkandidaten van een bepaalde school in een bepaald jaar aan. Je wilt nu het percentage mannen bij deze examenkandidaten schatten door een aselecte steekproef van 30 leerlingen naar hun geslacht te vragen. Op het derde werkblad zie je een steekproef van 30 leerlingen. Zo'n steekproef kan Excel zelf aanmaken, zoals je ziet.
Je ziet dat de steekproefproportie een redelijke schatting geeft van de populatieproportie. De bijbehorende betrouwbaarheidsintervallen zie je ernaast.

Je gaat nu zelf zo'n werkblad maken voor de profielkeuze en de proportie NG-kiezers. Daarop maak je een steekproef van 40 leerlingen om de populatieproportie te schatten.

Het eindresultaat

Kies zelf een vak en maak een werkblad waarop je het populatiegemiddelde van de CE-cijfers of de SE-cijfers van een bepaald vak schat met behulp van een steekproef van een bepaalde grootte. Maak ook een werkblad waarop je met behulp van een steekproef de populatieproportie CM-leerlingen schat.