Je hebt nu kennis gemaakt met binomiale toetsen en met het toetsen van het gemiddelde van een normale verdeling. Er bestaan nog veel andere soorten toetsen, afhankelijk van het type kansverdeling wat er achter zit. Maar ook een zogenaamde tekentoets vereist een speciale aanpak, hoewel het daarbij gewoon om een binomiale verdeling gaat. Je vergelijkt dan twee sets gegevens met elkaar, bijvoorbeeld het cijfer voor het SE (schoolexamen) en het CE (centraal examen).
De inspectie voor het onderwijs vergelijkt van een bepaalde school de cijfers voor wiskunde B van het SE (schoolexamen) en het CE (centraal examen).
> Kun je een manier te bedenken om vast te stellen of de CE-cijfers significant afwijken van de SE-cijfers?
> Waarom zou de inspectie daarin zijn geïnteresseerd?
De inspectie voor het onderwijs vergelijkt van een bepaalde school de cijfers voor wiskunde B van het SE (schoolexamen) en het CE (centraal examen). In de tabel vind je de gegevens van een klas van 19 leerlingen.
leerling | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 |
SE-cijfer | 6,0 | 6,7 | 5,8 | 7,1 | 5,4 | 6,5 | 8,8 | 6,9 | 7,9 | 5,1 | 6,1 | 6,1 | 6,4 | 7,4 | 5,9 | 6,2 | 7,1 | 6,8 | 6,3 |
CE-cijfer | 6,4 | 6,3 | 5,2 | 6,5 | 5,4 | 6,1 | 9,0 | 6,8 | 7,5 | 5,6 | 6,0 | 6,5 | 6,0 | 6,5 | 6,0 | 6,6 | 7,0 | 6,6 | 6,4 |
teken | + | – | – | – | 0 | – | + | – | – | + | – | + | – | – | + | + | – | – | + |
Een plus geeft aan dat de leerling het CE beter heeft gemaakt, een min dat het CE minder is gemaakt. Er zijn meer minnen dan plussen. Mag de inspectie op grond hiervan concluderen dat het CE significant slechter is gemaakt? (Neem een significantieniveau van 5%.)
Normaal gesproken zou je verwachten dat ongeveer evenveel leerlingen beter als minder scoren op het CE als er geen afwijking is. De kans dat iemand een plus krijgt is dan 0,5. Het aantal plussen is daarom binomiaal verdeeld.
Bij zo'n tekentoets neem je altijd p = 0,5 als uitgangspunt, als nulhypothese. En je kijkt vervolgens alleen naar het teken van de score: een "plus" als hij beter is, een "min" als hij minder is. Is er geen afwijking, dan laat je dat resultaat weg: n = 18.
Vanwege het vermoeden van de inspectie dat het CE slechter is gemaakt dan het SE is hier de alternatieve hypothese p < 0,5.
‡
Een tekentoets is een toets waarbij twee series resultaten met elkaar worden vergeleken. Met behulp van een teken (+ bijvoorbeeld) wordt aangegeven dat een resultaat in de éne serie beter is, een ander teken (– bijvoorbeeld) geeft aan dat een resultaat in de andere serie beter is.
Uitgangspunt is dat de verschillen uitsluitend door het toeval zijn te verklaren, maar dat er in feite geen verschil is tussen beide series. Het aantal minnen en plussen zou dan gelijk moeten zijn, de kans op een plus is 0,5. Het aantal plussen X is dan binomiaal verdeeld. Is er geen afwijking, dan laat je dat resultaat weg. Bij een tekentoets is dus altijd:
Op grond van het significantieniveau stel je dan het kritieke gebied van de toets vast
Er bestaan nog veel andere soorten toetsen voor specifieke doeleinden, bijvoorbeeld Pearson's Χ2-toets (chi-kwadraat-toets), die in de biologie veel wordt gebruikt, zie voorbeeld 2.
Of het toetsen van het verschil van twee normaal verdeelde stochasten, zie voorbeeld 3.
‡
De inspectie voor het onderwijs vergelijkt van een bepaalde school de cijfers voor wiskunde B van het SE (schoolexamen) en het CE (centraal examen). In de tabel vind je de gegevens van een klas van 19 leerlingen.
leerling | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 |
SE-cijfer | 6,0 | 6,7 | 5,8 | 7,1 | 5,4 | 6,5 | 8,8 | 6,9 | 7,9 | 5,1 | 6,1 | 6,1 | 6,4 | 7,4 | 5,9 | 6,2 | 7,1 | 6,8 | 6,3 |
CE-cijfer | 6,4 | 6,3 | 5,2 | 6,5 | 5,4 | 6,1 | 9,0 | 6,8 | 7,5 | 5,6 | 6,0 | 6,5 | 6,0 | 6,5 | 6,0 | 6,6 | 7,0 | 6,6 | 6,4 |
teken | + | – | – | – | 0 | – | + | – | – | + | – | + | – | – | + | + | – | – | + |
Een plus geeft aan dat de leerling het CE beter heeft gemaakt, een min dat het CE minder is gemaakt. Er zijn meer minnen dan plussen. Mag de inspectie met een significantieniveau van 5% op grond hiervan concluderen dat het CE slechter is gemaakt?
X is het aantal minnen (CE slechter) in de steekproef (n = 18). X is binomiaal verdeeld.
Nu is P(X ≥ 11 | n = 18 ∧ p = 0,5) ≈ 0,2403 > 0,05 (het significantieniveau).
De inspectie mag op grond hiervan deze conclusie niet trekken.
‡
Bij 200 worpen met een geldstuk vind je 115 keer kop en 85 keer munt. Mag je nu met een significantieniveau van 5% concluderen dat het geldstuk niet eerlijk is?
Bij een eerlijk geldstuk verwacht je 100 keer kop en 100 keer munt, noem deze theoretische waarden t1 en t2. De experimenteel gevonden waarden zijn x1 en x2.
Bekijk nu Χ2 = +
In dit geval is x1 = 115 en x2 = 85 en dus Χ2 = 4,50.
Met de grafische rekenmachine vind je:
P(Χ2 > 4,50) = P(0 ≤ Χ2 ≤ 4,50) ≈ 1 – 0,9661 = 0,0339 < 0,05.
Dus ligt 4,50 in het kritieke gebied van de toets en is de afwijking van een eerlijk geldstuk significant.
Dit voorbeeld is uit te breiden naar situaties met n theoretische en evenveel experimentele waarden. Er zijn dan n – 1 graden van vrijheid voor Χ2.
‡
Als je wilt onderzoeken of het drinken van veel sterke koffie invloed heeft op de score voor een toets dan kun je een verschiltoets uitvoeren.
Je neemt dan bijvoorbeeld 2 groepen van 30 proefpersonen. Groep A krijgt sterke koffie en groep B een placebo (fopmiddel). Daarna meet je hun scores voor een toets. Die scores zullen waarschijnlijk normaal zijn verdeeld.
Neem bijvoorbeeld aan dat de scores van groep A normaal zijn verdeeld met een gemiddelde van 75 punten en een standaardafwijking van 12.
De scores van groep B zijn normaal verdeeld met een gemiddeld van 65 punten en een standaardafwijking van 10.
Nu is het verschil van beide scores ook normaal verdeeld met gemiddelde en standaardafwijking .
Wanneer het drinken van koffie de scores niet verhoogt, zou het verschil van en gemiddeld 0 moeten zijn.
De nulhypothese is daarom H0: met .
De alternatieve hypothese luidt H1: met .
Je kiest nu een onbetrouwbaarheidsdrempel (bijvoorbeeld 5%) en kunt dan op grond van de uitslag van je meting vaststellen of het drinken van koffie de scores significant verbeterd. Een leuk onderzoekje om zelf uit te voeren...
‡
maand | jan | feb | mrt | apr | mei | jun | jul | aug | sep | okt | nov | dec |
afd.A | 9 | 9 | 8 | 10 | 12 | 13 | 12 | 12 | 10 | 11 | 8 | 12 |
afd.B | 7 | 10 | 9 | 8 | 11 | 11 | 7 | 9 | 9 | 10 | 10 | 7 |
dagnummer | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 |
middel A | 2 | 5 | 4 | 6 | 3 | 3 | 6 | 3 | 2 | 1 | 2 | 4 | 6 | 9 | 4 | 2 | 3 | 2 | 4 | 9 |
middel B | 3 | 8 | 6 | 9 | 2 | 4 | 8 | 5 | 5 | 2 | 5 | 5 | 3 | 11 | 8 | 4 | 5 | 0 | 5 | 1 |
aantal meisjes | aantal families |
0 | 18 |
1 | 56 |
2 | 110 |
3 | 88 |
4 | 40 |
5 | 8 |
www.math4all.nl > MAThADORE-basic HAVO/VWO > 4/5 HAVO wi-d > Statistiek en kansrekening > Hypothesen toetsen > Totaalbeeld > Toepassingen
Mannen hebben gemiddeld grotere voeten dan vrouwen is de gangbare opvatting. Je wilt deze opvatting toetsen met een significantieniveau van 5% met behulp van de gegevens in dit bestand.