Binomiale toetsen

Inleiding

Beantwoord de vragen bij Verkennen.


Uitleg

Opgaven

  1. In de Uitleg gaat het weer om de hypothese dat de kans op de geboorte van een meisje 50% is. Het siginificantieniveau van de toets is 5%.
    1. Leg uit wat dit significantieniveau precies betekent.
    2. Er is hier sprake van een enkelzijdig binomiale toets. Kun je die naam verklaren?
    3. Reken zelf het kritieke gebied van deze toets na.
    4. Waarom kun je ook zeggen dat de beschreven toets een betrouwbaarheid heeft van 95%?

  2. Bekijk nog eens de toets in de Uitleg.
    1. Voer deze toets nog eens uit, maar nu met een significantieniveau van 1%.
    2. Welke invloed heeft het verkleinen van het significantieniveau op het kritieke gebied?
    3. Waarom wordt het significantieniveau niet nog veel kleiner genomen, zeg 0,1%?

Theorie

Bekijk eerst de Theorie. In de opgaven wordt je naar de Voorbeelden verwezen.

Opgaven

  1. Bestudeer Voorbeeld 1.
    1. Voer de beschreven toets zelf uit.
    2. Voer de toets nog eens uit, maar nu met een betrouwbaarheid van 95%. Is er nog steeds sprake van een significante afwijking?

  2. In Voorbeeld 2 zie je hoe je bij een tweezijdige toets te werk kunt gaan.
    1. Waarom is dit een tweezijdige toets? Wat gebeurt er met de onbetrouwbaarheidsdrempel `alpha`?
    2. Voer de beschreven toets zelf uit, maar nu met een significantieniveau van 5%.

  3. In Voorbeeld 3 wordt de toets in voorbeeld 1 opnieuw bekeken.
    1. Waarom is het in dit geval niet nodig om het kritieke gebied vast te stellen?
    2. Wat betekent het als de overschrijdingskans kleiner is dan de onbetrouwbaarheidsdrempel?
    3. Wat betekent het als de overschrijdingskans groter is dan de onbetrouwbaarheidsdrempel?

  4. Je toetst `text(H)_0: p = 0,35` tegen `text(H)_1: p > 0,35` met een significantieniveau van 5%.
    1. Bepaal het kritieke gebied bij een steekproef met grootte 100.
    2. Doe hetzelfde bij een steekproef van grootte 1000.
    3. En nog eens bij een steekproef met grootte 10.000.
    4. Welke invloed heeft de grootte van de steekproef op de grens van het kritieke gebied? Wat heeft dit te maken met de standaardafwijking van de gebruikte binomiale verdeling?
    5. Waarom neemt men niet altijd een zo groot mogelijke steekproef?

  5. Je toetst `text(H)_0: p = 0,75` tegen `text(H)_1: p != 0,75` met een onbetrouwbaarheidsdrempel van `alpha = 0,05`.
    1. Bepaal het kritieke gebied als je een representatieve steekproef van 100 gebruikt.
    2. Stel je voor dat je vooraf hebt bepaald dat in de steekproef 80 elementen de betreffende eigenschap hebben. Leg uit waarom in dat geval het berekenen van het kritieke gebied niet nodig is. Laat zien hoe je in zo’n geval sneller te werk kunt gaan.


Verwerken

  1. Op een grote school slaagt elk jaar ongeveer 96% van de eindexamenkandidaten. Het afgelopen jaar viel het resultaat behoorlijk tegen. Slechts 92 van de 107 kandidaten haalden het eindexamen. Op andere scholen in de buurt waren er geen grote veranderingen ten opzichte van de slagingspercentages van de voorafgaande jaren. Er wordt geroepen: "De kwaliteit van de school holt achteruit". Een van de geslaagden is het daarmee niet eens: "Nee hoor; dat is helemaal niet waar. Dat kan gewoon eens een jaar voorkomen. Die kans bestaat nou eenmaal".
    1. De uitspraak van deze geslaagde kun je toetsen. Hoe luiden de nulhypothese en de alternatieve hypothese?
    2. Bereken de kans op 92 of minder geslaagden als de nulhypothese waar is.
    3. Krijgt de geslaagde leerling gelijk als het significantieniveau 0,01 is?

  2. Het hoofd van de personeelsadministratie van een groot bedrijf heeft het idee dat het ziekteverzuim op maandag veel groter is dan op de andere dagen in de week. Om dit te onderzoeken vraagt hij het aantal ziekteverzuimdagen per werkdag op in een bepaalde maand. In deze tabel zie je de resultaten.

    dagmadiwodovr
    aantal zieken9561586311

    1. Hoeveel zieken zou je op maandag mogen verwachten als het ziekteverzuim onafhankelijk is van de weekdag?
    Het vermoeden van de bedrijfsleider kun je met deze gegevens toetsen. Als nulhypothese kun je nemen: `text(H)_0: p = 0,2`.
    1. Formuleer de alternatieve hypothese.
    2. Krijgt de bedrijfsleider gelijk? Neem een significantieniveau van `alpha = 0,05`.

  3. Bij een loterij die elke week plaatsvindt, moet je op een formulier met daarop de getallen 1 tot en met 19, drie getallen aankruisen. Nadat de inlevertijd is verstreken, worden aselect drie getallen getrokken. Een deelnemer die op zijn lot tenminste twee van de drie getrokken getallen heeft aangekruist, krijgt een prijs.
    1. Toon aan dat, afgerond op twee decimalen, de kans op een prijs gelijk is aan 0,05.
    Iemand beweert dat zijn kans op een prijs groter is dan 0,05. Deze bewering wordt getoetst door gedurende honderd weken het aantal prijzen van deze persoon te noteren. Er wordt een significantieniveau van 1% gekozen.
    1. Hoeveel prijzen moet deze persoon in die honderd weken tenminste hebben gewonnen om hem gelijk te kunnen geven?

  4. Iemand wil de zuiverheid van een geldstuk controleren en besluit er 500 keer mee te werpen.
    Bij welke aantallen "kop" zal hij besluiten dat het geldstuk onzuiver is als hij een betrouwbaarheid van 90% hanteert?

  5. In 1998 zijn er in Nederland 179.568 baby’s geboren. 90.096 meisjes en 89.472 jongens. Met deze getallen kun je toetsen of de kans op een meisje gelijk is aan de kans op een jongen.
    De nulhypothese is dan weer: de kans op een meisje is 0,5.
    1. Neem aan dat het aantal meisjes binomiaal is verdeeld. Welke parameters heeft deze verdeling?
    2. Moet de nulhypotese verworpen of geaccepteerd worden als de onbetrouwbaarheidsdrempel 5% is?
    3. En als de toets een betrouwbaarheid van 99% moet hebben?


Testen

  1. Op het instituut voor toepast psychologisch onderzoek onderzoekt men helderziendheid. Mensen die beweren helderziend te zijn, worden uitgenodigd voor het volgende experiment. De helderziende wordt opgesloten in een kamer. Hij krijgt een serie van drie zeer verschillende plaatjes. Op hetzelfde ogenblik ontvangt een ander persoon in dezelfde ruimte dezelfde drie plaatjes. Deze persoon krijgt de opdracht om zich vijf minuten lang op één van de drie plaatjes te concentreren. Na die vijf minuten moet de helderziende dan aangeven op welk plaatje de ander zich geconcentreerd heeft. De twee deelnemers kunnen elkaar niet zien. Ze hebben een koptelefoon op waardoor ze steeds een nieuwe opdracht krijgen. Dit proces wordt in totaal 40 keer herhaald met steeds nieuwe series plaatjes. De nulhypothese die men wil toetsen luidt: de helderziende is niet helderziend. Dat kan men toetsen met behulp van het aantal keren dat de helderziende hetzelfde plaatje aangeeft als de ander. Als de nulhypothese waar is dan is het aantal keren "hetzelfde plaatje" binomiaal verdeeld.
    1. Welke parameters heeft deze binomiale verdeling?
    2. Helderziende X geeft 17 keer het juiste plaatje aan. Bereken de kans dat dit gebeurt als de nulhypothese juist is.
    3. Bereken de kans dat de nulhypothese ten onrechte verworpen wordt als er afgesproken wordt dat er sprake is van helderziendheid bij meer dan 20 juiste plaatjes.
    4. Er wordt afgesproken dat het significantieniveau 0,05 is. Wordt helderziende Y helderziend verklaard als hij 18 plaatjes goed heeft?

  2. Een kweker wil onderzoeken of zijn kruisingsmethode als resultaat heeft dat 25% van de bessenstruiken gevoelig is voor meeldauw. Hij constateert dat van de 100 bessenstruiken er 33 last hebben van meeldauw.
    Mag hij nu met een significantieniveau van 5% aannemen dat toch maar 25% gevoelig is voor meeldauw?