Binomiale kansen benaderen

Inleiding

Je ziet hier een kanshistogram van een binomiale verdeling met n = 50 en p = 0,20. Je ziet dat het een mooie klokvorm heeft, X loopt van 0 tot 30, de verwachtingswaarde is 50 · 0,20 = 10 en de standaardafwijking is ongeveer 2,8. Hoe groter n hoe beter het kanshistogram de klokvorm benadert.
De wiskundige formulering van deze stelling heet de centrale limietstelling.

Je leert nu:

Je kunt al:

Verkennen

Lees de inleiding en bekijk de figuren hierboven.

> Maak zelf dit kanshistogram en laat zien hoe je de standaardafwijking berekent.
> Doe ditzelfde nog eens voor n = 100 en dezelfde waarde van p.
> Bepaal P(X ≤ 23 | n = 100 en p = 0,20).
> Benader deze kans met de normale verdeling die past bij de klokvormige kromme die past bij het kanshistogram.


Uitleg

Hier zie je een kanshistogram van een binomiale verdeling met n = 50 en p = 0,20. Het heeft een mooie klokvorm, de verwachtingswaarde is 50 · 0,20 = 10 en de standaardafwijking is ongeveer 2,8.
Er onder zie je een kanshistogram van een binomiale stochast X met n = 100 en p = 0,20 voor X van 0 tot 35. De klokvorm wordt nog beter: hoe groter n hoe beter het kanshistogram de klokvorm benadert.
De wiskundige formulering van deze stelling heet de centrale limietstelling.

Je kunt nu bijvoorbeeld P(X ≤ 23 | n = 100 en p = 0,20) benaderen met behulp van de normale verdeling:

Deze aanpassing van een normale stochast aan een discrete stochast heet de continuïteitscorrectie.

Opgaven

  1. Bestudeer de Uitleg.
    1. Bepaal P(X ≤ 23 | n = 100 en p = 0,20) met behulp van de binomiale kansverdeling.
    2. Benader P(X ≤ 23 | n = 100 en p = 0,20) met behulp van de normale verdeling.
    3. Vind je veel verschil tussen a en b? Heb je de continuïteitscorrectie toegepast?

  2. Je gooit 15 keer met een eerlijk geldstuk. Het gaat je om de kans dat je slechts 6 keer munt gooit.
    1. Gebruik de binomiale verdeling om deze kans te berekenen.
    2. Gebruik de normale verdeling om deze kans te berekenen.
    3. Vergelijk je antwoorden met elkaar. Wat valt je op? Geef hiervoor een verklaring.

Theorie

De centrale limietstelling zegt:
Als X1, X2, ..., Xn onafhankelijke stochasten met dezelfde kansverdeling (en dus ook met gelijke verwachting E(X) en variantie Var(X)) zijn, dan is de som van deze stochasten normaal verdeeld met verwachting μ = n · E(X) en standaardafwijking σ =  nVar(X)  als n oneindig groot wordt.

Het bewijs van deze stelling vereist meer wiskundige kennis dan je nu hebt. Daarom wordt het hier buiten beschouwing gelaten.

Een gevolg van deze stelling is dat je een binomiale stochast X met parameters n en p voor grote n en niet al te kleine p kunt benaderen met een normale stochast Y met μ(Y) = E(X) = n · p en σ(Y) = σ(X) =  np(1p) .
Meestal wordt als vuistregel gebruikt dat deze benadering goed is als n > 25 en np > 5 en n(1 – p) > 5.

Bij het benaderen van binomiale kansen met behulp van een bijpassende normale stochast moet je wel de continuïteitscorrectie toepassen. Dat wil zeggen bij het overgaan van de discrete binomiale stochast naar de continue normale stochast letten op de afronding op gehelen!

Opmerking:
Het benaderen van een binomiale verdeling met behulp van een normale stochast is tegenwoordig niet meer erg boeiend. De huidige rekenapparatuur kan binomiale kansen zelfs voor heel grote n moeiteloos berekenen.

Voorbeeld 1

Volgens het artikel Wikipedia: Kleurenblindheid heeft ongeveer 1 op elke 20 mannen last van "rood-groen" kleurenblindheid.
Hoe groot is de kans dat in een representatieve steekproef van 15.000 mannen inderdaad 750 rood-groen-kleurenblinden voorkomen?

Antwoord

Stochast X is het aantal mannen in de steekproef van 15.000 dat rood-groen-kleurenblind is.
X is binomiaal verdeeld met p = 0,05 en n = 15.000.
Dus E(X) = 15.000 · 0,05 = 750 en σ(X) =  150000,050,95  ≈ 26,6927.

De gevraagde kans is P(X = 750 | n = 15.000 en p = 0,05).

Beide kansen zijn inderdaad op vier decimalen nauwkeurig hetzelfde.

Voorbeeld 2

De kans op kleurenblindheid is bij vrouwen veel kleiner, maar ongeveer 0,4% van de Westerse vrouwen is kleurenblind.
Hoe groot is de kans dat in een representatieve steekproef van 250 vrouwen inderdaad 1 kleurenblinde voorkomt?

Antwoord

Stochast X is het aantal vrouwen in de steekproef van 250 dat kleurenblind is.
X is binomiaal verdeeld met p = 0,004 en n = 250.
Dus E(X) = 250 · 0,004 = 1 en σ(X) =  2500,0040,996  ≈ 0,9980.

De gevraagde kans is P(X = 1 | n = 250 en p = 0,004).

Beide kansen zijn iets verschillend van elkaar. Dat komt omdat n · p = 250 · 0,004 = 1 ≤ 5 en een normale benadering in dit geval eigenlijk volgens de vuistregel niet verantwoord is.

Opgaven

  1. In Voorbeeld 1 zie je hoe je een binomiaal kansmodel kunt benaderen door een normale verdeling.
    1. Reken zelf dit voorbeeld na.
    2. In de Theorie staat een vuistregel die aangeeft wanneer je een binomiale kans kunt benaderen met de normale verdeling. Is in dit voorbeeld aan die vuistregel voldaan?

  2. In Voorbeeld 2 zie je nog eens hoe je een binomiaal kansmodel kunt benaderen door een normale verdeling.
    1. Reken ook dit voorbeeld na.
    2. Is in dit voorbeeld aan de vuistregel in de Theorie voldaan?

  3. Ongeveer 6% van de koffers die door een bepaalde machine geproduceerd worden, vertoont defecten.
    1. Geef een normale benadering van de kans dat van de 100 koffers die op een morgen worden gemaakt er hooguit 3 zijn die defecten vertonen.
    2. Hoe groot is de kans dat dit er precies 11 zijn?

  4. Uit onderzoek blijkt 55% van de stemgerechtigden uit een stad te zullen gaan stemmen op kandidaat A. Veronderstel dat je aan 1400 stemgerechtigden zou vragen waarop de bij de eerstkomende verkiezing zouden stemmen. Het gaat je om de kans dat minstens 700 mensen antwoorden op kandidaat A te zullen stemmen.
    1. Waarom ligt een normale benadering van deze kans voor de hand?
    2. Is zo’n normale benadering ook per se nodig?
    3. Geef een normale benadering van deze kans.

Verwerken

  1. Van een geneesmiddel is bekend dat 80% van de patiënten die het gaan gebruiken, inderdaad ook geneest. Het middel wordt in een kliniek aan 25 patiënten voorgeschreven. Geef een normale benadering van de kans dat van deze groep patiënten:
    1. precies 20 personen genezen.
    2. alle 25 personen genezen.
    3. niet één persoon geneest.
    4. meer dan 12 personen genezen.
    5. tussen de 17 en de 23 personen genezen.

  2. In een bepaalde streek is bekend dat 2,5% van de baby’s in hun eerste levensjaar sterven. In deze streek worden in een bepaald jaar 525 baby’s geboren.
    1. Hoeveel zullen hiervan naar verwachting in het eerste levensjaar sterven?
    2. Geef een normale benadering van de kans dat er hooguit 8 sterven. Verschilt je antwoord veel van de werkelijke kans?
    3. Bepaal de kans dat minstens 520 baby’s het eerste levensjaar overleven.

  3. De kans dat een entstof A tegen griep succes heeft, blijkt na onderzoekingen 0,95 te zijn. Een bedrijf laat alle 1150 werknemers met dit griepvaccin inenten.
    1. Hoe groot is voor dit bedrijf de kans dat meer dan 60 werknemers toch de griep krijgen?
    2. Benader de bij a genoemde kans ook met de normale verdeling.

  4. In een restaurant met een capaciteit van 350 tafels zijn voor de komende feestdagen alle tafels gereserveerd. De restauranthouder weet dat het aantal reserveringen waarbij niemand komt opdagen bij benadering normaal is verdeeld met een gemiddelde van 17,5 en een standaardafwijking van 4,1.
    1. Hoe groot is de kans dat iemand die heeft gereserveerd ook komt opdagen?
    2. De eigenaar van het restaurant wil zoveel reserveringen aannemen dat de kans dat voor iedereen die heeft gereserveerd en dan ook inderdaad verschijnt plaats is, minstens 99% is. Hoeveel reserveringen zal hij maximaal kunnen noteren?


Testen

  1. Een voedingsmiddelenbedrijf is zeer geïnteresseerd in de mening van haar klanten. Bij een onderzoek dat onder een grote groep mensen plaatsvond, was 70% van alle ondervraagden zeer tevreden over de smaak van één van hun producten. Het bedrijf levert aan een bedrijfskantine voor 250 mensen dit product en vraagt hen daarna naar hun mening over de smaak ervan. Ga er van uit dat alle 250 mensen die van deze bedrijfskantine gebruik maken ook echt het product hebben geproefd.
    1. Hoe groot is de kans dat minder dan 60 van hen het product niet lekker vinden als het resultaat van het onderzoek ook voor de mensen in deze bedrijfskantine opgaat?
    2. Bepaal de voorgaande kans ook door benadering met de normale verdeling.

  2. Het aantal keren dat een redelijk goede schutter bij een serie van 50 schoten de roos raakt blijkt normaal te zijn verdeeld met een standaardafwijking van 3. Hij gaat er van uit dat deze normale verdeling is ontstaan omdat hij per schot een bepaalde vaste kans `p` heeft om de roos te raken.
    1. Welke waarde zou `p` bij deze aanname moeten hebben?
    2. Bij hoeveel van de 50 schoten zal hij dan gemiddeld de roos raken?
    3. Hoe groot is de kans dat hij tenminste 30 keer van de 50 schoten de roos raakt?