Niet-binomiaal

Inleiding

Het binomiale kansmodel is erg overzichtelijk: er zijn maar twee mogelijkheden "succes" of "mislukking" en het gaat om herhaling van steeds dezelfde kanssituatie. Maar natuurlijk bestaan er heel veel discrete stochasten waarbij er meer dan twee mogelijkheden zijn en/of er geen herhaling plaatsvindt. Denk bijvoorbeeld in het vaasmodel aan een trekking zonder teruglegging.
Je zult in dit onderdeel een paar discrete niet-binomiale stochasten tegenkomen.

Je leert nu:

Je kunt al:

Verkennen

In een groep van 25 mannen zijn 2 leden van die groep kleurenblind.
Je trekt aselect een steekproef van vier mannen uit deze groep.

> Hoe groot is de kans dat daarbij één kleurenblinde man zit?

Van alle westerse mannen is 8% kleurenblind.
Je trekt aselect een steekproef van vier mannen uit deze groep.

> Hoe groot is de kans dat daarbij één kleurenblinde man zit?


Uitleg

In een groep van 30 personen hebben 10 mensen een bepaalde eigenschap en de rest niet. Uit die groep wordt aselect een steekproef van 5 getrokken.
Stochast M is het aantal mensen met deze eigenschap in deze steekproef.

Wil je nu een kansverdeling voor M opstellen, dan bedenk je dat het hier gaat om trekking zonder terugleggen. Dit betekent dat de kansen afhankelijk zijn van elkaar en dat een binomiaal kansmodel niet mogelijk is.
De kans op bijvoorbeeld M = 2 kun je zo berekenen:

P(M = 2) =  10 30  ·  9 29  ·  20 28  ·  19 27  ·  18 26  ·  ( 5 2 )  ≈ 0,3600.

Ga na, dat je deze kansverdeling krijgt:

m 0 1 2 3 4 5
P(M = m) 0,1088 0,3400 0,3600 0,1600 0,0295 0,0018

Je kunt met behulp van de tabel de verwachting en de standaardafwijking berekenen.
Je vindt E(M) ≈ 1,667 en σ(M) ≈ 0,979.

Kennelijk gaat E(M) = 5 ·  10 30  = 1 2 3  ook hier op, maar dit geldt niet voor de formule die bij de binomiale verdeling voor de standaardafwijking geldt.

In een groep van 30.000 personen hebben 10.000 mensen een bepaalde eigenschap en de rest niet. Uit die groep wordt aselect een steekproef van 5 getrokken.
Stochast M is het aantal mensen met deze eigenschap in deze steekproef.

Wil je nu een kansverdeling voor M opstellen, dan bedenk je dat het hier gaat om trekking zonder terugleggen. Dit betekent dat de kansen afhankelijk zijn van elkaar en dat een binomiaal kansmodel niet mogelijk is. De kans op M = 2 is:

P(M = 2) =  10000 30000  ·  9999 29999  ·  20000 29998  ·  19999 29997  ·  19998 29996  ·  ( 5 2 )  ≈ 0,3292.

Nu verschilt een breuk als 9999 29999  vrijwel niet van 10000 30000  =  1 3 .

En daarom kun je als je een kleine steekproef uit een heel grote populatie trekt toch wel het binomiale kansmodel gebruiken, hoewel het eigenlijk niet om onafhankelijke kansen gaat. Zie maar:

P(M = 2) ≈ ( 1 3 )2 · ( 2 3 )3 ·  ( 5 2 )  ≈ 0,3292.

Zelfs op vier decimalen nauwkeurig zijn beide kansen gelijk. In de praktijk wordt bij een steekproef uit een heel veel grotere populatie waarbij het gaat om het wel of niet hebben van een bepaalde eigenschap gewoon het binomiale kansmodel gebruikt.

Opgaven

  1. Bekijk in de Uitleg de kansverdeling van stochast `M` die het aantal mensen met een bepaalde eigenschap in een steekproef uit een kleine populatie van 30 personen weergeeft.
    1. Bereken P`(M = 3)` en P`(M = 4)`.
    2. Bereken E`(M)` en `sigma(M)`.
    3. Waarom is hier geen sprake van een binomiale kansverdeling?

  2. Bekijk in de Uitleg de kansverdeling van stochast `M` die het aantal mensen met een bepaalde eigenschap in een steekproef uit een grote populatie van 30.000 personen weergeeft.
    1. Bereken P`(M = 3)` en P`(M = 4)`. Benader deze kansen ook met behulp van het binomiale kansmodel.
    2. Bereken E`(M)` en `sigma(M)`.
    3. Waarom is kun je de kansverdeling van `M` heel goed benaderen door een binomiale kansverdeling?

Theorie

Heel vaak is in een bepaalde kanssituatie helemaal niet sprake van een binomiale stochast. Dan is er geen sprake van een herhaling van onafhankelijke Bernoulli-experimenten (succes of mislukking).

Een belangrijk geval is de hypergeometrische stochast.
Daarbij gaat het om een populatie van N elementen waarvan er a een bepaalde eigenschap hebben. Je trekt daaruit zonder teruglegging een steekproef van n elementen. De hypergeometrische stochast X is dan het aantal elementen in de steekproef dat deze eigenschap heeft. De kans op X = x is:

P(X = x) =  a N a1 N1 ... Na Nx Na1 Nx1 ...( n x ) .

Voor de verwachtingswaarde geldt: E(X) = n · p.
De standaarddeviatie van X kun je nu alleen uit de kansverdeling zelf halen. Daarom bepaal je in de praktijk zowel E(X) als σ(x) met behulp van de GR.

Bij een kleine steekproef uit een heel grote populatie kun je toch wel het binomiale kansmodel gebruiken, hoewel het eigenlijk niet om onafhankelijke kansen gaat. Dat komt omdat dan breuken als a N  en a1 N1  vrijwel gelijk zijn.
In de praktijk wordt bij een steekproef uit een heel veel grotere populatie waarbij het gaat om het wel of niet hebben van een bepaalde eigenschap gewoon het binomiale kansmodel gebruikt.

Voorbeeld 1

In een klas zitten 8 jongens en 12 meisjes. Daaruit wordt een aselecte steekproef van 4 personen getrokken. Stochast M is het aantal meisjes in de steekproef.
Stel een een kansverdeling op voor M en bepaal de verwachting en de standaardafwijking van M.

Antwoord

Bij de steekproef gaat het om trekking zonder terugleggen van 4 elementen uit een populatie van 20. M is een hypergeometrische stochast.
De kans op bijvoorbeeld M = 3 is:

P(M = 3) =  12 20  ·  11 19  ·  10 18  ·  8 17  · 4 ≈ 0,3633.

De complete kansverdeling wordt:

m01234
P(M = m)0,01450,13870,38140,36330,1022

Met de GR vind je dan: E(M) = 2,4 en σ(M) ≈ 0,899.

Voorbeeld 2

Op een scholengemeenschap zitten 800 jongens en 1200 meisjes. Daaruit wordt een aselecte steekproef van 4 personen getrokken. Stochast M is het aantal meisjes in de steekproef. Stel een een kansverdeling op voor M en bepaal de verwachting en de standaardafwijking van M. Laat zien dat je kansen vrijwel hetzelfde zijn als je een binomiaal kansmodel gebruikt.

Antwoord

Bij de steekproef gaat het om trekking zonder terugleggen van 4 elementen uit een populatie van 2000. M is een hypergeometrische stochast.
De kans op bijvoorbeeld M = 3 is:

P(M = 3) =  1200 2000  ·  1199 1999  ·  1198 1998  ·  800 1997  · 4 ≈ 0,3458.

Dit is vrijwel gelijk aan P(M = 3) = ( 1200 2000 )3 ·  800 2000  · 4 ≈ 0,3456.

Je kunt de kansen goed benaderen met een binomiaal kansmodel:

m01234
P(M = m)0,02560,15360,34560,34560,1296

En nu vind je: E(M) = 4 ·  1200 2000  = 2,4 en σ(M) =  4 1200 2000 800 2000  ≈ 0,980.

Voorbeeld 3

Je hebt gelezen dat op dit moment 23% van alle Nederlandse meisjes van 12 t/m 18 jaar rookt. Je weet dat deze groep meisjes uit ongeveer 450.000 personen bestaat. Je vraagt 50 jou onbekende Nederlandse meisjes uit die leeftijdscategorie of ze roken.
Hoe groot is de kans dat minstens 15 daarvan dit doen?

Antwoord

Hier is sprake van een steekproef uit een veel grotere populatie. Hoewel in feite sprake is van een hypergeometrische stochast, kun je het aantal rokende meisjes M in de steekproef opvatten als binomiale stochast.

De gevraagde kans is daarom P(M ≥ 15) = 1 – P(X ≤ 14) ≈ 0,1565.

Opgaven

  1. In Voorbeeld 1 gaat het om een steekproef van 4 uit een populatie van 20 personen. `M` is het aantal meisjes in de steekproef.
    1. Waarom is `M` geen binomiale stochast?
    2. Bereken zelf de kansen in de kansverdeling `M`.
    3. Reken de verwachtingswaarde en de standaardafwijking van `M` na.
    4. Bereken de kans dat er minstens 3 meisjes in de steekproef voorkomen.

  2. In Voorbeeld 2 gaat het om een steekproef van 4 uit een populatie van 2000 personen. `M` is het aantal meisjes in de steekproef.
    1. Waarom is `M` nog steeds geen binomiale stochast? Maar waarom kun je `M` nu wel goede benaderen met een binomiale stochast?
    2. Bereken zelf de kansen in de kansverdeling `M`.
    3. Reken de verwachtingswaarde en de standaardafwijking van `M` na.
    4. Bereken de kans dat er minstens 3 meisjes in de steekproef voorkomen.

  3. Een gezelschap bestaat uit drie mannen, vier vrouwen en vijf kinderen. Op een buurtfeest moet op aselecte wijze een team van vier personen uit de groep samengesteld worden om aan een spel deel te nemen.
    1. Welk kansmodel moet je gebruiken om de kans te berekenen dat in de groep twee kinderen zitten? Waarom?
    2. Hoe groot is de kans bedoeld in a?
    3. Hoe groot is de kans dat in de groep van vier minstens twee vrouwen zitten?
    4. Hoe groot is de kans dat de groep louter uit vrouwen en kinderen bestaat?
    5. Hoeveel kinderen mag je in de groep verwachten?

  4. In een vaas zitten twee witte en drie rode balletjes. Uit deze vaas worden, zonder teruglegging balletjes getrokken, totdat er een wit balletje wordt getrokken.
    Wat is de verwachting en de variantie van het aantal benodigde trekkingen?

  5. In Voorbeeld 3 gaat het om het berekenen van kansen dat een bepaald aantal meisjes in een steekproef van 50 uit een populatie van 450.000 meisjes rookt.
    1. Hoe moet je P`(M = 15)` eigenlijk berekenen?
    2. Waarom kun je in dit geval heel goed met een binomiaal kansmodel werken?
    3. Bereken P`(M = 15)`.

  6. Van alle leerlingen uit het basisonderwijs is bekend dat 90% rechtshandig is. Hoe groot is de kans dat je in een willekeurig gekozen groep van 20 kinderen minder dan 16 rechtshandigen aantreft?

  7. Een partij van 1000 blikken met groente heeft lange tijd in een magazijn gelegen. Je mag aannemen dat van 10% van de blikken de uiterste verkoopdatum verstreken is. Je kiest aselect 8 blikken uit de partij en controleert de verkoopdatum. Je vraagt je af hoe groot de kans is dat je in die steekproef wel drie blikken aantreft die te oud zijn.
    1. Is dit een trekking met of zonder terugleggen?
    2. Hoe groot is de genoemde kans?
    3. Bereken deze kans ook met het binomiale kansmodel. Hoe groot is het verschil tussen beide berekeningen?
    4. Bereken in drie decimalen nauwkeurig de kans dat je maximaal 3 blikken gekozen hebt waarvan de uiterste verkoopdatum verstreken is.


Verwerken

  1. Het bestuur van een politieke partij bestaat uit 20 personen, waarvan 40%jonger is dan 28 jaar. Door het lot worden 4 personen aangewezen om deel te nemen aan een buitenlandse reis.
    1. Hoeveel personen van de groep van 4 zijn naar verwachting jonger dan 28 jaar?
    2. Bepaal de kans, dat drie van de vier personen jonger zijn dan 28 jaar.
    3. Benader deze kans ook met behulp van een binomiaal kansmodel. Hoe groot is de afwijking met de juiste kans?
    Tijdens een regionale bijeenkomst van diezelfde partij zijn 100 leden aanwezig. Van deze leden is 40% jonger dan 35 jaar. Door het lot worden 4 personen aangewezen om deze regionale groepering te vertegenwoordigen op het landelijk congres van de partij.
    1. Bepaal de kans dat drie van de vier afgevaardigden jonger zijn dan 35 jaar.
    2. Benader ook deze kans binomiaal. Vind je nu een groot verschil? Verklaar je antwoord.

  2. In een doos zitten 30 uiterlijk allemaal dezelfde bonbons. 5 bonbons hebben echter een roomvulling en de andere een caramelvulling. Uit de doos worden vier bonbons genomen.
    1. Hoe groot is de kans dat er precies één bonbon met een roomvulling uit wordt gehaald?
    2. Hoe groot is de kans dat dat er twee of meer zijn?
    3. Hoe groot is de kans dat de vier er uitgenomen bonbons op één na allemaal een roomvulling hebben?

  3. Neem aan dat 80% van de Nederlandse bevolking een inkomen heeft waardoor ze ingeschreven zijn bij een ziekenfonds.
    1. Hoe groot is de kans dat bij een groep van 20 Nederlanders die een inkomen genieten zich hoogstens twee personen bevinden die niet ingeschreven kunnen staan bij een ziekenfonds?
    2. Als de kans dat in een groep Nederlanders met inkomen zich minder dan twee personen bevinden die niet ingeschreven kunnen staan bij een ziekenfonds, kleiner is dan 12,5%, hoe groot kan die groep dan zijn?

  4. Een grote partij wijnflessen wordt gekeurd door uit de partij een aselecte steekproef van 20 flessen te nemen. Elke fles wordt nauwkeurig onderzocht op gebreken. Wordt er in de steekproef meer dan 1 fles gevonden met een gebrek, dan wordt de gehele partij afgekeurd. Als er maximaal 1 fles wordt gevonden die niet voldoet, dan wordt de gehele partij goedgekeurd.
    1. Hoe groot is de kans dat de partij wordt goedgekeurd als 5% van de gehele partij flessen gebreken vertoont?
    2. Hoe groot is de kans als `1//5` van de totale partij gebreken heeft?
    3. Hoe groot is de kans dat de partij wordt afgekeurd als 90% van de partij geen gebreken heeft?

  5. Van een grote populatie is bekend dat 35% een bepaalde eigenschap bezit. Uit deze populatie wordt een willekeurige groep van 100 mensen gekozen. De kans dat in deze steekproef minder mensen aangetroffen worden met die eigenschap is 15%.
    1. Bepaal het maximale aantal mensen in de steekproef met die eigenschap.
    Van een andere populatie is bekend dat `1//6` een bepaalde eigenschap bezit. Uit deze populatie wordt een steekproef getrokken. De kans dat in deze steekproef hoogstens drie elementen worden aangetroffen met die eigenschap is 0,75.
    1. Bepaal de grootte van de steekproef.


Testen

  1. In een vaas zitten vijf balletjes genummerd 2, 4, 6, 8 en 10. Er worden zonder teruglegging twee balletjes uit de vaas getrokken. Stochast `V` is het verschil van de nummers van de twee balletjes.
    1. Stel de kansverdeling van `V` op en teken het bijbehorende kanshistogram.
    2. Bereken de verwachtingswaarde, de variantie en de standaardafwijking en geef de verwachtingswaarde en de standaarddeviatie in het kanshistogram aan.

  2. Bij een experiment heb je de beschikking over 5 vrouwelijke en 5 mannelijke proefpersonen. Je verdeelt ze willekeurig in twee groepen A en B van ieder vijf personen.
    1. Hoe groot is de kans dat in groep A minstens 4 vrouwen terecht komen? Bereken deze kans met een hypergeometrisch kansmodel en benader hem daarna met een binomiaal kansmodel.
    2. Welke van beide antwoorden op vraag a is de juiste? Is er veel verschil tussen beide? Verklaar je antwoord.

  3. Op zaterdagavond zit Jos, die iedere week meespeelt in de Lotto, gespannen voor de t.v. om de trekking van de 6 getallen mee te maken. (Het zogenaamde reservegetal laten we even buiten beschouwing.) Er zitten 41 balletjes met daarop de getallen 1 tot en met 41 in een ronddraaiende trommel waaruit er telkens één wordt getrokken.
    1. Hoe groot is de kans dat er zes even nummers worden getrokken?
    2. Als er twee even nummers zijn getrokken, hoe groot is dan nog de kans dat de volgende vier balletjes ook een even nummer hebben?
    3. Hoe groot is de kans, dat elk van de zes getrokken getallen kleiner is dan 15?
    Jos heeft de nummers 5, 10, 15, 20, 25 en 30 op zijn formulier aangekruist.
    1. Hoe groot is de kans dat hij ze alle zes goed heeft?