Normaal of niet?

Inleiding

Als je de gewichten van zo'n 1000 aselect gekozen vrouwen uit de leeftijdsgroep van 20-<30 jaar meet, krijg je ongeveer een klokvormige frequentieverdeling. Maar mag je nu zeggen dat er sprake is van een normale verdeling?
Er bestaat normaal waarschijnlijkheidspapier. Op dat papier wordt een cumulatief relatief frequentiepolygoon een rechte lijn als er van een normale verdeling sprake is. Met behulp van de vuistregels kun je vanaf dat papier dan het gemiddelde en de standaardafwijking aflezen.

Je leert nu:

Je kunt al:

gewichtfrequentie
  35-< 40  10
  40-< 45  15
  45-< 50  25
  50-< 55  75
  55-< 60  75
  60-< 65125
  65-< 70150
  70-< 75175
  75-< 80150
  80-< 85100
  85-< 90  50
  90-< 95  25
  95-<100  15
100-<105  10

Verkennen

Bij een landelijk onderzoek zijn de gewichten bepaald van 1000 aselect gekozen volwassen vrouwen van 20-<30 jaar, zie tabel. De frequentieverdeling lijkt op die van een normale verdeling. Kun je nu zonder meer een normale verdeling als rekenmodel gebruiken voor deze groep vrouwen?

> Ga na of deze frequentieverdeling voldoet aan de vuistregels voor een normale verdeling.
> Is het voldoen aan de vuistregels voldoende reden om te concluderen dat een normale verdeling een bruikbaar rekenmodel is?``


Uitleg

Bij een landelijk onderzoek zijn de gewichten bepaald van 1000 aselect gekozen volwassen vrouwen van 20-<30 jaar, zie tabel. De frequentieverdeling lijkt op die van een normale verdeling met μ(L) = 70,125 en σ(L) ≈ 12,338. Kun je nu zonder meer een normale verdeling als rekenmodel gebruiken voor deze groep vrouwen?

            

Zet je op normaal waarschijnlijkheidspapier kansen van de vorm P(L ≤ 40 | μ = 70,125 ∧ σ = 12,338) uit, dan krijg je een rechte lijn. Elke zuivere cumulatieve normale verdeling wordt op normaal waarschijnlijkheidspapier een rechte lijn.

Ga dit na met behulp van een blad normaal waarschijnlijkheidspapier. Dat kun je downloaden via

Maak je van de gegeven frequentieverdeling een cumulatieve relatieve frequentieverdeling en zet je die uit op normaal waarschijnlijkheidspapier, dan zou je een rechte lijn moeten krijgen (je zet de cumulatieve relatieve frequenties uit tegen de rechter klassengrenzen). Bekijk via de website het resultaat. Merk op dat de cumulatieve relatieve frequentieverdeling en de normale verdeling goed overeenkomen! Kennelijk zijn deze gewichten ongeveer normaal verdeeld!``

Opgaven

  1. Bestudeer de Uitleg. Neem (print) een aantal bladen normaal waarschijnlijkheidspapier. Ga uit van een normale verdeling met `mu = 70,125` en `sigma = 12,338`.
    1. Teken op normaal waarschijnlijkheidspapier de waarden van `text(P)(L <= g)` bij deze normale verdeling voor `g = 40, 45, 50, ..., 105`. Denk er om dat alle kansen als percentages moeten worden gegeven.
    2. Wordt je grafiek een rechte lijn?
    3. Waar in je figuur vind je `mu` terug? Kun je ook `sigma` terugvinden?

  2. Neem nu de tabel met de werkelijke gewichten van de 1000 vrouwen.
    1. Maak hierbij een tabel met cumulatieve relatieve frequenties.
    2. Zet deze cumulatieve relatieve frequenties uit tegen de bovengrenzen van elke klasse op het normaal waarschijnlijkheidspapier waar de normale verdeling van de vorige opgave op staat.
    3. Verschilt je grafiek veel van de grafiek van de normale verdeling? Waarom moet je de bovengrenzen van de klassen gebruiken?
    4. Kun je concluderen dat de gewichten van deze 1000 vrouwen normaal zijn verdeeld?

Theorie

Zet je bij een normaal verdeelde variabele X met verwachting μ(X) en standaardafwijking σ(X) op normaal waarschijnlijkheidspapier kansen van de vorm P(X ≤ g) uit tegen g, dan krijg je een rechte lijn: elke zuivere cumulatieve normale verdeling wordt op normaal waarschijnlijkheidspapier een rechte lijn.

Maak je van een gegeven frequentieverdeling een cumulatieve relatieve frequentieverdeling en zet je die uit op normaal waarschijnlijkheidspapier, dan zou je een rechte lijn moeten krijgen als de frequenties normaal zijn verdeeld. De cumulatieve relatieve frequenties moeten daarbij tegen de bovengrenzen van de klassen worden uitgezet!
Op de website vind je bij de theorie een blad normaal waarschijnlijkheidspapier.

Vaak liggen op het normaal waarschijnlijkheidspapier de punten van de cumulatieve relatieve frequentieverdeling niet precies op een rechte lijn. Dan trek je een rechte lijn die zo goed mogelijk bij de getekende punten past. Je benadert dan je frequentieverdeling door de normale verdeling die bij die lijn hoort.
De verwachtingswaarde schat je vervolgens door af te lezen welk getal er bij 50% hoort.
En omdat één van de twee vuistregels zegt dat bij een normale verdeling 68% in het interval [μ – σ,μ + σ] ligt, is bij 84% de waarde van μ + σ af te lezen.

Als X en Y normaal verdeelde stochasten zijn, dan is ook X + Y normaal verdeeld en
μ(X + Y) = μ(X) + μ(Y) en σ(X + Y) =  (X)) 2 + (σ(Y)) 2 .
Als X en Y normaal verdeelde stochasten zijn, dan is ook X – Y normaal verdeeld en
μ(X – Y) = μ(X) – μ(Y) en σ(X – Y) =  (X)) 2 + (σ(Y)) 2 .

Voorbeeld 1

De tabel geeft de diameters (in mm) van machinaal geproduceerde moeren. Ga na, dat deze diameters normaal zijn verdeeld en bereken het gemiddelde en de standaardafwijking.

Antwoord

diameterpercentage
12,8-< 12,9  0,1
12,9-< 13,0  2,1
13,0-< 13,1 13,6
13,1-< 13,2 34,1
13,2-< 13,3 34,0
13,3-< 13,4 13,6
13,4-< 13,5  2,0
13,5-< 13,6   0,1

Met de GR vind je μ(M) ≈ 13,20 en σ(M) ≈ 0,10 waarin M de diameter van een moer voorstelt.

Op nomaal waarschijnlijkheidspapier verschillen de cumulatieve relatieve frequentieverdeling vanuit de tabel en die gemaakt vanuit een normale verdeling met μ = 13,20 en σ = 0,10 vrijwel niet van elkaar. (Maak beide op een blad normaal waarschijnlijkheidspapier.)

Conclusie: M is normaal verdeeld met μ(M) ≈ 13,20 en
σ(M) ≈ 0,10.

Voorbeeld 2

De lengteverdeling van Nederlandse mannen boven 20 jaar is bij benadering klokvormig. Via

zie je op normaal waarschijnlijkheidspapier hoe deze verdeling wordt benaderd door een rechte lijn.
Bepaal vanuit deze figuur het gemiddelde en de standaardafwijking van X.

Antwoord

Op deze lengteverdeling van Nederlandse mannen boven 20 jaar zijn de lengtes bij 50% en 84% af te lezen:

Je vindt een gemiddelde van ongeveer 181 cm met een standaardafwijking van 189 – 181 = 8 cm.

Voorbeeld 3

In Voorbeeld 1 zag je dat de diameters M van een bepaalde soort moeren normaal zijn verdeeld met
μ(M) ≈ 13,20 en σ(M) ≈ 0,10 mm.
Bij deze moeren horen bouten waarvan de diameters B ook normaal zijn verdeeld: μ(B) ≈ 13,05 en σ(B) ≈ 0,10 mm.
Deze bouten passen nog in de moeren als hun diameters maximaal 0,25 mm kleiner zijn dan die van de moeren.
Hoeveel procent van de bouten past niet?

Antwoord

Kijk naar het verschil V = M – B van de diameters van een bout en een moer. Dit verschil is ook normaal verdeeld met

De bouten passen als 0 ≤ V ≤ 0,25.
De kans hierop is P(0 ≤ V ≤ 0,25 | μ = 0,15 en σ = 0,14) ≈ 0,62.
Conclusie: 38% van de bouten past niet in de moeren.

Opgaven

  1. In Voorbeeld 1 zie je hoe je een tabel met diameters van machinaal geproduceerde moeren.
    1. Reken zelf het gemiddelde en de standaarddeviatie na.
    2. Teken op normaal waarschijnlijkheidspapier de cumulatieve normale verdeling bij dit gemiddelde en deze standaardafwijking.
    3. Teken op hetzelfde papier de cumulatieve relatieve frequentieverdeling van de moeren.
    4. Ga na, dat beide redelijk goed overeen komen.

  2. Wanneer een cumulatieve relatieve frequentieverdeling op normaal waarschijnlijkheidspapier vrijwel een rechte lijn oplevert is er sprake van een normale verdeling. In Voorbeeld 2 kun je zien hoe je dan het gemiddelde en de standaardafwijking van de verdeling kunt aflezen uit de figuur.
    Ga zelf na dat de in het voorbeeld vermelde waarden inderdaad correct zijn.

  3. In een fabriek worden kilopakken suiker machinaal gevuld. Volgens de Europese norm mag niet meer dan 2,5% van de pakken suiker minder dan 1000 gram bevatten. Via vind je een bestand met daarin de vulgewichten van 100 pakken suiker.
    1. Maak een tabel met cumulatieve relatieve frequenties van deze vulgewichten. Gebruik klassen met een klassenbreedte van 1 gram.
    2. Bereken het gemiddelde en de standaarddeviatie van deze vulgewichten in één decimaal nauwkeurig.
    3. Teken op normaal waarschijnlijkheidspapier de cumulatieve relatieve frequentieverdeling.
    4. Zijn de vulgewichten (bij goede benadering) normaal verdeeld? Zo ja, trek dan de rechte lijn die hoort bij deze normale verdeling.
    5. Laat zien dat het gemiddelde vulgewicht en de bijbehorende standaarddeviatie die je uit de figuur afleest overeen komen met de berekende waarden.
    6. Welke vulgewichten hebben de 10% zwaarste pakken suiker? Lees je antwoord uit de figuur af.

  4. In Voorbeeld 3 vind je de gegevens van machinaal geproduceerde moeren en bijbehorende bouten.
    1. Het verschil van de diameters van de bouten en de moeren is ook normaal verdeeld. Welk gemiddelde en welke standaarddeviatie horen daar bij?
    2. Reken zelf het percentage bouten na dat niet in de moeren past.
    Het bedrijf dat deze bevestigingsmiddelen maakt, produceert nog veel meer bouten en moeren in diverse afmetingen. Voor een ander type bout met bijpassende moer geldt: de diameter van de moer is normaal verdeeld met een gemiddelde van 8,10 mm en een standaarddeviatie van 0,05 mm en de diameter van de bout is normaal verdeeld met een gemiddelde van 8,05 mm en een standaardafwijking van 0,03 mm. De bouten passen in de moeren als het verschil van de diameter van de moer en de bout minder dan 0,02 mm is.
    1. Hoeveel procent van deze bouten is te dik voor de moeren?
    2. Hoeveel procent van deze bouten past niet in de bijbehorende moer?
    Ook de gewichten van de bouten en moeren van deze tweede soort zijn normaal verdeeld: het gemiddelde gewicht van de moer is 5,0 gram met een standaardafwijking van 0,2 gram en het gemiddelde gewicht van de bout is 7,3 gram met een standaardafwijking van 0,3 gram. Ze worden verpakt in dozen. In elke doos zitten 100 bouten en moeren.
    1. Hoe zwaar zijn de bouten en moeren in zo'n doos gemiddeld? En welke standaardafwijking hoort daar bij?
    2. Hoeveel procent van deze dozen heeft een totale inhoud van meer dan 1235 gram?

Verwerken

bloeddrukmannenvrouwen
  105  2  1
  110  4  3
  115  6  5
  120 16 15
  125 15 12
  130  6  6
  135  7  7
  140  7  7
  145  7  8
  150  2  5
  155  1  3
  160  1  2
  165  15  1
  1. Deze tabel geeft de bloeddruk in mmHg (millimeter kwikdruk) van een groep mannen en een groep vrouwen.
    1. Bereken van beide groepen de gemiddelde bloeddruk en de standaardafwijking van de bloeddruk.
    2. Welke klassenindeling is hier gehanteerd?
    3. Laat met behulp van normaal waarschijnlijkheidspapier zien dat de bloeddruk van de mannen niet normaal is verdeeld.
    4. Je kunt wel een rechte lijn trekken die de verdeling zo goed mogelijk benaderd. Doe dat en lees het gemiddelde en de standaardafwijking af die bij die lijn passen. Wijken de waarden veel af van de berekende waarden?
    5. Is de bloeddruk van de vrouwen wel normaal verdeeld?

  2. Open het bestand "Enkele lichaamsafmetingen van 5001 vrouwen uit 1947" op Hierin zie je een tabel met lichaamslengtes in cm van de 5001 vrouwen uit het onderzoek in 1947 van Freudenthal en Sittig in opdracht van De Bijenkorf.
    1. Bereken de gemiddelde lichaamslengte en de standaarddeviatie.
    2. Teken op normaal waarschijnlijkheidspapier de bijbehorende cumulatieve relatieve frequentieverdeling.
    3. Zijn de lichaamslengtes bij benadering normaal verdeeld?
    4. 95% van de lichaamslengtes zit tussen `mu – a` en `mu + a`. Hoe groot is `a`? Lees je antwoord uit de figuur af.
    5. Welke minimale lengte hebben de 16% grootste lichaamslengtes? Lees je antwoord uit de figuur af.

  3. Limburgse kaas wordt verkocht in pakjes van 200 g. De snijmachine is zo afgesteld dat het gewicht van de pakjes normaal verdeeld is met een gemiddelde van 202,5 g en een standaardafwijking van 4,0 g. Er gaan 50 pakjes in een doos. Die dozen hebben een gemiddeld gewicht van 145,0 gram met een standaardafwijking van 5,5 gram.
    1. Hoeveel bedraagt het gemiddelde gewicht van zo'n doos met 50 pakjes kaas? En welke standaardafwijking hoort daar bij?
    2. Hoeveel procent van deze dozen met kaas weegt minder dan 10250 gram?

Testen

  1. Open het bestand "Enkele lichaamsafmetingen van 5001 vrouwen uit 1947" op Hierin zie je een tabel met kniehoogtes in cm van de 5001 vrouwen uit het onderzoek in 1947 van Freudenthal en Sittig in opdracht van De Bijenkorf.
    1. Bereken de gemiddelde kniehoogte en de standaarddeviatie.
    2. Teken op normaal waarschijnlijkheidspapier de bijbehorende cumulatieve relatieve frequentieverdeling.
    3. Ga na, dat de gemiddelde kniehoogte en de standaardafwijking die je uit de figuur kunt aflezen overeen komen met de berekende waarden.
    4. Zijn de kniehoogtes bij benadering normaal verdeeld?
    5. 60% van de kniehoogtes zit tussen `mu – a` en `mu + a`. Hoe groot is `a`? Lees je antwoord uit de figuur af.
    6. Welke minimale lengte hebben de 15% grootste kniehoogtes? Lees je antwoord uit de figuur af.

  2. Literpakken melk worden machinaal gevuld. Zo'n pak heeft een inhoud die normaal is verdeeld met een gemiddelde van 1,010 liter en een standaardafwijking van 0,006 liter. De vulmachine staat ingesteld op het gieten van gemiddeld 1,005 liter melk in zo'n pak met een standaardafwijking van 0,004 liter. Ook dit vulvolume is normaal verdeeld.
    1. In hoeveel procent van gevallen gaat bij het vullen melk verloren?
    2. Het gemiddelde vulvolume kan worden ingesteld. Hoeveel moet dit bedragen opdat in niet meer dan 1% van de gevallen melk verloren gaat bij het vullen van een pak?