Normaal of niet?

Inleiding

Als je de gewichten van zo'n 1000 aselect gekozen vrouwen uit de leeftijdsgroep van 20-<30 jaar meet, krijg je ongeveer een klokvormige frequentieverdeling. Maar mag je nu zeggen dat er sprake is van een normale verdeling?
Er bestaat normaal waarschijnlijkheidspapier. Op dat papier wordt een cumulatief relatief frequentiepolygoon een rechte lijn als er van een normale verdeling sprake is. Met behulp van de vuistregels kun je vanaf dat papier dan het gemiddelde en de standaardafwijking aflezen.

Je leert nu:

Je kunt al:

gewichtfrequentie
  35-< 40  10
  40-< 45  15
  45-< 50  25
  50-< 55  75
  55-< 60  75
  60-< 65125
  65-< 70150
  70-< 75175
  75-< 80150
  80-< 85100
  85-< 90  50
  90-< 95  25
  95-<100  15
100-<105  10

Verkennen

Bij een landelijk onderzoek zijn de gewichten bepaald van 1000 aselect gekozen volwassen vrouwen van 20-<30 jaar, zie tabel. De frequentieverdeling lijkt op die van een normale verdeling. Kun je nu zonder meer een normale verdeling als rekenmodel gebruiken voor deze groep vrouwen?

> Ga na of deze frequentieverdeling voldoet aan de vuistregels voor een normale verdeling.
> Is het voldoen aan de vuistregels voldoende reden om te concluderen dat een normale verdeling een bruikbaar rekenmodel is?``


Uitleg

Bij een landelijk onderzoek zijn de gewichten bepaald van 1000 aselect gekozen volwassen vrouwen van 20-<30 jaar, zie tabel. De frequentieverdeling lijkt op die van een normale verdeling met μ(L) = 70,125 en σ(L) ≈ 12,338. Kun je nu zonder meer een normale verdeling als rekenmodel gebruiken voor deze groep vrouwen?

            

Zet je op normaal waarschijnlijkheidspapier kansen van de vorm P(L ≤ 40 | μ = 70,125 ∧ σ = 12,338) uit, dan krijg je een rechte lijn. Elke zuivere cumulatieve normale verdeling wordt op normaal waarschijnlijkheidspapier een rechte lijn.

Ga dit na met behulp van een blad normaal waarschijnlijkheidspapier. Dat kun je downloaden via

Maak je van de gegeven frequentieverdeling een cumulatieve relatieve frequentieverdeling en zet je die uit op normaal waarschijnlijkheidspapier, dan zou je een rechte lijn moeten krijgen (je zet de cumulatieve relatieve frequenties uit tegen de rechter klassengrenzen). Bekijk via de website het resultaat. Merk op dat de cumulatieve relatieve frequentieverdeling en de normale verdeling goed overeenkomen! Kennelijk zijn deze gewichten ongeveer normaal verdeeld!``

Opgaven

  1. Bestudeer de Uitleg. Neem (print) een aantal bladen normaal waarschijnlijkheidspapier. Ga uit van een normale verdeling met `mu = 70,125` en `sigma = 12,338`.
    1. Teken op normaal waarschijnlijkheidspapier de waarden van `text(P)(L <= g)` bij deze normale verdeling voor `g = 40, 45, 50, ..., 105`. Denk er om dat alle kansen als percentages moeten worden gegeven.
    2. Wordt je grafiek een rechte lijn?
    3. Waar in je figuur vind je `mu` terug? Kun je ook `sigma` terugvinden?

  2. Neem nu de tabel met de werkelijke gewichten van de 1000 vrouwen.
    1. Maak hierbij een tabel met cumulatieve relatieve frequenties.
    2. Zet deze cumulatieve relatieve frequenties uit tegen de bovengrenzen van elke klasse op het normaal waarschijnlijkheidspapier waar de normale verdeling van de vorige opgave op staat.
    3. Verschilt je grafiek veel van de grafiek van de normale verdeling? Waarom moet je de bovengrenzen van de klassen gebruiken?
    4. Kun je concluderen dat de gewichten van deze 1000 vrouwen normaal zijn verdeeld?

Theorie

Zet je bij een normaal verdeelde variabele X met verwachting μ(X) en standaardafwijking σ(X) op normaal waarschijnlijkheidspapier kansen van de vorm P(X ≤ g) uit tegen g, dan krijg je een rechte lijn: elke zuivere cumulatieve normale verdeling wordt op normaal waarschijnlijkheidspapier een rechte lijn.

Maak je van een gegeven frequentieverdeling een cumulatieve relatieve frequentieverdeling en zet je die uit op normaal waarschijnlijkheidspapier, dan zou je een rechte lijn moeten krijgen als de frequenties normaal zijn verdeeld. De cumulatieve relatieve frequenties moeten daarbij tegen de bovengrenzen van de klassen worden uitgezet!
Op de website vind je bij de theorie een blad normaal waarschijnlijkheidspapier.

Vaak liggen op het normaal waarschijnlijkheidspapier de punten van de cumulatieve relatieve frequentieverdeling niet precies op een rechte lijn. Dan trek je een rechte lijn die zo goed mogelijk bij de getekende punten past. Je benadert dan je frequentieverdeling door de normale verdeling die bij die lijn hoort.
De verwachtingswaarde schat je vervolgens door af te lezen welk getal er bij 50% hoort.
En omdat één van de twee vuistregels zegt dat bij een normale verdeling 68% in het interval [μ – σ,μ + σ] ligt, is bij 84% de waarde van μ + σ af te lezen.

Voorbeeld

De tabel geeft de diameters (in mm) van machinaal geproduceerde moeren. Ga na, dat deze diameters normaal zijn verdeeld en bereken het gemiddelde en de standaardafwijking.

Antwoord

diameterpercentage
12,8-< 12,9  0,1
12,9-< 13,0  2,1
13,0-< 13,1 13,6
13,1-< 13,2 34,1
13,2-< 13,3 34,0
13,3-< 13,4 13,6
13,4-< 13,5  2,0
13,5-< 13,6   0,1

Met de GR vind je μ(M) ≈ 13,20 en σ(M) ≈ 0,10 waarin M de diameter van een moer voorstelt.

Op nomaal waarschijnlijkheidspapier verschillen de cumulatieve relatieve frequentieverdeling vanuit de tabel en die gemaakt vanuit een normale verdeling met μ = 13,20 en σ = 0,10 vrijwel niet van elkaar. (Maak beide op een blad normaal waarschijnlijkheidspapier.)

Conclusie: M is normaal verdeeld met μ(M) ≈ 13,20 en
σ(M) ≈ 0,10.

Voorbeeld 2

De lengteverdeling van Nederlandse mannen boven 20 jaar is bij benadering klokvormig. Via

zie je op normaal waarschijnlijkheidspapier hoe deze verdeling wordt benaderd door een rechte lijn.
Bepaal vanuit deze figuur het gemiddelde en de standaardafwijking van X.

Antwoord

Op deze lengteverdeling van Nederlandse mannen boven 20 jaar zijn de lengtes bij 50% en 84% af te lezen:

Je vindt een gemiddelde van ongeveer 181 cm met een standaardafwijking van 189 – 181 = 8 cm.

Opgaven

  1. In Voorbeeld 1 zie je hoe je een tabel met diameters van machinaal geproduceerde moeren.
    1. Reken zelf het gemiddelde en de standaarddeviatie na.
    2. Teken op normaal waarschijnlijkheidspapier de cumulatieve normale verdeling bij dit gemiddelde en deze standaardafwijking.
    3. Teken op hetzelfde papier de cumulatieve relatieve frequentieverdeling van de moeren.
    4. Ga na, dat beide redelijk goed overeen komen.

  2. Wanneer een cumulatieve relatieve frequentieverdeling op normaal waarschijnlijkheidspapier vrijwel een rechte lijn oplevert is er sprake van een normale verdeling. In Voorbeeld 2 kun je zien hoe je dan het gemiddelde en de standaardafwijking van de verdeling kunt aflezen uit de figuur.
    Ga zelf na dat de in het voorbeeld vermelde waarden inderdaad correct zijn.

  3. In een fabriek worden kilopakken suiker machinaal gevuld. Volgens de Europese norm mag niet meer dan 2,5% van de pakken suiker minder dan 1000 gram bevatten. Via vind je een bestand met daarin de vulgewichten van 100 pakken suiker.
    1. Maak een tabel met cumulatieve relatieve frequenties van deze vulgewichten. Gebruik klassen met een klassenbreedte van 1 gram.
    2. Bereken het gemiddelde en de standaarddeviatie van deze vulgewichten in één decimaal nauwkeurig.
    3. Teken op normaal waarschijnlijkheidspapier de cumulatieve relatieve frequentieverdeling.
    4. Zijn de vulgewichten (bij goede benadering) normaal verdeeld? Zo ja, trek dan de rechte lijn die hoort bij deze normale verdeling.
    5. Laat zien dat het gemiddelde vulgewicht en de bijbehorende standaarddeviatie die je uit de figuur afleest overeen komen met de berekende waarden.
    6. Welke vulgewichten hebben de 10% zwaarste pakken suiker? Lees je antwoord uit de figuur af.

Verwerken

bloeddrukmannenvrouwen
  105  2  1
  110  4  3
  115  6  5
  120 16 15
  125 15 12
  130  6  6
  135  7  7
  140  7  7
  145  7  8
  150  2  5
  155  1  3
  160  1  2
  165  15  1
  1. Deze tabel geeft de bloeddruk in mmHg (millimeter kwikdruk) van een groep mannen en een groep vrouwen.
    1. Bereken van beide groepen de gemiddelde bloeddruk en de standaardafwijking van de bloeddruk.
    2. Welke klassenindeling is hier gehanteerd?
    3. Laat met behulp van normaal waarschijnlijkheidspapier zien dat de bloeddruk van de mannen niet normaal is verdeeld.
    4. Je kunt wel een rechte lijn trekken die de verdeling zo goed mogelijk benaderd. Doe dat en lees het gemiddelde en de standaardafwijking af die bij die lijn passen. Wijken de waarden veel af van de berekende waarden?
    5. Is de bloeddruk van de vrouwen wel normaal verdeeld?

  2. Open het bestand "Enkele lichaamsafmetingen van 5001 vrouwen uit 1947" op Hierin zie je een tabel met lichaamslengtes in cm van de 5001 vrouwen uit het onderzoek in 1947 van Freudenthal en Sittig in opdracht van De Bijenkorf.
    1. Bereken de gemiddelde lichaamslengte en de standaarddeviatie.
    2. Teken op normaal waarschijnlijkheidspapier de bijbehorende cumulatieve relatieve frequentieverdeling.
    3. Zijn de lichaamslengtes bij benadering normaal verdeeld?
    4. 95% van de lichaamslengtes zit tussen `mu – a` en `mu + a`. Hoe groot is `a`? Lees je antwoord uit de figuur af.
    5. Welke minimale lengte hebben de 16% grootste lichaamslengtes? Lees je antwoord uit de figuur af.


Testen

  1. Open het bestand "Enkele lichaamsafmetingen van 5001 vrouwen uit 1947" op Hierin zie je een tabel met kniehoogtes in cm van de 5001 vrouwen uit het onderzoek in 1947 van Freudenthal en Sittig in opdracht van De Bijenkorf.
    1. Bereken de gemiddelde kniehoogte en de standaarddeviatie.
    2. Teken op normaal waarschijnlijkheidspapier de bijbehorende cumulatieve relatieve frequentieverdeling.
    3. Ga na, dat de gemiddelde kniehoogte en de standaardafwijking die je uit de figuur kunt aflezen overeen komen met de berekende waarden.
    4. Zijn de kniehoogtes bij benadering normaal verdeeld?
    5. 60% van de kniehoogtes zit tussen `mu – a` en `mu + a`. Hoe groot is `a`? Lees je antwoord uit de figuur af.
    6. Welke minimale lengte hebben de 15% grootste kniehoogtes? Lees je antwoord uit de figuur af.