Was ist der central limit theorem? Hier wird das statistische Konzept anhand eines sechsseitigen Würfels erklärt.
Was ist der central limit theorem?
Der central limit theorem (CLT) wird allgemein als statistische Theorie definiert , die besagt, dass bei einer ausreichend großen Stichprobengröße aus einer Population mit endlicher Varianz der Mittelwert aller Stichproben aus derselben Population ungefähr dem Mittelwert der Population entspricht.
Mit anderen Worten, der central limit theorem beschreibt genau die Form der Mittelwertverteilung , wenn wir wiederholt Stichproben aus einer gegebenen Population ziehen. Insbesondere wenn die Stichprobengröße größer wird, nähert sich die aus wiederholten Stichproben berechnete Mittelwertverteilung der Normalität an.
Um ein besseres Verständnis zu erlangen, schauen wir uns die Funktionsweise von CLT genauer an.
Komponenten des central limit theorem
Mit zunehmender Stichprobengröße kann die Stichprobenverteilung des Mittelwerts (X-quer) durch eine Normalverteilung mit Mittelwert µ und Standardabweichung σ/√ n angenähert werden , wobei:
- µ ist der Mittelwert der Grundgesamtheit
- σ ist die Standardabweichung der Grundgesamtheit
- n ist die Stichprobengröße
Mit anderen Worten: Wenn wir wiederholt unabhängige Zufallsstichproben der Größe n aus einer beliebigen Grundgesamtheit ziehen, dann nähert sich die Verteilung der Stichprobenmittelwerte bei einem großen n einer Normalverteilung an.
Der central limit theorem besagt, dass bei der Entnahme einer unendlichen Zahl aufeinanderfolgender Zufallsstichproben aus einer Grundgesamtheit die Stichprobenverteilung der Mittelwerte dieser Stichproben annähernd normalverteilt wird, mit Mittelwert µ und Standardabweichung σ/√ N, wenn der Stichprobenumfang ( N ) größer wird, und zwar unabhängig von der Form der Grundgesamtheitsverteilung.
So verwenden Sie den Zentralen Grenzwertsatz
Angenommen, wir ziehen eine Zufallsstichprobe der Größe n ( x1, x2, x3, … xn – 1, xn ) aus einer Zufallsvariablen einer Grundgesamtheit, die mit dem Mittelwert µ und der Standardabweichung σ verteilt ist.
Wiederholen Sie diesen Vorgang, indem Sie viele Stichproben aus der Grundgesamtheit ziehen und dann das x̄ jeder Stichprobe berechnen.
Wir behandeln die x̄-Werte als eine andere Verteilung, die wir als Stichprobenverteilung des Mittelwerts (x̄) bezeichnen.
Bei einer gegebenen Verteilung mit einem Mittelwert µ und einer Varianz σ2 nähert sich die Stichprobenverteilung des Mittelwerts einer Normalverteilung mit einem Mittelwert (µ) und einer Varianz σ2/ n , wenn n , die Stichprobengröße, zunimmt. Das Erstaunliche und intuitiv sehr Interessante am zentralen Grenzwertsatz besteht darin, dass sich die Stichprobenverteilung des Mittelwerts einer Normalverteilung annähert, unabhängig von der Form der ursprünglichen (übergeordneten) Verteilung.
Mit zunehmendem n nähert man sich sehr schnell einer Normalverteilung (beachten Sie, dass n die Stichprobengröße für jeden Mittelwert und nicht die Anzahl der Stichproben ist).
Bedenken Sie, dass bei einer Stichprobenverteilung des Mittelwerts davon ausgegangen wird, dass die Anzahl der Stichproben unendlich ist.
Zusammenfassend lässt sich sagen, dass der central limit theorem aus drei verschiedenen Komponenten besteht:
- Sukzessive Stichprobennahme aus einer Population
- Erhöhung der Stichprobengröße
- Bevölkerungsverteilung
Formel und Beispiel des central limit theorem
In der Abbildung unten sind die resultierenden Häufigkeitsverteilungen dargestellt, die jeweils auf 500 Mittelwerten basieren. Für n = 4 wurden 500 Mal 4 Werte aus einer gleichmäßigen Verteilung ausgewählt und jedes Mal der Mittelwert berechnet. Dieselbe Methode wurde mit Mittelwerten von 7 Werten für n = 7 und 10 Werten für n = 10 angewendet.
Wenn n zunimmt, werden die Verteilungen immer normaler und die Streuung der Verteilungen nimmt ab.
Schauen wir uns ein weiteres Beispiel mit einem Würfel an.
Würfel eignen sich hervorragend zur Veranschaulichung des central limit theorem. Wenn Sie einen sechsseitigen Würfel werfen, beträgt die Wahrscheinlichkeit , eine Eins zu würfeln, 1/6, eine Zwei 1/6, eine Drei ebenfalls 1/6 usw. Die Wahrscheinlichkeit, dass der Würfel auf einer Seite landet, ist gleich der Wahrscheinlichkeit, dass er auf einer der anderen fünf Seiten landet.
In einer Unterrichtssituation können wir dieses Experiment mit einem echten Würfel durchführen. Um eine genaue Darstellung der Bevölkerungsverteilung zu erhalten, würfeln wir 500 Mal. Wenn wir ein Histogramm verwenden, um die Daten grafisch darzustellen, sehen wir, dass die Verteilung – wie erwartet – ziemlich flach aussieht. Es ist definitiv keine Normalverteilung (Abbildung unten).
Nehmen wir weitere Stichproben und sehen wir, was mit dem Histogramm der Durchschnittswerte dieser Stichproben geschieht.
Dieses Mal würfeln wir zweimal, wiederholen diesen Vorgang 500 Mal und berechnen dann den Durchschnitt jedes Paares (Abbildung unten).
Ein Histogramm dieser Durchschnittswerte zeigt die Form ihrer Verteilung (Abbildung unten). Obwohl die blaue Normalkurve das Histogramm nicht genau wiedergibt, sieht das Profil der Balken eher glockenförmig aus. Lassen Sie uns nun fünfmal würfeln und den Durchschnitt der fünf Würfe berechnen, was wir wiederum 500 Mal wiederholen. Dann wiederholen wir den Vorgang des Würfelns 10 Mal und dann 30 Mal.
Die Histogramme für jeden Satz von Durchschnittswerten zeigen, dass die Verteilung der Durchschnittswerte mit zunehmender Stichprobengröße oder Anzahl der Rollen immer mehr einer Normalverteilung ähnelt. Darüber hinaus nimmt die Streuung der Stichprobenmittelwerte mit zunehmender Stichprobengröße ab android smartwatch.
Der central limit theorem besagt, dass für ein ausreichend großes n X-bar durch eine Normalverteilung mit Mittelwert µ und Standardabweichung σ/√ n angenähert werden kann .
Der Mittelwert der Grundgesamtheit für einen sechsseitigen Würfel beträgt (1+2+3+4+5+6)/6 = 3,5 und die Standardabweichung der Grundgesamtheit beträgt 1,708. Wenn der Satz also zutrifft, sollte der Mittelwert der dreißig Mittelwerte etwa 3,5 betragen, mit einer Standardabweichung von 1,708/30 = 0,31. Bei den Würfeln, die wir mit Minitab „geworfen“ haben, beträgt der Mittelwert der dreißig Mittelwerte 3,49 und die Standardabweichung 0,30, was sehr nahe an den berechneten Näherungen liegt.