Konfidenzintervalle: 4 häufige Fehler

Konfidenzintervalle sind ein wesentlicher Bestandteil der Inferenzstatistik. Wir können einige Wahrscheinlichkeiten und Informationen aus a verwenden Wahrscheinlichkeitsverteilung Schätzen eines Populationsparameters unter Verwendung einer Stichprobe. Die Aussage von a Konfidenzintervall wird so gemacht, dass es leicht missverstanden wird. Wir werden die korrekte Interpretation der Konfidenzintervalle untersuchen und vier Fehler untersuchen, die in diesem Bereich der Statistik gemacht werden.

Was ist ein Konfidenzintervall?

Ein Konfidenzintervall kann entweder als Wertebereich oder in der folgenden Form ausgedrückt werden:

Schätzung ± Fehlermarge

Ein Konfidenzintervall wird normalerweise mit einem Konfidenzniveau angegeben.Gemeinsame Konfidenzniveaus sind 90%, 95% und 99%.

Wir werden uns ein Beispiel ansehen, in dem wir einen Stichprobenmittelwert verwenden möchten, um den Mittelwert einer Population abzuleiten. Angenommen, dies führt zu einem Konfidenzintervall von 25 bis 30. Wenn wir sagen, dass wir zu 95% zuversichtlich sind, dass die unbekannte Bevölkerung

instagram viewer

bedeuten ist in diesem Intervall enthalten, dann sagen wir wirklich, dass wir das Intervall mit einer Methode gefunden haben, die in 95% der Fälle erfolgreich korrekte Ergebnisse liefert. Auf lange Sicht wird unsere Methode in 5% der Fälle nicht erfolgreich sein. Mit anderen Worten, wir werden es nicht schaffen, die wahre Bevölkerung zu erfassen, was nur eines von 20 Malen bedeutet.

Fehler Nr. 1

Wir werden uns nun eine Reihe verschiedener Fehler ansehen, die beim Umgang mit Konfidenzintervallen gemacht werden können. Eine falsche Aussage, die häufig über ein Konfidenzintervall mit einem Konfidenzniveau von 95% gemacht wird, ist, dass eine Wahrscheinlichkeit von 95% besteht, dass das Konfidenzintervall den wahren Mittelwert der Bevölkerung enthält.

Der Grund, warum dies ein Fehler ist, ist eigentlich ziemlich subtil. Die Schlüsselidee in Bezug auf ein Konfidenzintervall ist, dass die verwendete Wahrscheinlichkeit mit ins Bild kommt Die Methode, die zur Bestimmung des Konfidenzintervalls verwendet wird, bezieht sich auf die Methode benutzt.

Fehler Nr. 2

Ein zweiter Fehler besteht darin, ein 95% -Konfidenzintervall so zu interpretieren, dass 95% aller Datenwerte in der Grundgesamtheit innerhalb des Intervalls liegen. Wieder sprechen 95% mit der Testmethode.

Um zu sehen, warum die obige Aussage falsch ist, könnten wir eine normale Population mit a betrachten Standardabweichung von 1 und ein Mittelwert von 5. Eine Stichprobe mit zwei Datenpunkten mit jeweils 6 Werten hat einen Stichprobenmittelwert von 6. Ein 95% -Konfidenzintervall für den Bevölkerungsdurchschnitt wäre 4,6 bis 7,4. Dies überschneidet sich eindeutig nicht mit 95% der Normalverteilung, so wird es nicht 95% der Bevölkerung enthalten.

Fehler Nr. 3

Ein dritter Fehler ist zu sagen, dass ein 95% -Konfidenzintervall impliziert, dass 95% aller möglichen Stichprobenmittel in den Bereich des Intervalls fallen. Überdenken Sie das Beispiel aus dem letzten Abschnitt. Jede Stichprobe der Größe zwei, die nur aus Werten von weniger als 4,6 bestand, hätte einen Mittelwert von weniger als 4,6. Somit würden diese Abtastmittel außerhalb dieses bestimmten Konfidenzintervalls liegen. Proben, die dieser Beschreibung entsprechen, machen mehr als 5% des Gesamtbetrags aus. Es ist also ein Fehler zu sagen, dass dieses Konfidenzintervall 95% aller Stichprobenmittel erfasst.

Fehler Nr. 4

Ein vierter Fehler beim Umgang mit Konfidenzintervallen besteht darin, zu glauben, dass sie die einzige Fehlerquelle sind. Während mit einem Konfidenzintervall eine Fehlerquote verbunden ist, gibt es andere Stellen, an denen sich Fehler in eine statistische Analyse einschleichen können. Einige Beispiele für diese Art von Fehlern könnten auf eine falsche Versuchsplanung, eine Verzerrung der Stichprobe oder die Unfähigkeit zurückzuführen sein, Daten von einer bestimmten Teilmenge der Population zu erhalten.