Wie Konfidenzintervalle zur Berechnung verschiedener Parameter verwendet werden

Inferenzstatistik erhält seinen Namen von dem, was in diesem Zweig der Statistik passiert. Anstatt nur einen Datensatz zu beschreiben, versucht die Inferenzstatistik, auf der Grundlage von a etwas über eine Population abzuleiten statistische Stichprobe. Ein spezifisches Ziel in der Inferenzstatistik ist die Bestimmung des Wertes einer unbekannten Population Parameter. Der Wertebereich, den wir zur Schätzung dieses Parameters verwenden, wird als Konfidenzintervall bezeichnet.

Die Form eines Konfidenzintervalls

Ein Konfidenzintervall besteht aus zwei Teilen. Der erste Teil ist die Schätzung des Populationsparameters. Wir erhalten diese Schätzung unter Verwendung von a einfache Zufallsstichprobe. Aus diesem Beispiel berechnen wir die Statistik, die dem Parameter entspricht, den wir schätzen möchten. Wenn wir uns zum Beispiel für die mittlere Größe aller Erstklässler in den USA interessieren würden, würden wir dies tun Verwenden Sie eine einfache Zufallsstichprobe von US-Erstklässlern, messen Sie alle und berechnen Sie dann die mittlere Höhe unserer Stichprobe.

instagram viewer

Der zweite Teil eines Konfidenzintervalls ist die Fehlerquote. Dies ist notwendig, da unsere Schätzung allein vom tatsächlichen Wert des Populationsparameters abweichen kann. Um andere mögliche Werte des Parameters zu berücksichtigen, müssen wir einen Zahlenbereich erzeugen. Die Fehlerquote bewirkt dies, und jedes Konfidenzintervall hat die folgende Form:

Schätzung ± Fehlerquote

Die Schätzung befindet sich in der Mitte des Intervalls, und dann subtrahieren und addieren wir die Fehlergrenze von dieser Schätzung, um einen Wertebereich für den Parameter zu erhalten.

Vertrauensniveau

Mit jedem Konfidenzintervall ist ein Konfidenzniveau verbunden. Dies ist eine Wahrscheinlichkeit oder ein Prozentsatz, der angibt, wie viel Sicherheit wir unserem Konfidenzintervall zuordnen sollten. Wenn alle anderen Aspekte einer Situation identisch sind, ist das Konfidenzintervall umso breiter, je höher das Konfidenzniveau ist.

Dieses Maß an Vertrauen kann zu Verwirrung führen. Es ist keine Aussage über das Stichprobenverfahren oder die Grundgesamtheit. Stattdessen gibt es einen Hinweis auf den Erfolg des Konstruktionsprozesses eines Konfidenzintervalls. Beispielsweise verfehlen Konfidenzintervalle mit einer Konfidenz von 80 Prozent auf lange Sicht den wahren Populationsparameter eines von fünf Malen.

Jede Zahl von Null bis Eins könnte theoretisch für ein Konfidenzniveau verwendet werden. In der Praxis sind 90 Prozent, 95 Prozent und 99 Prozent übliche Konfidenzniveaus.

Fehlermarge

Die Fehlerquote eines Konfidenzniveaus wird durch einige Faktoren bestimmt. Wir können dies sehen, indem wir die Formel auf die Fehlerquote untersuchen. Eine Fehlerquote hat folgende Form:

Fehlergrenze = (Statistik für das Konfidenzniveau) * (Standardabweichung / Fehler)

Die Statistik für das Konfidenzniveau hängt davon ab, was Wahrscheinlichkeitsverteilung wird verwendet und welches Maß an Vertrauen wir gewählt haben. Zum Beispiel wenn C.ist unser Vertrauensniveau und wir arbeiten mit einem Normalverteilung, dann C. ist die Fläche unter der Kurve zwischen -z* zu z*. Diese Nummer z* ist die Zahl in unserer Fehlerquote.

Standardabweichung oder Standardfehler

Der andere in unserer Fehlerquote erforderliche Begriff ist die Standardabweichung oder der Standardfehler. Die Standardabweichung der Verteilung, mit der wir arbeiten, wird hier bevorzugt. Typischerweise sind jedoch Parameter aus der Population unbekannt. Diese Zahl ist normalerweise nicht verfügbar, wenn in der Praxis Konfidenzintervalle gebildet werden.

Um mit dieser Unsicherheit bei der Kenntnis der Standardabweichung umzugehen, verwenden wir stattdessen den Standardfehler. Der Standardfehler, der einer Standardabweichung entspricht, ist eine Schätzung dieser Standardabweichung. Was den Standardfehler so stark macht, ist, dass er aus der einfachen Zufallsstichprobe berechnet wird, die zur Berechnung unserer Schätzung verwendet wird. Es sind keine zusätzlichen Informationen erforderlich, da die Stichprobe die gesamte Schätzung für uns vornimmt.

Unterschiedliche Konfidenzintervalle

Es gibt verschiedene Situationen, die Konfidenzintervalle erfordern. Diese Konfidenzintervalle werden verwendet, um eine Anzahl verschiedener Parameter zu schätzen. Obwohl diese Aspekte unterschiedlich sind, werden alle diese Konfidenzintervalle durch dasselbe Gesamtformat vereint. Einige gängige Konfidenzintervalle sind die für einen Bevölkerungsdurchschnitt, eine Bevölkerungsvarianz, einen Bevölkerungsanteil, die Differenz zweier Bevölkerungsmittelwerte und die Differenz zweier Bevölkerungsanteile.