Beispiel für einen Fit-Test

Das Chi-Quadrat-Anpassungstest ist nützlich, um a zu vergleichen theoretisches Modell zu beobachteten Daten. Dieser Test ist eine Art des allgemeineren Chi-Quadrat-Tests. Wie bei jedem Thema in Mathematik oder Statistik kann es hilfreich sein, ein Beispiel durchzuarbeiten, um zu verstehen, was passiert, anhand eines Beispiels für den Chi-Quadrat-Anpassungstest.

Betrachten Sie eine Standardpackung Milchschokolade M & Ms. Es gibt sechs verschiedene Farben: Rot, Orange, Gelb, Grün, Blau und Braun. Nehmen wir an, wir sind neugierig auf die Verteilung dieser Farben und fragen, ob alle sechs Farben zu gleichen Teilen auftreten. Dies ist die Art von Frage, die mit einem Anpassungstest beantwortet werden kann.

Rahmen

Wir beginnen mit der Feststellung der Einstellung und warum der Fit-Test angemessen ist. Unsere Farbvariable ist kategorisch. Es gibt sechs Ebenen dieser Variablen, die den sechs möglichen Farben entsprechen. Wir gehen davon aus, dass die von uns gezählten M & Ms eine einfache Zufallsstichprobe aus der Bevölkerung aller M & Ms sind.

instagram viewer

Null- und Alternativhypothesen

Das Null- und Alternativhypothesen Für unseren Fit-Test spiegeln wir die Annahme wider, die wir über die Bevölkerung machen. Da wir testen, ob die Farben in gleichen Anteilen auftreten, lautet unsere Nullhypothese, dass alle Farben im gleichen Verhältnis auftreten. Formaler, wenn p₁ ist der Bevölkerungsanteil von roten Bonbons, p₂ ist der Bevölkerungsanteil von Orangenbonbons und so weiter, dann lautet die Nullhypothese: p₁ = p₂ =... = p₆ = 1/6.

Die alternative Hypothese ist, dass mindestens einer der Bevölkerungsanteile nicht gleich 1/6 ist.

Tatsächliche und erwartete Anzahl

Die tatsächliche Anzahl ist die Anzahl der Bonbons für jede der sechs Farben. Die erwartete Anzahl bezieht sich auf das, was wir erwarten würden, wenn die Nullhypothese wahr wäre. Wir werden lassen n sei die Größe unserer Stichprobe. Die erwartete Anzahl roter Bonbons beträgt p₁ n oder n/6. In diesem Beispiel ist die erwartete Anzahl von Süßigkeiten für jede der sechs Farben einfach n mal p_ich, oder n/6.

Chi-Quadrat-Statistik für die Anpassungsgüte

Wir werden nun eine Chi-Quadrat-Statistik für ein bestimmtes Beispiel berechnen. Angenommen, wir haben eine einfache Zufallsstichprobe von 600 M & M-Bonbons mit der folgenden Verteilung:

212 der Bonbons sind blau.
147 der Bonbons sind orange.
103 der Bonbons sind grün.
50 der Bonbons sind rot.
46 der Bonbons sind gelb.
42 der Bonbons sind braun.

Wenn die Nullhypothese wahr wäre, wären die erwarteten Zählwerte für jede dieser Farben (1/6) x 600 = 100. Wir verwenden dies nun bei unserer Berechnung der Chi-Quadrat-Statistik.

Wir berechnen den Beitrag zu unserer Statistik aus jeder der Farben. Jedes hat die Form (tatsächlich - erwartet)²/Expected.:

Für Blau haben wir (212 - 100)²/100 = 125.44
Für Orange haben wir (147 - 100)²/100 = 22.09
Für Grün haben wir (103 - 100)²/100 = 0.09
Für Rot haben wir (50 - 100)²/100 = 25
Für Gelb haben wir (46 - 100)²/100 = 29.16
Für Braun haben wir (42 - 100)²/100 = 33.64

Wir addieren dann alle diese Beiträge und stellen fest, dass unsere Chi-Quadrat-Statistik 125,44 + 22,09 + 0,09 + 25 + 29,16 + 33,64 = 235,42 beträgt.

Freiheitsgrade

Die Anzahl der Freiheitsgrade Denn ein Anpassungstest ist einfach eins weniger als die Anzahl der Ebenen unserer Variablen. Da es sechs Farben gab, haben wir 6 - 1 = 5 Freiheitsgrade.

Chi-Quadrat-Tabelle und P-Wert

Die von uns berechnete Chi-Quadrat-Statistik von 235,42 entspricht einem bestimmten Ort auf einer Chi-Quadrat-Verteilung mit fünf Freiheitsgraden. Wir brauchen jetzt eine p-Wert, um die Wahrscheinlichkeit zu bestimmen, eine Teststatistik von mindestens 235,42 zu erhalten, während angenommen wird, dass die Nullhypothese wahr ist.

Für diese Berechnung kann Microsoft Excel verwendet werden. Wir stellen fest, dass unsere Teststatistik mit fünf Freiheitsgraden einen p-Wert von 7,29 x 10 hat^-49. Dies ist ein extrem kleiner p-Wert.

Entscheidungsregel

Wir treffen unsere Entscheidung, ob die Nullhypothese basierend auf der Größe des p-Werts abgelehnt werden soll. Da wir einen sehr winzigen p-Wert haben, lehnen wir die Nullhypothese ab. Wir schließen daraus, dass M & Ms nicht gleichmäßig auf die sechs verschiedenen Farben verteilt sind. Eine Follow-up-Analyse könnte verwendet werden, um ein Konfidenzintervall für den Populationsanteil einer bestimmten Farbe zu bestimmen.