Wenn wir eine Gruppe studieren, vergleichen wir oft zwei Populationen. Abhängig von der Parameter Von dieser Gruppe, an der wir interessiert sind, und den Bedingungen, mit denen wir zu tun haben, stehen verschiedene Techniken zur Verfügung. Statistisch Inferenz Verfahren, die den Vergleich zweier Populationen betreffen, können normalerweise nicht auf drei oder mehr Populationen angewendet werden. Um mehr als zwei Populationen gleichzeitig zu untersuchen, benötigen wir verschiedene Arten von statistischen Instrumenten. Varianzanalyseoder ANOVA ist eine Technik aus statistischen Interferenzen, die es uns ermöglicht, mit mehreren Populationen umzugehen.
Vergleich der Mittelwerte
Um zu sehen, welche Probleme auftreten und warum wir ANOVA benötigen, betrachten wir ein Beispiel. Angenommen, wir versuchen festzustellen, ob die bedeuten Die Gewichte der grünen, roten, blauen und orangefarbenen M & M-Bonbons unterscheiden sich voneinander. Wir werden die mittleren Gewichte für jede dieser Populationen angeben, μ
1, μ2, μ3 μ4 bzw.. Wir können die entsprechenden verwenden Hypothesentest mehrmals und teste C (4,2) oder sechs verschiedene Nullhypothesen:- H.0: μ1 = μ2 um zu überprüfen, ob das Durchschnittsgewicht der Population der roten Bonbons vom Durchschnittsgewicht der Population der blauen Bonbons abweicht.
- H.0: μ2 = μ3 um zu überprüfen, ob sich das Durchschnittsgewicht der Population der blauen Bonbons vom Durchschnittsgewicht der Population der grünen Bonbons unterscheidet.
- H.0: μ3 = μ4 um zu überprüfen, ob das Durchschnittsgewicht der Population der grünen Bonbons vom Durchschnittsgewicht der Population der orangefarbenen Bonbons abweicht.
- H.0: μ4 = μ1 um zu überprüfen, ob das Durchschnittsgewicht der Population der orangefarbenen Bonbons vom Durchschnittsgewicht der Population der roten Bonbons abweicht.
- H.0: μ1 = μ3 um zu überprüfen, ob das Durchschnittsgewicht der Population der roten Bonbons vom Durchschnittsgewicht der Population der grünen Bonbons abweicht.
- H.0: μ2 = μ4 um zu überprüfen, ob das Durchschnittsgewicht der Population der blauen Bonbons vom Durchschnittsgewicht der Population der orangefarbenen Bonbons abweicht.
Bei dieser Art der Analyse gibt es viele Probleme. Wir werden sechs haben p-Werte. Auch wenn wir jeweils zu 95% testen können VertrauensniveauUnser Vertrauen in den Gesamtprozess ist geringer, da sich die Wahrscheinlichkeiten vervielfachen: 0,95 x 0,95 x 0,95 x 0,95 x 0,95 x 0,95 entspricht ungefähr 0,74 oder einem Vertrauensniveau von 74%. Somit hat sich die Wahrscheinlichkeit eines Fehlers vom Typ I erhöht.
Auf einer grundlegenderen Ebene können wir diese vier Parameter nicht als Ganzes vergleichen, indem wir sie beide gleichzeitig vergleichen. Die Mittelwerte der roten und blauen M & Ms können signifikant sein, wobei das mittlere Gewicht von Rot relativ größer ist als das mittlere Gewicht von Blau. Wenn wir jedoch das Durchschnittsgewicht aller vier Arten von Süßigkeiten betrachten, gibt es möglicherweise keinen signifikanten Unterschied.
Varianzanalyse
Um Situationen zu bewältigen, in denen wir mehrere Vergleiche durchführen müssen, verwenden wir ANOVA. Dieser Test ermöglicht es uns, die Parameter mehrerer Populationen gleichzeitig zu berücksichtigen, ohne auf einige der Probleme einzugehen, mit denen wir konfrontiert sind Durchführung von Hypothesentests auf zwei Parameter gleichzeitig.
Um eine ANOVA mit dem obigen M & M-Beispiel durchzuführen, würden wir die Nullhypothese H testen0:μ1 = μ2 = μ3= μ4. Dies besagt, dass es keinen Unterschied zwischen den Durchschnittsgewichten der roten, blauen und grünen M & Ms gibt. Die alternative Hypothese ist, dass es gibt Ein gewisser Unterschied zwischen den Durchschnittsgewichten der roten, blauen, grünen und orangefarbenen M & Ms. Diese Hypothese ist wirklich eine Kombination mehrerer Aussagen H.ein:
- Das Durchschnittsgewicht der Population von roten Bonbons ist nicht gleich dem Durchschnittsgewicht der Population von blauen Bonbons, OR
- Das Durchschnittsgewicht der Population von blauen Bonbons ist nicht gleich dem Durchschnittsgewicht der Population von grünen Bonbons, OR
- Das Durchschnittsgewicht der Population von grünen Bonbons entspricht nicht dem Durchschnittsgewicht der Population von Orangenbonbons, OR
- Das Durchschnittsgewicht der Population von grünen Bonbons ist nicht gleich dem Durchschnittsgewicht der Population von roten Bonbons, OR
- Das Durchschnittsgewicht der Population von blauen Bonbons ist nicht gleich dem Durchschnittsgewicht der Population von orangefarbenen Bonbons, OR
- Das Durchschnittsgewicht der Population von blauen Bonbons entspricht nicht dem Durchschnittsgewicht der Population von roten Bonbons.
In diesem speziellen Fall würden wir a verwenden, um unseren p-Wert zu erhalten Wahrscheinlichkeitsverteilung bekannt als F-Verteilung. Berechnungen mit dem ANOVA F-Test können von Hand durchgeführt werden, werden jedoch normalerweise mit einer statistischen Software berechnet.
Mehrfachvergleiche
Was ANOVA von anderen statistischen Techniken unterscheidet, ist, dass es verwendet wird, um mehrere Vergleiche durchzuführen. Dies ist in allen Statistiken üblich, da wir häufig mehr als nur zwei Gruppen vergleichen möchten. In der Regel deutet ein Gesamttest darauf hin, dass zwischen den untersuchten Parametern ein gewisser Unterschied besteht. Wir folgen diesem Test mit einer anderen Analyse, um zu entscheiden, welcher Parameter sich unterscheidet.