So finden Sie Freiheitsgrade in der Statistik

click fraud protection

Bei vielen statistischen Inferenzproblemen müssen wir die Anzahl ermitteln Freiheitsgrade. Die Anzahl der Freiheitsgrade wählt einen einzelnen aus Wahrscheinlichkeitsverteilung aus unendlich vielen. Dieser Schritt ist ein oft übersehenes, aber entscheidendes Detail bei der Berechnung vonVertrauensintervalle und die Arbeitsweise von Hypothesentests.

Es gibt keine einzige allgemeine Formel für die Anzahl der Freiheitsgrade. In der Inferenzstatistik werden jedoch für jede Art von Prozedur spezifische Formeln verwendet. Mit anderen Worten, die Umgebung, in der wir arbeiten, bestimmt die Anzahl der Freiheitsgrade. Was folgt, ist eine unvollständige Liste einiger der häufigsten Inferenzverfahren sowie die Anzahl der Freiheitsgrade, die in jeder Situation verwendet werden.

Standardnormalverteilung

Verfahren mit Standardnormalverteilung sind der Vollständigkeit halber aufgeführt und um einige Missverständnisse auszuräumen. Diese Verfahren erfordern nicht, dass wir die Anzahl der Freiheitsgrade ermitteln. Der Grund dafür ist, dass es eine einzige Standardnormalverteilung gibt. Diese Arten von Verfahren umfassen solche, an denen ein Populationsmittelwert beteiligt ist, wenn die Populationsstandardabweichung bereits bekannt ist, sowie Verfahren bezüglich der Bevölkerungsanteile.

instagram viewer

Ein Beispiel T-Verfahren

Manchmal erfordert die statistische Praxis, dass wir die T-Verteilung des Schülers verwenden. Bei diesen Verfahren, z. B. bei Verfahren mit einem Populationsmittelwert mit unbekannter Populationsstandardabweichung, ist die Anzahl der Freiheitsgrade um eins geringer als die Stichprobengröße. Also wenn die Stichprobengröße ist n, dann gibt es n - 1 Freiheitsgrade.

T Prozeduren mit gepaarten Daten

Oft macht es Sinn Daten als gepaart behandeln. Die Paarung wird typischerweise aufgrund einer Verbindung zwischen dem ersten und dem zweiten Wert in unserem Paar durchgeführt. Oft haben wir uns vor und nach den Messungen gepaart. Unsere Stichprobe gepaarter Daten ist nicht unabhängig. Der Unterschied zwischen jedem Paar ist jedoch unabhängig. Also wenn die Probe insgesamt hat n Datenpunktpaare (für insgesamt 2n Werte) gibt es dann n - 1 Freiheitsgrade.

T Verfahren für zwei unabhängige Populationen

Für diese Art von Problemen verwenden wir immer noch a t-Verteilung. Diesmal gibt es eine Stichprobe aus jeder unserer Populationen. Obwohl es vorzuziehen ist, dass diese beiden Stichproben dieselbe Größe haben, ist dies für unsere statistischen Verfahren nicht erforderlich. Somit können wir zwei Stichproben haben n1 und n2. Es gibt zwei Möglichkeiten, die Anzahl der Freiheitsgrade zu bestimmen. Die genauere Methode ist die Verwendung der Welch-Formel, einer rechenintensiven Formel, die die Stichprobengrößen und Stichprobenstandardabweichungen umfasst. Ein anderer Ansatz, der als konservative Näherung bezeichnet wird, kann verwendet werden, um die Freiheitsgrade schnell abzuschätzen. Dies ist einfach die kleinere der beiden Zahlen n1 - 1 und n2 - 1.

Chi-Platz für die Unabhängigkeit

Eine Verwendung der Chi-Quadrat-Test ist zu sehen, ob zwei kategoriale Variablen mit jeweils mehreren Ebenen unabhängig voneinander sind. Die Informationen zu diesen Variablen werden in a protokolliert Zwei-Wege-Tisch mit r Zeilen und c Säulen. Die Anzahl der Freiheitsgrade ist das Produkt (r - 1)(c - 1).

Chi-Quadrat-Passgenauigkeit

Die Chi-Quadrat-Anpassungsgüte beginnt mit einer einzelnen kategorialen Variablen mit insgesamt n Ebenen. Wir testen die Hypothese, dass diese Variable mit einem vorgegebenen Modell übereinstimmt. Die Anzahl der Freiheitsgrade ist eins weniger als die Anzahl der Ebenen. Mit anderen Worten, es gibt n - 1 Freiheitsgrade.

Ein Faktor ANOVA

Ein Faktor Varianzanalyse (ANOVA) ermöglicht es uns, Vergleiche zwischen mehreren Gruppen anzustellen, ohne dass mehrere paarweise Hypothesentests erforderlich sind. Da der Test erfordert, dass wir sowohl die Variation zwischen mehreren Gruppen als auch die Variation innerhalb jeder Gruppe messen, erhalten wir zwei Freiheitsgrade. Das F-Statistik, die für eine Faktor-ANOVA verwendet wird, ist ein Bruchteil. Der Zähler und der Nenner haben jeweils Freiheitsgrade. Lassen c sei die Anzahl der Gruppen und n ist die Gesamtzahl der Datenwerte. Die Anzahl der Freiheitsgrade für den Zähler ist eins weniger als die Anzahl der Gruppen oder c - 1. Die Anzahl der Freiheitsgrade für den Nenner ist die Gesamtzahl der Datenwerte abzüglich der Anzahl der Gruppen oder n - c.

Es ist klar, dass wir sehr vorsichtig sein müssen, um zu wissen, mit welchem ​​Inferenzverfahren wir arbeiten. Dieses Wissen informiert uns über die richtige Anzahl von Freiheitsgraden.

instagram story viewer