Was ist der Unterschied zwischen Varianz und Standardabweichung?

Wenn wir die Variabilität eines Datensatzes messen, gibt es zwei eng miteinander verbundene Statistiken: die Varianz und Standardabweichung, die beide angeben, wie verteilt die Datenwerte sind, und ähnliche Schritte in ihre Berechnung einbeziehen. Der Hauptunterschied zwischen diesen beiden statistischen Analysen besteht jedoch darin, dass die Standardabweichung die Quadratwurzel der Varianz ist.

Um die Unterschiede zwischen diesen beiden Beobachtungen der statistischen Streuung zu verstehen, muss man zuerst verstehen, was jede darstellt: Varianz repräsentiert alle Datenpunkte in einer Menge und wird berechnet, indem die quadratische Abweichung jedes Mittelwerts gemittelt wird, während die Standardabweichung ein Maß für die Streuung um den Mittelwert ist, wenn die zentrale Tendenz über die berechnet wird bedeuten.

Infolgedessen kann die Varianz als durchschnittliche quadratische Abweichung der Werte vom Mittelwert oder [Quadrieren “ausgedrückt werden Abweichung der Mittelwerte] geteilt durch die Anzahl der Beobachtungen und die Standardabweichung kann als Quadratwurzel der ausgedrückt werden Varianz.

instagram viewer

Konstruktion der Varianz

Um den Unterschied zwischen diesen Statistiken vollständig zu verstehen, müssen wir die Berechnung der Varianz verstehen. Die Schritte zur Berechnung der Stichprobenvarianz sind wie folgt:

  1. Berechnen Sie den Stichprobenmittelwert der Daten.
  2. Finden Sie die Differenz zwischen dem Mittelwert und jedem der Datenwerte.
  3. Quadrieren Sie diese Unterschiede.
  4. Addieren Sie die quadratischen Differenzen.
  5. Teilen Sie diese Summe durch eins weniger als die Gesamtzahl der Datenwerte.

Die Gründe für jeden dieser Schritte sind folgende:

  1. Der Mittelwert liefert den Mittelpunkt oder durchschnittlich der Daten.
  2. Die Unterschiede zum Mittelwert helfen, die Abweichungen von diesem Mittelwert zu bestimmen. Datenwerte, die weit vom Mittelwert entfernt sind, führen zu einer größeren Abweichung als Daten, die nahe am Mittelwert liegen.
  3. Die Differenzen werden quadriert, denn wenn die Differenzen addiert werden, ohne quadriert zu werden, ist diese Summe Null.
  4. Das Addition dieser quadratischen Abweichungen liefert eine Messung der Gesamtabweichung.
  5. Die Division durch eins weniger als die Stichprobengröße ergibt eine Art mittlere Abweichung. Dies negiert den Effekt, dass viele Datenpunkte jeweils zur Messung der Streuung beitragen.

Wie bereits erwähnt, wird die Standardabweichung einfach berechnet, indem die Quadratwurzel dieses Ergebnisses ermittelt wird, die den absoluten Standard der Abweichung unabhängig von der Gesamtzahl der Datenwerte liefert.

Varianz und Standardabweichung

Wenn wir die Varianz betrachten, erkennen wir, dass die Verwendung einen großen Nachteil hat. Wenn wir den Schritten der Varianzberechnung folgen, zeigt dies, dass die Varianz in quadratischen Einheiten gemessen wird, da wir bei unserer Berechnung quadratische Differenzen addiert haben. Wenn unsere Probendaten beispielsweise in Metern gemessen werden, werden die Einheiten für eine Varianz in Quadratmetern angegeben.

Um unser Ausbreitungsmaß zu standardisieren, müssen wir die Quadratwurzel der Varianz ziehen. Dies beseitigt das Problem der quadratischen Einheiten und gibt uns ein Maß für die Streuung, die dieselben Einheiten wie unsere ursprüngliche Stichprobe aufweist.

Es gibt viele Formeln in der mathematischen Statistik, die besser aussehende Formen haben, wenn wir sie als Varianz anstelle der Standardabweichung angeben.