So schätzen Sie Standardabweichungen (SD)

click fraud protection

Die Standardabweichung und der Bereich sind beide Maße der Verbreitung eines Datensatzes. Jede Zahl gibt auf ihre Weise an, wie weit die Daten voneinander entfernt sind, da beide ein Maß für die Variation sind. Obwohl es keine explizite Beziehung zwischen dem Bereich und Standardabweichung, da ist ein Faustregel Das kann nützlich sein, um diese beiden Statistiken in Beziehung zu setzen. Diese Beziehung wird manchmal als Bereichsregel für die Standardabweichung bezeichnet.

Die Bereichsregel besagt, dass die Standardabweichung einer Stichprobe ungefähr einem Viertel des Bereichs der Daten entspricht. Mit anderen Wortens = (Maximum - Minimum) / 4. Dies ist eine sehr einfach zu verwendende Formel und sollte nur als sehr grobe Formel verwendet werden Schätzung der Standardabweichung.

Ein Beispiel

Um ein Beispiel für die Funktionsweise der Bereichsregel zu sehen, sehen wir uns das folgende Beispiel an. Angenommen, wir beginnen mit den Datenwerten 12, 12, 14, 15, 16, 18, 18, 20, 20, 25. Diese Werte haben a

instagram viewer
bedeuten von 17 und eine Standardabweichung von ca. 4,1. Wenn wir stattdessen zuerst den Bereich unserer Daten als 25 berechnen - 12 = 13 und dann dividieren Sie diese Zahl durch vier. Wir haben unsere Schätzung der Standardabweichung als 13/4 = 3,25. Diese Zahl liegt relativ nahe an der tatsächlichen Standardabweichung und eignet sich für eine grobe Schätzung.

Warum funktioniert es?

Es mag scheinen, dass die Bereichsregel etwas seltsam ist. Warum funktioniert es? Scheint es nicht völlig willkürlich, den Bereich nur durch vier zu teilen? Warum würden wir nicht durch eine andere Zahl teilen? Hinter den Kulissen gibt es tatsächlich eine mathematische Rechtfertigung.

Erinnern Sie sich an die Eigenschaften des Glockenkurve und die Wahrscheinlichkeiten von a Standardnormalverteilung. Eine Funktion hat mit der Datenmenge zu tun, die innerhalb einer bestimmten Anzahl von Standardabweichungen liegt:

  • Ungefähr 68% der Daten liegen innerhalb einer Standardabweichung (höher oder niedriger) vom Mittelwert.
  • Ungefähr 95% der Daten liegen innerhalb von zwei Standardabweichungen (höher oder niedriger) vom Mittelwert.
  • Ungefähr 99% liegen innerhalb von drei Standardabweichungen (höher oder niedriger) vom Mittelwert.

Die Zahl, die wir verwenden werden, hat mit 95% zu tun. Wir können sagen, dass 95% unserer Daten von zwei Standardabweichungen unter dem Mittelwert zu zwei Standardabweichungen über dem Mittelwert 95% unserer Daten haben. Somit würde sich fast unsere gesamte Normalverteilung über ein Liniensegment erstrecken, das insgesamt vier Standardabweichungen lang ist.

Nicht alle Daten sind normalverteilt und glockenkurvenförmig. Die meisten Daten verhalten sich jedoch so gut, dass fast alle Daten erfasst werden, wenn zwei Standardabweichungen vom Mittelwert entfernt werden. Wir schätzen und sagen, dass vier Standardabweichungen ungefähr der Größe des Bereichs entsprechen, und daher ist der durch vier geteilte Bereich eine grobe Annäherung an die Standardabweichung.

Wird für die Bereichsregel verwendet

Die Bereichsregel ist in einer Reihe von Einstellungen hilfreich. Erstens ist es eine sehr schnelle Schätzung der Standardabweichung. Die Standardabweichung erfordert, dass wir zuerst den Mittelwert finden und dann diesen Mittelwert von jedem Datenpunkt, Quadrat, subtrahieren Addiere die Unterschiede, addiere diese, dividiere durch eins weniger als die Anzahl der Datenpunkte und nimm dann (endlich) das Quadrat Wurzel. Andererseits erfordert die Bereichsregel nur eine Subtraktion und eine Division.

Andere Stellen, an denen die Bereichsregel hilfreich ist, sind unvollständige Informationen. Formeln wie die zur Bestimmung der Stichprobengröße erfordern drei Informationen: die gewünschte Fehlermarge, das Vertrauensniveau und die Standardabweichung der Population, die wir untersuchen. Oft ist es unmöglich zu wissen, was die Bevölkerung ist Standardabweichung ist. Mit der Bereichsregel können wir diese Statistik schätzen und dann wissen, wie groß wir unsere Stichprobe machen sollten.

instagram story viewer