Eine Einführung in den Interquartilbereich

click fraud protection

Der Interquartilbereich (IQR) ist die Differenz zwischen dem ersten und dem dritten Quartil. Die Formel dafür lautet:

IQR = Q.3 - Q.1

Es gibt viele Messungen der Variabilität eines Datensatzes. Beide Angebot und Standardabweichung Sagen Sie uns, wie verteilt unsere Daten sind. Das Problem bei diesen deskriptiven Statistiken ist, dass sie sehr empfindlich gegenüber Ausreißern sind. Eine Messung der Ausbreitung eines Datensatzes, der gegenüber Ausreißern widerstandsfähiger ist, ist der Interquartilbereich.

Definition des Interquartilbereichs

Wie oben dargestellt, basiert der Interquartilbereich auf der Berechnung anderer Statistiken. Bevor wir den Interquartilbereich bestimmen, müssen wir zuerst die Werte des ersten und dritten Quartils kennen. (Natürlich hängen das erste und dritte Quartil vom Wert des Medians ab).

Sobald wir die Werte des ersten und dritten Quartils bestimmt haben, ist der Interquartilbereich sehr einfach zu berechnen. Alles was wir tun müssen, ist das erste Quartil vom dritten Quartil zu subtrahieren. Dies erklärt die Verwendung des Begriffs Interquartilbereich für diese Statistik.

instagram viewer

Beispiel

Um ein Beispiel für die Berechnung eines Interquartilbereichs zu sehen, betrachten wir den Datensatz: 2, 3, 3, 4, 5, 6, 6, 7, 8, 8, 8, 9. Das Zusammenfassung mit fünf Zahlen Für diesen Datensatz gilt:

  • Mindestens 2
  • Erstes Quartil von 3.5
  • Median von 6
  • Drittes Quartil von 8
  • Maximal 9

Wir sehen also, dass der Interquartilbereich 8 - 3,5 = 4,5 beträgt.

Die Bedeutung des Interquartilbereichs

Der Bereich gibt uns ein Maß dafür, wie verteilt unser gesamter Datensatz ist. Der Interquartilbereich, der angibt, wie weit die erstes und drittes Quartil are gibt an, wie verteilt die mittleren 50% unserer Daten sind.

Widerstand gegen Ausreißer

Der Hauptvorteil der Verwendung des Interquartilbereichs anstelle des Bereichs für die Messung der Streuung eines Datensatzes besteht darin, dass der Interquartilbereich nicht empfindlich gegenüber Ausreißern ist. Um dies zu sehen, schauen wir uns ein Beispiel an.

Aus dem obigen Datensatz haben wir einen Interquartilbereich von 3,5, einen Bereich von 9 - 2 = 7 und eine Standardabweichung von 2,34. Wenn wir den höchsten Wert von 9 durch einen extremen Ausreißer von 100 ersetzen, beträgt die Standardabweichung 27,37 und der Bereich 98. Obwohl wir ziemlich drastische Verschiebungen dieser Werte haben, sind das erste und dritte Quartil nicht betroffen und daher ändert sich der Interquartilbereich nicht.

Verwendung des Interquartilbereichs

Der Interquartilbereich ist nicht nur ein weniger empfindliches Maß für die Ausbreitung eines Datensatzes, sondern hat auch eine andere wichtige Verwendung. Aufgrund seiner Beständigkeit gegen Ausreißer ist der Interquartilbereich hilfreich, um festzustellen, wann ein Wert ein Ausreißer ist.

Das Interquartilbereichsregel informiert uns darüber, ob wir einen milden oder einen starken Ausreißer haben. Um nach einem Ausreißer zu suchen, müssen wir unter das erste Quartil oder über das dritte Quartil schauen. Wie weit wir gehen sollten, hängt vom Wert des Interquartilbereichs ab.

instagram story viewer