Histogrammklassen: Informationen und Beispiele

click fraud protection

Es gibt wirklich keine Regel für die Anzahl der Klassen. Bei der Anzahl der Klassen sind einige Dinge zu beachten. Wenn es nur eine Klasse gäbe, würden alle Daten in diese Klasse fallen. Unser Histogramm wäre einfach ein einzelnes Rechteck, dessen Höhe durch die Anzahl der Elemente in unserem Datensatz gegeben ist. Dies wäre nicht sehr hilfreich oder nützliches Histogramm.

Im anderen Extrem könnten wir eine Vielzahl von Klassen haben. Dies würde zu einer Vielzahl von Balken führen, von denen wahrscheinlich keiner sehr hoch wäre. Es wäre sehr schwierig, unter Verwendung dieser Art von Histogramm Unterscheidungsmerkmale aus den Daten zu bestimmen.

Um sich vor diesen beiden Extremen zu schützen, müssen wir eine Faustregel verwenden, um die Anzahl der Klassen für ein Histogramm zu bestimmen. Wenn wir einen relativ kleinen Datensatz haben, verwenden wir normalerweise nur etwa fünf Klassen. Wenn der Datensatz relativ groß ist, verwenden wir ungefähr 20 Klassen.

Es sei noch einmal betont, dass dies eine Faustregel ist, kein absolutes statistisches Prinzip. Es kann gute Gründe geben, eine andere Anzahl von Klassen für Daten zu haben. Wir werden unten ein Beispiel dafür sehen.

instagram viewer

Bevor wir einige Beispiele betrachten, werden wir sehen, wie die Klassen tatsächlich bestimmt werden. Wir beginnen diesen Prozess, indem wir das finden Angebot unserer Daten. Mit anderen Worten, wir subtrahieren den niedrigsten Datenwert vom höchsten Datenwert.

Wenn der Datensatz relativ klein ist, teilen wir den Bereich durch fünf. Der Quotient ist die Breite der Klassen für unser Histogramm. Wir werden in diesem Prozess wahrscheinlich einige Rundungen vornehmen müssen, was bedeutet, dass die Gesamtzahl der Klassen möglicherweise nicht fünf beträgt.

Wenn der Datensatz relativ groß ist, teilen wir den Bereich durch 20. Nach wie vor gibt uns dieses Teilungsproblem die Breite der Klassen für unser Histogramm. Wie wir bereits gesehen haben, kann unsere Rundung zu etwas mehr oder etwas weniger als 20 Klassen führen.

In den Fällen mit großen oder kleinen Datenmengen beginnt die erste Klasse an einem Punkt, der etwas unter dem kleinsten Datenwert liegt. Wir müssen dies so tun, dass der erste Datenwert in die erste Klasse fällt. Andere nachfolgende Klassen werden durch die Breite bestimmt, die beim Teilen des Bereichs festgelegt wurde. Wir wissen, dass wir uns in der letzten Klasse befinden, wenn unser höchster Datenwert in dieser Klasse enthalten ist.

Als Beispiel bestimmen wir eine geeignete Klassenbreite und Klassen für den Datensatz: 1.1, 1.9, 2.3, 3.0, 3.2, 4.1, 4.2, 4.4, 5.5, 5.5, 5.6, 5.7, 5.9, 6.2, 7.1, 7.9, 8.3, 9.0, 9.2, 11.1, 11.2, 14.4, 15.5, 15.5, 16.7, 18.9, 19.2.

Wir sehen, dass unser Satz 27 Datenpunkte enthält. Dies ist eine relativ kleine Menge, und deshalb werden wir den Bereich durch fünf teilen. Der Bereich liegt zwischen 19,2 und 1,1 = 18,1. Wir teilen 18,1 / 5 = 3,62. Dies bedeutet, dass eine Klassenbreite von 4 angemessen wäre. Unser kleinster Datenwert ist 1,1, daher beginnen wir die erste Klasse an einem Punkt, der unter diesem Wert liegt. Da unsere Daten aus positiven Zahlen bestehen, wäre es sinnvoll, die erste Klasse von 0 auf 4 zu bringen.

Angenommen, es gibt einen Multiple-Choice-Test mit 35 Fragen, und 1000 Schüler einer High School nehmen an dem Test teil. Wir möchten ein Histogramm erstellen, das die Anzahl der Schüler zeigt, die im Test bestimmte Ergebnisse erzielt haben. Wir sehen, dass 35/5 = 7 und 35/20 = 1,75. Trotz unserer Faustregel, die uns die Wahl zwischen Klassen der Breite 2 oder 7 gibt, die für unser Histogramm verwendet werden sollen, ist es möglicherweise besser, Klassen der Breite 1 zu haben. Diese Klassen würden jeder Frage entsprechen, die ein Schüler beim Test richtig beantwortet hat. Die erste davon würde bei 0 und die letzte bei 35 zentriert sein.

instagram story viewer