Das Gebiet der Statistik ist in zwei Hauptabteilungen unterteilt: beschreibende und inferentielle. Jedes dieser Segmente ist wichtig und bietet unterschiedliche Techniken, mit denen unterschiedliche Ziele erreicht werden. Beschreibende Statistiken beschreiben, was in a vor sich geht Population oder Datensatz. Inferenzstatistiken hingegen ermöglichen es Wissenschaftlern, Ergebnisse aus einer Stichprobengruppe zu entnehmen und auf eine größere Population zu verallgemeinern. Die beiden Arten von Statistiken weisen einige wichtige Unterschiede auf.
Beschreibende Statistik
Beschreibende Statistik ist die Art von Statistik, die den meisten Menschen wahrscheinlich in den Sinn kommt, wenn sie das Wort "Statistik" hören. In diesem Zweig der Statistik ist das Ziel zu beschreiben. Numerische Kennzahlen werden verwendet, um Merkmale eines Datensatzes zu ermitteln. Es gibt eine Reihe von Elementen, die zu diesem Teil der Statistik gehören, z.
- Das durchschnittlichoder Maß für die Mitte eines Datensatzes, bestehend aus Mittelwert, Median, Modus oder Mitteltonbereich
- Die Ausbreitung eines Datensatzes, der mit dem gemessen werden kann Angebot oder Standardabweichung
- Gesamtbeschreibungen von Daten wie der Zusammenfassung mit fünf Zahlen
- Messungen wie Schiefe und Kurtosis
- Die Erforschung von Beziehungen und Korrelation zwischen gepaarten Daten
- Die Darstellung statistischer Ergebnisse in grafisch bilden
Diese Maßnahmen sind wichtig und nützlich, da sie es Wissenschaftlern ermöglichen, Muster zwischen Daten zu erkennen und diese Daten zu verstehen. Beschreibende Statistiken können nur zur Beschreibung der untersuchten Population oder des untersuchten Datensatzes verwendet werden: Die Ergebnisse können nicht auf eine andere Gruppe oder Population übertragen werden.
Arten der beschreibenden Statistik
Es gibt zwei Arten deskriptiver Statistiken, die Sozialwissenschaftler verwenden:
Maße der zentralen Tendenz Erfassen Sie allgemeine Trends innerhalb der Daten und werden berechnet und als Mittelwert, Median und Modus ausgedrückt. Ein Mittelwert gibt den Wissenschaftlern den mathematischen Durchschnitt aller Datensätze an, z. B. das Durchschnittsalter bei der ersten Heirat. Der Median stellt die Mitte der Datenverteilung dar, wie das Alter, das in der Mitte des Altersbereichs liegt, in dem die Menschen zum ersten Mal heiraten. und der Modus könnte das häufigste Alter sein, in dem Menschen zum ersten Mal heiraten.
Ausbreitungsmaße beschreiben, wie die Daten verteilt sind und sich aufeinander beziehen, einschließlich:
- Der Bereich, der gesamte Wertebereich, der in einem Datensatz vorhanden ist
- Die Häufigkeitsverteilung, die definiert, wie oft ein bestimmter Wert in einem Datensatz vorkommt
- Quartile, Untergruppen, die innerhalb eines Datensatzes gebildet werden, wenn alle Werte über den Bereich in vier gleiche Teile unterteilt sind
- Mittlere absolute Abweichung, der Durchschnitt, um wie viel jeder Wert vom Mittelwert abweicht
- VarianzDies zeigt, wie viel Spread in den Daten vorhanden ist
- Standardabweichung, die die Streuung der Daten relativ zum Mittelwert darstellt
Ausbreitungsmaße werden häufig visuell in Tabellen, Kreis- und Balkendiagrammen sowie Histogrammen dargestellt, um das Verständnis der Trends in den Daten zu erleichtern.
Inferenzstatistik
Inferenzstatistiken werden durch komplexe mathematische Berechnungen erstellt, die es Wissenschaftlern ermöglichen, auf der Grundlage einer Untersuchung einer daraus entnommenen Stichprobe Trends über eine größere Population abzuleiten. Wissenschaftler verwenden Inferenzstatistiken, um die Beziehungen zwischen Variablen innerhalb einer Stichprobe zu untersuchen und dann Verallgemeinerungen oder Vorhersagen darüber machen, wie sich diese Variablen auf eine größere beziehen Population.
Es ist normalerweise unmöglich, jedes Mitglied der Bevölkerung einzeln zu untersuchen. Daher wählen Wissenschaftler eine repräsentative Untergruppe der Bevölkerung aus, die als statistische Stichprobe bezeichnet wird, und aus dieser Analyse können sie etwas über die Bevölkerung sagen, aus der die Stichprobe stammt. Es gibt zwei Hauptabteilungen der Inferenzstatistik:
- Ein Konfidenzintervall gibt einen Wertebereich für einen unbekannten Parameter der Population durch Messen einer statistischen Stichprobe an. Dies wird in Form eines Intervalls und des Vertrauensgrades ausgedrückt, dass der Parameter innerhalb des Intervalls liegt.
- Signifikanztests oder Hypothesentest wo Wissenschaftler einen Anspruch auf die Bevölkerung erheben, indem sie eine statistische Stichprobe analysieren. Aufgrund dieses Designs besteht bei diesem Prozess eine gewisse Unsicherheit. Dies kann in Form eines Signifikanzniveaus ausgedrückt werden.
Zu den Techniken, mit denen Sozialwissenschaftler die Beziehungen zwischen Variablen untersuchen und damit Inferenzstatistiken erstellen, gehören: lineare Regressionsanalysen, logistische Regressionsanalysen, ANOVA, Korrelationsanalysen, Modellierung von Strukturgleichungenund Überlebensanalyse. Bei der Durchführung von Untersuchungen mithilfe von Inferenzstatistiken führen Wissenschaftler einen Signifikanztest durch, um festzustellen, ob sie ihre Ergebnisse auf eine größere Population übertragen können. Zu den gängigen Signifikanztests gehören die Chi-Quadrat und T-Test. Diese sagen den Wissenschaftlern die Wahrscheinlichkeit, dass die Ergebnisse ihrer Analyse der Stichprobe für die Gesamtbevölkerung repräsentativ sind.
Beschreibend vs. Inferenzstatistik
Obwohl deskriptive Statistiken hilfreich sind, um Dinge wie die Verbreitung und das Zentrum der Daten zu lernen, kann nichts in deskriptiven Statistiken verwendet werden, um Verallgemeinerungen vorzunehmen. In der deskriptiven Statistik werden Messungen wie Mittelwert und Standardabweichung als exakte Zahlen angegeben.
Obwohl die Inferenzstatistik einige ähnliche Berechnungen verwendet - wie den Mittelwert und die Standardabweichung - ist der Fokus für die Inferenzstatistik unterschiedlich. Inferenzstatistiken beginnen mit einer Stichprobe und verallgemeinern sich dann auf eine Population. Diese Informationen über eine Population werden nicht als Zahl angegeben. Stattdessen drücken Wissenschaftler diese Parameter als eine Reihe potenzieller Zahlen zusammen mit einem gewissen Maß an Vertrauen aus.