Gepaarte Daten in Statistiken, die oft als geordnete Paare bezeichnet werden, beziehen sich auf zwei Variablen in den Individuen einer Population, die miteinander verknüpft sind, um die Korrelation zwischen ihnen zu bestimmen. Damit ein Datensatz als gepaarte Daten betrachtet werden kann, müssen diese beiden Datenwerte miteinander verbunden oder verknüpft sein und dürfen nicht separat betrachtet werden.
Die Idee gepaarter Daten steht im Gegensatz zu der üblichen Zuordnung einer Zahl zu jedem Datenpunkt wie in einem anderen quantitative Daten legt fest, dass jeder einzelne Datenpunkt zwei Zahlen zugeordnet ist, wodurch ein Diagramm bereitgestellt wird, mit dem Statistiker die Beziehung zwischen diesen Variablen in einer Population beobachten können.
Diese Methode der gepaarten Daten wird verwendet, wenn eine Studie zwei Variablen bei Personen der Bevölkerung vergleichen möchte, um eine Schlussfolgerung über die beobachtete Korrelation zu ziehen. Bei der Beobachtung dieser Datenpunkte ist die Reihenfolge der Paarung wichtig, da die erste Zahl ein Maß für eine Sache ist, während die zweite ein Maß für etwas völlig anderes ist.
Beispiel für gepaarte Daten
Angenommen, ein Lehrer zählt die Anzahl der Hausaufgaben jedes Schülers, um ein Beispiel für gepaarte Daten anzuzeigen für eine bestimmte Einheit abgegeben und diese Zahl dann mit dem Prozentsatz jedes Schülers beim Einheitentest gepaart. Die Paare sind wie folgt:
- Eine Person, die 10 Aufgaben abgeschlossen hat, verdiente 95% bei ihrem Test. (10, 95%)
- Eine Person, die 5 Aufgaben abgeschlossen hat, verdiente 80% bei ihrem Test. (5, 80%)
- Eine Person, die 9 Aufgaben abgeschlossen hat, verdiente 85% bei ihrem Test. (9, 85%)
- Eine Person, die 2 Aufgaben abgeschlossen hat, hat bei ihrem Test 50% verdient. (2, 50%)
- Eine Person, die 5 Aufgaben abgeschlossen hat, verdiente 60% bei ihrem Test. (5, 60%)
- Eine Person, die 3 Aufgaben erfüllt hat, hat bei ihrem Test 70% verdient. (3, 70%)
In jedem dieser Sätze gepaarter Daten können wir sehen, dass die Anzahl der Zuweisungen immer an erster Stelle steht geordnetes Paar, während der Prozentsatz, der beim Test verdient wurde, an zweiter Stelle steht, wie in der ersten Instanz von (10, 95%).
Während eine statistische Analyse dieser Daten auch verwendet werden könnte, um die durchschnittliche Anzahl von zu berechnen Wenn die Hausaufgaben erledigt sind oder die durchschnittliche Testnote erreicht ist, müssen möglicherweise andere Fragen gestellt werden die Daten. In diesem Fall möchte der Lehrer wissen, ob ein Zusammenhang zwischen der Anzahl der Hausaufgaben besteht Der Lehrer musste die Daten gepaart halten, um dies zu beantworten Frage.
Gepaarte Daten analysieren
Das statistische Methoden von Korrelation und Regression werden verwendet, um gepaarte Daten zu analysieren, wobei die Korrelationskoeffizient quantifiziert, wie eng die Daten entlang einer geraden Linie liegen, und misst die Stärke der linearen Beziehung.
Die Regression wird andererseits für verschiedene Anwendungen verwendet, einschließlich der Bestimmung, welche Zeile am besten zu unserem Datensatz passt. Diese Linie kann dann wiederum zum Schätzen oder Vorhersagen verwendet werden y Werte für Werte von x das war nicht Teil unseres ursprünglichen Datensatzes.
Es gibt einen speziellen Diagrammtyp, der sich besonders gut für gepaarte Daten eignet, die als Streudiagramm bezeichnet werden. In diesem Art des DiagrammsEine Koordinatenachse repräsentiert eine Menge der gepaarten Daten, während die andere Koordinatenachse die andere Menge der gepaarten Daten repräsentiert.
Bei einem Streudiagramm für die obigen Daten würde die x-Achse die Anzahl der zugewiesenen Zuordnungen bezeichnen, während die y-Achse die Ergebnisse des Einheitentests bezeichnen würde.