Steigung der Regressionslinie und Korrelationskoeffizient

click fraud protection

Viele Male im Studium von Statistiken Es ist wichtig, Verbindungen zwischen verschiedenen Themen herzustellen. Wir werden ein Beispiel dafür sehen, in dem die Steigung der Regressionslinie in direktem Zusammenhang mit der steht Korrelationskoeffizient. Da beide Konzepte gerade Linien beinhalten, ist es nur natürlich, die Frage zu stellen: "Wie sind der Korrelationskoeffizient und kleinste quadratische Linie verbunden?"

Zunächst werden wir einige Hintergrundinformationen zu diesen beiden Themen betrachten.

Details zur Korrelation

Es ist wichtig, sich an die Details zu erinnern, die sich auf den Korrelationskoeffizienten beziehen, der mit bezeichnet ist r. Diese Statistik wird verwendet, wenn wir gepaart haben quantitative Daten. Aus einem Streudiagramm von gepaarte Datenkönnen wir nach Trends in der Gesamtverteilung von Daten suchen. Einige gepaarte Daten weisen ein lineares oder geradliniges Muster auf. In der Praxis fallen die Daten jedoch nie genau auf eine gerade Linie.

Mehrere Leute sehen sich gleich an

instagram viewer
Streudiagramm von gepaarten Daten würde nicht übereinstimmen, wie nahe es an der Darstellung eines linearen Gesamttrends war. Schließlich können unsere Kriterien dafür etwas subjektiv sein. Die Skala, die wir verwenden, kann auch unsere Wahrnehmung der Daten beeinflussen. Aus diesen und weiteren Gründen benötigen wir eine Art objektives Maß, um festzustellen, wie nahe unsere gepaarten Daten an der Linearität liegen. Der Korrelationskoeffizient erreicht dies für uns.

Ein paar grundlegende Fakten über r umfassen:

  • Der Wert von r liegt zwischen einer reellen Zahl von -1 bis 1.
  • Werte von r nahe 0 bedeutet, dass zwischen den Daten nur eine geringe bis keine lineare Beziehung besteht.
  • Werte von r nahe 1 bedeutet, dass zwischen den Daten eine positive lineare Beziehung besteht. Dies bedeutet, dass als x erhöht das y erhöht sich auch.
  • Werte von r nahe -1 bedeutet, dass zwischen den Daten eine negative lineare Beziehung besteht. Dies bedeutet, dass als x erhöht das y nimmt ab.

Die Steigung der Linie der kleinsten Quadrate

Die letzten beiden Elemente in der obigen Liste weisen uns auf die Steigung der Linie der kleinsten Quadrate mit der besten Anpassung hin. Denken Sie daran, dass die Steigung einer Linie ein Maß dafür ist, wie viele Einheiten sie für jede Einheit, die wir nach rechts bewegen, nach oben oder unten bewegt. Manchmal wird dies als Anstieg der Linie geteilt durch den Lauf oder als Änderung in angegeben y Werte geteilt durch die Änderung in x Werte.

Im Allgemeinen haben gerade Linien Steigungen, die positiv, negativ oder null sind. Wenn wir unsere kleinsten quadratischen Regressionslinien untersuchen und die entsprechenden Werte von vergleichen würden rwürden wir feststellen, dass jedes Mal, wenn unsere Daten eine haben negativer Korrelationskoeffizientist die Steigung der Regressionslinie negativ. In ähnlicher Weise ist für jedes Mal, wenn wir einen positiven Korrelationskoeffizienten haben, die Steigung der Regressionslinie positiv.

Aus dieser Beobachtung sollte ersichtlich sein, dass definitiv ein Zusammenhang zwischen dem Vorzeichen des Korrelationskoeffizienten und der Steigung der Linie der kleinsten Quadrate besteht. Es bleibt zu erklären, warum dies wahr ist.

Die Formel für die Piste

Der Grund für die Verbindung zwischen dem Wert von r und die Steigung der Linie der kleinsten Quadrate hat mit der Formel zu tun, die uns die Steigung dieser Linie gibt. Für gepaarte Daten (x, y) wir bezeichnen die Standardabweichung des x Daten von sx und die Standardabweichung der y Daten von sy.

Die Formel für die Steigung ein der Regressionsgeraden ist:

  • a = r (sy/ sx)

Bei der Berechnung einer Standardabweichung wird die positive Quadratwurzel einer nichtnegativen Zahl gezogen. Infolgedessen dürfen beide Standardabweichungen in der Formel für die Steigung nicht negativ sein. Wenn wir davon ausgehen, dass unsere Daten variieren, können wir die Möglichkeit außer Acht lassen, dass eine dieser Standardabweichungen Null ist. Daher ist das Vorzeichen des Korrelationskoeffizienten dasselbe wie das Vorzeichen der Steigung der Regressionslinie.

instagram story viewer