Hauptkomponenten- und Faktoranalyse

Die Hauptkomponentenanalyse (PCA) und die Faktoranalyse (FA) sind statistische Techniken zur Datenreduktion oder Strukturerkennung. Diese beiden Methoden werden auf einen einzelnen Satz von Variablen angewendet, wenn der Forscher daran interessiert ist Ermitteln, welche Variablen in der Menge kohärente Teilmengen bilden, die relativ unabhängig von einer sind Ein weiterer. Variablen, die miteinander korreliert sind, aber weitgehend unabhängig von anderen Variablensätzen sind, werden zu Faktoren zusammengefasst. Mit diesen Faktoren können Sie die Anzahl der Variablen in Ihrer Analyse reduzieren, indem Sie mehrere Variablen zu einem Faktor kombinieren.

Die spezifischen Ziele von PCA oder FA sind die Zusammenfassung von Mustern von Korrelationen unter beobachteten Variablen, um eine große Anzahl von beobachteten Variablen auf eine kleinere Anzahl von Faktoren zu reduzieren, um a bereitzustellen Regressionsgleichung für einen zugrunde liegenden Prozess unter Verwendung beobachteter Variablen oder um eine Theorie über die Natur der zugrunde liegenden Prozesse zu testen.

instagram viewer

Beispiel

Nehmen wir zum Beispiel an, ein Forscher ist daran interessiert, die Eigenschaften von Doktoranden zu untersuchen. Der Forscher befragt eine große Stichprobe von Doktoranden zu Persönlichkeitsmerkmalen wie Motivation, intellektuelle Fähigkeiten, Schulgeschichte, Familiengeschichte, Gesundheit, körperliche Eigenschaften, etc. Jeder dieser Bereiche wird mit mehreren Variablen gemessen. Die Variablen werden dann einzeln in die Analyse eingegeben und die Korrelationen zwischen ihnen untersucht. Die Analyse zeigt Korrelationsmuster zwischen den Variablen, von denen angenommen wird, dass sie die zugrunde liegenden Prozesse widerspiegeln, die das Verhalten der Doktoranden beeinflussen. Beispielsweise bilden mehrere Variablen aus den Messungen der intellektuellen Fähigkeiten zusammen mit einigen Variablen aus den Maßnahmen der schulischen Geschichte einen Faktor, der die Intelligenz misst. In ähnlicher Weise können Variablen aus den Persönlichkeitsmaßen mit einigen Variablen aus der Motivation und der Schulbildung kombiniert werden Die Geschichte misst, um einen Faktor zu bilden, der den Grad misst, in dem ein Student lieber unabhängig arbeitet - eine Unabhängigkeit Faktor.

Schritte der Hauptkomponentenanalyse und Faktoranalyse

Zu den Schritten bei der Analyse der Hauptkomponenten und der Faktoranalyse gehören:

  • Wählen und messen Sie eine Reihe von Variablen.
  • Bereiten Sie die Korrelationsmatrix vor, um entweder PCA oder FA durchzuführen.
  • Extrahieren Sie eine Reihe von Faktoren aus der Korrelationsmatrix.
  • Bestimmen Sie die Anzahl der Faktoren.
  • Drehen Sie gegebenenfalls die Faktoren, um die Interpretierbarkeit zu verbessern.
  • Interpretieren Sie die Ergebnisse.
  • Überprüfen Sie die Faktorstruktur, indem Sie die Konstruktvalidität der Faktoren ermitteln.

Unterschied zwischen Hauptkomponentenanalyse und Faktoranalyse

Die Hauptkomponentenanalyse und die Faktoranalyse sind ähnlich, da beide Verfahren verwendet werden, um die Struktur eines Satzes von Variablen zu vereinfachen. Die Analysen unterscheiden sich jedoch in mehreren wichtigen Punkten:

  • In PCA werden die Komponenten als lineare Kombinationen der ursprünglichen Variablen berechnet. In FA werden die ursprünglichen Variablen als lineare Kombinationen der Faktoren definiert.
  • Bei PCA ist es das Ziel, möglichst viel von der Gesamtsumme zu machen Varianz in den Variablen wie möglich. Das Ziel in FA ist es, die Kovarianzen oder Korrelationen zwischen den Variablen zu erklären.
  • PCA wird verwendet, um die Daten auf eine kleinere Anzahl von Komponenten zu reduzieren. FA wird verwendet, um zu verstehen, welche Konstrukte den Daten zugrunde liegen.

Probleme mit der Hauptkomponentenanalyse und der Faktoranalyse

Ein Problem bei PCA und FA besteht darin, dass es keine Kriterienvariable gibt, anhand derer die Lösung getestet werden kann. Bei anderen statistischen Techniken wie Diskriminanzfunktionsanalyse, logistischer Regression, Profilanalyse und Multivariate VarianzanalyseDie Lösung wird danach beurteilt, wie gut sie die Gruppenmitgliedschaft vorhersagt. In PCA und FA gibt es kein externes Kriterium wie die Gruppenmitgliedschaft, anhand dessen die Lösung getestet werden kann.

Das zweite Problem von PCA und FA ist, dass nach der Extraktion unendlich viele Umdrehungen verfügbar sind. Alle berücksichtigen die gleiche Varianz in den Originaldaten, wobei der Faktor jedoch geringfügig definiert ist anders. Die endgültige Wahl bleibt dem Forscher aufgrund seiner Einschätzung seiner Interpretierbarkeit und seines wissenschaftlichen Nutzens überlassen. Forscher sind sich oft uneinig, welche Wahl die beste ist.

Ein drittes Problem ist, dass FA häufig verwendet wird, um schlecht konzipierte Forschung zu „retten“. Wenn kein anderes statistisches Verfahren angemessen oder anwendbar ist, können die Daten zumindest faktoranalysiert werden. Dies lässt viele glauben, dass die verschiedenen Formen von FA mit schlampiger Forschung verbunden sind.