Beispiel für Bootstrapping in Statistiken

click fraud protection

Bootstrapping ist eine leistungsstarke statistische Technik. Es ist besonders nützlich, wenn die Stichprobe Die Größe, mit der wir arbeiten, ist klein. Unter normalen Umständen können Stichprobengrößen von weniger als 40 nicht unter der Annahme von a behandelt werden Normalverteilung oder ein t Verteilung. Bootstrap-Techniken funktionieren recht gut mit Samples mit weniger als 40 Elementen. Der Grund dafür ist, dass beim Bootstrapping ein Resampling durchgeführt wird. Diese Art von Techniken setzen nichts über die Verteilung unserer Daten.

Bootstrapping ist populärer geworden, da Computerressourcen leichter verfügbar sind. Dies liegt daran, dass ein Computer verwendet werden muss, damit das Bootstrapping praktisch ist. Wie dies funktioniert, sehen wir im folgenden Beispiel für Bootstrapping.

Wir beginnen mit eine statistische Stichprobe von einer Bevölkerung, von der wir nichts wissen. Unser Ziel wird ein Konfidenzintervall von 90% über den Mittelwert der Stichprobe sein. Obwohl andere statistische Techniken verwendet werden, um zu bestimmen

instagram viewer
Vertrauensintervalle Nehmen wir an, wir kennen den Mittelwert oder die Standardabweichung unserer Population. Für das Bootstrapping ist nichts anderes als die Stichprobe erforderlich.

Für die Zwecke unseres Beispiels nehmen wir an, dass die Stichprobe 1, 2, 4, 4, 10 ist.

Wir führen jetzt ein Resample mit Ersatz aus unserem Sample durch, um sogenannte Bootstrap-Samples zu bilden. Jedes Bootstrap-Beispiel hat eine Größe von fünf, genau wie unser Originalmuster. Da wir jeden Wert zufällig auswählen und dann ersetzen, können sich die Bootstrap-Beispiele vom ursprünglichen Beispiel und voneinander unterscheiden.

Für Beispiele, denen wir in der realen Welt begegnen würden, würden wir dieses Resampling hunderte, wenn nicht tausende Male durchführen. Im Folgenden sehen Sie ein Beispiel für 20 Bootstrap-Beispiele:

Da wir Bootstrapping verwenden, um ein Konfidenzintervall für den Populationsmittelwert zu berechnen, berechnen wir jetzt die Mittelwerte für jedes unserer Bootstrap-Beispiele. Diese in aufsteigender Reihenfolge angeordneten Mittel sind: 2, 2,4, 2,6, 2,6, 2,8, 3, 3, 3,2, 3,4, 3,6, 3,8, 4, 4, 4,2, 4,6, 5,2, 6, 6, 6,6, 7,6.

Wir erhalten nun aus unserer Liste der Bootstrap-Beispiele ein Konfidenzintervall. Da wir ein 90% -Konfidenzintervall wünschen, verwenden wir das 95. und 5. Perzentil als Endpunkte der Intervalle. Der Grund dafür ist, dass wir 100% - 90% = 10% in zwei Hälften teilen, so dass wir die mittleren 90% aller Bootstrap-Beispielmittel haben.

instagram story viewer