Was ist Bootstrapping in Bezug auf Statistiken?

click fraud protection

Bootstrapping ist eine statistische Technik, die unter die breitere Überschrift Resampling fällt. Diese Technik ist relativ einfach, wird jedoch so oft wiederholt, dass sie stark von Computerberechnungen abhängt. Bootstrapping bietet eine andere Methode als Konfidenzintervalle zum Schätzen eines Populationsparameters. Bootstrapping scheint sehr magisch zu funktionieren. Lesen Sie weiter, um zu sehen, wie es seinen interessanten Namen erhält.

Eine Erklärung zum Bootstrapping

Ein Ziel von Inferenzstatistik ist es, den Wert eines Parameters einer Population zu bestimmen. Es ist normalerweise zu teuer oder sogar unmöglich, dies direkt zu messen. Also benutzen wir Statistische Stichproben. Wir beproben eine Population, messen eine Statistik dieser Stichprobe und verwenden diese Statistik dann, um etwas über die zu sagen entsprechender Parameter der Bevölkerung.

In einer Schokoladenfabrik möchten wir beispielsweise sicherstellen, dass Schokoriegel eine bestimmte haben bedeuten Gewicht. Es ist nicht möglich, jeden produzierten Schokoriegel zu wiegen. Daher verwenden wir Stichprobenverfahren, um zufällig 100 Schokoriegel auszuwählen. Wir berechnen den Mittelwert dieser 100 Schokoriegel und sagen, dass der Populationsmittelwert innerhalb einer Fehlergrenze liegt, die vom Mittelwert unserer Stichprobe abweicht.

instagram viewer

Nehmen wir an, wir möchten einige Monate später genauer wissen - oder weniger von a Fehlermarge - Wie hoch war das durchschnittliche Gewicht des Schokoriegels an dem Tag, an dem wir die Produktionslinie probierten? Wir können auch die heutigen Schokoriegel nicht verwenden viele Variablen haben das Bild betreten (verschiedene Chargen von Milch, Zucker und Kakaobohnen, verschiedene atmosphärische Bedingungen, verschiedene Mitarbeiter in der Linie usw.). Alles, was wir von dem Tag an haben, an dem wir neugierig sind, sind die 100 Gewichte. Ohne eine Zeitmaschine bis zu diesem Tag scheint die anfängliche Fehlerquote die beste zu sein, auf die wir hoffen können.

Zum Glück können wir die verwenden Technik des Bootstrapping. In dieser Situation haben wir zufällig Probe mit Ersatz von den 100 bekannten Gewichten. Wir nennen dies dann ein Bootstrap-Beispiel. Da wir einen Austausch zulassen, ist dieses Bootstrap-Beispiel höchstwahrscheinlich nicht mit unserem ursprünglichen Beispiel identisch. Einige Datenpunkte können dupliziert werden, und andere Datenpunkte von den anfänglichen 100 können in einem Bootstrap-Beispiel weggelassen werden. Mit Hilfe eines Computers können in relativ kurzer Zeit Tausende von Bootstrap-Beispielen erstellt werden.

Ein Beispiel

Wie bereits erwähnt, müssen wir einen Computer verwenden, um Bootstrap-Techniken wirklich nutzen zu können. Das folgende numerische Beispiel zeigt, wie der Prozess funktioniert. Wenn wir mit dem Beispiel 2, 4, 5, 6, 6 beginnen, sind alle folgenden Bootstrap-Beispiele möglich:

  • 2 ,5, 5, 6, 6
  • 4, 5, 6, 6, 6
  • 2, 2, 4, 5, 5
  • 2, 2, 2, 4, 6
  • 2, 2, 2, 2, 2
  • 4,6, 6, 6, 6

Geschichte der Technik

Bootstrap-Techniken sind im Bereich der Statistik relativ neu. Die erste Verwendung wurde 1979 in einem Artikel von Bradley Efron veröffentlicht. Mit zunehmender Rechenleistung und geringeren Kosten sind Bootstrap-Techniken weiter verbreitet.

Warum das Name Bootstrapping?

Der Name "Bootstrapping" kommt von dem Satz "Sich an seinen Bootstraps hochheben". Dies bezieht sich auf etwas, das absurd und unmöglich ist. Versuchen Sie es so gut Sie können, Sie können sich nicht in die Luft heben, indem Sie an Lederstücken an Ihren Stiefeln ziehen.

Es gibt eine mathematische Theorie, die Bootstrapping-Techniken rechtfertigt. Die Verwendung von Bootstrapping scheint jedoch das Unmögliche zu tun. Obwohl es nicht so aussieht, als könnten Sie die Schätzung einer Bevölkerungsstatistik verbessern, indem Sie dieselbe Stichprobe immer wieder verwenden, kann Bootstrapping dies tatsächlich tun.

instagram story viewer