Operante Konditionierung tritt auf, wenn eine Assoziation zwischen einem bestimmten Verhalten und einer Konsequenz für dieses Verhalten hergestellt wird. Diese Assoziation basiert auf der Verwendung von Verstärkung und / oder Bestrafung, um Verhalten zu fördern oder zu entmutigen. Die Operantenkonditionierung wurde zuerst vom Verhaltenspsychologen B. F. Skinner definiert und untersucht, der mehrere bekannte Operantenkonditionierungsexperimente mit Tieren durchführte.
Wichtige Erkenntnisse: Operante Konditionierung
- Operante Konditionierung ist der Prozess des Lernens durch Verstärkung und Bestrafung.
- Bei der operanten Konditionierung werden Verhaltensweisen basierend auf den Konsequenzen dieses Verhaltens gestärkt oder geschwächt.
- Die operative Konditionierung wurde vom Verhaltenspsychologen B. F. Skinner definiert und untersucht.
Ursprünge
B. F. Skinner war ein Behavioristwas bedeutet, dass er glaubte, dass die Psychologie auf das Studium beobachtbarer Verhaltensweisen beschränkt sein sollte. Während andere Behavioristen wie John B. Watson, der sich auf klassische Konditionierung konzentrierte, war Skinner mehr an dem Lernen interessiert, das durch operante Konditionierung geschah.
Er beobachtete das in klassische Konditionierungsreaktionen neigen dazu, durch angeborene Reflexe ausgelöst zu werden, die automatisch auftreten. Er nannte diese Art von Verhalten Befragter. Er unterschied Verhalten der Befragten aus dem Verhalten der Operanten. Operantes Verhalten war der Begriff Skinner, der verwendet wurde, um ein Verhalten zu beschreiben, das durch die darauf folgenden Konsequenzen verstärkt wird. Diese Konsequenzen spielen eine wichtige Rolle bei der erneuten Ausführung eines Verhaltens.
Skinners Ideen basierten auf Edward Thorndikes Wirkungsgesetz, das besagt, dass Verhalten, das positive Konsequenzen hervorruft, wahrscheinlich wiederholt werden, während Verhalten, das negative Konsequenzen hervorruft, wahrscheinlich nicht wiederholt wird. Skinner führte das Konzept der Verstärkung in Thorndikes Ideen ein und spezifizierte, dass verstärktes Verhalten wahrscheinlich wiederholt (oder verstärkt) wird.
Operante Konditionierung studieren, Skinner führte Experimente mit einer "Skinner Box" durch. Eine kleine Kiste mit einem Hebel an einem Ende, der beim Drücken Nahrung oder Wasser liefert. Ein Tier, wie eine Taube oder eine Ratte, wurde in die Kiste gelegt, in der es sich frei bewegen konnte. Schließlich würde das Tier den Hebel drücken und belohnt werden. Skinner stellte fest, dass dieser Prozess dazu führte, dass das Tier häufiger auf den Hebel drückte. Skinner würde das Lernen messen, indem er die Rate der Antworten des Tieres verfolgt, wenn diese Antworten verstärkt wurden.
Verstärkung und Bestrafung
Durch seine Experimente identifizierte Skinner die verschiedenen Arten der Verstärkung und Bestrafung, die das Verhalten fördern oder entmutigen.
Verstärkung
Eine Verstärkung, die einem Verhalten genau folgt, wird dieses Verhalten fördern und stärken. Es gibt zwei Arten der Verstärkung:
- Positive Verstärkung tritt auf, wenn ein Verhalten zu einem günstigen Ergebnis führt, z. Ein Hund erhält eine Belohnung, nachdem er einem Befehl Folge geleistet hat, oder ein Schüler erhält ein Kompliment vom Lehrer, nachdem er sich im Unterricht gut benommen hat. Diese Techniken erhöhen die Wahrscheinlichkeit, dass die Person das gewünschte Verhalten wiederholt, um die Belohnung erneut zu erhalten.
- Negative Verstärkung tritt auf, wenn ein Verhalten zur Beseitigung einer ungünstigen Erfahrung führt, z. Ein Experimentator hört auf, einem Affen einen elektrischen Schlag zu versetzen, wenn der Affe einen bestimmten Hebel drückt. In diesem Fall wird das Hebelpressverhalten verstärkt, da der Affe die ungünstigen Stromschläge wieder entfernen möchte.
Darüber hinaus identifizierte Skinner zwei verschiedene Arten von Verstärkern.
- Primärverstärker auf natürliche Weise das Verhalten verstärken, weil sie von Natur aus wünschenswert sind, z. Essen.
- Konditionierte Verstärker Verhalten verstärken, nicht weil sie von Natur aus wünschenswert sind, sondern weil wir lernen sie mit Primärverstärkern zu assoziieren. Zum Beispiel ist Papiergeld nicht von Natur aus wünschenswert, aber es kann verwendet werden, um von Natur aus wünschenswerte Güter wie Lebensmittel und Unterkünfte zu erwerben.
Bestrafung
Bestrafung ist das Gegenteil von Verstärkung. Wenn die Bestrafung einem Verhalten folgt, entmutigt und schwächt sie dieses Verhalten. Es gibt zwei Arten der Bestrafung.
- Positive Bestrafung (oder Bestrafung durch Anwendung) tritt auf, wenn auf ein Verhalten ein ungünstiges Ergebnis folgt, z. Ein Elternteil, der ein Kind verprügelt, nachdem das Kind ein Schimpfwort verwendet hat.
- Negative Bestrafung (oder Bestrafung durch Entfernung) tritt auf, wenn ein Verhalten zur Entfernung von etwas Günstigem führt, z. ein Elternteil, der einem Kind das wöchentliche Gehalt verweigert, weil sich das Kind schlecht benommen hat.
Obwohl Bestrafung immer noch weit verbreitet ist, stellten Skinner und viele andere Forscher fest, dass Bestrafung nicht immer effektiv ist. Bestrafung kann ein Verhalten für eine Weile unterdrücken, aber das unerwünschte Verhalten tritt auf lange Sicht wieder auf. Bestrafung kann auch unerwünschte Nebenwirkungen haben. Beispielsweise kann ein Kind, das von einem Lehrer bestraft wird, unsicher und ängstlich werden, weil es nicht genau weiß, was zu tun ist, um zukünftige Bestrafungen zu vermeiden.
Anstatt zu bestrafen, schlugen Skinner und andere vor, das gewünschte Verhalten zu verstärken und unerwünschte Verhaltensweisen zu ignorieren. Verstärkung erzählt eine Person Welches Verhalten ist erwünscht, während die Bestrafung dem Einzelnen nur sagt, welches Verhalten nicht erwünscht ist?
Verhaltensformung
Operante Konditionierung kann zu immer komplexeren Verhaltensweisen führen Gestaltung, auch als "Approximationsmethode" bezeichnet. Die Formgebung erfolgt Schritt für Schritt, da jeder Teil eines komplizierteren Verhaltens verstärkt wird. Das Formen beginnt mit der Verstärkung des ersten Teils des Verhaltens. Sobald dieses Teil des Verhaltens beherrscht ist, erfolgt die Verstärkung nur, wenn der zweite Teil des Verhaltens auftritt. Dieses Verstärkungsmuster wird fortgesetzt, bis das gesamte Verhalten beherrscht ist.
Wenn einem Kind beispielsweise das Schwimmen beigebracht wird, wird es möglicherweise zunächst nur dafür gelobt, dass es ins Wasser geht. Sie wird erneut gelobt, wenn sie das Treten lernt, und erneut, wenn sie bestimmte Armbewegungen lernt. Schließlich wird sie dafür gelobt, dass sie sich durch einen bestimmten Schlag durch das Wasser treibt und gleichzeitig tritt. Durch diesen Prozess wurde ein ganzes Verhalten geformt.
Zeitpläne der Verstärkung
In der realen Welt wird das Verhalten nicht ständig verstärkt. Skinner stellte fest, dass die Häufigkeit der Verstärkung Einfluss darauf haben kann, wie schnell und wie erfolgreich man ein neues Verhalten lernt. Er spezifizierte mehrere Verstärkungspläne mit jeweils unterschiedlichen Zeitpunkten und Frequenzen.
- Kontinuierliche Verstärkung tritt auf, wenn eine bestimmte Antwort auf jede einzelne Leistung eines bestimmten Verhaltens folgt. Lernen geschieht schnell mit kontinuierlicher Verstärkung. Wenn jedoch die Verstärkung gestoppt wird, nimmt das Verhalten schnell ab und hört letztendlich ganz auf, was als Aussterben bezeichnet wird.
- Zeitpläne mit festem Verhältnis Belohnungsverhalten nach einer bestimmten Anzahl von Antworten. Zum Beispiel kann ein Kind nach jeder fünften Aufgabe, die es erledigt, einen Stern bekommen. Nach diesem Zeitplan verlangsamt sich die Rücklaufquote unmittelbar nach Auslieferung der Belohnung.
- Zeitpläne mit variablem Verhältnis Variieren Sie die Anzahl der Verhaltensweisen, die erforderlich sind, um eine Belohnung zu erhalten. Dieser Zeitplan führt zu einer hohen Antwortrate und ist auch schwer zu löschen, da seine Variabilität das Verhalten beibehält. Spielautomaten verwenden diese Art von Bewehrungsplan.
- Zeitpläne mit festen Intervallen Geben Sie nach Ablauf einer bestimmten Zeit eine Belohnung. Stundenweise bezahlt zu werden, ist ein Beispiel für diese Art von Verstärkungsplan. Ähnlich wie beim Zeitplan mit festem Verhältnis steigt die Rücklaufquote, wenn sich die Belohnung nähert, verlangsamt sich jedoch unmittelbar nach Erhalt der Belohnung.
- Zeitpläne mit variablen Intervallen Variiere die Zeitspanne zwischen den Belohnungen. Zum Beispiel hat ein Kind, das zu verschiedenen Zeiten während der Woche eine Zulage erhält, solange es positive Verhaltensweisen gezeigt hat, einen Zeitplan mit variablen Intervallen. Das Kind wird sich weiterhin positiv verhalten, um eventuell seine Zulage zu erhalten.
Beispiele für die Operantenkonditionierung
Wenn Sie jemals ein Haustier ausgebildet oder ein Kind unterrichtet haben, haben Sie wahrscheinlich in Ihrem eigenen Leben eine operative Konditionierung angewendet. Operante Konditionierung wird immer noch häufig unter verschiedenen realen Umständen eingesetzt, einschließlich im Klassenzimmer und in therapeutischen Umgebungen.
Zum Beispiel kann ein Lehrer die Schüler dabei unterstützen, ihre Hausaufgaben regelmäßig zu machen, indem er regelmäßig Pop-Quiz gibt, die Fragen stellen, die den jüngsten Hausaufgaben ähneln. Wenn ein Kind einen Wutanfall auslöst, um Aufmerksamkeit zu erregen, kann der Elternteil das Verhalten ignorieren und das Kind nach Beendigung des Wutanfalls erneut bestätigen.
Operante Konditionierung wird auch in verwendet Verhaltensänderung, ein Ansatz zur Behandlung zahlreicher Probleme bei Erwachsenen und Kindern, einschließlich Phobien, Angstzuständen, Bettnässen und vielen anderen. Eine Möglichkeit, Verhaltensänderungen zu implementieren, besteht in a Token Economy, bei denen das gewünschte Verhalten durch Token in Form von digitalen Abzeichen, Knöpfen, Chips, Aufklebern oder anderen Objekten verstärkt wird. Schließlich können diese Token gegen echte Belohnungen eingetauscht werden.
Kritik
Während die operante Konditionierung viele Verhaltensweisen erklären kann und immer noch weit verbreitet ist, gibt es mehrere Kritikpunkte an dem Prozess. Erstens wird der operanten Konditionierung vorgeworfen, eine zu sein unvollständige Erklärung zum Lernen, weil es die Rolle biologischer und kognitiver Elemente vernachlässigt.
Darüber hinaus hängt die Konditionierung der Operanten von einem ab Autoritätsperson das Verhalten zu verstärken und die Rolle der Neugier und die Fähigkeit eines Individuums, seine eigenen Entdeckungen zu machen, zu ignorieren. Kritiker lehnen die Betonung der operanten Konditionierung auf die Kontrolle und Manipulation des Verhaltens ab und argumentieren, dass sie zu autoritären Praktiken führen können. Skinner glaubte jedoch, dass Umgebungen das Verhalten auf natürliche Weise kontrollieren und dass Menschen dieses Wissen für gut oder schlecht nutzen können.
Schließlich wird er kritisiert, weil Skinners Beobachtungen zur operanten Konditionierung auf Tierversuchen beruhten extrapolieren aus seinen Tierstudien, um Vorhersagen über menschliches Verhalten zu machen. Einige Psychologen glauben, dass diese Art der Verallgemeinerung fehlerhaft ist, weil Menschen und nichtmenschliche Tiere physisch und kognitiv unterschiedlich sind.
Quellen
- Kirsche, Kendra. "Was ist Operant Conditioning und wie funktioniert es?" Sehr guter Geist, 2. Oktober 2018. https://www.verywellmind.com/operant-conditioning-a2-2794863
- Crain, William. Entwicklungstheorien: Konzepte und Anwendungen. 5. Auflage, Pearson Prentice Hall. 2005.
- Goldman, Jason G. „Was ist Operantenkonditionierung? (Und wie erklärt es das Fahren von Hunden?) ” Wissenschaftlicher Amerikaner, 13. Dezember 2012. https://blogs.scientificamerican.com/thoughtful-animal/what-is-operant-conditioning-and-how-does-it-explain-driving-dogs/
- McLeod, Saul. "Skinner - Operante Konditionierung." Einfach Psychologie, 21. Januar 2018. https://www.simplypsychology.org/operant-conditioning.html#class