Définition, caractéristiques et exemples de conditionnement de l'opérateur

Le conditionnement opérant o Le conditionnement instrumental est un type d'apprentissage où le comportement est contrôlé avec des conséquences.

Elle repose sur l’idée que les comportements de renforcement ont tendance à se manifester de plus en plus souvent, alors que les comportements punis s’éteignent.

Quelle est la différence entre le conditionnement opérant et le conditionnement classique? Dans le conditionnement opérant, une réponse volontaire est suivie par un renforcement. De cette façon, la réponse volontaire (par exemple, étudier pour un examen) est plus susceptible de se produire dans le futur. Au contraire, dans le conditionnement classique, un stimulus active automatiquement une réponse involontaire.

Le conditionnement opératoire peut être décrit comme un processus qui tente de modifier le comportement en utilisant un renforcement positif et négatif. Grâce au conditionnement opérant, un individu établit une association entre un comportement particulier et une conséquence. Exemples:

Les parents récompensent de bonnes notes pour un enfant avec des bonbons ou une autre récompense.
Un enseignant récompense les élèves calmes et instruits. Les étudiants réalisent qu'en se comportant comme cela, ils reçoivent plus de points.
Un aliment est donné à un animal chaque fois qu'un levier est pressé.

B.F. Skinner (1938) a inventé le terme conditionnement opérant. Skinner a identifié trois types de réponses ou d'opérandes pouvant suivre le comportement:

Opérateurs neutres: réponses de l'environnement qui n'augmentent ni ne diminuent la probabilité de répétition d'un comportement.
Renforts: réponses de l'environnement qui augmentent la probabilité de répétition d'un comportement. Les renforts peuvent être positifs ou négatifs.
Des punitions: réponses de l'environnement qui diminuent la probabilité de répétition d'un comportement. La punition affaiblit le comportement.

Antécédents de conditionnement opérant

Thorndike a été le premier à reconnaître que ce conditionnement ne se limite pas à une réponse et à un renforcement. La réponse est donnée en présence de certains stimuli, en considérant trois événements: le stimulus, la réponse et la conséquence de la réponse ou du renforcement.

Cette structure facilite le développement de différents liens, tels que l'association entre le stimulus et la réponse, ce qui était essentiel pour la formulation de la loi de l'effet. A travers cela, il a affirmé que les réponses suivies des conséquences de renforcement auront plus de chances de se produire lorsque le stimulus réapparaîtra.

Au contraire, les réponses suivies de conséquences négatives auront une probabilité d'apparition plus faible lorsque le stimulus réapparaîtra. La loi de l'effet est l'antécédent du conditionnement opératoire ou du conditionnement instrumental, comme l'a nommé Thorndike.

Mais pour Skinner, psychologue du comportement, le conditionnement était le renforcement des comportements en fonction des conséquences qui auraient été obtenues auparavant.

Dans cette ligne, il existe deux formes de conditionnement:

Le classique ou Pavlovien: il est basé sur l'association de stimuli non conditionnés et conditionnés, étant les réponses contrôlées par des stimuli antécédents.
Conditionnement opératoire: les stimuli qui en résultent ou renforcent provoquent un certain comportement. Skinner explique que si le comportement est suivi d'un renforcement positif, cela augmenterait la probabilité qu'un tel comportement soit émis à l'avenir. Au contraire, si une réponse n'est pas suivie par un renforcement ou si ce renforcement est négatif, la probabilité d'émettre un tel comportement à l'avenir sera plus faible.

Concepts de base du conditionnement opérant

Renfort

Il est responsable de l’émission des réponses, c’est-à-dire de la probabilité qu’elles se produisent, qu’elles soient plus ou moins importantes à l’avenir. C'est un stimulus constant et cohérent, car il se produit une fois que la réponse s'est produite.

Il est impossible de savoir si un renforçateur déterminé influence le comportement jusqu'à ce qu'il soit présenté de manière contingente avec une réponse et que le comportement change en conséquence du renforcement.

Il existe deux types de renforcement: positif et négatif. Les deux ont le même objectif d'augmenter la probabilité que la réponse soit émise dans des situations futures. De plus, pour Skinner, les renforçateurs sont définis au moyen de comportements observables et mesurables.

Renforcement positif

Le renforcement positif renforce un comportement en fournissant une conséquence qu'un individu trouve enrichissante.

Renforcement négatif

L'élimination d'un renforçateur désagréable peut également renforcer un comportement. C'est ce qu'on appelle le renforcement négatif, car c'est l'élimination d'un stimulus indésirable qui est «gratifiant» pour l'animal ou la personne. Le renforcement négatif renforce le comportement car il arrête ou élimine une expérience désagréable.

Renforts primaires

Ils seraient tous ces renforceurs de base qui n’ont besoin d’aucune histoire de conditionnement préalable pour fonctionner en tant que tel. Certains exemples seraient l'eau, la nourriture et le sexe.

Renforts secondaires

Les renforcements secondaires seraient basés sur les antécédents de conditionnement grâce à l'association avec des stimuli non conditionnés.Certains exemples seraient l'argent et les qualifications.

Contingence de trois termes

C'est le modèle de base du conditionnement opérant et se compose de trois composantes: le stimulus discriminatif, la réponse et le stimulus de renforcement.

Un stimulus discriminatif serait celui qui indiquera au sujet que le renforçateur est disponible, indiquant que s'il effectue un certain comportement, il peut obtenir ledit renforçateur. En revanche, nous avons le ou les stimuli delta qui indiquent que le comportement ne mènera à aucun type de renforcement.

La réponse serait le comportement que le sujet effectuera, dont l'exécution prendra ou non le stimulus de renforcement.

Un stimulus de renforcement, comme mentionné ci-dessus, est responsable de l'émission du comportement puisque, grâce à son apparence, la probabilité d'émettre une réponse augmentera ou diminuera dans le futur.

Concepts à connaître sur le conditionnement opérant

Punition

La punition est également mesurée par ses effets sur le comportement du sujet. Par contre, contrairement au renfort, on vise à réduire ou à supprimer un certain comportement.

Une punition réduit la probabilité d'émettre un comportement dans des situations ultérieures. Cependant, cela n'élimine pas la réponse car si la menace de punition diminue, le comportement peut réapparaître.

En punition, il existe également deux types ou procédures différents, la punition positive et la punition négative.

Punition positive

Cela implique la présentation d'un stimulus aversif après l'exécution d'un certain comportement. Il est donné sous réserve de la réponse donnée par le sujet.

Punition négative

Elle consiste à éliminer un stimulus à la suite d’un certain comportement, c’est-à-dire à retirer un stimulus positif après la réalisation d’un certain comportement.

Extinction

À l'extinction, une réponse est arrêtée car le renforcement n'apparaît plus. Ce processus consiste à ne pas fournir le renforcement correspondant qui devrait être atteint et qui a permis de maintenir ce comportement au fil du temps.

Lorsqu'une réponse est éteinte, le stimulus discriminatif devient un stimulus d'extinction. Ce processus ne doit pas être confondu avec l’oubli, qui est donné lorsque la force d’un comportement diminue lorsque celle-ci n’a pas été délivrée dans un laps de temps.

La généralisation

Face à une situation ou un stimulus spécifique, une réponse est conditionnée, qui peut apparaître avant d'autres stimuli ou situations similaires.

Discrimination

Ce processus est le contraire de celui de la généralisation, il répond différemment selon le stimulus et le contexte.

Programmes de renforcement

Skinner a également établi plusieurs programmes de renforcement, y compris des programmes de renforcement continu et des programmes de renforcement intermittent.

Programmes de renforcement continu

Ils sont basés sur le renforcement constant de la réponse à chaque présentation, c'est-à-dire que chaque fois que le sujet effectue le comportement souhaité, il obtient un stimulus positif ou de renforcement.

Programmes de renforcement intermittent

En revanche, le sujet n'obtient pas toujours le renfort lors de l'exécution du comportement souhaité. Celles-ci sont définies en fonction du nombre de réponses données ou de l'intervalle de temps entre les réponses, donnant lieu à des procédures différentes.

Programmes à ratio fixe

Dans ces programmes, le renforcement est fourni lorsque le sujet génère des réponses fixes et constantes. Par exemple, dans un programme de ratio 10, la personne obtient le renforçateur après avoir fait dix réponses lorsque le stimulus est présenté.

Programmes à rapport variable

Ceci est construit comme le précédent, mais dans ce cas le nombre de réponses que le sujet doit donner pour obtenir le renforcement est variable.

Le renforcement continuerait à dépendre du nombre de réponses émises par le sujet mais avec une raison variable, grâce à laquelle le sujet est empêché de prédire le moment où le renforcement sera obtenu.

Programmes à intervalles fixes

Dans les programmes à intervalles, l'obtention du renforcement ne dépend pas du nombre de réponses que le sujet donne, mais est déterminé par le temps écoulé. Par conséquent, la première réponse produite après avoir passé un certain temps est renforcée.

Dans les programmes à intervalles fixes, le temps entre le renforcement et le renforcement est toujours le même.

Programmes à intervalles variables

Dans ces programmes, le renforcement est obtenu après un certain temps, bien que le temps soit différent pour chaque renforcement reçu.

Changement de comportement

Approximations successives ou mise en forme

Le moulage consiste en un changement de comportement à travers le moulage de comportements ou le renforcement différentiel d'approches successives.

Une série d'étapes est suivie pour façonner un comportement concret. Tout d'abord, le comportement initial à mouler est identifié pour savoir lequel vous souhaitez atteindre.

Ensuite, les éventuels renforcements qui vont être utilisés sont délimités et le processus est séparé en étapes ou étapes pour arriver au comportement final, renforçant chaque étape ou approche successive jusqu'à atteindre le dernier.

Avec cette procédure dynamique, les deux comportements et leurs conséquences sont transformés. En ce sens, les approches successives vers un comportement objectif sont renforcées.

Cependant, pour être réalisé, il est nécessaire de partir d'un comportement antérieur que le sujet effectue déjà, afin de renforcer progressivement son comportement jusqu'à ce qu'il atteigne l'objectif.

Chaîne

Avec elle, un nouveau comportement se forme à partir de la décomposition en étapes ou séquences plus simples, renforçant chaque réponse donnée dans chacune des étapes afin de conduire à l'établissement d'une réponse plus complexe dans le répertoire comportemental du sujet.

De longues chaînes de réponses peuvent être formées à l'aide de renforts conditionnés, en adoptant une unité fonctionnelle dont l'établissement conduit à l'acquisition et à la définition d'une compétence particulière.

Références

Conditionnement de l'opérateur Récupéré de wikipedia.org
Conditionnement de l'opérateur Récupéré de e-torredebabel.com.
Récupéré de biblio3.url.
Loi d'effet. Récupéré de wikipedia.org.
Extinction Récupéré de wikipedio.org.
Domjan, M. Principes d'apprentissage et de comportement. Paraninfo. 5ème édition.

Psychologie

« Performances et exemples de conditionnement classique Concept de conduite antisociale, théories et facteurs de risque »