B.F. Théorie Skinner du Comportement et du Conditionnement Opératoire



Burrhus Frederic Skinner, Mieux connu sous le nom B. F. Skinner était un psychologue américain connu pour ses contributions au développement de la théorie du behaviorisme, et son roman utopique Walden Two (1948).

Le comportementalisme suppose que tous les comportements sont des réponses à certains stimuli dans l'environnement ou des conséquences de l'histoire de l'individu. Bien que les comportementalistes acceptent généralement le rôle important de l'héritage dans la détermination du comportement, ils se concentrent principalement sur les facteurs environnementaux.

Il est le psychologue le plus reconnu dans le courant du comportementalisme et sa théorie a été l'une des plus influentes en psychologie.

Né en Pennsylvanie en 1904, il a commencé à travailler sur ses idées sur le comportement humain après avoir obtenu son doctorat à Harvard. Les œuvres de Skinner comprennent Le comportement des organismes (1938) et un roman basé sur ses théories, Walden dos (1948). Il a exploré le comportementalisme par rapport à la société dans des livres ultérieurs, dont Beyond Freedom et Human Dignity (1971).

En tant qu'étudiant au Hamilton College, Skinner s'est passionné pour l'écriture. Après avoir obtenu son diplôme en 1926, il essaya de devenir écrivain professionnel, mais obtint peu de succès. Deux ans plus tard, il décida de suivre une nouvelle direction pour sa vie; Il s'est inscrit à l'Université de Harvard pour étudier la psychologie.

Skinner considérait le libre arbitre comme une illusion et une action humaine dépendant des conséquences des actions précédentes. Si les conséquences sont mauvaises, il y a une forte probabilité que l'action ne se répète pas. Au contraire, si les conséquences sont bonnes, il est probable que l’action se répète. Skinner appelle cela le principe du renforcement.

Boîte de skinner

Pour renforcer le comportement, Skinner a utilisé le conditionnement opérant et, pour l’étudier, il a inventé la chambre de conditionnement opérant, également connue sous le nom de boîte Skinner.

Dans les années 1920, Watson avait quitté la psychologie académique et d'autres comportementalistes commençaient à être influents, proposant de nouvelles manières d'apprendre en dehors du conditionnement classique.

La façon de penser de Skinner était légèrement moins extrême que celle de Watson. Skinner croyait que nous avions un esprit, mais qu’il était simplement plus productif d’étudier des comportements observables plutôt que des événements mentaux internes.

Introduction au comportementalisme

Le comportementisme a été le principal paradigme de la psychologie entre 1920 et 1950, fondé par John Watson et basé sur la conviction que les comportements peuvent être mesurés, formés et modifiés. Le comportement peut se résumer à la citation suivante de Watson, considéré comme le "père" de ce courant psychologique:

« Donne-moi une douzaine de nourrissons en bonne santé, bien formés, de sorte que vous pouvez les éduquer, et je vous promets de choisir un au hasard et le former pour en faire un tout spécialiste, je peux choisir: médecin, avocat, artiste, homme d'affaires, mendiant ou voleur, indépendamment de son talent, de ses inclinations, de ses tendances, de ses aptitudes, de ses vocations et de la race de ses ancêtres ».

John Watson, Behaviorism, 1930.

Selon les principes du comportementalisme, tous les comportements sont tirés de l’environnement dans lequel nous évoluons. Les behavioristes ne croyaient pas aux déterminations biologiques.

De plus, ils étaient surtout préoccupés par des comportements qui pourraient être observés et croyaient qu'il y avait beaucoup de différence entre l'apprentissage qui se déroule chez l'homme et qui se produit chez les animaux.

Comment le comportementalisme a-t-il commencé?

Pavlov médicale russe a été le premier à étudier les théories de behaviorisme dans les années 1890 le conditionnement pavlovien classique a été découvert par hasard, quand il a découvert dans une expérience sur la digestion de leurs chiens, ils salivé quand il est entré dans la chambre , sans même apporter de la nourriture avec lui.

Pavlov et chien

En résumé, le conditionnement classique implique l'apprentissage qui associe un stimulus inconditionné qui apporte une réponse par défaut dans le corps (par exemple, réfléchissant) avec un nouveau stimulus, de sorte que celui-ci porte également la même réponse.

Cette théorie a ensuite été développé par Watson (1913), qui était le psychologue américain qui a fondé l'école behavioriste de la psychologie, a publié un article intitulé « Psychologie comme comportementaliste voit ». Plus tard, il a conditionné un enfant à craindre un rat blanc.

Thorndike, psychologue et éducateur américain, a officialisé le terme « loi de l'effet » en 1905. En 1936, Skinner, psychologue américain qui fait le véritable objet de cet article, publié « Le comportement des organismes » et a présenté les concepts du conditionnement opérant et de la modélisation.

Comportementnisme selon Burrhus Frederic Skinner

Source: emaze.com.

Le travail de Skinner a ses racines dans la vision du conditionnement classique comme quelque chose trop simple pour être une explication complète du comportement humain complexe. Skinner croyait que le meilleur moyen de comprendre le comportement humain était de vérifier les causes d’une action et ses conséquences. Il a appelé cette approche "conditionnement opérant".

Le conditionnement opérant concerne l'opérateur: les actions intentionnelles ayant un effet sur l'environnement qui nous entoure.Skinner a commencé à identifier les processus qui rendaient plus ou moins probable l'apparition de certains comportements opérants.

La théorie de Skinner sur le conditionnement opérant est basée sur les travaux de Thorndike (1905). Edward Thorndike a étudié l'apprentissage chez les animaux en utilisant un casse-tête pour proposer la théorie connue sous le nom de "loi de l'effet".

Le conditionnement opérant de Skinner

Comme nous l'avons dit, Skinner est considéré comme le père du conditionnement opérant, mais son travail est basé sur la loi de l'effet de Thorndike. Skinner a introduit un nouveau terme dans la loi de l'effet: le renforcement. Le comportement renforcé a tendance à se répéter; un comportement qui n'est pas renforcé a tendance à disparaître (affaiblit).

Skinner a étudié le conditionnement opérant en effectuant des expériences sur des animaux, qu'il a placées dans une "boîte Skinner", semblable à la boîte à puzzle de Thorndike.

Skinner a inventé le terme "conditionnement opérant", qui consiste à modifier un comportement en utilisant des renforts donnés après la réponse souhaitée. Skinner a identifié trois types de réponses ou d'opérants pouvant suivre le comportement:

  • Opérateurs neutres Ce sont des réponses de l'environnement qui n'augmentent ni ne diminuent la probabilité que le comportement se répète.
  • Ces réponses augmentent la probabilité que le comportement se répète. Les renforts peuvent être positifs ou négatifs.
  • Ce sont des réponses qui diminuent la probabilité qu'un comportement se répète; les punitions affaiblissent le comportement en question.

Nous avons tous connu des exemples de comportements qui ont été affectés par des renforts et des punitions. Lorsque nous étions enfants, par exemple, si nous parlions pendant un cours, le professeur nous a dit de nous taire. Cette réponse de l'enseignant est une punition qui, au moins supposément, devrait affaiblir le comportement de parler avec le camarade de classe pendant les cours.

Pendant l'adolescence, par exemple, le fait de porter un style particulier ou une marque de vêtement pourrait être renforcé positivement par des pairs du même âge à travers la flatterie, l'acceptation sociale ou simplement un geste aimable. Cela renforce et rend plus susceptible de répéter le comportement de porter un certain vêtement de marque.

Renforcement positif

Chercheurs avec boîte Skinner et pigeon.

Skinner a démontré comment le renforcement positif fonctionne en plaçant un rat affamé dans sa boîte Skinner. La boîte contenait un levier d'un côté et le rat, alors qu'il se déplaçait à travers la boîte, appuyait accidentellement sur le levier. Immédiatement, un granule de nourriture est tombé dans un petit récipient à côté du levier.

Les rats ont rapidement appris à aller directement au levier après avoir été plusieurs fois dans la boîte. La conséquence de la réception de la nourriture s'ils appuyaient sur le levier leur assurait de répéter le comportement encore et encore.

Le renforcement positif renforce un comportement en fournissant une conséquence que l'individu considère comme enrichissante. Par exemple, si votre enseignant vous donne de l'argent chaque fois que vous terminez vos devoirs, vous êtes plus susceptible de répéter le comportement de devoir à l'avenir, en renforçant ce comportement.

Renforcement négatif

L'élimination d'un renforcement désagréable peut également renforcer un certain comportement. C'est ce qu'on appelle le renforcement négatif, car c'est l'élimination d'un stimulus indésirable qui est "gratifiant" pour la personne ou l'animal. Le renforcement négatif renforce le comportement car il arrête ou élimine une expérience désagréable.

Par exemple, lorsque vous avez mal à la tête, vous prenez une aspirine pour la soulager. Le fait que la douleur disparaisse est un renforcement négatif du comportement de la prise d’aspirine, ce qui la rend plus susceptible de se reproduire à l’avenir si vous avez mal à la tête.

Skinner a étudié le fonctionnement du renfort négatif en plaçant un rat dans sa boîte Skinner et en l'exposant à un courant électrique désagréable qui lui causait un certain inconfort. Cette fois, le levier de la boîte a provoqué l'arrêt du courant électrique.

Les rats, au début, ont appuyé par inadvertance sur le levier, mais ont rapidement appris à appuyer pour arrêter le courant électrique. La conséquence de l’évasion du courant était de faire en sorte qu’ils répètent l’action chaque fois qu’ils étaient placés dans la boîte ou chaque fois qu’ils ressentaient l’électricité.

En fait, Skinner a appris aux rats à éviter même le courant électrique en allumant une lumière juste avant l'apparition du courant électrique. Les rats ont rapidement appris à appuyer sur le levier lorsque la lumière était allumée, car ils savaient que cela empêcherait le courant électrique d'être activé.

Ces deux réponses apprises sont appelées "apprentissage par évasion" et "apprentissage par évitement".

Punition

La punition est définie comme l'opposé du renforcement, car elle est conçue pour affaiblir ou éliminer une réponse au lieu d'augmenter sa probabilité. C'est un événement aversif qui diminue le comportement qui suit.

Comme dans le cas du renforcement, la punition peut fonctionner soit directement en appliquant un stimulus désagréable, tel qu'un choc électrique après une réponse, soit en éliminant un stimulus potentiellement gratifiant.

Par exemple, réduire l’argent d’une personne pour punir des comportements indésirables. Il est nécessaire de souligner qu'il n'est pas toujours facile de faire la distinction entre les punitions et les renforts négatifs.

Il y a plusieurs problèmes lors de l'utilisation des punitions, tels que:

  • Le comportement puni n'est pas oublié, il est supprimé. Ce comportement revient lorsque la punition n'est pas présente.
  • La punition peut entraîner une augmentation de l'agressivité. Cela peut montrer que l'agressivité est un moyen de gérer les problèmes.
  • Les punitions créent une peur qui se généralise aux comportements indésirables, par exemple la peur d'aller à l'école.
  • Souvent, la punition ne modélise pas le comportement par rapport au but recherché. Le renfort vous dit quoi faire, alors que la punition ne vous dit que ce qu'il ne faut pas faire.

Comportements de modélisation

Une autre contribution importante de Skinner est la notion de modélisation comportementale par approximations successives. Skinner soutient que les principes du conditionnement opérant peuvent être utilisés pour produire un comportement extrêmement complexe si les récompenses et les punitions sont effectuées de manière à encourager l’organisme en question à se rapprocher du comportement souhaité.

Pour que ce résultat se produise, les conditions (ou imprévus) requises pour recevoir la récompense devraient changer chaque fois que l'organisme fait un pas pour être plus près du comportement souhaité.

Selon Skinner, la plupart des comportements humains (y compris le langage) peuvent être expliqués comme un produit de ce type d'approximation successive.

Modification du comportement

La modification du comportement est un ensemble de thérapies ou de techniques basées sur le conditionnement opérant. Le principe de base est de changer les événements environnementaux liés à un certain comportement d'une personne. Par exemple, renforcer les comportements souhaités et ignorer ou punir les indésirables.

Cependant, ce n'est pas aussi simple que cela en a l'air. Renforcer toujours un comportement souhaité, par exemple, consiste essentiellement à corrompre quelqu'un.

Il existe plusieurs types de renforcement positif. Le renforcement primaire se produit lorsqu'une récompense renforce seul un comportement. Le renforcement secondaire se produit lorsque quelque chose renforce un comportement car il conduit à un renforcement primaire.

Applications pédagogiques pratiques

Dans la situation d'apprentissage conventionnelle, le conditionnement opérant est appliqué à des sujets liés aux salles de classe et à l'étude, au lieu d'être appliqué au contenu lié à l'apprentissage.

En ce qui concerne l’application pédagogique de la modélisation comportementale, un moyen simple de modéliser un comportement est de fournir retour d'expérience (feedback) concernant la performance de l'apprenti (par exemple, compliments, signes d'approbation, encouragement).

Par exemple, si un enseignant souhaite encourager ses élèves à répondre aux questions en classe, il devrait les féliciter à chaque tentative, que la réponse soit correcte ou non. Peu à peu, l'enseignant ne félicitera les élèves que lorsque leurs réponses seront correctes et, avec le temps, seules les réponses exceptionnelles seront louées.

Les comportements indésirables, tels que les retards à l'arrivée en classe et les discussions en classe dominantes, peuvent être éteints en étant ignorés par l'enseignant, au lieu d'être renforcés en attirant l'attention de l'enseignant sur ces comportements.

Savoir que vous avez réussi est également important, car cela motive l'apprentissage futur. Cependant, il est important de varier le type de renforcement fourni afin de maintenir le comportement. Ce n'est pas une tâche simple, car le professeur peut sembler malhonnête s'il pense trop à la manière dont il devrait se comporter lorsqu'il fait l'éloge d'un élève.

Autres applications pratiques et évaluation critique

Le conditionnement opératoire peut être utilisé pour expliquer un grand nombre de comportements, du processus d'apprentissage à la dépendance et à l'acquisition du langage. Il a également des applications pratiques, telles que celles que nous avons décrites précédemment, et dans les prisons, les hôpitaux psychiatriques et les sciences économiques.

En économie, une application connue du conditionnement opérant est l'économie de jeton, un système par lequel la personne reçoit des jetons juste après avoir effectué un comportement souhaité. Les jetons sont collectés puis échangés contre un objet important pour l'individu.

L'utilisation de la recherche animale sur le conditionnement opérant soulève également la question de l'extrapolation des résultats.

Certains psychologues affirment que nous ne pouvons pas généraliser au comportement humain des résultats de recherche avec des animaux, car leur anatomie et leur physiologie sont différentes et ne peuvent pas réfléchir à leurs expériences ni invoquer la raison, la patience et la mémoire en tant qu'êtres humains.