Definição, características e exemplos do condicionamento operante



O condicionamento operante o O condicionamento instrumental é um tipo de aprendizado em que o comportamento é controlado com conseqüências.

Baseia-se na ideia de que os comportamentos de reforço tendem a aparecer em mais ocasiões, enquanto os comportamentos que são punidos são extintos.

Qual é a diferença entre o condicionamento operante e o condicionamento clássico? No condicionamento operante, uma resposta voluntária é seguida por um reforçador. Dessa forma, a resposta voluntária (por exemplo, estudar para um exame) é mais provável de ocorrer no futuro. Pelo contrário, no condicionamento clássico, um estímulo ativa automaticamente uma resposta involuntária.

O condicionamento operante pode ser descrito como um processo que tenta modificar o comportamento através do uso de reforços positivos e negativos. Através do condicionamento operante, um indivíduo faz uma associação entre um comportamento particular e uma conseqüência. Exemplos:

  • Os pais recompensam boas notas por uma criança com doces ou alguma outra recompensa.
  • Um professor recompensa aqueles alunos que são calmos e educados. Os alunos percebem que, ao se comportarem assim, recebem mais pontos.
  • Um alimento é dado a um animal toda vez que uma alavanca é pressionada.

B.F. Skinner (1938) cunhou o termo condicionamento operante. Skinner identificou três tipos de respostas ou operandos que podem seguir o comportamento:

  • Operadores neutros: respostas do ambiente que não aumentam ou diminuem a probabilidade de um comportamento se repetir.
  • Reforçadores: respostas do ambiente que aumentam a probabilidade de repetição de um comportamento. Reforçadores podem ser positivos ou negativos.
  • Punições: respostas do ambiente que diminuem a probabilidade de um comportamento se repetir. Punição enfraquece o comportamento.

Antecedentes do condicionamento operante

Thorndike foi o primeiro a reconhecer que esse condicionamento inclui mais do que apenas uma resposta e um reforçador. A resposta é dada na presença de certos estímulos, considerando-se três eventos: o estímulo, a resposta e a conseqüência da resposta ou reforçador.

Essa estrutura facilita o desenvolvimento de diferentes elos, como a associação entre o estímulo e a resposta, que foi para Thorndike a chave para a formulação da lei do efeito. Com isso, afirmou que as respostas que são seguidas por reforços de consequências serão mais prováveis ​​de ocorrer quando o estímulo reaparecer.

Pelo contrário, aquelas respostas que são seguidas por consequências negativas terão uma menor probabilidade de ocorrência quando o estímulo reaparecer. A lei do efeito é o antecedente do condicionamento operativo ou do condicionamento instrumental, como foi nomeado por Thorndike.

Mas para Skinner, psicólogo comportamental, o condicionamento foi o fortalecimento de comportamentos de acordo com as consequências que anteriormente teriam sido obtidas.

Nesta linha, existem duas formas de condicionamento:

  • O clássico ou pavloviano: baseia-se na associação de estímulos incondicionados e condicionados, sendo as respostas controladas por estímulos antecedentes.
  • Condicionamento operante: o estímulo conseqüente ou reforçador faz com que determinado comportamento seja emitido. Skinner explica que, se o comportamento for seguido por um reforçador positivo, aumentará a probabilidade de tal conduta ser emitida no futuro. Pelo contrário, se uma resposta não for seguida por um reforçador ou se o reforçador for negativo, a probabilidade de emitir o dito comportamento no futuro será menor.

Conceitos básicos de condicionamento operante

Reforço

É responsável pela emissão de respostas, ou seja, a probabilidade de sua ocorrência, seja ela maior ou menor no futuro. É um estímulo reforçador e consistente, uma vez que ocorre quando a resposta ocorre.

É impossível saber se um determinado reforçador influencia o comportamento até que seja apresentado de forma contingente a uma resposta e verifica-se que o comportamento muda como conseqüência do reforçador.

Existem dois tipos de reforço: positivo e negativo. Ambos têm o mesmo propósito de aumentar a probabilidade de que a resposta seja emitida em situações futuras. Além disso, os reforçadores de Skinner são definidos por meio de comportamentos observáveis ​​e mensuráveis.

Reforço positivo

Reforço positivo reforça um comportamento, fornecendo uma conseqüência que um indivíduo encontra gratificante.

Reforço Negativo

A remoção de um reforçador desagradável também pode fortalecer um comportamento. Isso é chamado de reforço negativo porque é a eliminação de um estímulo adverso que é "recompensador" para o animal ou para a pessoa. Reforço negativo reforça o comportamento porque interrompe ou elimina uma experiência desagradável.

Reforçadores Primários

Eles seriam todos aqueles reforçadores básicos que não precisam de nenhuma história de condicionamento prévio para funcionar como tal. Alguns exemplos seriam água, comida e sexo.

Reforços secundários

Os reforçadores secundários seriam baseados em histórias prévias de condicionamento, graças à associação com estímulos incondicionados.Alguns exemplos seriam dinheiro e qualificações.

Contingência de três termos

É o modelo básico do condicionamento operante e consiste em três componentes: o estímulo discriminativo, a resposta e o estímulo reforçador.

Um estímulo discriminativo seria aquele que indicaria ao sujeito que o reforçador está disponível, indicando que se ele realizar um determinado comportamento ele pode obter o dito reforçador. Em contraste, temos o estímulo delta ou estímulos que indicam que o comportamento não levará à obtenção de nenhum tipo de reforçador.

A resposta seria o comportamento que o sujeito irá realizar, cuja execução levará ou não para obter o estímulo reforçador.

Um estímulo reforçador, como mencionado acima, é responsável pela emissão do comportamento, uma vez que, graças à sua aparência, a probabilidade de emitir uma resposta aumentará ou diminuirá no futuro.

Conceitos para saber sobre o condicionamento operante

Castigo

A punição também é medida pelos seus efeitos no comportamento do sujeito. Por outro lado, ao contrário do reforço, o que se pretende é a redução ou supressão de um determinado comportamento.

Uma punição reduz a probabilidade de emitir um comportamento em situações posteriores. No entanto, isso não elimina a resposta, porque se a ameaça de punição diminuir, o comportamento pode reaparecer.

Na punição há também dois tipos ou procedimentos diferentes, punição positiva e punição negativa.

Punição positiva

Isso envolve a apresentação de um estímulo aversivo após a realização de um determinado comportamento. É dado contingentemente à resposta dada pelo sujeito.

Punição negativa

Consiste na eliminação de um estímulo como consequência de um determinado comportamento, isto é, consiste na retirada de um estímulo positivo após a realização de um determinado comportamento.

Extinção

Na extinção, uma resposta é interrompida porque o reforçador não aparece mais. Este processo baseia-se em não fornecer o reforçador correspondente que se espera alcançar e que fez com que esse comportamento fosse mantido ao longo do tempo.

Quando uma resposta é extinta, o estímulo discriminativo torna-se um estímulo de extinção. Esse processo não deve ser confundido com o esquecimento, que é dado quando a força de um comportamento diminui quando ele não é emitido em um período de tempo.

Generalização

Quando confrontado com uma situação ou estímulo específico, uma resposta é condicionada, o que pode aparecer antes de outros estímulos ou situações similares.

Discriminação

Esse processo é o oposto do da generalização, responde de maneira diferente de acordo com o estímulo e o contexto.

Programas de reforço

Skinner também estabeleceu vários programas de reforço, incluindo programas de reforço contínuo e programas de reforço intermitente.

Programas de reforço contínuo

Eles são baseados no constante reforço da resposta a cada vez que é apresentado, ou seja, cada vez que o sujeito realiza o comportamento desejado, ele ou ela obterá um estímulo reforçador ou positivo.

Programas de reforço intermitente

Em contraste, aqui o sujeito nem sempre obtém o reforçador ao executar o comportamento desejado. Estes são definidos com base no número de respostas dadas ou no intervalo de tempo entre as respostas, dando origem a procedimentos diferentes.

Programas de taxa fixa

Nesses programas, o reforçador é fornecido quando o sujeito gera respostas fixas e constantes. Por exemplo, em um programa de razão 10 a pessoa obtém o reforçador depois de ter feito dez respostas quando o estímulo é apresentado.

Programas de relação variável

Isto é construído como o anterior, mas neste caso o número de respostas que o sujeito deve dar para obter o reforçador é variável.

O reforçador continuaria a depender do número de respostas emitidas pelo sujeito, mas com uma razão variável, graças à qual o sujeito é impedido de prever quando o reforçador será obtido.

Programas de intervalos fixos

Em programas de intervalo, a obtenção do reforçador não depende do número de respostas que o sujeito dá, mas é determinado pelo tempo decorrido. Consequentemente, a primeira resposta produzida depois de ter passado um certo período de tempo é reforçada.

Em programas de intervalo fixo, o tempo entre reforçador e reforçador é sempre o mesmo.

Programas de intervalo variável

Nesses programas, o reforçador é obtido após um tempo, embora o tempo seja diferente para cada reforçador recebido.

Mudança comportamental

Aproximações sucessivas ou modelagem

A moldagem consiste na mudança comportamental através da moldagem de comportamentos ou o reforço diferencial de abordagens sucessivas.

Uma série de etapas é seguida para moldar um comportamento concreto. Primeiro de tudo, o comportamento inicial que se pretende moldar é identificado para saber qual deles você deseja alcançar.

Então, os possíveis reforçadores que serão utilizados são delimitados e o processo é separado em etapas ou etapas para chegar ao comportamento final, reforçando cada passo ou abordagem sucessiva até chegar ao último.

Com este procedimento dinâmico, ambos os comportamentos e suas conseqüências são transformados. Nesse sentido, as sucessivas abordagens para um comportamento objetivo são reforçadas.

Entretanto, para ser realizado, é necessário partir de um comportamento anterior que o sujeito já realiza, a fim de fortalecer gradativamente seu comportamento até atingir o objetivo.

Corrente

Com ele, um novo comportamento é formado a partir da decomposição em etapas ou sequências mais simples, reforçando cada resposta dada em cada uma das etapas, a fim de levar ao estabelecimento de uma resposta mais complexa no repertório comportamental do sujeito.

Cadeias longas de respostas podem ser formadas usando reforços condicionados, adotando uma unidade funcional cujo estabelecimento leva à aquisição e definição de uma habilidade particular.

Referências

  1. Condicionamento operante. Obtido em wikipedia.org
  2. Condicionamento operante. Retirado de e-torredebabel.com.
  3. Obtido em biblio3.url.
  4. Lei do efeito. Obtido em wikipedia.org.
  5. Extinção Obtido em wikipedio.org.
  6. Domjan, M. Princípios de aprendizagem e comportamento. Paraninfo. 5ª edição.