Prévia do material em texto
Reforçamento Positivo e Extinção Profa: Marília Santana Texto de referência: Moreira (2007, Cap. 3) Análise Experimental do Comportamento Breve revisão dos processos básicos do comportamento Textos de referência: Matos (1995), Meyer (1997) e Souza (1997) Adaptado de Profa: Raquel Maria de Melo e Diogo Bloes Chagas O paradigma de análise AÇÃO HUMANA Condições estimuladoras iniciais Condições estimuladoras finais 2Roosevelt R. Starling O paradigma de análise AÇÃO HUMANA Chora, sonha, reclama, imagina, briga, tem medo... O que o cliente FAZ? SINAIS E SINTOMAS CLASSES DE RESPOSTAS 3Roosevelt R. Starling l Classes de respostas que produzem conseqüências aversivas para a pessoa; l Classes de respostas que impedem ou dificultam o acesso a reforçadores para a pessoa e/ou seu ambiente; l Relacionam-se queixas específicas com o repertório do cliente em sua interação com o ambiente funcional físico, histórico e sócio- verbal. Problemas de Comportamento 4Roosevelt R. Starling Multideterminação do comportamento o A análise do comportamento adota o modelo de seleção pelas consequências o O comportamento é produto de diferentes histórias o Filogenética o Ontogenética o Cultural o Comporta-se, implica em aprender comportamentos Aprendizagem: Análise do Comportamento § Mudança de comportamento resultante de prática ou experiência (interações organismo-ambiente). § Diferentes relações entre eventos ambientais e eventos comportamentais. § Eventos ambientais: Estímulos do ambiente externo (físico e sociais) e do próprio organismo (produção de hormônios, taquicardia). § Eventos comportamentais: Ações, sensações, pensamentos. Aprendizagem: Análise do Comportamento § Condicionamento: Procedimento e Processo de aprender relações entre mudanças ambientais e mudanças no comportamento § Categorias de Comportamentos: ü Comportamento Respondente (Reflexos: E-R) ü Comportamento Operante (Seleção pelas consequências) Processo de aprendizagem de associações entre estímulos (1927) Condicionamento Respondente Condicionamento Respondente: O experimento de Watson Condicionamento Respondente: O experimento de Watson Generalização respondente Contracondicionamento Substituição de uma RC por uma resposta incompatível Exemplo: Peter e o Coelho (Watson e Jones) EC (Coelho) à RC (“Medo”) EI (Alimentos, brinquedos) à RI (Sentimentos de conforto). Após emparelhamento e dessensibilização sistemática: EC (Coelho) à RI (Conforto e tranqüilidade). Condicionamento Respondente: Ex § Detector de mentiras: §Identifica mudanças na condutividade da pele “quando o indivíduo mente” § Relação US ð UR § US (repreensão verbal; agressão física) ð UR (taquicardia, sudorese0 § Sudorese: Aumenta a condutividade elétrica da pele § NU (Mentira) + US (repreensão verbal; agressão física) § Relação E ð R aprendida § CS (mentira) ð CR (taquicardia, sudorese) § Efetividade do detector de mentiras x fatores relevantes para o condicionamento respondente § Palavras tem “carga emocional”? § Como as palavras passam a eliciar emoções? o “Sd” - Eventos (ou condições) antecedentes. O que está presente quando o comportamento ocorre o “:” - Estabelece a ocasião para .. o “R” - Resposta o “Conseq” - Conseqüências, alterações no ambiente (externo ou interno) produzidas pelo comportamento Sd : R - Conseq. A relação de dependência entre eles é denominada de Contingência Condicionamento Operante Contingência, contiguidade e não contingência o Contingência o Contiguidade: Justaposição de eventos no tempo e/ou espaço (ex: tocar o telefone e ganhar o jogo) o Eventos não contingentes: sem relação de dependência entre eles (Ex: Fumar e chuva) Exercício o Depois que Ana termina a tarefa de casa ela tem permissão de usar o computador. o R: Contingência o Já é a segunda vez que você entra na sala e logo depois meu time leva gol. o R: Contiguidade Reforçamento 4 Algumas consequências aumentam a probabilidade de o comportamento voltar a ocorrer SA: R è Conseq REFORÇO é um tipo de consequência do comportamento que aumenta a probabilidade de o comportamento voltar a ocorrer § Reforçamento Positivo: §Refere-se a apresentação de um evento reforçador positivo contingente a uma resposta. SA: R Ò SR+ §Reforçamento Negativo: §Refere-se a remoção ou adiamento de um estímulo aversivo (ou reforçador negativo - SR-) imediatamente após a resposta ser emitida SA: R Ò SR- Estímulos Antecedentes / Comportamento Multicontingenciado 4 As respostas não são contingenciadas apenas por suas consequências, mas também por seus estímulos antecedentes 4 Comportamento multicontingenciado: cada resposta pode estar sob controle de vários eventos antecedentes e conseqüentes Eficácia do Reforço: o reforço é sempre reforçador? 4 Contingência: reforço apresentado como consequente (aprender que é necessário emitir a resposta para adquirir o reforçador) 4 Rapidez: quanto mais rápido é apresentado o reforçador após a emissão da resposta, maior a probabilidade de aumento da frequência 4 Quantidade: número de apresentações do reforçador até a saciedade 4 Privação: quantidade de tempo que passou desde a última vez que o sujeito recebeu o reforçador 4 Música alta: reforçador para alguns, aversivo para outros 4 Para afirmar que um estímulo é reforçador, devemos concentrar- nos em sua relação com o comportamento 4 Características físicas ou a natureza não servem para qualificar o estímulo 4 Comida: quando com fome = reforçador; quando saciado, pode ser aversiva Efeitos do Reforço 4 Diminuição da frequência de ocorrência de outros comportamentos diferentes daquele reforçado 4 Se você está em um bar, olhando as pessoas que por lá passam, bebendo, comendo e falando sobre um determinado assunto (comportamento analisado), e alguém começa a prestar muita atenção no que você está falando (reforço), é provável que você coma menos, beba menos, observe menos o movimento no bar e passe mais tempo conversando 4 No esporte, caso um determinado movimento (R) resulte em ponto, diminui a variabilidade da topografia da resposta 4 Diminuição da Variabilidade da Topografia da Resposta Punição 4 Algumas consequências diminuem a probabilidade de o comportamento voltar a ocorrer SA: R è Conseq É um tipo de consequência do comportamento que diminui a probabilidade de o comportamento voltar a ocorrer § Punição Positiva: §Um estímulo aversivo (SR- ou punidor) é apresentado contingente à ocorrência de uma resposta. SA: R Ò SR- §Punição Negativa: §Remoção ou retirada de um evento reforçador positivo (SR+) contingente a ocorrência de uma determinada resposta. SA: R Ò SP-Consequência: Remoção de SR+Consequência: Apresentação de SR- 4 A extinção respondente consiste em apresentar o estímulo condicionado sem a ocorrência do estímulo incondicionado – perda da relação entre estímulos Extinção Respondente Extinção Respondente Extinção Operante 4 Sempre que uma resposta anteriormente reforçada for emitida continuamente sem ser seguida de reforçamento, sua probabilidade de ocorrência decresce 4 Quando se suspende o reforçador (procedimento), o comportamento volta a seu nível operante (processo) – a freqüência do comportamento retorna aos níveis de antes do comportamento ter sido reforçado 4 Procedimento de extinção do comportamento operante: suspensão do reforço 4 Processo de extinção do comportamento operante: gradual diminuição da freqüência do comportamento Os efeitos do reforço são temporários (pode haver episódios de recuperação espontânea) 4 Aumento na freqüência de resposta no início do processo de extinção: antes de a freqüência da resposta começar a diminuir, ela aumenta abruptamente 4 Aumento na variabilidade da topografia (forma) da resposta: no início do processo de extinção, a forma como o comportamento estava sendo emitido começa a modificar-se 4 Eliciação de respostas emocionais: raiva,ansiedade, irritação, frustração Efeitos da Extinção CONTROLE AVERSIVO Refere-se ao uso de eventos aversivos para influenciar, modificar, o comportamento dos indivíduos. Estímulo Aversivo (ou reforçador negativo – SR-): Refere-se a eventos cuja ocorrência o indivíduo procura evitar ou se estiverem presentes, o indivíduo procurará remover ou atenuá-los. É definido funcionalmente, em termos do efeito sobre o comportamento O que é ou não aversivo pode variar de indivíduo para indivíduo Classificação a) Estimulo aversivo primário : A resposta a eles é independente de aprendizagem. Ex: Choque, calor intenso b) Estimulo aversivo secundário: Adquire propriedade aversiva devido a história de emparelhamento com eventos que já são aversivos. Ex: Repreensão verbal; expressão facial de desaprovação a) Comportamento de Fuga: É o comportamento que tem como efeito o término, remoção ou atenuação do estímulo aversivo (SR+) CONTROLE AVERSIVO Som alto Desligar o som Eliminação do barulho SA (SR- presente) Comportamento Consequência Aula maçante Divagar, desenhar Eliminação da “aula” b) Comportamento de Esquiva: É o comportamento que tem como efeito o adiamento da ocorrência do estímulo aversivo (SR-) SR- ausente; Sinal do SR- Comportamento de esquiva Evita SR- Aviso: “Prof. Carrasco” Matrícula em outra turma Evita reprovação CONTROLE AVERSIVO Efeitos Colaterais da Punição a) Pode gerar comportamentos de Fuga e Esquiva (contracontrole). Ex: Aluno exposto a muitos estímulos aversivos b) Estímulos aversivos intensos podem causar lesões físicas e alterações emocionais c) Pode ocorrer condicionamento respondente de respostas emocionais ao agente punidor d) Respostas agressivas (verbal ou física) podem ser aprendidas por observação) e) Os estímulos aversivos podem eliciar um contra-ataque aversivo f) Punição severa pode suprimir tanto comportamentos inadequados como adequados Condições que influenciam a efetividade da Punição: § Apresentação imediata da consequência e punição de cada ocorrência da resposta § Uso do estímulo aversivo com intensidade máxima (sem aumento gradual) § Descrição da contingência de punição § Treinamento de uma resposta alternativa Princípios de Aprendizagem Apresentação Reforçador Positivo (SR+) Reforçamento Positivo Efeito sobre a Resposta: Aumenta probabilidade futura Procedimento/ Estímulo Remoção Reforçamento Negativo Reforçador Negativo (SR-) Punição Positiva Punição Negativa Efeito sobre a Resposta: Diminui probabilidade futura Controle de Estímulos Ø Efeito que os estímulos antecedentes exercem sobre o comportamento. Ø Evidência de controle de estímulo: A probabilidade da resposta é alta na presença do estímulo diante do qual ela foi repetidamente reforçada e baixa na sua ausência. Ø Temas estudados: Discriminação simples e condicional, generalização, encadeamento de respostas, aprendizagem sem erro, conceitos e atenção. Ø SD (ou S+): Estímulo discriminativo ou correlacionado com o reforço. Ø SD (S Delta ou S-): Estímulo correlacionado com ausência de reforço ou apresentação do SR- (S avers.). Ø O SD não elicia comportamento operante; estabelece a condição para a emissão da resposta; e sinaliza a classe de respostas com probabilidade de reforço. Inclui o ambiente físico (espaço físico, objetos, etc.), o ambiente social (pessoa ou pessoas presentes), o ambiente temporal (horário, mês) e o ambiente orgânico. Controle de Estímulos Controle de Estímulos: Exemplos Estímulo Antecedente Comportamento Conseqüência Fazer pergunta Pessoa responde SD (Presença de 1 pessoa) Fazer pergunta Pessoa responde SD (Ausência de pessoas) Dia 1 “Pai, me empresta o carro?” “Pode pegar a chave” Dia 2 “Pai, me empresta o carro?” “Nããããooo ...!” 2. Generalização Ø Refere-se a emissão de uma resposta anteriormente reforçada na presença de um estímulo discriminativo (ou de uma de suas dimensões), diante de novos estímulos. Exemplos: Controle de Estímulos SA (SDs) Comportamento Consequência-SR+ Dizer “triangulo” Elogio Ø Encadeamento, cadeia de respostas, sequência de respostas ou cadeias comportamentais § Definição: Uma seqüência de respostas e estímulos discriminativos (SD), onde cada resposta produz uma consequência (SR+) que funciona também como SD para a próxima resposta § Exemplos: Ir ao cinema, cozinhar, ler, escrever, realizar uma operação matemática e balancear uma equação química. Encadeamento § Procedimento que envolve reforçamento diferencial de aproximações sucessivas à resposta final a ser ensinada. § Possibilita a aquisição de novos e diferentes comportamentos. Modelagem Resposta Inicial Rn R1 R3 R2 Resposta Final Pronúncia correta Ex: Paciente com esquizofrenia catatônica Whaley e Malott (1980) Æ Esvanecimento (fading): São efetuadas mudanças graduais em uma dimensão do estímulo (intensidade da cor, tamanho) de tal modo que este venha a se assemelhar ao estímulo alvo. Æ Partiu da discriminação de cor (inicial) Æ Discriminação final: disposição de letras Esvanecimento Bete Suzy SD R R SR+ SR+ Etapa 2 Bete Suzy Bete SuzyBete Suzy Bete Suzy Bete Suzy Bete SuzySe qu ên ci a de m ud an ça s g ra du ai s d o SD SD Esvanecimento Esquemas de Reforçamento • Esquemas de reforçamento: São regras que descrevem as diversas maneiras pelas quais as consequências (ex: reforçadores positivos) seguem o comportamento • Critério para programação das consequências • Os esquemas de reforçamento podem ser divididos em: – Esquemas de Reforçamento Contínuo (CRF) – Esquemas de Reforçamento Intermitente SA: R è SR+ SA: R è SR+ SA: R è SR+ SA: R è SR+ SA: R è SR+CRF SA: R è SR+ SA: R è SR+ Intermi tente SA: R è SR+ SA: R è SR+ SA: R è SR+ Os principais esquemas de reforçamento intermitente n Esquemas de razão: A consequência é apresentada após a ocorrência de um determinado número de respostas. Exemplo: n A cada dez ingressos que eu vendo ganho um. n Esquemas de intervalo: A consequência é apresentada se a resposta for emitida após ter transcorrido um determinado período de tempo. Ex: n No dia X as YY hs, ligar a TV e assistir Os Simpsons Esquemas de Razão n Razão Fixa (RF ou, no inglês, FR – Fixed Ratio): A consequência é apresentada após um número fixo e invariável de respostas (Razão: Número de respostas para cada consequência). Exemplo: n Na confeitaria em que trabalha, Joana recebe R$ 5,00 de comissão a cada 100 salgados que vende n Análise do exemplo: n SA: Confeitaria, cliente; R: Vender; SR+: R$ 5,00 de comissão n Relação entre R e SR+: Depende do número fixo de respostas n Logo, o esquema é RF n Razão Variável (RV ou, no inglês, VR - Variable Ratio): A consequência é apresentada após um número variável de respostas. O número de respostas varia em torno de um valor médio. Exemplo: n Uma diarista que trabalha em diferentes casas. Na primeira casa ela precisa arrumar 6 cômodos, na segunda 7, na terceira 4 e na quarta 3. Em cada casa, ela arruma quantidades diferentes de cômodos pelo mesmo preço. Ela recebe R$ 60,00 por diária. n Análise do exemplo: n SA: Casa, Dona da casa; R: “Arrumar cômodos”; SR+: R$ 60,00 n Relação entre R e SR+: Depende do número variável de respostas n Logo, o esquema é RV 5 (6,7,4,3: 20/4 = 5) n A consequência é apresentada após serem satisfeitas duas condições: (1) Deve ter transcorrido determinado intervalo de tempo desde o reforço anterior; e (2) A resposta que será seguida pela consequência deve ocorrer após o intervalo Esquemas de intervalo n Intervalo Fixo (IF ou, do inglês, FI- Fixed Interval): A primeira resposta correta, após um intervalo fixo de tempo, é seguida pelo consequência. n Exemplos (Fazer a análise funcional): n Ligar a TV todo dia às 20:15 no horário do Jornal Nacional (IF 24 horas) n Esperar pelo ônibus que passa no ponto a cada 15 minutos (IF 15 minutos) n Esperar o sinal vermelho do semáforo mudar para verde (IF 3 minutos) n Intervalo Variável(IV ou, no inglês, VI – Variable Innterval): A resposta é seguida pela consequência após um período de tempo variável desde a apresentação da última consequência. O valor sempre será dado sob uma medida média. Exemplo: n Uma pessoa que precisa se deslocar periodicamente entre andares de um prédio esperará tempos diferentes pelo elevador dependendo do andar que este se encontra n Análise do exemplo: n SA: Elevador indisponível; R:Apertar o “botão de acesso”; SR+: Elevador disponível n Relação entre R e SR+: Depende do tempo para o elevador percorrer diferentes distâncias, Logo, o esquema é de IV Efeitos dos esquemas sobre o comportamento n Frequência de respostas: Os esquemas intermitentes produzem um responder mais freqüente que os esquemas de reforçamento contínuo: n Apenas algumas respostas são reforçadas exigindo uma constância no responder n A saciação ocorre mais lentamente nestes esquemas n Aquisição e manutenção do comportamento: O reforçamento contínuo favorece a instalação de novos comportamentos, mas a manutenção é atribuída aos esquemas intermitentes Dúvidas??? ?