Prévia do material em texto
EXPERIMENTOS CLÁSSICOS EM ANÁLISE DO COMPORTAMENTO ORGANIZADORES Paulo Guerra Soares João Henrique de Almeida Carlos Renato Xavier Cançado www.walden4.com.br 2016 Instituto Walden4 E71 Experimentos clássicos em análise do comportamento [recurso eletrônico] / organizado por Paulo Guerra Soares, João Henrique de Almeida, Carlos Renato Xavier Cançado. - Brasília : Instituto Walden4, 2016. 333 p. ISBN: 978-85-65721-10-3 1. Psicologia experimental. 2. Análise do comportamento. I. Soares, Paulo Guerra, org. II. de Almeida, João Henrique, org. III. Cançado, Carlos Renato Xavier, org. IV. Título. CDD 150.724 Coordenadora: Seila Cibele Sitta Preto Projeto Gráfico: Leandro Brasil Melo Diagramação: Lorena Shimizu Capa: Lorena Shimizu DEDICATÓRIA Dedicamos esse livro à Profa. Sônia dos Santos Castanheira, ao Prof. Roosevelt Riston Starling, e ao Prof. Ernani Henrique Fazzi, responsáveis por nosso primeiro contato com a Análise Experimental do Comportamento. iii AUTORES E AUTORAS Alina Barboza Cabral Bianco Estudante de Graduação (Psicologia) – Universidade de Rio Verde. André Augusto Borges Varella Doutor em Psicologia – Universidade Federal de São Carlos. Andréia Schmidt Doutora em Psicologia Experimental – Universidade de São Paulo. Armando Domingos Batista Machado Doutor em Psicologia – Duke University, Estados Unidos. Candido Vinícius Bocaiuva Barnsley Pessôa Doutor em Psicologia Experimental – Universidade de São Paulo. Carlos Augusto de Medeiros Doutor em Psicologia – Universidade de Brasília. Carlos Eduardo Costa Doutor em Psicologia Experimental – Universidade de São Paulo. Carlos Renato Xavier Cançado Doutor em Psicologia/Análise do Comportamento – West Virginia University, Estados Unidos. Carolina Coury Silveira Mestre em Psicologia – Universidade Federal de São Carlos. Cristiano Coelho Doutor em Psicologia – Universidade de Brasília. Cristiano Valério dos Santos Doutor em Psicologia Experimental – Universidade de São Paulo. Edson Massayuki Huziwara Doutor em Psicologia Experimental – Universidade de São Paulo. iv Elenice Seixas Hanna Doutora em Psicologia – University of Wales, Reino Unido. Fábio Henrique Baia Doutor em Ciências do Comportamento –Universidade de Brasília. Flávia Hauck Mestre em Ciências do Comportamento –Universidade de Brasília. Hernando Borges Neves Filho Doutor em Psicologia Experimental – Universidade de São Paulo. Hiroto Okouchi Doutor em Ciências do Comportamento – Hiroshima University, Japão. Isabella Guimarães Lemes Estudante de Graduação (Psicologia) – Universidade de Rio Verde. Ítalo Siqueira de Castro Teixeira Graduação em Psicologia – Universidade de Fortaleza. João Claudio Todorov Doutor em Psicologia – Arizona State University, Estados Unidos. João Henrique de Almeida Doutor em Psicologia – Universidade Federal de São Carlos. Kennon A. Lattal Doutor em Psicologia Experimental e Clínica – University of Alabama, Estados Unidos. Lucas Ferraz Córdova Doutor em Ciências do Comportamento –Universidade de Brasília. Marcelo Borges Henriques Mestre em Psicologia – Pontifícia Universidade Católica de Goiás. v Márcio Borges Moreira Doutor em Ciências do Comportamento –Universidade de Brasília. Marco Vasconcellos Doutor em Psicologia – Purdue University , Estados Unidos. Maria Carolina Correa Martone Mestre em Psicologia Experimental – Pontifícia Universidade Católica de São Paulo Marília Pinheiro de Carvalho Doutora em Psicologia Básica – Universidade do Minho, Portugal. Paulo Guerra Soares Mestre em Análise do Comportamento – Universidade Estadual de Londrina. Peter Endemann Doutor em Psicologia Experimental – Universidade de São Paulo. Poliana Ferreira da Silva Estudante de Graduação (Psicologia) – Universidade de Rio Verde. Rafaela Meireles Fontes Azevedo Mestre em Ciências do Comportamento – Universidade de Brasília. William Ferreira Perez Doutor em Psicologia Experimental – Universidade de São Paulo. vi AGRADECIMENTOS “É preciso de uma aldeia inteira para criar uma criança”1. É ver- dade: muito trabalho, de muitas pessoas. Em relação à escrita de um ar- tigo científico, Killeen e Pellón (2013) indicaram que também “É preciso de uma aldeia inteira para criar um artigo”2 (p.19): muito trabalho, cer- tamente de muitas pessoas. O mesmo pode ser dito sobre a organização de um livro. Gostaríamos de agradecer a todas e a todos dessa “aldeia”, cujo trabalho permitiu que esse livro fosse criado. Agradecemos à cada autora e a cada autor dos capítulos que compõem esse livro. Vocês abraçaram o projeto e contribuíram de uma forma que o nosso breve agradecimento não consegue descrever e nun- ca será suficiente. Para vocês, especialmente, o nosso “Muito obrigado”. Agradecemos ao Prof. Alexandre Dittrich pela escolha da capa desse livro e pela escrita do texto que a acompanha. Cientistas são “ar- tistas do mundo natural” e a experimentação é um caminho central de sua atividade. Agradecemos à Profa. Deisy das Graças de Souza por escrever o prefácio e apresentar o livro de forma tão clara à audiência para qual foi escrito. O conselho que ela dá para futuras e futuros ana- listas do comportamento é válido para todas e todos interessados no estudo científico do comportamento, mesmo para quem tem familiari- dade e trabalha há anos com a experimentação. Agradecemos à equipe do Projeto de extensão UneDesign - In- tegração Universidade-Empresa do curso de Desenho Industrial com habilitação em Programação Visual, da Universidade do Norte do Para- ná, coordenada pela Profa. Seila Cibele Sitta Preto, pelo trabalho cuida- 1 It takes a village to raise a child. 2 “It takes a village to raise a paper”. Killeen, P. R., & Pellón, R. (2013). Adjuntive behaviors are operants. Learning & Behavior, 41, 1-24. vii doso em cada etapa da preparação desse livro. Aos discentes Leandro Brasil Melo pelo desenvolvimento do projeto gráfico, e Lorena Shimizu pela diagramação e desenvolvimento projetual de capa. O trabalho foi feito como parte de um projeto de extensão, e retrata a importância da integração das atividades de ensino e pesquisa na relação entre a uni- versidade e as comunidades nas quais está inserida. Por fim, agradecemos ao Prof. Márcio Borges Moreira, que acre- ditou no projeto e aceitou a tarefa de publicação de um livro gratuito e em formato eletrônico pela Editora do Instituto Walden4. É verdade: é preciso de uma aldeia para criar um livro! Paulo Guerra Soares João Henrique de Almeida3 Carlos Renato Xavier Cançado4 3 Apoio da FAPESP (Processo no: 2014/01874-7). 4 Apoio CAPES (PNPD). viii PREFÁCIO ... even though laboratory methods are often devised not for practical teaching but for the study of fundamental behavioral processes, the techniques are then available for application outside the laboratory. Murray Sidman, 1994, P.534 Tomar conhecimento da edição deste livro me deixou particular- mente entusiasmada. É sempre bom contar com material de qualidade como suporte para o ensino e, neste caso, vislumbrei a possibilidade de ter em mãos um material muito compatível com a maneira como gosto de trabalhar nas disciplinas que ministro para o curso de graduação em Psicologia. Segundo me relataram os organizadores, sua proposta era trazer ao leitor experimentos clássicos em análise do comportamento, rela- tados e interpretados por pesquisadores da área, com ênfase em suas contribuições para novas linhas de pesquisa. Gostei imediatamente da proposta e me lembrei de outras ocasiões em que tive oportunidade de explorar artigos de pesquisa como fontes para atividades de ensi- no, buscando propiciar ao aluno condições para o desenvolvimento de uma ampla gama de habilidades, incluindo a busca pelas origens de ideias, conceitos, procedimentos. No período em que estive na UnB, no início da década de 90, tive oportunidade de trabalharcom meu colega Jorge Mendes de Oliveira Castro, na disciplina Psicologia Geral e Experimental (PGE I), para alunos do primeiro semestre do curso de graduação em Psicologia. Discutimos muito as condições de entrada dos alunos no curso, incluindo as possíveis ideias preconcebidas sobre nossa disciplina, e a necessidade de colocá-los logo em contato com o que se estuda em Psicologia e, ao mesmo tempo, mantê-los motivados para ler e estudar o assunto. Concordamos muito rapidamente que, em ix vez de ler livros texto, os alunos poderiam aprender muito lendo arti- gos científicos, mais precisamente, relatos de pesquisa experimental, o que lhes permitiria ter contato com autores importantes da área e conhecer um pouco do desenvolvimento de nossa ciência. Tenho as melhores lembranças das horas e horas que passamos escolhendo os textos (claro que fizemos um levantamento 10 vezes maior do que seria possível abordar em uma disciplina de um semestre) e do entusiasmo com que trabalhamos naquela disciplina, em grande parte motivado pelos progressos dos alunos, evidenciados nas discussões em sala, em suas habilidades de ler e pensar, de utilizar o raciocínio científico, e de se dar conta de que cada experimento pode trazer uma nova contri- buição, mas também pode ter limitações, e que identificar os limites é um caminho para novas ideias e novas possibilidades de investigação. Sentíamos que estávamos criando boas condições para o desenvolvi- mento de pelo menos alguns dos requisitos importantes no repertório de futuros psicólogos e, talvez, pesquisadores em psicologia. Retornando à UFSCar, tive oportunidade de fazer parte da equi- pe que planejou o curso de graduação em Psicologia, implantado em 1994. Novamente me coube uma disciplina introdutória e quando co- mentei sobre a experiência na disciplina da UNB, meu colega Júlio de Rose me apresentou o livro de Roger Hock: “Quarenta estudos que transformaram a Psicologia”. O livro organizava o material em 10 ca- pítulos, cada capítulo apresentando quatro estudos clássicos. A organi- zação apresenta uma característica que resolvia muitos dos problemas que eu encontrara antes, ao exigir de alunos de primeiro semestre a leitura de um estudo experimental em toda a complexidade de seu re- lato original: neste livro, cada estudo é apresentado de maneira resu- mida – isto é, retira detalhes e complexidade do texto, sem deixar de apresentar ao leitor as informações essenciais para a compreensão do x que foi feito e da justificativa para fazê-lo; além disso, o autor do livro apresenta o contexto em que cada investigação foi concebida e con- duzida; e ao final do texto, apresenta, também, de maneira resumida, mas suficientemente informativa, as linhas de pesquisa e os desenvol- vimentos subsequentes que derivaram daquele estudo seminal (isto é, oferece uma perspectiva histórica do desenvolvimento da psicologia, por meio do trabalho concreto de pesquisadores relevantes). Usei o livro por vários anos, enquanto ministrei a disciplina (fui depois subs- tituída pelo Júlio, que continuou usando o “Hock”) e estou certa que o uso desse material, em suas sucessivas reedições, tem contribuído muito positivamente para iniciar o desenvolvimento das concepções do aluno sobre o que estuda a Psicologia – e sobre como essa ciência vem sendo, e poderá continuar sendo, construída. Experiência similar teve ocasião quando Edson Huziwara, fa- zendo pós-doutorado na UFSCar, se dispôs a oferecer uma turma da disciplina optativa do curso, denominada Fenômenos e Processos Psi- cológicos; fui formalmente responsável pela disciplina e estive presen- te em todas as aulas, mas todo o trabalho foi planejado e conduzido pelo Edson e pelo João Henrique de Almeida, um dos organizadores deste livro. Aquela disciplina do curso de Psicologia da UFSCar per- mite, a cada oferta, a especificação dos tópicos abordados e Edson e João propuseram que naquele semestre a disciplina tivesse por obje- tivo apresentar, de forma sucinta, a produção empírica (experimentos clássicos) sobre diversos processos comportamentais investigados pela análise experimental do comportamento e ensinar as habilidades ne- cessárias para uma leitura competente de textos científicos. Os alunos eram de uma turma avançada e liam os artigos no original, os professo- res realizaram um excelente trabalho de preparar cuidadosamente cada estudo para apresentar em sala, destacando seus aspectos fundamen- xi tais e apresentando pistas para que os alunos discutissem qualidades e limites da pesquisa em foco. Sou testemunha de que esta atividade funcionou como reforçador poderoso para a leitura prévia dos alunos, e, ao mesmo tempo, como modelo de leitura cuidadosa e crítica. Reconheço que ao relatar essas experiências estou falando de meu trabalho, em vez de falar sobre o livro que apresento aos leitores. Mas espero ter fornecido evidências do quanto aprecio o que encontrei nele: - O conteúdo é específico de análise do comportamento: trata- -se, assim, de uma fonte organizada de informações que podem ser usadas no ensino de disciplinas da área. - A seleção de artigos relevantes, que deram origem a importan- tes desenvolvimentos na área, pode contribuir decisivamente para que o leitor compreenda a relevância da memória da investigação científi- ca, a importância de se conhecer os clássicos e de se estabelecer rela- ções entre o experimento original e a linha ou linhas de pesquisa gera- das por ele e sua importância para o conhecimento atual em análise do comportamento. - A ênfase em estudos experimentais permite destacar aspectos metodológicos, as possibilidades e a importância de investigação rigo- rosa, os necessários limites (seja do ponto de vista do controle, seja do ponto de vista da validade interna e externa), as contribuições poten- ciais para a compreensão de processos comportamentais, as pergun- tas que deixaram de ser respondidas, ou que foram suscitadas pelos dados. Esse conjunto de aspectos representa uma rica oportunidade para subsidiar a avaliação crítica da pesquisa científica em análise do xii comportamento, e, o que é de extrema relevância para a sobrevivên- cia das práticas científicas (investigação e intervenção) em análise do comportamento, despertar talentos e vocações para dar continuidade ao desenvolvimento da área. Por todos esses aspectos, avalio que este volume pode ser uma fonte inestimável para formação ou o aprimoramento de analistas do comportamento. Há algum tempo, em uma entrevista para a Associação Brasileira de Psicologia e Medicina Comportamental (ABPMC), a entrevistadora me perguntou que conselhos eu daria para a nova geração de analistas do comportamento. Embora desacredite no potencial de “conselhos” (sem outras condições críticas) para gerar ou manter comportamentos, arrisquei alguns palpites que talvez respondessem ao interesse de al- guém. Penso que os palpites valem também para jovens analistas que busquem aprender com este livro, por isso tomo a liberdade de trans- crever alguns pontos daquela fala: Não existe nada que você possa fazer bem feito, que não exija esfor- ço, comprometimento, dedicação e um trabalho sistemático. Em nossa área, seja no estudo, na investigação, ou nas aplicações a problemas humanos, não dá para fazer um trabalho de qualquer jeito, não se pode fazê-lo rapidamente, nem superficialmente. Por isso, para quem quer se tornar um analista do comportamento competente, seja no desenvolvimento científico da área, seja no desenvolvimento profis- sional, o primeiro passo é dedicação. É preciso ler (ou melhor, estudar) relatos originais de pesquisa; é preciso ler muito, voltar às origens, ler os clássicos e, claro, ler bibliografia atualizada. Muitas vezes presencio meus alunos lendo – ou escrevendo sobre o que leram, e eles tendem a xiii assumir que o autor que estão lendo no momento foi o primeiro a falar daquele assunto, ou o que teve a ideia original de que trata a pesqui-sa. Muitas vezes, trata-se de conceitos elaborados há muito tempo, que são encontrados em Skinner (1931, 1938, 1953), Keller e Schoenfeld (1950), Ferster e Skinner (1957), Millenson (1967), Sidman (1960), mas eles citam o artigo mais recente que leram, como se fosse a fonte ori- ginal. É preciso estar atualizado, acompanhar o desenvolvimento da área e para isto é preciso recorrer à literatura recente, mas também é preciso manter o registro, a memória ou a história dos conceitos e descobertas. Apesar de todas as exigências de referência de citação científica, muitas vezes vemos uma deturpação em relação às origens. Não é incomum encontrarmos, em 2016, um artigo citando um au- tor que publicou em 2015, como se este fosse a referência original de um determinado assunto. É muito importante estudar os trabalhos dos pioneiros (e se interessar por quem foram eles, sob que condições trabalharam, onde e quando viveram), ler e conhecer o que a área já produziu, ao mesmo tempo em se lê referências atualizadas. É preciso tentar dominar o conhecimento produzido na área, que não é pouco; quanto mais se conhece – os conteúdos e os caminhos que levaram a eles, mais o analista do comportamento disporá de instrumental teórico, conceitual e de procedimentos, para analisar e interpretar situações novas e para pensar, gerar novos estudos, ou planejar in- tervenções com embasamento cientifico. As facilidades de acesso são cada vez maiores, mas não podemos nos iludir com essa facilidade. É muito fácil acessar dezenas de artigos pela internet e poder abrir cada um deles com um simples toque. Mas não basta: faltam os passos seguintes: como é que se lê essa quantidade de material, de maneira funcional? Será preciso trabalhar muito, de forma disciplinada. Para quem quiser ter uma boa formação como analista do comportamento, existe muito conhecimento sedimentado para se aprender a trabalhar xiv e existem boas oportunidades de novos desenvolvimentos, mas para isso é preciso estudar, se dedicar, se comprometer. Este livro pode ser um bom começo. Neste primeiro volume da série foram selecionados estudos experimentais sobre condicionamen- to respondente; sobre o papel das consequências e parâmetros de re- forço (atraso do reforço; contraste comportamental; comportamento de escolha, história comportamental, ressurgência); sobre controle de es- tímulos (processos atencionais, respostas de observação, responder por exclusão, eventos privados, resolução de problemas, Teoria das Mol- duras Relacionais); sobre comportamento social (cooperação, cultura) e comportamento verbal (correspondência verbal e não verbal; compor- tamento governado por regras); e sobre análise funcional. Todos eles deram origem a linhas de pesquisa produtivas, responsáveis por gran- de parte do estado atual da pesquisa em análise do comportamento. Os autores dos capítulos são investigadores nacionais e internacionais, que conhecem profundamente os estudos e seus autores e estão com- prometidos com a difusão e o ensino de análise do comportamento. Por todos esses aspectos, estou certa de que o livro atende a uma necessidade importante em nossa área, e que se tornará um oportuno ponto de partida para iniciantes e uma excelente ocasião para revisão e atualização para os iniciados em análise do comportamento. Deisy G. de Souza Universidade Federal de São Carlos xv A ciência e a arte são as mais belas criações do comportamento humano. Elas demonstram, cada uma à sua maneira, nossa fascinante capacidade de transformar o mundo e de nos transformarmos ao fazê- lo. O gentil convite feito por Carlos, João e Paulo para que eu esco- lhesse a imagem da capa do livro que você agora lê me confrontou com um desafio singular: ilustrar, com o auxílio da arte, o conteúdo de um livro científico. Minha tarefa certamente foi facilitada pelo fato de que a arte não nos compromete com interpretações “certas”. A arte é o campo da su- gestão, da metáfora, do símbolo. Assim, me lancei à tarefa sob um vago controle temático, mas também me deixando levar pela beleza e pelo poder evocativo das imagens. A Osteographia, publicada pelo anatomista inglês William Che- selden em 1733, é uma das obras mais importantes da história da ilus- tração anatômica. Ela impressiona não apenas pela precisão, mas pela elegância. As criaturas humanas e não-humanas que ali aparecem não são meros auxílios da ciência, passivamente à disposição dos estudio- sos: em tudo o que importa, elas parecem vivas, ativas, interagindo com seu entorno. O fato de serem apenas esqueletos dá às imagens seu impacto. Seres vivos reduzidos à sua dura estrutura têm fascinado a humanida- de ao longo dos séculos. Caveiras e esqueletos nos lembram de nosso destino comum. A representação da morte como um esqueleto vivo é comum a várias culturas. SOBRE A CAPA xvi O que nos mostra que estão mortos é o fato de serem apenas esqueletos. O que nos mostra que estão vivos é o fato de interagirem com o mundo. Os esqueletos que nos assombram e nos encantam na tradição são a encarnação desencarnada da contradição: são mortos que vivem. Se neles pouco resta do que esperaríamos encontrar em um corpo vivo, o comportamento é seu único sinal de vida - e, como lembrava Skinner, a história do comportamento e a história da vida começam juntas. O esqueleto que está na capa deste livro nos lembra ainda que a vida é evolução - e que nós, seres vivos, estamos todos ligados por laços de parentesco. Trata-se de uma figura simiesca, que não obstante adota uma postura aparentemente “intencional” e verbal, tipicamente humana. É como se interagisse com outros de sua espécie, cuja pre- sença a imagem permite apenas subentender. Filogênese, ontogênese e cultura estão todas na imagem - desde que nossa história nos permita encontrá-las. Assim como a Osteographia de Cheselden, que utilizou magis- tralmente a arte para fazer ciência, espero que também este livro pos- sa mostrar, da capa à última página, quão fascinante é a jornada de conhecimento e autoconhecimento proporcionada pela investigação científica. Alexandre Dittrich Universidade Federal do Paraná xvii Este livro foi idealizado a partir de uma paixão comum dos três organizadores: a Análise Experimental do Comportamento. A ideia ge- ral consiste em apresentar, a estudantes de graduação, diversos temas de pesquisa em Análise do Comportamento por meio de experimentos clássicos. A análise experimental geralmente é considerada um terreno árido, com descrições metodológicas difíceis e um certo “desprendi- mento” das questões do dia a dia. Estes fatores, em nossa opinião, difi- cultam o contato e até mesmo o interesse de estudantes iniciantes pelo laboratório e pela pesquisa experimental sobre o comportamento. Buscando inspiração em livros de divulgação científica, como “Forty studies that changed Psychology” de Roger Hock, formatamos a ideia inicial do livro. Estas ideias nos levaram a uma série de convites a pesquisadores e pesquisadoras de diversas instituições brasileiras e internacionais para contribuírem com a obra. Convites aceitos, o livro começou a ganhar forma. Mais ideias foram surgindo, e foram tantos os temas escolhidos que acabamos tendo que dividir a obra em dois volumes. Depois de incontáveis reuniões que aproximaram Londrina, São Carlos e Brasília, conseguimos concretizar nosso objetivo. Em cada capítulo, autores e autoras discutem temas relevantes na Análise do Comportamento a partir da descrição de um experimento “clássico”. Clássico, aqui, não significa necessariamente o estudo mais antigo, mas aquele que é reconhecidamente uma influência importante naquela área de pesquisa, ou seja, que tenha servido de contexto para a produção de mais conhecimento científico. Assim, em cada capítulo, o experimento clássico serve como um pano de fundo para a apresen- tação do tema, e os textos foram escritos com uma linguagem leve e acessível, buscando,sempre que possível, uma ponte entre os procedi- mentos metodológicos e o contexto aplicado. APRESENTAÇÃO xviii Esperamos que esta obra inspire estudantes (e futuros pesquisa- dores e pesquisadoras!) a se enveredarem pelos caminhos fascinantes da pesquisa experimental sobre o comportamento dos organismos. E que essa jornada seja para estes estudantes um pouco do que foi (e con- tinua sendo) para nós: um caminho de muito trabalho e de muitos erros e acertos, mas, acima de tudo, um caminho muito gratificante e enri- quecedor. Esperamos, também, que este material sirva como um apoio aos professores e professoras das disciplinas de Análise Experimental do Comportamento, como contexto para discussões sobre os temas de pesquisa que compõe os currículos destas disciplinas. Boa leitura! Paulo Guerra Soares João Henrique de Almeida Carlos Renato Xavier Cançado xix SUMÁRIO Capítulo I.............................................................................................24 Somos todos produtos da nossa história comportamental Paulo Guerra Soares, Carlos Eduardo Costa Capítulo II...........................................................................................36 O cheque está no correio: investigando como o reforço atrasado afeta o desempenho Kennon A. Lattal Capítulo III.........................................................................................49 Quando o passado retorna: ressurgência comportamental Carlos Renato Xavier Cançado, Flávia Hauck, Ítalo S. C. Teixeira Capítulo IV..........................................................................................64 Clarice Lispector, tempo e consequências: considerações sobre con- traste comportamental João Cláudio Todorov, Rafaela M. Fontes Azevedo Capítulo V...........................................................................................78 Da frequência absoluta à frequência relativa como unidade de análise do comportamento Cristiano Coelho Capítulo VI.........................................................................................95 Prestaram atenção em tudo? Elenice S. Hanna, Márcio Borges Moreira xx Capítulo VII.....................................................................................109 A resposta de observação: o papel das respostas sensoriais para o es- tabelecimento da discriminação Peter Endemann, Candido V. B. B. Pessôa Capítulo VIII.....................................................................................123 Controle dos processos atencionais Edson Massayuki Huziwara, Candido V. B. B. Pessôa Capítulo IX.......................................................................................139 O responder controlado temporalmente: desdobramentos da pesquisa com a tarefa de bissecção Marilia Pinheiro de Carvalho, Marco Vasconcelos, Armando Machado Capítulo X.........................................................................................158 Como você se sente? Hiroto Okouchi Capítulo XI........................................................................................171 “Esse não é um pitilics, então só pode ser aquele”: o responder por exclusão e a aprendizagem de repertórios verbais Adreia Schimidt Capítulo XII......................................................................................186 Paus e pedras podem machucar, mas palavras... também! - Teoria das molduras relacionais João Henrique de Almeida e William Ferreira Perez xxi Capítulo XIII....................................................................................205 Quando o mundo interage com o que é dito sobre o mundo: o compor- tamento governado por regras Carlos Eduardo Costa, Carlos Renato Xavier Cançado Capítulo XIV.....................................................................................222 A função do mentir em crianças: o controle operante na correspon- dência verbal Carlos Augusto de Medeiros, Lucas Ferraz Córdova Capítulo XV......................................................................................239 Do indivíduo ao grupo: simulações experimentais de relações sociais com animais não-humanos Marcelo Borges Henriques Capítulo XVI..................................................................................254 Metacontingências: investigação experimental da seleção cultural Fábio Henrique Baia, Alina Barboza Cabral Bianco, Isabella Guimarães Lemes, Poliana Ferreira da Silva Capítulo XVII..................................................................................272 “Para com isso menino!”: análise funcional em problemas de compor- tamento André A. B. Varella, Maria Carolina Correa Martone, Carolina Coury Silveira Capítulo XVII..................................................................................284 Recombinação de repertórios: criatividade e a integração de aprendi- zagens isoladas Hernando Borges Neves Filho xxii Capítulo XIX....................................................................................297 Controlar para conhecer Cristiano Valério dos Santos Capítulo XX......................................................................................310 The check is in the mail: examining how delayed reinforcement af- fects performance Kennon A. Lattal Capítulo XXI....................................................................................322 How do you feel? Hiroto Okouchi xxiii Paulo Guerra Soares, Carlos Eduardo Costa 24 Somos todos produtos da nossa história comportamental Paulo Guerra Soares Universidade Norte do Paraná; Núcleo Evoluir Carlos Eduardo Costa Universidade Estadual de Londrina Weiner, H. (1964). Conditioning history and human fixed-interval performance. Journal of the Experimental Analysis of Behavior, 7(5), 383-385. “O hoje é apenas um furo no futuro, por onde o passado começa a jorrar” Raul Seixas e Marcelo Nova Capítulo I | História Comportamental 25 INTRODUÇÃO À ÁREA DE PES- QUISA E CONTEXTUALIZAÇÃO DO EXPERIMENTO Uma das principais afirmações da te- oria da evolução por seleção natural é que as gerações atuais de indivíduos de uma determinada espécie são produto de um constante processo de variação e seleção. Assim, ao longo da história de evolução de uma espécie, indivíduos com caracte- rísticas menos adaptativas morreram, en- quanto aqueles mais bem adaptados sobre- viveram, passando seus genes às próximas gerações. É importante lembrar que mais ou menos adaptativa significa que, sob certos aspectos do ambiente, certas características favorecem mais certos indivíduos de uma espécie do que outras. Não há característi- cas intrinsecamente melhores do que ou- tras. Aquelas cuja consequência seja maior chance de sobrevivência e procriação irão aumentar de frequência na espécie. Portan- to, para explicar por que os indivíduos de uma espécie exibem alguma forma de com- portamento típico (como espirros, bocejos, náuseas ou salivação, no caso do ser huma- no), é imprescindível uma análise da histó- ria de seleção dessa espécie. Este modelo de variação e seleção dos aspectos biológicos, proposto por Char- les Darwin no seu livro Origem das Espécies (1859), é reconhecidamente uma das inspi- rações de B. F. Skinner na formulação do Behaviorismo Radical (Baum, 2006; Lau- renti, 2009; Skinner, 1974; 1981). Para Skin- ner, o Behaviorismo Radical enfatiza o es- tudo do comportamento de cada indivíduo (e não apenas os padrões típicos de cada espécie). Assim, fazendo jus à analogia com a teoria da evolução de Darwin, o compor- tamento atual dos indivíduos é produto de um conjunto de relações entre o compor- tamento do indivíduo (selecionado na his- tória individual) e o ambiente atual. Nesse sentido, Skinner afirma que “Coube a Da- rwin descobrir a ação seletiva do ambien- te, assim como cabe a nós [behavioristas] completar o desenvolvimento da ciência do comportamento com uma análise da ação seletiva do meio”. (Skinner, 1974, p.60-61). Como funciona essa relação entre a ação do indivíduo e as variáveisambien- tais? Skinner propõe que em determinadas circunstâncias, nos comportamos no mun- do de diversas maneiras (variação) e uma ou algumas dessas maneiras de nos com- portar produzem alterações no ambiente. Estas alterações podem produzir mudanças na probabilidade futura do comportamento (seleção). Se as consequências do compor- tamento forem reforçadoras, produzirão um aumento na probabilidade desse com- portamento ocorrer sob circunstâncias se- melhantes no futuro. Se as consequências forem punidoras, produzirão uma diminui- ção na probabilidade da ocorrência do com- portamento. Neste último caso, o indivíduo pode se comportar em função da situação que indica que uma consequência nociva é provável e, assim, aprende também a evitar estas situações. Assim, cada indivíduo, ao Paulo Guerra Soares, Carlos Eduardo Costa 26 entrar em contato com experiências únicas ao longo da vida, vai aprendendo determi- nadas maneiras de agir a partir das conse- quências que esse comportamento produz. A noção de seleção do comporta- mento por consequências sugere que, para que possamos explicar os comportamentos dos indivíduos, é imprescindível uma aná- lise da história comportamental de cada um (Aló, 2005; Chiesa, 1994; Costa, Cirino, Cançado & Soares, 2009; Freeman & Lattal, 1992; Skinner, 1974; Soares, Costa, Cança- do & Cirino, 2013). Skinner já apontava que “uma análise do comportamento é (...) ne- cessariamente ‘histórica’” (1974, p. 236), pois os comportamentos atuais são produto de uma história de seleção que ocorre ao longo da vida de cada indivíduo. Neste sentido, é relativamente se- guro afirmar que pessoas que passaram por experiências diferentes ao longo da vida, quando expostas a situações pareci- das no presente, se comportam de manei- ras distintas. Contudo, o que se observa é que a grande maioria das explicações do senso comum negligencia a história com- portamental na determinação do compor- tamento atual (Aló, 2005; Chiesa, 1994). Valendo-se de uma terminologia dualista/ mentalista, o senso comum explica o com- portamento dos indivíduos recorrendo a conceitos como “personalidade” ou “cará- ter”. A pesquisa de Simonassi, Pires, Ber- gholz e Santos (1984), por exemplo, identi- ficou que observadores que desconheciam a história comportamental de crianças ten- diam a explicar seu comportamento atual a partir de um viés mentalista. Por outro lado, quando os observadores conheciam a história comportamental das crianças, tenderam a leva-la em consideração na ex- plicação do comportamento atual em detri- mento das causas mentais. Assim, Skinner (1953/2003) afirmou que o “hábito de bus- car dentro do organismo uma explicação do comportamento tende a obscurecer as variáveis que estão ao alcance de uma aná- lise científica. Estas variáveis estão fora do organismo, em seu ambiente imediato e em sua história ambiental” (p. 33). A afirmação de Skinner (1953/2003) levanta a seguinte questão: Como podemos analisar cientificamente os efeitos da histó- ria ambiental sobre o comportamento atu- al? Sidman (1960) afirmou que, em um con- texto experimental, a “melhor maneira de um experimentador especificar a história comportamental de um organismo, na me- dida em que é importante para um deter- minado problema, é construir deliberada- mente essa história no organismo” (p. 290, itálico adicionado). Ou seja, o experimenta- dor interessado no estudo da história com- portamental deveria ser capaz de construir diferentes histórias para seus participantes no laboratório (Wanchisen, 1990). Porém, até meados da década de 1960 não havia, na literatura analítico-com- portamental, um conjunto de dados siste- máticos que permitisse a análise do efeito Capítulo I | História Comportamental 27 de diferentes contingências passadas sobre o comportamento atual. Nesse contexto, mais precisamente em 1964, foi publicado um dos primeiros estudos cujo objetivo era a análise do efeito de diferentes histórias comportamentais (construídas no laborató- rio, como sugerido por Sidman, 1960) sobre o comportamento atual. DESCRIÇÃO DO EXPERIMENTO Objetivo e Método A pesquisa de Weiner (1964) era sim- ples, porém engenhosa. O objetivo do estudo foi avaliar o efeito da exposição a diferentes contingências históricas sobre o compor- tamento atual. Como estratégia metodoló- gica, foram arranjados esquemas de refor- ço, programações de contingência muito utilizadas em pesquisas experimentais em Análise do Comportamento, que permitem a seleção de padrões estáveis de comporta- mento (Ferster & Skinner, 1957; Lattal, 1991; Souza Júnior & Cirino, 2004). Os participan- tes da pesquisa foram seis enfermeiros de um hospital psiquiátrico. Eles se sentavam em frente a um monitor e a tarefa experi- mental consistia em pressionar um botão. As consequências para esse comporta- mento eram pontos que apareciam em um contador de pontos no monitor. Em cada sessão, os participantes também recebiam uma quantia fixa de dinheiro, que não era contingente ao seu desempenho. Os parti- cipantes foram distribuídos em dois grupos: durante a primeira fase da pesquisa (cons- trução da história), os participantes do Gru- po 1 (n=3) foram expostos a um esquema de razão fixa (FR) 40 e os do Grupo 2 (n=3) a um esquema de reforçamento diferencial de baixas taxas (DRL) 20 segundos, por 10 sessões de 60 min. Para os participantes expostos ao FR, 100 pontos eram credita- dos no contador a cada 40 pressões ao bo- tão. Para os participantes expostos ao DRL, cada resposta emitida após a passagem de 20 segundos da última resposta produzia 100 pontos no contador. Respostas emiti- das antes do fim do intervalo reiniciavam o intervalo do DRL. Esquemas de FR, em geral, selecio- nam altas taxas de respostas, pois há uma relação direta entre taxa de respostas e taxa de reforços sob esse esquema. Por outro lado, o esquema DRL geralmente selecio- na baixas taxas de respostas, pois respos- tas emitidas antes de terminado o intervalo programado produzem o reinício do inter- valo. E este era exatamente o objetivo de Weiner nesta primeira fase do experimen- to: estabelecer duas linhas de base - ou duas histórias comportamentais diferentes - nas quais padrões de comportamento distintos (altas e baixas taxas de respostas) fossem selecionados. Após construir histórias compor- tamentais diferentes para cada grupo, era hora de testar o efeito da exposição a estas diferentes contingências sobre o comporta- mento atual, quando as contingências mu- dassem. Na segunda fase do experimento Paulo Guerra Soares, Carlos Eduardo Costa 28 (teste), os participantes de ambos os grupos foram expostos à um mesmo esquema de reforçamento de intervalo fixo (FI) 10 se- gundos por 10 sessões de 60 min e, depois, 10 sessões de 30 min. Sob o esquema de FI 10 s, a primeira resposta que ocorresse após o intervalo de 10 segundos produzia 100 pontos no contador. Respostas que ocorres- sem ao longo desse intervalo não tinham consequências programadas (diferente do que ocorria na fase anterior sob o esquema de DRL). Assim, no esquema de FI, não im- porta se o indivíduo responde em altas ou baixas taxas, pois ambos os padrões con- tinuam a produzir pontos, desde que uma resposta ocorra após transcorrido o inter- valo do FI. Portanto, expor os participantes a este esquema de reforço na fase de teste permitiu observar se a exposição prévia ao FR ou ao DRL teria alguma influência no modo como eles se comportariam quando as contingências mudassem (ou seja, quan- do o FI estivesse em vigor). Resultados e discussão E foi exatamente o que aconteceu! A Figura 1 exibe os registros cumulativos dos participantes do Grupo 1 (S1, S2 e S3) e do Grupo 2 (S4, S5 e S6), durante os 15 últimos minutos da fase de teste (FI). A análise da Figura 1 permite constatar que, mesmo após Figura 1. Registros cumulativos dos 15 últimos minutos da fase de teste (após 15 horas de exposição ao FI) dos participantes da pesquisade Weiner (1964). O painel superior exibe os registros dos participantes do Grupo 1 (história de FR) e o painel inferior exibe os registros dos participantes do Grupo 2 (história de DRL) (reproduzido com a permissão de John Wiley and Sons). Capítulo I | História Comportamental 29 15 horas de exposição ao FI, os participan- tes que tinham sido expostos ao FR emi- tiam taxas de respostas mais altas quando comparadas às taxas de respostas dos parti- cipantes que tinham sido expostos ao DRL. A pesquisa de Weiner (1964) é inte- ressante por demonstrar que, mesmo em um delineamento simples, no qual a res- posta selecionada era pressionar um botão, o comportamento dos participantes no es- quema de FI sofreu influências da histó- ria comportamental que foi construída no laboratório. Sobre estes resultados, Weiner afirmou que o “ponto importante é que a história de condicionamento deve ser con- siderada como um possível determinante do responder de humanos em FI” (p. 385). Mas é possível ir mais além, e supor que a história comportamental não seja ape- nas determinante do responder em FI, mas de qualquer comportamento, dentro e fora do laboratório. Se este for o caso, os resulta- dos da pesquisa de Weiner (1964) permitem inferir (baseado em dados empíricos) que as experiências vivenciadas pelas pessoas ao longo de sua vida podem, sim, influenciar o comportamento presente. Os resultados apresentados por Wei- ner (1964) nos permitem ainda outras con- siderações. A Figura 2 abaixo foi construída a partir da Tabela 1 do artigo. O eixo y apre- senta a taxa de respostas (R/min) em escala logarítmica e o eixo x exibe a média da taxa de respostas das três últimas sessões de his- tória (FR para S1, S2 e S3; DRL para S4, S5 e S6) e a taxa de respostas nas cinco últimas sessões do experimento. Observa-se na Figura 2 que a taxa de respostas nas cinco últimas sessões de FI dos participantes com história de FR foram sempre superiores às taxas de respostas dos participantes com história de DRL. Todavia, há que se considerar que houve diminuição na taxa de respostas dos participantes ex- postos a história de FR e aumento na taxa de respostas dos participantes com história de DRL, quando expostos ao FI. Durante as três últimas sessões de Figura 2. Taxa de respostas (R/min) em escala logarítmica na fase de construção da história experimental (Hist - FR para S1, S2 e S3; DRL para S4, S5 e S6) e nas cinco últimas sessões do experimento. Ver mais detalhes no texto. (Figura construída especialmente para este capítulo com dados apresentados em Weiner, 1964, p. 384, Tabela 1). exposição ao FR, os participantes S1 e S3 emitiram, em média, 412 e 240 respostas por minuto. Na última sessão de FI, eles emitiam 64 e 55 respostas por minuto, res- pectivamente. Ou seja, depois de 15 horas de exposição ao FI, houve uma redução na taxa de respostas de aproximadamente 85% para S1 e de 77% para S2, em relação à li- Paulo Guerra Soares, Carlos Eduardo Costa 30 nha de base. Uma análise parecida também pode ser realizada para os participantes S5 e S6, que foram expostos à história de DRL. Durante as três últimas sessões do DRL, S5 e S6 emitiam, em média, três respostas por minuto. A taxa de respostas na última ses- são do FI foi de seis e nove respostas por minuto, respectivamente. Pode parecer pouca coisa, mas trata-se de um aumen- to na taxa de respostas de 100% para S5 e 200% para S6! DESDOBRAMENTOS Os resultados da pesquisa de Weiner (1964) sugerem evidências de que: (a) é es- sencial a análise da história de exposição a contingências passadas para a compreen- são do comportamento atual, assim como proposto por Skinner (1981), em analogia à seleção natural; (b) que os efeitos da história comportamental podem ser estudados em laboratório, desde que haja controle sobre a construção da história comportamental dos indivíduos (Sidman, 1960; Wanchisen, 1990). Especular sobre as influências da história de vida sobre o comportamento presente pode parecer óbvio. Todavia, como apontado anteriormente, o senso comum frequentemente negligencia a história com- portamental quando se propõe a explicar o porquê as pessoas se comportam da manei- ra como o fazem. Por exemplo, como um leigo, que não conhece a história compor- tamental dos indivíduos, explicaria o de- sempenho dos participantes da pesquisa de Weiner (1964) durante a fase de teste? Assim como no estudo de Simonassi et al. (1984), provavelmente o leigo utilizaria conceitos mentalistas, como “ansiosas”, “hiperativas” (para os participantes com história de expo- sição ao FR) ou “preguiçosas”, “depressivas” (para aqueles com história de exposição ao DRL), ignorando completamente a história comportamental dos participantes! A partir da pesquisa de Weiner (1964), diversos estudos foram conduzidos para analisar os efeitos da história de exposição a diferentes contingências históricas sobre o comportamento atual, manipulando variá- veis como controle de estímulos, reforçador empregado e custo da resposta, utilizando não-humanos (e.g. Cole, 2001; Doughty, Ci- rino, Mayfield, da Silva, Okouchi, & Lattal, 2005; Freeman & Lattal, 1992; LeFrancois & Metzger, 1993) e humanos (e.g. Costa, Ba- naco, Longarezi, Martins, Maciel, & Sudo, 2008; Costa, Soares & Ramos, 2012; Okou- chi, 2003a; 2003b; Soares, Costa, Cançado & Cirino, 2013). As pesquisas em laboratório sobre história comportamental tiveram desdo- bramentos interessantes, também, para a aplicação da Análise do Comportamento (como na clínica comportamental). Neste contexto, Marçal (2013) ressalta que Capítulo I | História Comportamental 31 “Por mais que um padrão compor- tamental esteja trazendo problemas a alguém, por mais que este alguém esteja insatisfeito com sua forma de agir, tal comportamento foi reforçado no passado em um ou mais contextos” (p. 41). Conhecer a história é conhecer o comportamento. Para que se possa compre- ender o comportamento atual do paciente, é imprescindível que se conheçam elementos de sua história de vida, e que estes elemen- tos possam ser relacionados às contingên- cias atuais. Portanto, para a condução de uma análise funcional do comportamento adequada, é necessária a análise sistemáti- ca da história do paciente. Todavia, é importante esclarecer alguns pontos. Em primeiro lugar, quan- do conversamos com um cliente não te- mos acesso a sua história. Temos acesso ao comportamento verbal que pode estar sob o controle da história, pode estar sob o con- trole da audiência (o terapeuta) ou ambos. Os estudos sobre história comportamental não nos dão uma ferramenta para a atuação aplicada da Análise do Comportamento. As pesquisas empíricas sobre história compor- tamental nos permitem fazer especulações mais bem fundamentadas (i.e., baseadas em dados empíricos), mas que não passam de especulações, até que a intervenção seja feita e, eventualmente, o comportamento mude na direção “esperada” (pelas especu- lações). Isso não é pouco! Levantar hipóte- ses e especular com base em dados empí- ricos é mais do que muitas abordagens em Psicologia têm oferecido. CONSIDERAÇÕES FINAIS A pesquisa de Weiner (1964) foi uma das primeiras tentativas de análise sistemá- tica do efeito de histórias comportamentais no laboratório. Seus resultados ressaltam a importância do papel da história comporta- mental na determinação do comportamen- to atual. Ao constatar este fato, o analista do comportamento deve tomar cuidado com dois pontos. Primeiramente, a história com- portamental – especialmente quando ela não é conhecida – não deve ser transforma- da em uma explicação genérica do compor- tamento ou, como ressalta Cirino (2001), em uma “lata de lixo” da Análise do Comporta- mento. Todo comportamento é explicado a partir das contingências às quais o indiví- duo foi exposto, mas para lançar mão desta explicação histórica o analista do compor- tamento deve conhecer a história e quais elementosdesta história possuem relação com seu comportamento atual. Em segundo lugar, é importante não atribuir à história comportamental um efei- to definitivo e imutável sobre o compor- tamento atual (cf. Costa, Cirino, Cançado & Soares, 2009). Ainda que a explicação Behaviorista Radical seja essencialmente histórica, não podemos negligenciar o papel das contingências presentes. Uma análise Paulo Guerra Soares, Carlos Eduardo Costa 32 cautelosa dos resultados de Weiner (1964) ajuda a sustentar esta conclusão. Dois dos três participantes expostos à história de FR emitiram, na última sessão de FI, uma taxa de respostas mais baixa em relação à linha de base (Ver Figura 2, neste capítulo). Por isso, procuramos sempre lembrar: somos produtos da nossa história, mas não escra- vos dela! Essas análises demonstram que, de- finitivamente, não se pode negligenciar a contingência presente. A contingência de FI 10 s, programada por Weiner (1964) du- rante a fase teste, estabelece um desem- penho “ideal” de seis respostas por minuto (pois uma resposta a cada 10 segundos pro- duz reforço). Uma taxa média de respostas como as de S1 e S2 garantiam que muitos pontos fossem produzidos durante o FR, mas a grande maioria dessas respostas não produzia consequências programadas du- rante o FI, o que estabelece uma diminui- ção na taxa de respostas como algo desejá- vel. Durante o DRL, uma taxa média de três respostas por minuto (S4 e S5) garantia que os reforços continuassem a ser produzidos e que poucas perdas ocorressem. Contu- do, respostas emitidas durante o intervalo do FI não reiniciavam o intervalo como no DRL, o que estabelece um aumento na taxa de respostas como algo desejável. Os resul- tados de pesquisas posteriores sobre histó- ria comportamental (e.g., Freeman & Lattal, 1992; Soares et al., 2013) indicaram que o comportamento é produto da história, mas, gradualmente, fica sob controle das contin- gências presentes. Espera-se que o leitor possa ter com- preendido a importância da consideração dos eventos históricos sobre o comporta- mento atual e como o fenômeno pode ser estudado em laboratório. Dessa forma, des- taca-se um modelo causal (Skinner, 1981) que é uma alternativa a qualquer tipo de explicação mentalista/dualista. Quando queremos entender – e modificar – o com- portamento de um indivíduo, o primeiro passo, sem dúvida, é conhecer a sua histó- ria comportamental! PARA SABER MAIS Weiner (1969). Conjunto de cinco experi- mentos com humanos nos quais Weiner explora diferentes estratégias na constru- ção da história comportamental. Os deli- neamentos apresentados são em grupos ou com a exposição do mesmo participante a diferentes esquemas de reforço em fases sucessivas. Em linhas gerais, o artigo inves- tiga os determinantes do comportamento humano em um esquema de FI. O desem- penho de humanos neste esquema de re- forço foi a base de muita controvérsia sobre a diferença de humanos e não humanos se comportamento em esquemas de reforço. A ênfase de Weiner, é claro, é na importância da história comportamental. Freeman & Lattal (1992). Avaliação dos efeitos da história sobre o comportamento Capítulo I | História Comportamental 33 atual de pombos usando um delineamento no qual o sujeito é seu próprio controle (co- nhecido como Delineamento Experimental de Caso Único ou delineamento intrasujei- to). Nessa pesquisa, o mesmo organismo foi exposto a duas histórias comportamentais de maneira relativamente simultânea, sob diferentes controles de estímulo. O resulta- do geral, apontou que a história exerce efei- to sobre o comportamento atual, mas que esse efeito é transitório. Okouchi (2003b). Também utilizando um delineamento intrassujeito (esquemas de reforçamento múltiplo), com humanos, a pesquisa de Okouchi apontou que os efeitos da história ficam sob o controle de estímu- los e que esses efeitos podem se generalizar para outras situações semelhantes no pre- sente. Soares, Costa, Cançado, & Cirino (2013). Replicação sistemática da pesquisa de Fre- eman e Lattal (1992) com humanos. Os re- sultados corroboram o de outras pesquisas sugerindo que os efeitos da história ficam sob o controle de estímulos; são transitórios (embora possam ser de longa duração) e que a regularidade nos resultados de pesquisas com humanos em esquemas de reforça- mento depende do controle experimental, não requerendo, portanto, mudanças no modelo de causalidade quando falamos do comportamento humano e não humano. REFERÊNCIAS Aló, R. M. (2005). História de reforçamento. In J. Abreu-Rodrigues & M. R. Ribeiro (Eds.). Análise do comportamento: Pesquisa, teo- ria e aplicação (pp. 45-62). Porto Alegre: Artmed. Baum, W. M. (2006). Compreender o Beha- viorismo: comportamento, cultura e evolu- ção. Porto Alegre: ArtMed. Chiesa, M. (1994). Radical behaviorism: The philosophy and the Science. Boston: Autors Cooperative. Cirino, S. D. (2001). Detecção da história de reforçamento: Problemas metodológicos para lidar com a história passada. In H. J. Guilhardi, M. B. B. P. Madi, P. P. Queiroz & M. C. Scoz (Orgs.), Sobre comportamento e cognição: Vol 8. Expondo a variabilidade (pp. 137-147). Santo André: ESETec. Cole, M. R. (2001). The long term effect of high and low rate responding histories on fixed-interval responding in rats. Journal of the Experimental Analysis of Behavior, 75, 43-54. Costa, C. E., Banaco, R. A., Longarezi, D. M., Martins, E. V., Maciel, E. M., & Sudo, C. H. (2008). Tipo de reforçador como uma vari- ável moduladora dos efeitos de história em humanos. Psicologia: Teoria e Pesquisa, 24, 251-262. Paulo Guerra Soares, Carlos Eduardo Costa 34 Costa, C. E., Cirino, S. D., Cançado, C. R. X., & Soares, P. G. (2009). Polêmicas sobre his- tória comportamental: identificação de seus efeitos e sua duração. Psicologia: Reflexão e Crítica, 22, 317-326. Costa, C. E., Soares, P. G., & Ramos, M. N. (2012). Controle de estímulos e história comportamental: uma replicação de Fre- eman e Lattal (1992). Temas em Psicologia, 20, 273-288. Doughty, A. H., Cirino, S. D., Mayfield, K. H., Da Silva, S. P., Okouchi, H., & Lattal, K. A. (2005). Effects of behavioral history on resistance to change. The Psychological Re- cord, 55, 315-330. Ferster, C. B., & Skinner, B. F. (1957). Sche- dules of reinforcement. New York: Appleton. Freeman, T. J., & Lattal, K. A. (1992). Stimu- lus control of behavioral history. Journal of the Experimental Analysis of Behavior, 57, 5-15. Lattal, K. A. (1991). Scheduling positive rein- forcers. In I. H. Iversen & K. A. Lattal (Eds.), Experimental Analysis of Behavior, Part 1 (pp. 87-134). New York, NY: Elsevier Scien- ce. Laurenti, C. (2009). Criatividade, liberdade e dignidade: impactos do darwinismo no behaviorismo radical. Scientiae Studia, 7, 251-269. LeFrancois J. R, & Metzger B. (1993). Low- -response-rate conditioning history and fi- xed-interval responding in rats. Journal of the Experimental Analysis of Behavior, 59, 543– 549. Marçal, J. V. S. (2013). Behaviorismo radi- cal e prática clínica. In A. K. C. R. de-Farias (Org.), Análise Comportamental Clínica (pp. 30-48). Porto Alegre: Artmed. Okouchi, H. (2003a). Effects of differences in interreinforcer intervals between past and current schedules on fixed-interval responding. Journal of the Experimental Analysis of Behavior, 79, 49-64. Okouchi, H. (2003b). Stimulus generaliza- tion of behavioral history. Journal of the Experimental Analysis of Behavior, 80, 173- 186. Sidman, M. (1960). Tactics of scientific rese- arch. New York: Basic Books. Simonassi, L. E., Pires, M. C. T., Bergholz, M. B., & Santos, A. C. G. (1984). Causação no comportamento humano: acesso à história passada como determinantes na explicação do comportamento humano. Psicologia: Ci- ência e Profissão, 4, 16-23. Skinner, B. F. (1974). About behaviorism. New York: Vintage Books. Skinner, B. F. (1981). Selection by conse- quences. Science, 213, 501-504.Capítulo I | História Comportamental 35 Skinner, B. F. (2003). Ciência e Comporta- mento Humano. São Paulo: Martins Fontes (Originalmente publicado em 1953). Soares, P. G., Costa, C. E., Cançado, C. R. X., & Cirino, S. D. (2013). Controle de estímulos e história comportamental em humanos. Psicologia: Reflexão e Crítica, 26, p. 357-366. Souza Júnior, E. J., & Cirino, S. D. (2004) Es- quemas de reforçamento. In C. E. Costa, J. C. Luzia, & H. H. N. Sant’Anna (Orgs.), Primei- ros Passos em análise do comportamento e cognição. Vol. 2 (pp. 31-42). Santo André: ESETec. Wanchisen, B. A. (1990). Forgetting the les- sons of history. The Behavior Analyst, 13, 31-37. Weiner, H. (1964). Conditioning history and human fixed-interval performance. Journal of the Experimental Analysis of Behavior, 7, 383-385. Weiner, H. (1969). Controling human fixed- interval performance. Journal of the Expe- rimental Analysis of Behavior, 12, 349-373. Kennon A. Lattal 36 O cheque está no correio1, 2: investigando como o reforço atrasado afeta o desempenho Azzi, R., Fix, D. S. R., Keller, F. S., & Rocha e Silva, M. I. (1964). Exteroceptive control of response under delayed reinforcement. Journal of the Experimental Analysis of Behavior, 7, 159-162. “… um atraso do reforço não é um parâmetro estático no efeito de um reforço sobre o comportamento” (C. B. Ferster, 1953) Kennon A. Lattal West Virginia University Capítulo II | Atraso do Reforço 37 1 Tradução realizada por João Henrique de Almeida, Paulo Guerra Soa- res e Carlos Renato Xavier Cançado. O primeiro tradutor é bolsista de pós-doutorado FAPESP processo número 2014/01874-7. 2 Nota de tradução: “The check is in the mail” é uma expressão utilizada para indicar a um credor que um pagamento (ainda não realizado) será feito em breve. É uma situação em que o atraso de um reforço é, neces- sariamente, sinalizado (i.e., o pagamento ainda não foi recebido e seu recebimento é sinalizado pela expressão “o cheque está no correio”). 3 Nota de tradução: os termos “signaled”, “unsignaled”, “resetting” e “nonresetting” que qualificam atrasos do reforço foram traduzidos, res- pectivamente, como “sinalizados”, “não sinalizados”, “resetáveis” e “não resetáveis”. INTRODUÇÃO A ÁREA DE PES- QUISA E CONTEXTUALIZAÇÃO DO EXPERIMENTO Atraso do reforço, mesmo em 1964, era uma questão de interesse de longa data na Psicologia da Aprendizagem (e.g., Kim- ble, 1961; Renner, 1964). Thorndike (1911) preparou o palco para investigações futu- ras, quando afirmou que “as respostas que eram acompanhadas ou seguidas de perto pela satisfação do animal” (p. 244) seriam fortalecidas. Foi deixado para outros explo- rarem os limites e as implicações da “pro- ximidade” temporal para a relação respos- ta-reforço. O tema geral foi explorado por todos os principais teóricos da aprendiza- gem que sucederam Thorndike. Guthrie (1935) enfatizou a importância fundamen- tal da contiguidade temporal entre eventos para a aprendizagem, mas ele nem era um teórico do reforçamento! Hull (1943) discu- tiu extensamente o problema do atraso do reforço em seu livro Princípios do Compor- tamento (Principles of Behavior), com ên- fase especial nos mecanismos responsáveis pela manutenção do comportamento sob condições de atraso do reforço (ver também Spence, 1947). O atraso do reforço também aparece como um problema de pesquisa no livro de Skinner (1938) O Comportamento dos Organismos. Diferentemente da tenta- tiva de Hull de inferir mecanismos teóricos subjacentes ao gradiente de atrasos do re- forço, a análise de Skinner foi, previsivel- mente, mais empírica. Os experimentos em que foram im- postos um atraso temporal entre a resposta que produz o reforço e a entrega desse re- forço são descritos em dois momentos em O Coportamento dos Organismos. Os atra- sos investigados por Skinner (1938) foram não-sinalizados, isto é, não houve mudança de estímulo que acompanhasse o intervalo do atraso. No primeiro experimento (des- crito nas pp. 73-74), uma resposta liberava “um pêndulo que acionava o comedouro no final do intervalo desejado”. Skinner (Figu- ra 6, p. 73) mostrou os dados de aquisição de oito ratos usando atrasos de 1-4 s com diferentes pares de ratos, e, com uma exce- ção, notou que foram comparáveis aos de aquisição com reforço imediato. Não está claro se estes atrasos eram reiniciados se as respostas subsequentes ocorressem du- rante o intervalo do atraso, mas parece que eles não foram, isto é, os atrasos foram não resetáveis3 (cf. Lattal & Gleeson, 1990). Ele afirmou que “[um] novo intervalo deve ser iniciado [quando ocorre uma segunda res- posta] ou a segunda resposta será reforçada rápido demais, mas isto significa que a pri- Kennon A. Lattal 38 meira resposta não seria reforçada” (p. 73). Seus comentários subsequentes sugeriram que ele não resolveu este problema neste primeiro experimento. Um pouco mais tarde no livro ele descreveu outros dois experimentos en- volvendo atraso do reforço. Ele começou repetindo o problema do procedimento já mencionado anteriormente: “Nenhum pla- nejamento foi feito para evitar a possivel coincidência de uma segunda resposta com um reforço atrasado” (Skinner, 1938, p. 138), tornando assim mais provável que o atraso obtido seria menor do que o atraso progra- mado. Ele também observou uma segunda dificuldade, relacionada com os ratos que mantinham a barra pressionada. O atraso começou com uma pressão a barra, mas às vezes a barra continuava a ser pressiona- da durante o atraso e era liberada no final do intervalo, levando Skinner a questionar se isso resultaria em reforço imediato ou atrasado. O equipamento utilizado neste experimento foi o mesmo utilizado no ex- perimento descrito acima mas, no entanto, ele apontou uma mudança: “o equipamen- to tem esta propriedade importante: se uma segunda resposta é feita durante o intervalo do atraso, a contagem do tempo recomeça, de modo que um intervalo completo deve decorrer novamente antes que o reforço ocorra” (p 139. ). Assim, em vez de um atraso não resetável, neste experimento os atrasos eram resetáveis, isto é , o intervalo do atra- so era reiniciado para cada resposta após aquela que iniciou o atraso. Utilizando este procedimento, os ratos foram condiciona- dos “da maneira usual” (p 140; presumivel- mente Skinner queria dizer com reforço imediato) para responder, por fim, em um esquema intervalo fixo (FI) 5 min. Após este treino, atrasos de 2, 4, 6 ou 8 s estavam em vigor com diferentes ratos por três sessões. As taxas de resposta foram reduzidas quan- do os atrasos estavam em vigor, sendo que com os dois atrasos mais curtos o respon- der foi menos reduzido em comparação aos dois mais longos. Em um experimento final sobre atraso do reforço, Skinner analisou os efeitos de várias mudanças no treino e na implementação dos atrasos. O principal desenvolvimento suse- quente na análise experimental do atraso do reforço foi a pesquisa de Ferster (1953). A maioria dos teóricos de aprendizagem, incluindo Skinner, focaram os efeitos pre- judiciais do atraso do reforço sobre a apren- dizagem e o desempenho. Ferster inverteu a questão e perguntou se seria possível man- ter o comportamento apesar da presença de um atraso entre o reforço e a resposta que o produziu. Ele conduziu uma série de expe- rimentos com pombos em que ele primei- ro mantinha a resposta de bicar (bicar um pequeno disco de plástico) com esquemas de reforço intervalo variável (VI). Com essa linha de base, em seu primeiro e segundo experimentos, atrasos sinalizados por bla- ckouts4 da câmara experimental ocorreram 4 Nota de tradução: Termo mantido como no original. O termo é utiliza- do para descrever situações em que as luzes da câmara experimental, e até mesmo aquelas que iluminam os discos de resposta, são apagadas. Capítulo II | Atraso do Reforço 39 entre o reforço e a resposta que o produziu. Os blackouts foram utilizados“para evitar S de respondesse” (p. 219), aproveitando-se do fato de que pombos normalmente não bi- cam os discos de resposta quando a caixa e o disco estão apagados. Claro, apagar as lu- zes da caixa era uma consequência imedia- ta da resposta, fazendo com que o blackout funcionasse como um estímulo, em última análise correlacionado com a liberação do reforço. Como resultado, o atraso do reforço covariou com a potencial função reforçado- ra condicionada do blackout. Esta covaria- ção permite questionar esse experimento, e todos os experimentos envolvendo atrasos sinalizados do reforço, como um teste dos efeitos de um atraso do reforço”puro” sobre o responder. Em seu primeiro experimento, Ferster observou que atrasos de 60 s cau- saram uma “pequena queda” na taxas de respostas, mas sob atrasos de 120 s, a taxa de respostas caiu para cerca da metade de seu valor quando o reforços imediatos eram utilizados. Em seu segundo experimento, Ferster tentou manter altas taxas de res- posta introduzindo os atrasos gradualmen- te, aumentando a sua duração de 1 a 60 s ao longo de um período de treino de 90 hr. Ele relatou que “os três Ss que mantiveram as taxas normais de resposta sob 60 s de atra- so foram mantidos no mesmo procedimen- to por várias centenas de horas cada. Eles não exibiram nenhuma tendência de desa- celeração” (p. 222). O responder do quar- to pombo não foi mantido, de acordo com Ferster, porque os atrasos “foram aumen- tados muito rapidamente.” (p. 222). Ele não apresentou dados quantitativos na descri- ção de seus experimentos, baseando-se, ao invés disso, em descrições verbais do que aconteceu, apoiadas apenas por alguns re- gistros cumulativos dos desempenhos dos pombos. Estas duas linhas de pesquisa (Skin- ner, 1938; e Ferster, 1953) fornecem o con- texto para o tema deste capítulo: o experi- mento de Azzi, Fix, Rocha e Silva e Keller (1964). Uma parte importante da história por trás do experimento de Azzi et al. é caso de amor de Fred Keller com o Brasil, que co- meçou com a sua chegada como Fulbright Teaching Fellow na Universidade de São Paulo no início de 1961. Foi nomeado como seu assistente de pesquisa Rodolpho Azzi, que aparece com Keller e outros pesquisa- dores e pesquisadoras do Brasil na Figura 1. Sobre Azzi, Keller (2008) afirmou: “Ele rapidamente se tornou meu con- selheiro e guia, ele meatualizava com tudo o que eu deveria saber sobre os meus alunos, membros do corpo do- cente e funcionários da administra- ção. Ele me ajudou a responder a per- guntas, escrever relatórios, e avaliar o progresso dos meus alunos. Ele me preparou para reuniões importantes, me informava sobre novos desenvolvi- mentos, e me protegeu de incômodos de qualquer tipo.” (p. 248) Kennon A. Lattal 40 Logo depois que Keller começou a le- cionar, ele recebeu uma entrega de equipa- mento de pesquisa que ele havia adquirido da compania Grason-Stadler em Waltham, Massachussetts. Ele se lembrou de que o equipamento “... não veio com as instruções, por isso tivemos de determinar como fun- cionava por tentativa e erro. Rodol- fo [sic] [Azzi] e eu, juntamente com Mario Guidi, um estudante em nosso curso, trabalhamos durante dias an- tes de finalmente descobrirmos como automatizar um estudo longo sobre os efeitos de diferentes atrasos do re- forço sobre a resposta de pressionar a barra de três ratos brancos (nomea- dos de Alpha, Beta e Gamma por Ro- dolfo [sic]). Os resultados foram pu- blicados mais tarde no Journal of the Experimental Analysis of Behavior” (Keller, 2008, p. 250). Podemos apenas especular sobre o porquê atraso do reforço foi o tema da pri- meira pesquisa publicada no Journal of the Experimental Analysis of Behavior com um primeiro autor brasileiro (Azzi). Vamos voltar para o segundo experimento relata- do por Skinner com atraso de reforço em O Comportamento dos Organismos. Lem- bre-se que ele usou um procedimento de atraso resetável, em que cada resposta que ocorresse após aquela que deu início ao atraso reiniciava o intervalo do atraso. Ele usou um procedimento semelhante para reduzir o responder em altas taxas [“nenhu- ma resposta foi reforçada se fosse precedi- da, no prazo de quinze segundos, por outra resposta” (p. 306)], dando assim origem ao esquema de reforçamento diferencial de taxas baixas (DRL). Wilson e Keller (1953), posteriormente, estudaram os efeitos de es- quemas DRL sobre a pressão à barra de ra- tos sob uma série de valores do “atraso” (i.e., os valores do DRL). O experimento Wilson e Keller nasceu de uma demonstração ini- cial do que era basicamente um esquema de reforçamento diferencial de outros com- portamentos (DRO), em que o início de um período de SD ocorreu somente se não hou- vesse resposta no período S-delta imedia- tamente anterior por um período de tempo especificado (cf. Skinner, 1938, p. 161). Uma contingência de atraso de reforço resetável é essencialmente um esquema DRL sem a resposta requerida no fim do intervalo, Figura 1. Rodolpho Azzi, Fred Keller, Maria Amélia Matos, Carolina Martuscelli Bori, e Andrés Aguirre (da esquerda para a direita) com equipamentos, Dezembro de 1961. Capítulo II | Atraso do Reforço 41 e um esquema DRO é essencialmente um procedimento de atraso resetável, mas sem a exigência de uma resposta para iniciar cada intervalo do DRO (os reforços ocor- rem desde que a resposta alvo não ocorra; se uma resposta alvo ocorrer, ela reinicia o intervalo do DRO). Combine todas essas ideias, adicione o fato de que Ferster (um dos alunos de doutorado de Keller em Co- lumbia) tinha estudado previamente os efeitos de atrasos sinalizados do reforço e, voilà, os procedimentos utilizados por Azzi et al. (1964) emergem. Não podemos saber com precisão como a ideia para o experi- mento foi desenvolvida mas, certamente, e sem surpresa, pode ser intimamente ligada a alguns dos trabalhos anteriores de Keller e seus alunos na Universidade de Columbia. DESCRIÇÃO DO EXPERIMENTO Objetivo e Método Azzi et al. (1964) buscaram fazer duas coisas: (a) investigar o responder operante sob condições em que o intervalo entre o reforçador e a resposta que o produzia era variado e (b) comparar condições em que o atraso fosse acompanhado por uma mu- dança nos estímulos (um estímulo que o sinalizasse) ou ocorresse sem qualquer mu- dança durante o intervalo do atraso (não sinalizado). Assim, o experimento era ba- sicamente uma comparação de duas con- dições diferentes – atrasos do reforço não sinalizados e sinalizados – que tinham sido observados em experimentos diferentes conduzidos, respectivamente, por Skinner (1938) e Ferster (1953). Para isso, três ratos foram incial- mente treinados a pressionar uma barra em um esquema de razão fixa (FR) 1, em que o reforçado era acesso à água. Parece razoável assumir que neste tempo nem pelotas de comida usadas com os ratos em muitos dos experimentos de Skinner e outros, nem tão pouco os meios para liberar essas pelotas – i.e., um comedouro – estavam disponíveis no Brasil. Água era fácil de obter e Keller tinha trazido consigo o que ele chamou de um “Brenner dipper”5 para liberação de água como reforços. Após o treino inicial, “dentro de uma câmara com a iluminação reduzida, cada [rato] foi exposto sucessiva- mente a atrasos do reforço de 1; 3; 5; 7,5; 10; 15; e 20 s[egundos], nesta ordem, com um total de 150 reforços em cada atraso” (Azzi et al., 1964, p. 159). O esquema de reforço então era, tecnicamente falando, um tan- dem FR 1 DRO t-s, em que t correspondia a um dos valores de atraso apresentados aci- ma. Um esquema tandem (a palavra latina para “um logo após o outro”) é idêntico a um esquema de reforço encadeado em que dois ou mais componentes do esquema preci- sam ser finalizados em uma sequência fixa para que o reforço ocorra; no entanto, em um esquema encadeado cada componen- te é associado com um estímulo diferente, 5 Nota de tradução: Um dipperé uma espécie de bebedouro; o equipa- mento geralmente consiste em uma haste com um recipiente côncavo na ponta que, quando mergulhado em um líquido, retém parte do mes- mo. O líquido então pode ser apresentado ao animal movimentando-se a haste até alguma parte da câmara experimental. Kennon A. Lattal 42 mas no esquema tandem o estímulo as- sociado com cada componente é idêntico. No procedimento de Azzi et al. (1964), cada atraso reiniciava se uma resposta ocorresse durante o intervalo do atraso (um atraso re- setável), e não havia nenhuma mudança no estímulo durante o período de atraso. Em seguida, foram realizadas várias manipula- ções das durações do atraso para dos dois dos ratos. O terceiro rato aparentemente foi exposto somente a um esquema DRL 20 s com reforços imediatos. Assim como na primeira, na segunda parte do experimen- to o esquema de reforço em vigor tecnica- mente era um tandem FR1 DRO ts, em que t era 20 por dez dias, seguido por seis dias com t=30s. Durante a metade de cada ses- são, “cada animal trabalhou em uma câma- ra com a iluminação reduzida” (p.160). Du- rante a outra metade, no entanto, “ausência de iluminação (escuridão) estava em vigor durante cada intervalo do atraso… cada vez que uma resposta de pressão à barra ocor- ria, a luz da caixa era desligada (p.160, itáli- cos originais) e não voltava a ser ligada até que o reforço tivesse sido liberado. Pressões à barra na câmara sem iluminação aumen- tavam o período sem iluminação até que a duração do atraso terminasse e o reforço fosse liberado. Assim, na segunda parte do experimento, foram comparados um inter- valo do atraso correlacionado com a pre- sença e com a ausência de uma mudança nos estímulos. Resultados e Discussão Houve dois achados principais. O responder mantido sob um esquema tan- dem FR1 DRO ts foi uma função negativa- mente desacelerada da duração do atraso. Ou seja, a taxa de respostas caiu precipita- damente quando o atraso aumentou de 1 a 10 s, mas atingiu a assíntota naquele ponto, não caindo mais quando aos atrasos dura- vam 15 ou 20 s. Essa relação é chamada de gradiente de atraso do reforço, e é caracte- rística da relação entre as medidas de uma resposta e a duração do atraso em uma am- pla variedade de atrasos do reforço e parâ- metros do esquema de reforço (cf. Lattal, 2010). Escurecer a câmara durante o atraso “produziu um efeito considerável, regula- rizando e aumentando a taxa de respostas [relativo aquela observada na condição de atraso não sinalizado] em quase todos os casos” (Azzi et al., 1964, p. 160). A discussão considerou o papel do comportamento mediador em manter o res- ponder durante o atraso, uma observação feita anteriormente por Ferster (1953). No que subsequentemente se tornou uma aná- lise padrão, a mudança de estímulos (em atrasos sinalizados dos reforços) é entendi- da como um reforçador condicionado que mantém as respostas que a produziram. Isto ainda é uma interpretação comum do papel do estímulo que sinaliza o atraso em pro- cedimentos de atrasos sinalizados do refor- ço. Essa interpretação, no entanto, tem sido questionada recentemente interpretando- -se a mudança de estímulos como tendo Capítulo II | Atraso do Reforço 43 função de ligação ou marcação do atraso (e.g., Williams, 1991), ao invés de fortalecer o comportamento que a precede. DESDOBRAMENTOS Ambos os resultados do experimen- to qualificam Azzi et al. (1964) como um ex- perimento seminal no estudo do atraso do reforço. Os gradientes de atraso do reforço apresentados por Azzi et al. (1964) tem sido replicados quando diferentes esquemas de reforço têm sido usados para manter o responder (Elcoro & Lattal, 2011, FI; Jarmo- lowicz & Lattal, 2013, FR; Richards, 1981, DRL e VI; Sizemore & Lattal, 1978, VI) e com uma variação mais ampla de valores de atraso (Pierce, Hanford, & Zimmerman, 1972; Richards, 1981; Sizemore & Lattal, 1978). Azzi et al. também anteciparam vá- rias comparações subsequentes de atra- so do reforço sinalizado e não sinalizado, com mais ou menos os mesmos resultados: atrasos sinalizados mantem um responder mais robusto do que os não sinalizados (Ri- chards, 1981). Uma característica particu- larmente interessante de Azzi et al. é que as comparações dos atrasos do reforço si- nalizados e não sinalizados foram intras- sujeitos. Eles são os primeiros a comparar simultaneamente (intrassessão) os efeitos dos atrasos do reforço sinalizados e não si- nalizados (cf. Lattal, 1984; Lattal & Ziegler, 1982; Richards, 1981). Muito depois de Azzi et al., Reilly e Lattal (2004) desenvolveram um método para obter gradientes de atraso do reforço intrassujeitos durante uma úni- ca sessão. Eles mantiveram o responder sob um esquema VI e, no início de cada sessão, programaram um atraso curto antes que um reforço fosse disponibilizado. Cada re- forço subsequente foi disponibilizado após um atraso progressivamente maior. O experimento de Azzi et al. (1964) foi conduzido na tradição da Universidade de Columbia de conduzir análises paramé- tricas sistemáticas das variáveis controla- doras do comportamento. Nesse caso, as durações do atraso foram manipuladas em condições sucessivas. Como não havia um retorno à linha de base entre os aumentos sucessivos nos valores dos atrasos, atrasos subsequentes eram impostos sob taxas va- riáveis de respostas entre manipulações, com efeitos desconhecidos sobre o gradien- te de atraso do reforço. Esses gradientes de atraso do reforço, no entanto, são um tanto similares em sua forma aqueles obtidos com pressões à barra de ratos ou bicar de disco de pombos mantidos sob outros esquemas de reforço (Elcoro & Lattal, 2011; Pierce, et al., 1972; Richards, 1981; Sizemore & Lattal, 1978), sugerindo que a taxa de respostas na linha de base pode ter um papel menos importante na forma do gradiente do que o valor do atraso em si. Uma potencial variável estranha no experimento foi a taxa de reforços. Como tantos outros experimentos iniciais envol- vendo atrasos do reforço, a taxa de refor- ços sob cada valor de atraso não foi relatada Kennon A. Lattal 44 por Azzi et al. (1964). É quase certo que as taxas de reforço diferiram quando os atra- sos foram aumentados na primeira parte do experimento e na presença e na ausência de um estímulo na segunda parte. Pesqui- sas posteriores, no entanto, mostraram que diferenças na taxa de reforços geralmente não explicavam as diferenças nas taxas de resposta observadas quando durações de atraso são alteradas (Lattal, 1982; Richards, 1981; Sizemore & Lattal, 1978). Lattal e Gleeson (1990) utilizaram um procedimento semelhante aos de Skinner (1938) e Azzi et al. (1964) para investigar a aquisição de responder por ratos e pombos experimentalmente ingênuos sob atrasos do reforço não sinalizados e resetáveis e não resetáveis quando a resposta operan- te não havia sido modelada ou treinada de alguma forma, mas deixada para se desen- volver sem qualquer intervenção por parte dos investigadores. Responder robusto se desenvolveu sob estas condições, atestan- do o poder de reforço atrasado no desen- volvimento e manutenção comportamento operante. Esta é outra maneira de dizer que o reforço imediato não é necessário para que a aprendizagem ocorra. Dito isto, no entanto, o reforço imediato resulta em um responder muito mais robusto. É uma ques- tão em aberto se a aquisição de respostas é “mais rápida” com reforços imediatos vs. atrasados das respostas. CONSIDERAÇÕES FINAIS O atraso do reforço é um dos princi- pais parâmetros que afetam a eficácia dos reforços no desenvolvimento e na manu- tenção do comportamento (Kimble, 1961). Por esta razão, o seu papel, tanto sozinho como em combinação com outros parâme- tros do reforço, tal como magnitude dos re- forços, foi investigado extensivamente. Um dos resultados dessas análises de interações é o desconto do atraso, em que sistematica- mente aumentar atrasos do reforço parare- forços de maior magnitude ou probabilida- de enquanto o atraso para outro reforço de menor magnitude ou probabilidade é fixo permite determinar, entre outras coisas, o ponto de indiferença em que uma das duas alternativas é igualmente provável de ser escolhida (ver Green, Myerson, & Vander- veldt de 2014, para um resumo recente des- tes resultados). Estudos sobre desconto do atraso oferecem insights sobre como dife- rentes combinações de parâmetros de re- forço podem ser dimensionados. Da mesma forma, o atraso do reforço (às vezes também chamado de “gratificação” em experimen- tos não analítico-comportamentais sobre o fenômeno) desempenha um papel impor- tante no desenvolvimento de estratégias de auto-gerenciamento ou de auto-controle. Na verdade, a base desta área de pesquisa e aplicação é a análise experimental de atraso do reforço. Uma outra área em que as pesqui- sas sobre atraso do reforço tem sido impor- Capítulo II | Atraso do Reforço 45 tantes é o estudo do reforço condicionado. Uma teoria fundamental sobre esse tipo re- forço é a teoria da redução do atraso (delay reduction theory), que sugere que estímulos funcionam como reforçadores na medida em que eles indicam uma redução do tem- po de acesso ao reforço primário (Fantino, 1977). As lições do atraso do reforço não fo- ram perdidas na análise do comportamento aplicada, onde a importância da imediati- cidade do reforço seguindo o comporta- mento apropriado continua, com razão, sendo enfatizada. Embora reforço imediato possa ser o ideal no tratamento e na ges- tão do comportamento humano de manei- ra geral, muitos comportamentos humanos são mantidos apesar de seus reforços serem atrasados a partir das respostas que os pro- duzem. A pesquisa básica sobre atraso do reforço sugere uma série de condições sob as quais os atrasos reduzirão (e.g., atrasos mais longos ou não sinalizados) ou não (e.g., atrasos mais mais curtos ou sinalizados) o responder, mas poucas pesquisas aplicadas tem sido realizadas para expandir estes re- sultados e investigar como eles podem es- tar relacionados a programas de tratamen- to (mas cf. Stromer, McComas, & Rehfeldt, 2000). Uma questão particularmente impor- tante e não resolvida na análise do atraso do reforço com humanos tanto na pesquisa como em contextos aplicados é a questão da mediação do comportamento durante os atrasos pelo comportamento verbal. Ambos Ferster (1953) e Azzi et al. (1964) sugeriram que o comportamento é mantido durante os atrasos do reforço na medida em que certos padrões de comportamento estereotipado surjem durante o atraso, o que resultaria numa cadeia de comportamento desen- volvendo de tal modo que a resposta que inicia o atraso é seguida por algum padrão regular de comportamento (não necessá- rio mas mantido por reforço acidental) que termina contiguamente com reforço. Tais cadeias supersticiosas, assim, garantiriam uma “conexão” entre a resposta operante inicial e o reforço no final do atraso. Tem sido sugerido que o comportamento verbal de humanos pode também mediar os atra- sos. Algo que uma pessoa faz agora pode não ter um efeito em uma hora, em um dia, ou até mais, mas os dois eventos per- manecem conectados e a pessoa continua a se engajar no comportamento que tem o reforço atrasado. Talvez isso esteja relacio- nado a coisas que ou a pessoa diz a si mes- mo ou outras pessoas a durante o interva- lo do atraso. Ou talvez não. Alguns críticos contemporâneos de tais interpretações do atraso do reforço baseadas em contiguidade têm sugerido que a proximidade temporal entre a resposta e reforço desempenha um papel relativamente menor na aquisição e manutenção de responder em comparação ao fato de que existe uma correlação geral entre a taxa de respostas e os reforços que resultam, imediatamente ou após atrasos (ver Baum, 1973). O experimento de Lattal e Gleeson (1990) descrito acima ilustra que Kennon A. Lattal 46 a aprendizagem pode ocorrer quando há apenas uma correlação entre a resposta e o reforço, mas não a contiguidade respos- ta-reforço. Este último ponto levanta uma questão mais ampla, sem resposta ainda, sobre se os reforços que ocorrem após um atraso são mais bem caracterizados como atrasados em relação à respostas específi- cas ou se são correlacionados com grupos de respostas organizadas como taxas de resposta ou tempo alocado à respostas de topografias particulares. Um último ponto, mas não menos importante, é que a partir de uma perspec- tiva histórica o experimento é importante porque é o primeiro de muitos relatos de pesquisa por analistas do comportamento brasileiros a ser publicado no Journal of the Experimental Analysis of Behavior. PARA SABER MAIS Commons, Mazur, Nevin, & Rachlin (1987). É um volume editado que apresenta uma série de perspectivas sobre o uso e as impli- cações do atraso do reforço para a compre- ensão do processo de reforçamento. Lattal (2010). fez uma revisão sobre a pes- quisa básica sobre atraso do reforço condu- zida na tradição analítico-comportamental de Skinner até o momento da publicação de sua revisão. Renner (1964). é uma importante revisão inicial sobre atraso do reforço a partir de uma perspectiva mais ampla das teorias da aprendizagem sobre o tema. Stromer, McComas, & Rehfeldt (2000). consideraram algumas implicações aplica- das de pesquisas sobre atraso do reforço. Tarpy & Sawabini (1974). analisaram criti- camente pesquisas sobre atraso do reforço conduzidas desde a publicação da revisão de Renner até a sua própria. REFERÊNCIAS Azzi, R., Fix, D. S. R., Keller, F. S., & Rocha e Silva, M. I. (1964). Exteroceptive control of response under delayed reinforcement. Journal of the Experimental Analysis of Behavior, 7, 159-162. Baum, W. M. (1973). The correlation-based law of effect. Journal of the Experimental Analysis of Behavior, 20, 137-153. Commons, M. L., Mazur, J., Nevin, J. A., & Rachlin, H. (Eds.) (1987). Quantitative stu- dies of operant behavior: The effect of delay and of intervening events on reinforcement value. New York: Erlbaum. Elcoro, M., & Lattal, K. A. (2011). Effects of unsignaled delays of reinforcement on fi- xed-interval schedule performance. Beha- vioural Processes, 88, 47-52. Capítulo II | Atraso do Reforço 47 Fantino (1977). Conditioned reinforcement, choice, and information. In W. K. Honig & J.E.R. Staddon (Eds.), Handbook of operant behavior (pp. 326-339). New York: Prentice Hall. Ferster, C. B. (1953). Sustained behavior un- der delayed reinforcement. Journal of Expe- rimental Psychology, 45, 218-224. Green, L., Myerson, J., & Vanderveldt, A. (2014). Delay and probability discounting. In F. K. McSweeney & E. S. Murphy (Eds.), The Wiley Blackwell handbook of operant and classical conditioning. Oxford: John Wiley & Sons. Guthrie, E. R. (1935). The psychology of lear- ning. New York: Harper. Hull, C. L. (1943). Principles of Behavior. New York: Appleton-Century Crofts. Jarmolowicz, D. P., & Lattal, K. A. (2013). De- lay of reinforcement and fixed-ratio perfor- mance. Journal of the Experimental Analy- sis of Behavior, 100, 370-395. Keller, F. S. (2008). At my own pace: The au- tobiography of Fred S. Keller. Cornwall on Hudson: Sloan Publishing. Kimble, G. A. (1961). Hilgard and Mar- quis’ Conditioning and Learning. New York: Appleton Century Crofts. Lattal, K. A. (1984). Signal functions in de- layed reinforcement. Journal of the Experi- mental Analysis of Behavior, 42, 239-253. Lattal, K.A. (2010). Delayed reinforcement of operant behavior. Journal of the Experi- mental Analysis of Behavior, 93, 129-139. Lattal, K. A., & Gleeson, S. (1990). Respon- se acquisition with delayed reinforcement. Journal of Experimental Psychology: Animal Behavior Processes, 16, 27-39. Lattal, K. A., & Ziegler, D. R. (1982). Briefly delayed reinforcement: An interresponse time analysis. Journal of the Experimental Analysis of Behavior, 37,407-416. Pierce, C. H., Hanford, P. V., & Zimmerman, J. (1972). Effects of different delay of reinforcement procedures on variable-in- terval responding. Journal of the Experi- mental Analysis of Behavior, 18, 141-146. Renner, K. E. (1964). Delay of reinforcement: A historical review. Psychological Review, 61, 341-361. Reilly, M.P., & Lattal, K.A. (2004). Progressi- ve delays to reinforcement. Journal of the Experimental Analysis of Behavior, 82, 21- 35. Richards, R. W. (1981). A comparison of sig- naled and unsignaled delay of reinforce- ment. Journal of the Experimental Analysis of Behavior, 35, 145-152. Kennon A. Lattal 48 Sizemore, O. J., & Lattal, K. A. (1978). Un- signaled delay of reinforcement in variable- -interval schedules. Journal of the Experi- mental Analysis of Behavior, 30, 169-175. Skinner, B. F. (1938). The behavior or orga- nisms: An experimental analysis. New York: Appleton Century Crofts. Spence, K. W. (1947). The role of secondary reinforcement in delayed reward learning. Psychological Review, 54, 1-8. Stromer, R, McComas, J. J., & Rehfeldt, R. A. (2000). Designing interventions that inclu- de delayed reinforcement: Implica- tions of recent laboratory research. Journal of Applied Behavior Analysis, 33, 359-371. Tarpy, R. M., & Sawabini, F. L. (1974). Rein- forcement delay: A selective review of the past decade. Psychological Bulletin, 81, 984-987. Thorndike, E. L. (1911). Animal intelligence. New York: MacMillan. Williams, B. A. (1991). Marking and bridging versus conditioned reinforcement. Animal Learning and Behavior, 19, 264-269. Wilson, M. P., & Keller, F. S. (1953). On the selective reinforcement of spaced respon- ses. Journal of Comparative and Physiologi- cal Psychology, 46, 190-193. Carlos Renato Xavier Cançado, Flávia Hauck, Ítalo S. C. Teixeira 49 Quando o passado retorna: ressurgência comportamental Carlos Renato Xavier Cançado Flávia Hauck Ítalo S. C. Teixeira Universidade de Brasília Epstein, R. (1983). Resurgence of previously reinforced behavior during extinction. Behaviour Analysis Letters, 3, 391-397. A fênix é uma ave da Arábia (...). Quando percebe que envelheceu, constrói uma fogueira para si (...) e encarando os raios do sol nascente, acende o fogo e o nutre batendo suas asas, e ressurge de suas próprias cinzas. (Isidoro de Sevilha, Etymologiae, Livro 12, 7:22) Capítulo III | Ressurgência Comportamental 50 INTRODUÇÃO À ÁREA DE PES- QUISA E CONTEXTUALIZAÇÃO DO EXPERIMENTO É bem provável que você tenha se encontrado em uma situação em que teve que resolver um problema como, por exem- plo, responder corretamente a um exercí- cio de cálculo, abrir uma porta emperrada, ou escrever um texto sobre um tema com o qual você tem pouca familiaridade. Você “não sabe o que fazer”. Um problema pode ser apenas uma situação em que seu com- portamento não modifica o ambiente de maneira eficiente, isto é, seu comporta- mento não produz consequências. É o que os analistas do comportamento chamam de extinção. Além da redução na frequência de determinadas respostas, um outro efei- to da extinção é o aumento na variabilida- de da topografia das respostas (Antonitis, 1951). Você tenta fazer coisas diferentes, comportar-se de outras maneiras para ten- tar resolver o problema. Parte do que você faz nesse momento é, comumente, algo bem parecido com o que você fez no passa- do (talvez mesmo em um passado remoto) e que, nesse passado, “deu certo”. É parte de sua história comportamental. É sobre essa variação comportamental que o ambiente irá operar, selecionando o que é usualmen- te descrito como a “solução do problema”, possivelmente um “comportamento novo” ou “criativo” (Epstein, 1996; ver especial- mente, Skinner, 1981, 1984). Em situações nas quais comporta- mentos atuais deixam de produzir conse- quências, comportamentos previamente reforçados tendem a recorrer, um fenôme- no que analistas do comportamento de- nominam de ressurgência (Epstein, 1983, 1985). Embora a ressurgência tivesse sido descrita anteriormente na literatura cientí- fica (e.g., Carey, 1951; Leitenberg, Rawson & Bath, 1970; Leitenberg, Rawson & Mulick, 1975; ver Epstein, 2015), o estudo sistemá- tico desse fenômeno intensificou-se nos anos 1980, especialmente após a publicação do artigo de Epstein (1983), cujo experimen- to é descrito nesse capítulo. Nesse artigo, Epstein usa um termo específico para des- crever a recorrência de comportamentos previamente reforçados durante a extinção de outros comportamentos (i.e., ressurgên- cia; ver também Epstein & Skinner, 1980), define o fenômeno, descreve um proce- dimento para sua análise experimental, e levanta diversas questões de pesquisa que serviram de base para a condução de expe- rimentos sobre a ressurgência desde então (ver Lattal & St Peter Pipkin, 2009; e Pontes & Abreu-Rodrigues, 2015, para revisões da literatura). No início de seu artigo, Epstein (1983) define a ressurgência da seguinte maneira: “Quando, numa dada situação, um com- portamento reforçado recentemente deixa de ser reforçado, comportamentos ante- riormente reforçados em condições seme- lhantes tendem a recorrer” (p. 391; itálicos adicionados). Essa definição pode parecer Carlos Renato Xavier Cançado, Flávia Hauck, Ítalo S. C. Teixeira 51 geral demais, algo que talvez pudesse ter sido descrito por meio da observação casu- al do comportamento no cotidiano, sem re- correr a equipamentos especiais, sem con- duzir experimentos, e sequer pensar em ir ao laboratório. Por quê recorrer a uma situ- ação simplificada no laboratório quando o fenômeno pode ser observado no compor- tamento de humanos e não humanos em ambientes não laboratoriais? Mas é exata- mente essa simplificação do laboratório em relação a ambientes não laboratoriais, con- duzida por meio do controle experimental de variáveis, que queremos quando nosso objetivo é descrever princípios comporta- mentais. A análise experimental permite uma descrição mais precisa do fenôme- no investigado e dos fatores que o levam a ocorrer (i.e., suas variáveis de controle). Se você conhece as variáveis que determinam um fenômeno, pode prevê-lo com maior precisão se você sabe que essas variáveis estão em vigor. Além disso, se você pode manipular essas variáveis, pode fazer com que o fenômeno ocorra ou deixe de ocor- rer (Skinner, 2003/1953). É essa a princi- pal função de uma análise experimental do comportamento e não seria diferente em relação ao estudo da ressurgência. Vejamos, então, como foi a análise experimental da ressurgência conduzida por Epstein. DESCRIÇÃO DO EXPERIMENTO Objetivo e Método O objetivo de Epstein (1983) era ana- lisar experimentalmente a ressurgência, isto é, a recorrência de comportamentos previamente reforçados quando comporta- mentos atuais deixavam de ser reforçados. Metodologicamente, seria necessário que uma resposta específica (a resposta alvo) fosse inicialmente reforçada. Em uma se- gunda fase, a resposta alvo deixaria de pro- duzir reforços e uma outra resposta (a res- posta alternativa) seria reforçada. Em uma terceira fase, a resposta alvo continua a não produzir reforços e a ressurgência dessa resposta poderia ser verificada quando a resposta alternativa deixasse de produzir reforços. Na literatura experimental, o pro- cedimento para o estudo da ressurgência é descrito comumente como um “procedi- mento de três fases” e a primeira, a segun- da e a terceira fases do procedimento são denominadas fases de Treino, Eliminação (ou Reforçamento Alternativo) e Teste, res- pectivamente. Embora Epstein não tenha feito uso desses termos, eles serão utiliza- dos nesse capítulo para descrever as fases de seu procedimento. Independente dos nomes que demos ao procedimento e às fases experimentais, o que deve ser destacado é que Epstein (1983) precisou construir, em laboratório, uma história comportamental remota (i.e., a resposta alvofoi reforçada), uma histó- ria comportamental recente (i.e., a respos- ta alvo deixou de ser reforçada e apenas a resposta alternativa passou a produzir re- forços) e também modificar o ambiente de seus sujeitos em um teste (i.e., a resposta Capítulo III | Ressurgência Comportamental 52 alternativa também deixou de produzir re- forços) para verificar se, e como, a ressur- gência das respostas alvo ocorreria. O experimento foi conduzido com seis pombos, experimentalmente ingênu- os, mantidos a 80% de seu peso livre por meio de um regime de privação de comida. Como os experimentos sobre ressurgência são experimentos sobre os efeitos de uma história remota sobre o comportamento atual, o fato de os pombos terem sido ex- perimentalmente ingênuos foi um aspecto importante de controle experimental. Os resultados poderiam ser diferentes (ou mes- mo de difícil interpretação) se os pombos já tivessem uma determinada história no am- biente experimental escolhido por Epstein. O procedimento de privação de comida é uma operação estabelecedora ou motiva- dora (Miguel, 2000; ver também Laraway, Snycerski, Michael & Poling, 2003), neces- sária para estabelecer o acesso à comida no ambiente experimental como consequência e permitir que determinadas respostas se- jam selecionadas e mantidas durante o ex- perimento. O equipamento utilizado no experi- mento foi uma câmara de condicionamento operante para pombos (as sessões experi- mentais eram conduzidas com cada pombo individualmente). Um dos painéis da câ- mara continha dois discos de resposta, lo- calizados à direita e à esquerda no painel e separados por 12 cm, e um comedouro loca- lizado entre os discos (os discos de resposta usualmente são de plástico e têm 2 cm de diâmetro; respostas de bicar o disco fecham um circuito elétrico que permite o registro automático das respostas). Quando acio- nado, o comedouro dava acesso a grãos por 3 s (i.e., reforços). Em cada fase do experi- mento, descritas a seguir, as sessões expe- rimentais duravam 60 min e o registro das respostas foi feito por meio de um micro- computador, de registradores cumulativos, e também de filmagens das sessões expe- rimentais feitas com uma câmera de vídeo. Fase de Treino: o objetivo dessa fase foi estabelecer a resposta alvo. Para três pombos, a resposta alvo consistiu em bicar o disco da direita e, para os outros três, o disco da esquerda. A resposta alvo foi man- tida sob um esquema de reforçamento in- tervalo variável (VI) 60 s. Sob esse esque- ma, a primeira resposta após um intervalo médio de 60 s produz reforços (os intervalos entre reforços variam e sua média é igual a 60 s; os intervalos são selecionados alea- toriamente em uma sessão). Esse esquema produz uma taxa de respostas moderada e constante e, por essa razão, é muito usado para o estabelecimento de linhas de base comportamentais em análise experimental do comportamento. Essa fase teve a dura- ção de 15 a 49 sessões, entre pombos, e ter- minou quando a taxa de respostas de cada pombo fosse estável (embora Epstein, 1983, não defina precisamente seu critério de es- tabilidade, comumente exige-se que os su- jeitos sejam expostos às condições por um número mínimo de sessões e que não haja Carlos Renato Xavier Cançado, Flávia Hauck, Ítalo S. C. Teixeira 53 tendências crescentes ou decrescentes na taxa de respostas por algumas sessões con- secutivas). Fase de Eliminação: o objetivo des- sa fase foi reduzir a frequência da respos- ta alvo e reforçar uma resposta alternati- va. Na etapa inicial dessa fase, para cada pombo, a resposta alvo deixou de produzir reforços (i.e., extinção estava em vigor). O número de sessões em que a resposta alvo esteve em extinção variou para cada pom- bo, entre uma e 12 sessões. A etapa final dessa fase ocorreu em uma sessão de 60 min. Nessa sessão, o procedimento de ex- tinção da resposta alvo esteve em vigor por pelo menos 30 min e até que nenhuma res- posta alvo ocorresse por 10 min consecuti- vos, para cada pombo. Então, foi reforçada uma resposta alternativa cuja topografia era incompatível com bicar o disco. A topo- grafia da resposta alternativa variou entre pombos: para um pombo, por exemplo, a resposta alternativa consistiu em virar para a esquerda; para outro pombo, em abaixar a cabeça; para outro, em levantar a asa. A resposta alternativa foi reforçada 20 vezes em um esquema de razão fixa (FR) 1. Sob esse esquema cada ocorrência da resposta alternativa produzia o reforço. Após a pro- dução de 20 reforços pela resposta alterna- tiva, ainda nessa mesma sessão, teve início a fase de Teste. Fase de Teste: nessa fase, para cada pombo, os reforços para a resposta alterna- tiva foram descontinuados. É importante destacar que, durante essa fase, a resposta alvo também não produzia reforços. Essa fase esteve em vigor até o término da sessão de 60 min e teve a duração de aproximada- mente 10 min para cada pombo. Ressurgência seria evidenciada caso ocorresse um aumento na frequência da resposta alvo na fase de Teste em relação à frequência dessa mesma resposta na etapa final da fase de Eliminação. Mas vejamos alguns aspectos do procedimento de Eps- tein (1983) que qualificam (em seu experi- mento, e em qualquer experimento sobre ressurgência) a descrição de um aumento na frequência de respostas alvo durante a fase de Teste como ressurgência. Aspectos do controle experimental: vale destacar alguns aspectos importan- tes de controle experimental adotados por Epstein (1983). Lembre-se que a câmara de condicionamento operante tinha dois dis- cos de resposta. Bicar um desses discos foi definido como a resposta alvo. Respostas de bicar o outro disco nunca produziram reforços durante o experimento, mas foram registradas e serviram como respostas con- trole. A comparação da frequência de res- postas alvo e respostas controle na fase de Teste permite diferenciar a ressurgência da variabilidade no comportamento induzida pela extinção. Sem o registro de uma res- posta controle, um aumento na frequência da resposta alvo na fase de Teste, que seria descrita como ressurgência, poderia sim- plesmente ser um exemplo de variabilida- Capítulo III | Ressurgência Comportamental 54 de induzida pela extinção. No entanto, se o aumento na frequência da resposta alvo na fase de Teste fosse maior do que a frequên- cia da resposta controle, isso seria evidên- cia de que a ressurgência é função da histó- ria de reforçamento estabelecida na fase de Treino e não apenas induzida pela extinção. Portanto, a ressurgência é definida opera- cionalmente no experimento de Epstein como um aumento na frequência da res- posta alvo durante a fase de Teste (i.e., em relação à frequência dessa mesma resposta durante a etapa final da fase de Elimina- ção) que fosse maior do que a frequência da resposta controle nessa mesma fase. Um outro aspecto de controle ex- perimental importante do experimento de Epstein (1983) é o fato de a etapa final da fase de Eliminação e a fase de Teste terem sido conduzidas na mesma sessão. Quando uma resposta está em extinção, é comum observarmos um fenômeno de recorrência chamado de recuperação espontânea (des- crito por Pavlov, e.g., Pavlov, 1927, no estu- do da extinção respondente; o fenômeno é também observado na extinção operante). A recuperação espontânea caracteriza-se por um aumento na frequência de respostas no início de uma sessão de extinção em re- lação a frequência dessas respostas no final da sessão de extinção imediatamente ante- rior. Portanto, se a transição entre a fase de Eliminação e a fase de Teste ocorresse entre sessões no experimento de Epstein, não teríamos como dissociar a eventual ressurgência da resposta alvo no início da fase de Teste do fenômeno de recuperação espontânea (lembre-se que a resposta alvo estava em extinção durante toda a fase de Eliminação, e também durante a fase de Teste). Como a transiçãoentre as fases de Eliminação e Teste no experimento de Eps- tein ocorreu na mesma sessão, um aumen- to na frequência da resposta alvo no Teste seria mais precisamente descrito como res- surgência e não como recuperação espon- tânea. Finalmente, vale apontar que Epstein (1983) conduziu a extinção da resposta alvo, na fase de Eliminação, antes do reforça- mento da resposta alternativa (e.g., Bruzek, Thompson & Peters, 2009; Lieving & Lattal, 2003). Isso foi feito para garantir que a fre- quência da resposta alvo era baixa quando as respostas alternativas fossem reforçadas. No entanto, são comuns experimentos so- bre ressurgência nos quais a extinção da resposta alvo e o reforçamento da resposta alternativa ocorrem simultaneamente na fase de Eliminação (e.g., Cançado & Lattal, 2011; da Silva, Maxwell & Lattal, 2008; Po- dlesnik, Gimenez-Gomez & Shahan, 2006). Resultados e Discussão Como apontado anteriormente, o número de sessões na fase de Treino e na etapa inicial da fase de Eliminação variou entre pombos. Na fase de Treino, entre pombos, de 11 a 49 sessões foram conduzi- das; na etapa inicial da fase de Eliminação, de 1 a 12 sessões foram conduzidas. Carlos Renato Xavier Cançado, Flávia Hauck, Ítalo S. C. Teixeira 55 Infelizmente, Epstein (1983) não apresentou dados da fase de Treino. Como essa fase foi conduzida até que a taxa de respostas alvo de cada pombo fosse está- vel, temos que assumir que foi isso o que aconteceu. A taxa de respostas alvo, para cada pombo, estava próxima de zero quan- do teve início o reforçamento das respostas alternativas. Assim, Epstein demonstrou que a exposição à extinção durante a etapa inicial da fase de Eliminação reduziu consi- deravelmente a taxa de respostas alvo antes que as respostas alternativas começassem a ser reforçadas. Na etapa final da fase de Eliminação, a taxa de respostas alternativas aumentou para cada pombo e a taxa de respostas alvo permaneceu próxima de zero. Finalmente, quando os reforços para respostas alterna- tivas foram descontinuados na fase de Tes- te, a frequência dessas respostas diminuiu e observou-se um aumento na ocorrência da resposta alvo para cada pombo. Isto é, a ressurgência de uma resposta previamente reforçada ocorreu quando a resposta alter- nativa estava em extinção. A magnitude da ressurgência (i.e., o quanto a taxa de respos- tas aumentou na fase de Teste em relação à fase de Eliminação) variou entre os pombos e aparentemente não foi influenciada pelo número de sessões conduzidas nas fases de Treino e Eliminação. A condução da etapa final da fase de Eliminação e da fase de Teste em uma mes- ma sessão (Epstein, 1983) permite afirmar que o aumento na frequência de respos- tas alvo durante a fase de Teste não foi um exemplo de recuperação espontânea. Além disso, o registro das respostas controle per- mite afirmar que esse aumento na frequên- cia de respostas alvo durante a fase de Teste não pode ser descrito simplesmente como variabilidade no comportamento induzida pela extinção. Para cada pombo, o aumen- to na frequência da resposta alvo na fase de Teste foi maior do que a frequência de res- postas controle nessa mesma fase (apenas um pombo emitiu uma resposta controle na fase de Teste). Portanto, podemos afirmar que a ressurgência é produto da história re- mota de reforçamento estabelecida na fase de Treino. O fato de a resposta alvo e a res- posta controle terem topografias semelhan- tes (ambas são respostas de bicar um disco, e os discos estavam próximos um do outro na câmara de condicionamento) torna esse aspecto do procedimento ainda mais rele- vante e ressalta a importância da história do organismo em determinar qual compor- tamento irá ocorrer (ou recorrer) quando a extinção estiver em vigor. Epstein (1983) destaca, contudo, que a condução da etapa final da fase de Elimi- nação e da fase de Teste em uma mesma sessão tem implicações para interpretarmos seus resultados. Nesse contexto, ele faz re- ferência a outro fenômeno de recorrência, o restabelecimento (Reid, 1958; Franks & Lattal, 1976). O restabelecimento é a recor- rência de respostas previamente reforçadas quando, em uma fase de Teste, a resposta Capítulo III | Ressurgência Comportamental 56 alvo está em extinção, mas os reforços são apresentados independentemente das res- postas do organismo. O restabelecimento evidencia o controle discriminativo do pró- prio reforço como variável que influencia a recorrência de respostas. No experimento de Epstein, a etapa final da fase de Elimi- nação foi conduzida por um período rela- tivamente curto (o tempo necessário para a emissão de 20 respostas alternativas), na mesma sessão em que, posteriormente, a fase de Teste foi conduzida. É possível, portanto, que a ressurgência observada para cada pombo nesse experimento tenha sido parcialmente induzida pela ocorrência de reforços na etapa final da fase de Elimi- nação (lembre-se que 3 s de acesso a grãos serviram como reforços para as respostas alvo, na fase de Treino, e para as respostas alternativas, na fase de Eliminação). No en- tanto, vale ressaltar que, para cada pombo, a ressurgência foi observada no experimento de Epstein apenas quando os reforços para a resposta alternativa foram descontinua- dos, e não enquanto esses reforços estavam sendo produzidos. Além disso, experimen- tos subsequentes demonstraram que a res- surgência ocorre mesmo quando a fase de Eliminação é conduzida por várias sessões de duração mais longa do que aquela pro- gramada por Epstein (e.g., Lieving & Lattal, 2003; Podlesnik et al., 2006; Podlesnik & Shahan, 2009) e quando a transição entre as fases de Eliminação e Teste ocorre não na mesma sessão, mas entre sessões. Nes- se último caso, não há reforços disponíveis para qualquer resposta durante toda a fase de Teste. DESDOBRAMENTOS A beleza de uma ciência experimen- tal é que os resultados de um experimen- to respondem algumas perguntas, mas le- vantam uma série de novas perguntas que requerem estudos adicionais. Ao discutir seus resultados, Epstein (1983) afirmou que muitas variáveis poderiam influenciar a ressurgência como, por exemplo, os esque- mas de reforçamento que mantêm a respos- ta alvo e a resposta alternativa, o tipo e a magnitude dos reforços que mantêm essas respostas, a duração das fases de Treino e de Eliminação (i.e., o tempo em que respos- tas alvo e alternativa são reforçadas) e tam- bém as condições em que a resposta alvo foi extinta (i.e., o número de sessões) e a taxa de respostas alvo antes do reforçamento da resposta alternativa. Além disso, ele suge- riu que o fenômeno da ressurgência esta- ria possivelmente envolvido no que cha- mamos de criatividade e de resolução de problemas. Com essas afirmações, Epstein levantou uma série de questões que pode- riam ser experimentalmente investigadas e ressaltou a utilidade do conhecimento so- bre o fenômeno da ressurgência para a aná- lise de outros padrões comportamentais. Os resultados de Epstein (1983) têm sido replicados em diversos laboratórios desde então, com diferentes espécies (e.g., ratos, Podlesnik et al., 2006; humanos, Wil- Carlos Renato Xavier Cançado, Flávia Hauck, Ítalo S. C. Teixeira 57 son & Hayes, 1996; peixes, da Silva, Cança- do & Lattal, 2014) e com algumas modifica- ções do procedimento descrito pelo autor (ver Pontes e Abreu-Rodrigues, 2015). As variáveis que possivelmente influencia- riam a ressurgência, indicadas por Epstein e descritas anteriormente, vêm sendo estu- dadas sistematicamente desde então. Dife- rente do que indicaram os resultados de seu experimento (Epstein, 1983), alguns estudos sugerem que o número de sessões na fase de Treino pode influenciar a magnitude da ressurgência. Ressurgência de maior mag- nitude tende a ocorrer quando a fase de Treino é conduzida por um número maior de sessões (e.g., Bruzek et al., 2009; Dou- ghty, Cash, Finch, Holloway & Wallington,2010). No entanto, resultados inconsisten- tes entre estudos têm sido obtidos quando a duração da fase de Eliminação é manipu- lada. Em alguns estudos, a magnitude da ressurgência foi maior quando a duração da fase de Eliminação foi menor (e.g., Lei- tenberg, et al., 1975; ver também Sweeney & Shahan, 2013b). Em outros estudos, a dura- ção da fase de Eliminação não influenciou a magnitude da ressurgência (e.g., Lieving & Lattal, 2003, Winterbauer, Lucke & Bouton, 2013). Hoje sabemos que a ressurgência é um fenômeno replicável interssujeitos e também intrassujeitos (i.e., após a exposi- ção repetida dos mesmos sujeitos ao pro- cedimento de três fases; e.g., Cançado & Lattal, 2011; Lieving & Lattal, 2003). Além disso, sabemos que a magnitude da ressur- gência é influenciada pela taxa de reforços em vigor nas fases de Treino (Podlesnik & Shahan, 2009, 2010) e Eliminação (Cança- do, Abreu-Rodrigues & Aló, 2015; Sweeney & Shahan, 2013a). Em geral, taxas altas de reforços nessas duas fases produzem res- surgência de maior magnitude do que ta- xas baixas de reforços. Temos também evidências que unidades comportamentais mais complexas, como diferentes padrões temporais de resposta (Cançado & Lattal, 2011) e sequências espaciais de respostas (Sánchez-Carrasco & Nieto, 2005; Reed & Morgan, 2006) ressurgem assim como respostas discretas como bicar um disco, pressionar uma barra ou um botão de res- postas. Esse último achado pode ser rele- vante para interpretar resultados de alguns estudos que mostram que ressurgência de maior magnitude é observada quando, na fase de Treino, a resposta alvo ocorre em taxas altas do que quando ocorre em taxas baixas (da Silva, et al., 2008; Reed & Mor- gan, 2007). O que esses últimos resultados podem indicar é a ressurgência de padrões diferentes de respostas (i.e., taxas altas e ta- xas baixas) estabelecidos na fase de Treino. Por fim, vale ressaltar que a ressurgência de respostas mantidas por contingências de reforçamento negativo (ao invés de contin- gências de reforçamento positivo, como no experimento de Epstein) tem sido demons- trada com humanos no laboratório (Bruzek et al., 2009; Alessandri, Lattal & Cançado, 2015) e em ambientes não laboratoriais (e.g., Volkert, Lerman, Call & Trosclair-Lasserre, 2009). Capítulo III | Ressurgência Comportamental 58 Epstein (1983) destacou a relevância do fenômeno da ressurgência para a análise de fenômenos como a criatividade e a re- solução de problemas (ver também Epstein, 1996). Mas a ressurgência pode ser relevan- te também para compreender outros fenô- menos, como, por exemplo, a recaída (e.g., de comportamentos mantidos por drogas, Podlesnik et al., 2006; ou de outros compor- tamentos de relevância aplicada; Lieving, Hagopian, Long & O’Connor, 2004; ver também, Bouton, 2011; Podlesnik & Kelley, 2015; e St Peter, 2015). Se você pensar no procedimento de três fases para o estudo da ressurgência, verá que o procedimento se adequa bem como um modelo experimen- tal para o estudo da recaída. No laborató- rio com não humanos, por exemplo, pode- mos reforçar as respostas alvo com drogas na fase de Treino (e.g., álcool, Podlesnik et al.; ou cocaína Quick, Pyszczynski, Colston & Shahan, 2011) e as respostas alternativas com comida, na fase de Eliminação (a fase de Teste consistiria, assim como no estu- do de Epstein, em descontinuar a comida que mantém as respostas alternativas). Em contextos aplicados, a resposta alvo pode ser um comportamento problema cuja fre- quência temos interesse em reduzir (e.g., agressão, autoagressão, abuso de drogas e outras substâncias) e respostas alternativas são comumente aquelas mais apropriadas para o contexto em que vive o participante e que resultam de uma intervenção com- portamental como reforçamento diferen- cial de respostas alternativas (Marsteller & St Peter, 2014; Volkert et al., 2009). Recentemente, esforços de pesquisa- dores e pesquisadoras em contextos labo- ratoriais e não laboratoriais têm produzido achados interessantes sobre a ressurgência. Esses achados não apenas aumentam nosso conhecimento sobre o fenômeno, mas ser- vem como base para lidar com o fenômeno nos mais diversos contextos. Consideran- do-se a data de publicação do experimen- to de Epstein (1983), a área de pesquisas sobre ressurgência é relativamente jovem. A ressurgência é um tema desafiador – é um fenômeno transitório (Sidman, 1960) e, como qualquer fenômeno transitório, exige esforço de pesquisadores e pesquisadoras na elaboração das melhores condições para seu estudo. Análises experimentais siste- máticas dos efeitos de variáveis de controle já conhecidas sobre a ressurgência são in- teressantes e necessárias. Ao conduzirmos tais análises, certamente descobriremos novas variáveis de controle e relações entre essas variáveis na determinação da ressur- gência. CONSIDERAÇÕES FINAIS Por quê estudar a ressurgência, ou a recorrência do comportamento de maneira geral, é interessante? Primeiramente, trata- -se de um fenômeno natural e seu estudo, por si só, se justifica. Além disso, é útil co- nhecer suas variáveis de controle para al- terar sua probabilidade de ocorrência onde quer que isso seja necessário. Há contextos em que a recorrência de comportamentos Carlos Renato Xavier Cançado, Flávia Hauck, Ítalo S. C. Teixeira 59 é indesejável, mas ocorrem mesmo assim (e.g., a recorrência de comportamentos-pro- blema e a recaída). Há outros contextos em que seria desejável e pode não ocorrer (e.g., em contextos de resolução de problemas e quando temos interesse no estabelecimento de comportamentos novos). No início de seu artigo, Epstein (1983) afirma que o fato que comportamentos pre- viamente reforçados tendem a recorrer quando comportamentos atuais deixam de produzir reforços (i.e., ressurgência) teria “um potencial de aplicação amplo” (p. 391). Talvez apenas recentemente, dado o acu- mulo de evidências experimentais sobre o fenômeno, tenhamos passado a explorar mais as implicações do estudo da ressur- gência para uma análise experimental do comportamento e para a aplicação dos prin- cípios comportamentais em contextos não laboratoriais. Durante aproximadamente 20 anos, desde a publicação do trabalho de Epstein até a publicação de uma série de experimentos conduzidos por Lieving e Lattal (2003), estudos sobre a ressurgência foram escassos e envolveram comumente a análise de condições em que o fenômeno ocorre ou não (ver Pontes & Abreu-Rodri- gues, 2015). Recentemente, contudo, aná- lises experimentais sistemáticas têm sido direcionadas à descrição de variáveis que alteram não apenas a ocorrência da ressur- gência, mas também sua magnitude. Um maior refinamento experimental permite descrever não apenas quando o fenômeno irá ocorrer, mas também especificar como e em que grau o fenômeno será observado. Essa é uma tarefa que aguarda aqueles in- teressados na ressurgência e na recorrência de comportamentos em geral. PARA SABER MAIS Lieving & Lattal (2003). Série de quatro ex- perimentos conduzidos com pombos. Uma das primeiras análises experimentais sis- temáticas sobre a ressurgência conduzida após a publicação do experimento de Eps- tein (1983). Podlesnik, Gimenez-Gomez, & Shahan (2006). Experimento conduzido com ratos sobre a ressurgência de comportamentos previamente mantidos por álcool. Os auto- res apresentam nesse artigo o procedimen- to para o estudo da ressurgência como um modelo experimental da recaída. Podlesnik & Shahan (2009). Nesse artigo, os efeitos sobre a ressurgência de taxas de reforços diferenciais na fase de Treino (as- sim como sobre outros fenômenos de recor- rência, como o restabelecimento e a reno- vação) são avaliados. Os autores propõem uma relação entre as variáveis que deter- minam a ressurgência (e a recorrência em geral) e a resistência do comportamento à mudança. Bruzek, Thompson, & Peters (2009). Emdois experimentos conduzidos com hu- manos, a ressurgência de comportamentos Capítulo III | Ressurgência Comportamental 60 mantidos previamente por contingências de reforçamento negativo (fuga) foi estuda- da. Cançado, Abreu-Rodrigues, & Aló (2015). Em dois experimentos conduzidos com ra- tos, os efeitos sobre a ressurgência de taxa de reforços diferenciais na fase de Elimina- ção foram avaliados parametricamente. REFERÊNCIAS Alessandri, J., Lattal, K. A., & Cançado, C. R. X. (2015). The recurrence of negatively reinforced responding of humans. Journal of the Experimental Analysis of Behavior, 104, 211–222. Antonitis, J. J. (1951). Response variability in the white rat during conditioning, extinc- tion, and reconditioning. Journal of Experi- mental Psychology, 42, 273-281. Bouton, M. E. (2011). Learning and the per- sistence of appetite: Extinction and the motivation to eat and overeat. Physiology & Behavior, 103, 51–58. Bruzek, J. L., Thompson, R. H., & Peters, L. C. (2009). Resurgence of infant caregi- ving responses. Journal of the Experimental Analysis of Behavior, 92, 327-343. Cançado, C. R. X., Abreu-Rodrigues, J., & Aló, R. M. (2015). Reinforcement rate and resurgence: A parametric analysis. Revista Mexicana de Análisis de la Conducta, 41, 84-115. Cançado, C. R. X., & Lattal, K. A. (2011). Re- surgence of temporal patterns of respon- ding. Journal of the Experimental Analysis of Behavior, 95, 271-287. Carey, J. P. (1951). Reinstatement of previou- sly learned responses under conditions of extinction: A study of “regression” [Abs- tract]. American Psychologist, 6, 284. da Silva, S. P., Cançado, C. R. X., & Lattal, K. A. (2014). Resurgence in Siamese fighting fish, Betta splendens. Behavioural Proces- ses, 103, 315-319. da Silva, S. P., Maxwell, M. E., & Lattal, K. A. (2008). Concurrent resurgence and beha- vioral history. Journal of the Experimental Analysis of Behaviour, 90, 313-331. Doughty, A. H., Cash, J. D., Finch, E. A., Holloway, C., & Wallington, L. K. (2010). Ef- fects of training history on resurgence in humans. Behavioural Processes, 83, 340- 343. Epstein, R. (1983). Resurgence of previou- sly reinforced behavior during extinction. Behaviour Analysis Letter, 3, 391–397. Epstein, R. (1985). Extinction-induced re- surgence: Preliminary investigations and possible applications. The Psychological Re- cord, 35, 143-153. Carlos Renato Xavier Cançado, Flávia Hauck, Ítalo S. C. Teixeira 61 Epstein, R. (1996). Cognition, creativity & behavior: Selected essays. Westport, CT: Praeger Epstein, R. (2015). On the rediscovery of the principle of resurgence. Revista Mexicana de Análisis de la Conducta, 41, 19-43. Epstein, R., & Skinner, B. F. (1980). Resur- gence of responding after the cessation of response-independent reinforcement. Pro- ceedings of the National Academy of Scien- ces of the United States of America, 77, 6251- 6253. Franks, G. J, & Lattal, K. A. (1976). Antece- dent reinforcement schedule training and operant response reinstatement in rats. Animal Learning & Behavior, 4, 374-378. Laraway, S., Snycerski, S., Michael, J., & Poling, A. (2003). Motivating operations and terms to describe them: Some further refinements. Journal of Applied Behavior Analysis, 36, 407-414. Lattal, K. A., & St. Peter Pipkin, C. (2009). Resurgence of previously reinforced res- ponding: Research and application. The Behavior Analyst Today, 10, 254-266. Leitenberg, H., Rawson, R. A., & Bath, K. B. (1970). Reinforcement of competing beha- vior during extinction. Science, 169, 301- 303. Leitenberg, H., Rawson, R. A., & Mulick, J. A. (1975). Extinction and reinforcement of alternative behavior. Journal of Compara- tive and Physiological Psychology, 88, 640- 652. Lieving, G. A., Hagopian, L. P., Long, E. S., & O’Connor, J. (2004). Response-class hie- rarchies and resurgence of severe problem behavior. The Psychological Record, 54, 621–634. Lieving, G. A, & Lattal, K. A. (2003). Recen- cy, repeatability, and reinforcer retrench- ment: An experimental analysis of resur- gence. Journal of the Experimental Analysis of Behavior, 80, 217-233. Marsteller, T. M., & St Peter, C. C. (2014). Ef- fects of fixed-time reinforcement schedules on resurgence of problem behavior. Journal of Applied Behavior Analysis, 47, 455-469. Miguel, C. F. (2000). O conceito de opera- ção estabelecedora na análise do compor- tamento. Psicologia: Teoria e Pesquisa, 16, 259-267. Pavlov, I. P. (1927). Conditioned reflexes: An investigation of the physiological activity of the cerebral cortex. Londres: Oxford Uni- versity Press. Podlesnik, C. A, Jimenez-Gomez, C., & Shahan, T. A. (2006). Resurgence of alcohol seeking produced by discontinuing non- -drug reinforcement as an animal model of Capítulo III | Ressurgência Comportamental 62 drug relapse. Behavioural Pharmacology, 17, 369-374. Podlesnik, C. A, & Kelley, M. E. (2015). Trans- lational research on the relapse of operant behavior. Revista Mexicana de Análisis de la Conducta, 41, 226-251. Podlesnik, C. A, & Shahan, T. A. (2009). Behavioral momentum and relapse of ex- tinguished operant responding. Learning & Behavior, 37, 357-364. Podlesnik, C. A., & Shahan, T. A. (2010). Ex- tinction, relapse, and behavioral momen- tum. Behavioural Processes, 84, 400-411. Pontes, T. R. N., & Abreu-Rodrigues, J. (2015). Ressurgência comportamental: Uma revi- são. Acta Comportamentalia, 23, 339-353. Quick, S. L., Pyszczynski, A. D., Colston, K. A., & Shahan, T. A. (2011). Loss of alternative non-drug reinforcement induces relapse of cocaine-seeking in rats: Role of dopamine D(1) receptors. Neuropsychopharmacology, 36, 1015–1020. Reed, P., & Morgan, T. A. (2006). Resurgence of response sequences during extinction in rats shows a primacy effect. Journal of the Experimental Analysis of Behavior, 86, 307- 315. Reed, P., & Morgan, T. a. (2007). Resurgence of behavior during extinction depends on previous rate of response. Learning & Beha- vior, 35, 106–114. Reid, R. L. (1958). The role of the reinforcer as a stimulus. British Journal of Psychology, 49, 202-209. Sánchez-Carrasco, L., & Nieto, J. (2005). Resurgence of three-response sequences in rats. Revista Mexicana de Análisis de la Conducta, 31, 215–226. Sidman, M. (1960). Tactics of scientific rese- arch: Evaluating experimental data in psy- chology. Boston: Authors Cooperative, Inc. Skinner, B. F. (2003). Ciência e Comporta- mento Humano. (J. C. Todorov & R. Azzi, Trad.). São Paulo: Martins Fontes (original publicado em 1953). Skinner, B. F. (1984). An operant analysis of problem solving. Behavioral and Brain Sciences, 7, 583-613. Skinner, B. F. (1981). Selection by conse- quences. Science, 213, 501–504. St Peter, C. C. (2015). Six reasons why applied behavior analysts should know about re- surgence. Revista Mexicana de Análisis de la Conducta, 41, 252–268. Sweeney, M. M., & Shahan, T. A. (2013a). Effects of high, low, and thinning rates of alternative reinforcement on response eli- mination and resurgence. Journal of the Ex- perimental Analysis of Behavior, 100, 102- Carlos Renato Xavier Cançado, Flávia Hauck, Ítalo S. C. Teixeira 63 116. Sweeney, M. M., & Shahan, T. A. (2013b). Behavioral momentum and resurgence : Effects of time in extinction and repeated resurgence tests. Learning & Behavior, 41, 414-424. Volkert, V. M., Lerman, D. C., Call, N. A., & Trosclair-Lasserre, N. (2009). An evaluation of resurgence during treatment with func- tional communication training. Journal of Applied Behavior Analysis, 42, 145-160. Wilson, K. G., & Hayes, S. C. (1996). Resur- gence of derived stimulus relations. Journal of the Experimental Analysis of Behavior, 66, 267-281. Winterbauer, N. E., Lucke, S., & Bouton, M. E. (2013). Some factors modulating the strength of resurgence after extinction of an instrumental behavior. Learning andMotivation, 44, 60-71. João Cláudio Todorov, Rafaela M. Fontes Azevedo 64 Clarice Lispector, tempo e consequências: considerações sobre contraste comportamental João Cláudio Todorov Rafaela M. Fontes Azevedo Universidade de Brasília Reynolds, G. S. (1961). Behavioral contrast. Journal of the Experimental Analysis Behavior, 4, 57-71. “Observo em mim mesma as mudanças de estação: eu claramente mudo com elas” Clarice Lispector Capítulo IV | Contraste Comportamental 65 INTRODUÇÃO À ÁREA DE PES- QUISA E CONTEXTUALIZAÇÃO DO EXPERIMENTO A noção de que o comportamento é selecionado por suas consequências é an- tiga, anterior a Thorndike (e.g., 1911, 1927). Skinner (1957/1978) inicia seu livro sobre comportamento verbal com uma frase de impacto: “Os homens agem sobre o mundo, modificam-no e, por sua vez são modifica- dos pelas consequências de sua ação” (p.15). Consequências parecem ser a marca registrada da Análise do Comportamento, como demonstram alguns livros recentes (Biglan, 2015; Madden, 2013; McSweeney & Murphy, 2014a; Schneider, 2012). Mas con- sequências não seguem comportamentos no vácuo. O contexto no qual o comporta- mento ocorre também é relevante (Skinner, 1953/2003). Skinner (1938) afirmou que, em- bora a resposta possa ocorrer em diversas si- tuações, apenas em parte dessas situações a sua emissão será efetiva em produzir refor- ços. Assim, o contexto no qual o comporta- mento ocorre (i.e., eventos antecedentes ao comportamento) acaba exercendo funções muito importantes por sinalizar quando e quais tipos de consequências estarão dispo- níveis. Em função disso, o comportamento operante deve ser sempre compreendido a partir da contingência tríplice: Eventos que antecedem o comportamento (estímulos discriminativos), o próprio comportamento, e as consequências que seguem a sua emis- são (reforço ou punição; e.g., Skinner, 1938, 1953/2003). Os estímulos discriminativos (SD) podem ser qualquer variável presente no contexto atual do indivíduo. São estímulos que sinalizam a disponibilidade da conse- quência e dão “dicas” sobre a probabilidade de o comportamento ser ou não reforçado ou punido. Quando determinadas consequ- ências estão disponíveis apenas para res- postas emitidas em um determinado con- texto (na presença de determinado SD) e quando o indivíduo passa a responder ape- nas nesse contexto, dizemos que o respon- der é discriminado (Skinner, 1938). Porém, para sabermos se o responder é discrimi- nado ou não é preciso que haja pelo menos dois contextos correlacionados diferencial- mente com a produção da consequência (e.g. contextos diferentes que sinalizam a presença de tipos de consequências dife- rentes, ou que sinalizam presença vs. au- sência de consequências, ou mesmo que si- nalizam diferentes relações entre a emissão da resposta e a apresentação do reforço). Ao observarmos mudanças no comportamento do indivíduo em função de mudanças nos estímulos antecedentes poderemos afirmar que há controle discriminativo, isto é, que o comportamento está sob o controle de estí- mulos (Catania, 1999). Controle discriminativo, portanto, se refere à influência que o contexto exerce sobre o comportamento (Moreira & Medei- ros, 2007) e, para estuda-lo é preciso treinar o comportamento em contextos diferentes João Cláudio Todorov, Rafaela M. Fontes Azevedo 66 (na presença de estímulos distintos). Isto é, é preciso expor o indivíduo a situações nas quais a disponibilidade da consequência é diferencialmente correlacionada a dife- rentes estímulos antecedentes. Por isso, o esquema mais tradicionalmente utilizado para investigar controle discriminativo tem sido o esquema múltiplo. Esquemas de reforçamento ou pu- nição são relações condicionais entre o comportamento dos organismos e eventos no ambiente e são geralmente utilizados como variáveis independentes na Análi- se do Comportamento (Ferster & Skinner, 1957). Assim, ao estabelecer um esquema de reforçamento se estabelece uma rela- ção “se, então” que indicará quais as con- dições (e.g. número de respostas, interva- lo de tempo necessário entre as respostas, etc.) para a apresentação da consequência. Por exemplo, em um esquema de razão fixa se estabelece um número fixo de respostas que deve ser emitido pelo organismo para que a consequência seja apresentada. Em um esquema de reforçamento, geralmente se estabelece também uma relação condi- cional com o estímulo antecedente. Assim, a relação entre a resposta e a consequência depende do estímulo antecedente presente no momento: se na situação A o compor- tamento B ocorrer, então a consequência C será apresentada (Todorov, 2002, 2012). Como indicado anteriormente, um esquema comumente utilizado para de- monstrar o controle estabelecido pelos estí- mulos antecedentes é o esquema múltiplo. Em um esquema múltiplo, dois ou mais esquemas de reforçamento são correlacio- nados a diferentes estímulos antecedentes. Cada um desses esquemas de reforçamento correlacionados a diferentes estímulos an- tecedentes compõe o que se chama de com- ponente (Ferster & Skinner, 1957). Em um experimento de laboratório com animais não-humanos podemos ter, por exemplo, um esquema múltiplo com dois compo- nentes: em um sempre há uma luz acesa e a emissão da resposta é sempre seguida por comida e no outro não há luz e a resposta nunca é seguida por comida. Têm-se, assim, dois contextos diferentes (presença vs. au- sência de luz) correlacionados com esque- mas diferentes (reforço vs. extinção). Pode- -se afirmar que o responder é discriminado, nesse exemplo, se o organismo responde mais na presença da luz do que na sua au- sência. Embora no treino discriminativo simples seja comum a utilização de alter- nação de estímulos antecedentes correla- cionados a reforço e extinção (e.g. Hanson, 1959; Skinner, 1938; Smith & Hoy, 1954), ge- ralmente os experimentos com esquemas múltiplos utilizam dois ou mais componen- tes nos quais diferentes esquemas de refor- çamento (e.g. razão fixa ou variável, inter- valo fixo ou variável) estão em vigor, sendo cada um sinalizado por um estímulo an- tecedente diferente, porém, correlaciona- dos a tipos semelhantes de consequências (Ferster & Skinner, 1957). Por exemplo, po- Capítulo IV | Contraste Comportamental 67 demos ter um esquema múltiplo com dois componentes programados da seguinte forma: em um componente há sempre um tom e a consequência é produzida a partir de um esquema de razão fixa (a cada X res- postas, a comida é apresentada) e no outro componente o tom está sempre ausente e a consequência é produzida a partir de um esquema de intervalo fixo (a comida é apre- sentada para a primeira resposta emitida após X min). Nesse caso, pode-se afirmar que o responder é discriminado se for ob- servado que a taxa e o padrão de respostas são diferenciados entre os componentes. Uma das utilidades do esquema múltiplo é, então, demonstrar como o comportamento muda em função de mudanças no contexto, dado que as mudanças no contexto sinali- zam mudanças nas contingências em vigor. Herrnstein e Brady (1958) afirmaram que o esquema múltiplo pode ser uma boa ferramenta para comparações intrassujei- tos dentro de uma mesma sessão em função da independência entre o desempenho nos componentes. Porém, em diversos experi- mentos (inclusive no experimento de Herr- nstein & Brady) tornou-se evidente que os desempenhos entre os componentes podem não ser independentes, isto é, o que ocorre em um dos componentes de um esquema múltiplo pode influenciar o comportamen- to que ocorre no outro componente. À mu- dança do comportamento em um contexto (SD) em função de alterações nas condições em vigor em outro contexto (diferente SD) chama-se interação (Reynolds, 1961b). Essa interação entre os componentes do esque- ma múltiplo pode ser estudada alterando- -se as condições em um componente en- quanto as condições no outro componente são mantidas constantes. Assim, oobjetivo ao se estudar a interação é observar como mudanças nas condições de um contexto afetam o comportamento em outro contex- to inalterado. Diversos experimentos foram reali- zados para investigar essa interação entre componentes (e.g. Findley, 1958, Herrick, Myers & Korotkin, 1959, Reynolds, 1961b, 1961c) e o que se observou é que alterações que diminuem a taxa de respostas em um componente (e.g., extinção) geralmente produzem aumentos na taxa de respostas no componente inalterado. Além disso, al- terações que aumentam a taxa de respostas em um componente produzem diminuições na taxa de respostas no componente inal- terado. A esse efeito de interação foi dado o nome de contraste comportamental (con- traste positivo, no primeiro caso, e contras- te negativo no segundo). Assim, contraste comportamental se refere a uma mudança na taxa de respostas na presença de um estímulo que é oposta à mudança na taxa de respostas na presença de outro estímulo (Reynolds, 1961a). Embora o contraste seja um efeito comumente observado durante a formação de uma discriminação entre dois ou mais estímulos (e.g., quando um deles é corre- lacionado ao reforço e o outro a extinção), João Cláudio Todorov, Rafaela M. Fontes Azevedo 68 o contraste ocorre também em condições em que há reforço programado na presença de ambos os estímulos, porém com varia- ções na taxa de reforços entre eles. Findley (1958), por exemplo, relatou que a taxa de respostas em um componente, um esquema de intervalo variável (VI) 6 min, aumentou quando no outro componente, um VI maior do que 6 min programava uma menor taxa de reforços em relação ao VI 6 min. Porém, até a década de 1960, o que se observava nos experimentos realizados sobre contraste (e.g. Herrick, et al., 1959; Reynolds, 1961b) era que a taxa de respostas covariava consistentemente com a taxa de reforços (i.e., diminuições na taxa de refor- ços eram seguidas de diminuições na taxa de respostas e aumentos na taxa de refor- ços eram seguidos por aumentos na taxa de respostas) e não se sabia dizer qual das duas variáveis era responsável pelo con- traste comportamental. Permanecia então a questão: A taxa de respostas no componen- te inalterado aumenta porque a taxa de res- postas do segundo componente diminui ou porque a taxa de reforços do segundo com- ponente diminui? Por isso, em 1961, Rey- nolds resolveu conduzir um estudo para responder a essa questão. DESCRIÇÃO DO EXPERIMENTO Objetivo e Método A proposta de Reynolds (1961a) foi conduzir um estudo no qual taxa de refor- ços e taxa de respostas pudessem ser expe- rimentalmente isoladas para observar como cada variável influenciava o contraste e as- sim, poder verificar se o fenômeno era fun- ção de mudanças na taxa de reforços ou na taxa de respostas. Reynolds encontrou uma solução relativamente simples e interes- sante para responder a sua pergunta: Dimi- nuir a taxa de respostas sem alterar a taxa de reforços. Para isso, Reynolds (1961a) utilizou quatro pombos e uma caixa operante com um disco que poderia ser iluminado por quatro cores diferentes. Durante o experi- mento, cada pombo era colocado na câma- ra experimental e respostas de bicar o disco produziam acesso a comida. Reynolds di- vidiu o seu estudo em quatro procedimen- tos subdivididos em várias fases. Em cada procedimento havia um esquema múltiplo com dois componentes e, em cada compo- nente, o disco era iluminado por uma cor diferente (SD). Diversos tipos de alterações foram feitas em um dos componentes do múltiplo a fim de verificar quais variações nesse componente levariam a mudanças na taxa de respostas no outro componen- te, que permanecia inalterado ao longo das fases. Em todos os procedimentos, inicial- mente, um VI 3 min esteve em vigor em cada componente do múltiplo. Isto é, em média, a primeira resposta após 3 min pro- duzia o reforço. Cada componente ficava em vigor por 3 min e eram apresentados de Capítulo IV | Contraste Comportamental 69 maneira alternada. Em cada sessão, cada componente era apresentado 30 vezes. Os procedimentos variaram em relação às al- terações realizadas em um dos componen- tes, sendo no primeiro sempre mantido um VI 3 min (de agora em diante, chamaremos o componente mantido com o VI 3 min de componente constante e o componente no qual as manipulações foram realizadas de componente alterado). No Procedimento I, para o compo- nente alterado foi programado um timeout em umas das fases (todas as luzes da caixa operante eram apagadas e não havia apre- sentação de reforço para nenhuma das res- postas emitidas) e extinção em outra fase (o estímulo continuava a ser apresentado, porém, não havia apresentação do reforço). No Procedimento II, para o componente al- terado, foi programado um esquema de re- forçamento diferencial de outros compor- tamentos (DRO¹) 50 ou 75 s para uma das fases e extinção para outra. A programação do DRO no Procedimento II teve como ob- jetivo garantir que a taxa de respostas di- minuísse sem que houvesse uma redução na taxa de reforços, dado que sempre que os pombos não respondessem (por 50 ou 75 s) o reforço seria apresentado. A ordem de mudança para DRO ou extinção, no com- ponente alterado, foi contrabalanceada en- tre os pombos (i.e., para alguns pombos o componente foi alterado para o DRO e só depois para extinção e para outros pombos a ordem de alteração foi inversa). O Proce- dimento III foi uma combinação dos dois procedimentos anteriores e a manipula- ção feita no componente alterado foi uma combinação do timeout com o DRO, ou seja, todas as luzes da caixa experimental eram apagadas e reforços eram produzidos se os pombos não respondessem durante o intervalo do DRO. Um procedimento adi- cional foi realizado para controlar o efeito do aumento na taxa de reforços sob o DRO e, para isso, ao final da última sessão do Procedimento III, aumentou-se o peso dos animais (i.e., diminuiu-se a privação) e, en- tão, no dia seguinte os animais foram nova- mente expostos às mesmas condições que haviam sido programadas no Procedimento II, no qual para o componente alterado foi programado um DRO em uma fase, e extin- ção na fase seguinte. As manipulações realizadas por Rey- nolds (1961a) possibilitaram a comparação de condições nas quais a diminuição da taxa de respostas estava correlacionada à diminuição na taxa de reforços (i.e., alteran- do o segundo componente para extinção ou timeout) e condições nas quais a diminui- ção da taxa de respostas não estava corre- lacionada à diminuição na taxa de reforços (i.e., alterando o segundo componente para um DRO). Dessa forma, foi possível iso- lar experimentalmente os efeitos da taxa de respostas e da taxa de reforços sobre o contraste comportamental. Se o contraste 1 Em um DRO, o reforço só é apresentado se o organismo cumprir o intervalo estabelecido sem emitir determinada resposta. No presente experimento, caso o pombo passasse 50 ou 75 s sem bicar o disco a comida era apresentada. João Cláudio Todorov, Rafaela M. Fontes Azevedo 70 dependesse de variações apenas na taxa de respostas, em todas as condições o con- traste deveria ocorrer, já que em todas ha- veria uma redução da taxa de resposta no componente alterado. Porém, se é a altera- ção na taxa de reforços a variável relevan- te, então, o contraste só deveria ocorrer nas condições nas quais houvesse variação da taxa de reforços no componente alterado (i.e., nas condições em que foram progra- mados timeout ou extinção) e não deveria ocorrer nas condições em que o DRO estava em vigor (i.e., a taxa de reforços nessa con- dição não era alterada). Portanto, se a taxa de respostas no componente constante au- mentasse quando mudanças fossem feitas no componente alterado em todas as con- dições, a taxa de respostas poderia ser en- tendida como variável mais relevante. No entanto, se a taxa de respostas do compo- nente constante só variasse nas condições em que houve mudançasna taxa de refor- ços no componente alterado, então a taxa de reforços seria a principal variável deter- minante do contraste. Resultados e Discussão Os resultados indicaram que altera- ções na taxa de reforços, e não na taxa de respostas, em um dos componentes do múl- tiplo é a variável que determina o contraste comportamental (Reynolds, 1961a). Tanto timeout quanto extinção no componente alterado produziram aumentos na taxa de respostas do componente constante. Po- rém, quando o DRO estava em vigor no componente alterado, combinado ou não com timeout, aumentos na taxa de respos- tas do componente constante (independen- te do peso corporal dos pombos) não foram observados. De maneira geral, o contraste foi observado nas condições onde não ha- via reforços em um componente (timeout e extinção), mas não foi observado quando havia reforço disponível nesse componen- te, embora a taxa de respostas durante o componente alterado tenha diminuído em todas as condições. Reynolds (1961a) propôs duas expli- cações para a não ocorrência do contraste nas condições em que um DRO estava em vigor no componente alterado. Uma expli- cação é que o contraste pode não ter acon- tecido porque, sob o DRO, pausas (i.e., não bicar o disco) foram reforçadas e isso pode ter induzido a ocorrência de pausas tam- bém no componente constante, em que o VI 3 min continuava em vigor. Uma outra explicação é que o contraste poderia não ter ocorrido porque a diminuição na taxa de reforços, e não de respostas, é a condição necessária para a ocorrência do contraste e, dessa forma, o DRO eliminou este efeito uma vez que não houve redução na taxa de reforços sob esse esquema, como indicado anteriormente. Como o aumento da taxa de respos- tas foi imediato no componente constante (VI 3 min) quando o DRO foi suspenso no componente alterado (i.e., quando extinção estava em vigor nesse componente), Rey- Capítulo IV | Contraste Comportamental 71 nolds (1961a) afirmou que a taxa de reforços é a variável mais relevante para a ocorrên- cia do contraste. Para Reynolds, é a altera- ção na frequência relativa de reforços (i.e., a frequência de reforços na presença de um estímulo em relação à frequência de refor- ços na presença de ambos os estímulos) que causa as alterações na taxa de respostas que descrevemos como contraste. DESDOBRAMENTOS O experimento de Reynolds (1961a) sugere que as consequências que são pro- gramadas em um contexto afetam não só o que fazemos naquele contexto, mas tam- bém o que fazemos em outros contextos. Portanto, o que um organismo faz em uma situação depende não só das consequências disponíveis naquela situação, mas também das consequências disponíveis em situa- ções diferentes (ver também Herrnstein, 1961, 1970). Assim, para que seja possível com- preender o que um indivíduo faz em um determinado contexto muitas vezes será preciso observar também o que ele faz em outras situações e que tipos de consequ- ências ele tem disponível de uma maneira geral e não apenas em uma determinada ocasião. É preciso, então, adotar uma pers- pectiva relativa e entender que a função de um estímulo pode ser não só a de sinalizar as consequências disponíveis naquele con- texto, mas as consequências disponíveis naquele contexto em relação a todos os ou- tros. A partir da pesquisa de Reynolds (1961a) muitas outras investigações foram realizadas a fim de verificar o efeito da taxa de reforços sobre a ocorrência e a magni- tude do contraste, principalmente com o objetivo de responder se a taxa de refor- ços seria a única variável responsável pela ocorrência do contraste, se seria a variável principal, e que outras variáveis e explica- ções seriam possíveis. Experimentos manipulando diver- sos tipos de esquemas em um dos com- ponentes, para produzir diferentes taxas de respostas sem alterar as taxas de re- forços entre os componentes foram reali- zados, corroborando a ideia de que a taxa de reforços é realmente mais relevante do que a taxa de respostas na determinação do contraste (e.g. Bloomfield, 1967; Nevin, 1968; Reynolds, 1961d; Zuriff, 1970). Dado, então, que a taxa relativa de reforços é uma variável relevante para a ocorrência do contraste, também foram estabelecidas relações entre contraste e a Lei da Iguala- ção (e.g. McLean & White, 1983; Williams & Wixted, 1986). A Lei da Igualação prediz que em situações de escolha (i.e. esquemas concorrentes, nos quais os dois componen- tes são apresentados simultaneamente e o organismo deve escolher responder em ou outro componente) a taxa de respostas se igualará à taxa de reforços disponíveis. Assim, situações de escolha caracteriza- João Cláudio Todorov, Rafaela M. Fontes Azevedo 72 riam o caso mais evidente de interação, já que a maneira como eu me comporto em relação a uma das opções necessariamente afetará o meu comportamento em relação à outra opção, dado que ambas as respostas não podem ser emitidas ao mesmo tempo. Assim como a distribuição de respostas em esquemas concorrentes é função da distri- buição dos reforços entre os componentes, essa interação também parece ocorrer mes- mo quando as opções são apresentadas de maneira sucessiva, e não simultânea, como é o caso dos procedimentos para o estudo do contraste (i.e., esquemas múltiplos). Em ambos os casos, então, temos evidencia de como a distribuição de reforços pode afetar a distribuição das respostas. Outra variável que parece afetar a ocorrência do contraste é a duração dos componentes, e muitos estudos foram con- duzidos a fim de se investigar essa relação. De maneira geral, observa-se que a magni- tude do contraste é maior quanto menor for a duração do componente (e.g. Charman & Davison, 1982; Hinson, Malone, McNally & Rowe, 1978; Shimp & Wheatley, 1971; Todo- rov, 1972). O estudo de Reynolds (1961a) foi um primeiro passo para uma compreensão mais precisa sobre a ocorrência do con- traste, pois foi o primeiro a isolar os efeitos de taxa de respostas e de reforços. Embo- ra seus resultados tenham indicado a taxa relativa de reforços como a principal vari- ável responsável pela ocorrência do con- traste, desde então diversas investigações tem sido conduzidas a fim de se chegar a um entendimento mais claro e a uma des- crição mais acurada desse fenômeno (ver Freeman, 1971; e Williams, 1983). CONSIDERAÇÕES FINAIS A conclusão de que é alteração da taxa de reforços que produz a ocorrência do contraste, entretanto, deve ser considerada com cautela. Reynolds e Limpo (1968), por exemplo, conduziram um experimento uti- lizando um esquema de reforçamento dife- rencial de taxas baixas (DRL) e observaram que a taxa de respostas do componente constante aumenta, apesar da taxa relativa de reforços diminuir em relação à linha de base. Embora alterações na taxa relativa de reforços pareçam estar diretamente relacio- nadas à ocorrência do contraste, sendo re- plicada em diversos trabalhos (e.g. Catania, 1961; Reynolds, 1963; Wilton & Gay, 1969), essa pode não ser a única variável de con- trole (e.g. Davison & Ferguson, 1978; Wilkie 1977; Williams, 1980). O mais importante a ser considerado na literatura sobre contras- te e sobre o trabalho de Reynolds (1961a), especificamente, é o papel que outros con- textos (passados e futuros) exercem sobre o que acontece no momento atual. Trabalhos publicados nos anos 1960 e 1970 foram decisivos para determinar o Capítulo IV | Contraste Comportamental 73 progresso da Análise do Comportamento nessa questão, destacando a função do con- texto na determinação do comportamento e demonstrando que diversos aspectos do contexto exercem controle sobre o com- portamento dos organismos. Esses diversos aspectos devem, então, ser considerados ao se analisar o que um organismo faz agora e por quê faz. Para compreender o compor- tamento atual de um organismo é preciso levar em conta que seu comportamento é influenciado não só pela contingência a qual estáexposto, mas também pelo que mais está acontecendo no ambiente na- quele momento, ou seja, todas as demais contingências disponíveis que concorrem simultaneamente. Assim, para entender o que o indivíduo faz precisamos analisar todas as outras opções do que ele poderia estar fazendo e todas as consequências pro- gramadas para esses comportamentos con- correntes (Herrnstein, 1961, 1970). O comportamento atual pode ser influenciado ainda por sinais do que vai acontecer no futuro muito próximo (Rey- nolds, 1961a, 1961b, 1961c; Reynolds & Lim- po, 1968) e também do que já ocorreu no passado, e assim, a ordem de ocorrência dos eventos (o que o indivíduo acabou de fazer e o que ele vai fazer em seguida) pode controlar também o seu comportamen- to atual (e.g. Catania & Gill, 1964; Nevin & Shettleworth, 1966; Terrace, 1966a). Dessa forma, ao analisarmos o papel do contexto é preciso compreendê-lo de modo amplo e dinâmico, tendo em vista circunstâncias e variáveis passadas, presentes e futuras que podem atuar no controle do comportamen- to atual de um organismo. Essa noção de interação entre dife- rentes contextos pode ser especialmente relevante no contexto aplicado e principal- mente no tratamento de comportamentos problema. Gross e Drabman (1981) fizeram uma revisão de estudos sobre contraste comportamental realizados com humanos que demonstram a ocorrência do fenôme- no. Uma das evidências que se tem é de que, embora alguns tratamentos sejam eficazes em reduzir o comportamento problema em determinados contextos, esse mesmo com- portamento pode aumentar de frequência em outros contextos não correlacionados ao tratamento (e.g. redução de comporta- mentos inapropriados em casa, mas au- mento desses mesmos comportamentos na escola), caracterizando assim um efeito de contraste comportamental. Então, ao se pensar em intervenções comportamentais é preciso sempre lembrar que os contextos não podem ser compreendidos de maneira isolada e que alterações em um contexto podem acarretar mudanças comportamen- tais em outros contextos aparentemente não correlacionados. PARA SABER MAIS Terrace (1966b). Investigou se o uso de um treino de discriminação mais extenso e uti- lizando um procedimento de aprendizagem João Cláudio Todorov, Rafaela M. Fontes Azevedo 74 sem erros pode eliminar o contraste com- portamental. Henke, Allen, & Davison (1972). Investi- garam a função da amídala cerebelosa na ocorrência de contraste, demonstrando di- ferenças entre ratos com a região lesionada e ratos sem lesões na região. Koegel, Egel, & Williams (1980). Examina- ram a ocorrência de contraste em interven- ções comportamentais com crianças com diagnóstico de autismo. Killeen (2014). Propôs uma nova teoria ex- plicativa para a ocorrência do contraste. Boyle (2015). Realizou uma investigação translacional sobre contraste comporta- mental, avaliando a influência da ordem dos contextos e de efeitos intrassessão em adultos com deficiência intelectual. REFERÊNCIAS Biglan, A. (2015). The nurture effect. Oakland, CA: New Harbinger Publications. Boyle, M. A. (2015). A Translational Investi- gation of Positive and Negative Behavioral Contrast (Tese de Doutorado). Utah State University, Logan. Retirada de All Gradu- ate Theses and Dissertations. (Paper 4234). Bloomfield, T. M. (1967). Behavioral con- trast and relative reinforcement frequency in two multiple schedules. Journal of the Experimental Analysis of Behavior, 10, 151- 158. Catania, A. C. (1961). Behavioral contrast in a multiple and concurrent schedule of reinforcement. Journal of the Experimental Analysis of Behavior, 4, 335-342. Catania, C.A. (1999). Aprendizagem: com- portamento, linguagem e cognição. (Trad. Deisy das Graça de Souza). Porto Alegre: Artmed. Catania, A. C., & Gill, C. A. (1964). Inhibi- tion and behavioral contrast. Psychonomic Science, 1, 257-258. Charman, L., & Davison, M. (1982). On the effects of component durations and compo- nent reinforcement rates in multiple sche- dules. Journal of the Experimental Analysis of Behavior, 37, 417–439. Davison, M., & Ferguson, A. (1978). The ef- fects of different component response re- quirements in multiple and concurrent schedules. Journal of the Experimental Analysis of Behavior, 29, 283–295. Ferster, C. B., & Skinner, B. F. (1957). Sche- dules of reinforcement. New York: Apple- ton-Century-Crofts. Findley, J. D. (1958). Preference and swit- ching under concurrent scheduling. Journal of the Experimental Analysis of Behavior, 1, Capítulo IV | Contraste Comportamental 75 123-144. Gross, A. M., & Drabman, R. S. (1981). Beha- vioral contrast and behavioral therapy. Behavior Therapy, 12, 231-246. Hanson, H. M. (1959). Effects of discrimi- nation training on stimulus generalization. Journal of Experimental Psychology, 58, 321-334. Henke, P. G., Allen, J. D., & Davison, C. (1972). Effect of lesions in the amygdala on behavioral contrast. Physiology and Beha- vior, 8,173-176. Herrick R. M., Myers J. L., & Korotkin A. L. (1959). Changes in Sd and Sdelta rates du- ring the development of an operant discri- mination. Journal of Comparative and Phy- siological Psychology, 52, 359–363. Herrnstein, R. J. (1961). Relative and absolu- te strength of response as a function of fre- quency of reinforcement. Journal of the Ex- perimental Analysis of Behavior, 4, 267-272. Herrnstein, R. J. (1970). On the law of ef- fect. Journal of the Experimental Analysis of Behavior, 13, 243–266. Herrnstein, R. J., & Brady, J. V. (1958). Inte- ractions among components of a multiple schedule. Journal of Experimental Analysis of Behavior, 1, 293-301. Hinson, J. M., Malone, J. C., McNally, K. A., & Rowe, D. W. (1978). Effects of component length and of the transitions among com- ponents in multiple schedules. Journal of the Experimental Analysis of Behavior, 29, 3-16. Killeen, P. R. (2014). A theory of behavio- ral contrast. Journal of the Experimental Analysis of Behavior, 102, 363-390. Koegel, R. L., Egel, A. L., & Williams, J. A. (1980). Behavioral contrast and generali- zation across settings in the treatment of autistic children. Journal of Experimental Child Psychology, 30, 422-437. Madden, G. J. (2013). APA handbook of behavior analysis. Washington, DC: Ameri- can Psychological Association. McLean, A. P., & White, K. G. (1983). Tem- poral constraint on choice: Sensitivity and bias in multiple schedules. Journal of the Experimental Analysis of Behavior, 39, 405- 426. McSweeney, F. K., & Murphy, E. S. (Eds.). (2014). The Wiley-Blackwell handbook of operant and classical conditioning. Oxford: John Wiley & Sons. Moreira, M. B., & Medeiros, C. A. (2007). Princípios Básicos de Análise do Comporta- mento. Porto Alegre: Artmed. Nevin, J. A. (1968). Differential reinforce- ment and stimulus control of not respon- João Cláudio Todorov, Rafaela M. Fontes Azevedo 76 ding. Journal of the Experimental Analysis of Behavior, 11, 715-726. Nevin, J. A., & Shettleworth, S. J. (1966). An analysis of contrast effects in multiple sche- dules. Journal of the Experimental Analysis of Behavior, 9, 305-315. Reynolds, G. S. (1961a). Behavioral contrast. Journal of the Experimental Analysis Beha- vior, 4, 57-71. Reynolds, G. S. (1961b). An analysis of inte- ractions in a multiple schedule. Journal of the Experimental Analysis of Behavior, 4, 107-117. Reynolds, G. S. (1961c). Contrast, generali- zation and the process of discrimination. Journal of the Experimental Analysis of Behavior, 4, 289-294. Reynolds, G. S. (1961d). Relativity of res- ponse rate and reinforcement frequency in a multiple schedule. Journal of the Experi- mental Analysis of Behavior, 4, 179-184. Reynolds, G. S. (1963). Some limitations on behavioral contrast and induction during successive discrimination. Journal of the Experimental Analysis of Behavior, 6, 131- 139. Reynolds, G. S., & Limpo, A. J. (1968). On some causes of behavioral contrast.Journal of the Experimental Analysis of Behavior, 11, 543-547. Schneider, S. C. (2012). The science of conse- quences. New York: Prometheus Books. Shimp, C. P., & Wheatley, K. L. (1971). Ma- tching to relative reinforcement frequency in multiple schedules with a short compo- nent duration. Journal of the Experimental Analysis of Behavior, 15, 205-210. Skinner, B. F. (1938). The behavior of orga- nisms: An experimental analysis. New York: Appleton-Century-Crofts. Skinner, B. F. (1978). O comportamento ver- bal. São Paulo: Cultrix (Obra original publi- cada em 1957). Skinner, B. F. (2003). Ciência e comporta- mento humano (11ª ed.). (Trad. de J. C. To- dorov e R. Azzi). São Paulo: Martins Fontes. (Obra original publicada em 1953). Smith, M. H., & Hoy, W. J. (1954). Rate of response during operant discrimination. Journal of Experimental Psychology, 48, 259–264. Terrace, H. S. (1966a). Stimulus control. In W. K. Honing (Ed.). Operant behavior: Are- as of research and application. New York: Appleton-Century-Crofts. Terrace, H. S. (1966b). Behavioral contrast and the peak shift: Effects of extended dis- crimination training. Journal of the Experi- mental Analysis of Behavior, 9, 613-617. Capítulo IV | Contraste Comportamental 77 Thorndike, E. L. (1911). Animal intelligence. New York: Macmillan. Thorndike, E. L. (1927). The law of effect. The American Journal of Psychology, 39, 212-222. Todorov, J. C. (1972). Component duration and relative response rates in multiple sche- dules. Journal of the Experimental Analysis of Behavior, 17, 45-49. Todorov, J. C. (2002). A evolução do conceito de operante. Psicologia: Teoria e Pesquisa, 18, 123-127. Todorov, J. C, (2012). Metacontingências e a análise comportamental de práticas cultu- rais. Clínica e Cultura, 1, 36-45. Wilkie, D. M. (1977). Behavioral contrast produced by a signaled decrease in local rate of reinforcement. Learning and Moti- vation, 8, 182-193. Williams, B. A. (1980). Contrast, signaled reinforcement, and the relative law of ef- fect. American Journal of Psychology, 93, 617-629. Williams, B. A. (1983). Another look at con- trast in multiple schedules. Journal of the Experimental Analysis of Behavior, 39, 345- 284. Williams, B. A., & Wixted, J. T. (1986). An equation for behavioral contrast. Journal of the Experimental Analysis of Behavior, 45, 47-62. Wilton, R. N., & Gay, R. A. (1969). Behavio- ral contrast in one component of a multiple schedule as a function of the reinforcement conditions operating in the following com- ponent. Journal of the Experimental Analy- sis of Behavior, 12, 239-246. Zuriff, G. E. (1970). A comparison of varia- ble-ratio and variable-interval schedules of reinforcement. Journal of the Experimental Analysis of Behavior, 13, 369-374. Cristiano Coelho 78 Da frequência absoluta à frequência relativa como unidade de análise do comportamento Cristiano Coelho Pontifícia Universidade Católica de Goiás Herrnstein, R. J. (1961). Relative and Absolute Strength of Response as a Function of Frequency of Reinforcement. Journal of the Experimental Analysis of Behavior, 4(3), 267-272. “Você não veio aqui para fazer a escolha. Você já a fez. Você está aqui para tentar entender porque fez essa escolha” O Oráculo (The Matrix Reloaded, Irmãos Wachowski) Capítulo V | Escolha 79 INTRODUÇÃO À ÁREA DE PES- QUISA E CONTEXTUALIZAÇÃO DO EXPERIMENTO Skinner (1950) deu os primeiros pas- sos para uma compreensão do estudo do comportamento de escolha na Análise do Comportamento ao propor que responder a um dentre dois estímulos é escolha, não o resultado desta escolha (como propõe o senso comum). Já preferência seria uma medida do número de respostas em uma alternativa em relação à outra, relacionan- do-se à alternação de respostas a cada es- tímulo disponível. Dessa forma, em vez de tomar a escolha como um processo inferido pré-comportamental, visão característica de concepções que baseavam suas explica- ções em processos mentais vigentes à épo- ca, Skinner focou na a emissão de respostas como a escolha em si. Com isso, caracte- rizou-a como um padrão comportamental mais amplo, relacionado a outras variáveis que não os supostos processos decisórios internos. Podemos dizer que bicar um dentre dois discos disponíveis, estudar em vez de ir para a festa na véspera da prova ou dizer “te amo” quando solicitado pela namorada em vez de dizer que quer terminar, seriam as escolhas e não os produtos da escolha. Adicionalmente, bicar mais vezes um dis- co que outro, ir mais vezes à balada que es- tudar na véspera da prova e dizer mais “te amo” ilustrariam as preferências por cada uma dessas alternativas, e estariam rela- cionadas às suas respectivas consequên- cias. Essa formulação apresentou avanços na compreensão do controle do comporta- mento operante, mas ainda se concentrou na consequenciação direta de cada respos- ta independentemente das consequências para respostas alternativas. No exemplo do pombo acima, as respostas a cada disco eram vistas como influenciadas apenas por seus próprios reforços, sem uma influência direta pelos reforços disponíveis para ou- tras alternativas. Isso teria como implicação que, ao aumentar a frequência de reforços em um dos discos, a taxa absoluta de res- postas a esse disco aumentaria, sem inter- ferir na taxa de respostas ao outro disco. Mesmo assim, Skinner antecipou a noção de igualação ao obter uma proporcionali- dade nas taxas absolutas de respostas entre dois esquemas, conforme suas respectivas taxas absolutas de reforços. Condições que envolviam essas si- tuações foram exploradas de forma siste- mática posteriormente por Ferster e Skinner (1957) em experimentos sobre o compor- tamento em esquemas concorrentes, nos quais dois (ou mais) esquemas de reforça- mento permanecem em vigor simultanea- mente para diferentes respostas incompa- tíveis de serem emitidas ao mesmo tempo. Em arranjos experimentais de esquemas concorrentes, cada esquema é vinculado a diferentes operandos que diferem com re- lação à posição (como dois discos ou duas barras), cor ou outra propriedade, e permi- tem a mensuração das taxas e distribuições Cristiano Coelho 80 das diferentes respostas ao longo do tempo. Podemos ter dois discos em uma parede da caixa experimental dispostos lado a lado, cada um iluminado por uma cor; respos- tas a um dos discos podem ser reforçadas intermitentemente a cada 30 segundos e respostas ao outro disco podem ser refor- çadas a cada 60 segundos, por exemplo, e as duas respostas não podem ser emitidas ao mesmo tempo. Esse procedimento, que passou a ser o padrão no estudo de escolha, capta a noção básica de Skinner (1950). Os estudos anteriores a Herrnstein (1961) con- centraram-se nas análises da suspensão dessas consequências sobre respostas con- correntes e dos efeitos de consequências, que mostravam regularidades nos padrões e distribuição de respostas: Ferster e Skin- ner (1957) investigaram sistematicamente em várias condições que as respostas em esquemas concorrentes com dois operan- dos localmente separados apresentavam os mesmos padrões obtidos em esquemas sim- ples; Findley (1958) estendeu esses achados para situações experimentais com os dois esquemas associados ao mesmo operando, sinalizado por cores diferentes de acordo com o esquema no qual o pombo respondia, e as cores e o respectivo esquema modifica- dos quando o pombo emitia uma resposta em um disco de mudança. De acordo com Davison (2012), estes trabalhos iniciais es- tavam preocupados em descrever essas re- gularidades em vez de se aprofundarem em medidas quantitativas. A busca por descrições quantitativas começou a se desenvolver com Herrnstein (1958) ao propor que devido às respostas em esquemas concorrentes serem incompatí- veis, haveria “a possibilidade de estudar es- colha como um processo comportamental” (p. 35). De acordo com ele, porém, o desen- volvimento da área careciade dados que explicitassem como a disponibilização de consequências para respostas incompatí- veis levaria à semelhança na proporciona- lidade entre os reforços obtidos e respostas emitidas nas duas alternativas que os da- dos sugeriam, isto é, como uma alternativa com uma frequência de reforços duas vezes maior que a outra levava a um responder duas vezes maior naquela alternativa. Herrnstein (1958) obteve dados de distribuição de respostas entre dois es- quemas concorrentes de razão fixa (FR), com três pombos. Nesse experimento, de um total de 40 respostas a serem emitidas para cada reforço, foi manipulado o núme- ro de respostas necessárias em cada disco para a liberação do reforço em diferentes condições. A proporção de respostas nas alternativas se aproximou das proporções programadas pelos esquemas de razão, mas a proporção de reforços obtidos variou de maneira irregular quando a obtenção do reforço dependida da emissão de uma res- posta no esquema alternativo após serem emitidas as respostas definidas no outro esquema. Ao controlar sistematicamente a distribuição de reforços, Herrnstein obteve proporções de respostas semelhantes à de reforços obtidos. Apesar da noção de esco- Capítulo V | Escolha 81 lha como comportamento não estar parti- cularmente traçada naquele trabalho, esta- va aberta a porta para o desenvolvimento de um modelo quantitativo do estudo do comportamento de escolha a partir da no- ção de igualação. Um dos grandes diferen- ciais de Herrnstein (1961) foi investigar essas relações de maneira sistemática, fornecen- do sustentação empírica para a análise dos efeitos da frequência relativa de reforços sobre a distribuição de respostas. DESCRIÇÃO DO EXPERIMENTO Objetivo e Método O objetivo do trabalho de Herrns- tein (1961) foi estudar de forma paramétrica e descrever quantitativamente o efeito da frequência relativa de reforços em esque- mas concorrentes sobre as taxas de respos- tas em cada componente do esquema e as taxas relativas entre os dois esquemas. Em um estudo paramétrico, a variável indepen- dente (e.g., frequência relativa de reforços) é manipulada em diferentes valores permi- tindo que sejam obtidas diversas medidas da variável dependente (e.g., frequência re- lativa de respostas), possibilitando o acesso a uma maior amplitude da relação funcio- nal, ou seja, como a variável dependente se modifica com diversos valores da variá- vel independente. Para tanto, três pombos foram mantidos a 80% de seus pesos com acesso livre a alimento. O experimento foi realizado em uma caixa de condicionamen- to operante com dois discos de respostas lo- calizados em uma das paredes da caixa. Os discos podiam ser iluminados com as cores vermelho (A - disco da esquerda) e branco (B - disco da direita) e ficavam a uma mes- ma distância do comedouro, que ficava centralizado na mesma parede dos discos. O experimento iniciou-se com um treino preliminar em duas sessões que ter- minavam após 60 reforços, no qual eram reforçadas respostas no disco diferente daquele para o qual havia sido disponibi- lizado o último reforço, de acordo com um esquema concorrente de reforço contínuo (CONC CRF - CRF). Este treino visou ga- rantir uma distribuição de respostas simi- lar e a alternância entre os dois discos, de forma a garantir um mesmo contato com as alternativas concorrentes em vigor. Poste- riormente, Herrnstein (1961) programou re- forços para duas respostas disponibilizados independentemente de acordo com esque- mas de reforço de intervalo variável (CONC VI - VI), nos quais a liberação de reforços em um esquema não interferia na liberação de reforços da outra alternativa. O uso de esquemas de intervalo variável, nos quais o reforço é disponibilizado para a primeira resposta após a passagem de um tempo que varia em torno de uma média, justificou-se por ser um esquema que, ao ser modifica- do, leva a consistentes alterações na taxa de respostas. Os dois esquemas vigoravam ao mesmo tempo, sem interferência entre si, e os intervalos programados para cada um deles vigoravam mesmo quando o pombo respondia no outro esquema, porém um Cristiano Coelho 82 reforço disponível em um dos esquemas só era liberado quando o sujeito respondia nesse esquema. Assim, em um dado mo- mento poderia haver reforço disponível em ambos os esquemas, em apenas um deles ou em nenhum dos dois. Herrnstein (1961) utilizou dois pares de esquemas que em conjunto programa- vam um reforço a cada 1,5 minutos em todas as condições. Este controle experimental foi importante para garantir que as medidas de respostas se relacionassem às frequên- cias relativas de reforços dos dois esquemas e não a possíveis diferenças nas taxas totais de reforços entre as condições. Em seu tra- balho, os valores dos VIs foram: VI 3 min – VI 3 min; VI 2,25 min – VI 4,5 min; VI 1,8 min – VI 9 min; e VI 1,5 min – Extinção. Esses pares de esquemas foram alternados entre os dois discos (A e B), de forma que havia condições em que o disco A ora tinha VIs menores (maior frequência de reforços), ora VIs maiores (menor frequência de re- forços) que o disco B, além da condição VI 3 min – VI 3 min, em que foi programada uma mesma frequência de reforços para os dois discos. Os sujeitos foram expostos a to- das essas condições e em ordens diferentes, visando reduzir efeitos derivados da ordem de exposição. É importante ressaltar que cada condição foi realizada por um número de sessões até que a emissão de respostas se estabilizasse ao longo de cinco sessões; só então uma nova condição era iniciada. Herrnstein (1961) usou, em algumas condições, um procedimento que evitava que respostas de alternar entre os dois es- quemas fossem reforçadas acidentalmente, o atraso para respostas de mudança (chan- geover delay, COD). Como ele funciona? Sem o COD, quando o pombo estivesse bi- cando em um disco e houvesse reforço dis- ponível para respostas no disco alternativo, a primeira resposta nesse disco alternativo seria reforçada. Isso pode reforçar não res- postas a um disco específico, mas o padrão de alternação entre os discos (i.e., responder em um disco e responder no outro e, assim, sucessivamente) independente das modifi- cações na taxa relativa de reforços. O COD tem como função evitar que isso aconte- ça. Vamos supor que em um determinado momento houvesse reforço disponível para respostas no disco B e o pombo estivesse respondendo no disco A. Ao alternar para o disco B e obter o reforço disponível nes- se disco, ele precisaria permanecer respon- dendo no disco B pelo menos pelo tempo definido no COD (que foi de 1,5 s. no experi- mento) para que um reforço fosse liberado. Resultados e discussão Herrnstein (1961) registrou o núme- ro de reforços obtidos e respostas emitidas em cada disco, para cada condição. Esses dados possibilitaram diversas análises so- bre os efeitos das alterações na frequência de reforços sobre a regularidade e, princi- palmente (no caso de Herrnstein), a aspec- tos quantitativos do comportamento. Mais especificamente, se o aumento na taxa de Capítulo V | Escolha 83 reforço de uma alternativa e a consequente redução na taxa de reforço para a outra al- ternativa levariam a aumentos (e reduções) nas taxas de respostas, bem como a exten- são dessas alterações em função dos esque- mas do par concorrente. Para isso, em cada condição, além das frequências absolutas de reforços e respostas em cada um dos discos A e B, foram calculadas a frequência relati- va de reforços obtidos (proporcionalmente o número de reforços obtidos no disco A em relação ao total de reforços obtidos nos dois discos, A e B) e a porcentagem de respostas emitidas (total de respostas emitidas no dis- co A dividido pelo total de respostas emiti- das nos discos A e B), considerando as cinco sessões finais, com o comportamento está- vel. Como a frequência relativa de reforços variou entre as condições, esses cálculos possibilitaramverificar como se alteraria a distribuição de respostas entre os dois dis- cos. De maneira direta, Herrnstein investi- gou se a proporção de respostas se igualaria à frequência relativa de reforços, descrita pela equação: (1), na qual R e r são número de respostas e re- forços, respectivamente, e 1 e 2 correspon- dem às alternativas. Essa equação expressa que as respostas na alternativa 1 divididas pelo total de respostas nas duas alternativas (1 e 2) tendem a igualar o total de reforços obtidos na alternativa 1 divididos pelo total de reforços obtidos nas duas alternativas¹. As porcentagens de respostas se aproximaram da porcentagem de reforços obtidos nas respectivas condições, ou seja, a frequência relativa de respostas tendeu a igualar a frequência relativa de reforços, nas condições em que se utilizou o COD (que reduziu a taxa de alternação e, consequen- temente, aumentou o controle pelas con- tingências de cada esquema) e os desvios de uma igualação perfeita não apresentaram tendência sistemática da previsão teórica de igualação. Este achado submeteu pela primeira vez a teste quantitativo a noção de distribuição de respostas como função da distribuição de reforços baseada no princí- pio de que a alteração na frequência de re- forços de uma fonte influencia as respostas sob controle de outra fonte de reforços. Essa influência relaciona-se a outro achado fundamental obtido por Herrnstein (1961) e que se constitui um dos pressupos- tos para a relação de igualação: a taxa de res- postas apresentou uma relação linear (cres- cente e contínua) com a taxa de reforços obtidos em cada alternativa e que as taxas de respostas nos dois discos foram seme- lhantes na condição CONC VI 3 min - VI 3 min, quando foi programada a mesma taxa de reforço nos dois discos. Assim, o total de respostas nos dois discos em cada condição ficou constante ou apresentou pequenas variações assistemáticas. E por que essas 1 Em seu trabalho, Herrnstein (1961) utilizou P (para bicadas - pecking) em vez de R e E (para comer – eating) em vez de r. No presente traba- lho, a escolha de nomenclatura diferente do trabalho original deriva do fato de ter se tornado uma das mais usadas na área. Cristiano Coelho 84 variações são compatíveis com o princípio de igualação? O aumento linear nas taxas de respostas com o aumento da frequência absoluta de reforços foi descrito a partir da relação p = ke, sendo p a frequência de bi- cadas (respostas), e a frequência de comer (reforços) e k uma constante, compatível com a noção de fortalecimento da respos- ta proposta por Skinner (1938, p.130, citado por Herrnstein, 1961, p. 270) de que há uma constância entre a quantidade de reforços obtidos e respostas emitidas em extinção. Apesar de Skinner posteriormente aban- donar a noção de constância entre essas medidas, a equação continuou como uma proposta de fortalecimento de respostas baseada em um crescimento linear até atin- gir o máximo de respostas possíveis. Para Herrnstein (1961), essa relação seria a única compatível com a igualação. E por que isso é tão importante para apreciarmos os resul- tados de Herrnstein? Porque ao ser aplicado a esquemas concorrentes, envolve um pres- suposto fundamental: de que há um limite máximo de emissão de respostas e, assim, o aumento na taxa de uma resposta (confor- me o aumento na taxa de reforço) é neces- sariamente acompanhado pela redução nas demais respostas. Ao revermos a descri- ção dos dados de taxas de respostas acima, quando os dois esquemas eram iguais (VI 3 min – VI 3 min) as taxas de respostas se assemelharam e, para cada um dos demais esquemas com VIs diferentes, os pombos responderam no VI com maior frequência de reforço e a soma das respostas nos dois esquemas permaneceram constantes, ou sem alterações sistemáticas entre diferen- tes condições. DESDOBRAMENTOS A importância do experimento de Herrnstein (1961) foi exatamente estabele- cer um procedimento no qual era possível se relacionar medidas quantitativas de fre- quências absolutas e relativas de respos- tas a dois discos à frequência relativa de reforços. A relação de igualdade entre as frequências relativas de reforços e as fre- quências relativas de respostas expressa na Equação 1 foi então o primeiro grande passo para a chamada “Lei da Igualação” (Herrnstein, 1970), que expressa, em linhas gerais, que a distribuição de respostas entre alternativas tende a igualar a distribuição de reforços obtidos nas respectivas alter- nativas. Além disso, dela deriva a ideia de que quando essa distribuição de reforços é alterada em alguma direção, a distribuição de respostas tenderá a se alterar na mesma medida. Assim, se duas fontes de reforços fornecem a mesma frequência de reforços, as respostas tenderão a se distribuir em tor- no de 50% para cada alternativa; se uma das fontes passa a fornecer uma frequência quatro vezes maior que a outra, de forma que 80% dos reforços passam a ser obtidos nessa fonte, a Lei da Igualação prevê que o organismo passará a emitir em torno de quatro vezes mais respostas nessa alterna- tiva, conforme previsto na igualação perfei- ta (ou estrita) de Herrnstein (Equação 1). Capítulo V | Escolha 85 Os trabalhos que se iniciaram com o experimento de Herrnstein (1961) passa- ram a fornecer dados sistemáticos que fo- ram gradativamente demonstrando que um comportamento é influenciado não apenas por suas consequências, mas também pelos reforços disponíveis no ambiente para res- postas alternativas e culminaram na con- cepção de que escolha é comportamento e todo comportamento envolve escolha² (Herrnstein, 1970). Dois pressupostos quantitativos bá- sicos propostos por Herrnstein (1970), em decorrência dos dados que passaram a ser sistematizados em Herrnstein (1961), re- lacionavam as respostas e os reforços dis- poníveis para diferentes respostas em uma dada situação (Baum, 2010; Davison, 2012; De Villiers & Herrnstein, 1976). Primeira- mente, considerando-se o conjunto de res- postas nesta dada situação, há um máximo de respostas incompatíveis possíveis de se- rem emitidas (k) que se mantém constante nessa situação. O outro pressupõe que esse total de respostas é alocado entre diferen- tes fontes reforçadoras conforme suas res- pectivas proporções de reforços. Contudo, Herrnstein (1961) considerava que o au- mento linear das taxas de respostas deveria ser obtido com o aumento das taxas abso- lutas de reforços também em situações que investigavam respostas em esquemas sim- ples. Ao se deparar com dados que contra- riaram essa suposição (e.g. Catania & Rey- nolds, 1968) e mostravam que o aumento da taxa de respostas com o aumento da taxa de reforços caracterizava-se por unidades cada vez menores (quanto mais reforços por minuto eram providos, menor o aumen- to na taxa de respostas), Herrnstein (1970) ponderou que mesmo em um esquema sim- ples outras fontes de reforço (mesmo não controladas pelo experimentador) estariam em vigor, concorrendo com o esquema pro- gramado pelo experimentador. Em termos matemáticos, essa relação pode ser aplica- da a uma única resposta R1 reforçada com uma frequência absoluta r1, em que devem ser considerados os reforços para outros comportamentos incompatíveis (ro), rela- ção essa expressa na Equação 2, que ficou conhecida como a hipérbole de Herrnstein, por dar conta dos efeitos cada vez menores do aumento da taxa absoluta de reforços sobre a taxa absoluta de respostas: (2). As previsões derivadas desse mode- lo são que: a taxa de R1 pode variar de zero até se aproximar do máximo k, conforme a relação entre seus reforços (r1) e os outros reforços (ro) para as respostas concorrentes; quanto maior a frequência de reforços para R1 em relação aos reforços disponíveis para 2 A sugestão inicial de Herrnstein levou a questionamentos acerca de sua amplitude, por ser inicialmente entendida como relacionada a comportamentos operantes e respondentese por se questionar a sua aplicabilidade em situações nas quais a escolha é “praticamente” nula, como, por exemplo, uma pessoa sendo ameaçada com uma arma para abrir seu cofre. Com relação ao primeiro, os relatos encontrados res- tringem-se a comportamento operante. Quanto ao segundo, a situação envolveria uma altíssima magnitude de reforço (negativo, no caso) para a resposta de ceder à ameaça, em contraposição a uma ínfima mag- nitude para rebater as ameaças, de forma que a resposta (muito) mais provável estaria sob controle das magnitudes relativas de ambas as respostas. Dessa forma, a menção a respostas no presente texto será referente a operantes. Cristiano Coelho 86 outras respostas, maior a frequência de R1; à medida que o ambiente passa a prover mais reforços para outras respostas, a frequência de R1 diminui; o aumento da frequência ab- soluta de R1 é cada vez menor à medida que se aumenta a frequência absoluta de refor- ços. Para exemplificar a relação acima, vamos supor uma situação hipotética na qual o total de reforços para outros compor- tamentos é constante ao longo de diferentes condições. Em uma condição o experimen- tador programa um esquema que fornece 10 reforços por hora e, hipoteticamente, o organismo emite 50 respostas por minuto. Ao alterarmos a condição e aumentar em 10 os reforços por hora (fornecendo então 20 reforços por hora), possivelmente as res- postas aumentarão para 100 por minuto (50 respostas a mais). Se aumentarmos mais 10 reforços por hora em uma nova condição (que passa a fornecer 30 reforços por hora), as respostas apresentarão um aumento menor, digamos 40 respostas por minuto a mais, e o organismo passará a emitir 140 respostas por minuto. Caso uma nova con- dição programe mais 10 reforços por hora, o aumento no número de respostas será de 30, por exemplo, e assim por diante, até que atinja o máximo de respostas, e então o aumento na taxa absoluta de reforços não produzirá aumentos nas taxas de respostas. Como podemos ver, a cada condição o au- mento na taxa de reforço foi constante (de 10 em 10), mas o aumento na taxa de respos- tas foi cada vez menor (50, 40, 30...), obten- do-se 50, 100, 140, 170 até atingir o máximo. Esse efeito das taxas de reforços so- bre a taxa de respostas, porém, não apenas é totalmente compatível com a igualação, mas acaba sendo fundamental para que ela ocorra, pois acaba mostrando que as alterações nas condições estão alterando a frequência de reforços programados pelo experimentador relativamente aos outros reforços providos pelo ambiente (Ro), que permaneceram constantes ao longo das di- ferentes condições no nosso exemplo. Se hipoteticamente os outros reforços tiverem uma taxa de 10 por hora na primeira condi- ção, igual ao programado pelo experimen- tador, o organismo alocará metade do tem- po respondendo ao esquema programado e metade do tempo realizando as outras ati- vidades. Vamos considerar agora duas situa- ções com esquemas concorrentes. Em uma temos dois esquemas de intervalo variável de 30 segundos, e na outra, dois esquemas de intervalo variável de 1 minuto, cada um associado a um disco de respostas. Nas duas situações, a taxa total de reforços é diferente, considerando os dois esquemas: a primeira com 120 reforços por hora e a segunda com 60 reforços por hora. Assim, o total de res- postas emitidas nos dois discos na primeira situação seria maior que na segunda, visto que teria uma maior taxa absoluta de refor- ços. Porém, como em ambas as situações os esquemas componentes dos respectivos pares concorrentes são iguais, com metade Capítulo V | Escolha 87 dos reforços a serem obtidos em cada fon- te, a igualação prevê que o organismo dis- tribuiria igualmente suas respostas às duas fontes, pois o que importa para a igualação são os valores relativos dos reforços e não os absolutos. Mas você pode perguntar: e os outros reforços não alterariam essa relação? Não! De acordo com a hipérbole de Herr- nstein, além dos esquemas programados pelo experimentador, o organismo também gastaria tempo emitindo respostas que são controladas pelos outros reforços disponí- veis nessa situação. Contudo, como os ou- tros reforços estão constantes nessa condi- ção, eles interfeririam da mesma maneira (ou igualmente) nas respostas aos dois es- quemas e, assim, seus efeitos se anulariam matematicamente. Essas previsões atualmente podem parecer simples, mas precisamos conside- rar que àquela época o diferencial foi mos- trar que a frequência de R1 não dependia apenas dos reforços produzidos por ela. Porém, isso não é tudo. Se R1 depende de sua taxa de reforços e dos reforços para ou- tras respostas alternativas e, consequente- mente, as outras respostas são controladas pelos seus próprios reforços e pela taxa de reforços de R1, há uma interdependência entre a contingência em vigor para R1 e as contingências sob as quais estão as outras respostas possíveis de serem emitidas na mesma situação e incompatíveis com R1. Dessa forma, ao se aumentar a taxa de re- forços para R1 relativamente aos reforços de outros comportamentos, não só a taxa de respostas R1 aumenta, mas a emissão de outras respostas alternativas diminui, de- vido a um máximo de respostas possíveis de serem emitidas. O artigo de Herrnstein (1961) foi um marco no estudo do comporta- mento de escolha ao prover dados sistemá- ticos e quantificação de duas alternativas de respostas, realizando manipulações pa- ramétricas da taxa relativa de reforços em esquemas concorrentes de intervalo variá- vel (CONC VI - VI) e mostrando que as alte- rações nessa taxa relativa de reforços eram acompanhadas de alterações similares na taxa relativa de resposta, desenvolvendo o princípio de igualação. Em termos quanti- tativos, se aplicarmos a Equação 2 a duas respostas concorrentes, R1 e R2, obtemos a Equação 1³ proposta por Herrnstein (1961). A concepção de Herrnstein (1961) foi tão importante que, após sua publicação, a Análise do Comportamento passou a de- senvolver diversos trabalhos quantitativos, não apenas para o estudo de escolha, mas na busca de relações quantitativas entre o comportamento e suas consequências, ava- liando também a asserção de Herrnstein (1970) de que escolha é comportamento (e vice-versa). Passamos então a ter uma gama de estudos que tentavam avaliar a genera- lidade da Lei da Igualação e extensão para outros parâmetros do reforço, como atraso e magnitude (e.g. Rachlin & Baum, 1969; 3 Há um conjunto de transformações para se chegar a essa formulação, fora do âmbito do presente trabalho. De forma resumida, tanto k quan- to ro saem da Equação 1 porque ao interagirem da mesma forma com R1 e R2, seus efeitos são matematicamente “anulados”. Cristiano Coelho 88 Logue, 1988; Logue & Chavarro, 1987; Todo- rov, 1973), arranjos experimentais, como a função do COD e efeito da frequência abso- luta de reforços (e.g. Shull & Pliskoff, 1967; Todorov, Coelho & Beckert, 1993), efeitos da história (e.g. Todorov, Oliveira-Castro, Han- na, Bittencourt de Sá & Barreto, 1983), ape- nas para mencionar alguns poucos exem- plos. Pesquisas mostraram também que a relação de igualação se aplicava para medi- das de alocação de tempo (e.g. Baum, 1975; Baum & Rachlin, 1969). A aplicabilidade da proposta de Herrnstein para o estudo e in- tervenção sobre o comportamento humano também foi testada (e.g. Bradshaw & Szaba- di, 1978; Logue, 1988; Neef, Mace, Shea & Shade, 1992; Pierce & Epling, 1983). Baum (1974, 1979) observou os dados de alguns estudos indicavam dois desvios sistemáticos da igualação encontrados em- piricamente. Um desvio foi chamado de viés, uma persistência a apresentar uma preferência por uma alternativa derivada de aspectos não relacionados à distribui- ção de reforços. Essa preferência por uma alternativa pode ser derivada de diferenças na força necessária para acionar o lócus de respostas, diferenças qualitativas nas respostas em cadaesquema (bicar x acio- nar um pedal), diferenças na iluminação dos discos, dentre outros. O outro desvio, chamado de sensibilidade, ocorre quando a distribuição de respostas não se modifi- ca de maneira estrita conforme a alteração nas relações entre os reforços obtidos nos esquemas concorrentes. Conforme pontua- mos ao início deste tópico, para Herrnstein (1961), a igualação implica que uma variação na frequência relativa de reforços deve ser acompanhada da mesma variação na fre- quência relativa de respostas: se em uma fonte é obtida três vezes mais reforços que a alternativa, para igualar o organismo emi- tiria três vezes mais respostas, por exemplo. Além disso, ao se dobrar a frequência relati- va de reforços para essa mesma alternativa, a frequência relativa de respostas também dobraria. Porém, Baum (1979) realizou uma revisão de 23 estudos e observou dados nos quais quando a distribuição de reforços era alterada em uma certa medida produzia variações menores e, em outras, variações maiores na distribuição de respostas, as quais Baum denominou de “subigualação” e “sobreigualação”, respectivamente. Diversos trabalhos (e.g. Baum, 1974, 1979; Rachlin & Baum, 1969) estenderam a proposta de Herrnstein (1961, 1970). Ao bus- car sistematizar os dados sobre igualação envolvendo os diferentes parâmetros do re- forço, Baum (1974) desenvolveu a Lei Gene- ralizada da Igualação. Porém, derivou uma equação baseada na relação entre razões de respostas (respostas emitidas em uma alter- nativa dividida pelas respostas emitidas na outra alternativa) e razões de reforços (re- forços obtidos em uma alternativa dividido pelos reforços obtidos na outra alternativa). O uso de medidas de razão descrevia me- lhor as distribuições de reforços e respostas por terem uma amplitude maior que pro- porção ou porcentagem, que tem seu limite Capítulo V | Escolha 89 de 0 a 1 e 0% a 100%, respectivamente. Essa relação é expressa na Equação 3: (3), sendo a e b os parâmetros obtidos empiri- camente, relacionados ao viés e sensibilida- de. Quando se encontra uma sensibilidade perfeita e ausência de viés, a equação de Baum expressa a igualação estrita de Herr- nstein. A mesma relação pode ser aplicada quando são manipuladas as magnitudes e/ ou atrasos. Quando os três parâmetros são manipulados em um mesmo experimento, é possível se calcular as sensibilidades às variações de cada um deles. Pierce e Epling (1983) avaliaram a ge- neralidade da Lei da Igualação para a des- crição do comportamento humano e suge- rem que os resultados com humanos seriam compatíveis com a igualação. Além disso, observaram que pesquisas com humanos que não encontraram dados sistemáticos compatíveis com a igualação (e.g. Oscar- -Berman, Heyman, Bonner & Ryder, 1980) apresentavam especificidades metodoló- gicas que não permitiriam uma adequada análise da igualação. Em primeiro lugar, esses experimentos com humanos geral- mente utilizaram poucas sessões e dados de comportamento sem o controle já esta- belecido pela contingência, ou seja, dados de transição, ao passo que a lei se dirige a dados de distribuição de respostas em esta- do estável. A discussão levantada por Pierce e Epling (1983) mostra alguns dos cuidados necessários para se falar em igualação e sua aplicabilidade ao comportamento huma- no, em concordância com os pressupostos desenvolvidos por Herrnstein (1961, 1964, 1970) e compatível com a literatura. Dois exemplos da aplicabilidade da igualação com humanos em contextos diferentes po- dem contribuir para que visualizemos a ex- tensão dos efeitos de Herrnstein (1961). Bradshaw e Szabadi (1976) realiza- ram uma investigação, ao longo de seis me- ses, com uma pessoa diagnosticada como maníaca depressiva. No experimento, dife- rentes operandos estavam associados com diferentes VIs, que foram utilizados para manipular a taxa de reforço, testando uma função derivada da Equação 1 acima. Essa mensuração, realizada em situações com diferenças de “humor” (normal, depressivo, maníaco), mostrou que a taxa de respos- tas aumentava com aumentos na taxa de reforço na forma prevista pela Equação 1, atingindo o máximo k. Contudo, conforme o “humor”, o máximo de respostas emitidas diferiu, com taxas máximas mais altas obti- das em quando o paciente estava maníaco, e as mais baixas quando estava depressivo. Neef, Mace, Shea e Shade (1992) ava- liaram a Lei da Igualação em um contexto educacional com reforçadores de mesma “qualidade” e “qualidade” diferente. Três estudantes especiais tiveram que resol- ver problemas matemáticos apresentados Cristiano Coelho 90 concorrentemente e com reforços de acor- do com esquemas de VI. Na condição com reforços qualitativamente semelhantes, o tempo alocado a cada esquema variou con- forme previsto na igualação. Um dado inte- ressante foi que os autores não obtiveram igualação com reforços qualitativamente diferentes. De fato, a proposta de igualação, tal como proposta por Herrnstein, se ade- qua a escolha com mesmos reforçadores. A ideia de igualação repercutiu tam- bém no desenvolvimento dos trabalhos sobre escolhas entre reforçadores com di- ferentes atrasos e magnitudes, desenvol- vidos na área de autocontrole (e.g. Mazur, 1987; Rachlin & Green, 1972). A noção bási- ca para essa extensão foi a Lei Generalizada da Igualação, com a demonstração de que a distribuição de respostas é alterada con- forme os pressupostos básicos da ideia de Herrnstein (1961) quando são manipulados atraso e magnitude de reforço. Além disso, análises quantitativas da perda de valor re- forçador de consequências atrasadas mos- traram-se compatíveis com a equação de igualação (Ainslie & Haslam, 1992) ao serem aplicadas ao estudo do comportamento de não humanos (e.g. Mazur, 1995) e humanos (e.g. Coelho, Hanna & Todorov, 2003; Ra- chlin, Raineri & Cross, 1991). A Lei da Igualação, tal como propos- ta por Herrnstein (1961), se adequa a escolha com mesmos reforçadores. Propostas pos- teriores (e.g. Rachlin, 1989) tentaram inter- pretar o parâmetro de sensibilidade da Lei Generalizada da Igualação como o nível de semelhança funcional ou de complementa- riedade entre os reforços disponibilizados pelas duas fontes. Em alguns casos, essa in- terpretação prevê que a diminuição de uma frequência de reforços levaria à diminuição nas duas respostas concorrentes e permite descrever adequadamente as alterações na distribuição de respostas. Mas essa é outra longa história4! CONSIDERAÇÕES FINAIS Sem dúvida, a contribuição mais clara de Herrnstein (1961) foi sua proposta de estabelecer relações quantitativas pre- cisas entre comportamento e suas conse- quências. Essas relações não só validam, mas principalmente, acrescentam-se aos achados sobre a regularidade dessas re- lações. Ao longo de seus estudos, Herrns- tein procurou aprofundar essas relações, focando nos efeitos das consequências e questionando princípios de racionalidade, sistematizados em uma compilação de tex- tos finalizada após sua morte (Herrnstein, Rachlin & Laibson, 1997). Essa compilação de textos mostra como as pesquisas realiza- das por ele iniciadas a partir de Herrnstein (1961) foram indicando as falhas nas previ- sões da Psicologia e da Economia baseadas 4 Algumas referências a respeito, além de Rachlin (1989): Rachlin, H., Kagel, J. H., & Battalio, R. C. (1980). Substitutability in time allocation. Psychological Review, 87(4), 355. Rachlin, H., Green, L., Kagel, J. H., & Battalio, R. C. (1976). Economic demand theory and psychological stu- dies of choice. Psychology of Learning and Motivation, 10, 129-154. Capítulo V | Escolha 91 no pressuposto de que as escolhas visam o máximo de resultados. Esses dados mos- tram a igualação na base da dinâmica das escolhas. E há muito mais para buscarmos e satisfazer nossa curiosidade. Os números? Eles não são o comportamento em si, ape- nas uma forma (dentre as diversas) de des- crevê-lo e permitir-nosconhecer de uma maneira mais precisa as regularidades do comportamento. Considero que para além da quanti- ficação, o pressuposto de que nosso com- portamento é afetado também pelas con- tingências concorrentes é uma das grandes contribuições da sistematização dessa área. Ela permeia direta ou indiretamente inter- venções que passaram a ser adotadas em diferentes contextos, nos quais fomos dei- xando de punir comportamentos-proble- ma e passamos a reforçar comportamentos socialmente desejáveis. Diferentes formas de intervenção baseadas em reforço dife- rencial e até a noção de reforço para com- portamentos clinicamente relevantes tipo 2 (CRB2) na Psicoterapia Analítica Funcional (Kohlenbergh & Tsai, 2001) tem embutidas noções que se aproximam daquela investi- gada a partir do experimento de Herrnstein (1961). Podemos ilustrar sua repercussão pelo fato de que Herrnstein (1961), junta- mente com outro trabalho clássico sobre escolha (Herrnstein, 1970) foi um dos cin- co trabalhos publicados no Journal of the Experimental Analysis of Behavior (JEAB) mais citados no Journal of Applied Beha- vior Analysis (JABA) entre 1983 e 2003 (Elliot e cols., 2005). Ao lado do artigo se- minal de Michael (1982) sobre operações estabelecedoras, a Lei da Igualação perma- neceu como um dos principais tópicos de interesse na área aplicada. Conforme El- liot e cols. (p. 560) “Claramente, igualação e operações estabelecedoras são tópicos de contínuo interesse para analistas aplicados do comportamento e devem ser abrangidos em programas de treinamento. Igualação e operações estabelecedoras tem provado ser úteis em conceituar e tratar uma amplitude de comportamentos-problema”. PARA SABER MAIS Baum (2010). Descreve um tutorial baseado na igualação como alocação de tempo entre atividades. No texto são discutidos aspec- tos referentes à Borges, Todorov, & Simonassi (2006). Des- creve experimentos com diferentes mani- pulações, mostrando como as condições para a obtenção de igualação com humanos dependem da programação experimental. Garcia-Mijares & Silva (1999). Apresenta de forma didática as noções de igualação. Madden & Perone (1999). Avaliaram a Lei Generalizada da Igualação e, mais especi- ficamente, a sensibilidade comportamental. Os dados mostraram que a sensibilidade foi Cristiano Coelho 92 maior quando havia uma resposta de obser- vação. Todorov, Coelho, & Beckert (1993). Reali- zaram um conjunto de experimentos com pombos, nos quais variaram a frequência relativa e frequência absoluta de reforços. Os dados reforçam que o pressuposto de que a igualação depende somente da fre- quência relativa de reforços e da função do COD na separação das respostas aos esque- mas. REFERÊNCIAS Ainslie, G., & Haslam, N. (1992). Hyperbolic discounting. In G. Loewenstein & J. Elster, J. (Eds.), Choice over time. New York: Russell Sage Foundation. Baum, W. M. (1974). On two types of devia- tion from the matching law: Bias and un- dermatching. Journal of The Experimental Analysis of Behavior, 22, 231-242. Baum, W. M. (1975). Time allocation in hu- man vigilance. Journal of the Experimental Analysis of Behavior, 23, 45-53. Baum, W. M. (1979). Matching, undermat- ching, and overmatching in studies of choi- ce. Journal of the Experimental Analysis of Behavior, 32, 269-281. Baum, W. M. (2010). Dynamics of choice: A tutorial. Journal of the Experimental Analy- sis of Behavior, 94, 161-174. Baum, W. M., & Rachlin, H. (1969). Choice as time allocation. Journal of the Experimental Analysis of Behavior, 12, 861-874. Borges, F. S., Todorov, J. C., & Simonassi, L. E. (2006). Comportamento humano em es- quemas concorrentes: escolha como uma questão de procedimento. Revista Brasilei- ra de Terapia Comportamental e Cogniti- va,8, 13-24. Bradshaw, C. M., & Szabadi, E. (1978). Chan- ges in operant behavior in a manic-depres- sive patient. Behavior Therapy, 9, 950-954. Catania, A. C., & Reynolds, G. S. (1968). A quantitative analysis of the responding maintained by interval schedules of rein- forcement. Journal of the Experimental Analysis of Behavior, 11, 327-383. Coelho, C., Hanna, E. S., & Todorov, J. C. (2003). Magnitude, atraso e probabilidade de reforço em situações hipotéticas de risco. Psicologia: Teoria e Pesquisa, 19, 269-278. Davison, M. (2012). The matching law (Edi- ção revisada de Davison, M., & McCarthy, D. (1988). The matching law: A research re- view. Hillsdale, NJ: Lawrence Erlbaum As- sociates). De Villiers, P. A., & Herrnstein, R. J. (1976). Toward a law of response strength. Psycho- logical Bulletin, 83, 1131. Capítulo V | Escolha 93 Elliott, A. J., Morgan, K., Fuqua, R. W., Ehrhardt, K., & Poling, A. (2005). Self- and cross-citations in the Journal of Applied Behavior Analysis and the Journal of the Experimental Analysis of Behavior: 1993– 2003. Journal of Applied Behavior Analysis, 38, 559-563. Ferster, C. & Skinner (1957). Schedules of reinforcement. New York: Appleton Cen- tury-Crofts. Findley, J. D. (1958). Preference and swit- ching under concurrent scheduling. Journal of the Experimental Analysis of Behavior, 1, 123-144. Garcia-Mijares, M., & Silva, M. T. A. (1999). Introdução à teoria da igualação. Sobre comportamento e cognição, 4, 40-53. Herrnstein, R. J. (1958). Some factors in- fluencing behavior in a two-response si- tuation. Transactions of the New York Aca- demy of Sciences, 21, 35-45. Herrnstein, R. J. (1961). Relative and Abso- lute strength of Response as a Function of Frequency of Reinforcement. Journal of the Experimental Analysis of Behavior, 4, 267- 272. Herrnstein, R. J. (1964). Secondary reinfor- cement and rate of primary reinforcement. Journal of the Experimental Analysis of Behavior, 7, 27-36. Herrnstein, R. J. (1970). On the law of ef- fect. Journal of the Experimental Analysis of Behavior, 13, 243-266. Herrnstein, R. J., (1997). The matching law: Papers in psychology and economics. Cam- bridge: Harvard University Press. Kohlenberg, R. J., & Tsai, M. (2001). Psicotera- pia Analítica Funcional. São Paulo: ESETEC. Logue, A. W., & Chavarro, A. (1987). Effect on choice of absolute and relative values of reinforcer delay, amount, and frequency. Journal of Experimental Psychology: Ani- mal Behavior Processes, 13, 280. Logue, A. W. (1988). Research on self-con- trol: An integrating framework. Behavioral and Brain Sciences, 11, 665-679. Madden, G. J., & Perone, M. (1999). Human sensitivity to concurrent schedules of rein- forcement: Effects of observing schedule- -correlated stimuli. Journal of the Experi- mental Analysis of Behavior, 71, 303-318. Mazur, J. E. (1987). An adjusting procedu- re for studying delayed reinforcement. In M. L. Commons, J. E. Mazur, & J. A. Nevin (Eds.), Quantitative Analysis of Behavior: Vol 5. The effect of delay and intervening events on reinforcement value. Hillsdale, NJ: Lawrence Erlbaum. (pp. 55-73). Mazur, J. E. (1995). Conditioned reinforce- ment and choice with delayed and uncer- Cristiano Coelho 94 tain primary reinforcers. Journal of the Ex- perimental Analysis of behavior, 63, 139-150. Michael, J. (1982). Distinguishing between discriminative and motivational functions of stimuli. Journal of the Experimental Analysis of Behavior, 37, 149-155. Neef, N. A., Mace, F. C., Shea, M. C., & Sha- de, D. (1992). Effects of reinforcer rate and reinforcer quality on time allocation: Ex- tensions of matching theory to educatio- nal settings. Journal of Applied Behavior Analysis, 25, 691-699. Oscar-Berman, M., Heyman, G. M., Bon- ner, R. T., & Ryder, J. (1980). Human neu- ropsychology: Some differences between Korsakoff and normal operant performan- ce. Psychological Research, 41, 235-247. Pierce, W. D., & Epling, W. F. (1983). Choice, matching, and human behavior: A review of the literature. The Behavior Analyst, 6, 57. Rachlin, H. (1989). Judgment, decision, and choice: A cognitive/behavioral synthesis. New York: WH Freeman/Times Books/Henry Holt & Co. Rachlin, H., & Baum, W. M. (1969). Respon- se rate as a function of amount of reinfor- cement for a signalled concurrent respon- se. Journal of the Experimental Analysis of Behavior, 12, 11-16. Rachlin, H., & Green, L. (1972). Commit- ment, Choice and self-control. Journal of the Experimental Analysis of Behavior, 17, 15-22. Rachlin, H., Raineri, A., & Cross, D. (1991). Subjective probability and delay. Journal of the Experimental Analysis of Behavior, 55, 233-244. Shull, R. L., & Pliskoff, S. S. (1967). Changeo- ver delay and concurrent schedules: Some effects on relative performance measures. Journal of the Experimental Analysis of Behavior, 10, 517-527. Skinner, B. F. (1950). Are theories of lear- ning necessary? Psychological Review, 57, 193-216. Todorov, J. C. (1973). Interaction of frequen- cy and magnitude of reinforcement on con- current performances. Journal of the Expe- rimental Analysis of Behavior, 19, 451-458. Todorov, J. C., Oliveira-Castro, J. M., Hanna, E. S., Bittencourt de Sá, M. C. N., & Barre- to, M. D. Q. (1983). Choice, experience, and the generalized matching law. Journal of the Experimental Analysis of Behavior, 40, 99- 111. Todorov, J. C., Coelho, C., & Beckert, M. E. (1993). Efeito da frequência absoluta de re- forços em situação de escolha: um teste do pressuposto da relatividade na lei generali- zada de igualação. Psicologia: Teoria e Pes- quisa, 9, 227-42. Elenice S. Hanna, Márcio Borges Moreira 95 Prestaram atenção em tudo? Elenice S. Hanna Universidade de Brasília Márcio Borges Moreira Centro Universitário de Brasília; Instituto Walden4 Reynolds, G. (1961). Attention in the pigeon. Journal of the Experimental Analysis of Behavior, 4, 203-208. “Da mesma forma que podemos atentar para um objeto sem olhar para ele, assim também podemos olhar para um objeto sem prestar-lhe atenção” Skinner (1953/2003, p. 138) Capítulo VI | Atenção 96 INTRODUÇÃO À ÁREA DE PES- QUISA E CONTEXTUALIZAÇÃO DO EXPERIMENTO Ao perguntar para várias pesso- as que foram à mesma sala de cinema no mesmo horário, o que lhes chamou mais atenção, respostas variadas apareceriam. Alguns incluiriam no relato determinados personagens, suas personalidades ou as in- terações entre eles. Outros falariam dos ce- nários, cidades ou construções. Poderíamos ainda encontrar aqueles que focam seus relatos nas cenas de suspense, na forma como foram produzidas, na iluminação ou nos aspectos negativos. Uma pessoa menos atenta ao filme, como o dono do cinema, poderia ainda ter se interessado pelo nú- mero de pessoas que havia na sala e no que elas estavam consumindo. Em situações cotidianas nem sem- pre o comportamento de uma pessoa fica, do ponto de vista de um observador exter- no (o diretor do filme, por exemplo) ou do próprio indivíduo, sob controle dos mes- mos estímulos que antecedem ou que estão presentes quando um determinado com- portamento ocorre. Dito de outra forma, di- ferentes indivíduos podem prestar atenção a diferentes aspectos, ou diferentes estímu- los, de um mesmo ambiente. Diz-se, nessas situações, que o organismo prestou ou não atenção ao evento, que atentou ou não a uma ou mais propriedades relevantes do es- tímulo. É importante ressaltar que, em Aná- lise do Comportamento, estímulo é “qual- quer evento físico, combinação de eventos ou relação entre eventos. O vocabulário do estímulo classifica os aspectos do ambiente …” (Catania, 1998/1999, p. 402). Quando fa- lamos de uma propriedade de um estímulo, falamos de alguma qualidade mensurável de um estímulo, por exemplo, cor, forma, cheiro, tamanho, textura, etc. O conceito de ambiente, por sua vez, pode ser definido como o “conjunto de circunstâncias físicas no qual o organismo, ou uma parte referida desse organismo, existe” (Johnston & Pen- nypacker, 2009, p. 29). O uso do conceito de atenção em muitos casos, entretanto, pode inverter “... a direção da ação ao sugerir que não é o es- tímulo que controla o comportamento do observador, mas é o observador que atenta para o estímulo e assim o controla” (Skin- ner, 1953/2000, p. 135). Nessa perspectiva, a “falta de atenção” não explica o contro- le inadequado de estímulos, é apenas uma forma resumida de se referir à ausência de controle por determinados elementos ou dimensões de estímulos sobre o comporta- mento. É importante lembrar que falar de controle do comportamento é falar de vari- áveis que tornam um determinado compor- tamento mais ou menos provável (não sig- nifica, necessariamente, falar de “obrigar” alguém a fazer algo). Conhecer as variáveis que aumen- tam as chances de haver coerência entre o que se quer ensinar dos estímulos ante- cedentes e o que será aprendido é funda- Elenice S. Hanna, Márcio Borges Moreira 97 mental para o ensino de diversos processos comportamentais complexos. A aprendiza- gem de conceitos, por exemplo, é base para o desenvolvimento do pensamento e da linguagem humana. Quando aprendemos o conceito de “vermelho” ou de um “núme- ro”, interagimos com eventos que são com- postos por outras propriedades. Um objeto vermelho ou unitário possui forma, peso, tamanho, apenas para citar algumas das possíveis propriedades. Mas como ocorre o processo que permite que determinado comportamento fique sob controle da cor ou o número, por exemplo, dentre tantos aspectos dos objetos que contêm cor e nu- merosidade? Perguntando em uma lingua- gem mais coloquial, como prestamos aten- ção apenas à cor ou ao número dos objetos? O experimento que é tema deste ca- pítulo foi publicado por George Reynolds em 1961 com o título de “Atenção no pom- bo” e inspirou uma série estudos relevan- tes para a compreensão da atenção e do controle do comportamento por estímu- los compostos. Em estudos sobre controle do comportamento operante por estímu- los antecedentes, o ensino é realizado por meio de procedimentos chamados de treino discriminativo. A base de um treino discri- minativo é o reforçamento diferencial da resposta emitida na presença de estímulos diferentes (Dinsmoor, 1995). Na presença de um objeto vermelho (S+), a resposta de dizer “vermelho” (R) é seguida por alguma reação de aprovação do professor (SR+), mas não terá esta consequência se o objeto for amarelo (S–). Responder “vermelho” faz parte de duas contingências: uma na qual a resposta produz reforçamento e outra em que produz extinção, gerando a discrimi- nação entre os objetos de cores diferentes (i.e., vermelho e amarelo). Discriminar esses objetos é responder diferencialmente na presença de cada um, isto é, dizendo “ver- melho” diante do S+ (objeto vermelho), mas não diante do S– (objeto amarelo). A discriminação está presente em muitos exemplos do que chamamos de “co- nhecimento” e de “atenção”. Quando se diz que alguém reconheceu o brinquedo ver- melho ou prestou atenção no vestido ver- melho, supõe-se que ele(a) diferencie (dis- crimine) as cores. No entanto, afirmações como essas são meras inferências (Sidman, 1979), como as evidências apresentadas por Reynolds (1961) permitem discutir. Pas- semos, então, para o estudo clássico que apresentou estas evidências e em seguida veremos como este tema tem relação com outros assuntos interessantes. DESCRIÇÃO DOS EXPERIMEN- TOS Os experimentos de Reynolds (1961) foram inspirados, dentre outros experi- mentos, pela pesquisa realizada por Lashley (1938), na qual respostas de ratos de saltar em direção a um cartão contendo a figura de um triângulo foram reforçadas com co- mida e as respostas de saltar em direção a Capítulo VI | Atenção 98 um cartão contendo a figura de triângu- lo invertido foram punidas pela queda do animal em uma rede de segurança. Após realizar esse treino discriminativo, Lashley realizou testes nos quais apenas metade das figuras eram apresentadas aos ratos. Nes- ses testes, não se observou consistência no comportamento de saltar dos animais, isto é, as “partes” dos triângulos apresentadasnos testes como estímulos antecedentes exerceram controles diferentes para dife- rentes animais. No entanto, estes responde- ram de forma coerente com o treino quando apenas a metade inferior de cada figura era apresentada. Experimento 1 - Objetivo e Método Com base nos resultados da pesquisa de Lashley (1938), o objetivo do experimen- to de Reynolds (1961) foi avaliar os efeitos da variação e eliminação de características dos estímulos sobre a aprendizagem de dis- criminações de estímulos – dizemos que uma discriminação de estímulos foi estabe- lecida quando o indivíduo se comporta de maneira diferente na presença de estímulos antecedentes diferentes. No Experimento 1 (Reynolds, 1961), dois pombos foram colocados em câma- ras experimentais que continham discos de resposta onde ora era apresentado um triângulo sobre um fundo vermelho (ΔR) e ora um círculo sobre um fundo verde (OG), Figura 1. Diagrama do treino discriminativo e dos estímulos decompostos utilizados no teste em extinção de Reynolds (1961; painel da esquerda) e resultados do Experimento 1 (painel da direita). O gráfico do painel da direita é uma adaptação da Figura 1 de Reynolds (p. 204). Elenice S. Hanna, Márcio Borges Moreira 99 de forma imprevisível. Bicadas no disco ΔR eram seguidas por comida (reforço), após transcorridos 3 min em média desde a apresentação do último reforço (i.e., um es- quema de reforçamento intervalo variável, VI, 3 min). Respostas de bicar no disco OG não eram reforçadas (extinção). Esta etapa do procedimento consistiu de um treino discriminativo (Figura 1). Após a etapa de treino discriminativo, iniciava-se uma se- gunda etapa do experimento, chamada de teste em extinção. Nesta etapa Reynolds (1961) programou um teste no qual os com- ponentes dos estímulos utilizados durante o treino discriminativo eram apresentados separadamente, ou seja, o disco de resposta continha ora o triângulo, ora o círculo, ora era iluminado por vermelho e ora por ver- de. O teste foi realizado em extinção, isto é, bicadas no disco, independentemente de qual estímulo estivesse presente no disco, não eram seguidas pela apresentação de comida. O teste em extinção foi uma veri- ficação do que os pombos haviam aprendi- do durante o treino discriminativo. Portan- to, procedimentos de treino são tarefas de aprendizagem e procedimento de teste em extinção são procedimentos de avaliação dessa aprendizagem. Resultados e Discussão No início do treino discriminativo, ambos os pombos bicavam no disco tanto na presença do ΔR quanto na presença do OG. No entanto, à medida que o treino dis- criminativo continuava, as respostas iam se concentrando no disco cujas bicadas pro- duziam comida, isto é, os animais passaram a bicar nos disco quase que exclusivamente na presença do triângulo sobre fundo ver- melho (Figura 1). Neste caso, dizemos que o controle discriminativo foi estabelecido: respostas de bicar ocorriam na presença do triângulo sobre fundo vermelho e ocorriam com baixa frequência na presença do círcu- lo sobre fundo verde. Durante o teste em extinção, na qual os componentes dos estímulos utilizados no treino foram apresentados separada- mente, Reynolds (1961) verificou que, para o pombo 105, a maioria das respostas de bicar ocorreu na presença do triângulo, enquan- to para o pombo 107 a maior parte das res- postas ocorreu na presença da cor vermelha (Figura 1). Mesmo tendo sido submetidos ao treino discriminativo com os mesmos es- tímulos compostos, o comportamento de cada um dos animais, durante o teste, foi controlado por uma propriedade especí- fica diferente do estímulo (triângulo para o pombo 105 e cor vermelha para o pom- bo 107). Reynolds argumentou apenas que o responder de cada um dos pombos ficou sob controle de um dos muitos aspectos de cada estímulo, não sugerindo possíveis de- terminantes das diferenças individuais no controle de estímulos observado no com- portamento dos pombos - até porque seus dados não permitiam explicar o controle de estímulos desenvolvido pelos animais. Os analistas do comportamento acham mais produtivo ficar provisoriamente sem uma Capítulo VI | Atenção 100 explicação do que inventar um explicação que não seja baseada nas interações entre o organismo e o ambiente. Por exemplo, Rey- nolds poderia ter dito: “O pombo 105 bicou mais vezes na presença do triângulo duran- te os testes porque ele prestou mais aten- ção a este aspecto do estímulo durante o treino”. No entanto, propor uma explicação como essa não explica nada, é apenas ou- tra forma de dizer que o pombo bicou mais vezes na presença do triângulo. Mesmo se aceitássemos a explicação “bicou mais na presença do triângulo porque prestou mais atenção a esse aspecto”, ainda teríamos que explicar por que ele prestou mais atenção a esse aspeto. Os estudos que foram desen- cadeados após a publicação do artigo de Reynolds (1961), entretanto, mostraram que o objetivo do estudo original foi cumprido e inspirou muitos outros estudos que nos aju- dam a compreender melhor como diferen- tes controles de estímulos se estabelecem. Experimento 2 - Objetivo e Método Reynolds (1961) realizou um segun- do experimento, com os mesmos pombos, fazendo combinações de estímulos ainda mais complexas. No Experimento 2, havia as seguintes combinações de forma e cor nos discos de resposta durante o treino dis- criminativo: triângulo sobre fundo verme- lho, círculo sobre fundo vermelho, triân- gulo sobre fundo azul, círculo sobre fundo azul. Além disso, em alguns momentos uma lâmpada amarela, posicionada na lateral da câmara experimental, se acendia e em ou- tros momentos uma lâmpada verde, posi- cionada no mesmo local que a amarela, se acendia. Durante o treino discriminativo do Experimento 2, as respostas de bicar o disco foram reforçadas em esquema de intervalo fixo (FI) 3 min quando a lâmpada amarela estava acesa e o fundo do disco era verme- lho (independentemente se continha círcu- lo ou triângulo) e quando a luz verde estava acesa e o disco continha um triângulo (in- dependentemente da cor do fundo do dis- co). Veja que neste treino discriminativo, o comportamento do pombo de bicar no dis- co deveria ficar sob controle de uma rela- ção mais complexa (i.e., composta por mais elementos) entre os estímulos presentes do que aquela programada no Experimento 1: cor da lâmpada lateral, cor do fundo do dis- co e forma projetada no disco. Resultados e Discussão Após cerca de 100 horas de trei- no discriminativo, o comportamento dos pombos ficou sob controle dos estímulos programados, isto é, eles bicavam no dis- co quando a luz amarela e o fundo do dis- co vermelho estavam presentes e quando luz verde e o triângulo estavam presentes; quando a luz amarela e círculo sobre fun- do azul estavam presentes, por exemplo, os pombos praticamente não bicavam o disco de resposta. Após o treino discriminativo, Reynolds (1961) realizou vários testes em extinção alterando a configuração dos estí- mulos como, por exemplo, extinção das res- postas durante as mesmas configurações de estímulos do treino; extinção das respostas com as duas lâmpadas laterais apagadas; e Elenice S. Hanna, Márcio Borges Moreira 101 extinção das respostas com as duas lâmpa- das laterais acesas simultaneamente. Os resultados desse segundo expe- rimento replicaram os resultados do pri- meiro: controle por aspectos específicos da configuração de estímulos. Nas palavras de Reynolds (1961, p. 208): No segundo experimento, nenhum dos pombos atentou para a cor da lâmpa- da lateral. O responder deles foi controlado apenas pela presença ou ausência da lâm- pada lateral amarela, ou, de acordo com análise posterior, pela intensidade da ilu- minação da lâmpada lateral. DESDOBRAMENTOS Centenas, talvez milhares, de pes- quisas foram e continuam sendo realizadas com o intuito de sabermos cada vez mais sobre os fatores que determinam quais os aspectos do ambiente que controlarão ocomportamento de diferentes organismos e em quais situações (e.g., Barros, Galvão, Brino, Goulart, & McIlvane, 2005; Carter & Werner, 1978; de Rose, de Souza & Hanna, 1996; Debert, Huziwara, Faggiani, de Mathis & McIlvane, 2009; Dube & McIlvane, 1999; Johnson & Cumming, 1968; Lovaas, Koegel & Schreibman, 1979). Em outras palavras, ainda hoje estudamos o que pode levar al- gumas pessoas a prestarem atenção a certos aspectos de seu ambiente e outras pessoas a prestarem atenção a outros aspectos. A se- guir, apresentamos dois experimentos que demonstraram controle discriminativo por parte da configuração de estímulos e avan- çaram o conhecimento sobre o tema. O primeiro experimento, conduzido por Wilkie e Masson (1976), foi uma repli- cação sistemática do experimento de Rey- nolds (1961) com controles mais refinados e também utilizando pombos como sujeitos experimentais. A primeira parte do estudo foi idêntica ao Experimento 1 de Reynolds (i.e., treino com estímulos compostos e tes- te com os elementos dos estímulos com- postos). Na fase de teste, os seis pombos responderam quase que exclusivamente na presença da cor previamente correla- cionada com o reforço (i.e., teriam atenta- do para cor e não para a forma). Embora as bicadas dos pombos de Wilkie e Masson não tenham ficado sob controle de aspec- tos diferentes do estímulo composto, como no estudo de Reynolds, a evidência de con- trole por apenas uma das propriedades do estímulo composto (cor) é um resultado se- melhante ao (i.e., uma replicação do) estudo original. A replicação (Wilkie & Mason, 1976) confirmou que os animais não humanos não atentam para todas as propriedades de um estímulo composto, mas os autores ainda foram além para avaliar se o teste em extinção era um contexto adequado para identificar o controle de estímulos aprendi- do durante os treinos. Wilkie e Masson, em uma segunda etapa do estudo, realizaram um novo treino discriminativo para avaliar Capítulo VI | Atenção 102 se a situação de teste em extinção masca- rou o possível controle exercido pela outra propriedade do estímulo (forma). Neste se- gundo treino, bicadas no disco foram refor- çadas na presença das duas formas (triân- gulo e círculo), mas sem o fundo colorido correspondente aos estímulos compostos do primeiro treino. Se as formas não tives- sem adquirido nenhuma função comporta- mental no primeiro treino, a aprendizagem na presença de cada forma deveria ser se- melhante no segundo treino. No entanto, já na primeira sessão de treino os pesquisa- dores observaram que a frequência do res- ponder na presença da forma previamente correlacionada com reforço aumentou mais rapidamente que na presença da forma cor- relacionada com extinção. Embora se pu- desse pensar, a partir do primeiro teste, que os pombos prestaram atenção somente à cor, os resultados do segundo treino discri- minativo mostraram que as formas também exerceram algum controle sobre o compor- tamento. Este é um dos aspectos mais interes- santes da pesquisa científica e que depende da curiosidade de pesquisadores e pesqui- sadoras: seu caráter cumulativo. Reynolds (1961) demonstrou atenção seletiva à deter- minados aspectos dos estímulos. Wilkie e Masson (1976) confirmaram esse resultado e ainda mostraram que o contexto no qual se avalia a atenção às diferentes proprie- dades do estímulo pode levar a conclusões diferentes sobre a extensão do controle de estímulos. Nas décadas de 1960 e 1970, muitos estudos sobre controle de estímulos rea- lizados em laboratório utilizaram pombos como sujeitos. O sistema visual das aves, dentre outras vantagens, permite empregar diversos estímulos visuais com variação de cores, diferentemente dos roedores que são sensíveis aos raios UV e “cegos” para grande parte das frequências que seres hu- manos enxergam. Nesses estudos, os estí- mulos visuais são projetados nos discos de resposta ou em outros locais da câmara ex- perimental para estudo do comportamento operante de pombos. Uma pergunta comumente feita quando fenômenos importantes são estu- dados empiricamente em laboratório com não humanos é sobre a sua generalida- de para o comportamento humano. Nesse sentido, Touchette (1969) realizou um treino discriminativo com sete garotos de 12 a 17 anos com atraso severo no desenvolvimen- to, utilizando linhas com diferentes inclina- ções (45° e 135°). O treino iniciava com o re- forçamento de respostas quando uma parte pequena da linha (semelhante à um ponto) aparecia na parte debaixo (para cinco parti- cipantes) ou de cima (para outros dois par- ticipantes) do painel de apresentação dos estímulos (Figura 2, Pré-treino). Em segui- da, os participantes aprendiam as discri- minações com as linhas inclinadas (Figura 2, Treino), devendo responder na chave da esquerda na presença de uma linha com 45° de inclinação e na chave da direita na pre- sença de uma linha com 135° de inclinação. Elenice S. Hanna, Márcio Borges Moreira 103 Durante o teste para avaliar o con- trole de estímulos, Touchette (1969) consi- derou as linhas como estímulos compos- tos e separou cada linha em duas partes, apresentando ora a parte inferior ora a parte superior (Figura 2, Teste). Note que esta separação não alterava a inclinação da linha, que era a propriedade que o ex- perimentador esperava que controlasse o comportamento dos participantes. No en- tanto, o controle parcial foi observado mais uma vez para a maioria dos participantes, que responderam consistentemente apenas para uma das partes (superior ou inferior) da linha com a inclinação correlacionada com reforçamento (Figura 2, painel da di- reita), replicando os achados de Reynolds (1961) e Wilkie e Masson (1976). Além de mostrar a generalidade do fenômeno do controle parcial com humanos e para estí- mulos mais simples (como linhas), Touchet- te mostrou a importância de aprendizagens anteriores para compreender o controle de estímulos (veja também esse efeito de his- tória em Johnson & Cumming, 1968, e Ray, 1969). A história experimental construída durante o pré-treino com estímulos em po- sições diferentes (superior ou inferior), foi uma variável importante para compreender o controle de estímulos observado no teste. Em geral, o responder foi apropriado (i.e., consistente com o treino) apenas quando as partes das linhas apresentadas no teste correspondiam à posição dos estímulos do Pré-treino. Em outras palavras, o início do treino que exigiu atenção para a (ou contro- le pela) parte de cima ou debaixo da chave determinou para qual parte da linha incli- nada o participante atentou nas etapas sub- sequentes do procedimento. Um tema de pesquisa em Análise do Comportamento bastante relacionado com os achados de Reynolds (1961) é a su- perseletividade (overselectivity). Diz-se que houve superseletividade de estímulos ou controle de estímulos restrito quando se ob- serva que um dado comportamento fica sob Figura 2. Estímulos utilizados em cada etapa do estudo de Touchette (1969; painel da esquerda) e porcentagens de acertos obtidas no teste para cada participante (painel da direita). Figura construída com base na descrição do estudo. Capítulo VI | Atenção 104 o controle de apenas uma propriedade do estímulo quando deveria, do ponto de vista do experimentador, ficar sob o controle de relações entre diferentes propriedades des- se estímulo ou de outras propriedades. Por exemplo, se o pai faz a barba e o filho não o reconhece mais como sendo seu pai, di- zemos que houve superseletividade de estí- mulos (estímulo barba, neste caso). A superseletividade (Lovaas, Schrei- bman, Koegel, & Rehm, 1971) ou controle res- trito de estímulos é observada em humanos com desenvolvimento típico (e.g., Verneque & Hanna, 2012), mas com mais frequência em crianças com desenvolvimento atípico (e.g., Lovaas & Schreibman, 1971; Lovaas et al., 1971; Lovaas, et al., 1979), especialmente em indivíduos com diagnóstico de autis- mo. Lovaase colaboradores (e.g., Lovaas & Schreibman, 1971; Lovaas et al., 1971) ensi- naram crianças com desenvolvimento típi- co e com diagnóstico de autismo a discrimi- nar estímulos compostos e mostraram que a maioria das crianças com diagnóstico de autismo respondeu a apenas um dos com- ponentes dos estímulos quando eles foram apresentados separadamente no teste (i.e., superseletividade). Uma proporção menor de crianças com atraso do desenvolvimento do estudo de Lovaas et al. (1971) apresentou superseletividade, enquanto as crianças com desenvolvimento típico responderam a todos os componentes do estímulo com- posto. Lovaas et al. (1979) discutem como a superseletividade pode estar relacionada com falhas no desenvolvimento da lingua- gem, do comportamento social e a outras deficiências na aprendizagem de pessoas no espectro autista. Os estudos de Lovaas e colaborado- res (e.g., Lovaas & Schreibman, 1971; Lovaas et al., 1971; Lovaas et al., 1979) foram con- siderados bastante relevantes para a época, quando havia escassez de conhecimento sobre a falta de responsividade a elemen- tos críticos do ambiente em indivíduos com diagnóstico de autismo e por ter desenca- deado investigações sobre as condições que reduzem a superseletividade. Lovaas e Schreibman (1971), por exemplo, mostraram que ao reforçar respostas na presença dos componentes apresentados separadamen- te, crianças com diagnóstico de autismo passaram a responder a todos os elementos do estímulo composto. Outros estudos (e.g., Allen & Fuqua, 1985; Schreibman, Charlop, & Koegel, 1982) mostraram que não é neces- sário decompor o estímulo e ensinar sepa- radamente as discriminações de cada ele- mento para ampliar o controle de estímulos (i.e., para reduzir a superseletividade). Estes estudos utilizaram, durante a fase de ensi- no, configurações de estímulos compostos S+ e S- que variavam um componente do composto por vez (diferença única) e com- pararam com a condição de ensino que pro- grama estímulos compostos com todos os componentes diferentes (diferenças múlti- plas). Veja na Figura 3 exemplos de estímu- los criados com diferenças múltiplas (pai- nel direito) e estímulos com diferença única (painel esquerdo). Na configuração com di- Elenice S. Hanna, Márcio Borges Moreira 105 ferenças múltiplas, estímulos S+ e S- pos- suem maior diferença física e o responder sob controle de um único componente do estímulo tem a mesma probabilidade de re- forçamento seja qual for o elemento. Nesse caso, atentar para qualquer um dos elemen- tos do estímulo composto é suficiente para produzir 100% dos reforços. Em contraste, para a configuração que possui apenas um elemento diferente, responder sob contro- le dos elementos iguais tem baixa probabi- lidade de ser seguido por reforço, uma vez que ele também está presente nos estímu- los “incorretos”, isto é, aqueles não correla- cionados com reforçamento. Se o elemento diferente é variado ao longo do treino (uti- lizando-se diferentes S- como os da Figura 3), as discriminações por mais componen- tes se desenvolvem. No entanto, configurações com dife- rença única (crítica) produzem mais erros durante a etapa de ensino e seu uso pode não ser uma estratégia eficiente para indi- víduos com baixa resistência à frustração e em tarefas com alta complexidade em rela- ção ao repertório inicial de estudantes (e.g., Anderson & Rincover, 1982). Nesses casos, procedimentos especiais que combinam o ensino de discriminações com os elemen- tos separados e compostos com diferenças críticas e/ou a programação de aumentos graduais na semelhança física entre os es- tímulos (fading, veja o estudo de Terrace, 1963) podem ser utilizados na metodologia de ensino. Os estudos de Dube e McIlvane (1999) e de Duarte e Baer (1997) são exem- plos destes procedimentos. O primeiro en- sinou discriminações entre palavras e o se- gundo entre faces. CONSIDERAÇÕES FINAIS Em muitas atividades humanas, é necessário atentar e discriminar diver- sos eventos e ignorar outros. Reynolds (1961) iniciou uma série de investigações que mostraram que o atentar e as discri- minações que aprendemos dependem das contingências de reforçamento às quais somos expostos. Quando estas contingên- cias permitem o responder sob controle de qualquer componente ou propriedade do evento antecedente para que o reforçamen- to ocorra, variabilidade e controle restrito por um dos elementos comumente resulta. A ocorrência dessa variabilidade depende, entretanto, de condições antecedentes his- tóricas e presentes, além de características do organismo. O conhecimento das variá- veis independentes que ampliam o controle Figura 3. Exemplo de configuração de estímulos S+ e S- com diferença única e com diferenças múltiplas. Capítulo VI | Atenção 106 de estímulos (atenção) tem possibilitado o desenvolvimento de metodologias efetivas para modificar o padrão de controle de estí- mulo muitas vezes denominado de “patoló- gico” (Sidman, 1960). Pesquisas sobre controle de estímu- los realizadas com não humanos, como as de Reynolds (1961), dentre muitas outras, foram e continuam sendo essenciais para que pesquisas sobre controle de estímulos com humanos fossem e continuem sen- do realizadas – toda vez que uma criança apresenta dificuldades para aprender a ler, por exemplo, temos ali uma possível apli- cação para o conhecimento sobre controle de estímulos. O conhecimento acumulado produzido tanto por pesquisas com não hu- manos quanto por pesquisas com humanos foi essencial para que tecnologias de ensino eficazes fossem produzidas e aplicadas nos mais diversos contextos. Graças a todo esse histórico de produção de conhecimento de base empírica, analistas do comportamento têm a possibilidade, hoje em dia, de auxiliar professores a elaborar estratégias de ensino que otimizam a aprendizagem de leitura e escrita de crianças no ensino regular; que possibilitam melhora na qualidade de vida de crianças diagnosticadas com algum tipo de atraso no desenvolvimento, incluindo desempenhos acadêmicos; e que auxiliam no desenvolvimento de softwares educa- cionais mais eficazes, apenas para citar al- guns exemplos. PARA SABER MAIS da Hora & Benvenuti (2007). Os pesquisa- dores avaliaram os efeitos de um procedi- mento conhecido como resposta de obser- vação diferencial sobre o desempenho de um menino autista em uma tarefa de mat- ching-to-sample (MTS) que utilizou sílabas e palavras como estímulos. A resposta de observação diferencial impedia que o res- ponder da criança aos estímulos compara- ção fosse baseado em apenas uma das síla- bas da palavra apresentada como modelo. Gomes & Souza (2008). Nesta pesquisa avaliou-se o desempenho de pessoas diag- nosticadas com autismo em tarefas de em- parelhamento com o modelo por identida- de. Buscou-se, na pesquisa, identificar os efeitos da organização dos estímulos sobre a aprendizagem dos participantes. Hanna, Karino, Araújo, & Souza (2010). Será que aprendemos a ler novas palavras mais rapidamente treinando a leitura com palavras semelhantes ou diferentes? Será que aprendemos a ler novas palavras mais rapidamente treinando com silabas ou le- tras? Essa pesquisa tentou responder a es- sas perguntas. Alves, de Assis, Kato, & Brino (2011). Nesta pesquisa investigou-se a aprendizagem de leitura recombinativa após procedimentos de esvanecimento de sílabas das palavras de ensino em pessoas com atraso no desen- volvimento cognitivo. Elenice S. Hanna, Márcio Borges Moreira 107 REFERÊNCIAS Alves, K. R. S., de Assis, G. J. A, Kato, O. M., & Brino, A. L.F. (2011). Leitura recombinati- va após procedimentos de fading in de síla- bas das palavras de ensino em pessoas com atraso no desenvolvimento cognitivo. Acta Comportamentalia, 19, 183-203. Anderson, N. B. & Rincover, A. (1982). The generality of overselectivity in develop- mentally disabled children. Journal of Ex- perimental Child Psychology, 34, 217-230. Barros, R. S., Galvão, O.F., Brino, A. L. F., Goulart, P. R. K., & McIlvane, W. J. (2005). Variáveis de procedimento na pesquisa so- bre classes de equivalência: contribuições para o estudo do comportamento simbóli- co. Revista Brasileira de Análise do Com- portamento, 1, 15-27. Carter, D. E., & Werner, T. J. (1978). Com- plex learning and information processing by pigeons: A critical analysis. Journal of the Experimental Analysis of Behavior, 29, 565-601. Catania, A. C. (1998/1999). Aprendizagem: comportamento, linguagem e cognição. Por- to Alegre: Artmed. da Hora, C. L., & Benvenuti, M. F. L. (2007). Controle restrito em uma tarefa de mat- ching-to-sample com palavras e sílabas: avaliação do desempenho de uma criança diagnosticada com autismo. Revista Brasi- leira de Análise do Comportamento, 3, 29- 45. Debert, P., Huziwara, E. M., Faggiani, R. B., de Mathis, M. E. S., & McIlvane, W. J. (2009). Emergent conditional relations in a go/no- -go procedure: Figure-ground and stimu- lus-position compound relations. Journal of Experimental Analysis of Behavior, 92, 233- 243. Dinsmoor, J. A. (1995). Stimulus control: Part I. The Behavior Analyst, 18, 51–68. Duarte, A. M. M., & Baer, D. M. (1997). Over- selectivity in the naming of suddenly and gradually constructed faces. In D. M. Baer & E. M. Pinkston (Eds.), Environment and behavior (pp. 210-218). Oxford: Westview Press. Dube, W. V., & McIlvane, W. J. (1999) Re- duction of stimulus overselectivity with nonverbal differential observing responses. Journal of Applied Behavior Analysis, 32, 25-33. Gomes, C. G. S., & Souza, D. G. (2008). De- sempenho de pessoas com autismo em ta- refas de emparelhamento com o modelo por identidade: efeitos da organização dos estímulos. Psicologia: Reflexão e Crítica, 21, 418-429. Hanna, E., Karino, C., Araújo, V., & Souza, D. (2010). Leitura recombinativa de pseu- dopalavras impressas em pseudoalfabeto: Capítulo VI | Atenção 108 similaridade entre palavras e extensão da unidade ensinada. Psicologia USP, 21, 275- 311. Johnson, D. F., & Cumming, W. W. (1968). Some determiners of attention. Journal of the Experimental Analysis of Behavior, 11, 157-166. Johnston, J. M., & Pennypacker, H. S. (2009). Strategies and Tactics of Behavioral Resear- ch. New York: Routledge. Lashley, K. S. (1938). The mechanism of vi- sion: XV. Preliminary studies of the rat’s ca- pacity for detail vision. Journal of General Psychology, 18, 123-193. Lovaas, O. I., Schreibman, L., Koegel, R. L., & Rehm, R. (1971) Selective responding by autistic children to multiple sensory input. Journal of Abnormal Psychology, 77, 211- 222. Lovaas, O. I., Koegel, R. L., & Schreibman, L. (1979). Stimulus overselectivity in autism: a review of research. Psychological Bulletin, 86, 1236-1254. Lovaas, O. I., & Schreibman, L. (1971). Sti- mulus overselectivity of autistic children in a two stimulus situation. Behavioral Rese- arch & Therapy, 9, 305-310. Ray, B. A. (1969). Selective attention: The effects of combining stimuli which control incompatible behavior. Journal of the Expe- rimental Analysis of Behavior, 12, 539-550. Reynolds, G. (1961). Attention in the pige- on. Journal of the Experimental Analysis of Behavior, 4, 203-208. Sidman, M. (1979). Remarks. Behaviorism, 7, 123-126. Sidman (1960). Normal sources of patholo- gical behavior. Science, 132, 61-68. Skinner, B. F. (1953/2003). Ciência e com- portamento humano (J. C. Todorov & R. Azzi, Trads.). São Paulo: Martins Fontes. Terrace, H. S. (1963). Errorless transfer of a discrimination across two continua. Jour- -nal of the Experimental Analysis of Beha- vior, 6, 223–232. Touchette, P. E. (1969). Tilted lines as com- plex stimuli. Journal of the Experimental Analysis of Behavior, 12, 211-214. Verneque, L., & Hanna, E. S. (2012). Tempo de exposição a estímulos multidimensio- nais e topografias de controle de estímulo. Revista Brasileira de Análise do Comporta- mento, 8, 12-25. Wilkie, D. M., & Masson, M. E. (1976). Atten- tion in the pigeon: a reevaluation. Journal of the Experimental Analysis of Behavior, 26, 207-212. Peter Endemann, Candido Pessôa 109 A resposta de observação: o papel das respostas sensoriais para o estabelecimento da discriminação Peter Endemann Universidade de São Paulo Candido V. B. B. Pessôa Paradigma Centro de Ciências do Comportamento Wyckoff, L. B. (1969). The role of observing responses in discrimination learning. In D. P Hendry (Ed.), Conditioned reinforcement (pp. 237-260). Homewood, IL: The Dorsey press. “A seleção natural atuou sobre o sistema sensorial por meio das consequências im- postas aos comportamentos guiados por esse sistemas” Nilsson (2009) Capítulo VII | Resposta de Observação 110 1 O controle da resposta por estímulos irrelevantes e seu efeito no esta- belecimento da discriminação tem sido investigado ao longo das últi- mas décadas por diversos pesquisadores (e.g. Dinsmoor, 1985; Dopson, Esber & Pearce, 2010; Endemann, 2013; Hall, 1976; Krechevsky, 1932; Lawrence, 1949; Mackintosh, 1965; Serna & Carlin, 2001; Spence, 1936; Trobalon, Miguelez, McLaren & Mackintosh, 2003; Wagner, Logan, Haberlandt & Price, 1968; Wyckoff, 1952; Zeaman & Denegre, 1967). INTRODUÇÃO À ÁREA DE PES- QUISA E CONTEXTUALIZAÇÃO DO EXPERIMENTO A elaboração do conceito de respos- ta de observação se deu com o objetivo de abordar um conjunto de práticas e pressu- postos envolvendo a experiência senso- rial dos organismos a partir de uma pers- pectiva comportamental. De modo geral, a experiência sensorial, compreendida pelo ver, ouvir, sentir cheiros ou gostos ou sen- tir a textura de um objeto pelo tato, é tra- dicionalmente definida por habilidades tais como a diferenciação e associação de objetos. De uma perpectiva comportamen- tal, essa experiência foi definida em termos de discriminação e generalização, isto é, pelo controle diferencial de respostas por estímulos do ambiente. Segundo Skinner (1938/1991), “pode-se dizer que um organis- mo ‘percebe que dois estímulos são diferen- tes’ se alguma diferença, qualquer que seja ela, pode ser identificada no comportamen- to sob controle daqueles estímulos” (p. 169). Essas respostas diferenciais são produzi- das em um treino discriminativo ou treino de reforçamento diferencial. Nesse treino, respostas são reforçadas na presença de um estímulo (S+ ou SD) e não reforçadas na presença de outro estímulo (S- ou S-delta). Nas décadas de 1930 e 1940, o papel das respostas sensoriais no estabelecimen- to da discriminação foi empiricamente in- vestigado. Posições opostas entre os diver- sos pesquisadores da época deram origem a um longo debate, conhecido como Contro- vérsia Continuidade vs. não Continuidade. Foi a partir desse debate que Wyckoff (1952, 1969) elaborou seu problema de pesquisa e o procedimento experimental para seu es- tudo. De um modo geral, o papel das res- postas sensoriais foi inserido nos estudos sobre a discriminação por Karl Lashley (1929). Essa inserção se deu partir de um princípio fundamental da Gestalt, a seleti- vidade. Com base nesse princípio, os orga- nismos não percebem ou atentam ao am- biente como um todo, mas apenas a partes restritas desse ambiente. Segundo autores como Lashley (1929, 1938, 1942) e Kreche- vsky (1932, 1937, 1938), o sujeito experi- mental, ao ser exposto a um treino discri- minativo, poderia atentar seletivamente a estímulos irrelevantes1 para a discriminação e permanecer respondendo sobre controle acidental desses estímulos. Nesses casos, o sujeito poderia não estar aprendendo nada sobre as contingências de discriminação programadas. Em síntese, o sujeito poderia, em função do controle seletivo de estímu- los irrelevantes, permanecer em situação não discriminada mesmo sendo exposto e produzindo os reforçadores programados a depender de sua correlação com aqueles es- Peter Endemann, Candido Pessôa 111 tímulos. Exemplos de estímulos irrelevan- tes poderiam ser a temperatura, o tamanhoou a textura da caixa experimental em um treino discriminativo entre as cores verde e vermelho. Respostas a estímulos irrelevantes ao longo do treino discriminativo foram cha- madas de tentativas de solução e, segundo Lashley (1929, 1938, 1942), são parte de uma gama de atividades e da história do sujeito. Essas tentativas de solução foram analisa- das por Krechevsky (1932, 1938) sob o rótulo de “hipóteses”. Essas respostas, registradas sobretudo no início do treino discriminati- vo, foram discutidas por Lashley e por Kre- chevsky com base em outro princípio da Gestalt, o da “organização sensorial”. O estabelecimento da discriminação envolveria, assim, uma série de controles independentes em função do contato sen- sorial e seletivo com os estímulos presen- tes. Essa série de controles antecederiam o contato e o controle diferencial das respos- tas pelos estímulos S+ e S-. Lashley exem- plifica esses controles como “respostas à posição, à alternação, a dicas oriundas dos movimentos do pesquisador e que comu- mente precedem as respostas aos estímulos correlacionados” (Lashley, 1929, p. 135). O termo “estímulos correlacionados” utilizado por Lashley se refere tanto a S+ como a S-, pois ambos conservam correlações de +1 e -1 com o reforço, respectivamente2. Em conclusão, supondo uma priori- dade da seletividade frente ao treino dis- criminativo e ao estabelecimento da dis- criminação, os autores (e.g., Lashley, 1929, 1938) apontavam para a necessidade de se investigar não apenas o estabelecimento de respostas diferenciais, mas também de res- postas sensoriais que tinham como função colocar o organismo em contato com os es- tímulos S+ e S-, relevantes para a diferen- ciação da resposta. Não se questionava uma definição comportamental de discrimina- ção, mas a natureza do processo pelo qual o organismo passava a responder diferencial- mente quando exposto ao treino de reforça- mento diferencial. Para os autores citados anteriormente (e.g., Krechevsky, 1932, 1938; Lashley, 1938) , o estabelecimento da dis- criminação seria um processo de natureza descontínua. Por outro lado, Kenneth W. Spen- ce (1936, 1940, 1945) e Skinner (1938/1991) assumiam a discriminação como um pro- cesso contínuo, envolvendo o acúmulo de pequenas diferenças entre as respostas na presença de S+ e S-, em função do reforça- mento diferencial (Skinner não participou ativamente do debate, o que lhe rendeu críticas, e.g., Krechevsky, 1938). Contudo, a concepção de que a discriminação seria 2 Em um treino discriminativo, a correlação dos estímulos é correta e comumente tratada da seguinte maneira: S+ correlacionado ao reforço e S- correlacionado à extinção. A extinção se refere à ausência de re- forço e, desse modo, o S- é correlacionado, negativamente, ao reforço. Assim, em um treino discriminativo, podemos nos referir tanto ao S+ como S- como “estímulos correlacionados”. Em termos de probabilida- de de a resposta (ou cadeia de respostas) produzir o reforço, temos pro- babilidade de 100% e 0%, respectivamente, sob o S+ e sob o S-. Estímu- los que, de fato, não são correlacionados com o reforço são aqueles que mantem correlação nula (zero) e a probabilidade de a resposta produzir o reforço em sua presença é 50% (i.e., ao acaso). Capítulo VII | Resposta de Observação 112 um processo contínuo de acúmulos de pe- quenas diferenças foi defendida por Spen- ce). Essa concepção ficou, então, conhecida como continuísta. Com o objetivo de se investigar os processos básicos envolvidos na discrimi- nação, tornar o treino mais eficaz e evitar o controle acidental das respostas por estímu- los irrelevantes, tanto Skinner (1938/1991) como Spence (1936) estabeleceram algumas soluções procedimentais. Segundo Skinner, os experimentos deveriam ser conduzidos “em caixas à prova de som, escuras, com pa- redes lisas” (p. 55). Segundo Spence (1936), uma vez que o interesse é no processo de diferenciação das respostas aos estímulos correlacionados com o reforço, o ambiente experimental bem como a resposta senso- rial aos estímulos correlacionados devem ser os mais simples possível. Segundo Spence (1936), todos es- tímulos que incidam sobre o aparato sen- sorial do organismo quando sua resposta é reforçada adquirem ou perdem tendências excitatórias. Assim, ao longo do treino dis- criminativo, possíveis controles da resposta por estímulos irrelevantes vão sendo gradu- almente eliminados e os estímulos correla- cionados com o reforço (i.e., S+ e S-) passam a controlar diferencialmente a resposta, em um processo gradual e contínuo. As posições opostas sobre o processo de discriminação foram submetidas a uma série de experimentos nas décadas de 1930 e 1940 (e.g. Ehrenfreund, 1948; Krechevsky, 1932, 1937, 1938; Lashley, 1929, 1938, 1942; McCulloch & Pratt, 1934; Spence, 1936, 1940, 1945). Nesses experimentos, a princi- pal manipulação (variáveis independentes) foi o controle e variações em parâmetros dos estímulos (e.g., quantidade e posição dos estímulos no ambiente experimental, variação em suas propriedades físicas – bri- lho, frequência, textura, etc. – variação em sua correlação com o reforço) e o desem- penho analisado (variável dependente) foi o número de “acertos” e “erros”. O desem- penho foi registrado antes que os sujeitos atingissem o critério, ou seja, no período em que os sujeitos se mantinham responden- do tanto na presença do S+ quanto na do S-. Nesse período, as respostas não discri- minadas (em relação aos S+ e S-) produzem as consequências programadas ao acaso, ou seja, as respostas produzem reforços em aproximadamente 50% das vezes. Esse pe- ríodo foi chamado de período pressolução. A manipulação de parâmetros dos estímulos e a análise das respostas no pe- ríodo pressolução foram realizadas em con- junto com uma manipulação bem engenho- sa. Diversos pesquisadores aplicaram uma reversão na correlação dos estímulos com o reforço ainda no período pressolução, isto é, o estímulo que era S+ passava a ser S- e vi- ce-versa. A justificativa dessas reversões no período pressolução era que caso a discri- minação se estabelecesse por um processo contínuo, a reversão deveria afetar o núme- ro de respostas (acertos e erros) emitidas no Peter Endemann, Candido Pessôa 113 período pressolução, em comparação a um grupo controle para o qual a reversão não era conduzida. Se a discriminação fosse um processo descontínuo, a reversão dos estí- mulos no período pressolução não afetaria necessariamente o número de respostas, uma vez que essas poderiam ser emitidas sob controle de outras partes do ambien- te (estímulos irrelevantes) que não aquelas que foram correlacionadas ao reforço. De todas as manipulações dos parâ- metros dos estímulos, a posição na qual o estímulo era apresentado em um treino de discriminação visual teve um papel pecu- liar para o problema de pesquisa de Wycko- ff (1969). Ehrenfreud (1948), com base nos dados inconclusivos dos experimentos até então realizados, decidiu expor dois grupos de sujeitos ao mesmo treino discriminativo e reversão dos estímulos no período pres- solução. A única diferença entre os grupos foi a posição na qual os estímulos eram apresentados no campo de visão dos sujei- tos. Os resultados obtidos por Ehrenfreud refletem os resultados obtidos ao longo de todo o debate: quando os estímulos eram apresentados bem a frente do sujeito, em uma posição a partir da qual o contato era favorecido ao longo de todo o treino, os re- sultados davam maior suporte àqueles que defendiam a discriminação como um pro- cesso contínuo. Quando os estímulos eram apresentados em outra posição do campo visual, os resultados davam maior supor- te àqueles que defendiam discriminação como um processo não contínuo. Apesar de o artigo de Ehrenfreud ter sido publicado em 1948, o efeito da posição do estímulo já vinha sendo debatido desde a década de 1930. Ao longo do debate, Spen- ce (1940, 1945), de forma bastantecoerente, analisou a situação experimental dos estu- dos e inseriu uma questão interessante em seus argumentos. Segundo Spence, a mera presença dos estímulos na situação expe- rimental não garante que esses estímulos incidam no aparato sensorial do sujeito. Se- gundo Spence, “caso o aparato sensorial do animal não seja forçado a receber os estí- mulos correlacionados com o reforço desde o início do treino, as associações não serão formadas” (Spence, 1940, p. 276). Nessas si- tuações, “o animal é requerido a aprender, em adição à resposta diferencial, uma resposta perceptual apropriada que o conduza para a recepção dos estímu- los correlacionados ... o animal deve aprender a orientar e fixar a cabeça e os olhos afim de receber os estímu- los correlacionados” (Spence, 1940, p. 276). Essas respostas foram chamadas de respostas de orientação dos órgãos recep- tores. Ao inserir a necessidade do aprendi- zado de uma resposta de orientação dos re- ceptores no debate, Spence (1940, 1945) ad- mite que o animal pode estar respondendo a estímulos irrelevantes e não estar apren- Capítulo VII | Resposta de Observação 114 dendo nada sobre os estímulos correlacio- nados (i.e., S+ e S-). Mas, nesse caso, segun- do Spence (1945), não estaria ocorrendo o estabelecimento da discriminação sobre o qual seus interesses estavam centrados. O autor insistiu, portanto, na simplificação do ambiente experimental. Após revisar o debate, Wyckoff levan- ta críticas ao modelo defendido por Spence (1940, 1945). Sem necessariamente tomar um partido no debate, Wyckoff (1952) apon- ta que a simplificação do ambiente experi- mental, de modo a minimizar a necessidade de aprendizado de respostas de orientação dos receptores (como definidas por Spence), poderia impor limites ao valor preditivo do modelo continuísta e de teorias sobre o es- tabelecimento da discriminação. Segundo Wyckoff, nem em situações cotidianas nem em situações controladas de laboratório seria possível precisar se os animais serão expostos aos estímulos correlacionados ao reforço. Em sua tese de doutorado, Wycko- ff, manipulou a necessidade de se aprender a resposta de orientação dos receptores, além daquelas respostas que produzem (ou não) o reforço, em um treino discriminativo. Wyckoff finalizou o doutorado em 1951, pu- blicou um artigo teórico em 1952 e, apenas em 1969, um artigo que descreve seu estudo experimental. Os objetivos e o método des- se estudo serão descritos a seguir. DESCRIÇÃO DO EXPERIMENTO Objetivo e Método O objetivo principal do experimento de Wyckoff (1969) foi analisar o papel das respostas de orientação dos receptores no estabelecimento de uma discriminação. Di- ferentemente de como essas respostas eram discutidas, Wyckoff as definiu como res- postas que colocam o organismo em conta- to com estímulos correlacionados com o re- forço. Para diferenciá-las das respostas que produzem o reforço (e.g., bicar um disco em experimentos com pombos, pressionar uma barra em experimentos com ratos, chama- das de respostas efetivas), Wyckoff as no- meou de respostas de observação (RO). Com base na função da RO (i.e., co- locar o organismo em contato com os es- tímulos correlacionados ao reforço) e nos princípios do condicionamento operante descritos por Skinner (1938/1991), Wyckoff (1969) investigou se a produção de estímu- los discriminativos teria um efeito reforça- dor sobre a RO em um treino discrimina- tivo. Essa investigação, segundo Wyckoff (1952), forneceria um tratamento comporta- mental ao que vinha sendo nomeado de ex- periência sensorial e resposta de orientação dos receptores. Frente à dificuldade de se registrar a orientação dos órgãos receptores de sujei- tos experimentais, Wyckoff (1969) foi enge- nhoso e coerente com a definição funcional da RO. Em seu experimento, usou pombos Peter Endemann, Candido Pessôa 115 como sujeitos experimentais. Na caixa ex- perimental, um pedal foi posto no piso e os estímulos correlacionados com o refor- ço (S+ ou S-) só eram apresentados caso o pombo o pressionasse. Assim, os pombos só entravam em contato com os estímulos ao pressionar o pedal. Os estímulos ficavam expostos durante todo o tempo em que o sujeito estivesse pisando o pedal, o que, por sua vez, definiu a medida a ser registrada e analisada por Wyckoff: a duração da res- posta de observação. No experimento, foram utilizados 20 pombos mantidos sob um regime de priva- ção de comida. Os pombos foram distribuí- dos em dois grupos, (Controle e Experimen- tal). Além do pedal, a caixa experimental continha um disco que podia ser iluminado de branco, vermelho ou verde e um come- douro retrátil (para apresentação de comi- da). Em uma fase preliminar, que durou 45 min, houve a adaptação dos pombos de ambos os grupos às condições experi- mentais. Durante os primeiros 15 min des- sa fase, o disco foi iluminado de branco e a primeira bicada no disco produzia acesso a um comedouro por 4 s em um esquema de intervalo fixo (FI) 30 s. Durante os 30 min restantes dessa fase, o disco foi ilumi- nado de verde ou de vermelho em períodos sucessivos de 30 s. As respostas de bicar o disco davam acesso ao comedouro da mes- ma forma que nos primeiros 15 min dessa fase (i.e., sob um FI 30 s). Nesta fase preli- minar, não havia contingências para pisar no pedal e tampouco uma correlação entre as luzes verde e vermelha e o acesso ao co- medouro. Os pombos do Grupo Controle foram expostos a estas condições durante todo o experimento. Na Fase Experimental (treino discri- minativo), aplicadas apenas aos pombos no Grupo Experimental, houve cinco sessões de 75 min e uma de 15 min. Durante as ses- sões desta fase, respostas de bicar o disco fo- ram mantidas sob um esquema FI 30 s. Esse esquema se alternava com um esquema de extinção a cada 30 s. Durante a extinção, bicadas no disco não produziam acesso ao comedouro. Durante a fase experimental, a luz vermelha era correlacionada ao FI 30 s (i.e., aos reforços) a luz verde era correlacio- nada à extinção. Entretanto, as luzes ver- de ou vermelha eram produzidas somente enquanto o pombo pisasse no pedal, isto é, quando emitisse a RO. Se o pombo emitisse a RO e o esquema em vigor fosse a extin- ção, o disco era iluminado de verde. Quan- do o pombo pisasse no pedal e estivesse em vigor o esquema FI 30 s, a luz vermelha se acendia no disco. Caso o sujeito não emitis- se a RO, o disco permanecia iluminado de branco tanto quando o esquema em vigor era o FI30 s quanto quando o esquema em vigor era extinção e as respostas de bicar o disco produziam o reforço a depender de qual esquema estava em vigor. Em resumo, pisar o pedal, emitindo a RO, transformava um esquema misto FI 30 s extinção em um esquema múltiplo FI 30 s extinção3. Capítulo VII | Resposta de Observação 116 Após as seis primeiras sessões da Fase Experimental, o Grupo Experimen- tal foi subdividido em três subgrupos A, B e C. O subgrupo A permaneceu no treino discriminativo (reforçamento diferencial) e, assim, a RO continuava a produzir as luzes verde e vermelha e essas, por sua vez, se mantinham relacionadas com a extinção e reforço, respectivamente. Para o subgrupo B, a relação dos estímulos com o reforço foi invertida (o estímulo relacionado ao FI 30 s passou a ser o verde e o estímulo relacio- nado à extinção passou a ser o vermelho); e o subgrupo C retornou à condições seme- lhantes aos últimos 30 min da fase preli- minar (reforçamento não-diferencial), nas quais as luzes, apesar de produzidas pela pressão no pedal, não estavam mais corre- lacionadas ao reforço (i.e., reforço poderia ser produzido com a mesma probabilidade diante da luz verde e vermelha, se o pedal estivesse pressionado, e branca, se o pedal não estivesse pressionado). Resultados e Discussão Como indicado anteriormente, Wy- ckoff (1969) registrou o tempo em que o pe- dal era pressionado, isto é, a duração das respostas de observação. Com isso, eleana- lisou variações na duração da RO em fun- ção da produção ou não dos estímulos cor- relacionados com o reforço nos diferentes subgrupos. A duração da RO para o Grupo Controle foi relativamente alta inicialmen- te, mas rapidamente diminuiu, permane- cendo baixa até o fim do experimento. Para o Grupo Experimental, a duração da RO também começou alta para todos os pom- bos e assim permaneceu para o subgrupo A, que se manteve no treino discriminativo. Para o subgrupo B, a duração da RO dimi- nuiu logo que a correlação dos estímulos foi invertida, mas aumentou assim que a discriminação foi novamente estabelecida. Para o subgrupo C, que retornou às condi- ções da fase preliminar após o treino discri- minativo (as luzes verde e vermelha podiam ser produzidas, mas não havia correlação diferencial com o reforço), a duração da RO diminuiu em relação à fase em que havia correlação entre as luzes verde e vermelha e o reforço. Em conclusão, Wyckoff (1969) afir- mou que a exposição e o contato dos sujei- tos com os estímulos discriminativos teve um efeito reforçador sobre a RO (i.e., pres- são ao pedal). Assim, Wyckoff confirmou que a produção de estímulos discriminati- vos para a resposta de bicar um disco esta- beleceu e manteve a RO. Com base em seus resultados, Wyckoff (1952, 1969) afirmou que (1) a probabilidade da RO aumenta ou permanece alta sob as condições de reforço diferencial implementadas no treino discri- minativo; (2) quando a correlação dos estí- mulos é invertida, a probabilidade da RO diminui temporariamente e depois retorna a um valor alto; e (3) a probabilidade da RO 3 Em um esquema múltiplo, dois ou mais esquemas de reforço se alter- nam e cada um é apresentado conjuntamente a um estímulo diferente. Em um esquema misto, os esquemas de reforço se alternam, mas não há estímulos correlacionados diferencialmente com os esquemas em vigor (Machado, 1982). Peter Endemann, Candido Pessôa 117 diminui ou permanece baixa em situações de reforço não-diferencial, nas quais os es- tímulos produzidos pela RO não são corre- lacionados ao reforço. Os resultados obtidos autorizaram Wyckoff (1969) a discutir o papel da RO no estabelecimento da discriminação tendo como base os princípios operantes descri- tos por Skinner (1938/1991). Segundo Wy- ckoff (1952, 1969), a RO é uma resposta ope- rante cuja consequência é a produção dos estímulos discriminativos. Definir a respos- ta de observação por sua função e não por sua topografia permitiu a Wyckoff delinear um experimento que facilmente registrou as respostas de observação. Foi esta genia- lidade que tornou seu estudo um clássico na Análise do Comportamento e permitiu ampliar o uso do conceito de discriminação para situações em que os estímulos discri- minativos não estão claramente dispostos sobre o aparato sensorial dos indivíduos. Um aspecto importante da RO vale ser ressaltado. A emissão da RO tem como única consequência a produção dos estí- mulos discriminativos e, portanto, não al- tera a obtenção dos reforços programados para uma determinada resposta. A obten- ção dos reforços pode ocorrer sem a emis- são da RO (i.e., na presença da luz branca). Em uma discriminação sucessiva (i.e., em que os estímulos correlacionados com re- forço e com extinção se alternam), como delineada por Wyckoff (1969), todos os re- forços programados podiam ser produzidos sem que os pombos emitissem uma única vez a RO. Esse aspecto levou a alguns des- dobramentos importantes na investigação sobre o estabelecimento da discriminação, sobre os efeitos comportamentais de refor- ços condicionados e sobre atenção. Esses desdobramentos são discutidos a seguir. DESDOBRAMENTOS No procedimento de Wyckoff (1969), chamado de delineamento (ou procedimen- to) de resposta de observação, o fortaleci- mento da RO não ocorreu em função direta da produção do estímulo reforçador primá- rio (i.e., acesso a comida). Como visto, no estudo de Wyckoff, o valor de reforçador condicionado das luzes verde e vermelha foi adquirido em função de suas correla- ções com os esquemas de reforço (i.e., FI 30 s) e extinção que, por sua vez, controlaram o aumento na duração da RO. Por meio des- se delineamento, vários autores têm inves- tigado essa (correlação) e outras condições (e.g. temporais) necessárias para o estabele- cimento do valor reforçador condicionado de determinados estímulos. Como esperado, posições e hipóteses opostas sobre o reforço condicionado foram propostas. Um amplo debate se mantém até os dias atuais. As duas principais hipóteses são conhecidas como a hipótese da redu- ção da incerteza e a hipótese da redução do atraso. Autores que propõem a hipótese da redução da incerteza (e.g. Berlyne, 1957) Capítulo VII | Resposta de Observação 118 defendem que a condição necessária para o estabelecimento e controle da RO é a redu- ção na incerteza gerada pelas respostas aos estímulos não-correlacionados (estímulos irrelevantes, tais como a luz branca do es- quema misto no estudo de Wyckoff, 1969). Os autores que propõem a hipótese da re- dução do atraso (e.g. Fantino, 1977; Fantino & Logan, 1979), defendem que a condição necessária para o estabelecimento do valor reforçador condicionado de um estímulo é a redução temporal relativa sinalizada pelo estímulo correlacionado com o reforço pri- mário. Dinsmoor (1983) discute algumas questões referentes à RO e apresenta, além de novas possibilidades de investigação sobre reforçamento condicionado, um refi- namento do estudo de Wyckoff (1969) e do conceito de resposta de observação. Como descrito anteriormente, Wyckoff registrou e analisou a duração da RO em função da correlação dos estímulos com o reforço. Dinsmoor, Browne, Lawrence, e Wasser- man (1971) registraram e analisaram sepa- radamente a duração da RO nos diferentes componentes (i.e., na presença dos dife- rentes estímulos) em um treino de reforça- mento diferencial. Os autores notaram que a duração da RO é maior na presença do S+ do que na presença do S-. Essa assimetria na duração da RO entre S+ e S- foi definida pelos autores como observação seletiva e gerou novas pesquisas sobre o reforço con- dicionado e sobre o papel da RO no estabe- lecimento da discriminação (e.g. Dinsmoor 1985; Dinsmoor, Mueller, Martin, & Bowe, 1982). Com o desenvolvimento de novas tecnologias, especialmente a de rastrea- mento dos movimentos oculares, o conceito de resposta de observação tem sido subme- tido à novos refinamentos e discussões (e.g. Endemann, 2008, 2013; Pessôa, 2010; To- manari, Balsamo, Fowler, Farren, & Dube, 2007; Tomanari & Pergher, 2003). O registro de parâmetros dos movimentos sacádicos4 (pico de velocidade, amplitude, curvatura) e da fixação (frequência, duração) tem permi- tido a análise de novas medidas da RO. De posse dessas novas medidas, o papel da RO tem sido analisado em diferentes situações básicas e aplicadas envolvendo discrimina- ções simples e condicionais, formação de classes de estímulos equivalentes (e.g. Dube et al., 1999; Serna & Carlin, 2001), treina- mento de habilidades como leitura e reso- lução de problemas (e.g. Endemann, Pessôa, Perez & Tomanari, 2010). CONSIDERAÇÕES FINAIS Com o objetivo de trazer a discrimi- nação para o campo da análise do compor- tamento operante, Skinner (1938/1991) de- 4 Movimentos sacádicos são os movimentos oculares rápidos, antece- didos e precedidos pela fixação e acomodação dos estímulos no centro da retina (e.g. Krauzlis, 2008; Madelain, Paeye & Darcheville, 2011; Sal- thouse & Ellis, 1980). Segundo Krauzlis (2008), um aspecto importante dos movimentos sacádicos é que “são seletivamente guiados por ob- jetos de interesse do observador, apesar do fato de haver usualmente no ambiente vários outros objetos distratores” (Krauzlis, 2008, p. 789, itálico acrescentado). Peter Endemann, Candido Pessôa 119 fendeu que a discriminação e a experiência sensorial a ela subjacente deveriam ser de- finidas e analisadascom base em apenas uma classe de respostas (i.e., aquela que, pela produção diferencial do reforço, fica sob controle de estímulos discriminativos). Wyckoff (1969) foi original em estabelecer medidas interdependentes entre duas clas- ses de resposta (i.e., a que produz direta- mente o reforço e a que produz os estímulos discriminativos) e em avaliar experimental- mente a resposta de observação bem como o entrelaçamento desta com a resposta que produz o reforço. Esse entrelaçamen- to é mediado por um estímulo com duas funções: Função reforçadora condiciona- da para a resposta de observação e função discriminativa para a resposta que produz o reforço (e.g., Pessôa & Sério, 2006). PARA SABER MAIS Dinsmoor (1985). Análise teórica sobre o papel da resposta de observação no estabe- lecimento da discriminação, em que o autor critica as posições de Skinner e Spence. O autor apresenta uma série de estudos sobre controle de estímulos, destacando o papel da observação seletiva (desenvolvido desde o estudo de Dinsmoor et al., 1971). Endemann (2013). Análise experimental e teórica sobre o efeito de variações nos es- tímulos irrelevantes para a aquisição e ma- nutenção da resposta de observação visual (registrada por meio dos movimentos ocu- lares). Neste estudo, apresentam-se com mais detalhes os estudos experimentais e argumentos da Controvérsia continuidade vs. não-continuidade. Pessôa & Sério (2006). Análise teórica so- bre as duas contingências envolvidas no estabelecimento da discriminação. Os au- tores discutem as duas funções adquiridas pelo estímulo correlacionado com o refor- ço: Discriminativo, para a resposta efetiva, e reforçador condicionado, para a resposta de observação. Tomanari (2009). Ampla revisão dos estu- dos sobre a resposta de observação desde pesquisas precursoras com ratos expostos a labirintos até investigações mais recentes sobre o tema. O autor apresenta aspectos relevantes do delineamento experimental tais como número de operanda e as dife- rentes espécies utilizadas nos estudos. Pessôa & Tomanari (2015). Diferenciam o procedimento de resposta de observação elaborado por Wyckoff (1969) da importân- cia da resposta de observação por ele de- finida funcionalmente, dando destaque às possibilidades de pesquisas aplicadas para a facilitação da aquisição de respostas de observação. REFERÊNCIAS Berlyne, D. E. (1957). Uncertainty and con- flict: A point of contact between informa- Capítulo VII | Resposta de Observação 120 tion theory and behavior concepts. Psycho- logical Review, 64, 329-333. Dinsmoor, J. A. (1983). Observing and con- ditioned reinforcement. Behavioral and Brain Sciences, 6, 693-728. Dinsmoor, J. A. (1985). The role of observing and attention in establishing stimulus con- trol. Journal of the Experimental Analysis of Behavior, 43, 365-381. Dinsmoor, J. A., Browne, M. P., Lawren- ce, C. E., & Wasserman, E. A. (1971). A new analysis of Wyckoff’s observing response. Proceedings of the 79th Annual Convention, American Psychological Association (pp. 679-680). Dinsmoor, J. A., Mueller, K. L., Martin, L. T., & Bowe, C. A. (1982). The acquisition of ob- serving. Journal of the Experimental Analy- sis of Behavior, 38, 249-263. Dopson, J. C., Esber, G. R., & Pearce, J. M. (2010). Differences in the associability of relevant and irrelevant stimuli. Journal of Experimental Psychology: Animal Behavior Processes, 36, 258–267. Dube, W. V., Lombard, K. M., Farren, K. M., Flusser, D. S., Balsamo, L. M., & Fowler, T. R. (1999). Eye tracking assessment of stimulus overselectivity in individuals with mental retardation. Experimental Analysis of Hu- man Behavior Bulletin, 17, 8-14. Ehrenfreund, D. (1948). An experimental test of the continuity theory of discrimina- tion with pattern vision. Journal of Com- parative and Physiological Psychology, 41, 408-422. Endemann, P. (2008). Resposta de observa- ção e movimento dos olhos em uma situação de discriminação simples simultânea. (Dis- sertação de Mestrado). Universidade de São Paulo, São Paulo. Endemann, P. (2013). Aprendizado sobre a (ir)relevância dos estímulos. (Tese de douto- rado) Universidade de São Paulo, São Paulo. Endemann, P., Pessôa, C. V. B. B., Perez, W. F., & Tomanari, G. Y. (2010). Identificação de operantes verbais constituintes da leitura por meio da análise dos movimentos dos olhos. Psicologia: Teoria e Pesquisa, 27, 139- 148. Fantino E. (1977). Conditioned reinforce- ment: Choice and information. In W.K. Ho- nig & J.E.R. Staddon (Eds.), Handbook of operant behavior (pp. 313–339). Englewood Cliffs, NJ: Prentice-Hall. Fantino, E., & Logan, C. A. (1979). The ex- perimental analysis of behavior: A biological perspective. New York: W. H. Freeman. Hall, G. (1976). Learning to ignore irrelevant stimuli variations within and between dis- plays. Quarterly Journal of Experimental Psychology, 28, 247-253 Peter Endemann, Candido Pessôa 121 Krauzlis, R. J. (2008). Eye movements. In L. R. Squire & D. Berg (Eds.), Fundamental Neuroscience (pp. 775-792). Amsterdam: El- sevier. Krechevsky, I. (1932). Hypotheses in rats. Psychological Review, 39, 516-532. Krechevsky, I. (1937). A note concerning “the nature of discrimination learning in animals.” Psychological Review, 44, 97-104. Krechevsky, I. (1938). A study of the conti- nuity of the problem-solving process. Psy- chological Review, 45, 107-133. Lashley, K. S. (1929). Brain mechanisms and intelligence. Chicago: University of Chicago Press. Lashley, K. S. (1938). The mechanism of vi- sion: XV. Preliminary studies of the rat’s ca- pacity for detail vision. Journal of General Psychology, 18, 123-193. Lashley, K. S. (1942). An examination of the continuity theory as applied to discrimina- tion learning. Journal of Genetic Psychology, 26, 241-265. Lawrence, D. H. (1949). Acquired distincti- veness of cues: I. Transfer between discri- minations on the basis of familiarity with the stimulus. Journal of Experimental Psy- chology, 39, 770-784. Mackintosh, N. J. (1965). Selective attention in animal discrimination learning. Psycho- logical Bulletin, 64, 124-50. Madelain L., Paeye C., & Darcheville, J. C. (2011). Operant control of human eye move- ments. Behavioural Processes, 87, 142–148. Nilsson, D.E., (2009). The evolution of eyes and visually guided behaviour. Philosophi- cal Transactions of the Royal Society, 364, 2833–2847. Pearce, J. M., Esber, G. R., George, D. N., & Haselgrove, M. (2008). The nature of discri- mination learning in pigeons. Learning & Behavior, 36, 188-199. Pessôa, C. V. B. B. (2010). Efeito de diferentes treinos de discriminação sobre as fixações dos olhos de humanos. (Tese de doutorado). Universidade de São Paulo, São Paulo. Pessôa, C. V. B. B., & Sério, T. M. A. P. (2006). Análise do comportamento de observação. Revista Brasileira de Análise do Comporta- mento, 2, 143-153. Pessôa, C. V. B. B., & Tomanari, G. Y. (2015). Procedimento de resposta de observação e comportamento de observação. Perspecti- vas em Análise do Comportamento, 6, 89- 98. Salthouse, T. A., & Ellis, C. L. (1980). Deter- minants of eye-fixation duration. American Journal of Psychology, 93, 207-234. Capítulo VII | Resposta de Observação 122 Serna, R. W., & Carlin, M. T. (2001). Guiding visual attention in individuals with mental retardation. In L. M. Glidden (Ed.), Interna- tional review of research in mental retarda- tion, 24 (pp. 321-357). San Diego, CA: Aca- demic Press. Skinner, B. F. (1938). The behavior of orga- nisms: an experimental analysis. New York: Appleton-Century-Crofts. Spence, K. W. (1936). The nature of discri- mination learning in animals. Psychological Review, 43, 437-449. Spence, K. W. (1940). Continuous versus non-continuous interpretations of discri- mination learning. Psychological Review, 47, 271-288. Spence, K. W. (1942). The basis of solution by chimpanzees of the intermediate size problem. Journal of ExperimentalPsycholo- gy, 31, 257-271. Spence, K. W. (1945). An experimental test of the continuity and noncontinuity theo- ries of discrimination learning. Journal of Experimental Psychology, 35, 253-266. Tomanari, G. Y. (2009). Resposta de obser- vação: Uma reavaliação. Acta Comporta- mentalia, 17, 259-277. Tomanari, G. Y., Balsamo, L. M., Fowler, T. R., Farren, K. M., & Dube, W. V. (2007). Manual and ocular observing behavior in human subjects. European Journal of Beha- vior Analysis, 8, 29-40. Tomanari, G. Y., & Pergher, N. K. (2003). Observing behavior and eye movements in a Wyckoff observing response procedure. Paper presented at the Annual Meeting of the Association for Behavior Analysis, São Francisco. Trobalon, J.B., Miguelez, D., McLaren, I. P .L., & Mackintosh, N. J. (2003). Intradimen- sional and extradimensional shifts in spa- tial learning. Journal of Experimental Psy- chology: Animal Behavior Processes, 29, 143-152. Wagner, A. R., Logan, F. A., Haberlandt, K., & Price, T. (1968). Stimulus selection in ani- mal discrimination learning. Journal of Ex- perimental Psychology, 76, 171-180. Wyckoff, L. B. (1952). The role of observing responses in discrimination learning: Part I. Psychological Review, 59, 431-442. Wyckoff, L. B. (1969). The role of observing responses in discrimination learning. In D. P Hendry (Ed.), Conditioned reinforcement (pp. 237-260). Homewood, IL: The Dorsey Press. Zeaman, D. & Denegre, J. (1967). Variability of irrelevant discriminative stimuli. Journal of Experimental Psychology, 73, 574-580. Edson Massayuki Huziwara, Candido V. B. B. Pessôa 123 Controle dos processos atencionais Edson Massayuki Huziwara Universidade Federal de Minas Gerais Candido V. B. B. Pessôa Paradigma Centro de Ciências do Comportamento Holland, J. G. (1958). Human vigilance. Science, 128 (3315), 61-67. “Life is what happens to you while you’re busy making other plans” John Lennon Capítulo VIII | Atenção 124 INTRODUÇÃO À ÁREA DE PES- QUISA E CONTEXTUALIZAÇÃO DO EXPERIMENTO Notícias a respeito de pessoas diag- nosticadas com o Transtorno do Déficit de Atenção e Hiperatividade (TDAH) torna- ram-se consideravelmente frequentes nos dias atuais. Segundo o Manual Diagnóstico e Estatístico de Transtornos Mentais (DSM- -IV-TR™), o TDAH apresenta como carac- terística principal um “padrão persistente de desatenção e/ou hiperatividade-impul- sividade, mais frequente e grave do que aquele tipicamente observado nos indiví- duos em equivalente estágio de desenvol- vimento” (APA, 2002, p. 112). Estima-se que 3% a 6% das crianças em idade escolar de todo o mundo tenham sido diagnosticadas com o referido transtorno (Faraone, Serge- ant, Gillberg, & Biederman, 2003; Rohde, Miguel Filho, Benetti, Gallois, & Kieling, 2004), constituindo-se assim em uma das principais causas de encaminhamento para os serviços de saúde (Rohde, Barbosa, Tra- montina, & Polanczyk, 2000; Rohde et al., 2004). Iniciar este capítulo apresentando considerações acerca do TDAH tem por ob- jetivo ilustrar como questões relacionadas a processos atencionais estão em evidência na Psicologia contemporânea. A produção de conhecimento sobre tais processos con- tinua sendo fundamental para o desenvol- vimento de intervenções eficazes (Ketzer, Gallois, Martinez, Rohde, & Schmitz, 2012; Reinhardt & Reinhardt, 2013). O interesse pelos processos atencio- nais justifica-se não somente pelos aspec- tos patológicos nele envolvidos, mas tam- bém por sua aparente importância nas mais variadas situações de nossa vida cotidiana. Por exemplo, um jogador que não se manti- ver atento ao jogo reduz suas possibilidades de vitória; um aluno que não se mantiver atento à aula, reduz suas possibilidades de aprender a tarefa; ou, ainda, um motoris- ta que não se mantiver atento ao trânsito, aumenta suas possibilidades de causar ou sofrer um acidente. Estudos sobre processos atencionais conduzidos nas décadas de 1940 e 1950 utilizavam situações nas quais indivíduos eram requisitados a detectar a ocorrência de determinados eventos críticos, porém pou- co frequentes, em tarefas longas e propo- sitalmente monótonas. Mackworth (1948), por exemplo, realizou um experimento no qual a tarefa dos participantes era obser- var um mostrador de um relógio analógico. Em grande parte do tempo, o único pontei- ro apresentado nesse mostrador realizava movimentos em ritmo regular, movendo-se apenas uma vez por segundo. Os eventos críticos que deveriam ser detectados pelos participantes consistiam em movimentos duplos do ponteiro, ou seja, ocasiões em que o ritmo era alterado e o ponteiro movia- -se duas vezes em um único segundo. Esses eventos críticos ocorriam 24 vezes em cada hora de sessão, em intervalos variáveis de Edson Massayuki Huziwara, Candido V. B. B. Pessôa 125 tempo. O procedimento tinha como objeti- vo simular situações em que, por exemplo, um marinheiro observa um sonar para de- tectar a presença de submarinos inimigos. Holland (1958) destacou a similaridade des- ta situação com a de um trabalhador em uma fábrica que inspeciona produtos em uma linha de produção para detectar itens com defeito que raramente aparecem. Nes- sas situações, apesar da baixa probabilida- de de ocorrência de um evento crítico, sua detecção seria de extrema importância e, portanto, marinheiros ou trabalhadores de- veriam manter-se atentos durante todo o tempo de execução da tarefa. Muitos estudos utilizando tarefas experimentais similares àquela propos- ta por Mackworth (1948) foram conduzi- dos. Em geral, os resultados demonstra- ram que a acurácia em detectar os eventos críticos diminuía ao longo do tempo (e. g., Adams, 1956; Bakan, 1955; Bartlett, Beinert, & Graham, 1955; Deese & Ormond, 1953; Fraser, 1950; Mackworth, 1948; 1950). Mais especificamente, todos ou quase todos os eventos críticos apresentados no início da sessão eram detectados. No entanto, princi- palmente depois dos 30 primeiros minutos, apenas aproximadamente 30% dos partici- pantes continuavam a detectar na mesma proporção os eventos que ocorriam. Outro resultado comum nessas pesquisas era uma correlação positiva entre a quantidade ab- soluta de eventos críticos apresentados e a porcentagem total de eventos detectados – i.e., em média, 46% dos eventos críticos eram detectados quando 10 apresentações por hora eram realizadas; no entanto, 88% dos eventos eram detectados quando 40 apresentações por hora eram realizadas (Deese & Ormond, 1953). De acordo com Deese e Ormond, o desempenho altamente acurado no início da tarefa seria um refle- xo dos altos níveis de atenção ou vigilân- cia1 apresentados pelos indivíduos. Ainda segundo Deese e Ormond, com o passar do tempo e a consequente fadiga, os níveis de atenção ou vigilância diminuiriam e isso produziria uma queda na quantidade de de- tecções. A correlação positiva entre quanti- dade absoluta de apresentações de eventos críticos e porcentagem de detecções, por sua vez, era explicada fazendo referência à diferentes níveis de expectativa. Dizia-se que quanto maior a quantidade de eventos críticos apresentados até um determinado momento da sessão, maior também seria a expectativa de que um próximo evento crí- tico fosse apresentado dentro de um curto espaço de tempo. Portanto, a alta expecta- tiva da próxima apresentação de um evento crítico manteria altos níveis de atenção e vigilância durante a tarefa, apesar da fadiga ocasionada pelo decorrer do tempo. Acerca de tais explicações, baseadas em constructos teóricos como atenção, vi- gilância ou expectativa, Holland (1958) ar- gumentou: 1 Optou-se por traduzir a palavra inglesa “vigilance” por “vigilância”. Outras possibilidades de tradução, talvez mais provocativas, seriam “concentração” ou “atenção focada”, termos que aparecem como sinô- nimos de “vigilance” na edição eletrônica do Oxford Dictionary. Capítulo VIII | Atenção 126 Esses conceitos dão a aparência de ex- plicaros dados em virtude da sintaxe das frases. Diz-se que o participante faz uma detecção porque ele está, na- quele momento, vigilante e atento ou esperando um sinal. Mas, os conceitos não são menos misteriosos do que os fenômenos que se propõem a explicar. Resta a tarefa de descobrir os eventos que influenciam a vigilância, a aten- ção ou a expectativa. (p. 62). Ainda de acordo com Holland (1958), as diferenças nas quantidades de detecções realizadas no início ou final da sessão, assim como a correlação positiva entre quantida- de absoluta e percentual de eventos críticos detectados, como ocorrido, por exemplo, em Deese e Ormond (1953), são formas de descrever padrões comportamentais dos participantes e, como tal, não necessita- riam de constructos mentais como atenção, vigilância ou expectativa para serem expli- cados. Diante desse contexto, o desafio es- tava assim posto: Como estudar o fenôme- no da detecção de eventos críticos e expli- car resultados muito regulares sem recorrer a constructos mentais (e.g., expectativa)? Holland (1958) acreditava que a precisão em detectar eventos críticos poderia estar relacionada à emissão de um conjunto de respostas que aumentaria a possibilidade de sucesso em tal tarefa, sendo estas de- nominadas de respostas de observação. Wyckoff (1952; 1969) definiu respostas de observação como aquelas que produzem os estímulos discriminativos para outras respostas. Manter-se observando o visor por longos períodos de tempo ou identifi- car prontamente quais os vários estímu- los presentes durante a execução da tarefa são exemplos de respostas de observação, uma vez que um evento detectado seria o estímulo discriminativo para relatar esse evento e as respostas de observação seriam mantidas pela produção destes estímulos discriminativos. Holland foi a primeira pes- soa a manipular experimentalmente a fre- quência e a distribuição temporal das res- postas de observação. O seu experimento, adiante relatado, tornou-se assim um dos mais clássicos sobre processos atencionais realizado sob a orientação teórica da Análi- se do Comportamento. DESCRIÇÃO DO EXPERIMENTO Objetivo e Método Holland (1958) teve dois objetivos. O primeiro foi verificar se a detecção de sinais seria um reforçador para respostas de ob- servação. O segundo foi medir as respostas de observação em situações similares às usadas por Mackworth (1948), para pos- sibilitar uma reinterpretação dos eventos ocorridos na situação analisada em termos comportamentais, sem o uso de construc- tos como expectativa ou atenção. No experimento de Holland (1958), a tarefa experimental consistia em par- Edson Massayuki Huziwara, Candido V. B. B. Pessôa 127 ticipantes – jovens alistados na marinha americana – observarem um mostrador retangular com um ponteiro inicialmente posicionado na extremidade esquerda. No início da sessão, o participante era instru- ído a detectar e relatar o máximo de oca- siões nas quais o ponteiro se movesse da extremidade esquerda para a extremidade direita do mostrador (ver Figura 1). O relato de movimentos do ponteiro era feito pelo participante ao apertar um botão de relato, que também recolocava o ponteiro no lu- gar original. No fim da sessão era informa- do ao participante quantos sinais ele havia detectado e o tempo médio de detecção. A novidade no procedimento proposto por Holland consistiu em inserir um botão que, quando pressionado, acendia uma lâmpada localizada atrás do mostrador, iluminando- -o por 0,07s (resposta de observação). Após esse curto período, a lâmpada era apaga- da e a única forma de iluminar o mostra- dor e poder observar o ponteiro novamente era uma nova pressão ao botão. As sessões ocorriam em uma sala escura, de maneira que a única forma de detectar as mudanças no ponteiro era emitir a resposta de pressio- nar a lâmpada. Quando um movimento do ponteiro era detectado, o participante de- veria apertar outro botão para informar que havia detectado um movimento do pontei- ro. Este segundo botão tinha duas consequ- ências: (1) acionava um contador de eventos e (2) recolocava o ponteiro no lugar original, à esquerda do mostrador, o que possibili- tava que um novo movimento do ponteiro ocorresse. O procedimento permitiu medir com precisão a ocorrência das respostas de observação – i.e., pressões no botão que ilu- minava o mostrador – ao longo do experi- mento. A questão acerca dos efeitos refor- çadores da detecção de eventos críticos foi solucionada utilizando conhecimen- tos provenientes de uma das áreas mais exaustivamente estudadas em Análise do Comportamento, a saber, os esquemas de reforço. Esquemas são regras que especi- ficam sob quais condições determinadas respostas produzem consequências. De crucial importância para o presente con- texto foram experimentos que demons- traram que a taxa de respostas e o padrão temporal de respostas é determinado por esquemas (Catania, 1999; Ferster & Skin- ner, 1957). Mais precisamente, os estudos encontraram essa modulação de maneira tão regular, independente do organismo ou da resposta sob análise, que se torna possí- vel prever o padrão comportamental diante de cada diferente esquema de reforço uti- lizado (Machado, 1982; Skinner, 1956). Se, sob um determinado esquema de reforço, Figura 1. Representação do mostrador apresentado aos participantes no experimento de Holland (1958). A parte esquerda da figura mostra a posição inicial do ponteiro, antes da ocorrência do evento crítico. A parte direita mostra a posição do ponteiro depois de ocorrido o evento crítico. A seta cinza representa o sentido do movimento executado pelo ponteiro. Capítulo VIII | Atenção 128 a resposta assume um padrão de emissão típico do esquema, pode-se concluir que a contingência de reforço pela qual o reforço é produzido no esquema está controlando aquela resposta. Com base nesse conhecimento, para fazer com que a oportunidade de realizar uma detecção (i.e., pressionar o botão que relatava um movimento do ponteiro) se tor- nasse contingente à emissão de um deter- minado padrão de respostas de observação (i.e., pressionar o botão para o acendimen- to da lâmpada), Holland (1958) utilizou di- ferentes esquemas de reforço para a pro- dução de movimentos dos ponteiros pela emissão de respostas de observação. Caso os padrões de respostas emitidos pelos par- ticipantes no botão que acendia a lâmpada fossem similares àqueles usualmente des- critos quando utilizados os diferentes es- quemas de reforço, a hipótese das funções reforçadoras da detecção de eventos críti- cos estaria comprovada. Holland (1958) utilizou três diferentes esquemas de reforço para avaliar o padrão de emissão das respostas de observação: um esquema de intervalo fixo (FI), um esquema de razão fixa (FR) e um esquema de reforço diferencial de taxas baixas (DRL). Sob o FI, uma resposta é reforçada após transcorrido um período fixo de tempo, contado a partir de um evento ambiental relevante como a obtenção do reforço ou o início da sessão; as respostas que ocorrem antes do final do período não são reforçadas. Em esquemas FI, o padrão de respostas é caracterizado por baixas taxas no início do intervalo e um aumento na taxa de respostas à medida que se aproxima o seu final (para uma dis- cussão das exceções a este padrão veja, por exemplo, Okouchi, 2002). No experimento de Holland, cinco participantes foram pri- meiramente expostos a um FI 30s por oito sessões de 40 min. Ou seja, a primeira res- posta de observação (i.e., pressionar o botão para o acendimento da luz) emitida após 30 s produzia não somente o acendimento da lâmpada por 0,07s, mas também o movi- mento do ponteiro no mostrador e a conse- quente oportunidade de detecção do even- to crítico. Em seguida, o valor do intervalo foi aumentado para 1, 2, 3, e, finalmente, 4 min, com oito sessões sucessivas sob cada valor do FI. Sob o FR, a produção do reforço de- pende apenas da emissãode um número fixo de respostas, que é contado a partir de um evento ambiental relevante, como a ob- tenção do reforço ou o início da sessão. As- sim sendo, nesse esquema, a obtenção do reforçador não está vinculado à passagem do tempo, existe uma relação direta entre a taxa de respostas emitida e a taxa de re- forços obtida. Talvez por este motivo, o pa- drão de respostas em FR seja caracterizado por taxas altas e constantes durante toda a sessão, sendo muitas vezes possível visua- lizar pausas no responder que ocorrem tipi- camente após cada reforço (diferentes das pausas após o reforço em um FI, a taxa de respostas na retomada de um FR inicia-se Edson Massayuki Huziwara, Candido V. B. B. Pessôa 129 já constante, enquanto em FI ela tende a ser positivamente acelerada). Holland (1958) primeiramente expos, por seis sessões de 40 min, sete participantes a um FR 36, ou seja, a oportunidade de detecção ocorreu somente após a emissão da 36ª respos- ta de observação. Então, o valor do FR foi aumentado, também em blocos de seis ses- sões, para 60, 84, 108, 150 e, finalmente, 200 respostas por detecção. Por fim, sob o DRL, uma resposta é reforçada somente quando emitida após um intervalo de tempo especificado sem ela ocorrer. Ao considerar que o esquema refor- ça diferencialmente o espaçamento tempo- ral entre as respostas, o padrão de respostas emitidas pelos participantes irá se adequar ao valor temporal estipulado, mais precisa- mente, quanto maior for o tempo exigido para a não ocorrência de respostas, me- nor será a taxa de respostas. Dessa forma, o padrão tipicamente obtido sob o DRL é o de baixas taxas de respostas, com espaça- mento temporal entre elas e com ocasionais emissões de “jorros” de várias respostas com baixíssimo intervalo. Dois participan- tes foram expostos a um DRL 30 s, ou seja, uma resposta de observação iria provocar o movimento do ponteiro e a consequente oportunidade de detecção se, e somente se, fosse precedida por um período mínimo de 30s sem que essa mesma resposta de ob- servação tivesse sido emitida. As sessões tinham duração de 4h. Para atingir o segundo objetivo, ve- rificar como seriam as respostas de obser- vação em uma situação similar à usada por Mackworth (1948), Holland (1958) usou es- quemas de reforço baseando-se nas apre- sentações de eventos críticos usados por Mackworth. Nas situações testadas por Mackworth, os intervalos entre os eventos críticos (duplos movimentos no ponteiro do relógio) eram ¾, ¾, 1½, 2, 2, 1, 5, 1, 2, 2, 3 e 10 min em ciclos que ocorriam a cada meia hora. Na análise do comportamento, um es- quema de reforço que ocorre em intervalos variáveis é denominado esquema de inter- valo variável (VI). Sob esse esquema uma resposta é reforçada quando emitida após intervalos que variam ao redor de uma mé- dia de tempo estabelecido. O VI produz ti- picamente uma taxa moderada e constante de respostas nos intervalos entre reforços. No caso dos intervalos usados por Ma- ckworth, em média, a cada 1 minuto haveria um evento crítico para ser detectado. Ou- tro aspecto do procedimento do estudo de Mackworth era a de que o evento crítico fi- cava disponível para ser detectado por ape- nas um breve período de tempo. Em análise do comportamento, quando o reforço está disponível para ser consumido por apenas um determinado período de tempo, cha- ma-se esse período de contenção limitada (limited hold). Quando se usa a contenção limitada comumente observa-se o aumen- to da taxa de respostas em relação à uma condição sem contenção limitada. Holland usou uma contenção limitada de 1¼ s. Isto é, neste caso em que foi usada a contenção limitada após o movimento do ponteiro, se Capítulo VIII | Atenção 130 o participante não detectasse o movimen- to nesse intervalo de tempo, o ponteiro re- tornaria automaticamente para a direita e o participante perderia a oportunidade de relatar o evento. Resultados e Discussão Os padrões de respostas de observa- ção descritos para os participantes em cada um dos esquemas de reforço utilizados por Holland (1958) – FI, FR, DRL – foram ex- tremamente similares àqueles usualmente encontrados em experimentos anteriores em outros tipos de respostas que também usaram esquemas de reforço (e.g., Ferster & Skinner, 1957). Apenas para ilustrar os efeitos dos diferentes esquemas de reforço sobre a emissão das respostas de observa- ção, ao comparar os padrões de respostas de observação nos diferentes esquemas de reforço, foi possível verificar que, enquanto o participante sob FR, independentemente do valor do esquema, emite 600 respostas em menos de cinco minutos de sessão, o participante sob DRL emite aproximada- mente 290 respostas em 50 minutos de ses- são. Tais resultados demonstraram que a detecção de eventos críticos, de fato, exerce um papel reforçador para a emissão das res- postas de observação, como previa o autor. Dessa forma, os resultados obtidos por Holland (1958) demonstraram que os padrões de ocorrências das respostas de observação, consideradas em muitos con- textos como sendo o reflexo de processos mentais complexos, podem ser explicados a partir de conceitos propostos pelo condi- cionamento operante, fazendo-se referên- cia aos esquemas de reforço que mantêm essas respostas. De acordo com o autor, não haveria a necessidade de recorrer a níveis mentais de explicação, a constructos teóri- cos como atenção, vigilância ou expectati- va, uma vez que o controle exercido pelos diferentes esquemas de reforço pôde ser di- retamente demonstrado no nível compor- tamental. O segundo objetivo proposto por Holland (1958), verificar como seriam as respostas de observação em uma situação similar à usada por Mackworth (1948), tam- bém trouxe um resultado importante. Assim como no experimento de Mackwhoth, dois tipos diferentes de desempenho foram ob- servados entre os participantes de Holland que foram expostos ao VI com contenção limitada. Na mesma proporção dos parti- cipantes de Mackworth, aproximadamente 30% dos participantes de Holland detecta- ram todos os movimentos do ponteiro que eram programados durante o experimento. Para os outros 70%, a quantidade de even- tos detectados teve um declínio acentuado ao longo da sessão. O que Holland pôde demonstrar com seu experimento é que esse declínio foi causado pela diminuição da emissão de respostas de observação. Essas respostas de observação, como visto na parte anterior do experimento, são con- troladas pelo esquema de reforço em vigor. Holland demonstrou que os participantes Edson Massayuki Huziwara, Candido V. B. B. Pessôa 131 que detectaram todos os reforços ao longo da sessão partiram de uma taxa inicial de emissão das respostas de observação mais alta do que os participantes que diminuí- ram as detecções ao longo da sessão Pro- vavelmente, esse “ponto de partida” com que cada participante iniciou a emissão de respostas (alta ou baixa taxa de respostas) seja devido à história pregressa de reforço de respostas de observação de cada um. Os participantes que partiram de uma taxa mais baixa de emissão de respostas de ob- servação detectaram menos movimentos no ponteiro. Essa menor detecção é, em outras palavras, uma menor taxa de refor- ços. Uma menor taxa de reforços gera uma menor taxa de respostas (Ferster & Skinner, 1957). Assim, os participantes que já inicia- ram o experimento com uma baixa taxa inicial de emissão de respostas de observa- ção entraram num círculo vicioso de menor emissão de respostas gerando menor taxa de reforço e menor taxa de reforço gerando menor emissão de respostas. Holland (1958), portanto, demons- trou que a detecção de um evento crítico (i.e., o movimento do ponteiro) pode con- trolar a frequência de emissão das respos- tas de observação (i.e., pressionar o botão para o acendimento da lâmpada). Vale res- saltar que estudos anteriores explicavam a ocorrência de tais respostas de observação como sendo o reflexode estados mentais complexos como atenção, vigilância ou ex- pectativa (e.g., Adams, 1956; Bakan, 1955; Bartlett et al., 1955; Deese & Ormond, 1953; Fraser, 1950; Mackworth, 1948, 1950). Ao analisar o conjunto dos resultados obtidos por Holland, foi possível comprovar a hi- pótese do autor de que é possível explicar os padrões de ocorrência de tais respostas a partir dos princípios do condicionamento operante, especialmente do esquema de re- forço em vigor. Os mesmos princípios sobre o condi- cionamento operante foram utilizados por Holland (1958) para reinterpretar alguns dos achados mais recorrentemente descritos em experimentos sobre atenção e vigilân- cia até a data de publicação de seu artigo. O primeiro desses achados refere-se à di- minuição na quantidade de detecções fei- tas pelos participantes ao longo da sessão, que seria explicado pelo declínio dos níveis de atenção em função da fadiga (Deese & Ormond, 1953; Mackworth, 1948, 1950). De acordo com Holland, a explicação para tal fato estaria relacionada à taxa de reforço. Ao longo da sessão, a taxa de emissão de respostas de observação se adéqua à quan- tidade de reforços apresentados. Assim, se a quantidade de apresentações do estímu- lo reforçador for baixa ou o intervalo entre reforços for demasiado longo, haverá um declínio na taxa de respostas de observação (e.g., Kelleher, Riddle, & Cook, 1962). Em decorrência da menor taxa de respostas de observação, menor também será a quanti- dade de eventos críticos detectados. Capítulo VIII | Atenção 132 DESDOBRAMENTOS Um aspecto a ser destacado acer- ca do procedimento utilizado por Holland (1958) refere-se à considerável diferença entre as respostas que normalmente são identificadas como respostas de observação e a resposta instrumental utilizada no refe- rido experimento. Em uma análise extre- mamente crítica, poder-se-ia argumentar que o fenômeno comportamental observa- do por Holland seria de natureza diferente daquela observada em experimentos sobre atenção e vigilância, restabelecendo o papel dos constructos mentais na explicação do comportamento. Sobre essa questão, o au- tor afirma: Em outros estudos sobre vigilância, o comportamento de observação foi provavelmente a fixação do olhar ou os movimentos com a cabeça, bem como respostas talvez ainda mais su- tis. Seria interessante estender a téc- nica apresentada aqui para algumas destas respostas, mesmo consideran- do que, para muitas questões, a topo- grafia da resposta pode não ser tão importante e os métodos ora utiliza- dos sejam perfeitamente suficientes. (p. 62). Portanto, o autor parece concordar que a resposta de pressionar um botão para acender uma lâmpada é consideravelmente diferente de mover o rosto em direção a um mostrador e permanecer observando-o por longos períodos de tempo, respostas nor- malmente relacionada à vigilância. No en- tanto, de acordo com Holland (1958), uma vez demonstrada a função reforçadora da detecção de eventos críticos, elas poderiam aumentar a probabilidade de ocorrência de toda e qualquer resposta de observação, in- dependente de qual topografia fosse reque- rida. Talvez até de modo contraditório à afirmação sobre as topografias de respos- tas, trabalhos posteriores ao de Holland (1958) estiveram relacionados a criar formas de registrar e medir o comportamento de olhar enquanto uma resposta de observa- ção. Em 1968, juntamente com Stephen R. Schroeder, Holland publicou um artigo no qual os autores utilizaram um equipamento que permitiu registrar a frequência e a du- ração dos movimentos dos olhos dos par- ticipantes quando estes observavam partes específicas em uma tela contendo quatro mostradores, todos idênticos ao utilizado no experimento de Holland descrito nesse capítulo. Neste novo experimento, os parti- cipantes também foram instruídos a detec- tar movimentos de ponteiros em qualquer um dos quatro mostradores e a manipula- ção experimental feita também utilizou di- ferentes esquemas de reforço. Por exemplo, ao utilizar um FR, um movimento de pon- teiro ocorria somente após a 36ª ocasião na qual o participante tivesse olhado para um dos mostradores, isto é, emitido a respos- ta de observação. Os resultados obtidos por Schroeder e Holland demonstraram que os Edson Massayuki Huziwara, Candido V. B. B. Pessôa 133 padrões de movimento dos olhos em dire- ção aos mostradores foram sensíveis aos diferentes esquemas de reforço utilizados (i.e., FR, FI e DRL). A similaridade dos resultados obtidos por Schroeder e Holland (1968), utilizando o registro movimentos dos olhos, com aque- les descritos em Holland (1958), utilizando o registro de pressões a um botão, pareceu in- dicar que a função reforçadora da detecção de eventos críticos realmente independe da topografia das respostas e, talvez ainda mais importante, que a resposta instrumen- tal utilizada em 1958 era, de fato, compa- rável com as respostas tipicamente iden- tificadas com a atenção (i.e., olhar). Desde então, uma vasta quantidade publicações acerca das relações entre as respostas de observação e o comportamento de olhar tem sido produzida (e.g., Doran & Holland, 1971; Dube, Balsamo et al., 2006; Dube, Di- ckson et al., 2010; Huziwara, de Souza, & Tomanari, 2016; Huziwara, Silva, Perez, & Tomanari, 2015; Perez, Endemann, Pessôa, & Tomanari, 2014; Pessoa, Huziwara, Perez, Endemann, & Tomanari, 2009; Schroeder, 1969a, 1969b, 1970, 1997; Serna & Carlin, 2001). Em relação à importância do estudo de Holland (1958) para a manutenção da atenção em tarefas de vigilância, Holland (1958) é citado em diversos experimentos da área, como na manutenção da atenção du- rante a navegação de barcos (Thomas, 1980) e aviões (Lewis, 1973) e, em geral, para as- pectos da segurança no trabalho (e.g., Aber- nathy & Lattal, 2014; Howell, Johnston, & Goldstein, 1966). CONSIDERAÇÕES FINAIS Como mencionado no início deste ca- pítulo, o TDAH atualmente se constitui em um sério problema a ser solucionado. Sag- volden, Aase, Johansen e Russell (2005), por exemplo, apontavam a escassez de dados sobre tratamentos médicos eficazes para o subtipo déficit de atenção do TDAH. No que concerne às contribuições da Análise do Comportamento, os padrões comporta- mentais usualmente característicos de pes- soas com diagnóstico de déficit de atenção são, ao menos em parte, explicados a partir dos gradientes de atraso de reforço (Cata- nia, 2005). Baseado em extensa literatura, Catania explica que uma das causas do que chamamos déficit de atenção pode estar re- lacionada à dificuldade de controle por re- forços condicionados. Nos termos do expe- rimento de Holland (1958), caso a distância temporal entre a identificação de um even- to crítico e o reforço obtido por essa identi- ficação for demasiado longa, o movimento do ponteiro pode não adquirir uma função reforçadora para manter a resposta de pres- tar atenção ao (iluminar o) mostrador. Um valor da distância temporal eficiente varia entre indivíduos e, assim, no caso do expe- rimento de Holland, pessoas que necessi- tassem intervalos temporais muito peque- nos entre os reforços poderiam deixar de Capítulo VIII | Atenção 134 emitir as respostas de observação ao longo do experimento. Nos limites da revisão de literatura realizada para o presente capítu- lo, não encontramos estudos que se apoiem diretamente no achado de Holland de que esquemas de reforços influenciariam dire- tamente a quantidade de atenção em uma tarefa (para exceção, veja Goldberg & Kons- tantareas, 1979). Assim, parece permanecer essa lacuna a ser perseguida sobre a relação entre os padrões comportamentais gerados e mantidos por diferentes esquemas de re- forço e os padrões comportamentais carac- terísticos do déficit de atenção. Ao considerar todos os aspectos pre- sentes no experimento de Holland (1958), torna-se possível verificar que a engenho- sidade do autor, ao propor uma nova forma de análise,permitiu a formulação de expli- cações mais parcimoniosas sobre proces- sos comportamentais. Essa busca por ex- plicações parcimoniosas, como alternativa para explicações por vezes tão misteriosas quanto o próprio fenômeno a ser explicado, é marca dos trabalhos desenvolvidos pelo autor e, certamente, um exemplo a ser se- guido. PARA SABER MAIS Pessoa, Huziwara, Perez, Endemann, & Tomanari (2009). Replicação sistemáti- ca dos resultados descritos por Schroeder (1969a; 1969b; 1970) sobre o comportamento de olhar em tarefas de discriminação sim- ples. Os principais resultados referem-se a uma aparente diminuição no tempo empre- gado para observar os estímulos ao longo das sucessivas tentativas de treino. Dube, Balsamo, Fowler, Dickson, Lom- bard, & Tomanari (2006). Avaliação do comportamento de olhar em tarefas de discriminação condicional utilizando pro- cedimento de emparelhamento de acordo com o modelo. Resultados sugerem que os participantes com maiores porcentagens de acertos em tarefas que envolvem o aprendi- zado de discriminações condicionais tam- bém apresentam maior quantidade de tem- po empregado na observação dos estímulos apresentados. Artigos de Revisão. Para uma revisão sobre o controle operante dos movimentos dos olhos veja Pessôa (2010). Para uma revisão sobre o papel das respostas de observa- ção como fenômenos atencionais consulte Rico, Goulart, Hamasaki e Tomanari (2012) ou Benvenuti, Barros e Tomanari (2014). REFERÊNCIAS Abernathy, W. B., & Lattal, D. (2014). Or- ganizational Behavior Management, past, present, and future. In F. K. Macksweeney e E. S. Murphy (Eds.), The Willey Blackwell handbook of classical and operant condi- tioning, (pp. 645-668). Chichester, WS: John Willey & Sons, Ltd. Edson Massayuki Huziwara, Candido V. B. B. Pessôa 135 Adams, J. A. (1956). Vigilance in the detec- tion of low-intensity visual stimuli. Journal of Experimental Psychology, 52, 204-208. American Psychiatric Association – APA (2002). Manual diagnóstico e estatístico de transtornos mentais - DSM-IV-TR™. 4ª ed. rev. Porto Alegre: Artmed. Bakan, P. (1955). Discrimination decrement as a function of time in a prolonged vigil. Journal of Experimental Psychology, 50, 387-390. Bartlett, S. C., Beinert, R. L., & Graham, J. R. (1955). Studies of visual fatigue and effi- ciency in radar observation. United States Air Force Wright Air Development Center Technical Report, 55-100. Benvenuti, M. F., Barros, T., & Tomanari, G. Y. (2014). Atenção, observação e a produção do comportamento simbólico e do respon- der relacional. In J. C. de Rose, M. S. C. A. Gil e D. G. de Souza (Orgs.), Comportamen- to simbólico: Bases conceituais e empíricas, (pp. 57-93). São Paulo: Cultura Acadêmica. Catania, A. C. (1999). Aprendizagem: Com- portamento, linguagem e cognição. Porto Alegre: Artmed. Catania, C. A. (2005). Attention-deficit/ hyperactivity disorder (ADHD): Delay-of- -reinforcement gradients and other beha- vioral mechanisms. Behavioral and Brain Sciences, 28, 397-468. Deese, J., & Ormond, E. (1953). Studies of de- tectability during continuous visual search. United States Air Force Wright Air Develop- ment Center Technical Report, 53-88. Doran, J., & Holland, J. G. (1971). Eye move- ments as a function of response contingen- cies measured by blackout technique. Jour- nal of Applied Behavior Analysis, 4, 11-17. Dube, W. V., Balsamo, L. M., Fowler, T. R., Dickson, C. A., Lombard, K. M., & Tomana- ri, G. Y. (2006). Observing behavior topogra- phy in delayed matching to multiple sam- ples. The Psychological Record, 56, 233-244. Dube, W. V., Dickson, C. A., Balsamo, L. M., Odonnell, K. L., Tomanari, G. Y., Farren, K. M., Wheeler, E. E., & Mcilvane, W. J. (2010). Observing behavior and atypically restric- ted stimulus control. Journal of the Experi- mental Analysis of Behavior, 94, 297-313. Faraone, S. V., Sergeant, J., Gillberg, C., & Biederman, J. (2003). The worldwide pre- valence of ADHD: Is it an American condi- tion? World Psychiatry, 2, 104-113. Ferster, C. B., & Skinner, B. F. (1957). Schedu- les of reinforcement. East Norwalk: Apple- ton-Century-Crofts. Fraser, D. C. (1953). The relation of an en- vironmental variable to performance in a prolonged visual task. Quarterly Journal of Experimental Psychology, 5, 31-32. Capítulo VIII | Atenção 136 Goldberg, J. O., & Konstantareas, M. M. (1981). Vigilance in hyperactive and normal children on a self-paced operant task. Jour- nal of Child Psychology and Psychiatry, 22, 53-63. Holland, J. G. (1958). Human vigilance. Science, 128, 61-67. Howell, W. C., Johnston, W. A., & Goldstein, I. L. (1966). Complex monitoring and its re- lation to the classical problem of vigilance. Organizational Behavior and Human Per- formance, 1, 129-150. Huziwara, E. M., de Souza, D. G., & Toma- nari, G. Y. (2016). Patterns of eye movement in matching-to-sample tasks. Psicologia: Reflexão e Crítica, 29. Huziwara, E. M., Silva, M. J. M., Perez, W. F., & Tomanari, G. Y. (2015). Analyzing the stimulus control acquisition in simple dis- crimination tasks through eye movement. Psicologia: Reflexão e Crítica, 28, 603-612. Kelleher, R. T., Riddle, W. C. & Cook, L. (1962). Observing response in pigeons. Jour- nal of the Experimental Analysis of Beha- vior, 5, 3-13. Ketzer, C. R., Gallois, C., Martinez, A. L., Rohde, L. A., & Schmitz, M. (2012). Is there an association between perinatal compli- cations and attention-deficit/hyperactivity disorder-inattentive type in children and adolescents? Revista Brasileira de Psiquia- tria, 34, 321-328. Lewis, M. F. (1973). Frequency of anti-colli- sion observing responses by solo pilots as a function of traffic density, ATC traffic war- nings, and competing behavior. Recuperado em http://libraryonline.erau.edu/online- -full-text/faa-aviation-medicine-reports/ AM73-06.pdf Machado, L. M. C. M. (1986). Esquemas de reforçamento positivo: Esquemas simples. Psicologia, 12, 1-15. Mackworth, N. H. (1948). The breakdown of vigilance during prolonged visual search. Quarterly Journal of Experimental Psycho- logy, 1, 6-21. Mackworth, N. H. (1950). Researches in the measurement of human performance. Me- dical Research Council Special Report Se- ries, 268. Okouchi, H. (2002). Individual differences in human fixed-interval performance. The Psychological Record, 52, 173-186. Perez, W. F., Endemann, P., Pessoa, C. V. B. B., & Tomanari, G. Y. (2014). Assessing stimulus control in a discrimination task with compound stimuli: evaluating testing procedures and tracking eye fixations. The Psychological Record, 65, 83-88. Pessoa, C. V. B. B. (2010). Efeitos de diferentes treinos de discriminação sobre as fixações Edson Massayuki Huziwara, Candido V. B. B. Pessôa 137 do olhos de humanos. (Tese de doutorado). Instituto de Psicologia da Universidade de São Paulo. Pessoa, C. V. B. B., Huziwara, E. M., Pe- rez, W. F., Endemann, P., & Tomanari, G. Y. (2009). Eye fixations to figures in a four- -choice situation with luminance balanced areas: Evaluating practice effects. Journal of Eye Movement Research, 2, 1-6. Reinhardt, M. C., & Reinhardt, C. A. (2013). Attention deficit-hyperactivity disorder, comorbidities, and risk situations. Jornal de Pediatria, 89, 124-130. Rico, V. V., Goulart, P. R. K., Hamasaki, E. I. M., & Tomanari, G. Y. (2012). Percepção e atenção. In M. M. C. Hübner e M. B. Morei- ra. (Orgs.). Fundamentos de psicologia: Te- mas clássicos de psicologia à luz da Análise do Comportamento. 1ed, (pp. 155-210). Rio de Janeiro, RJ: Guanabara Koogan. Rohde, L. A., Barbosa, G., Tramontina, S., & Polanczyk, G. (2000). Transtorno de déficit de atenção/hiperatividade. Revista Brasi- leira de Psiquiatria, 22, 7-11. Rohde, L. A., Miguel Filho, E. C., Benetti, L., Gallois, C., & Kieling, C. (2004). Transtor- no de déficit de atenção/hiperatividade na infância e na adolescência: Considerações clínicas e terapêuticas. Revista de Psiquia-tria Clínica, 31, 124-131. Sagvolden, T., Aase, H., Johansen, E. B., & Russell, V. A. (2005). A dynamic develop- mental theory of attention-deficit/hype- ractivity disorder (ADHD) predominantly hyperactive/impulsive and combined sub- types. Behavioral and Brain Sciences, 28, 397-468. Schroeder, S. R. (1969a). Effects of cue fac- tors on selective eye movements and choi- ces during successive discriminations. Per- ceptual and Motor Skills, 29, 991-998. Schroeder, S. R. (1969b). Fixation and Choi- ce selectivity during discrimination trans- fer. Psychonomic Science, 17, 324-325. Schroeder, S. R. (1970). Selective eye move- ments to simultaneously presented stimuli during discrimination. Perception & Psy- chophysics, 7, 121-124. Schroeder, S. R. (1997). Selective eye fixa- tions during transfer of discriminative sti- mulus control. In D. M. Baer, & E. M. Pinks- ton (Orgs.), Environment and Behavior, (pp. 97–110). Boulder, CO: Westview. Schroeder, S. R., & Holland, J. G. (1968). Operant control of eye movements. Journal of Applied Behavior Analysis, 1, 161-166. Serna, R., & Carlin, M. T. (2001). Guiding visual attention in individuals with mental retardation. International Review of Resear- ch in Mental Retardation, 24, 321-357. Skinner, B. F. (1956). A case history in scien- Capítulo VIII | Atenção 138 tific method. American Psychologist, 11, 221- 233. Thomas, T. W. (1980). The effects of fatigue on vigilance in sailing. (Dissertação de mes- trado). The University of British Columbia. Wyckoff Jr., L. B., (1952). The role of obser- ving responses in discrimination learning: Part I. Psychological Review, 59, 431-442. Marilia Pinheiro de Carvalho, Marco Vasconcelos, Armando Machado 139 O responder controlado temporalmente: desdobramentos da pesquisa com a tarefa de bissecção Marilia Pinheiro de Carvalho Marco Vasconcelos Armando Machado Universidade do Minho, Portugal Church, R. M., & Deluty, M. (1977). Bisection of temporal intervals. Journal of Experimental Psy- chology: Animal Behavior Processes, 3, 216-228. “O que é, pois, o tempo? Se ninguém mo pergunta, sei o que é; mas se quero explicá- -lo a quem mo pergunta, não sei.” (Santo Agostinho, Confissões) Capítulo IX | Bissecção Temporal 140 1 MPC e MV contaram com a bolsa de investigação UMINHO/ BI/249/2015 e com a bolsa de investigador IF/01624/2013, respectiva- mente, ambas da Fundação para a Ciência e Tecnologia (FCT), Portugal. AM beneficiou da bolsa de licença sabática SFRH/BSAB/113653/2015 da FCT e de uma bolsa da Fundação de Amparo à Pesquisa do Esta- do de São Paulo (FAPESP: 2015/06491-1) para Professor Convidado na Universidade Federal de São Carlos, Brasil. Este capítulo foi parcial- mente financiado pela FCT e pelo Ministério da Educação e Ciência através de fundos nacionais, e cofinanciado pelo FEDER sob o acordo de parceria PT2020 (UID/PSI/01662/2013). 2 Stubbs (1968) conduziu três experimentos com intervalos temporais variando entre 1 e 40 s. Para fins didáticos, ilustramos apenas o caso do Experimento 2, com intervalos entre 2 e 20 s. Figura 1. Diagrama hipotético de um procedimento de condicionamen- to respondente temporal. Comida (*) é apresentada sucessivamente em intervalos fixos de tempo (T). Tipicamente, salivação condicionada ocorre instantes antes de a comida ser apresentada. INTRODUÇÃO À ÁREA DE PES- QUISA E CONTEXTUALIZAÇÃO DO EXPERIMENTO Em fins da década de 1970, já era sa- bido que as respostas de animais não-hu- manos podem ser controladas por inter- valos de tempo. Por exemplo, as pesquisas seminais de Pavlov (1927) sobre condicio- namento respondente demonstraram que, quando comida era entregue sucessiva- mente em intervalos fixos de tempo, a sali- vação de cães sistematicamente antecipava os momentos de entrega. Dá-se a esse efeito o nome de condicionamento temporal (Ca- tania, 1999). A Figura 1 abaixo ilustra um procedimento de condicionamento tempo- ral e resultados hipóteticos. 2 s a 20 s2. A tarefa consistia em uma dis- criminação condicional na qual o estímulo modelo era uma luz que ficava acesa duran- te um intervalo de tempo variável, e os es- tímulos comparação eram um disco verde e um disco vermelho apresentados simul- taneamente após o estímulo modelo. Para receber comida, os pombos deviam bicar o disco verde se o modelo durasse de 2 a 10 s, e o disco vermelho se o modelo durasse de 12 a 20 s. Como os estímulos de 2 a 10 s são os mais curtos das durações treinadas, e os estímulos de 12 a 20 s são os mais longos, podemos dizer que respostas no disco verde são respostas ‘curto’ e que respostas no dis- co vermelho são respostas ‘longo’. Stubbs (1968) mediu a proporção de vezes em que os sujeitos responderam ‘longo’ (i.e., bicaram o disco vermelho) em função de cada uma durações apresenta- das. Dá-se o nome de função psicométrica à função que relaciona a proporção de uma das respostas (e.g., “longo”) à duração dos estímulos (Church, 2002; Richelle & Lejeu- ne, 1980). Se a discriminação fosse perfei- ta, a função psicométrica deveria assumir a forma de um degrau (ver painel de cima da Figura 2): Nenhuma resposta ‘longo’ se- ria emitida após os estímulos de 2 a 10 s [P(‘longo’) = 0], e apenas respostas ‘longo’ seriam emitidas após os estímulos de 12 a 20 s [P(‘longo’) = 1]. Em um outro estudo clássico, desta vez com um procedimento de condiciona- mento operante, Stubbs (1968, Experimen- to 2) demonstrou que pombos eram capazes de discriminar estímulos com duração de Marilia Pinheiro de Carvalho, Marco Vasconcelos, Armando Machado 141 A Figura 2 abaixo (painel de baixo) esquematiza a tendência geral dos dados individuais obtidos por Stubbs (1968). A proporção de respostas ‘longo’ aumentou de 2 a 20 s, confirmando que os pombos eram capazes de discriminar os estímulos mais curtos dos estímulos mais longos. Contudo, o aumento na proporção de respostas foi gradual, ao invés de ser abrupto e em for- ma de degrau: A função psicométrica tinha uma forma ogival, com mínimo e máximo nas durações extremas de 2 e 20 s, respec- tivamente. Curiosamente, a proporção de res- postas ‘longo’ para as durações de 10 e 12 s esteve próxima de 0.5, ou seja, em cerca de metade das vezes os sujeitos respondiam ‘curto’ e na outra metade das vezes respon- diam ‘longo’ para cada uma destas dura- ções – a despeito de terem sido treinados a responder ‘curto’ para 10 s e ‘longo’ para 12 s. Com base nestes resultados, Stubbs (1968) sugeriu que os sujeitos estabelece- ram um critério de decisão para responder: Respondiam ‘curto’ para durações menores do que o critério e respondiam ‘longo’ para durações maiores do que o critério. Ainda de acordo com o autor, o critério estaria ente 10 e 12 s e quanto mais próxima uma duração estivesse dele, maior a incerteza em classificá-la como ‘curta’ ou ‘longa’ – a incerteza traduz-se em proporções de res- postas ‘longo’ próximas de 0.5, como Stubbs observou nos pombos. O critério que divide as durações mais curtas das mais longas também pode ser tomado como a duração que, do ponto de vista do sujeito, está equidistante das durações treinadas. A esta duração, perce- bida como “o meio do caminho”, por assim dizer, dá-se o nome de ponto de igualdade subjetiva (PIS). A pergunta que naturalmen- te se coloca é qual duração corresponde ao PIS. A pergunta é relevante porque o valor do PIS dá pistas sobre a métrica usada pelos animais para “medir” as durações dos estí- mulos. Falar da métrica é falar da relação entre o tempo objetivo (medido pelo reló- gio) e o tempo subjetivo (inferido a partir do Figura 2. Painel de cima: Função psicométrica hipotética em forma de degrau. Painel de baixo: Esquematização do padrão geral das funções psicométricas obtidas em uma discriminação entre 2 e 20 s por Stubbs (1968, Experimento 2). Capítulo IX | Bissecção Temporal 142 comportamento). Será a métrica do tempo subjetivo linear, logarítmica, recíproca, ou de outro tipo? A Figura3 abaixo ilustra as três primeiras métricas. Tome o caso de uma discriminação entre 1 s e 4 s. Em uma transformação line- ar, y = ax + b (painel da esquerda na Figura 3; no nosso exemplo, assumimos que a = 1 e b = 1), 1 s (x1) é representado subjetivamente como 2 (y1) e 4 s (x2) é representado como 5 (y2). O PIS é a duração x equivalente ao valor médio de 2 e 5 da representação sub- jetiva (ver a seta que projeta no eixo do x o valor médio da representação subjetiva). A derivação na Figura 3 (painel da esquerda) mostra que, se o sujeito usa uma métrica li- near, o PIS é a média aritmética (MA) de 1 e 4 s. Em uma transformação logarítmica, y = ln(x) (painel central na Figura 3; logarít- mo na base e), 1 s (x1) é representado como zero (y1) e 4 s (x2) como 1.39 (y2). A deriva- ção (painel central) mostra que se o sujeito usa uma métrica logarítmica, o PIS é a mé- dia geométrica (MG) de 1 e 4 s. Por fim, em uma transformação recí- proca, y = 1/x (painel da direita na Figura 3), 1 s (x1) é representado como 1 (y1) e 4 s (x2) é representado como 0.25 (y2). A derivação (painel da direita) mostra que, se o sujeito usa uma métrica recíproca, o PIS é a média harmônica (MH) de 1 e 4 s. Generalizando, se ao estimar a du- ração de n estímulos, t1, t2, ..., tn, os su- jeitos usam uma métrica linear, o PIS é Figura 3. Painel da esquerda: Transformação linear da duração x. Painel central: Transformação logarítmica da duração x. Painel da direita: Transfor- mação recíproca da duração x. Marilia Pinheiro de Carvalho, Marco Vasconcelos, Armando Machado 143 igual à média aritmética dos estímulos ; se usam uma métrica logarítmica, o PIS é igual à média geomé- trica dos estímulos ; e se usam uma métrica recíproca, o PIS é igual à média harmônica dos estímulos Church e Deluty (1977) determina- ram empiricamente o PIS em um dos es- tudos mais influentes na área do controle temporal do responder (timing). Eles usa- ram uma tarefa psicofísica clássica, a tare- fa de bissecção, para medir o valor do PIS em diversas discriminações temporais. Os resultados revelaram algumas das proprie- dades centrais do responder controlado temporalmente em animais não-humanos e essas propriedades definiram aquilo que qualquer modelo teórico de timing deve ex- plicar. Para além disso, o estudo de Chur- ch e Deluty identificou pela primeira vez questões importantes sobre a natureza do controle por estímulos temporais e sobre a natureza do que é aprendido em tarefas temporais, sugeriu procedimentos para analisá-las empiricamente, e avançou com respostas provisórias a essas questões. To- das elas permanecem em aberto. DESCRIÇÃO DO EXPERIMENTO Objetivo e método A tarefa de bissecção temporal é uma tarefa de discriminação condicional. Para ilustrar, considere uma tentativa de treino típica no estudo de Church e Deluty (1977) com ratos. Durante o intervalo entre tenta- tivas (ITI, do inglês inter-trial interval), uma luz de iluminação geral ficava acesa por 30 segundos. Terminado o ITI, a luz geral apa- gava-se por 2 ou 8 s – o período na escuri- dão sinalizava o intervalo de tempo a esti- mar e era o estímulo modelo da tentativa. Ao fim do intervalo, duas barras de resposta eram introduzidas na caixa, uma na esquer- da e outra na direita do painel de respostas. Os ratos deviam pressionar uma das duas barras condicionalmente à duração do in- tervalo. Respostas corretas (e.g., pressionar a barra da esquerda após 2 s e a barra da di- reita após 8 s) eram reforçadas com acesso a comida e respostas incorretas não produ- ziam consequências (extinção). Para facili- tar a descrição, a partir de agora vamos sim- plesmente dizer que os ratos aprenderam a responder ‘curto’ após a duração mais curta, e ‘longo’ após a duração mais longa – inde- pendentemente de formalmente as respos- tas serem pressionar a barra da esquerda ou da direita. Quatro grupos de ratos (N = 8) foram treinados em diversas discriminações ao longo de seis fases experimentais. Para os nossos propósitos, é suficiente considerar apenas as quatro primeiras fases. Na Fase ( )1 2n nMG t t t= × × × 1 2 nt t tMA n + + + = 1 2 1 1 1 nt t t nMH + + + = Capítulo IX | Bissecção Temporal 144 I, todos os grupos aprenderam a discrimi- nação entre 2 e 8 s. Na Fase II, os grupos A e B aprenderam a discriminação entre 1 e 4 s, e os grupos C e D a discriminação entre 4 e 16 segundos. Na Fase III, os grupos A e B aprenderam a discriminação entre 4 e 16 s, e os grupos C e D a discriminação entre 1 e 4 s. Na Fase IV, todos grupos aprenderam a discriminação entre 3 e 12 s. A Tabela 1 resu- me as discriminações aprendidas por cada rações de treino (e.g., no caso da discrimi- nação entre 2 e 8 s, MH = 3.2 s, MG = 4 s e MA= 5 s). Também nas tentativas de teste, os sujeitos deviam responder ‘curto’ ou ‘lon- go’ condicionalmente à duração apresenta- da na tentativa, mas nenhuma resposta era reforçada. Concluído o treino discriminati- vo e o teste de generalização de uma fase experimental, iniciava-se a fase seguinte. Tabela 1. Discriminações temporais aprendidas por cada grupo de ratos nas quatro primeiras fases do estudo de Church e Deluty (1977). Em cada célula, a posição da duração de treino representa a resposta correta. Por exemplo, ‘1 s – 4 s’ significa que, para receber comida, os sujeitos deviam responder ‘esquerda’ após 1 s, e ‘direita’ após 4 s. Adaptado de Church e Deluty (1977). grupo em cada fase. Doravante, chamare- mos as durações treinadas em cada discri- minação de ‘durações de treino’. Cada fase começava com o treino discriminativo e terminava com um teste de generalização. O treino discriminativo incluía apenas tentativas com as durações de treino, como as descritas acima. O tes- te de generalização incluía, para além das tentativas de treino, tentativas de teste em que eram apresentadas cinco durações in- termediárias3 às durações de treino – três destas durações correspondiam às médias harmônica, geométrica e aritmética das du- 3 As durações de teste estavam aproximadamente em progressão geo- métrica, ou seja, cada duração depois da primeira era obtida multipli- cando a anterior por uma constante. Com os dados do teste de generali- zação, Church e Deluty (1977) obtiveram a função psicométrica e o PIS de cada discri- minação treinada. Como o PIS é a duração que separa os modelos ‘curtos’ dos modelos ‘longos’, ele também pode ser visto como a duração em que o sujeito divide ao meio, ou bissecta, o intervalo ente as durações de treino (e.g., o intervalo entre 2 e 8 s). Daí o nome do procedimento, bissecção tempo- ral. Resultados e discussão A Figura 4 (painel da esquerda) apre- senta as funções psicométricas médias (n=8) obtidas por Church e Deluty (1977) em Marilia Pinheiro de Carvalho, Marco Vasconcelos, Armando Machado 145 cada uma das quatro discriminações. Todas as funções psicométricas tinham valores mínimo e máximo próximos das duraçõs de treino de cada discriminação e formato ogival, evidenciando que os pombos eram capazes de discriminar as diferentes dura- ções. O painel central da Figura 4 apresen- ta as mesmas funções psicométricas, mas, agora, o eixo do x está com as durações em unidades logarítmicas. No eixo do x, os valores 1 e 7 correspondem às durações de treino curta e longa, respectivamente. Os valores 3, 4 e 5 correspondem às médias harmônica, geométrica e aritmética das du- rações de treino de cada discriminação, res- pectivamente. A partir das funções psicométricas, os autores calcularam o PIS de cada dis- criminação ajustando uma reta aos pontos correspondentes às três durações centrais [pontos com coordenadas (3, y), (4, y) e (5, y)]. Eles escolheram estes pontos porque se concentravam próximos ao ponto com coordenadas (x, 0.50), o PIS. Conhecidos os parâmetros da reta (inclinação e interse- ção-y), calculou-se o PIS. O painel central naFigura 4 apresenta os PISs obtidos em função da média geométrica das durações treinadas em cada discriminação – para a discriminação entre 1 e 4 s, MG = 2 s; para 2 e 8 s, MG = 4 s; para 3 e 12 s, MG = 6 s; para 4 e 16 s, MG = 8 s. A figura também mostra quais seriam os PISs esperados no caso de eles estarem nas médias4 harmônica e arit- mética das durações de treino (ver as linhas tracejadas na figura). Os resultados mos- traram que os PISs praticamente se sobre- puseram às médias geométricas, revelando que, do ponto de vista dos ratos, a duração que bissecta o intervalo entre as durações de treino é a média geométrica das mesmas. Também à partir das retas ajustadas às funções psicométricas, os autores calcu- laram o limiar diferencial de cada discrimi- nação. O limiar diferencial, também deno- minado de diferença mínima perceptível (just noticeable difference ou JND), indica quanto um estímulo de comparação deve diferir de um estímulo padrão em uma dada dimensão física para ser percebido como Figura 4. Painel da esquerda: Funções psicométricas médias obtidas por Church e Deluty (1977). Painel central: Funções psicométricas obtidas por Church e Deluty (1977) graficadas em uma escala comum em unidades logarítmicas. Painel da direita: PISs médios em função da média geométrica das durações treinadas em cada discriminação. A linha contínua (MG) indica a média geométrica das durações treinadas. As linhas tracejadas (MH e MA) indicam as médias harmônica e aritmética, respectivamente. Capítulo IX | Bissecção Temporal 146 diferente. Se o JND é pequeno, uma peque- na diferença entre os estímulos é suficiente para discriminá-los, se é grande, os estímu- los devem diferir bastante para serem dis- criminados. Para obter o JND de cada rato, os autores identificaram em cada reta as durações correspondentes aos pontos com coordenadas (x1, 0.75) e (x2, 0.25) e depois calcularam JND = (x1-x2)/2. Esperamos naturalmente que o JND seja maior nas discriminações com as du- rações mais longas. Por exemplo, esperarí- amos que ele fosse maior na discriminação entre 4 e 16 s do que na discriminação entre 1 e 4 s. É fácil percebermos que, por ser uma medida absoluta da discriminabilidade dos estímulos, o JND é afetado pela ordem de grandeza dos estímulos em questão. Con- clusões gerais sobre a discriminabilidade dos estímulos, portanto, deveriam basear- -se em uma medida relativa. A Fração de Weber, obtida dividin- do o JND pelo valor do estímulo padrão, t (FW=JND/t), é frequentemente usada como um índice relativo da discriminabilidade. Para calcular a Fração de Weber em cada discriminação, Church e Deluty (1977) assu- miram que o PIS era o estímulo padrão, ou seja, o critério em relação ao qual os sujeitos categorizavam as durações como curtas ou longas. Como em todas as discriminações o PIS estava muito próximo da média geo- métrica das durações de treino, os autores assumiram que t = MG em cada discrimi- nação. As Frações de Weber obtidas eram relativamente constantes (M = 0.23) e não diferiram estaticamente entre si. Estes re- sultados revelaram que, para qualquer or- dem de grandeza dos estímulos temporais, um estímulo deve diferir em cerca de 23%5 do estímulo padrão para ser discriminável. Em outras palavras, a discriminabilidade entre duas durações depende de sua dife- rença relativa e não da sua diferença ab- soluta. Church e Deluty (1977) verificaram que, à semelhança de muitas outras dimen- sões do estímulo, a discriminação da dura- ção também segue a Lei de Weber. Se a Fração de Weber é constante, é de se esperar que os sujeitos respondam de maneira semelhante para durações distin- tas que representem a mesma proporção de tempo transcorrido (ou que estejam na mesma razão). Para ilustrar, voltemos ao caso das discriminações 1 s vs. 4 s e 4 s vs. 16 s. Na primeira, os sujeitos aprenderam a responder ‘longo’ após 4 s e a MG = 2 s. Na segunda, aprenderam a responder ‘longo’ após 16 s e a MG = 8 s. Em ambos os casos, a proporção entre a duração de treino mais longa (4 ou 16 s) e a correspondente média 4 A média harmômica é sempre inferior ou igual à média geométrica que, por sua vez, é sempre inferior ou igual à média aritmética, ou seja, MH ≤ MG ≤ MA. A igualdade ocorre quando os números são todos iguais. 5 Na literatura em tarefas temporais com animais não-humanos, há evidencia da Fração de Weber variando entre 0.20 e 0.30 (Richelle & Lejeune, 1980). Marilia Pinheiro de Carvalho, Marco Vasconcelos, Armando Machado 147 geométrica é de 2. Assim, como a Fração de Weber é constante, a proporção de respostas ‘longo’ emitidas para cada uma dessas duas durações longas deveria ser igual: P(‘longo’) aos 4 s na discriminação 1 s vs. 4 s deveria ser igual a P(‘longo’) aos 16 s na discrimina- ção 4 s vs. 16 s. O mesmo aconteceria para as outras durações usadas nos testes. Church e Deluty (1977) confimaram este resultado: As proporções de respostas ‘longo’ eram iguais para durações que repre- sentavam a mesma proporção em relação à média geométrica e, portanto, as funções psicométricas das quatro discriminações sobrepuseram-se (conferir o painel central na Figura 4). A sobreposição das funções psico- métricas ilustra uma das propriedades mais robustas da discriminação temporal em animais, a propriedade escalar: Tarefas de bissecção com durações de treino na mes- ma proporção (1:4 em todas as tarefas em análise no estudo) induzem funções psi- cométricas que se sobrepõem quando gra- ficadas na mesma escala. Church e Deluty (1977) verificaram que a discriminação tem- poral dos estímulos obedece à propriedade escalar. DESDOBRAMENTOS Responder relacional vs. respon- der absoluto. Retomemos o nosso exemplo com o treino discriminativo entre 1 e 4 s. Para facilitar a descrição, dissemos até aqui que os sujeitos aprendem a responder ‘cur- to’ para 1 segundo e ‘longo’ para 4 s, quando, em verdade, eles aprendem, por exemplo, a pressionar a barra da esquerda após 1 s e a barra da direita após 4 s. Existe uma dife- rença fundamental entre afirmar que os su- jeitos respondem que uma duração é curta e a outra é longa, e afirmar que respondem ‘esquerda’ e ‘direita’ em função das dura- ções. A primeira afirmação implica que os sujeitos respondem com base no valor rela- tivo das durações – isto é, aprendem que 1 s é curto relativamente a 4 s, que 4 s é longo relativamente a 1 s e, adicionalmente, quais respostas emitir para os estímulos curto e longo; a segunda afirmação implica que os sujeitos respondem com base no valor absoluto das durações – isto é, aprendem quais respostas emitir após 1 e 4 s. O responder com base no valor rela- tivo dos estímulos, ou o responder relacio- nal, influenciou fortemente o programa de trabalhos da escola da Gestalt em princípios do século XX e é um dos tópicos de pesqui- sa mais antigos da psicologia experimen- tal. Há evidência de responder relacional controlado pelo brilho (Kohler, 1918/1938), pelo tamanho (Gulliksen, 1932) e pela forma (Saldanha & Bitterman, 1951) dos estímulos, embora interpretações alternativas sejam possíveis (e.g., Spence, 1936, 1937). Mas será que animais não-humanos respondem rela- cionalmente em discriminações temporais? O estudo de Church e Deluty (1977) Capítulo IX | Bissecção Temporal 148 iniciou a linha de pesquisa neste tópico e, assim, levantou outra questão fundamen- tal no estudo do timing, designadamente, o quê um animal aprende na tarefa de bis- secção. Vejamos como os autores atacaram o problema. Volte à Tabela 1 e considere as tarefas realizadas pelos grupos A e B nas Fases II e III. Na Fase II, ambos os grupos aprenderam a responder ‘esquerda’ após 1 s e ‘direita’ após 4 s. Se, por um lado, os sujeitos aprenderam a responder ao valor relativo das durações, a contingência pode ser resumida com o esquema ‘curto→es- querda, longo→direita’. Se, por outro lado, aprenderam a responder ao valor absoluto das durações, a contingênciapode ser resu- mida como ‘1s→esquerda, 4s→direita’. A Fase III foi planejada para testar as duas possibilidades. Ambos os grupos aprenderam a discriminação entre 4 e 16 s, mas o mapeamento entre a resposta correta e a duração do estímulo diferiu entre gru- pos. Um grupo aprendeu a responder ‘es- querda’ após 4 s e ‘direita’ após 16 s. Obser- ve que se manteve o mapeamento relativo ‘curto→esquerda, longo→direita’ para este grupo e, por isso, vamos chamá-lo de grupo Relativo. O outro grupo, em contrapartida, aprendeu a responder ‘direita’ após 4 s e ‘es- querda’ após 16 s. Neste caso, manteve-se o mapeamento absoluto ‘4s→direita’ e, por isso, chamamo-lo de grupo Absoluto. Church e Deluty (1977) raciocinaram que, se o responder na discriminação tem- poral é baseado no valor relativo das dura- ções, o grupo Relativo deveria aprender a Fase III mais rapidamente do que o grupo Absoluto. Se, pelo contrário, o responder é Figura 5. Painel da esquerda. Proporção de acertos para a duração de 4 s obtida nos grupos Relativo e Absoluto por Church e Deluty (1977). Painel central. Porcentagem de acertos de um sujeito do grupo Relativo para as durações de 6 e 18 s na fase B do experimento de Carvalho et al. (2016). Painel da direita. Porcentagem de acerto de um sujeito do grupo Absoluto para as durações de 6 e 18 s na fase B do experimento de Carvalho et al. (2016). Marilia Pinheiro de Carvalho, Marco Vasconcelos, Armando Machado 149 baseado no valor absoluto, o grupo Absoluto deveria aprender mais rapidamente do que o grupo Relativo. Os autores compararam a porcentagem de respostas corretas dos gru- pos ao longo das sessões de treino da Fase III, mas analisaram apenas o desempenho para a duração de 4 s. Os resultados na Fi- gura 5 (painel a) revelaram que o grupo Re- lativo respondia corretamente em mais de 90% das tentativas ao fim de quinze sessões de treino, mas o grupo Absoluto respondia corretamente em menos de 70% das tenta- tivas. Além disso, já na primeira sessão de treino, o desempenho do grupo Relativo era mais alto do que o do grupo Absoluto. Com base nestes resultados, os autores concluí- ram que os sujeitos aprendem a responder ao valor relativo das durações em tarefas de discriminação temporal. Em nosso laboratório, replicamos com pombos o experimento de Church e Deluty (1977). Ensinamos aos animais as discriminações entre 2 s vs. 6 s e 6 s. vs. 18 segundos e usamos um disco verde e outro vermelho como estímulos de comparação. Nossos resultados (painéis b e c na Figura 5; Carvalho & Machado, 2012; Carvalho, Machado, & Tonneau, 2016), contudo, não corroboraram aqueles obtidos por Church e Deluty com ratos. Ao invés, eles mostraram que (a) na primeira sessão de treino, o de- sempenho do grupo Absoluto era mais alto do que o do grupo Relativo na duração de 6 s (a duração comum ao treino das duas fases e que em nosso procedimento equi- valia à duração de 4 s no estudo de Church e Deluty) e (b) ambos os grupos tinham um desempenho similar e elevado no final do treino. Para melhor fundamentar a compa- ração dos grupos, nós simulamos o desem- penho na tarefa com o modelo Learning to Time (LeT; Machado, 1997; Machado, Ma- lheiro, & Erlhagen, 2009) e, posteriormente, constratamos as simulações com os dados empíricos. O LeT é um modelo comporta- mental que descreve a aquisição e o estado estável de respostas controladas temporal- mente com base em processos de reforça- mento, extinção e generalização. De acordo com o LeT, o início do estímulo modelo ativa uma série de esta- dos comportamentais que estão ligados às duas respostas operantes. A velocidade de ativação dos estados (λ) varia de tentativa para tentativa e provem de uma distribui- ção normal, λ ~ N (média = μ, desvio pa- drão =σ). Quando o sujeito emite uma res- posta ao fim do estímulo modelo, a força do elo associativo entre a resposta emitida e o estado ativo no momento da resposta é alterada dependendo da consequência da resposta: Se foi reforçada, a força aumenta; se foi extinta, a força diminui. A Figura 6 esquematiza o modelo. Vejamos o caso da discriminação ‘2s→verde, 8s→vermelho’. Em uma ten- tativa com um estímulo modelo de 2 s e λ = 1, o estado n = 2 está ativo no momento em que o sujeito emite uma resposta, ‘ver- Capítulo IX | Bissecção Temporal 150 de’ por exemplo. A resposta é reforçada e, portanto, a força do elo entre o estado n=2 e ‘verde’ aumenta e a força do elo entre o es- tado n=2 e ‘vermelho’ diminui . Se o sujeito responder ‘vermelho’, a resposta é extinta, o elo de n=2 e ‘vermelho’ diminui e o elo de n=2 e ‘verde’ aumenta. Veja na Figura 6 o elo “forte” (linha preta) de n=2 com ‘verde’ e o elo “fraco” (linha cinza pontilhada) de n=2 com ‘vermelho’. Em uma tentativa com um estímulo modelo de 8 s e λ = 1, o estado n = 8 está ativo no momento em que o sujeito emite a resposta ‘vermelho’. A resposta é refor- çada, a força do elo entre o estado n = 8 e ‘vermelho’ aumenta e a força do elo entre o estado n = 8 e ‘verde’ diminui. Raciocínio semelhante ao já descrito acima aplica-se ao efeito da extinção da resposta ‘verde’ emitida após 8 s. O parâmetro λ é uma variável alea- tória, e, portanto, o estado ativo ao fim de um dado estímulo modelo varia de tentati- va para tentativa. Contudo, a ativação dos estados correlaciona-se com a passagem do tempo e, assim, estados iniciais (e.g., n = 1, 2, 3) estarão mais provavelmente ativos durante as respostas ao estímulo de 2 s, e estados subsequentes (e.g., n = 6, 7, 8) esta- rão mais provavelmente ativos durante as respostas ao estímulo de 8 s. Com o treino, as forças de ligação de todos os estados ati- vos durante as respostas são alteradas, de modo que os estados iniciais estarão mais fortemente ligados a ‘verde’ e os estados posteriores estarão mais fortemente ligados a ‘vermelho’. O resultado são dois gradien- tes de forças de ligação, um para a resposta ‘verde’ e outro para a resposta ‘vermelho’ (observe a gradação da espessura dos elos associativos na Figura 6). Em cada tentati- va, o sujeito emitirá a resposta que tiver o elo mais forte com o estado ativo ao fim do estímulo modelo. Como você deve ter observado, o LeT assume que as respostas do sujeito são controladas pela duração absoluta do es- tímulo modelo (i.e., 2 s ou 8 s) e não pela sua duração relativa (i.e., ‘curto’ ou ‘longo’). Ao comparar as simulações do LeT com o desempenho dos pombos, pudemos ava- liar qual é a forma de controle de estímulos predominante na tarefa de bissecção tem- poral. As simulações foram genericamente semelhantes ao desempenho dos pombos tanto qualitativa, quanto quantitativamen- te (compare os painéis d e e com os painéis b e c, respectivamente, na Figura 5). Os re- sultados dos estudos conduzidos por Car- valho e colaboradores (2012, 2016), portanto, Figura 6. Diagrama dos componentes do modelo Learning to Time (LeT) – estados comportamentais, elos associativos e respostas operan- tes – aplicado à uma tarefa de bissecção temporal. A cor e o tracejado dos elos indicam a força de ligação entre os estados e as respostas: Li- nhas pretas contínuas indicam força “elevada”, linhas pretas traceja- das indicam força “intermediária” e linhas cinzas pontilhadas indicam força “baixa”. Portanto, o estado n = 2 está fortemente ligado a ‘verde’ e fracamente ligado a ‘vermelho’, e o estado n = 8 está fracamente ligado a ‘verde’ e fortemente ligado a ‘vermelho’, por exemplo. Marilia Pinheiro de Carvalho, Marco Vasconcelos, Armando Machado 151 sugerem de maneira bastante robusta que o responder na tarefa de bissecção temporal é baseado no valor absoluto das durações. Permanece por identificar sob quais condi- ções os animais aprendem a responder com base na duração relativa dos estímulos tem- porais. Efeitos contextuais na tarefa de bis- secção. Para além dos estudos empíricos, os pesquisadores do timing também têm conduzido pesquisas teóricas. Em particu- lar, elestêm proposto vários modelos ma- temáticos para explicar o desempenho em tarefas temporais. Dois dos modelos mais influentes são o LeT, já apresentado, e o Scalar Expectancy Theory (SET; Gibbon, 1977, 1991; Gibbon & Church, 1984; Gibbon, Church, & Meck, 1984). Os dois modelos diferem nos seus pressupostos sobre o que é aprendido na tarefa de bissecção temporal. Para compre- endermos estas diferenças, tomemos uma tarefa em que os sujeitos devem responder ‘vermelho’ após 1 s e ‘verde’ após 4 s. De acordo com o SET, os sujeitos aprendem apenas as contingências ‘1s→escolher ver- melho’ e ‘4s→escolher verde’. O LeT, pelo contrário, assume que os sujeitos apren- dem ‘1s→escolher vermelho e evitar verde’ e ‘4s→escolher verde e evitar vermelho’. Para testar os pressupostos dos mo- delos, Machado e Keen (1999) desenvolve- ram a tarefa de dupla bissecção temporal. Como o nome da tarefa sugere, os sujeitos são treinados em duas bissecções temporais. A primeira é semelhante à que acabamos de descrever entre 1 e 4 s. Na segunda, apren- dem a responder ‘azul’ após 4 s e ‘amarelo’ após 16 s. Para o SET, os sujeitos aprendem ‘4s→escolher azul’ e ‘16s→escolher ama- relo’. Para o LeT, eles aprendem ‘4s→esco- lher azul e evitar amarelo’ e ‘16s→escolher amarelo e evitar azul’. Aprendidas as duas discriminações, é conduzido um teste com durações que variam entre 1 e 16 s e no qual as opções de reposta são ‘verde’ e ‘azul’. Os modelos diferem nas previsões que fazem do desempenho no teste. De acordo com o SET, os sujeitos deveriam distribuir aleatoriamente suas respostas entre ‘verde’ e ‘azul’ durante o teste, porque no treino prévio eles apenas aprenderam ‘1s→escolher vermelho, 4s→escolher ver- de, 4s→escolher azul, 16s→escolher ama- relo’ e, portanto, não deveriam apresentar vieses em favor de uma ou outra resposta em função das diferentes durações. Como consequência, a proporção de respostas ‘verde’ não deveria variar com as durações de teste. De acordo com o LeT, os sujeitos deveriam preferir ‘verde’ conforme as du- rações de teste aumentassem porque no treino prévio os sujeitos aprenderam (a) a evitar ‘azul após as durações mais lon- gas (próximas de 16 s) e (b) a evitar ‘verde’ após as durações mais curtas (próximas de Capítulo IX | Bissecção Temporal 152 1 s). No teste, dada a escolha entre ‘verde’ e ‘azul’, a proporção de respostas ‘verde’ de- veria aumentar com o aumento na duração dos estímulos. Diversos estudos usaram a tarefa de dupla bissecção temporal (Arantes & Ma- chado, 2008; Machado & Arantes, 2006; Machado & Keen, 1999; Machado & Olivei- ra, 2009; Machado & Pata, 2005; Oliveira & Machado, 2008, 2009; Vieira de Castro & Machado, 2012; Vieira de Castro, Machado, & Tomanari, 2013) e sistematicamente con- firmaram as previsões do LeT. A Figura 7 apresenta os resultados obtidos por Macha- do e Pata (2005) com pombos. Dá-se o nome de efeito de contexto a este padrão de resul- tados, porque as respostas no teste são de- terminadas pelo contexto original em que os sujeitos aprenderam a escolher ou evitar consideramos um treino discriminativo em que as probabilidades de reforço das res- postas corretas para cada duração de treino eram iguais. Church e Deluty (1977) usaram um esquema de Razão Fixa (FR) 1 para as respostas ‘curto’ e ‘longo’. Sob este esquema, verificamos que o PIS está usualmente na média geométrica das durações de treino. A linha contínua na Figura 8 ilustra uma fun- ção psicométrica hipotética para um treino discriminativo entre 1 e 4 s no qual as res- postas ‘curto’ e ‘longo’ tinham igual proba- bilidade de reforço. Observe que o PIS da função é igual a 2 s. Agora, o que aconteceria com o PIS, em particular, e com a função psicométrica, de um modo geral, se conduzíssemos um treino discriminativo em que uma resposta tem maior probabilidade de reforço do que a outra? Por exemplo, o que aconteceria se a probabilidade de reforço da resposta ‘longo’ fosse de 1.0 e a probabilidade de reforço da resposta ‘curto’ fosse de 0.2? De maneira se- melhante, o que aconteceria se a magnitude do reforço fosse maior para a resposta ‘lon- go’ do que para a resposta ‘curto’? Em am- bos os casos, esperaríamos que a proporção de respostas ‘longo’ aumentasse, resultando em uma função psicométrica que está des- locada para a esquerda da função que con- sideramos anteriormente, e cujo PIS está abaixo de 2 s. A linha pontilhada na Figura 8 ilustra o efeito. De maneira similar, quando a proba- bilidade de reforço da resposta ‘longo’ fosse Figura 7. Efeito de contexto obtido por Machado e Pata (2005) com pombos em uma tarefa de dupla bissecção temporal. uma resposta em função das durações. Efeitos da probabilidade do reforço na função psicométrica. Até agora, apenas Marilia Pinheiro de Carvalho, Marco Vasconcelos, Armando Machado 153 menor do que a probabilidade de reforço da resposta ‘curto’, a proporção de respostas ‘longo’ diminuiria, a função psicométrica deslocar-se-ia para a direita e o PIS seria superior a 2 s. A linha tracejada na Figura 8 ilustra o efeito. Até o momento, contudo, os resulta- dos experimentais são escassos e inconsis- tentes. Stubbs (1976), por exemplo, reportou deslocamentos consistentes com as previ- sões em uma tarefa em que a probabilidade relativa de reforço diferia entre as respostas ‘curto’ e ‘longo’ (ver também Raslear, 1985). Outros estudos que manipularam a mag- nitude do reforço, no entanto, revelaram tanto resultados consistentes quanto resul- tados inconsistentes com as previsões (e.g., Galtress & Kirkpatrick, 2010). Caso ocorram de fato, os desloca- mentos da função psicométrica indicariam que a distribuição das respostas entre as duas opções (‘curto’ e ‘longo’) é sensível às discrepâncias nas probabilidades e nas mag- nitudes de reforço. Tais resultados seriam consistentes com a Lei da Igualação (Herr- nstein, 1970) e aproximariam o responder em discriminações temporais do responder observado em outros procedimentos que envolvem escolha. Mais pesquisa sobre o tópico é claramente necessária. CONSIDERAÇÕES FINAIS O estudo de Church e Deluty (1977) é hoje considerado um clássico da pesqui- sa em timing. Por um lado, foi pioneiro na implementação de uma tarefa de bissecção temporal recorrendo a um procedimento psicofísico clássico (i.e., o método de estí- mulos constantes). Anteriormente, Stubbs (1968, 1976) tinha utilizado um procedimen- to similar, mas, ao invés de reforçar apenas as repostas para as durações mais curta e mais longa, reforçava também as respostas para as durações intermediárias. Church e Deluty, por sua vez, foram os primeiros a reportar funções psicométricas e PISs ob- tidos em testes de generalização e sem re- forçamento das respostas para as durações intermediárias. Por outro lado, e porventu- ra mais importante, o estudo de Church e Deluty deu lugar a uma série de questões consideradas ainda hoje centrais para a nossa compreensão da percepção temporal tanto em humanos como em animais não humanos. Como discutido anteriormente, o PIS Figura 8. Funções psicométricas hipotéticas para diferentes probabi- lidades de reforço na discriminação entre 1 e 4 s. Em cada linha da legenda, o valor à esquerda representa a probabilidade de reforço da resposta ‘curto’ e o valor à direita representa a probabilidade de reforço da resposta ‘longo’. Capítulo IX | Bissecção Temporal 154 na média geométrica sugere uma escala logarítmica para o tempo subjetivo, com- binada com uma regra de decisão baseada na diferença entre tempos subjetivos. Con- tudo, logo após o estudo de Church e Delu- ty (1977), outros autores mostraram como o PIS na média geométrica pode ser obtido a partir de uma escala linear e de uma regra de decisão baseada na razão entre os tem- pos subjetivos (ver Gibbon, 1991). As ques- tões sobre a métrica da escala subjetiva do tempo – logarítmica versus linear – e sobre a regra de decisão permanecem em aber- to(e.g., Jozefowiez, Machado, & Staddon, 2013). Da mesma forma, há evidência de res- ponder relacional em algumas circunstân- cias (e.g., Zentall, Weaver, & Clement, 2004), muito embora nosso laboratório tenha en- contrado evidências sólidas de responder absoluto, pelo menos em pombos. Ainda, a tarefa de bissecção abriu a porta para pro- cedimentos mais complexos como a dupla bissecção. Esta última tem sido usada para estudar efeitos de contexto na percepção temporal, testando previsões contrastantes de dois modelos proeminentes da área, o SET e o LeT. Por fim, ainda não são claros os efeitos da manipulação da probabilidade e da magnitude do reforço na função psi- cométrica. Os resultados obtidos por alguns autores apontam para deslocamentos da função induzidos por estas manipulações (Galtress & Kirkpatrick, 2010; Raslear, 1985; Stubbs, 1976), mas o assunto permanece por esclarecer cabalmente. A melhor prova do sucesso e impor- tância do trabalho de Church e Deluty (1977) são as linhas de pesquisa que abriu. Trinta e nove anos após a sua publicação, as su- gestões nele contidas permanecem atuais e alvo de forte disputa e investigação. PARA SABER MAIS Carvalho & Machado (2012); Carvalho, Machado, & Tonneau (2016). Em ambos os artigos, os autores reproduziram o estu- do original de Church e Deluty (1977) com procedimentos que melhoraram o desenho experimental e a análise de dados para es- tudar a questão do responder relacional vs. responder absoluto. Nos artigos, os autores também apresentam uma revisão detalha- da do trabalho de Church e Deluty (1977). Carvalho, Machado, & Vasconcelos (2016). Os autores revisam as principais tarefas ex- perimentais usadas na pesquisa em timing e os principais resultados obtidos até hoje. Propõem uma abordagem integrativa dos resultados que se baseia na interação de gradientes de generalização temporal. Richelle & Lejeune (1980). Livro de referên- cia na área do timing, escrito por dois dos principais pesquisadores da área. Resume os principais procedimentos, resultados e propriedades do responder controlado por intervalos de tempo. Marilia Pinheiro de Carvalho, Marco Vasconcelos, Armando Machado 155 REFERÊNCIAS Arantes, J., & Machado, A. (2008). Context effects in a temporal discrimination task: Further tests of the Scalar Expectancy The- ory and Learning-to-Time models. Journal of the Experimental Analysis of Behavior, 90, 33-51. Carvalho, M. P., & Machado, A. (2012). Rela- tive versus absolute stimulus control in the temporal bisection task. Journal of the Ex- perimental Analysis of Behavior, 98, 23-44. Carvalho, M. P., Machado, A., & Tonneau, F. (2016). Learning in the temporal bisection task: Relative or Absolute? Journal of Expe- rimental Psychology, 42, 67-81. Carvalho, M. P., Machado, A., & Vasconce- los, M. (2016). Animal timing: a synthetic approach. Animal Cognition, 1-26. Catania, A. C. (1999). Aprendizagem: Com- portamento, Linguagem e Cognição (4ª ed.). Porto Alegre: Artes Médicas. Church, R. M. (2002). Temporal learning. In H. Pashler, & R. Gallistel (Eds), Stevens’ Handbook of Experimental Psychology, Third Edition: Volume 3, Learning, Motiva- tion, and Emotion (pp. 365-393). New York, NY: Wiley. Church, R. M., & Deluty, M. (1977). Bisec- tion of temporal intervals. Journal of Expe- rimental Psychology: Animal Behavior Pro- cesses, 3, 216-228. Galtress, T., & Kirkpatrick, K. (2010). Reward magnitude effects on temporal discrimina- tion. Learning and Motivation, 41, 108-124. Gibbon, J. (1977). Scalar expectancy theory and Weber’s law in animal timing. Psycho- logical Review, 84, 279-325. Gibbon, J. (1991). Origins of scalar timing. Learning and Motivation, 22, 3-38. Gibbon, J., & Church, R. M. (1984). Sources of variance in an information processing theory of timing. In H. L. Roitblat, T. G. Be- ver, & H. S. Terrace (Eds), Animal Cognition (pp. 465-488). Hillsdale, NJ: Lawrence Erl- baum Associates. Gibbon, J., Church, R. M., & Meck, W. H. (1984). Scalar Timing in Memory. Annals of the New York Academy of Sciences, 423, 52- 77. Gulliksen, H. (1932). Studies of transfer of response: I. Relative versus absolute factors in the discrimination of size by the white rat. Journal of Genetic Psychology, 40, 37-51. Herrnstein, R. J. (1970). On the law of ef- fect. Journal of the Experimental Analysis of Behavior, 13, 243-266. Köhler, W. (1918/1938). Simple structural functions in the chimpanzee and in the chi- cken. In W. D. Ellis (Ed), A source book of Capítulo IX | Bissecção Temporal 156 gestalt psychology (pp. 217-227). New York: Harcourt, Brace & World. (Trabalho original publicado em alemão em 1918). Machado, A. (1997). Learning the temporal dynamics of behavior. Psychological Re- view, 104, 241-265. Machado, A., & Arantes, J. (2006). Further tests of the Scalar Expectancy Theory (SET) and the Learning-to-Time (LeT) model in a temporal bisection task. Behavioural Pro- cesses 72, 195-206. Machado, A., & Keen, R. (1999). Learning to Time (LeT) or Scalar Expectancy The- ory (SET)? A critical test of two models of timing. Psychological Science, 10, 285-290. Machado, A., Malheiro, M. T., & Erlhagen, W. (2009). Learning to time: A perspecti- ve. Journal of the Experimental Analysis of Behavior, 92, 423-458. Machado, A., & Oliveira, L. (2009). Dupla bissecção temporal: testes críticos de dois modelos de timing. Acta Comportamenta- lia, 17, 25-60. Machado, A., & Pata, P. (2005). Testing the scalar expectancy theory (SET) and the le- arning-to-time model (LeT) in a double bi- section task. Learning & Behavior, 33, 111- 122. Oliveira, L., & Machado, A. (2008). The ef- fect of sample duration and cue on a double temporal discrimination. Learning and Mo- tivation, 39, 71-94. Oliveira, L., & Machado, A. (2009). Context effect in a temporal bisection task with the choice keys available during the sample. Behavioural Processes, 81, 286-292. Pavlov, I. (1927). Conditioned reflexes. Lon- don: Oxford University Press. Raslear, T. G. (1985). Perceptual bias and response bias in temporal bisection. Per- ception & Psychophysics, 38, 261-268. Richelle, M., & Lejeune, H. (1980). Time in animal behaviour. Oxford: Pergamon Press Ltd. Saldanha, E. L., & Bitterman, M. E. (1951). Relational learning in the rat. The American Journal of Psychology, 64, 37-53. Santo Agostinho. (2004). Confissões, Livro XI, XIV, 17 (2ª ed.). Lisboa: Imprensa Nacio- nal da Casa da Moeda. Spence, K. W. (1936). The nature of discri- mination learning in animals. Psychological Review, 43, 427-449. Spence, K. W. (1937). The differential res- ponse in animals to stimuli varying within a single dimension. Psychological Review, 44, 430-444. Stubbs, D. A. (1968). The discrimination of Marilia Pinheiro de Carvalho, Marco Vasconcelos, Armando Machado 157 stimulus duration by pigeons. Journal of the Experimental Analysis of Behavior, 11, 223- 238. Stubbs, D. A. (1976). Response bias and the discrimination of stimulus duration. Jour- nal of the Experimental Analysis of Beha- vior, 25, 243-250. Vieira de Castro, A. C., & Machado, A. (2012). The interaction of temporal generalization gradients predicts the context effect. Jour- nal of the Experimental Analysis of Beha- vior, 97, 263-279. Vieira de Castro, A. C., Machado, A., & To- manari, G. Y. (2013). The context effect as interaction of temporal generalization gra- dients: Testing the fundamental assump- tions of the Learning-to-Time model. Beha- vioural Processes, 95, 18-30. Hiroto Okouchi 158 Como você se sente?1, 2 Hiroto Okouchi Universidade Osaka Kyoiku, Japão Lubinski, D., & Thompson, T. (1987). An animal model of the interpersonal communication of interoceptive (private) states. Journal of the Experimental Analysis of Behavior, 48, 1-15. “Nós não precisamos supor que eventos que ocorrem dentro da pele de um organis- mo tem propriedades especiais por essa razão” (Skinner, 1953, p.257). CapítuloX | Eventos Privados 159 INTRODUÇÃO À ÁREA DE PES- QUISA E CONTEXTUALIZAÇÃO DO EXPERIMENTO Muitas pessoas, não somente os psi- cólogos mas também os não especialistas em Psicologia, estão interessados em com- preender a “mente”. Analistas do comporta- mento têm uma perspectiva única sobre ela, baseada no Behaviorismo Radical (Skinner, 1945). A entidade hipotética que geral- mente tem sido chamada de “mente” está relacionada com um dos conceitos analíti- co-comportamentais, os eventos privados. Eventos privados têm sido geralmente de- finidos estruturalmente como eventos que ocorrem dentro da pele de uma pessoa (Ca- tania, 1992, p.388) e, funcionalmente, como eventos que são diretamente acessíveis a apenas uma pessoa (Skinner, 1953, p.257). Sentimentos, como “depressão” e “entu- siasmo”, são eventos privados não só estru- turalmente, mas também funcionalmente, porque ocorrem dentro da pele de uma pes- soa e estão diretamente acessíveis apenas para ele ou ela. Tais sentimentos, em ge- ral, são considerados como “elementos da mente” (Dicionário de Inglês Oxford, 2004, pp.1047-1048). Em oposição aos eventos privados, eventos que ocorrem fora da pele de uma pessoa e/ou eventos que são diretamen- te acessíveis a mais do que um indivíduo podem ser chamados de eventos públicos. O pressionar de uma barra por um rato e a entrega de uma pelota de comida, durante um experimento de condicionamento ope- rante, são exemplos típicos de eventos pú- blicos. A análise experimental do compor- tamento tem acumulado um extenso corpo de conhecimento sobre as relações sistemá- ticas entre tais eventos públicos (Ferster & Skinner, 1957, Honig, 1966; Honig & Stad- don, 1977; Iversen & Lattal, 1991; Madden, 2013). Analistas do comportamento presu- mem que eventos privados obedecem os mesmos princípios comportamentais reve- lados pela análise experimental de even- tos públicos. De acordo com este ponto de vista, por exemplo, até mesmo descrever nossos próprios sentimentos é um resul- tado de contingências de reforçamento. Skinner (1945) argumentou que as respos- tas verbais sob controle de estímulos pri- vados são estabelecidas e mantidas prin- cipalmente pelas contingências de reforço “arranjadas” por outras pessoas. Suponha que uma pessoa “deprimida” (um falante), diga: “Estou deprimido.” Se alguém (um ou- vinte) ouviu e entendeu a reclamação (isto é, se o ouvinte pertencesse a uma mesma comunidade verbal que o falante e pudesse reagir de forma adequada ao que o falan- te disse), e se o ouvinte soubesse que o fa- 1 Tradução realizada por João Henrique de Almeida, Carlos Renato Xa- vier Cançado e Paulo Guerra Soares. O primeiro tradutor é bolsista de pós-doutorado FAPESP processo número 2014/01874-7. 2 O artigo descrito nesse texto foi traduzido para a língua portuguesa por Júlio de Rose e está publicado: Lubinski,D. & Thompson, T. (2010) Um modelo animal de comunicação interpessoal de estados interocep- tivos (privados). Revista Brasileira de Análise do Comportamento, 6, 229-252. Hiroto Okouchi 160 lante tinha experimentado um evento que normalmente provoca sentimentos de de- pressão (por exemplo, a perda de um ente querido), o ouvinte poderia dizer: “Eu sei exatamente como você se sente.” Compor- tamentalmente, o sentimento de depressão, a queixa “estou deprimido”, e as palavras de conforto “Eu sei exatamente como você se sente”, respectivamente, são um estímulo discriminativo, uma resposta e um refor- çador do comportamento verbal do falante. Uma resposta verbal (e.g., “vermelho”) a um estímulo público (e.g., um cartão vermelho) pode ser estabelecida pelo reforço dado por outros (e.g., “Correto, esta é a cor do car- tão.”). Os analistas do comportamento su- põe que descrever os próprios sentimentos (e.g., estar deprimido), também é aprendido (e.g., Skinner, 1953, pp.257-282). Skinner (1945) também demonstrou que o relato de uma pessoa sobre um estí- mulo privado não ocorre por reforço direto, mas por meio de generalização. Uma pessoa pode descrever seu sentimento novo como “deprimido(a)” se ele ou ela aprendeu que a palavra “deprimido(a)” é usada quando algo (e.g. uma barra) foi empurrado para baixo (generalização de eventos públicos para os privados, Skinner, 1957, pp.132-133) ou a palavra é usada quando ele ou ela experi- menta um sentimento semelhante ao sen- timento novo (i.e. generalização de eventos privados conhecidos para aqueles desco- nhecidos). Apesar da grande quantidade de análises conceituais (e.g., Leigland, 2014; Schlinger, 2011; Tourinho, 2006), análises experimentais de eventos privados têm recebido relativamente pouca atenção. O experimento conduzido por Lubinski e Thompson (1987) é um dos raros casos em que foi praticada uma análise experimental de eventos privados. DESCRIÇÃO DO EXPERIMENTO Objetivos e Método O objetivo do experimento de Lu- binski e Thompson (1987) foi avaliar se ani- mais não-humanos poderiam aprender a interagir comunicativamente, com base em eventos em seu ambiente interno. Figura 1. Painéis adjacentes de trabalho das caixass para os dois grupos de pombos. Os painéis de trabalho foram separados por uma divisória de acrílico Os mandadores foram treinados na caixa esquerda; os tate- adores foram treinados na caixa direita (figura reproduzida da tradução de Lubinski & Thompson, com permissão da ReBAC e JEAB). Capítulo X | Eventos Privados 161 Figura 2. Uma comunicação entre dois pombos com base na ingestão de drogas (estado interno) de um dos pombos. Da esquerda para a direita, os cinco quadros (A-E) mostram os componentes sucessivos do procedimento. Os pombos à esquerda e à direita em cada quadro eram o mandador e o tateador, respectivamente (reproduzida da tradução de Lubinski & Thompson, 1987, com permissão da ReBAC e JEAB). de água e comida durante o experimento, foram treinados em uma cadeia comporta- mental com dois componentes, em que o primeiro componente compreendia uma ta- refa pareamento ao modelo arbitrária (arbi- trary matching-to-sample )(o procedimen- to deste treino será resumido em seguida). Após o treino, a cadeia comportamental es- tabelecida era a seguinte: (a) O tateador era injetado com um depressor (pentobarbital), um estimulante (cocaína) ou uma solução salina isotônica; (b) três discos de resposta, cada um marcado com a letra “D”, “N”, ou “Σ” foram iluminados (Figura 1); (c) bicadas correspondentes à substância injetada (o disco “D” para o pentobarbital, o disco “Σ” para a cocaína, e o disco “N” para a solução Os sujeitos foram cinco pombos White Carneau fêmeas, experimentalmen- te ingênuas, distribuídos em dois grupos, denominados “mandadores” (dois pombos) e “tateadores” (três pombos). Duas caixas experimentais contí- guas, separadas por uma divisória de acríli- co transparente, que permitiu que os pom- bos vissem um ao outro, foram usadas (ver Figuras 1 e 2). Os mandadores foram trei- nados na caixa esquerda, os tateadores na direita. Antes de serem colocados em suas caixas simultaneamente, cada pombo foi treinado individualmente. Os tateadores, que estavam privados Hiroto Okouchi 162 salina) foram seguidas pela apresentação de uma luz azul piscando acima dos discos de resposta; (d) as respostas em um disco aci- ma de um comedouro (disco da comida) e em um disco acima de um bebedouro (dis- co da água) foram reforçadas com comida e água, respectivamente. A tarefa de pareamento ao modelo que os tateadores experimentaram é co- nhecida como um procedimento de discri- minação de drogas (drug discrimination): reforçar um tipo de comportamento após a administração de uma droga e reforçar ou- tro comportamento após a administração de nenhuma droga ou alguma outra dro- ga (Branch, 1991). Na ausência de qualquer estímulo diferencial exteroceptivo corre- lacionado com qualquer comportamento, escolhas produziam reforçadores mais fre- quentemente do que ao acaso e poderiam ser atribuídas a estímulos interoceptivos decorrentesda substância administrada (e.g., a droga ou a solução salina). Assim, os tateadores no experimento de Lubinski e Thompson (1987) foram treinados para “relatar seus sentimentos” pela tarefa de pareamento ao modelo. Foram necessários aproximadamente sete meses para os tate- adores responderem de forma consistente (i.e., pelo menos 80% de respostas corretas) nesta tarefa. Um segundo objetivo do experimen- to Lubinski e Thompson (1987) foi avaliar se as respostas dos pombos aos seus even- tos internos (privados) poderiam funcionar como um tato, o que foi estudado na parte final do experimento (descrito em seguida). Um tato, uma unidade do comportamento verbal, é “um operante verbal em que uma resposta de determinada forma é evocada (ou pelo menos fortalecida) por um deter- minado objeto ou evento ou propriedade de um objeto ou evento” (Skinner, 1957, pp. 81-82). Citando vários outros autores (e.g., MacCorquodale, 1969; Skinner, 1957, pp.81-82), Lubinski e Thompson afirmam que tatos não são mantidos por reforços específicos, nem mudam com o estado de privação ou de estimulação aversiva do in- divíduo, mas são mantidos por reforçadores condicionados generalizados (e.g., dizendo “Correto” quando alguém nomeia com pre- cisão a cor de um cartão vermelho dizendo “Vermelho”). A fim de alcançar este segun- do objetivo, Lubinski e Thompson tentaram estabelecer a luz azul intermitente como um reforçador condicionado generalizado que pudesse manter o comportamento dos tateadores. Os tateadores foram privados de comida de forma mais rigorosa do que eles foram privados de água em um dia (i.e., privação de comida por 28 hr e privação de água por 4hr), e eles foram privados de água de forma mais rigorosa do que eles foram privados de comida em outro dia (i.e., priva- ção de água por 28 hr e privação de comida por 4hr). Alternando essas duas condições de uma forma A-B-A-B, os tateadores esco- lhiam comida e água indiferenciadamente quando a luz azul estava piscando. Um mando, uma unidade mais pri- Capítulo X | Eventos Privados 163 mitiva do comportamento verbal, é “um operante verbal em que a resposta é reforça- da por uma consequência particular, e está, portanto, sob controle funcional das condi- ções relevantes de privação ou de estimu- lação aversiva” (Skinner, 1957, pp.35 -36). Dizer a palavra “Doce” é um exemplo de um mando quando reforçado pelo acesso a do- ces, e a resposta “Doce” será mais provável de ocorrer após um período de privação de doces ou comida (Skinner, 1957, p.35). Os mandadores, que foram mantidos sob pri- vação de comida a 85% de seu peso com livre acesso a comida, foram treinados em uma cadeia comportamental com três com- ponentes, em que o terceiro componente envolvia uma tarefa de pareamento ao mo- delo arbitrário. A cadeia estabelecida para o mandador era a seguinte: (a) foi ilumina- do um disco com letras em Inglês dispostas para formar as palavras (Figura 1); “Como você se sente?”; (b) as bicadas do mandador ao disco “Como você se sente” foram segui- das pela iluminação de um outro disco ro- tulado “Obrigado”; (c) quando o mandador bicava o disco “Obrigado”, a letra “D”, “N”, ou “Σ” era projetada em um disco modelo; (d) bicar o disco modelo e, em seguida, bicar o disco de comparação contendo a respos- ta com a correspondência correta (o disco “P” para a letra “D”, o disco “C” para a letra “Σ”, e o disco “S”para a letra”N”) produziam comida. Depois de ambos os mandadors e tateadores adquirirem independentemente a precisão necessária (i.e., pelo menos 80% de respostas corretas) no encadeamento, tateadores e mandadors individuais fo- ram colocados nas suas caixas simultane- amente. Como a Figura 2 ilustra, a intera- ção comportamental necessária de cada par mandador-tateador foi: (a) foi iluminado o disco do mandador “Como você se sente?” e o mandador bicava esse disco; (b) foram ilu- minados todos os discos de comparação do tateador (i.e., os discos “D”, “N”, e “Σ”) e o ta- teador bicava o disco de comparação corre- lacionado com a substância injetada (ou os próprios “sentimentos” do tateador); (c) foi iluminado o disco “Obrigado” na caixa do mandador e o mandador bicava esse disco; (d) a letra (“D”, “N”, ou “Σ”, i.e., o “nome” da droga ou o relato do tateador de seus “senti- mentos”) previamente bicada pelo tateador aparecia no disco modelo do mandador e a luz azul começava a piscar a caixa do tate- ador; o mandador bicava o disco modelo e, em seguida, bicava do disco de comparação correto; o tateador bicava o disco da comida ou da água, produzindo comida ou água; (e) o mandador recebeu comida. Se o tateador bicasse o disco de comparação não corre- lacionado com a substância injectada (uma resposta incorreta), as luzes da caixa eram escurecidas por 4 s e o elo inicial da cadeia (a) era reiniciado. Assim, o estímulo modelo apresentado ao mandador sempre foi corre- to. Ambos os mandadors trabalharam com cada um dos tateadores. Os pombos foram testados nessa interação por 40 sessões ex- perimentais. Deve-se notar que o experimento de Lubinski e Thompson (1987) apresenta- va duas fases adicionais (Fases 2 e 3). Na Hiroto Okouchi 164 Fase 2, os tateadores foram injetados com novas drogas, clordiazepóxido e d-anfeta- mina, que possuem propriedades farma- cológicas em comum com o pentobarbital e cocaína, respectivamente, como um tes- te de generalização. Na Fase 3, os autores examinaram se as respostas dos tateadores aos seus eventos privados funcionavam realmente como tatos. Foram testados os desempenhos dos tateadores quando foram colocados em suas caixas experimentais depois de receberem 24 horas de acesso li- vre a alimento e água (os tateadores foram saciados com alimento e água), e quando suas respostas corretas produziam apenas a luz azul piscando, mas que não produziam água ou comida (as respostas corretas dos tateadores produziam apenas reforçadores condicionados). Resultados e Discussão Resultados da Fase 1. Como apenas uma única substância (pentobarbital, cocaína, ou salina) foi inje- tada antes de cada sessão, a escolha corre- ta para o tateador foi a mesma em todas as tentativas em uma sessão. Assim, o desem- penho dos tateadores na primeira tentativa de uma sessão foi importante neste experi- mento. Tanto o mandador quanto o tatea- dor responderam corretamente (e.g., o tate- ador que recebeu o pentobarbital e bicou o disco “D”, e o mandador bicou o disco “P”) na primeira tentativa em 70-100% das ses- sões, enquanto que a porcentagem de uma discriminação correta acontecer por acaso era de aproximadamente 11% (i.e., o produto dos dois desempenhos individuais acon- tecendo por acaso, i.e., 0,33 x 0,33). Estes resultados sugerem que os pombos apren- deram a interagir comunicativamente com base em eventos do seu ambiente interno. Resultados das Fases 2 e 3. Os desempenhos observados na Fase 1 persistiram na Fase 2, sugerindo que as respostas dos tateadores aos seus even- tos privados decorrentes do treino com as drogas (pentobarbital e cocaína) generali- zaram para os eventos privados semelhan- tes decorrentes de drogas não utilizadas no treino (clordiazepóxido e d-anfetamina). Os desempenhos observados nas Fases 1 e 2 persistiram na Fase 3, sugerindo que as respostas precisas dos tateadores aos seus eventos privados não foram mantidas pelos reforçadores específicos (comida ou água), e não covariaram com os estados de privação dos tateadores, mas foram mantidas por um reforço condicionado generalizado (a luz azul piscando). A discussão do artigo de Lubinski e Thompson (1987) pode ser resumida da seguinte forma: (a) o comportamento dos tateadores envolveu tatear os eventos pri- vados; (b) os tateadores aprenderam a ta- tear eventos privados sob um esquema de reforçamento contínuo com 100% de preci- são, isto é, por meio de uma contingência em que cada resposta correta produzia um reforçador e qualquer resposta incorreta CapítuloX | Eventos Privados 165 não produzia reforçadores; por outro lado, considera-se que humanos aprendem a ta- tear eventos privados sob um esquema de reforçamento intermitente com baixa pre- cisão (Skinner, 1945); (c) a generalização ob- tida na Fase 2 configura-se como um exem- plo de tatos extendidos e exemplifica com não-humanos a descrição de Skinner de como humanos aprendem a relatar novos sentimentos; (d) os resultados de Thomp- son e Lubunski demonstram que o com- portamento encoberto (e.g., pensamentos, sentimentos e imaginação), que tem sido um dos candidatos para análise por meio de modelos experimentais com não-hu- manos (Epstein, 1984), mas tem resistido à análise empírica, é passível de uma análise objetiva; (e) os desempenhos estudados por Lubinski e Thompson podem não consistir em um exemplo de “atividade lingüística”, como o termo é geralmente entendido, mas compartilham características com aqueles comportamentos observados em crianças muito novas ou indivíduos com diagnós- tico de deficiências de desenvolvimento; (f) Savage-Rumbaugh (1984) afirmou que o comportamento controlado por contingên- cias impostas por circuitos eletrônicos ao invés de por um outro indivíduo não pode- ria ser caracterizado como “comunicação”. No entanto, as trocas diádicas humanas de respostas muitas vezes são mediadas por eventos externos, tais como ligações telefô- nicas e quadros de avisos no computador, e nós estamos satisfeitos em nos referirmos a essas trocas como “verbais”. DESDOBRAMENTOS O experimento de Lubinski e Thomp- son (1987) recebeu grande atenção (e.g., Ca- tania, 1992, pp.219-220). Em 1993, a revista Behavioral and Brain Sciences dedicou um número para um debate sobre o mesmo, com comentários de 27 estudiosos da aná- lise do comportamento e de outras aborda- gens (ver Lubinski & Thompson, 1993). O experimento de Lubinski e Thomp- son (1987), no entanto, não foi replicado diretamente ou sistematicamente. Prova- velmente, isto pode ser devido a razões de ordem prática. O equipamento utilizado por Lubinski e Thompson era muito dife- rente de caixas operantes padrão. As dro- gas psicoativas não são acessíveis a todos os pesquisadores. Além disso, este tipo de experimento demora muito tempo. Confor- me descrito na parte de Objetivos e Método deste capítulo, de fato, Lubinski e Thomp- son passaram sete meses para ensinar os tateadores a discriminação entre as drogas. Dois estudos podem ser considera- dos como sucessores Lubinski e Thompson (1987). Um foi realizado por DeGrandpre, Bickel, e Higgins (1992). Eles também usa- ram o procedimento de discriminação de drogas como Lubinski e Thompson fizeram, e examinaram se relações de equivalência podem surgir entre os estímulos interocep- tivos (ativados por drogas) e os estímulos exteroceptivos. Humanos adultos foram treinados em discriminações de drogas com Hiroto Okouchi 166 triazolam (reduzindo auto-relatos de ansie- dade) e placebo (cápsulas cheias de lactose) como estímulos modelo, e estímulos visuais como estímulos de comparação. Quando o triazolam (A1) foi apresentado, a escolha de um estímulo visual B1 era a correta, en- quanto a escolha dos estímulos visuais B2 e A0 eram incorretas; ou quando escolher um estímulo visual C1 era a escolha correta e a escolha dos estímulos visuais C2 e C0 in- corretas. Da mesma forma, quando o place- bo (A2) era o modelo, as comparações cor- retas eram B2 e C2. Após o estabelecimento das relações condicionais A1B1, A1C1, A2B2, A2C2 por meio desse treino de discrimi- nação de drogas, as relações não treinadas B1C1 e B2C2 emergiam. Estes resultados demonstram que eventos privados podem emergir como membros de uma classe equi- valente, da mesma forma que ocorre com os estímulos públicos (Sidman & Tailby, 1982) e, como Lubinski e Thompson mostraram, fornecem evidências de que os princípios comportamentais que operam em eventos públicos funcionam também com os even- tos privados (Skinner, 1953, pp.257-258). Outro exemplo relevante para o tema é um experimento realizado por Okouchi (2006). Como no experimento de Lubinski e Thompson, no experimento de Okouchi respostas a estímulos privados de um in- divíduo configuravam estímulos modelos para outro indivíduo. Diferente do experi- mento de Lubinski e Thompson, no entan- to, estímulos privados não eram estímulos interoceptivos mas exteroceptivos, isto é, estímulos visuais que apenas um indivíduo de um par de estudantes de graduação po- dia ver. De acordo com a definição funcio- nal de eventos privados como eventos que são diretamente acessíveis a uma só pessoa (Skinner, 1953, p.257), eventos que ocorrem fora da pele de uma pessoa podem ser pri- vados (Rachlin, 2003, chamou esse tipo de evento privado de Privacidade B e o distin- guiu da Privacidade A, que são eventos que ocorrem sob a pele de uma pessoa). Empregando a definição funcional de eventos privados, Okouchi (2006) exa- minou uma das interpretações de Skinner (1945) de como respostas verbais sob con- trole de um estímulo privado são estabe- lecidas: o relato de um estímulo privado (e.g., dor) pode ser aprendido por meio de reforços providos por outras pessoas que inferem o estímulo privado das respostas públicas colaterais (e.g., a mão no queixo, expressões faciais, gemidos) ao estímulo. Oito dos 16 participantes, descritos como instrutores, aprendiam primeiro discrimi- nações condicionais BC com os estímulos B como os modelos e os estímulos C como comparações. Em seguida, outros oito par- ticipantes, descritos como aprendizes, fo- ram expostos a um procedimento de pare- amento ao modelo modificado em que as respostas dos aprendizes foram reforçadas ou punidas não pelas respostas do experi- mentador, mas pelas respostas dos instru- tores. As discriminações condicionais AC deveriam ser estabelecidas para os aprendi- zes, em que os estímulos modelos As foram Capítulo X | Eventos Privados 167 apresentados simultaneamente com os es- tímulos B para que os instrutores pudessem ver os Bs, mas não os As. De acordo com a definição funcional de eventos privados, os estímulos A eram privados para os instru- tores. Assim, os estímulos modelo As e os estímulos modelo correlacionados Bs cor- respondiam, respectivamente, a estímulos privados e suas respostas públicas colate- rais na interpretação de Skinner. Okouchi examinou se os relatos dos aprendizes (Cs) de seus próprios estímulos (As) seriam es- tabelecidos pelo reforço diferencial provido por outras pessoas (os instrutores) que po- deriam ter acesso apenas aos estímulos co- laterais (BS) e aos relatos (CS). No experimento de Okouchi (2006), dois de oito pares de participantes apre- sentaram o desempenho previsto, no qual aprenderam as discriminações condicio- nais AC dos instrutores que não tinham acesso aos estímulos A. Posteriormente, Sonoda e Okouchi (2012) replicaram os re- sultados de Okouchi utilizando um proce- dimento modificado. Eles utilizaram es- tímulos abstratos e um computador, por exemplo, enquanto Okouchi havia usado estímulos geométricos, sílabas sem sentido, e estímulos coloridos e havia controlado a apresentação no experimento manualmen- te. Sonoda e Okouchi obtiveram os desem- penhos esperados de todos os 26 pares de alunos de graduação. CONSIDERAÇÕES FINAIS Talvez, simular o comportamento de relatar eventos privados por animais não- -humanos tenha sido uma das realizações mais significativas de Lubinski e Thomp- son (1987). Epstein (1981, 1984) insistiu que as simulações animais, ou modelos experi- mentais, sintetizando o chamado compor- tamento humano “complexo” em animais, poderiam dar insights sobre que tipos de variáveis constituem alguns desses com- portamentos “complexos” em seres huma- nos. Epstein (1984) listou quatro classes de comportamentos que tinham resistido a essas análises e, portanto, tinham sido considerados como “complexos”: (a) com- portamentos encobertos (“pensamentos”, “sentimentos” e “imaginações”);(b) com- portamentos tipicamente humanos (lingua- gem, comportamentos que são descritos sob a rubrica do “self”, e o comportamento de resolução de problemas); (c) os compor- tamentos controlados por estímulos tempo- ralmente remotos (“memória”); e (d) novos comportamentos (“criatividade” e “pensa- mento produtivo”). Exceto pela classe de comportamentos encobertos, alguns com- portamentos de cada uma dessas classes foram simulados e estudados experimen- talmente (e.g., Epstein, 1981; Epstein, Lanza, & Skinner, 1980; Epstein & Skinner, 1981). O trabalho de Lubinski e Thompson pode ser considerado um sucesso de uma simulação animal de comportamentos encobertos ou eventos privados ( “sentimentos”). Hiroto Okouchi 168 Como o título do artigo de Lubinski e Thompson (1987) sugere, duas práticas que ilustram um modelo de como exami- nar eventos privados também podem ser realizações significativas deste trabalho. Em primeiro lugar, eles mostraram que os processos de discriminação de drogas po- dem ser utilizados em experimentos sobre eventos privados. Uma das dificuldades na experimentação sobre eventos privados é a manipulação dos mesmos. Apresenta- ção e não apresentação de um “sentimen- to”, por exemplo, não é fácil, ao passo que apresentações de uma luz colorida têm sido comumente implementadas em expe- rimentos comportamentais. O uso de dro- gas psicoativas seria um dos poucos méto- dos para manipular sentimentos de forma relativamente confiável (mas ver Branch, 1991, para uma discussão sobre as dificul- dades em usar drogas como estímulos dis- criminativos). Em segundo lugar, Lubinski e Thompson conduziram um experimen- to sobre eventos privados no contexto das interações entre indivíduos. Esta prática é útil porque, de acordo com a definição fun- cional de eventos privados (Skinner, 1953, p.257), se um evento é privado ou não, de- pende se ele é acessível a outras pessoas ou não. PARA SABER MAIS DeGrandpre, Bickel, & Higgins (1992). Esse artigo relata um experimento em que even- tos privados humanos foram manipulados por meio de drogas psicoativas. Kohlenberg, & Tsai (1991). Este livro des- creve como eventos privados, como emo- ções, memória, cognições e crenças são conceituados e manejados em uma psicote- rapia analítico comportamental. Okouchi (2006). Este artigo mostra como eventos fora da pele do participante e não acessíveis a outros participantes, mas a um experimentador podem contribuir para a análise experimental dos eventos privados, e relata um experimento que investigou uma das interpretações de Skinner (1945) da maneira em que os humanos aprendem a relatar eventos privados. Rachlin (2003). Esse capítulo de livro des- creve como o behaviorismo teleológico compreende os eventos privados. O beha- viorismo teleológico exclui eventos inter- nos (eventos sob a pele do organismo) de uma análise do comportamento e busca por variáveis controladoras do comportamento de forma ampla no ambiente temporalmen- te estendido do organismo. Skinner (1945). Esse é um clássico sobre eventos privados. Você PRECISA ler se você estuda eventos privados a partir de uma perspectiva comportamental. Sonoda, & Okouchi (2012). Esse artigo rela- ta experimentos que replicam os resultados de Okouchi (2006), utilizando um procedi- mento modificado. No Experimento 2, os Capítulo X | Eventos Privados 169 aprendizes aprenderam a tatear “eventos privados” por reforçamento não com 100% mas com 83,3% de precisão, ilustrando um análogo de laboratório da vida diária, em que se entende que os humanos aprendem a tatear eventos privados sob um esquema de reforçamento com fraca acurácia (Skin- ner,1945). REFERÊNCIAS Branch, M. N. (1991). Behavioral pharma- cology. In I. H. Iversen & K. A. Lattal (Eds.), Experimental analysis of behavior (Part 2, pp.21-77). Amsterdam: Elsevier. Catania, A. C. (1992). Learning (3rd ed.). Englewood Cliffs, NJ: Prentice-Hall. DeGrandpre, R. J., Bickel, W. K., & Higgins, S. T. (1992). Emergent equivalence rela- tions between interoceptive (drug) and ex- teroceptive (visual) stimuli. Journal of the Experimental Analysis of Behavior, 58, 9-18. Epstein, R. (1981). On pigeons and people: A preliminary look at the columban simula- tion project. The Behavior Analyst, 4, 43-55. Epstein, R. (1984). Simulation research in the analysis of behavior. Behaviorism, 12, 41-59. Epstein, R., Lanza, R. P., & Skinner, B. F. (1980). Symbolic communication between two pigeons (Columba livia domestica). Sci- ence, 207, 543-545. Epstein, R., & Skinner, B. F. (1981). The spontaneous use of memoranda by pigeons. Behavior Analysis Letters, 1, 241-246. Ferster, C. B., & Skinner, B. F. (1957). Sched- ules of reinforcement. New York: Apple- ton-Century-Crofts. Honig, W. K. (Ed.). (1966). Operant behav- ior: Areas of research and application. New York: Appleton-Century-Crofts. Honig, W. K., & Staddon, J. E. R. (Eds.). (1977). Handbook of operant behavior. En- glewood Cliffs, Prentice-Hall. Iversen, I. H., & Lattal, K. L. (Eds.). (1991). Experimental analysis of behavior (Part 1). Amsterdam: Elsevier. Kohlenberg, R. J., & Tsai, M. (1991). Func- tional analytic psychotherapy: Creating intense and curative therapeutic relation- ships. New York: Plenum Press. Leigland, S. (2014). Contingency horizon: On private events and the analysis of be- havior. The Behavior Analyst, 37, 13-24. Lubinski, D., & Thompson, T. (1987). An animal model of the interpersonal commu- nication of interoceptive (private) states. Journal of the Experimental Analysis of Be- havior, 48, 1-15. Hiroto Okouchi 170 Lubinski, D., & Thompson, T. (1993). Spe- cies and individual differences in commu- nication based on private states. Behavior- al and Brain Sciences, 16, 627-680. MacCorquodale, K. (1969). B. F. Skinner’s verbal behavior: A retrospective apprecia- tion. Journal of the Experimental Analysis of Behavior, 12, 831-841. Madden, G. J. (Ed.). (2013). APA handbook of behavior analysis (Vol.1). Washington, DC: American Psychological Association. Okouchi, H. (2006). An experimental anal- ysis of another privacy. The Psychological Record, 56, 245-257. Rachlin, H. (2003). Privacy. In K. A. Lattal, & P. N. Chase (Eds.), Behavior theory and philosophy (pp.187-201). New York: Kluwer Academic/Plenum Publishers. Savage-Rumbaugh, E. S. (1984). Verbal be- havior at a procedural level in the chimpan- zee. Journal of the Experimental Analysis of Behavior, 41, 223-250. Schlinger, H. D. (2011). Introduction: Pri- vate events in a natural science of behavior. The Behavior Analyst, 34, 181-184. Sidman, M., & Tailby, W. (1982). Condition- al discrimination vs. matching to sample: An expansion of the testing paradigm. Jour- nal of the Experimental Analysis of Behav- ior, 37, 5-22. Skinner, B. F. (1945). The operational anal- ysis of psychological terms. Psychological Review, 52, 270-277. Skinner, B. F. (1953). Science and human behavior. New York: Macmillan. Skinner, B. F. (1957). Verbal behavior. New York: Appleton-Century-Crofts. Sonoda, A., & Okouchi, H. (2012). A revised procedure for analyzing private events. The Psychological Record, 62, 645-661. The Oxford English Dictionary (2nd. ed.). (2004). Oxford: Clarendon Press. Tourinho, E. Z. (2006). Private stimuli, co- vert responses, and private events: Con- ceptual remarks. The Behavior Analyst, 29, 13-31. Andréia Schmidt 171 “Esse não é um pitilics, então só pode ser aquele”: o responder por exclusão e a aprendizagem de repertórios verbais Andréia Schmidt Universidade de São Paulo Dixon, L. S. (1977). The nature of control by spoken words over visual stimulus selection. Journal of the Experimental Analysis of Behavior, 27, 433-442. “- Mamãe, por que é que eu me chamo Marcelo? (...) Por que é que não escolheram marmelo? - Porque marmelo é nome de fruta, menino! - E a fruta