Logo Passei Direto
Buscar
Material
páginas com resultados encontrados.
páginas com resultados encontrados.

Prévia do material em texto

EXPERIMENTOS CLÁSSICOS 
EM ANÁLISE DO COMPORTAMENTO
ORGANIZADORES
Paulo Guerra Soares 
João Henrique de Almeida 
Carlos Renato Xavier Cançado
www.walden4.com.br
2016
Instituto Walden4
E71
Experimentos clássicos em análise do comportamento [recurso eletrônico] 
/ organizado por Paulo Guerra Soares, João Henrique de Almeida, Carlos 
Renato Xavier Cançado. - Brasília : Instituto Walden4, 2016.
333 p.
ISBN: 978-85-65721-10-3
1. Psicologia experimental. 2. Análise do comportamento. I. Soares, Paulo 
Guerra, org. II. de Almeida, João Henrique, org. III. Cançado, Carlos Renato 
Xavier, org. IV. Título.
CDD 150.724
Coordenadora: Seila Cibele Sitta Preto
Projeto Gráfico: Leandro Brasil Melo
Diagramação: Lorena Shimizu
Capa: Lorena Shimizu 
DEDICATÓRIA
Dedicamos esse livro à Profa. Sônia dos Santos Castanheira, 
ao Prof. Roosevelt Riston Starling, e ao Prof. Ernani Henrique Fazzi, 
responsáveis por nosso primeiro contato com a Análise Experimental 
do Comportamento.
iii
AUTORES E AUTORAS
Alina Barboza Cabral Bianco 
Estudante de Graduação 
(Psicologia) – Universidade de 
Rio Verde.
André Augusto Borges Varella 
Doutor em Psicologia – 
Universidade Federal de São 
Carlos.
Andréia Schmidt 
Doutora em Psicologia 
Experimental – Universidade de 
São Paulo.
Armando Domingos Batista 
Machado 
Doutor em Psicologia – Duke 
University, Estados Unidos.
Candido Vinícius Bocaiuva 
Barnsley Pessôa 
Doutor em Psicologia 
Experimental – Universidade de 
São Paulo.
Carlos Augusto de Medeiros 
Doutor em Psicologia – 
Universidade de Brasília.
Carlos Eduardo Costa 
Doutor em Psicologia 
Experimental – Universidade de 
São Paulo.
Carlos Renato Xavier Cançado 
Doutor em Psicologia/Análise 
do Comportamento – West 
Virginia University, Estados 
Unidos.
Carolina Coury Silveira 
Mestre em Psicologia – 
Universidade Federal de São 
Carlos.
Cristiano Coelho 
Doutor em Psicologia – 
Universidade de Brasília.
Cristiano Valério dos Santos 
Doutor em Psicologia 
Experimental – Universidade de 
São Paulo.
Edson Massayuki Huziwara 
Doutor em Psicologia 
Experimental – Universidade de 
São Paulo.
iv
Elenice Seixas Hanna 
Doutora em Psicologia – 
University of Wales, Reino 
Unido.
Fábio Henrique Baia 
Doutor em Ciências do 
Comportamento –Universidade 
de Brasília.
Flávia Hauck 
Mestre em Ciências do 
Comportamento –Universidade 
de Brasília.
Hernando Borges Neves Filho 
Doutor em Psicologia 
Experimental – Universidade de 
São Paulo.
Hiroto Okouchi 
Doutor em Ciências do 
Comportamento – Hiroshima 
University, Japão.
Isabella Guimarães Lemes 
Estudante de Graduação 
(Psicologia) – Universidade de 
Rio Verde.
Ítalo Siqueira de Castro 
Teixeira 
Graduação em Psicologia – 
Universidade de Fortaleza.
João Claudio Todorov 
Doutor em Psicologia – Arizona 
State University, Estados 
Unidos.
João Henrique de Almeida 
Doutor em Psicologia – 
Universidade Federal de São 
Carlos.
Kennon A. Lattal 
Doutor em Psicologia 
Experimental e Clínica – 
University of Alabama, Estados 
Unidos.
Lucas Ferraz Córdova 
Doutor em Ciências do 
Comportamento –Universidade 
de Brasília.
Marcelo Borges Henriques 
Mestre em Psicologia – 
Pontifícia Universidade Católica 
de Goiás.
v
Márcio Borges Moreira 
Doutor em Ciências do 
Comportamento –Universidade 
de Brasília.
Marco Vasconcellos 
Doutor em Psicologia – Purdue 
University , Estados Unidos.
Maria Carolina Correa 
Martone 
Mestre em Psicologia 
Experimental – Pontifícia 
Universidade Católica de São 
Paulo
Marília Pinheiro de Carvalho 
Doutora em Psicologia Básica 
– Universidade do Minho, 
Portugal. 
Paulo Guerra Soares 
Mestre em Análise do 
Comportamento – Universidade 
Estadual de Londrina.
Peter Endemann 
Doutor em Psicologia 
Experimental – Universidade de 
São Paulo.
Poliana Ferreira da Silva 
Estudante de Graduação 
(Psicologia) – Universidade de 
Rio Verde.
Rafaela Meireles Fontes 
Azevedo 
Mestre em Ciências do 
Comportamento – Universidade 
de Brasília.
William Ferreira Perez 
Doutor em Psicologia 
Experimental – Universidade de 
São Paulo.
vi
AGRADECIMENTOS
 “É preciso de uma aldeia inteira para criar uma criança”1. É ver-
dade: muito trabalho, de muitas pessoas. Em relação à escrita de um ar-
tigo científico, Killeen e Pellón (2013) indicaram que também “É preciso 
de uma aldeia inteira para criar um artigo”2 (p.19): muito trabalho, cer-
tamente de muitas pessoas. O mesmo pode ser dito sobre a organização 
de um livro. Gostaríamos de agradecer a todas e a todos dessa “aldeia”, 
cujo trabalho permitiu que esse livro fosse criado. 
 Agradecemos à cada autora e a cada autor dos capítulos que 
compõem esse livro. Vocês abraçaram o projeto e contribuíram de uma 
forma que o nosso breve agradecimento não consegue descrever e nun-
ca será suficiente. Para vocês, especialmente, o nosso “Muito obrigado”.
 Agradecemos ao Prof. Alexandre Dittrich pela escolha da capa 
desse livro e pela escrita do texto que a acompanha. Cientistas são “ar-
tistas do mundo natural” e a experimentação é um caminho central 
de sua atividade. Agradecemos à Profa. Deisy das Graças de Souza por 
escrever o prefácio e apresentar o livro de forma tão clara à audiência 
para qual foi escrito. O conselho que ela dá para futuras e futuros ana-
listas do comportamento é válido para todas e todos interessados no 
estudo científico do comportamento, mesmo para quem tem familiari-
dade e trabalha há anos com a experimentação.
 Agradecemos à equipe do Projeto de extensão UneDesign - In-
tegração Universidade-Empresa do curso de Desenho Industrial com 
habilitação em Programação Visual, da Universidade do Norte do Para-
ná, coordenada pela Profa. Seila Cibele Sitta Preto, pelo trabalho cuida-
1 It takes a village to raise a child.
2 “It takes a village to raise a paper”. Killeen, P. R., & Pellón, R. (2013). Adjuntive behaviors are operants. Learning & 
Behavior, 41, 1-24.
vii
doso em cada etapa da preparação desse livro. Aos discentes Leandro 
Brasil Melo pelo desenvolvimento do projeto gráfico, e Lorena Shimizu 
pela diagramação e desenvolvimento projetual de capa. O trabalho foi 
feito como parte de um projeto de extensão, e retrata a importância da 
integração das atividades de ensino e pesquisa na relação entre a uni-
versidade e as comunidades nas quais está inserida. 
 Por fim, agradecemos ao Prof. Márcio Borges Moreira, que acre-
ditou no projeto e aceitou a tarefa de publicação de um livro gratuito e 
em formato eletrônico pela Editora do Instituto Walden4. 
 É verdade: é preciso de uma aldeia para criar um livro!
Paulo Guerra Soares 
João Henrique de Almeida3 
Carlos Renato Xavier Cançado4
3 Apoio da FAPESP (Processo no: 2014/01874-7). 
4 Apoio CAPES (PNPD).
viii
PREFÁCIO
... even though laboratory methods are often devised not for practical 
teaching but for the study of fundamental behavioral processes, the 
techniques are then available for application outside the laboratory.
Murray Sidman, 1994, P.534
Tomar conhecimento da edição deste livro me deixou particular-
mente entusiasmada. É sempre bom contar com material de qualidade 
como suporte para o ensino e, neste caso, vislumbrei a possibilidade de 
ter em mãos um material muito compatível com a maneira como gosto 
de trabalhar nas disciplinas que ministro para o curso de graduação em 
Psicologia. 
Segundo me relataram os organizadores, sua proposta era trazer 
ao leitor experimentos clássicos em análise do comportamento, rela-
tados e interpretados por pesquisadores da área, com ênfase em suas 
contribuições para novas linhas de pesquisa. Gostei imediatamente da 
proposta e me lembrei de outras ocasiões em que tive oportunidade 
de explorar artigos de pesquisa como fontes para atividades de ensi-
no, buscando propiciar ao aluno condições para o desenvolvimento de 
uma ampla gama de habilidades, incluindo a busca pelas origens de 
ideias, conceitos, procedimentos. No período em que estive na UnB, 
no início da década de 90, tive oportunidade de trabalharcom meu 
colega Jorge Mendes de Oliveira Castro, na disciplina Psicologia Geral 
e Experimental (PGE I), para alunos do primeiro semestre do curso de 
graduação em Psicologia. Discutimos muito as condições de entrada 
dos alunos no curso, incluindo as possíveis ideias preconcebidas sobre 
nossa disciplina, e a necessidade de colocá-los logo em contato com o 
que se estuda em Psicologia e, ao mesmo tempo, mantê-los motivados 
para ler e estudar o assunto. Concordamos muito rapidamente que, em 
ix
vez de ler livros texto, os alunos poderiam aprender muito lendo arti-
gos científicos, mais precisamente, relatos de pesquisa experimental, 
o que lhes permitiria ter contato com autores importantes da área e 
conhecer um pouco do desenvolvimento de nossa ciência. Tenho as 
melhores lembranças das horas e horas que passamos escolhendo os 
textos (claro que fizemos um levantamento 10 vezes maior do que seria 
possível abordar em uma disciplina de um semestre) e do entusiasmo 
com que trabalhamos naquela disciplina, em grande parte motivado 
pelos progressos dos alunos, evidenciados nas discussões em sala, em 
suas habilidades de ler e pensar, de utilizar o raciocínio científico, e de 
se dar conta de que cada experimento pode trazer uma nova contri-
buição, mas também pode ter limitações, e que identificar os limites é 
um caminho para novas ideias e novas possibilidades de investigação. 
Sentíamos que estávamos criando boas condições para o desenvolvi-
mento de pelo menos alguns dos requisitos importantes no repertório 
de futuros psicólogos e, talvez, pesquisadores em psicologia.
Retornando à UFSCar, tive oportunidade de fazer parte da equi-
pe que planejou o curso de graduação em Psicologia, implantado em 
1994. Novamente me coube uma disciplina introdutória e quando co-
mentei sobre a experiência na disciplina da UNB, meu colega Júlio de 
Rose me apresentou o livro de Roger Hock: “Quarenta estudos que 
transformaram a Psicologia”. O livro organizava o material em 10 ca-
pítulos, cada capítulo apresentando quatro estudos clássicos. A organi-
zação apresenta uma característica que resolvia muitos dos problemas 
que eu encontrara antes, ao exigir de alunos de primeiro semestre a 
leitura de um estudo experimental em toda a complexidade de seu re-
lato original: neste livro, cada estudo é apresentado de maneira resu-
mida – isto é, retira detalhes e complexidade do texto, sem deixar de 
apresentar ao leitor as informações essenciais para a compreensão do 
x
que foi feito e da justificativa para fazê-lo; além disso, o autor do livro 
apresenta o contexto em que cada investigação foi concebida e con-
duzida; e ao final do texto, apresenta, também, de maneira resumida, 
mas suficientemente informativa, as linhas de pesquisa e os desenvol-
vimentos subsequentes que derivaram daquele estudo seminal (isto é, 
oferece uma perspectiva histórica do desenvolvimento da psicologia, 
por meio do trabalho concreto de pesquisadores relevantes). Usei o 
livro por vários anos, enquanto ministrei a disciplina (fui depois subs-
tituída pelo Júlio, que continuou usando o “Hock”) e estou certa que 
o uso desse material, em suas sucessivas reedições, tem contribuído 
muito positivamente para iniciar o desenvolvimento das concepções 
do aluno sobre o que estuda a Psicologia – e sobre como essa ciência 
vem sendo, e poderá continuar sendo, construída.
Experiência similar teve ocasião quando Edson Huziwara, fa-
zendo pós-doutorado na UFSCar, se dispôs a oferecer uma turma da 
disciplina optativa do curso, denominada Fenômenos e Processos Psi-
cológicos; fui formalmente responsável pela disciplina e estive presen-
te em todas as aulas, mas todo o trabalho foi planejado e conduzido 
pelo Edson e pelo João Henrique de Almeida, um dos organizadores 
deste livro. Aquela disciplina do curso de Psicologia da UFSCar per-
mite, a cada oferta, a especificação dos tópicos abordados e Edson e 
João propuseram que naquele semestre a disciplina tivesse por obje-
tivo apresentar, de forma sucinta, a produção empírica (experimentos 
clássicos) sobre diversos processos comportamentais investigados pela 
análise experimental do comportamento e ensinar as habilidades ne-
cessárias para uma leitura competente de textos científicos. Os alunos 
eram de uma turma avançada e liam os artigos no original, os professo-
res realizaram um excelente trabalho de preparar cuidadosamente cada 
estudo para apresentar em sala, destacando seus aspectos fundamen-
xi
tais e apresentando pistas para que os alunos discutissem qualidades 
e limites da pesquisa em foco. Sou testemunha de que esta atividade 
funcionou como reforçador poderoso para a leitura prévia dos alunos, 
e, ao mesmo tempo, como modelo de leitura cuidadosa e crítica. 
Reconheço que ao relatar essas experiências estou falando de 
meu trabalho, em vez de falar sobre o livro que apresento aos leitores. 
Mas espero ter fornecido evidências do quanto aprecio o que encontrei 
nele: 
- O conteúdo é específico de análise do comportamento: trata-
-se, assim, de uma fonte organizada de informações que podem ser 
usadas no ensino de disciplinas da área.
- A seleção de artigos relevantes, que deram origem a importan-
tes desenvolvimentos na área, pode contribuir decisivamente para que 
o leitor compreenda a relevância da memória da investigação científi-
ca, a importância de se conhecer os clássicos e de se estabelecer rela-
ções entre o experimento original e a linha ou linhas de pesquisa gera-
das por ele e sua importância para o conhecimento atual em análise do 
comportamento.
- A ênfase em estudos experimentais permite destacar aspectos 
metodológicos, as possibilidades e a importância de investigação rigo-
rosa, os necessários limites (seja do ponto de vista do controle, seja do 
ponto de vista da validade interna e externa), as contribuições poten-
ciais para a compreensão de processos comportamentais, as pergun-
tas que deixaram de ser respondidas, ou que foram suscitadas pelos 
dados. Esse conjunto de aspectos representa uma rica oportunidade 
para subsidiar a avaliação crítica da pesquisa científica em análise do 
xii
comportamento, e, o que é de extrema relevância para a sobrevivên-
cia das práticas científicas (investigação e intervenção) em análise do 
comportamento, despertar talentos e vocações para dar continuidade 
ao desenvolvimento da área.
Por todos esses aspectos, avalio que este volume pode ser uma 
fonte inestimável para formação ou o aprimoramento de analistas do 
comportamento. 
Há algum tempo, em uma entrevista para a Associação Brasileira 
de Psicologia e Medicina Comportamental (ABPMC), a entrevistadora 
me perguntou que conselhos eu daria para a nova geração de analistas 
do comportamento. Embora desacredite no potencial de “conselhos” 
(sem outras condições críticas) para gerar ou manter comportamentos, 
arrisquei alguns palpites que talvez respondessem ao interesse de al-
guém. Penso que os palpites valem também para jovens analistas que 
busquem aprender com este livro, por isso tomo a liberdade de trans-
crever alguns pontos daquela fala: 
Não existe nada que você possa fazer bem feito, que não exija esfor-
ço, comprometimento, dedicação e um trabalho sistemático. Em nossa 
área, seja no estudo, na investigação, ou nas aplicações a problemas 
humanos, não dá para fazer um trabalho de qualquer jeito, não se 
pode fazê-lo rapidamente, nem superficialmente. Por isso, para quem 
quer se tornar um analista do comportamento competente, seja no 
desenvolvimento científico da área, seja no desenvolvimento profis-
sional, o primeiro passo é dedicação. É preciso ler (ou melhor, estudar) 
relatos originais de pesquisa; é preciso ler muito, voltar às origens, ler 
os clássicos e, claro, ler bibliografia atualizada. Muitas vezes presencio 
meus alunos lendo – ou escrevendo sobre o que leram, e eles tendem a 
xiii
assumir que o autor que estão lendo no momento foi o primeiro a falar 
daquele assunto, ou o que teve a ideia original de que trata a pesqui-sa. Muitas vezes, trata-se de conceitos elaborados há muito tempo, 
que são encontrados em Skinner (1931, 1938, 1953), Keller e Schoenfeld 
(1950), Ferster e Skinner (1957), Millenson (1967), Sidman (1960), mas 
eles citam o artigo mais recente que leram, como se fosse a fonte ori-
ginal. É preciso estar atualizado, acompanhar o desenvolvimento da 
área e para isto é preciso recorrer à literatura recente, mas também 
é preciso manter o registro, a memória ou a história dos conceitos e 
descobertas. Apesar de todas as exigências de referência de citação 
científica, muitas vezes vemos uma deturpação em relação às origens. 
Não é incomum encontrarmos, em 2016, um artigo citando um au-
tor que publicou em 2015, como se este fosse a referência original de 
um determinado assunto. É muito importante estudar os trabalhos 
dos pioneiros (e se interessar por quem foram eles, sob que condições 
trabalharam, onde e quando viveram), ler e conhecer o que a área já 
produziu, ao mesmo tempo em se lê referências atualizadas. É preciso 
tentar dominar o conhecimento produzido na área, que não é pouco; 
quanto mais se conhece – os conteúdos e os caminhos que levaram 
a eles, mais o analista do comportamento disporá de instrumental 
teórico, conceitual e de procedimentos, para analisar e interpretar 
situações novas e para pensar, gerar novos estudos, ou planejar in-
tervenções com embasamento cientifico. As facilidades de acesso são 
cada vez maiores, mas não podemos nos iludir com essa facilidade. 
É muito fácil acessar dezenas de artigos pela internet e poder abrir 
cada um deles com um simples toque. Mas não basta: faltam os passos 
seguintes: como é que se lê essa quantidade de material, de maneira 
funcional? Será preciso trabalhar muito, de forma disciplinada. Para 
quem quiser ter uma boa formação como analista do comportamento, 
existe muito conhecimento sedimentado para se aprender a trabalhar 
xiv
e existem boas oportunidades de novos desenvolvimentos, mas para 
isso é preciso estudar, se dedicar, se comprometer. 
Este livro pode ser um bom começo. Neste primeiro volume da 
série foram selecionados estudos experimentais sobre condicionamen-
to respondente; sobre o papel das consequências e parâmetros de re-
forço (atraso do reforço; contraste comportamental; comportamento de 
escolha, história comportamental, ressurgência); sobre controle de es-
tímulos (processos atencionais, respostas de observação, responder por 
exclusão, eventos privados, resolução de problemas, Teoria das Mol-
duras Relacionais); sobre comportamento social (cooperação, cultura) e 
comportamento verbal (correspondência verbal e não verbal; compor-
tamento governado por regras); e sobre análise funcional. Todos eles 
deram origem a linhas de pesquisa produtivas, responsáveis por gran-
de parte do estado atual da pesquisa em análise do comportamento. 
Os autores dos capítulos são investigadores nacionais e internacionais, 
que conhecem profundamente os estudos e seus autores e estão com-
prometidos com a difusão e o ensino de análise do comportamento. 
Por todos esses aspectos, estou certa de que o livro atende a uma 
necessidade importante em nossa área, e que se tornará um oportuno 
ponto de partida para iniciantes e uma excelente ocasião para revisão e 
atualização para os iniciados em análise do comportamento. 
Deisy G. de Souza 
Universidade Federal de São Carlos 
xv
A ciência e a arte são as mais belas criações do comportamento 
humano. Elas demonstram, cada uma à sua maneira, nossa fascinante 
capacidade de transformar o mundo e de nos transformarmos ao fazê-
lo. 
O gentil convite feito por Carlos, João e Paulo para que eu esco-
lhesse a imagem da capa do livro que você agora lê me confrontou com 
um desafio singular: ilustrar, com o auxílio da arte, o conteúdo de um 
livro científico. 
Minha tarefa certamente foi facilitada pelo fato de que a arte não 
nos compromete com interpretações “certas”. A arte é o campo da su-
gestão, da metáfora, do símbolo. Assim, me lancei à tarefa sob um vago 
controle temático, mas também me deixando levar pela beleza e pelo 
poder evocativo das imagens.
A Osteographia, publicada pelo anatomista inglês William Che-
selden em 1733, é uma das obras mais importantes da história da ilus-
tração anatômica. Ela impressiona não apenas pela precisão, mas pela 
elegância. As criaturas humanas e não-humanas que ali aparecem não 
são meros auxílios da ciência, passivamente à disposição dos estudio-
sos: em tudo o que importa, elas parecem vivas, ativas, interagindo 
com seu entorno. 
O fato de serem apenas esqueletos dá às imagens seu impacto. 
Seres vivos reduzidos à sua dura estrutura têm fascinado a humanida-
de ao longo dos séculos. Caveiras e esqueletos nos lembram de nosso 
destino comum. A representação da morte como um esqueleto vivo é 
comum a várias culturas. 
SOBRE A CAPA
xvi
O que nos mostra que estão mortos é o fato de serem apenas 
esqueletos. O que nos mostra que estão vivos é o fato de interagirem 
com o mundo. Os esqueletos que nos assombram e nos encantam na 
tradição são a encarnação desencarnada da contradição: são mortos 
que vivem. Se neles pouco resta do que esperaríamos encontrar em 
um corpo vivo, o comportamento é seu único sinal de vida - e, como 
lembrava Skinner, a história do comportamento e a história da vida 
começam juntas. 
O esqueleto que está na capa deste livro nos lembra ainda que 
a vida é evolução - e que nós, seres vivos, estamos todos ligados por 
laços de parentesco. Trata-se de uma figura simiesca, que não obstante 
adota uma postura aparentemente “intencional” e verbal, tipicamente 
humana. É como se interagisse com outros de sua espécie, cuja pre-
sença a imagem permite apenas subentender. Filogênese, ontogênese e 
cultura estão todas na imagem - desde que nossa história nos permita 
encontrá-las. 
Assim como a Osteographia de Cheselden, que utilizou magis-
tralmente a arte para fazer ciência, espero que também este livro pos-
sa mostrar, da capa à última página, quão fascinante é a jornada de 
conhecimento e autoconhecimento proporcionada pela investigação 
científica. 
 
 
Alexandre Dittrich 
Universidade Federal do Paraná
xvii
Este livro foi idealizado a partir de uma paixão comum dos três 
organizadores: a Análise Experimental do Comportamento. A ideia ge-
ral consiste em apresentar, a estudantes de graduação, diversos temas 
de pesquisa em Análise do Comportamento por meio de experimentos 
clássicos. A análise experimental geralmente é considerada um terreno 
árido, com descrições metodológicas difíceis e um certo “desprendi-
mento” das questões do dia a dia. Estes fatores, em nossa opinião, difi-
cultam o contato e até mesmo o interesse de estudantes iniciantes pelo 
laboratório e pela pesquisa experimental sobre o comportamento. 
Buscando inspiração em livros de divulgação científica, como 
“Forty studies that changed Psychology” de Roger Hock, formatamos a 
ideia inicial do livro. Estas ideias nos levaram a uma série de convites 
a pesquisadores e pesquisadoras de diversas instituições brasileiras e 
internacionais para contribuírem com a obra. Convites aceitos, o livro 
começou a ganhar forma. Mais ideias foram surgindo, e foram tantos 
os temas escolhidos que acabamos tendo que dividir a obra em dois 
volumes. Depois de incontáveis reuniões que aproximaram Londrina, 
São Carlos e Brasília, conseguimos concretizar nosso objetivo.
Em cada capítulo, autores e autoras discutem temas relevantes 
na Análise do Comportamento a partir da descrição de um experimento 
“clássico”. Clássico, aqui, não significa necessariamente o estudo mais 
antigo, mas aquele que é reconhecidamente uma influência importante 
naquela área de pesquisa, ou seja, que tenha servido de contexto para 
a produção de mais conhecimento científico. Assim, em cada capítulo, 
o experimento clássico serve como um pano de fundo para a apresen-
tação do tema, e os textos foram escritos com uma linguagem leve e 
acessível, buscando,sempre que possível, uma ponte entre os procedi-
mentos metodológicos e o contexto aplicado.
APRESENTAÇÃO
xviii
Esperamos que esta obra inspire estudantes (e futuros pesquisa-
dores e pesquisadoras!) a se enveredarem pelos caminhos fascinantes 
da pesquisa experimental sobre o comportamento dos organismos. E 
que essa jornada seja para estes estudantes um pouco do que foi (e con-
tinua sendo) para nós: um caminho de muito trabalho e de muitos erros 
e acertos, mas, acima de tudo, um caminho muito gratificante e enri-
quecedor. Esperamos, também, que este material sirva como um apoio 
aos professores e professoras das disciplinas de Análise Experimental 
do Comportamento, como contexto para discussões sobre os temas de 
pesquisa que compõe os currículos destas disciplinas.
Boa leitura!
Paulo Guerra Soares 
João Henrique de Almeida 
Carlos Renato Xavier Cançado
xix
SUMÁRIO
Capítulo I.............................................................................................24
Somos todos produtos da nossa história comportamental 
Paulo Guerra Soares, Carlos Eduardo Costa
Capítulo II...........................................................................................36
O cheque está no correio: investigando como o reforço atrasado afeta 
o desempenho
Kennon A. Lattal
Capítulo III.........................................................................................49
Quando o passado retorna: ressurgência comportamental
Carlos Renato Xavier Cançado, Flávia Hauck, Ítalo S. C. Teixeira
Capítulo IV..........................................................................................64
Clarice Lispector, tempo e consequências: considerações sobre con-
traste comportamental
João Cláudio Todorov, Rafaela M. Fontes Azevedo
Capítulo V...........................................................................................78
Da frequência absoluta à frequência relativa como unidade de análise 
do comportamento
Cristiano Coelho
Capítulo VI.........................................................................................95
Prestaram atenção em tudo?
Elenice S. Hanna, Márcio Borges Moreira
xx
Capítulo VII.....................................................................................109
A resposta de observação: o papel das respostas sensoriais para o es-
tabelecimento da discriminação
Peter Endemann, Candido V. B. B. Pessôa
Capítulo VIII.....................................................................................123
Controle dos processos atencionais
Edson Massayuki Huziwara, Candido V. B. B. Pessôa
Capítulo IX.......................................................................................139
O responder controlado temporalmente: desdobramentos da pesquisa 
com a tarefa de bissecção
Marilia Pinheiro de Carvalho, Marco Vasconcelos, Armando Machado
Capítulo X.........................................................................................158
Como você se sente?
Hiroto Okouchi
Capítulo XI........................................................................................171
“Esse não é um pitilics, então só pode ser aquele”: o responder por 
exclusão e a aprendizagem de repertórios verbais
Adreia Schimidt
Capítulo XII......................................................................................186
Paus e pedras podem machucar, mas palavras... também! - Teoria das 
molduras relacionais
João Henrique de Almeida e William Ferreira Perez
xxi
Capítulo XIII....................................................................................205
Quando o mundo interage com o que é dito sobre o mundo: o compor-
tamento governado por regras
Carlos Eduardo Costa, Carlos Renato Xavier Cançado
Capítulo XIV.....................................................................................222
A função do mentir em crianças: o controle operante na correspon-
dência verbal
Carlos Augusto de Medeiros, Lucas Ferraz Córdova
Capítulo XV......................................................................................239
Do indivíduo ao grupo: simulações experimentais de relações sociais 
com animais não-humanos
Marcelo Borges Henriques
Capítulo XVI..................................................................................254
Metacontingências: investigação experimental da seleção cultural
Fábio Henrique Baia, Alina Barboza Cabral Bianco, Isabella Guimarães 
Lemes, Poliana Ferreira da Silva
Capítulo XVII..................................................................................272
“Para com isso menino!”: análise funcional em problemas de compor-
tamento
André A. B. Varella, Maria Carolina Correa Martone, Carolina Coury 
Silveira
Capítulo XVII..................................................................................284
Recombinação de repertórios: criatividade e a integração de aprendi-
zagens isoladas
Hernando Borges Neves Filho
xxii
Capítulo XIX....................................................................................297
Controlar para conhecer
Cristiano Valério dos Santos
Capítulo XX......................................................................................310
The check is in the mail: examining how delayed reinforcement af-
fects performance
Kennon A. Lattal
Capítulo XXI....................................................................................322
How do you feel?
Hiroto Okouchi
xxiii
Paulo Guerra Soares, Carlos Eduardo Costa
24
Somos todos produtos 
da nossa história 
comportamental
Paulo Guerra Soares 
Universidade Norte do Paraná; Núcleo Evoluir
Carlos Eduardo Costa 
Universidade Estadual de Londrina
Weiner, H. (1964). Conditioning history and human fixed-interval performance. Journal of the 
Experimental Analysis of Behavior, 7(5), 383-385.
“O hoje é apenas um furo no futuro, por onde o passado começa a jorrar” 
Raul Seixas e Marcelo Nova
Capítulo I | História Comportamental
25
INTRODUÇÃO À ÁREA DE PES-
QUISA E CONTEXTUALIZAÇÃO 
DO EXPERIMENTO
Uma das principais afirmações da te-
oria da evolução por seleção natural é que 
as gerações atuais de indivíduos de uma 
determinada espécie são produto de um 
constante processo de variação e seleção. 
Assim, ao longo da história de evolução 
de uma espécie, indivíduos com caracte-
rísticas menos adaptativas morreram, en-
quanto aqueles mais bem adaptados sobre-
viveram, passando seus genes às próximas 
gerações. É importante lembrar que mais ou 
menos adaptativa significa que, sob certos 
aspectos do ambiente, certas características 
favorecem mais certos indivíduos de uma 
espécie do que outras. Não há característi-
cas intrinsecamente melhores do que ou-
tras. Aquelas cuja consequência seja maior 
chance de sobrevivência e procriação irão 
aumentar de frequência na espécie. Portan-
to, para explicar por que os indivíduos de 
uma espécie exibem alguma forma de com-
portamento típico (como espirros, bocejos, 
náuseas ou salivação, no caso do ser huma-
no), é imprescindível uma análise da histó-
ria de seleção dessa espécie.
Este modelo de variação e seleção 
dos aspectos biológicos, proposto por Char-
les Darwin no seu livro Origem das Espécies 
(1859), é reconhecidamente uma das inspi-
rações de B. F. Skinner na formulação do 
Behaviorismo Radical (Baum, 2006; Lau-
renti, 2009; Skinner, 1974; 1981). Para Skin-
ner, o Behaviorismo Radical enfatiza o es-
tudo do comportamento de cada indivíduo 
(e não apenas os padrões típicos de cada 
espécie). Assim, fazendo jus à analogia com 
a teoria da evolução de Darwin, o compor-
tamento atual dos indivíduos é produto de 
um conjunto de relações entre o compor-
tamento do indivíduo (selecionado na his-
tória individual) e o ambiente atual. Nesse 
sentido, Skinner afirma que “Coube a Da-
rwin descobrir a ação seletiva do ambien-
te, assim como cabe a nós [behavioristas] 
completar o desenvolvimento da ciência do 
comportamento com uma análise da ação 
seletiva do meio”. (Skinner, 1974, p.60-61).
Como funciona essa relação entre a 
ação do indivíduo e as variáveisambien-
tais? Skinner propõe que em determinadas 
circunstâncias, nos comportamos no mun-
do de diversas maneiras (variação) e uma 
ou algumas dessas maneiras de nos com-
portar produzem alterações no ambiente. 
Estas alterações podem produzir mudanças 
na probabilidade futura do comportamento 
(seleção). Se as consequências do compor-
tamento forem reforçadoras, produzirão 
um aumento na probabilidade desse com-
portamento ocorrer sob circunstâncias se-
melhantes no futuro. Se as consequências 
forem punidoras, produzirão uma diminui-
ção na probabilidade da ocorrência do com-
portamento. Neste último caso, o indivíduo 
pode se comportar em função da situação 
que indica que uma consequência nociva é 
provável e, assim, aprende também a evitar 
estas situações. Assim, cada indivíduo, ao 
Paulo Guerra Soares, Carlos Eduardo Costa
26
entrar em contato com experiências únicas 
ao longo da vida, vai aprendendo determi-
nadas maneiras de agir a partir das conse-
quências que esse comportamento produz.
A noção de seleção do comporta-
mento por consequências sugere que, para 
que possamos explicar os comportamentos 
dos indivíduos, é imprescindível uma aná-
lise da história comportamental de cada 
um (Aló, 2005; Chiesa, 1994; Costa, Cirino, 
Cançado & Soares, 2009; Freeman & Lattal, 
1992; Skinner, 1974; Soares, Costa, Cança-
do & Cirino, 2013). Skinner já apontava que 
“uma análise do comportamento é (...) ne-
cessariamente ‘histórica’” (1974, p. 236), pois 
os comportamentos atuais são produto de 
uma história de seleção que ocorre ao longo 
da vida de cada indivíduo.
Neste sentido, é relativamente se-
guro afirmar que pessoas que passaram 
por experiências diferentes ao longo da 
vida, quando expostas a situações pareci-
das no presente, se comportam de manei-
ras distintas. Contudo, o que se observa é 
que a grande maioria das explicações do 
senso comum negligencia a história com-
portamental na determinação do compor-
tamento atual (Aló, 2005; Chiesa, 1994). 
Valendo-se de uma terminologia dualista/
mentalista, o senso comum explica o com-
portamento dos indivíduos recorrendo a 
conceitos como “personalidade” ou “cará-
ter”. A pesquisa de Simonassi, Pires, Ber-
gholz e Santos (1984), por exemplo, identi-
ficou que observadores que desconheciam 
a história comportamental de crianças ten-
diam a explicar seu comportamento atual 
a partir de um viés mentalista. Por outro 
lado, quando os observadores conheciam 
a história comportamental das crianças, 
tenderam a leva-la em consideração na ex-
plicação do comportamento atual em detri-
mento das causas mentais. Assim, Skinner 
(1953/2003) afirmou que o “hábito de bus-
car dentro do organismo uma explicação 
do comportamento tende a obscurecer as 
variáveis que estão ao alcance de uma aná-
lise científica. Estas variáveis estão fora do 
organismo, em seu ambiente imediato e em 
sua história ambiental” (p. 33).
A afirmação de Skinner (1953/2003) 
levanta a seguinte questão: Como podemos 
analisar cientificamente os efeitos da histó-
ria ambiental sobre o comportamento atu-
al? Sidman (1960) afirmou que, em um con-
texto experimental, a “melhor maneira de 
um experimentador especificar a história 
comportamental de um organismo, na me-
dida em que é importante para um deter-
minado problema, é construir deliberada-
mente essa história no organismo” (p. 290, 
itálico adicionado). Ou seja, o experimenta-
dor interessado no estudo da história com-
portamental deveria ser capaz de construir 
diferentes histórias para seus participantes 
no laboratório (Wanchisen, 1990).
Porém, até meados da década de 
1960 não havia, na literatura analítico-com-
portamental, um conjunto de dados siste-
máticos que permitisse a análise do efeito 
Capítulo I | História Comportamental
27
de diferentes contingências passadas sobre 
o comportamento atual. Nesse contexto, 
mais precisamente em 1964, foi publicado 
um dos primeiros estudos cujo objetivo era 
a análise do efeito de diferentes histórias 
comportamentais (construídas no laborató-
rio, como sugerido por Sidman, 1960) sobre 
o comportamento atual.
DESCRIÇÃO DO EXPERIMENTO
Objetivo e Método
A pesquisa de Weiner (1964) era sim-
ples, porém engenhosa. O objetivo do estudo 
foi avaliar o efeito da exposição a diferentes 
contingências históricas sobre o compor-
tamento atual. Como estratégia metodoló-
gica, foram arranjados esquemas de refor-
ço, programações de contingência muito 
utilizadas em pesquisas experimentais em 
Análise do Comportamento, que permitem 
a seleção de padrões estáveis de comporta-
mento (Ferster & Skinner, 1957; Lattal, 1991; 
Souza Júnior & Cirino, 2004). Os participan-
tes da pesquisa foram seis enfermeiros de 
um hospital psiquiátrico. Eles se sentavam 
em frente a um monitor e a tarefa experi-
mental consistia em pressionar um botão. 
As consequências para esse comporta-
mento eram pontos que apareciam em um 
contador de pontos no monitor. Em cada 
sessão, os participantes também recebiam 
uma quantia fixa de dinheiro, que não era 
contingente ao seu desempenho. Os parti-
cipantes foram distribuídos em dois grupos: 
durante a primeira fase da pesquisa (cons-
trução da história), os participantes do Gru-
po 1 (n=3) foram expostos a um esquema de 
razão fixa (FR) 40 e os do Grupo 2 (n=3) a 
um esquema de reforçamento diferencial 
de baixas taxas (DRL) 20 segundos, por 10 
sessões de 60 min. Para os participantes 
expostos ao FR, 100 pontos eram credita-
dos no contador a cada 40 pressões ao bo-
tão. Para os participantes expostos ao DRL, 
cada resposta emitida após a passagem de 
20 segundos da última resposta produzia 
100 pontos no contador. Respostas emiti-
das antes do fim do intervalo reiniciavam o 
intervalo do DRL.
Esquemas de FR, em geral, selecio-
nam altas taxas de respostas, pois há uma 
relação direta entre taxa de respostas e taxa 
de reforços sob esse esquema. Por outro 
lado, o esquema DRL geralmente selecio-
na baixas taxas de respostas, pois respos-
tas emitidas antes de terminado o intervalo 
programado produzem o reinício do inter-
valo. E este era exatamente o objetivo de 
Weiner nesta primeira fase do experimen-
to: estabelecer duas linhas de base - ou duas 
histórias comportamentais diferentes - nas 
quais padrões de comportamento distintos 
(altas e baixas taxas de respostas) fossem 
selecionados.
Após construir histórias compor-
tamentais diferentes para cada grupo, era 
hora de testar o efeito da exposição a estas 
diferentes contingências sobre o comporta-
mento atual, quando as contingências mu-
dassem. Na segunda fase do experimento 
Paulo Guerra Soares, Carlos Eduardo Costa
28
(teste), os participantes de ambos os grupos 
foram expostos à um mesmo esquema de 
reforçamento de intervalo fixo (FI) 10 se-
gundos por 10 sessões de 60 min e, depois, 
10 sessões de 30 min. Sob o esquema de FI 
10 s, a primeira resposta que ocorresse após 
o intervalo de 10 segundos produzia 100 
pontos no contador. Respostas que ocorres-
sem ao longo desse intervalo não tinham 
consequências programadas (diferente do 
que ocorria na fase anterior sob o esquema 
de DRL). Assim, no esquema de FI, não im-
porta se o indivíduo responde em altas ou 
baixas taxas, pois ambos os padrões con-
tinuam a produzir pontos, desde que uma 
resposta ocorra após transcorrido o inter-
valo do FI. Portanto, expor os participantes 
a este esquema de reforço na fase de teste 
permitiu observar se a exposição prévia ao 
FR ou ao DRL teria alguma influência no 
modo como eles se comportariam quando 
as contingências mudassem (ou seja, quan-
do o FI estivesse em vigor).
Resultados e discussão
E foi exatamente o que aconteceu! A 
Figura 1 exibe os registros cumulativos dos 
participantes do Grupo 1 (S1, S2 e S3) e do 
Grupo 2 (S4, S5 e S6), durante os 15 últimos 
minutos da fase de teste (FI). A análise da 
Figura 1 permite constatar que, mesmo após 
Figura 1. Registros cumulativos dos 15 últimos minutos da fase de teste (após 15 horas de exposição ao FI) dos participantes da pesquisade Weiner 
(1964). O painel superior exibe os registros dos participantes do Grupo 1 (história de FR) e o painel inferior exibe os registros dos participantes do Grupo 
2 (história de DRL) (reproduzido com a permissão de John Wiley and Sons).
Capítulo I | História Comportamental
29
15 horas de exposição ao FI, os participan-
tes que tinham sido expostos ao FR emi-
tiam taxas de respostas mais altas quando 
comparadas às taxas de respostas dos parti-
cipantes que tinham sido expostos ao DRL.
A pesquisa de Weiner (1964) é inte-
ressante por demonstrar que, mesmo em 
um delineamento simples, no qual a res-
posta selecionada era pressionar um botão, 
o comportamento dos participantes no es-
quema de FI sofreu influências da histó-
ria comportamental que foi construída no 
laboratório. Sobre estes resultados, Weiner 
afirmou que o “ponto importante é que a 
história de condicionamento deve ser con-
siderada como um possível determinante 
do responder de humanos em FI” (p. 385).
Mas é possível ir mais além, e supor 
que a história comportamental não seja ape-
nas determinante do responder em FI, mas 
de qualquer comportamento, dentro e fora 
do laboratório. Se este for o caso, os resulta-
dos da pesquisa de Weiner (1964) permitem 
inferir (baseado em dados empíricos) que as 
experiências vivenciadas pelas pessoas ao 
longo de sua vida podem, sim, influenciar o 
comportamento presente.
Os resultados apresentados por Wei-
ner (1964) nos permitem ainda outras con-
siderações. A Figura 2 abaixo foi construída 
a partir da Tabela 1 do artigo. O eixo y apre-
senta a taxa de respostas (R/min) em escala 
logarítmica e o eixo x exibe a média da taxa 
de respostas das três últimas sessões de his-
tória (FR para S1, S2 e S3; DRL para S4, S5 e 
S6) e a taxa de respostas nas cinco últimas 
sessões do experimento.
Observa-se na Figura 2 que a taxa de 
respostas nas cinco últimas sessões de FI 
dos participantes com história de FR foram 
sempre superiores às taxas de respostas dos 
participantes com história de DRL. Todavia, 
há que se considerar que houve diminuição 
na taxa de respostas dos participantes ex-
postos a história de FR e aumento na taxa 
de respostas dos participantes com história 
de DRL, quando expostos ao FI.
Durante as três últimas sessões de 
Figura 2. Taxa de respostas (R/min) em escala logarítmica na fase de 
construção da história experimental (Hist - FR para S1, S2 e S3; DRL 
para S4, S5 e S6) e nas cinco últimas sessões do experimento. Ver mais 
detalhes no texto. (Figura construída especialmente para este capítulo 
com dados apresentados em Weiner, 1964, p. 384, Tabela 1).
exposição ao FR, os participantes S1 e S3 
emitiram, em média, 412 e 240 respostas 
por minuto. Na última sessão de FI, eles 
emitiam 64 e 55 respostas por minuto, res-
pectivamente. Ou seja, depois de 15 horas 
de exposição ao FI, houve uma redução na 
taxa de respostas de aproximadamente 85% 
para S1 e de 77% para S2, em relação à li-
Paulo Guerra Soares, Carlos Eduardo Costa
30
nha de base. Uma análise parecida também 
pode ser realizada para os participantes S5 
e S6, que foram expostos à história de DRL. 
Durante as três últimas sessões do DRL, S5 
e S6 emitiam, em média, três respostas por 
minuto. A taxa de respostas na última ses-
são do FI foi de seis e nove respostas por 
minuto, respectivamente. Pode parecer 
pouca coisa, mas trata-se de um aumen-
to na taxa de respostas de 100% para S5 e 
200% para S6! 
DESDOBRAMENTOS
Os resultados da pesquisa de Weiner 
(1964) sugerem evidências de que: (a) é es-
sencial a análise da história de exposição a 
contingências passadas para a compreen-
são do comportamento atual, assim como 
proposto por Skinner (1981), em analogia à 
seleção natural; (b) que os efeitos da história 
comportamental podem ser estudados em 
laboratório, desde que haja controle sobre 
a construção da história comportamental 
dos indivíduos (Sidman, 1960; Wanchisen, 
1990).
Especular sobre as influências da 
história de vida sobre o comportamento 
presente pode parecer óbvio. Todavia, como 
apontado anteriormente, o senso comum 
frequentemente negligencia a história com-
portamental quando se propõe a explicar o 
porquê as pessoas se comportam da manei-
ra como o fazem. Por exemplo, como um 
leigo, que não conhece a história compor-
tamental dos indivíduos, explicaria o de-
sempenho dos participantes da pesquisa de 
Weiner (1964) durante a fase de teste? Assim 
como no estudo de Simonassi et al. (1984), 
provavelmente o leigo utilizaria conceitos 
mentalistas, como “ansiosas”, “hiperativas” 
(para os participantes com história de expo-
sição ao FR) ou “preguiçosas”, “depressivas” 
(para aqueles com história de exposição ao 
DRL), ignorando completamente a história 
comportamental dos participantes!
A partir da pesquisa de Weiner (1964), 
diversos estudos foram conduzidos para 
analisar os efeitos da história de exposição a 
diferentes contingências históricas sobre o 
comportamento atual, manipulando variá-
veis como controle de estímulos, reforçador 
empregado e custo da resposta, utilizando 
não-humanos (e.g. Cole, 2001; Doughty, Ci-
rino, Mayfield, da Silva, Okouchi, & Lattal, 
2005; Freeman & Lattal, 1992; LeFrancois & 
Metzger, 1993) e humanos (e.g. Costa, Ba-
naco, Longarezi, Martins, Maciel, & Sudo, 
2008; Costa, Soares & Ramos, 2012; Okou-
chi, 2003a; 2003b; Soares, Costa, Cançado 
& Cirino, 2013).
As pesquisas em laboratório sobre 
história comportamental tiveram desdo-
bramentos interessantes, também, para a 
aplicação da Análise do Comportamento 
(como na clínica comportamental). Neste 
contexto, Marçal (2013) ressalta que
Capítulo I | História Comportamental
31
“Por mais que um padrão compor-
tamental esteja trazendo problemas 
a alguém, por mais que este alguém 
esteja insatisfeito com sua forma de 
agir, tal comportamento foi reforçado 
no passado em um ou mais contextos” 
(p. 41).
Conhecer a história é conhecer o 
comportamento. Para que se possa compre-
ender o comportamento atual do paciente, é 
imprescindível que se conheçam elementos 
de sua história de vida, e que estes elemen-
tos possam ser relacionados às contingên-
cias atuais. Portanto, para a condução de 
uma análise funcional do comportamento 
adequada, é necessária a análise sistemáti-
ca da história do paciente.
Todavia, é importante esclarecer 
alguns pontos. Em primeiro lugar, quan-
do conversamos com um cliente não te-
mos acesso a sua história. Temos acesso ao 
comportamento verbal que pode estar sob o 
controle da história, pode estar sob o con-
trole da audiência (o terapeuta) ou ambos. 
Os estudos sobre história comportamental 
não nos dão uma ferramenta para a atuação 
aplicada da Análise do Comportamento. As 
pesquisas empíricas sobre história compor-
tamental nos permitem fazer especulações 
mais bem fundamentadas (i.e., baseadas em 
dados empíricos), mas que não passam de 
especulações, até que a intervenção seja 
feita e, eventualmente, o comportamento 
mude na direção “esperada” (pelas especu-
lações). Isso não é pouco! Levantar hipóte-
ses e especular com base em dados empí-
ricos é mais do que muitas abordagens em 
Psicologia têm oferecido.
CONSIDERAÇÕES FINAIS
A pesquisa de Weiner (1964) foi uma 
das primeiras tentativas de análise sistemá-
tica do efeito de histórias comportamentais 
no laboratório. Seus resultados ressaltam a 
importância do papel da história comporta-
mental na determinação do comportamen-
to atual. Ao constatar este fato, o analista do 
comportamento deve tomar cuidado com 
dois pontos. Primeiramente, a história com-
portamental – especialmente quando ela 
não é conhecida – não deve ser transforma-
da em uma explicação genérica do compor-
tamento ou, como ressalta Cirino (2001), em 
uma “lata de lixo” da Análise do Comporta-
mento. Todo comportamento é explicado a 
partir das contingências às quais o indiví-
duo foi exposto, mas para lançar mão desta 
explicação histórica o analista do compor-
tamento deve conhecer a história e quais 
elementosdesta história possuem relação 
com seu comportamento atual.
Em segundo lugar, é importante não 
atribuir à história comportamental um efei-
to definitivo e imutável sobre o compor-
tamento atual (cf. Costa, Cirino, Cançado 
& Soares, 2009). Ainda que a explicação 
Behaviorista Radical seja essencialmente 
histórica, não podemos negligenciar o papel 
das contingências presentes. Uma análise 
Paulo Guerra Soares, Carlos Eduardo Costa
32
cautelosa dos resultados de Weiner (1964) 
ajuda a sustentar esta conclusão. Dois dos 
três participantes expostos à história de FR 
emitiram, na última sessão de FI, uma taxa 
de respostas mais baixa em relação à linha 
de base (Ver Figura 2, neste capítulo). Por 
isso, procuramos sempre lembrar: somos 
produtos da nossa história, mas não escra-
vos dela!
Essas análises demonstram que, de-
finitivamente, não se pode negligenciar a 
contingência presente. A contingência de 
FI 10 s, programada por Weiner (1964) du-
rante a fase teste, estabelece um desem-
penho “ideal” de seis respostas por minuto 
(pois uma resposta a cada 10 segundos pro-
duz reforço). Uma taxa média de respostas 
como as de S1 e S2 garantiam que muitos 
pontos fossem produzidos durante o FR, 
mas a grande maioria dessas respostas não 
produzia consequências programadas du-
rante o FI, o que estabelece uma diminui-
ção na taxa de respostas como algo desejá-
vel. Durante o DRL, uma taxa média de três 
respostas por minuto (S4 e S5) garantia que 
os reforços continuassem a ser produzidos 
e que poucas perdas ocorressem. Contu-
do, respostas emitidas durante o intervalo 
do FI não reiniciavam o intervalo como no 
DRL, o que estabelece um aumento na taxa 
de respostas como algo desejável. Os resul-
tados de pesquisas posteriores sobre histó-
ria comportamental (e.g., Freeman & Lattal, 
1992; Soares et al., 2013) indicaram que o 
comportamento é produto da história, mas, 
gradualmente, fica sob controle das contin-
gências presentes.
Espera-se que o leitor possa ter com-
preendido a importância da consideração 
dos eventos históricos sobre o comporta-
mento atual e como o fenômeno pode ser 
estudado em laboratório. Dessa forma, des-
taca-se um modelo causal (Skinner, 1981) 
que é uma alternativa a qualquer tipo de 
explicação mentalista/dualista. Quando 
queremos entender – e modificar – o com-
portamento de um indivíduo, o primeiro 
passo, sem dúvida, é conhecer a sua histó-
ria comportamental!
PARA SABER MAIS
Weiner (1969). Conjunto de cinco experi-
mentos com humanos nos quais Weiner 
explora diferentes estratégias na constru-
ção da história comportamental. Os deli-
neamentos apresentados são em grupos ou 
com a exposição do mesmo participante a 
diferentes esquemas de reforço em fases 
sucessivas. Em linhas gerais, o artigo inves-
tiga os determinantes do comportamento 
humano em um esquema de FI. O desem-
penho de humanos neste esquema de re-
forço foi a base de muita controvérsia sobre 
a diferença de humanos e não humanos se 
comportamento em esquemas de reforço. A 
ênfase de Weiner, é claro, é na importância 
da história comportamental.
Freeman & Lattal (1992). Avaliação dos 
efeitos da história sobre o comportamento 
Capítulo I | História Comportamental
33
atual de pombos usando um delineamento 
no qual o sujeito é seu próprio controle (co-
nhecido como Delineamento Experimental 
de Caso Único ou delineamento intrasujei-
to). Nessa pesquisa, o mesmo organismo foi 
exposto a duas histórias comportamentais 
de maneira relativamente simultânea, sob 
diferentes controles de estímulo. O resulta-
do geral, apontou que a história exerce efei-
to sobre o comportamento atual, mas que 
esse efeito é transitório.
Okouchi (2003b). Também utilizando um 
delineamento intrassujeito (esquemas de 
reforçamento múltiplo), com humanos, a 
pesquisa de Okouchi apontou que os efeitos 
da história ficam sob o controle de estímu-
los e que esses efeitos podem se generalizar 
para outras situações semelhantes no pre-
sente.
Soares, Costa, Cançado, & Cirino (2013). 
Replicação sistemática da pesquisa de Fre-
eman e Lattal (1992) com humanos. Os re-
sultados corroboram o de outras pesquisas 
sugerindo que os efeitos da história ficam 
sob o controle de estímulos; são transitórios 
(embora possam ser de longa duração) e que 
a regularidade nos resultados de pesquisas 
com humanos em esquemas de reforça-
mento depende do controle experimental, 
não requerendo, portanto, mudanças no 
modelo de causalidade quando falamos do 
comportamento humano e não humano. 
REFERÊNCIAS
Aló, R. M. (2005). História de reforçamento. 
In J. Abreu-Rodrigues & M. R. Ribeiro (Eds.). 
Análise do comportamento: Pesquisa, teo-
ria e aplicação (pp. 45-62). Porto Alegre: 
Artmed.
Baum, W. M. (2006). Compreender o Beha-
viorismo: comportamento, cultura e evolu-
ção. Porto Alegre: ArtMed.
Chiesa, M. (1994). Radical behaviorism: The 
philosophy and the Science. Boston: Autors 
Cooperative.
Cirino, S. D. (2001). Detecção da história de 
reforçamento: Problemas metodológicos 
para lidar com a história passada. In H. J. 
Guilhardi, M. B. B. P. Madi, P. P. Queiroz & 
M. C. Scoz (Orgs.), Sobre comportamento 
e cognição: Vol 8. Expondo a variabilidade 
(pp. 137-147). Santo André: ESETec.
Cole, M. R. (2001). The long term effect of 
high and low rate responding histories on 
fixed-interval responding in rats. Journal of 
the Experimental Analysis of Behavior, 75, 
43-54.
Costa, C. E., Banaco, R. A., Longarezi, D. M., 
Martins, E. V., Maciel, E. M., & Sudo, C. H. 
(2008). Tipo de reforçador como uma vari-
ável moduladora dos efeitos de história em 
humanos. Psicologia: Teoria e Pesquisa, 24, 
251-262.
Paulo Guerra Soares, Carlos Eduardo Costa
34
Costa, C. E., Cirino, S. D., Cançado, C. R. X., 
& Soares, P. G. (2009). Polêmicas sobre his-
tória comportamental: identificação de seus 
efeitos e sua duração. Psicologia: Reflexão e 
Crítica, 22, 317-326.
Costa, C. E., Soares, P. G., & Ramos, M. N. 
(2012). Controle de estímulos e história 
comportamental: uma replicação de Fre-
eman e Lattal (1992). Temas em Psicologia, 
20, 273-288.
Doughty, A. H., Cirino, S. D., Mayfield, K. 
H., Da Silva, S. P., Okouchi, H., & Lattal, K. 
A. (2005). Effects of behavioral history on 
resistance to change. The Psychological Re-
cord, 55, 315-330.
Ferster, C. B., & Skinner, B. F. (1957). Sche-
dules of reinforcement. New York: Appleton.
Freeman, T. J., & Lattal, K. A. (1992). Stimu-
lus control of behavioral history. Journal of 
the Experimental Analysis of Behavior, 57, 
5-15.
Lattal, K. A. (1991). Scheduling positive rein-
forcers. In I. H. Iversen & K. A. Lattal (Eds.), 
Experimental Analysis of Behavior, Part 1 
(pp. 87-134). New York, NY: Elsevier Scien-
ce.
Laurenti, C. (2009). Criatividade, liberdade 
e dignidade: impactos do darwinismo no 
behaviorismo radical. Scientiae Studia, 7, 
251-269.
LeFrancois J. R, & Metzger B. (1993). Low-
-response-rate conditioning history and fi-
xed-interval responding in rats. Journal of 
the Experimental Analysis of Behavior, 59, 
543– 549.
Marçal, J. V. S. (2013). Behaviorismo radi-
cal e prática clínica. In A. K. C. R. de-Farias 
(Org.), Análise Comportamental Clínica (pp. 
30-48). Porto Alegre: Artmed.
Okouchi, H. (2003a). Effects of differences 
in interreinforcer intervals between past 
and current schedules on fixed-interval 
responding. Journal of the Experimental 
Analysis of Behavior, 79, 49-64.
Okouchi, H. (2003b). Stimulus generaliza-
tion of behavioral history. Journal of the 
Experimental Analysis of Behavior, 80, 173-
186.
Sidman, M. (1960). Tactics of scientific rese-
arch. New York: Basic Books.
Simonassi, L. E., Pires, M. C. T., Bergholz, 
M. B., & Santos, A. C. G. (1984). Causação no 
comportamento humano: acesso à história 
passada como determinantes na explicação 
do comportamento humano. Psicologia: Ci-
ência e Profissão, 4, 16-23.
Skinner, B. F. (1974). About behaviorism. 
New York: Vintage Books. 
Skinner, B. F. (1981). Selection by conse-
quences. Science, 213, 501-504.Capítulo I | História Comportamental
35
Skinner, B. F. (2003). Ciência e Comporta-
mento Humano. São Paulo: Martins Fontes 
(Originalmente publicado em 1953).
Soares, P. G., Costa, C. E., Cançado, C. R. X., 
& Cirino, S. D. (2013). Controle de estímulos 
e história comportamental em humanos. 
Psicologia: Reflexão e Crítica, 26, p. 357-366.
Souza Júnior, E. J., & Cirino, S. D. (2004) Es-
quemas de reforçamento. In C. E. Costa, J. C. 
Luzia, & H. H. N. Sant’Anna (Orgs.), Primei-
ros Passos em análise do comportamento 
e cognição. Vol. 2 (pp. 31-42). Santo André: 
ESETec.
Wanchisen, B. A. (1990). Forgetting the les-
sons of history. The Behavior Analyst, 13, 
31-37.
Weiner, H. (1964). Conditioning history and 
human fixed-interval performance. Journal 
of the Experimental Analysis of Behavior, 7, 
383-385.
Weiner, H. (1969). Controling human fixed- 
interval performance. Journal of the Expe-
rimental Analysis of Behavior, 12, 349-373.
Kennon A. Lattal 
36
O cheque está no correio1, 2: 
investigando como o reforço 
atrasado afeta o desempenho
Azzi, R., Fix, D. S. R., Keller, F. S., & Rocha e Silva, M. I. (1964). Exteroceptive control of response 
under delayed reinforcement. Journal of the Experimental Analysis of Behavior, 7, 159-162.
“… um atraso do reforço não é um parâmetro estático no efeito de um reforço sobre 
o comportamento” 
(C. B. Ferster, 1953)
Kennon A. Lattal 
West Virginia University
Capítulo II | Atraso do Reforço
37
1 Tradução realizada por João Henrique de Almeida, Paulo Guerra Soa-
res e Carlos Renato Xavier Cançado. O primeiro tradutor é bolsista de 
pós-doutorado FAPESP processo número 2014/01874-7.
2 Nota de tradução: “The check is in the mail” é uma expressão utilizada 
para indicar a um credor que um pagamento (ainda não realizado) será 
feito em breve. É uma situação em que o atraso de um reforço é, neces-
sariamente, sinalizado (i.e., o pagamento ainda não foi recebido e seu 
recebimento é sinalizado pela expressão “o cheque está no correio”).
3 Nota de tradução: os termos “signaled”, “unsignaled”, “resetting” e 
“nonresetting” que qualificam atrasos do reforço foram traduzidos, res-
pectivamente, como “sinalizados”, “não sinalizados”, “resetáveis” e “não 
resetáveis”. 
INTRODUÇÃO A ÁREA DE PES-
QUISA E CONTEXTUALIZAÇÃO 
DO EXPERIMENTO 
 Atraso do reforço, mesmo em 1964, 
era uma questão de interesse de longa data 
na Psicologia da Aprendizagem (e.g., Kim-
ble, 1961; Renner, 1964). Thorndike (1911) 
preparou o palco para investigações futu-
ras, quando afirmou que “as respostas que 
eram acompanhadas ou seguidas de perto 
pela satisfação do animal” (p. 244) seriam 
fortalecidas. Foi deixado para outros explo-
rarem os limites e as implicações da “pro-
ximidade” temporal para a relação respos-
ta-reforço. O tema geral foi explorado por 
todos os principais teóricos da aprendiza-
gem que sucederam Thorndike. Guthrie 
(1935) enfatizou a importância fundamen-
tal da contiguidade temporal entre eventos 
para a aprendizagem, mas ele nem era um 
teórico do reforçamento! Hull (1943) discu-
tiu extensamente o problema do atraso do 
reforço em seu livro Princípios do Compor-
tamento (Principles of Behavior), com ên-
fase especial nos mecanismos responsáveis 
pela manutenção do comportamento sob 
condições de atraso do reforço (ver também 
Spence, 1947). O atraso do reforço também 
aparece como um problema de pesquisa no 
livro de Skinner (1938) O Comportamento 
dos Organismos. Diferentemente da tenta-
tiva de Hull de inferir mecanismos teóricos 
subjacentes ao gradiente de atrasos do re-
forço, a análise de Skinner foi, previsivel-
mente, mais empírica.
Os experimentos em que foram im-
postos um atraso temporal entre a resposta 
que produz o reforço e a entrega desse re-
forço são descritos em dois momentos em 
O Coportamento dos Organismos. Os atra-
sos investigados por Skinner (1938) foram 
não-sinalizados, isto é, não houve mudança 
de estímulo que acompanhasse o intervalo 
do atraso. No primeiro experimento (des-
crito nas pp. 73-74), uma resposta liberava 
“um pêndulo que acionava o comedouro no 
final do intervalo desejado”. Skinner (Figu-
ra 6, p. 73) mostrou os dados de aquisição 
de oito ratos usando atrasos de 1-4 s com 
diferentes pares de ratos, e, com uma exce-
ção, notou que foram comparáveis aos de 
aquisição com reforço imediato. Não está 
claro se estes atrasos eram reiniciados se 
as respostas subsequentes ocorressem du-
rante o intervalo do atraso, mas parece que 
eles não foram, isto é, os atrasos foram não 
resetáveis3 (cf. Lattal & Gleeson, 1990). Ele 
afirmou que “[um] novo intervalo deve ser 
iniciado [quando ocorre uma segunda res-
posta] ou a segunda resposta será reforçada 
rápido demais, mas isto significa que a pri-
Kennon A. Lattal 
38
meira resposta não seria reforçada” (p. 73). 
Seus comentários subsequentes sugeriram 
que ele não resolveu este problema neste 
primeiro experimento.
Um pouco mais tarde no livro ele 
descreveu outros dois experimentos en-
volvendo atraso do reforço. Ele começou 
repetindo o problema do procedimento já 
mencionado anteriormente: “Nenhum pla-
nejamento foi feito para evitar a possivel 
coincidência de uma segunda resposta com 
um reforço atrasado” (Skinner, 1938, p. 138), 
tornando assim mais provável que o atraso 
obtido seria menor do que o atraso progra-
mado. Ele também observou uma segunda 
dificuldade, relacionada com os ratos que 
mantinham a barra pressionada. O atraso 
começou com uma pressão a barra, mas às 
vezes a barra continuava a ser pressiona-
da durante o atraso e era liberada no final 
do intervalo, levando Skinner a questionar 
se isso resultaria em reforço imediato ou 
atrasado. O equipamento utilizado neste 
experimento foi o mesmo utilizado no ex-
perimento descrito acima mas, no entanto, 
ele apontou uma mudança: “o equipamen-
to tem esta propriedade importante: se uma 
segunda resposta é feita durante o intervalo 
do atraso, a contagem do tempo recomeça, 
de modo que um intervalo completo deve 
decorrer novamente antes que o reforço 
ocorra” (p 139. ). Assim, em vez de um atraso 
não resetável, neste experimento os atrasos 
eram resetáveis, isto é , o intervalo do atra-
so era reiniciado para cada resposta após 
aquela que iniciou o atraso. Utilizando este 
procedimento, os ratos foram condiciona-
dos “da maneira usual” (p 140; presumivel-
mente Skinner queria dizer com reforço 
imediato) para responder, por fim, em um 
esquema intervalo fixo (FI) 5 min. Após este 
treino, atrasos de 2, 4, 6 ou 8 s estavam em 
vigor com diferentes ratos por três sessões. 
As taxas de resposta foram reduzidas quan-
do os atrasos estavam em vigor, sendo que 
com os dois atrasos mais curtos o respon-
der foi menos reduzido em comparação aos 
dois mais longos. Em um experimento final 
sobre atraso do reforço, Skinner analisou os 
efeitos de várias mudanças no treino e na 
implementação dos atrasos.
O principal desenvolvimento suse-
quente na análise experimental do atraso 
do reforço foi a pesquisa de Ferster (1953). 
A maioria dos teóricos de aprendizagem, 
incluindo Skinner, focaram os efeitos pre-
judiciais do atraso do reforço sobre a apren-
dizagem e o desempenho. Ferster inverteu a 
questão e perguntou se seria possível man-
ter o comportamento apesar da presença de 
um atraso entre o reforço e a resposta que o 
produziu. Ele conduziu uma série de expe-
rimentos com pombos em que ele primei-
ro mantinha a resposta de bicar (bicar um 
pequeno disco de plástico) com esquemas 
de reforço intervalo variável (VI). Com essa 
linha de base, em seu primeiro e segundo 
experimentos, atrasos sinalizados por bla-
ckouts4 da câmara experimental ocorreram 
4 Nota de tradução: Termo mantido como no original. O termo é utiliza-
do para descrever situações em que as luzes da câmara experimental, e 
até mesmo aquelas que iluminam os discos de resposta, são apagadas.
Capítulo II | Atraso do Reforço
39
entre o reforço e a resposta que o produziu. 
Os blackouts foram utilizados“para evitar S 
de respondesse” (p. 219), aproveitando-se do 
fato de que pombos normalmente não bi-
cam os discos de resposta quando a caixa e 
o disco estão apagados. Claro, apagar as lu-
zes da caixa era uma consequência imedia-
ta da resposta, fazendo com que o blackout 
funcionasse como um estímulo, em última 
análise correlacionado com a liberação do 
reforço. Como resultado, o atraso do reforço 
covariou com a potencial função reforçado-
ra condicionada do blackout. Esta covaria-
ção permite questionar esse experimento, e 
todos os experimentos envolvendo atrasos 
sinalizados do reforço, como um teste dos 
efeitos de um atraso do reforço”puro” sobre 
o responder. Em seu primeiro experimento, 
Ferster observou que atrasos de 60 s cau-
saram uma “pequena queda” na taxas de 
respostas, mas sob atrasos de 120 s, a taxa 
de respostas caiu para cerca da metade de 
seu valor quando o reforços imediatos eram 
utilizados. Em seu segundo experimento, 
Ferster tentou manter altas taxas de res-
posta introduzindo os atrasos gradualmen-
te, aumentando a sua duração de 1 a 60 s ao 
longo de um período de treino de 90 hr. Ele 
relatou que “os três Ss que mantiveram as 
taxas normais de resposta sob 60 s de atra-
so foram mantidos no mesmo procedimen-
to por várias centenas de horas cada. Eles 
não exibiram nenhuma tendência de desa-
celeração” (p. 222). O responder do quar-
to pombo não foi mantido, de acordo com 
Ferster, porque os atrasos “foram aumen-
tados muito rapidamente.” (p. 222). Ele não 
apresentou dados quantitativos na descri-
ção de seus experimentos, baseando-se, ao 
invés disso, em descrições verbais do que 
aconteceu, apoiadas apenas por alguns re-
gistros cumulativos dos desempenhos dos 
pombos.
Estas duas linhas de pesquisa (Skin-
ner, 1938; e Ferster, 1953) fornecem o con-
texto para o tema deste capítulo: o experi-
mento de Azzi, Fix, Rocha e Silva e Keller 
(1964). Uma parte importante da história 
por trás do experimento de Azzi et al. é caso 
de amor de Fred Keller com o Brasil, que co-
meçou com a sua chegada como Fulbright 
Teaching Fellow na Universidade de São 
Paulo no início de 1961. Foi nomeado como 
seu assistente de pesquisa Rodolpho Azzi, 
que aparece com Keller e outros pesquisa-
dores e pesquisadoras do Brasil na Figura 1. 
Sobre Azzi, Keller (2008) afirmou:
“Ele rapidamente se tornou meu con-
selheiro e guia, ele meatualizava com 
tudo o que eu deveria saber sobre os 
meus alunos, membros do corpo do-
cente e funcionários da administra-
ção. Ele me ajudou a responder a per-
guntas, escrever relatórios, e avaliar 
o progresso dos meus alunos. Ele me 
preparou para reuniões importantes, 
me informava sobre novos desenvolvi-
mentos, e me protegeu de incômodos 
de qualquer tipo.” (p. 248)
Kennon A. Lattal 
40
Logo depois que Keller começou a le-
cionar, ele recebeu uma entrega de equipa-
mento de pesquisa que ele havia adquirido 
da compania Grason-Stadler em Waltham, 
Massachussetts. Ele se lembrou de que o 
equipamento
“... não veio com as instruções, por 
isso tivemos de determinar como fun-
cionava por tentativa e erro. Rodol-
fo [sic] [Azzi] e eu, juntamente com 
Mario Guidi, um estudante em nosso 
curso, trabalhamos durante dias an-
tes de finalmente descobrirmos como 
automatizar um estudo longo sobre 
os efeitos de diferentes atrasos do re-
forço sobre a resposta de pressionar a 
barra de três ratos brancos (nomea-
dos de Alpha, Beta e Gamma por Ro-
dolfo [sic]). Os resultados foram pu-
blicados mais tarde no Journal of the 
Experimental Analysis of Behavior” 
(Keller, 2008, p. 250).
 Podemos apenas especular sobre o 
porquê atraso do reforço foi o tema da pri-
meira pesquisa publicada no Journal of the 
Experimental Analysis of Behavior com 
um primeiro autor brasileiro (Azzi). Vamos 
voltar para o segundo experimento relata-
do por Skinner com atraso de reforço em 
O Comportamento dos Organismos. Lem-
bre-se que ele usou um procedimento de 
atraso resetável, em que cada resposta que 
ocorresse após aquela que deu início ao 
atraso reiniciava o intervalo do atraso. Ele 
usou um procedimento semelhante para 
reduzir o responder em altas taxas [“nenhu-
ma resposta foi reforçada se fosse precedi-
da, no prazo de quinze segundos, por outra 
resposta” (p. 306)], dando assim origem ao 
esquema de reforçamento diferencial de 
taxas baixas (DRL). Wilson e Keller (1953), 
posteriormente, estudaram os efeitos de es-
quemas DRL sobre a pressão à barra de ra-
tos sob uma série de valores do “atraso” (i.e., 
os valores do DRL). O experimento Wilson 
e Keller nasceu de uma demonstração ini-
cial do que era basicamente um esquema 
de reforçamento diferencial de outros com-
portamentos (DRO), em que o início de um 
período de SD ocorreu somente se não hou-
vesse resposta no período S-delta imedia-
tamente anterior por um período de tempo 
especificado (cf. Skinner, 1938, p. 161). Uma 
contingência de atraso de reforço resetável 
é essencialmente um esquema DRL sem 
a resposta requerida no fim do intervalo, 
Figura 1. Rodolpho Azzi, Fred Keller, Maria Amélia Matos, Carolina 
Martuscelli Bori, e Andrés Aguirre (da esquerda para a direita) com 
equipamentos, Dezembro de 1961.
Capítulo II | Atraso do Reforço
41
e um esquema DRO é essencialmente um 
procedimento de atraso resetável, mas sem 
a exigência de uma resposta para iniciar 
cada intervalo do DRO (os reforços ocor-
rem desde que a resposta alvo não ocorra; 
se uma resposta alvo ocorrer, ela reinicia 
o intervalo do DRO). Combine todas essas 
ideias, adicione o fato de que Ferster (um 
dos alunos de doutorado de Keller em Co-
lumbia) tinha estudado previamente os 
efeitos de atrasos sinalizados do reforço e, 
voilà, os procedimentos utilizados por Azzi 
et al. (1964) emergem. Não podemos saber 
com precisão como a ideia para o experi-
mento foi desenvolvida mas, certamente, e 
sem surpresa, pode ser intimamente ligada 
a alguns dos trabalhos anteriores de Keller e 
seus alunos na Universidade de Columbia.
DESCRIÇÃO DO EXPERIMENTO
Objetivo e Método
 Azzi et al. (1964) buscaram fazer duas 
coisas: (a) investigar o responder operante 
sob condições em que o intervalo entre o 
reforçador e a resposta que o produzia era 
variado e (b) comparar condições em que 
o atraso fosse acompanhado por uma mu-
dança nos estímulos (um estímulo que o 
sinalizasse) ou ocorresse sem qualquer mu-
dança durante o intervalo do atraso (não 
sinalizado). Assim, o experimento era ba-
sicamente uma comparação de duas con-
dições diferentes – atrasos do reforço não 
sinalizados e sinalizados – que tinham sido 
observados em experimentos diferentes 
conduzidos, respectivamente, por Skinner 
(1938) e Ferster (1953). 
 Para isso, três ratos foram incial-
mente treinados a pressionar uma barra em 
um esquema de razão fixa (FR) 1, em que o 
reforçado era acesso à água. Parece razoável 
assumir que neste tempo nem pelotas de 
comida usadas com os ratos em muitos dos 
experimentos de Skinner e outros, nem tão 
pouco os meios para liberar essas pelotas – 
i.e., um comedouro – estavam disponíveis 
no Brasil. Água era fácil de obter e Keller 
tinha trazido consigo o que ele chamou 
de um “Brenner dipper”5 para liberação de 
água como reforços. Após o treino inicial, 
“dentro de uma câmara com a iluminação 
reduzida, cada [rato] foi exposto sucessiva-
mente a atrasos do reforço de 1; 3; 5; 7,5; 10; 
15; e 20 s[egundos], nesta ordem, com um 
total de 150 reforços em cada atraso” (Azzi 
et al., 1964, p. 159). O esquema de reforço 
então era, tecnicamente falando, um tan-
dem FR 1 DRO t-s, em que t correspondia a 
um dos valores de atraso apresentados aci-
ma. Um esquema tandem (a palavra latina 
para “um logo após o outro”) é idêntico a um 
esquema de reforço encadeado em que dois 
ou mais componentes do esquema preci-
sam ser finalizados em uma sequência fixa 
para que o reforço ocorra; no entanto, em 
um esquema encadeado cada componen-
te é associado com um estímulo diferente, 
5 Nota de tradução: Um dipperé uma espécie de bebedouro; o equipa-
mento geralmente consiste em uma haste com um recipiente côncavo 
na ponta que, quando mergulhado em um líquido, retém parte do mes-
mo. O líquido então pode ser apresentado ao animal movimentando-se 
a haste até alguma parte da câmara experimental. 
Kennon A. Lattal 
42
mas no esquema tandem o estímulo as-
sociado com cada componente é idêntico. 
No procedimento de Azzi et al. (1964), cada 
atraso reiniciava se uma resposta ocorresse 
durante o intervalo do atraso (um atraso re-
setável), e não havia nenhuma mudança no 
estímulo durante o período de atraso. Em 
seguida, foram realizadas várias manipula-
ções das durações do atraso para dos dois 
dos ratos. O terceiro rato aparentemente foi 
exposto somente a um esquema DRL 20 s 
com reforços imediatos. Assim como na 
primeira, na segunda parte do experimen-
to o esquema de reforço em vigor tecnica-
mente era um tandem FR1 DRO ts, em que 
t era 20 por dez dias, seguido por seis dias 
com t=30s. Durante a metade de cada ses-
são, “cada animal trabalhou em uma câma-
ra com a iluminação reduzida” (p.160). Du-
rante a outra metade, no entanto, “ausência 
de iluminação (escuridão) estava em vigor 
durante cada intervalo do atraso… cada vez 
que uma resposta de pressão à barra ocor-
ria, a luz da caixa era desligada (p.160, itáli-
cos originais) e não voltava a ser ligada até 
que o reforço tivesse sido liberado. Pressões 
à barra na câmara sem iluminação aumen-
tavam o período sem iluminação até que a 
duração do atraso terminasse e o reforço 
fosse liberado. Assim, na segunda parte do 
experimento, foram comparados um inter-
valo do atraso correlacionado com a pre-
sença e com a ausência de uma mudança 
nos estímulos. 
Resultados e Discussão
 Houve dois achados principais. O 
responder mantido sob um esquema tan-
dem FR1 DRO ts foi uma função negativa-
mente desacelerada da duração do atraso. 
Ou seja, a taxa de respostas caiu precipita-
damente quando o atraso aumentou de 1 a 
10 s, mas atingiu a assíntota naquele ponto, 
não caindo mais quando aos atrasos dura-
vam 15 ou 20 s. Essa relação é chamada de 
gradiente de atraso do reforço, e é caracte-
rística da relação entre as medidas de uma 
resposta e a duração do atraso em uma am-
pla variedade de atrasos do reforço e parâ-
metros do esquema de reforço (cf. Lattal, 
2010). Escurecer a câmara durante o atraso 
“produziu um efeito considerável, regula-
rizando e aumentando a taxa de respostas 
[relativo aquela observada na condição de 
atraso não sinalizado] em quase todos os 
casos” (Azzi et al., 1964, p. 160). 
 A discussão considerou o papel do 
comportamento mediador em manter o res-
ponder durante o atraso, uma observação 
feita anteriormente por Ferster (1953). No 
que subsequentemente se tornou uma aná-
lise padrão, a mudança de estímulos (em 
atrasos sinalizados dos reforços) é entendi-
da como um reforçador condicionado que 
mantém as respostas que a produziram. Isto 
ainda é uma interpretação comum do papel 
do estímulo que sinaliza o atraso em pro-
cedimentos de atrasos sinalizados do refor-
ço. Essa interpretação, no entanto, tem sido 
questionada recentemente interpretando-
-se a mudança de estímulos como tendo 
Capítulo II | Atraso do Reforço
43
função de ligação ou marcação do atraso 
(e.g., Williams, 1991), ao invés de fortalecer 
o comportamento que a precede. 
DESDOBRAMENTOS
 Ambos os resultados do experimen-
to qualificam Azzi et al. (1964) como um ex-
perimento seminal no estudo do atraso do 
reforço. Os gradientes de atraso do reforço 
apresentados por Azzi et al. (1964) tem sido 
replicados quando diferentes esquemas 
de reforço têm sido usados para manter o 
responder (Elcoro & Lattal, 2011, FI; Jarmo-
lowicz & Lattal, 2013, FR; Richards, 1981, 
DRL e VI; Sizemore & Lattal, 1978, VI) e 
com uma variação mais ampla de valores 
de atraso (Pierce, Hanford, & Zimmerman, 
1972; Richards, 1981; Sizemore & Lattal, 
1978). Azzi et al. também anteciparam vá-
rias comparações subsequentes de atra-
so do reforço sinalizado e não sinalizado, 
com mais ou menos os mesmos resultados: 
atrasos sinalizados mantem um responder 
mais robusto do que os não sinalizados (Ri-
chards, 1981). Uma característica particu-
larmente interessante de Azzi et al. é que 
as comparações dos atrasos do reforço si-
nalizados e não sinalizados foram intras-
sujeitos. Eles são os primeiros a comparar 
simultaneamente (intrassessão) os efeitos 
dos atrasos do reforço sinalizados e não si-
nalizados (cf. Lattal, 1984; Lattal & Ziegler, 
1982; Richards, 1981). Muito depois de Azzi 
et al., Reilly e Lattal (2004) desenvolveram 
um método para obter gradientes de atraso 
do reforço intrassujeitos durante uma úni-
ca sessão. Eles mantiveram o responder sob 
um esquema VI e, no início de cada sessão, 
programaram um atraso curto antes que 
um reforço fosse disponibilizado. Cada re-
forço subsequente foi disponibilizado após 
um atraso progressivamente maior.
 O experimento de Azzi et al. (1964) 
foi conduzido na tradição da Universidade 
de Columbia de conduzir análises paramé-
tricas sistemáticas das variáveis controla-
doras do comportamento. Nesse caso, as 
durações do atraso foram manipuladas em 
condições sucessivas. Como não havia um 
retorno à linha de base entre os aumentos 
sucessivos nos valores dos atrasos, atrasos 
subsequentes eram impostos sob taxas va-
riáveis de respostas entre manipulações, 
com efeitos desconhecidos sobre o gradien-
te de atraso do reforço. Esses gradientes de 
atraso do reforço, no entanto, são um tanto 
similares em sua forma aqueles obtidos com 
pressões à barra de ratos ou bicar de disco 
de pombos mantidos sob outros esquemas 
de reforço (Elcoro & Lattal, 2011; Pierce, et 
al., 1972; Richards, 1981; Sizemore & Lattal, 
1978), sugerindo que a taxa de respostas 
na linha de base pode ter um papel menos 
importante na forma do gradiente do que o 
valor do atraso em si.
Uma potencial variável estranha no 
experimento foi a taxa de reforços. Como 
tantos outros experimentos iniciais envol-
vendo atrasos do reforço, a taxa de refor-
ços sob cada valor de atraso não foi relatada 
Kennon A. Lattal 
44
por Azzi et al. (1964). É quase certo que as 
taxas de reforço diferiram quando os atra-
sos foram aumentados na primeira parte do 
experimento e na presença e na ausência 
de um estímulo na segunda parte. Pesqui-
sas posteriores, no entanto, mostraram que 
diferenças na taxa de reforços geralmente 
não explicavam as diferenças nas taxas de 
resposta observadas quando durações de 
atraso são alteradas (Lattal, 1982; Richards, 
1981; Sizemore & Lattal, 1978).
Lattal e Gleeson (1990) utilizaram um 
procedimento semelhante aos de Skinner 
(1938) e Azzi et al. (1964) para investigar a 
aquisição de responder por ratos e pombos 
experimentalmente ingênuos sob atrasos 
do reforço não sinalizados e resetáveis e 
não resetáveis quando a resposta operan-
te não havia sido modelada ou treinada de 
alguma forma, mas deixada para se desen-
volver sem qualquer intervenção por parte 
dos investigadores. Responder robusto se 
desenvolveu sob estas condições, atestan-
do o poder de reforço atrasado no desen-
volvimento e manutenção comportamento 
operante. Esta é outra maneira de dizer que 
o reforço imediato não é necessário para 
que a aprendizagem ocorra. Dito isto, no 
entanto, o reforço imediato resulta em um 
responder muito mais robusto. É uma ques-
tão em aberto se a aquisição de respostas 
é “mais rápida” com reforços imediatos vs. 
atrasados das respostas.
CONSIDERAÇÕES FINAIS
 O atraso do reforço é um dos princi-
pais parâmetros que afetam a eficácia dos 
reforços no desenvolvimento e na manu-
tenção do comportamento (Kimble, 1961). 
Por esta razão, o seu papel, tanto sozinho 
como em combinação com outros parâme-
tros do reforço, tal como magnitude dos re-
forços, foi investigado extensivamente. Um 
dos resultados dessas análises de interações 
é o desconto do atraso, em que sistematica-
mente aumentar atrasos do reforço parare-
forços de maior magnitude ou probabilida-
de enquanto o atraso para outro reforço de 
menor magnitude ou probabilidade é fixo 
permite determinar, entre outras coisas, o 
ponto de indiferença em que uma das duas 
alternativas é igualmente provável de ser 
escolhida (ver Green, Myerson, & Vander-
veldt de 2014, para um resumo recente des-
tes resultados). Estudos sobre desconto do 
atraso oferecem insights sobre como dife-
rentes combinações de parâmetros de re-
forço podem ser dimensionados. Da mesma 
forma, o atraso do reforço (às vezes também 
chamado de “gratificação” em experimen-
tos não analítico-comportamentais sobre o 
fenômeno) desempenha um papel impor-
tante no desenvolvimento de estratégias de 
auto-gerenciamento ou de auto-controle. 
Na verdade, a base desta área de pesquisa e 
aplicação é a análise experimental de atraso 
do reforço.
Uma outra área em que as pesqui-
sas sobre atraso do reforço tem sido impor-
Capítulo II | Atraso do Reforço
45
tantes é o estudo do reforço condicionado. 
Uma teoria fundamental sobre esse tipo re-
forço é a teoria da redução do atraso (delay 
reduction theory), que sugere que estímulos 
funcionam como reforçadores na medida 
em que eles indicam uma redução do tem-
po de acesso ao reforço primário (Fantino, 
1977).
As lições do atraso do reforço não fo-
ram perdidas na análise do comportamento 
aplicada, onde a importância da imediati-
cidade do reforço seguindo o comporta-
mento apropriado continua, com razão, 
sendo enfatizada. Embora reforço imediato 
possa ser o ideal no tratamento e na ges-
tão do comportamento humano de manei-
ra geral, muitos comportamentos humanos 
são mantidos apesar de seus reforços serem 
atrasados a partir das respostas que os pro-
duzem. A pesquisa básica sobre atraso do 
reforço sugere uma série de condições sob 
as quais os atrasos reduzirão (e.g., atrasos 
mais longos ou não sinalizados) ou não (e.g., 
atrasos mais mais curtos ou sinalizados) o 
responder, mas poucas pesquisas aplicadas 
tem sido realizadas para expandir estes re-
sultados e investigar como eles podem es-
tar relacionados a programas de tratamen-
to (mas cf. Stromer, McComas, & Rehfeldt, 
2000).
Uma questão particularmente impor-
tante e não resolvida na análise do atraso 
do reforço com humanos tanto na pesquisa 
como em contextos aplicados é a questão 
da mediação do comportamento durante os 
atrasos pelo comportamento verbal. Ambos 
Ferster (1953) e Azzi et al. (1964) sugeriram 
que o comportamento é mantido durante os 
atrasos do reforço na medida em que certos 
padrões de comportamento estereotipado 
surjem durante o atraso, o que resultaria 
numa cadeia de comportamento desen-
volvendo de tal modo que a resposta que 
inicia o atraso é seguida por algum padrão 
regular de comportamento (não necessá-
rio mas mantido por reforço acidental) que 
termina contiguamente com reforço. Tais 
cadeias supersticiosas, assim, garantiriam 
uma “conexão” entre a resposta operante 
inicial e o reforço no final do atraso. Tem 
sido sugerido que o comportamento verbal 
de humanos pode também mediar os atra-
sos. Algo que uma pessoa faz agora pode 
não ter um efeito em uma hora, em um 
dia, ou até mais, mas os dois eventos per-
manecem conectados e a pessoa continua 
a se engajar no comportamento que tem o 
reforço atrasado. Talvez isso esteja relacio-
nado a coisas que ou a pessoa diz a si mes-
mo ou outras pessoas a durante o interva-
lo do atraso. Ou talvez não. Alguns críticos 
contemporâneos de tais interpretações do 
atraso do reforço baseadas em contiguidade 
têm sugerido que a proximidade temporal 
entre a resposta e reforço desempenha um 
papel relativamente menor na aquisição e 
manutenção de responder em comparação 
ao fato de que existe uma correlação geral 
entre a taxa de respostas e os reforços que 
resultam, imediatamente ou após atrasos 
(ver Baum, 1973). O experimento de Lattal 
e Gleeson (1990) descrito acima ilustra que 
Kennon A. Lattal 
46
a aprendizagem pode ocorrer quando há 
apenas uma correlação entre a resposta e 
o reforço, mas não a contiguidade respos-
ta-reforço. Este último ponto levanta uma 
questão mais ampla, sem resposta ainda, 
sobre se os reforços que ocorrem após um 
atraso são mais bem caracterizados como 
atrasados em relação à respostas específi-
cas ou se são correlacionados com grupos 
de respostas organizadas como taxas de 
resposta ou tempo alocado à respostas de 
topografias particulares. 
Um último ponto, mas não menos 
importante, é que a partir de uma perspec-
tiva histórica o experimento é importante 
porque é o primeiro de muitos relatos de 
pesquisa por analistas do comportamento 
brasileiros a ser publicado no Journal of the 
Experimental Analysis of Behavior.
PARA SABER MAIS
Commons, Mazur, Nevin, & Rachlin (1987). 
É um volume editado que apresenta uma 
série de perspectivas sobre o uso e as impli-
cações do atraso do reforço para a compre-
ensão do processo de reforçamento.
Lattal (2010). fez uma revisão sobre a pes-
quisa básica sobre atraso do reforço condu-
zida na tradição analítico-comportamental 
de Skinner até o momento da publicação de 
sua revisão.
Renner (1964). é uma importante revisão 
inicial sobre atraso do reforço a partir de 
uma perspectiva mais ampla das teorias da 
aprendizagem sobre o tema. 
Stromer, McComas, & Rehfeldt (2000). 
consideraram algumas implicações aplica-
das de pesquisas sobre atraso do reforço.
Tarpy & Sawabini (1974). analisaram criti-
camente pesquisas sobre atraso do reforço 
conduzidas desde a publicação da revisão 
de Renner até a sua própria.
REFERÊNCIAS
Azzi, R., Fix, D. S. R., Keller, F. S., & Rocha 
e Silva, M. I. (1964). Exteroceptive control 
of response under delayed reinforcement. 
Journal of the Experimental Analysis of 
Behavior, 7, 159-162.
Baum, W. M. (1973). The correlation-based 
law of effect. Journal of the Experimental 
Analysis of Behavior, 20, 137-153. 
Commons, M. L., Mazur, J., Nevin, J. A., & 
Rachlin, H. (Eds.) (1987). Quantitative stu-
dies of operant behavior: The effect of delay 
and of intervening events on reinforcement 
value. New York: Erlbaum.
Elcoro, M., & Lattal, K. A. (2011). Effects of 
unsignaled delays of reinforcement on fi-
xed-interval schedule performance. Beha-
vioural Processes, 88, 47-52.
Capítulo II | Atraso do Reforço
47
Fantino (1977). Conditioned reinforcement, 
choice, and information. In W. K. Honig & 
J.E.R. Staddon (Eds.), Handbook of operant 
behavior (pp. 326-339). New York: Prentice 
Hall.
Ferster, C. B. (1953). Sustained behavior un-
der delayed reinforcement. Journal of Expe-
rimental Psychology, 45, 218-224.
Green, L., Myerson, J., & Vanderveldt, A. 
(2014). Delay and probability discounting. 
In F. K. McSweeney & E. S. Murphy 
(Eds.), The Wiley Blackwell handbook of 
operant and classical conditioning. Oxford: 
John Wiley & Sons. 
Guthrie, E. R. (1935). The psychology of lear-
ning. New York: Harper. 
Hull, C. L. (1943). Principles of Behavior. 
New York: Appleton-Century Crofts. 
Jarmolowicz, D. P., & Lattal, K. A. (2013). De-
lay of reinforcement and fixed-ratio perfor-
mance. Journal of the Experimental Analy-
sis of Behavior, 100, 370-395.
Keller, F. S. (2008). At my own pace: The au-
tobiography of Fred S. Keller. Cornwall on 
Hudson: Sloan Publishing. 
Kimble, G. A. (1961). Hilgard and Mar-
quis’ Conditioning and Learning. New York: 
Appleton Century Crofts.
Lattal, K. A. (1984). Signal functions in de-
layed reinforcement. Journal of the Experi-
mental Analysis of Behavior, 42, 239-253.
Lattal, K.A. (2010). Delayed reinforcement 
of operant behavior. Journal of the Experi-
mental Analysis of Behavior, 93, 129-139. 
Lattal, K. A., & Gleeson, S. (1990). Respon-
se acquisition with delayed reinforcement. 
Journal of Experimental Psychology: Animal 
Behavior Processes, 16, 27-39.
Lattal, K. A., & Ziegler, D. R. (1982). Briefly 
delayed reinforcement: An interresponse 
time analysis. Journal of the Experimental 
Analysis of Behavior, 37,407-416.
Pierce, C. H., Hanford, P. V., & Zimmerman, 
J. (1972). Effects of different delay of 
reinforcement procedures on variable-in-
terval responding. Journal of the Experi-
mental Analysis of Behavior, 18, 141-146.
Renner, K. E. (1964). Delay of reinforcement: 
A historical review. Psychological Review, 
61, 341-361.
Reilly, M.P., & Lattal, K.A. (2004). Progressi-
ve delays to reinforcement. Journal of the 
Experimental Analysis of Behavior, 82, 21-
35.
Richards, R. W. (1981). A comparison of sig-
naled and unsignaled delay of reinforce-
ment. Journal of the Experimental Analysis 
of Behavior, 35, 145-152.
Kennon A. Lattal 
48
Sizemore, O. J., & Lattal, K. A. (1978). Un-
signaled delay of reinforcement in variable-
-interval schedules. Journal of the Experi-
mental Analysis of Behavior, 30, 169-175.
Skinner, B. F. (1938). The behavior or orga-
nisms: An experimental analysis. New York: 
Appleton Century Crofts. 
Spence, K. W. (1947). The role of secondary 
reinforcement in delayed reward learning. 
Psychological Review, 54, 1-8. 
Stromer, R, McComas, J. J., & Rehfeldt, R. A. 
(2000). Designing interventions that inclu-
de delayed reinforcement: Implica-
tions of recent laboratory research. Journal 
of Applied Behavior Analysis, 33, 359-371. 
Tarpy, R. M., & Sawabini, F. L. (1974). Rein-
forcement delay: A selective review of the 
past decade. Psychological Bulletin, 81, 
984-987.
Thorndike, E. L. (1911). Animal intelligence. 
New York: MacMillan.
Williams, B. A. (1991). Marking and bridging 
versus conditioned reinforcement. Animal 
Learning and Behavior, 19, 264-269. 
Wilson, M. P., & Keller, F. S. (1953). On the 
selective reinforcement of spaced respon-
ses. Journal of Comparative and Physiologi-
cal Psychology, 46, 190-193.
Carlos Renato Xavier Cançado, Flávia Hauck, Ítalo S. C. Teixeira
49
Quando o passado 
retorna: ressurgência 
comportamental
Carlos Renato Xavier Cançado
Flávia Hauck
Ítalo S. C. Teixeira
Universidade de Brasília
Epstein, R. (1983). Resurgence of previously reinforced behavior during extinction. Behaviour 
Analysis Letters, 3, 391-397. 
A fênix é uma ave da Arábia (...). Quando percebe que envelheceu, constrói uma 
fogueira para si (...) e encarando os raios do sol nascente, acende o fogo e o nutre 
batendo suas asas, e ressurge de suas próprias cinzas. 
(Isidoro de Sevilha, Etymologiae, Livro 12, 7:22)
Capítulo III | Ressurgência Comportamental
50
INTRODUÇÃO À ÁREA DE PES-
QUISA E CONTEXTUALIZAÇÃO 
DO EXPERIMENTO 
É bem provável que você tenha se 
encontrado em uma situação em que teve 
que resolver um problema como, por exem-
plo, responder corretamente a um exercí-
cio de cálculo, abrir uma porta emperrada, 
ou escrever um texto sobre um tema com 
o qual você tem pouca familiaridade. Você 
“não sabe o que fazer”. Um problema pode 
ser apenas uma situação em que seu com-
portamento não modifica o ambiente de 
maneira eficiente, isto é, seu comporta-
mento não produz consequências. É o que 
os analistas do comportamento chamam de 
extinção. Além da redução na frequência 
de determinadas respostas, um outro efei-
to da extinção é o aumento na variabilida-
de da topografia das respostas (Antonitis, 
1951). Você tenta fazer coisas diferentes, 
comportar-se de outras maneiras para ten-
tar resolver o problema. Parte do que você 
faz nesse momento é, comumente, algo 
bem parecido com o que você fez no passa-
do (talvez mesmo em um passado remoto) e 
que, nesse passado, “deu certo”. É parte de 
sua história comportamental. É sobre essa 
variação comportamental que o ambiente 
irá operar, selecionando o que é usualmen-
te descrito como a “solução do problema”, 
possivelmente um “comportamento novo” 
ou “criativo” (Epstein, 1996; ver especial-
mente, Skinner, 1981, 1984). 
Em situações nas quais comporta-
mentos atuais deixam de produzir conse-
quências, comportamentos previamente 
reforçados tendem a recorrer, um fenôme-
no que analistas do comportamento de-
nominam de ressurgência (Epstein, 1983, 
1985). Embora a ressurgência tivesse sido 
descrita anteriormente na literatura cientí-
fica (e.g., Carey, 1951; Leitenberg, Rawson & 
Bath, 1970; Leitenberg, Rawson & Mulick, 
1975; ver Epstein, 2015), o estudo sistemá-
tico desse fenômeno intensificou-se nos 
anos 1980, especialmente após a publicação 
do artigo de Epstein (1983), cujo experimen-
to é descrito nesse capítulo. Nesse artigo, 
Epstein usa um termo específico para des-
crever a recorrência de comportamentos 
previamente reforçados durante a extinção 
de outros comportamentos (i.e., ressurgên-
cia; ver também Epstein & Skinner, 1980), 
define o fenômeno, descreve um proce-
dimento para sua análise experimental, e 
levanta diversas questões de pesquisa que 
serviram de base para a condução de expe-
rimentos sobre a ressurgência desde então 
(ver Lattal & St Peter Pipkin, 2009; e Pontes 
& Abreu-Rodrigues, 2015, para revisões da 
literatura). 
No início de seu artigo, Epstein (1983) 
define a ressurgência da seguinte maneira: 
“Quando, numa dada situação, um com-
portamento reforçado recentemente deixa 
de ser reforçado, comportamentos ante-
riormente reforçados em condições seme-
lhantes tendem a recorrer” (p. 391; itálicos 
adicionados). Essa definição pode parecer 
Carlos Renato Xavier Cançado, Flávia Hauck, Ítalo S. C. Teixeira
51
geral demais, algo que talvez pudesse ter 
sido descrito por meio da observação casu-
al do comportamento no cotidiano, sem re-
correr a equipamentos especiais, sem con-
duzir experimentos, e sequer pensar em ir 
ao laboratório. Por quê recorrer a uma situ-
ação simplificada no laboratório quando o 
fenômeno pode ser observado no compor-
tamento de humanos e não humanos em 
ambientes não laboratoriais? Mas é exata-
mente essa simplificação do laboratório em 
relação a ambientes não laboratoriais, con-
duzida por meio do controle experimental 
de variáveis, que queremos quando nosso 
objetivo é descrever princípios comporta-
mentais. A análise experimental permite 
uma descrição mais precisa do fenôme-
no investigado e dos fatores que o levam a 
ocorrer (i.e., suas variáveis de controle). Se 
você conhece as variáveis que determinam 
um fenômeno, pode prevê-lo com maior 
precisão se você sabe que essas variáveis 
estão em vigor. Além disso, se você pode 
manipular essas variáveis, pode fazer com 
que o fenômeno ocorra ou deixe de ocor-
rer (Skinner, 2003/1953). É essa a princi-
pal função de uma análise experimental do 
comportamento e não seria diferente em 
relação ao estudo da ressurgência. Vejamos, 
então, como foi a análise experimental da 
ressurgência conduzida por Epstein. 
 DESCRIÇÃO DO EXPERIMENTO 
Objetivo e Método 
O objetivo de Epstein (1983) era ana-
lisar experimentalmente a ressurgência, 
isto é, a recorrência de comportamentos 
previamente reforçados quando comporta-
mentos atuais deixavam de ser reforçados. 
Metodologicamente, seria necessário que 
uma resposta específica (a resposta alvo) 
fosse inicialmente reforçada. Em uma se-
gunda fase, a resposta alvo deixaria de pro-
duzir reforços e uma outra resposta (a res-
posta alternativa) seria reforçada. Em uma 
terceira fase, a resposta alvo continua a não 
produzir reforços e a ressurgência dessa 
resposta poderia ser verificada quando a 
resposta alternativa deixasse de produzir 
reforços. Na literatura experimental, o pro-
cedimento para o estudo da ressurgência 
é descrito comumente como um “procedi-
mento de três fases” e a primeira, a segun-
da e a terceira fases do procedimento são 
denominadas fases de Treino, Eliminação 
(ou Reforçamento Alternativo) e Teste, res-
pectivamente. Embora Epstein não tenha 
feito uso desses termos, eles serão utiliza-
dos nesse capítulo para descrever as fases 
de seu procedimento. 
Independente dos nomes que demos 
ao procedimento e às fases experimentais, 
o que deve ser destacado é que Epstein 
(1983) precisou construir, em laboratório, 
uma história comportamental remota (i.e., 
a resposta alvofoi reforçada), uma histó-
ria comportamental recente (i.e., a respos-
ta alvo deixou de ser reforçada e apenas a 
resposta alternativa passou a produzir re-
forços) e também modificar o ambiente de 
seus sujeitos em um teste (i.e., a resposta 
Capítulo III | Ressurgência Comportamental
52
alternativa também deixou de produzir re-
forços) para verificar se, e como, a ressur-
gência das respostas alvo ocorreria. 
O experimento foi conduzido com 
seis pombos, experimentalmente ingênu-
os, mantidos a 80% de seu peso livre por 
meio de um regime de privação de comida. 
Como os experimentos sobre ressurgência 
são experimentos sobre os efeitos de uma 
história remota sobre o comportamento 
atual, o fato de os pombos terem sido ex-
perimentalmente ingênuos foi um aspecto 
importante de controle experimental. Os 
resultados poderiam ser diferentes (ou mes-
mo de difícil interpretação) se os pombos já 
tivessem uma determinada história no am-
biente experimental escolhido por Epstein. 
O procedimento de privação de comida é 
uma operação estabelecedora ou motiva-
dora (Miguel, 2000; ver também Laraway, 
Snycerski, Michael & Poling, 2003), neces-
sária para estabelecer o acesso à comida no 
ambiente experimental como consequência 
e permitir que determinadas respostas se-
jam selecionadas e mantidas durante o ex-
perimento. 
O equipamento utilizado no experi-
mento foi uma câmara de condicionamento 
operante para pombos (as sessões experi-
mentais eram conduzidas com cada pombo 
individualmente). Um dos painéis da câ-
mara continha dois discos de resposta, lo-
calizados à direita e à esquerda no painel e 
separados por 12 cm, e um comedouro loca-
lizado entre os discos (os discos de resposta 
usualmente são de plástico e têm 2 cm de 
diâmetro; respostas de bicar o disco fecham 
um circuito elétrico que permite o registro 
automático das respostas). Quando acio-
nado, o comedouro dava acesso a grãos por 
3 s (i.e., reforços). Em cada fase do experi-
mento, descritas a seguir, as sessões expe-
rimentais duravam 60 min e o registro das 
respostas foi feito por meio de um micro-
computador, de registradores cumulativos, 
e também de filmagens das sessões expe-
rimentais feitas com uma câmera de vídeo. 
Fase de Treino: o objetivo dessa fase 
foi estabelecer a resposta alvo. Para três 
pombos, a resposta alvo consistiu em bicar 
o disco da direita e, para os outros três, o 
disco da esquerda. A resposta alvo foi man-
tida sob um esquema de reforçamento in-
tervalo variável (VI) 60 s. Sob esse esque-
ma, a primeira resposta após um intervalo 
médio de 60 s produz reforços (os intervalos 
entre reforços variam e sua média é igual 
a 60 s; os intervalos são selecionados alea-
toriamente em uma sessão). Esse esquema 
produz uma taxa de respostas moderada e 
constante e, por essa razão, é muito usado 
para o estabelecimento de linhas de base 
comportamentais em análise experimental 
do comportamento. Essa fase teve a dura-
ção de 15 a 49 sessões, entre pombos, e ter-
minou quando a taxa de respostas de cada 
pombo fosse estável (embora Epstein, 1983, 
não defina precisamente seu critério de es-
tabilidade, comumente exige-se que os su-
jeitos sejam expostos às condições por um 
número mínimo de sessões e que não haja 
Carlos Renato Xavier Cançado, Flávia Hauck, Ítalo S. C. Teixeira
53
tendências crescentes ou decrescentes na 
taxa de respostas por algumas sessões con-
secutivas). 
Fase de Eliminação: o objetivo des-
sa fase foi reduzir a frequência da respos-
ta alvo e reforçar uma resposta alternati-
va. Na etapa inicial dessa fase, para cada 
pombo, a resposta alvo deixou de produzir 
reforços (i.e., extinção estava em vigor). O 
número de sessões em que a resposta alvo 
esteve em extinção variou para cada pom-
bo, entre uma e 12 sessões. A etapa final 
dessa fase ocorreu em uma sessão de 60 
min. Nessa sessão, o procedimento de ex-
tinção da resposta alvo esteve em vigor por 
pelo menos 30 min e até que nenhuma res-
posta alvo ocorresse por 10 min consecuti-
vos, para cada pombo. Então, foi reforçada 
uma resposta alternativa cuja topografia 
era incompatível com bicar o disco. A topo-
grafia da resposta alternativa variou entre 
pombos: para um pombo, por exemplo, a 
resposta alternativa consistiu em virar para 
a esquerda; para outro pombo, em abaixar 
a cabeça; para outro, em levantar a asa. A 
resposta alternativa foi reforçada 20 vezes 
em um esquema de razão fixa (FR) 1. Sob 
esse esquema cada ocorrência da resposta 
alternativa produzia o reforço. Após a pro-
dução de 20 reforços pela resposta alterna-
tiva, ainda nessa mesma sessão, teve início 
a fase de Teste. 
 Fase de Teste: nessa fase, para cada 
pombo, os reforços para a resposta alterna-
tiva foram descontinuados. É importante 
destacar que, durante essa fase, a resposta 
alvo também não produzia reforços. Essa 
fase esteve em vigor até o término da sessão 
de 60 min e teve a duração de aproximada-
mente 10 min para cada pombo. 
Ressurgência seria evidenciada caso 
ocorresse um aumento na frequência da 
resposta alvo na fase de Teste em relação à 
frequência dessa mesma resposta na etapa 
final da fase de Eliminação. Mas vejamos 
alguns aspectos do procedimento de Eps-
tein (1983) que qualificam (em seu experi-
mento, e em qualquer experimento sobre 
ressurgência) a descrição de um aumento 
na frequência de respostas alvo durante a 
fase de Teste como ressurgência. 
Aspectos do controle experimental: 
vale destacar alguns aspectos importan-
tes de controle experimental adotados por 
Epstein (1983). Lembre-se que a câmara de 
condicionamento operante tinha dois dis-
cos de resposta. Bicar um desses discos foi 
definido como a resposta alvo. Respostas 
de bicar o outro disco nunca produziram 
reforços durante o experimento, mas foram 
registradas e serviram como respostas con-
trole. A comparação da frequência de res-
postas alvo e respostas controle na fase de 
Teste permite diferenciar a ressurgência da 
variabilidade no comportamento induzida 
pela extinção. Sem o registro de uma res-
posta controle, um aumento na frequência 
da resposta alvo na fase de Teste, que seria 
descrita como ressurgência, poderia sim-
plesmente ser um exemplo de variabilida-
Capítulo III | Ressurgência Comportamental
54
de induzida pela extinção. No entanto, se o 
aumento na frequência da resposta alvo na 
fase de Teste fosse maior do que a frequên-
cia da resposta controle, isso seria evidên-
cia de que a ressurgência é função da histó-
ria de reforçamento estabelecida na fase de 
Treino e não apenas induzida pela extinção. 
Portanto, a ressurgência é definida opera-
cionalmente no experimento de Epstein 
como um aumento na frequência da res-
posta alvo durante a fase de Teste (i.e., em 
relação à frequência dessa mesma resposta 
durante a etapa final da fase de Elimina-
ção) que fosse maior do que a frequência da 
resposta controle nessa mesma fase. 
Um outro aspecto de controle ex-
perimental importante do experimento de 
Epstein (1983) é o fato de a etapa final da 
fase de Eliminação e a fase de Teste terem 
sido conduzidas na mesma sessão. Quando 
uma resposta está em extinção, é comum 
observarmos um fenômeno de recorrência 
chamado de recuperação espontânea (des-
crito por Pavlov, e.g., Pavlov, 1927, no estu-
do da extinção respondente; o fenômeno é 
também observado na extinção operante). 
A recuperação espontânea caracteriza-se 
por um aumento na frequência de respostas 
no início de uma sessão de extinção em re-
lação a frequência dessas respostas no final 
da sessão de extinção imediatamente ante-
rior. Portanto, se a transição entre a fase 
de Eliminação e a fase de Teste ocorresse 
entre sessões no experimento de Epstein, 
não teríamos como dissociar a eventual 
ressurgência da resposta alvo no início da 
fase de Teste do fenômeno de recuperação 
espontânea (lembre-se que a resposta alvo 
estava em extinção durante toda a fase de 
Eliminação, e também durante a fase de 
Teste). Como a transiçãoentre as fases de 
Eliminação e Teste no experimento de Eps-
tein ocorreu na mesma sessão, um aumen-
to na frequência da resposta alvo no Teste 
seria mais precisamente descrito como res-
surgência e não como recuperação espon-
tânea. 
Finalmente, vale apontar que Epstein 
(1983) conduziu a extinção da resposta alvo, 
na fase de Eliminação, antes do reforça-
mento da resposta alternativa (e.g., Bruzek, 
Thompson & Peters, 2009; Lieving & Lattal, 
2003). Isso foi feito para garantir que a fre-
quência da resposta alvo era baixa quando 
as respostas alternativas fossem reforçadas. 
No entanto, são comuns experimentos so-
bre ressurgência nos quais a extinção da 
resposta alvo e o reforçamento da resposta 
alternativa ocorrem simultaneamente na 
fase de Eliminação (e.g., Cançado & Lattal, 
2011; da Silva, Maxwell & Lattal, 2008; Po-
dlesnik, Gimenez-Gomez & Shahan, 2006). 
 Resultados e Discussão 
Como apontado anteriormente, o 
número de sessões na fase de Treino e na 
etapa inicial da fase de Eliminação variou 
entre pombos. Na fase de Treino, entre 
pombos, de 11 a 49 sessões foram conduzi-
das; na etapa inicial da fase de Eliminação, 
de 1 a 12 sessões foram conduzidas. 
Carlos Renato Xavier Cançado, Flávia Hauck, Ítalo S. C. Teixeira
55
Infelizmente, Epstein (1983) não 
apresentou dados da fase de Treino. Como 
essa fase foi conduzida até que a taxa de 
respostas alvo de cada pombo fosse está-
vel, temos que assumir que foi isso o que 
aconteceu. A taxa de respostas alvo, para 
cada pombo, estava próxima de zero quan-
do teve início o reforçamento das respostas 
alternativas. Assim, Epstein demonstrou 
que a exposição à extinção durante a etapa 
inicial da fase de Eliminação reduziu consi-
deravelmente a taxa de respostas alvo antes 
que as respostas alternativas começassem a 
ser reforçadas. 
Na etapa final da fase de Eliminação, 
a taxa de respostas alternativas aumentou 
para cada pombo e a taxa de respostas alvo 
permaneceu próxima de zero. Finalmente, 
quando os reforços para respostas alterna-
tivas foram descontinuados na fase de Tes-
te, a frequência dessas respostas diminuiu 
e observou-se um aumento na ocorrência 
da resposta alvo para cada pombo. Isto é, a 
ressurgência de uma resposta previamente 
reforçada ocorreu quando a resposta alter-
nativa estava em extinção. A magnitude da 
ressurgência (i.e., o quanto a taxa de respos-
tas aumentou na fase de Teste em relação à 
fase de Eliminação) variou entre os pombos 
e aparentemente não foi influenciada pelo 
número de sessões conduzidas nas fases de 
Treino e Eliminação. 
A condução da etapa final da fase de 
Eliminação e da fase de Teste em uma mes-
ma sessão (Epstein, 1983) permite afirmar 
que o aumento na frequência de respos-
tas alvo durante a fase de Teste não foi um 
exemplo de recuperação espontânea. Além 
disso, o registro das respostas controle per-
mite afirmar que esse aumento na frequên-
cia de respostas alvo durante a fase de Teste 
não pode ser descrito simplesmente como 
variabilidade no comportamento induzida 
pela extinção. Para cada pombo, o aumen-
to na frequência da resposta alvo na fase de 
Teste foi maior do que a frequência de res-
postas controle nessa mesma fase (apenas 
um pombo emitiu uma resposta controle na 
fase de Teste). Portanto, podemos afirmar 
que a ressurgência é produto da história re-
mota de reforçamento estabelecida na fase 
de Treino. O fato de a resposta alvo e a res-
posta controle terem topografias semelhan-
tes (ambas são respostas de bicar um disco, 
e os discos estavam próximos um do outro 
na câmara de condicionamento) torna esse 
aspecto do procedimento ainda mais rele-
vante e ressalta a importância da história 
do organismo em determinar qual compor-
tamento irá ocorrer (ou recorrer) quando a 
extinção estiver em vigor. 
Epstein (1983) destaca, contudo, que 
a condução da etapa final da fase de Elimi-
nação e da fase de Teste em uma mesma 
sessão tem implicações para interpretarmos 
seus resultados. Nesse contexto, ele faz re-
ferência a outro fenômeno de recorrência, 
o restabelecimento (Reid, 1958; Franks & 
Lattal, 1976). O restabelecimento é a recor-
rência de respostas previamente reforçadas 
quando, em uma fase de Teste, a resposta 
Capítulo III | Ressurgência Comportamental
56
alvo está em extinção, mas os reforços são 
apresentados independentemente das res-
postas do organismo. O restabelecimento 
evidencia o controle discriminativo do pró-
prio reforço como variável que influencia a 
recorrência de respostas. No experimento 
de Epstein, a etapa final da fase de Elimi-
nação foi conduzida por um período rela-
tivamente curto (o tempo necessário para 
a emissão de 20 respostas alternativas), 
na mesma sessão em que, posteriormente, 
a fase de Teste foi conduzida. É possível, 
portanto, que a ressurgência observada 
para cada pombo nesse experimento tenha 
sido parcialmente induzida pela ocorrência 
de reforços na etapa final da fase de Elimi-
nação (lembre-se que 3 s de acesso a grãos 
serviram como reforços para as respostas 
alvo, na fase de Treino, e para as respostas 
alternativas, na fase de Eliminação). No en-
tanto, vale ressaltar que, para cada pombo, a 
ressurgência foi observada no experimento 
de Epstein apenas quando os reforços para 
a resposta alternativa foram descontinua-
dos, e não enquanto esses reforços estavam 
sendo produzidos. Além disso, experimen-
tos subsequentes demonstraram que a res-
surgência ocorre mesmo quando a fase de 
Eliminação é conduzida por várias sessões 
de duração mais longa do que aquela pro-
gramada por Epstein (e.g., Lieving & Lattal, 
2003; Podlesnik et al., 2006; Podlesnik & 
Shahan, 2009) e quando a transição entre 
as fases de Eliminação e Teste ocorre não 
na mesma sessão, mas entre sessões. Nes-
se último caso, não há reforços disponíveis 
para qualquer resposta durante toda a fase 
de Teste. 
 DESDOBRAMENTOS 
A beleza de uma ciência experimen-
tal é que os resultados de um experimen-
to respondem algumas perguntas, mas le-
vantam uma série de novas perguntas que 
requerem estudos adicionais. Ao discutir 
seus resultados, Epstein (1983) afirmou que 
muitas variáveis poderiam influenciar a 
ressurgência como, por exemplo, os esque-
mas de reforçamento que mantêm a respos-
ta alvo e a resposta alternativa, o tipo e a 
magnitude dos reforços que mantêm essas 
respostas, a duração das fases de Treino e 
de Eliminação (i.e., o tempo em que respos-
tas alvo e alternativa são reforçadas) e tam-
bém as condições em que a resposta alvo foi 
extinta (i.e., o número de sessões) e a taxa 
de respostas alvo antes do reforçamento da 
resposta alternativa. Além disso, ele suge-
riu que o fenômeno da ressurgência esta-
ria possivelmente envolvido no que cha-
mamos de criatividade e de resolução de 
problemas. Com essas afirmações, Epstein 
levantou uma série de questões que pode-
riam ser experimentalmente investigadas e 
ressaltou a utilidade do conhecimento so-
bre o fenômeno da ressurgência para a aná-
lise de outros padrões comportamentais. 
Os resultados de Epstein (1983) têm 
sido replicados em diversos laboratórios 
desde então, com diferentes espécies (e.g., 
ratos, Podlesnik et al., 2006; humanos, Wil-
Carlos Renato Xavier Cançado, Flávia Hauck, Ítalo S. C. Teixeira
57
son & Hayes, 1996; peixes, da Silva, Cança-
do & Lattal, 2014) e com algumas modifica-
ções do procedimento descrito pelo autor 
(ver Pontes e Abreu-Rodrigues, 2015). As 
variáveis que possivelmente influencia-
riam a ressurgência, indicadas por Epstein 
e descritas anteriormente, vêm sendo estu-
dadas sistematicamente desde então. Dife-
rente do que indicaram os resultados de seu 
experimento (Epstein, 1983), alguns estudos 
sugerem que o número de sessões na fase 
de Treino pode influenciar a magnitude da 
ressurgência. Ressurgência de maior mag-
nitude tende a ocorrer quando a fase de 
Treino é conduzida por um número maior 
de sessões (e.g., Bruzek et al., 2009; Dou-
ghty, Cash, Finch, Holloway & Wallington,2010). No entanto, resultados inconsisten-
tes entre estudos têm sido obtidos quando 
a duração da fase de Eliminação é manipu-
lada. Em alguns estudos, a magnitude da 
ressurgência foi maior quando a duração 
da fase de Eliminação foi menor (e.g., Lei-
tenberg, et al., 1975; ver também Sweeney & 
Shahan, 2013b). Em outros estudos, a dura-
ção da fase de Eliminação não influenciou 
a magnitude da ressurgência (e.g., Lieving & 
Lattal, 2003, Winterbauer, Lucke & Bouton, 
2013). 
Hoje sabemos que a ressurgência é 
um fenômeno replicável interssujeitos e 
também intrassujeitos (i.e., após a exposi-
ção repetida dos mesmos sujeitos ao pro-
cedimento de três fases; e.g., Cançado & 
Lattal, 2011; Lieving & Lattal, 2003). Além 
disso, sabemos que a magnitude da ressur-
gência é influenciada pela taxa de reforços 
em vigor nas fases de Treino (Podlesnik & 
Shahan, 2009, 2010) e Eliminação (Cança-
do, Abreu-Rodrigues & Aló, 2015; Sweeney 
& Shahan, 2013a). Em geral, taxas altas de 
reforços nessas duas fases produzem res-
surgência de maior magnitude do que ta-
xas baixas de reforços. Temos também 
evidências que unidades comportamentais 
mais complexas, como diferentes padrões 
temporais de resposta (Cançado & Lattal, 
2011) e sequências espaciais de respostas 
(Sánchez-Carrasco & Nieto, 2005; Reed 
& Morgan, 2006) ressurgem assim como 
respostas discretas como bicar um disco, 
pressionar uma barra ou um botão de res-
postas. Esse último achado pode ser rele-
vante para interpretar resultados de alguns 
estudos que mostram que ressurgência de 
maior magnitude é observada quando, na 
fase de Treino, a resposta alvo ocorre em 
taxas altas do que quando ocorre em taxas 
baixas (da Silva, et al., 2008; Reed & Mor-
gan, 2007). O que esses últimos resultados 
podem indicar é a ressurgência de padrões 
diferentes de respostas (i.e., taxas altas e ta-
xas baixas) estabelecidos na fase de Treino. 
Por fim, vale ressaltar que a ressurgência de 
respostas mantidas por contingências de 
reforçamento negativo (ao invés de contin-
gências de reforçamento positivo, como no 
experimento de Epstein) tem sido demons-
trada com humanos no laboratório (Bruzek 
et al., 2009; Alessandri, Lattal & Cançado, 
2015) e em ambientes não laboratoriais (e.g., 
Volkert, Lerman, Call & Trosclair-Lasserre, 
2009). 
Capítulo III | Ressurgência Comportamental
58
Epstein (1983) destacou a relevância 
do fenômeno da ressurgência para a análise 
de fenômenos como a criatividade e a re-
solução de problemas (ver também Epstein, 
1996). Mas a ressurgência pode ser relevan-
te também para compreender outros fenô-
menos, como, por exemplo, a recaída (e.g., 
de comportamentos mantidos por drogas, 
Podlesnik et al., 2006; ou de outros compor-
tamentos de relevância aplicada; Lieving, 
Hagopian, Long & O’Connor, 2004; ver 
também, Bouton, 2011; Podlesnik & Kelley, 
2015; e St Peter, 2015). Se você pensar no 
procedimento de três fases para o estudo da 
ressurgência, verá que o procedimento se 
adequa bem como um modelo experimen-
tal para o estudo da recaída. No laborató-
rio com não humanos, por exemplo, pode-
mos reforçar as respostas alvo com drogas 
na fase de Treino (e.g., álcool, Podlesnik et 
al.; ou cocaína Quick, Pyszczynski, Colston 
& Shahan, 2011) e as respostas alternativas 
com comida, na fase de Eliminação (a fase 
de Teste consistiria, assim como no estu-
do de Epstein, em descontinuar a comida 
que mantém as respostas alternativas). Em 
contextos aplicados, a resposta alvo pode 
ser um comportamento problema cuja fre-
quência temos interesse em reduzir (e.g., 
agressão, autoagressão, abuso de drogas e 
outras substâncias) e respostas alternativas 
são comumente aquelas mais apropriadas 
para o contexto em que vive o participante 
e que resultam de uma intervenção com-
portamental como reforçamento diferen-
cial de respostas alternativas (Marsteller & 
St Peter, 2014; Volkert et al., 2009). 
Recentemente, esforços de pesquisa-
dores e pesquisadoras em contextos labo-
ratoriais e não laboratoriais têm produzido 
achados interessantes sobre a ressurgência. 
Esses achados não apenas aumentam nosso 
conhecimento sobre o fenômeno, mas ser-
vem como base para lidar com o fenômeno 
nos mais diversos contextos. Consideran-
do-se a data de publicação do experimen-
to de Epstein (1983), a área de pesquisas 
sobre ressurgência é relativamente jovem. 
A ressurgência é um tema desafiador – é 
um fenômeno transitório (Sidman, 1960) e, 
como qualquer fenômeno transitório, exige 
esforço de pesquisadores e pesquisadoras 
na elaboração das melhores condições para 
seu estudo. Análises experimentais siste-
máticas dos efeitos de variáveis de controle 
já conhecidas sobre a ressurgência são in-
teressantes e necessárias. Ao conduzirmos 
tais análises, certamente descobriremos 
novas variáveis de controle e relações entre 
essas variáveis na determinação da ressur-
gência. 
 CONSIDERAÇÕES FINAIS 
Por quê estudar a ressurgência, ou a 
recorrência do comportamento de maneira 
geral, é interessante? Primeiramente, trata-
-se de um fenômeno natural e seu estudo, 
por si só, se justifica. Além disso, é útil co-
nhecer suas variáveis de controle para al-
terar sua probabilidade de ocorrência onde 
quer que isso seja necessário. Há contextos 
em que a recorrência de comportamentos 
Carlos Renato Xavier Cançado, Flávia Hauck, Ítalo S. C. Teixeira
59
é indesejável, mas ocorrem mesmo assim 
(e.g., a recorrência de comportamentos-pro-
blema e a recaída). Há outros contextos em 
que seria desejável e pode não ocorrer (e.g., 
em contextos de resolução de problemas e 
quando temos interesse no estabelecimento 
de comportamentos novos). 
No início de seu artigo, Epstein (1983) 
afirma que o fato que comportamentos pre-
viamente reforçados tendem a recorrer 
quando comportamentos atuais deixam de 
produzir reforços (i.e., ressurgência) teria 
“um potencial de aplicação amplo” (p. 391). 
Talvez apenas recentemente, dado o acu-
mulo de evidências experimentais sobre o 
fenômeno, tenhamos passado a explorar 
mais as implicações do estudo da ressur-
gência para uma análise experimental do 
comportamento e para a aplicação dos prin-
cípios comportamentais em contextos não 
laboratoriais. Durante aproximadamente 
20 anos, desde a publicação do trabalho 
de Epstein até a publicação de uma série 
de experimentos conduzidos por Lieving e 
Lattal (2003), estudos sobre a ressurgência 
foram escassos e envolveram comumente 
a análise de condições em que o fenômeno 
ocorre ou não (ver Pontes & Abreu-Rodri-
gues, 2015). Recentemente, contudo, aná-
lises experimentais sistemáticas têm sido 
direcionadas à descrição de variáveis que 
alteram não apenas a ocorrência da ressur-
gência, mas também sua magnitude. Um 
maior refinamento experimental permite 
descrever não apenas quando o fenômeno 
irá ocorrer, mas também especificar como 
e em que grau o fenômeno será observado. 
Essa é uma tarefa que aguarda aqueles in-
teressados na ressurgência e na recorrência 
de comportamentos em geral. 
 PARA SABER MAIS 
Lieving & Lattal (2003). Série de quatro ex-
perimentos conduzidos com pombos. Uma 
das primeiras análises experimentais sis-
temáticas sobre a ressurgência conduzida 
após a publicação do experimento de Eps-
tein (1983). 
Podlesnik, Gimenez-Gomez, & Shahan 
(2006). Experimento conduzido com ratos 
sobre a ressurgência de comportamentos 
previamente mantidos por álcool. Os auto-
res apresentam nesse artigo o procedimen-
to para o estudo da ressurgência como um 
modelo experimental da recaída. 
Podlesnik & Shahan (2009). Nesse artigo, 
os efeitos sobre a ressurgência de taxas de 
reforços diferenciais na fase de Treino (as-
sim como sobre outros fenômenos de recor-
rência, como o restabelecimento e a reno-
vação) são avaliados. Os autores propõem 
uma relação entre as variáveis que deter-
minam a ressurgência (e a recorrência em 
geral) e a resistência do comportamento à 
mudança. 
Bruzek, Thompson, & Peters (2009). Emdois experimentos conduzidos com hu-
manos, a ressurgência de comportamentos 
Capítulo III | Ressurgência Comportamental
60
mantidos previamente por contingências 
de reforçamento negativo (fuga) foi estuda-
da. 
Cançado, Abreu-Rodrigues, & Aló (2015). 
Em dois experimentos conduzidos com ra-
tos, os efeitos sobre a ressurgência de taxa 
de reforços diferenciais na fase de Elimina-
ção foram avaliados parametricamente. 
REFERÊNCIAS 
Alessandri, J., Lattal, K. A., & Cançado, C. 
R. X. (2015). The recurrence of negatively 
reinforced responding of humans. Journal 
of the Experimental Analysis of Behavior, 
104, 211–222. 
Antonitis, J. J. (1951). Response variability in 
the white rat during conditioning, extinc-
tion, and reconditioning. Journal of Experi-
mental Psychology, 42, 273-281. 
Bouton, M. E. (2011). Learning and the per-
sistence of appetite: Extinction and the 
motivation to eat and overeat. Physiology & 
Behavior, 103, 51–58. 
Bruzek, J. L., Thompson, R. H., & Peters, 
L. C. (2009). Resurgence of infant caregi-
ving responses. Journal of the Experimental 
Analysis of Behavior, 92, 327-343. 
Cançado, C. R. X., Abreu-Rodrigues, J., & 
Aló, R. M. (2015). Reinforcement rate and 
resurgence: A parametric analysis. Revista 
Mexicana de Análisis de la Conducta, 41, 
84-115. 
Cançado, C. R. X., & Lattal, K. A. (2011). Re-
surgence of temporal patterns of respon-
ding. Journal of the Experimental Analysis 
of Behavior, 95, 271-287. 
Carey, J. P. (1951). Reinstatement of previou-
sly learned responses under conditions of 
extinction: A study of “regression” [Abs-
tract]. American Psychologist, 6, 284. 
da Silva, S. P., Cançado, C. R. X., & Lattal, 
K. A. (2014). Resurgence in Siamese fighting 
fish, Betta splendens. Behavioural Proces-
ses, 103, 315-319. 
da Silva, S. P., Maxwell, M. E., & Lattal, K. 
A. (2008). Concurrent resurgence and beha-
vioral history. Journal of the Experimental 
Analysis of Behaviour, 90, 313-331. 
Doughty, A. H., Cash, J. D., Finch, E. A., 
Holloway, C., & Wallington, L. K. (2010). Ef-
fects of training history on resurgence in 
humans. Behavioural Processes, 83, 340-
343. 
Epstein, R. (1983). Resurgence of previou-
sly reinforced behavior during extinction. 
Behaviour Analysis Letter, 3, 391–397. 
Epstein, R. (1985). Extinction-induced re-
surgence: Preliminary investigations and 
possible applications. The Psychological Re-
cord, 35, 143-153. 
Carlos Renato Xavier Cançado, Flávia Hauck, Ítalo S. C. Teixeira
61
Epstein, R. (1996). Cognition, creativity & 
behavior: Selected essays. Westport, CT: 
Praeger 
Epstein, R. (2015). On the rediscovery of the 
principle of resurgence. Revista Mexicana 
de Análisis de la Conducta, 41, 19-43. 
Epstein, R., & Skinner, B. F. (1980). Resur-
gence of responding after the cessation of 
response-independent reinforcement. Pro-
ceedings of the National Academy of Scien-
ces of the United States of America, 77, 6251-
6253. 
Franks, G. J, & Lattal, K. A. (1976). Antece-
dent reinforcement schedule training and 
operant response reinstatement in rats. 
Animal Learning & Behavior, 4, 374-378. 
Laraway, S., Snycerski, S., Michael, J., & 
Poling, A. (2003). Motivating operations 
and terms to describe them: Some further 
refinements. Journal of Applied Behavior 
Analysis, 36, 407-414. 
Lattal, K. A., & St. Peter Pipkin, C. (2009). 
Resurgence of previously reinforced res-
ponding: Research and application. The 
Behavior Analyst Today, 10, 254-266. 
Leitenberg, H., Rawson, R. A., & Bath, K. B. 
(1970). Reinforcement of competing beha-
vior during extinction. Science, 169, 301-
303. 
Leitenberg, H., Rawson, R. A., & Mulick, J. 
A. (1975). Extinction and reinforcement of 
alternative behavior. Journal of Compara-
tive and Physiological Psychology, 88, 640-
652. 
Lieving, G. A., Hagopian, L. P., Long, E. S., 
& O’Connor, J. (2004). Response-class hie-
rarchies and resurgence of severe problem 
behavior. The Psychological Record, 54, 
621–634. 
Lieving, G. A, & Lattal, K. A. (2003). Recen-
cy, repeatability, and reinforcer retrench-
ment: An experimental analysis of resur-
gence. Journal of the Experimental Analysis 
of Behavior, 80, 217-233. 
Marsteller, T. M., & St Peter, C. C. (2014). Ef-
fects of fixed-time reinforcement schedules 
on resurgence of problem behavior. Journal 
of Applied Behavior Analysis, 47, 455-469. 
Miguel, C. F. (2000). O conceito de opera-
ção estabelecedora na análise do compor-
tamento. Psicologia: Teoria e Pesquisa, 16, 
259-267. 
Pavlov, I. P. (1927). Conditioned reflexes: An 
investigation of the physiological activity of 
the cerebral cortex. Londres: Oxford Uni-
versity Press. 
Podlesnik, C. A, Jimenez-Gomez, C., & 
Shahan, T. A. (2006). Resurgence of alcohol 
seeking produced by discontinuing non-
-drug reinforcement as an animal model of 
Capítulo III | Ressurgência Comportamental
62
drug relapse. Behavioural Pharmacology, 
17, 369-374. 
Podlesnik, C. A, & Kelley, M. E. (2015). Trans-
lational research on the relapse of operant 
behavior. Revista Mexicana de Análisis de 
la Conducta, 41, 226-251. 
Podlesnik, C. A, & Shahan, T. A. (2009). 
Behavioral momentum and relapse of ex-
tinguished operant responding. Learning & 
Behavior, 37, 357-364. 
Podlesnik, C. A., & Shahan, T. A. (2010). Ex-
tinction, relapse, and behavioral momen-
tum. Behavioural Processes, 84, 400-411. 
Pontes, T. R. N., & Abreu-Rodrigues, J. (2015). 
Ressurgência comportamental: Uma revi-
são. Acta Comportamentalia, 23, 339-353. 
Quick, S. L., Pyszczynski, A. D., Colston, K. 
A., & Shahan, T. A. (2011). Loss of alternative 
non-drug reinforcement induces relapse of 
cocaine-seeking in rats: Role of dopamine 
D(1) receptors. Neuropsychopharmacology, 
36, 1015–1020. 
Reed, P., & Morgan, T. A. (2006). Resurgence 
of response sequences during extinction in 
rats shows a primacy effect. Journal of the 
Experimental Analysis of Behavior, 86, 307-
315. 
Reed, P., & Morgan, T. a. (2007). Resurgence 
of behavior during extinction depends on 
previous rate of response. Learning & Beha-
vior, 35, 106–114. 
Reid, R. L. (1958). The role of the reinforcer 
as a stimulus. British Journal of Psychology, 
49, 202-209. 
Sánchez-Carrasco, L., & Nieto, J. (2005). 
Resurgence of three-response sequences 
in rats. Revista Mexicana de Análisis de la 
Conducta, 31, 215–226. 
Sidman, M. (1960). Tactics of scientific rese-
arch: Evaluating experimental data in psy-
chology. Boston: Authors Cooperative, Inc. 
Skinner, B. F. (2003). Ciência e Comporta-
mento Humano. (J. C. Todorov & R. Azzi, 
Trad.). São Paulo: Martins Fontes (original 
publicado em 1953). 
Skinner, B. F. (1984). An operant analysis 
of problem solving. Behavioral and Brain 
Sciences, 7, 583-613. 
Skinner, B. F. (1981). Selection by conse-
quences. Science, 213, 501–504. 
St Peter, C. C. (2015). Six reasons why applied 
behavior analysts should know about re-
surgence. Revista Mexicana de Análisis de 
la Conducta, 41, 252–268. 
Sweeney, M. M., & Shahan, T. A. (2013a). 
Effects of high, low, and thinning rates of 
alternative reinforcement on response eli-
mination and resurgence. Journal of the Ex-
perimental Analysis of Behavior, 100, 102-
Carlos Renato Xavier Cançado, Flávia Hauck, Ítalo S. C. Teixeira
63
116. 
Sweeney, M. M., & Shahan, T. A. (2013b). 
Behavioral momentum and resurgence : 
Effects of time in extinction and repeated 
resurgence tests. Learning & Behavior, 41, 
414-424. 
Volkert, V. M., Lerman, D. C., Call, N. A., & 
Trosclair-Lasserre, N. (2009). An evaluation 
of resurgence during treatment with func-
tional communication training. Journal of 
Applied Behavior Analysis, 42, 145-160. 
Wilson, K. G., & Hayes, S. C. (1996). Resur-
gence of derived stimulus relations. Journal 
of the Experimental Analysis of Behavior, 
66, 267-281. 
Winterbauer, N. E., Lucke, S., & Bouton, 
M. E. (2013). Some factors modulating the 
strength of resurgence after extinction of 
an instrumental behavior. Learning andMotivation, 44, 60-71. 
João Cláudio Todorov, Rafaela M. Fontes Azevedo
64
Clarice Lispector, 
tempo e consequências: 
considerações sobre 
contraste comportamental
João Cláudio Todorov 
Rafaela M. Fontes Azevedo 
Universidade de Brasília
Reynolds, G. S. (1961). Behavioral contrast. Journal of the Experimental Analysis 
Behavior, 4, 57-71.
“Observo em mim mesma as mudanças de estação: eu claramente mudo com elas”
Clarice Lispector
Capítulo IV | Contraste Comportamental
65
INTRODUÇÃO À ÁREA DE PES-
QUISA E CONTEXTUALIZAÇÃO 
DO EXPERIMENTO 
A noção de que o comportamento é 
selecionado por suas consequências é an-
tiga, anterior a Thorndike (e.g., 1911, 1927). 
Skinner (1957/1978) inicia seu livro sobre 
comportamento verbal com uma frase de 
impacto: “Os homens agem sobre o mundo, 
modificam-no e, por sua vez são modifica-
dos pelas consequências de sua ação” (p.15).
Consequências parecem ser a marca 
registrada da Análise do Comportamento, 
como demonstram alguns livros recentes 
(Biglan, 2015; Madden, 2013; McSweeney & 
Murphy, 2014a; Schneider, 2012). Mas con-
sequências não seguem comportamentos 
no vácuo. O contexto no qual o comporta-
mento ocorre também é relevante (Skinner, 
1953/2003). Skinner (1938) afirmou que, em-
bora a resposta possa ocorrer em diversas si-
tuações, apenas em parte dessas situações a 
sua emissão será efetiva em produzir refor-
ços. Assim, o contexto no qual o comporta-
mento ocorre (i.e., eventos antecedentes ao 
comportamento) acaba exercendo funções 
muito importantes por sinalizar quando e 
quais tipos de consequências estarão dispo-
níveis. Em função disso, o comportamento 
operante deve ser sempre compreendido a 
partir da contingência tríplice: Eventos que 
antecedem o comportamento (estímulos 
discriminativos), o próprio comportamento, 
e as consequências que seguem a sua emis-
são (reforço ou punição; e.g., Skinner, 1938, 
1953/2003).
 Os estímulos discriminativos (SD) 
podem ser qualquer variável presente no 
contexto atual do indivíduo. São estímulos 
que sinalizam a disponibilidade da conse-
quência e dão “dicas” sobre a probabilidade 
de o comportamento ser ou não reforçado 
ou punido. Quando determinadas consequ-
ências estão disponíveis apenas para res-
postas emitidas em um determinado con-
texto (na presença de determinado SD) e 
quando o indivíduo passa a responder ape-
nas nesse contexto, dizemos que o respon-
der é discriminado (Skinner, 1938). Porém, 
para sabermos se o responder é discrimi-
nado ou não é preciso que haja pelo menos 
dois contextos correlacionados diferencial-
mente com a produção da consequência 
(e.g. contextos diferentes que sinalizam a 
presença de tipos de consequências dife-
rentes, ou que sinalizam presença vs. au-
sência de consequências, ou mesmo que si-
nalizam diferentes relações entre a emissão 
da resposta e a apresentação do reforço). Ao 
observarmos mudanças no comportamento 
do indivíduo em função de mudanças nos 
estímulos antecedentes poderemos afirmar 
que há controle discriminativo, isto é, que o 
comportamento está sob o controle de estí-
mulos (Catania, 1999).
Controle discriminativo, portanto, se 
refere à influência que o contexto exerce 
sobre o comportamento (Moreira & Medei-
ros, 2007) e, para estuda-lo é preciso treinar 
o comportamento em contextos diferentes 
João Cláudio Todorov, Rafaela M. Fontes Azevedo
66
(na presença de estímulos distintos). Isto é, 
é preciso expor o indivíduo a situações nas 
quais a disponibilidade da consequência 
é diferencialmente correlacionada a dife-
rentes estímulos antecedentes. Por isso, o 
esquema mais tradicionalmente utilizado 
para investigar controle discriminativo tem 
sido o esquema múltiplo. 
Esquemas de reforçamento ou pu-
nição são relações condicionais entre o 
comportamento dos organismos e eventos 
no ambiente e são geralmente utilizados 
como variáveis independentes na Análi-
se do Comportamento (Ferster & Skinner, 
1957). Assim, ao estabelecer um esquema 
de reforçamento se estabelece uma rela-
ção “se, então” que indicará quais as con-
dições (e.g. número de respostas, interva-
lo de tempo necessário entre as respostas, 
etc.) para a apresentação da consequência. 
Por exemplo, em um esquema de razão fixa 
se estabelece um número fixo de respostas 
que deve ser emitido pelo organismo para 
que a consequência seja apresentada. Em 
um esquema de reforçamento, geralmente 
se estabelece também uma relação condi-
cional com o estímulo antecedente. Assim, 
a relação entre a resposta e a consequência 
depende do estímulo antecedente presente 
no momento: se na situação A o compor-
tamento B ocorrer, então a consequência C 
será apresentada (Todorov, 2002, 2012).
Como indicado anteriormente, um 
esquema comumente utilizado para de-
monstrar o controle estabelecido pelos estí-
mulos antecedentes é o esquema múltiplo. 
Em um esquema múltiplo, dois ou mais 
esquemas de reforçamento são correlacio-
nados a diferentes estímulos antecedentes. 
Cada um desses esquemas de reforçamento 
correlacionados a diferentes estímulos an-
tecedentes compõe o que se chama de com-
ponente (Ferster & Skinner, 1957). Em um 
experimento de laboratório com animais 
não-humanos podemos ter, por exemplo, 
um esquema múltiplo com dois compo-
nentes: em um sempre há uma luz acesa e 
a emissão da resposta é sempre seguida por 
comida e no outro não há luz e a resposta 
nunca é seguida por comida. Têm-se, assim, 
dois contextos diferentes (presença vs. au-
sência de luz) correlacionados com esque-
mas diferentes (reforço vs. extinção). Pode-
-se afirmar que o responder é discriminado, 
nesse exemplo, se o organismo responde 
mais na presença da luz do que na sua au-
sência. 
Embora no treino discriminativo 
simples seja comum a utilização de alter-
nação de estímulos antecedentes correla-
cionados a reforço e extinção (e.g. Hanson, 
1959; Skinner, 1938; Smith & Hoy, 1954), ge-
ralmente os experimentos com esquemas 
múltiplos utilizam dois ou mais componen-
tes nos quais diferentes esquemas de refor-
çamento (e.g. razão fixa ou variável, inter-
valo fixo ou variável) estão em vigor, sendo 
cada um sinalizado por um estímulo an-
tecedente diferente, porém, correlaciona-
dos a tipos semelhantes de consequências 
(Ferster & Skinner, 1957). Por exemplo, po-
Capítulo IV | Contraste Comportamental
67
demos ter um esquema múltiplo com dois 
componentes programados da seguinte 
forma: em um componente há sempre um 
tom e a consequência é produzida a partir 
de um esquema de razão fixa (a cada X res-
postas, a comida é apresentada) e no outro 
componente o tom está sempre ausente e 
a consequência é produzida a partir de um 
esquema de intervalo fixo (a comida é apre-
sentada para a primeira resposta emitida 
após X min). Nesse caso, pode-se afirmar 
que o responder é discriminado se for ob-
servado que a taxa e o padrão de respostas 
são diferenciados entre os componentes. 
Uma das utilidades do esquema múltiplo é, 
então, demonstrar como o comportamento 
muda em função de mudanças no contexto, 
dado que as mudanças no contexto sinali-
zam mudanças nas contingências em vigor. 
 Herrnstein e Brady (1958) afirmaram 
que o esquema múltiplo pode ser uma boa 
ferramenta para comparações intrassujei-
tos dentro de uma mesma sessão em função 
da independência entre o desempenho nos 
componentes. Porém, em diversos experi-
mentos (inclusive no experimento de Herr-
nstein & Brady) tornou-se evidente que os 
desempenhos entre os componentes podem 
não ser independentes, isto é, o que ocorre 
em um dos componentes de um esquema 
múltiplo pode influenciar o comportamen-
to que ocorre no outro componente. À mu-
dança do comportamento em um contexto 
(SD) em função de alterações nas condições 
em vigor em outro contexto (diferente SD) 
chama-se interação (Reynolds, 1961b). Essa 
interação entre os componentes do esque-
ma múltiplo pode ser estudada alterando-
-se as condições em um componente en-
quanto as condições no outro componente 
são mantidas constantes. Assim, oobjetivo 
ao se estudar a interação é observar como 
mudanças nas condições de um contexto 
afetam o comportamento em outro contex-
to inalterado.
 Diversos experimentos foram reali-
zados para investigar essa interação entre 
componentes (e.g. Findley, 1958, Herrick, 
Myers & Korotkin, 1959, Reynolds, 1961b, 
1961c) e o que se observou é que alterações 
que diminuem a taxa de respostas em um 
componente (e.g., extinção) geralmente 
produzem aumentos na taxa de respostas 
no componente inalterado. Além disso, al-
terações que aumentam a taxa de respostas 
em um componente produzem diminuições 
na taxa de respostas no componente inal-
terado. A esse efeito de interação foi dado 
o nome de contraste comportamental (con-
traste positivo, no primeiro caso, e contras-
te negativo no segundo). Assim, contraste 
comportamental se refere a uma mudança 
na taxa de respostas na presença de um 
estímulo que é oposta à mudança na taxa 
de respostas na presença de outro estímulo 
(Reynolds, 1961a). 
Embora o contraste seja um efeito 
comumente observado durante a formação 
de uma discriminação entre dois ou mais 
estímulos (e.g., quando um deles é corre-
lacionado ao reforço e o outro a extinção), 
João Cláudio Todorov, Rafaela M. Fontes Azevedo
68
o contraste ocorre também em condições 
em que há reforço programado na presença 
de ambos os estímulos, porém com varia-
ções na taxa de reforços entre eles. Findley 
(1958), por exemplo, relatou que a taxa de 
respostas em um componente, um esquema 
de intervalo variável (VI) 6 min, aumentou 
quando no outro componente, um VI maior 
do que 6 min programava uma menor taxa 
de reforços em relação ao VI 6 min. 
Porém, até a década de 1960, o que 
se observava nos experimentos realizados 
sobre contraste (e.g. Herrick, et al., 1959; 
Reynolds, 1961b) era que a taxa de respostas 
covariava consistentemente com a taxa de 
reforços (i.e., diminuições na taxa de refor-
ços eram seguidas de diminuições na taxa 
de respostas e aumentos na taxa de refor-
ços eram seguidos por aumentos na taxa 
de respostas) e não se sabia dizer qual das 
duas variáveis era responsável pelo con-
traste comportamental. Permanecia então a 
questão: A taxa de respostas no componen-
te inalterado aumenta porque a taxa de res-
postas do segundo componente diminui ou 
porque a taxa de reforços do segundo com-
ponente diminui? Por isso, em 1961, Rey-
nolds resolveu conduzir um estudo para 
responder a essa questão.
DESCRIÇÃO DO EXPERIMENTO
Objetivo e Método
A proposta de Reynolds (1961a) foi 
conduzir um estudo no qual taxa de refor-
ços e taxa de respostas pudessem ser expe-
rimentalmente isoladas para observar como 
cada variável influenciava o contraste e as-
sim, poder verificar se o fenômeno era fun-
ção de mudanças na taxa de reforços ou na 
taxa de respostas. Reynolds encontrou uma 
solução relativamente simples e interes-
sante para responder a sua pergunta: Dimi-
nuir a taxa de respostas sem alterar a taxa 
de reforços. 
Para isso, Reynolds (1961a) utilizou 
quatro pombos e uma caixa operante com 
um disco que poderia ser iluminado por 
quatro cores diferentes. Durante o experi-
mento, cada pombo era colocado na câma-
ra experimental e respostas de bicar o disco 
produziam acesso a comida. Reynolds di-
vidiu o seu estudo em quatro procedimen-
tos subdivididos em várias fases. Em cada 
procedimento havia um esquema múltiplo 
com dois componentes e, em cada compo-
nente, o disco era iluminado por uma cor 
diferente (SD). Diversos tipos de alterações 
foram feitas em um dos componentes do 
múltiplo a fim de verificar quais variações 
nesse componente levariam a mudanças 
na taxa de respostas no outro componen-
te, que permanecia inalterado ao longo das 
fases. 
Em todos os procedimentos, inicial-
mente, um VI 3 min esteve em vigor em 
cada componente do múltiplo. Isto é, em 
média, a primeira resposta após 3 min pro-
duzia o reforço. Cada componente ficava 
em vigor por 3 min e eram apresentados de 
Capítulo IV | Contraste Comportamental
69
maneira alternada. Em cada sessão, cada 
componente era apresentado 30 vezes. Os 
procedimentos variaram em relação às al-
terações realizadas em um dos componen-
tes, sendo no primeiro sempre mantido um 
VI 3 min (de agora em diante, chamaremos 
o componente mantido com o VI 3 min de 
componente constante e o componente no 
qual as manipulações foram realizadas de 
componente alterado). 
No Procedimento I, para o compo-
nente alterado foi programado um timeout 
em umas das fases (todas as luzes da caixa 
operante eram apagadas e não havia apre-
sentação de reforço para nenhuma das res-
postas emitidas) e extinção em outra fase 
(o estímulo continuava a ser apresentado, 
porém, não havia apresentação do reforço). 
No Procedimento II, para o componente al-
terado, foi programado um esquema de re-
forçamento diferencial de outros compor-
tamentos (DRO¹) 50 ou 75 s para uma das 
fases e extinção para outra. A programação 
do DRO no Procedimento II teve como ob-
jetivo garantir que a taxa de respostas di-
minuísse sem que houvesse uma redução 
na taxa de reforços, dado que sempre que 
os pombos não respondessem (por 50 ou 75 
s) o reforço seria apresentado. A ordem de 
mudança para DRO ou extinção, no com-
ponente alterado, foi contrabalanceada en-
tre os pombos (i.e., para alguns pombos o 
componente foi alterado para o DRO e só 
depois para extinção e para outros pombos 
a ordem de alteração foi inversa). O Proce-
dimento III foi uma combinação dos dois 
procedimentos anteriores e a manipula-
ção feita no componente alterado foi uma 
combinação do timeout com o DRO, ou 
seja, todas as luzes da caixa experimental 
eram apagadas e reforços eram produzidos 
se os pombos não respondessem durante o 
intervalo do DRO. Um procedimento adi-
cional foi realizado para controlar o efeito 
do aumento na taxa de reforços sob o DRO 
e, para isso, ao final da última sessão do 
Procedimento III, aumentou-se o peso dos 
animais (i.e., diminuiu-se a privação) e, en-
tão, no dia seguinte os animais foram nova-
mente expostos às mesmas condições que 
haviam sido programadas no Procedimento 
II, no qual para o componente alterado foi 
programado um DRO em uma fase, e extin-
ção na fase seguinte. 
As manipulações realizadas por Rey-
nolds (1961a) possibilitaram a comparação 
de condições nas quais a diminuição da 
taxa de respostas estava correlacionada à 
diminuição na taxa de reforços (i.e., alteran-
do o segundo componente para extinção ou 
timeout) e condições nas quais a diminui-
ção da taxa de respostas não estava corre-
lacionada à diminuição na taxa de reforços 
(i.e., alterando o segundo componente para 
um DRO). Dessa forma, foi possível iso-
lar experimentalmente os efeitos da taxa 
de respostas e da taxa de reforços sobre o 
contraste comportamental. Se o contraste 
1 Em um DRO, o reforço só é apresentado se o organismo cumprir o 
intervalo estabelecido sem emitir determinada resposta. No presente 
experimento, caso o pombo passasse 50 ou 75 s sem bicar o disco a 
comida era apresentada.
João Cláudio Todorov, Rafaela M. Fontes Azevedo
70
dependesse de variações apenas na taxa 
de respostas, em todas as condições o con-
traste deveria ocorrer, já que em todas ha-
veria uma redução da taxa de resposta no 
componente alterado. Porém, se é a altera-
ção na taxa de reforços a variável relevan-
te, então, o contraste só deveria ocorrer nas 
condições nas quais houvesse variação da 
taxa de reforços no componente alterado 
(i.e., nas condições em que foram progra-
mados timeout ou extinção) e não deveria 
ocorrer nas condições em que o DRO estava 
em vigor (i.e., a taxa de reforços nessa con-
dição não era alterada). Portanto, se a taxa 
de respostas no componente constante au-
mentasse quando mudanças fossem feitas 
no componente alterado em todas as con-
dições, a taxa de respostas poderia ser en-
tendida como variável mais relevante. No 
entanto, se a taxa de respostas do compo-
nente constante só variasse nas condições 
em que houve mudançasna taxa de refor-
ços no componente alterado, então a taxa 
de reforços seria a principal variável deter-
minante do contraste.
Resultados e Discussão
Os resultados indicaram que altera-
ções na taxa de reforços, e não na taxa de 
respostas, em um dos componentes do múl-
tiplo é a variável que determina o contraste 
comportamental (Reynolds, 1961a). Tanto 
timeout quanto extinção no componente 
alterado produziram aumentos na taxa de 
respostas do componente constante. Po-
rém, quando o DRO estava em vigor no 
componente alterado, combinado ou não 
com timeout, aumentos na taxa de respos-
tas do componente constante (independen-
te do peso corporal dos pombos) não foram 
observados. De maneira geral, o contraste 
foi observado nas condições onde não ha-
via reforços em um componente (timeout 
e extinção), mas não foi observado quando 
havia reforço disponível nesse componen-
te, embora a taxa de respostas durante o 
componente alterado tenha diminuído em 
todas as condições. 
Reynolds (1961a) propôs duas expli-
cações para a não ocorrência do contraste 
nas condições em que um DRO estava em 
vigor no componente alterado. Uma expli-
cação é que o contraste pode não ter acon-
tecido porque, sob o DRO, pausas (i.e., não 
bicar o disco) foram reforçadas e isso pode 
ter induzido a ocorrência de pausas tam-
bém no componente constante, em que o 
VI 3 min continuava em vigor. Uma outra 
explicação é que o contraste poderia não 
ter ocorrido porque a diminuição na taxa de 
reforços, e não de respostas, é a condição 
necessária para a ocorrência do contraste 
e, dessa forma, o DRO eliminou este efeito 
uma vez que não houve redução na taxa de 
reforços sob esse esquema, como indicado 
anteriormente.
Como o aumento da taxa de respos-
tas foi imediato no componente constante 
(VI 3 min) quando o DRO foi suspenso no 
componente alterado (i.e., quando extinção 
estava em vigor nesse componente), Rey-
Capítulo IV | Contraste Comportamental
71
nolds (1961a) afirmou que a taxa de reforços 
é a variável mais relevante para a ocorrên-
cia do contraste. Para Reynolds, é a altera-
ção na frequência relativa de reforços (i.e., a 
frequência de reforços na presença de um 
estímulo em relação à frequência de refor-
ços na presença de ambos os estímulos) que 
causa as alterações na taxa de respostas 
que descrevemos como contraste. 
DESDOBRAMENTOS
O experimento de Reynolds (1961a) 
sugere que as consequências que são pro-
gramadas em um contexto afetam não só 
o que fazemos naquele contexto, mas tam-
bém o que fazemos em outros contextos. 
Portanto, o que um organismo faz em uma 
situação depende não só das consequências 
disponíveis naquela situação, mas também 
das consequências disponíveis em situa-
ções diferentes (ver também Herrnstein, 
1961, 1970). 
Assim, para que seja possível com-
preender o que um indivíduo faz em um 
determinado contexto muitas vezes será 
preciso observar também o que ele faz em 
outras situações e que tipos de consequ-
ências ele tem disponível de uma maneira 
geral e não apenas em uma determinada 
ocasião. É preciso, então, adotar uma pers-
pectiva relativa e entender que a função de 
um estímulo pode ser não só a de sinalizar 
as consequências disponíveis naquele con-
texto, mas as consequências disponíveis 
naquele contexto em relação a todos os ou-
tros.
A partir da pesquisa de Reynolds 
(1961a) muitas outras investigações foram 
realizadas a fim de verificar o efeito da taxa 
de reforços sobre a ocorrência e a magni-
tude do contraste, principalmente com o 
objetivo de responder se a taxa de refor-
ços seria a única variável responsável pela 
ocorrência do contraste, se seria a variável 
principal, e que outras variáveis e explica-
ções seriam possíveis. 
Experimentos manipulando diver-
sos tipos de esquemas em um dos com-
ponentes, para produzir diferentes taxas 
de respostas sem alterar as taxas de re-
forços entre os componentes foram reali-
zados, corroborando a ideia de que a taxa 
de reforços é realmente mais relevante do 
que a taxa de respostas na determinação 
do contraste (e.g. Bloomfield, 1967; Nevin, 
1968; Reynolds, 1961d; Zuriff, 1970). Dado, 
então, que a taxa relativa de reforços é 
uma variável relevante para a ocorrência 
do contraste, também foram estabelecidas 
relações entre contraste e a Lei da Iguala-
ção (e.g. McLean & White, 1983; Williams 
& Wixted, 1986). A Lei da Igualação prediz 
que em situações de escolha (i.e. esquemas 
concorrentes, nos quais os dois componen-
tes são apresentados simultaneamente e 
o organismo deve escolher responder em 
ou outro componente) a taxa de respostas 
se igualará à taxa de reforços disponíveis. 
Assim, situações de escolha caracteriza-
João Cláudio Todorov, Rafaela M. Fontes Azevedo
72
riam o caso mais evidente de interação, já 
que a maneira como eu me comporto em 
relação a uma das opções necessariamente 
afetará o meu comportamento em relação à 
outra opção, dado que ambas as respostas 
não podem ser emitidas ao mesmo tempo. 
Assim como a distribuição de respostas em 
esquemas concorrentes é função da distri-
buição dos reforços entre os componentes, 
essa interação também parece ocorrer mes-
mo quando as opções são apresentadas de 
maneira sucessiva, e não simultânea, como 
é o caso dos procedimentos para o estudo 
do contraste (i.e., esquemas múltiplos). Em 
ambos os casos, então, temos evidencia de 
como a distribuição de reforços pode afetar 
a distribuição das respostas. 
Outra variável que parece afetar a 
ocorrência do contraste é a duração dos 
componentes, e muitos estudos foram con-
duzidos a fim de se investigar essa relação. 
De maneira geral, observa-se que a magni-
tude do contraste é maior quanto menor for 
a duração do componente (e.g. Charman & 
Davison, 1982; Hinson, Malone, McNally & 
Rowe, 1978; Shimp & Wheatley, 1971; Todo-
rov, 1972). 
 O estudo de Reynolds (1961a) foi 
um primeiro passo para uma compreensão 
mais precisa sobre a ocorrência do con-
traste, pois foi o primeiro a isolar os efeitos 
de taxa de respostas e de reforços. Embo-
ra seus resultados tenham indicado a taxa 
relativa de reforços como a principal vari-
ável responsável pela ocorrência do con-
traste, desde então diversas investigações 
tem sido conduzidas a fim de se chegar a 
um entendimento mais claro e a uma des-
crição mais acurada desse fenômeno (ver 
Freeman, 1971; e Williams, 1983).
CONSIDERAÇÕES FINAIS
 A conclusão de que é alteração da 
taxa de reforços que produz a ocorrência do 
contraste, entretanto, deve ser considerada 
com cautela. Reynolds e Limpo (1968), por 
exemplo, conduziram um experimento uti-
lizando um esquema de reforçamento dife-
rencial de taxas baixas (DRL) e observaram 
que a taxa de respostas do componente 
constante aumenta, apesar da taxa relativa 
de reforços diminuir em relação à linha de 
base. 
Embora alterações na taxa relativa de 
reforços pareçam estar diretamente relacio-
nadas à ocorrência do contraste, sendo re-
plicada em diversos trabalhos (e.g. Catania, 
1961; Reynolds, 1963; Wilton & Gay, 1969), 
essa pode não ser a única variável de con-
trole (e.g. Davison & Ferguson, 1978; Wilkie 
1977; Williams, 1980). O mais importante a 
ser considerado na literatura sobre contras-
te e sobre o trabalho de Reynolds (1961a), 
especificamente, é o papel que outros con-
textos (passados e futuros) exercem sobre o 
que acontece no momento atual. 
Trabalhos publicados nos anos 1960 
e 1970 foram decisivos para determinar o 
Capítulo IV | Contraste Comportamental
73
progresso da Análise do Comportamento 
nessa questão, destacando a função do con-
texto na determinação do comportamento 
e demonstrando que diversos aspectos do 
contexto exercem controle sobre o com-
portamento dos organismos. Esses diversos 
aspectos devem, então, ser considerados ao 
se analisar o que um organismo faz agora e 
por quê faz. Para compreender o compor-
tamento atual de um organismo é preciso 
levar em conta que seu comportamento é 
influenciado não só pela contingência a 
qual estáexposto, mas também pelo que 
mais está acontecendo no ambiente na-
quele momento, ou seja, todas as demais 
contingências disponíveis que concorrem 
simultaneamente. Assim, para entender 
o que o indivíduo faz precisamos analisar 
todas as outras opções do que ele poderia 
estar fazendo e todas as consequências pro-
gramadas para esses comportamentos con-
correntes (Herrnstein, 1961, 1970). 
O comportamento atual pode ser 
influenciado ainda por sinais do que vai 
acontecer no futuro muito próximo (Rey-
nolds, 1961a, 1961b, 1961c; Reynolds & Lim-
po, 1968) e também do que já ocorreu no 
passado, e assim, a ordem de ocorrência 
dos eventos (o que o indivíduo acabou de 
fazer e o que ele vai fazer em seguida) pode 
controlar também o seu comportamen-
to atual (e.g. Catania & Gill, 1964; Nevin & 
Shettleworth, 1966; Terrace, 1966a). Dessa 
forma, ao analisarmos o papel do contexto 
é preciso compreendê-lo de modo amplo e 
dinâmico, tendo em vista circunstâncias e 
variáveis passadas, presentes e futuras que 
podem atuar no controle do comportamen-
to atual de um organismo.
Essa noção de interação entre dife-
rentes contextos pode ser especialmente 
relevante no contexto aplicado e principal-
mente no tratamento de comportamentos 
problema. Gross e Drabman (1981) fizeram 
uma revisão de estudos sobre contraste 
comportamental realizados com humanos 
que demonstram a ocorrência do fenôme-
no. Uma das evidências que se tem é de que, 
embora alguns tratamentos sejam eficazes 
em reduzir o comportamento problema em 
determinados contextos, esse mesmo com-
portamento pode aumentar de frequência 
em outros contextos não correlacionados 
ao tratamento (e.g. redução de comporta-
mentos inapropriados em casa, mas au-
mento desses mesmos comportamentos 
na escola), caracterizando assim um efeito 
de contraste comportamental. Então, ao se 
pensar em intervenções comportamentais 
é preciso sempre lembrar que os contextos 
não podem ser compreendidos de maneira 
isolada e que alterações em um contexto 
podem acarretar mudanças comportamen-
tais em outros contextos aparentemente 
não correlacionados. 
PARA SABER MAIS
Terrace (1966b). Investigou se o uso de um 
treino de discriminação mais extenso e uti-
lizando um procedimento de aprendizagem 
João Cláudio Todorov, Rafaela M. Fontes Azevedo
74
sem erros pode eliminar o contraste com-
portamental. 
Henke, Allen, & Davison (1972). Investi-
garam a função da amídala cerebelosa na 
ocorrência de contraste, demonstrando di-
ferenças entre ratos com a região lesionada 
e ratos sem lesões na região. 
Koegel, Egel, & Williams (1980). Examina-
ram a ocorrência de contraste em interven-
ções comportamentais com crianças com 
diagnóstico de autismo. 
Killeen (2014). Propôs uma nova teoria ex-
plicativa para a ocorrência do contraste.
Boyle (2015). Realizou uma investigação 
translacional sobre contraste comporta-
mental, avaliando a influência da ordem 
dos contextos e de efeitos intrassessão em 
adultos com deficiência intelectual.
REFERÊNCIAS
Biglan, A. (2015). The nurture effect. Oakland, 
CA: New Harbinger Publications.
Boyle, M. A. (2015). A Translational Investi-
gation of Positive and Negative Behavioral 
Contrast (Tese de Doutorado). Utah State 
University, Logan. Retirada de All Gradu-
ate Theses and Dissertations. (Paper 4234).
Bloomfield, T. M. (1967). Behavioral con-
trast and relative reinforcement frequency 
in two multiple schedules. Journal of the 
Experimental Analysis of Behavior, 10, 151-
158.
Catania, A. C. (1961). Behavioral contrast 
in a multiple and concurrent schedule of 
reinforcement. Journal of the Experimental 
Analysis of Behavior, 4, 335-342.
Catania, C.A. (1999). Aprendizagem: com-
portamento, linguagem e cognição. (Trad. 
Deisy das Graça de Souza). Porto Alegre: 
Artmed.
Catania, A. C., & Gill, C. A. (1964). Inhibi-
tion and behavioral contrast. Psychonomic 
Science, 1, 257-258.
Charman, L., & Davison, M. (1982). On the 
effects of component durations and compo-
nent reinforcement rates in multiple sche-
dules. Journal of the Experimental Analysis 
of Behavior, 37, 417–439. 
Davison, M., & Ferguson, A. (1978). The ef-
fects of different component response re-
quirements in multiple and concurrent 
schedules. Journal of the Experimental 
Analysis of Behavior, 29, 283–295. 
Ferster, C. B., & Skinner, B. F. (1957). Sche-
dules of reinforcement. New York: Apple-
ton-Century-Crofts.
Findley, J. D. (1958). Preference and swit-
ching under concurrent scheduling. Journal 
of the Experimental Analysis of Behavior, 1, 
Capítulo IV | Contraste Comportamental
75
123-144.
Gross, A. M., & Drabman, R. S. (1981). Beha-
vioral contrast and behavioral therapy. 
Behavior Therapy, 12, 231-246.
Hanson, H. M. (1959). Effects of discrimi-
nation training on stimulus generalization. 
Journal of Experimental Psychology, 58, 
321-334.
Henke, P. G., Allen, J. D., & Davison, C. 
(1972). Effect of lesions in the amygdala on 
behavioral contrast. Physiology and Beha-
vior, 8,173-176. 
 Herrick R. M., Myers J. L., & Korotkin A. L. 
(1959). Changes in Sd and Sdelta rates du-
ring the development of an operant discri-
mination. Journal of Comparative and Phy-
siological Psychology, 52, 359–363.
Herrnstein, R. J. (1961). Relative and absolu-
te strength of response as a function of fre-
quency of reinforcement. Journal of the Ex-
perimental Analysis of Behavior, 4, 267-272.
Herrnstein, R. J. (1970). On the law of ef-
fect. Journal of the Experimental Analysis of 
Behavior, 13, 243–266. 
Herrnstein, R. J., & Brady, J. V. (1958). Inte-
ractions among components of a multiple 
schedule. Journal of Experimental Analysis 
of Behavior, 1, 293-301.
Hinson, J. M., Malone, J. C., McNally, K. A., 
& Rowe, D. W. (1978). Effects of component 
length and of the transitions among com-
ponents in multiple schedules. Journal of 
the Experimental Analysis of Behavior, 29, 
3-16.
Killeen, P. R. (2014). A theory of behavio-
ral contrast. Journal of the Experimental 
Analysis of Behavior, 102, 363-390.
Koegel, R. L., Egel, A. L., & Williams, J. A. 
(1980). Behavioral contrast and generali-
zation across settings in the treatment of 
autistic children. Journal of Experimental 
Child Psychology, 30, 422-437.
Madden, G. J. (2013). APA handbook of 
behavior analysis. Washington, DC: Ameri-
can Psychological Association.
McLean, A. P., & White, K. G. (1983). Tem-
poral constraint on choice: Sensitivity and 
bias in multiple schedules. Journal of the 
Experimental Analysis of Behavior, 39, 405-
426.
McSweeney, F. K., & Murphy, E. S. (Eds.). 
(2014). The Wiley-Blackwell handbook of 
operant and classical conditioning. Oxford: 
John Wiley & Sons.
Moreira, M. B., & Medeiros, C. A. (2007). 
Princípios Básicos de Análise do Comporta-
mento. Porto Alegre: Artmed.
Nevin, J. A. (1968). Differential reinforce-
ment and stimulus control of not respon-
João Cláudio Todorov, Rafaela M. Fontes Azevedo
76
ding. Journal of the Experimental Analysis 
of Behavior, 11, 715-726.
Nevin, J. A., & Shettleworth, S. J. (1966). An 
analysis of contrast effects in multiple sche-
dules. Journal of the Experimental Analysis 
of Behavior, 9, 305-315.
Reynolds, G. S. (1961a). Behavioral contrast. 
Journal of the Experimental Analysis Beha-
vior, 4, 57-71.
Reynolds, G. S. (1961b). An analysis of inte-
ractions in a multiple schedule. Journal of 
the Experimental Analysis of Behavior, 4, 
107-117.
Reynolds, G. S. (1961c). Contrast, generali-
zation and the process of discrimination. 
Journal of the Experimental Analysis of 
Behavior, 4, 289-294.
Reynolds, G. S. (1961d). Relativity of res-
ponse rate and reinforcement frequency in 
a multiple schedule. Journal of the Experi-
mental Analysis of Behavior, 4, 179-184.
Reynolds, G. S. (1963). Some limitations on 
behavioral contrast and induction during 
successive discrimination. Journal of the 
Experimental Analysis of Behavior, 6, 131-
139. 
Reynolds, G. S., & Limpo, A. J. (1968). On 
some causes of behavioral contrast.Journal 
of the Experimental Analysis of Behavior, 11, 
543-547. 
Schneider, S. C. (2012). The science of conse-
quences. New York: Prometheus Books.
Shimp, C. P., & Wheatley, K. L. (1971). Ma-
tching to relative reinforcement frequency 
in multiple schedules with a short compo-
nent duration. Journal of the Experimental 
Analysis of Behavior, 15, 205-210.
Skinner, B. F. (1938). The behavior of orga-
nisms: An experimental analysis. New York: 
Appleton-Century-Crofts.
Skinner, B. F. (1978). O comportamento ver-
bal. São Paulo: Cultrix (Obra original publi-
cada em 1957).
Skinner, B. F. (2003). Ciência e comporta-
mento humano (11ª ed.). (Trad. de J. C. To-
dorov e R. Azzi). São Paulo: Martins Fontes. 
(Obra original publicada em 1953).
Smith, M. H., & Hoy, W. J. (1954). Rate of 
response during operant discrimination. 
Journal of Experimental Psychology, 48, 
259–264.
Terrace, H. S. (1966a). Stimulus control. In 
W. K. Honing (Ed.). Operant behavior: Are-
as of research and application. New York: 
Appleton-Century-Crofts.
Terrace, H. S. (1966b). Behavioral contrast 
and the peak shift: Effects of extended dis-
crimination training. Journal of the Experi-
mental Analysis of Behavior, 9, 613-617.
Capítulo IV | Contraste Comportamental
77
Thorndike, E. L. (1911). Animal intelligence. 
New York: Macmillan.
Thorndike, E. L. (1927). The law of effect. 
The American Journal of Psychology, 39, 
212-222. 
Todorov, J. C. (1972). Component duration 
and relative response rates in multiple sche-
dules. Journal of the Experimental Analysis 
of Behavior, 17, 45-49.
Todorov, J. C. (2002). A evolução do conceito 
de operante. Psicologia: Teoria e Pesquisa, 
18, 123-127.
Todorov, J. C, (2012). Metacontingências e a 
análise comportamental de práticas cultu-
rais. Clínica e Cultura, 1, 36-45.
Wilkie, D. M. (1977). Behavioral contrast 
produced by a signaled decrease in local 
rate of reinforcement. Learning and Moti-
vation, 8, 182-193.
Williams, B. A. (1980). Contrast, signaled 
reinforcement, and the relative law of ef-
fect. American Journal of Psychology, 93, 
617-629.
Williams, B. A. (1983). Another look at con-
trast in multiple schedules. Journal of the 
Experimental Analysis of Behavior, 39, 345-
284.
Williams, B. A., & Wixted, J. T. (1986). An 
equation for behavioral contrast. Journal of 
the Experimental Analysis of Behavior, 45, 
47-62.
Wilton, R. N., & Gay, R. A. (1969). Behavio-
ral contrast in one component of a multiple 
schedule as a function of the reinforcement 
conditions operating in the following com-
ponent. Journal of the Experimental Analy-
sis of Behavior, 12, 239-246. 
Zuriff, G. E. (1970). A comparison of varia-
ble-ratio and variable-interval schedules of 
reinforcement. Journal of the Experimental 
Analysis of Behavior, 13, 369-374.
Cristiano Coelho 
78
Da frequência absoluta 
à frequência relativa 
como unidade de análise 
do comportamento
Cristiano Coelho 
Pontifícia Universidade Católica de Goiás
Herrnstein, R. J. (1961). Relative and Absolute Strength of Response as a Function of Frequency 
of Reinforcement. Journal of the Experimental Analysis of Behavior, 4(3), 267-272.
“Você não veio aqui para fazer a escolha. Você já a fez. Você está aqui para tentar 
entender porque fez essa escolha”
O Oráculo (The Matrix Reloaded, Irmãos Wachowski)
Capítulo V | Escolha
79
INTRODUÇÃO À ÁREA DE PES-
QUISA E CONTEXTUALIZAÇÃO 
DO EXPERIMENTO
 Skinner (1950) deu os primeiros pas-
sos para uma compreensão do estudo do 
comportamento de escolha na Análise do 
Comportamento ao propor que responder 
a um dentre dois estímulos é escolha, não 
o resultado desta escolha (como propõe 
o senso comum). Já preferência seria uma 
medida do número de respostas em uma 
alternativa em relação à outra, relacionan-
do-se à alternação de respostas a cada es-
tímulo disponível. Dessa forma, em vez de 
tomar a escolha como um processo inferido 
pré-comportamental, visão característica 
de concepções que baseavam suas explica-
ções em processos mentais vigentes à épo-
ca, Skinner focou na a emissão de respostas 
como a escolha em si. Com isso, caracte-
rizou-a como um padrão comportamental 
mais amplo, relacionado a outras variáveis 
que não os supostos processos decisórios 
internos. 
Podemos dizer que bicar um dentre 
dois discos disponíveis, estudar em vez de 
ir para a festa na véspera da prova ou dizer 
“te amo” quando solicitado pela namorada 
em vez de dizer que quer terminar, seriam 
as escolhas e não os produtos da escolha. 
Adicionalmente, bicar mais vezes um dis-
co que outro, ir mais vezes à balada que es-
tudar na véspera da prova e dizer mais “te 
amo” ilustrariam as preferências por cada 
uma dessas alternativas, e estariam rela-
cionadas às suas respectivas consequên-
cias. Essa formulação apresentou avanços 
na compreensão do controle do comporta-
mento operante, mas ainda se concentrou 
na consequenciação direta de cada respos-
ta independentemente das consequências 
para respostas alternativas. No exemplo 
do pombo acima, as respostas a cada disco 
eram vistas como influenciadas apenas por 
seus próprios reforços, sem uma influência 
direta pelos reforços disponíveis para ou-
tras alternativas. Isso teria como implicação 
que, ao aumentar a frequência de reforços 
em um dos discos, a taxa absoluta de res-
postas a esse disco aumentaria, sem inter-
ferir na taxa de respostas ao outro disco. 
Mesmo assim, Skinner antecipou a noção 
de igualação ao obter uma proporcionali-
dade nas taxas absolutas de respostas entre 
dois esquemas, conforme suas respectivas 
taxas absolutas de reforços. 
Condições que envolviam essas si-
tuações foram exploradas de forma siste-
mática posteriormente por Ferster e Skinner 
(1957) em experimentos sobre o compor-
tamento em esquemas concorrentes, nos 
quais dois (ou mais) esquemas de reforça-
mento permanecem em vigor simultanea-
mente para diferentes respostas incompa-
tíveis de serem emitidas ao mesmo tempo. 
Em arranjos experimentais de esquemas 
concorrentes, cada esquema é vinculado a 
diferentes operandos que diferem com re-
lação à posição (como dois discos ou duas 
barras), cor ou outra propriedade, e permi-
tem a mensuração das taxas e distribuições 
Cristiano Coelho 
80
das diferentes respostas ao longo do tempo. 
Podemos ter dois discos em uma parede da 
caixa experimental dispostos lado a lado, 
cada um iluminado por uma cor; respos-
tas a um dos discos podem ser reforçadas 
intermitentemente a cada 30 segundos e 
respostas ao outro disco podem ser refor-
çadas a cada 60 segundos, por exemplo, e 
as duas respostas não podem ser emitidas 
ao mesmo tempo. Esse procedimento, que 
passou a ser o padrão no estudo de escolha, 
capta a noção básica de Skinner (1950). Os 
estudos anteriores a Herrnstein (1961) con-
centraram-se nas análises da suspensão 
dessas consequências sobre respostas con-
correntes e dos efeitos de consequências, 
que mostravam regularidades nos padrões 
e distribuição de respostas: Ferster e Skin-
ner (1957) investigaram sistematicamente 
em várias condições que as respostas em 
esquemas concorrentes com dois operan-
dos localmente separados apresentavam os 
mesmos padrões obtidos em esquemas sim-
ples; Findley (1958) estendeu esses achados 
para situações experimentais com os dois 
esquemas associados ao mesmo operando, 
sinalizado por cores diferentes de acordo 
com o esquema no qual o pombo respondia, 
e as cores e o respectivo esquema modifica-
dos quando o pombo emitia uma resposta 
em um disco de mudança. De acordo com 
Davison (2012), estes trabalhos iniciais es-
tavam preocupados em descrever essas re-
gularidades em vez de se aprofundarem em 
medidas quantitativas. 
A busca por descrições quantitativas 
começou a se desenvolver com Herrnstein 
(1958) ao propor que devido às respostas em 
esquemas concorrentes serem incompatí-
veis, haveria “a possibilidade de estudar es-
colha como um processo comportamental” 
(p. 35). De acordo com ele, porém, o desen-
volvimento da área careciade dados que 
explicitassem como a disponibilização de 
consequências para respostas incompatí-
veis levaria à semelhança na proporciona-
lidade entre os reforços obtidos e respostas 
emitidas nas duas alternativas que os da-
dos sugeriam, isto é, como uma alternativa 
com uma frequência de reforços duas vezes 
maior que a outra levava a um responder 
duas vezes maior naquela alternativa. 
Herrnstein (1958) obteve dados de 
distribuição de respostas entre dois es-
quemas concorrentes de razão fixa (FR), 
com três pombos. Nesse experimento, de 
um total de 40 respostas a serem emitidas 
para cada reforço, foi manipulado o núme-
ro de respostas necessárias em cada disco 
para a liberação do reforço em diferentes 
condições. A proporção de respostas nas 
alternativas se aproximou das proporções 
programadas pelos esquemas de razão, mas 
a proporção de reforços obtidos variou de 
maneira irregular quando a obtenção do 
reforço dependida da emissão de uma res-
posta no esquema alternativo após serem 
emitidas as respostas definidas no outro 
esquema. Ao controlar sistematicamente a 
distribuição de reforços, Herrnstein obteve 
proporções de respostas semelhantes à de 
reforços obtidos. Apesar da noção de esco-
Capítulo V | Escolha
81
lha como comportamento não estar parti-
cularmente traçada naquele trabalho, esta-
va aberta a porta para o desenvolvimento 
de um modelo quantitativo do estudo do 
comportamento de escolha a partir da no-
ção de igualação. Um dos grandes diferen-
ciais de Herrnstein (1961) foi investigar essas 
relações de maneira sistemática, fornecen-
do sustentação empírica para a análise dos 
efeitos da frequência relativa de reforços 
sobre a distribuição de respostas.
DESCRIÇÃO DO EXPERIMENTO 
Objetivo e Método
 O objetivo do trabalho de Herrns-
tein (1961) foi estudar de forma paramétrica 
e descrever quantitativamente o efeito da 
frequência relativa de reforços em esque-
mas concorrentes sobre as taxas de respos-
tas em cada componente do esquema e as 
taxas relativas entre os dois esquemas. Em 
um estudo paramétrico, a variável indepen-
dente (e.g., frequência relativa de reforços) 
é manipulada em diferentes valores permi-
tindo que sejam obtidas diversas medidas 
da variável dependente (e.g., frequência re-
lativa de respostas), possibilitando o acesso 
a uma maior amplitude da relação funcio-
nal, ou seja, como a variável dependente 
se modifica com diversos valores da variá-
vel independente. Para tanto, três pombos 
foram mantidos a 80% de seus pesos com 
acesso livre a alimento. O experimento foi 
realizado em uma caixa de condicionamen-
to operante com dois discos de respostas lo-
calizados em uma das paredes da caixa. Os 
discos podiam ser iluminados com as cores 
vermelho (A - disco da esquerda) e branco 
(B - disco da direita) e ficavam a uma mes-
ma distância do comedouro, que ficava 
centralizado na mesma parede dos discos.
O experimento iniciou-se com um 
treino preliminar em duas sessões que ter-
minavam após 60 reforços, no qual eram 
reforçadas respostas no disco diferente 
daquele para o qual havia sido disponibi-
lizado o último reforço, de acordo com um 
esquema concorrente de reforço contínuo 
(CONC CRF - CRF). Este treino visou ga-
rantir uma distribuição de respostas simi-
lar e a alternância entre os dois discos, de 
forma a garantir um mesmo contato com as 
alternativas concorrentes em vigor. Poste-
riormente, Herrnstein (1961) programou re-
forços para duas respostas disponibilizados 
independentemente de acordo com esque-
mas de reforço de intervalo variável (CONC 
VI - VI), nos quais a liberação de reforços 
em um esquema não interferia na liberação 
de reforços da outra alternativa. O uso de 
esquemas de intervalo variável, nos quais 
o reforço é disponibilizado para a primeira 
resposta após a passagem de um tempo que 
varia em torno de uma média, justificou-se 
por ser um esquema que, ao ser modifica-
do, leva a consistentes alterações na taxa de 
respostas. Os dois esquemas vigoravam ao 
mesmo tempo, sem interferência entre si, 
e os intervalos programados para cada um 
deles vigoravam mesmo quando o pombo 
respondia no outro esquema, porém um 
Cristiano Coelho 
82
reforço disponível em um dos esquemas 
só era liberado quando o sujeito respondia 
nesse esquema. Assim, em um dado mo-
mento poderia haver reforço disponível em 
ambos os esquemas, em apenas um deles 
ou em nenhum dos dois. 
Herrnstein (1961) utilizou dois pares 
de esquemas que em conjunto programa-
vam um reforço a cada 1,5 minutos em todas 
as condições. Este controle experimental 
foi importante para garantir que as medidas 
de respostas se relacionassem às frequên-
cias relativas de reforços dos dois esquemas 
e não a possíveis diferenças nas taxas totais 
de reforços entre as condições. Em seu tra-
balho, os valores dos VIs foram: VI 3 min 
– VI 3 min; VI 2,25 min – VI 4,5 min; VI 1,8 
min – VI 9 min; e VI 1,5 min – Extinção. 
Esses pares de esquemas foram alternados 
entre os dois discos (A e B), de forma que 
havia condições em que o disco A ora tinha 
VIs menores (maior frequência de reforços), 
ora VIs maiores (menor frequência de re-
forços) que o disco B, além da condição VI 
3 min – VI 3 min, em que foi programada 
uma mesma frequência de reforços para os 
dois discos. Os sujeitos foram expostos a to-
das essas condições e em ordens diferentes, 
visando reduzir efeitos derivados da ordem 
de exposição. É importante ressaltar que 
cada condição foi realizada por um número 
de sessões até que a emissão de respostas se 
estabilizasse ao longo de cinco sessões; só 
então uma nova condição era iniciada. 
Herrnstein (1961) usou, em algumas 
condições, um procedimento que evitava 
que respostas de alternar entre os dois es-
quemas fossem reforçadas acidentalmente, 
o atraso para respostas de mudança (chan-
geover delay, COD). Como ele funciona? 
Sem o COD, quando o pombo estivesse bi-
cando em um disco e houvesse reforço dis-
ponível para respostas no disco alternativo, 
a primeira resposta nesse disco alternativo 
seria reforçada. Isso pode reforçar não res-
postas a um disco específico, mas o padrão 
de alternação entre os discos (i.e., responder 
em um disco e responder no outro e, assim, 
sucessivamente) independente das modifi-
cações na taxa relativa de reforços. O COD 
tem como função evitar que isso aconte-
ça. Vamos supor que em um determinado 
momento houvesse reforço disponível para 
respostas no disco B e o pombo estivesse 
respondendo no disco A. Ao alternar para 
o disco B e obter o reforço disponível nes-
se disco, ele precisaria permanecer respon-
dendo no disco B pelo menos pelo tempo 
definido no COD (que foi de 1,5 s. no experi-
mento) para que um reforço fosse liberado. 
Resultados e discussão
 Herrnstein (1961) registrou o núme-
ro de reforços obtidos e respostas emitidas 
em cada disco, para cada condição. Esses 
dados possibilitaram diversas análises so-
bre os efeitos das alterações na frequência 
de reforços sobre a regularidade e, princi-
palmente (no caso de Herrnstein), a aspec-
tos quantitativos do comportamento. Mais 
especificamente, se o aumento na taxa de 
Capítulo V | Escolha
83
reforço de uma alternativa e a consequente 
redução na taxa de reforço para a outra al-
ternativa levariam a aumentos (e reduções) 
nas taxas de respostas, bem como a exten-
são dessas alterações em função dos esque-
mas do par concorrente. Para isso, em cada 
condição, além das frequências absolutas de 
reforços e respostas em cada um dos discos 
A e B, foram calculadas a frequência relati-
va de reforços obtidos (proporcionalmente 
o número de reforços obtidos no disco A em 
relação ao total de reforços obtidos nos dois 
discos, A e B) e a porcentagem de respostas 
emitidas (total de respostas emitidas no dis-
co A dividido pelo total de respostas emiti-
das nos discos A e B), considerando as cinco 
sessões finais, com o comportamento está-
vel. Como a frequência relativa de reforços 
variou entre as condições, esses cálculos 
possibilitaramverificar como se alteraria a 
distribuição de respostas entre os dois dis-
cos. De maneira direta, Herrnstein investi-
gou se a proporção de respostas se igualaria 
à frequência relativa de reforços, descrita 
pela equação:
 (1), 
 
na qual R e r são número de respostas e re-
forços, respectivamente, e 1 e 2 correspon-
dem às alternativas. Essa equação expressa 
que as respostas na alternativa 1 divididas 
pelo total de respostas nas duas alternativas 
(1 e 2) tendem a igualar o total de reforços 
obtidos na alternativa 1 divididos pelo total 
de reforços obtidos nas duas alternativas¹.
As porcentagens de respostas se 
aproximaram da porcentagem de reforços 
obtidos nas respectivas condições, ou seja, 
a frequência relativa de respostas tendeu a 
igualar a frequência relativa de reforços, nas 
condições em que se utilizou o COD (que 
reduziu a taxa de alternação e, consequen-
temente, aumentou o controle pelas con-
tingências de cada esquema) e os desvios de 
uma igualação perfeita não apresentaram 
tendência sistemática da previsão teórica 
de igualação. Este achado submeteu pela 
primeira vez a teste quantitativo a noção de 
distribuição de respostas como função da 
distribuição de reforços baseada no princí-
pio de que a alteração na frequência de re-
forços de uma fonte influencia as respostas 
sob controle de outra fonte de reforços.
 Essa influência relaciona-se a outro 
achado fundamental obtido por Herrnstein 
(1961) e que se constitui um dos pressupos-
tos para a relação de igualação: a taxa de res-
postas apresentou uma relação linear (cres-
cente e contínua) com a taxa de reforços 
obtidos em cada alternativa e que as taxas 
de respostas nos dois discos foram seme-
lhantes na condição CONC VI 3 min - VI 3 
min, quando foi programada a mesma taxa 
de reforço nos dois discos. Assim, o total de 
respostas nos dois discos em cada condição 
ficou constante ou apresentou pequenas 
variações assistemáticas. E por que essas 
1 Em seu trabalho, Herrnstein (1961) utilizou P (para bicadas - pecking) 
em vez de R e E (para comer – eating) em vez de r. No presente traba-
lho, a escolha de nomenclatura diferente do trabalho original deriva do 
fato de ter se tornado uma das mais usadas na área. 
Cristiano Coelho 
84
variações são compatíveis com o princípio 
de igualação? O aumento linear nas taxas 
de respostas com o aumento da frequência 
absoluta de reforços foi descrito a partir da 
relação p = ke, sendo p a frequência de bi-
cadas (respostas), e a frequência de comer 
(reforços) e k uma constante, compatível 
com a noção de fortalecimento da respos-
ta proposta por Skinner (1938, p.130, citado 
por Herrnstein, 1961, p. 270) de que há uma 
constância entre a quantidade de reforços 
obtidos e respostas emitidas em extinção. 
Apesar de Skinner posteriormente aban-
donar a noção de constância entre essas 
medidas, a equação continuou como uma 
proposta de fortalecimento de respostas 
baseada em um crescimento linear até atin-
gir o máximo de respostas possíveis. Para 
Herrnstein (1961), essa relação seria a única 
compatível com a igualação. E por que isso 
é tão importante para apreciarmos os resul-
tados de Herrnstein? Porque ao ser aplicado 
a esquemas concorrentes, envolve um pres-
suposto fundamental: de que há um limite 
máximo de emissão de respostas e, assim, o 
aumento na taxa de uma resposta (confor-
me o aumento na taxa de reforço) é neces-
sariamente acompanhado pela redução nas 
demais respostas. Ao revermos a descri-
ção dos dados de taxas de respostas acima, 
quando os dois esquemas eram iguais (VI 
3 min – VI 3 min) as taxas de respostas se 
assemelharam e, para cada um dos demais 
esquemas com VIs diferentes, os pombos 
responderam no VI com maior frequência 
de reforço e a soma das respostas nos dois 
esquemas permaneceram constantes, ou 
sem alterações sistemáticas entre diferen-
tes condições.
DESDOBRAMENTOS
A importância do experimento de 
Herrnstein (1961) foi exatamente estabele-
cer um procedimento no qual era possível 
se relacionar medidas quantitativas de fre-
quências absolutas e relativas de respos-
tas a dois discos à frequência relativa de 
reforços. A relação de igualdade entre as 
frequências relativas de reforços e as fre-
quências relativas de respostas expressa 
na Equação 1 foi então o primeiro grande 
passo para a chamada “Lei da Igualação” 
(Herrnstein, 1970), que expressa, em linhas 
gerais, que a distribuição de respostas entre 
alternativas tende a igualar a distribuição 
de reforços obtidos nas respectivas alter-
nativas. Além disso, dela deriva a ideia de 
que quando essa distribuição de reforços é 
alterada em alguma direção, a distribuição 
de respostas tenderá a se alterar na mesma 
medida. Assim, se duas fontes de reforços 
fornecem a mesma frequência de reforços, 
as respostas tenderão a se distribuir em tor-
no de 50% para cada alternativa; se uma 
das fontes passa a fornecer uma frequência 
quatro vezes maior que a outra, de forma 
que 80% dos reforços passam a ser obtidos 
nessa fonte, a Lei da Igualação prevê que 
o organismo passará a emitir em torno de 
quatro vezes mais respostas nessa alterna-
tiva, conforme previsto na igualação perfei-
ta (ou estrita) de Herrnstein (Equação 1).
Capítulo V | Escolha
85
 Os trabalhos que se iniciaram com 
o experimento de Herrnstein (1961) passa-
ram a fornecer dados sistemáticos que fo-
ram gradativamente demonstrando que um 
comportamento é influenciado não apenas 
por suas consequências, mas também pelos 
reforços disponíveis no ambiente para res-
postas alternativas e culminaram na con-
cepção de que escolha é comportamento 
e todo comportamento envolve escolha² 
(Herrnstein, 1970).
Dois pressupostos quantitativos bá-
sicos propostos por Herrnstein (1970), em 
decorrência dos dados que passaram a ser 
sistematizados em Herrnstein (1961), re-
lacionavam as respostas e os reforços dis-
poníveis para diferentes respostas em uma 
dada situação (Baum, 2010; Davison, 2012; 
De Villiers & Herrnstein, 1976). Primeira-
mente, considerando-se o conjunto de res-
postas nesta dada situação, há um máximo 
de respostas incompatíveis possíveis de se-
rem emitidas (k) que se mantém constante 
nessa situação. O outro pressupõe que esse 
total de respostas é alocado entre diferen-
tes fontes reforçadoras conforme suas res-
pectivas proporções de reforços. Contudo, 
Herrnstein (1961) considerava que o au-
mento linear das taxas de respostas deveria 
ser obtido com o aumento das taxas abso-
lutas de reforços também em situações que 
investigavam respostas em esquemas sim-
ples. Ao se deparar com dados que contra-
riaram essa suposição (e.g. Catania & Rey-
nolds, 1968) e mostravam que o aumento da 
taxa de respostas com o aumento da taxa 
de reforços caracterizava-se por unidades 
cada vez menores (quanto mais reforços por 
minuto eram providos, menor o aumen-
to na taxa de respostas), Herrnstein (1970) 
ponderou que mesmo em um esquema sim-
ples outras fontes de reforço (mesmo não 
controladas pelo experimentador) estariam 
em vigor, concorrendo com o esquema pro-
gramado pelo experimentador. Em termos 
matemáticos, essa relação pode ser aplica-
da a uma única resposta R1 reforçada com 
uma frequência absoluta r1, em que devem 
ser considerados os reforços para outros 
comportamentos incompatíveis (ro), rela-
ção essa expressa na Equação 2, que ficou 
conhecida como a hipérbole de Herrnstein, 
por dar conta dos efeitos cada vez menores 
do aumento da taxa absoluta de reforços 
sobre a taxa absoluta de respostas: 
 (2).
 As previsões derivadas desse mode-
lo são que: a taxa de R1 pode variar de zero 
até se aproximar do máximo k, conforme a 
relação entre seus reforços (r1) e os outros 
reforços (ro) para as respostas concorrentes; 
quanto maior a frequência de reforços para 
R1 em relação aos reforços disponíveis para 
2 A sugestão inicial de Herrnstein levou a questionamentos acerca de 
sua amplitude, por ser inicialmente entendida como relacionada a 
comportamentos operantes e respondentese por se questionar a sua 
aplicabilidade em situações nas quais a escolha é “praticamente” nula, 
como, por exemplo, uma pessoa sendo ameaçada com uma arma para 
abrir seu cofre. Com relação ao primeiro, os relatos encontrados res-
tringem-se a comportamento operante. Quanto ao segundo, a situação 
envolveria uma altíssima magnitude de reforço (negativo, no caso) para 
a resposta de ceder à ameaça, em contraposição a uma ínfima mag-
nitude para rebater as ameaças, de forma que a resposta (muito) mais 
provável estaria sob controle das magnitudes relativas de ambas as 
respostas. Dessa forma, a menção a respostas no presente texto será 
referente a operantes.
Cristiano Coelho 
86
outras respostas, maior a frequência de R1; à 
medida que o ambiente passa a prover mais 
reforços para outras respostas, a frequência 
de R1 diminui; o aumento da frequência ab-
soluta de R1 é cada vez menor à medida que 
se aumenta a frequência absoluta de refor-
ços. 
Para exemplificar a relação acima, 
vamos supor uma situação hipotética na 
qual o total de reforços para outros compor-
tamentos é constante ao longo de diferentes 
condições. Em uma condição o experimen-
tador programa um esquema que fornece 
10 reforços por hora e, hipoteticamente, o 
organismo emite 50 respostas por minuto. 
Ao alterarmos a condição e aumentar em 
10 os reforços por hora (fornecendo então 
20 reforços por hora), possivelmente as res-
postas aumentarão para 100 por minuto (50 
respostas a mais). Se aumentarmos mais 10 
reforços por hora em uma nova condição 
(que passa a fornecer 30 reforços por hora), 
as respostas apresentarão um aumento 
menor, digamos 40 respostas por minuto 
a mais, e o organismo passará a emitir 140 
respostas por minuto. Caso uma nova con-
dição programe mais 10 reforços por hora, 
o aumento no número de respostas será 
de 30, por exemplo, e assim por diante, até 
que atinja o máximo de respostas, e então o 
aumento na taxa absoluta de reforços não 
produzirá aumentos nas taxas de respostas. 
Como podemos ver, a cada condição o au-
mento na taxa de reforço foi constante (de 
10 em 10), mas o aumento na taxa de respos-
tas foi cada vez menor (50, 40, 30...), obten-
do-se 50, 100, 140, 170 até atingir o máximo.
Esse efeito das taxas de reforços so-
bre a taxa de respostas, porém, não apenas 
é totalmente compatível com a igualação, 
mas acaba sendo fundamental para que 
ela ocorra, pois acaba mostrando que as 
alterações nas condições estão alterando a 
frequência de reforços programados pelo 
experimentador relativamente aos outros 
reforços providos pelo ambiente (Ro), que 
permaneceram constantes ao longo das di-
ferentes condições no nosso exemplo. Se 
hipoteticamente os outros reforços tiverem 
uma taxa de 10 por hora na primeira condi-
ção, igual ao programado pelo experimen-
tador, o organismo alocará metade do tem-
po respondendo ao esquema programado e 
metade do tempo realizando as outras ati-
vidades. 
Vamos considerar agora duas situa-
ções com esquemas concorrentes. Em uma 
temos dois esquemas de intervalo variável 
de 30 segundos, e na outra, dois esquemas 
de intervalo variável de 1 minuto, cada um 
associado a um disco de respostas. Nas duas 
situações, a taxa total de reforços é diferente, 
considerando os dois esquemas: a primeira 
com 120 reforços por hora e a segunda com 
60 reforços por hora. Assim, o total de res-
postas emitidas nos dois discos na primeira 
situação seria maior que na segunda, visto 
que teria uma maior taxa absoluta de refor-
ços. Porém, como em ambas as situações 
os esquemas componentes dos respectivos 
pares concorrentes são iguais, com metade 
Capítulo V | Escolha
87
dos reforços a serem obtidos em cada fon-
te, a igualação prevê que o organismo dis-
tribuiria igualmente suas respostas às duas 
fontes, pois o que importa para a igualação 
são os valores relativos dos reforços e não 
os absolutos. Mas você pode perguntar: e os 
outros reforços não alterariam essa relação? 
Não! De acordo com a hipérbole de Herr-
nstein, além dos esquemas programados 
pelo experimentador, o organismo também 
gastaria tempo emitindo respostas que são 
controladas pelos outros reforços disponí-
veis nessa situação. Contudo, como os ou-
tros reforços estão constantes nessa condi-
ção, eles interfeririam da mesma maneira 
(ou igualmente) nas respostas aos dois es-
quemas e, assim, seus efeitos se anulariam 
matematicamente.
Essas previsões atualmente podem 
parecer simples, mas precisamos conside-
rar que àquela época o diferencial foi mos-
trar que a frequência de R1 não dependia 
apenas dos reforços produzidos por ela. 
Porém, isso não é tudo. Se R1 depende de 
sua taxa de reforços e dos reforços para ou-
tras respostas alternativas e, consequente-
mente, as outras respostas são controladas 
pelos seus próprios reforços e pela taxa de 
reforços de R1, há uma interdependência 
entre a contingência em vigor para R1 e as 
contingências sob as quais estão as outras 
respostas possíveis de serem emitidas na 
mesma situação e incompatíveis com R1. 
Dessa forma, ao se aumentar a taxa de re-
forços para R1 relativamente aos reforços 
de outros comportamentos, não só a taxa 
de respostas R1 aumenta, mas a emissão de 
outras respostas alternativas diminui, de-
vido a um máximo de respostas possíveis 
de serem emitidas. O artigo de Herrnstein 
(1961) foi um marco no estudo do comporta-
mento de escolha ao prover dados sistemá-
ticos e quantificação de duas alternativas 
de respostas, realizando manipulações pa-
ramétricas da taxa relativa de reforços em 
esquemas concorrentes de intervalo variá-
vel (CONC VI - VI) e mostrando que as alte-
rações nessa taxa relativa de reforços eram 
acompanhadas de alterações similares na 
taxa relativa de resposta, desenvolvendo o 
princípio de igualação. Em termos quanti-
tativos, se aplicarmos a Equação 2 a duas 
respostas concorrentes, R1 e R2, obtemos a 
Equação 1³ proposta por Herrnstein (1961).
A concepção de Herrnstein (1961) foi 
tão importante que, após sua publicação, a 
Análise do Comportamento passou a de-
senvolver diversos trabalhos quantitativos, 
não apenas para o estudo de escolha, mas 
na busca de relações quantitativas entre o 
comportamento e suas consequências, ava-
liando também a asserção de Herrnstein 
(1970) de que escolha é comportamento (e 
vice-versa). Passamos então a ter uma gama 
de estudos que tentavam avaliar a genera-
lidade da Lei da Igualação e extensão para 
outros parâmetros do reforço, como atraso 
e magnitude (e.g. Rachlin & Baum, 1969; 
3 Há um conjunto de transformações para se chegar a essa formulação, 
fora do âmbito do presente trabalho. De forma resumida, tanto k quan-
to ro saem da Equação 1 porque ao interagirem da mesma forma com 
R1 e R2, seus efeitos são matematicamente “anulados”.
Cristiano Coelho 
88
Logue, 1988; Logue & Chavarro, 1987; Todo-
rov, 1973), arranjos experimentais, como a 
função do COD e efeito da frequência abso-
luta de reforços (e.g. Shull & Pliskoff, 1967; 
Todorov, Coelho & Beckert, 1993), efeitos da 
história (e.g. Todorov, Oliveira-Castro, Han-
na, Bittencourt de Sá & Barreto, 1983), ape-
nas para mencionar alguns poucos exem-
plos. Pesquisas mostraram também que a 
relação de igualação se aplicava para medi-
das de alocação de tempo (e.g. Baum, 1975; 
Baum & Rachlin, 1969). A aplicabilidade da 
proposta de Herrnstein para o estudo e in-
tervenção sobre o comportamento humano 
também foi testada (e.g. Bradshaw & Szaba-
di, 1978; Logue, 1988; Neef, Mace, Shea & 
Shade, 1992; Pierce & Epling, 1983).
Baum (1974, 1979) observou os dados 
de alguns estudos indicavam dois desvios 
sistemáticos da igualação encontrados em-
piricamente. Um desvio foi chamado de 
viés, uma persistência a apresentar uma 
preferência por uma alternativa derivada 
de aspectos não relacionados à distribui-
ção de reforços. Essa preferência por uma 
alternativa pode ser derivada de diferenças 
na força necessária para acionar o lócus 
de respostas, diferenças qualitativas nas 
respostas em cadaesquema (bicar x acio-
nar um pedal), diferenças na iluminação 
dos discos, dentre outros. O outro desvio, 
chamado de sensibilidade, ocorre quando 
a distribuição de respostas não se modifi-
ca de maneira estrita conforme a alteração 
nas relações entre os reforços obtidos nos 
esquemas concorrentes. Conforme pontua-
mos ao início deste tópico, para Herrnstein 
(1961), a igualação implica que uma variação 
na frequência relativa de reforços deve ser 
acompanhada da mesma variação na fre-
quência relativa de respostas: se em uma 
fonte é obtida três vezes mais reforços que 
a alternativa, para igualar o organismo emi-
tiria três vezes mais respostas, por exemplo. 
Além disso, ao se dobrar a frequência relati-
va de reforços para essa mesma alternativa, 
a frequência relativa de respostas também 
dobraria. Porém, Baum (1979) realizou uma 
revisão de 23 estudos e observou dados nos 
quais quando a distribuição de reforços era 
alterada em uma certa medida produzia 
variações menores e, em outras, variações 
maiores na distribuição de respostas, as 
quais Baum denominou de “subigualação” 
e “sobreigualação”, respectivamente. 
Diversos trabalhos (e.g. Baum, 1974, 
1979; Rachlin & Baum, 1969) estenderam a 
proposta de Herrnstein (1961, 1970). Ao bus-
car sistematizar os dados sobre igualação 
envolvendo os diferentes parâmetros do re-
forço, Baum (1974) desenvolveu a Lei Gene-
ralizada da Igualação. Porém, derivou uma 
equação baseada na relação entre razões de 
respostas (respostas emitidas em uma alter-
nativa dividida pelas respostas emitidas na 
outra alternativa) e razões de reforços (re-
forços obtidos em uma alternativa dividido 
pelos reforços obtidos na outra alternativa). 
O uso de medidas de razão descrevia me-
lhor as distribuições de reforços e respostas 
por terem uma amplitude maior que pro-
porção ou porcentagem, que tem seu limite 
Capítulo V | Escolha
89
de 0 a 1 e 0% a 100%, respectivamente. Essa 
relação é expressa na Equação 3:
 (3), 
 
sendo a e b os parâmetros obtidos empiri-
camente, relacionados ao viés e sensibilida-
de. Quando se encontra uma sensibilidade 
perfeita e ausência de viés, a equação de 
Baum expressa a igualação estrita de Herr-
nstein. A mesma relação pode ser aplicada 
quando são manipuladas as magnitudes e/
ou atrasos. Quando os três parâmetros são 
manipulados em um mesmo experimento, 
é possível se calcular as sensibilidades às 
variações de cada um deles. 
Pierce e Epling (1983) avaliaram a ge-
neralidade da Lei da Igualação para a des-
crição do comportamento humano e suge-
rem que os resultados com humanos seriam 
compatíveis com a igualação. Além disso, 
observaram que pesquisas com humanos 
que não encontraram dados sistemáticos 
compatíveis com a igualação (e.g. Oscar-
-Berman, Heyman, Bonner & Ryder, 1980) 
apresentavam especificidades metodoló-
gicas que não permitiriam uma adequada 
análise da igualação. Em primeiro lugar, 
esses experimentos com humanos geral-
mente utilizaram poucas sessões e dados 
de comportamento sem o controle já esta-
belecido pela contingência, ou seja, dados 
de transição, ao passo que a lei se dirige a 
dados de distribuição de respostas em esta-
do estável. 
A discussão levantada por Pierce e 
Epling (1983) mostra alguns dos cuidados 
necessários para se falar em igualação e sua 
aplicabilidade ao comportamento huma-
no, em concordância com os pressupostos 
desenvolvidos por Herrnstein (1961, 1964, 
1970) e compatível com a literatura. Dois 
exemplos da aplicabilidade da igualação 
com humanos em contextos diferentes po-
dem contribuir para que visualizemos a ex-
tensão dos efeitos de Herrnstein (1961).
Bradshaw e Szabadi (1976) realiza-
ram uma investigação, ao longo de seis me-
ses, com uma pessoa diagnosticada como 
maníaca depressiva. No experimento, dife-
rentes operandos estavam associados com 
diferentes VIs, que foram utilizados para 
manipular a taxa de reforço, testando uma 
função derivada da Equação 1 acima. Essa 
mensuração, realizada em situações com 
diferenças de “humor” (normal, depressivo, 
maníaco), mostrou que a taxa de respos-
tas aumentava com aumentos na taxa de 
reforço na forma prevista pela Equação 1, 
atingindo o máximo k. Contudo, conforme 
o “humor”, o máximo de respostas emitidas 
diferiu, com taxas máximas mais altas obti-
das em quando o paciente estava maníaco, 
e as mais baixas quando estava depressivo. 
Neef, Mace, Shea e Shade (1992) ava-
liaram a Lei da Igualação em um contexto 
educacional com reforçadores de mesma 
“qualidade” e “qualidade” diferente. Três 
estudantes especiais tiveram que resol-
ver problemas matemáticos apresentados 
Cristiano Coelho 
90
concorrentemente e com reforços de acor-
do com esquemas de VI. Na condição com 
reforços qualitativamente semelhantes, o 
tempo alocado a cada esquema variou con-
forme previsto na igualação. Um dado inte-
ressante foi que os autores não obtiveram 
igualação com reforços qualitativamente 
diferentes. De fato, a proposta de igualação, 
tal como proposta por Herrnstein, se ade-
qua a escolha com mesmos reforçadores.
A ideia de igualação repercutiu tam-
bém no desenvolvimento dos trabalhos 
sobre escolhas entre reforçadores com di-
ferentes atrasos e magnitudes, desenvol-
vidos na área de autocontrole (e.g. Mazur, 
1987; Rachlin & Green, 1972). A noção bási-
ca para essa extensão foi a Lei Generalizada 
da Igualação, com a demonstração de que 
a distribuição de respostas é alterada con-
forme os pressupostos básicos da ideia de 
Herrnstein (1961) quando são manipulados 
atraso e magnitude de reforço. Além disso, 
análises quantitativas da perda de valor re-
forçador de consequências atrasadas mos-
traram-se compatíveis com a equação de 
igualação (Ainslie & Haslam, 1992) ao serem 
aplicadas ao estudo do comportamento de 
não humanos (e.g. Mazur, 1995) e humanos 
(e.g. Coelho, Hanna & Todorov, 2003; Ra-
chlin, Raineri & Cross, 1991).
A Lei da Igualação, tal como propos-
ta por Herrnstein (1961), se adequa a escolha 
com mesmos reforçadores. Propostas pos-
teriores (e.g. Rachlin, 1989) tentaram inter-
pretar o parâmetro de sensibilidade da Lei 
Generalizada da Igualação como o nível de 
semelhança funcional ou de complementa-
riedade entre os reforços disponibilizados 
pelas duas fontes. Em alguns casos, essa in-
terpretação prevê que a diminuição de uma 
frequência de reforços levaria à diminuição 
nas duas respostas concorrentes e permite 
descrever adequadamente as alterações na 
distribuição de respostas. Mas essa é outra 
longa história4!
CONSIDERAÇÕES FINAIS
Sem dúvida, a contribuição mais 
clara de Herrnstein (1961) foi sua proposta 
de estabelecer relações quantitativas pre-
cisas entre comportamento e suas conse-
quências. Essas relações não só validam, 
mas principalmente, acrescentam-se aos 
achados sobre a regularidade dessas re-
lações. Ao longo de seus estudos, Herrns-
tein procurou aprofundar essas relações, 
focando nos efeitos das consequências e 
questionando princípios de racionalidade, 
sistematizados em uma compilação de tex-
tos finalizada após sua morte (Herrnstein, 
Rachlin & Laibson, 1997). Essa compilação 
de textos mostra como as pesquisas realiza-
das por ele iniciadas a partir de Herrnstein 
(1961) foram indicando as falhas nas previ-
sões da Psicologia e da Economia baseadas 
4 Algumas referências a respeito, além de Rachlin (1989): Rachlin, H., 
Kagel, J. H., & Battalio, R. C. (1980). Substitutability in time allocation. 
Psychological Review, 87(4), 355. Rachlin, H., Green, L., Kagel, J. H., & 
Battalio, R. C. (1976). Economic demand theory and psychological stu-
dies of choice. Psychology of Learning and Motivation, 10, 129-154.
Capítulo V | Escolha
91
no pressuposto de que as escolhas visam o 
máximo de resultados. Esses dados mos-
tram a igualação na base da dinâmica das 
escolhas. E há muito mais para buscarmos 
e satisfazer nossa curiosidade. Os números? 
Eles não são o comportamento em si, ape-
nas uma forma (dentre as diversas) de des-
crevê-lo e permitir-nosconhecer de uma 
maneira mais precisa as regularidades do 
comportamento.
Considero que para além da quanti-
ficação, o pressuposto de que nosso com-
portamento é afetado também pelas con-
tingências concorrentes é uma das grandes 
contribuições da sistematização dessa área. 
Ela permeia direta ou indiretamente inter-
venções que passaram a ser adotadas em 
diferentes contextos, nos quais fomos dei-
xando de punir comportamentos-proble-
ma e passamos a reforçar comportamentos 
socialmente desejáveis. Diferentes formas 
de intervenção baseadas em reforço dife-
rencial e até a noção de reforço para com-
portamentos clinicamente relevantes tipo 2 
(CRB2) na Psicoterapia Analítica Funcional 
(Kohlenbergh & Tsai, 2001) tem embutidas 
noções que se aproximam daquela investi-
gada a partir do experimento de Herrnstein 
(1961).
Podemos ilustrar sua repercussão 
pelo fato de que Herrnstein (1961), junta-
mente com outro trabalho clássico sobre 
escolha (Herrnstein, 1970) foi um dos cin-
co trabalhos publicados no Journal of the 
Experimental Analysis of Behavior (JEAB) 
mais citados no Journal of Applied Beha-
vior Analysis (JABA) entre 1983 e 2003 
(Elliot e cols., 2005). Ao lado do artigo se-
minal de Michael (1982) sobre operações 
estabelecedoras, a Lei da Igualação perma-
neceu como um dos principais tópicos de 
interesse na área aplicada. Conforme El-
liot e cols. (p. 560) “Claramente, igualação 
e operações estabelecedoras são tópicos de 
contínuo interesse para analistas aplicados 
do comportamento e devem ser abrangidos 
em programas de treinamento. Igualação e 
operações estabelecedoras tem provado ser 
úteis em conceituar e tratar uma amplitude 
de comportamentos-problema”.
PARA SABER MAIS
Baum (2010). Descreve um tutorial baseado 
na igualação como alocação de tempo entre 
atividades. No texto são discutidos aspec-
tos referentes à
Borges, Todorov, & Simonassi (2006). Des-
creve experimentos com diferentes mani-
pulações, mostrando como as condições 
para a obtenção de igualação com humanos 
dependem da programação experimental.
Garcia-Mijares & Silva (1999). Apresenta 
de forma didática as noções de igualação.
Madden & Perone (1999). Avaliaram a Lei 
Generalizada da Igualação e, mais especi-
ficamente, a sensibilidade comportamental. 
Os dados mostraram que a sensibilidade foi 
Cristiano Coelho 
92
maior quando havia uma resposta de obser-
vação.
Todorov, Coelho, & Beckert (1993). Reali-
zaram um conjunto de experimentos com 
pombos, nos quais variaram a frequência 
relativa e frequência absoluta de reforços. 
Os dados reforçam que o pressuposto de 
que a igualação depende somente da fre-
quência relativa de reforços e da função do 
COD na separação das respostas aos esque-
mas.
REFERÊNCIAS
Ainslie, G., & Haslam, N. (1992). Hyperbolic 
discounting. In G. Loewenstein & J. Elster, J. 
(Eds.), Choice over time. New York: Russell 
Sage Foundation.
Baum, W. M. (1974). On two types of devia-
tion from the matching law: Bias and un-
dermatching. Journal of The Experimental 
Analysis of Behavior, 22, 231-242.
Baum, W. M. (1975). Time allocation in hu-
man vigilance. Journal of the Experimental 
Analysis of Behavior, 23, 45-53.
Baum, W. M. (1979). Matching, undermat-
ching, and overmatching in studies of choi-
ce. Journal of the Experimental Analysis of 
Behavior, 32, 269-281.
Baum, W. M. (2010). Dynamics of choice: A 
tutorial. Journal of the Experimental Analy-
sis of Behavior, 94, 161-174.
Baum, W. M., & Rachlin, H. (1969). Choice as 
time allocation. Journal of the Experimental 
Analysis of Behavior, 12, 861-874.
Borges, F. S., Todorov, J. C., & Simonassi, L. 
E. (2006). Comportamento humano em es-
quemas concorrentes: escolha como uma 
questão de procedimento. Revista Brasilei-
ra de Terapia Comportamental e Cogniti-
va,8, 13-24.
Bradshaw, C. M., & Szabadi, E. (1978). Chan-
ges in operant behavior in a manic-depres-
sive patient. Behavior Therapy, 9, 950-954.
Catania, A. C., & Reynolds, G. S. (1968). A 
quantitative analysis of the responding 
maintained by interval schedules of rein-
forcement. Journal of the Experimental 
Analysis of Behavior, 11, 327-383.
Coelho, C., Hanna, E. S., & Todorov, J. C. 
(2003). Magnitude, atraso e probabilidade 
de reforço em situações hipotéticas de risco. 
Psicologia: Teoria e Pesquisa, 19, 269-278.
Davison, M. (2012). The matching law (Edi-
ção revisada de Davison, M., & McCarthy, 
D. (1988). The matching law: A research re-
view. Hillsdale, NJ: Lawrence Erlbaum As-
sociates). 
De Villiers, P. A., & Herrnstein, R. J. (1976). 
Toward a law of response strength. Psycho-
logical Bulletin, 83, 1131.
Capítulo V | Escolha
93
Elliott, A. J., Morgan, K., Fuqua, R. W., 
Ehrhardt, K., & Poling, A. (2005). Self- and 
cross-citations in the Journal of Applied 
Behavior Analysis and the Journal of the 
Experimental Analysis of Behavior: 1993–
2003. Journal of Applied Behavior Analysis, 
38, 559-563.
Ferster, C. & Skinner (1957). Schedules of 
reinforcement. New York: Appleton Cen-
tury-Crofts.
Findley, J. D. (1958). Preference and swit-
ching under concurrent scheduling. Journal 
of the Experimental Analysis of Behavior, 1, 
123-144.
Garcia-Mijares, M., & Silva, M. T. A. (1999). 
Introdução à teoria da igualação. Sobre 
comportamento e cognição, 4, 40-53.
Herrnstein, R. J. (1958). Some factors in-
fluencing behavior in a two-response si-
tuation. Transactions of the New York Aca-
demy of Sciences, 21, 35-45.
Herrnstein, R. J. (1961). Relative and Abso-
lute strength of Response as a Function of 
Frequency of Reinforcement. Journal of the 
Experimental Analysis of Behavior, 4, 267-
272.
Herrnstein, R. J. (1964). Secondary reinfor-
cement and rate of primary reinforcement. 
Journal of the Experimental Analysis of 
Behavior, 7, 27-36.
Herrnstein, R. J. (1970). On the law of ef-
fect. Journal of the Experimental Analysis of 
Behavior, 13, 243-266.
Herrnstein, R. J., (1997). The matching law: 
Papers in psychology and economics. Cam-
bridge: Harvard University Press.
Kohlenberg, R. J., & Tsai, M. (2001). Psicotera-
pia Analítica Funcional. São Paulo: ESETEC.
Logue, A. W., & Chavarro, A. (1987). Effect 
on choice of absolute and relative values of 
reinforcer delay, amount, and frequency. 
Journal of Experimental Psychology: Ani-
mal Behavior Processes, 13, 280.
Logue, A. W. (1988). Research on self-con-
trol: An integrating framework. Behavioral 
and Brain Sciences, 11, 665-679.
Madden, G. J., & Perone, M. (1999). Human 
sensitivity to concurrent schedules of rein-
forcement: Effects of observing schedule-
-correlated stimuli. Journal of the Experi-
mental Analysis of Behavior, 71, 303-318.
Mazur, J. E. (1987). An adjusting procedu-
re for studying delayed reinforcement. In 
M. L. Commons, J. E. Mazur, & J. A. Nevin 
(Eds.), Quantitative Analysis of Behavior: 
Vol 5. The effect of delay and intervening 
events on reinforcement value. Hillsdale, NJ: 
Lawrence Erlbaum. (pp. 55-73).
Mazur, J. E. (1995). Conditioned reinforce-
ment and choice with delayed and uncer-
Cristiano Coelho 
94
tain primary reinforcers. Journal of the Ex-
perimental Analysis of behavior, 63, 139-150.
Michael, J. (1982). Distinguishing between 
discriminative and motivational functions 
of stimuli. Journal of the Experimental 
Analysis of Behavior, 37, 149-155.
Neef, N. A., Mace, F. C., Shea, M. C., & Sha-
de, D. (1992). Effects of reinforcer rate and 
reinforcer quality on time allocation: Ex-
tensions of matching theory to educatio-
nal settings. Journal of Applied Behavior 
Analysis, 25, 691-699.
Oscar-Berman, M., Heyman, G. M., Bon-
ner, R. T., & Ryder, J. (1980). Human neu-
ropsychology: Some differences between 
Korsakoff and normal operant performan-
ce. Psychological Research, 41, 235-247.
Pierce, W. D., & Epling, W. F. (1983). Choice, 
matching, and human behavior: A review of 
the literature. The Behavior Analyst, 6, 57.
Rachlin, H. (1989). Judgment, decision, and 
choice: A cognitive/behavioral synthesis. 
New York: WH Freeman/Times Books/Henry Holt & Co.
Rachlin, H., & Baum, W. M. (1969). Respon-
se rate as a function of amount of reinfor-
cement for a signalled concurrent respon-
se. Journal of the Experimental Analysis of 
Behavior, 12, 11-16.
Rachlin, H., & Green, L. (1972). Commit-
ment, Choice and self-control. Journal of 
the Experimental Analysis of Behavior, 17, 
15-22.
Rachlin, H., Raineri, A., & Cross, D. (1991). 
Subjective probability and delay. Journal of 
the Experimental Analysis of Behavior, 55, 
233-244.
Shull, R. L., & Pliskoff, S. S. (1967). Changeo-
ver delay and concurrent schedules: Some 
effects on relative performance measures. 
Journal of the Experimental Analysis of 
Behavior, 10, 517-527.
Skinner, B. F. (1950). Are theories of lear-
ning necessary? Psychological Review, 57, 
193-216.
Todorov, J. C. (1973). Interaction of frequen-
cy and magnitude of reinforcement on con-
current performances. Journal of the Expe-
rimental Analysis of Behavior, 19, 451-458.
Todorov, J. C., Oliveira-Castro, J. M., Hanna, 
E. S., Bittencourt de Sá, M. C. N., & Barre-
to, M. D. Q. (1983). Choice, experience, and 
the generalized matching law. Journal of the 
Experimental Analysis of Behavior, 40, 99-
111.
Todorov, J. C., Coelho, C., & Beckert, M. E. 
(1993). Efeito da frequência absoluta de re-
forços em situação de escolha: um teste do 
pressuposto da relatividade na lei generali-
zada de igualação. Psicologia: Teoria e Pes-
quisa, 9, 227-42.
Elenice S. Hanna, Márcio Borges Moreira
95
Prestaram atenção 
em tudo?
Elenice S. Hanna
Universidade de Brasília
Márcio Borges Moreira
Centro Universitário de Brasília; Instituto Walden4
Reynolds, G. (1961). Attention in the pigeon. Journal of the Experimental Analysis 
of Behavior, 4, 203-208.
“Da mesma forma que podemos atentar para um objeto sem olhar para ele, assim 
também podemos olhar para um objeto sem prestar-lhe atenção”
Skinner (1953/2003, p. 138) 
Capítulo VI | Atenção
96
INTRODUÇÃO À ÁREA DE PES-
QUISA E CONTEXTUALIZAÇÃO 
DO EXPERIMENTO
 Ao perguntar para várias pesso-
as que foram à mesma sala de cinema no 
mesmo horário, o que lhes chamou mais 
atenção, respostas variadas apareceriam. 
Alguns incluiriam no relato determinados 
personagens, suas personalidades ou as in-
terações entre eles. Outros falariam dos ce-
nários, cidades ou construções. Poderíamos 
ainda encontrar aqueles que focam seus 
relatos nas cenas de suspense, na forma 
como foram produzidas, na iluminação ou 
nos aspectos negativos. Uma pessoa menos 
atenta ao filme, como o dono do cinema, 
poderia ainda ter se interessado pelo nú-
mero de pessoas que havia na sala e no que 
elas estavam consumindo.
 Em situações cotidianas nem sem-
pre o comportamento de uma pessoa fica, 
do ponto de vista de um observador exter-
no (o diretor do filme, por exemplo) ou do 
próprio indivíduo, sob controle dos mes-
mos estímulos que antecedem ou que estão 
presentes quando um determinado com-
portamento ocorre. Dito de outra forma, di-
ferentes indivíduos podem prestar atenção 
a diferentes aspectos, ou diferentes estímu-
los, de um mesmo ambiente. Diz-se, nessas 
situações, que o organismo prestou ou não 
atenção ao evento, que atentou ou não a 
uma ou mais propriedades relevantes do es-
tímulo. É importante ressaltar que, em Aná-
lise do Comportamento, estímulo é “qual-
quer evento físico, combinação de eventos 
ou relação entre eventos. O vocabulário do 
estímulo classifica os aspectos do ambiente 
…” (Catania, 1998/1999, p. 402). Quando fa-
lamos de uma propriedade de um estímulo, 
falamos de alguma qualidade mensurável 
de um estímulo, por exemplo, cor, forma, 
cheiro, tamanho, textura, etc. O conceito 
de ambiente, por sua vez, pode ser definido 
como o “conjunto de circunstâncias físicas 
no qual o organismo, ou uma parte referida 
desse organismo, existe” (Johnston & Pen-
nypacker, 2009, p. 29).
 O uso do conceito de atenção em 
muitos casos, entretanto, pode inverter “... 
a direção da ação ao sugerir que não é o es-
tímulo que controla o comportamento do 
observador, mas é o observador que atenta 
para o estímulo e assim o controla” (Skin-
ner, 1953/2000, p. 135). Nessa perspectiva, 
a “falta de atenção” não explica o contro-
le inadequado de estímulos, é apenas uma 
forma resumida de se referir à ausência de 
controle por determinados elementos ou 
dimensões de estímulos sobre o comporta-
mento. É importante lembrar que falar de 
controle do comportamento é falar de vari-
áveis que tornam um determinado compor-
tamento mais ou menos provável (não sig-
nifica, necessariamente, falar de “obrigar” 
alguém a fazer algo).
 Conhecer as variáveis que aumen-
tam as chances de haver coerência entre 
o que se quer ensinar dos estímulos ante-
cedentes e o que será aprendido é funda-
Elenice S. Hanna, Márcio Borges Moreira
97
mental para o ensino de diversos processos 
comportamentais complexos. A aprendiza-
gem de conceitos, por exemplo, é base para 
o desenvolvimento do pensamento e da 
linguagem humana. Quando aprendemos o 
conceito de “vermelho” ou de um “núme-
ro”, interagimos com eventos que são com-
postos por outras propriedades. Um objeto 
vermelho ou unitário possui forma, peso, 
tamanho, apenas para citar algumas das 
possíveis propriedades. Mas como ocorre 
o processo que permite que determinado 
comportamento fique sob controle da cor 
ou o número, por exemplo, dentre tantos 
aspectos dos objetos que contêm cor e nu-
merosidade? Perguntando em uma lingua-
gem mais coloquial, como prestamos aten-
ção apenas à cor ou ao número dos objetos? 
 O experimento que é tema deste ca-
pítulo foi publicado por George Reynolds 
em 1961 com o título de “Atenção no pom-
bo” e inspirou uma série estudos relevan-
tes para a compreensão da atenção e do 
controle do comportamento por estímu-
los compostos. Em estudos sobre controle 
do comportamento operante por estímu-
los antecedentes, o ensino é realizado por 
meio de procedimentos chamados de treino 
discriminativo. A base de um treino discri-
minativo é o reforçamento diferencial da 
resposta emitida na presença de estímulos 
diferentes (Dinsmoor, 1995). Na presença 
de um objeto vermelho (S+), a resposta de 
dizer “vermelho” (R) é seguida por alguma 
reação de aprovação do professor (SR+), 
mas não terá esta consequência se o objeto 
for amarelo (S–). Responder “vermelho” faz 
parte de duas contingências: uma na qual 
a resposta produz reforçamento e outra em 
que produz extinção, gerando a discrimi-
nação entre os objetos de cores diferentes 
(i.e., vermelho e amarelo). Discriminar esses 
objetos é responder diferencialmente na 
presença de cada um, isto é, dizendo “ver-
melho” diante do S+ (objeto vermelho), mas 
não diante do S– (objeto amarelo). 
 A discriminação está presente em 
muitos exemplos do que chamamos de “co-
nhecimento” e de “atenção”. Quando se diz 
que alguém reconheceu o brinquedo ver-
melho ou prestou atenção no vestido ver-
melho, supõe-se que ele(a) diferencie (dis-
crimine) as cores. No entanto, afirmações 
como essas são meras inferências (Sidman, 
1979), como as evidências apresentadas por 
Reynolds (1961) permitem discutir. Pas-
semos, então, para o estudo clássico que 
apresentou estas evidências e em seguida 
veremos como este tema tem relação com 
outros assuntos interessantes. 
DESCRIÇÃO DOS EXPERIMEN-
TOS 
Os experimentos de Reynolds (1961) 
foram inspirados, dentre outros experi-
mentos, pela pesquisa realizada por Lashley 
(1938), na qual respostas de ratos de saltar 
em direção a um cartão contendo a figura 
de um triângulo foram reforçadas com co-
mida e as respostas de saltar em direção a 
Capítulo VI | Atenção
98
um cartão contendo a figura de triângu-
lo invertido foram punidas pela queda do 
animal em uma rede de segurança. Após 
realizar esse treino discriminativo, Lashley 
realizou testes nos quais apenas metade das 
figuras eram apresentadas aos ratos. Nes-
ses testes, não se observou consistência no 
comportamento de saltar dos animais, isto 
é, as “partes” dos triângulos apresentadasnos testes como estímulos antecedentes 
exerceram controles diferentes para dife-
rentes animais. No entanto, estes responde-
ram de forma coerente com o treino quando 
apenas a metade inferior de cada figura era 
apresentada.
Experimento 1 - Objetivo e Método
Com base nos resultados da pesquisa 
de Lashley (1938), o objetivo do experimen-
to de Reynolds (1961) foi avaliar os efeitos 
da variação e eliminação de características 
dos estímulos sobre a aprendizagem de dis-
criminações de estímulos – dizemos que 
uma discriminação de estímulos foi estabe-
lecida quando o indivíduo se comporta de 
maneira diferente na presença de estímulos 
antecedentes diferentes.
No Experimento 1 (Reynolds, 1961), 
dois pombos foram colocados em câma-
ras experimentais que continham discos 
de resposta onde ora era apresentado um 
triângulo sobre um fundo vermelho (ΔR) e 
ora um círculo sobre um fundo verde (OG), 
Figura 1. Diagrama do treino discriminativo e dos estímulos decompostos utilizados no teste em extinção de Reynolds (1961; painel da esquerda) e 
resultados do Experimento 1 (painel da direita). O gráfico do painel da direita é uma adaptação da Figura 1 de Reynolds (p. 204).
Elenice S. Hanna, Márcio Borges Moreira
99
de forma imprevisível. Bicadas no disco 
ΔR eram seguidas por comida (reforço), 
após transcorridos 3 min em média desde a 
apresentação do último reforço (i.e., um es-
quema de reforçamento intervalo variável, 
VI, 3 min). Respostas de bicar no disco OG 
não eram reforçadas (extinção). Esta etapa 
do procedimento consistiu de um treino 
discriminativo (Figura 1). Após a etapa de 
treino discriminativo, iniciava-se uma se-
gunda etapa do experimento, chamada de 
teste em extinção. Nesta etapa Reynolds 
(1961) programou um teste no qual os com-
ponentes dos estímulos utilizados durante 
o treino discriminativo eram apresentados 
separadamente, ou seja, o disco de resposta 
continha ora o triângulo, ora o círculo, ora 
era iluminado por vermelho e ora por ver-
de. O teste foi realizado em extinção, isto 
é, bicadas no disco, independentemente de 
qual estímulo estivesse presente no disco, 
não eram seguidas pela apresentação de 
comida. O teste em extinção foi uma veri-
ficação do que os pombos haviam aprendi-
do durante o treino discriminativo. Portan-
to, procedimentos de treino são tarefas de 
aprendizagem e procedimento de teste em 
extinção são procedimentos de avaliação 
dessa aprendizagem.
Resultados e Discussão
No início do treino discriminativo, 
ambos os pombos bicavam no disco tanto 
na presença do ΔR quanto na presença do 
OG. No entanto, à medida que o treino dis-
criminativo continuava, as respostas iam se 
concentrando no disco cujas bicadas pro-
duziam comida, isto é, os animais passaram 
a bicar nos disco quase que exclusivamente 
na presença do triângulo sobre fundo ver-
melho (Figura 1). Neste caso, dizemos que 
o controle discriminativo foi estabelecido: 
respostas de bicar ocorriam na presença do 
triângulo sobre fundo vermelho e ocorriam 
com baixa frequência na presença do círcu-
lo sobre fundo verde.
Durante o teste em extinção, na qual 
os componentes dos estímulos utilizados 
no treino foram apresentados separada-
mente, Reynolds (1961) verificou que, para o 
pombo 105, a maioria das respostas de bicar 
ocorreu na presença do triângulo, enquan-
to para o pombo 107 a maior parte das res-
postas ocorreu na presença da cor vermelha 
(Figura 1). Mesmo tendo sido submetidos ao 
treino discriminativo com os mesmos es-
tímulos compostos, o comportamento de 
cada um dos animais, durante o teste, foi 
controlado por uma propriedade especí-
fica diferente do estímulo (triângulo para 
o pombo 105 e cor vermelha para o pom-
bo 107). Reynolds argumentou apenas que 
o responder de cada um dos pombos ficou 
sob controle de um dos muitos aspectos de 
cada estímulo, não sugerindo possíveis de-
terminantes das diferenças individuais no 
controle de estímulos observado no com-
portamento dos pombos - até porque seus 
dados não permitiam explicar o controle de 
estímulos desenvolvido pelos animais. Os 
analistas do comportamento acham mais 
produtivo ficar provisoriamente sem uma 
Capítulo VI | Atenção
100
explicação do que inventar um explicação 
que não seja baseada nas interações entre o 
organismo e o ambiente. Por exemplo, Rey-
nolds poderia ter dito: “O pombo 105 bicou 
mais vezes na presença do triângulo duran-
te os testes porque ele prestou mais aten-
ção a este aspecto do estímulo durante o 
treino”. No entanto, propor uma explicação 
como essa não explica nada, é apenas ou-
tra forma de dizer que o pombo bicou mais 
vezes na presença do triângulo. Mesmo se 
aceitássemos a explicação “bicou mais na 
presença do triângulo porque prestou mais 
atenção a esse aspecto”, ainda teríamos que 
explicar por que ele prestou mais atenção a 
esse aspeto. Os estudos que foram desen-
cadeados após a publicação do artigo de 
Reynolds (1961), entretanto, mostraram que 
o objetivo do estudo original foi cumprido e 
inspirou muitos outros estudos que nos aju-
dam a compreender melhor como diferen-
tes controles de estímulos se estabelecem. 
Experimento 2 - Objetivo e Método
 Reynolds (1961) realizou um segun-
do experimento, com os mesmos pombos, 
fazendo combinações de estímulos ainda 
mais complexas. No Experimento 2, havia 
as seguintes combinações de forma e cor 
nos discos de resposta durante o treino dis-
criminativo: triângulo sobre fundo verme-
lho, círculo sobre fundo vermelho, triân-
gulo sobre fundo azul, círculo sobre fundo 
azul. Além disso, em alguns momentos uma 
lâmpada amarela, posicionada na lateral da 
câmara experimental, se acendia e em ou-
tros momentos uma lâmpada verde, posi-
cionada no mesmo local que a amarela, se 
acendia. Durante o treino discriminativo do 
Experimento 2, as respostas de bicar o disco 
foram reforçadas em esquema de intervalo 
fixo (FI) 3 min quando a lâmpada amarela 
estava acesa e o fundo do disco era verme-
lho (independentemente se continha círcu-
lo ou triângulo) e quando a luz verde estava 
acesa e o disco continha um triângulo (in-
dependentemente da cor do fundo do dis-
co). Veja que neste treino discriminativo, o 
comportamento do pombo de bicar no dis-
co deveria ficar sob controle de uma rela-
ção mais complexa (i.e., composta por mais 
elementos) entre os estímulos presentes do 
que aquela programada no Experimento 1: 
cor da lâmpada lateral, cor do fundo do dis-
co e forma projetada no disco.
Resultados e Discussão
 Após cerca de 100 horas de trei-
no discriminativo, o comportamento dos 
pombos ficou sob controle dos estímulos 
programados, isto é, eles bicavam no dis-
co quando a luz amarela e o fundo do dis-
co vermelho estavam presentes e quando 
luz verde e o triângulo estavam presentes; 
quando a luz amarela e círculo sobre fun-
do azul estavam presentes, por exemplo, os 
pombos praticamente não bicavam o disco 
de resposta. Após o treino discriminativo, 
Reynolds (1961) realizou vários testes em 
extinção alterando a configuração dos estí-
mulos como, por exemplo, extinção das res-
postas durante as mesmas configurações de 
estímulos do treino; extinção das respostas 
com as duas lâmpadas laterais apagadas; e 
Elenice S. Hanna, Márcio Borges Moreira
101
extinção das respostas com as duas lâmpa-
das laterais acesas simultaneamente. 
Os resultados desse segundo expe-
rimento replicaram os resultados do pri-
meiro: controle por aspectos específicos da 
configuração de estímulos. Nas palavras de 
Reynolds (1961, p. 208): 
No segundo experimento, nenhum 
dos pombos atentou para a cor da lâmpa-
da lateral. O responder deles foi controlado 
apenas pela presença ou ausência da lâm-
pada lateral amarela, ou, de acordo com 
análise posterior, pela intensidade da ilu-
minação da lâmpada lateral.
DESDOBRAMENTOS 
 Centenas, talvez milhares, de pes-
quisas foram e continuam sendo realizadas 
com o intuito de sabermos cada vez mais 
sobre os fatores que determinam quais os 
aspectos do ambiente que controlarão ocomportamento de diferentes organismos 
e em quais situações (e.g., Barros, Galvão, 
Brino, Goulart, & McIlvane, 2005; Carter & 
Werner, 1978; de Rose, de Souza & Hanna, 
1996; Debert, Huziwara, Faggiani, de Mathis 
& McIlvane, 2009; Dube & McIlvane, 1999; 
Johnson & Cumming, 1968; Lovaas, Koegel 
& Schreibman, 1979). Em outras palavras, 
ainda hoje estudamos o que pode levar al-
gumas pessoas a prestarem atenção a certos 
aspectos de seu ambiente e outras pessoas a 
prestarem atenção a outros aspectos. A se-
guir, apresentamos dois experimentos que 
demonstraram controle discriminativo por 
parte da configuração de estímulos e avan-
çaram o conhecimento sobre o tema.
 O primeiro experimento, conduzido 
por Wilkie e Masson (1976), foi uma repli-
cação sistemática do experimento de Rey-
nolds (1961) com controles mais refinados e 
também utilizando pombos como sujeitos 
experimentais. A primeira parte do estudo 
foi idêntica ao Experimento 1 de Reynolds 
(i.e., treino com estímulos compostos e tes-
te com os elementos dos estímulos com-
postos). Na fase de teste, os seis pombos 
responderam quase que exclusivamente 
na presença da cor previamente correla-
cionada com o reforço (i.e., teriam atenta-
do para cor e não para a forma). Embora as 
bicadas dos pombos de Wilkie e Masson 
não tenham ficado sob controle de aspec-
tos diferentes do estímulo composto, como 
no estudo de Reynolds, a evidência de con-
trole por apenas uma das propriedades do 
estímulo composto (cor) é um resultado se-
melhante ao (i.e., uma replicação do) estudo 
original.
A replicação (Wilkie & Mason, 1976) 
confirmou que os animais não humanos 
não atentam para todas as propriedades 
de um estímulo composto, mas os autores 
ainda foram além para avaliar se o teste em 
extinção era um contexto adequado para 
identificar o controle de estímulos aprendi-
do durante os treinos. Wilkie e Masson, em 
uma segunda etapa do estudo, realizaram 
um novo treino discriminativo para avaliar 
Capítulo VI | Atenção
102
se a situação de teste em extinção masca-
rou o possível controle exercido pela outra 
propriedade do estímulo (forma). Neste se-
gundo treino, bicadas no disco foram refor-
çadas na presença das duas formas (triân-
gulo e círculo), mas sem o fundo colorido 
correspondente aos estímulos compostos 
do primeiro treino. Se as formas não tives-
sem adquirido nenhuma função comporta-
mental no primeiro treino, a aprendizagem 
na presença de cada forma deveria ser se-
melhante no segundo treino. No entanto, já 
na primeira sessão de treino os pesquisa-
dores observaram que a frequência do res-
ponder na presença da forma previamente 
correlacionada com reforço aumentou mais 
rapidamente que na presença da forma cor-
relacionada com extinção. Embora se pu-
desse pensar, a partir do primeiro teste, que 
os pombos prestaram atenção somente à 
cor, os resultados do segundo treino discri-
minativo mostraram que as formas também 
exerceram algum controle sobre o compor-
tamento.
 Este é um dos aspectos mais interes-
santes da pesquisa científica e que depende 
da curiosidade de pesquisadores e pesqui-
sadoras: seu caráter cumulativo. Reynolds 
(1961) demonstrou atenção seletiva à deter-
minados aspectos dos estímulos. Wilkie e 
Masson (1976) confirmaram esse resultado 
e ainda mostraram que o contexto no qual 
se avalia a atenção às diferentes proprie-
dades do estímulo pode levar a conclusões 
diferentes sobre a extensão do controle de 
estímulos. 
Nas décadas de 1960 e 1970, muitos 
estudos sobre controle de estímulos rea-
lizados em laboratório utilizaram pombos 
como sujeitos. O sistema visual das aves, 
dentre outras vantagens, permite empregar 
diversos estímulos visuais com variação 
de cores, diferentemente dos roedores que 
são sensíveis aos raios UV e “cegos” para 
grande parte das frequências que seres hu-
manos enxergam. Nesses estudos, os estí-
mulos visuais são projetados nos discos de 
resposta ou em outros locais da câmara ex-
perimental para estudo do comportamento 
operante de pombos. 
Uma pergunta comumente feita 
quando fenômenos importantes são estu-
dados empiricamente em laboratório com 
não humanos é sobre a sua generalida-
de para o comportamento humano. Nesse 
sentido, Touchette (1969) realizou um treino 
discriminativo com sete garotos de 12 a 17 
anos com atraso severo no desenvolvimen-
to, utilizando linhas com diferentes inclina-
ções (45° e 135°). O treino iniciava com o re-
forçamento de respostas quando uma parte 
pequena da linha (semelhante à um ponto) 
aparecia na parte debaixo (para cinco parti-
cipantes) ou de cima (para outros dois par-
ticipantes) do painel de apresentação dos 
estímulos (Figura 2, Pré-treino). Em segui-
da, os participantes aprendiam as discri-
minações com as linhas inclinadas (Figura 
2, Treino), devendo responder na chave da 
esquerda na presença de uma linha com 45° 
de inclinação e na chave da direita na pre-
sença de uma linha com 135° de inclinação.
Elenice S. Hanna, Márcio Borges Moreira
103
Durante o teste para avaliar o con-
trole de estímulos, Touchette (1969) consi-
derou as linhas como estímulos compos-
tos e separou cada linha em duas partes, 
apresentando ora a parte inferior ora a 
parte superior (Figura 2, Teste). Note que 
esta separação não alterava a inclinação 
da linha, que era a propriedade que o ex-
perimentador esperava que controlasse o 
comportamento dos participantes. No en-
tanto, o controle parcial foi observado mais 
uma vez para a maioria dos participantes, 
que responderam consistentemente apenas 
para uma das partes (superior ou inferior) 
da linha com a inclinação correlacionada 
com reforçamento (Figura 2, painel da di-
reita), replicando os achados de Reynolds 
(1961) e Wilkie e Masson (1976). Além de 
mostrar a generalidade do fenômeno do 
controle parcial com humanos e para estí-
mulos mais simples (como linhas), Touchet-
te mostrou a importância de aprendizagens 
anteriores para compreender o controle de 
estímulos (veja também esse efeito de his-
tória em Johnson & Cumming, 1968, e Ray, 
1969). A história experimental construída 
durante o pré-treino com estímulos em po-
sições diferentes (superior ou inferior), foi 
uma variável importante para compreender 
o controle de estímulos observado no teste. 
Em geral, o responder foi apropriado (i.e., 
consistente com o treino) apenas quando 
as partes das linhas apresentadas no teste 
correspondiam à posição dos estímulos do 
Pré-treino. Em outras palavras, o início do 
treino que exigiu atenção para a (ou contro-
le pela) parte de cima ou debaixo da chave 
determinou para qual parte da linha incli-
nada o participante atentou nas etapas sub-
sequentes do procedimento.
Um tema de pesquisa em Análise 
do Comportamento bastante relacionado 
com os achados de Reynolds (1961) é a su-
perseletividade (overselectivity). Diz-se que 
houve superseletividade de estímulos ou 
controle de estímulos restrito quando se ob-
serva que um dado comportamento fica sob 
Figura 2. Estímulos utilizados em cada etapa do estudo de Touchette (1969; painel da esquerda) e porcentagens de acertos obtidas no teste para cada 
participante (painel da direita). Figura construída com base na descrição do estudo.
Capítulo VI | Atenção
104
o controle de apenas uma propriedade do 
estímulo quando deveria, do ponto de vista 
do experimentador, ficar sob o controle de 
relações entre diferentes propriedades des-
se estímulo ou de outras propriedades. Por 
exemplo, se o pai faz a barba e o filho não 
o reconhece mais como sendo seu pai, di-
zemos que houve superseletividade de estí-
mulos (estímulo barba, neste caso).
A superseletividade (Lovaas, Schrei-
bman, Koegel, & Rehm, 1971) ou controle res-
trito de estímulos é observada em humanos 
com desenvolvimento típico (e.g., Verneque 
& Hanna, 2012), mas com mais frequência 
em crianças com desenvolvimento atípico 
(e.g., Lovaas & Schreibman, 1971; Lovaas et 
al., 1971; Lovaas, et al., 1979), especialmente 
em indivíduos com diagnóstico de autis-
mo. Lovaase colaboradores (e.g., Lovaas & 
Schreibman, 1971; Lovaas et al., 1971) ensi-
naram crianças com desenvolvimento típi-
co e com diagnóstico de autismo a discrimi-
nar estímulos compostos e mostraram que 
a maioria das crianças com diagnóstico de 
autismo respondeu a apenas um dos com-
ponentes dos estímulos quando eles foram 
apresentados separadamente no teste (i.e., 
superseletividade). Uma proporção menor 
de crianças com atraso do desenvolvimento 
do estudo de Lovaas et al. (1971) apresentou 
superseletividade, enquanto as crianças 
com desenvolvimento típico responderam 
a todos os componentes do estímulo com-
posto. Lovaas et al. (1979) discutem como 
a superseletividade pode estar relacionada 
com falhas no desenvolvimento da lingua-
gem, do comportamento social e a outras 
deficiências na aprendizagem de pessoas 
no espectro autista.
Os estudos de Lovaas e colaborado-
res (e.g., Lovaas & Schreibman, 1971; Lovaas 
et al., 1971; Lovaas et al., 1979) foram con-
siderados bastante relevantes para a época, 
quando havia escassez de conhecimento 
sobre a falta de responsividade a elemen-
tos críticos do ambiente em indivíduos com 
diagnóstico de autismo e por ter desenca-
deado investigações sobre as condições 
que reduzem a superseletividade. Lovaas e 
Schreibman (1971), por exemplo, mostraram 
que ao reforçar respostas na presença dos 
componentes apresentados separadamen-
te, crianças com diagnóstico de autismo 
passaram a responder a todos os elementos 
do estímulo composto. Outros estudos (e.g., 
Allen & Fuqua, 1985; Schreibman, Charlop, 
& Koegel, 1982) mostraram que não é neces-
sário decompor o estímulo e ensinar sepa-
radamente as discriminações de cada ele-
mento para ampliar o controle de estímulos 
(i.e., para reduzir a superseletividade). Estes 
estudos utilizaram, durante a fase de ensi-
no, configurações de estímulos compostos 
S+ e S- que variavam um componente do 
composto por vez (diferença única) e com-
pararam com a condição de ensino que pro-
grama estímulos compostos com todos os 
componentes diferentes (diferenças múlti-
plas). Veja na Figura 3 exemplos de estímu-
los criados com diferenças múltiplas (pai-
nel direito) e estímulos com diferença única 
(painel esquerdo). Na configuração com di-
Elenice S. Hanna, Márcio Borges Moreira
105
ferenças múltiplas, estímulos S+ e S- pos-
suem maior diferença física e o responder 
sob controle de um único componente do 
estímulo tem a mesma probabilidade de re-
forçamento seja qual for o elemento. Nesse 
caso, atentar para qualquer um dos elemen-
tos do estímulo composto é suficiente para 
produzir 100% dos reforços. Em contraste, 
para a configuração que possui apenas um 
elemento diferente, responder sob contro-
le dos elementos iguais tem baixa probabi-
lidade de ser seguido por reforço, uma vez 
que ele também está presente nos estímu-
los “incorretos”, isto é, aqueles não correla-
cionados com reforçamento. Se o elemento 
diferente é variado ao longo do treino (uti-
lizando-se diferentes S- como os da Figura 
3), as discriminações por mais componen-
tes se desenvolvem. 
No entanto, configurações com dife-
rença única (crítica) produzem mais erros 
durante a etapa de ensino e seu uso pode 
não ser uma estratégia eficiente para indi-
víduos com baixa resistência à frustração e 
em tarefas com alta complexidade em rela-
ção ao repertório inicial de estudantes (e.g., 
Anderson & Rincover, 1982). Nesses casos, 
procedimentos especiais que combinam o 
ensino de discriminações com os elemen-
tos separados e compostos com diferenças 
críticas e/ou a programação de aumentos 
graduais na semelhança física entre os es-
tímulos (fading, veja o estudo de Terrace, 
1963) podem ser utilizados na metodologia 
de ensino. Os estudos de Dube e McIlvane 
(1999) e de Duarte e Baer (1997) são exem-
plos destes procedimentos. O primeiro en-
sinou discriminações entre palavras e o se-
gundo entre faces.
CONSIDERAÇÕES FINAIS
 Em muitas atividades humanas, 
é necessário atentar e discriminar diver-
sos eventos e ignorar outros. Reynolds 
(1961) iniciou uma série de investigações 
que mostraram que o atentar e as discri-
minações que aprendemos dependem das 
contingências de reforçamento às quais 
somos expostos. Quando estas contingên-
cias permitem o responder sob controle de 
qualquer componente ou propriedade do 
evento antecedente para que o reforçamen-
to ocorra, variabilidade e controle restrito 
por um dos elementos comumente resulta. 
A ocorrência dessa variabilidade depende, 
entretanto, de condições antecedentes his-
tóricas e presentes, além de características 
do organismo. O conhecimento das variá-
veis independentes que ampliam o controle 
Figura 3. Exemplo de configuração de estímulos S+ e S- com diferença 
única e com diferenças múltiplas.
Capítulo VI | Atenção
106
de estímulos (atenção) tem possibilitado o 
desenvolvimento de metodologias efetivas 
para modificar o padrão de controle de estí-
mulo muitas vezes denominado de “patoló-
gico” (Sidman, 1960).
Pesquisas sobre controle de estímu-
los realizadas com não humanos, como as 
de Reynolds (1961), dentre muitas outras, 
foram e continuam sendo essenciais para 
que pesquisas sobre controle de estímulos 
com humanos fossem e continuem sen-
do realizadas – toda vez que uma criança 
apresenta dificuldades para aprender a ler, 
por exemplo, temos ali uma possível apli-
cação para o conhecimento sobre controle 
de estímulos. O conhecimento acumulado 
produzido tanto por pesquisas com não hu-
manos quanto por pesquisas com humanos 
foi essencial para que tecnologias de ensino 
eficazes fossem produzidas e aplicadas nos 
mais diversos contextos. Graças a todo esse 
histórico de produção de conhecimento de 
base empírica, analistas do comportamento 
têm a possibilidade, hoje em dia, de auxiliar 
professores a elaborar estratégias de ensino 
que otimizam a aprendizagem de leitura e 
escrita de crianças no ensino regular; que 
possibilitam melhora na qualidade de vida 
de crianças diagnosticadas com algum tipo 
de atraso no desenvolvimento, incluindo 
desempenhos acadêmicos; e que auxiliam 
no desenvolvimento de softwares educa-
cionais mais eficazes, apenas para citar al-
guns exemplos.
PARA SABER MAIS
da Hora & Benvenuti (2007). Os pesquisa-
dores avaliaram os efeitos de um procedi-
mento conhecido como resposta de obser-
vação diferencial sobre o desempenho de 
um menino autista em uma tarefa de mat-
ching-to-sample (MTS) que utilizou sílabas 
e palavras como estímulos. A resposta de 
observação diferencial impedia que o res-
ponder da criança aos estímulos compara-
ção fosse baseado em apenas uma das síla-
bas da palavra apresentada como modelo.
Gomes & Souza (2008). Nesta pesquisa 
avaliou-se o desempenho de pessoas diag-
nosticadas com autismo em tarefas de em-
parelhamento com o modelo por identida-
de. Buscou-se, na pesquisa, identificar os 
efeitos da organização dos estímulos sobre 
a aprendizagem dos participantes.
Hanna, Karino, Araújo, & Souza (2010). 
Será que aprendemos a ler novas palavras 
mais rapidamente treinando a leitura com 
palavras semelhantes ou diferentes? Será 
que aprendemos a ler novas palavras mais 
rapidamente treinando com silabas ou le-
tras? Essa pesquisa tentou responder a es-
sas perguntas.
Alves, de Assis, Kato, & Brino (2011). Nesta 
pesquisa investigou-se a aprendizagem de 
leitura recombinativa após procedimentos 
de esvanecimento de sílabas das palavras 
de ensino em pessoas com atraso no desen-
volvimento cognitivo. 
Elenice S. Hanna, Márcio Borges Moreira
107
REFERÊNCIAS
Alves, K. R. S., de Assis, G. J. A, Kato, O. M., 
& Brino, A. L.F. (2011). Leitura recombinati-
va após procedimentos de fading in de síla-
bas das palavras de ensino em pessoas com 
atraso no desenvolvimento cognitivo. Acta 
Comportamentalia, 19, 183-203.
Anderson, N. B. & Rincover, A. (1982). The 
generality of overselectivity in develop-
mentally disabled children. Journal of Ex-
perimental Child Psychology, 34, 217-230. 
Barros, R. S., Galvão, O.F., Brino, A. L. F., 
Goulart, P. R. K., & McIlvane, W. J. (2005). 
Variáveis de procedimento na pesquisa so-
bre classes de equivalência: contribuições 
para o estudo do comportamento simbóli-
co. Revista Brasileira de Análise do Com-
portamento, 1, 15-27.
Carter, D. E., & Werner, T. J. (1978). Com-
plex learning and information processing 
by pigeons: A critical analysis. Journal of 
the Experimental Analysis of Behavior, 29, 
565-601.
Catania, A. C. (1998/1999). Aprendizagem: 
comportamento, linguagem e cognição. Por-
to Alegre: Artmed.
da Hora, C. L., & Benvenuti, M. F. L. (2007). 
Controle restrito em uma tarefa de mat-
ching-to-sample com palavras e sílabas: 
avaliação do desempenho de uma criança 
diagnosticada com autismo. Revista Brasi-
leira de Análise do Comportamento, 3, 29-
45.
Debert, P., Huziwara, E. M., Faggiani, R. B., 
de Mathis, M. E. S., & McIlvane, W. J. (2009). 
Emergent conditional relations in a go/no-
-go procedure: Figure-ground and stimu-
lus-position compound relations. Journal of 
Experimental Analysis of Behavior, 92, 233-
243.
Dinsmoor, J. A. (1995). Stimulus control: Part 
I. The Behavior Analyst, 18, 51–68.
Duarte, A. M. M., & Baer, D. M. (1997). Over-
selectivity in the naming of suddenly and 
gradually constructed faces. In D. M. Baer 
& E. M. Pinkston (Eds.), Environment and 
behavior (pp. 210-218). Oxford: Westview 
Press.
Dube, W. V., & McIlvane, W. J. (1999) Re-
duction of stimulus overselectivity with 
nonverbal differential observing responses. 
Journal of Applied Behavior Analysis, 32, 
25-33.
Gomes, C. G. S., & Souza, D. G. (2008). De-
sempenho de pessoas com autismo em ta-
refas de emparelhamento com o modelo 
por identidade: efeitos da organização dos 
estímulos. Psicologia: Reflexão e Crítica, 21, 
418-429.
Hanna, E., Karino, C., Araújo, V., & Souza, 
D. (2010). Leitura recombinativa de pseu-
dopalavras impressas em pseudoalfabeto: 
Capítulo VI | Atenção
108
similaridade entre palavras e extensão da 
unidade ensinada. Psicologia USP, 21, 275-
311. 
Johnson, D. F., & Cumming, W. W. (1968). 
Some determiners of attention. Journal of 
the Experimental Analysis of Behavior, 11, 
157-166.
Johnston, J. M., & Pennypacker, H. S. (2009). 
Strategies and Tactics of Behavioral Resear-
ch. New York: Routledge. 
Lashley, K. S. (1938). The mechanism of vi-
sion: XV. Preliminary studies of the rat’s ca-
pacity for detail vision. Journal of General 
Psychology, 18, 123-193.
Lovaas, O. I., Schreibman, L., Koegel, R. L., 
& Rehm, R. (1971) Selective responding by 
autistic children to multiple sensory input. 
Journal of Abnormal Psychology, 77, 211-
222. 
Lovaas, O. I., Koegel, R. L., & Schreibman, 
L. (1979). Stimulus overselectivity in autism: 
a review of research. Psychological Bulletin, 
86, 1236-1254.
Lovaas, O. I., & Schreibman, L. (1971). Sti-
mulus overselectivity of autistic children in 
a two stimulus situation. Behavioral Rese-
arch & Therapy, 9, 305-310.
Ray, B. A. (1969). Selective attention: The 
effects of combining stimuli which control 
incompatible behavior. Journal of the Expe-
rimental Analysis of Behavior, 12, 539-550.
Reynolds, G. (1961). Attention in the pige-
on. Journal of the Experimental Analysis of 
Behavior, 4, 203-208.
Sidman, M. (1979). Remarks. Behaviorism, 7, 
123-126.
Sidman (1960). Normal sources of patholo-
gical behavior. Science, 132, 61-68.
Skinner, B. F. (1953/2003). Ciência e com-
portamento humano (J. C. Todorov & R. 
Azzi, Trads.). São Paulo: Martins Fontes.
Terrace, H. S. (1963). Errorless transfer of a 
discrimination across two continua. Jour-
-nal of the Experimental Analysis of Beha-
vior, 6, 223–232.
Touchette, P. E. (1969). Tilted lines as com-
plex stimuli. Journal of the Experimental 
Analysis of Behavior, 12, 211-214.
Verneque, L., & Hanna, E. S. (2012). Tempo 
de exposição a estímulos multidimensio-
nais e topografias de controle de estímulo. 
Revista Brasileira de Análise do Comporta-
mento, 8, 12-25.
Wilkie, D. M., & Masson, M. E. (1976). Atten-
tion in the pigeon: a reevaluation. Journal of 
the Experimental Analysis of Behavior, 26, 
207-212.
Peter Endemann, Candido Pessôa 
109
A resposta de observação: o 
papel das respostas sensoriais 
para o estabelecimento da 
discriminação
Peter Endemann 
Universidade de São Paulo
Candido V. B. B. Pessôa
Paradigma Centro de Ciências do Comportamento
Wyckoff, L. B. (1969). The role of observing responses in discrimination learning. In D. P Hendry 
(Ed.), Conditioned reinforcement (pp. 237-260). Homewood, IL: The Dorsey press. 
“A seleção natural atuou sobre o sistema sensorial por meio das consequências im-
postas aos comportamentos guiados por esse sistemas” 
Nilsson (2009)
Capítulo VII | Resposta de Observação
110
1 O controle da resposta por estímulos irrelevantes e seu efeito no esta-
belecimento da discriminação tem sido investigado ao longo das últi-
mas décadas por diversos pesquisadores (e.g. Dinsmoor, 1985; Dopson, 
Esber & Pearce, 2010; Endemann, 2013; Hall, 1976; Krechevsky, 1932; 
Lawrence, 1949; Mackintosh, 1965; Serna & Carlin, 2001; Spence, 1936; 
Trobalon, Miguelez, McLaren & Mackintosh, 2003; Wagner, Logan, 
Haberlandt & Price, 1968; Wyckoff, 1952; Zeaman & Denegre, 1967).
INTRODUÇÃO À ÁREA DE PES-
QUISA E CONTEXTUALIZAÇÃO 
DO EXPERIMENTO
A elaboração do conceito de respos-
ta de observação se deu com o objetivo de 
abordar um conjunto de práticas e pressu-
postos envolvendo a experiência senso-
rial dos organismos a partir de uma pers-
pectiva comportamental. De modo geral, a 
experiência sensorial, compreendida pelo 
ver, ouvir, sentir cheiros ou gostos ou sen-
tir a textura de um objeto pelo tato, é tra-
dicionalmente definida por habilidades 
tais como a diferenciação e associação de 
objetos. De uma perpectiva comportamen-
tal, essa experiência foi definida em termos 
de discriminação e generalização, isto é, 
pelo controle diferencial de respostas por 
estímulos do ambiente. Segundo Skinner 
(1938/1991), “pode-se dizer que um organis-
mo ‘percebe que dois estímulos são diferen-
tes’ se alguma diferença, qualquer que seja 
ela, pode ser identificada no comportamen-
to sob controle daqueles estímulos” (p. 169). 
Essas respostas diferenciais são produzi-
das em um treino discriminativo ou treino 
de reforçamento diferencial. Nesse treino, 
respostas são reforçadas na presença de 
um estímulo (S+ ou SD) e não reforçadas na 
presença de outro estímulo (S- ou S-delta).
Nas décadas de 1930 e 1940, o papel 
das respostas sensoriais no estabelecimen-
to da discriminação foi empiricamente in-
vestigado. Posições opostas entre os diver-
sos pesquisadores da época deram origem a 
um longo debate, conhecido como Contro-
vérsia Continuidade vs. não Continuidade. 
Foi a partir desse debate que Wyckoff (1952, 
1969) elaborou seu problema de pesquisa e 
o procedimento experimental para seu es-
tudo. 
De um modo geral, o papel das res-
postas sensoriais foi inserido nos estudos 
sobre a discriminação por Karl Lashley 
(1929). Essa inserção se deu partir de um 
princípio fundamental da Gestalt, a seleti-
vidade. Com base nesse princípio, os orga-
nismos não percebem ou atentam ao am-
biente como um todo, mas apenas a partes 
restritas desse ambiente. Segundo autores 
como Lashley (1929, 1938, 1942) e Kreche-
vsky (1932, 1937, 1938), o sujeito experi-
mental, ao ser exposto a um treino discri-
minativo, poderia atentar seletivamente a 
estímulos irrelevantes1 para a discriminação 
e permanecer respondendo sobre controle 
acidental desses estímulos. Nesses casos, o 
sujeito poderia não estar aprendendo nada 
sobre as contingências de discriminação 
programadas. Em síntese, o sujeito poderia, 
em função do controle seletivo de estímu-
los irrelevantes, permanecer em situação 
não discriminada mesmo sendo exposto e 
produzindo os reforçadores programados a 
depender de sua correlação com aqueles es-
Peter Endemann, Candido Pessôa 
111
tímulos. Exemplos de estímulos irrelevan-
tes poderiam ser a temperatura, o tamanhoou a textura da caixa experimental em um 
treino discriminativo entre as cores verde e 
vermelho.
Respostas a estímulos irrelevantes ao 
longo do treino discriminativo foram cha-
madas de tentativas de solução e, segundo 
Lashley (1929, 1938, 1942), são parte de uma 
gama de atividades e da história do sujeito. 
Essas tentativas de solução foram analisa-
das por Krechevsky (1932, 1938) sob o rótulo 
de “hipóteses”. Essas respostas, registradas 
sobretudo no início do treino discriminati-
vo, foram discutidas por Lashley e por Kre-
chevsky com base em outro princípio da 
Gestalt, o da “organização sensorial”.
O estabelecimento da discriminação 
envolveria, assim, uma série de controles 
independentes em função do contato sen-
sorial e seletivo com os estímulos presen-
tes. Essa série de controles antecederiam o 
contato e o controle diferencial das respos-
tas pelos estímulos S+ e S-. Lashley exem-
plifica esses controles como “respostas à 
posição, à alternação, a dicas oriundas dos 
movimentos do pesquisador e que comu-
mente precedem as respostas aos estímulos 
correlacionados” (Lashley, 1929, p. 135). O 
termo “estímulos correlacionados” utilizado 
por Lashley se refere tanto a S+ como a S-, 
pois ambos conservam correlações de +1 e 
-1 com o reforço, respectivamente2. 
Em conclusão, supondo uma priori-
dade da seletividade frente ao treino dis-
criminativo e ao estabelecimento da dis-
criminação, os autores (e.g., Lashley, 1929, 
1938) apontavam para a necessidade de se 
investigar não apenas o estabelecimento de 
respostas diferenciais, mas também de res-
postas sensoriais que tinham como função 
colocar o organismo em contato com os es-
tímulos S+ e S-, relevantes para a diferen-
ciação da resposta. Não se questionava uma 
definição comportamental de discrimina-
ção, mas a natureza do processo pelo qual o 
organismo passava a responder diferencial-
mente quando exposto ao treino de reforça-
mento diferencial. Para os autores citados 
anteriormente (e.g., Krechevsky, 1932, 1938; 
Lashley, 1938) , o estabelecimento da dis-
criminação seria um processo de natureza 
descontínua.
Por outro lado, Kenneth W. Spen-
ce (1936, 1940, 1945) e Skinner (1938/1991) 
assumiam a discriminação como um pro-
cesso contínuo, envolvendo o acúmulo de 
pequenas diferenças entre as respostas na 
presença de S+ e S-, em função do reforça-
mento diferencial (Skinner não participou 
ativamente do debate, o que lhe rendeu 
críticas, e.g., Krechevsky, 1938). Contudo, 
a concepção de que a discriminação seria 
2 Em um treino discriminativo, a correlação dos estímulos é correta e 
comumente tratada da seguinte maneira: S+ correlacionado ao reforço 
e S- correlacionado à extinção. A extinção se refere à ausência de re-
forço e, desse modo, o S- é correlacionado, negativamente, ao reforço. 
Assim, em um treino discriminativo, podemos nos referir tanto ao S+ 
como S- como “estímulos correlacionados”. Em termos de probabilida-
de de a resposta (ou cadeia de respostas) produzir o reforço, temos pro-
babilidade de 100% e 0%, respectivamente, sob o S+ e sob o S-. Estímu-
los que, de fato, não são correlacionados com o reforço são aqueles que 
mantem correlação nula (zero) e a probabilidade de a resposta produzir 
o reforço em sua presença é 50% (i.e., ao acaso). 
Capítulo VII | Resposta de Observação
112
um processo contínuo de acúmulos de pe-
quenas diferenças foi defendida por Spen-
ce). Essa concepção ficou, então, conhecida 
como continuísta. 
Com o objetivo de se investigar os 
processos básicos envolvidos na discrimi-
nação, tornar o treino mais eficaz e evitar o 
controle acidental das respostas por estímu-
los irrelevantes, tanto Skinner (1938/1991) 
como Spence (1936) estabeleceram algumas 
soluções procedimentais. Segundo Skinner, 
os experimentos deveriam ser conduzidos 
“em caixas à prova de som, escuras, com pa-
redes lisas” (p. 55). Segundo Spence (1936), 
uma vez que o interesse é no processo de 
diferenciação das respostas aos estímulos 
correlacionados com o reforço, o ambiente 
experimental bem como a resposta senso-
rial aos estímulos correlacionados devem 
ser os mais simples possível.
Segundo Spence (1936), todos es-
tímulos que incidam sobre o aparato sen-
sorial do organismo quando sua resposta é 
reforçada adquirem ou perdem tendências 
excitatórias. Assim, ao longo do treino dis-
criminativo, possíveis controles da resposta 
por estímulos irrelevantes vão sendo gradu-
almente eliminados e os estímulos correla-
cionados com o reforço (i.e., S+ e S-) passam 
a controlar diferencialmente a resposta, em 
um processo gradual e contínuo. 
As posições opostas sobre o processo 
de discriminação foram submetidas a uma 
série de experimentos nas décadas de 1930 
e 1940 (e.g. Ehrenfreund, 1948; Krechevsky, 
1932, 1937, 1938; Lashley, 1929, 1938, 1942; 
McCulloch & Pratt, 1934; Spence, 1936, 
1940, 1945). Nesses experimentos, a princi-
pal manipulação (variáveis independentes) 
foi o controle e variações em parâmetros 
dos estímulos (e.g., quantidade e posição 
dos estímulos no ambiente experimental, 
variação em suas propriedades físicas – bri-
lho, frequência, textura, etc. – variação em 
sua correlação com o reforço) e o desem-
penho analisado (variável dependente) foi 
o número de “acertos” e “erros”. O desem-
penho foi registrado antes que os sujeitos 
atingissem o critério, ou seja, no período em 
que os sujeitos se mantinham responden-
do tanto na presença do S+ quanto na do 
S-. Nesse período, as respostas não discri-
minadas (em relação aos S+ e S-) produzem 
as consequências programadas ao acaso, 
ou seja, as respostas produzem reforços em 
aproximadamente 50% das vezes. Esse pe-
ríodo foi chamado de período pressolução.
A manipulação de parâmetros dos 
estímulos e a análise das respostas no pe-
ríodo pressolução foram realizadas em con-
junto com uma manipulação bem engenho-
sa. Diversos pesquisadores aplicaram uma 
reversão na correlação dos estímulos com o 
reforço ainda no período pressolução, isto é, 
o estímulo que era S+ passava a ser S- e vi-
ce-versa. A justificativa dessas reversões no 
período pressolução era que caso a discri-
minação se estabelecesse por um processo 
contínuo, a reversão deveria afetar o núme-
ro de respostas (acertos e erros) emitidas no 
Peter Endemann, Candido Pessôa 
113
período pressolução, em comparação a um 
grupo controle para o qual a reversão não 
era conduzida. Se a discriminação fosse um 
processo descontínuo, a reversão dos estí-
mulos no período pressolução não afetaria 
necessariamente o número de respostas, 
uma vez que essas poderiam ser emitidas 
sob controle de outras partes do ambien-
te (estímulos irrelevantes) que não aquelas 
que foram correlacionadas ao reforço. 
De todas as manipulações dos parâ-
metros dos estímulos, a posição na qual o 
estímulo era apresentado em um treino de 
discriminação visual teve um papel pecu-
liar para o problema de pesquisa de Wycko-
ff (1969). Ehrenfreud (1948), com base nos 
dados inconclusivos dos experimentos até 
então realizados, decidiu expor dois grupos 
de sujeitos ao mesmo treino discriminativo 
e reversão dos estímulos no período pres-
solução. A única diferença entre os grupos 
foi a posição na qual os estímulos eram 
apresentados no campo de visão dos sujei-
tos. Os resultados obtidos por Ehrenfreud 
refletem os resultados obtidos ao longo de 
todo o debate: quando os estímulos eram 
apresentados bem a frente do sujeito, em 
uma posição a partir da qual o contato era 
favorecido ao longo de todo o treino, os re-
sultados davam maior suporte àqueles que 
defendiam a discriminação como um pro-
cesso contínuo. Quando os estímulos eram 
apresentados em outra posição do campo 
visual, os resultados davam maior supor-
te àqueles que defendiam discriminação 
como um processo não contínuo. 
Apesar de o artigo de Ehrenfreud ter 
sido publicado em 1948, o efeito da posição 
do estímulo já vinha sendo debatido desde 
a década de 1930. Ao longo do debate, Spen-
ce (1940, 1945), de forma bastantecoerente, 
analisou a situação experimental dos estu-
dos e inseriu uma questão interessante em 
seus argumentos. Segundo Spence, a mera 
presença dos estímulos na situação expe-
rimental não garante que esses estímulos 
incidam no aparato sensorial do sujeito. Se-
gundo Spence, “caso o aparato sensorial do 
animal não seja forçado a receber os estí-
mulos correlacionados com o reforço desde 
o início do treino, as associações não serão 
formadas” (Spence, 1940, p. 276). Nessas si-
tuações, 
 “o animal é requerido a aprender, em 
adição à resposta diferencial, uma 
resposta perceptual apropriada que o 
conduza para a recepção dos estímu-
los correlacionados ... o animal deve 
aprender a orientar e fixar a cabeça 
e os olhos afim de receber os estímu-
los correlacionados” (Spence, 1940, p. 
276). 
Essas respostas foram chamadas de 
respostas de orientação dos órgãos recep-
tores.
Ao inserir a necessidade do aprendi-
zado de uma resposta de orientação dos re-
ceptores no debate, Spence (1940, 1945) ad-
mite que o animal pode estar respondendo 
a estímulos irrelevantes e não estar apren-
Capítulo VII | Resposta de Observação
114
dendo nada sobre os estímulos correlacio-
nados (i.e., S+ e S-). Mas, nesse caso, segun-
do Spence (1945), não estaria ocorrendo o 
estabelecimento da discriminação sobre o 
qual seus interesses estavam centrados. O 
autor insistiu, portanto, na simplificação do 
ambiente experimental.
Após revisar o debate, Wyckoff levan-
ta críticas ao modelo defendido por Spence 
(1940, 1945). Sem necessariamente tomar 
um partido no debate, Wyckoff (1952) apon-
ta que a simplificação do ambiente experi-
mental, de modo a minimizar a necessidade 
de aprendizado de respostas de orientação 
dos receptores (como definidas por Spence), 
poderia impor limites ao valor preditivo do 
modelo continuísta e de teorias sobre o es-
tabelecimento da discriminação. Segundo 
Wyckoff, nem em situações cotidianas nem 
em situações controladas de laboratório 
seria possível precisar se os animais serão 
expostos aos estímulos correlacionados ao 
reforço. Em sua tese de doutorado, Wycko-
ff, manipulou a necessidade de se aprender 
a resposta de orientação dos receptores, 
além daquelas respostas que produzem (ou 
não) o reforço, em um treino discriminativo. 
Wyckoff finalizou o doutorado em 1951, pu-
blicou um artigo teórico em 1952 e, apenas 
em 1969, um artigo que descreve seu estudo 
experimental. Os objetivos e o método des-
se estudo serão descritos a seguir.
DESCRIÇÃO DO EXPERIMENTO
Objetivo e Método
O objetivo principal do experimento 
de Wyckoff (1969) foi analisar o papel das 
respostas de orientação dos receptores no 
estabelecimento de uma discriminação. Di-
ferentemente de como essas respostas eram 
discutidas, Wyckoff as definiu como res-
postas que colocam o organismo em conta-
to com estímulos correlacionados com o re-
forço. Para diferenciá-las das respostas que 
produzem o reforço (e.g., bicar um disco em 
experimentos com pombos, pressionar uma 
barra em experimentos com ratos, chama-
das de respostas efetivas), Wyckoff as no-
meou de respostas de observação (RO). 
Com base na função da RO (i.e., co-
locar o organismo em contato com os es-
tímulos correlacionados ao reforço) e nos 
princípios do condicionamento operante 
descritos por Skinner (1938/1991), Wyckoff 
(1969) investigou se a produção de estímu-
los discriminativos teria um efeito reforça-
dor sobre a RO em um treino discrimina-
tivo. Essa investigação, segundo Wyckoff 
(1952), forneceria um tratamento comporta-
mental ao que vinha sendo nomeado de ex-
periência sensorial e resposta de orientação 
dos receptores.
Frente à dificuldade de se registrar a 
orientação dos órgãos receptores de sujei-
tos experimentais, Wyckoff (1969) foi enge-
nhoso e coerente com a definição funcional 
da RO. Em seu experimento, usou pombos 
Peter Endemann, Candido Pessôa 
115
como sujeitos experimentais. Na caixa ex-
perimental, um pedal foi posto no piso e 
os estímulos correlacionados com o refor-
ço (S+ ou S-) só eram apresentados caso o 
pombo o pressionasse. Assim, os pombos 
só entravam em contato com os estímulos 
ao pressionar o pedal. Os estímulos ficavam 
expostos durante todo o tempo em que o 
sujeito estivesse pisando o pedal, o que, por 
sua vez, definiu a medida a ser registrada 
e analisada por Wyckoff: a duração da res-
posta de observação. 
No experimento, foram utilizados 20 
pombos mantidos sob um regime de priva-
ção de comida. Os pombos foram distribuí-
dos em dois grupos, (Controle e Experimen-
tal). Além do pedal, a caixa experimental 
continha um disco que podia ser iluminado 
de branco, vermelho ou verde e um come-
douro retrátil (para apresentação de comi-
da). 
Em uma fase preliminar, que durou 
45 min, houve a adaptação dos pombos 
de ambos os grupos às condições experi-
mentais. Durante os primeiros 15 min des-
sa fase, o disco foi iluminado de branco e 
a primeira bicada no disco produzia acesso 
a um comedouro por 4 s em um esquema 
de intervalo fixo (FI) 30 s. Durante os 30 
min restantes dessa fase, o disco foi ilumi-
nado de verde ou de vermelho em períodos 
sucessivos de 30 s. As respostas de bicar o 
disco davam acesso ao comedouro da mes-
ma forma que nos primeiros 15 min dessa 
fase (i.e., sob um FI 30 s). Nesta fase preli-
minar, não havia contingências para pisar 
no pedal e tampouco uma correlação entre 
as luzes verde e vermelha e o acesso ao co-
medouro. Os pombos do Grupo Controle 
foram expostos a estas condições durante 
todo o experimento.
Na Fase Experimental (treino discri-
minativo), aplicadas apenas aos pombos no 
Grupo Experimental, houve cinco sessões 
de 75 min e uma de 15 min. Durante as ses-
sões desta fase, respostas de bicar o disco fo-
ram mantidas sob um esquema FI 30 s. Esse 
esquema se alternava com um esquema de 
extinção a cada 30 s. Durante a extinção, 
bicadas no disco não produziam acesso ao 
comedouro. Durante a fase experimental, a 
luz vermelha era correlacionada ao FI 30 s 
(i.e., aos reforços) a luz verde era correlacio-
nada à extinção. Entretanto, as luzes ver-
de ou vermelha eram produzidas somente 
enquanto o pombo pisasse no pedal, isto é, 
quando emitisse a RO. Se o pombo emitisse 
a RO e o esquema em vigor fosse a extin-
ção, o disco era iluminado de verde. Quan-
do o pombo pisasse no pedal e estivesse em 
vigor o esquema FI 30 s, a luz vermelha se 
acendia no disco. Caso o sujeito não emitis-
se a RO, o disco permanecia iluminado de 
branco tanto quando o esquema em vigor 
era o FI30 s quanto quando o esquema em 
vigor era extinção e as respostas de bicar o 
disco produziam o reforço a depender de 
qual esquema estava em vigor. Em resumo, 
pisar o pedal, emitindo a RO, transformava 
um esquema misto FI 30 s extinção em um 
esquema múltiplo FI 30 s extinção3.
Capítulo VII | Resposta de Observação
116
Após as seis primeiras sessões da 
Fase Experimental, o Grupo Experimen-
tal foi subdividido em três subgrupos A, B 
e C. O subgrupo A permaneceu no treino 
discriminativo (reforçamento diferencial) e, 
assim, a RO continuava a produzir as luzes 
verde e vermelha e essas, por sua vez, se 
mantinham relacionadas com a extinção e 
reforço, respectivamente. Para o subgrupo 
B, a relação dos estímulos com o reforço foi 
invertida (o estímulo relacionado ao FI 30 
s passou a ser o verde e o estímulo relacio-
nado à extinção passou a ser o vermelho); e 
o subgrupo C retornou à condições seme-
lhantes aos últimos 30 min da fase preli-
minar (reforçamento não-diferencial), nas 
quais as luzes, apesar de produzidas pela 
pressão no pedal, não estavam mais corre-
lacionadas ao reforço (i.e., reforço poderia 
ser produzido com a mesma probabilidade 
diante da luz verde e vermelha, se o pedal 
estivesse pressionado, e branca, se o pedal 
não estivesse pressionado).
Resultados e Discussão
Como indicado anteriormente, Wy-
ckoff (1969) registrou o tempo em que o pe-
dal era pressionado, isto é, a duração das 
respostas de observação. Com isso, eleana-
lisou variações na duração da RO em fun-
ção da produção ou não dos estímulos cor-
relacionados com o reforço nos diferentes 
subgrupos. A duração da RO para o Grupo 
Controle foi relativamente alta inicialmen-
te, mas rapidamente diminuiu, permane-
cendo baixa até o fim do experimento. Para 
o Grupo Experimental, a duração da RO 
também começou alta para todos os pom-
bos e assim permaneceu para o subgrupo 
A, que se manteve no treino discriminativo. 
Para o subgrupo B, a duração da RO dimi-
nuiu logo que a correlação dos estímulos 
foi invertida, mas aumentou assim que a 
discriminação foi novamente estabelecida. 
Para o subgrupo C, que retornou às condi-
ções da fase preliminar após o treino discri-
minativo (as luzes verde e vermelha podiam 
ser produzidas, mas não havia correlação 
diferencial com o reforço), a duração da RO 
diminuiu em relação à fase em que havia 
correlação entre as luzes verde e vermelha 
e o reforço.
Em conclusão, Wyckoff (1969) afir-
mou que a exposição e o contato dos sujei-
tos com os estímulos discriminativos teve 
um efeito reforçador sobre a RO (i.e., pres-
são ao pedal). Assim, Wyckoff confirmou 
que a produção de estímulos discriminati-
vos para a resposta de bicar um disco esta-
beleceu e manteve a RO. Com base em seus 
resultados, Wyckoff (1952, 1969) afirmou 
que (1) a probabilidade da RO aumenta ou 
permanece alta sob as condições de reforço 
diferencial implementadas no treino discri-
minativo; (2) quando a correlação dos estí-
mulos é invertida, a probabilidade da RO 
diminui temporariamente e depois retorna 
a um valor alto; e (3) a probabilidade da RO 
3 Em um esquema múltiplo, dois ou mais esquemas de reforço se alter-
nam e cada um é apresentado conjuntamente a um estímulo diferente. 
Em um esquema misto, os esquemas de reforço se alternam, mas não 
há estímulos correlacionados diferencialmente com os esquemas em 
vigor (Machado, 1982).
Peter Endemann, Candido Pessôa 
117
diminui ou permanece baixa em situações 
de reforço não-diferencial, nas quais os es-
tímulos produzidos pela RO não são corre-
lacionados ao reforço.
Os resultados obtidos autorizaram 
Wyckoff (1969) a discutir o papel da RO no 
estabelecimento da discriminação tendo 
como base os princípios operantes descri-
tos por Skinner (1938/1991). Segundo Wy-
ckoff (1952, 1969), a RO é uma resposta ope-
rante cuja consequência é a produção dos 
estímulos discriminativos. Definir a respos-
ta de observação por sua função e não por 
sua topografia permitiu a Wyckoff delinear 
um experimento que facilmente registrou 
as respostas de observação. Foi esta genia-
lidade que tornou seu estudo um clássico 
na Análise do Comportamento e permitiu 
ampliar o uso do conceito de discriminação 
para situações em que os estímulos discri-
minativos não estão claramente dispostos 
sobre o aparato sensorial dos indivíduos.
Um aspecto importante da RO vale 
ser ressaltado. A emissão da RO tem como 
única consequência a produção dos estí-
mulos discriminativos e, portanto, não al-
tera a obtenção dos reforços programados 
para uma determinada resposta. A obten-
ção dos reforços pode ocorrer sem a emis-
são da RO (i.e., na presença da luz branca). 
Em uma discriminação sucessiva (i.e., em 
que os estímulos correlacionados com re-
forço e com extinção se alternam), como 
delineada por Wyckoff (1969), todos os re-
forços programados podiam ser produzidos 
sem que os pombos emitissem uma única 
vez a RO. Esse aspecto levou a alguns des-
dobramentos importantes na investigação 
sobre o estabelecimento da discriminação, 
sobre os efeitos comportamentais de refor-
ços condicionados e sobre atenção. Esses 
desdobramentos são discutidos a seguir.
 DESDOBRAMENTOS
No procedimento de Wyckoff (1969), 
chamado de delineamento (ou procedimen-
to) de resposta de observação, o fortaleci-
mento da RO não ocorreu em função direta 
da produção do estímulo reforçador primá-
rio (i.e., acesso a comida). Como visto, no 
estudo de Wyckoff, o valor de reforçador 
condicionado das luzes verde e vermelha 
foi adquirido em função de suas correla-
ções com os esquemas de reforço (i.e., FI 30 
s) e extinção que, por sua vez, controlaram 
o aumento na duração da RO. Por meio des-
se delineamento, vários autores têm inves-
tigado essa (correlação) e outras condições 
(e.g. temporais) necessárias para o estabele-
cimento do valor reforçador condicionado 
de determinados estímulos. 
Como esperado, posições e hipóteses 
opostas sobre o reforço condicionado foram 
propostas. Um amplo debate se mantém até 
os dias atuais. As duas principais hipóteses 
são conhecidas como a hipótese da redu-
ção da incerteza e a hipótese da redução 
do atraso. Autores que propõem a hipótese 
da redução da incerteza (e.g. Berlyne, 1957) 
Capítulo VII | Resposta de Observação
118
defendem que a condição necessária para o 
estabelecimento e controle da RO é a redu-
ção na incerteza gerada pelas respostas aos 
estímulos não-correlacionados (estímulos 
irrelevantes, tais como a luz branca do es-
quema misto no estudo de Wyckoff, 1969). 
Os autores que propõem a hipótese da re-
dução do atraso (e.g. Fantino, 1977; Fantino 
& Logan, 1979), defendem que a condição 
necessária para o estabelecimento do valor 
reforçador condicionado de um estímulo é 
a redução temporal relativa sinalizada pelo 
estímulo correlacionado com o reforço pri-
mário. 
Dinsmoor (1983) discute algumas 
questões referentes à RO e apresenta, além 
de novas possibilidades de investigação 
sobre reforçamento condicionado, um refi-
namento do estudo de Wyckoff (1969) e do 
conceito de resposta de observação. Como 
descrito anteriormente, Wyckoff registrou 
e analisou a duração da RO em função da 
correlação dos estímulos com o reforço. 
Dinsmoor, Browne, Lawrence, e Wasser-
man (1971) registraram e analisaram sepa-
radamente a duração da RO nos diferentes 
componentes (i.e., na presença dos dife-
rentes estímulos) em um treino de reforça-
mento diferencial. Os autores notaram que 
a duração da RO é maior na presença do S+ 
do que na presença do S-. Essa assimetria 
na duração da RO entre S+ e S- foi definida 
pelos autores como observação seletiva e 
gerou novas pesquisas sobre o reforço con-
dicionado e sobre o papel da RO no estabe-
lecimento da discriminação (e.g. Dinsmoor 
1985; Dinsmoor, Mueller, Martin, & Bowe, 
1982).
 Com o desenvolvimento de novas 
tecnologias, especialmente a de rastrea-
mento dos movimentos oculares, o conceito 
de resposta de observação tem sido subme-
tido à novos refinamentos e discussões (e.g. 
Endemann, 2008, 2013; Pessôa, 2010; To-
manari, Balsamo, Fowler, Farren, & Dube, 
2007; Tomanari & Pergher, 2003). O registro 
de parâmetros dos movimentos sacádicos4 
(pico de velocidade, amplitude, curvatura) e 
da fixação (frequência, duração) tem permi-
tido a análise de novas medidas da RO. De 
posse dessas novas medidas, o papel da RO 
tem sido analisado em diferentes situações 
básicas e aplicadas envolvendo discrimina-
ções simples e condicionais, formação de 
classes de estímulos equivalentes (e.g. Dube 
et al., 1999; Serna & Carlin, 2001), treina-
mento de habilidades como leitura e reso-
lução de problemas (e.g. Endemann, Pessôa, 
Perez & Tomanari, 2010).
CONSIDERAÇÕES FINAIS
Com o objetivo de trazer a discrimi-
nação para o campo da análise do compor-
tamento operante, Skinner (1938/1991) de-
4 Movimentos sacádicos são os movimentos oculares rápidos, antece-
didos e precedidos pela fixação e acomodação dos estímulos no centro 
da retina (e.g. Krauzlis, 2008; Madelain, Paeye & Darcheville, 2011; Sal-
thouse & Ellis, 1980). Segundo Krauzlis (2008), um aspecto importante 
dos movimentos sacádicos é que “são seletivamente guiados por ob-
jetos de interesse do observador, apesar do fato de haver usualmente 
no ambiente vários outros objetos distratores” (Krauzlis, 2008, p. 789, 
itálico acrescentado).
Peter Endemann, Candido Pessôa 
119
fendeu que a discriminação e a experiência 
sensorial a ela subjacente deveriam ser de-
finidas e analisadascom base em apenas 
uma classe de respostas (i.e., aquela que, 
pela produção diferencial do reforço, fica 
sob controle de estímulos discriminativos). 
Wyckoff (1969) foi original em estabelecer 
medidas interdependentes entre duas clas-
ses de resposta (i.e., a que produz direta-
mente o reforço e a que produz os estímulos 
discriminativos) e em avaliar experimental-
mente a resposta de observação bem como 
o entrelaçamento desta com a resposta 
que produz o reforço. Esse entrelaçamen-
to é mediado por um estímulo com duas 
funções: Função reforçadora condiciona-
da para a resposta de observação e função 
discriminativa para a resposta que produz o 
reforço (e.g., Pessôa & Sério, 2006). 
PARA SABER MAIS
Dinsmoor (1985). Análise teórica sobre o 
papel da resposta de observação no estabe-
lecimento da discriminação, em que o autor 
critica as posições de Skinner e Spence. O 
autor apresenta uma série de estudos sobre 
controle de estímulos, destacando o papel 
da observação seletiva (desenvolvido desde 
o estudo de Dinsmoor et al., 1971).
Endemann (2013). Análise experimental e 
teórica sobre o efeito de variações nos es-
tímulos irrelevantes para a aquisição e ma-
nutenção da resposta de observação visual 
(registrada por meio dos movimentos ocu-
lares). Neste estudo, apresentam-se com 
mais detalhes os estudos experimentais e 
argumentos da Controvérsia continuidade 
vs. não-continuidade.
Pessôa & Sério (2006). Análise teórica so-
bre as duas contingências envolvidas no 
estabelecimento da discriminação. Os au-
tores discutem as duas funções adquiridas 
pelo estímulo correlacionado com o refor-
ço: Discriminativo, para a resposta efetiva, 
e reforçador condicionado, para a resposta 
de observação.
Tomanari (2009). Ampla revisão dos estu-
dos sobre a resposta de observação desde 
pesquisas precursoras com ratos expostos 
a labirintos até investigações mais recentes 
sobre o tema. O autor apresenta aspectos 
relevantes do delineamento experimental 
tais como número de operanda e as dife-
rentes espécies utilizadas nos estudos.
Pessôa & Tomanari (2015). Diferenciam o 
procedimento de resposta de observação 
elaborado por Wyckoff (1969) da importân-
cia da resposta de observação por ele de-
finida funcionalmente, dando destaque às 
possibilidades de pesquisas aplicadas para 
a facilitação da aquisição de respostas de 
observação. 
REFERÊNCIAS
Berlyne, D. E. (1957). Uncertainty and con-
flict: A point of contact between informa-
Capítulo VII | Resposta de Observação
120
tion theory and behavior concepts. Psycho-
logical Review, 64, 329-333. 
Dinsmoor, J. A. (1983). Observing and con-
ditioned reinforcement. Behavioral and 
Brain Sciences, 6, 693-728. 
Dinsmoor, J. A. (1985). The role of observing 
and attention in establishing stimulus con-
trol. Journal of the Experimental Analysis of 
Behavior, 43, 365-381.
Dinsmoor, J. A., Browne, M. P., Lawren-
ce, C. E., & Wasserman, E. A. (1971). A new 
analysis of Wyckoff’s observing response. 
Proceedings of the 79th Annual Convention, 
American Psychological Association (pp. 
679-680).
Dinsmoor, J. A., Mueller, K. L., Martin, L. T., 
& Bowe, C. A. (1982). The acquisition of ob-
serving. Journal of the Experimental Analy-
sis of Behavior, 38, 249-263.
Dopson, J. C., Esber, G. R., & Pearce, J. M. 
(2010). Differences in the associability of 
relevant and irrelevant stimuli. Journal of 
Experimental Psychology: Animal Behavior 
Processes, 36, 258–267.
Dube, W. V., Lombard, K. M., Farren, K. M., 
Flusser, D. S., Balsamo, L. M., & Fowler, T. R. 
(1999). Eye tracking assessment of stimulus 
overselectivity in individuals with mental 
retardation. Experimental Analysis of Hu-
man Behavior Bulletin, 17, 8-14.
Ehrenfreund, D. (1948). An experimental 
test of the continuity theory of discrimina-
tion with pattern vision. Journal of Com-
parative and Physiological Psychology, 41, 
408-422.
Endemann, P. (2008). Resposta de observa-
ção e movimento dos olhos em uma situação 
de discriminação simples simultânea. (Dis-
sertação de Mestrado). Universidade de São 
Paulo, São Paulo. 
Endemann, P. (2013). Aprendizado sobre a 
(ir)relevância dos estímulos. (Tese de douto-
rado) Universidade de São Paulo, São Paulo.
Endemann, P., Pessôa, C. V. B. B., Perez, W. 
F., & Tomanari, G. Y. (2010). Identificação de 
operantes verbais constituintes da leitura 
por meio da análise dos movimentos dos 
olhos. Psicologia: Teoria e Pesquisa, 27, 139-
148. 
Fantino E. (1977). Conditioned reinforce-
ment: Choice and information. In W.K. Ho-
nig & J.E.R. Staddon (Eds.), Handbook of 
operant behavior (pp. 313–339). Englewood 
Cliffs, NJ: Prentice-Hall.
Fantino, E., & Logan, C. A. (1979). The ex-
perimental analysis of behavior: A biological 
perspective. New York: W. H. Freeman. 
Hall, G. (1976). Learning to ignore irrelevant 
stimuli variations within and between dis-
plays. Quarterly Journal of Experimental 
Psychology, 28, 247-253
Peter Endemann, Candido Pessôa 
121
Krauzlis, R. J. (2008). Eye movements. In 
L. R. Squire & D. Berg (Eds.), Fundamental 
Neuroscience (pp. 775-792). Amsterdam: El-
sevier.
Krechevsky, I. (1932). Hypotheses in rats. 
Psychological Review, 39, 516-532.
Krechevsky, I. (1937). A note concerning 
“the nature of discrimination learning in 
animals.” Psychological Review, 44, 97-104.
Krechevsky, I. (1938). A study of the conti-
nuity of the problem-solving process. Psy-
chological Review, 45, 107-133.
Lashley, K. S. (1929). Brain mechanisms and 
intelligence. Chicago: University of Chicago 
Press.
Lashley, K. S. (1938). The mechanism of vi-
sion: XV. Preliminary studies of the rat’s ca-
pacity for detail vision. Journal of General 
Psychology, 18, 123-193.
Lashley, K. S. (1942). An examination of the 
continuity theory as applied to discrimina-
tion learning. Journal of Genetic Psychology, 
26, 241-265.
Lawrence, D. H. (1949). Acquired distincti-
veness of cues: I. Transfer between discri-
minations on the basis of familiarity with 
the stimulus. Journal of Experimental Psy-
chology, 39, 770-784.
Mackintosh, N. J. (1965). Selective attention 
in animal discrimination learning. Psycho-
logical Bulletin, 64, 124-50.
Madelain L., Paeye C., & Darcheville, J. C. 
(2011). Operant control of human eye move-
ments. Behavioural Processes, 87, 142–148.
Nilsson, D.E., (2009). The evolution of eyes 
and visually guided behaviour. Philosophi-
cal Transactions of the Royal Society, 364, 
2833–2847.
Pearce, J. M., Esber, G. R., George, D. N., & 
Haselgrove, M. (2008). The nature of discri-
mination learning in pigeons. Learning & 
Behavior, 36, 188-199. 
Pessôa, C. V. B. B. (2010). Efeito de diferentes 
treinos de discriminação sobre as fixações 
dos olhos de humanos. (Tese de doutorado). 
Universidade de São Paulo, São Paulo. 
Pessôa, C. V. B. B., & Sério, T. M. A. P. (2006). 
Análise do comportamento de observação. 
Revista Brasileira de Análise do Comporta-
mento, 2, 143-153.
Pessôa, C. V. B. B., & Tomanari, G. Y. (2015). 
Procedimento de resposta de observação e 
comportamento de observação. Perspecti-
vas em Análise do Comportamento, 6, 89-
98.
Salthouse, T. A., & Ellis, C. L. (1980). Deter-
minants of eye-fixation duration. American 
Journal of Psychology, 93, 207-234.
Capítulo VII | Resposta de Observação
122
Serna, R. W., & Carlin, M. T. (2001). Guiding 
visual attention in individuals with mental 
retardation. In L. M. Glidden (Ed.), Interna-
tional review of research in mental retarda-
tion, 24 (pp. 321-357). San Diego, CA: Aca-
demic Press.
Skinner, B. F. (1938). The behavior of orga-
nisms: an experimental analysis. New York: 
Appleton-Century-Crofts.
Spence, K. W. (1936). The nature of discri-
mination learning in animals. Psychological 
Review, 43, 437-449.
Spence, K. W. (1940). Continuous versus 
non-continuous interpretations of discri-
mination learning. Psychological Review, 47, 
271-288.
Spence, K. W. (1942). The basis of solution 
by chimpanzees of the intermediate size 
problem. Journal of ExperimentalPsycholo-
gy, 31, 257-271.
Spence, K. W. (1945). An experimental test 
of the continuity and noncontinuity theo-
ries of discrimination learning. Journal of 
Experimental Psychology, 35, 253-266.
Tomanari, G. Y. (2009). Resposta de obser-
vação: Uma reavaliação. Acta Comporta-
mentalia, 17, 259-277.
Tomanari, G. Y., Balsamo, L. M., Fowler, 
T. R., Farren, K. M., & Dube, W. V. (2007). 
Manual and ocular observing behavior in 
human subjects. European Journal of Beha-
vior Analysis, 8, 29-40.
Tomanari, G. Y., & Pergher, N. K. (2003). 
Observing behavior and eye movements in 
a Wyckoff observing response procedure. 
Paper presented at the Annual Meeting of 
the Association for Behavior Analysis, São 
Francisco.
Trobalon, J.B., Miguelez, D., McLaren, I. P 
.L., & Mackintosh, N. J. (2003). Intradimen-
sional and extradimensional shifts in spa-
tial learning. Journal of Experimental Psy-
chology: Animal Behavior Processes, 29, 
143-152.
Wagner, A. R., Logan, F. A., Haberlandt, K., 
& Price, T. (1968). Stimulus selection in ani-
mal discrimination learning. Journal of Ex-
perimental Psychology, 76, 171-180.
Wyckoff, L. B. (1952). The role of observing 
responses in discrimination learning: Part I. 
Psychological Review, 59, 431-442.
Wyckoff, L. B. (1969). The role of observing 
responses in discrimination learning. In D. 
P Hendry (Ed.), Conditioned reinforcement 
(pp. 237-260). Homewood, IL: The Dorsey 
Press. 
Zeaman, D. & Denegre, J. (1967). Variability 
of irrelevant discriminative stimuli. Journal 
of Experimental Psychology, 73, 574-580.
Edson Massayuki Huziwara, Candido V. B. B. Pessôa 
123
Controle dos processos 
atencionais
Edson Massayuki Huziwara 
Universidade Federal de Minas Gerais
Candido V. B. B. Pessôa 
Paradigma Centro de Ciências do Comportamento
Holland, J. G. (1958). Human vigilance. Science, 128 (3315), 61-67.
“Life is what happens to you while you’re busy making other plans”
John Lennon
Capítulo VIII | Atenção
124
INTRODUÇÃO À ÁREA DE PES-
QUISA E CONTEXTUALIZAÇÃO 
DO EXPERIMENTO 
Notícias a respeito de pessoas diag-
nosticadas com o Transtorno do Déficit de 
Atenção e Hiperatividade (TDAH) torna-
ram-se consideravelmente frequentes nos 
dias atuais. Segundo o Manual Diagnóstico 
e Estatístico de Transtornos Mentais (DSM-
-IV-TR™), o TDAH apresenta como carac-
terística principal um “padrão persistente 
de desatenção e/ou hiperatividade-impul-
sividade, mais frequente e grave do que 
aquele tipicamente observado nos indiví-
duos em equivalente estágio de desenvol-
vimento” (APA, 2002, p. 112). Estima-se que 
3% a 6% das crianças em idade escolar de 
todo o mundo tenham sido diagnosticadas 
com o referido transtorno (Faraone, Serge-
ant, Gillberg, & Biederman, 2003; Rohde, 
Miguel Filho, Benetti, Gallois, & Kieling, 
2004), constituindo-se assim em uma das 
principais causas de encaminhamento para 
os serviços de saúde (Rohde, Barbosa, Tra-
montina, & Polanczyk, 2000; Rohde et al., 
2004). 
Iniciar este capítulo apresentando 
considerações acerca do TDAH tem por ob-
jetivo ilustrar como questões relacionadas 
a processos atencionais estão em evidência 
na Psicologia contemporânea. A produção 
de conhecimento sobre tais processos con-
tinua sendo fundamental para o desenvol-
vimento de intervenções eficazes (Ketzer, 
Gallois, Martinez, Rohde, & Schmitz, 2012; 
Reinhardt & Reinhardt, 2013). 
O interesse pelos processos atencio-
nais justifica-se não somente pelos aspec-
tos patológicos nele envolvidos, mas tam-
bém por sua aparente importância nas mais 
variadas situações de nossa vida cotidiana. 
Por exemplo, um jogador que não se manti-
ver atento ao jogo reduz suas possibilidades 
de vitória; um aluno que não se mantiver 
atento à aula, reduz suas possibilidades de 
aprender a tarefa; ou, ainda, um motoris-
ta que não se mantiver atento ao trânsito, 
aumenta suas possibilidades de causar ou 
sofrer um acidente.
Estudos sobre processos atencionais 
conduzidos nas décadas de 1940 e 1950 
utilizavam situações nas quais indivíduos 
eram requisitados a detectar a ocorrência de 
determinados eventos críticos, porém pou-
co frequentes, em tarefas longas e propo-
sitalmente monótonas. Mackworth (1948), 
por exemplo, realizou um experimento no 
qual a tarefa dos participantes era obser-
var um mostrador de um relógio analógico. 
Em grande parte do tempo, o único pontei-
ro apresentado nesse mostrador realizava 
movimentos em ritmo regular, movendo-se 
apenas uma vez por segundo. Os eventos 
críticos que deveriam ser detectados pelos 
participantes consistiam em movimentos 
duplos do ponteiro, ou seja, ocasiões em 
que o ritmo era alterado e o ponteiro movia-
-se duas vezes em um único segundo. Esses 
eventos críticos ocorriam 24 vezes em cada 
hora de sessão, em intervalos variáveis de 
Edson Massayuki Huziwara, Candido V. B. B. Pessôa 
125
tempo. O procedimento tinha como objeti-
vo simular situações em que, por exemplo, 
um marinheiro observa um sonar para de-
tectar a presença de submarinos inimigos. 
Holland (1958) destacou a similaridade des-
ta situação com a de um trabalhador em 
uma fábrica que inspeciona produtos em 
uma linha de produção para detectar itens 
com defeito que raramente aparecem. Nes-
sas situações, apesar da baixa probabilida-
de de ocorrência de um evento crítico, sua 
detecção seria de extrema importância e, 
portanto, marinheiros ou trabalhadores de-
veriam manter-se atentos durante todo o 
tempo de execução da tarefa. 
Muitos estudos utilizando tarefas 
experimentais similares àquela propos-
ta por Mackworth (1948) foram conduzi-
dos. Em geral, os resultados demonstra-
ram que a acurácia em detectar os eventos 
críticos diminuía ao longo do tempo (e. g., 
Adams, 1956; Bakan, 1955; Bartlett, Beinert, 
& Graham, 1955; Deese & Ormond, 1953; 
Fraser, 1950; Mackworth, 1948; 1950). Mais 
especificamente, todos ou quase todos os 
eventos críticos apresentados no início da 
sessão eram detectados. No entanto, princi-
palmente depois dos 30 primeiros minutos, 
apenas aproximadamente 30% dos partici-
pantes continuavam a detectar na mesma 
proporção os eventos que ocorriam. Outro 
resultado comum nessas pesquisas era uma 
correlação positiva entre a quantidade ab-
soluta de eventos críticos apresentados e a 
porcentagem total de eventos detectados 
– i.e., em média, 46% dos eventos críticos 
eram detectados quando 10 apresentações 
por hora eram realizadas; no entanto, 88% 
dos eventos eram detectados quando 40 
apresentações por hora eram realizadas 
(Deese & Ormond, 1953). De acordo com 
Deese e Ormond, o desempenho altamente 
acurado no início da tarefa seria um refle-
xo dos altos níveis de atenção ou vigilân-
cia1 apresentados pelos indivíduos. Ainda 
segundo Deese e Ormond, com o passar do 
tempo e a consequente fadiga, os níveis de 
atenção ou vigilância diminuiriam e isso 
produziria uma queda na quantidade de de-
tecções. A correlação positiva entre quanti-
dade absoluta de apresentações de eventos 
críticos e porcentagem de detecções, por 
sua vez, era explicada fazendo referência 
à diferentes níveis de expectativa. Dizia-se 
que quanto maior a quantidade de eventos 
críticos apresentados até um determinado 
momento da sessão, maior também seria a 
expectativa de que um próximo evento crí-
tico fosse apresentado dentro de um curto 
espaço de tempo. Portanto, a alta expecta-
tiva da próxima apresentação de um evento 
crítico manteria altos níveis de atenção e 
vigilância durante a tarefa, apesar da fadiga 
ocasionada pelo decorrer do tempo. 
Acerca de tais explicações, baseadas 
em constructos teóricos como atenção, vi-
gilância ou expectativa, Holland (1958) ar-
gumentou:
1 Optou-se por traduzir a palavra inglesa “vigilance” por “vigilância”. 
Outras possibilidades de tradução, talvez mais provocativas, seriam 
“concentração” ou “atenção focada”, termos que aparecem como sinô-
nimos de “vigilance” na edição eletrônica do Oxford Dictionary.
Capítulo VIII | Atenção
126
Esses conceitos dão a aparência de ex-
plicaros dados em virtude da sintaxe 
das frases. Diz-se que o participante 
faz uma detecção porque ele está, na-
quele momento, vigilante e atento ou 
esperando um sinal. Mas, os conceitos 
não são menos misteriosos do que os 
fenômenos que se propõem a explicar. 
Resta a tarefa de descobrir os eventos 
que influenciam a vigilância, a aten-
ção ou a expectativa. (p. 62).
Ainda de acordo com Holland (1958), 
as diferenças nas quantidades de detecções 
realizadas no início ou final da sessão, assim 
como a correlação positiva entre quantida-
de absoluta e percentual de eventos críticos 
detectados, como ocorrido, por exemplo, 
em Deese e Ormond (1953), são formas de 
descrever padrões comportamentais dos 
participantes e, como tal, não necessita-
riam de constructos mentais como atenção, 
vigilância ou expectativa para serem expli-
cados.
Diante desse contexto, o desafio es-
tava assim posto: Como estudar o fenôme-
no da detecção de eventos críticos e expli-
car resultados muito regulares sem recorrer 
a constructos mentais (e.g., expectativa)? 
Holland (1958) acreditava que a precisão 
em detectar eventos críticos poderia estar 
relacionada à emissão de um conjunto de 
respostas que aumentaria a possibilidade 
de sucesso em tal tarefa, sendo estas de-
nominadas de respostas de observação. 
Wyckoff (1952; 1969) definiu respostas de 
observação como aquelas que produzem 
os estímulos discriminativos para outras 
respostas. Manter-se observando o visor 
por longos períodos de tempo ou identifi-
car prontamente quais os vários estímu-
los presentes durante a execução da tarefa 
são exemplos de respostas de observação, 
uma vez que um evento detectado seria o 
estímulo discriminativo para relatar esse 
evento e as respostas de observação seriam 
mantidas pela produção destes estímulos 
discriminativos. Holland foi a primeira pes-
soa a manipular experimentalmente a fre-
quência e a distribuição temporal das res-
postas de observação. O seu experimento, 
adiante relatado, tornou-se assim um dos 
mais clássicos sobre processos atencionais 
realizado sob a orientação teórica da Análi-
se do Comportamento. 
DESCRIÇÃO DO EXPERIMENTO 
Objetivo e Método
Holland (1958) teve dois objetivos. O 
primeiro foi verificar se a detecção de sinais 
seria um reforçador para respostas de ob-
servação. O segundo foi medir as respostas 
de observação em situações similares às 
usadas por Mackworth (1948), para pos-
sibilitar uma reinterpretação dos eventos 
ocorridos na situação analisada em termos 
comportamentais, sem o uso de construc-
tos como expectativa ou atenção. 
No experimento de Holland (1958), 
a tarefa experimental consistia em par-
Edson Massayuki Huziwara, Candido V. B. B. Pessôa 
127
ticipantes – jovens alistados na marinha 
americana – observarem um mostrador 
retangular com um ponteiro inicialmente 
posicionado na extremidade esquerda. No 
início da sessão, o participante era instru-
ído a detectar e relatar o máximo de oca-
siões nas quais o ponteiro se movesse da 
extremidade esquerda para a extremidade 
direita do mostrador (ver Figura 1). O relato 
de movimentos do ponteiro era feito pelo 
participante ao apertar um botão de relato, 
que também recolocava o ponteiro no lu-
gar original. No fim da sessão era informa-
do ao participante quantos sinais ele havia 
detectado e o tempo médio de detecção. A 
novidade no procedimento proposto por 
Holland consistiu em inserir um botão que, 
quando pressionado, acendia uma lâmpada 
localizada atrás do mostrador, iluminando-
-o por 0,07s (resposta de observação). Após 
esse curto período, a lâmpada era apaga-
da e a única forma de iluminar o mostra-
dor e poder observar o ponteiro novamente 
era uma nova pressão ao botão. As sessões 
ocorriam em uma sala escura, de maneira 
que a única forma de detectar as mudanças 
no ponteiro era emitir a resposta de pressio-
nar a lâmpada. Quando um movimento do 
ponteiro era detectado, o participante de-
veria apertar outro botão para informar que 
havia detectado um movimento do pontei-
ro. Este segundo botão tinha duas consequ-
ências: (1) acionava um contador de eventos 
e (2) recolocava o ponteiro no lugar original, 
à esquerda do mostrador, o que possibili-
tava que um novo movimento do ponteiro 
ocorresse. O procedimento permitiu medir 
com precisão a ocorrência das respostas de 
observação – i.e., pressões no botão que ilu-
minava o mostrador – ao longo do experi-
mento.
A questão acerca dos efeitos refor-
çadores da detecção de eventos críticos 
foi solucionada utilizando conhecimen-
tos provenientes de uma das áreas mais 
exaustivamente estudadas em Análise do 
Comportamento, a saber, os esquemas de 
reforço. Esquemas são regras que especi-
ficam sob quais condições determinadas 
respostas produzem consequências. De 
crucial importância para o presente con-
texto foram experimentos que demons-
traram que a taxa de respostas e o padrão 
temporal de respostas é determinado por 
esquemas (Catania, 1999; Ferster & Skin-
ner, 1957). Mais precisamente, os estudos 
encontraram essa modulação de maneira 
tão regular, independente do organismo ou 
da resposta sob análise, que se torna possí-
vel prever o padrão comportamental diante 
de cada diferente esquema de reforço uti-
lizado (Machado, 1982; Skinner, 1956). Se, 
sob um determinado esquema de reforço, 
Figura 1. Representação do mostrador apresentado aos participantes 
no experimento de Holland (1958). A parte esquerda da figura mostra 
a posição inicial do ponteiro, antes da ocorrência do evento crítico. A 
parte direita mostra a posição do ponteiro depois de ocorrido o evento 
crítico. A seta cinza representa o sentido do movimento executado pelo 
ponteiro.
Capítulo VIII | Atenção
128
a resposta assume um padrão de emissão 
típico do esquema, pode-se concluir que a 
contingência de reforço pela qual o reforço 
é produzido no esquema está controlando 
aquela resposta. 
Com base nesse conhecimento, para 
fazer com que a oportunidade de realizar 
uma detecção (i.e., pressionar o botão que 
relatava um movimento do ponteiro) se tor-
nasse contingente à emissão de um deter-
minado padrão de respostas de observação 
(i.e., pressionar o botão para o acendimen-
to da lâmpada), Holland (1958) utilizou di-
ferentes esquemas de reforço para a pro-
dução de movimentos dos ponteiros pela 
emissão de respostas de observação. Caso 
os padrões de respostas emitidos pelos par-
ticipantes no botão que acendia a lâmpada 
fossem similares àqueles usualmente des-
critos quando utilizados os diferentes es-
quemas de reforço, a hipótese das funções 
reforçadoras da detecção de eventos críti-
cos estaria comprovada.
Holland (1958) utilizou três diferentes 
esquemas de reforço para avaliar o padrão 
de emissão das respostas de observação: um 
esquema de intervalo fixo (FI), um esquema 
de razão fixa (FR) e um esquema de reforço 
diferencial de taxas baixas (DRL). Sob o FI, 
uma resposta é reforçada após transcorrido 
um período fixo de tempo, contado a partir 
de um evento ambiental relevante como a 
obtenção do reforço ou o início da sessão; 
as respostas que ocorrem antes do final do 
período não são reforçadas. Em esquemas 
FI, o padrão de respostas é caracterizado 
por baixas taxas no início do intervalo e 
um aumento na taxa de respostas à medida 
que se aproxima o seu final (para uma dis-
cussão das exceções a este padrão veja, por 
exemplo, Okouchi, 2002). No experimento 
de Holland, cinco participantes foram pri-
meiramente expostos a um FI 30s por oito 
sessões de 40 min. Ou seja, a primeira res-
posta de observação (i.e., pressionar o botão 
para o acendimento da luz) emitida após 30 
s produzia não somente o acendimento da 
lâmpada por 0,07s, mas também o movi-
mento do ponteiro no mostrador e a conse-
quente oportunidade de detecção do even-
to crítico. Em seguida, o valor do intervalo 
foi aumentado para 1, 2, 3, e, finalmente, 4 
min, com oito sessões sucessivas sob cada 
valor do FI. 
Sob o FR, a produção do reforço de-
pende apenas da emissãode um número 
fixo de respostas, que é contado a partir de 
um evento ambiental relevante, como a ob-
tenção do reforço ou o início da sessão. As-
sim sendo, nesse esquema, a obtenção do 
reforçador não está vinculado à passagem 
do tempo, existe uma relação direta entre 
a taxa de respostas emitida e a taxa de re-
forços obtida. Talvez por este motivo, o pa-
drão de respostas em FR seja caracterizado 
por taxas altas e constantes durante toda a 
sessão, sendo muitas vezes possível visua-
lizar pausas no responder que ocorrem tipi-
camente após cada reforço (diferentes das 
pausas após o reforço em um FI, a taxa de 
respostas na retomada de um FR inicia-se 
Edson Massayuki Huziwara, Candido V. B. B. Pessôa 
129
já constante, enquanto em FI ela tende a ser 
positivamente acelerada). Holland (1958) 
primeiramente expos, por seis sessões de 
40 min, sete participantes a um FR 36, ou 
seja, a oportunidade de detecção ocorreu 
somente após a emissão da 36ª respos-
ta de observação. Então, o valor do FR foi 
aumentado, também em blocos de seis ses-
sões, para 60, 84, 108, 150 e, finalmente, 200 
respostas por detecção.
Por fim, sob o DRL, uma resposta é 
reforçada somente quando emitida após 
um intervalo de tempo especificado sem ela 
ocorrer. Ao considerar que o esquema refor-
ça diferencialmente o espaçamento tempo-
ral entre as respostas, o padrão de respostas 
emitidas pelos participantes irá se adequar 
ao valor temporal estipulado, mais precisa-
mente, quanto maior for o tempo exigido 
para a não ocorrência de respostas, me-
nor será a taxa de respostas. Dessa forma, 
o padrão tipicamente obtido sob o DRL é o 
de baixas taxas de respostas, com espaça-
mento temporal entre elas e com ocasionais 
emissões de “jorros” de várias respostas 
com baixíssimo intervalo. Dois participan-
tes foram expostos a um DRL 30 s, ou seja, 
uma resposta de observação iria provocar 
o movimento do ponteiro e a consequente 
oportunidade de detecção se, e somente se, 
fosse precedida por um período mínimo de 
30s sem que essa mesma resposta de ob-
servação tivesse sido emitida. As sessões 
tinham duração de 4h.
Para atingir o segundo objetivo, ve-
rificar como seriam as respostas de obser-
vação em uma situação similar à usada por 
Mackworth (1948), Holland (1958) usou es-
quemas de reforço baseando-se nas apre-
sentações de eventos críticos usados por 
Mackworth. Nas situações testadas por 
Mackworth, os intervalos entre os eventos 
críticos (duplos movimentos no ponteiro do 
relógio) eram ¾, ¾, 1½, 2, 2, 1, 5, 1, 2, 2, 3 e 
10 min em ciclos que ocorriam a cada meia 
hora. Na análise do comportamento, um es-
quema de reforço que ocorre em intervalos 
variáveis é denominado esquema de inter-
valo variável (VI). Sob esse esquema uma 
resposta é reforçada quando emitida após 
intervalos que variam ao redor de uma mé-
dia de tempo estabelecido. O VI produz ti-
picamente uma taxa moderada e constante 
de respostas nos intervalos entre reforços. 
No caso dos intervalos usados por Ma-
ckworth, em média, a cada 1 minuto haveria 
um evento crítico para ser detectado. Ou-
tro aspecto do procedimento do estudo de 
Mackworth era a de que o evento crítico fi-
cava disponível para ser detectado por ape-
nas um breve período de tempo. Em análise 
do comportamento, quando o reforço está 
disponível para ser consumido por apenas 
um determinado período de tempo, cha-
ma-se esse período de contenção limitada 
(limited hold). Quando se usa a contenção 
limitada comumente observa-se o aumen-
to da taxa de respostas em relação à uma 
condição sem contenção limitada. Holland 
usou uma contenção limitada de 1¼ s. Isto 
é, neste caso em que foi usada a contenção 
limitada após o movimento do ponteiro, se 
Capítulo VIII | Atenção
130
o participante não detectasse o movimen-
to nesse intervalo de tempo, o ponteiro re-
tornaria automaticamente para a direita e 
o participante perderia a oportunidade de 
relatar o evento. 
Resultados e Discussão
Os padrões de respostas de observa-
ção descritos para os participantes em cada 
um dos esquemas de reforço utilizados por 
Holland (1958) – FI, FR, DRL – foram ex-
tremamente similares àqueles usualmente 
encontrados em experimentos anteriores 
em outros tipos de respostas que também 
usaram esquemas de reforço (e.g., Ferster 
& Skinner, 1957). Apenas para ilustrar os 
efeitos dos diferentes esquemas de reforço 
sobre a emissão das respostas de observa-
ção, ao comparar os padrões de respostas 
de observação nos diferentes esquemas de 
reforço, foi possível verificar que, enquanto 
o participante sob FR, independentemente 
do valor do esquema, emite 600 respostas 
em menos de cinco minutos de sessão, o 
participante sob DRL emite aproximada-
mente 290 respostas em 50 minutos de ses-
são. Tais resultados demonstraram que a 
detecção de eventos críticos, de fato, exerce 
um papel reforçador para a emissão das res-
postas de observação, como previa o autor.
Dessa forma, os resultados obtidos 
por Holland (1958) demonstraram que os 
padrões de ocorrências das respostas de 
observação, consideradas em muitos con-
textos como sendo o reflexo de processos 
mentais complexos, podem ser explicados 
a partir de conceitos propostos pelo condi-
cionamento operante, fazendo-se referên-
cia aos esquemas de reforço que mantêm 
essas respostas. De acordo com o autor, não 
haveria a necessidade de recorrer a níveis 
mentais de explicação, a constructos teóri-
cos como atenção, vigilância ou expectati-
va, uma vez que o controle exercido pelos 
diferentes esquemas de reforço pôde ser di-
retamente demonstrado no nível compor-
tamental.
O segundo objetivo proposto por 
Holland (1958), verificar como seriam as 
respostas de observação em uma situação 
similar à usada por Mackworth (1948), tam-
bém trouxe um resultado importante. Assim 
como no experimento de Mackwhoth, dois 
tipos diferentes de desempenho foram ob-
servados entre os participantes de Holland 
que foram expostos ao VI com contenção 
limitada. Na mesma proporção dos parti-
cipantes de Mackworth, aproximadamente 
30% dos participantes de Holland detecta-
ram todos os movimentos do ponteiro que 
eram programados durante o experimento. 
Para os outros 70%, a quantidade de even-
tos detectados teve um declínio acentuado 
ao longo da sessão. O que Holland pôde 
demonstrar com seu experimento é que 
esse declínio foi causado pela diminuição 
da emissão de respostas de observação. 
Essas respostas de observação, como visto 
na parte anterior do experimento, são con-
troladas pelo esquema de reforço em vigor. 
Holland demonstrou que os participantes 
Edson Massayuki Huziwara, Candido V. B. B. Pessôa 
131
que detectaram todos os reforços ao longo 
da sessão partiram de uma taxa inicial de 
emissão das respostas de observação mais 
alta do que os participantes que diminuí-
ram as detecções ao longo da sessão Pro-
vavelmente, esse “ponto de partida” com 
que cada participante iniciou a emissão de 
respostas (alta ou baixa taxa de respostas) 
seja devido à história pregressa de reforço 
de respostas de observação de cada um. 
Os participantes que partiram de uma taxa 
mais baixa de emissão de respostas de ob-
servação detectaram menos movimentos 
no ponteiro. Essa menor detecção é, em 
outras palavras, uma menor taxa de refor-
ços. Uma menor taxa de reforços gera uma 
menor taxa de respostas (Ferster & Skinner, 
1957). Assim, os participantes que já inicia-
ram o experimento com uma baixa taxa 
inicial de emissão de respostas de observa-
ção entraram num círculo vicioso de menor 
emissão de respostas gerando menor taxa 
de reforço e menor taxa de reforço gerando 
menor emissão de respostas. 
Holland (1958), portanto, demons-
trou que a detecção de um evento crítico 
(i.e., o movimento do ponteiro) pode con-
trolar a frequência de emissão das respos-
tas de observação (i.e., pressionar o botão 
para o acendimento da lâmpada). Vale res-
saltar que estudos anteriores explicavam a 
ocorrência de tais respostas de observação 
como sendo o reflexode estados mentais 
complexos como atenção, vigilância ou ex-
pectativa (e.g., Adams, 1956; Bakan, 1955; 
Bartlett et al., 1955; Deese & Ormond, 1953; 
Fraser, 1950; Mackworth, 1948, 1950). Ao 
analisar o conjunto dos resultados obtidos 
por Holland, foi possível comprovar a hi-
pótese do autor de que é possível explicar 
os padrões de ocorrência de tais respostas 
a partir dos princípios do condicionamento 
operante, especialmente do esquema de re-
forço em vigor.
Os mesmos princípios sobre o condi-
cionamento operante foram utilizados por 
Holland (1958) para reinterpretar alguns dos 
achados mais recorrentemente descritos 
em experimentos sobre atenção e vigilân-
cia até a data de publicação de seu artigo. 
O primeiro desses achados refere-se à di-
minuição na quantidade de detecções fei-
tas pelos participantes ao longo da sessão, 
que seria explicado pelo declínio dos níveis 
de atenção em função da fadiga (Deese & 
Ormond, 1953; Mackworth, 1948, 1950). De 
acordo com Holland, a explicação para tal 
fato estaria relacionada à taxa de reforço. 
Ao longo da sessão, a taxa de emissão de 
respostas de observação se adéqua à quan-
tidade de reforços apresentados. Assim, se 
a quantidade de apresentações do estímu-
lo reforçador for baixa ou o intervalo entre 
reforços for demasiado longo, haverá um 
declínio na taxa de respostas de observação 
(e.g., Kelleher, Riddle, & Cook, 1962). Em 
decorrência da menor taxa de respostas de 
observação, menor também será a quanti-
dade de eventos críticos detectados.
Capítulo VIII | Atenção
132
DESDOBRAMENTOS
Um aspecto a ser destacado acer-
ca do procedimento utilizado por Holland 
(1958) refere-se à considerável diferença 
entre as respostas que normalmente são 
identificadas como respostas de observação 
e a resposta instrumental utilizada no refe-
rido experimento. Em uma análise extre-
mamente crítica, poder-se-ia argumentar 
que o fenômeno comportamental observa-
do por Holland seria de natureza diferente 
daquela observada em experimentos sobre 
atenção e vigilância, restabelecendo o papel 
dos constructos mentais na explicação do 
comportamento. Sobre essa questão, o au-
tor afirma:
Em outros estudos sobre vigilância, 
o comportamento de observação foi 
provavelmente a fixação do olhar ou 
os movimentos com a cabeça, bem 
como respostas talvez ainda mais su-
tis. Seria interessante estender a téc-
nica apresentada aqui para algumas 
destas respostas, mesmo consideran-
do que, para muitas questões, a topo-
grafia da resposta pode não ser tão 
importante e os métodos ora utiliza-
dos sejam perfeitamente suficientes. 
(p. 62).
Portanto, o autor parece concordar 
que a resposta de pressionar um botão para 
acender uma lâmpada é consideravelmente 
diferente de mover o rosto em direção a um 
mostrador e permanecer observando-o por 
longos períodos de tempo, respostas nor-
malmente relacionada à vigilância. No en-
tanto, de acordo com Holland (1958), uma 
vez demonstrada a função reforçadora da 
detecção de eventos críticos, elas poderiam 
aumentar a probabilidade de ocorrência de 
toda e qualquer resposta de observação, in-
dependente de qual topografia fosse reque-
rida.
Talvez até de modo contraditório à 
afirmação sobre as topografias de respos-
tas, trabalhos posteriores ao de Holland 
(1958) estiveram relacionados a criar formas 
de registrar e medir o comportamento de 
olhar enquanto uma resposta de observa-
ção. Em 1968, juntamente com Stephen R. 
Schroeder, Holland publicou um artigo no 
qual os autores utilizaram um equipamento 
que permitiu registrar a frequência e a du-
ração dos movimentos dos olhos dos par-
ticipantes quando estes observavam partes 
específicas em uma tela contendo quatro 
mostradores, todos idênticos ao utilizado 
no experimento de Holland descrito nesse 
capítulo. Neste novo experimento, os parti-
cipantes também foram instruídos a detec-
tar movimentos de ponteiros em qualquer 
um dos quatro mostradores e a manipula-
ção experimental feita também utilizou di-
ferentes esquemas de reforço. Por exemplo, 
ao utilizar um FR, um movimento de pon-
teiro ocorria somente após a 36ª ocasião na 
qual o participante tivesse olhado para um 
dos mostradores, isto é, emitido a respos-
ta de observação. Os resultados obtidos por 
Schroeder e Holland demonstraram que os 
Edson Massayuki Huziwara, Candido V. B. B. Pessôa 
133
padrões de movimento dos olhos em dire-
ção aos mostradores foram sensíveis aos 
diferentes esquemas de reforço utilizados 
(i.e., FR, FI e DRL). 
A similaridade dos resultados obtidos 
por Schroeder e Holland (1968), utilizando o 
registro movimentos dos olhos, com aque-
les descritos em Holland (1958), utilizando o 
registro de pressões a um botão, pareceu in-
dicar que a função reforçadora da detecção 
de eventos críticos realmente independe 
da topografia das respostas e, talvez ainda 
mais importante, que a resposta instrumen-
tal utilizada em 1958 era, de fato, compa-
rável com as respostas tipicamente iden-
tificadas com a atenção (i.e., olhar). Desde 
então, uma vasta quantidade publicações 
acerca das relações entre as respostas de 
observação e o comportamento de olhar 
tem sido produzida (e.g., Doran & Holland, 
1971; Dube, Balsamo et al., 2006; Dube, Di-
ckson et al., 2010; Huziwara, de Souza, & 
Tomanari, 2016; Huziwara, Silva, Perez, & 
Tomanari, 2015; Perez, Endemann, Pessôa, 
& Tomanari, 2014; Pessoa, Huziwara, Perez, 
Endemann, & Tomanari, 2009; Schroeder, 
1969a, 1969b, 1970, 1997; Serna & Carlin, 
2001). 
Em relação à importância do estudo 
de Holland (1958) para a manutenção da 
atenção em tarefas de vigilância, Holland 
(1958) é citado em diversos experimentos da 
área, como na manutenção da atenção du-
rante a navegação de barcos (Thomas, 1980) 
e aviões (Lewis, 1973) e, em geral, para as-
pectos da segurança no trabalho (e.g., Aber-
nathy & Lattal, 2014; Howell, Johnston, & 
Goldstein, 1966).
CONSIDERAÇÕES FINAIS
Como mencionado no início deste ca-
pítulo, o TDAH atualmente se constitui em 
um sério problema a ser solucionado. Sag-
volden, Aase, Johansen e Russell (2005), por 
exemplo, apontavam a escassez de dados 
sobre tratamentos médicos eficazes para 
o subtipo déficit de atenção do TDAH. No 
que concerne às contribuições da Análise 
do Comportamento, os padrões comporta-
mentais usualmente característicos de pes-
soas com diagnóstico de déficit de atenção 
são, ao menos em parte, explicados a partir 
dos gradientes de atraso de reforço (Cata-
nia, 2005). Baseado em extensa literatura, 
Catania explica que uma das causas do que 
chamamos déficit de atenção pode estar re-
lacionada à dificuldade de controle por re-
forços condicionados. Nos termos do expe-
rimento de Holland (1958), caso a distância 
temporal entre a identificação de um even-
to crítico e o reforço obtido por essa identi-
ficação for demasiado longa, o movimento 
do ponteiro pode não adquirir uma função 
reforçadora para manter a resposta de pres-
tar atenção ao (iluminar o) mostrador. Um 
valor da distância temporal eficiente varia 
entre indivíduos e, assim, no caso do expe-
rimento de Holland, pessoas que necessi-
tassem intervalos temporais muito peque-
nos entre os reforços poderiam deixar de 
Capítulo VIII | Atenção
134
emitir as respostas de observação ao longo 
do experimento. Nos limites da revisão de 
literatura realizada para o presente capítu-
lo, não encontramos estudos que se apoiem 
diretamente no achado de Holland de que 
esquemas de reforços influenciariam dire-
tamente a quantidade de atenção em uma 
tarefa (para exceção, veja Goldberg & Kons-
tantareas, 1979). Assim, parece permanecer 
essa lacuna a ser perseguida sobre a relação 
entre os padrões comportamentais gerados 
e mantidos por diferentes esquemas de re-
forço e os padrões comportamentais carac-
terísticos do déficit de atenção.
Ao considerar todos os aspectos pre-
sentes no experimento de Holland (1958), 
torna-se possível verificar que a engenho-
sidade do autor, ao propor uma nova forma 
de análise,permitiu a formulação de expli-
cações mais parcimoniosas sobre proces-
sos comportamentais. Essa busca por ex-
plicações parcimoniosas, como alternativa 
para explicações por vezes tão misteriosas 
quanto o próprio fenômeno a ser explicado, 
é marca dos trabalhos desenvolvidos pelo 
autor e, certamente, um exemplo a ser se-
guido.
PARA SABER MAIS
Pessoa, Huziwara, Perez, Endemann, & 
Tomanari (2009). Replicação sistemáti-
ca dos resultados descritos por Schroeder 
(1969a; 1969b; 1970) sobre o comportamento 
de olhar em tarefas de discriminação sim-
ples. Os principais resultados referem-se a 
uma aparente diminuição no tempo empre-
gado para observar os estímulos ao longo 
das sucessivas tentativas de treino.
Dube, Balsamo, Fowler, Dickson, Lom-
bard, & Tomanari (2006). Avaliação do 
comportamento de olhar em tarefas de 
discriminação condicional utilizando pro-
cedimento de emparelhamento de acordo 
com o modelo. Resultados sugerem que os 
participantes com maiores porcentagens de 
acertos em tarefas que envolvem o aprendi-
zado de discriminações condicionais tam-
bém apresentam maior quantidade de tem-
po empregado na observação dos estímulos 
apresentados. 
Artigos de Revisão. Para uma revisão sobre 
o controle operante dos movimentos dos 
olhos veja Pessôa (2010). Para uma revisão 
sobre o papel das respostas de observa-
ção como fenômenos atencionais consulte 
Rico, Goulart, Hamasaki e Tomanari (2012) 
ou Benvenuti, Barros e Tomanari (2014).
REFERÊNCIAS
Abernathy, W. B., & Lattal, D. (2014). Or-
ganizational Behavior Management, past, 
present, and future. In F. K. Macksweeney 
e E. S. Murphy (Eds.), The Willey Blackwell 
handbook of classical and operant condi-
tioning, (pp. 645-668). Chichester, WS: John 
Willey & Sons, Ltd.
Edson Massayuki Huziwara, Candido V. B. B. Pessôa 
135
Adams, J. A. (1956). Vigilance in the detec-
tion of low-intensity visual stimuli. Journal 
of Experimental Psychology, 52, 204-208.
American Psychiatric Association – APA 
(2002). Manual diagnóstico e estatístico de 
transtornos mentais - DSM-IV-TR™. 4ª ed. 
rev. Porto Alegre: Artmed.
Bakan, P. (1955). Discrimination decrement 
as a function of time in a prolonged vigil. 
Journal of Experimental Psychology, 50, 
387-390.
Bartlett, S. C., Beinert, R. L., & Graham, J. 
R. (1955). Studies of visual fatigue and effi-
ciency in radar observation. United States 
Air Force Wright Air Development Center 
Technical Report, 55-100.
Benvenuti, M. F., Barros, T., & Tomanari, G. 
Y. (2014). Atenção, observação e a produção 
do comportamento simbólico e do respon-
der relacional. In J. C. de Rose, M. S. C. A. 
Gil e D. G. de Souza (Orgs.), Comportamen-
to simbólico: Bases conceituais e empíricas, 
(pp. 57-93). São Paulo: Cultura Acadêmica.
Catania, A. C. (1999). Aprendizagem: Com-
portamento, linguagem e cognição. Porto 
Alegre: Artmed.
Catania, C. A. (2005). Attention-deficit/
hyperactivity disorder (ADHD): Delay-of-
-reinforcement gradients and other beha-
vioral mechanisms. Behavioral and Brain 
Sciences, 28, 397-468.
Deese, J., & Ormond, E. (1953). Studies of de-
tectability during continuous visual search. 
United States Air Force Wright Air Develop-
ment Center Technical Report, 53-88.
Doran, J., & Holland, J. G. (1971). Eye move-
ments as a function of response contingen-
cies measured by blackout technique. Jour-
nal of Applied Behavior Analysis, 4, 11-17.
Dube, W. V., Balsamo, L. M., Fowler, T. R., 
Dickson, C. A., Lombard, K. M., & Tomana-
ri, G. Y. (2006). Observing behavior topogra-
phy in delayed matching to multiple sam-
ples. The Psychological Record, 56, 233-244.
Dube, W. V., Dickson, C. A., Balsamo, L. M., 
Odonnell, K. L., Tomanari, G. Y., Farren, K. 
M., Wheeler, E. E., & Mcilvane, W. J. (2010). 
Observing behavior and atypically restric-
ted stimulus control. Journal of the Experi-
mental Analysis of Behavior, 94, 297-313.
Faraone, S. V., Sergeant, J., Gillberg, C., & 
Biederman, J. (2003). The worldwide pre-
valence of ADHD: Is it an American condi-
tion? World Psychiatry, 2, 104-113.
Ferster, C. B., & Skinner, B. F. (1957). Schedu-
les of reinforcement. East Norwalk: Apple-
ton-Century-Crofts.
Fraser, D. C. (1953). The relation of an en-
vironmental variable to performance in a 
prolonged visual task. Quarterly Journal of 
Experimental Psychology, 5, 31-32.
Capítulo VIII | Atenção
136
Goldberg, J. O., & Konstantareas, M. M. 
(1981). Vigilance in hyperactive and normal 
children on a self-paced operant task. Jour-
nal of Child Psychology and Psychiatry, 22, 
53-63.
Holland, J. G. (1958). Human vigilance. 
Science, 128, 61-67.
Howell, W. C., Johnston, W. A., & Goldstein, 
I. L. (1966). Complex monitoring and its re-
lation to the classical problem of vigilance. 
Organizational Behavior and Human Per-
formance, 1, 129-150.
Huziwara, E. M., de Souza, D. G., & Toma-
nari, G. Y. (2016). Patterns of eye movement 
in matching-to-sample tasks. Psicologia: 
Reflexão e Crítica, 29.
Huziwara, E. M., Silva, M. J. M., Perez, W. 
F., & Tomanari, G. Y. (2015). Analyzing the 
stimulus control acquisition in simple dis-
crimination tasks through eye movement. 
Psicologia: Reflexão e Crítica, 28, 603-612.
Kelleher, R. T., Riddle, W. C. & Cook, L. 
(1962). Observing response in pigeons. Jour-
nal of the Experimental Analysis of Beha-
vior, 5, 3-13.
Ketzer, C. R., Gallois, C., Martinez, A. L., 
Rohde, L. A., & Schmitz, M. (2012). Is there 
an association between perinatal compli-
cations and attention-deficit/hyperactivity 
disorder-inattentive type in children and 
adolescents? Revista Brasileira de Psiquia-
tria, 34, 321-328.
Lewis, M. F. (1973). Frequency of anti-colli-
sion observing responses by solo pilots as a 
function of traffic density, ATC traffic war-
nings, and competing behavior. Recuperado 
em http://libraryonline.erau.edu/online-
-full-text/faa-aviation-medicine-reports/
AM73-06.pdf 
Machado, L. M. C. M. (1986). Esquemas de 
reforçamento positivo: Esquemas simples. 
Psicologia, 12, 1-15.
Mackworth, N. H. (1948). The breakdown of 
vigilance during prolonged visual search. 
Quarterly Journal of Experimental Psycho-
logy, 1, 6-21.
Mackworth, N. H. (1950). Researches in the 
measurement of human performance. Me-
dical Research Council Special Report Se-
ries, 268.
Okouchi, H. (2002). Individual differences 
in human fixed-interval performance. The 
Psychological Record, 52, 173-186.
Perez, W. F., Endemann, P., Pessoa, C. V. 
B. B., & Tomanari, G. Y. (2014). Assessing 
stimulus control in a discrimination task 
with compound stimuli: evaluating testing 
procedures and tracking eye fixations. The 
Psychological Record, 65, 83-88.
Pessoa, C. V. B. B. (2010). Efeitos de diferentes 
treinos de discriminação sobre as fixações 
Edson Massayuki Huziwara, Candido V. B. B. Pessôa 
137
do olhos de humanos. (Tese de doutorado). 
Instituto de Psicologia da Universidade de 
São Paulo.
Pessoa, C. V. B. B., Huziwara, E. M., Pe-
rez, W. F., Endemann, P., & Tomanari, G. 
Y. (2009). Eye fixations to figures in a four-
-choice situation with luminance balanced 
areas: Evaluating practice effects. Journal of 
Eye Movement Research, 2, 1-6.
Reinhardt, M. C., & Reinhardt, C. A. (2013). 
Attention deficit-hyperactivity disorder, 
comorbidities, and risk situations. Jornal de 
Pediatria, 89, 124-130.
Rico, V. V., Goulart, P. R. K., Hamasaki, E. 
I. M., & Tomanari, G. Y. (2012). Percepção e 
atenção. In M. M. C. Hübner e M. B. Morei-
ra. (Orgs.). Fundamentos de psicologia: Te-
mas clássicos de psicologia à luz da Análise 
do Comportamento. 1ed, (pp. 155-210). Rio 
de Janeiro, RJ: Guanabara Koogan.
Rohde, L. A., Barbosa, G., Tramontina, S., & 
Polanczyk, G. (2000). Transtorno de déficit 
de atenção/hiperatividade. Revista Brasi-
leira de Psiquiatria, 22, 7-11.
Rohde, L. A., Miguel Filho, E. C., Benetti, L., 
Gallois, C., & Kieling, C. (2004). Transtor-
no de déficit de atenção/hiperatividade na 
infância e na adolescência: Considerações 
clínicas e terapêuticas. Revista de Psiquia-tria Clínica, 31, 124-131.
Sagvolden, T., Aase, H., Johansen, E. B., & 
Russell, V. A. (2005). A dynamic develop-
mental theory of attention-deficit/hype-
ractivity disorder (ADHD) predominantly 
hyperactive/impulsive and combined sub-
types. Behavioral and Brain Sciences, 28, 
397-468.
Schroeder, S. R. (1969a). Effects of cue fac-
tors on selective eye movements and choi-
ces during successive discriminations. Per-
ceptual and Motor Skills, 29, 991-998.
Schroeder, S. R. (1969b). Fixation and Choi-
ce selectivity during discrimination trans-
fer. Psychonomic Science, 17, 324-325.
Schroeder, S. R. (1970). Selective eye move-
ments to simultaneously presented stimuli 
during discrimination. Perception & Psy-
chophysics, 7, 121-124.
Schroeder, S. R. (1997). Selective eye fixa-
tions during transfer of discriminative sti-
mulus control. In D. M. Baer, & E. M. Pinks-
ton (Orgs.), Environment and Behavior, (pp. 
97–110). Boulder, CO: Westview.
Schroeder, S. R., & Holland, J. G. (1968). 
Operant control of eye movements. Journal 
of Applied Behavior Analysis, 1, 161-166.
Serna, R., & Carlin, M. T. (2001). Guiding 
visual attention in individuals with mental 
retardation. International Review of Resear-
ch in Mental Retardation, 24, 321-357.
Skinner, B. F. (1956). A case history in scien-
Capítulo VIII | Atenção
138
tific method. American Psychologist, 11, 221-
233.
Thomas, T. W. (1980). The effects of fatigue 
on vigilance in sailing. (Dissertação de mes-
trado). The University of British Columbia.
Wyckoff Jr., L. B., (1952). The role of obser-
ving responses in discrimination learning: 
Part I. Psychological Review, 59, 431-442.
Marilia Pinheiro de Carvalho, Marco Vasconcelos, Armando Machado
139
O responder controlado 
temporalmente: 
desdobramentos da pesquisa 
com a tarefa de bissecção
Marilia Pinheiro de Carvalho
Marco Vasconcelos
Armando Machado
Universidade do Minho, Portugal
Church, R. M., & Deluty, M. (1977). Bisection of temporal intervals. Journal of Experimental Psy-
chology: Animal Behavior Processes, 3, 216-228.
“O que é, pois, o tempo? Se ninguém mo pergunta, sei o que é; mas se quero explicá-
-lo a quem mo pergunta, não sei.”
(Santo Agostinho, Confissões)
Capítulo IX | Bissecção Temporal
140
1 MPC e MV contaram com a bolsa de investigação UMINHO/
BI/249/2015 e com a bolsa de investigador IF/01624/2013, respectiva-
mente, ambas da Fundação para a Ciência e Tecnologia (FCT), Portugal. 
AM beneficiou da bolsa de licença sabática SFRH/BSAB/113653/2015 
da FCT e de uma bolsa da Fundação de Amparo à Pesquisa do Esta-
do de São Paulo (FAPESP: 2015/06491-1) para Professor Convidado na 
Universidade Federal de São Carlos, Brasil. Este capítulo foi parcial-
mente financiado pela FCT e pelo Ministério da Educação e Ciência 
através de fundos nacionais, e cofinanciado pelo FEDER sob o acordo 
de parceria PT2020 (UID/PSI/01662/2013).
2 Stubbs (1968) conduziu três experimentos com intervalos temporais 
variando entre 1 e 40 s. Para fins didáticos, ilustramos apenas o caso do 
Experimento 2, com intervalos entre 2 e 20 s.
Figura 1. Diagrama hipotético de um procedimento de condicionamen-
to respondente temporal. Comida (*) é apresentada sucessivamente em 
intervalos fixos de tempo (T). Tipicamente, salivação condicionada 
ocorre instantes antes de a comida ser apresentada. 
INTRODUÇÃO À ÁREA DE PES-
QUISA E CONTEXTUALIZAÇÃO 
DO EXPERIMENTO
Em fins da década de 1970, já era sa-
bido que as respostas de animais não-hu-
manos podem ser controladas por inter-
valos de tempo. Por exemplo, as pesquisas 
seminais de Pavlov (1927) sobre condicio-
namento respondente demonstraram que, 
quando comida era entregue sucessiva-
mente em intervalos fixos de tempo, a sali-
vação de cães sistematicamente antecipava 
os momentos de entrega. Dá-se a esse efeito 
o nome de condicionamento temporal (Ca-
tania, 1999). A Figura 1 abaixo ilustra um 
procedimento de condicionamento tempo-
ral e resultados hipóteticos.
2 s a 20 s2. A tarefa consistia em uma dis-
criminação condicional na qual o estímulo 
modelo era uma luz que ficava acesa duran-
te um intervalo de tempo variável, e os es-
tímulos comparação eram um disco verde 
e um disco vermelho apresentados simul-
taneamente após o estímulo modelo. Para 
receber comida, os pombos deviam bicar o 
disco verde se o modelo durasse de 2 a 10 s, 
e o disco vermelho se o modelo durasse de 
12 a 20 s. Como os estímulos de 2 a 10 s são 
os mais curtos das durações treinadas, e os 
estímulos de 12 a 20 s são os mais longos, 
podemos dizer que respostas no disco verde 
são respostas ‘curto’ e que respostas no dis-
co vermelho são respostas ‘longo’.
Stubbs (1968) mediu a proporção 
de vezes em que os sujeitos responderam 
‘longo’ (i.e., bicaram o disco vermelho) em 
função de cada uma durações apresenta-
das. Dá-se o nome de função psicométrica 
à função que relaciona a proporção de uma 
das respostas (e.g., “longo”) à duração dos 
estímulos (Church, 2002; Richelle & Lejeu-
ne, 1980). Se a discriminação fosse perfei-
ta, a função psicométrica deveria assumir 
a forma de um degrau (ver painel de cima 
da Figura 2): Nenhuma resposta ‘longo’ se-
ria emitida após os estímulos de 2 a 10 s 
[P(‘longo’) = 0], e apenas respostas ‘longo’ 
seriam emitidas após os estímulos de 12 a 
20 s [P(‘longo’) = 1].
Em um outro estudo clássico, desta 
vez com um procedimento de condiciona-
mento operante, Stubbs (1968, Experimen-
to 2) demonstrou que pombos eram capazes 
de discriminar estímulos com duração de 
Marilia Pinheiro de Carvalho, Marco Vasconcelos, Armando Machado
141
A Figura 2 abaixo (painel de baixo) 
esquematiza a tendência geral dos dados 
individuais obtidos por Stubbs (1968). A 
proporção de respostas ‘longo’ aumentou de 
2 a 20 s, confirmando que os pombos eram 
capazes de discriminar os estímulos mais 
curtos dos estímulos mais longos. Contudo, 
o aumento na proporção de respostas foi 
gradual, ao invés de ser abrupto e em for-
ma de degrau: A função psicométrica tinha 
uma forma ogival, com mínimo e máximo 
nas durações extremas de 2 e 20 s, respec-
tivamente. 
Curiosamente, a proporção de res-
postas ‘longo’ para as durações de 10 e 12 s 
esteve próxima de 0.5, ou seja, em cerca de 
metade das vezes os sujeitos respondiam 
‘curto’ e na outra metade das vezes respon-
diam ‘longo’ para cada uma destas dura-
ções – a despeito de terem sido treinados 
a responder ‘curto’ para 10 s e ‘longo’ para 
12 s. Com base nestes resultados, Stubbs 
(1968) sugeriu que os sujeitos estabelece-
ram um critério de decisão para responder: 
Respondiam ‘curto’ para durações menores 
do que o critério e respondiam ‘longo’ para 
durações maiores do que o critério. Ainda 
de acordo com o autor, o critério estaria 
ente 10 e 12 s e quanto mais próxima uma 
duração estivesse dele, maior a incerteza 
em classificá-la como ‘curta’ ou ‘longa’ – a 
incerteza traduz-se em proporções de res-
postas ‘longo’ próximas de 0.5, como Stubbs 
observou nos pombos.
O critério que divide as durações 
mais curtas das mais longas também pode 
ser tomado como a duração que, do ponto 
de vista do sujeito, está equidistante das 
durações treinadas. A esta duração, perce-
bida como “o meio do caminho”, por assim 
dizer, dá-se o nome de ponto de igualdade 
subjetiva (PIS). A pergunta que naturalmen-
te se coloca é qual duração corresponde ao 
PIS. A pergunta é relevante porque o valor 
do PIS dá pistas sobre a métrica usada pelos 
animais para “medir” as durações dos estí-
mulos. Falar da métrica é falar da relação 
entre o tempo objetivo (medido pelo reló-
gio) e o tempo subjetivo (inferido a partir do 
Figura 2. Painel de cima: Função psicométrica hipotética em forma de 
degrau. Painel de baixo: Esquematização do padrão geral das funções 
psicométricas obtidas em uma discriminação entre 2 e 20 s por Stubbs 
(1968, Experimento 2).
Capítulo IX | Bissecção Temporal
142
comportamento). Será a métrica do tempo 
subjetivo linear, logarítmica, recíproca, ou 
de outro tipo? A Figura3 abaixo ilustra as 
três primeiras métricas.
Tome o caso de uma discriminação 
entre 1 s e 4 s. Em uma transformação line-
ar, y = ax + b (painel da esquerda na Figura 
3; no nosso exemplo, assumimos que a = 1 e 
b = 1), 1 s (x1) é representado subjetivamente 
como 2 (y1) e 4 s (x2) é representado como 
5 (y2). O PIS é a duração x equivalente ao 
valor médio de 2 e 5 da representação sub-
jetiva (ver a seta que projeta no eixo do x o 
valor médio da representação subjetiva). A 
derivação na Figura 3 (painel da esquerda) 
mostra que, se o sujeito usa uma métrica li-
near, o PIS é a média aritmética (MA) de 1 
e 4 s.
Em uma transformação logarítmica, 
y = ln(x) (painel central na Figura 3; logarít-
mo na base e), 1 s (x1) é representado como 
zero (y1) e 4 s (x2) como 1.39 (y2). A deriva-
ção (painel central) mostra que se o sujeito 
usa uma métrica logarítmica, o PIS é a mé-
dia geométrica (MG) de 1 e 4 s.
Por fim, em uma transformação recí-
proca, y = 1/x (painel da direita na Figura 3), 
1 s (x1) é representado como 1 (y1) e 4 s (x2) 
é representado como 0.25 (y2). A derivação 
(painel da direita) mostra que, se o sujeito 
usa uma métrica recíproca, o PIS é a média 
harmônica (MH) de 1 e 4 s.
Generalizando, se ao estimar a du-
ração de n estímulos, t1, t2, ..., tn, os su-
jeitos usam uma métrica linear, o PIS é 
Figura 3. Painel da esquerda: Transformação linear da duração x. Painel central: Transformação logarítmica da duração x. Painel da direita: Transfor-
mação recíproca da duração x.
Marilia Pinheiro de Carvalho, Marco Vasconcelos, Armando Machado
143
igual à média aritmética dos estímulos 
 
 
 
; se usam uma métrica 
 
logarítmica, o PIS é igual à média geomé- 
trica dos estímulos ; 
e se usam uma métrica recíproca, o PIS é 
igual à média harmônica dos estímulos 
 
 
 Church e Deluty (1977) determina-
ram empiricamente o PIS em um dos es-
tudos mais influentes na área do controle 
temporal do responder (timing). Eles usa-
ram uma tarefa psicofísica clássica, a tare-
fa de bissecção, para medir o valor do PIS 
em diversas discriminações temporais. Os 
resultados revelaram algumas das proprie-
dades centrais do responder controlado 
temporalmente em animais não-humanos 
e essas propriedades definiram aquilo que 
qualquer modelo teórico de timing deve ex-
plicar. Para além disso, o estudo de Chur-
ch e Deluty identificou pela primeira vez 
questões importantes sobre a natureza do 
controle por estímulos temporais e sobre 
a natureza do que é aprendido em tarefas 
temporais, sugeriu procedimentos para 
analisá-las empiricamente, e avançou com 
respostas provisórias a essas questões. To-
das elas permanecem em aberto.
DESCRIÇÃO DO EXPERIMENTO
Objetivo e método
A tarefa de bissecção temporal é uma 
tarefa de discriminação condicional. Para 
ilustrar, considere uma tentativa de treino 
típica no estudo de Church e Deluty (1977) 
com ratos. Durante o intervalo entre tenta-
tivas (ITI, do inglês inter-trial interval), uma 
luz de iluminação geral ficava acesa por 30 
segundos. Terminado o ITI, a luz geral apa-
gava-se por 2 ou 8 s – o período na escuri-
dão sinalizava o intervalo de tempo a esti-
mar e era o estímulo modelo da tentativa. 
Ao fim do intervalo, duas barras de resposta 
eram introduzidas na caixa, uma na esquer-
da e outra na direita do painel de respostas. 
Os ratos deviam pressionar uma das duas 
barras condicionalmente à duração do in-
tervalo. Respostas corretas (e.g., pressionar 
a barra da esquerda após 2 s e a barra da di-
reita após 8 s) eram reforçadas com acesso 
a comida e respostas incorretas não produ-
ziam consequências (extinção). Para facili-
tar a descrição, a partir de agora vamos sim-
plesmente dizer que os ratos aprenderam a 
responder ‘curto’ após a duração mais curta, 
e ‘longo’ após a duração mais longa – inde-
pendentemente de formalmente as respos-
tas serem pressionar a barra da esquerda ou 
da direita.
Quatro grupos de ratos (N = 8) foram 
treinados em diversas discriminações ao 
longo de seis fases experimentais. Para os 
nossos propósitos, é suficiente considerar 
apenas as quatro primeiras fases. Na Fase 
( )1 2n nMG t t t= × × ×
1 2 nt t tMA
n
+ + + = 
 

1 2
1 1 1
nt t t
nMH
 
 
 + + + 
=

Capítulo IX | Bissecção Temporal
144
I, todos os grupos aprenderam a discrimi-
nação entre 2 e 8 s. Na Fase II, os grupos A 
e B aprenderam a discriminação entre 1 e 4 
s, e os grupos C e D a discriminação entre 4 
e 16 segundos. Na Fase III, os grupos A e B 
aprenderam a discriminação entre 4 e 16 s, 
e os grupos C e D a discriminação entre 1 e 
4 s. Na Fase IV, todos grupos aprenderam a 
discriminação entre 3 e 12 s. A Tabela 1 resu-
me as discriminações aprendidas por cada 
rações de treino (e.g., no caso da discrimi-
nação entre 2 e 8 s, MH = 3.2 s, MG = 4 s e 
MA= 5 s). Também nas tentativas de teste, 
os sujeitos deviam responder ‘curto’ ou ‘lon-
go’ condicionalmente à duração apresenta-
da na tentativa, mas nenhuma resposta era 
reforçada. Concluído o treino discriminati-
vo e o teste de generalização de uma fase 
experimental, iniciava-se a fase seguinte.
Tabela 1. Discriminações temporais aprendidas por cada grupo de ratos nas quatro primeiras fases do estudo de Church e Deluty (1977). Em cada célula, 
a posição da duração de treino representa a resposta correta. Por exemplo, ‘1 s – 4 s’ significa que, para receber comida, os sujeitos deviam responder 
‘esquerda’ após 1 s, e ‘direita’ após 4 s. Adaptado de Church e Deluty (1977).
grupo em cada fase. Doravante, chamare-
mos as durações treinadas em cada discri-
minação de ‘durações de treino’.
Cada fase começava com o treino 
discriminativo e terminava com um teste 
de generalização. O treino discriminativo 
incluía apenas tentativas com as durações 
de treino, como as descritas acima. O tes-
te de generalização incluía, para além das 
tentativas de treino, tentativas de teste em 
que eram apresentadas cinco durações in-
termediárias3 às durações de treino – três 
destas durações correspondiam às médias 
harmônica, geométrica e aritmética das du-
3 As durações de teste estavam aproximadamente em progressão geo-
métrica, ou seja, cada duração depois da primeira era obtida multipli-
cando a anterior por uma constante.
Com os dados do teste de generali-
zação, Church e Deluty (1977) obtiveram a 
função psicométrica e o PIS de cada discri-
minação treinada. Como o PIS é a duração 
que separa os modelos ‘curtos’ dos modelos 
‘longos’, ele também pode ser visto como a 
duração em que o sujeito divide ao meio, 
ou bissecta, o intervalo ente as durações de 
treino (e.g., o intervalo entre 2 e 8 s). Daí o 
nome do procedimento, bissecção tempo-
ral.
Resultados e discussão
A Figura 4 (painel da esquerda) apre-
senta as funções psicométricas médias 
(n=8) obtidas por Church e Deluty (1977) em 
Marilia Pinheiro de Carvalho, Marco Vasconcelos, Armando Machado
145
cada uma das quatro discriminações. Todas 
as funções psicométricas tinham valores 
mínimo e máximo próximos das duraçõs 
de treino de cada discriminação e formato 
ogival, evidenciando que os pombos eram 
capazes de discriminar as diferentes dura-
ções. 
O painel central da Figura 4 apresen-
ta as mesmas funções psicométricas, mas, 
agora, o eixo do x está com as durações 
em unidades logarítmicas. No eixo do x, os 
valores 1 e 7 correspondem às durações de 
treino curta e longa, respectivamente. Os 
valores 3, 4 e 5 correspondem às médias 
harmônica, geométrica e aritmética das du-
rações de treino de cada discriminação, res-
pectivamente.
A partir das funções psicométricas, 
os autores calcularam o PIS de cada dis-
criminação ajustando uma reta aos pontos 
correspondentes às três durações centrais 
[pontos com coordenadas (3, y), (4, y) e (5, 
y)]. Eles escolheram estes pontos porque 
se concentravam próximos ao ponto com 
coordenadas (x, 0.50), o PIS. Conhecidos 
os parâmetros da reta (inclinação e interse-
ção-y), calculou-se o PIS. O painel central 
naFigura 4 apresenta os PISs obtidos em 
função da média geométrica das durações 
treinadas em cada discriminação – para a 
discriminação entre 1 e 4 s, MG = 2 s; para 2 
e 8 s, MG = 4 s; para 3 e 12 s, MG = 6 s; para 
4 e 16 s, MG = 8 s. A figura também mostra 
quais seriam os PISs esperados no caso de 
eles estarem nas médias4 harmônica e arit-
mética das durações de treino (ver as linhas 
tracejadas na figura). Os resultados mos-
traram que os PISs praticamente se sobre-
puseram às médias geométricas, revelando 
que, do ponto de vista dos ratos, a duração 
que bissecta o intervalo entre as durações 
de treino é a média geométrica das mesmas.
Também à partir das retas ajustadas 
às funções psicométricas, os autores calcu-
laram o limiar diferencial de cada discrimi-
nação. O limiar diferencial, também deno-
minado de diferença mínima perceptível 
(just noticeable difference ou JND), indica 
quanto um estímulo de comparação deve 
diferir de um estímulo padrão em uma dada 
dimensão física para ser percebido como 
Figura 4. Painel da esquerda: Funções psicométricas médias obtidas por Church e Deluty (1977). Painel central: Funções psicométricas obtidas por 
Church e Deluty (1977) graficadas em uma escala comum em unidades logarítmicas. Painel da direita: PISs médios em função da média geométrica das 
durações treinadas em cada discriminação. A linha contínua (MG) indica a média geométrica das durações treinadas. As linhas tracejadas (MH e MA) 
indicam as médias harmônica e aritmética, respectivamente.
Capítulo IX | Bissecção Temporal
146
diferente. Se o JND é pequeno, uma peque-
na diferença entre os estímulos é suficiente 
para discriminá-los, se é grande, os estímu-
los devem diferir bastante para serem dis-
criminados. Para obter o JND de cada rato, 
os autores identificaram em cada reta as 
durações correspondentes aos pontos com 
coordenadas (x1, 0.75) e (x2, 0.25) e depois 
calcularam JND = (x1-x2)/2.
Esperamos naturalmente que o JND 
seja maior nas discriminações com as du-
rações mais longas. Por exemplo, esperarí-
amos que ele fosse maior na discriminação 
entre 4 e 16 s do que na discriminação entre 
1 e 4 s. É fácil percebermos que, por ser uma 
medida absoluta da discriminabilidade dos 
estímulos, o JND é afetado pela ordem de 
grandeza dos estímulos em questão. Con-
clusões gerais sobre a discriminabilidade 
dos estímulos, portanto, deveriam basear-
-se em uma medida relativa.
A Fração de Weber, obtida dividin-
do o JND pelo valor do estímulo padrão, t 
(FW=JND/t), é frequentemente usada como 
um índice relativo da discriminabilidade. 
Para calcular a Fração de Weber em cada 
discriminação, Church e Deluty (1977) assu-
miram que o PIS era o estímulo padrão, ou 
seja, o critério em relação ao qual os sujeitos 
categorizavam as durações como curtas ou 
longas. Como em todas as discriminações 
o PIS estava muito próximo da média geo-
métrica das durações de treino, os autores 
assumiram que t = MG em cada discrimi-
nação.
As Frações de Weber obtidas eram 
relativamente constantes (M = 0.23) e não 
diferiram estaticamente entre si. Estes re-
sultados revelaram que, para qualquer or-
dem de grandeza dos estímulos temporais, 
um estímulo deve diferir em cerca de 23%5 
do estímulo padrão para ser discriminável. 
Em outras palavras, a discriminabilidade 
entre duas durações depende de sua dife-
rença relativa e não da sua diferença ab-
soluta. Church e Deluty (1977) verificaram 
que, à semelhança de muitas outras dimen-
sões do estímulo, a discriminação da dura-
ção também segue a Lei de Weber.
Se a Fração de Weber é constante, é 
de se esperar que os sujeitos respondam de 
maneira semelhante para durações distin-
tas que representem a mesma proporção 
de tempo transcorrido (ou que estejam na 
mesma razão). Para ilustrar, voltemos ao 
caso das discriminações 1 s vs. 4 s e 4 s vs. 
16 s. Na primeira, os sujeitos aprenderam a 
responder ‘longo’ após 4 s e a MG = 2 s. Na 
segunda, aprenderam a responder ‘longo’ 
após 16 s e a MG = 8 s. Em ambos os casos, 
a proporção entre a duração de treino mais 
longa (4 ou 16 s) e a correspondente média 
4 A média harmômica é sempre inferior ou igual à média geométrica 
que, por sua vez, é sempre inferior ou igual à média aritmética, ou seja, 
MH ≤ MG ≤ MA. A igualdade ocorre quando os números são todos 
iguais.
5 Na literatura em tarefas temporais com animais não-humanos, há 
evidencia da Fração de Weber variando entre 0.20 e 0.30 (Richelle & 
Lejeune, 1980).
Marilia Pinheiro de Carvalho, Marco Vasconcelos, Armando Machado
147
geométrica é de 2. Assim, como a Fração de 
Weber é constante, a proporção de respostas 
‘longo’ emitidas para cada uma dessas duas 
durações longas deveria ser igual: P(‘longo’) 
aos 4 s na discriminação 1 s vs. 4 s deveria 
ser igual a P(‘longo’) aos 16 s na discrimina-
ção 4 s vs. 16 s. O mesmo aconteceria para 
as outras durações usadas nos testes.
Church e Deluty (1977) confimaram 
este resultado: As proporções de respostas 
‘longo’ eram iguais para durações que repre-
sentavam a mesma proporção em relação à 
média geométrica e, portanto, as funções 
psicométricas das quatro discriminações 
sobrepuseram-se (conferir o painel central 
na Figura 4).
A sobreposição das funções psico-
métricas ilustra uma das propriedades mais 
robustas da discriminação temporal em 
animais, a propriedade escalar: Tarefas de 
bissecção com durações de treino na mes-
ma proporção (1:4 em todas as tarefas em 
análise no estudo) induzem funções psi-
cométricas que se sobrepõem quando gra-
ficadas na mesma escala. Church e Deluty 
(1977) verificaram que a discriminação tem-
poral dos estímulos obedece à propriedade 
escalar.
DESDOBRAMENTOS
Responder relacional vs. respon-
der absoluto. Retomemos o nosso exemplo 
com o treino discriminativo entre 1 e 4 s. 
Para facilitar a descrição, dissemos até aqui 
que os sujeitos aprendem a responder ‘cur-
to’ para 1 segundo e ‘longo’ para 4 s, quando, 
em verdade, eles aprendem, por exemplo, a 
pressionar a barra da esquerda após 1 s e a 
barra da direita após 4 s. Existe uma dife-
rença fundamental entre afirmar que os su-
jeitos respondem que uma duração é curta 
e a outra é longa, e afirmar que respondem 
‘esquerda’ e ‘direita’ em função das dura-
ções. A primeira afirmação implica que os 
sujeitos respondem com base no valor rela-
tivo das durações – isto é, aprendem que 1 s 
é curto relativamente a 4 s, que 4 s é longo 
relativamente a 1 s e, adicionalmente, quais 
respostas emitir para os estímulos curto e 
longo; a segunda afirmação implica que 
os sujeitos respondem com base no valor 
absoluto das durações – isto é, aprendem 
quais respostas emitir após 1 e 4 s.
O responder com base no valor rela-
tivo dos estímulos, ou o responder relacio-
nal, influenciou fortemente o programa de 
trabalhos da escola da Gestalt em princípios 
do século XX e é um dos tópicos de pesqui-
sa mais antigos da psicologia experimen-
tal. Há evidência de responder relacional 
controlado pelo brilho (Kohler, 1918/1938), 
pelo tamanho (Gulliksen, 1932) e pela forma 
(Saldanha & Bitterman, 1951) dos estímulos, 
embora interpretações alternativas sejam 
possíveis (e.g., Spence, 1936, 1937). Mas será 
que animais não-humanos respondem rela-
cionalmente em discriminações temporais?
O estudo de Church e Deluty (1977) 
Capítulo IX | Bissecção Temporal
148
iniciou a linha de pesquisa neste tópico e, 
assim, levantou outra questão fundamen-
tal no estudo do timing, designadamente, 
o quê um animal aprende na tarefa de bis-
secção. Vejamos como os autores atacaram 
o problema. Volte à Tabela 1 e considere as 
tarefas realizadas pelos grupos A e B nas 
Fases II e III. Na Fase II, ambos os grupos 
aprenderam a responder ‘esquerda’ após 
1 s e ‘direita’ após 4 s. Se, por um lado, os 
sujeitos aprenderam a responder ao valor 
relativo das durações, a contingência pode 
ser resumida com o esquema ‘curto→es-
querda, longo→direita’. Se, por outro lado, 
aprenderam a responder ao valor absoluto 
das durações, a contingênciapode ser resu-
mida como ‘1s→esquerda, 4s→direita’.
A Fase III foi planejada para testar 
as duas possibilidades. Ambos os grupos 
aprenderam a discriminação entre 4 e 16 s, 
mas o mapeamento entre a resposta correta 
e a duração do estímulo diferiu entre gru-
pos. Um grupo aprendeu a responder ‘es-
querda’ após 4 s e ‘direita’ após 16 s. Obser-
ve que se manteve o mapeamento relativo 
‘curto→esquerda, longo→direita’ para este 
grupo e, por isso, vamos chamá-lo de grupo 
Relativo. O outro grupo, em contrapartida, 
aprendeu a responder ‘direita’ após 4 s e ‘es-
querda’ após 16 s. Neste caso, manteve-se 
o mapeamento absoluto ‘4s→direita’ e, por 
isso, chamamo-lo de grupo Absoluto.
Church e Deluty (1977) raciocinaram 
que, se o responder na discriminação tem-
poral é baseado no valor relativo das dura-
ções, o grupo Relativo deveria aprender a 
Fase III mais rapidamente do que o grupo 
Absoluto. Se, pelo contrário, o responder é 
Figura 5. Painel da esquerda. Proporção de acertos para a duração de 4 s obtida nos grupos Relativo e Absoluto por Church e Deluty (1977). Painel 
central. Porcentagem de acertos de um sujeito do grupo Relativo para as durações de 6 e 18 s na fase B do experimento de Carvalho et al. (2016). Painel 
da direita. Porcentagem de acerto de um sujeito do grupo Absoluto para as durações de 6 e 18 s na fase B do experimento de Carvalho et al. (2016).
Marilia Pinheiro de Carvalho, Marco Vasconcelos, Armando Machado
149
baseado no valor absoluto, o grupo Absoluto 
deveria aprender mais rapidamente do que 
o grupo Relativo. Os autores compararam a 
porcentagem de respostas corretas dos gru-
pos ao longo das sessões de treino da Fase 
III, mas analisaram apenas o desempenho 
para a duração de 4 s. Os resultados na Fi-
gura 5 (painel a) revelaram que o grupo Re-
lativo respondia corretamente em mais de 
90% das tentativas ao fim de quinze sessões 
de treino, mas o grupo Absoluto respondia 
corretamente em menos de 70% das tenta-
tivas. Além disso, já na primeira sessão de 
treino, o desempenho do grupo Relativo era 
mais alto do que o do grupo Absoluto. Com 
base nestes resultados, os autores concluí-
ram que os sujeitos aprendem a responder 
ao valor relativo das durações em tarefas de 
discriminação temporal.
Em nosso laboratório, replicamos 
com pombos o experimento de Church e 
Deluty (1977). Ensinamos aos animais as 
discriminações entre 2 s vs. 6 s e 6 s. vs. 18 
segundos e usamos um disco verde e outro 
vermelho como estímulos de comparação. 
Nossos resultados (painéis b e c na Figura 
5; Carvalho & Machado, 2012; Carvalho, 
Machado, & Tonneau, 2016), contudo, não 
corroboraram aqueles obtidos por Church e 
Deluty com ratos. Ao invés, eles mostraram 
que (a) na primeira sessão de treino, o de-
sempenho do grupo Absoluto era mais alto 
do que o do grupo Relativo na duração de 
6 s (a duração comum ao treino das duas 
fases e que em nosso procedimento equi-
valia à duração de 4 s no estudo de Church 
e Deluty) e (b) ambos os grupos tinham um 
desempenho similar e elevado no final do 
treino.
Para melhor fundamentar a compa-
ração dos grupos, nós simulamos o desem-
penho na tarefa com o modelo Learning to 
Time (LeT; Machado, 1997; Machado, Ma-
lheiro, & Erlhagen, 2009) e, posteriormente, 
constratamos as simulações com os dados 
empíricos. O LeT é um modelo comporta-
mental que descreve a aquisição e o estado 
estável de respostas controladas temporal-
mente com base em processos de reforça-
mento, extinção e generalização.
De acordo com o LeT, o início do 
estímulo modelo ativa uma série de esta-
dos comportamentais que estão ligados às 
duas respostas operantes. A velocidade de 
ativação dos estados (λ) varia de tentativa 
para tentativa e provem de uma distribui-
ção normal, λ ~ N (média = μ, desvio pa-
drão =σ). Quando o sujeito emite uma res-
posta ao fim do estímulo modelo, a força 
do elo associativo entre a resposta emitida 
e o estado ativo no momento da resposta é 
alterada dependendo da consequência da 
resposta: Se foi reforçada, a força aumenta; 
se foi extinta, a força diminui. A Figura 6 
esquematiza o modelo.
Vejamos o caso da discriminação 
‘2s→verde, 8s→vermelho’. Em uma ten-
tativa com um estímulo modelo de 2 s e λ 
= 1, o estado n = 2 está ativo no momento 
em que o sujeito emite uma resposta, ‘ver-
Capítulo IX | Bissecção Temporal
150
de’ por exemplo. A resposta é reforçada e, 
portanto, a força do elo entre o estado n=2 e 
‘verde’ aumenta e a força do elo entre o es-
tado n=2 e ‘vermelho’ diminui . Se o sujeito 
responder ‘vermelho’, a resposta é extinta, 
o elo de n=2 e ‘vermelho’ diminui e o elo de 
n=2 e ‘verde’ aumenta. Veja na Figura 6 o 
elo “forte” (linha preta) de n=2 com ‘verde’ e 
o elo “fraco” (linha cinza pontilhada) de n=2 
com ‘vermelho’.
Em uma tentativa com um estímulo 
modelo de 8 s e λ = 1, o estado n = 8 está 
ativo no momento em que o sujeito emite 
a resposta ‘vermelho’. A resposta é refor-
çada, a força do elo entre o estado n = 8 e 
‘vermelho’ aumenta e a força do elo entre 
o estado n = 8 e ‘verde’ diminui. Raciocínio 
semelhante ao já descrito acima aplica-se 
ao efeito da extinção da resposta ‘verde’ 
emitida após 8 s.
O parâmetro λ é uma variável alea-
tória, e, portanto, o estado ativo ao fim de 
um dado estímulo modelo varia de tentati-
va para tentativa. Contudo, a ativação dos 
estados correlaciona-se com a passagem 
do tempo e, assim, estados iniciais (e.g., n 
= 1, 2, 3) estarão mais provavelmente ativos 
durante as respostas ao estímulo de 2 s, e 
estados subsequentes (e.g., n = 6, 7, 8) esta-
rão mais provavelmente ativos durante as 
respostas ao estímulo de 8 s. Com o treino, 
as forças de ligação de todos os estados ati-
vos durante as respostas são alteradas, de 
modo que os estados iniciais estarão mais 
fortemente ligados a ‘verde’ e os estados 
posteriores estarão mais fortemente ligados 
a ‘vermelho’. O resultado são dois gradien-
tes de forças de ligação, um para a resposta 
‘verde’ e outro para a resposta ‘vermelho’ 
(observe a gradação da espessura dos elos 
associativos na Figura 6). Em cada tentati-
va, o sujeito emitirá a resposta que tiver o 
elo mais forte com o estado ativo ao fim do 
estímulo modelo.
Como você deve ter observado, o 
LeT assume que as respostas do sujeito são 
controladas pela duração absoluta do es-
tímulo modelo (i.e., 2 s ou 8 s) e não pela 
sua duração relativa (i.e., ‘curto’ ou ‘longo’). 
Ao comparar as simulações do LeT com o 
desempenho dos pombos, pudemos ava-
liar qual é a forma de controle de estímulos 
predominante na tarefa de bissecção tem-
poral. As simulações foram genericamente 
semelhantes ao desempenho dos pombos 
tanto qualitativa, quanto quantitativamen-
te (compare os painéis d e e com os painéis 
b e c, respectivamente, na Figura 5). Os re-
sultados dos estudos conduzidos por Car-
valho e colaboradores (2012, 2016), portanto, 
Figura 6. Diagrama dos componentes do modelo Learning to Time 
(LeT) – estados comportamentais, elos associativos e respostas operan-
tes – aplicado à uma tarefa de bissecção temporal. A cor e o tracejado 
dos elos indicam a força de ligação entre os estados e as respostas: Li-
nhas pretas contínuas indicam força “elevada”, linhas pretas traceja-
das indicam força “intermediária” e linhas cinzas pontilhadas indicam 
força “baixa”. Portanto, o estado n = 2 está fortemente ligado a ‘verde’ e 
fracamente ligado a ‘vermelho’, e o estado n = 8 está fracamente ligado 
a ‘verde’ e fortemente ligado a ‘vermelho’, por exemplo.
Marilia Pinheiro de Carvalho, Marco Vasconcelos, Armando Machado
151
sugerem de maneira bastante robusta que o 
responder na tarefa de bissecção temporal 
é baseado no valor absoluto das durações. 
Permanece por identificar sob quais condi-
ções os animais aprendem a responder com 
base na duração relativa dos estímulos tem-
porais.
Efeitos contextuais na tarefa de bis-
secção. 
Para além dos estudos empíricos, 
os pesquisadores do timing também têm 
conduzido pesquisas teóricas. Em particu-
lar, elestêm proposto vários modelos ma-
temáticos para explicar o desempenho em 
tarefas temporais. Dois dos modelos mais 
influentes são o LeT, já apresentado, e o 
Scalar Expectancy Theory (SET; Gibbon, 
1977, 1991; Gibbon & Church, 1984; Gibbon, 
Church, & Meck, 1984).
Os dois modelos diferem nos seus 
pressupostos sobre o que é aprendido na 
tarefa de bissecção temporal. Para compre-
endermos estas diferenças, tomemos uma 
tarefa em que os sujeitos devem responder 
‘vermelho’ após 1 s e ‘verde’ após 4 s. De 
acordo com o SET, os sujeitos aprendem 
apenas as contingências ‘1s→escolher ver-
melho’ e ‘4s→escolher verde’. O LeT, pelo 
contrário, assume que os sujeitos apren-
dem ‘1s→escolher vermelho e evitar verde’ 
e ‘4s→escolher verde e evitar vermelho’.
Para testar os pressupostos dos mo-
delos, Machado e Keen (1999) desenvolve-
ram a tarefa de dupla bissecção temporal. 
Como o nome da tarefa sugere, os sujeitos 
são treinados em duas bissecções temporais. 
A primeira é semelhante à que acabamos de 
descrever entre 1 e 4 s. Na segunda, apren-
dem a responder ‘azul’ após 4 s e ‘amarelo’ 
após 16 s. Para o SET, os sujeitos aprendem 
‘4s→escolher azul’ e ‘16s→escolher ama-
relo’. Para o LeT, eles aprendem ‘4s→esco-
lher azul e evitar amarelo’ e ‘16s→escolher 
amarelo e evitar azul’. Aprendidas as duas 
discriminações, é conduzido um teste com 
durações que variam entre 1 e 16 s e no qual 
as opções de reposta são ‘verde’ e ‘azul’.
Os modelos diferem nas previsões 
que fazem do desempenho no teste. De 
acordo com o SET, os sujeitos deveriam 
distribuir aleatoriamente suas respostas 
entre ‘verde’ e ‘azul’ durante o teste, porque 
no treino prévio eles apenas aprenderam 
‘1s→escolher vermelho, 4s→escolher ver-
de, 4s→escolher azul, 16s→escolher ama-
relo’ e, portanto, não deveriam apresentar 
vieses em favor de uma ou outra resposta 
em função das diferentes durações. Como 
consequência, a proporção de respostas 
‘verde’ não deveria variar com as durações 
de teste.
De acordo com o LeT, os sujeitos 
deveriam preferir ‘verde’ conforme as du-
rações de teste aumentassem porque no 
treino prévio os sujeitos aprenderam (a) 
a evitar ‘azul após as durações mais lon-
gas (próximas de 16 s) e (b) a evitar ‘verde’ 
após as durações mais curtas (próximas de 
Capítulo IX | Bissecção Temporal
152
1 s). No teste, dada a escolha entre ‘verde’ e 
‘azul’, a proporção de respostas ‘verde’ de-
veria aumentar com o aumento na duração 
dos estímulos.
Diversos estudos usaram a tarefa de 
dupla bissecção temporal (Arantes & Ma-
chado, 2008; Machado & Arantes, 2006; 
Machado & Keen, 1999; Machado & Olivei-
ra, 2009; Machado & Pata, 2005; Oliveira & 
Machado, 2008, 2009; Vieira de Castro & 
Machado, 2012; Vieira de Castro, Machado, 
& Tomanari, 2013) e sistematicamente con-
firmaram as previsões do LeT. A Figura 7 
apresenta os resultados obtidos por Macha-
do e Pata (2005) com pombos. Dá-se o nome 
de efeito de contexto a este padrão de resul-
tados, porque as respostas no teste são de-
terminadas pelo contexto original em que 
os sujeitos aprenderam a escolher ou evitar 
consideramos um treino discriminativo em 
que as probabilidades de reforço das res-
postas corretas para cada duração de treino 
eram iguais. Church e Deluty (1977) usaram 
um esquema de Razão Fixa (FR) 1 para as 
respostas ‘curto’ e ‘longo’. Sob este esquema, 
verificamos que o PIS está usualmente na 
média geométrica das durações de treino. A 
linha contínua na Figura 8 ilustra uma fun-
ção psicométrica hipotética para um treino 
discriminativo entre 1 e 4 s no qual as res-
postas ‘curto’ e ‘longo’ tinham igual proba-
bilidade de reforço. Observe que o PIS da 
função é igual a 2 s.
Agora, o que aconteceria com o PIS, 
em particular, e com a função psicométrica, 
de um modo geral, se conduzíssemos um 
treino discriminativo em que uma resposta 
tem maior probabilidade de reforço do que 
a outra? Por exemplo, o que aconteceria se a 
probabilidade de reforço da resposta ‘longo’ 
fosse de 1.0 e a probabilidade de reforço da 
resposta ‘curto’ fosse de 0.2? De maneira se-
melhante, o que aconteceria se a magnitude 
do reforço fosse maior para a resposta ‘lon-
go’ do que para a resposta ‘curto’? Em am-
bos os casos, esperaríamos que a proporção 
de respostas ‘longo’ aumentasse, resultando 
em uma função psicométrica que está des-
locada para a esquerda da função que con-
sideramos anteriormente, e cujo PIS está 
abaixo de 2 s. A linha pontilhada na Figura 
8 ilustra o efeito.
De maneira similar, quando a proba-
bilidade de reforço da resposta ‘longo’ fosse 
Figura 7. Efeito de contexto obtido por Machado e Pata (2005) com 
pombos em uma tarefa de dupla bissecção temporal.
uma resposta em função das durações.
Efeitos da probabilidade do reforço 
na função psicométrica. Até agora, apenas 
Marilia Pinheiro de Carvalho, Marco Vasconcelos, Armando Machado
153
menor do que a probabilidade de reforço da 
resposta ‘curto’, a proporção de respostas 
‘longo’ diminuiria, a função psicométrica 
deslocar-se-ia para a direita e o PIS seria 
superior a 2 s. A linha tracejada na Figura 8 
ilustra o efeito.
Até o momento, contudo, os resulta-
dos experimentais são escassos e inconsis-
tentes. Stubbs (1976), por exemplo, reportou 
deslocamentos consistentes com as previ-
sões em uma tarefa em que a probabilidade 
relativa de reforço diferia entre as respostas 
‘curto’ e ‘longo’ (ver também Raslear, 1985). 
Outros estudos que manipularam a mag-
nitude do reforço, no entanto, revelaram 
tanto resultados consistentes quanto resul-
tados inconsistentes com as previsões (e.g., 
Galtress & Kirkpatrick, 2010).
Caso ocorram de fato, os desloca-
mentos da função psicométrica indicariam 
que a distribuição das respostas entre as 
duas opções (‘curto’ e ‘longo’) é sensível às 
discrepâncias nas probabilidades e nas mag-
nitudes de reforço. Tais resultados seriam 
consistentes com a Lei da Igualação (Herr-
nstein, 1970) e aproximariam o responder 
em discriminações temporais do responder 
observado em outros procedimentos que 
envolvem escolha. Mais pesquisa sobre o 
tópico é claramente necessária.
CONSIDERAÇÕES FINAIS
O estudo de Church e Deluty (1977) 
é hoje considerado um clássico da pesqui-
sa em timing. Por um lado, foi pioneiro na 
implementação de uma tarefa de bissecção 
temporal recorrendo a um procedimento 
psicofísico clássico (i.e., o método de estí-
mulos constantes). Anteriormente, Stubbs 
(1968, 1976) tinha utilizado um procedimen-
to similar, mas, ao invés de reforçar apenas 
as repostas para as durações mais curta e 
mais longa, reforçava também as respostas 
para as durações intermediárias. Church e 
Deluty, por sua vez, foram os primeiros a 
reportar funções psicométricas e PISs ob-
tidos em testes de generalização e sem re-
forçamento das respostas para as durações 
intermediárias. Por outro lado, e porventu-
ra mais importante, o estudo de Church e 
Deluty deu lugar a uma série de questões 
consideradas ainda hoje centrais para a 
nossa compreensão da percepção temporal 
tanto em humanos como em animais não 
humanos.
Como discutido anteriormente, o PIS 
Figura 8. Funções psicométricas hipotéticas para diferentes probabi-
lidades de reforço na discriminação entre 1 e 4 s. Em cada linha da 
legenda, o valor à esquerda representa a probabilidade de reforço da 
resposta ‘curto’ e o valor à direita representa a probabilidade de reforço 
da resposta ‘longo’.
Capítulo IX | Bissecção Temporal
154
na média geométrica sugere uma escala 
logarítmica para o tempo subjetivo, com-
binada com uma regra de decisão baseada 
na diferença entre tempos subjetivos. Con-
tudo, logo após o estudo de Church e Delu-
ty (1977), outros autores mostraram como o 
PIS na média geométrica pode ser obtido a 
partir de uma escala linear e de uma regra 
de decisão baseada na razão entre os tem-
pos subjetivos (ver Gibbon, 1991). As ques-
tões sobre a métrica da escala subjetiva do 
tempo – logarítmica versus linear – e sobre 
a regra de decisão permanecem em aber-
to(e.g., Jozefowiez, Machado, & Staddon, 
2013). Da mesma forma, há evidência de res-
ponder relacional em algumas circunstân-
cias (e.g., Zentall, Weaver, & Clement, 2004), 
muito embora nosso laboratório tenha en-
contrado evidências sólidas de responder 
absoluto, pelo menos em pombos. Ainda, a 
tarefa de bissecção abriu a porta para pro-
cedimentos mais complexos como a dupla 
bissecção. Esta última tem sido usada para 
estudar efeitos de contexto na percepção 
temporal, testando previsões contrastantes 
de dois modelos proeminentes da área, o 
SET e o LeT. Por fim, ainda não são claros 
os efeitos da manipulação da probabilidade 
e da magnitude do reforço na função psi-
cométrica. Os resultados obtidos por alguns 
autores apontam para deslocamentos da 
função induzidos por estas manipulações 
(Galtress & Kirkpatrick, 2010; Raslear, 1985; 
Stubbs, 1976), mas o assunto permanece por 
esclarecer cabalmente.
A melhor prova do sucesso e impor-
tância do trabalho de Church e Deluty (1977) 
são as linhas de pesquisa que abriu. Trinta 
e nove anos após a sua publicação, as su-
gestões nele contidas permanecem atuais e 
alvo de forte disputa e investigação.
PARA SABER MAIS
Carvalho & Machado (2012); Carvalho, 
Machado, & Tonneau (2016). Em ambos 
os artigos, os autores reproduziram o estu-
do original de Church e Deluty (1977) com 
procedimentos que melhoraram o desenho 
experimental e a análise de dados para es-
tudar a questão do responder relacional vs. 
responder absoluto. Nos artigos, os autores 
também apresentam uma revisão detalha-
da do trabalho de Church e Deluty (1977).
Carvalho, Machado, & Vasconcelos (2016).
Os autores revisam as principais tarefas ex-
perimentais usadas na pesquisa em timing 
e os principais resultados obtidos até hoje. 
Propõem uma abordagem integrativa dos 
resultados que se baseia na interação de 
gradientes de generalização temporal.
Richelle & Lejeune (1980). Livro de referên-
cia na área do timing, escrito por dois dos 
principais pesquisadores da área. Resume 
os principais procedimentos, resultados e 
propriedades do responder controlado por 
intervalos de tempo.
Marilia Pinheiro de Carvalho, Marco Vasconcelos, Armando Machado
155
REFERÊNCIAS
Arantes, J., & Machado, A. (2008). Context 
effects in a temporal discrimination task: 
Further tests of the Scalar Expectancy The-
ory and Learning-to-Time models. Journal 
of the Experimental Analysis of Behavior, 
90, 33-51.
Carvalho, M. P., & Machado, A. (2012). Rela-
tive versus absolute stimulus control in the 
temporal bisection task. Journal of the Ex-
perimental Analysis of Behavior, 98, 23-44.
Carvalho, M. P., Machado, A., & Tonneau, 
F. (2016). Learning in the temporal bisection 
task: Relative or Absolute? Journal of Expe-
rimental Psychology, 42, 67-81.
Carvalho, M. P., Machado, A., & Vasconce-
los, M. (2016). Animal timing: a synthetic 
approach. Animal Cognition, 1-26. 
Catania, A. C. (1999). Aprendizagem: Com-
portamento, Linguagem e Cognição (4ª ed.). 
Porto Alegre: Artes Médicas.
Church, R. M. (2002). Temporal learning. 
In H. Pashler, & R. Gallistel (Eds), Stevens’ 
Handbook of Experimental Psychology, 
Third Edition: Volume 3, Learning, Motiva-
tion, and Emotion (pp. 365-393). New York, 
NY: Wiley.
Church, R. M., & Deluty, M. (1977). Bisec-
tion of temporal intervals. Journal of Expe-
rimental Psychology: Animal Behavior Pro-
cesses, 3, 216-228.
Galtress, T., & Kirkpatrick, K. (2010). Reward 
magnitude effects on temporal discrimina-
tion. Learning and Motivation, 41, 108-124.
Gibbon, J. (1977). Scalar expectancy theory 
and Weber’s law in animal timing. Psycho-
logical Review, 84, 279-325.
Gibbon, J. (1991). Origins of scalar timing. 
Learning and Motivation, 22, 3-38.
Gibbon, J., & Church, R. M. (1984). Sources 
of variance in an information processing 
theory of timing. In H. L. Roitblat, T. G. Be-
ver, & H. S. Terrace (Eds), Animal Cognition 
(pp. 465-488). Hillsdale, NJ: Lawrence Erl-
baum Associates.
Gibbon, J., Church, R. M., & Meck, W. H. 
(1984). Scalar Timing in Memory. Annals of 
the New York Academy of Sciences, 423, 52-
77.
Gulliksen, H. (1932). Studies of transfer of 
response: I. Relative versus absolute factors 
in the discrimination of size by the white 
rat. Journal of Genetic Psychology, 40, 37-51.
Herrnstein, R. J. (1970). On the law of ef-
fect. Journal of the Experimental Analysis of 
Behavior, 13, 243-266.
Köhler, W. (1918/1938). Simple structural 
functions in the chimpanzee and in the chi-
cken. In W. D. Ellis (Ed), A source book of 
Capítulo IX | Bissecção Temporal
156
gestalt psychology (pp. 217-227). New York: 
Harcourt, Brace & World. (Trabalho original 
publicado em alemão em 1918).
Machado, A. (1997). Learning the temporal 
dynamics of behavior. Psychological Re-
view, 104, 241-265.
Machado, A., & Arantes, J. (2006). Further 
tests of the Scalar Expectancy Theory (SET) 
and the Learning-to-Time (LeT) model in a 
temporal bisection task. Behavioural Pro-
cesses 72, 195-206.
Machado, A., & Keen, R. (1999). Learning 
to Time (LeT) or Scalar Expectancy The-
ory (SET)? A critical test of two models of 
timing. Psychological Science, 10, 285-290.
Machado, A., Malheiro, M. T., & Erlhagen, 
W. (2009). Learning to time: A perspecti-
ve. Journal of the Experimental Analysis of 
Behavior, 92, 423-458.
Machado, A., & Oliveira, L. (2009). Dupla 
bissecção temporal: testes críticos de dois 
modelos de timing. Acta Comportamenta-
lia, 17, 25-60.
Machado, A., & Pata, P. (2005). Testing the 
scalar expectancy theory (SET) and the le-
arning-to-time model (LeT) in a double bi-
section task. Learning & Behavior, 33, 111-
122.
Oliveira, L., & Machado, A. (2008). The ef-
fect of sample duration and cue on a double 
temporal discrimination. Learning and Mo-
tivation, 39, 71-94.
Oliveira, L., & Machado, A. (2009). Context 
effect in a temporal bisection task with the 
choice keys available during the sample. 
Behavioural Processes, 81, 286-292.
Pavlov, I. (1927). Conditioned reflexes. Lon-
don: Oxford University Press.
Raslear, T. G. (1985). Perceptual bias and 
response bias in temporal bisection. Per-
ception & Psychophysics, 38, 261-268.
Richelle, M., & Lejeune, H. (1980). Time in 
animal behaviour. Oxford: Pergamon Press 
Ltd.
Saldanha, E. L., & Bitterman, M. E. (1951). 
Relational learning in the rat. The American 
Journal of Psychology, 64, 37-53.
Santo Agostinho. (2004). Confissões, Livro 
XI, XIV, 17 (2ª ed.). Lisboa: Imprensa Nacio-
nal da Casa da Moeda.
Spence, K. W. (1936). The nature of discri-
mination learning in animals. Psychological 
Review, 43, 427-449.
Spence, K. W. (1937). The differential res-
ponse in animals to stimuli varying within 
a single dimension. Psychological Review, 
44, 430-444.
Stubbs, D. A. (1968). The discrimination of 
Marilia Pinheiro de Carvalho, Marco Vasconcelos, Armando Machado
157
stimulus duration by pigeons. Journal of the 
Experimental Analysis of Behavior, 11, 223-
238.
Stubbs, D. A. (1976). Response bias and the 
discrimination of stimulus duration. Jour-
nal of the Experimental Analysis of Beha-
vior, 25, 243-250.
Vieira de Castro, A. C., & Machado, A. (2012). 
The interaction of temporal generalization 
gradients predicts the context effect. Jour-
nal of the Experimental Analysis of Beha-
vior, 97, 263-279.
Vieira de Castro, A. C., Machado, A., & To-
manari, G. Y. (2013). The context effect as 
interaction of temporal generalization gra-
dients: Testing the fundamental assump-
tions of the Learning-to-Time model. Beha-
vioural Processes, 95, 18-30.
Hiroto Okouchi
158
Como você se sente?1, 2
Hiroto Okouchi 
Universidade Osaka Kyoiku, Japão
Lubinski, D., & Thompson, T. (1987). An animal model of the interpersonal communication of 
interoceptive (private) states. Journal of the Experimental Analysis of Behavior, 48, 1-15.
“Nós não precisamos supor que eventos que ocorrem dentro da pele de um organis-
mo tem propriedades especiais por essa razão”
(Skinner, 1953, p.257).
CapítuloX | Eventos Privados
159
INTRODUÇÃO À ÁREA DE PES-
QUISA E CONTEXTUALIZAÇÃO 
DO EXPERIMENTO
Muitas pessoas, não somente os psi-
cólogos mas também os não especialistas 
em Psicologia, estão interessados em com-
preender a “mente”. Analistas do comporta-
mento têm uma perspectiva única sobre ela, 
baseada no Behaviorismo Radical (Skinner, 
1945).
A entidade hipotética que geral-
mente tem sido chamada de “mente” está 
relacionada com um dos conceitos analíti-
co-comportamentais, os eventos privados. 
Eventos privados têm sido geralmente de-
finidos estruturalmente como eventos que 
ocorrem dentro da pele de uma pessoa (Ca-
tania, 1992, p.388) e, funcionalmente, como 
eventos que são diretamente acessíveis a 
apenas uma pessoa (Skinner, 1953, p.257). 
Sentimentos, como “depressão” e “entu-
siasmo”, são eventos privados não só estru-
turalmente, mas também funcionalmente, 
porque ocorrem dentro da pele de uma pes-
soa e estão diretamente acessíveis apenas 
para ele ou ela. Tais sentimentos, em ge-
ral, são considerados como “elementos da 
mente” (Dicionário de Inglês Oxford, 2004, 
pp.1047-1048). 
Em oposição aos eventos privados, 
eventos que ocorrem fora da pele de uma 
pessoa e/ou eventos que são diretamen-
te acessíveis a mais do que um indivíduo 
podem ser chamados de eventos públicos. 
O pressionar de uma barra por um rato e a 
entrega de uma pelota de comida, durante 
um experimento de condicionamento ope-
rante, são exemplos típicos de eventos pú-
blicos. A análise experimental do compor-
tamento tem acumulado um extenso corpo 
de conhecimento sobre as relações sistemá-
ticas entre tais eventos públicos (Ferster & 
Skinner, 1957, Honig, 1966; Honig & Stad-
don, 1977; Iversen & Lattal, 1991; Madden, 
2013).
Analistas do comportamento presu-
mem que eventos privados obedecem os 
mesmos princípios comportamentais reve-
lados pela análise experimental de even-
tos públicos. De acordo com este ponto de 
vista, por exemplo, até mesmo descrever 
nossos próprios sentimentos é um resul-
tado de contingências de reforçamento. 
Skinner (1945) argumentou que as respos-
tas verbais sob controle de estímulos pri-
vados são estabelecidas e mantidas prin-
cipalmente pelas contingências de reforço 
“arranjadas” por outras pessoas. Suponha 
que uma pessoa “deprimida” (um falante), 
diga: “Estou deprimido.” Se alguém (um ou-
vinte) ouviu e entendeu a reclamação (isto 
é, se o ouvinte pertencesse a uma mesma 
comunidade verbal que o falante e pudesse 
reagir de forma adequada ao que o falan-
te disse), e se o ouvinte soubesse que o fa-
1 Tradução realizada por João Henrique de Almeida, Carlos Renato Xa-
vier Cançado e Paulo Guerra Soares. O primeiro tradutor é bolsista de 
pós-doutorado FAPESP processo número 2014/01874-7.
2 O artigo descrito nesse texto foi traduzido para a língua portuguesa 
por Júlio de Rose e está publicado: Lubinski,D. & Thompson, T. (2010) 
Um modelo animal de comunicação interpessoal de estados interocep-
tivos (privados). Revista Brasileira de Análise do Comportamento, 6, 
229-252. 
Hiroto Okouchi
160
lante tinha experimentado um evento que 
normalmente provoca sentimentos de de-
pressão (por exemplo, a perda de um ente 
querido), o ouvinte poderia dizer: “Eu sei 
exatamente como você se sente.” Compor-
tamentalmente, o sentimento de depressão, 
a queixa “estou deprimido”, e as palavras de 
conforto “Eu sei exatamente como você se 
sente”, respectivamente, são um estímulo 
discriminativo, uma resposta e um refor-
çador do comportamento verbal do falante. 
Uma resposta verbal (e.g., “vermelho”) a um 
estímulo público (e.g., um cartão vermelho) 
pode ser estabelecida pelo reforço dado por 
outros (e.g., “Correto, esta é a cor do car-
tão.”). Os analistas do comportamento su-
põe que descrever os próprios sentimentos 
(e.g., estar deprimido), também é aprendido 
(e.g., Skinner, 1953, pp.257-282).
Skinner (1945) também demonstrou 
que o relato de uma pessoa sobre um estí-
mulo privado não ocorre por reforço direto, 
mas por meio de generalização. Uma pessoa 
pode descrever seu sentimento novo como 
“deprimido(a)” se ele ou ela aprendeu que a 
palavra “deprimido(a)” é usada quando algo 
(e.g. uma barra) foi empurrado para baixo 
(generalização de eventos públicos para os 
privados, Skinner, 1957, pp.132-133) ou a 
palavra é usada quando ele ou ela experi-
menta um sentimento semelhante ao sen-
timento novo (i.e. generalização de eventos 
privados conhecidos para aqueles desco-
nhecidos).
Apesar da grande quantidade de 
análises conceituais (e.g., Leigland, 2014; 
Schlinger, 2011; Tourinho, 2006), análises 
experimentais de eventos privados têm 
recebido relativamente pouca atenção. O 
experimento conduzido por Lubinski e 
Thompson (1987) é um dos raros casos em 
que foi praticada uma análise experimental 
de eventos privados.
DESCRIÇÃO DO EXPERIMENTO
Objetivos e Método
O objetivo do experimento de Lu-
binski e Thompson (1987) foi avaliar se ani-
mais não-humanos poderiam aprender a 
interagir comunicativamente, com base em 
eventos em seu ambiente interno.
Figura 1. Painéis adjacentes de trabalho das caixass para os dois grupos 
de pombos. Os painéis de trabalho foram separados por uma divisória 
de acrílico Os mandadores foram treinados na caixa esquerda; os tate-
adores foram treinados na caixa direita (figura reproduzida da tradução 
de Lubinski & Thompson, com permissão da ReBAC e JEAB).
Capítulo X | Eventos Privados
161
Figura 2. Uma comunicação entre dois pombos com base na ingestão de drogas (estado interno) de um dos pombos. Da esquerda para a direita, os cinco 
quadros (A-E) mostram os componentes sucessivos do procedimento. Os pombos à esquerda e à direita em cada quadro eram o mandador e o tateador, 
respectivamente (reproduzida da tradução de Lubinski & Thompson, 1987, com permissão da ReBAC e JEAB).
de água e comida durante o experimento, 
foram treinados em uma cadeia comporta-
mental com dois componentes, em que o 
primeiro componente compreendia uma ta-
refa pareamento ao modelo arbitrária (arbi-
trary matching-to-sample )(o procedimen-
to deste treino será resumido em seguida). 
Após o treino, a cadeia comportamental es-
tabelecida era a seguinte: (a) O tateador era 
injetado com um depressor (pentobarbital), 
um estimulante (cocaína) ou uma solução 
salina isotônica; (b) três discos de resposta, 
cada um marcado com a letra “D”, “N”, ou 
“Σ” foram iluminados (Figura 1); (c) bicadas 
correspondentes à substância injetada (o 
disco “D” para o pentobarbital, o disco “Σ” 
para a cocaína, e o disco “N” para a solução 
Os sujeitos foram cinco pombos 
White Carneau fêmeas, experimentalmen-
te ingênuas, distribuídos em dois grupos, 
denominados “mandadores” (dois pombos) 
e “tateadores” (três pombos).
Duas caixas experimentais contí-
guas, separadas por uma divisória de acríli-
co transparente, que permitiu que os pom-
bos vissem um ao outro, foram usadas (ver 
Figuras 1 e 2). Os mandadores foram trei-
nados na caixa esquerda, os tateadores na 
direita. Antes de serem colocados em suas 
caixas simultaneamente, cada pombo foi 
treinado individualmente.
Os tateadores, que estavam privados 
Hiroto Okouchi
162
salina) foram seguidas pela apresentação de 
uma luz azul piscando acima dos discos de 
resposta; (d) as respostas em um disco aci-
ma de um comedouro (disco da comida) e 
em um disco acima de um bebedouro (dis-
co da água) foram reforçadas com comida e 
água, respectivamente.
A tarefa de pareamento ao modelo 
que os tateadores experimentaram é co-
nhecida como um procedimento de discri-
minação de drogas (drug discrimination): 
reforçar um tipo de comportamento após a 
administração de uma droga e reforçar ou-
tro comportamento após a administração 
de nenhuma droga ou alguma outra dro-
ga (Branch, 1991). Na ausência de qualquer 
estímulo diferencial exteroceptivo corre-
lacionado com qualquer comportamento, 
escolhas produziam reforçadores mais fre-
quentemente do que ao acaso e poderiam 
ser atribuídas a estímulos interoceptivos 
decorrentesda substância administrada 
(e.g., a droga ou a solução salina). Assim, 
os tateadores no experimento de Lubinski 
e Thompson (1987) foram treinados para 
“relatar seus sentimentos” pela tarefa de 
pareamento ao modelo. Foram necessários 
aproximadamente sete meses para os tate-
adores responderem de forma consistente 
(i.e., pelo menos 80% de respostas corretas) 
nesta tarefa.
Um segundo objetivo do experimen-
to Lubinski e Thompson (1987) foi avaliar 
se as respostas dos pombos aos seus even-
tos internos (privados) poderiam funcionar 
como um tato, o que foi estudado na parte 
final do experimento (descrito em seguida). 
Um tato, uma unidade do comportamento 
verbal, é “um operante verbal em que uma 
resposta de determinada forma é evocada 
(ou pelo menos fortalecida) por um deter-
minado objeto ou evento ou propriedade 
de um objeto ou evento” (Skinner, 1957, 
pp. 81-82). Citando vários outros autores 
(e.g., MacCorquodale, 1969; Skinner, 1957, 
pp.81-82), Lubinski e Thompson afirmam 
que tatos não são mantidos por reforços 
específicos, nem mudam com o estado de 
privação ou de estimulação aversiva do in-
divíduo, mas são mantidos por reforçadores 
condicionados generalizados (e.g., dizendo 
“Correto” quando alguém nomeia com pre-
cisão a cor de um cartão vermelho dizendo 
“Vermelho”). A fim de alcançar este segun-
do objetivo, Lubinski e Thompson tentaram 
estabelecer a luz azul intermitente como 
um reforçador condicionado generalizado 
que pudesse manter o comportamento dos 
tateadores. Os tateadores foram privados 
de comida de forma mais rigorosa do que 
eles foram privados de água em um dia (i.e., 
privação de comida por 28 hr e privação de 
água por 4hr), e eles foram privados de água 
de forma mais rigorosa do que eles foram 
privados de comida em outro dia (i.e., priva-
ção de água por 28 hr e privação de comida 
por 4hr). Alternando essas duas condições 
de uma forma A-B-A-B, os tateadores esco-
lhiam comida e água indiferenciadamente 
quando a luz azul estava piscando.
Um mando, uma unidade mais pri-
Capítulo X | Eventos Privados
163
mitiva do comportamento verbal, é “um 
operante verbal em que a resposta é reforça-
da por uma consequência particular, e está, 
portanto, sob controle funcional das condi-
ções relevantes de privação ou de estimu-
lação aversiva” (Skinner, 1957, pp.35 -36). 
Dizer a palavra “Doce” é um exemplo de um 
mando quando reforçado pelo acesso a do-
ces, e a resposta “Doce” será mais provável 
de ocorrer após um período de privação de 
doces ou comida (Skinner, 1957, p.35). Os 
mandadores, que foram mantidos sob pri-
vação de comida a 85% de seu peso com 
livre acesso a comida, foram treinados em 
uma cadeia comportamental com três com-
ponentes, em que o terceiro componente 
envolvia uma tarefa de pareamento ao mo-
delo arbitrário. A cadeia estabelecida para 
o mandador era a seguinte: (a) foi ilumina-
do um disco com letras em Inglês dispostas 
para formar as palavras (Figura 1); “Como 
você se sente?”; (b) as bicadas do mandador 
ao disco “Como você se sente” foram segui-
das pela iluminação de um outro disco ro-
tulado “Obrigado”; (c) quando o mandador 
bicava o disco “Obrigado”, a letra “D”, “N”, 
ou “Σ” era projetada em um disco modelo; 
(d) bicar o disco modelo e, em seguida, bicar 
o disco de comparação contendo a respos-
ta com a correspondência correta (o disco 
“P” para a letra “D”, o disco “C” para a letra 
“Σ”, e o disco “S”para a letra”N”) produziam 
comida. Depois de ambos os mandadors e 
tateadores adquirirem independentemente 
a precisão necessária (i.e., pelo menos 80% 
de respostas corretas) no encadeamento, 
tateadores e mandadors individuais fo-
ram colocados nas suas caixas simultane-
amente. Como a Figura 2 ilustra, a intera-
ção comportamental necessária de cada par 
mandador-tateador foi: (a) foi iluminado o 
disco do mandador “Como você se sente?” e 
o mandador bicava esse disco; (b) foram ilu-
minados todos os discos de comparação do 
tateador (i.e., os discos “D”, “N”, e “Σ”) e o ta-
teador bicava o disco de comparação corre-
lacionado com a substância injetada (ou os 
próprios “sentimentos” do tateador); (c) foi 
iluminado o disco “Obrigado” na caixa do 
mandador e o mandador bicava esse disco; 
(d) a letra (“D”, “N”, ou “Σ”, i.e., o “nome” da 
droga ou o relato do tateador de seus “senti-
mentos”) previamente bicada pelo tateador 
aparecia no disco modelo do mandador e a 
luz azul começava a piscar a caixa do tate-
ador; o mandador bicava o disco modelo e, 
em seguida, bicava do disco de comparação 
correto; o tateador bicava o disco da comida 
ou da água, produzindo comida ou água; (e) 
o mandador recebeu comida. Se o tateador 
bicasse o disco de comparação não corre-
lacionado com a substância injectada (uma 
resposta incorreta), as luzes da caixa eram 
escurecidas por 4 s e o elo inicial da cadeia 
(a) era reiniciado. Assim, o estímulo modelo 
apresentado ao mandador sempre foi corre-
to. Ambos os mandadors trabalharam com 
cada um dos tateadores. Os pombos foram 
testados nessa interação por 40 sessões ex-
perimentais.
Deve-se notar que o experimento 
de Lubinski e Thompson (1987) apresenta-
va duas fases adicionais (Fases 2 e 3). Na 
Hiroto Okouchi
164
Fase 2, os tateadores foram injetados com 
novas drogas, clordiazepóxido e d-anfeta-
mina, que possuem propriedades farma-
cológicas em comum com o pentobarbital 
e cocaína, respectivamente, como um tes-
te de generalização. Na Fase 3, os autores 
examinaram se as respostas dos tateadores 
aos seus eventos privados funcionavam 
realmente como tatos. Foram testados os 
desempenhos dos tateadores quando foram 
colocados em suas caixas experimentais 
depois de receberem 24 horas de acesso li-
vre a alimento e água (os tateadores foram 
saciados com alimento e água), e quando 
suas respostas corretas produziam apenas a 
luz azul piscando, mas que não produziam 
água ou comida (as respostas corretas dos 
tateadores produziam apenas reforçadores 
condicionados).
Resultados e Discussão
Resultados da Fase 1. 
Como apenas uma única substância 
(pentobarbital, cocaína, ou salina) foi inje-
tada antes de cada sessão, a escolha corre-
ta para o tateador foi a mesma em todas as 
tentativas em uma sessão. Assim, o desem-
penho dos tateadores na primeira tentativa 
de uma sessão foi importante neste experi-
mento. Tanto o mandador quanto o tatea-
dor responderam corretamente (e.g., o tate-
ador que recebeu o pentobarbital e bicou o 
disco “D”, e o mandador bicou o disco “P”) 
na primeira tentativa em 70-100% das ses-
sões, enquanto que a porcentagem de uma 
discriminação correta acontecer por acaso 
era de aproximadamente 11% (i.e., o produto 
dos dois desempenhos individuais acon-
tecendo por acaso, i.e., 0,33 x 0,33). Estes 
resultados sugerem que os pombos apren-
deram a interagir comunicativamente com 
base em eventos do seu ambiente interno.
Resultados das Fases 2 e 3. 
Os desempenhos observados na 
Fase 1 persistiram na Fase 2, sugerindo que 
as respostas dos tateadores aos seus even-
tos privados decorrentes do treino com as 
drogas (pentobarbital e cocaína) generali-
zaram para os eventos privados semelhan-
tes decorrentes de drogas não utilizadas no 
treino (clordiazepóxido e d-anfetamina). 
Os desempenhos observados nas Fases 1 e 
2 persistiram na Fase 3, sugerindo que as 
respostas precisas dos tateadores aos seus 
eventos privados não foram mantidas pelos 
reforçadores específicos (comida ou água), e 
não covariaram com os estados de privação 
dos tateadores, mas foram mantidas por um 
reforço condicionado generalizado (a luz 
azul piscando).
A discussão do artigo de Lubinski 
e Thompson (1987) pode ser resumida da 
seguinte forma: (a) o comportamento dos 
tateadores envolveu tatear os eventos pri-
vados; (b) os tateadores aprenderam a ta-
tear eventos privados sob um esquema de 
reforçamento contínuo com 100% de preci-
são, isto é, por meio de uma contingência 
em que cada resposta correta produzia um 
reforçador e qualquer resposta incorreta 
CapítuloX | Eventos Privados
165
não produzia reforçadores; por outro lado, 
considera-se que humanos aprendem a ta-
tear eventos privados sob um esquema de 
reforçamento intermitente com baixa pre-
cisão (Skinner, 1945); (c) a generalização ob-
tida na Fase 2 configura-se como um exem-
plo de tatos extendidos e exemplifica com 
não-humanos a descrição de Skinner de 
como humanos aprendem a relatar novos 
sentimentos; (d) os resultados de Thomp-
son e Lubunski demonstram que o com-
portamento encoberto (e.g., pensamentos, 
sentimentos e imaginação), que tem sido 
um dos candidatos para análise por meio 
de modelos experimentais com não-hu-
manos (Epstein, 1984), mas tem resistido à 
análise empírica, é passível de uma análise 
objetiva; (e) os desempenhos estudados por 
Lubinski e Thompson podem não consistir 
em um exemplo de “atividade lingüística”, 
como o termo é geralmente entendido, mas 
compartilham características com aqueles 
comportamentos observados em crianças 
muito novas ou indivíduos com diagnós-
tico de deficiências de desenvolvimento; 
(f) Savage-Rumbaugh (1984) afirmou que o 
comportamento controlado por contingên-
cias impostas por circuitos eletrônicos ao 
invés de por um outro indivíduo não pode-
ria ser caracterizado como “comunicação”. 
No entanto, as trocas diádicas humanas de 
respostas muitas vezes são mediadas por 
eventos externos, tais como ligações telefô-
nicas e quadros de avisos no computador, e 
nós estamos satisfeitos em nos referirmos a 
essas trocas como “verbais”.
DESDOBRAMENTOS
O experimento de Lubinski e Thomp-
son (1987) recebeu grande atenção (e.g., Ca-
tania, 1992, pp.219-220). Em 1993, a revista 
Behavioral and Brain Sciences dedicou um 
número para um debate sobre o mesmo, 
com comentários de 27 estudiosos da aná-
lise do comportamento e de outras aborda-
gens (ver Lubinski & Thompson, 1993).
O experimento de Lubinski e Thomp-
son (1987), no entanto, não foi replicado 
diretamente ou sistematicamente. Prova-
velmente, isto pode ser devido a razões de 
ordem prática. O equipamento utilizado 
por Lubinski e Thompson era muito dife-
rente de caixas operantes padrão. As dro-
gas psicoativas não são acessíveis a todos 
os pesquisadores. Além disso, este tipo de 
experimento demora muito tempo. Confor-
me descrito na parte de Objetivos e Método 
deste capítulo, de fato, Lubinski e Thomp-
son passaram sete meses para ensinar os 
tateadores a discriminação entre as drogas.
Dois estudos podem ser considera-
dos como sucessores Lubinski e Thompson 
(1987). Um foi realizado por DeGrandpre, 
Bickel, e Higgins (1992). Eles também usa-
ram o procedimento de discriminação de 
drogas como Lubinski e Thompson fizeram, 
e examinaram se relações de equivalência 
podem surgir entre os estímulos interocep-
tivos (ativados por drogas) e os estímulos 
exteroceptivos. Humanos adultos foram 
treinados em discriminações de drogas com 
Hiroto Okouchi
166
triazolam (reduzindo auto-relatos de ansie-
dade) e placebo (cápsulas cheias de lactose) 
como estímulos modelo, e estímulos visuais 
como estímulos de comparação. Quando o 
triazolam (A1) foi apresentado, a escolha 
de um estímulo visual B1 era a correta, en-
quanto a escolha dos estímulos visuais B2 e 
A0 eram incorretas; ou quando escolher um 
estímulo visual C1 era a escolha correta e a 
escolha dos estímulos visuais C2 e C0 in-
corretas. Da mesma forma, quando o place-
bo (A2) era o modelo, as comparações cor-
retas eram B2 e C2. Após o estabelecimento 
das relações condicionais A1B1, A1C1, A2B2, 
A2C2 por meio desse treino de discrimi-
nação de drogas, as relações não treinadas 
B1C1 e B2C2 emergiam. Estes resultados 
demonstram que eventos privados podem 
emergir como membros de uma classe equi-
valente, da mesma forma que ocorre com os 
estímulos públicos (Sidman & Tailby, 1982) 
e, como Lubinski e Thompson mostraram, 
fornecem evidências de que os princípios 
comportamentais que operam em eventos 
públicos funcionam também com os even-
tos privados (Skinner, 1953, pp.257-258).
Outro exemplo relevante para o tema 
é um experimento realizado por Okouchi 
(2006). Como no experimento de Lubinski 
e Thompson, no experimento de Okouchi 
respostas a estímulos privados de um in-
divíduo configuravam estímulos modelos 
para outro indivíduo. Diferente do experi-
mento de Lubinski e Thompson, no entan-
to, estímulos privados não eram estímulos 
interoceptivos mas exteroceptivos, isto é, 
estímulos visuais que apenas um indivíduo 
de um par de estudantes de graduação po-
dia ver. De acordo com a definição funcio-
nal de eventos privados como eventos que 
são diretamente acessíveis a uma só pessoa 
(Skinner, 1953, p.257), eventos que ocorrem 
fora da pele de uma pessoa podem ser pri-
vados (Rachlin, 2003, chamou esse tipo de 
evento privado de Privacidade B e o distin-
guiu da Privacidade A, que são eventos que 
ocorrem sob a pele de uma pessoa).
Empregando a definição funcional 
de eventos privados, Okouchi (2006) exa-
minou uma das interpretações de Skinner 
(1945) de como respostas verbais sob con-
trole de um estímulo privado são estabe-
lecidas: o relato de um estímulo privado 
(e.g., dor) pode ser aprendido por meio de 
reforços providos por outras pessoas que 
inferem o estímulo privado das respostas 
públicas colaterais (e.g., a mão no queixo, 
expressões faciais, gemidos) ao estímulo. 
Oito dos 16 participantes, descritos como 
instrutores, aprendiam primeiro discrimi-
nações condicionais BC com os estímulos 
B como os modelos e os estímulos C como 
comparações. Em seguida, outros oito par-
ticipantes, descritos como aprendizes, fo-
ram expostos a um procedimento de pare-
amento ao modelo modificado em que as 
respostas dos aprendizes foram reforçadas 
ou punidas não pelas respostas do experi-
mentador, mas pelas respostas dos instru-
tores. As discriminações condicionais AC 
deveriam ser estabelecidas para os aprendi-
zes, em que os estímulos modelos As foram 
Capítulo X | Eventos Privados
167
apresentados simultaneamente com os es-
tímulos B para que os instrutores pudessem 
ver os Bs, mas não os As. De acordo com a 
definição funcional de eventos privados, os 
estímulos A eram privados para os instru-
tores. Assim, os estímulos modelo As e os 
estímulos modelo correlacionados Bs cor-
respondiam, respectivamente, a estímulos 
privados e suas respostas públicas colate-
rais na interpretação de Skinner. Okouchi 
examinou se os relatos dos aprendizes (Cs) 
de seus próprios estímulos (As) seriam es-
tabelecidos pelo reforço diferencial provido 
por outras pessoas (os instrutores) que po-
deriam ter acesso apenas aos estímulos co-
laterais (BS) e aos relatos (CS).
No experimento de Okouchi (2006), 
dois de oito pares de participantes apre-
sentaram o desempenho previsto, no qual 
aprenderam as discriminações condicio-
nais AC dos instrutores que não tinham 
acesso aos estímulos A. Posteriormente, 
Sonoda e Okouchi (2012) replicaram os re-
sultados de Okouchi utilizando um proce-
dimento modificado. Eles utilizaram es-
tímulos abstratos e um computador, por 
exemplo, enquanto Okouchi havia usado 
estímulos geométricos, sílabas sem sentido, 
e estímulos coloridos e havia controlado a 
apresentação no experimento manualmen-
te. Sonoda e Okouchi obtiveram os desem-
penhos esperados de todos os 26 pares de 
alunos de graduação.
CONSIDERAÇÕES FINAIS
Talvez, simular o comportamento de 
relatar eventos privados por animais não-
-humanos tenha sido uma das realizações 
mais significativas de Lubinski e Thomp-
son (1987). Epstein (1981, 1984) insistiu que 
as simulações animais, ou modelos experi-
mentais, sintetizando o chamado compor-
tamento humano “complexo” em animais, 
poderiam dar insights sobre que tipos de 
variáveis constituem alguns desses com-
portamentos “complexos” em seres huma-
nos. Epstein (1984) listou quatro classes 
de comportamentos que tinham resistido 
a essas análises e, portanto, tinham sido 
considerados como “complexos”: (a) com-
portamentos encobertos (“pensamentos”, 
“sentimentos” e “imaginações”);(b) com-
portamentos tipicamente humanos (lingua-
gem, comportamentos que são descritos 
sob a rubrica do “self”, e o comportamento 
de resolução de problemas); (c) os compor-
tamentos controlados por estímulos tempo-
ralmente remotos (“memória”); e (d) novos 
comportamentos (“criatividade” e “pensa-
mento produtivo”). Exceto pela classe de 
comportamentos encobertos, alguns com-
portamentos de cada uma dessas classes 
foram simulados e estudados experimen-
talmente (e.g., Epstein, 1981; Epstein, Lanza, 
& Skinner, 1980; Epstein & Skinner, 1981). O 
trabalho de Lubinski e Thompson pode ser 
considerado um sucesso de uma simulação 
animal de comportamentos encobertos ou 
eventos privados ( “sentimentos”).
Hiroto Okouchi
168
Como o título do artigo de Lubinski 
e Thompson (1987) sugere, duas práticas 
que ilustram um modelo de como exami-
nar eventos privados também podem ser 
realizações significativas deste trabalho. 
Em primeiro lugar, eles mostraram que os 
processos de discriminação de drogas po-
dem ser utilizados em experimentos sobre 
eventos privados. Uma das dificuldades na 
experimentação sobre eventos privados é 
a manipulação dos mesmos. Apresenta-
ção e não apresentação de um “sentimen-
to”, por exemplo, não é fácil, ao passo que 
apresentações de uma luz colorida têm 
sido comumente implementadas em expe-
rimentos comportamentais. O uso de dro-
gas psicoativas seria um dos poucos méto-
dos para manipular sentimentos de forma 
relativamente confiável (mas ver Branch, 
1991, para uma discussão sobre as dificul-
dades em usar drogas como estímulos dis-
criminativos). Em segundo lugar, Lubinski 
e Thompson conduziram um experimen-
to sobre eventos privados no contexto das 
interações entre indivíduos. Esta prática é 
útil porque, de acordo com a definição fun-
cional de eventos privados (Skinner, 1953, 
p.257), se um evento é privado ou não, de-
pende se ele é acessível a outras pessoas ou 
não.
PARA SABER MAIS
DeGrandpre, Bickel, & Higgins (1992). Esse 
artigo relata um experimento em que even-
tos privados humanos foram manipulados 
por meio de drogas psicoativas. 
Kohlenberg, & Tsai (1991). Este livro des-
creve como eventos privados, como emo-
ções, memória, cognições e crenças são 
conceituados e manejados em uma psicote-
rapia analítico comportamental. 
Okouchi (2006). Este artigo mostra como 
eventos fora da pele do participante e não 
acessíveis a outros participantes, mas a um 
experimentador podem contribuir para a 
análise experimental dos eventos privados, 
e relata um experimento que investigou 
uma das interpretações de Skinner (1945) 
da maneira em que os humanos aprendem 
a relatar eventos privados.
Rachlin (2003). Esse capítulo de livro des-
creve como o behaviorismo teleológico 
compreende os eventos privados. O beha-
viorismo teleológico exclui eventos inter-
nos (eventos sob a pele do organismo) de 
uma análise do comportamento e busca por 
variáveis controladoras do comportamento 
de forma ampla no ambiente temporalmen-
te estendido do organismo. 
Skinner (1945). Esse é um clássico sobre 
eventos privados. Você PRECISA ler se 
você estuda eventos privados a partir de 
uma perspectiva comportamental.
Sonoda, & Okouchi (2012). Esse artigo rela-
ta experimentos que replicam os resultados 
de Okouchi (2006), utilizando um procedi-
mento modificado. No Experimento 2, os 
Capítulo X | Eventos Privados
169
aprendizes aprenderam a tatear “eventos 
privados” por reforçamento não com 100% 
mas com 83,3% de precisão, ilustrando um 
análogo de laboratório da vida diária, em 
que se entende que os humanos aprendem 
a tatear eventos privados sob um esquema 
de reforçamento com fraca acurácia (Skin-
ner,1945).
REFERÊNCIAS
Branch, M. N. (1991). Behavioral pharma-
cology. In I. H. Iversen & K. A. Lattal (Eds.), 
Experimental analysis of behavior (Part 2, 
pp.21-77). Amsterdam: Elsevier.
Catania, A. C. (1992). Learning (3rd ed.). 
Englewood Cliffs, NJ: Prentice-Hall.
DeGrandpre, R. J., Bickel, W. K., & Higgins, 
S. T. (1992). Emergent equivalence rela-
tions between interoceptive (drug) and ex-
teroceptive (visual) stimuli. Journal of the 
Experimental Analysis of Behavior, 58, 9-18.
Epstein, R. (1981). On pigeons and people: 
A preliminary look at the columban simula-
tion project. The Behavior Analyst, 4, 43-55.
Epstein, R. (1984). Simulation research in 
the analysis of behavior. Behaviorism, 12, 
41-59.
Epstein, R., Lanza, R. P., & Skinner, B. F. 
(1980). Symbolic communication between 
two pigeons (Columba livia domestica). Sci-
ence, 207, 543-545.
Epstein, R., & Skinner, B. F. (1981). The 
spontaneous use of memoranda by pigeons. 
Behavior Analysis Letters, 1, 241-246. 
Ferster, C. B., & Skinner, B. F. (1957). Sched-
ules of reinforcement. New York: Apple-
ton-Century-Crofts.
Honig, W. K. (Ed.). (1966). Operant behav-
ior: Areas of research and application. New 
York: Appleton-Century-Crofts.
Honig, W. K., & Staddon, J. E. R. (Eds.). 
(1977). Handbook of operant behavior. En-
glewood Cliffs, Prentice-Hall.
Iversen, I. H., & Lattal, K. L. (Eds.). (1991). 
Experimental analysis of behavior (Part 1). 
Amsterdam: Elsevier.
Kohlenberg, R. J., & Tsai, M. (1991). Func-
tional analytic psychotherapy: Creating 
intense and curative therapeutic relation-
ships. New York: Plenum Press. 
Leigland, S. (2014). Contingency horizon: 
On private events and the analysis of be-
havior. The Behavior Analyst, 37, 13-24. 
Lubinski, D., & Thompson, T. (1987). An 
animal model of the interpersonal commu-
nication of interoceptive (private) states. 
Journal of the Experimental Analysis of Be-
havior, 48, 1-15.
Hiroto Okouchi
170
Lubinski, D., & Thompson, T. (1993). Spe-
cies and individual differences in commu-
nication based on private states. Behavior-
al and Brain Sciences, 16, 627-680.
MacCorquodale, K. (1969). B. F. Skinner’s 
verbal behavior: A retrospective apprecia-
tion. Journal of the Experimental Analysis 
of Behavior, 12, 831-841.
Madden, G. J. (Ed.). (2013). APA handbook 
of behavior analysis (Vol.1). Washington, 
DC: American Psychological Association. 
Okouchi, H. (2006). An experimental anal-
ysis of another privacy. The Psychological 
Record, 56, 245-257. 
Rachlin, H. (2003). Privacy. In K. A. Lattal, 
& P. N. Chase (Eds.), Behavior theory and 
philosophy (pp.187-201). New York: Kluwer 
Academic/Plenum Publishers.
Savage-Rumbaugh, E. S. (1984). Verbal be-
havior at a procedural level in the chimpan-
zee. Journal of the Experimental Analysis of 
Behavior, 41, 223-250.
Schlinger, H. D. (2011). Introduction: Pri-
vate events in a natural science of behavior. 
The Behavior Analyst, 34, 181-184.
Sidman, M., & Tailby, W. (1982). Condition-
al discrimination vs. matching to sample: 
An expansion of the testing paradigm. Jour-
nal of the Experimental Analysis of Behav-
ior, 37, 5-22.
Skinner, B. F. (1945). The operational anal-
ysis of psychological terms. Psychological 
Review, 52, 270-277.
Skinner, B. F. (1953). Science and human 
behavior. New York: Macmillan.
Skinner, B. F. (1957). Verbal behavior. New 
York: Appleton-Century-Crofts.
Sonoda, A., & Okouchi, H. (2012). A revised 
procedure for analyzing private events. The 
Psychological Record, 62, 645-661.
The Oxford English Dictionary (2nd. ed.). 
(2004). Oxford: Clarendon Press.
Tourinho, E. Z. (2006). Private stimuli, co-
vert responses, and private events: Con-
ceptual remarks. The Behavior Analyst, 29, 
13-31.
Andréia Schmidt
171
 “Esse não é um pitilics, 
então só pode ser aquele”: o 
responder por exclusão e a 
aprendizagem de repertórios 
verbais
Andréia Schmidt 
Universidade de São Paulo
Dixon, L. S. (1977). The nature of control by spoken words over visual stimulus selection. Journal 
of the Experimental Analysis of Behavior, 27, 433-442.
“- Mamãe, por que é que eu me chamo Marcelo? 
(...) Por que é que não escolheram marmelo?
- Porque marmelo é nome de fruta, menino!
- E a fruta