iw4_experimentos_classicos_v1_2016

Artes

Eric César Martins

em 15/03/2021

Material

Prévia do material em texto

EXPERIMENTOS CLÁSSICOS
EM ANÁLISE DO COMPORTAMENTO
ORGANIZADORES
Paulo Guerra Soares
João Henrique de Almeida
Carlos Renato Xavier Cançado
www.walden4.com.br
2016
Instituto Walden4
E71
Experimentos clássicos em análise do comportamento [recurso eletrônico]
/ organizado por Paulo Guerra Soares, João Henrique de Almeida, Carlos
Renato Xavier Cançado. - Brasília : Instituto Walden4, 2016.
333 p.
ISBN: 978-85-65721-10-3
1. Psicologia experimental. 2. Análise do comportamento. I. Soares, Paulo
Guerra, org. II. de Almeida, João Henrique, org. III. Cançado, Carlos Renato
Xavier, org. IV. Título.
CDD 150.724
Coordenadora: Seila Cibele Sitta Preto
Projeto Gráfico: Leandro Brasil Melo
Diagramação: Lorena Shimizu
Capa: Lorena Shimizu
DEDICATÓRIA
Dedicamos esse livro à Profa. Sônia dos Santos Castanheira,
ao Prof. Roosevelt Riston Starling, e ao Prof. Ernani Henrique Fazzi,
responsáveis por nosso primeiro contato com a Análise Experimental
do Comportamento.
iii
AUTORES E AUTORAS
Alina Barboza Cabral Bianco
Estudante de Graduação
(Psicologia) – Universidade de
Rio Verde.
André Augusto Borges Varella
Doutor em Psicologia –
Universidade Federal de São
Carlos.
Andréia Schmidt
Doutora em Psicologia
Experimental – Universidade de
São Paulo.
Armando Domingos Batista
Machado
Doutor em Psicologia – Duke
University, Estados Unidos.
Candido Vinícius Bocaiuva
Barnsley Pessôa
Doutor em Psicologia
Experimental – Universidade de
São Paulo.
Carlos Augusto de Medeiros
Doutor em Psicologia –
Universidade de Brasília.
Carlos Eduardo Costa
Doutor em Psicologia
Experimental – Universidade de
São Paulo.
Carlos Renato Xavier Cançado
Doutor em Psicologia/Análise
do Comportamento – West
Virginia University, Estados
Unidos.
Carolina Coury Silveira
Mestre em Psicologia –
Universidade Federal de São
Carlos.
Cristiano Coelho
Doutor em Psicologia –
Universidade de Brasília.
Cristiano Valério dos Santos
Doutor em Psicologia
Experimental – Universidade de
São Paulo.
Edson Massayuki Huziwara
Doutor em Psicologia
Experimental – Universidade de
São Paulo.
iv
Elenice Seixas Hanna
Doutora em Psicologia –
University of Wales, Reino
Unido.
Fábio Henrique Baia
Doutor em Ciências do
Comportamento –Universidade
de Brasília.
Flávia Hauck
Mestre em Ciências do
Comportamento –Universidade
de Brasília.
Hernando Borges Neves Filho
Doutor em Psicologia
Experimental – Universidade de
São Paulo.
Hiroto Okouchi
Doutor em Ciências do
Comportamento – Hiroshima
University, Japão.
Isabella Guimarães Lemes
Estudante de Graduação
(Psicologia) – Universidade de
Rio Verde.
Ítalo Siqueira de Castro
Teixeira
Graduação em Psicologia –
Universidade de Fortaleza.
João Claudio Todorov
Doutor em Psicologia – Arizona
State University, Estados
Unidos.
João Henrique de Almeida
Doutor em Psicologia –
Universidade Federal de São
Carlos.
Kennon A. Lattal
Doutor em Psicologia
Experimental e Clínica –
University of Alabama, Estados
Unidos.
Lucas Ferraz Córdova
Doutor em Ciências do
Comportamento –Universidade
de Brasília.
Marcelo Borges Henriques
Mestre em Psicologia –
Pontifícia Universidade Católica
de Goiás.
v
Márcio Borges Moreira
Doutor em Ciências do
Comportamento –Universidade
de Brasília.
Marco Vasconcellos
Doutor em Psicologia – Purdue
University , Estados Unidos.
Maria Carolina Correa
Martone
Mestre em Psicologia
Experimental – Pontifícia
Universidade Católica de São
Paulo
Marília Pinheiro de Carvalho
Doutora em Psicologia Básica
– Universidade do Minho,
Portugal.
Paulo Guerra Soares
Mestre em Análise do
Comportamento – Universidade
Estadual de Londrina.
Peter Endemann
Doutor em Psicologia
Experimental – Universidade de
São Paulo.
Poliana Ferreira da Silva
Estudante de Graduação
(Psicologia) – Universidade de
Rio Verde.
Rafaela Meireles Fontes
Azevedo
Mestre em Ciências do
Comportamento – Universidade
de Brasília.
William Ferreira Perez
Doutor em Psicologia
Experimental – Universidade de
São Paulo.
vi
AGRADECIMENTOS
“É preciso de uma aldeia inteira para criar uma criança”1. É ver-
dade: muito trabalho, de muitas pessoas. Em relação à escrita de um ar-
tigo científico, Killeen e Pellón (2013) indicaram que também “É preciso
de uma aldeia inteira para criar um artigo”2 (p.19): muito trabalho, cer-
tamente de muitas pessoas. O mesmo pode ser dito sobre a organização
de um livro. Gostaríamos de agradecer a todas e a todos dessa “aldeia”,
cujo trabalho permitiu que esse livro fosse criado.
Agradecemos à cada autora e a cada autor dos capítulos que
compõem esse livro. Vocês abraçaram o projeto e contribuíram de uma
forma que o nosso breve agradecimento não consegue descrever e nun-
ca será suficiente. Para vocês, especialmente, o nosso “Muito obrigado”.
Agradecemos ao Prof. Alexandre Dittrich pela escolha da capa
desse livro e pela escrita do texto que a acompanha. Cientistas são “ar-
tistas do mundo natural” e a experimentação é um caminho central
de sua atividade. Agradecemos à Profa. Deisy das Graças de Souza por
escrever o prefácio e apresentar o livro de forma tão clara à audiência
para qual foi escrito. O conselho que ela dá para futuras e futuros ana-
listas do comportamento é válido para todas e todos interessados no
estudo científico do comportamento, mesmo para quem tem familiari-
dade e trabalha há anos com a experimentação.
Agradecemos à equipe do Projeto de extensão UneDesign - In-
tegração Universidade-Empresa do curso de Desenho Industrial com
habilitação em Programação Visual, da Universidade do Norte do Para-
ná, coordenada pela Profa. Seila Cibele Sitta Preto, pelo trabalho cuida-
1 It takes a village to raise a child.
2 “It takes a village to raise a paper”. Killeen, P. R., & Pellón, R. (2013). Adjuntive behaviors are operants. Learning &
Behavior, 41, 1-24.
vii
doso em cada etapa da preparação desse livro. Aos discentes Leandro
Brasil Melo pelo desenvolvimento do projeto gráfico, e Lorena Shimizu
pela diagramação e desenvolvimento projetual de capa. O trabalho foi
feito como parte de um projeto de extensão, e retrata a importância da
integração das atividades de ensino e pesquisa na relação entre a uni-
versidade e as comunidades nas quais está inserida.
Por fim, agradecemos ao Prof. Márcio Borges Moreira, que acre-
ditou no projeto e aceitou a tarefa de publicação de um livro gratuito e
em formato eletrônico pela Editora do Instituto Walden4.
É verdade: é preciso de uma aldeia para criar um livro!
Paulo Guerra Soares
João Henrique de Almeida3
Carlos Renato Xavier Cançado4
3 Apoio da FAPESP (Processo no: 2014/01874-7).
4 Apoio CAPES (PNPD).
viii
PREFÁCIO
... even though laboratory methods are often devised not for practical
teaching but for the study of fundamental behavioral processes, the
techniques are then available for application outside the laboratory.
Murray Sidman, 1994, P.534
Tomar conhecimento da edição deste livro me deixou particular-
mente entusiasmada. É sempre bom contar com material de qualidade
como suporte para o ensino e, neste caso, vislumbrei a possibilidade de
ter em mãos um material muito compatível com a maneira como gosto
de trabalhar nas disciplinas que ministro para o curso de graduação em
Psicologia.
Segundo me relataram os organizadores, sua proposta era trazer
ao leitor experimentos clássicos em análise do comportamento, rela-
tados e interpretados por pesquisadores da área, com ênfase em suas
contribuições para novas linhas de pesquisa. Gostei imediatamente da
proposta e me lembrei de outras ocasiões em que tive oportunidade
de explorar artigos de pesquisa como fontes para atividades de ensi-
no, buscando propiciar ao aluno condições para o desenvolvimento de
uma ampla gama de habilidades, incluindo a busca pelas origens de
ideias, conceitos, procedimentos. No período em que estive na UnB,
no início da década de 90, tive oportunidade de trabalharcom meu
colega Jorge Mendes de Oliveira Castro, na disciplina Psicologia Geral
e Experimental (PGE I), para alunos do primeiro semestre do curso de
graduação em Psicologia. Discutimos muito as condições de entrada
dos alunos no curso, incluindo as possíveis ideias preconcebidas sobre
nossa disciplina, e a necessidade de colocá-los logo em contato com o
que se estuda em Psicologia e, ao mesmo tempo, mantê-los motivados
para ler e estudar o assunto. Concordamos muito rapidamente que, em
ix
vez de ler livros texto, os alunos poderiam aprender muito lendo arti-
gos científicos, mais precisamente, relatos de pesquisa experimental,
o que lhes permitiria ter contato com autores importantes da área e
conhecer um pouco do desenvolvimento de nossa ciência. Tenho as
melhores lembranças das horas e horas que passamos escolhendo os
textos (claro que fizemos um levantamento 10 vezes maior do que seria
possível abordar em uma disciplina de um semestre) e do entusiasmo
com que trabalhamos naquela disciplina, em grande parte motivado
pelos progressos dos alunos, evidenciados nas discussões em sala, em
suas habilidades de ler e pensar, de utilizar o raciocínio científico, e de
se dar conta de que cada experimento pode trazer uma nova contri-
buição, mas também pode ter limitações, e que identificar os limites é
um caminho para novas ideias e novas possibilidades de investigação.
Sentíamos que estávamos criando boas condições para o desenvolvi-
mento de pelo menos alguns dos requisitos importantes no repertório
de futuros psicólogos e, talvez, pesquisadores em psicologia.
Retornando à UFSCar, tive oportunidade de fazer parte da equi-
pe que planejou o curso de graduação em Psicologia, implantado em
1994. Novamente me coube uma disciplina introdutória e quando co-
mentei sobre a experiência na disciplina da UNB, meu colega Júlio de
Rose me apresentou o livro de Roger Hock: “Quarenta estudos que
transformaram a Psicologia”. O livro organizava o material em 10 ca-
pítulos, cada capítulo apresentando quatro estudos clássicos. A organi-
zação apresenta uma característica que resolvia muitos dos problemas
que eu encontrara antes, ao exigir de alunos de primeiro semestre a
leitura de um estudo experimental em toda a complexidade de seu re-
lato original: neste livro, cada estudo é apresentado de maneira resu-
mida – isto é, retira detalhes e complexidade do texto, sem deixar de
apresentar ao leitor as informações essenciais para a compreensão do
x
que foi feito e da justificativa para fazê-lo; além disso, o autor do livro
apresenta o contexto em que cada investigação foi concebida e con-
duzida; e ao final do texto, apresenta, também, de maneira resumida,
mas suficientemente informativa, as linhas de pesquisa e os desenvol-
vimentos subsequentes que derivaram daquele estudo seminal (isto é,
oferece uma perspectiva histórica do desenvolvimento da psicologia,
por meio do trabalho concreto de pesquisadores relevantes). Usei o
livro por vários anos, enquanto ministrei a disciplina (fui depois subs-
tituída pelo Júlio, que continuou usando o “Hock”) e estou certa que
o uso desse material, em suas sucessivas reedições, tem contribuído
muito positivamente para iniciar o desenvolvimento das concepções
do aluno sobre o que estuda a Psicologia – e sobre como essa ciência
vem sendo, e poderá continuar sendo, construída.
Experiência similar teve ocasião quando Edson Huziwara, fa-
zendo pós-doutorado na UFSCar, se dispôs a oferecer uma turma da
disciplina optativa do curso, denominada Fenômenos e Processos Psi-
cológicos; fui formalmente responsável pela disciplina e estive presen-
te em todas as aulas, mas todo o trabalho foi planejado e conduzido
pelo Edson e pelo João Henrique de Almeida, um dos organizadores
deste livro. Aquela disciplina do curso de Psicologia da UFSCar per-
mite, a cada oferta, a especificação dos tópicos abordados e Edson e
João propuseram que naquele semestre a disciplina tivesse por obje-
tivo apresentar, de forma sucinta, a produção empírica (experimentos
clássicos) sobre diversos processos comportamentais investigados pela
análise experimental do comportamento e ensinar as habilidades ne-
cessárias para uma leitura competente de textos científicos. Os alunos
eram de uma turma avançada e liam os artigos no original, os professo-
res realizaram um excelente trabalho de preparar cuidadosamente cada
estudo para apresentar em sala, destacando seus aspectos fundamen-
xi
tais e apresentando pistas para que os alunos discutissem qualidades
e limites da pesquisa em foco. Sou testemunha de que esta atividade
funcionou como reforçador poderoso para a leitura prévia dos alunos,
e, ao mesmo tempo, como modelo de leitura cuidadosa e crítica.
Reconheço que ao relatar essas experiências estou falando de
meu trabalho, em vez de falar sobre o livro que apresento aos leitores.
Mas espero ter fornecido evidências do quanto aprecio o que encontrei
nele:
- O conteúdo é específico de análise do comportamento: trata-
-se, assim, de uma fonte organizada de informações que podem ser
usadas no ensino de disciplinas da área.
- A seleção de artigos relevantes, que deram origem a importan-
tes desenvolvimentos na área, pode contribuir decisivamente para que
o leitor compreenda a relevância da memória da investigação científi-
ca, a importância de se conhecer os clássicos e de se estabelecer rela-
ções entre o experimento original e a linha ou linhas de pesquisa gera-
das por ele e sua importância para o conhecimento atual em análise do
comportamento.
- A ênfase em estudos experimentais permite destacar aspectos
metodológicos, as possibilidades e a importância de investigação rigo-
rosa, os necessários limites (seja do ponto de vista do controle, seja do
ponto de vista da validade interna e externa), as contribuições poten-
ciais para a compreensão de processos comportamentais, as pergun-
tas que deixaram de ser respondidas, ou que foram suscitadas pelos
dados. Esse conjunto de aspectos representa uma rica oportunidade
para subsidiar a avaliação crítica da pesquisa científica em análise do
xii
comportamento, e, o que é de extrema relevância para a sobrevivên-
cia das práticas científicas (investigação e intervenção) em análise do
comportamento, despertar talentos e vocações para dar continuidade
ao desenvolvimento da área.
Por todos esses aspectos, avalio que este volume pode ser uma
fonte inestimável para formação ou o aprimoramento de analistas do
comportamento.
Há algum tempo, em uma entrevista para a Associação Brasileira
de Psicologia e Medicina Comportamental (ABPMC), a entrevistadora
me perguntou que conselhos eu daria para a nova geração de analistas
do comportamento. Embora desacredite no potencial de “conselhos”
(sem outras condições críticas) para gerar ou manter comportamentos,
arrisquei alguns palpites que talvez respondessem ao interesse de al-
guém. Penso que os palpites valem também para jovens analistas que
busquem aprender com este livro, por isso tomo a liberdade de trans-
crever alguns pontos daquela fala:
Não existe nada que você possa fazer bem feito, que não exija esfor-
ço, comprometimento, dedicação e um trabalho sistemático. Em nossa
área, seja no estudo, na investigação, ou nas aplicações a problemas
humanos, não dá para fazer um trabalho de qualquer jeito, não se
pode fazê-lo rapidamente, nem superficialmente. Por isso, para quem
quer se tornar um analista do comportamento competente, seja no
desenvolvimento científico da área, seja no desenvolvimento profis-
sional, o primeiro passo é dedicação. É preciso ler (ou melhor, estudar)
relatos originais de pesquisa; é preciso ler muito, voltar às origens, ler
os clássicos e, claro, ler bibliografia atualizada. Muitas vezes presencio
meus alunos lendo – ou escrevendo sobre o que leram, e eles tendem a
xiii
assumir que o autor que estão lendo no momento foi o primeiro a falar
daquele assunto, ou o que teve a ideia original de que trata a pesqui-sa. Muitas vezes, trata-se de conceitos elaborados há muito tempo,
que são encontrados em Skinner (1931, 1938, 1953), Keller e Schoenfeld
(1950), Ferster e Skinner (1957), Millenson (1967), Sidman (1960), mas
eles citam o artigo mais recente que leram, como se fosse a fonte ori-
ginal. É preciso estar atualizado, acompanhar o desenvolvimento da
área e para isto é preciso recorrer à literatura recente, mas também
é preciso manter o registro, a memória ou a história dos conceitos e
descobertas. Apesar de todas as exigências de referência de citação
científica, muitas vezes vemos uma deturpação em relação às origens.
Não é incomum encontrarmos, em 2016, um artigo citando um au-
tor que publicou em 2015, como se este fosse a referência original de
um determinado assunto. É muito importante estudar os trabalhos
dos pioneiros (e se interessar por quem foram eles, sob que condições
trabalharam, onde e quando viveram), ler e conhecer o que a área já
produziu, ao mesmo tempo em se lê referências atualizadas. É preciso
tentar dominar o conhecimento produzido na área, que não é pouco;
quanto mais se conhece – os conteúdos e os caminhos que levaram
a eles, mais o analista do comportamento disporá de instrumental
teórico, conceitual e de procedimentos, para analisar e interpretar
situações novas e para pensar, gerar novos estudos, ou planejar in-
tervenções com embasamento cientifico. As facilidades de acesso são
cada vez maiores, mas não podemos nos iludir com essa facilidade.
É muito fácil acessar dezenas de artigos pela internet e poder abrir
cada um deles com um simples toque. Mas não basta: faltam os passos
seguintes: como é que se lê essa quantidade de material, de maneira
funcional? Será preciso trabalhar muito, de forma disciplinada. Para
quem quiser ter uma boa formação como analista do comportamento,
existe muito conhecimento sedimentado para se aprender a trabalhar
xiv
e existem boas oportunidades de novos desenvolvimentos, mas para
isso é preciso estudar, se dedicar, se comprometer.
Este livro pode ser um bom começo. Neste primeiro volume da
série foram selecionados estudos experimentais sobre condicionamen-
to respondente; sobre o papel das consequências e parâmetros de re-
forço (atraso do reforço; contraste comportamental; comportamento de
escolha, história comportamental, ressurgência); sobre controle de es-
tímulos (processos atencionais, respostas de observação, responder por
exclusão, eventos privados, resolução de problemas, Teoria das Mol-
duras Relacionais); sobre comportamento social (cooperação, cultura) e
comportamento verbal (correspondência verbal e não verbal; compor-
tamento governado por regras); e sobre análise funcional. Todos eles
deram origem a linhas de pesquisa produtivas, responsáveis por gran-
de parte do estado atual da pesquisa em análise do comportamento.
Os autores dos capítulos são investigadores nacionais e internacionais,
que conhecem profundamente os estudos e seus autores e estão com-
prometidos com a difusão e o ensino de análise do comportamento.
Por todos esses aspectos, estou certa de que o livro atende a uma
necessidade importante em nossa área, e que se tornará um oportuno
ponto de partida para iniciantes e uma excelente ocasião para revisão e
atualização para os iniciados em análise do comportamento.
Deisy G. de Souza
Universidade Federal de São Carlos
xv
A ciência e a arte são as mais belas criações do comportamento
humano. Elas demonstram, cada uma à sua maneira, nossa fascinante
capacidade de transformar o mundo e de nos transformarmos ao fazê-
lo.
O gentil convite feito por Carlos, João e Paulo para que eu esco-
lhesse a imagem da capa do livro que você agora lê me confrontou com
um desafio singular: ilustrar, com o auxílio da arte, o conteúdo de um
livro científico.
Minha tarefa certamente foi facilitada pelo fato de que a arte não
nos compromete com interpretações “certas”. A arte é o campo da su-
gestão, da metáfora, do símbolo. Assim, me lancei à tarefa sob um vago
controle temático, mas também me deixando levar pela beleza e pelo
poder evocativo das imagens.
A Osteographia, publicada pelo anatomista inglês William Che-
selden em 1733, é uma das obras mais importantes da história da ilus-
tração anatômica. Ela impressiona não apenas pela precisão, mas pela
elegância. As criaturas humanas e não-humanas que ali aparecem não
são meros auxílios da ciência, passivamente à disposição dos estudio-
sos: em tudo o que importa, elas parecem vivas, ativas, interagindo
com seu entorno.
O fato de serem apenas esqueletos dá às imagens seu impacto.
Seres vivos reduzidos à sua dura estrutura têm fascinado a humanida-
de ao longo dos séculos. Caveiras e esqueletos nos lembram de nosso
destino comum. A representação da morte como um esqueleto vivo é
comum a várias culturas.
SOBRE A CAPA
xvi
O que nos mostra que estão mortos é o fato de serem apenas
esqueletos. O que nos mostra que estão vivos é o fato de interagirem
com o mundo. Os esqueletos que nos assombram e nos encantam na
tradição são a encarnação desencarnada da contradição: são mortos
que vivem. Se neles pouco resta do que esperaríamos encontrar em
um corpo vivo, o comportamento é seu único sinal de vida - e, como
lembrava Skinner, a história do comportamento e a história da vida
começam juntas.
O esqueleto que está na capa deste livro nos lembra ainda que
a vida é evolução - e que nós, seres vivos, estamos todos ligados por
laços de parentesco. Trata-se de uma figura simiesca, que não obstante
adota uma postura aparentemente “intencional” e verbal, tipicamente
humana. É como se interagisse com outros de sua espécie, cuja pre-
sença a imagem permite apenas subentender. Filogênese, ontogênese e
cultura estão todas na imagem - desde que nossa história nos permita
encontrá-las.
Assim como a Osteographia de Cheselden, que utilizou magis-
tralmente a arte para fazer ciência, espero que também este livro pos-
sa mostrar, da capa à última página, quão fascinante é a jornada de
conhecimento e autoconhecimento proporcionada pela investigação
científica.

Alexandre Dittrich
Universidade Federal do Paraná
xvii
Este livro foi idealizado a partir de uma paixão comum dos três
organizadores: a Análise Experimental do Comportamento. A ideia ge-
ral consiste em apresentar, a estudantes de graduação, diversos temas
de pesquisa em Análise do Comportamento por meio de experimentos
clássicos. A análise experimental geralmente é considerada um terreno
árido, com descrições metodológicas difíceis e um certo “desprendi-
mento” das questões do dia a dia. Estes fatores, em nossa opinião, difi-
cultam o contato e até mesmo o interesse de estudantes iniciantes pelo
laboratório e pela pesquisa experimental sobre o comportamento.
Buscando inspiração em livros de divulgação científica, como
“Forty studies that changed Psychology” de Roger Hock, formatamos a
ideia inicial do livro. Estas ideias nos levaram a uma série de convites
a pesquisadores e pesquisadoras de diversas instituições brasileiras e
internacionais para contribuírem com a obra. Convites aceitos, o livro
começou a ganhar forma. Mais ideias foram surgindo, e foram tantos
os temas escolhidos que acabamos tendo que dividir a obra em dois
volumes. Depois de incontáveis reuniões que aproximaram Londrina,
São Carlos e Brasília, conseguimos concretizar nosso objetivo.
Em cada capítulo, autores e autoras discutem temas relevantes
na Análise do Comportamento a partir da descrição de um experimento
“clássico”. Clássico, aqui, não significa necessariamente o estudo mais
antigo, mas aquele que é reconhecidamente uma influência importante
naquela área de pesquisa, ou seja, que tenha servido de contexto para
a produção de mais conhecimento científico. Assim, em cada capítulo,
o experimento clássico serve como um pano de fundo para a apresen-
tação do tema, e os textos foram escritos com uma linguagem leve e
acessível, buscando,sempre que possível, uma ponte entre os procedi-
mentos metodológicos e o contexto aplicado.
APRESENTAÇÃO
xviii
Esperamos que esta obra inspire estudantes (e futuros pesquisa-
dores e pesquisadoras!) a se enveredarem pelos caminhos fascinantes
da pesquisa experimental sobre o comportamento dos organismos. E
que essa jornada seja para estes estudantes um pouco do que foi (e con-
tinua sendo) para nós: um caminho de muito trabalho e de muitos erros
e acertos, mas, acima de tudo, um caminho muito gratificante e enri-
quecedor. Esperamos, também, que este material sirva como um apoio
aos professores e professoras das disciplinas de Análise Experimental
do Comportamento, como contexto para discussões sobre os temas de
pesquisa que compõe os currículos destas disciplinas.
Boa leitura!
Paulo Guerra Soares
João Henrique de Almeida
Carlos Renato Xavier Cançado
xix
SUMÁRIO
Capítulo I.............................................................................................24
Somos todos produtos da nossa história comportamental
Paulo Guerra Soares, Carlos Eduardo Costa
Capítulo II...........................................................................................36
O cheque está no correio: investigando como o reforço atrasado afeta
o desempenho
Kennon A. Lattal
Capítulo III.........................................................................................49
Quando o passado retorna: ressurgência comportamental
Carlos Renato Xavier Cançado, Flávia Hauck, Ítalo S. C. Teixeira
Capítulo IV..........................................................................................64
Clarice Lispector, tempo e consequências: considerações sobre con-
traste comportamental
João Cláudio Todorov, Rafaela M. Fontes Azevedo
Capítulo V...........................................................................................78
Da frequência absoluta à frequência relativa como unidade de análise
do comportamento
Cristiano Coelho
Capítulo VI.........................................................................................95
Prestaram atenção em tudo?
Elenice S. Hanna, Márcio Borges Moreira
xx
Capítulo VII.....................................................................................109
A resposta de observação: o papel das respostas sensoriais para o es-
tabelecimento da discriminação
Peter Endemann, Candido V. B. B. Pessôa
Capítulo VIII.....................................................................................123
Controle dos processos atencionais
Edson Massayuki Huziwara, Candido V. B. B. Pessôa
Capítulo IX.......................................................................................139
O responder controlado temporalmente: desdobramentos da pesquisa
com a tarefa de bissecção
Marilia Pinheiro de Carvalho, Marco Vasconcelos, Armando Machado
Capítulo X.........................................................................................158
Como você se sente?
Hiroto Okouchi
Capítulo XI........................................................................................171
“Esse não é um pitilics, então só pode ser aquele”: o responder por
exclusão e a aprendizagem de repertórios verbais
Adreia Schimidt
Capítulo XII......................................................................................186
Paus e pedras podem machucar, mas palavras... também! - Teoria das
molduras relacionais
João Henrique de Almeida e William Ferreira Perez
xxi
Capítulo XIII....................................................................................205
Quando o mundo interage com o que é dito sobre o mundo: o compor-
tamento governado por regras
Carlos Eduardo Costa, Carlos Renato Xavier Cançado
Capítulo XIV.....................................................................................222
A função do mentir em crianças: o controle operante na correspon-
dência verbal
Carlos Augusto de Medeiros, Lucas Ferraz Córdova
Capítulo XV......................................................................................239
Do indivíduo ao grupo: simulações experimentais de relações sociais
com animais não-humanos
Marcelo Borges Henriques
Capítulo XVI..................................................................................254
Metacontingências: investigação experimental da seleção cultural
Fábio Henrique Baia, Alina Barboza Cabral Bianco, Isabella Guimarães
Lemes, Poliana Ferreira da Silva
Capítulo XVII..................................................................................272
“Para com isso menino!”: análise funcional em problemas de compor-
tamento
André A. B. Varella, Maria Carolina Correa Martone, Carolina Coury
Silveira
Capítulo XVII..................................................................................284
Recombinação de repertórios: criatividade e a integração de aprendi-
zagens isoladas
Hernando Borges Neves Filho
xxii
Capítulo XIX....................................................................................297
Controlar para conhecer
Cristiano Valério dos Santos
Capítulo XX......................................................................................310
The check is in the mail: examining how delayed reinforcement af-
fects performance
Kennon A. Lattal
Capítulo XXI....................................................................................322
How do you feel?
Hiroto Okouchi
xxiii
Paulo Guerra Soares, Carlos Eduardo Costa
24
Somos todos produtos
da nossa história
comportamental
Paulo Guerra Soares
Universidade Norte do Paraná; Núcleo Evoluir
Carlos Eduardo Costa
Universidade Estadual de Londrina
Weiner, H. (1964). Conditioning history and human fixed-interval performance. Journal of the
Experimental Analysis of Behavior, 7(5), 383-385.
“O hoje é apenas um furo no futuro, por onde o passado começa a jorrar”
Raul Seixas e Marcelo Nova
Capítulo I | História Comportamental
25
INTRODUÇÃO À ÁREA DE PES-
QUISA E CONTEXTUALIZAÇÃO
DO EXPERIMENTO
Uma das principais afirmações da te-
oria da evolução por seleção natural é que
as gerações atuais de indivíduos de uma
determinada espécie são produto de um
constante processo de variação e seleção.
Assim, ao longo da história de evolução
de uma espécie, indivíduos com caracte-
rísticas menos adaptativas morreram, en-
quanto aqueles mais bem adaptados sobre-
viveram, passando seus genes às próximas
gerações. É importante lembrar que mais ou
menos adaptativa significa que, sob certos
aspectos do ambiente, certas características
favorecem mais certos indivíduos de uma
espécie do que outras. Não há característi-
cas intrinsecamente melhores do que ou-
tras. Aquelas cuja consequência seja maior
chance de sobrevivência e procriação irão
aumentar de frequência na espécie. Portan-
to, para explicar por que os indivíduos de
uma espécie exibem alguma forma de com-
portamento típico (como espirros, bocejos,
náuseas ou salivação, no caso do ser huma-
no), é imprescindível uma análise da histó-
ria de seleção dessa espécie.
Este modelo de variação e seleção
dos aspectos biológicos, proposto por Char-
les Darwin no seu livro Origem das Espécies
(1859), é reconhecidamente uma das inspi-
rações de B. F. Skinner na formulação do
Behaviorismo Radical (Baum, 2006; Lau-
renti, 2009; Skinner, 1974; 1981). Para Skin-
ner, o Behaviorismo Radical enfatiza o es-
tudo do comportamento de cada indivíduo
(e não apenas os padrões típicos de cada
espécie). Assim, fazendo jus à analogia com
a teoria da evolução de Darwin, o compor-
tamento atual dos indivíduos é produto de
um conjunto de relações entre o compor-
tamento do indivíduo (selecionado na his-
tória individual) e o ambiente atual. Nesse
sentido, Skinner afirma que “Coube a Da-
rwin descobrir a ação seletiva do ambien-
te, assim como cabe a nós [behavioristas]
completar o desenvolvimento da ciência do
comportamento com uma análise da ação
seletiva do meio”. (Skinner, 1974, p.60-61).
Como funciona essa relação entre a
ação do indivíduo e as variáveisambien-
tais? Skinner propõe que em determinadas
circunstâncias, nos comportamos no mun-
do de diversas maneiras (variação) e uma
ou algumas dessas maneiras de nos com-
portar produzem alterações no ambiente.
Estas alterações podem produzir mudanças
na probabilidade futura do comportamento
(seleção). Se as consequências do compor-
tamento forem reforçadoras, produzirão
um aumento na probabilidade desse com-
portamento ocorrer sob circunstâncias se-
melhantes no futuro. Se as consequências
forem punidoras, produzirão uma diminui-
ção na probabilidade da ocorrência do com-
portamento. Neste último caso, o indivíduo
pode se comportar em função da situação
que indica que uma consequência nociva é
provável e, assim, aprende também a evitar
estas situações. Assim, cada indivíduo, ao
Paulo Guerra Soares, Carlos Eduardo Costa
26
entrar em contato com experiências únicas
ao longo da vida, vai aprendendo determi-
nadas maneiras de agir a partir das conse-
quências que esse comportamento produz.
A noção de seleção do comporta-
mento por consequências sugere que, para
que possamos explicar os comportamentos
dos indivíduos, é imprescindível uma aná-
lise da história comportamental de cada
um (Aló, 2005; Chiesa, 1994; Costa, Cirino,
Cançado & Soares, 2009; Freeman & Lattal,
1992; Skinner, 1974; Soares, Costa, Cança-
do & Cirino, 2013). Skinner já apontava que
“uma análise do comportamento é (...) ne-
cessariamente ‘histórica’” (1974, p. 236), pois
os comportamentos atuais são produto de
uma história de seleção que ocorre ao longo
da vida de cada indivíduo.
Neste sentido, é relativamente se-
guro afirmar que pessoas que passaram
por experiências diferentes ao longo da
vida, quando expostas a situações pareci-
das no presente, se comportam de manei-
ras distintas. Contudo, o que se observa é
que a grande maioria das explicações do
senso comum negligencia a história com-
portamental na determinação do compor-
tamento atual (Aló, 2005; Chiesa, 1994).
Valendo-se de uma terminologia dualista/
mentalista, o senso comum explica o com-
portamento dos indivíduos recorrendo a
conceitos como “personalidade” ou “cará-
ter”. A pesquisa de Simonassi, Pires, Ber-
gholz e Santos (1984), por exemplo, identi-
ficou que observadores que desconheciam
a história comportamental de crianças ten-
diam a explicar seu comportamento atual
a partir de um viés mentalista. Por outro
lado, quando os observadores conheciam
a história comportamental das crianças,
tenderam a leva-la em consideração na ex-
plicação do comportamento atual em detri-
mento das causas mentais. Assim, Skinner
(1953/2003) afirmou que o “hábito de bus-
car dentro do organismo uma explicação
do comportamento tende a obscurecer as
variáveis que estão ao alcance de uma aná-
lise científica. Estas variáveis estão fora do
organismo, em seu ambiente imediato e em
sua história ambiental” (p. 33).
A afirmação de Skinner (1953/2003)
levanta a seguinte questão: Como podemos
analisar cientificamente os efeitos da histó-
ria ambiental sobre o comportamento atu-
al? Sidman (1960) afirmou que, em um con-
texto experimental, a “melhor maneira de
um experimentador especificar a história
comportamental de um organismo, na me-
dida em que é importante para um deter-
minado problema, é construir deliberada-
mente essa história no organismo” (p. 290,
itálico adicionado). Ou seja, o experimenta-
dor interessado no estudo da história com-
portamental deveria ser capaz de construir
diferentes histórias para seus participantes
no laboratório (Wanchisen, 1990).
Porém, até meados da década de
1960 não havia, na literatura analítico-com-
portamental, um conjunto de dados siste-
máticos que permitisse a análise do efeito
Capítulo I | História Comportamental
27
de diferentes contingências passadas sobre
o comportamento atual. Nesse contexto,
mais precisamente em 1964, foi publicado
um dos primeiros estudos cujo objetivo era
a análise do efeito de diferentes histórias
comportamentais (construídas no laborató-
rio, como sugerido por Sidman, 1960) sobre
o comportamento atual.
DESCRIÇÃO DO EXPERIMENTO
Objetivo e Método
A pesquisa de Weiner (1964) era sim-
ples, porém engenhosa. O objetivo do estudo
foi avaliar o efeito da exposição a diferentes
contingências históricas sobre o compor-
tamento atual. Como estratégia metodoló-
gica, foram arranjados esquemas de refor-
ço, programações de contingência muito
utilizadas em pesquisas experimentais em
Análise do Comportamento, que permitem
a seleção de padrões estáveis de comporta-
mento (Ferster & Skinner, 1957; Lattal, 1991;
Souza Júnior & Cirino, 2004). Os participan-
tes da pesquisa foram seis enfermeiros de
um hospital psiquiátrico. Eles se sentavam
em frente a um monitor e a tarefa experi-
mental consistia em pressionar um botão.
As consequências para esse comporta-
mento eram pontos que apareciam em um
contador de pontos no monitor. Em cada
sessão, os participantes também recebiam
uma quantia fixa de dinheiro, que não era
contingente ao seu desempenho. Os parti-
cipantes foram distribuídos em dois grupos:
durante a primeira fase da pesquisa (cons-
trução da história), os participantes do Gru-
po 1 (n=3) foram expostos a um esquema de
razão fixa (FR) 40 e os do Grupo 2 (n=3) a
um esquema de reforçamento diferencial
de baixas taxas (DRL) 20 segundos, por 10
sessões de 60 min. Para os participantes
expostos ao FR, 100 pontos eram credita-
dos no contador a cada 40 pressões ao bo-
tão. Para os participantes expostos ao DRL,
cada resposta emitida após a passagem de
20 segundos da última resposta produzia
100 pontos no contador. Respostas emiti-
das antes do fim do intervalo reiniciavam o
intervalo do DRL.
Esquemas de FR, em geral, selecio-
nam altas taxas de respostas, pois há uma
relação direta entre taxa de respostas e taxa
de reforços sob esse esquema. Por outro
lado, o esquema DRL geralmente selecio-
na baixas taxas de respostas, pois respos-
tas emitidas antes de terminado o intervalo
programado produzem o reinício do inter-
valo. E este era exatamente o objetivo de
Weiner nesta primeira fase do experimen-
to: estabelecer duas linhas de base - ou duas
histórias comportamentais diferentes - nas
quais padrões de comportamento distintos
(altas e baixas taxas de respostas) fossem
selecionados.
Após construir histórias compor-
tamentais diferentes para cada grupo, era
hora de testar o efeito da exposição a estas
diferentes contingências sobre o comporta-
mento atual, quando as contingências mu-
dassem. Na segunda fase do experimento
Paulo Guerra Soares, Carlos Eduardo Costa
28
(teste), os participantes de ambos os grupos
foram expostos à um mesmo esquema de
reforçamento de intervalo fixo (FI) 10 se-
gundos por 10 sessões de 60 min e, depois,
10 sessões de 30 min. Sob o esquema de FI
10 s, a primeira resposta que ocorresse após
o intervalo de 10 segundos produzia 100
pontos no contador. Respostas que ocorres-
sem ao longo desse intervalo não tinham
consequências programadas (diferente do
que ocorria na fase anterior sob o esquema
de DRL). Assim, no esquema de FI, não im-
porta se o indivíduo responde em altas ou
baixas taxas, pois ambos os padrões con-
tinuam a produzir pontos, desde que uma
resposta ocorra após transcorrido o inter-
valo do FI. Portanto, expor os participantes
a este esquema de reforço na fase de teste
permitiu observar se a exposição prévia ao
FR ou ao DRL teria alguma influência no
modo como eles se comportariam quando
as contingências mudassem (ou seja, quan-
do o FI estivesse em vigor).
Resultados e discussão
E foi exatamente o que aconteceu! A
Figura 1 exibe os registros cumulativos dos
participantes do Grupo 1 (S1, S2 e S3) e do
Grupo 2 (S4, S5 e S6), durante os 15 últimos
minutos da fase de teste (FI). A análise da
Figura 1 permite constatar que, mesmo após
Figura 1. Registros cumulativos dos 15 últimos minutos da fase de teste (após 15 horas de exposição ao FI) dos participantes da pesquisade Weiner
(1964). O painel superior exibe os registros dos participantes do Grupo 1 (história de FR) e o painel inferior exibe os registros dos participantes do Grupo
2 (história de DRL) (reproduzido com a permissão de John Wiley and Sons).
Capítulo I | História Comportamental
29
15 horas de exposição ao FI, os participan-
tes que tinham sido expostos ao FR emi-
tiam taxas de respostas mais altas quando
comparadas às taxas de respostas dos parti-
cipantes que tinham sido expostos ao DRL.
A pesquisa de Weiner (1964) é inte-
ressante por demonstrar que, mesmo em
um delineamento simples, no qual a res-
posta selecionada era pressionar um botão,
o comportamento dos participantes no es-
quema de FI sofreu influências da histó-
ria comportamental que foi construída no
laboratório. Sobre estes resultados, Weiner
afirmou que o “ponto importante é que a
história de condicionamento deve ser con-
siderada como um possível determinante
do responder de humanos em FI” (p. 385).
Mas é possível ir mais além, e supor
que a história comportamental não seja ape-
nas determinante do responder em FI, mas
de qualquer comportamento, dentro e fora
do laboratório. Se este for o caso, os resulta-
dos da pesquisa de Weiner (1964) permitem
inferir (baseado em dados empíricos) que as
experiências vivenciadas pelas pessoas ao
longo de sua vida podem, sim, influenciar o
comportamento presente.
Os resultados apresentados por Wei-
ner (1964) nos permitem ainda outras con-
siderações. A Figura 2 abaixo foi construída
a partir da Tabela 1 do artigo. O eixo y apre-
senta a taxa de respostas (R/min) em escala
logarítmica e o eixo x exibe a média da taxa
de respostas das três últimas sessões de his-
tória (FR para S1, S2 e S3; DRL para S4, S5 e
S6) e a taxa de respostas nas cinco últimas
sessões do experimento.
Observa-se na Figura 2 que a taxa de
respostas nas cinco últimas sessões de FI
dos participantes com história de FR foram
sempre superiores às taxas de respostas dos
participantes com história de DRL. Todavia,
há que se considerar que houve diminuição
na taxa de respostas dos participantes ex-
postos a história de FR e aumento na taxa
de respostas dos participantes com história
de DRL, quando expostos ao FI.
Durante as três últimas sessões de
Figura 2. Taxa de respostas (R/min) em escala logarítmica na fase de
construção da história experimental (Hist - FR para S1, S2 e S3; DRL
para S4, S5 e S6) e nas cinco últimas sessões do experimento. Ver mais
detalhes no texto. (Figura construída especialmente para este capítulo
com dados apresentados em Weiner, 1964, p. 384, Tabela 1).
exposição ao FR, os participantes S1 e S3
emitiram, em média, 412 e 240 respostas
por minuto. Na última sessão de FI, eles
emitiam 64 e 55 respostas por minuto, res-
pectivamente. Ou seja, depois de 15 horas
de exposição ao FI, houve uma redução na
taxa de respostas de aproximadamente 85%
para S1 e de 77% para S2, em relação à li-
Paulo Guerra Soares, Carlos Eduardo Costa
30
nha de base. Uma análise parecida também
pode ser realizada para os participantes S5
e S6, que foram expostos à história de DRL.
Durante as três últimas sessões do DRL, S5
e S6 emitiam, em média, três respostas por
minuto. A taxa de respostas na última ses-
são do FI foi de seis e nove respostas por
minuto, respectivamente. Pode parecer
pouca coisa, mas trata-se de um aumen-
to na taxa de respostas de 100% para S5 e
200% para S6!
DESDOBRAMENTOS
Os resultados da pesquisa de Weiner
(1964) sugerem evidências de que: (a) é es-
sencial a análise da história de exposição a
contingências passadas para a compreen-
são do comportamento atual, assim como
proposto por Skinner (1981), em analogia à
seleção natural; (b) que os efeitos da história
comportamental podem ser estudados em
laboratório, desde que haja controle sobre
a construção da história comportamental
dos indivíduos (Sidman, 1960; Wanchisen,
1990).
Especular sobre as influências da
história de vida sobre o comportamento
presente pode parecer óbvio. Todavia, como
apontado anteriormente, o senso comum
frequentemente negligencia a história com-
portamental quando se propõe a explicar o
porquê as pessoas se comportam da manei-
ra como o fazem. Por exemplo, como um
leigo, que não conhece a história compor-
tamental dos indivíduos, explicaria o de-
sempenho dos participantes da pesquisa de
Weiner (1964) durante a fase de teste? Assim
como no estudo de Simonassi et al. (1984),
provavelmente o leigo utilizaria conceitos
mentalistas, como “ansiosas”, “hiperativas”
(para os participantes com história de expo-
sição ao FR) ou “preguiçosas”, “depressivas”
(para aqueles com história de exposição ao
DRL), ignorando completamente a história
comportamental dos participantes!
A partir da pesquisa de Weiner (1964),
diversos estudos foram conduzidos para
analisar os efeitos da história de exposição a
diferentes contingências históricas sobre o
comportamento atual, manipulando variá-
veis como controle de estímulos, reforçador
empregado e custo da resposta, utilizando
não-humanos (e.g. Cole, 2001; Doughty, Ci-
rino, Mayfield, da Silva, Okouchi, & Lattal,
2005; Freeman & Lattal, 1992; LeFrancois &
Metzger, 1993) e humanos (e.g. Costa, Ba-
naco, Longarezi, Martins, Maciel, & Sudo,
2008; Costa, Soares & Ramos, 2012; Okou-
chi, 2003a; 2003b; Soares, Costa, Cançado
& Cirino, 2013).
As pesquisas em laboratório sobre
história comportamental tiveram desdo-
bramentos interessantes, também, para a
aplicação da Análise do Comportamento
(como na clínica comportamental). Neste
contexto, Marçal (2013) ressalta que
Capítulo I | História Comportamental
31
“Por mais que um padrão compor-
tamental esteja trazendo problemas
a alguém, por mais que este alguém
esteja insatisfeito com sua forma de
agir, tal comportamento foi reforçado
no passado em um ou mais contextos”
(p. 41).
Conhecer a história é conhecer o
comportamento. Para que se possa compre-
ender o comportamento atual do paciente, é
imprescindível que se conheçam elementos
de sua história de vida, e que estes elemen-
tos possam ser relacionados às contingên-
cias atuais. Portanto, para a condução de
uma análise funcional do comportamento
adequada, é necessária a análise sistemáti-
ca da história do paciente.
Todavia, é importante esclarecer
alguns pontos. Em primeiro lugar, quan-
do conversamos com um cliente não te-
mos acesso a sua história. Temos acesso ao
comportamento verbal que pode estar sob o
controle da história, pode estar sob o con-
trole da audiência (o terapeuta) ou ambos.
Os estudos sobre história comportamental
não nos dão uma ferramenta para a atuação
aplicada da Análise do Comportamento. As
pesquisas empíricas sobre história compor-
tamental nos permitem fazer especulações
mais bem fundamentadas (i.e., baseadas em
dados empíricos), mas que não passam de
especulações, até que a intervenção seja
feita e, eventualmente, o comportamento
mude na direção “esperada” (pelas especu-
lações). Isso não é pouco! Levantar hipóte-
ses e especular com base em dados empí-
ricos é mais do que muitas abordagens em
Psicologia têm oferecido.
CONSIDERAÇÕES FINAIS
A pesquisa de Weiner (1964) foi uma
das primeiras tentativas de análise sistemá-
tica do efeito de histórias comportamentais
no laboratório. Seus resultados ressaltam a
importância do papel da história comporta-
mental na determinação do comportamen-
to atual. Ao constatar este fato, o analista do
comportamento deve tomar cuidado com
dois pontos. Primeiramente, a história com-
portamental – especialmente quando ela
não é conhecida – não deve ser transforma-
da em uma explicação genérica do compor-
tamento ou, como ressalta Cirino (2001), em
uma “lata de lixo” da Análise do Comporta-
mento. Todo comportamento é explicado a
partir das contingências às quais o indiví-
duo foi exposto, mas para lançar mão desta
explicação histórica o analista do compor-
tamento deve conhecer a história e quais
elementosdesta história possuem relação
com seu comportamento atual.
Em segundo lugar, é importante não
atribuir à história comportamental um efei-
to definitivo e imutável sobre o compor-
tamento atual (cf. Costa, Cirino, Cançado
& Soares, 2009). Ainda que a explicação
Behaviorista Radical seja essencialmente
histórica, não podemos negligenciar o papel
das contingências presentes. Uma análise
Paulo Guerra Soares, Carlos Eduardo Costa
32
cautelosa dos resultados de Weiner (1964)
ajuda a sustentar esta conclusão. Dois dos
três participantes expostos à história de FR
emitiram, na última sessão de FI, uma taxa
de respostas mais baixa em relação à linha
de base (Ver Figura 2, neste capítulo). Por
isso, procuramos sempre lembrar: somos
produtos da nossa história, mas não escra-
vos dela!
Essas análises demonstram que, de-
finitivamente, não se pode negligenciar a
contingência presente. A contingência de
FI 10 s, programada por Weiner (1964) du-
rante a fase teste, estabelece um desem-
penho “ideal” de seis respostas por minuto
(pois uma resposta a cada 10 segundos pro-
duz reforço). Uma taxa média de respostas
como as de S1 e S2 garantiam que muitos
pontos fossem produzidos durante o FR,
mas a grande maioria dessas respostas não
produzia consequências programadas du-
rante o FI, o que estabelece uma diminui-
ção na taxa de respostas como algo desejá-
vel. Durante o DRL, uma taxa média de três
respostas por minuto (S4 e S5) garantia que
os reforços continuassem a ser produzidos
e que poucas perdas ocorressem. Contu-
do, respostas emitidas durante o intervalo
do FI não reiniciavam o intervalo como no
DRL, o que estabelece um aumento na taxa
de respostas como algo desejável. Os resul-
tados de pesquisas posteriores sobre histó-
ria comportamental (e.g., Freeman & Lattal,
1992; Soares et al., 2013) indicaram que o
comportamento é produto da história, mas,
gradualmente, fica sob controle das contin-
gências presentes.
Espera-se que o leitor possa ter com-
preendido a importância da consideração
dos eventos históricos sobre o comporta-
mento atual e como o fenômeno pode ser
estudado em laboratório. Dessa forma, des-
taca-se um modelo causal (Skinner, 1981)
que é uma alternativa a qualquer tipo de
explicação mentalista/dualista. Quando
queremos entender – e modificar – o com-
portamento de um indivíduo, o primeiro
passo, sem dúvida, é conhecer a sua histó-
ria comportamental!
PARA SABER MAIS
Weiner (1969). Conjunto de cinco experi-
mentos com humanos nos quais Weiner
explora diferentes estratégias na constru-
ção da história comportamental. Os deli-
neamentos apresentados são em grupos ou
com a exposição do mesmo participante a
diferentes esquemas de reforço em fases
sucessivas. Em linhas gerais, o artigo inves-
tiga os determinantes do comportamento
humano em um esquema de FI. O desem-
penho de humanos neste esquema de re-
forço foi a base de muita controvérsia sobre
a diferença de humanos e não humanos se
comportamento em esquemas de reforço. A
ênfase de Weiner, é claro, é na importância
da história comportamental.
Freeman & Lattal (1992). Avaliação dos
efeitos da história sobre o comportamento
Capítulo I | História Comportamental
33
atual de pombos usando um delineamento
no qual o sujeito é seu próprio controle (co-
nhecido como Delineamento Experimental
de Caso Único ou delineamento intrasujei-
to). Nessa pesquisa, o mesmo organismo foi
exposto a duas histórias comportamentais
de maneira relativamente simultânea, sob
diferentes controles de estímulo. O resulta-
do geral, apontou que a história exerce efei-
to sobre o comportamento atual, mas que
esse efeito é transitório.
Okouchi (2003b). Também utilizando um
delineamento intrassujeito (esquemas de
reforçamento múltiplo), com humanos, a
pesquisa de Okouchi apontou que os efeitos
da história ficam sob o controle de estímu-
los e que esses efeitos podem se generalizar
para outras situações semelhantes no pre-
sente.
Soares, Costa, Cançado, & Cirino (2013).
Replicação sistemática da pesquisa de Fre-
eman e Lattal (1992) com humanos. Os re-
sultados corroboram o de outras pesquisas
sugerindo que os efeitos da história ficam
sob o controle de estímulos; são transitórios
(embora possam ser de longa duração) e que
a regularidade nos resultados de pesquisas
com humanos em esquemas de reforça-
mento depende do controle experimental,
não requerendo, portanto, mudanças no
modelo de causalidade quando falamos do
comportamento humano e não humano.
REFERÊNCIAS
Aló, R. M. (2005). História de reforçamento.
In J. Abreu-Rodrigues & M. R. Ribeiro (Eds.).
Análise do comportamento: Pesquisa, teo-
ria e aplicação (pp. 45-62). Porto Alegre:
Artmed.
Baum, W. M. (2006). Compreender o Beha-
viorismo: comportamento, cultura e evolu-
ção. Porto Alegre: ArtMed.
Chiesa, M. (1994). Radical behaviorism: The
philosophy and the Science. Boston: Autors
Cooperative.
Cirino, S. D. (2001). Detecção da história de
reforçamento: Problemas metodológicos
para lidar com a história passada. In H. J.
Guilhardi, M. B. B. P. Madi, P. P. Queiroz &
M. C. Scoz (Orgs.), Sobre comportamento
e cognição: Vol 8. Expondo a variabilidade
(pp. 137-147). Santo André: ESETec.
Cole, M. R. (2001). The long term effect of
high and low rate responding histories on
fixed-interval responding in rats. Journal of
the Experimental Analysis of Behavior, 75,
43-54.
Costa, C. E., Banaco, R. A., Longarezi, D. M.,
Martins, E. V., Maciel, E. M., & Sudo, C. H.
(2008). Tipo de reforçador como uma vari-
ável moduladora dos efeitos de história em
humanos. Psicologia: Teoria e Pesquisa, 24,
251-262.
Paulo Guerra Soares, Carlos Eduardo Costa
34
Costa, C. E., Cirino, S. D., Cançado, C. R. X.,
& Soares, P. G. (2009). Polêmicas sobre his-
tória comportamental: identificação de seus
efeitos e sua duração. Psicologia: Reflexão e
Crítica, 22, 317-326.
Costa, C. E., Soares, P. G., & Ramos, M. N.
(2012). Controle de estímulos e história
comportamental: uma replicação de Fre-
eman e Lattal (1992). Temas em Psicologia,
20, 273-288.
Doughty, A. H., Cirino, S. D., Mayfield, K.
H., Da Silva, S. P., Okouchi, H., & Lattal, K.
A. (2005). Effects of behavioral history on
resistance to change. The Psychological Re-
cord, 55, 315-330.
Ferster, C. B., & Skinner, B. F. (1957). Sche-
dules of reinforcement. New York: Appleton.
Freeman, T. J., & Lattal, K. A. (1992). Stimu-
lus control of behavioral history. Journal of
the Experimental Analysis of Behavior, 57,
5-15.
Lattal, K. A. (1991). Scheduling positive rein-
forcers. In I. H. Iversen & K. A. Lattal (Eds.),
Experimental Analysis of Behavior, Part 1
(pp. 87-134). New York, NY: Elsevier Scien-
ce.
Laurenti, C. (2009). Criatividade, liberdade
e dignidade: impactos do darwinismo no
behaviorismo radical. Scientiae Studia, 7,
251-269.
LeFrancois J. R, & Metzger B. (1993). Low-
-response-rate conditioning history and fi-
xed-interval responding in rats. Journal of
the Experimental Analysis of Behavior, 59,
543– 549.
Marçal, J. V. S. (2013). Behaviorismo radi-
cal e prática clínica. In A. K. C. R. de-Farias
(Org.), Análise Comportamental Clínica (pp.
30-48). Porto Alegre: Artmed.
Okouchi, H. (2003a). Effects of differences
in interreinforcer intervals between past
and current schedules on fixed-interval
responding. Journal of the Experimental
Analysis of Behavior, 79, 49-64.
Okouchi, H. (2003b). Stimulus generaliza-
tion of behavioral history. Journal of the
Experimental Analysis of Behavior, 80, 173-
186.
Sidman, M. (1960). Tactics of scientific rese-
arch. New York: Basic Books.
Simonassi, L. E., Pires, M. C. T., Bergholz,
M. B., & Santos, A. C. G. (1984). Causação no
comportamento humano: acesso à história
passada como determinantes na explicação
do comportamento humano. Psicologia: Ci-
ência e Profissão, 4, 16-23.
Skinner, B. F. (1974). About behaviorism.
New York: Vintage Books.
Skinner, B. F. (1981). Selection by conse-
quences. Science, 213, 501-504.Capítulo I | História Comportamental
35
Skinner, B. F. (2003). Ciência e Comporta-
mento Humano. São Paulo: Martins Fontes
(Originalmente publicado em 1953).
Soares, P. G., Costa, C. E., Cançado, C. R. X.,
& Cirino, S. D. (2013). Controle de estímulos
e história comportamental em humanos.
Psicologia: Reflexão e Crítica, 26, p. 357-366.
Souza Júnior, E. J., & Cirino, S. D. (2004) Es-
quemas de reforçamento. In C. E. Costa, J. C.
Luzia, & H. H. N. Sant’Anna (Orgs.), Primei-
ros Passos em análise do comportamento
e cognição. Vol. 2 (pp. 31-42). Santo André:
ESETec.
Wanchisen, B. A. (1990). Forgetting the les-
sons of history. The Behavior Analyst, 13,
31-37.
Weiner, H. (1964). Conditioning history and
human fixed-interval performance. Journal
of the Experimental Analysis of Behavior, 7,
383-385.
Weiner, H. (1969). Controling human fixed-
interval performance. Journal of the Expe-
rimental Analysis of Behavior, 12, 349-373.
Kennon A. Lattal
36
O cheque está no correio1, 2:
investigando como o reforço
atrasado afeta o desempenho
Azzi, R., Fix, D. S. R., Keller, F. S., & Rocha e Silva, M. I. (1964). Exteroceptive control of response
under delayed reinforcement. Journal of the Experimental Analysis of Behavior, 7, 159-162.
“… um atraso do reforço não é um parâmetro estático no efeito de um reforço sobre
o comportamento”
(C. B. Ferster, 1953)
Kennon A. Lattal
West Virginia University
Capítulo II | Atraso do Reforço
37
1 Tradução realizada por João Henrique de Almeida, Paulo Guerra Soa-
res e Carlos Renato Xavier Cançado. O primeiro tradutor é bolsista de
pós-doutorado FAPESP processo número 2014/01874-7.
2 Nota de tradução: “The check is in the mail” é uma expressão utilizada
para indicar a um credor que um pagamento (ainda não realizado) será
feito em breve. É uma situação em que o atraso de um reforço é, neces-
sariamente, sinalizado (i.e., o pagamento ainda não foi recebido e seu
recebimento é sinalizado pela expressão “o cheque está no correio”).
3 Nota de tradução: os termos “signaled”, “unsignaled”, “resetting” e
“nonresetting” que qualificam atrasos do reforço foram traduzidos, res-
pectivamente, como “sinalizados”, “não sinalizados”, “resetáveis” e “não
resetáveis”.
INTRODUÇÃO A ÁREA DE PES-
QUISA E CONTEXTUALIZAÇÃO
DO EXPERIMENTO
Atraso do reforço, mesmo em 1964,
era uma questão de interesse de longa data
na Psicologia da Aprendizagem (e.g., Kim-
ble, 1961; Renner, 1964). Thorndike (1911)
preparou o palco para investigações futu-
ras, quando afirmou que “as respostas que
eram acompanhadas ou seguidas de perto
pela satisfação do animal” (p. 244) seriam
fortalecidas. Foi deixado para outros explo-
rarem os limites e as implicações da “pro-
ximidade” temporal para a relação respos-
ta-reforço. O tema geral foi explorado por
todos os principais teóricos da aprendiza-
gem que sucederam Thorndike. Guthrie
(1935) enfatizou a importância fundamen-
tal da contiguidade temporal entre eventos
para a aprendizagem, mas ele nem era um
teórico do reforçamento! Hull (1943) discu-
tiu extensamente o problema do atraso do
reforço em seu livro Princípios do Compor-
tamento (Principles of Behavior), com ên-
fase especial nos mecanismos responsáveis
pela manutenção do comportamento sob
condições de atraso do reforço (ver também
Spence, 1947). O atraso do reforço também
aparece como um problema de pesquisa no
livro de Skinner (1938) O Comportamento
dos Organismos. Diferentemente da tenta-
tiva de Hull de inferir mecanismos teóricos
subjacentes ao gradiente de atrasos do re-
forço, a análise de Skinner foi, previsivel-
mente, mais empírica.
Os experimentos em que foram im-
postos um atraso temporal entre a resposta
que produz o reforço e a entrega desse re-
forço são descritos em dois momentos em
O Coportamento dos Organismos. Os atra-
sos investigados por Skinner (1938) foram
não-sinalizados, isto é, não houve mudança
de estímulo que acompanhasse o intervalo
do atraso. No primeiro experimento (des-
crito nas pp. 73-74), uma resposta liberava
“um pêndulo que acionava o comedouro no
final do intervalo desejado”. Skinner (Figu-
ra 6, p. 73) mostrou os dados de aquisição
de oito ratos usando atrasos de 1-4 s com
diferentes pares de ratos, e, com uma exce-
ção, notou que foram comparáveis aos de
aquisição com reforço imediato. Não está
claro se estes atrasos eram reiniciados se
as respostas subsequentes ocorressem du-
rante o intervalo do atraso, mas parece que
eles não foram, isto é, os atrasos foram não
resetáveis3 (cf. Lattal & Gleeson, 1990). Ele
afirmou que “[um] novo intervalo deve ser
iniciado [quando ocorre uma segunda res-
posta] ou a segunda resposta será reforçada
rápido demais, mas isto significa que a pri-
Kennon A. Lattal
38
meira resposta não seria reforçada” (p. 73).
Seus comentários subsequentes sugeriram
que ele não resolveu este problema neste
primeiro experimento.
Um pouco mais tarde no livro ele
descreveu outros dois experimentos en-
volvendo atraso do reforço. Ele começou
repetindo o problema do procedimento já
mencionado anteriormente: “Nenhum pla-
nejamento foi feito para evitar a possivel
coincidência de uma segunda resposta com
um reforço atrasado” (Skinner, 1938, p. 138),
tornando assim mais provável que o atraso
obtido seria menor do que o atraso progra-
mado. Ele também observou uma segunda
dificuldade, relacionada com os ratos que
mantinham a barra pressionada. O atraso
começou com uma pressão a barra, mas às
vezes a barra continuava a ser pressiona-
da durante o atraso e era liberada no final
do intervalo, levando Skinner a questionar
se isso resultaria em reforço imediato ou
atrasado. O equipamento utilizado neste
experimento foi o mesmo utilizado no ex-
perimento descrito acima mas, no entanto,
ele apontou uma mudança: “o equipamen-
to tem esta propriedade importante: se uma
segunda resposta é feita durante o intervalo
do atraso, a contagem do tempo recomeça,
de modo que um intervalo completo deve
decorrer novamente antes que o reforço
ocorra” (p 139. ). Assim, em vez de um atraso
não resetável, neste experimento os atrasos
eram resetáveis, isto é , o intervalo do atra-
so era reiniciado para cada resposta após
aquela que iniciou o atraso. Utilizando este
procedimento, os ratos foram condiciona-
dos “da maneira usual” (p 140; presumivel-
mente Skinner queria dizer com reforço
imediato) para responder, por fim, em um
esquema intervalo fixo (FI) 5 min. Após este
treino, atrasos de 2, 4, 6 ou 8 s estavam em
vigor com diferentes ratos por três sessões.
As taxas de resposta foram reduzidas quan-
do os atrasos estavam em vigor, sendo que
com os dois atrasos mais curtos o respon-
der foi menos reduzido em comparação aos
dois mais longos. Em um experimento final
sobre atraso do reforço, Skinner analisou os
efeitos de várias mudanças no treino e na
implementação dos atrasos.
O principal desenvolvimento suse-
quente na análise experimental do atraso
do reforço foi a pesquisa de Ferster (1953).
A maioria dos teóricos de aprendizagem,
incluindo Skinner, focaram os efeitos pre-
judiciais do atraso do reforço sobre a apren-
dizagem e o desempenho. Ferster inverteu a
questão e perguntou se seria possível man-
ter o comportamento apesar da presença de
um atraso entre o reforço e a resposta que o
produziu. Ele conduziu uma série de expe-
rimentos com pombos em que ele primei-
ro mantinha a resposta de bicar (bicar um
pequeno disco de plástico) com esquemas
de reforço intervalo variável (VI). Com essa
linha de base, em seu primeiro e segundo
experimentos, atrasos sinalizados por bla-
ckouts4 da câmara experimental ocorreram
4 Nota de tradução: Termo mantido como no original. O termo é utiliza-
do para descrever situações em que as luzes da câmara experimental, e
até mesmo aquelas que iluminam os discos de resposta, são apagadas.
Capítulo II | Atraso do Reforço
39
entre o reforço e a resposta que o produziu.
Os blackouts foram utilizados“para evitar S
de respondesse” (p. 219), aproveitando-se do
fato de que pombos normalmente não bi-
cam os discos de resposta quando a caixa e
o disco estão apagados. Claro, apagar as lu-
zes da caixa era uma consequência imedia-
ta da resposta, fazendo com que o blackout
funcionasse como um estímulo, em última
análise correlacionado com a liberação do
reforço. Como resultado, o atraso do reforço
covariou com a potencial função reforçado-
ra condicionada do blackout. Esta covaria-
ção permite questionar esse experimento, e
todos os experimentos envolvendo atrasos
sinalizados do reforço, como um teste dos
efeitos de um atraso do reforço”puro” sobre
o responder. Em seu primeiro experimento,
Ferster observou que atrasos de 60 s cau-
saram uma “pequena queda” na taxas de
respostas, mas sob atrasos de 120 s, a taxa
de respostas caiu para cerca da metade de
seu valor quando o reforços imediatos eram
utilizados. Em seu segundo experimento,
Ferster tentou manter altas taxas de res-
posta introduzindo os atrasos gradualmen-
te, aumentando a sua duração de 1 a 60 s ao
longo de um período de treino de 90 hr. Ele
relatou que “os três Ss que mantiveram as
taxas normais de resposta sob 60 s de atra-
so foram mantidos no mesmo procedimen-
to por várias centenas de horas cada. Eles
não exibiram nenhuma tendência de desa-
celeração” (p. 222). O responder do quar-
to pombo não foi mantido, de acordo com
Ferster, porque os atrasos “foram aumen-
tados muito rapidamente.” (p. 222). Ele não
apresentou dados quantitativos na descri-
ção de seus experimentos, baseando-se, ao
invés disso, em descrições verbais do que
aconteceu, apoiadas apenas por alguns re-
gistros cumulativos dos desempenhos dos
pombos.
Estas duas linhas de pesquisa (Skin-
ner, 1938; e Ferster, 1953) fornecem o con-
texto para o tema deste capítulo: o experi-
mento de Azzi, Fix, Rocha e Silva e Keller
(1964). Uma parte importante da história
por trás do experimento de Azzi et al. é caso
de amor de Fred Keller com o Brasil, que co-
meçou com a sua chegada como Fulbright
Teaching Fellow na Universidade de São
Paulo no início de 1961. Foi nomeado como
seu assistente de pesquisa Rodolpho Azzi,
que aparece com Keller e outros pesquisa-
dores e pesquisadoras do Brasil na Figura 1.
Sobre Azzi, Keller (2008) afirmou:
“Ele rapidamente se tornou meu con-
selheiro e guia, ele meatualizava com
tudo o que eu deveria saber sobre os
meus alunos, membros do corpo do-
cente e funcionários da administra-
ção. Ele me ajudou a responder a per-
guntas, escrever relatórios, e avaliar
o progresso dos meus alunos. Ele me
preparou para reuniões importantes,
me informava sobre novos desenvolvi-
mentos, e me protegeu de incômodos
de qualquer tipo.” (p. 248)
Kennon A. Lattal
40
Logo depois que Keller começou a le-
cionar, ele recebeu uma entrega de equipa-
mento de pesquisa que ele havia adquirido
da compania Grason-Stadler em Waltham,
Massachussetts. Ele se lembrou de que o
equipamento
“... não veio com as instruções, por
isso tivemos de determinar como fun-
cionava por tentativa e erro. Rodol-
fo [sic] [Azzi] e eu, juntamente com
Mario Guidi, um estudante em nosso
curso, trabalhamos durante dias an-
tes de finalmente descobrirmos como
automatizar um estudo longo sobre
os efeitos de diferentes atrasos do re-
forço sobre a resposta de pressionar a
barra de três ratos brancos (nomea-
dos de Alpha, Beta e Gamma por Ro-
dolfo [sic]). Os resultados foram pu-
blicados mais tarde no Journal of the
Experimental Analysis of Behavior”
(Keller, 2008, p. 250).
Podemos apenas especular sobre o
porquê atraso do reforço foi o tema da pri-
meira pesquisa publicada no Journal of the
Experimental Analysis of Behavior com
um primeiro autor brasileiro (Azzi). Vamos
voltar para o segundo experimento relata-
do por Skinner com atraso de reforço em
O Comportamento dos Organismos. Lem-
bre-se que ele usou um procedimento de
atraso resetável, em que cada resposta que
ocorresse após aquela que deu início ao
atraso reiniciava o intervalo do atraso. Ele
usou um procedimento semelhante para
reduzir o responder em altas taxas [“nenhu-
ma resposta foi reforçada se fosse precedi-
da, no prazo de quinze segundos, por outra
resposta” (p. 306)], dando assim origem ao
esquema de reforçamento diferencial de
taxas baixas (DRL). Wilson e Keller (1953),
posteriormente, estudaram os efeitos de es-
quemas DRL sobre a pressão à barra de ra-
tos sob uma série de valores do “atraso” (i.e.,
os valores do DRL). O experimento Wilson
e Keller nasceu de uma demonstração ini-
cial do que era basicamente um esquema
de reforçamento diferencial de outros com-
portamentos (DRO), em que o início de um
período de SD ocorreu somente se não hou-
vesse resposta no período S-delta imedia-
tamente anterior por um período de tempo
especificado (cf. Skinner, 1938, p. 161). Uma
contingência de atraso de reforço resetável
é essencialmente um esquema DRL sem
a resposta requerida no fim do intervalo,
Figura 1. Rodolpho Azzi, Fred Keller, Maria Amélia Matos, Carolina
Martuscelli Bori, e Andrés Aguirre (da esquerda para a direita) com
equipamentos, Dezembro de 1961.
Capítulo II | Atraso do Reforço
41
e um esquema DRO é essencialmente um
procedimento de atraso resetável, mas sem
a exigência de uma resposta para iniciar
cada intervalo do DRO (os reforços ocor-
rem desde que a resposta alvo não ocorra;
se uma resposta alvo ocorrer, ela reinicia
o intervalo do DRO). Combine todas essas
ideias, adicione o fato de que Ferster (um
dos alunos de doutorado de Keller em Co-
lumbia) tinha estudado previamente os
efeitos de atrasos sinalizados do reforço e,
voilà, os procedimentos utilizados por Azzi
et al. (1964) emergem. Não podemos saber
com precisão como a ideia para o experi-
mento foi desenvolvida mas, certamente, e
sem surpresa, pode ser intimamente ligada
a alguns dos trabalhos anteriores de Keller e
seus alunos na Universidade de Columbia.
DESCRIÇÃO DO EXPERIMENTO
Objetivo e Método
Azzi et al. (1964) buscaram fazer duas
coisas: (a) investigar o responder operante
sob condições em que o intervalo entre o
reforçador e a resposta que o produzia era
variado e (b) comparar condições em que
o atraso fosse acompanhado por uma mu-
dança nos estímulos (um estímulo que o
sinalizasse) ou ocorresse sem qualquer mu-
dança durante o intervalo do atraso (não
sinalizado). Assim, o experimento era ba-
sicamente uma comparação de duas con-
dições diferentes – atrasos do reforço não
sinalizados e sinalizados – que tinham sido
observados em experimentos diferentes
conduzidos, respectivamente, por Skinner
(1938) e Ferster (1953).
Para isso, três ratos foram incial-
mente treinados a pressionar uma barra em
um esquema de razão fixa (FR) 1, em que o
reforçado era acesso à água. Parece razoável
assumir que neste tempo nem pelotas de
comida usadas com os ratos em muitos dos
experimentos de Skinner e outros, nem tão
pouco os meios para liberar essas pelotas –
i.e., um comedouro – estavam disponíveis
no Brasil. Água era fácil de obter e Keller
tinha trazido consigo o que ele chamou
de um “Brenner dipper”5 para liberação de
água como reforços. Após o treino inicial,
“dentro de uma câmara com a iluminação
reduzida, cada [rato] foi exposto sucessiva-
mente a atrasos do reforço de 1; 3; 5; 7,5; 10;
15; e 20 s[egundos], nesta ordem, com um
total de 150 reforços em cada atraso” (Azzi
et al., 1964, p. 159). O esquema de reforço
então era, tecnicamente falando, um tan-
dem FR 1 DRO t-s, em que t correspondia a
um dos valores de atraso apresentados aci-
ma. Um esquema tandem (a palavra latina
para “um logo após o outro”) é idêntico a um
esquema de reforço encadeado em que dois
ou mais componentes do esquema preci-
sam ser finalizados em uma sequência fixa
para que o reforço ocorra; no entanto, em
um esquema encadeado cada componen-
te é associado com um estímulo diferente,
5 Nota de tradução: Um dipperé uma espécie de bebedouro; o equipa-
mento geralmente consiste em uma haste com um recipiente côncavo
na ponta que, quando mergulhado em um líquido, retém parte do mes-
mo. O líquido então pode ser apresentado ao animal movimentando-se
a haste até alguma parte da câmara experimental.
Kennon A. Lattal
42
mas no esquema tandem o estímulo as-
sociado com cada componente é idêntico.
No procedimento de Azzi et al. (1964), cada
atraso reiniciava se uma resposta ocorresse
durante o intervalo do atraso (um atraso re-
setável), e não havia nenhuma mudança no
estímulo durante o período de atraso. Em
seguida, foram realizadas várias manipula-
ções das durações do atraso para dos dois
dos ratos. O terceiro rato aparentemente foi
exposto somente a um esquema DRL 20 s
com reforços imediatos. Assim como na
primeira, na segunda parte do experimen-
to o esquema de reforço em vigor tecnica-
mente era um tandem FR1 DRO ts, em que
t era 20 por dez dias, seguido por seis dias
com t=30s. Durante a metade de cada ses-
são, “cada animal trabalhou em uma câma-
ra com a iluminação reduzida” (p.160). Du-
rante a outra metade, no entanto, “ausência
de iluminação (escuridão) estava em vigor
durante cada intervalo do atraso… cada vez
que uma resposta de pressão à barra ocor-
ria, a luz da caixa era desligada (p.160, itáli-
cos originais) e não voltava a ser ligada até
que o reforço tivesse sido liberado. Pressões
à barra na câmara sem iluminação aumen-
tavam o período sem iluminação até que a
duração do atraso terminasse e o reforço
fosse liberado. Assim, na segunda parte do
experimento, foram comparados um inter-
valo do atraso correlacionado com a pre-
sença e com a ausência de uma mudança
nos estímulos.
Resultados e Discussão
Houve dois achados principais. O
responder mantido sob um esquema tan-
dem FR1 DRO ts foi uma função negativa-
mente desacelerada da duração do atraso.
Ou seja, a taxa de respostas caiu precipita-
damente quando o atraso aumentou de 1 a
10 s, mas atingiu a assíntota naquele ponto,
não caindo mais quando aos atrasos dura-
vam 15 ou 20 s. Essa relação é chamada de
gradiente de atraso do reforço, e é caracte-
rística da relação entre as medidas de uma
resposta e a duração do atraso em uma am-
pla variedade de atrasos do reforço e parâ-
metros do esquema de reforço (cf. Lattal,
2010). Escurecer a câmara durante o atraso
“produziu um efeito considerável, regula-
rizando e aumentando a taxa de respostas
[relativo aquela observada na condição de
atraso não sinalizado] em quase todos os
casos” (Azzi et al., 1964, p. 160).
A discussão considerou o papel do
comportamento mediador em manter o res-
ponder durante o atraso, uma observação
feita anteriormente por Ferster (1953). No
que subsequentemente se tornou uma aná-
lise padrão, a mudança de estímulos (em
atrasos sinalizados dos reforços) é entendi-
da como um reforçador condicionado que
mantém as respostas que a produziram. Isto
ainda é uma interpretação comum do papel
do estímulo que sinaliza o atraso em pro-
cedimentos de atrasos sinalizados do refor-
ço. Essa interpretação, no entanto, tem sido
questionada recentemente interpretando-
-se a mudança de estímulos como tendo
Capítulo II | Atraso do Reforço
43
função de ligação ou marcação do atraso
(e.g., Williams, 1991), ao invés de fortalecer
o comportamento que a precede.
DESDOBRAMENTOS
Ambos os resultados do experimen-
to qualificam Azzi et al. (1964) como um ex-
perimento seminal no estudo do atraso do
reforço. Os gradientes de atraso do reforço
apresentados por Azzi et al. (1964) tem sido
replicados quando diferentes esquemas
de reforço têm sido usados para manter o
responder (Elcoro & Lattal, 2011, FI; Jarmo-
lowicz & Lattal, 2013, FR; Richards, 1981,
DRL e VI; Sizemore & Lattal, 1978, VI) e
com uma variação mais ampla de valores
de atraso (Pierce, Hanford, & Zimmerman,
1972; Richards, 1981; Sizemore & Lattal,
1978). Azzi et al. também anteciparam vá-
rias comparações subsequentes de atra-
so do reforço sinalizado e não sinalizado,
com mais ou menos os mesmos resultados:
atrasos sinalizados mantem um responder
mais robusto do que os não sinalizados (Ri-
chards, 1981). Uma característica particu-
larmente interessante de Azzi et al. é que
as comparações dos atrasos do reforço si-
nalizados e não sinalizados foram intras-
sujeitos. Eles são os primeiros a comparar
simultaneamente (intrassessão) os efeitos
dos atrasos do reforço sinalizados e não si-
nalizados (cf. Lattal, 1984; Lattal & Ziegler,
1982; Richards, 1981). Muito depois de Azzi
et al., Reilly e Lattal (2004) desenvolveram
um método para obter gradientes de atraso
do reforço intrassujeitos durante uma úni-
ca sessão. Eles mantiveram o responder sob
um esquema VI e, no início de cada sessão,
programaram um atraso curto antes que
um reforço fosse disponibilizado. Cada re-
forço subsequente foi disponibilizado após
um atraso progressivamente maior.
O experimento de Azzi et al. (1964)
foi conduzido na tradição da Universidade
de Columbia de conduzir análises paramé-
tricas sistemáticas das variáveis controla-
doras do comportamento. Nesse caso, as
durações do atraso foram manipuladas em
condições sucessivas. Como não havia um
retorno à linha de base entre os aumentos
sucessivos nos valores dos atrasos, atrasos
subsequentes eram impostos sob taxas va-
riáveis de respostas entre manipulações,
com efeitos desconhecidos sobre o gradien-
te de atraso do reforço. Esses gradientes de
atraso do reforço, no entanto, são um tanto
similares em sua forma aqueles obtidos com
pressões à barra de ratos ou bicar de disco
de pombos mantidos sob outros esquemas
de reforço (Elcoro & Lattal, 2011; Pierce, et
al., 1972; Richards, 1981; Sizemore & Lattal,
1978), sugerindo que a taxa de respostas
na linha de base pode ter um papel menos
importante na forma do gradiente do que o
valor do atraso em si.
Uma potencial variável estranha no
experimento foi a taxa de reforços. Como
tantos outros experimentos iniciais envol-
vendo atrasos do reforço, a taxa de refor-
ços sob cada valor de atraso não foi relatada
Kennon A. Lattal
44
por Azzi et al. (1964). É quase certo que as
taxas de reforço diferiram quando os atra-
sos foram aumentados na primeira parte do
experimento e na presença e na ausência
de um estímulo na segunda parte. Pesqui-
sas posteriores, no entanto, mostraram que
diferenças na taxa de reforços geralmente
não explicavam as diferenças nas taxas de
resposta observadas quando durações de
atraso são alteradas (Lattal, 1982; Richards,
1981; Sizemore & Lattal, 1978).
Lattal e Gleeson (1990) utilizaram um
procedimento semelhante aos de Skinner
(1938) e Azzi et al. (1964) para investigar a
aquisição de responder por ratos e pombos
experimentalmente ingênuos sob atrasos
do reforço não sinalizados e resetáveis e
não resetáveis quando a resposta operan-
te não havia sido modelada ou treinada de
alguma forma, mas deixada para se desen-
volver sem qualquer intervenção por parte
dos investigadores. Responder robusto se
desenvolveu sob estas condições, atestan-
do o poder de reforço atrasado no desen-
volvimento e manutenção comportamento
operante. Esta é outra maneira de dizer que
o reforço imediato não é necessário para
que a aprendizagem ocorra. Dito isto, no
entanto, o reforço imediato resulta em um
responder muito mais robusto. É uma ques-
tão em aberto se a aquisição de respostas
é “mais rápida” com reforços imediatos vs.
atrasados das respostas.
CONSIDERAÇÕES FINAIS
O atraso do reforço é um dos princi-
pais parâmetros que afetam a eficácia dos
reforços no desenvolvimento e na manu-
tenção do comportamento (Kimble, 1961).
Por esta razão, o seu papel, tanto sozinho
como em combinação com outros parâme-
tros do reforço, tal como magnitude dos re-
forços, foi investigado extensivamente. Um
dos resultados dessas análises de interações
é o desconto do atraso, em que sistematica-
mente aumentar atrasos do reforço parare-
forços de maior magnitude ou probabilida-
de enquanto o atraso para outro reforço de
menor magnitude ou probabilidade é fixo
permite determinar, entre outras coisas, o
ponto de indiferença em que uma das duas
alternativas é igualmente provável de ser
escolhida (ver Green, Myerson, & Vander-
veldt de 2014, para um resumo recente des-
tes resultados). Estudos sobre desconto do
atraso oferecem insights sobre como dife-
rentes combinações de parâmetros de re-
forço podem ser dimensionados. Da mesma
forma, o atraso do reforço (às vezes também
chamado de “gratificação” em experimen-
tos não analítico-comportamentais sobre o
fenômeno) desempenha um papel impor-
tante no desenvolvimento de estratégias de
auto-gerenciamento ou de auto-controle.
Na verdade, a base desta área de pesquisa e
aplicação é a análise experimental de atraso
do reforço.
Uma outra área em que as pesqui-
sas sobre atraso do reforço tem sido impor-
Capítulo II | Atraso do Reforço
45
tantes é o estudo do reforço condicionado.
Uma teoria fundamental sobre esse tipo re-
forço é a teoria da redução do atraso (delay
reduction theory), que sugere que estímulos
funcionam como reforçadores na medida
em que eles indicam uma redução do tem-
po de acesso ao reforço primário (Fantino,
1977).
As lições do atraso do reforço não fo-
ram perdidas na análise do comportamento
aplicada, onde a importância da imediati-
cidade do reforço seguindo o comporta-
mento apropriado continua, com razão,
sendo enfatizada. Embora reforço imediato
possa ser o ideal no tratamento e na ges-
tão do comportamento humano de manei-
ra geral, muitos comportamentos humanos
são mantidos apesar de seus reforços serem
atrasados a partir das respostas que os pro-
duzem. A pesquisa básica sobre atraso do
reforço sugere uma série de condições sob
as quais os atrasos reduzirão (e.g., atrasos
mais longos ou não sinalizados) ou não (e.g.,
atrasos mais mais curtos ou sinalizados) o
responder, mas poucas pesquisas aplicadas
tem sido realizadas para expandir estes re-
sultados e investigar como eles podem es-
tar relacionados a programas de tratamen-
to (mas cf. Stromer, McComas, & Rehfeldt,
2000).
Uma questão particularmente impor-
tante e não resolvida na análise do atraso
do reforço com humanos tanto na pesquisa
como em contextos aplicados é a questão
da mediação do comportamento durante os
atrasos pelo comportamento verbal. Ambos
Ferster (1953) e Azzi et al. (1964) sugeriram
que o comportamento é mantido durante os
atrasos do reforço na medida em que certos
padrões de comportamento estereotipado
surjem durante o atraso, o que resultaria
numa cadeia de comportamento desen-
volvendo de tal modo que a resposta que
inicia o atraso é seguida por algum padrão
regular de comportamento (não necessá-
rio mas mantido por reforço acidental) que
termina contiguamente com reforço. Tais
cadeias supersticiosas, assim, garantiriam
uma “conexão” entre a resposta operante
inicial e o reforço no final do atraso. Tem
sido sugerido que o comportamento verbal
de humanos pode também mediar os atra-
sos. Algo que uma pessoa faz agora pode
não ter um efeito em uma hora, em um
dia, ou até mais, mas os dois eventos per-
manecem conectados e a pessoa continua
a se engajar no comportamento que tem o
reforço atrasado. Talvez isso esteja relacio-
nado a coisas que ou a pessoa diz a si mes-
mo ou outras pessoas a durante o interva-
lo do atraso. Ou talvez não. Alguns críticos
contemporâneos de tais interpretações do
atraso do reforço baseadas em contiguidade
têm sugerido que a proximidade temporal
entre a resposta e reforço desempenha um
papel relativamente menor na aquisição e
manutenção de responder em comparação
ao fato de que existe uma correlação geral
entre a taxa de respostas e os reforços que
resultam, imediatamente ou após atrasos
(ver Baum, 1973). O experimento de Lattal
e Gleeson (1990) descrito acima ilustra que
Kennon A. Lattal
46
a aprendizagem pode ocorrer quando há
apenas uma correlação entre a resposta e
o reforço, mas não a contiguidade respos-
ta-reforço. Este último ponto levanta uma
questão mais ampla, sem resposta ainda,
sobre se os reforços que ocorrem após um
atraso são mais bem caracterizados como
atrasados em relação à respostas específi-
cas ou se são correlacionados com grupos
de respostas organizadas como taxas de
resposta ou tempo alocado à respostas de
topografias particulares.
Um último ponto, mas não menos
importante, é que a partir de uma perspec-
tiva histórica o experimento é importante
porque é o primeiro de muitos relatos de
pesquisa por analistas do comportamento
brasileiros a ser publicado no Journal of the
Experimental Analysis of Behavior.
PARA SABER MAIS
Commons, Mazur, Nevin, & Rachlin (1987).
É um volume editado que apresenta uma
série de perspectivas sobre o uso e as impli-
cações do atraso do reforço para a compre-
ensão do processo de reforçamento.
Lattal (2010). fez uma revisão sobre a pes-
quisa básica sobre atraso do reforço condu-
zida na tradição analítico-comportamental
de Skinner até o momento da publicação de
sua revisão.
Renner (1964). é uma importante revisão
inicial sobre atraso do reforço a partir de
uma perspectiva mais ampla das teorias da
aprendizagem sobre o tema.
Stromer, McComas, & Rehfeldt (2000).
consideraram algumas implicações aplica-
das de pesquisas sobre atraso do reforço.
Tarpy & Sawabini (1974). analisaram criti-
camente pesquisas sobre atraso do reforço
conduzidas desde a publicação da revisão
de Renner até a sua própria.
REFERÊNCIAS
Azzi, R., Fix, D. S. R., Keller, F. S., & Rocha
e Silva, M. I. (1964). Exteroceptive control
of response under delayed reinforcement.
Journal of the Experimental Analysis of
Behavior, 7, 159-162.
Baum, W. M. (1973). The correlation-based
law of effect. Journal of the Experimental
Analysis of Behavior, 20, 137-153.
Commons, M. L., Mazur, J., Nevin, J. A., &
Rachlin, H. (Eds.) (1987). Quantitative stu-
dies of operant behavior: The effect of delay
and of intervening events on reinforcement
value. New York: Erlbaum.
Elcoro, M., & Lattal, K. A. (2011). Effects of
unsignaled delays of reinforcement on fi-
xed-interval schedule performance. Beha-
vioural Processes, 88, 47-52.
Capítulo II | Atraso do Reforço
47
Fantino (1977). Conditioned reinforcement,
choice, and information. In W. K. Honig &
J.E.R. Staddon (Eds.), Handbook of operant
behavior (pp. 326-339). New York: Prentice
Hall.
Ferster, C. B. (1953). Sustained behavior un-
der delayed reinforcement. Journal of Expe-
rimental Psychology, 45, 218-224.
Green, L., Myerson, J., & Vanderveldt, A.
(2014). Delay and probability discounting.
In F. K. McSweeney & E. S. Murphy
(Eds.), The Wiley Blackwell handbook of
operant and classical conditioning. Oxford:
John Wiley & Sons.
Guthrie, E. R. (1935). The psychology of lear-
ning. New York: Harper.
Hull, C. L. (1943). Principles of Behavior.
New York: Appleton-Century Crofts.
Jarmolowicz, D. P., & Lattal, K. A. (2013). De-
lay of reinforcement and fixed-ratio perfor-
mance. Journal of the Experimental Analy-
sis of Behavior, 100, 370-395.
Keller, F. S. (2008). At my own pace: The au-
tobiography of Fred S. Keller. Cornwall on
Hudson: Sloan Publishing.
Kimble, G. A. (1961). Hilgard and Mar-
quis’ Conditioning and Learning. New York:
Appleton Century Crofts.
Lattal, K. A. (1984). Signal functions in de-
layed reinforcement. Journal of the Experi-
mental Analysis of Behavior, 42, 239-253.
Lattal, K.A. (2010). Delayed reinforcement
of operant behavior. Journal of the Experi-
mental Analysis of Behavior, 93, 129-139.
Lattal, K. A., & Gleeson, S. (1990). Respon-
se acquisition with delayed reinforcement.
Journal of Experimental Psychology: Animal
Behavior Processes, 16, 27-39.
Lattal, K. A., & Ziegler, D. R. (1982). Briefly
delayed reinforcement: An interresponse
time analysis. Journal of the Experimental
Analysis of Behavior, 37,407-416.
Pierce, C. H., Hanford, P. V., & Zimmerman,
J. (1972). Effects of different delay of
reinforcement procedures on variable-in-
terval responding. Journal of the Experi-
mental Analysis of Behavior, 18, 141-146.
Renner, K. E. (1964). Delay of reinforcement:
A historical review. Psychological Review,
61, 341-361.
Reilly, M.P., & Lattal, K.A. (2004). Progressi-
ve delays to reinforcement. Journal of the
Experimental Analysis of Behavior, 82, 21-
35.
Richards, R. W. (1981). A comparison of sig-
naled and unsignaled delay of reinforce-
ment. Journal of the Experimental Analysis
of Behavior, 35, 145-152.
Kennon A. Lattal
48
Sizemore, O. J., & Lattal, K. A. (1978). Un-
signaled delay of reinforcement in variable-
-interval schedules. Journal of the Experi-
mental Analysis of Behavior, 30, 169-175.
Skinner, B. F. (1938). The behavior or orga-
nisms: An experimental analysis. New York:
Appleton Century Crofts.
Spence, K. W. (1947). The role of secondary
reinforcement in delayed reward learning.
Psychological Review, 54, 1-8.
Stromer, R, McComas, J. J., & Rehfeldt, R. A.
(2000). Designing interventions that inclu-
de delayed reinforcement: Implica-
tions of recent laboratory research. Journal
of Applied Behavior Analysis, 33, 359-371.
Tarpy, R. M., & Sawabini, F. L. (1974). Rein-
forcement delay: A selective review of the
past decade. Psychological Bulletin, 81,
984-987.
Thorndike, E. L. (1911). Animal intelligence.
New York: MacMillan.
Williams, B. A. (1991). Marking and bridging
versus conditioned reinforcement. Animal
Learning and Behavior, 19, 264-269.
Wilson, M. P., & Keller, F. S. (1953). On the
selective reinforcement of spaced respon-
ses. Journal of Comparative and Physiologi-
cal Psychology, 46, 190-193.
Carlos Renato Xavier Cançado, Flávia Hauck, Ítalo S. C. Teixeira
49
Quando o passado
retorna: ressurgência
comportamental
Carlos Renato Xavier Cançado
Flávia Hauck
Ítalo S. C. Teixeira
Universidade de Brasília
Epstein, R. (1983). Resurgence of previously reinforced behavior during extinction. Behaviour
Analysis Letters, 3, 391-397.
A fênix é uma ave da Arábia (...). Quando percebe que envelheceu, constrói uma
fogueira para si (...) e encarando os raios do sol nascente, acende o fogo e o nutre
batendo suas asas, e ressurge de suas próprias cinzas.
(Isidoro de Sevilha, Etymologiae, Livro 12, 7:22)
Capítulo III | Ressurgência Comportamental
50
INTRODUÇÃO À ÁREA DE PES-
QUISA E CONTEXTUALIZAÇÃO
DO EXPERIMENTO
É bem provável que você tenha se
encontrado em uma situação em que teve
que resolver um problema como, por exem-
plo, responder corretamente a um exercí-
cio de cálculo, abrir uma porta emperrada,
ou escrever um texto sobre um tema com
o qual você tem pouca familiaridade. Você
“não sabe o que fazer”. Um problema pode
ser apenas uma situação em que seu com-
portamento não modifica o ambiente de
maneira eficiente, isto é, seu comporta-
mento não produz consequências. É o que
os analistas do comportamento chamam de
extinção. Além da redução na frequência
de determinadas respostas, um outro efei-
to da extinção é o aumento na variabilida-
de da topografia das respostas (Antonitis,
1951). Você tenta fazer coisas diferentes,
comportar-se de outras maneiras para ten-
tar resolver o problema. Parte do que você
faz nesse momento é, comumente, algo
bem parecido com o que você fez no passa-
do (talvez mesmo em um passado remoto) e
que, nesse passado, “deu certo”. É parte de
sua história comportamental. É sobre essa
variação comportamental que o ambiente
irá operar, selecionando o que é usualmen-
te descrito como a “solução do problema”,
possivelmente um “comportamento novo”
ou “criativo” (Epstein, 1996; ver especial-
mente, Skinner, 1981, 1984).
Em situações nas quais comporta-
mentos atuais deixam de produzir conse-
quências, comportamentos previamente
reforçados tendem a recorrer, um fenôme-
no que analistas do comportamento de-
nominam de ressurgência (Epstein, 1983,
1985). Embora a ressurgência tivesse sido
descrita anteriormente na literatura cientí-
fica (e.g., Carey, 1951; Leitenberg, Rawson &
Bath, 1970; Leitenberg, Rawson & Mulick,
1975; ver Epstein, 2015), o estudo sistemá-
tico desse fenômeno intensificou-se nos
anos 1980, especialmente após a publicação
do artigo de Epstein (1983), cujo experimen-
to é descrito nesse capítulo. Nesse artigo,
Epstein usa um termo específico para des-
crever a recorrência de comportamentos
previamente reforçados durante a extinção
de outros comportamentos (i.e., ressurgên-
cia; ver também Epstein & Skinner, 1980),
define o fenômeno, descreve um proce-
dimento para sua análise experimental, e
levanta diversas questões de pesquisa que
serviram de base para a condução de expe-
rimentos sobre a ressurgência desde então
(ver Lattal & St Peter Pipkin, 2009; e Pontes
& Abreu-Rodrigues, 2015, para revisões da
literatura).
No início de seu artigo, Epstein (1983)
define a ressurgência da seguinte maneira:
“Quando, numa dada situação, um com-
portamento reforçado recentemente deixa
de ser reforçado, comportamentos ante-
riormente reforçados em condições seme-
lhantes tendem a recorrer” (p. 391; itálicos
adicionados). Essa definição pode parecer
Carlos Renato Xavier Cançado, Flávia Hauck, Ítalo S. C. Teixeira
51
geral demais, algo que talvez pudesse ter
sido descrito por meio da observação casu-
al do comportamento no cotidiano, sem re-
correr a equipamentos especiais, sem con-
duzir experimentos, e sequer pensar em ir
ao laboratório. Por quê recorrer a uma situ-
ação simplificada no laboratório quando o
fenômeno pode ser observado no compor-
tamento de humanos e não humanos em
ambientes não laboratoriais? Mas é exata-
mente essa simplificação do laboratório em
relação a ambientes não laboratoriais, con-
duzida por meio do controle experimental
de variáveis, que queremos quando nosso
objetivo é descrever princípios comporta-
mentais. A análise experimental permite
uma descrição mais precisa do fenôme-
no investigado e dos fatores que o levam a
ocorrer (i.e., suas variáveis de controle). Se
você conhece as variáveis que determinam
um fenômeno, pode prevê-lo com maior
precisão se você sabe que essas variáveis
estão em vigor. Além disso, se você pode
manipular essas variáveis, pode fazer com
que o fenômeno ocorra ou deixe de ocor-
rer (Skinner, 2003/1953). É essa a princi-
pal função de uma análise experimental do
comportamento e não seria diferente em
relação ao estudo da ressurgência. Vejamos,
então, como foi a análise experimental da
ressurgência conduzida por Epstein.
DESCRIÇÃO DO EXPERIMENTO
Objetivo e Método
O objetivo de Epstein (1983) era ana-
lisar experimentalmente a ressurgência,
isto é, a recorrência de comportamentos
previamente reforçados quando comporta-
mentos atuais deixavam de ser reforçados.
Metodologicamente, seria necessário que
uma resposta específica (a resposta alvo)
fosse inicialmente reforçada. Em uma se-
gunda fase, a resposta alvo deixaria de pro-
duzir reforços e uma outra resposta (a res-
posta alternativa) seria reforçada. Em uma
terceira fase, a resposta alvo continua a não
produzir reforços e a ressurgência dessa
resposta poderia ser verificada quando a
resposta alternativa deixasse de produzir
reforços. Na literatura experimental, o pro-
cedimento para o estudo da ressurgência
é descrito comumente como um “procedi-
mento de três fases” e a primeira, a segun-
da e a terceira fases do procedimento são
denominadas fases de Treino, Eliminação
(ou Reforçamento Alternativo) e Teste, res-
pectivamente. Embora Epstein não tenha
feito uso desses termos, eles serão utiliza-
dos nesse capítulo para descrever as fases
de seu procedimento.
Independente dos nomes que demos
ao procedimento e às fases experimentais,
o que deve ser destacado é que Epstein
(1983) precisou construir, em laboratório,
uma história comportamental remota (i.e.,
a resposta alvofoi reforçada), uma histó-
ria comportamental recente (i.e., a respos-
ta alvo deixou de ser reforçada e apenas a
resposta alternativa passou a produzir re-
forços) e também modificar o ambiente de
seus sujeitos em um teste (i.e., a resposta
Capítulo III | Ressurgência Comportamental
52
alternativa também deixou de produzir re-
forços) para verificar se, e como, a ressur-
gência das respostas alvo ocorreria.
O experimento foi conduzido com
seis pombos, experimentalmente ingênu-
os, mantidos a 80% de seu peso livre por
meio de um regime de privação de comida.
Como os experimentos sobre ressurgência
são experimentos sobre os efeitos de uma
história remota sobre o comportamento
atual, o fato de os pombos terem sido ex-
perimentalmente ingênuos foi um aspecto
importante de controle experimental. Os
resultados poderiam ser diferentes (ou mes-
mo de difícil interpretação) se os pombos já
tivessem uma determinada história no am-
biente experimental escolhido por Epstein.
O procedimento de privação de comida é
uma operação estabelecedora ou motiva-
dora (Miguel, 2000; ver também Laraway,
Snycerski, Michael & Poling, 2003), neces-
sária para estabelecer o acesso à comida no
ambiente experimental como consequência
e permitir que determinadas respostas se-
jam selecionadas e mantidas durante o ex-
perimento.
O equipamento utilizado no experi-
mento foi uma câmara de condicionamento
operante para pombos (as sessões experi-
mentais eram conduzidas com cada pombo
individualmente). Um dos painéis da câ-
mara continha dois discos de resposta, lo-
calizados à direita e à esquerda no painel e
separados por 12 cm, e um comedouro loca-
lizado entre os discos (os discos de resposta
usualmente são de plástico e têm 2 cm de
diâmetro; respostas de bicar o disco fecham
um circuito elétrico que permite o registro
automático das respostas). Quando acio-
nado, o comedouro dava acesso a grãos por
3 s (i.e., reforços). Em cada fase do experi-
mento, descritas a seguir, as sessões expe-
rimentais duravam 60 min e o registro das
respostas foi feito por meio de um micro-
computador, de registradores cumulativos,
e também de filmagens das sessões expe-
rimentais feitas com uma câmera de vídeo.
Fase de Treino: o objetivo dessa fase
foi estabelecer a resposta alvo. Para três
pombos, a resposta alvo consistiu em bicar
o disco da direita e, para os outros três, o
disco da esquerda. A resposta alvo foi man-
tida sob um esquema de reforçamento in-
tervalo variável (VI) 60 s. Sob esse esque-
ma, a primeira resposta após um intervalo
médio de 60 s produz reforços (os intervalos
entre reforços variam e sua média é igual
a 60 s; os intervalos são selecionados alea-
toriamente em uma sessão). Esse esquema
produz uma taxa de respostas moderada e
constante e, por essa razão, é muito usado
para o estabelecimento de linhas de base
comportamentais em análise experimental
do comportamento. Essa fase teve a dura-
ção de 15 a 49 sessões, entre pombos, e ter-
minou quando a taxa de respostas de cada
pombo fosse estável (embora Epstein, 1983,
não defina precisamente seu critério de es-
tabilidade, comumente exige-se que os su-
jeitos sejam expostos às condições por um
número mínimo de sessões e que não haja
Carlos Renato Xavier Cançado, Flávia Hauck, Ítalo S. C. Teixeira
53
tendências crescentes ou decrescentes na
taxa de respostas por algumas sessões con-
secutivas).
Fase de Eliminação: o objetivo des-
sa fase foi reduzir a frequência da respos-
ta alvo e reforçar uma resposta alternati-
va. Na etapa inicial dessa fase, para cada
pombo, a resposta alvo deixou de produzir
reforços (i.e., extinção estava em vigor). O
número de sessões em que a resposta alvo
esteve em extinção variou para cada pom-
bo, entre uma e 12 sessões. A etapa final
dessa fase ocorreu em uma sessão de 60
min. Nessa sessão, o procedimento de ex-
tinção da resposta alvo esteve em vigor por
pelo menos 30 min e até que nenhuma res-
posta alvo ocorresse por 10 min consecuti-
vos, para cada pombo. Então, foi reforçada
uma resposta alternativa cuja topografia
era incompatível com bicar o disco. A topo-
grafia da resposta alternativa variou entre
pombos: para um pombo, por exemplo, a
resposta alternativa consistiu em virar para
a esquerda; para outro pombo, em abaixar
a cabeça; para outro, em levantar a asa. A
resposta alternativa foi reforçada 20 vezes
em um esquema de razão fixa (FR) 1. Sob
esse esquema cada ocorrência da resposta
alternativa produzia o reforço. Após a pro-
dução de 20 reforços pela resposta alterna-
tiva, ainda nessa mesma sessão, teve início
a fase de Teste.
Fase de Teste: nessa fase, para cada
pombo, os reforços para a resposta alterna-
tiva foram descontinuados. É importante
destacar que, durante essa fase, a resposta
alvo também não produzia reforços. Essa
fase esteve em vigor até o término da sessão
de 60 min e teve a duração de aproximada-
mente 10 min para cada pombo.
Ressurgência seria evidenciada caso
ocorresse um aumento na frequência da
resposta alvo na fase de Teste em relação à
frequência dessa mesma resposta na etapa
final da fase de Eliminação. Mas vejamos
alguns aspectos do procedimento de Eps-
tein (1983) que qualificam (em seu experi-
mento, e em qualquer experimento sobre
ressurgência) a descrição de um aumento
na frequência de respostas alvo durante a
fase de Teste como ressurgência.
Aspectos do controle experimental:
vale destacar alguns aspectos importan-
tes de controle experimental adotados por
Epstein (1983). Lembre-se que a câmara de
condicionamento operante tinha dois dis-
cos de resposta. Bicar um desses discos foi
definido como a resposta alvo. Respostas
de bicar o outro disco nunca produziram
reforços durante o experimento, mas foram
registradas e serviram como respostas con-
trole. A comparação da frequência de res-
postas alvo e respostas controle na fase de
Teste permite diferenciar a ressurgência da
variabilidade no comportamento induzida
pela extinção. Sem o registro de uma res-
posta controle, um aumento na frequência
da resposta alvo na fase de Teste, que seria
descrita como ressurgência, poderia sim-
plesmente ser um exemplo de variabilida-
Capítulo III | Ressurgência Comportamental
54
de induzida pela extinção. No entanto, se o
aumento na frequência da resposta alvo na
fase de Teste fosse maior do que a frequên-
cia da resposta controle, isso seria evidên-
cia de que a ressurgência é função da histó-
ria de reforçamento estabelecida na fase de
Treino e não apenas induzida pela extinção.
Portanto, a ressurgência é definida opera-
cionalmente no experimento de Epstein
como um aumento na frequência da res-
posta alvo durante a fase de Teste (i.e., em
relação à frequência dessa mesma resposta
durante a etapa final da fase de Elimina-
ção) que fosse maior do que a frequência da
resposta controle nessa mesma fase.
Um outro aspecto de controle ex-
perimental importante do experimento de
Epstein (1983) é o fato de a etapa final da
fase de Eliminação e a fase de Teste terem
sido conduzidas na mesma sessão. Quando
uma resposta está em extinção, é comum
observarmos um fenômeno de recorrência
chamado de recuperação espontânea (des-
crito por Pavlov, e.g., Pavlov, 1927, no estu-
do da extinção respondente; o fenômeno é
também observado na extinção operante).
A recuperação espontânea caracteriza-se
por um aumento na frequência de respostas
no início de uma sessão de extinção em re-
lação a frequência dessas respostas no final
da sessão de extinção imediatamente ante-
rior. Portanto, se a transição entre a fase
de Eliminação e a fase de Teste ocorresse
entre sessões no experimento de Epstein,
não teríamos como dissociar a eventual
ressurgência da resposta alvo no início da
fase de Teste do fenômeno de recuperação
espontânea (lembre-se que a resposta alvo
estava em extinção durante toda a fase de
Eliminação, e também durante a fase de
Teste). Como a transiçãoentre as fases de
Eliminação e Teste no experimento de Eps-
tein ocorreu na mesma sessão, um aumen-
to na frequência da resposta alvo no Teste
seria mais precisamente descrito como res-
surgência e não como recuperação espon-
tânea.
Finalmente, vale apontar que Epstein
(1983) conduziu a extinção da resposta alvo,
na fase de Eliminação, antes do reforça-
mento da resposta alternativa (e.g., Bruzek,
Thompson & Peters, 2009; Lieving & Lattal,
2003). Isso foi feito para garantir que a fre-
quência da resposta alvo era baixa quando
as respostas alternativas fossem reforçadas.
No entanto, são comuns experimentos so-
bre ressurgência nos quais a extinção da
resposta alvo e o reforçamento da resposta
alternativa ocorrem simultaneamente na
fase de Eliminação (e.g., Cançado & Lattal,
2011; da Silva, Maxwell & Lattal, 2008; Po-
dlesnik, Gimenez-Gomez & Shahan, 2006).
Resultados e Discussão
Como apontado anteriormente, o
número de sessões na fase de Treino e na
etapa inicial da fase de Eliminação variou
entre pombos. Na fase de Treino, entre
pombos, de 11 a 49 sessões foram conduzi-
das; na etapa inicial da fase de Eliminação,
de 1 a 12 sessões foram conduzidas.
Carlos Renato Xavier Cançado, Flávia Hauck, Ítalo S. C. Teixeira
55
Infelizmente, Epstein (1983) não
apresentou dados da fase de Treino. Como
essa fase foi conduzida até que a taxa de
respostas alvo de cada pombo fosse está-
vel, temos que assumir que foi isso o que
aconteceu. A taxa de respostas alvo, para
cada pombo, estava próxima de zero quan-
do teve início o reforçamento das respostas
alternativas. Assim, Epstein demonstrou
que a exposição à extinção durante a etapa
inicial da fase de Eliminação reduziu consi-
deravelmente a taxa de respostas alvo antes
que as respostas alternativas começassem a
ser reforçadas.
Na etapa final da fase de Eliminação,
a taxa de respostas alternativas aumentou
para cada pombo e a taxa de respostas alvo
permaneceu próxima de zero. Finalmente,
quando os reforços para respostas alterna-
tivas foram descontinuados na fase de Tes-
te, a frequência dessas respostas diminuiu
e observou-se um aumento na ocorrência
da resposta alvo para cada pombo. Isto é, a
ressurgência de uma resposta previamente
reforçada ocorreu quando a resposta alter-
nativa estava em extinção. A magnitude da
ressurgência (i.e., o quanto a taxa de respos-
tas aumentou na fase de Teste em relação à
fase de Eliminação) variou entre os pombos
e aparentemente não foi influenciada pelo
número de sessões conduzidas nas fases de
Treino e Eliminação.
A condução da etapa final da fase de
Eliminação e da fase de Teste em uma mes-
ma sessão (Epstein, 1983) permite afirmar
que o aumento na frequência de respos-
tas alvo durante a fase de Teste não foi um
exemplo de recuperação espontânea. Além
disso, o registro das respostas controle per-
mite afirmar que esse aumento na frequên-
cia de respostas alvo durante a fase de Teste
não pode ser descrito simplesmente como
variabilidade no comportamento induzida
pela extinção. Para cada pombo, o aumen-
to na frequência da resposta alvo na fase de
Teste foi maior do que a frequência de res-
postas controle nessa mesma fase (apenas
um pombo emitiu uma resposta controle na
fase de Teste). Portanto, podemos afirmar
que a ressurgência é produto da história re-
mota de reforçamento estabelecida na fase
de Treino. O fato de a resposta alvo e a res-
posta controle terem topografias semelhan-
tes (ambas são respostas de bicar um disco,
e os discos estavam próximos um do outro
na câmara de condicionamento) torna esse
aspecto do procedimento ainda mais rele-
vante e ressalta a importância da história
do organismo em determinar qual compor-
tamento irá ocorrer (ou recorrer) quando a
extinção estiver em vigor.
Epstein (1983) destaca, contudo, que
a condução da etapa final da fase de Elimi-
nação e da fase de Teste em uma mesma
sessão tem implicações para interpretarmos
seus resultados. Nesse contexto, ele faz re-
ferência a outro fenômeno de recorrência,
o restabelecimento (Reid, 1958; Franks &
Lattal, 1976). O restabelecimento é a recor-
rência de respostas previamente reforçadas
quando, em uma fase de Teste, a resposta
Capítulo III | Ressurgência Comportamental
56
alvo está em extinção, mas os reforços são
apresentados independentemente das res-
postas do organismo. O restabelecimento
evidencia o controle discriminativo do pró-
prio reforço como variável que influencia a
recorrência de respostas. No experimento
de Epstein, a etapa final da fase de Elimi-
nação foi conduzida por um período rela-
tivamente curto (o tempo necessário para
a emissão de 20 respostas alternativas),
na mesma sessão em que, posteriormente,
a fase de Teste foi conduzida. É possível,
portanto, que a ressurgência observada
para cada pombo nesse experimento tenha
sido parcialmente induzida pela ocorrência
de reforços na etapa final da fase de Elimi-
nação (lembre-se que 3 s de acesso a grãos
serviram como reforços para as respostas
alvo, na fase de Treino, e para as respostas
alternativas, na fase de Eliminação). No en-
tanto, vale ressaltar que, para cada pombo, a
ressurgência foi observada no experimento
de Epstein apenas quando os reforços para
a resposta alternativa foram descontinua-
dos, e não enquanto esses reforços estavam
sendo produzidos. Além disso, experimen-
tos subsequentes demonstraram que a res-
surgência ocorre mesmo quando a fase de
Eliminação é conduzida por várias sessões
de duração mais longa do que aquela pro-
gramada por Epstein (e.g., Lieving & Lattal,
2003; Podlesnik et al., 2006; Podlesnik &
Shahan, 2009) e quando a transição entre
as fases de Eliminação e Teste ocorre não
na mesma sessão, mas entre sessões. Nes-
se último caso, não há reforços disponíveis
para qualquer resposta durante toda a fase
de Teste.
DESDOBRAMENTOS
A beleza de uma ciência experimen-
tal é que os resultados de um experimen-
to respondem algumas perguntas, mas le-
vantam uma série de novas perguntas que
requerem estudos adicionais. Ao discutir
seus resultados, Epstein (1983) afirmou que
muitas variáveis poderiam influenciar a
ressurgência como, por exemplo, os esque-
mas de reforçamento que mantêm a respos-
ta alvo e a resposta alternativa, o tipo e a
magnitude dos reforços que mantêm essas
respostas, a duração das fases de Treino e
de Eliminação (i.e., o tempo em que respos-
tas alvo e alternativa são reforçadas) e tam-
bém as condições em que a resposta alvo foi
extinta (i.e., o número de sessões) e a taxa
de respostas alvo antes do reforçamento da
resposta alternativa. Além disso, ele suge-
riu que o fenômeno da ressurgência esta-
ria possivelmente envolvido no que cha-
mamos de criatividade e de resolução de
problemas. Com essas afirmações, Epstein
levantou uma série de questões que pode-
riam ser experimentalmente investigadas e
ressaltou a utilidade do conhecimento so-
bre o fenômeno da ressurgência para a aná-
lise de outros padrões comportamentais.
Os resultados de Epstein (1983) têm
sido replicados em diversos laboratórios
desde então, com diferentes espécies (e.g.,
ratos, Podlesnik et al., 2006; humanos, Wil-
Carlos Renato Xavier Cançado, Flávia Hauck, Ítalo S. C. Teixeira
57
son & Hayes, 1996; peixes, da Silva, Cança-
do & Lattal, 2014) e com algumas modifica-
ções do procedimento descrito pelo autor
(ver Pontes e Abreu-Rodrigues, 2015). As
variáveis que possivelmente influencia-
riam a ressurgência, indicadas por Epstein
e descritas anteriormente, vêm sendo estu-
dadas sistematicamente desde então. Dife-
rente do que indicaram os resultados de seu
experimento (Epstein, 1983), alguns estudos
sugerem que o número de sessões na fase
de Treino pode influenciar a magnitude da
ressurgência. Ressurgência de maior mag-
nitude tende a ocorrer quando a fase de
Treino é conduzida por um número maior
de sessões (e.g., Bruzek et al., 2009; Dou-
ghty, Cash, Finch, Holloway & Wallington,2010). No entanto, resultados inconsisten-
tes entre estudos têm sido obtidos quando
a duração da fase de Eliminação é manipu-
lada. Em alguns estudos, a magnitude da
ressurgência foi maior quando a duração
da fase de Eliminação foi menor (e.g., Lei-
tenberg, et al., 1975; ver também Sweeney &
Shahan, 2013b). Em outros estudos, a dura-
ção da fase de Eliminação não influenciou
a magnitude da ressurgência (e.g., Lieving &
Lattal, 2003, Winterbauer, Lucke & Bouton,
2013).
Hoje sabemos que a ressurgência é
um fenômeno replicável interssujeitos e
também intrassujeitos (i.e., após a exposi-
ção repetida dos mesmos sujeitos ao pro-
cedimento de três fases; e.g., Cançado &
Lattal, 2011; Lieving & Lattal, 2003). Além
disso, sabemos que a magnitude da ressur-
gência é influenciada pela taxa de reforços
em vigor nas fases de Treino (Podlesnik &
Shahan, 2009, 2010) e Eliminação (Cança-
do, Abreu-Rodrigues & Aló, 2015; Sweeney
& Shahan, 2013a). Em geral, taxas altas de
reforços nessas duas fases produzem res-
surgência de maior magnitude do que ta-
xas baixas de reforços. Temos também
evidências que unidades comportamentais
mais complexas, como diferentes padrões
temporais de resposta (Cançado & Lattal,
2011) e sequências espaciais de respostas
(Sánchez-Carrasco & Nieto, 2005; Reed
& Morgan, 2006) ressurgem assim como
respostas discretas como bicar um disco,
pressionar uma barra ou um botão de res-
postas. Esse último achado pode ser rele-
vante para interpretar resultados de alguns
estudos que mostram que ressurgência de
maior magnitude é observada quando, na
fase de Treino, a resposta alvo ocorre em
taxas altas do que quando ocorre em taxas
baixas (da Silva, et al., 2008; Reed & Mor-
gan, 2007). O que esses últimos resultados
podem indicar é a ressurgência de padrões
diferentes de respostas (i.e., taxas altas e ta-
xas baixas) estabelecidos na fase de Treino.
Por fim, vale ressaltar que a ressurgência de
respostas mantidas por contingências de
reforçamento negativo (ao invés de contin-
gências de reforçamento positivo, como no
experimento de Epstein) tem sido demons-
trada com humanos no laboratório (Bruzek
et al., 2009; Alessandri, Lattal & Cançado,
2015) e em ambientes não laboratoriais (e.g.,
Volkert, Lerman, Call & Trosclair-Lasserre,
2009).
Capítulo III | Ressurgência Comportamental
58
Epstein (1983) destacou a relevância
do fenômeno da ressurgência para a análise
de fenômenos como a criatividade e a re-
solução de problemas (ver também Epstein,
1996). Mas a ressurgência pode ser relevan-
te também para compreender outros fenô-
menos, como, por exemplo, a recaída (e.g.,
de comportamentos mantidos por drogas,
Podlesnik et al., 2006; ou de outros compor-
tamentos de relevância aplicada; Lieving,
Hagopian, Long & O’Connor, 2004; ver
também, Bouton, 2011; Podlesnik & Kelley,
2015; e St Peter, 2015). Se você pensar no
procedimento de três fases para o estudo da
ressurgência, verá que o procedimento se
adequa bem como um modelo experimen-
tal para o estudo da recaída. No laborató-
rio com não humanos, por exemplo, pode-
mos reforçar as respostas alvo com drogas
na fase de Treino (e.g., álcool, Podlesnik et
al.; ou cocaína Quick, Pyszczynski, Colston
& Shahan, 2011) e as respostas alternativas
com comida, na fase de Eliminação (a fase
de Teste consistiria, assim como no estu-
do de Epstein, em descontinuar a comida
que mantém as respostas alternativas). Em
contextos aplicados, a resposta alvo pode
ser um comportamento problema cuja fre-
quência temos interesse em reduzir (e.g.,
agressão, autoagressão, abuso de drogas e
outras substâncias) e respostas alternativas
são comumente aquelas mais apropriadas
para o contexto em que vive o participante
e que resultam de uma intervenção com-
portamental como reforçamento diferen-
cial de respostas alternativas (Marsteller &
St Peter, 2014; Volkert et al., 2009).
Recentemente, esforços de pesquisa-
dores e pesquisadoras em contextos labo-
ratoriais e não laboratoriais têm produzido
achados interessantes sobre a ressurgência.
Esses achados não apenas aumentam nosso
conhecimento sobre o fenômeno, mas ser-
vem como base para lidar com o fenômeno
nos mais diversos contextos. Consideran-
do-se a data de publicação do experimen-
to de Epstein (1983), a área de pesquisas
sobre ressurgência é relativamente jovem.
A ressurgência é um tema desafiador – é
um fenômeno transitório (Sidman, 1960) e,
como qualquer fenômeno transitório, exige
esforço de pesquisadores e pesquisadoras
na elaboração das melhores condições para
seu estudo. Análises experimentais siste-
máticas dos efeitos de variáveis de controle
já conhecidas sobre a ressurgência são in-
teressantes e necessárias. Ao conduzirmos
tais análises, certamente descobriremos
novas variáveis de controle e relações entre
essas variáveis na determinação da ressur-
gência.
CONSIDERAÇÕES FINAIS
Por quê estudar a ressurgência, ou a
recorrência do comportamento de maneira
geral, é interessante? Primeiramente, trata-
-se de um fenômeno natural e seu estudo,
por si só, se justifica. Além disso, é útil co-
nhecer suas variáveis de controle para al-
terar sua probabilidade de ocorrência onde
quer que isso seja necessário. Há contextos
em que a recorrência de comportamentos
Carlos Renato Xavier Cançado, Flávia Hauck, Ítalo S. C. Teixeira
59
é indesejável, mas ocorrem mesmo assim
(e.g., a recorrência de comportamentos-pro-
blema e a recaída). Há outros contextos em
que seria desejável e pode não ocorrer (e.g.,
em contextos de resolução de problemas e
quando temos interesse no estabelecimento
de comportamentos novos).
No início de seu artigo, Epstein (1983)
afirma que o fato que comportamentos pre-
viamente reforçados tendem a recorrer
quando comportamentos atuais deixam de
produzir reforços (i.e., ressurgência) teria
“um potencial de aplicação amplo” (p. 391).
Talvez apenas recentemente, dado o acu-
mulo de evidências experimentais sobre o
fenômeno, tenhamos passado a explorar
mais as implicações do estudo da ressur-
gência para uma análise experimental do
comportamento e para a aplicação dos prin-
cípios comportamentais em contextos não
laboratoriais. Durante aproximadamente
20 anos, desde a publicação do trabalho
de Epstein até a publicação de uma série
de experimentos conduzidos por Lieving e
Lattal (2003), estudos sobre a ressurgência
foram escassos e envolveram comumente
a análise de condições em que o fenômeno
ocorre ou não (ver Pontes & Abreu-Rodri-
gues, 2015). Recentemente, contudo, aná-
lises experimentais sistemáticas têm sido
direcionadas à descrição de variáveis que
alteram não apenas a ocorrência da ressur-
gência, mas também sua magnitude. Um
maior refinamento experimental permite
descrever não apenas quando o fenômeno
irá ocorrer, mas também especificar como
e em que grau o fenômeno será observado.
Essa é uma tarefa que aguarda aqueles in-
teressados na ressurgência e na recorrência
de comportamentos em geral.
PARA SABER MAIS
Lieving & Lattal (2003). Série de quatro ex-
perimentos conduzidos com pombos. Uma
das primeiras análises experimentais sis-
temáticas sobre a ressurgência conduzida
após a publicação do experimento de Eps-
tein (1983).
Podlesnik, Gimenez-Gomez, & Shahan
(2006). Experimento conduzido com ratos
sobre a ressurgência de comportamentos
previamente mantidos por álcool. Os auto-
res apresentam nesse artigo o procedimen-
to para o estudo da ressurgência como um
modelo experimental da recaída.
Podlesnik & Shahan (2009). Nesse artigo,
os efeitos sobre a ressurgência de taxas de
reforços diferenciais na fase de Treino (as-
sim como sobre outros fenômenos de recor-
rência, como o restabelecimento e a reno-
vação) são avaliados. Os autores propõem
uma relação entre as variáveis que deter-
minam a ressurgência (e a recorrência em
geral) e a resistência do comportamento à
mudança.
Bruzek, Thompson, & Peters (2009). Emdois experimentos conduzidos com hu-
manos, a ressurgência de comportamentos
Capítulo III | Ressurgência Comportamental
60
mantidos previamente por contingências
de reforçamento negativo (fuga) foi estuda-
da.
Cançado, Abreu-Rodrigues, & Aló (2015).
Em dois experimentos conduzidos com ra-
tos, os efeitos sobre a ressurgência de taxa
de reforços diferenciais na fase de Elimina-
ção foram avaliados parametricamente.
REFERÊNCIAS
Alessandri, J., Lattal, K. A., & Cançado, C.
R. X. (2015). The recurrence of negatively
reinforced responding of humans. Journal
of the Experimental Analysis of Behavior,
104, 211–222.
Antonitis, J. J. (1951). Response variability in
the white rat during conditioning, extinc-
tion, and reconditioning. Journal of Experi-
mental Psychology, 42, 273-281.
Bouton, M. E. (2011). Learning and the per-
sistence of appetite: Extinction and the
motivation to eat and overeat. Physiology &
Behavior, 103, 51–58.
Bruzek, J. L., Thompson, R. H., & Peters,
L. C. (2009). Resurgence of infant caregi-
ving responses. Journal of the Experimental
Analysis of Behavior, 92, 327-343.
Cançado, C. R. X., Abreu-Rodrigues, J., &
Aló, R. M. (2015). Reinforcement rate and
resurgence: A parametric analysis. Revista
Mexicana de Análisis de la Conducta, 41,
84-115.
Cançado, C. R. X., & Lattal, K. A. (2011). Re-
surgence of temporal patterns of respon-
ding. Journal of the Experimental Analysis
of Behavior, 95, 271-287.
Carey, J. P. (1951). Reinstatement of previou-
sly learned responses under conditions of
extinction: A study of “regression” [Abs-
tract]. American Psychologist, 6, 284.
da Silva, S. P., Cançado, C. R. X., & Lattal,
K. A. (2014). Resurgence in Siamese fighting
fish, Betta splendens. Behavioural Proces-
ses, 103, 315-319.
da Silva, S. P., Maxwell, M. E., & Lattal, K.
A. (2008). Concurrent resurgence and beha-
vioral history. Journal of the Experimental
Analysis of Behaviour, 90, 313-331.
Doughty, A. H., Cash, J. D., Finch, E. A.,
Holloway, C., & Wallington, L. K. (2010). Ef-
fects of training history on resurgence in
humans. Behavioural Processes, 83, 340-
343.
Epstein, R. (1983). Resurgence of previou-
sly reinforced behavior during extinction.
Behaviour Analysis Letter, 3, 391–397.
Epstein, R. (1985). Extinction-induced re-
surgence: Preliminary investigations and
possible applications. The Psychological Re-
cord, 35, 143-153.
Carlos Renato Xavier Cançado, Flávia Hauck, Ítalo S. C. Teixeira
61
Epstein, R. (1996). Cognition, creativity &
behavior: Selected essays. Westport, CT:
Praeger
Epstein, R. (2015). On the rediscovery of the
principle of resurgence. Revista Mexicana
de Análisis de la Conducta, 41, 19-43.
Epstein, R., & Skinner, B. F. (1980). Resur-
gence of responding after the cessation of
response-independent reinforcement. Pro-
ceedings of the National Academy of Scien-
ces of the United States of America, 77, 6251-
6253.
Franks, G. J, & Lattal, K. A. (1976). Antece-
dent reinforcement schedule training and
operant response reinstatement in rats.
Animal Learning & Behavior, 4, 374-378.
Laraway, S., Snycerski, S., Michael, J., &
Poling, A. (2003). Motivating operations
and terms to describe them: Some further
refinements. Journal of Applied Behavior
Analysis, 36, 407-414.
Lattal, K. A., & St. Peter Pipkin, C. (2009).
Resurgence of previously reinforced res-
ponding: Research and application. The
Behavior Analyst Today, 10, 254-266.
Leitenberg, H., Rawson, R. A., & Bath, K. B.
(1970). Reinforcement of competing beha-
vior during extinction. Science, 169, 301-
303.
Leitenberg, H., Rawson, R. A., & Mulick, J.
A. (1975). Extinction and reinforcement of
alternative behavior. Journal of Compara-
tive and Physiological Psychology, 88, 640-
652.
Lieving, G. A., Hagopian, L. P., Long, E. S.,
& O’Connor, J. (2004). Response-class hie-
rarchies and resurgence of severe problem
behavior. The Psychological Record, 54,
621–634.
Lieving, G. A, & Lattal, K. A. (2003). Recen-
cy, repeatability, and reinforcer retrench-
ment: An experimental analysis of resur-
gence. Journal of the Experimental Analysis
of Behavior, 80, 217-233.
Marsteller, T. M., & St Peter, C. C. (2014). Ef-
fects of fixed-time reinforcement schedules
on resurgence of problem behavior. Journal
of Applied Behavior Analysis, 47, 455-469.
Miguel, C. F. (2000). O conceito de opera-
ção estabelecedora na análise do compor-
tamento. Psicologia: Teoria e Pesquisa, 16,
259-267.
Pavlov, I. P. (1927). Conditioned reflexes: An
investigation of the physiological activity of
the cerebral cortex. Londres: Oxford Uni-
versity Press.
Podlesnik, C. A, Jimenez-Gomez, C., &
Shahan, T. A. (2006). Resurgence of alcohol
seeking produced by discontinuing non-
-drug reinforcement as an animal model of
Capítulo III | Ressurgência Comportamental
62
drug relapse. Behavioural Pharmacology,
17, 369-374.
Podlesnik, C. A, & Kelley, M. E. (2015). Trans-
lational research on the relapse of operant
behavior. Revista Mexicana de Análisis de
la Conducta, 41, 226-251.
Podlesnik, C. A, & Shahan, T. A. (2009).
Behavioral momentum and relapse of ex-
tinguished operant responding. Learning &
Behavior, 37, 357-364.
Podlesnik, C. A., & Shahan, T. A. (2010). Ex-
tinction, relapse, and behavioral momen-
tum. Behavioural Processes, 84, 400-411.
Pontes, T. R. N., & Abreu-Rodrigues, J. (2015).
Ressurgência comportamental: Uma revi-
são. Acta Comportamentalia, 23, 339-353.
Quick, S. L., Pyszczynski, A. D., Colston, K.
A., & Shahan, T. A. (2011). Loss of alternative
non-drug reinforcement induces relapse of
cocaine-seeking in rats: Role of dopamine
D(1) receptors. Neuropsychopharmacology,
36, 1015–1020.
Reed, P., & Morgan, T. A. (2006). Resurgence
of response sequences during extinction in
rats shows a primacy effect. Journal of the
Experimental Analysis of Behavior, 86, 307-
315.
Reed, P., & Morgan, T. a. (2007). Resurgence
of behavior during extinction depends on
previous rate of response. Learning & Beha-
vior, 35, 106–114.
Reid, R. L. (1958). The role of the reinforcer
as a stimulus. British Journal of Psychology,
49, 202-209.
Sánchez-Carrasco, L., & Nieto, J. (2005).
Resurgence of three-response sequences
in rats. Revista Mexicana de Análisis de la
Conducta, 31, 215–226.
Sidman, M. (1960). Tactics of scientific rese-
arch: Evaluating experimental data in psy-
chology. Boston: Authors Cooperative, Inc.
Skinner, B. F. (2003). Ciência e Comporta-
mento Humano. (J. C. Todorov & R. Azzi,
Trad.). São Paulo: Martins Fontes (original
publicado em 1953).
Skinner, B. F. (1984). An operant analysis
of problem solving. Behavioral and Brain
Sciences, 7, 583-613.
Skinner, B. F. (1981). Selection by conse-
quences. Science, 213, 501–504.
St Peter, C. C. (2015). Six reasons why applied
behavior analysts should know about re-
surgence. Revista Mexicana de Análisis de
la Conducta, 41, 252–268.
Sweeney, M. M., & Shahan, T. A. (2013a).
Effects of high, low, and thinning rates of
alternative reinforcement on response eli-
mination and resurgence. Journal of the Ex-
perimental Analysis of Behavior, 100, 102-
Carlos Renato Xavier Cançado, Flávia Hauck, Ítalo S. C. Teixeira
63
116.
Sweeney, M. M., & Shahan, T. A. (2013b).
Behavioral momentum and resurgence :
Effects of time in extinction and repeated
resurgence tests. Learning & Behavior, 41,
414-424.
Volkert, V. M., Lerman, D. C., Call, N. A., &
Trosclair-Lasserre, N. (2009). An evaluation
of resurgence during treatment with func-
tional communication training. Journal of
Applied Behavior Analysis, 42, 145-160.
Wilson, K. G., & Hayes, S. C. (1996). Resur-
gence of derived stimulus relations. Journal
of the Experimental Analysis of Behavior,
66, 267-281.
Winterbauer, N. E., Lucke, S., & Bouton,
M. E. (2013). Some factors modulating the
strength of resurgence after extinction of
an instrumental behavior. Learning andMotivation, 44, 60-71.
João Cláudio Todorov, Rafaela M. Fontes Azevedo
64
Clarice Lispector,
tempo e consequências:
considerações sobre
contraste comportamental
João Cláudio Todorov
Rafaela M. Fontes Azevedo
Universidade de Brasília
Reynolds, G. S. (1961). Behavioral contrast. Journal of the Experimental Analysis
Behavior, 4, 57-71.
“Observo em mim mesma as mudanças de estação: eu claramente mudo com elas”
Clarice Lispector
Capítulo IV | Contraste Comportamental
65
INTRODUÇÃO À ÁREA DE PES-
QUISA E CONTEXTUALIZAÇÃO
DO EXPERIMENTO
A noção de que o comportamento é
selecionado por suas consequências é an-
tiga, anterior a Thorndike (e.g., 1911, 1927).
Skinner (1957/1978) inicia seu livro sobre
comportamento verbal com uma frase de
impacto: “Os homens agem sobre o mundo,
modificam-no e, por sua vez são modifica-
dos pelas consequências de sua ação” (p.15).
Consequências parecem ser a marca
registrada da Análise do Comportamento,
como demonstram alguns livros recentes
(Biglan, 2015; Madden, 2013; McSweeney &
Murphy, 2014a; Schneider, 2012). Mas con-
sequências não seguem comportamentos
no vácuo. O contexto no qual o comporta-
mento ocorre também é relevante (Skinner,
1953/2003). Skinner (1938) afirmou que, em-
bora a resposta possa ocorrer em diversas si-
tuações, apenas em parte dessas situações a
sua emissão será efetiva em produzir refor-
ços. Assim, o contexto no qual o comporta-
mento ocorre (i.e., eventos antecedentes ao
comportamento) acaba exercendo funções
muito importantes por sinalizar quando e
quais tipos de consequências estarão dispo-
níveis. Em função disso, o comportamento
operante deve ser sempre compreendido a
partir da contingência tríplice: Eventos que
antecedem o comportamento (estímulos
discriminativos), o próprio comportamento,
e as consequências que seguem a sua emis-
são (reforço ou punição; e.g., Skinner, 1938,
1953/2003).
Os estímulos discriminativos (SD)
podem ser qualquer variável presente no
contexto atual do indivíduo. São estímulos
que sinalizam a disponibilidade da conse-
quência e dão “dicas” sobre a probabilidade
de o comportamento ser ou não reforçado
ou punido. Quando determinadas consequ-
ências estão disponíveis apenas para res-
postas emitidas em um determinado con-
texto (na presença de determinado SD) e
quando o indivíduo passa a responder ape-
nas nesse contexto, dizemos que o respon-
der é discriminado (Skinner, 1938). Porém,
para sabermos se o responder é discrimi-
nado ou não é preciso que haja pelo menos
dois contextos correlacionados diferencial-
mente com a produção da consequência
(e.g. contextos diferentes que sinalizam a
presença de tipos de consequências dife-
rentes, ou que sinalizam presença vs. au-
sência de consequências, ou mesmo que si-
nalizam diferentes relações entre a emissão
da resposta e a apresentação do reforço). Ao
observarmos mudanças no comportamento
do indivíduo em função de mudanças nos
estímulos antecedentes poderemos afirmar
que há controle discriminativo, isto é, que o
comportamento está sob o controle de estí-
mulos (Catania, 1999).
Controle discriminativo, portanto, se
refere à influência que o contexto exerce
sobre o comportamento (Moreira & Medei-
ros, 2007) e, para estuda-lo é preciso treinar
o comportamento em contextos diferentes
João Cláudio Todorov, Rafaela M. Fontes Azevedo
66
(na presença de estímulos distintos). Isto é,
é preciso expor o indivíduo a situações nas
quais a disponibilidade da consequência
é diferencialmente correlacionada a dife-
rentes estímulos antecedentes. Por isso, o
esquema mais tradicionalmente utilizado
para investigar controle discriminativo tem
sido o esquema múltiplo.
Esquemas de reforçamento ou pu-
nição são relações condicionais entre o
comportamento dos organismos e eventos
no ambiente e são geralmente utilizados
como variáveis independentes na Análi-
se do Comportamento (Ferster & Skinner,
1957). Assim, ao estabelecer um esquema
de reforçamento se estabelece uma rela-
ção “se, então” que indicará quais as con-
dições (e.g. número de respostas, interva-
lo de tempo necessário entre as respostas,
etc.) para a apresentação da consequência.
Por exemplo, em um esquema de razão fixa
se estabelece um número fixo de respostas
que deve ser emitido pelo organismo para
que a consequência seja apresentada. Em
um esquema de reforçamento, geralmente
se estabelece também uma relação condi-
cional com o estímulo antecedente. Assim,
a relação entre a resposta e a consequência
depende do estímulo antecedente presente
no momento: se na situação A o compor-
tamento B ocorrer, então a consequência C
será apresentada (Todorov, 2002, 2012).
Como indicado anteriormente, um
esquema comumente utilizado para de-
monstrar o controle estabelecido pelos estí-
mulos antecedentes é o esquema múltiplo.
Em um esquema múltiplo, dois ou mais
esquemas de reforçamento são correlacio-
nados a diferentes estímulos antecedentes.
Cada um desses esquemas de reforçamento
correlacionados a diferentes estímulos an-
tecedentes compõe o que se chama de com-
ponente (Ferster & Skinner, 1957). Em um
experimento de laboratório com animais
não-humanos podemos ter, por exemplo,
um esquema múltiplo com dois compo-
nentes: em um sempre há uma luz acesa e
a emissão da resposta é sempre seguida por
comida e no outro não há luz e a resposta
nunca é seguida por comida. Têm-se, assim,
dois contextos diferentes (presença vs. au-
sência de luz) correlacionados com esque-
mas diferentes (reforço vs. extinção). Pode-
-se afirmar que o responder é discriminado,
nesse exemplo, se o organismo responde
mais na presença da luz do que na sua au-
sência.
Embora no treino discriminativo
simples seja comum a utilização de alter-
nação de estímulos antecedentes correla-
cionados a reforço e extinção (e.g. Hanson,
1959; Skinner, 1938; Smith & Hoy, 1954), ge-
ralmente os experimentos com esquemas
múltiplos utilizam dois ou mais componen-
tes nos quais diferentes esquemas de refor-
çamento (e.g. razão fixa ou variável, inter-
valo fixo ou variável) estão em vigor, sendo
cada um sinalizado por um estímulo an-
tecedente diferente, porém, correlaciona-
dos a tipos semelhantes de consequências
(Ferster & Skinner, 1957). Por exemplo, po-
Capítulo IV | Contraste Comportamental
67
demos ter um esquema múltiplo com dois
componentes programados da seguinte
forma: em um componente há sempre um
tom e a consequência é produzida a partir
de um esquema de razão fixa (a cada X res-
postas, a comida é apresentada) e no outro
componente o tom está sempre ausente e
a consequência é produzida a partir de um
esquema de intervalo fixo (a comida é apre-
sentada para a primeira resposta emitida
após X min). Nesse caso, pode-se afirmar
que o responder é discriminado se for ob-
servado que a taxa e o padrão de respostas
são diferenciados entre os componentes.
Uma das utilidades do esquema múltiplo é,
então, demonstrar como o comportamento
muda em função de mudanças no contexto,
dado que as mudanças no contexto sinali-
zam mudanças nas contingências em vigor.
Herrnstein e Brady (1958) afirmaram
que o esquema múltiplo pode ser uma boa
ferramenta para comparações intrassujei-
tos dentro de uma mesma sessão em função
da independência entre o desempenho nos
componentes. Porém, em diversos experi-
mentos (inclusive no experimento de Herr-
nstein & Brady) tornou-se evidente que os
desempenhos entre os componentes podem
não ser independentes, isto é, o que ocorre
em um dos componentes de um esquema
múltiplo pode influenciar o comportamen-
to que ocorre no outro componente. À mu-
dança do comportamento em um contexto
(SD) em função de alterações nas condições
em vigor em outro contexto (diferente SD)
chama-se interação (Reynolds, 1961b). Essa
interação entre os componentes do esque-
ma múltiplo pode ser estudada alterando-
-se as condições em um componente en-
quanto as condições no outro componente
são mantidas constantes. Assim, oobjetivo
ao se estudar a interação é observar como
mudanças nas condições de um contexto
afetam o comportamento em outro contex-
to inalterado.
Diversos experimentos foram reali-
zados para investigar essa interação entre
componentes (e.g. Findley, 1958, Herrick,
Myers & Korotkin, 1959, Reynolds, 1961b,
1961c) e o que se observou é que alterações
que diminuem a taxa de respostas em um
componente (e.g., extinção) geralmente
produzem aumentos na taxa de respostas
no componente inalterado. Além disso, al-
terações que aumentam a taxa de respostas
em um componente produzem diminuições
na taxa de respostas no componente inal-
terado. A esse efeito de interação foi dado
o nome de contraste comportamental (con-
traste positivo, no primeiro caso, e contras-
te negativo no segundo). Assim, contraste
comportamental se refere a uma mudança
na taxa de respostas na presença de um
estímulo que é oposta à mudança na taxa
de respostas na presença de outro estímulo
(Reynolds, 1961a).
Embora o contraste seja um efeito
comumente observado durante a formação
de uma discriminação entre dois ou mais
estímulos (e.g., quando um deles é corre-
lacionado ao reforço e o outro a extinção),
João Cláudio Todorov, Rafaela M. Fontes Azevedo
68
o contraste ocorre também em condições
em que há reforço programado na presença
de ambos os estímulos, porém com varia-
ções na taxa de reforços entre eles. Findley
(1958), por exemplo, relatou que a taxa de
respostas em um componente, um esquema
de intervalo variável (VI) 6 min, aumentou
quando no outro componente, um VI maior
do que 6 min programava uma menor taxa
de reforços em relação ao VI 6 min.
Porém, até a década de 1960, o que
se observava nos experimentos realizados
sobre contraste (e.g. Herrick, et al., 1959;
Reynolds, 1961b) era que a taxa de respostas
covariava consistentemente com a taxa de
reforços (i.e., diminuições na taxa de refor-
ços eram seguidas de diminuições na taxa
de respostas e aumentos na taxa de refor-
ços eram seguidos por aumentos na taxa
de respostas) e não se sabia dizer qual das
duas variáveis era responsável pelo con-
traste comportamental. Permanecia então a
questão: A taxa de respostas no componen-
te inalterado aumenta porque a taxa de res-
postas do segundo componente diminui ou
porque a taxa de reforços do segundo com-
ponente diminui? Por isso, em 1961, Rey-
nolds resolveu conduzir um estudo para
responder a essa questão.
DESCRIÇÃO DO EXPERIMENTO
Objetivo e Método
A proposta de Reynolds (1961a) foi
conduzir um estudo no qual taxa de refor-
ços e taxa de respostas pudessem ser expe-
rimentalmente isoladas para observar como
cada variável influenciava o contraste e as-
sim, poder verificar se o fenômeno era fun-
ção de mudanças na taxa de reforços ou na
taxa de respostas. Reynolds encontrou uma
solução relativamente simples e interes-
sante para responder a sua pergunta: Dimi-
nuir a taxa de respostas sem alterar a taxa
de reforços.
Para isso, Reynolds (1961a) utilizou
quatro pombos e uma caixa operante com
um disco que poderia ser iluminado por
quatro cores diferentes. Durante o experi-
mento, cada pombo era colocado na câma-
ra experimental e respostas de bicar o disco
produziam acesso a comida. Reynolds di-
vidiu o seu estudo em quatro procedimen-
tos subdivididos em várias fases. Em cada
procedimento havia um esquema múltiplo
com dois componentes e, em cada compo-
nente, o disco era iluminado por uma cor
diferente (SD). Diversos tipos de alterações
foram feitas em um dos componentes do
múltiplo a fim de verificar quais variações
nesse componente levariam a mudanças
na taxa de respostas no outro componen-
te, que permanecia inalterado ao longo das
fases.
Em todos os procedimentos, inicial-
mente, um VI 3 min esteve em vigor em
cada componente do múltiplo. Isto é, em
média, a primeira resposta após 3 min pro-
duzia o reforço. Cada componente ficava
em vigor por 3 min e eram apresentados de
Capítulo IV | Contraste Comportamental
69
maneira alternada. Em cada sessão, cada
componente era apresentado 30 vezes. Os
procedimentos variaram em relação às al-
terações realizadas em um dos componen-
tes, sendo no primeiro sempre mantido um
VI 3 min (de agora em diante, chamaremos
o componente mantido com o VI 3 min de
componente constante e o componente no
qual as manipulações foram realizadas de
componente alterado).
No Procedimento I, para o compo-
nente alterado foi programado um timeout
em umas das fases (todas as luzes da caixa
operante eram apagadas e não havia apre-
sentação de reforço para nenhuma das res-
postas emitidas) e extinção em outra fase
(o estímulo continuava a ser apresentado,
porém, não havia apresentação do reforço).
No Procedimento II, para o componente al-
terado, foi programado um esquema de re-
forçamento diferencial de outros compor-
tamentos (DRO¹) 50 ou 75 s para uma das
fases e extinção para outra. A programação
do DRO no Procedimento II teve como ob-
jetivo garantir que a taxa de respostas di-
minuísse sem que houvesse uma redução
na taxa de reforços, dado que sempre que
os pombos não respondessem (por 50 ou 75
s) o reforço seria apresentado. A ordem de
mudança para DRO ou extinção, no com-
ponente alterado, foi contrabalanceada en-
tre os pombos (i.e., para alguns pombos o
componente foi alterado para o DRO e só
depois para extinção e para outros pombos
a ordem de alteração foi inversa). O Proce-
dimento III foi uma combinação dos dois
procedimentos anteriores e a manipula-
ção feita no componente alterado foi uma
combinação do timeout com o DRO, ou
seja, todas as luzes da caixa experimental
eram apagadas e reforços eram produzidos
se os pombos não respondessem durante o
intervalo do DRO. Um procedimento adi-
cional foi realizado para controlar o efeito
do aumento na taxa de reforços sob o DRO
e, para isso, ao final da última sessão do
Procedimento III, aumentou-se o peso dos
animais (i.e., diminuiu-se a privação) e, en-
tão, no dia seguinte os animais foram nova-
mente expostos às mesmas condições que
haviam sido programadas no Procedimento
II, no qual para o componente alterado foi
programado um DRO em uma fase, e extin-
ção na fase seguinte.
As manipulações realizadas por Rey-
nolds (1961a) possibilitaram a comparação
de condições nas quais a diminuição da
taxa de respostas estava correlacionada à
diminuição na taxa de reforços (i.e., alteran-
do o segundo componente para extinção ou
timeout) e condições nas quais a diminui-
ção da taxa de respostas não estava corre-
lacionada à diminuição na taxa de reforços
(i.e., alterando o segundo componente para
um DRO). Dessa forma, foi possível iso-
lar experimentalmente os efeitos da taxa
de respostas e da taxa de reforços sobre o
contraste comportamental. Se o contraste
1 Em um DRO, o reforço só é apresentado se o organismo cumprir o
intervalo estabelecido sem emitir determinada resposta. No presente
experimento, caso o pombo passasse 50 ou 75 s sem bicar o disco a
comida era apresentada.
João Cláudio Todorov, Rafaela M. Fontes Azevedo
70
dependesse de variações apenas na taxa
de respostas, em todas as condições o con-
traste deveria ocorrer, já que em todas ha-
veria uma redução da taxa de resposta no
componente alterado. Porém, se é a altera-
ção na taxa de reforços a variável relevan-
te, então, o contraste só deveria ocorrer nas
condições nas quais houvesse variação da
taxa de reforços no componente alterado
(i.e., nas condições em que foram progra-
mados timeout ou extinção) e não deveria
ocorrer nas condições em que o DRO estava
em vigor (i.e., a taxa de reforços nessa con-
dição não era alterada). Portanto, se a taxa
de respostas no componente constante au-
mentasse quando mudanças fossem feitas
no componente alterado em todas as con-
dições, a taxa de respostas poderia ser en-
tendida como variável mais relevante. No
entanto, se a taxa de respostas do compo-
nente constante só variasse nas condições
em que houve mudançasna taxa de refor-
ços no componente alterado, então a taxa
de reforços seria a principal variável deter-
minante do contraste.
Resultados e Discussão
Os resultados indicaram que altera-
ções na taxa de reforços, e não na taxa de
respostas, em um dos componentes do múl-
tiplo é a variável que determina o contraste
comportamental (Reynolds, 1961a). Tanto
timeout quanto extinção no componente
alterado produziram aumentos na taxa de
respostas do componente constante. Po-
rém, quando o DRO estava em vigor no
componente alterado, combinado ou não
com timeout, aumentos na taxa de respos-
tas do componente constante (independen-
te do peso corporal dos pombos) não foram
observados. De maneira geral, o contraste
foi observado nas condições onde não ha-
via reforços em um componente (timeout
e extinção), mas não foi observado quando
havia reforço disponível nesse componen-
te, embora a taxa de respostas durante o
componente alterado tenha diminuído em
todas as condições.
Reynolds (1961a) propôs duas expli-
cações para a não ocorrência do contraste
nas condições em que um DRO estava em
vigor no componente alterado. Uma expli-
cação é que o contraste pode não ter acon-
tecido porque, sob o DRO, pausas (i.e., não
bicar o disco) foram reforçadas e isso pode
ter induzido a ocorrência de pausas tam-
bém no componente constante, em que o
VI 3 min continuava em vigor. Uma outra
explicação é que o contraste poderia não
ter ocorrido porque a diminuição na taxa de
reforços, e não de respostas, é a condição
necessária para a ocorrência do contraste
e, dessa forma, o DRO eliminou este efeito
uma vez que não houve redução na taxa de
reforços sob esse esquema, como indicado
anteriormente.
Como o aumento da taxa de respos-
tas foi imediato no componente constante
(VI 3 min) quando o DRO foi suspenso no
componente alterado (i.e., quando extinção
estava em vigor nesse componente), Rey-
Capítulo IV | Contraste Comportamental
71
nolds (1961a) afirmou que a taxa de reforços
é a variável mais relevante para a ocorrên-
cia do contraste. Para Reynolds, é a altera-
ção na frequência relativa de reforços (i.e., a
frequência de reforços na presença de um
estímulo em relação à frequência de refor-
ços na presença de ambos os estímulos) que
causa as alterações na taxa de respostas
que descrevemos como contraste.
DESDOBRAMENTOS
O experimento de Reynolds (1961a)
sugere que as consequências que são pro-
gramadas em um contexto afetam não só
o que fazemos naquele contexto, mas tam-
bém o que fazemos em outros contextos.
Portanto, o que um organismo faz em uma
situação depende não só das consequências
disponíveis naquela situação, mas também
das consequências disponíveis em situa-
ções diferentes (ver também Herrnstein,
1961, 1970).
Assim, para que seja possível com-
preender o que um indivíduo faz em um
determinado contexto muitas vezes será
preciso observar também o que ele faz em
outras situações e que tipos de consequ-
ências ele tem disponível de uma maneira
geral e não apenas em uma determinada
ocasião. É preciso, então, adotar uma pers-
pectiva relativa e entender que a função de
um estímulo pode ser não só a de sinalizar
as consequências disponíveis naquele con-
texto, mas as consequências disponíveis
naquele contexto em relação a todos os ou-
tros.
A partir da pesquisa de Reynolds
(1961a) muitas outras investigações foram
realizadas a fim de verificar o efeito da taxa
de reforços sobre a ocorrência e a magni-
tude do contraste, principalmente com o
objetivo de responder se a taxa de refor-
ços seria a única variável responsável pela
ocorrência do contraste, se seria a variável
principal, e que outras variáveis e explica-
ções seriam possíveis.
Experimentos manipulando diver-
sos tipos de esquemas em um dos com-
ponentes, para produzir diferentes taxas
de respostas sem alterar as taxas de re-
forços entre os componentes foram reali-
zados, corroborando a ideia de que a taxa
de reforços é realmente mais relevante do
que a taxa de respostas na determinação
do contraste (e.g. Bloomfield, 1967; Nevin,
1968; Reynolds, 1961d; Zuriff, 1970). Dado,
então, que a taxa relativa de reforços é
uma variável relevante para a ocorrência
do contraste, também foram estabelecidas
relações entre contraste e a Lei da Iguala-
ção (e.g. McLean & White, 1983; Williams
& Wixted, 1986). A Lei da Igualação prediz
que em situações de escolha (i.e. esquemas
concorrentes, nos quais os dois componen-
tes são apresentados simultaneamente e
o organismo deve escolher responder em
ou outro componente) a taxa de respostas
se igualará à taxa de reforços disponíveis.
Assim, situações de escolha caracteriza-
João Cláudio Todorov, Rafaela M. Fontes Azevedo
72
riam o caso mais evidente de interação, já
que a maneira como eu me comporto em
relação a uma das opções necessariamente
afetará o meu comportamento em relação à
outra opção, dado que ambas as respostas
não podem ser emitidas ao mesmo tempo.
Assim como a distribuição de respostas em
esquemas concorrentes é função da distri-
buição dos reforços entre os componentes,
essa interação também parece ocorrer mes-
mo quando as opções são apresentadas de
maneira sucessiva, e não simultânea, como
é o caso dos procedimentos para o estudo
do contraste (i.e., esquemas múltiplos). Em
ambos os casos, então, temos evidencia de
como a distribuição de reforços pode afetar
a distribuição das respostas.
Outra variável que parece afetar a
ocorrência do contraste é a duração dos
componentes, e muitos estudos foram con-
duzidos a fim de se investigar essa relação.
De maneira geral, observa-se que a magni-
tude do contraste é maior quanto menor for
a duração do componente (e.g. Charman &
Davison, 1982; Hinson, Malone, McNally &
Rowe, 1978; Shimp & Wheatley, 1971; Todo-
rov, 1972).
O estudo de Reynolds (1961a) foi
um primeiro passo para uma compreensão
mais precisa sobre a ocorrência do con-
traste, pois foi o primeiro a isolar os efeitos
de taxa de respostas e de reforços. Embo-
ra seus resultados tenham indicado a taxa
relativa de reforços como a principal vari-
ável responsável pela ocorrência do con-
traste, desde então diversas investigações
tem sido conduzidas a fim de se chegar a
um entendimento mais claro e a uma des-
crição mais acurada desse fenômeno (ver
Freeman, 1971; e Williams, 1983).
CONSIDERAÇÕES FINAIS
A conclusão de que é alteração da
taxa de reforços que produz a ocorrência do
contraste, entretanto, deve ser considerada
com cautela. Reynolds e Limpo (1968), por
exemplo, conduziram um experimento uti-
lizando um esquema de reforçamento dife-
rencial de taxas baixas (DRL) e observaram
que a taxa de respostas do componente
constante aumenta, apesar da taxa relativa
de reforços diminuir em relação à linha de
base.
Embora alterações na taxa relativa de
reforços pareçam estar diretamente relacio-
nadas à ocorrência do contraste, sendo re-
plicada em diversos trabalhos (e.g. Catania,
1961; Reynolds, 1963; Wilton & Gay, 1969),
essa pode não ser a única variável de con-
trole (e.g. Davison & Ferguson, 1978; Wilkie
1977; Williams, 1980). O mais importante a
ser considerado na literatura sobre contras-
te e sobre o trabalho de Reynolds (1961a),
especificamente, é o papel que outros con-
textos (passados e futuros) exercem sobre o
que acontece no momento atual.
Trabalhos publicados nos anos 1960
e 1970 foram decisivos para determinar o
Capítulo IV | Contraste Comportamental
73
progresso da Análise do Comportamento
nessa questão, destacando a função do con-
texto na determinação do comportamento
e demonstrando que diversos aspectos do
contexto exercem controle sobre o com-
portamento dos organismos. Esses diversos
aspectos devem, então, ser considerados ao
se analisar o que um organismo faz agora e
por quê faz. Para compreender o compor-
tamento atual de um organismo é preciso
levar em conta que seu comportamento é
influenciado não só pela contingência a
qual estáexposto, mas também pelo que
mais está acontecendo no ambiente na-
quele momento, ou seja, todas as demais
contingências disponíveis que concorrem
simultaneamente. Assim, para entender
o que o indivíduo faz precisamos analisar
todas as outras opções do que ele poderia
estar fazendo e todas as consequências pro-
gramadas para esses comportamentos con-
correntes (Herrnstein, 1961, 1970).
O comportamento atual pode ser
influenciado ainda por sinais do que vai
acontecer no futuro muito próximo (Rey-
nolds, 1961a, 1961b, 1961c; Reynolds & Lim-
po, 1968) e também do que já ocorreu no
passado, e assim, a ordem de ocorrência
dos eventos (o que o indivíduo acabou de
fazer e o que ele vai fazer em seguida) pode
controlar também o seu comportamen-
to atual (e.g. Catania & Gill, 1964; Nevin &
Shettleworth, 1966; Terrace, 1966a). Dessa
forma, ao analisarmos o papel do contexto
é preciso compreendê-lo de modo amplo e
dinâmico, tendo em vista circunstâncias e
variáveis passadas, presentes e futuras que
podem atuar no controle do comportamen-
to atual de um organismo.
Essa noção de interação entre dife-
rentes contextos pode ser especialmente
relevante no contexto aplicado e principal-
mente no tratamento de comportamentos
problema. Gross e Drabman (1981) fizeram
uma revisão de estudos sobre contraste
comportamental realizados com humanos
que demonstram a ocorrência do fenôme-
no. Uma das evidências que se tem é de que,
embora alguns tratamentos sejam eficazes
em reduzir o comportamento problema em
determinados contextos, esse mesmo com-
portamento pode aumentar de frequência
em outros contextos não correlacionados
ao tratamento (e.g. redução de comporta-
mentos inapropriados em casa, mas au-
mento desses mesmos comportamentos
na escola), caracterizando assim um efeito
de contraste comportamental. Então, ao se
pensar em intervenções comportamentais
é preciso sempre lembrar que os contextos
não podem ser compreendidos de maneira
isolada e que alterações em um contexto
podem acarretar mudanças comportamen-
tais em outros contextos aparentemente
não correlacionados.
PARA SABER MAIS
Terrace (1966b). Investigou se o uso de um
treino de discriminação mais extenso e uti-
lizando um procedimento de aprendizagem
João Cláudio Todorov, Rafaela M. Fontes Azevedo
74
sem erros pode eliminar o contraste com-
portamental.
Henke, Allen, & Davison (1972). Investi-
garam a função da amídala cerebelosa na
ocorrência de contraste, demonstrando di-
ferenças entre ratos com a região lesionada
e ratos sem lesões na região.
Koegel, Egel, & Williams (1980). Examina-
ram a ocorrência de contraste em interven-
ções comportamentais com crianças com
diagnóstico de autismo.
Killeen (2014). Propôs uma nova teoria ex-
plicativa para a ocorrência do contraste.
Boyle (2015). Realizou uma investigação
translacional sobre contraste comporta-
mental, avaliando a influência da ordem
dos contextos e de efeitos intrassessão em
adultos com deficiência intelectual.
REFERÊNCIAS
Biglan, A. (2015). The nurture effect. Oakland,
CA: New Harbinger Publications.
Boyle, M. A. (2015). A Translational Investi-
gation of Positive and Negative Behavioral
Contrast (Tese de Doutorado). Utah State
University, Logan. Retirada de All Gradu-
ate Theses and Dissertations. (Paper 4234).
Bloomfield, T. M. (1967). Behavioral con-
trast and relative reinforcement frequency
in two multiple schedules. Journal of the
Experimental Analysis of Behavior, 10, 151-
158.
Catania, A. C. (1961). Behavioral contrast
in a multiple and concurrent schedule of
reinforcement. Journal of the Experimental
Analysis of Behavior, 4, 335-342.
Catania, C.A. (1999). Aprendizagem: com-
portamento, linguagem e cognição. (Trad.
Deisy das Graça de Souza). Porto Alegre:
Artmed.
Catania, A. C., & Gill, C. A. (1964). Inhibi-
tion and behavioral contrast. Psychonomic
Science, 1, 257-258.
Charman, L., & Davison, M. (1982). On the
effects of component durations and compo-
nent reinforcement rates in multiple sche-
dules. Journal of the Experimental Analysis
of Behavior, 37, 417–439.
Davison, M., & Ferguson, A. (1978). The ef-
fects of different component response re-
quirements in multiple and concurrent
schedules. Journal of the Experimental
Analysis of Behavior, 29, 283–295.
Ferster, C. B., & Skinner, B. F. (1957). Sche-
dules of reinforcement. New York: Apple-
ton-Century-Crofts.
Findley, J. D. (1958). Preference and swit-
ching under concurrent scheduling. Journal
of the Experimental Analysis of Behavior, 1,
Capítulo IV | Contraste Comportamental
75
123-144.
Gross, A. M., & Drabman, R. S. (1981). Beha-
vioral contrast and behavioral therapy.
Behavior Therapy, 12, 231-246.
Hanson, H. M. (1959). Effects of discrimi-
nation training on stimulus generalization.
Journal of Experimental Psychology, 58,
321-334.
Henke, P. G., Allen, J. D., & Davison, C.
(1972). Effect of lesions in the amygdala on
behavioral contrast. Physiology and Beha-
vior, 8,173-176.
Herrick R. M., Myers J. L., & Korotkin A. L.
(1959). Changes in Sd and Sdelta rates du-
ring the development of an operant discri-
mination. Journal of Comparative and Phy-
siological Psychology, 52, 359–363.
Herrnstein, R. J. (1961). Relative and absolu-
te strength of response as a function of fre-
quency of reinforcement. Journal of the Ex-
perimental Analysis of Behavior, 4, 267-272.
Herrnstein, R. J. (1970). On the law of ef-
fect. Journal of the Experimental Analysis of
Behavior, 13, 243–266.
Herrnstein, R. J., & Brady, J. V. (1958). Inte-
ractions among components of a multiple
schedule. Journal of Experimental Analysis
of Behavior, 1, 293-301.
Hinson, J. M., Malone, J. C., McNally, K. A.,
& Rowe, D. W. (1978). Effects of component
length and of the transitions among com-
ponents in multiple schedules. Journal of
the Experimental Analysis of Behavior, 29,
3-16.
Killeen, P. R. (2014). A theory of behavio-
ral contrast. Journal of the Experimental
Analysis of Behavior, 102, 363-390.
Koegel, R. L., Egel, A. L., & Williams, J. A.
(1980). Behavioral contrast and generali-
zation across settings in the treatment of
autistic children. Journal of Experimental
Child Psychology, 30, 422-437.
Madden, G. J. (2013). APA handbook of
behavior analysis. Washington, DC: Ameri-
can Psychological Association.
McLean, A. P., & White, K. G. (1983). Tem-
poral constraint on choice: Sensitivity and
bias in multiple schedules. Journal of the
Experimental Analysis of Behavior, 39, 405-
426.
McSweeney, F. K., & Murphy, E. S. (Eds.).
(2014). The Wiley-Blackwell handbook of
operant and classical conditioning. Oxford:
John Wiley & Sons.
Moreira, M. B., & Medeiros, C. A. (2007).
Princípios Básicos de Análise do Comporta-
mento. Porto Alegre: Artmed.
Nevin, J. A. (1968). Differential reinforce-
ment and stimulus control of not respon-
João Cláudio Todorov, Rafaela M. Fontes Azevedo
76
ding. Journal of the Experimental Analysis
of Behavior, 11, 715-726.
Nevin, J. A., & Shettleworth, S. J. (1966). An
analysis of contrast effects in multiple sche-
dules. Journal of the Experimental Analysis
of Behavior, 9, 305-315.
Reynolds, G. S. (1961a). Behavioral contrast.
Journal of the Experimental Analysis Beha-
vior, 4, 57-71.
Reynolds, G. S. (1961b). An analysis of inte-
ractions in a multiple schedule. Journal of
the Experimental Analysis of Behavior, 4,
107-117.
Reynolds, G. S. (1961c). Contrast, generali-
zation and the process of discrimination.
Journal of the Experimental Analysis of
Behavior, 4, 289-294.
Reynolds, G. S. (1961d). Relativity of res-
ponse rate and reinforcement frequency in
a multiple schedule. Journal of the Experi-
mental Analysis of Behavior, 4, 179-184.
Reynolds, G. S. (1963). Some limitations on
behavioral contrast and induction during
successive discrimination. Journal of the
Experimental Analysis of Behavior, 6, 131-
139.
Reynolds, G. S., & Limpo, A. J. (1968). On
some causes of behavioral contrast.Journal
of the Experimental Analysis of Behavior, 11,
543-547.
Schneider, S. C. (2012). The science of conse-
quences. New York: Prometheus Books.
Shimp, C. P., & Wheatley, K. L. (1971). Ma-
tching to relative reinforcement frequency
in multiple schedules with a short compo-
nent duration. Journal of the Experimental
Analysis of Behavior, 15, 205-210.
Skinner, B. F. (1938). The behavior of orga-
nisms: An experimental analysis. New York:
Appleton-Century-Crofts.
Skinner, B. F. (1978). O comportamento ver-
bal. São Paulo: Cultrix (Obra original publi-
cada em 1957).
Skinner, B. F. (2003). Ciência e comporta-
mento humano (11ª ed.). (Trad. de J. C. To-
dorov e R. Azzi). São Paulo: Martins Fontes.
(Obra original publicada em 1953).
Smith, M. H., & Hoy, W. J. (1954). Rate of
response during operant discrimination.
Journal of Experimental Psychology, 48,
259–264.
Terrace, H. S. (1966a). Stimulus control. In
W. K. Honing (Ed.). Operant behavior: Are-
as of research and application. New York:
Appleton-Century-Crofts.
Terrace, H. S. (1966b). Behavioral contrast
and the peak shift: Effects of extended dis-
crimination training. Journal of the Experi-
mental Analysis of Behavior, 9, 613-617.
Capítulo IV | Contraste Comportamental
77
Thorndike, E. L. (1911). Animal intelligence.
New York: Macmillan.
Thorndike, E. L. (1927). The law of effect.
The American Journal of Psychology, 39,
212-222.
Todorov, J. C. (1972). Component duration
and relative response rates in multiple sche-
dules. Journal of the Experimental Analysis
of Behavior, 17, 45-49.
Todorov, J. C. (2002). A evolução do conceito
de operante. Psicologia: Teoria e Pesquisa,
18, 123-127.
Todorov, J. C, (2012). Metacontingências e a
análise comportamental de práticas cultu-
rais. Clínica e Cultura, 1, 36-45.
Wilkie, D. M. (1977). Behavioral contrast
produced by a signaled decrease in local
rate of reinforcement. Learning and Moti-
vation, 8, 182-193.
Williams, B. A. (1980). Contrast, signaled
reinforcement, and the relative law of ef-
fect. American Journal of Psychology, 93,
617-629.
Williams, B. A. (1983). Another look at con-
trast in multiple schedules. Journal of the
Experimental Analysis of Behavior, 39, 345-
284.
Williams, B. A., & Wixted, J. T. (1986). An
equation for behavioral contrast. Journal of
the Experimental Analysis of Behavior, 45,
47-62.
Wilton, R. N., & Gay, R. A. (1969). Behavio-
ral contrast in one component of a multiple
schedule as a function of the reinforcement
conditions operating in the following com-
ponent. Journal of the Experimental Analy-
sis of Behavior, 12, 239-246.
Zuriff, G. E. (1970). A comparison of varia-
ble-ratio and variable-interval schedules of
reinforcement. Journal of the Experimental
Analysis of Behavior, 13, 369-374.
Cristiano Coelho
78
Da frequência absoluta
à frequência relativa
como unidade de análise
do comportamento
Cristiano Coelho
Pontifícia Universidade Católica de Goiás
Herrnstein, R. J. (1961). Relative and Absolute Strength of Response as a Function of Frequency
of Reinforcement. Journal of the Experimental Analysis of Behavior, 4(3), 267-272.
“Você não veio aqui para fazer a escolha. Você já a fez. Você está aqui para tentar
entender porque fez essa escolha”
O Oráculo (The Matrix Reloaded, Irmãos Wachowski)
Capítulo V | Escolha
79
INTRODUÇÃO À ÁREA DE PES-
QUISA E CONTEXTUALIZAÇÃO
DO EXPERIMENTO
Skinner (1950) deu os primeiros pas-
sos para uma compreensão do estudo do
comportamento de escolha na Análise do
Comportamento ao propor que responder
a um dentre dois estímulos é escolha, não
o resultado desta escolha (como propõe
o senso comum). Já preferência seria uma
medida do número de respostas em uma
alternativa em relação à outra, relacionan-
do-se à alternação de respostas a cada es-
tímulo disponível. Dessa forma, em vez de
tomar a escolha como um processo inferido
pré-comportamental, visão característica
de concepções que baseavam suas explica-
ções em processos mentais vigentes à épo-
ca, Skinner focou na a emissão de respostas
como a escolha em si. Com isso, caracte-
rizou-a como um padrão comportamental
mais amplo, relacionado a outras variáveis
que não os supostos processos decisórios
internos.
Podemos dizer que bicar um dentre
dois discos disponíveis, estudar em vez de
ir para a festa na véspera da prova ou dizer
“te amo” quando solicitado pela namorada
em vez de dizer que quer terminar, seriam
as escolhas e não os produtos da escolha.
Adicionalmente, bicar mais vezes um dis-
co que outro, ir mais vezes à balada que es-
tudar na véspera da prova e dizer mais “te
amo” ilustrariam as preferências por cada
uma dessas alternativas, e estariam rela-
cionadas às suas respectivas consequên-
cias. Essa formulação apresentou avanços
na compreensão do controle do comporta-
mento operante, mas ainda se concentrou
na consequenciação direta de cada respos-
ta independentemente das consequências
para respostas alternativas. No exemplo
do pombo acima, as respostas a cada disco
eram vistas como influenciadas apenas por
seus próprios reforços, sem uma influência
direta pelos reforços disponíveis para ou-
tras alternativas. Isso teria como implicação
que, ao aumentar a frequência de reforços
em um dos discos, a taxa absoluta de res-
postas a esse disco aumentaria, sem inter-
ferir na taxa de respostas ao outro disco.
Mesmo assim, Skinner antecipou a noção
de igualação ao obter uma proporcionali-
dade nas taxas absolutas de respostas entre
dois esquemas, conforme suas respectivas
taxas absolutas de reforços.
Condições que envolviam essas si-
tuações foram exploradas de forma siste-
mática posteriormente por Ferster e Skinner
(1957) em experimentos sobre o compor-
tamento em esquemas concorrentes, nos
quais dois (ou mais) esquemas de reforça-
mento permanecem em vigor simultanea-
mente para diferentes respostas incompa-
tíveis de serem emitidas ao mesmo tempo.
Em arranjos experimentais de esquemas
concorrentes, cada esquema é vinculado a
diferentes operandos que diferem com re-
lação à posição (como dois discos ou duas
barras), cor ou outra propriedade, e permi-
tem a mensuração das taxas e distribuições
Cristiano Coelho
80
das diferentes respostas ao longo do tempo.
Podemos ter dois discos em uma parede da
caixa experimental dispostos lado a lado,
cada um iluminado por uma cor; respos-
tas a um dos discos podem ser reforçadas
intermitentemente a cada 30 segundos e
respostas ao outro disco podem ser refor-
çadas a cada 60 segundos, por exemplo, e
as duas respostas não podem ser emitidas
ao mesmo tempo. Esse procedimento, que
passou a ser o padrão no estudo de escolha,
capta a noção básica de Skinner (1950). Os
estudos anteriores a Herrnstein (1961) con-
centraram-se nas análises da suspensão
dessas consequências sobre respostas con-
correntes e dos efeitos de consequências,
que mostravam regularidades nos padrões
e distribuição de respostas: Ferster e Skin-
ner (1957) investigaram sistematicamente
em várias condições que as respostas em
esquemas concorrentes com dois operan-
dos localmente separados apresentavam os
mesmos padrões obtidos em esquemas sim-
ples; Findley (1958) estendeu esses achados
para situações experimentais com os dois
esquemas associados ao mesmo operando,
sinalizado por cores diferentes de acordo
com o esquema no qual o pombo respondia,
e as cores e o respectivo esquema modifica-
dos quando o pombo emitia uma resposta
em um disco de mudança. De acordo com
Davison (2012), estes trabalhos iniciais es-
tavam preocupados em descrever essas re-
gularidades em vez de se aprofundarem em
medidas quantitativas.
A busca por descrições quantitativas
começou a se desenvolver com Herrnstein
(1958) ao propor que devido às respostas em
esquemas concorrentes serem incompatí-
veis, haveria “a possibilidade de estudar es-
colha como um processo comportamental”
(p. 35). De acordo com ele, porém, o desen-
volvimento da área careciade dados que
explicitassem como a disponibilização de
consequências para respostas incompatí-
veis levaria à semelhança na proporciona-
lidade entre os reforços obtidos e respostas
emitidas nas duas alternativas que os da-
dos sugeriam, isto é, como uma alternativa
com uma frequência de reforços duas vezes
maior que a outra levava a um responder
duas vezes maior naquela alternativa.
Herrnstein (1958) obteve dados de
distribuição de respostas entre dois es-
quemas concorrentes de razão fixa (FR),
com três pombos. Nesse experimento, de
um total de 40 respostas a serem emitidas
para cada reforço, foi manipulado o núme-
ro de respostas necessárias em cada disco
para a liberação do reforço em diferentes
condições. A proporção de respostas nas
alternativas se aproximou das proporções
programadas pelos esquemas de razão, mas
a proporção de reforços obtidos variou de
maneira irregular quando a obtenção do
reforço dependida da emissão de uma res-
posta no esquema alternativo após serem
emitidas as respostas definidas no outro
esquema. Ao controlar sistematicamente a
distribuição de reforços, Herrnstein obteve
proporções de respostas semelhantes à de
reforços obtidos. Apesar da noção de esco-
Capítulo V | Escolha
81
lha como comportamento não estar parti-
cularmente traçada naquele trabalho, esta-
va aberta a porta para o desenvolvimento
de um modelo quantitativo do estudo do
comportamento de escolha a partir da no-
ção de igualação. Um dos grandes diferen-
ciais de Herrnstein (1961) foi investigar essas
relações de maneira sistemática, fornecen-
do sustentação empírica para a análise dos
efeitos da frequência relativa de reforços
sobre a distribuição de respostas.
DESCRIÇÃO DO EXPERIMENTO
Objetivo e Método
O objetivo do trabalho de Herrns-
tein (1961) foi estudar de forma paramétrica
e descrever quantitativamente o efeito da
frequência relativa de reforços em esque-
mas concorrentes sobre as taxas de respos-
tas em cada componente do esquema e as
taxas relativas entre os dois esquemas. Em
um estudo paramétrico, a variável indepen-
dente (e.g., frequência relativa de reforços)
é manipulada em diferentes valores permi-
tindo que sejam obtidas diversas medidas
da variável dependente (e.g., frequência re-
lativa de respostas), possibilitando o acesso
a uma maior amplitude da relação funcio-
nal, ou seja, como a variável dependente
se modifica com diversos valores da variá-
vel independente. Para tanto, três pombos
foram mantidos a 80% de seus pesos com
acesso livre a alimento. O experimento foi
realizado em uma caixa de condicionamen-
to operante com dois discos de respostas lo-
calizados em uma das paredes da caixa. Os
discos podiam ser iluminados com as cores
vermelho (A - disco da esquerda) e branco
(B - disco da direita) e ficavam a uma mes-
ma distância do comedouro, que ficava
centralizado na mesma parede dos discos.
O experimento iniciou-se com um
treino preliminar em duas sessões que ter-
minavam após 60 reforços, no qual eram
reforçadas respostas no disco diferente
daquele para o qual havia sido disponibi-
lizado o último reforço, de acordo com um
esquema concorrente de reforço contínuo
(CONC CRF - CRF). Este treino visou ga-
rantir uma distribuição de respostas simi-
lar e a alternância entre os dois discos, de
forma a garantir um mesmo contato com as
alternativas concorrentes em vigor. Poste-
riormente, Herrnstein (1961) programou re-
forços para duas respostas disponibilizados
independentemente de acordo com esque-
mas de reforço de intervalo variável (CONC
VI - VI), nos quais a liberação de reforços
em um esquema não interferia na liberação
de reforços da outra alternativa. O uso de
esquemas de intervalo variável, nos quais
o reforço é disponibilizado para a primeira
resposta após a passagem de um tempo que
varia em torno de uma média, justificou-se
por ser um esquema que, ao ser modifica-
do, leva a consistentes alterações na taxa de
respostas. Os dois esquemas vigoravam ao
mesmo tempo, sem interferência entre si,
e os intervalos programados para cada um
deles vigoravam mesmo quando o pombo
respondia no outro esquema, porém um
Cristiano Coelho
82
reforço disponível em um dos esquemas
só era liberado quando o sujeito respondia
nesse esquema. Assim, em um dado mo-
mento poderia haver reforço disponível em
ambos os esquemas, em apenas um deles
ou em nenhum dos dois.
Herrnstein (1961) utilizou dois pares
de esquemas que em conjunto programa-
vam um reforço a cada 1,5 minutos em todas
as condições. Este controle experimental
foi importante para garantir que as medidas
de respostas se relacionassem às frequên-
cias relativas de reforços dos dois esquemas
e não a possíveis diferenças nas taxas totais
de reforços entre as condições. Em seu tra-
balho, os valores dos VIs foram: VI 3 min
– VI 3 min; VI 2,25 min – VI 4,5 min; VI 1,8
min – VI 9 min; e VI 1,5 min – Extinção.
Esses pares de esquemas foram alternados
entre os dois discos (A e B), de forma que
havia condições em que o disco A ora tinha
VIs menores (maior frequência de reforços),
ora VIs maiores (menor frequência de re-
forços) que o disco B, além da condição VI
3 min – VI 3 min, em que foi programada
uma mesma frequência de reforços para os
dois discos. Os sujeitos foram expostos a to-
das essas condições e em ordens diferentes,
visando reduzir efeitos derivados da ordem
de exposição. É importante ressaltar que
cada condição foi realizada por um número
de sessões até que a emissão de respostas se
estabilizasse ao longo de cinco sessões; só
então uma nova condição era iniciada.
Herrnstein (1961) usou, em algumas
condições, um procedimento que evitava
que respostas de alternar entre os dois es-
quemas fossem reforçadas acidentalmente,
o atraso para respostas de mudança (chan-
geover delay, COD). Como ele funciona?
Sem o COD, quando o pombo estivesse bi-
cando em um disco e houvesse reforço dis-
ponível para respostas no disco alternativo,
a primeira resposta nesse disco alternativo
seria reforçada. Isso pode reforçar não res-
postas a um disco específico, mas o padrão
de alternação entre os discos (i.e., responder
em um disco e responder no outro e, assim,
sucessivamente) independente das modifi-
cações na taxa relativa de reforços. O COD
tem como função evitar que isso aconte-
ça. Vamos supor que em um determinado
momento houvesse reforço disponível para
respostas no disco B e o pombo estivesse
respondendo no disco A. Ao alternar para
o disco B e obter o reforço disponível nes-
se disco, ele precisaria permanecer respon-
dendo no disco B pelo menos pelo tempo
definido no COD (que foi de 1,5 s. no experi-
mento) para que um reforço fosse liberado.
Resultados e discussão
Herrnstein (1961) registrou o núme-
ro de reforços obtidos e respostas emitidas
em cada disco, para cada condição. Esses
dados possibilitaram diversas análises so-
bre os efeitos das alterações na frequência
de reforços sobre a regularidade e, princi-
palmente (no caso de Herrnstein), a aspec-
tos quantitativos do comportamento. Mais
especificamente, se o aumento na taxa de
Capítulo V | Escolha
83
reforço de uma alternativa e a consequente
redução na taxa de reforço para a outra al-
ternativa levariam a aumentos (e reduções)
nas taxas de respostas, bem como a exten-
são dessas alterações em função dos esque-
mas do par concorrente. Para isso, em cada
condição, além das frequências absolutas de
reforços e respostas em cada um dos discos
A e B, foram calculadas a frequência relati-
va de reforços obtidos (proporcionalmente
o número de reforços obtidos no disco A em
relação ao total de reforços obtidos nos dois
discos, A e B) e a porcentagem de respostas
emitidas (total de respostas emitidas no dis-
co A dividido pelo total de respostas emiti-
das nos discos A e B), considerando as cinco
sessões finais, com o comportamento está-
vel. Como a frequência relativa de reforços
variou entre as condições, esses cálculos
possibilitaramverificar como se alteraria a
distribuição de respostas entre os dois dis-
cos. De maneira direta, Herrnstein investi-
gou se a proporção de respostas se igualaria
à frequência relativa de reforços, descrita
pela equação:
(1),

na qual R e r são número de respostas e re-
forços, respectivamente, e 1 e 2 correspon-
dem às alternativas. Essa equação expressa
que as respostas na alternativa 1 divididas
pelo total de respostas nas duas alternativas
(1 e 2) tendem a igualar o total de reforços
obtidos na alternativa 1 divididos pelo total
de reforços obtidos nas duas alternativas¹.
As porcentagens de respostas se
aproximaram da porcentagem de reforços
obtidos nas respectivas condições, ou seja,
a frequência relativa de respostas tendeu a
igualar a frequência relativa de reforços, nas
condições em que se utilizou o COD (que
reduziu a taxa de alternação e, consequen-
temente, aumentou o controle pelas con-
tingências de cada esquema) e os desvios de
uma igualação perfeita não apresentaram
tendência sistemática da previsão teórica
de igualação. Este achado submeteu pela
primeira vez a teste quantitativo a noção de
distribuição de respostas como função da
distribuição de reforços baseada no princí-
pio de que a alteração na frequência de re-
forços de uma fonte influencia as respostas
sob controle de outra fonte de reforços.
Essa influência relaciona-se a outro
achado fundamental obtido por Herrnstein
(1961) e que se constitui um dos pressupos-
tos para a relação de igualação: a taxa de res-
postas apresentou uma relação linear (cres-
cente e contínua) com a taxa de reforços
obtidos em cada alternativa e que as taxas
de respostas nos dois discos foram seme-
lhantes na condição CONC VI 3 min - VI 3
min, quando foi programada a mesma taxa
de reforço nos dois discos. Assim, o total de
respostas nos dois discos em cada condição
ficou constante ou apresentou pequenas
variações assistemáticas. E por que essas
1 Em seu trabalho, Herrnstein (1961) utilizou P (para bicadas - pecking)
em vez de R e E (para comer – eating) em vez de r. No presente traba-
lho, a escolha de nomenclatura diferente do trabalho original deriva do
fato de ter se tornado uma das mais usadas na área.
Cristiano Coelho
84
variações são compatíveis com o princípio
de igualação? O aumento linear nas taxas
de respostas com o aumento da frequência
absoluta de reforços foi descrito a partir da
relação p = ke, sendo p a frequência de bi-
cadas (respostas), e a frequência de comer
(reforços) e k uma constante, compatível
com a noção de fortalecimento da respos-
ta proposta por Skinner (1938, p.130, citado
por Herrnstein, 1961, p. 270) de que há uma
constância entre a quantidade de reforços
obtidos e respostas emitidas em extinção.
Apesar de Skinner posteriormente aban-
donar a noção de constância entre essas
medidas, a equação continuou como uma
proposta de fortalecimento de respostas
baseada em um crescimento linear até atin-
gir o máximo de respostas possíveis. Para
Herrnstein (1961), essa relação seria a única
compatível com a igualação. E por que isso
é tão importante para apreciarmos os resul-
tados de Herrnstein? Porque ao ser aplicado
a esquemas concorrentes, envolve um pres-
suposto fundamental: de que há um limite
máximo de emissão de respostas e, assim, o
aumento na taxa de uma resposta (confor-
me o aumento na taxa de reforço) é neces-
sariamente acompanhado pela redução nas
demais respostas. Ao revermos a descri-
ção dos dados de taxas de respostas acima,
quando os dois esquemas eram iguais (VI
3 min – VI 3 min) as taxas de respostas se
assemelharam e, para cada um dos demais
esquemas com VIs diferentes, os pombos
responderam no VI com maior frequência
de reforço e a soma das respostas nos dois
esquemas permaneceram constantes, ou
sem alterações sistemáticas entre diferen-
tes condições.
DESDOBRAMENTOS
A importância do experimento de
Herrnstein (1961) foi exatamente estabele-
cer um procedimento no qual era possível
se relacionar medidas quantitativas de fre-
quências absolutas e relativas de respos-
tas a dois discos à frequência relativa de
reforços. A relação de igualdade entre as
frequências relativas de reforços e as fre-
quências relativas de respostas expressa
na Equação 1 foi então o primeiro grande
passo para a chamada “Lei da Igualação”
(Herrnstein, 1970), que expressa, em linhas
gerais, que a distribuição de respostas entre
alternativas tende a igualar a distribuição
de reforços obtidos nas respectivas alter-
nativas. Além disso, dela deriva a ideia de
que quando essa distribuição de reforços é
alterada em alguma direção, a distribuição
de respostas tenderá a se alterar na mesma
medida. Assim, se duas fontes de reforços
fornecem a mesma frequência de reforços,
as respostas tenderão a se distribuir em tor-
no de 50% para cada alternativa; se uma
das fontes passa a fornecer uma frequência
quatro vezes maior que a outra, de forma
que 80% dos reforços passam a ser obtidos
nessa fonte, a Lei da Igualação prevê que
o organismo passará a emitir em torno de
quatro vezes mais respostas nessa alterna-
tiva, conforme previsto na igualação perfei-
ta (ou estrita) de Herrnstein (Equação 1).
Capítulo V | Escolha
85
Os trabalhos que se iniciaram com
o experimento de Herrnstein (1961) passa-
ram a fornecer dados sistemáticos que fo-
ram gradativamente demonstrando que um
comportamento é influenciado não apenas
por suas consequências, mas também pelos
reforços disponíveis no ambiente para res-
postas alternativas e culminaram na con-
cepção de que escolha é comportamento
e todo comportamento envolve escolha²
(Herrnstein, 1970).
Dois pressupostos quantitativos bá-
sicos propostos por Herrnstein (1970), em
decorrência dos dados que passaram a ser
sistematizados em Herrnstein (1961), re-
lacionavam as respostas e os reforços dis-
poníveis para diferentes respostas em uma
dada situação (Baum, 2010; Davison, 2012;
De Villiers & Herrnstein, 1976). Primeira-
mente, considerando-se o conjunto de res-
postas nesta dada situação, há um máximo
de respostas incompatíveis possíveis de se-
rem emitidas (k) que se mantém constante
nessa situação. O outro pressupõe que esse
total de respostas é alocado entre diferen-
tes fontes reforçadoras conforme suas res-
pectivas proporções de reforços. Contudo,
Herrnstein (1961) considerava que o au-
mento linear das taxas de respostas deveria
ser obtido com o aumento das taxas abso-
lutas de reforços também em situações que
investigavam respostas em esquemas sim-
ples. Ao se deparar com dados que contra-
riaram essa suposição (e.g. Catania & Rey-
nolds, 1968) e mostravam que o aumento da
taxa de respostas com o aumento da taxa
de reforços caracterizava-se por unidades
cada vez menores (quanto mais reforços por
minuto eram providos, menor o aumen-
to na taxa de respostas), Herrnstein (1970)
ponderou que mesmo em um esquema sim-
ples outras fontes de reforço (mesmo não
controladas pelo experimentador) estariam
em vigor, concorrendo com o esquema pro-
gramado pelo experimentador. Em termos
matemáticos, essa relação pode ser aplica-
da a uma única resposta R1 reforçada com
uma frequência absoluta r1, em que devem
ser considerados os reforços para outros
comportamentos incompatíveis (ro), rela-
ção essa expressa na Equação 2, que ficou
conhecida como a hipérbole de Herrnstein,
por dar conta dos efeitos cada vez menores
do aumento da taxa absoluta de reforços
sobre a taxa absoluta de respostas:
(2).
As previsões derivadas desse mode-
lo são que: a taxa de R1 pode variar de zero
até se aproximar do máximo k, conforme a
relação entre seus reforços (r1) e os outros
reforços (ro) para as respostas concorrentes;
quanto maior a frequência de reforços para
R1 em relação aos reforços disponíveis para
2 A sugestão inicial de Herrnstein levou a questionamentos acerca de
sua amplitude, por ser inicialmente entendida como relacionada a
comportamentos operantes e respondentese por se questionar a sua
aplicabilidade em situações nas quais a escolha é “praticamente” nula,
como, por exemplo, uma pessoa sendo ameaçada com uma arma para
abrir seu cofre. Com relação ao primeiro, os relatos encontrados res-
tringem-se a comportamento operante. Quanto ao segundo, a situação
envolveria uma altíssima magnitude de reforço (negativo, no caso) para
a resposta de ceder à ameaça, em contraposição a uma ínfima mag-
nitude para rebater as ameaças, de forma que a resposta (muito) mais
provável estaria sob controle das magnitudes relativas de ambas as
respostas. Dessa forma, a menção a respostas no presente texto será
referente a operantes.
Cristiano Coelho
86
outras respostas, maior a frequência de R1; à
medida que o ambiente passa a prover mais
reforços para outras respostas, a frequência
de R1 diminui; o aumento da frequência ab-
soluta de R1 é cada vez menor à medida que
se aumenta a frequência absoluta de refor-
ços.
Para exemplificar a relação acima,
vamos supor uma situação hipotética na
qual o total de reforços para outros compor-
tamentos é constante ao longo de diferentes
condições. Em uma condição o experimen-
tador programa um esquema que fornece
10 reforços por hora e, hipoteticamente, o
organismo emite 50 respostas por minuto.
Ao alterarmos a condição e aumentar em
10 os reforços por hora (fornecendo então
20 reforços por hora), possivelmente as res-
postas aumentarão para 100 por minuto (50
respostas a mais). Se aumentarmos mais 10
reforços por hora em uma nova condição
(que passa a fornecer 30 reforços por hora),
as respostas apresentarão um aumento
menor, digamos 40 respostas por minuto
a mais, e o organismo passará a emitir 140
respostas por minuto. Caso uma nova con-
dição programe mais 10 reforços por hora,
o aumento no número de respostas será
de 30, por exemplo, e assim por diante, até
que atinja o máximo de respostas, e então o
aumento na taxa absoluta de reforços não
produzirá aumentos nas taxas de respostas.
Como podemos ver, a cada condição o au-
mento na taxa de reforço foi constante (de
10 em 10), mas o aumento na taxa de respos-
tas foi cada vez menor (50, 40, 30...), obten-
do-se 50, 100, 140, 170 até atingir o máximo.
Esse efeito das taxas de reforços so-
bre a taxa de respostas, porém, não apenas
é totalmente compatível com a igualação,
mas acaba sendo fundamental para que
ela ocorra, pois acaba mostrando que as
alterações nas condições estão alterando a
frequência de reforços programados pelo
experimentador relativamente aos outros
reforços providos pelo ambiente (Ro), que
permaneceram constantes ao longo das di-
ferentes condições no nosso exemplo. Se
hipoteticamente os outros reforços tiverem
uma taxa de 10 por hora na primeira condi-
ção, igual ao programado pelo experimen-
tador, o organismo alocará metade do tem-
po respondendo ao esquema programado e
metade do tempo realizando as outras ati-
vidades.
Vamos considerar agora duas situa-
ções com esquemas concorrentes. Em uma
temos dois esquemas de intervalo variável
de 30 segundos, e na outra, dois esquemas
de intervalo variável de 1 minuto, cada um
associado a um disco de respostas. Nas duas
situações, a taxa total de reforços é diferente,
considerando os dois esquemas: a primeira
com 120 reforços por hora e a segunda com
60 reforços por hora. Assim, o total de res-
postas emitidas nos dois discos na primeira
situação seria maior que na segunda, visto
que teria uma maior taxa absoluta de refor-
ços. Porém, como em ambas as situações
os esquemas componentes dos respectivos
pares concorrentes são iguais, com metade
Capítulo V | Escolha
87
dos reforços a serem obtidos em cada fon-
te, a igualação prevê que o organismo dis-
tribuiria igualmente suas respostas às duas
fontes, pois o que importa para a igualação
são os valores relativos dos reforços e não
os absolutos. Mas você pode perguntar: e os
outros reforços não alterariam essa relação?
Não! De acordo com a hipérbole de Herr-
nstein, além dos esquemas programados
pelo experimentador, o organismo também
gastaria tempo emitindo respostas que são
controladas pelos outros reforços disponí-
veis nessa situação. Contudo, como os ou-
tros reforços estão constantes nessa condi-
ção, eles interfeririam da mesma maneira
(ou igualmente) nas respostas aos dois es-
quemas e, assim, seus efeitos se anulariam
matematicamente.
Essas previsões atualmente podem
parecer simples, mas precisamos conside-
rar que àquela época o diferencial foi mos-
trar que a frequência de R1 não dependia
apenas dos reforços produzidos por ela.
Porém, isso não é tudo. Se R1 depende de
sua taxa de reforços e dos reforços para ou-
tras respostas alternativas e, consequente-
mente, as outras respostas são controladas
pelos seus próprios reforços e pela taxa de
reforços de R1, há uma interdependência
entre a contingência em vigor para R1 e as
contingências sob as quais estão as outras
respostas possíveis de serem emitidas na
mesma situação e incompatíveis com R1.
Dessa forma, ao se aumentar a taxa de re-
forços para R1 relativamente aos reforços
de outros comportamentos, não só a taxa
de respostas R1 aumenta, mas a emissão de
outras respostas alternativas diminui, de-
vido a um máximo de respostas possíveis
de serem emitidas. O artigo de Herrnstein
(1961) foi um marco no estudo do comporta-
mento de escolha ao prover dados sistemá-
ticos e quantificação de duas alternativas
de respostas, realizando manipulações pa-
ramétricas da taxa relativa de reforços em
esquemas concorrentes de intervalo variá-
vel (CONC VI - VI) e mostrando que as alte-
rações nessa taxa relativa de reforços eram
acompanhadas de alterações similares na
taxa relativa de resposta, desenvolvendo o
princípio de igualação. Em termos quanti-
tativos, se aplicarmos a Equação 2 a duas
respostas concorrentes, R1 e R2, obtemos a
Equação 1³ proposta por Herrnstein (1961).
A concepção de Herrnstein (1961) foi
tão importante que, após sua publicação, a
Análise do Comportamento passou a de-
senvolver diversos trabalhos quantitativos,
não apenas para o estudo de escolha, mas
na busca de relações quantitativas entre o
comportamento e suas consequências, ava-
liando também a asserção de Herrnstein
(1970) de que escolha é comportamento (e
vice-versa). Passamos então a ter uma gama
de estudos que tentavam avaliar a genera-
lidade da Lei da Igualação e extensão para
outros parâmetros do reforço, como atraso
e magnitude (e.g. Rachlin & Baum, 1969;
3 Há um conjunto de transformações para se chegar a essa formulação,
fora do âmbito do presente trabalho. De forma resumida, tanto k quan-
to ro saem da Equação 1 porque ao interagirem da mesma forma com
R1 e R2, seus efeitos são matematicamente “anulados”.
Cristiano Coelho
88
Logue, 1988; Logue & Chavarro, 1987; Todo-
rov, 1973), arranjos experimentais, como a
função do COD e efeito da frequência abso-
luta de reforços (e.g. Shull & Pliskoff, 1967;
Todorov, Coelho & Beckert, 1993), efeitos da
história (e.g. Todorov, Oliveira-Castro, Han-
na, Bittencourt de Sá & Barreto, 1983), ape-
nas para mencionar alguns poucos exem-
plos. Pesquisas mostraram também que a
relação de igualação se aplicava para medi-
das de alocação de tempo (e.g. Baum, 1975;
Baum & Rachlin, 1969). A aplicabilidade da
proposta de Herrnstein para o estudo e in-
tervenção sobre o comportamento humano
também foi testada (e.g. Bradshaw & Szaba-
di, 1978; Logue, 1988; Neef, Mace, Shea &
Shade, 1992; Pierce & Epling, 1983).
Baum (1974, 1979) observou os dados
de alguns estudos indicavam dois desvios
sistemáticos da igualação encontrados em-
piricamente. Um desvio foi chamado de
viés, uma persistência a apresentar uma
preferência por uma alternativa derivada
de aspectos não relacionados à distribui-
ção de reforços. Essa preferência por uma
alternativa pode ser derivada de diferenças
na força necessária para acionar o lócus
de respostas, diferenças qualitativas nas
respostas em cadaesquema (bicar x acio-
nar um pedal), diferenças na iluminação
dos discos, dentre outros. O outro desvio,
chamado de sensibilidade, ocorre quando
a distribuição de respostas não se modifi-
ca de maneira estrita conforme a alteração
nas relações entre os reforços obtidos nos
esquemas concorrentes. Conforme pontua-
mos ao início deste tópico, para Herrnstein
(1961), a igualação implica que uma variação
na frequência relativa de reforços deve ser
acompanhada da mesma variação na fre-
quência relativa de respostas: se em uma
fonte é obtida três vezes mais reforços que
a alternativa, para igualar o organismo emi-
tiria três vezes mais respostas, por exemplo.
Além disso, ao se dobrar a frequência relati-
va de reforços para essa mesma alternativa,
a frequência relativa de respostas também
dobraria. Porém, Baum (1979) realizou uma
revisão de 23 estudos e observou dados nos
quais quando a distribuição de reforços era
alterada em uma certa medida produzia
variações menores e, em outras, variações
maiores na distribuição de respostas, as
quais Baum denominou de “subigualação”
e “sobreigualação”, respectivamente.
Diversos trabalhos (e.g. Baum, 1974,
1979; Rachlin & Baum, 1969) estenderam a
proposta de Herrnstein (1961, 1970). Ao bus-
car sistematizar os dados sobre igualação
envolvendo os diferentes parâmetros do re-
forço, Baum (1974) desenvolveu a Lei Gene-
ralizada da Igualação. Porém, derivou uma
equação baseada na relação entre razões de
respostas (respostas emitidas em uma alter-
nativa dividida pelas respostas emitidas na
outra alternativa) e razões de reforços (re-
forços obtidos em uma alternativa dividido
pelos reforços obtidos na outra alternativa).
O uso de medidas de razão descrevia me-
lhor as distribuições de reforços e respostas
por terem uma amplitude maior que pro-
porção ou porcentagem, que tem seu limite
Capítulo V | Escolha
89
de 0 a 1 e 0% a 100%, respectivamente. Essa
relação é expressa na Equação 3:
(3),

sendo a e b os parâmetros obtidos empiri-
camente, relacionados ao viés e sensibilida-
de. Quando se encontra uma sensibilidade
perfeita e ausência de viés, a equação de
Baum expressa a igualação estrita de Herr-
nstein. A mesma relação pode ser aplicada
quando são manipuladas as magnitudes e/
ou atrasos. Quando os três parâmetros são
manipulados em um mesmo experimento,
é possível se calcular as sensibilidades às
variações de cada um deles.
Pierce e Epling (1983) avaliaram a ge-
neralidade da Lei da Igualação para a des-
crição do comportamento humano e suge-
rem que os resultados com humanos seriam
compatíveis com a igualação. Além disso,
observaram que pesquisas com humanos
que não encontraram dados sistemáticos
compatíveis com a igualação (e.g. Oscar-
-Berman, Heyman, Bonner & Ryder, 1980)
apresentavam especificidades metodoló-
gicas que não permitiriam uma adequada
análise da igualação. Em primeiro lugar,
esses experimentos com humanos geral-
mente utilizaram poucas sessões e dados
de comportamento sem o controle já esta-
belecido pela contingência, ou seja, dados
de transição, ao passo que a lei se dirige a
dados de distribuição de respostas em esta-
do estável.
A discussão levantada por Pierce e
Epling (1983) mostra alguns dos cuidados
necessários para se falar em igualação e sua
aplicabilidade ao comportamento huma-
no, em concordância com os pressupostos
desenvolvidos por Herrnstein (1961, 1964,
1970) e compatível com a literatura. Dois
exemplos da aplicabilidade da igualação
com humanos em contextos diferentes po-
dem contribuir para que visualizemos a ex-
tensão dos efeitos de Herrnstein (1961).
Bradshaw e Szabadi (1976) realiza-
ram uma investigação, ao longo de seis me-
ses, com uma pessoa diagnosticada como
maníaca depressiva. No experimento, dife-
rentes operandos estavam associados com
diferentes VIs, que foram utilizados para
manipular a taxa de reforço, testando uma
função derivada da Equação 1 acima. Essa
mensuração, realizada em situações com
diferenças de “humor” (normal, depressivo,
maníaco), mostrou que a taxa de respos-
tas aumentava com aumentos na taxa de
reforço na forma prevista pela Equação 1,
atingindo o máximo k. Contudo, conforme
o “humor”, o máximo de respostas emitidas
diferiu, com taxas máximas mais altas obti-
das em quando o paciente estava maníaco,
e as mais baixas quando estava depressivo.
Neef, Mace, Shea e Shade (1992) ava-
liaram a Lei da Igualação em um contexto
educacional com reforçadores de mesma
“qualidade” e “qualidade” diferente. Três
estudantes especiais tiveram que resol-
ver problemas matemáticos apresentados
Cristiano Coelho
90
concorrentemente e com reforços de acor-
do com esquemas de VI. Na condição com
reforços qualitativamente semelhantes, o
tempo alocado a cada esquema variou con-
forme previsto na igualação. Um dado inte-
ressante foi que os autores não obtiveram
igualação com reforços qualitativamente
diferentes. De fato, a proposta de igualação,
tal como proposta por Herrnstein, se ade-
qua a escolha com mesmos reforçadores.
A ideia de igualação repercutiu tam-
bém no desenvolvimento dos trabalhos
sobre escolhas entre reforçadores com di-
ferentes atrasos e magnitudes, desenvol-
vidos na área de autocontrole (e.g. Mazur,
1987; Rachlin & Green, 1972). A noção bási-
ca para essa extensão foi a Lei Generalizada
da Igualação, com a demonstração de que
a distribuição de respostas é alterada con-
forme os pressupostos básicos da ideia de
Herrnstein (1961) quando são manipulados
atraso e magnitude de reforço. Além disso,
análises quantitativas da perda de valor re-
forçador de consequências atrasadas mos-
traram-se compatíveis com a equação de
igualação (Ainslie & Haslam, 1992) ao serem
aplicadas ao estudo do comportamento de
não humanos (e.g. Mazur, 1995) e humanos
(e.g. Coelho, Hanna & Todorov, 2003; Ra-
chlin, Raineri & Cross, 1991).
A Lei da Igualação, tal como propos-
ta por Herrnstein (1961), se adequa a escolha
com mesmos reforçadores. Propostas pos-
teriores (e.g. Rachlin, 1989) tentaram inter-
pretar o parâmetro de sensibilidade da Lei
Generalizada da Igualação como o nível de
semelhança funcional ou de complementa-
riedade entre os reforços disponibilizados
pelas duas fontes. Em alguns casos, essa in-
terpretação prevê que a diminuição de uma
frequência de reforços levaria à diminuição
nas duas respostas concorrentes e permite
descrever adequadamente as alterações na
distribuição de respostas. Mas essa é outra
longa história4!
CONSIDERAÇÕES FINAIS
Sem dúvida, a contribuição mais
clara de Herrnstein (1961) foi sua proposta
de estabelecer relações quantitativas pre-
cisas entre comportamento e suas conse-
quências. Essas relações não só validam,
mas principalmente, acrescentam-se aos
achados sobre a regularidade dessas re-
lações. Ao longo de seus estudos, Herrns-
tein procurou aprofundar essas relações,
focando nos efeitos das consequências e
questionando princípios de racionalidade,
sistematizados em uma compilação de tex-
tos finalizada após sua morte (Herrnstein,
Rachlin & Laibson, 1997). Essa compilação
de textos mostra como as pesquisas realiza-
das por ele iniciadas a partir de Herrnstein
(1961) foram indicando as falhas nas previ-
sões da Psicologia e da Economia baseadas
4 Algumas referências a respeito, além de Rachlin (1989): Rachlin, H.,
Kagel, J. H., & Battalio, R. C. (1980). Substitutability in time allocation.
Psychological Review, 87(4), 355. Rachlin, H., Green, L., Kagel, J. H., &
Battalio, R. C. (1976). Economic demand theory and psychological stu-
dies of choice. Psychology of Learning and Motivation, 10, 129-154.
Capítulo V | Escolha
91
no pressuposto de que as escolhas visam o
máximo de resultados. Esses dados mos-
tram a igualação na base da dinâmica das
escolhas. E há muito mais para buscarmos
e satisfazer nossa curiosidade. Os números?
Eles não são o comportamento em si, ape-
nas uma forma (dentre as diversas) de des-
crevê-lo e permitir-nosconhecer de uma
maneira mais precisa as regularidades do
comportamento.
Considero que para além da quanti-
ficação, o pressuposto de que nosso com-
portamento é afetado também pelas con-
tingências concorrentes é uma das grandes
contribuições da sistematização dessa área.
Ela permeia direta ou indiretamente inter-
venções que passaram a ser adotadas em
diferentes contextos, nos quais fomos dei-
xando de punir comportamentos-proble-
ma e passamos a reforçar comportamentos
socialmente desejáveis. Diferentes formas
de intervenção baseadas em reforço dife-
rencial e até a noção de reforço para com-
portamentos clinicamente relevantes tipo 2
(CRB2) na Psicoterapia Analítica Funcional
(Kohlenbergh & Tsai, 2001) tem embutidas
noções que se aproximam daquela investi-
gada a partir do experimento de Herrnstein
(1961).
Podemos ilustrar sua repercussão
pelo fato de que Herrnstein (1961), junta-
mente com outro trabalho clássico sobre
escolha (Herrnstein, 1970) foi um dos cin-
co trabalhos publicados no Journal of the
Experimental Analysis of Behavior (JEAB)
mais citados no Journal of Applied Beha-
vior Analysis (JABA) entre 1983 e 2003
(Elliot e cols., 2005). Ao lado do artigo se-
minal de Michael (1982) sobre operações
estabelecedoras, a Lei da Igualação perma-
neceu como um dos principais tópicos de
interesse na área aplicada. Conforme El-
liot e cols. (p. 560) “Claramente, igualação
e operações estabelecedoras são tópicos de
contínuo interesse para analistas aplicados
do comportamento e devem ser abrangidos
em programas de treinamento. Igualação e
operações estabelecedoras tem provado ser
úteis em conceituar e tratar uma amplitude
de comportamentos-problema”.
PARA SABER MAIS
Baum (2010). Descreve um tutorial baseado
na igualação como alocação de tempo entre
atividades. No texto são discutidos aspec-
tos referentes à
Borges, Todorov, & Simonassi (2006). Des-
creve experimentos com diferentes mani-
pulações, mostrando como as condições
para a obtenção de igualação com humanos
dependem da programação experimental.
Garcia-Mijares & Silva (1999). Apresenta
de forma didática as noções de igualação.
Madden & Perone (1999). Avaliaram a Lei
Generalizada da Igualação e, mais especi-
ficamente, a sensibilidade comportamental.
Os dados mostraram que a sensibilidade foi
Cristiano Coelho
92
maior quando havia uma resposta de obser-
vação.
Todorov, Coelho, & Beckert (1993). Reali-
zaram um conjunto de experimentos com
pombos, nos quais variaram a frequência
relativa e frequência absoluta de reforços.
Os dados reforçam que o pressuposto de
que a igualação depende somente da fre-
quência relativa de reforços e da função do
COD na separação das respostas aos esque-
mas.
REFERÊNCIAS
Ainslie, G., & Haslam, N. (1992). Hyperbolic
discounting. In G. Loewenstein & J. Elster, J.
(Eds.), Choice over time. New York: Russell
Sage Foundation.
Baum, W. M. (1974). On two types of devia-
tion from the matching law: Bias and un-
dermatching. Journal of The Experimental
Analysis of Behavior, 22, 231-242.
Baum, W. M. (1975). Time allocation in hu-
man vigilance. Journal of the Experimental
Analysis of Behavior, 23, 45-53.
Baum, W. M. (1979). Matching, undermat-
ching, and overmatching in studies of choi-
ce. Journal of the Experimental Analysis of
Behavior, 32, 269-281.
Baum, W. M. (2010). Dynamics of choice: A
tutorial. Journal of the Experimental Analy-
sis of Behavior, 94, 161-174.
Baum, W. M., & Rachlin, H. (1969). Choice as
time allocation. Journal of the Experimental
Analysis of Behavior, 12, 861-874.
Borges, F. S., Todorov, J. C., & Simonassi, L.
E. (2006). Comportamento humano em es-
quemas concorrentes: escolha como uma
questão de procedimento. Revista Brasilei-
ra de Terapia Comportamental e Cogniti-
va,8, 13-24.
Bradshaw, C. M., & Szabadi, E. (1978). Chan-
ges in operant behavior in a manic-depres-
sive patient. Behavior Therapy, 9, 950-954.
Catania, A. C., & Reynolds, G. S. (1968). A
quantitative analysis of the responding
maintained by interval schedules of rein-
forcement. Journal of the Experimental
Analysis of Behavior, 11, 327-383.
Coelho, C., Hanna, E. S., & Todorov, J. C.
(2003). Magnitude, atraso e probabilidade
de reforço em situações hipotéticas de risco.
Psicologia: Teoria e Pesquisa, 19, 269-278.
Davison, M. (2012). The matching law (Edi-
ção revisada de Davison, M., & McCarthy,
D. (1988). The matching law: A research re-
view. Hillsdale, NJ: Lawrence Erlbaum As-
sociates).
De Villiers, P. A., & Herrnstein, R. J. (1976).
Toward a law of response strength. Psycho-
logical Bulletin, 83, 1131.
Capítulo V | Escolha
93
Elliott, A. J., Morgan, K., Fuqua, R. W.,
Ehrhardt, K., & Poling, A. (2005). Self- and
cross-citations in the Journal of Applied
Behavior Analysis and the Journal of the
Experimental Analysis of Behavior: 1993–
2003. Journal of Applied Behavior Analysis,
38, 559-563.
Ferster, C. & Skinner (1957). Schedules of
reinforcement. New York: Appleton Cen-
tury-Crofts.
Findley, J. D. (1958). Preference and swit-
ching under concurrent scheduling. Journal
of the Experimental Analysis of Behavior, 1,
123-144.
Garcia-Mijares, M., & Silva, M. T. A. (1999).
Introdução à teoria da igualação. Sobre
comportamento e cognição, 4, 40-53.
Herrnstein, R. J. (1958). Some factors in-
fluencing behavior in a two-response si-
tuation. Transactions of the New York Aca-
demy of Sciences, 21, 35-45.
Herrnstein, R. J. (1961). Relative and Abso-
lute strength of Response as a Function of
Frequency of Reinforcement. Journal of the
Experimental Analysis of Behavior, 4, 267-
272.
Herrnstein, R. J. (1964). Secondary reinfor-
cement and rate of primary reinforcement.
Journal of the Experimental Analysis of
Behavior, 7, 27-36.
Herrnstein, R. J. (1970). On the law of ef-
fect. Journal of the Experimental Analysis of
Behavior, 13, 243-266.
Herrnstein, R. J., (1997). The matching law:
Papers in psychology and economics. Cam-
bridge: Harvard University Press.
Kohlenberg, R. J., & Tsai, M. (2001). Psicotera-
pia Analítica Funcional. São Paulo: ESETEC.
Logue, A. W., & Chavarro, A. (1987). Effect
on choice of absolute and relative values of
reinforcer delay, amount, and frequency.
Journal of Experimental Psychology: Ani-
mal Behavior Processes, 13, 280.
Logue, A. W. (1988). Research on self-con-
trol: An integrating framework. Behavioral
and Brain Sciences, 11, 665-679.
Madden, G. J., & Perone, M. (1999). Human
sensitivity to concurrent schedules of rein-
forcement: Effects of observing schedule-
-correlated stimuli. Journal of the Experi-
mental Analysis of Behavior, 71, 303-318.
Mazur, J. E. (1987). An adjusting procedu-
re for studying delayed reinforcement. In
M. L. Commons, J. E. Mazur, & J. A. Nevin
(Eds.), Quantitative Analysis of Behavior:
Vol 5. The effect of delay and intervening
events on reinforcement value. Hillsdale, NJ:
Lawrence Erlbaum. (pp. 55-73).
Mazur, J. E. (1995). Conditioned reinforce-
ment and choice with delayed and uncer-
Cristiano Coelho
94
tain primary reinforcers. Journal of the Ex-
perimental Analysis of behavior, 63, 139-150.
Michael, J. (1982). Distinguishing between
discriminative and motivational functions
of stimuli. Journal of the Experimental
Analysis of Behavior, 37, 149-155.
Neef, N. A., Mace, F. C., Shea, M. C., & Sha-
de, D. (1992). Effects of reinforcer rate and
reinforcer quality on time allocation: Ex-
tensions of matching theory to educatio-
nal settings. Journal of Applied Behavior
Analysis, 25, 691-699.
Oscar-Berman, M., Heyman, G. M., Bon-
ner, R. T., & Ryder, J. (1980). Human neu-
ropsychology: Some differences between
Korsakoff and normal operant performan-
ce. Psychological Research, 41, 235-247.
Pierce, W. D., & Epling, W. F. (1983). Choice,
matching, and human behavior: A review of
the literature. The Behavior Analyst, 6, 57.
Rachlin, H. (1989). Judgment, decision, and
choice: A cognitive/behavioral synthesis.
New York: WH Freeman/Times Books/Henry Holt & Co.
Rachlin, H., & Baum, W. M. (1969). Respon-
se rate as a function of amount of reinfor-
cement for a signalled concurrent respon-
se. Journal of the Experimental Analysis of
Behavior, 12, 11-16.
Rachlin, H., & Green, L. (1972). Commit-
ment, Choice and self-control. Journal of
the Experimental Analysis of Behavior, 17,
15-22.
Rachlin, H., Raineri, A., & Cross, D. (1991).
Subjective probability and delay. Journal of
the Experimental Analysis of Behavior, 55,
233-244.
Shull, R. L., & Pliskoff, S. S. (1967). Changeo-
ver delay and concurrent schedules: Some
effects on relative performance measures.
Journal of the Experimental Analysis of
Behavior, 10, 517-527.
Skinner, B. F. (1950). Are theories of lear-
ning necessary? Psychological Review, 57,
193-216.
Todorov, J. C. (1973). Interaction of frequen-
cy and magnitude of reinforcement on con-
current performances. Journal of the Expe-
rimental Analysis of Behavior, 19, 451-458.
Todorov, J. C., Oliveira-Castro, J. M., Hanna,
E. S., Bittencourt de Sá, M. C. N., & Barre-
to, M. D. Q. (1983). Choice, experience, and
the generalized matching law. Journal of the
Experimental Analysis of Behavior, 40, 99-
111.
Todorov, J. C., Coelho, C., & Beckert, M. E.
(1993). Efeito da frequência absoluta de re-
forços em situação de escolha: um teste do
pressuposto da relatividade na lei generali-
zada de igualação. Psicologia: Teoria e Pes-
quisa, 9, 227-42.
Elenice S. Hanna, Márcio Borges Moreira
95
Prestaram atenção
em tudo?
Elenice S. Hanna
Universidade de Brasília
Márcio Borges Moreira
Centro Universitário de Brasília; Instituto Walden4
Reynolds, G. (1961). Attention in the pigeon. Journal of the Experimental Analysis
of Behavior, 4, 203-208.
“Da mesma forma que podemos atentar para um objeto sem olhar para ele, assim
também podemos olhar para um objeto sem prestar-lhe atenção”
Skinner (1953/2003, p. 138)
Capítulo VI | Atenção
96
INTRODUÇÃO À ÁREA DE PES-
QUISA E CONTEXTUALIZAÇÃO
DO EXPERIMENTO
Ao perguntar para várias pesso-
as que foram à mesma sala de cinema no
mesmo horário, o que lhes chamou mais
atenção, respostas variadas apareceriam.
Alguns incluiriam no relato determinados
personagens, suas personalidades ou as in-
terações entre eles. Outros falariam dos ce-
nários, cidades ou construções. Poderíamos
ainda encontrar aqueles que focam seus
relatos nas cenas de suspense, na forma
como foram produzidas, na iluminação ou
nos aspectos negativos. Uma pessoa menos
atenta ao filme, como o dono do cinema,
poderia ainda ter se interessado pelo nú-
mero de pessoas que havia na sala e no que
elas estavam consumindo.
Em situações cotidianas nem sem-
pre o comportamento de uma pessoa fica,
do ponto de vista de um observador exter-
no (o diretor do filme, por exemplo) ou do
próprio indivíduo, sob controle dos mes-
mos estímulos que antecedem ou que estão
presentes quando um determinado com-
portamento ocorre. Dito de outra forma, di-
ferentes indivíduos podem prestar atenção
a diferentes aspectos, ou diferentes estímu-
los, de um mesmo ambiente. Diz-se, nessas
situações, que o organismo prestou ou não
atenção ao evento, que atentou ou não a
uma ou mais propriedades relevantes do es-
tímulo. É importante ressaltar que, em Aná-
lise do Comportamento, estímulo é “qual-
quer evento físico, combinação de eventos
ou relação entre eventos. O vocabulário do
estímulo classifica os aspectos do ambiente
…” (Catania, 1998/1999, p. 402). Quando fa-
lamos de uma propriedade de um estímulo,
falamos de alguma qualidade mensurável
de um estímulo, por exemplo, cor, forma,
cheiro, tamanho, textura, etc. O conceito
de ambiente, por sua vez, pode ser definido
como o “conjunto de circunstâncias físicas
no qual o organismo, ou uma parte referida
desse organismo, existe” (Johnston & Pen-
nypacker, 2009, p. 29).
O uso do conceito de atenção em
muitos casos, entretanto, pode inverter “...
a direção da ação ao sugerir que não é o es-
tímulo que controla o comportamento do
observador, mas é o observador que atenta
para o estímulo e assim o controla” (Skin-
ner, 1953/2000, p. 135). Nessa perspectiva,
a “falta de atenção” não explica o contro-
le inadequado de estímulos, é apenas uma
forma resumida de se referir à ausência de
controle por determinados elementos ou
dimensões de estímulos sobre o comporta-
mento. É importante lembrar que falar de
controle do comportamento é falar de vari-
áveis que tornam um determinado compor-
tamento mais ou menos provável (não sig-
nifica, necessariamente, falar de “obrigar”
alguém a fazer algo).
Conhecer as variáveis que aumen-
tam as chances de haver coerência entre
o que se quer ensinar dos estímulos ante-
cedentes e o que será aprendido é funda-
Elenice S. Hanna, Márcio Borges Moreira
97
mental para o ensino de diversos processos
comportamentais complexos. A aprendiza-
gem de conceitos, por exemplo, é base para
o desenvolvimento do pensamento e da
linguagem humana. Quando aprendemos o
conceito de “vermelho” ou de um “núme-
ro”, interagimos com eventos que são com-
postos por outras propriedades. Um objeto
vermelho ou unitário possui forma, peso,
tamanho, apenas para citar algumas das
possíveis propriedades. Mas como ocorre
o processo que permite que determinado
comportamento fique sob controle da cor
ou o número, por exemplo, dentre tantos
aspectos dos objetos que contêm cor e nu-
merosidade? Perguntando em uma lingua-
gem mais coloquial, como prestamos aten-
ção apenas à cor ou ao número dos objetos?
O experimento que é tema deste ca-
pítulo foi publicado por George Reynolds
em 1961 com o título de “Atenção no pom-
bo” e inspirou uma série estudos relevan-
tes para a compreensão da atenção e do
controle do comportamento por estímu-
los compostos. Em estudos sobre controle
do comportamento operante por estímu-
los antecedentes, o ensino é realizado por
meio de procedimentos chamados de treino
discriminativo. A base de um treino discri-
minativo é o reforçamento diferencial da
resposta emitida na presença de estímulos
diferentes (Dinsmoor, 1995). Na presença
de um objeto vermelho (S+), a resposta de
dizer “vermelho” (R) é seguida por alguma
reação de aprovação do professor (SR+),
mas não terá esta consequência se o objeto
for amarelo (S–). Responder “vermelho” faz
parte de duas contingências: uma na qual
a resposta produz reforçamento e outra em
que produz extinção, gerando a discrimi-
nação entre os objetos de cores diferentes
(i.e., vermelho e amarelo). Discriminar esses
objetos é responder diferencialmente na
presença de cada um, isto é, dizendo “ver-
melho” diante do S+ (objeto vermelho), mas
não diante do S– (objeto amarelo).
A discriminação está presente em
muitos exemplos do que chamamos de “co-
nhecimento” e de “atenção”. Quando se diz
que alguém reconheceu o brinquedo ver-
melho ou prestou atenção no vestido ver-
melho, supõe-se que ele(a) diferencie (dis-
crimine) as cores. No entanto, afirmações
como essas são meras inferências (Sidman,
1979), como as evidências apresentadas por
Reynolds (1961) permitem discutir. Pas-
semos, então, para o estudo clássico que
apresentou estas evidências e em seguida
veremos como este tema tem relação com
outros assuntos interessantes.
DESCRIÇÃO DOS EXPERIMEN-
TOS
Os experimentos de Reynolds (1961)
foram inspirados, dentre outros experi-
mentos, pela pesquisa realizada por Lashley
(1938), na qual respostas de ratos de saltar
em direção a um cartão contendo a figura
de um triângulo foram reforçadas com co-
mida e as respostas de saltar em direção a
Capítulo VI | Atenção
98
um cartão contendo a figura de triângu-
lo invertido foram punidas pela queda do
animal em uma rede de segurança. Após
realizar esse treino discriminativo, Lashley
realizou testes nos quais apenas metade das
figuras eram apresentadas aos ratos. Nes-
ses testes, não se observou consistência no
comportamento de saltar dos animais, isto
é, as “partes” dos triângulos apresentadasnos testes como estímulos antecedentes
exerceram controles diferentes para dife-
rentes animais. No entanto, estes responde-
ram de forma coerente com o treino quando
apenas a metade inferior de cada figura era
apresentada.
Experimento 1 - Objetivo e Método
Com base nos resultados da pesquisa
de Lashley (1938), o objetivo do experimen-
to de Reynolds (1961) foi avaliar os efeitos
da variação e eliminação de características
dos estímulos sobre a aprendizagem de dis-
criminações de estímulos – dizemos que
uma discriminação de estímulos foi estabe-
lecida quando o indivíduo se comporta de
maneira diferente na presença de estímulos
antecedentes diferentes.
No Experimento 1 (Reynolds, 1961),
dois pombos foram colocados em câma-
ras experimentais que continham discos
de resposta onde ora era apresentado um
triângulo sobre um fundo vermelho (ΔR) e
ora um círculo sobre um fundo verde (OG),
Figura 1. Diagrama do treino discriminativo e dos estímulos decompostos utilizados no teste em extinção de Reynolds (1961; painel da esquerda) e
resultados do Experimento 1 (painel da direita). O gráfico do painel da direita é uma adaptação da Figura 1 de Reynolds (p. 204).
Elenice S. Hanna, Márcio Borges Moreira
99
de forma imprevisível. Bicadas no disco
ΔR eram seguidas por comida (reforço),
após transcorridos 3 min em média desde a
apresentação do último reforço (i.e., um es-
quema de reforçamento intervalo variável,
VI, 3 min). Respostas de bicar no disco OG
não eram reforçadas (extinção). Esta etapa
do procedimento consistiu de um treino
discriminativo (Figura 1). Após a etapa de
treino discriminativo, iniciava-se uma se-
gunda etapa do experimento, chamada de
teste em extinção. Nesta etapa Reynolds
(1961) programou um teste no qual os com-
ponentes dos estímulos utilizados durante
o treino discriminativo eram apresentados
separadamente, ou seja, o disco de resposta
continha ora o triângulo, ora o círculo, ora
era iluminado por vermelho e ora por ver-
de. O teste foi realizado em extinção, isto
é, bicadas no disco, independentemente de
qual estímulo estivesse presente no disco,
não eram seguidas pela apresentação de
comida. O teste em extinção foi uma veri-
ficação do que os pombos haviam aprendi-
do durante o treino discriminativo. Portan-
to, procedimentos de treino são tarefas de
aprendizagem e procedimento de teste em
extinção são procedimentos de avaliação
dessa aprendizagem.
Resultados e Discussão
No início do treino discriminativo,
ambos os pombos bicavam no disco tanto
na presença do ΔR quanto na presença do
OG. No entanto, à medida que o treino dis-
criminativo continuava, as respostas iam se
concentrando no disco cujas bicadas pro-
duziam comida, isto é, os animais passaram
a bicar nos disco quase que exclusivamente
na presença do triângulo sobre fundo ver-
melho (Figura 1). Neste caso, dizemos que
o controle discriminativo foi estabelecido:
respostas de bicar ocorriam na presença do
triângulo sobre fundo vermelho e ocorriam
com baixa frequência na presença do círcu-
lo sobre fundo verde.
Durante o teste em extinção, na qual
os componentes dos estímulos utilizados
no treino foram apresentados separada-
mente, Reynolds (1961) verificou que, para o
pombo 105, a maioria das respostas de bicar
ocorreu na presença do triângulo, enquan-
to para o pombo 107 a maior parte das res-
postas ocorreu na presença da cor vermelha
(Figura 1). Mesmo tendo sido submetidos ao
treino discriminativo com os mesmos es-
tímulos compostos, o comportamento de
cada um dos animais, durante o teste, foi
controlado por uma propriedade especí-
fica diferente do estímulo (triângulo para
o pombo 105 e cor vermelha para o pom-
bo 107). Reynolds argumentou apenas que
o responder de cada um dos pombos ficou
sob controle de um dos muitos aspectos de
cada estímulo, não sugerindo possíveis de-
terminantes das diferenças individuais no
controle de estímulos observado no com-
portamento dos pombos - até porque seus
dados não permitiam explicar o controle de
estímulos desenvolvido pelos animais. Os
analistas do comportamento acham mais
produtivo ficar provisoriamente sem uma
Capítulo VI | Atenção
100
explicação do que inventar um explicação
que não seja baseada nas interações entre o
organismo e o ambiente. Por exemplo, Rey-
nolds poderia ter dito: “O pombo 105 bicou
mais vezes na presença do triângulo duran-
te os testes porque ele prestou mais aten-
ção a este aspecto do estímulo durante o
treino”. No entanto, propor uma explicação
como essa não explica nada, é apenas ou-
tra forma de dizer que o pombo bicou mais
vezes na presença do triângulo. Mesmo se
aceitássemos a explicação “bicou mais na
presença do triângulo porque prestou mais
atenção a esse aspecto”, ainda teríamos que
explicar por que ele prestou mais atenção a
esse aspeto. Os estudos que foram desen-
cadeados após a publicação do artigo de
Reynolds (1961), entretanto, mostraram que
o objetivo do estudo original foi cumprido e
inspirou muitos outros estudos que nos aju-
dam a compreender melhor como diferen-
tes controles de estímulos se estabelecem.
Experimento 2 - Objetivo e Método
Reynolds (1961) realizou um segun-
do experimento, com os mesmos pombos,
fazendo combinações de estímulos ainda
mais complexas. No Experimento 2, havia
as seguintes combinações de forma e cor
nos discos de resposta durante o treino dis-
criminativo: triângulo sobre fundo verme-
lho, círculo sobre fundo vermelho, triân-
gulo sobre fundo azul, círculo sobre fundo
azul. Além disso, em alguns momentos uma
lâmpada amarela, posicionada na lateral da
câmara experimental, se acendia e em ou-
tros momentos uma lâmpada verde, posi-
cionada no mesmo local que a amarela, se
acendia. Durante o treino discriminativo do
Experimento 2, as respostas de bicar o disco
foram reforçadas em esquema de intervalo
fixo (FI) 3 min quando a lâmpada amarela
estava acesa e o fundo do disco era verme-
lho (independentemente se continha círcu-
lo ou triângulo) e quando a luz verde estava
acesa e o disco continha um triângulo (in-
dependentemente da cor do fundo do dis-
co). Veja que neste treino discriminativo, o
comportamento do pombo de bicar no dis-
co deveria ficar sob controle de uma rela-
ção mais complexa (i.e., composta por mais
elementos) entre os estímulos presentes do
que aquela programada no Experimento 1:
cor da lâmpada lateral, cor do fundo do dis-
co e forma projetada no disco.
Resultados e Discussão
Após cerca de 100 horas de trei-
no discriminativo, o comportamento dos
pombos ficou sob controle dos estímulos
programados, isto é, eles bicavam no dis-
co quando a luz amarela e o fundo do dis-
co vermelho estavam presentes e quando
luz verde e o triângulo estavam presentes;
quando a luz amarela e círculo sobre fun-
do azul estavam presentes, por exemplo, os
pombos praticamente não bicavam o disco
de resposta. Após o treino discriminativo,
Reynolds (1961) realizou vários testes em
extinção alterando a configuração dos estí-
mulos como, por exemplo, extinção das res-
postas durante as mesmas configurações de
estímulos do treino; extinção das respostas
com as duas lâmpadas laterais apagadas; e
Elenice S. Hanna, Márcio Borges Moreira
101
extinção das respostas com as duas lâmpa-
das laterais acesas simultaneamente.
Os resultados desse segundo expe-
rimento replicaram os resultados do pri-
meiro: controle por aspectos específicos da
configuração de estímulos. Nas palavras de
Reynolds (1961, p. 208):
No segundo experimento, nenhum
dos pombos atentou para a cor da lâmpa-
da lateral. O responder deles foi controlado
apenas pela presença ou ausência da lâm-
pada lateral amarela, ou, de acordo com
análise posterior, pela intensidade da ilu-
minação da lâmpada lateral.
DESDOBRAMENTOS
Centenas, talvez milhares, de pes-
quisas foram e continuam sendo realizadas
com o intuito de sabermos cada vez mais
sobre os fatores que determinam quais os
aspectos do ambiente que controlarão ocomportamento de diferentes organismos
e em quais situações (e.g., Barros, Galvão,
Brino, Goulart, & McIlvane, 2005; Carter &
Werner, 1978; de Rose, de Souza & Hanna,
1996; Debert, Huziwara, Faggiani, de Mathis
& McIlvane, 2009; Dube & McIlvane, 1999;
Johnson & Cumming, 1968; Lovaas, Koegel
& Schreibman, 1979). Em outras palavras,
ainda hoje estudamos o que pode levar al-
gumas pessoas a prestarem atenção a certos
aspectos de seu ambiente e outras pessoas a
prestarem atenção a outros aspectos. A se-
guir, apresentamos dois experimentos que
demonstraram controle discriminativo por
parte da configuração de estímulos e avan-
çaram o conhecimento sobre o tema.
O primeiro experimento, conduzido
por Wilkie e Masson (1976), foi uma repli-
cação sistemática do experimento de Rey-
nolds (1961) com controles mais refinados e
também utilizando pombos como sujeitos
experimentais. A primeira parte do estudo
foi idêntica ao Experimento 1 de Reynolds
(i.e., treino com estímulos compostos e tes-
te com os elementos dos estímulos com-
postos). Na fase de teste, os seis pombos
responderam quase que exclusivamente
na presença da cor previamente correla-
cionada com o reforço (i.e., teriam atenta-
do para cor e não para a forma). Embora as
bicadas dos pombos de Wilkie e Masson
não tenham ficado sob controle de aspec-
tos diferentes do estímulo composto, como
no estudo de Reynolds, a evidência de con-
trole por apenas uma das propriedades do
estímulo composto (cor) é um resultado se-
melhante ao (i.e., uma replicação do) estudo
original.
A replicação (Wilkie & Mason, 1976)
confirmou que os animais não humanos
não atentam para todas as propriedades
de um estímulo composto, mas os autores
ainda foram além para avaliar se o teste em
extinção era um contexto adequado para
identificar o controle de estímulos aprendi-
do durante os treinos. Wilkie e Masson, em
uma segunda etapa do estudo, realizaram
um novo treino discriminativo para avaliar
Capítulo VI | Atenção
102
se a situação de teste em extinção masca-
rou o possível controle exercido pela outra
propriedade do estímulo (forma). Neste se-
gundo treino, bicadas no disco foram refor-
çadas na presença das duas formas (triân-
gulo e círculo), mas sem o fundo colorido
correspondente aos estímulos compostos
do primeiro treino. Se as formas não tives-
sem adquirido nenhuma função comporta-
mental no primeiro treino, a aprendizagem
na presença de cada forma deveria ser se-
melhante no segundo treino. No entanto, já
na primeira sessão de treino os pesquisa-
dores observaram que a frequência do res-
ponder na presença da forma previamente
correlacionada com reforço aumentou mais
rapidamente que na presença da forma cor-
relacionada com extinção. Embora se pu-
desse pensar, a partir do primeiro teste, que
os pombos prestaram atenção somente à
cor, os resultados do segundo treino discri-
minativo mostraram que as formas também
exerceram algum controle sobre o compor-
tamento.
Este é um dos aspectos mais interes-
santes da pesquisa científica e que depende
da curiosidade de pesquisadores e pesqui-
sadoras: seu caráter cumulativo. Reynolds
(1961) demonstrou atenção seletiva à deter-
minados aspectos dos estímulos. Wilkie e
Masson (1976) confirmaram esse resultado
e ainda mostraram que o contexto no qual
se avalia a atenção às diferentes proprie-
dades do estímulo pode levar a conclusões
diferentes sobre a extensão do controle de
estímulos.
Nas décadas de 1960 e 1970, muitos
estudos sobre controle de estímulos rea-
lizados em laboratório utilizaram pombos
como sujeitos. O sistema visual das aves,
dentre outras vantagens, permite empregar
diversos estímulos visuais com variação
de cores, diferentemente dos roedores que
são sensíveis aos raios UV e “cegos” para
grande parte das frequências que seres hu-
manos enxergam. Nesses estudos, os estí-
mulos visuais são projetados nos discos de
resposta ou em outros locais da câmara ex-
perimental para estudo do comportamento
operante de pombos.
Uma pergunta comumente feita
quando fenômenos importantes são estu-
dados empiricamente em laboratório com
não humanos é sobre a sua generalida-
de para o comportamento humano. Nesse
sentido, Touchette (1969) realizou um treino
discriminativo com sete garotos de 12 a 17
anos com atraso severo no desenvolvimen-
to, utilizando linhas com diferentes inclina-
ções (45° e 135°). O treino iniciava com o re-
forçamento de respostas quando uma parte
pequena da linha (semelhante à um ponto)
aparecia na parte debaixo (para cinco parti-
cipantes) ou de cima (para outros dois par-
ticipantes) do painel de apresentação dos
estímulos (Figura 2, Pré-treino). Em segui-
da, os participantes aprendiam as discri-
minações com as linhas inclinadas (Figura
2, Treino), devendo responder na chave da
esquerda na presença de uma linha com 45°
de inclinação e na chave da direita na pre-
sença de uma linha com 135° de inclinação.
Elenice S. Hanna, Márcio Borges Moreira
103
Durante o teste para avaliar o con-
trole de estímulos, Touchette (1969) consi-
derou as linhas como estímulos compos-
tos e separou cada linha em duas partes,
apresentando ora a parte inferior ora a
parte superior (Figura 2, Teste). Note que
esta separação não alterava a inclinação
da linha, que era a propriedade que o ex-
perimentador esperava que controlasse o
comportamento dos participantes. No en-
tanto, o controle parcial foi observado mais
uma vez para a maioria dos participantes,
que responderam consistentemente apenas
para uma das partes (superior ou inferior)
da linha com a inclinação correlacionada
com reforçamento (Figura 2, painel da di-
reita), replicando os achados de Reynolds
(1961) e Wilkie e Masson (1976). Além de
mostrar a generalidade do fenômeno do
controle parcial com humanos e para estí-
mulos mais simples (como linhas), Touchet-
te mostrou a importância de aprendizagens
anteriores para compreender o controle de
estímulos (veja também esse efeito de his-
tória em Johnson & Cumming, 1968, e Ray,
1969). A história experimental construída
durante o pré-treino com estímulos em po-
sições diferentes (superior ou inferior), foi
uma variável importante para compreender
o controle de estímulos observado no teste.
Em geral, o responder foi apropriado (i.e.,
consistente com o treino) apenas quando
as partes das linhas apresentadas no teste
correspondiam à posição dos estímulos do
Pré-treino. Em outras palavras, o início do
treino que exigiu atenção para a (ou contro-
le pela) parte de cima ou debaixo da chave
determinou para qual parte da linha incli-
nada o participante atentou nas etapas sub-
sequentes do procedimento.
Um tema de pesquisa em Análise
do Comportamento bastante relacionado
com os achados de Reynolds (1961) é a su-
perseletividade (overselectivity). Diz-se que
houve superseletividade de estímulos ou
controle de estímulos restrito quando se ob-
serva que um dado comportamento fica sob
Figura 2. Estímulos utilizados em cada etapa do estudo de Touchette (1969; painel da esquerda) e porcentagens de acertos obtidas no teste para cada
participante (painel da direita). Figura construída com base na descrição do estudo.
Capítulo VI | Atenção
104
o controle de apenas uma propriedade do
estímulo quando deveria, do ponto de vista
do experimentador, ficar sob o controle de
relações entre diferentes propriedades des-
se estímulo ou de outras propriedades. Por
exemplo, se o pai faz a barba e o filho não
o reconhece mais como sendo seu pai, di-
zemos que houve superseletividade de estí-
mulos (estímulo barba, neste caso).
A superseletividade (Lovaas, Schrei-
bman, Koegel, & Rehm, 1971) ou controle res-
trito de estímulos é observada em humanos
com desenvolvimento típico (e.g., Verneque
& Hanna, 2012), mas com mais frequência
em crianças com desenvolvimento atípico
(e.g., Lovaas & Schreibman, 1971; Lovaas et
al., 1971; Lovaas, et al., 1979), especialmente
em indivíduos com diagnóstico de autis-
mo. Lovaase colaboradores (e.g., Lovaas &
Schreibman, 1971; Lovaas et al., 1971) ensi-
naram crianças com desenvolvimento típi-
co e com diagnóstico de autismo a discrimi-
nar estímulos compostos e mostraram que
a maioria das crianças com diagnóstico de
autismo respondeu a apenas um dos com-
ponentes dos estímulos quando eles foram
apresentados separadamente no teste (i.e.,
superseletividade). Uma proporção menor
de crianças com atraso do desenvolvimento
do estudo de Lovaas et al. (1971) apresentou
superseletividade, enquanto as crianças
com desenvolvimento típico responderam
a todos os componentes do estímulo com-
posto. Lovaas et al. (1979) discutem como
a superseletividade pode estar relacionada
com falhas no desenvolvimento da lingua-
gem, do comportamento social e a outras
deficiências na aprendizagem de pessoas
no espectro autista.
Os estudos de Lovaas e colaborado-
res (e.g., Lovaas & Schreibman, 1971; Lovaas
et al., 1971; Lovaas et al., 1979) foram con-
siderados bastante relevantes para a época,
quando havia escassez de conhecimento
sobre a falta de responsividade a elemen-
tos críticos do ambiente em indivíduos com
diagnóstico de autismo e por ter desenca-
deado investigações sobre as condições
que reduzem a superseletividade. Lovaas e
Schreibman (1971), por exemplo, mostraram
que ao reforçar respostas na presença dos
componentes apresentados separadamen-
te, crianças com diagnóstico de autismo
passaram a responder a todos os elementos
do estímulo composto. Outros estudos (e.g.,
Allen & Fuqua, 1985; Schreibman, Charlop,
& Koegel, 1982) mostraram que não é neces-
sário decompor o estímulo e ensinar sepa-
radamente as discriminações de cada ele-
mento para ampliar o controle de estímulos
(i.e., para reduzir a superseletividade). Estes
estudos utilizaram, durante a fase de ensi-
no, configurações de estímulos compostos
S+ e S- que variavam um componente do
composto por vez (diferença única) e com-
pararam com a condição de ensino que pro-
grama estímulos compostos com todos os
componentes diferentes (diferenças múlti-
plas). Veja na Figura 3 exemplos de estímu-
los criados com diferenças múltiplas (pai-
nel direito) e estímulos com diferença única
(painel esquerdo). Na configuração com di-
Elenice S. Hanna, Márcio Borges Moreira
105
ferenças múltiplas, estímulos S+ e S- pos-
suem maior diferença física e o responder
sob controle de um único componente do
estímulo tem a mesma probabilidade de re-
forçamento seja qual for o elemento. Nesse
caso, atentar para qualquer um dos elemen-
tos do estímulo composto é suficiente para
produzir 100% dos reforços. Em contraste,
para a configuração que possui apenas um
elemento diferente, responder sob contro-
le dos elementos iguais tem baixa probabi-
lidade de ser seguido por reforço, uma vez
que ele também está presente nos estímu-
los “incorretos”, isto é, aqueles não correla-
cionados com reforçamento. Se o elemento
diferente é variado ao longo do treino (uti-
lizando-se diferentes S- como os da Figura
3), as discriminações por mais componen-
tes se desenvolvem.
No entanto, configurações com dife-
rença única (crítica) produzem mais erros
durante a etapa de ensino e seu uso pode
não ser uma estratégia eficiente para indi-
víduos com baixa resistência à frustração e
em tarefas com alta complexidade em rela-
ção ao repertório inicial de estudantes (e.g.,
Anderson & Rincover, 1982). Nesses casos,
procedimentos especiais que combinam o
ensino de discriminações com os elemen-
tos separados e compostos com diferenças
críticas e/ou a programação de aumentos
graduais na semelhança física entre os es-
tímulos (fading, veja o estudo de Terrace,
1963) podem ser utilizados na metodologia
de ensino. Os estudos de Dube e McIlvane
(1999) e de Duarte e Baer (1997) são exem-
plos destes procedimentos. O primeiro en-
sinou discriminações entre palavras e o se-
gundo entre faces.
CONSIDERAÇÕES FINAIS
Em muitas atividades humanas,
é necessário atentar e discriminar diver-
sos eventos e ignorar outros. Reynolds
(1961) iniciou uma série de investigações
que mostraram que o atentar e as discri-
minações que aprendemos dependem das
contingências de reforçamento às quais
somos expostos. Quando estas contingên-
cias permitem o responder sob controle de
qualquer componente ou propriedade do
evento antecedente para que o reforçamen-
to ocorra, variabilidade e controle restrito
por um dos elementos comumente resulta.
A ocorrência dessa variabilidade depende,
entretanto, de condições antecedentes his-
tóricas e presentes, além de características
do organismo. O conhecimento das variá-
veis independentes que ampliam o controle
Figura 3. Exemplo de configuração de estímulos S+ e S- com diferença
única e com diferenças múltiplas.
Capítulo VI | Atenção
106
de estímulos (atenção) tem possibilitado o
desenvolvimento de metodologias efetivas
para modificar o padrão de controle de estí-
mulo muitas vezes denominado de “patoló-
gico” (Sidman, 1960).
Pesquisas sobre controle de estímu-
los realizadas com não humanos, como as
de Reynolds (1961), dentre muitas outras,
foram e continuam sendo essenciais para
que pesquisas sobre controle de estímulos
com humanos fossem e continuem sen-
do realizadas – toda vez que uma criança
apresenta dificuldades para aprender a ler,
por exemplo, temos ali uma possível apli-
cação para o conhecimento sobre controle
de estímulos. O conhecimento acumulado
produzido tanto por pesquisas com não hu-
manos quanto por pesquisas com humanos
foi essencial para que tecnologias de ensino
eficazes fossem produzidas e aplicadas nos
mais diversos contextos. Graças a todo esse
histórico de produção de conhecimento de
base empírica, analistas do comportamento
têm a possibilidade, hoje em dia, de auxiliar
professores a elaborar estratégias de ensino
que otimizam a aprendizagem de leitura e
escrita de crianças no ensino regular; que
possibilitam melhora na qualidade de vida
de crianças diagnosticadas com algum tipo
de atraso no desenvolvimento, incluindo
desempenhos acadêmicos; e que auxiliam
no desenvolvimento de softwares educa-
cionais mais eficazes, apenas para citar al-
guns exemplos.
PARA SABER MAIS
da Hora & Benvenuti (2007). Os pesquisa-
dores avaliaram os efeitos de um procedi-
mento conhecido como resposta de obser-
vação diferencial sobre o desempenho de
um menino autista em uma tarefa de mat-
ching-to-sample (MTS) que utilizou sílabas
e palavras como estímulos. A resposta de
observação diferencial impedia que o res-
ponder da criança aos estímulos compara-
ção fosse baseado em apenas uma das síla-
bas da palavra apresentada como modelo.
Gomes & Souza (2008). Nesta pesquisa
avaliou-se o desempenho de pessoas diag-
nosticadas com autismo em tarefas de em-
parelhamento com o modelo por identida-
de. Buscou-se, na pesquisa, identificar os
efeitos da organização dos estímulos sobre
a aprendizagem dos participantes.
Hanna, Karino, Araújo, & Souza (2010).
Será que aprendemos a ler novas palavras
mais rapidamente treinando a leitura com
palavras semelhantes ou diferentes? Será
que aprendemos a ler novas palavras mais
rapidamente treinando com silabas ou le-
tras? Essa pesquisa tentou responder a es-
sas perguntas.
Alves, de Assis, Kato, & Brino (2011). Nesta
pesquisa investigou-se a aprendizagem de
leitura recombinativa após procedimentos
de esvanecimento de sílabas das palavras
de ensino em pessoas com atraso no desen-
volvimento cognitivo.
Elenice S. Hanna, Márcio Borges Moreira
107
REFERÊNCIAS
Alves, K. R. S., de Assis, G. J. A, Kato, O. M.,
& Brino, A. L.F. (2011). Leitura recombinati-
va após procedimentos de fading in de síla-
bas das palavras de ensino em pessoas com
atraso no desenvolvimento cognitivo. Acta
Comportamentalia, 19, 183-203.
Anderson, N. B. & Rincover, A. (1982). The
generality of overselectivity in develop-
mentally disabled children. Journal of Ex-
perimental Child Psychology, 34, 217-230.
Barros, R. S., Galvão, O.F., Brino, A. L. F.,
Goulart, P. R. K., & McIlvane, W. J. (2005).
Variáveis de procedimento na pesquisa so-
bre classes de equivalência: contribuições
para o estudo do comportamento simbóli-
co. Revista Brasileira de Análise do Com-
portamento, 1, 15-27.
Carter, D. E., & Werner, T. J. (1978). Com-
plex learning and information processing
by pigeons: A critical analysis. Journal of
the Experimental Analysis of Behavior, 29,
565-601.
Catania, A. C. (1998/1999). Aprendizagem:
comportamento, linguagem e cognição. Por-
to Alegre: Artmed.
da Hora, C. L., & Benvenuti, M. F. L. (2007).
Controle restrito em uma tarefa de mat-
ching-to-sample com palavras e sílabas:
avaliação do desempenho de uma criança
diagnosticada com autismo. Revista Brasi-
leira de Análise do Comportamento, 3, 29-
45.
Debert, P., Huziwara, E. M., Faggiani, R. B.,
de Mathis, M. E. S., & McIlvane, W. J. (2009).
Emergent conditional relations in a go/no-
-go procedure: Figure-ground and stimu-
lus-position compound relations. Journal of
Experimental Analysis of Behavior, 92, 233-
243.
Dinsmoor, J. A. (1995). Stimulus control: Part
I. The Behavior Analyst, 18, 51–68.
Duarte, A. M. M., & Baer, D. M. (1997). Over-
selectivity in the naming of suddenly and
gradually constructed faces. In D. M. Baer
& E. M. Pinkston (Eds.), Environment and
behavior (pp. 210-218). Oxford: Westview
Press.
Dube, W. V., & McIlvane, W. J. (1999) Re-
duction of stimulus overselectivity with
nonverbal differential observing responses.
Journal of Applied Behavior Analysis, 32,
25-33.
Gomes, C. G. S., & Souza, D. G. (2008). De-
sempenho de pessoas com autismo em ta-
refas de emparelhamento com o modelo
por identidade: efeitos da organização dos
estímulos. Psicologia: Reflexão e Crítica, 21,
418-429.
Hanna, E., Karino, C., Araújo, V., & Souza,
D. (2010). Leitura recombinativa de pseu-
dopalavras impressas em pseudoalfabeto:
Capítulo VI | Atenção
108
similaridade entre palavras e extensão da
unidade ensinada. Psicologia USP, 21, 275-
311.
Johnson, D. F., & Cumming, W. W. (1968).
Some determiners of attention. Journal of
the Experimental Analysis of Behavior, 11,
157-166.
Johnston, J. M., & Pennypacker, H. S. (2009).
Strategies and Tactics of Behavioral Resear-
ch. New York: Routledge.
Lashley, K. S. (1938). The mechanism of vi-
sion: XV. Preliminary studies of the rat’s ca-
pacity for detail vision. Journal of General
Psychology, 18, 123-193.
Lovaas, O. I., Schreibman, L., Koegel, R. L.,
& Rehm, R. (1971) Selective responding by
autistic children to multiple sensory input.
Journal of Abnormal Psychology, 77, 211-
222.
Lovaas, O. I., Koegel, R. L., & Schreibman,
L. (1979). Stimulus overselectivity in autism:
a review of research. Psychological Bulletin,
86, 1236-1254.
Lovaas, O. I., & Schreibman, L. (1971). Sti-
mulus overselectivity of autistic children in
a two stimulus situation. Behavioral Rese-
arch & Therapy, 9, 305-310.
Ray, B. A. (1969). Selective attention: The
effects of combining stimuli which control
incompatible behavior. Journal of the Expe-
rimental Analysis of Behavior, 12, 539-550.
Reynolds, G. (1961). Attention in the pige-
on. Journal of the Experimental Analysis of
Behavior, 4, 203-208.
Sidman, M. (1979). Remarks. Behaviorism, 7,
123-126.
Sidman (1960). Normal sources of patholo-
gical behavior. Science, 132, 61-68.
Skinner, B. F. (1953/2003). Ciência e com-
portamento humano (J. C. Todorov & R.
Azzi, Trads.). São Paulo: Martins Fontes.
Terrace, H. S. (1963). Errorless transfer of a
discrimination across two continua. Jour-
-nal of the Experimental Analysis of Beha-
vior, 6, 223–232.
Touchette, P. E. (1969). Tilted lines as com-
plex stimuli. Journal of the Experimental
Analysis of Behavior, 12, 211-214.
Verneque, L., & Hanna, E. S. (2012). Tempo
de exposição a estímulos multidimensio-
nais e topografias de controle de estímulo.
Revista Brasileira de Análise do Comporta-
mento, 8, 12-25.
Wilkie, D. M., & Masson, M. E. (1976). Atten-
tion in the pigeon: a reevaluation. Journal of
the Experimental Analysis of Behavior, 26,
207-212.
Peter Endemann, Candido Pessôa
109
A resposta de observação: o
papel das respostas sensoriais
para o estabelecimento da
discriminação
Peter Endemann
Universidade de São Paulo
Candido V. B. B. Pessôa
Paradigma Centro de Ciências do Comportamento
Wyckoff, L. B. (1969). The role of observing responses in discrimination learning. In D. P Hendry
(Ed.), Conditioned reinforcement (pp. 237-260). Homewood, IL: The Dorsey press.
“A seleção natural atuou sobre o sistema sensorial por meio das consequências im-
postas aos comportamentos guiados por esse sistemas”
Nilsson (2009)
Capítulo VII | Resposta de Observação
110
1 O controle da resposta por estímulos irrelevantes e seu efeito no esta-
belecimento da discriminação tem sido investigado ao longo das últi-
mas décadas por diversos pesquisadores (e.g. Dinsmoor, 1985; Dopson,
Esber & Pearce, 2010; Endemann, 2013; Hall, 1976; Krechevsky, 1932;
Lawrence, 1949; Mackintosh, 1965; Serna & Carlin, 2001; Spence, 1936;
Trobalon, Miguelez, McLaren & Mackintosh, 2003; Wagner, Logan,
Haberlandt & Price, 1968; Wyckoff, 1952; Zeaman & Denegre, 1967).
INTRODUÇÃO À ÁREA DE PES-
QUISA E CONTEXTUALIZAÇÃO
DO EXPERIMENTO
A elaboração do conceito de respos-
ta de observação se deu com o objetivo de
abordar um conjunto de práticas e pressu-
postos envolvendo a experiência senso-
rial dos organismos a partir de uma pers-
pectiva comportamental. De modo geral, a
experiência sensorial, compreendida pelo
ver, ouvir, sentir cheiros ou gostos ou sen-
tir a textura de um objeto pelo tato, é tra-
dicionalmente definida por habilidades
tais como a diferenciação e associação de
objetos. De uma perpectiva comportamen-
tal, essa experiência foi definida em termos
de discriminação e generalização, isto é,
pelo controle diferencial de respostas por
estímulos do ambiente. Segundo Skinner
(1938/1991), “pode-se dizer que um organis-
mo ‘percebe que dois estímulos são diferen-
tes’ se alguma diferença, qualquer que seja
ela, pode ser identificada no comportamen-
to sob controle daqueles estímulos” (p. 169).
Essas respostas diferenciais são produzi-
das em um treino discriminativo ou treino
de reforçamento diferencial. Nesse treino,
respostas são reforçadas na presença de
um estímulo (S+ ou SD) e não reforçadas na
presença de outro estímulo (S- ou S-delta).
Nas décadas de 1930 e 1940, o papel
das respostas sensoriais no estabelecimen-
to da discriminação foi empiricamente in-
vestigado. Posições opostas entre os diver-
sos pesquisadores da época deram origem a
um longo debate, conhecido como Contro-
vérsia Continuidade vs. não Continuidade.
Foi a partir desse debate que Wyckoff (1952,
1969) elaborou seu problema de pesquisa e
o procedimento experimental para seu es-
tudo.
De um modo geral, o papel das res-
postas sensoriais foi inserido nos estudos
sobre a discriminação por Karl Lashley
(1929). Essa inserção se deu partir de um
princípio fundamental da Gestalt, a seleti-
vidade. Com base nesse princípio, os orga-
nismos não percebem ou atentam ao am-
biente como um todo, mas apenas a partes
restritas desse ambiente. Segundo autores
como Lashley (1929, 1938, 1942) e Kreche-
vsky (1932, 1937, 1938), o sujeito experi-
mental, ao ser exposto a um treino discri-
minativo, poderia atentar seletivamente a
estímulos irrelevantes1 para a discriminação
e permanecer respondendo sobre controle
acidental desses estímulos. Nesses casos, o
sujeito poderia não estar aprendendo nada
sobre as contingências de discriminação
programadas. Em síntese, o sujeito poderia,
em função do controle seletivo de estímu-
los irrelevantes, permanecer em situação
não discriminada mesmo sendo exposto e
produzindo os reforçadores programados a
depender de sua correlação com aqueles es-
Peter Endemann, Candido Pessôa
111
tímulos. Exemplos de estímulos irrelevan-
tes poderiam ser a temperatura, o tamanhoou a textura da caixa experimental em um
treino discriminativo entre as cores verde e
vermelho.
Respostas a estímulos irrelevantes ao
longo do treino discriminativo foram cha-
madas de tentativas de solução e, segundo
Lashley (1929, 1938, 1942), são parte de uma
gama de atividades e da história do sujeito.
Essas tentativas de solução foram analisa-
das por Krechevsky (1932, 1938) sob o rótulo
de “hipóteses”. Essas respostas, registradas
sobretudo no início do treino discriminati-
vo, foram discutidas por Lashley e por Kre-
chevsky com base em outro princípio da
Gestalt, o da “organização sensorial”.
O estabelecimento da discriminação
envolveria, assim, uma série de controles
independentes em função do contato sen-
sorial e seletivo com os estímulos presen-
tes. Essa série de controles antecederiam o
contato e o controle diferencial das respos-
tas pelos estímulos S+ e S-. Lashley exem-
plifica esses controles como “respostas à
posição, à alternação, a dicas oriundas dos
movimentos do pesquisador e que comu-
mente precedem as respostas aos estímulos
correlacionados” (Lashley, 1929, p. 135). O
termo “estímulos correlacionados” utilizado
por Lashley se refere tanto a S+ como a S-,
pois ambos conservam correlações de +1 e
-1 com o reforço, respectivamente2.
Em conclusão, supondo uma priori-
dade da seletividade frente ao treino dis-
criminativo e ao estabelecimento da dis-
criminação, os autores (e.g., Lashley, 1929,
1938) apontavam para a necessidade de se
investigar não apenas o estabelecimento de
respostas diferenciais, mas também de res-
postas sensoriais que tinham como função
colocar o organismo em contato com os es-
tímulos S+ e S-, relevantes para a diferen-
ciação da resposta. Não se questionava uma
definição comportamental de discrimina-
ção, mas a natureza do processo pelo qual o
organismo passava a responder diferencial-
mente quando exposto ao treino de reforça-
mento diferencial. Para os autores citados
anteriormente (e.g., Krechevsky, 1932, 1938;
Lashley, 1938) , o estabelecimento da dis-
criminação seria um processo de natureza
descontínua.
Por outro lado, Kenneth W. Spen-
ce (1936, 1940, 1945) e Skinner (1938/1991)
assumiam a discriminação como um pro-
cesso contínuo, envolvendo o acúmulo de
pequenas diferenças entre as respostas na
presença de S+ e S-, em função do reforça-
mento diferencial (Skinner não participou
ativamente do debate, o que lhe rendeu
críticas, e.g., Krechevsky, 1938). Contudo,
a concepção de que a discriminação seria
2 Em um treino discriminativo, a correlação dos estímulos é correta e
comumente tratada da seguinte maneira: S+ correlacionado ao reforço
e S- correlacionado à extinção. A extinção se refere à ausência de re-
forço e, desse modo, o S- é correlacionado, negativamente, ao reforço.
Assim, em um treino discriminativo, podemos nos referir tanto ao S+
como S- como “estímulos correlacionados”. Em termos de probabilida-
de de a resposta (ou cadeia de respostas) produzir o reforço, temos pro-
babilidade de 100% e 0%, respectivamente, sob o S+ e sob o S-. Estímu-
los que, de fato, não são correlacionados com o reforço são aqueles que
mantem correlação nula (zero) e a probabilidade de a resposta produzir
o reforço em sua presença é 50% (i.e., ao acaso).
Capítulo VII | Resposta de Observação
112
um processo contínuo de acúmulos de pe-
quenas diferenças foi defendida por Spen-
ce). Essa concepção ficou, então, conhecida
como continuísta.
Com o objetivo de se investigar os
processos básicos envolvidos na discrimi-
nação, tornar o treino mais eficaz e evitar o
controle acidental das respostas por estímu-
los irrelevantes, tanto Skinner (1938/1991)
como Spence (1936) estabeleceram algumas
soluções procedimentais. Segundo Skinner,
os experimentos deveriam ser conduzidos
“em caixas à prova de som, escuras, com pa-
redes lisas” (p. 55). Segundo Spence (1936),
uma vez que o interesse é no processo de
diferenciação das respostas aos estímulos
correlacionados com o reforço, o ambiente
experimental bem como a resposta senso-
rial aos estímulos correlacionados devem
ser os mais simples possível.
Segundo Spence (1936), todos es-
tímulos que incidam sobre o aparato sen-
sorial do organismo quando sua resposta é
reforçada adquirem ou perdem tendências
excitatórias. Assim, ao longo do treino dis-
criminativo, possíveis controles da resposta
por estímulos irrelevantes vão sendo gradu-
almente eliminados e os estímulos correla-
cionados com o reforço (i.e., S+ e S-) passam
a controlar diferencialmente a resposta, em
um processo gradual e contínuo.
As posições opostas sobre o processo
de discriminação foram submetidas a uma
série de experimentos nas décadas de 1930
e 1940 (e.g. Ehrenfreund, 1948; Krechevsky,
1932, 1937, 1938; Lashley, 1929, 1938, 1942;
McCulloch & Pratt, 1934; Spence, 1936,
1940, 1945). Nesses experimentos, a princi-
pal manipulação (variáveis independentes)
foi o controle e variações em parâmetros
dos estímulos (e.g., quantidade e posição
dos estímulos no ambiente experimental,
variação em suas propriedades físicas – bri-
lho, frequência, textura, etc. – variação em
sua correlação com o reforço) e o desem-
penho analisado (variável dependente) foi
o número de “acertos” e “erros”. O desem-
penho foi registrado antes que os sujeitos
atingissem o critério, ou seja, no período em
que os sujeitos se mantinham responden-
do tanto na presença do S+ quanto na do
S-. Nesse período, as respostas não discri-
minadas (em relação aos S+ e S-) produzem
as consequências programadas ao acaso,
ou seja, as respostas produzem reforços em
aproximadamente 50% das vezes. Esse pe-
ríodo foi chamado de período pressolução.
A manipulação de parâmetros dos
estímulos e a análise das respostas no pe-
ríodo pressolução foram realizadas em con-
junto com uma manipulação bem engenho-
sa. Diversos pesquisadores aplicaram uma
reversão na correlação dos estímulos com o
reforço ainda no período pressolução, isto é,
o estímulo que era S+ passava a ser S- e vi-
ce-versa. A justificativa dessas reversões no
período pressolução era que caso a discri-
minação se estabelecesse por um processo
contínuo, a reversão deveria afetar o núme-
ro de respostas (acertos e erros) emitidas no
Peter Endemann, Candido Pessôa
113
período pressolução, em comparação a um
grupo controle para o qual a reversão não
era conduzida. Se a discriminação fosse um
processo descontínuo, a reversão dos estí-
mulos no período pressolução não afetaria
necessariamente o número de respostas,
uma vez que essas poderiam ser emitidas
sob controle de outras partes do ambien-
te (estímulos irrelevantes) que não aquelas
que foram correlacionadas ao reforço.
De todas as manipulações dos parâ-
metros dos estímulos, a posição na qual o
estímulo era apresentado em um treino de
discriminação visual teve um papel pecu-
liar para o problema de pesquisa de Wycko-
ff (1969). Ehrenfreud (1948), com base nos
dados inconclusivos dos experimentos até
então realizados, decidiu expor dois grupos
de sujeitos ao mesmo treino discriminativo
e reversão dos estímulos no período pres-
solução. A única diferença entre os grupos
foi a posição na qual os estímulos eram
apresentados no campo de visão dos sujei-
tos. Os resultados obtidos por Ehrenfreud
refletem os resultados obtidos ao longo de
todo o debate: quando os estímulos eram
apresentados bem a frente do sujeito, em
uma posição a partir da qual o contato era
favorecido ao longo de todo o treino, os re-
sultados davam maior suporte àqueles que
defendiam a discriminação como um pro-
cesso contínuo. Quando os estímulos eram
apresentados em outra posição do campo
visual, os resultados davam maior supor-
te àqueles que defendiam discriminação
como um processo não contínuo.
Apesar de o artigo de Ehrenfreud ter
sido publicado em 1948, o efeito da posição
do estímulo já vinha sendo debatido desde
a década de 1930. Ao longo do debate, Spen-
ce (1940, 1945), de forma bastantecoerente,
analisou a situação experimental dos estu-
dos e inseriu uma questão interessante em
seus argumentos. Segundo Spence, a mera
presença dos estímulos na situação expe-
rimental não garante que esses estímulos
incidam no aparato sensorial do sujeito. Se-
gundo Spence, “caso o aparato sensorial do
animal não seja forçado a receber os estí-
mulos correlacionados com o reforço desde
o início do treino, as associações não serão
formadas” (Spence, 1940, p. 276). Nessas si-
tuações,
“o animal é requerido a aprender, em
adição à resposta diferencial, uma
resposta perceptual apropriada que o
conduza para a recepção dos estímu-
los correlacionados ... o animal deve
aprender a orientar e fixar a cabeça
e os olhos afim de receber os estímu-
los correlacionados” (Spence, 1940, p.
276).
Essas respostas foram chamadas de
respostas de orientação dos órgãos recep-
tores.
Ao inserir a necessidade do aprendi-
zado de uma resposta de orientação dos re-
ceptores no debate, Spence (1940, 1945) ad-
mite que o animal pode estar respondendo
a estímulos irrelevantes e não estar apren-
Capítulo VII | Resposta de Observação
114
dendo nada sobre os estímulos correlacio-
nados (i.e., S+ e S-). Mas, nesse caso, segun-
do Spence (1945), não estaria ocorrendo o
estabelecimento da discriminação sobre o
qual seus interesses estavam centrados. O
autor insistiu, portanto, na simplificação do
ambiente experimental.
Após revisar o debate, Wyckoff levan-
ta críticas ao modelo defendido por Spence
(1940, 1945). Sem necessariamente tomar
um partido no debate, Wyckoff (1952) apon-
ta que a simplificação do ambiente experi-
mental, de modo a minimizar a necessidade
de aprendizado de respostas de orientação
dos receptores (como definidas por Spence),
poderia impor limites ao valor preditivo do
modelo continuísta e de teorias sobre o es-
tabelecimento da discriminação. Segundo
Wyckoff, nem em situações cotidianas nem
em situações controladas de laboratório
seria possível precisar se os animais serão
expostos aos estímulos correlacionados ao
reforço. Em sua tese de doutorado, Wycko-
ff, manipulou a necessidade de se aprender
a resposta de orientação dos receptores,
além daquelas respostas que produzem (ou
não) o reforço, em um treino discriminativo.
Wyckoff finalizou o doutorado em 1951, pu-
blicou um artigo teórico em 1952 e, apenas
em 1969, um artigo que descreve seu estudo
experimental. Os objetivos e o método des-
se estudo serão descritos a seguir.
DESCRIÇÃO DO EXPERIMENTO
Objetivo e Método
O objetivo principal do experimento
de Wyckoff (1969) foi analisar o papel das
respostas de orientação dos receptores no
estabelecimento de uma discriminação. Di-
ferentemente de como essas respostas eram
discutidas, Wyckoff as definiu como res-
postas que colocam o organismo em conta-
to com estímulos correlacionados com o re-
forço. Para diferenciá-las das respostas que
produzem o reforço (e.g., bicar um disco em
experimentos com pombos, pressionar uma
barra em experimentos com ratos, chama-
das de respostas efetivas), Wyckoff as no-
meou de respostas de observação (RO).
Com base na função da RO (i.e., co-
locar o organismo em contato com os es-
tímulos correlacionados ao reforço) e nos
princípios do condicionamento operante
descritos por Skinner (1938/1991), Wyckoff
(1969) investigou se a produção de estímu-
los discriminativos teria um efeito reforça-
dor sobre a RO em um treino discrimina-
tivo. Essa investigação, segundo Wyckoff
(1952), forneceria um tratamento comporta-
mental ao que vinha sendo nomeado de ex-
periência sensorial e resposta de orientação
dos receptores.
Frente à dificuldade de se registrar a
orientação dos órgãos receptores de sujei-
tos experimentais, Wyckoff (1969) foi enge-
nhoso e coerente com a definição funcional
da RO. Em seu experimento, usou pombos
Peter Endemann, Candido Pessôa
115
como sujeitos experimentais. Na caixa ex-
perimental, um pedal foi posto no piso e
os estímulos correlacionados com o refor-
ço (S+ ou S-) só eram apresentados caso o
pombo o pressionasse. Assim, os pombos
só entravam em contato com os estímulos
ao pressionar o pedal. Os estímulos ficavam
expostos durante todo o tempo em que o
sujeito estivesse pisando o pedal, o que, por
sua vez, definiu a medida a ser registrada
e analisada por Wyckoff: a duração da res-
posta de observação.
No experimento, foram utilizados 20
pombos mantidos sob um regime de priva-
ção de comida. Os pombos foram distribuí-
dos em dois grupos, (Controle e Experimen-
tal). Além do pedal, a caixa experimental
continha um disco que podia ser iluminado
de branco, vermelho ou verde e um come-
douro retrátil (para apresentação de comi-
da).
Em uma fase preliminar, que durou
45 min, houve a adaptação dos pombos
de ambos os grupos às condições experi-
mentais. Durante os primeiros 15 min des-
sa fase, o disco foi iluminado de branco e
a primeira bicada no disco produzia acesso
a um comedouro por 4 s em um esquema
de intervalo fixo (FI) 30 s. Durante os 30
min restantes dessa fase, o disco foi ilumi-
nado de verde ou de vermelho em períodos
sucessivos de 30 s. As respostas de bicar o
disco davam acesso ao comedouro da mes-
ma forma que nos primeiros 15 min dessa
fase (i.e., sob um FI 30 s). Nesta fase preli-
minar, não havia contingências para pisar
no pedal e tampouco uma correlação entre
as luzes verde e vermelha e o acesso ao co-
medouro. Os pombos do Grupo Controle
foram expostos a estas condições durante
todo o experimento.
Na Fase Experimental (treino discri-
minativo), aplicadas apenas aos pombos no
Grupo Experimental, houve cinco sessões
de 75 min e uma de 15 min. Durante as ses-
sões desta fase, respostas de bicar o disco fo-
ram mantidas sob um esquema FI 30 s. Esse
esquema se alternava com um esquema de
extinção a cada 30 s. Durante a extinção,
bicadas no disco não produziam acesso ao
comedouro. Durante a fase experimental, a
luz vermelha era correlacionada ao FI 30 s
(i.e., aos reforços) a luz verde era correlacio-
nada à extinção. Entretanto, as luzes ver-
de ou vermelha eram produzidas somente
enquanto o pombo pisasse no pedal, isto é,
quando emitisse a RO. Se o pombo emitisse
a RO e o esquema em vigor fosse a extin-
ção, o disco era iluminado de verde. Quan-
do o pombo pisasse no pedal e estivesse em
vigor o esquema FI 30 s, a luz vermelha se
acendia no disco. Caso o sujeito não emitis-
se a RO, o disco permanecia iluminado de
branco tanto quando o esquema em vigor
era o FI30 s quanto quando o esquema em
vigor era extinção e as respostas de bicar o
disco produziam o reforço a depender de
qual esquema estava em vigor. Em resumo,
pisar o pedal, emitindo a RO, transformava
um esquema misto FI 30 s extinção em um
esquema múltiplo FI 30 s extinção3.
Capítulo VII | Resposta de Observação
116
Após as seis primeiras sessões da
Fase Experimental, o Grupo Experimen-
tal foi subdividido em três subgrupos A, B
e C. O subgrupo A permaneceu no treino
discriminativo (reforçamento diferencial) e,
assim, a RO continuava a produzir as luzes
verde e vermelha e essas, por sua vez, se
mantinham relacionadas com a extinção e
reforço, respectivamente. Para o subgrupo
B, a relação dos estímulos com o reforço foi
invertida (o estímulo relacionado ao FI 30
s passou a ser o verde e o estímulo relacio-
nado à extinção passou a ser o vermelho); e
o subgrupo C retornou à condições seme-
lhantes aos últimos 30 min da fase preli-
minar (reforçamento não-diferencial), nas
quais as luzes, apesar de produzidas pela
pressão no pedal, não estavam mais corre-
lacionadas ao reforço (i.e., reforço poderia
ser produzido com a mesma probabilidade
diante da luz verde e vermelha, se o pedal
estivesse pressionado, e branca, se o pedal
não estivesse pressionado).
Resultados e Discussão
Como indicado anteriormente, Wy-
ckoff (1969) registrou o tempo em que o pe-
dal era pressionado, isto é, a duração das
respostas de observação. Com isso, eleana-
lisou variações na duração da RO em fun-
ção da produção ou não dos estímulos cor-
relacionados com o reforço nos diferentes
subgrupos. A duração da RO para o Grupo
Controle foi relativamente alta inicialmen-
te, mas rapidamente diminuiu, permane-
cendo baixa até o fim do experimento. Para
o Grupo Experimental, a duração da RO
também começou alta para todos os pom-
bos e assim permaneceu para o subgrupo
A, que se manteve no treino discriminativo.
Para o subgrupo B, a duração da RO dimi-
nuiu logo que a correlação dos estímulos
foi invertida, mas aumentou assim que a
discriminação foi novamente estabelecida.
Para o subgrupo C, que retornou às condi-
ções da fase preliminar após o treino discri-
minativo (as luzes verde e vermelha podiam
ser produzidas, mas não havia correlação
diferencial com o reforço), a duração da RO
diminuiu em relação à fase em que havia
correlação entre as luzes verde e vermelha
e o reforço.
Em conclusão, Wyckoff (1969) afir-
mou que a exposição e o contato dos sujei-
tos com os estímulos discriminativos teve
um efeito reforçador sobre a RO (i.e., pres-
são ao pedal). Assim, Wyckoff confirmou
que a produção de estímulos discriminati-
vos para a resposta de bicar um disco esta-
beleceu e manteve a RO. Com base em seus
resultados, Wyckoff (1952, 1969) afirmou
que (1) a probabilidade da RO aumenta ou
permanece alta sob as condições de reforço
diferencial implementadas no treino discri-
minativo; (2) quando a correlação dos estí-
mulos é invertida, a probabilidade da RO
diminui temporariamente e depois retorna
a um valor alto; e (3) a probabilidade da RO
3 Em um esquema múltiplo, dois ou mais esquemas de reforço se alter-
nam e cada um é apresentado conjuntamente a um estímulo diferente.
Em um esquema misto, os esquemas de reforço se alternam, mas não
há estímulos correlacionados diferencialmente com os esquemas em
vigor (Machado, 1982).
Peter Endemann, Candido Pessôa
117
diminui ou permanece baixa em situações
de reforço não-diferencial, nas quais os es-
tímulos produzidos pela RO não são corre-
lacionados ao reforço.
Os resultados obtidos autorizaram
Wyckoff (1969) a discutir o papel da RO no
estabelecimento da discriminação tendo
como base os princípios operantes descri-
tos por Skinner (1938/1991). Segundo Wy-
ckoff (1952, 1969), a RO é uma resposta ope-
rante cuja consequência é a produção dos
estímulos discriminativos. Definir a respos-
ta de observação por sua função e não por
sua topografia permitiu a Wyckoff delinear
um experimento que facilmente registrou
as respostas de observação. Foi esta genia-
lidade que tornou seu estudo um clássico
na Análise do Comportamento e permitiu
ampliar o uso do conceito de discriminação
para situações em que os estímulos discri-
minativos não estão claramente dispostos
sobre o aparato sensorial dos indivíduos.
Um aspecto importante da RO vale
ser ressaltado. A emissão da RO tem como
única consequência a produção dos estí-
mulos discriminativos e, portanto, não al-
tera a obtenção dos reforços programados
para uma determinada resposta. A obten-
ção dos reforços pode ocorrer sem a emis-
são da RO (i.e., na presença da luz branca).
Em uma discriminação sucessiva (i.e., em
que os estímulos correlacionados com re-
forço e com extinção se alternam), como
delineada por Wyckoff (1969), todos os re-
forços programados podiam ser produzidos
sem que os pombos emitissem uma única
vez a RO. Esse aspecto levou a alguns des-
dobramentos importantes na investigação
sobre o estabelecimento da discriminação,
sobre os efeitos comportamentais de refor-
ços condicionados e sobre atenção. Esses
desdobramentos são discutidos a seguir.
DESDOBRAMENTOS
No procedimento de Wyckoff (1969),
chamado de delineamento (ou procedimen-
to) de resposta de observação, o fortaleci-
mento da RO não ocorreu em função direta
da produção do estímulo reforçador primá-
rio (i.e., acesso a comida). Como visto, no
estudo de Wyckoff, o valor de reforçador
condicionado das luzes verde e vermelha
foi adquirido em função de suas correla-
ções com os esquemas de reforço (i.e., FI 30
s) e extinção que, por sua vez, controlaram
o aumento na duração da RO. Por meio des-
se delineamento, vários autores têm inves-
tigado essa (correlação) e outras condições
(e.g. temporais) necessárias para o estabele-
cimento do valor reforçador condicionado
de determinados estímulos.
Como esperado, posições e hipóteses
opostas sobre o reforço condicionado foram
propostas. Um amplo debate se mantém até
os dias atuais. As duas principais hipóteses
são conhecidas como a hipótese da redu-
ção da incerteza e a hipótese da redução
do atraso. Autores que propõem a hipótese
da redução da incerteza (e.g. Berlyne, 1957)
Capítulo VII | Resposta de Observação
118
defendem que a condição necessária para o
estabelecimento e controle da RO é a redu-
ção na incerteza gerada pelas respostas aos
estímulos não-correlacionados (estímulos
irrelevantes, tais como a luz branca do es-
quema misto no estudo de Wyckoff, 1969).
Os autores que propõem a hipótese da re-
dução do atraso (e.g. Fantino, 1977; Fantino
& Logan, 1979), defendem que a condição
necessária para o estabelecimento do valor
reforçador condicionado de um estímulo é
a redução temporal relativa sinalizada pelo
estímulo correlacionado com o reforço pri-
mário.
Dinsmoor (1983) discute algumas
questões referentes à RO e apresenta, além
de novas possibilidades de investigação
sobre reforçamento condicionado, um refi-
namento do estudo de Wyckoff (1969) e do
conceito de resposta de observação. Como
descrito anteriormente, Wyckoff registrou
e analisou a duração da RO em função da
correlação dos estímulos com o reforço.
Dinsmoor, Browne, Lawrence, e Wasser-
man (1971) registraram e analisaram sepa-
radamente a duração da RO nos diferentes
componentes (i.e., na presença dos dife-
rentes estímulos) em um treino de reforça-
mento diferencial. Os autores notaram que
a duração da RO é maior na presença do S+
do que na presença do S-. Essa assimetria
na duração da RO entre S+ e S- foi definida
pelos autores como observação seletiva e
gerou novas pesquisas sobre o reforço con-
dicionado e sobre o papel da RO no estabe-
lecimento da discriminação (e.g. Dinsmoor
1985; Dinsmoor, Mueller, Martin, & Bowe,
1982).
Com o desenvolvimento de novas
tecnologias, especialmente a de rastrea-
mento dos movimentos oculares, o conceito
de resposta de observação tem sido subme-
tido à novos refinamentos e discussões (e.g.
Endemann, 2008, 2013; Pessôa, 2010; To-
manari, Balsamo, Fowler, Farren, & Dube,
2007; Tomanari & Pergher, 2003). O registro
de parâmetros dos movimentos sacádicos4
(pico de velocidade, amplitude, curvatura) e
da fixação (frequência, duração) tem permi-
tido a análise de novas medidas da RO. De
posse dessas novas medidas, o papel da RO
tem sido analisado em diferentes situações
básicas e aplicadas envolvendo discrimina-
ções simples e condicionais, formação de
classes de estímulos equivalentes (e.g. Dube
et al., 1999; Serna & Carlin, 2001), treina-
mento de habilidades como leitura e reso-
lução de problemas (e.g. Endemann, Pessôa,
Perez & Tomanari, 2010).
CONSIDERAÇÕES FINAIS
Com o objetivo de trazer a discrimi-
nação para o campo da análise do compor-
tamento operante, Skinner (1938/1991) de-
4 Movimentos sacádicos são os movimentos oculares rápidos, antece-
didos e precedidos pela fixação e acomodação dos estímulos no centro
da retina (e.g. Krauzlis, 2008; Madelain, Paeye & Darcheville, 2011; Sal-
thouse & Ellis, 1980). Segundo Krauzlis (2008), um aspecto importante
dos movimentos sacádicos é que “são seletivamente guiados por ob-
jetos de interesse do observador, apesar do fato de haver usualmente
no ambiente vários outros objetos distratores” (Krauzlis, 2008, p. 789,
itálico acrescentado).
Peter Endemann, Candido Pessôa
119
fendeu que a discriminação e a experiência
sensorial a ela subjacente deveriam ser de-
finidas e analisadascom base em apenas
uma classe de respostas (i.e., aquela que,
pela produção diferencial do reforço, fica
sob controle de estímulos discriminativos).
Wyckoff (1969) foi original em estabelecer
medidas interdependentes entre duas clas-
ses de resposta (i.e., a que produz direta-
mente o reforço e a que produz os estímulos
discriminativos) e em avaliar experimental-
mente a resposta de observação bem como
o entrelaçamento desta com a resposta
que produz o reforço. Esse entrelaçamen-
to é mediado por um estímulo com duas
funções: Função reforçadora condiciona-
da para a resposta de observação e função
discriminativa para a resposta que produz o
reforço (e.g., Pessôa & Sério, 2006).
PARA SABER MAIS
Dinsmoor (1985). Análise teórica sobre o
papel da resposta de observação no estabe-
lecimento da discriminação, em que o autor
critica as posições de Skinner e Spence. O
autor apresenta uma série de estudos sobre
controle de estímulos, destacando o papel
da observação seletiva (desenvolvido desde
o estudo de Dinsmoor et al., 1971).
Endemann (2013). Análise experimental e
teórica sobre o efeito de variações nos es-
tímulos irrelevantes para a aquisição e ma-
nutenção da resposta de observação visual
(registrada por meio dos movimentos ocu-
lares). Neste estudo, apresentam-se com
mais detalhes os estudos experimentais e
argumentos da Controvérsia continuidade
vs. não-continuidade.
Pessôa & Sério (2006). Análise teórica so-
bre as duas contingências envolvidas no
estabelecimento da discriminação. Os au-
tores discutem as duas funções adquiridas
pelo estímulo correlacionado com o refor-
ço: Discriminativo, para a resposta efetiva,
e reforçador condicionado, para a resposta
de observação.
Tomanari (2009). Ampla revisão dos estu-
dos sobre a resposta de observação desde
pesquisas precursoras com ratos expostos
a labirintos até investigações mais recentes
sobre o tema. O autor apresenta aspectos
relevantes do delineamento experimental
tais como número de operanda e as dife-
rentes espécies utilizadas nos estudos.
Pessôa & Tomanari (2015). Diferenciam o
procedimento de resposta de observação
elaborado por Wyckoff (1969) da importân-
cia da resposta de observação por ele de-
finida funcionalmente, dando destaque às
possibilidades de pesquisas aplicadas para
a facilitação da aquisição de respostas de
observação.
REFERÊNCIAS
Berlyne, D. E. (1957). Uncertainty and con-
flict: A point of contact between informa-
Capítulo VII | Resposta de Observação
120
tion theory and behavior concepts. Psycho-
logical Review, 64, 329-333.
Dinsmoor, J. A. (1983). Observing and con-
ditioned reinforcement. Behavioral and
Brain Sciences, 6, 693-728.
Dinsmoor, J. A. (1985). The role of observing
and attention in establishing stimulus con-
trol. Journal of the Experimental Analysis of
Behavior, 43, 365-381.
Dinsmoor, J. A., Browne, M. P., Lawren-
ce, C. E., & Wasserman, E. A. (1971). A new
analysis of Wyckoff’s observing response.
Proceedings of the 79th Annual Convention,
American Psychological Association (pp.
679-680).
Dinsmoor, J. A., Mueller, K. L., Martin, L. T.,
& Bowe, C. A. (1982). The acquisition of ob-
serving. Journal of the Experimental Analy-
sis of Behavior, 38, 249-263.
Dopson, J. C., Esber, G. R., & Pearce, J. M.
(2010). Differences in the associability of
relevant and irrelevant stimuli. Journal of
Experimental Psychology: Animal Behavior
Processes, 36, 258–267.
Dube, W. V., Lombard, K. M., Farren, K. M.,
Flusser, D. S., Balsamo, L. M., & Fowler, T. R.
(1999). Eye tracking assessment of stimulus
overselectivity in individuals with mental
retardation. Experimental Analysis of Hu-
man Behavior Bulletin, 17, 8-14.
Ehrenfreund, D. (1948). An experimental
test of the continuity theory of discrimina-
tion with pattern vision. Journal of Com-
parative and Physiological Psychology, 41,
408-422.
Endemann, P. (2008). Resposta de observa-
ção e movimento dos olhos em uma situação
de discriminação simples simultânea. (Dis-
sertação de Mestrado). Universidade de São
Paulo, São Paulo.
Endemann, P. (2013). Aprendizado sobre a
(ir)relevância dos estímulos. (Tese de douto-
rado) Universidade de São Paulo, São Paulo.
Endemann, P., Pessôa, C. V. B. B., Perez, W.
F., & Tomanari, G. Y. (2010). Identificação de
operantes verbais constituintes da leitura
por meio da análise dos movimentos dos
olhos. Psicologia: Teoria e Pesquisa, 27, 139-
148.
Fantino E. (1977). Conditioned reinforce-
ment: Choice and information. In W.K. Ho-
nig & J.E.R. Staddon (Eds.), Handbook of
operant behavior (pp. 313–339). Englewood
Cliffs, NJ: Prentice-Hall.
Fantino, E., & Logan, C. A. (1979). The ex-
perimental analysis of behavior: A biological
perspective. New York: W. H. Freeman.
Hall, G. (1976). Learning to ignore irrelevant
stimuli variations within and between dis-
plays. Quarterly Journal of Experimental
Psychology, 28, 247-253
Peter Endemann, Candido Pessôa
121
Krauzlis, R. J. (2008). Eye movements. In
L. R. Squire & D. Berg (Eds.), Fundamental
Neuroscience (pp. 775-792). Amsterdam: El-
sevier.
Krechevsky, I. (1932). Hypotheses in rats.
Psychological Review, 39, 516-532.
Krechevsky, I. (1937). A note concerning
“the nature of discrimination learning in
animals.” Psychological Review, 44, 97-104.
Krechevsky, I. (1938). A study of the conti-
nuity of the problem-solving process. Psy-
chological Review, 45, 107-133.
Lashley, K. S. (1929). Brain mechanisms and
intelligence. Chicago: University of Chicago
Press.
Lashley, K. S. (1938). The mechanism of vi-
sion: XV. Preliminary studies of the rat’s ca-
pacity for detail vision. Journal of General
Psychology, 18, 123-193.
Lashley, K. S. (1942). An examination of the
continuity theory as applied to discrimina-
tion learning. Journal of Genetic Psychology,
26, 241-265.
Lawrence, D. H. (1949). Acquired distincti-
veness of cues: I. Transfer between discri-
minations on the basis of familiarity with
the stimulus. Journal of Experimental Psy-
chology, 39, 770-784.
Mackintosh, N. J. (1965). Selective attention
in animal discrimination learning. Psycho-
logical Bulletin, 64, 124-50.
Madelain L., Paeye C., & Darcheville, J. C.
(2011). Operant control of human eye move-
ments. Behavioural Processes, 87, 142–148.
Nilsson, D.E., (2009). The evolution of eyes
and visually guided behaviour. Philosophi-
cal Transactions of the Royal Society, 364,
2833–2847.
Pearce, J. M., Esber, G. R., George, D. N., &
Haselgrove, M. (2008). The nature of discri-
mination learning in pigeons. Learning &
Behavior, 36, 188-199.
Pessôa, C. V. B. B. (2010). Efeito de diferentes
treinos de discriminação sobre as fixações
dos olhos de humanos. (Tese de doutorado).
Universidade de São Paulo, São Paulo.
Pessôa, C. V. B. B., & Sério, T. M. A. P. (2006).
Análise do comportamento de observação.
Revista Brasileira de Análise do Comporta-
mento, 2, 143-153.
Pessôa, C. V. B. B., & Tomanari, G. Y. (2015).
Procedimento de resposta de observação e
comportamento de observação. Perspecti-
vas em Análise do Comportamento, 6, 89-
98.
Salthouse, T. A., & Ellis, C. L. (1980). Deter-
minants of eye-fixation duration. American
Journal of Psychology, 93, 207-234.
Capítulo VII | Resposta de Observação
122
Serna, R. W., & Carlin, M. T. (2001). Guiding
visual attention in individuals with mental
retardation. In L. M. Glidden (Ed.), Interna-
tional review of research in mental retarda-
tion, 24 (pp. 321-357). San Diego, CA: Aca-
demic Press.
Skinner, B. F. (1938). The behavior of orga-
nisms: an experimental analysis. New York:
Appleton-Century-Crofts.
Spence, K. W. (1936). The nature of discri-
mination learning in animals. Psychological
Review, 43, 437-449.
Spence, K. W. (1940). Continuous versus
non-continuous interpretations of discri-
mination learning. Psychological Review, 47,
271-288.
Spence, K. W. (1942). The basis of solution
by chimpanzees of the intermediate size
problem. Journal of ExperimentalPsycholo-
gy, 31, 257-271.
Spence, K. W. (1945). An experimental test
of the continuity and noncontinuity theo-
ries of discrimination learning. Journal of
Experimental Psychology, 35, 253-266.
Tomanari, G. Y. (2009). Resposta de obser-
vação: Uma reavaliação. Acta Comporta-
mentalia, 17, 259-277.
Tomanari, G. Y., Balsamo, L. M., Fowler,
T. R., Farren, K. M., & Dube, W. V. (2007).
Manual and ocular observing behavior in
human subjects. European Journal of Beha-
vior Analysis, 8, 29-40.
Tomanari, G. Y., & Pergher, N. K. (2003).
Observing behavior and eye movements in
a Wyckoff observing response procedure.
Paper presented at the Annual Meeting of
the Association for Behavior Analysis, São
Francisco.
Trobalon, J.B., Miguelez, D., McLaren, I. P
.L., & Mackintosh, N. J. (2003). Intradimen-
sional and extradimensional shifts in spa-
tial learning. Journal of Experimental Psy-
chology: Animal Behavior Processes, 29,
143-152.
Wagner, A. R., Logan, F. A., Haberlandt, K.,
& Price, T. (1968). Stimulus selection in ani-
mal discrimination learning. Journal of Ex-
perimental Psychology, 76, 171-180.
Wyckoff, L. B. (1952). The role of observing
responses in discrimination learning: Part I.
Psychological Review, 59, 431-442.
Wyckoff, L. B. (1969). The role of observing
responses in discrimination learning. In D.
P Hendry (Ed.), Conditioned reinforcement
(pp. 237-260). Homewood, IL: The Dorsey
Press.
Zeaman, D. & Denegre, J. (1967). Variability
of irrelevant discriminative stimuli. Journal
of Experimental Psychology, 73, 574-580.
Edson Massayuki Huziwara, Candido V. B. B. Pessôa
123
Controle dos processos
atencionais
Edson Massayuki Huziwara
Universidade Federal de Minas Gerais
Candido V. B. B. Pessôa
Paradigma Centro de Ciências do Comportamento
Holland, J. G. (1958). Human vigilance. Science, 128 (3315), 61-67.
“Life is what happens to you while you’re busy making other plans”
John Lennon
Capítulo VIII | Atenção
124
INTRODUÇÃO À ÁREA DE PES-
QUISA E CONTEXTUALIZAÇÃO
DO EXPERIMENTO
Notícias a respeito de pessoas diag-
nosticadas com o Transtorno do Déficit de
Atenção e Hiperatividade (TDAH) torna-
ram-se consideravelmente frequentes nos
dias atuais. Segundo o Manual Diagnóstico
e Estatístico de Transtornos Mentais (DSM-
-IV-TR™), o TDAH apresenta como carac-
terística principal um “padrão persistente
de desatenção e/ou hiperatividade-impul-
sividade, mais frequente e grave do que
aquele tipicamente observado nos indiví-
duos em equivalente estágio de desenvol-
vimento” (APA, 2002, p. 112). Estima-se que
3% a 6% das crianças em idade escolar de
todo o mundo tenham sido diagnosticadas
com o referido transtorno (Faraone, Serge-
ant, Gillberg, & Biederman, 2003; Rohde,
Miguel Filho, Benetti, Gallois, & Kieling,
2004), constituindo-se assim em uma das
principais causas de encaminhamento para
os serviços de saúde (Rohde, Barbosa, Tra-
montina, & Polanczyk, 2000; Rohde et al.,
2004).
Iniciar este capítulo apresentando
considerações acerca do TDAH tem por ob-
jetivo ilustrar como questões relacionadas
a processos atencionais estão em evidência
na Psicologia contemporânea. A produção
de conhecimento sobre tais processos con-
tinua sendo fundamental para o desenvol-
vimento de intervenções eficazes (Ketzer,
Gallois, Martinez, Rohde, & Schmitz, 2012;
Reinhardt & Reinhardt, 2013).
O interesse pelos processos atencio-
nais justifica-se não somente pelos aspec-
tos patológicos nele envolvidos, mas tam-
bém por sua aparente importância nas mais
variadas situações de nossa vida cotidiana.
Por exemplo, um jogador que não se manti-
ver atento ao jogo reduz suas possibilidades
de vitória; um aluno que não se mantiver
atento à aula, reduz suas possibilidades de
aprender a tarefa; ou, ainda, um motoris-
ta que não se mantiver atento ao trânsito,
aumenta suas possibilidades de causar ou
sofrer um acidente.
Estudos sobre processos atencionais
conduzidos nas décadas de 1940 e 1950
utilizavam situações nas quais indivíduos
eram requisitados a detectar a ocorrência de
determinados eventos críticos, porém pou-
co frequentes, em tarefas longas e propo-
sitalmente monótonas. Mackworth (1948),
por exemplo, realizou um experimento no
qual a tarefa dos participantes era obser-
var um mostrador de um relógio analógico.
Em grande parte do tempo, o único pontei-
ro apresentado nesse mostrador realizava
movimentos em ritmo regular, movendo-se
apenas uma vez por segundo. Os eventos
críticos que deveriam ser detectados pelos
participantes consistiam em movimentos
duplos do ponteiro, ou seja, ocasiões em
que o ritmo era alterado e o ponteiro movia-
-se duas vezes em um único segundo. Esses
eventos críticos ocorriam 24 vezes em cada
hora de sessão, em intervalos variáveis de
Edson Massayuki Huziwara, Candido V. B. B. Pessôa
125
tempo. O procedimento tinha como objeti-
vo simular situações em que, por exemplo,
um marinheiro observa um sonar para de-
tectar a presença de submarinos inimigos.
Holland (1958) destacou a similaridade des-
ta situação com a de um trabalhador em
uma fábrica que inspeciona produtos em
uma linha de produção para detectar itens
com defeito que raramente aparecem. Nes-
sas situações, apesar da baixa probabilida-
de de ocorrência de um evento crítico, sua
detecção seria de extrema importância e,
portanto, marinheiros ou trabalhadores de-
veriam manter-se atentos durante todo o
tempo de execução da tarefa.
Muitos estudos utilizando tarefas
experimentais similares àquela propos-
ta por Mackworth (1948) foram conduzi-
dos. Em geral, os resultados demonstra-
ram que a acurácia em detectar os eventos
críticos diminuía ao longo do tempo (e. g.,
Adams, 1956; Bakan, 1955; Bartlett, Beinert,
& Graham, 1955; Deese & Ormond, 1953;
Fraser, 1950; Mackworth, 1948; 1950). Mais
especificamente, todos ou quase todos os
eventos críticos apresentados no início da
sessão eram detectados. No entanto, princi-
palmente depois dos 30 primeiros minutos,
apenas aproximadamente 30% dos partici-
pantes continuavam a detectar na mesma
proporção os eventos que ocorriam. Outro
resultado comum nessas pesquisas era uma
correlação positiva entre a quantidade ab-
soluta de eventos críticos apresentados e a
porcentagem total de eventos detectados
– i.e., em média, 46% dos eventos críticos
eram detectados quando 10 apresentações
por hora eram realizadas; no entanto, 88%
dos eventos eram detectados quando 40
apresentações por hora eram realizadas
(Deese & Ormond, 1953). De acordo com
Deese e Ormond, o desempenho altamente
acurado no início da tarefa seria um refle-
xo dos altos níveis de atenção ou vigilân-
cia1 apresentados pelos indivíduos. Ainda
segundo Deese e Ormond, com o passar do
tempo e a consequente fadiga, os níveis de
atenção ou vigilância diminuiriam e isso
produziria uma queda na quantidade de de-
tecções. A correlação positiva entre quanti-
dade absoluta de apresentações de eventos
críticos e porcentagem de detecções, por
sua vez, era explicada fazendo referência
à diferentes níveis de expectativa. Dizia-se
que quanto maior a quantidade de eventos
críticos apresentados até um determinado
momento da sessão, maior também seria a
expectativa de que um próximo evento crí-
tico fosse apresentado dentro de um curto
espaço de tempo. Portanto, a alta expecta-
tiva da próxima apresentação de um evento
crítico manteria altos níveis de atenção e
vigilância durante a tarefa, apesar da fadiga
ocasionada pelo decorrer do tempo.
Acerca de tais explicações, baseadas
em constructos teóricos como atenção, vi-
gilância ou expectativa, Holland (1958) ar-
gumentou:
1 Optou-se por traduzir a palavra inglesa “vigilance” por “vigilância”.
Outras possibilidades de tradução, talvez mais provocativas, seriam
“concentração” ou “atenção focada”, termos que aparecem como sinô-
nimos de “vigilance” na edição eletrônica do Oxford Dictionary.
Capítulo VIII | Atenção
126
Esses conceitos dão a aparência de ex-
plicaros dados em virtude da sintaxe
das frases. Diz-se que o participante
faz uma detecção porque ele está, na-
quele momento, vigilante e atento ou
esperando um sinal. Mas, os conceitos
não são menos misteriosos do que os
fenômenos que se propõem a explicar.
Resta a tarefa de descobrir os eventos
que influenciam a vigilância, a aten-
ção ou a expectativa. (p. 62).
Ainda de acordo com Holland (1958),
as diferenças nas quantidades de detecções
realizadas no início ou final da sessão, assim
como a correlação positiva entre quantida-
de absoluta e percentual de eventos críticos
detectados, como ocorrido, por exemplo,
em Deese e Ormond (1953), são formas de
descrever padrões comportamentais dos
participantes e, como tal, não necessita-
riam de constructos mentais como atenção,
vigilância ou expectativa para serem expli-
cados.
Diante desse contexto, o desafio es-
tava assim posto: Como estudar o fenôme-
no da detecção de eventos críticos e expli-
car resultados muito regulares sem recorrer
a constructos mentais (e.g., expectativa)?
Holland (1958) acreditava que a precisão
em detectar eventos críticos poderia estar
relacionada à emissão de um conjunto de
respostas que aumentaria a possibilidade
de sucesso em tal tarefa, sendo estas de-
nominadas de respostas de observação.
Wyckoff (1952; 1969) definiu respostas de
observação como aquelas que produzem
os estímulos discriminativos para outras
respostas. Manter-se observando o visor
por longos períodos de tempo ou identifi-
car prontamente quais os vários estímu-
los presentes durante a execução da tarefa
são exemplos de respostas de observação,
uma vez que um evento detectado seria o
estímulo discriminativo para relatar esse
evento e as respostas de observação seriam
mantidas pela produção destes estímulos
discriminativos. Holland foi a primeira pes-
soa a manipular experimentalmente a fre-
quência e a distribuição temporal das res-
postas de observação. O seu experimento,
adiante relatado, tornou-se assim um dos
mais clássicos sobre processos atencionais
realizado sob a orientação teórica da Análi-
se do Comportamento.
DESCRIÇÃO DO EXPERIMENTO
Objetivo e Método
Holland (1958) teve dois objetivos. O
primeiro foi verificar se a detecção de sinais
seria um reforçador para respostas de ob-
servação. O segundo foi medir as respostas
de observação em situações similares às
usadas por Mackworth (1948), para pos-
sibilitar uma reinterpretação dos eventos
ocorridos na situação analisada em termos
comportamentais, sem o uso de construc-
tos como expectativa ou atenção.
No experimento de Holland (1958),
a tarefa experimental consistia em par-
Edson Massayuki Huziwara, Candido V. B. B. Pessôa
127
ticipantes – jovens alistados na marinha
americana – observarem um mostrador
retangular com um ponteiro inicialmente
posicionado na extremidade esquerda. No
início da sessão, o participante era instru-
ído a detectar e relatar o máximo de oca-
siões nas quais o ponteiro se movesse da
extremidade esquerda para a extremidade
direita do mostrador (ver Figura 1). O relato
de movimentos do ponteiro era feito pelo
participante ao apertar um botão de relato,
que também recolocava o ponteiro no lu-
gar original. No fim da sessão era informa-
do ao participante quantos sinais ele havia
detectado e o tempo médio de detecção. A
novidade no procedimento proposto por
Holland consistiu em inserir um botão que,
quando pressionado, acendia uma lâmpada
localizada atrás do mostrador, iluminando-
-o por 0,07s (resposta de observação). Após
esse curto período, a lâmpada era apaga-
da e a única forma de iluminar o mostra-
dor e poder observar o ponteiro novamente
era uma nova pressão ao botão. As sessões
ocorriam em uma sala escura, de maneira
que a única forma de detectar as mudanças
no ponteiro era emitir a resposta de pressio-
nar a lâmpada. Quando um movimento do
ponteiro era detectado, o participante de-
veria apertar outro botão para informar que
havia detectado um movimento do pontei-
ro. Este segundo botão tinha duas consequ-
ências: (1) acionava um contador de eventos
e (2) recolocava o ponteiro no lugar original,
à esquerda do mostrador, o que possibili-
tava que um novo movimento do ponteiro
ocorresse. O procedimento permitiu medir
com precisão a ocorrência das respostas de
observação – i.e., pressões no botão que ilu-
minava o mostrador – ao longo do experi-
mento.
A questão acerca dos efeitos refor-
çadores da detecção de eventos críticos
foi solucionada utilizando conhecimen-
tos provenientes de uma das áreas mais
exaustivamente estudadas em Análise do
Comportamento, a saber, os esquemas de
reforço. Esquemas são regras que especi-
ficam sob quais condições determinadas
respostas produzem consequências. De
crucial importância para o presente con-
texto foram experimentos que demons-
traram que a taxa de respostas e o padrão
temporal de respostas é determinado por
esquemas (Catania, 1999; Ferster & Skin-
ner, 1957). Mais precisamente, os estudos
encontraram essa modulação de maneira
tão regular, independente do organismo ou
da resposta sob análise, que se torna possí-
vel prever o padrão comportamental diante
de cada diferente esquema de reforço uti-
lizado (Machado, 1982; Skinner, 1956). Se,
sob um determinado esquema de reforço,
Figura 1. Representação do mostrador apresentado aos participantes
no experimento de Holland (1958). A parte esquerda da figura mostra
a posição inicial do ponteiro, antes da ocorrência do evento crítico. A
parte direita mostra a posição do ponteiro depois de ocorrido o evento
crítico. A seta cinza representa o sentido do movimento executado pelo
ponteiro.
Capítulo VIII | Atenção
128
a resposta assume um padrão de emissão
típico do esquema, pode-se concluir que a
contingência de reforço pela qual o reforço
é produzido no esquema está controlando
aquela resposta.
Com base nesse conhecimento, para
fazer com que a oportunidade de realizar
uma detecção (i.e., pressionar o botão que
relatava um movimento do ponteiro) se tor-
nasse contingente à emissão de um deter-
minado padrão de respostas de observação
(i.e., pressionar o botão para o acendimen-
to da lâmpada), Holland (1958) utilizou di-
ferentes esquemas de reforço para a pro-
dução de movimentos dos ponteiros pela
emissão de respostas de observação. Caso
os padrões de respostas emitidos pelos par-
ticipantes no botão que acendia a lâmpada
fossem similares àqueles usualmente des-
critos quando utilizados os diferentes es-
quemas de reforço, a hipótese das funções
reforçadoras da detecção de eventos críti-
cos estaria comprovada.
Holland (1958) utilizou três diferentes
esquemas de reforço para avaliar o padrão
de emissão das respostas de observação: um
esquema de intervalo fixo (FI), um esquema
de razão fixa (FR) e um esquema de reforço
diferencial de taxas baixas (DRL). Sob o FI,
uma resposta é reforçada após transcorrido
um período fixo de tempo, contado a partir
de um evento ambiental relevante como a
obtenção do reforço ou o início da sessão;
as respostas que ocorrem antes do final do
período não são reforçadas. Em esquemas
FI, o padrão de respostas é caracterizado
por baixas taxas no início do intervalo e
um aumento na taxa de respostas à medida
que se aproxima o seu final (para uma dis-
cussão das exceções a este padrão veja, por
exemplo, Okouchi, 2002). No experimento
de Holland, cinco participantes foram pri-
meiramente expostos a um FI 30s por oito
sessões de 40 min. Ou seja, a primeira res-
posta de observação (i.e., pressionar o botão
para o acendimento da luz) emitida após 30
s produzia não somente o acendimento da
lâmpada por 0,07s, mas também o movi-
mento do ponteiro no mostrador e a conse-
quente oportunidade de detecção do even-
to crítico. Em seguida, o valor do intervalo
foi aumentado para 1, 2, 3, e, finalmente, 4
min, com oito sessões sucessivas sob cada
valor do FI.
Sob o FR, a produção do reforço de-
pende apenas da emissãode um número
fixo de respostas, que é contado a partir de
um evento ambiental relevante, como a ob-
tenção do reforço ou o início da sessão. As-
sim sendo, nesse esquema, a obtenção do
reforçador não está vinculado à passagem
do tempo, existe uma relação direta entre
a taxa de respostas emitida e a taxa de re-
forços obtida. Talvez por este motivo, o pa-
drão de respostas em FR seja caracterizado
por taxas altas e constantes durante toda a
sessão, sendo muitas vezes possível visua-
lizar pausas no responder que ocorrem tipi-
camente após cada reforço (diferentes das
pausas após o reforço em um FI, a taxa de
respostas na retomada de um FR inicia-se
Edson Massayuki Huziwara, Candido V. B. B. Pessôa
129
já constante, enquanto em FI ela tende a ser
positivamente acelerada). Holland (1958)
primeiramente expos, por seis sessões de
40 min, sete participantes a um FR 36, ou
seja, a oportunidade de detecção ocorreu
somente após a emissão da 36ª respos-
ta de observação. Então, o valor do FR foi
aumentado, também em blocos de seis ses-
sões, para 60, 84, 108, 150 e, finalmente, 200
respostas por detecção.
Por fim, sob o DRL, uma resposta é
reforçada somente quando emitida após
um intervalo de tempo especificado sem ela
ocorrer. Ao considerar que o esquema refor-
ça diferencialmente o espaçamento tempo-
ral entre as respostas, o padrão de respostas
emitidas pelos participantes irá se adequar
ao valor temporal estipulado, mais precisa-
mente, quanto maior for o tempo exigido
para a não ocorrência de respostas, me-
nor será a taxa de respostas. Dessa forma,
o padrão tipicamente obtido sob o DRL é o
de baixas taxas de respostas, com espaça-
mento temporal entre elas e com ocasionais
emissões de “jorros” de várias respostas
com baixíssimo intervalo. Dois participan-
tes foram expostos a um DRL 30 s, ou seja,
uma resposta de observação iria provocar
o movimento do ponteiro e a consequente
oportunidade de detecção se, e somente se,
fosse precedida por um período mínimo de
30s sem que essa mesma resposta de ob-
servação tivesse sido emitida. As sessões
tinham duração de 4h.
Para atingir o segundo objetivo, ve-
rificar como seriam as respostas de obser-
vação em uma situação similar à usada por
Mackworth (1948), Holland (1958) usou es-
quemas de reforço baseando-se nas apre-
sentações de eventos críticos usados por
Mackworth. Nas situações testadas por
Mackworth, os intervalos entre os eventos
críticos (duplos movimentos no ponteiro do
relógio) eram ¾, ¾, 1½, 2, 2, 1, 5, 1, 2, 2, 3 e
10 min em ciclos que ocorriam a cada meia
hora. Na análise do comportamento, um es-
quema de reforço que ocorre em intervalos
variáveis é denominado esquema de inter-
valo variável (VI). Sob esse esquema uma
resposta é reforçada quando emitida após
intervalos que variam ao redor de uma mé-
dia de tempo estabelecido. O VI produz ti-
picamente uma taxa moderada e constante
de respostas nos intervalos entre reforços.
No caso dos intervalos usados por Ma-
ckworth, em média, a cada 1 minuto haveria
um evento crítico para ser detectado. Ou-
tro aspecto do procedimento do estudo de
Mackworth era a de que o evento crítico fi-
cava disponível para ser detectado por ape-
nas um breve período de tempo. Em análise
do comportamento, quando o reforço está
disponível para ser consumido por apenas
um determinado período de tempo, cha-
ma-se esse período de contenção limitada
(limited hold). Quando se usa a contenção
limitada comumente observa-se o aumen-
to da taxa de respostas em relação à uma
condição sem contenção limitada. Holland
usou uma contenção limitada de 1¼ s. Isto
é, neste caso em que foi usada a contenção
limitada após o movimento do ponteiro, se
Capítulo VIII | Atenção
130
o participante não detectasse o movimen-
to nesse intervalo de tempo, o ponteiro re-
tornaria automaticamente para a direita e
o participante perderia a oportunidade de
relatar o evento.
Resultados e Discussão
Os padrões de respostas de observa-
ção descritos para os participantes em cada
um dos esquemas de reforço utilizados por
Holland (1958) – FI, FR, DRL – foram ex-
tremamente similares àqueles usualmente
encontrados em experimentos anteriores
em outros tipos de respostas que também
usaram esquemas de reforço (e.g., Ferster
& Skinner, 1957). Apenas para ilustrar os
efeitos dos diferentes esquemas de reforço
sobre a emissão das respostas de observa-
ção, ao comparar os padrões de respostas
de observação nos diferentes esquemas de
reforço, foi possível verificar que, enquanto
o participante sob FR, independentemente
do valor do esquema, emite 600 respostas
em menos de cinco minutos de sessão, o
participante sob DRL emite aproximada-
mente 290 respostas em 50 minutos de ses-
são. Tais resultados demonstraram que a
detecção de eventos críticos, de fato, exerce
um papel reforçador para a emissão das res-
postas de observação, como previa o autor.
Dessa forma, os resultados obtidos
por Holland (1958) demonstraram que os
padrões de ocorrências das respostas de
observação, consideradas em muitos con-
textos como sendo o reflexo de processos
mentais complexos, podem ser explicados
a partir de conceitos propostos pelo condi-
cionamento operante, fazendo-se referên-
cia aos esquemas de reforço que mantêm
essas respostas. De acordo com o autor, não
haveria a necessidade de recorrer a níveis
mentais de explicação, a constructos teóri-
cos como atenção, vigilância ou expectati-
va, uma vez que o controle exercido pelos
diferentes esquemas de reforço pôde ser di-
retamente demonstrado no nível compor-
tamental.
O segundo objetivo proposto por
Holland (1958), verificar como seriam as
respostas de observação em uma situação
similar à usada por Mackworth (1948), tam-
bém trouxe um resultado importante. Assim
como no experimento de Mackwhoth, dois
tipos diferentes de desempenho foram ob-
servados entre os participantes de Holland
que foram expostos ao VI com contenção
limitada. Na mesma proporção dos parti-
cipantes de Mackworth, aproximadamente
30% dos participantes de Holland detecta-
ram todos os movimentos do ponteiro que
eram programados durante o experimento.
Para os outros 70%, a quantidade de even-
tos detectados teve um declínio acentuado
ao longo da sessão. O que Holland pôde
demonstrar com seu experimento é que
esse declínio foi causado pela diminuição
da emissão de respostas de observação.
Essas respostas de observação, como visto
na parte anterior do experimento, são con-
troladas pelo esquema de reforço em vigor.
Holland demonstrou que os participantes
Edson Massayuki Huziwara, Candido V. B. B. Pessôa
131
que detectaram todos os reforços ao longo
da sessão partiram de uma taxa inicial de
emissão das respostas de observação mais
alta do que os participantes que diminuí-
ram as detecções ao longo da sessão Pro-
vavelmente, esse “ponto de partida” com
que cada participante iniciou a emissão de
respostas (alta ou baixa taxa de respostas)
seja devido à história pregressa de reforço
de respostas de observação de cada um.
Os participantes que partiram de uma taxa
mais baixa de emissão de respostas de ob-
servação detectaram menos movimentos
no ponteiro. Essa menor detecção é, em
outras palavras, uma menor taxa de refor-
ços. Uma menor taxa de reforços gera uma
menor taxa de respostas (Ferster & Skinner,
1957). Assim, os participantes que já inicia-
ram o experimento com uma baixa taxa
inicial de emissão de respostas de observa-
ção entraram num círculo vicioso de menor
emissão de respostas gerando menor taxa
de reforço e menor taxa de reforço gerando
menor emissão de respostas.
Holland (1958), portanto, demons-
trou que a detecção de um evento crítico
(i.e., o movimento do ponteiro) pode con-
trolar a frequência de emissão das respos-
tas de observação (i.e., pressionar o botão
para o acendimento da lâmpada). Vale res-
saltar que estudos anteriores explicavam a
ocorrência de tais respostas de observação
como sendo o reflexode estados mentais
complexos como atenção, vigilância ou ex-
pectativa (e.g., Adams, 1956; Bakan, 1955;
Bartlett et al., 1955; Deese & Ormond, 1953;
Fraser, 1950; Mackworth, 1948, 1950). Ao
analisar o conjunto dos resultados obtidos
por Holland, foi possível comprovar a hi-
pótese do autor de que é possível explicar
os padrões de ocorrência de tais respostas
a partir dos princípios do condicionamento
operante, especialmente do esquema de re-
forço em vigor.
Os mesmos princípios sobre o condi-
cionamento operante foram utilizados por
Holland (1958) para reinterpretar alguns dos
achados mais recorrentemente descritos
em experimentos sobre atenção e vigilân-
cia até a data de publicação de seu artigo.
O primeiro desses achados refere-se à di-
minuição na quantidade de detecções fei-
tas pelos participantes ao longo da sessão,
que seria explicado pelo declínio dos níveis
de atenção em função da fadiga (Deese &
Ormond, 1953; Mackworth, 1948, 1950). De
acordo com Holland, a explicação para tal
fato estaria relacionada à taxa de reforço.
Ao longo da sessão, a taxa de emissão de
respostas de observação se adéqua à quan-
tidade de reforços apresentados. Assim, se
a quantidade de apresentações do estímu-
lo reforçador for baixa ou o intervalo entre
reforços for demasiado longo, haverá um
declínio na taxa de respostas de observação
(e.g., Kelleher, Riddle, & Cook, 1962). Em
decorrência da menor taxa de respostas de
observação, menor também será a quanti-
dade de eventos críticos detectados.
Capítulo VIII | Atenção
132
DESDOBRAMENTOS
Um aspecto a ser destacado acer-
ca do procedimento utilizado por Holland
(1958) refere-se à considerável diferença
entre as respostas que normalmente são
identificadas como respostas de observação
e a resposta instrumental utilizada no refe-
rido experimento. Em uma análise extre-
mamente crítica, poder-se-ia argumentar
que o fenômeno comportamental observa-
do por Holland seria de natureza diferente
daquela observada em experimentos sobre
atenção e vigilância, restabelecendo o papel
dos constructos mentais na explicação do
comportamento. Sobre essa questão, o au-
tor afirma:
Em outros estudos sobre vigilância,
o comportamento de observação foi
provavelmente a fixação do olhar ou
os movimentos com a cabeça, bem
como respostas talvez ainda mais su-
tis. Seria interessante estender a téc-
nica apresentada aqui para algumas
destas respostas, mesmo consideran-
do que, para muitas questões, a topo-
grafia da resposta pode não ser tão
importante e os métodos ora utiliza-
dos sejam perfeitamente suficientes.
(p. 62).
Portanto, o autor parece concordar
que a resposta de pressionar um botão para
acender uma lâmpada é consideravelmente
diferente de mover o rosto em direção a um
mostrador e permanecer observando-o por
longos períodos de tempo, respostas nor-
malmente relacionada à vigilância. No en-
tanto, de acordo com Holland (1958), uma
vez demonstrada a função reforçadora da
detecção de eventos críticos, elas poderiam
aumentar a probabilidade de ocorrência de
toda e qualquer resposta de observação, in-
dependente de qual topografia fosse reque-
rida.
Talvez até de modo contraditório à
afirmação sobre as topografias de respos-
tas, trabalhos posteriores ao de Holland
(1958) estiveram relacionados a criar formas
de registrar e medir o comportamento de
olhar enquanto uma resposta de observa-
ção. Em 1968, juntamente com Stephen R.
Schroeder, Holland publicou um artigo no
qual os autores utilizaram um equipamento
que permitiu registrar a frequência e a du-
ração dos movimentos dos olhos dos par-
ticipantes quando estes observavam partes
específicas em uma tela contendo quatro
mostradores, todos idênticos ao utilizado
no experimento de Holland descrito nesse
capítulo. Neste novo experimento, os parti-
cipantes também foram instruídos a detec-
tar movimentos de ponteiros em qualquer
um dos quatro mostradores e a manipula-
ção experimental feita também utilizou di-
ferentes esquemas de reforço. Por exemplo,
ao utilizar um FR, um movimento de pon-
teiro ocorria somente após a 36ª ocasião na
qual o participante tivesse olhado para um
dos mostradores, isto é, emitido a respos-
ta de observação. Os resultados obtidos por
Schroeder e Holland demonstraram que os
Edson Massayuki Huziwara, Candido V. B. B. Pessôa
133
padrões de movimento dos olhos em dire-
ção aos mostradores foram sensíveis aos
diferentes esquemas de reforço utilizados
(i.e., FR, FI e DRL).
A similaridade dos resultados obtidos
por Schroeder e Holland (1968), utilizando o
registro movimentos dos olhos, com aque-
les descritos em Holland (1958), utilizando o
registro de pressões a um botão, pareceu in-
dicar que a função reforçadora da detecção
de eventos críticos realmente independe
da topografia das respostas e, talvez ainda
mais importante, que a resposta instrumen-
tal utilizada em 1958 era, de fato, compa-
rável com as respostas tipicamente iden-
tificadas com a atenção (i.e., olhar). Desde
então, uma vasta quantidade publicações
acerca das relações entre as respostas de
observação e o comportamento de olhar
tem sido produzida (e.g., Doran & Holland,
1971; Dube, Balsamo et al., 2006; Dube, Di-
ckson et al., 2010; Huziwara, de Souza, &
Tomanari, 2016; Huziwara, Silva, Perez, &
Tomanari, 2015; Perez, Endemann, Pessôa,
& Tomanari, 2014; Pessoa, Huziwara, Perez,
Endemann, & Tomanari, 2009; Schroeder,
1969a, 1969b, 1970, 1997; Serna & Carlin,
2001).
Em relação à importância do estudo
de Holland (1958) para a manutenção da
atenção em tarefas de vigilância, Holland
(1958) é citado em diversos experimentos da
área, como na manutenção da atenção du-
rante a navegação de barcos (Thomas, 1980)
e aviões (Lewis, 1973) e, em geral, para as-
pectos da segurança no trabalho (e.g., Aber-
nathy & Lattal, 2014; Howell, Johnston, &
Goldstein, 1966).
CONSIDERAÇÕES FINAIS
Como mencionado no início deste ca-
pítulo, o TDAH atualmente se constitui em
um sério problema a ser solucionado. Sag-
volden, Aase, Johansen e Russell (2005), por
exemplo, apontavam a escassez de dados
sobre tratamentos médicos eficazes para
o subtipo déficit de atenção do TDAH. No
que concerne às contribuições da Análise
do Comportamento, os padrões comporta-
mentais usualmente característicos de pes-
soas com diagnóstico de déficit de atenção
são, ao menos em parte, explicados a partir
dos gradientes de atraso de reforço (Cata-
nia, 2005). Baseado em extensa literatura,
Catania explica que uma das causas do que
chamamos déficit de atenção pode estar re-
lacionada à dificuldade de controle por re-
forços condicionados. Nos termos do expe-
rimento de Holland (1958), caso a distância
temporal entre a identificação de um even-
to crítico e o reforço obtido por essa identi-
ficação for demasiado longa, o movimento
do ponteiro pode não adquirir uma função
reforçadora para manter a resposta de pres-
tar atenção ao (iluminar o) mostrador. Um
valor da distância temporal eficiente varia
entre indivíduos e, assim, no caso do expe-
rimento de Holland, pessoas que necessi-
tassem intervalos temporais muito peque-
nos entre os reforços poderiam deixar de
Capítulo VIII | Atenção
134
emitir as respostas de observação ao longo
do experimento. Nos limites da revisão de
literatura realizada para o presente capítu-
lo, não encontramos estudos que se apoiem
diretamente no achado de Holland de que
esquemas de reforços influenciariam dire-
tamente a quantidade de atenção em uma
tarefa (para exceção, veja Goldberg & Kons-
tantareas, 1979). Assim, parece permanecer
essa lacuna a ser perseguida sobre a relação
entre os padrões comportamentais gerados
e mantidos por diferentes esquemas de re-
forço e os padrões comportamentais carac-
terísticos do déficit de atenção.
Ao considerar todos os aspectos pre-
sentes no experimento de Holland (1958),
torna-se possível verificar que a engenho-
sidade do autor, ao propor uma nova forma
de análise,permitiu a formulação de expli-
cações mais parcimoniosas sobre proces-
sos comportamentais. Essa busca por ex-
plicações parcimoniosas, como alternativa
para explicações por vezes tão misteriosas
quanto o próprio fenômeno a ser explicado,
é marca dos trabalhos desenvolvidos pelo
autor e, certamente, um exemplo a ser se-
guido.
PARA SABER MAIS
Pessoa, Huziwara, Perez, Endemann, &
Tomanari (2009). Replicação sistemáti-
ca dos resultados descritos por Schroeder
(1969a; 1969b; 1970) sobre o comportamento
de olhar em tarefas de discriminação sim-
ples. Os principais resultados referem-se a
uma aparente diminuição no tempo empre-
gado para observar os estímulos ao longo
das sucessivas tentativas de treino.
Dube, Balsamo, Fowler, Dickson, Lom-
bard, & Tomanari (2006). Avaliação do
comportamento de olhar em tarefas de
discriminação condicional utilizando pro-
cedimento de emparelhamento de acordo
com o modelo. Resultados sugerem que os
participantes com maiores porcentagens de
acertos em tarefas que envolvem o aprendi-
zado de discriminações condicionais tam-
bém apresentam maior quantidade de tem-
po empregado na observação dos estímulos
apresentados.
Artigos de Revisão. Para uma revisão sobre
o controle operante dos movimentos dos
olhos veja Pessôa (2010). Para uma revisão
sobre o papel das respostas de observa-
ção como fenômenos atencionais consulte
Rico, Goulart, Hamasaki e Tomanari (2012)
ou Benvenuti, Barros e Tomanari (2014).
REFERÊNCIAS
Abernathy, W. B., & Lattal, D. (2014). Or-
ganizational Behavior Management, past,
present, and future. In F. K. Macksweeney
e E. S. Murphy (Eds.), The Willey Blackwell
handbook of classical and operant condi-
tioning, (pp. 645-668). Chichester, WS: John
Willey & Sons, Ltd.
Edson Massayuki Huziwara, Candido V. B. B. Pessôa
135
Adams, J. A. (1956). Vigilance in the detec-
tion of low-intensity visual stimuli. Journal
of Experimental Psychology, 52, 204-208.
American Psychiatric Association – APA
(2002). Manual diagnóstico e estatístico de
transtornos mentais - DSM-IV-TR™. 4ª ed.
rev. Porto Alegre: Artmed.
Bakan, P. (1955). Discrimination decrement
as a function of time in a prolonged vigil.
Journal of Experimental Psychology, 50,
387-390.
Bartlett, S. C., Beinert, R. L., & Graham, J.
R. (1955). Studies of visual fatigue and effi-
ciency in radar observation. United States
Air Force Wright Air Development Center
Technical Report, 55-100.
Benvenuti, M. F., Barros, T., & Tomanari, G.
Y. (2014). Atenção, observação e a produção
do comportamento simbólico e do respon-
der relacional. In J. C. de Rose, M. S. C. A.
Gil e D. G. de Souza (Orgs.), Comportamen-
to simbólico: Bases conceituais e empíricas,
(pp. 57-93). São Paulo: Cultura Acadêmica.
Catania, A. C. (1999). Aprendizagem: Com-
portamento, linguagem e cognição. Porto
Alegre: Artmed.
Catania, C. A. (2005). Attention-deficit/
hyperactivity disorder (ADHD): Delay-of-
-reinforcement gradients and other beha-
vioral mechanisms. Behavioral and Brain
Sciences, 28, 397-468.
Deese, J., & Ormond, E. (1953). Studies of de-
tectability during continuous visual search.
United States Air Force Wright Air Develop-
ment Center Technical Report, 53-88.
Doran, J., & Holland, J. G. (1971). Eye move-
ments as a function of response contingen-
cies measured by blackout technique. Jour-
nal of Applied Behavior Analysis, 4, 11-17.
Dube, W. V., Balsamo, L. M., Fowler, T. R.,
Dickson, C. A., Lombard, K. M., & Tomana-
ri, G. Y. (2006). Observing behavior topogra-
phy in delayed matching to multiple sam-
ples. The Psychological Record, 56, 233-244.
Dube, W. V., Dickson, C. A., Balsamo, L. M.,
Odonnell, K. L., Tomanari, G. Y., Farren, K.
M., Wheeler, E. E., & Mcilvane, W. J. (2010).
Observing behavior and atypically restric-
ted stimulus control. Journal of the Experi-
mental Analysis of Behavior, 94, 297-313.
Faraone, S. V., Sergeant, J., Gillberg, C., &
Biederman, J. (2003). The worldwide pre-
valence of ADHD: Is it an American condi-
tion? World Psychiatry, 2, 104-113.
Ferster, C. B., & Skinner, B. F. (1957). Schedu-
les of reinforcement. East Norwalk: Apple-
ton-Century-Crofts.
Fraser, D. C. (1953). The relation of an en-
vironmental variable to performance in a
prolonged visual task. Quarterly Journal of
Experimental Psychology, 5, 31-32.
Capítulo VIII | Atenção
136
Goldberg, J. O., & Konstantareas, M. M.
(1981). Vigilance in hyperactive and normal
children on a self-paced operant task. Jour-
nal of Child Psychology and Psychiatry, 22,
53-63.
Holland, J. G. (1958). Human vigilance.
Science, 128, 61-67.
Howell, W. C., Johnston, W. A., & Goldstein,
I. L. (1966). Complex monitoring and its re-
lation to the classical problem of vigilance.
Organizational Behavior and Human Per-
formance, 1, 129-150.
Huziwara, E. M., de Souza, D. G., & Toma-
nari, G. Y. (2016). Patterns of eye movement
in matching-to-sample tasks. Psicologia:
Reflexão e Crítica, 29.
Huziwara, E. M., Silva, M. J. M., Perez, W.
F., & Tomanari, G. Y. (2015). Analyzing the
stimulus control acquisition in simple dis-
crimination tasks through eye movement.
Psicologia: Reflexão e Crítica, 28, 603-612.
Kelleher, R. T., Riddle, W. C. & Cook, L.
(1962). Observing response in pigeons. Jour-
nal of the Experimental Analysis of Beha-
vior, 5, 3-13.
Ketzer, C. R., Gallois, C., Martinez, A. L.,
Rohde, L. A., & Schmitz, M. (2012). Is there
an association between perinatal compli-
cations and attention-deficit/hyperactivity
disorder-inattentive type in children and
adolescents? Revista Brasileira de Psiquia-
tria, 34, 321-328.
Lewis, M. F. (1973). Frequency of anti-colli-
sion observing responses by solo pilots as a
function of traffic density, ATC traffic war-
nings, and competing behavior. Recuperado
em http://libraryonline.erau.edu/online-
-full-text/faa-aviation-medicine-reports/
AM73-06.pdf
Machado, L. M. C. M. (1986). Esquemas de
reforçamento positivo: Esquemas simples.
Psicologia, 12, 1-15.
Mackworth, N. H. (1948). The breakdown of
vigilance during prolonged visual search.
Quarterly Journal of Experimental Psycho-
logy, 1, 6-21.
Mackworth, N. H. (1950). Researches in the
measurement of human performance. Me-
dical Research Council Special Report Se-
ries, 268.
Okouchi, H. (2002). Individual differences
in human fixed-interval performance. The
Psychological Record, 52, 173-186.
Perez, W. F., Endemann, P., Pessoa, C. V.
B. B., & Tomanari, G. Y. (2014). Assessing
stimulus control in a discrimination task
with compound stimuli: evaluating testing
procedures and tracking eye fixations. The
Psychological Record, 65, 83-88.
Pessoa, C. V. B. B. (2010). Efeitos de diferentes
treinos de discriminação sobre as fixações
Edson Massayuki Huziwara, Candido V. B. B. Pessôa
137
do olhos de humanos. (Tese de doutorado).
Instituto de Psicologia da Universidade de
São Paulo.
Pessoa, C. V. B. B., Huziwara, E. M., Pe-
rez, W. F., Endemann, P., & Tomanari, G.
Y. (2009). Eye fixations to figures in a four-
-choice situation with luminance balanced
areas: Evaluating practice effects. Journal of
Eye Movement Research, 2, 1-6.
Reinhardt, M. C., & Reinhardt, C. A. (2013).
Attention deficit-hyperactivity disorder,
comorbidities, and risk situations. Jornal de
Pediatria, 89, 124-130.
Rico, V. V., Goulart, P. R. K., Hamasaki, E.
I. M., & Tomanari, G. Y. (2012). Percepção e
atenção. In M. M. C. Hübner e M. B. Morei-
ra. (Orgs.). Fundamentos de psicologia: Te-
mas clássicos de psicologia à luz da Análise
do Comportamento. 1ed, (pp. 155-210). Rio
de Janeiro, RJ: Guanabara Koogan.
Rohde, L. A., Barbosa, G., Tramontina, S., &
Polanczyk, G. (2000). Transtorno de déficit
de atenção/hiperatividade. Revista Brasi-
leira de Psiquiatria, 22, 7-11.
Rohde, L. A., Miguel Filho, E. C., Benetti, L.,
Gallois, C., & Kieling, C. (2004). Transtor-
no de déficit de atenção/hiperatividade na
infância e na adolescência: Considerações
clínicas e terapêuticas. Revista de Psiquia-tria Clínica, 31, 124-131.
Sagvolden, T., Aase, H., Johansen, E. B., &
Russell, V. A. (2005). A dynamic develop-
mental theory of attention-deficit/hype-
ractivity disorder (ADHD) predominantly
hyperactive/impulsive and combined sub-
types. Behavioral and Brain Sciences, 28,
397-468.
Schroeder, S. R. (1969a). Effects of cue fac-
tors on selective eye movements and choi-
ces during successive discriminations. Per-
ceptual and Motor Skills, 29, 991-998.
Schroeder, S. R. (1969b). Fixation and Choi-
ce selectivity during discrimination trans-
fer. Psychonomic Science, 17, 324-325.
Schroeder, S. R. (1970). Selective eye move-
ments to simultaneously presented stimuli
during discrimination. Perception & Psy-
chophysics, 7, 121-124.
Schroeder, S. R. (1997). Selective eye fixa-
tions during transfer of discriminative sti-
mulus control. In D. M. Baer, & E. M. Pinks-
ton (Orgs.), Environment and Behavior, (pp.
97–110). Boulder, CO: Westview.
Schroeder, S. R., & Holland, J. G. (1968).
Operant control of eye movements. Journal
of Applied Behavior Analysis, 1, 161-166.
Serna, R., & Carlin, M. T. (2001). Guiding
visual attention in individuals with mental
retardation. International Review of Resear-
ch in Mental Retardation, 24, 321-357.
Skinner, B. F. (1956). A case history in scien-
Capítulo VIII | Atenção
138
tific method. American Psychologist, 11, 221-
233.
Thomas, T. W. (1980). The effects of fatigue
on vigilance in sailing. (Dissertação de mes-
trado). The University of British Columbia.
Wyckoff Jr., L. B., (1952). The role of obser-
ving responses in discrimination learning:
Part I. Psychological Review, 59, 431-442.
Marilia Pinheiro de Carvalho, Marco Vasconcelos, Armando Machado
139
O responder controlado
temporalmente:
desdobramentos da pesquisa
com a tarefa de bissecção
Marilia Pinheiro de Carvalho
Marco Vasconcelos
Armando Machado
Universidade do Minho, Portugal
Church, R. M., & Deluty, M. (1977). Bisection of temporal intervals. Journal of Experimental Psy-
chology: Animal Behavior Processes, 3, 216-228.
“O que é, pois, o tempo? Se ninguém mo pergunta, sei o que é; mas se quero explicá-
-lo a quem mo pergunta, não sei.”
(Santo Agostinho, Confissões)
Capítulo IX | Bissecção Temporal
140
1 MPC e MV contaram com a bolsa de investigação UMINHO/
BI/249/2015 e com a bolsa de investigador IF/01624/2013, respectiva-
mente, ambas da Fundação para a Ciência e Tecnologia (FCT), Portugal.
AM beneficiou da bolsa de licença sabática SFRH/BSAB/113653/2015
da FCT e de uma bolsa da Fundação de Amparo à Pesquisa do Esta-
do de São Paulo (FAPESP: 2015/06491-1) para Professor Convidado na
Universidade Federal de São Carlos, Brasil. Este capítulo foi parcial-
mente financiado pela FCT e pelo Ministério da Educação e Ciência
através de fundos nacionais, e cofinanciado pelo FEDER sob o acordo
de parceria PT2020 (UID/PSI/01662/2013).
2 Stubbs (1968) conduziu três experimentos com intervalos temporais
variando entre 1 e 40 s. Para fins didáticos, ilustramos apenas o caso do
Experimento 2, com intervalos entre 2 e 20 s.
Figura 1. Diagrama hipotético de um procedimento de condicionamen-
to respondente temporal. Comida (*) é apresentada sucessivamente em
intervalos fixos de tempo (T). Tipicamente, salivação condicionada
ocorre instantes antes de a comida ser apresentada.
INTRODUÇÃO À ÁREA DE PES-
QUISA E CONTEXTUALIZAÇÃO
DO EXPERIMENTO
Em fins da década de 1970, já era sa-
bido que as respostas de animais não-hu-
manos podem ser controladas por inter-
valos de tempo. Por exemplo, as pesquisas
seminais de Pavlov (1927) sobre condicio-
namento respondente demonstraram que,
quando comida era entregue sucessiva-
mente em intervalos fixos de tempo, a sali-
vação de cães sistematicamente antecipava
os momentos de entrega. Dá-se a esse efeito
o nome de condicionamento temporal (Ca-
tania, 1999). A Figura 1 abaixo ilustra um
procedimento de condicionamento tempo-
ral e resultados hipóteticos.
2 s a 20 s2. A tarefa consistia em uma dis-
criminação condicional na qual o estímulo
modelo era uma luz que ficava acesa duran-
te um intervalo de tempo variável, e os es-
tímulos comparação eram um disco verde
e um disco vermelho apresentados simul-
taneamente após o estímulo modelo. Para
receber comida, os pombos deviam bicar o
disco verde se o modelo durasse de 2 a 10 s,
e o disco vermelho se o modelo durasse de
12 a 20 s. Como os estímulos de 2 a 10 s são
os mais curtos das durações treinadas, e os
estímulos de 12 a 20 s são os mais longos,
podemos dizer que respostas no disco verde
são respostas ‘curto’ e que respostas no dis-
co vermelho são respostas ‘longo’.
Stubbs (1968) mediu a proporção
de vezes em que os sujeitos responderam
‘longo’ (i.e., bicaram o disco vermelho) em
função de cada uma durações apresenta-
das. Dá-se o nome de função psicométrica
à função que relaciona a proporção de uma
das respostas (e.g., “longo”) à duração dos
estímulos (Church, 2002; Richelle & Lejeu-
ne, 1980). Se a discriminação fosse perfei-
ta, a função psicométrica deveria assumir
a forma de um degrau (ver painel de cima
da Figura 2): Nenhuma resposta ‘longo’ se-
ria emitida após os estímulos de 2 a 10 s
[P(‘longo’) = 0], e apenas respostas ‘longo’
seriam emitidas após os estímulos de 12 a
20 s [P(‘longo’) = 1].
Em um outro estudo clássico, desta
vez com um procedimento de condiciona-
mento operante, Stubbs (1968, Experimen-
to 2) demonstrou que pombos eram capazes
de discriminar estímulos com duração de
Marilia Pinheiro de Carvalho, Marco Vasconcelos, Armando Machado
141
A Figura 2 abaixo (painel de baixo)
esquematiza a tendência geral dos dados
individuais obtidos por Stubbs (1968). A
proporção de respostas ‘longo’ aumentou de
2 a 20 s, confirmando que os pombos eram
capazes de discriminar os estímulos mais
curtos dos estímulos mais longos. Contudo,
o aumento na proporção de respostas foi
gradual, ao invés de ser abrupto e em for-
ma de degrau: A função psicométrica tinha
uma forma ogival, com mínimo e máximo
nas durações extremas de 2 e 20 s, respec-
tivamente.
Curiosamente, a proporção de res-
postas ‘longo’ para as durações de 10 e 12 s
esteve próxima de 0.5, ou seja, em cerca de
metade das vezes os sujeitos respondiam
‘curto’ e na outra metade das vezes respon-
diam ‘longo’ para cada uma destas dura-
ções – a despeito de terem sido treinados
a responder ‘curto’ para 10 s e ‘longo’ para
12 s. Com base nestes resultados, Stubbs
(1968) sugeriu que os sujeitos estabelece-
ram um critério de decisão para responder:
Respondiam ‘curto’ para durações menores
do que o critério e respondiam ‘longo’ para
durações maiores do que o critério. Ainda
de acordo com o autor, o critério estaria
ente 10 e 12 s e quanto mais próxima uma
duração estivesse dele, maior a incerteza
em classificá-la como ‘curta’ ou ‘longa’ – a
incerteza traduz-se em proporções de res-
postas ‘longo’ próximas de 0.5, como Stubbs
observou nos pombos.
O critério que divide as durações
mais curtas das mais longas também pode
ser tomado como a duração que, do ponto
de vista do sujeito, está equidistante das
durações treinadas. A esta duração, perce-
bida como “o meio do caminho”, por assim
dizer, dá-se o nome de ponto de igualdade
subjetiva (PIS). A pergunta que naturalmen-
te se coloca é qual duração corresponde ao
PIS. A pergunta é relevante porque o valor
do PIS dá pistas sobre a métrica usada pelos
animais para “medir” as durações dos estí-
mulos. Falar da métrica é falar da relação
entre o tempo objetivo (medido pelo reló-
gio) e o tempo subjetivo (inferido a partir do
Figura 2. Painel de cima: Função psicométrica hipotética em forma de
degrau. Painel de baixo: Esquematização do padrão geral das funções
psicométricas obtidas em uma discriminação entre 2 e 20 s por Stubbs
(1968, Experimento 2).
Capítulo IX | Bissecção Temporal
142
comportamento). Será a métrica do tempo
subjetivo linear, logarítmica, recíproca, ou
de outro tipo? A Figura3 abaixo ilustra as
três primeiras métricas.
Tome o caso de uma discriminação
entre 1 s e 4 s. Em uma transformação line-
ar, y = ax + b (painel da esquerda na Figura
3; no nosso exemplo, assumimos que a = 1 e
b = 1), 1 s (x1) é representado subjetivamente
como 2 (y1) e 4 s (x2) é representado como
5 (y2). O PIS é a duração x equivalente ao
valor médio de 2 e 5 da representação sub-
jetiva (ver a seta que projeta no eixo do x o
valor médio da representação subjetiva). A
derivação na Figura 3 (painel da esquerda)
mostra que, se o sujeito usa uma métrica li-
near, o PIS é a média aritmética (MA) de 1
e 4 s.
Em uma transformação logarítmica,
y = ln(x) (painel central na Figura 3; logarít-
mo na base e), 1 s (x1) é representado como
zero (y1) e 4 s (x2) como 1.39 (y2). A deriva-
ção (painel central) mostra que se o sujeito
usa uma métrica logarítmica, o PIS é a mé-
dia geométrica (MG) de 1 e 4 s.
Por fim, em uma transformação recí-
proca, y = 1/x (painel da direita na Figura 3),
1 s (x1) é representado como 1 (y1) e 4 s (x2)
é representado como 0.25 (y2). A derivação
(painel da direita) mostra que, se o sujeito
usa uma métrica recíproca, o PIS é a média
harmônica (MH) de 1 e 4 s.
Generalizando, se ao estimar a du-
ração de n estímulos, t1, t2, ..., tn, os su-
jeitos usam uma métrica linear, o PIS é
Figura 3. Painel da esquerda: Transformação linear da duração x. Painel central: Transformação logarítmica da duração x. Painel da direita: Transfor-
mação recíproca da duração x.
Marilia Pinheiro de Carvalho, Marco Vasconcelos, Armando Machado
143
igual à média aritmética dos estímulos

; se usam uma métrica

logarítmica, o PIS é igual à média geomé-
trica dos estímulos ;
e se usam uma métrica recíproca, o PIS é
igual à média harmônica dos estímulos

Church e Deluty (1977) determina-
ram empiricamente o PIS em um dos es-
tudos mais influentes na área do controle
temporal do responder (timing). Eles usa-
ram uma tarefa psicofísica clássica, a tare-
fa de bissecção, para medir o valor do PIS
em diversas discriminações temporais. Os
resultados revelaram algumas das proprie-
dades centrais do responder controlado
temporalmente em animais não-humanos
e essas propriedades definiram aquilo que
qualquer modelo teórico de timing deve ex-
plicar. Para além disso, o estudo de Chur-
ch e Deluty identificou pela primeira vez
questões importantes sobre a natureza do
controle por estímulos temporais e sobre
a natureza do que é aprendido em tarefas
temporais, sugeriu procedimentos para
analisá-las empiricamente, e avançou com
respostas provisórias a essas questões. To-
das elas permanecem em aberto.
DESCRIÇÃO DO EXPERIMENTO
Objetivo e método
A tarefa de bissecção temporal é uma
tarefa de discriminação condicional. Para
ilustrar, considere uma tentativa de treino
típica no estudo de Church e Deluty (1977)
com ratos. Durante o intervalo entre tenta-
tivas (ITI, do inglês inter-trial interval), uma
luz de iluminação geral ficava acesa por 30
segundos. Terminado o ITI, a luz geral apa-
gava-se por 2 ou 8 s – o período na escuri-
dão sinalizava o intervalo de tempo a esti-
mar e era o estímulo modelo da tentativa.
Ao fim do intervalo, duas barras de resposta
eram introduzidas na caixa, uma na esquer-
da e outra na direita do painel de respostas.
Os ratos deviam pressionar uma das duas
barras condicionalmente à duração do in-
tervalo. Respostas corretas (e.g., pressionar
a barra da esquerda após 2 s e a barra da di-
reita após 8 s) eram reforçadas com acesso
a comida e respostas incorretas não produ-
ziam consequências (extinção). Para facili-
tar a descrição, a partir de agora vamos sim-
plesmente dizer que os ratos aprenderam a
responder ‘curto’ após a duração mais curta,
e ‘longo’ após a duração mais longa – inde-
pendentemente de formalmente as respos-
tas serem pressionar a barra da esquerda ou
da direita.
Quatro grupos de ratos (N = 8) foram
treinados em diversas discriminações ao
longo de seis fases experimentais. Para os
nossos propósitos, é suficiente considerar
apenas as quatro primeiras fases. Na Fase
( )1 2n nMG t t t= × × ×
1 2 nt t tMA
n
+ + + = 
 

1 2
1 1 1
nt t t
nMH
 
 
 + + + 
=

Capítulo IX | Bissecção Temporal
144
I, todos os grupos aprenderam a discrimi-
nação entre 2 e 8 s. Na Fase II, os grupos A
e B aprenderam a discriminação entre 1 e 4
s, e os grupos C e D a discriminação entre 4
e 16 segundos. Na Fase III, os grupos A e B
aprenderam a discriminação entre 4 e 16 s,
e os grupos C e D a discriminação entre 1 e
4 s. Na Fase IV, todos grupos aprenderam a
discriminação entre 3 e 12 s. A Tabela 1 resu-
me as discriminações aprendidas por cada
rações de treino (e.g., no caso da discrimi-
nação entre 2 e 8 s, MH = 3.2 s, MG = 4 s e
MA= 5 s). Também nas tentativas de teste,
os sujeitos deviam responder ‘curto’ ou ‘lon-
go’ condicionalmente à duração apresenta-
da na tentativa, mas nenhuma resposta era
reforçada. Concluído o treino discriminati-
vo e o teste de generalização de uma fase
experimental, iniciava-se a fase seguinte.
Tabela 1. Discriminações temporais aprendidas por cada grupo de ratos nas quatro primeiras fases do estudo de Church e Deluty (1977). Em cada célula,
a posição da duração de treino representa a resposta correta. Por exemplo, ‘1 s – 4 s’ significa que, para receber comida, os sujeitos deviam responder
‘esquerda’ após 1 s, e ‘direita’ após 4 s. Adaptado de Church e Deluty (1977).
grupo em cada fase. Doravante, chamare-
mos as durações treinadas em cada discri-
minação de ‘durações de treino’.
Cada fase começava com o treino
discriminativo e terminava com um teste
de generalização. O treino discriminativo
incluía apenas tentativas com as durações
de treino, como as descritas acima. O tes-
te de generalização incluía, para além das
tentativas de treino, tentativas de teste em
que eram apresentadas cinco durações in-
termediárias3 às durações de treino – três
destas durações correspondiam às médias
harmônica, geométrica e aritmética das du-
3 As durações de teste estavam aproximadamente em progressão geo-
métrica, ou seja, cada duração depois da primeira era obtida multipli-
cando a anterior por uma constante.
Com os dados do teste de generali-
zação, Church e Deluty (1977) obtiveram a
função psicométrica e o PIS de cada discri-
minação treinada. Como o PIS é a duração
que separa os modelos ‘curtos’ dos modelos
‘longos’, ele também pode ser visto como a
duração em que o sujeito divide ao meio,
ou bissecta, o intervalo ente as durações de
treino (e.g., o intervalo entre 2 e 8 s). Daí o
nome do procedimento, bissecção tempo-
ral.
Resultados e discussão
A Figura 4 (painel da esquerda) apre-
senta as funções psicométricas médias
(n=8) obtidas por Church e Deluty (1977) em
Marilia Pinheiro de Carvalho, Marco Vasconcelos, Armando Machado
145
cada uma das quatro discriminações. Todas
as funções psicométricas tinham valores
mínimo e máximo próximos das duraçõs
de treino de cada discriminação e formato
ogival, evidenciando que os pombos eram
capazes de discriminar as diferentes dura-
ções.
O painel central da Figura 4 apresen-
ta as mesmas funções psicométricas, mas,
agora, o eixo do x está com as durações
em unidades logarítmicas. No eixo do x, os
valores 1 e 7 correspondem às durações de
treino curta e longa, respectivamente. Os
valores 3, 4 e 5 correspondem às médias
harmônica, geométrica e aritmética das du-
rações de treino de cada discriminação, res-
pectivamente.
A partir das funções psicométricas,
os autores calcularam o PIS de cada dis-
criminação ajustando uma reta aos pontos
correspondentes às três durações centrais
[pontos com coordenadas (3, y), (4, y) e (5,
y)]. Eles escolheram estes pontos porque
se concentravam próximos ao ponto com
coordenadas (x, 0.50), o PIS. Conhecidos
os parâmetros da reta (inclinação e interse-
ção-y), calculou-se o PIS. O painel central
naFigura 4 apresenta os PISs obtidos em
função da média geométrica das durações
treinadas em cada discriminação – para a
discriminação entre 1 e 4 s, MG = 2 s; para 2
e 8 s, MG = 4 s; para 3 e 12 s, MG = 6 s; para
4 e 16 s, MG = 8 s. A figura também mostra
quais seriam os PISs esperados no caso de
eles estarem nas médias4 harmônica e arit-
mética das durações de treino (ver as linhas
tracejadas na figura). Os resultados mos-
traram que os PISs praticamente se sobre-
puseram às médias geométricas, revelando
que, do ponto de vista dos ratos, a duração
que bissecta o intervalo entre as durações
de treino é a média geométrica das mesmas.
Também à partir das retas ajustadas
às funções psicométricas, os autores calcu-
laram o limiar diferencial de cada discrimi-
nação. O limiar diferencial, também deno-
minado de diferença mínima perceptível
(just noticeable difference ou JND), indica
quanto um estímulo de comparação deve
diferir de um estímulo padrão em uma dada
dimensão física para ser percebido como
Figura 4. Painel da esquerda: Funções psicométricas médias obtidas por Church e Deluty (1977). Painel central: Funções psicométricas obtidas por
Church e Deluty (1977) graficadas em uma escala comum em unidades logarítmicas. Painel da direita: PISs médios em função da média geométrica das
durações treinadas em cada discriminação. A linha contínua (MG) indica a média geométrica das durações treinadas. As linhas tracejadas (MH e MA)
indicam as médias harmônica e aritmética, respectivamente.
Capítulo IX | Bissecção Temporal
146
diferente. Se o JND é pequeno, uma peque-
na diferença entre os estímulos é suficiente
para discriminá-los, se é grande, os estímu-
los devem diferir bastante para serem dis-
criminados. Para obter o JND de cada rato,
os autores identificaram em cada reta as
durações correspondentes aos pontos com
coordenadas (x1, 0.75) e (x2, 0.25) e depois
calcularam JND = (x1-x2)/2.
Esperamos naturalmente que o JND
seja maior nas discriminações com as du-
rações mais longas. Por exemplo, esperarí-
amos que ele fosse maior na discriminação
entre 4 e 16 s do que na discriminação entre
1 e 4 s. É fácil percebermos que, por ser uma
medida absoluta da discriminabilidade dos
estímulos, o JND é afetado pela ordem de
grandeza dos estímulos em questão. Con-
clusões gerais sobre a discriminabilidade
dos estímulos, portanto, deveriam basear-
-se em uma medida relativa.
A Fração de Weber, obtida dividin-
do o JND pelo valor do estímulo padrão, t
(FW=JND/t), é frequentemente usada como
um índice relativo da discriminabilidade.
Para calcular a Fração de Weber em cada
discriminação, Church e Deluty (1977) assu-
miram que o PIS era o estímulo padrão, ou
seja, o critério em relação ao qual os sujeitos
categorizavam as durações como curtas ou
longas. Como em todas as discriminações
o PIS estava muito próximo da média geo-
métrica das durações de treino, os autores
assumiram que t = MG em cada discrimi-
nação.
As Frações de Weber obtidas eram
relativamente constantes (M = 0.23) e não
diferiram estaticamente entre si. Estes re-
sultados revelaram que, para qualquer or-
dem de grandeza dos estímulos temporais,
um estímulo deve diferir em cerca de 23%5
do estímulo padrão para ser discriminável.
Em outras palavras, a discriminabilidade
entre duas durações depende de sua dife-
rença relativa e não da sua diferença ab-
soluta. Church e Deluty (1977) verificaram
que, à semelhança de muitas outras dimen-
sões do estímulo, a discriminação da dura-
ção também segue a Lei de Weber.
Se a Fração de Weber é constante, é
de se esperar que os sujeitos respondam de
maneira semelhante para durações distin-
tas que representem a mesma proporção
de tempo transcorrido (ou que estejam na
mesma razão). Para ilustrar, voltemos ao
caso das discriminações 1 s vs. 4 s e 4 s vs.
16 s. Na primeira, os sujeitos aprenderam a
responder ‘longo’ após 4 s e a MG = 2 s. Na
segunda, aprenderam a responder ‘longo’
após 16 s e a MG = 8 s. Em ambos os casos,
a proporção entre a duração de treino mais
longa (4 ou 16 s) e a correspondente média
4 A média harmômica é sempre inferior ou igual à média geométrica
que, por sua vez, é sempre inferior ou igual à média aritmética, ou seja,
MH ≤ MG ≤ MA. A igualdade ocorre quando os números são todos
iguais.
5 Na literatura em tarefas temporais com animais não-humanos, há
evidencia da Fração de Weber variando entre 0.20 e 0.30 (Richelle &
Lejeune, 1980).
Marilia Pinheiro de Carvalho, Marco Vasconcelos, Armando Machado
147
geométrica é de 2. Assim, como a Fração de
Weber é constante, a proporção de respostas
‘longo’ emitidas para cada uma dessas duas
durações longas deveria ser igual: P(‘longo’)
aos 4 s na discriminação 1 s vs. 4 s deveria
ser igual a P(‘longo’) aos 16 s na discrimina-
ção 4 s vs. 16 s. O mesmo aconteceria para
as outras durações usadas nos testes.
Church e Deluty (1977) confimaram
este resultado: As proporções de respostas
‘longo’ eram iguais para durações que repre-
sentavam a mesma proporção em relação à
média geométrica e, portanto, as funções
psicométricas das quatro discriminações
sobrepuseram-se (conferir o painel central
na Figura 4).
A sobreposição das funções psico-
métricas ilustra uma das propriedades mais
robustas da discriminação temporal em
animais, a propriedade escalar: Tarefas de
bissecção com durações de treino na mes-
ma proporção (1:4 em todas as tarefas em
análise no estudo) induzem funções psi-
cométricas que se sobrepõem quando gra-
ficadas na mesma escala. Church e Deluty
(1977) verificaram que a discriminação tem-
poral dos estímulos obedece à propriedade
escalar.
DESDOBRAMENTOS
Responder relacional vs. respon-
der absoluto. Retomemos o nosso exemplo
com o treino discriminativo entre 1 e 4 s.
Para facilitar a descrição, dissemos até aqui
que os sujeitos aprendem a responder ‘cur-
to’ para 1 segundo e ‘longo’ para 4 s, quando,
em verdade, eles aprendem, por exemplo, a
pressionar a barra da esquerda após 1 s e a
barra da direita após 4 s. Existe uma dife-
rença fundamental entre afirmar que os su-
jeitos respondem que uma duração é curta
e a outra é longa, e afirmar que respondem
‘esquerda’ e ‘direita’ em função das dura-
ções. A primeira afirmação implica que os
sujeitos respondem com base no valor rela-
tivo das durações – isto é, aprendem que 1 s
é curto relativamente a 4 s, que 4 s é longo
relativamente a 1 s e, adicionalmente, quais
respostas emitir para os estímulos curto e
longo; a segunda afirmação implica que
os sujeitos respondem com base no valor
absoluto das durações – isto é, aprendem
quais respostas emitir após 1 e 4 s.
O responder com base no valor rela-
tivo dos estímulos, ou o responder relacio-
nal, influenciou fortemente o programa de
trabalhos da escola da Gestalt em princípios
do século XX e é um dos tópicos de pesqui-
sa mais antigos da psicologia experimen-
tal. Há evidência de responder relacional
controlado pelo brilho (Kohler, 1918/1938),
pelo tamanho (Gulliksen, 1932) e pela forma
(Saldanha & Bitterman, 1951) dos estímulos,
embora interpretações alternativas sejam
possíveis (e.g., Spence, 1936, 1937). Mas será
que animais não-humanos respondem rela-
cionalmente em discriminações temporais?
O estudo de Church e Deluty (1977)
Capítulo IX | Bissecção Temporal
148
iniciou a linha de pesquisa neste tópico e,
assim, levantou outra questão fundamen-
tal no estudo do timing, designadamente,
o quê um animal aprende na tarefa de bis-
secção. Vejamos como os autores atacaram
o problema. Volte à Tabela 1 e considere as
tarefas realizadas pelos grupos A e B nas
Fases II e III. Na Fase II, ambos os grupos
aprenderam a responder ‘esquerda’ após
1 s e ‘direita’ após 4 s. Se, por um lado, os
sujeitos aprenderam a responder ao valor
relativo das durações, a contingência pode
ser resumida com o esquema ‘curto→es-
querda, longo→direita’. Se, por outro lado,
aprenderam a responder ao valor absoluto
das durações, a contingênciapode ser resu-
mida como ‘1s→esquerda, 4s→direita’.
A Fase III foi planejada para testar
as duas possibilidades. Ambos os grupos
aprenderam a discriminação entre 4 e 16 s,
mas o mapeamento entre a resposta correta
e a duração do estímulo diferiu entre gru-
pos. Um grupo aprendeu a responder ‘es-
querda’ após 4 s e ‘direita’ após 16 s. Obser-
ve que se manteve o mapeamento relativo
‘curto→esquerda, longo→direita’ para este
grupo e, por isso, vamos chamá-lo de grupo
Relativo. O outro grupo, em contrapartida,
aprendeu a responder ‘direita’ após 4 s e ‘es-
querda’ após 16 s. Neste caso, manteve-se
o mapeamento absoluto ‘4s→direita’ e, por
isso, chamamo-lo de grupo Absoluto.
Church e Deluty (1977) raciocinaram
que, se o responder na discriminação tem-
poral é baseado no valor relativo das dura-
ções, o grupo Relativo deveria aprender a
Fase III mais rapidamente do que o grupo
Absoluto. Se, pelo contrário, o responder é
Figura 5. Painel da esquerda. Proporção de acertos para a duração de 4 s obtida nos grupos Relativo e Absoluto por Church e Deluty (1977). Painel
central. Porcentagem de acertos de um sujeito do grupo Relativo para as durações de 6 e 18 s na fase B do experimento de Carvalho et al. (2016). Painel
da direita. Porcentagem de acerto de um sujeito do grupo Absoluto para as durações de 6 e 18 s na fase B do experimento de Carvalho et al. (2016).
Marilia Pinheiro de Carvalho, Marco Vasconcelos, Armando Machado
149
baseado no valor absoluto, o grupo Absoluto
deveria aprender mais rapidamente do que
o grupo Relativo. Os autores compararam a
porcentagem de respostas corretas dos gru-
pos ao longo das sessões de treino da Fase
III, mas analisaram apenas o desempenho
para a duração de 4 s. Os resultados na Fi-
gura 5 (painel a) revelaram que o grupo Re-
lativo respondia corretamente em mais de
90% das tentativas ao fim de quinze sessões
de treino, mas o grupo Absoluto respondia
corretamente em menos de 70% das tenta-
tivas. Além disso, já na primeira sessão de
treino, o desempenho do grupo Relativo era
mais alto do que o do grupo Absoluto. Com
base nestes resultados, os autores concluí-
ram que os sujeitos aprendem a responder
ao valor relativo das durações em tarefas de
discriminação temporal.
Em nosso laboratório, replicamos
com pombos o experimento de Church e
Deluty (1977). Ensinamos aos animais as
discriminações entre 2 s vs. 6 s e 6 s. vs. 18
segundos e usamos um disco verde e outro
vermelho como estímulos de comparação.
Nossos resultados (painéis b e c na Figura
5; Carvalho & Machado, 2012; Carvalho,
Machado, & Tonneau, 2016), contudo, não
corroboraram aqueles obtidos por Church e
Deluty com ratos. Ao invés, eles mostraram
que (a) na primeira sessão de treino, o de-
sempenho do grupo Absoluto era mais alto
do que o do grupo Relativo na duração de
6 s (a duração comum ao treino das duas
fases e que em nosso procedimento equi-
valia à duração de 4 s no estudo de Church
e Deluty) e (b) ambos os grupos tinham um
desempenho similar e elevado no final do
treino.
Para melhor fundamentar a compa-
ração dos grupos, nós simulamos o desem-
penho na tarefa com o modelo Learning to
Time (LeT; Machado, 1997; Machado, Ma-
lheiro, & Erlhagen, 2009) e, posteriormente,
constratamos as simulações com os dados
empíricos. O LeT é um modelo comporta-
mental que descreve a aquisição e o estado
estável de respostas controladas temporal-
mente com base em processos de reforça-
mento, extinção e generalização.
De acordo com o LeT, o início do
estímulo modelo ativa uma série de esta-
dos comportamentais que estão ligados às
duas respostas operantes. A velocidade de
ativação dos estados (λ) varia de tentativa
para tentativa e provem de uma distribui-
ção normal, λ ~ N (média = μ, desvio pa-
drão =σ). Quando o sujeito emite uma res-
posta ao fim do estímulo modelo, a força
do elo associativo entre a resposta emitida
e o estado ativo no momento da resposta é
alterada dependendo da consequência da
resposta: Se foi reforçada, a força aumenta;
se foi extinta, a força diminui. A Figura 6
esquematiza o modelo.
Vejamos o caso da discriminação
‘2s→verde, 8s→vermelho’. Em uma ten-
tativa com um estímulo modelo de 2 s e λ
= 1, o estado n = 2 está ativo no momento
em que o sujeito emite uma resposta, ‘ver-
Capítulo IX | Bissecção Temporal
150
de’ por exemplo. A resposta é reforçada e,
portanto, a força do elo entre o estado n=2 e
‘verde’ aumenta e a força do elo entre o es-
tado n=2 e ‘vermelho’ diminui . Se o sujeito
responder ‘vermelho’, a resposta é extinta,
o elo de n=2 e ‘vermelho’ diminui e o elo de
n=2 e ‘verde’ aumenta. Veja na Figura 6 o
elo “forte” (linha preta) de n=2 com ‘verde’ e
o elo “fraco” (linha cinza pontilhada) de n=2
com ‘vermelho’.
Em uma tentativa com um estímulo
modelo de 8 s e λ = 1, o estado n = 8 está
ativo no momento em que o sujeito emite
a resposta ‘vermelho’. A resposta é refor-
çada, a força do elo entre o estado n = 8 e
‘vermelho’ aumenta e a força do elo entre
o estado n = 8 e ‘verde’ diminui. Raciocínio
semelhante ao já descrito acima aplica-se
ao efeito da extinção da resposta ‘verde’
emitida após 8 s.
O parâmetro λ é uma variável alea-
tória, e, portanto, o estado ativo ao fim de
um dado estímulo modelo varia de tentati-
va para tentativa. Contudo, a ativação dos
estados correlaciona-se com a passagem
do tempo e, assim, estados iniciais (e.g., n
= 1, 2, 3) estarão mais provavelmente ativos
durante as respostas ao estímulo de 2 s, e
estados subsequentes (e.g., n = 6, 7, 8) esta-
rão mais provavelmente ativos durante as
respostas ao estímulo de 8 s. Com o treino,
as forças de ligação de todos os estados ati-
vos durante as respostas são alteradas, de
modo que os estados iniciais estarão mais
fortemente ligados a ‘verde’ e os estados
posteriores estarão mais fortemente ligados
a ‘vermelho’. O resultado são dois gradien-
tes de forças de ligação, um para a resposta
‘verde’ e outro para a resposta ‘vermelho’
(observe a gradação da espessura dos elos
associativos na Figura 6). Em cada tentati-
va, o sujeito emitirá a resposta que tiver o
elo mais forte com o estado ativo ao fim do
estímulo modelo.
Como você deve ter observado, o
LeT assume que as respostas do sujeito são
controladas pela duração absoluta do es-
tímulo modelo (i.e., 2 s ou 8 s) e não pela
sua duração relativa (i.e., ‘curto’ ou ‘longo’).
Ao comparar as simulações do LeT com o
desempenho dos pombos, pudemos ava-
liar qual é a forma de controle de estímulos
predominante na tarefa de bissecção tem-
poral. As simulações foram genericamente
semelhantes ao desempenho dos pombos
tanto qualitativa, quanto quantitativamen-
te (compare os painéis d e e com os painéis
b e c, respectivamente, na Figura 5). Os re-
sultados dos estudos conduzidos por Car-
valho e colaboradores (2012, 2016), portanto,
Figura 6. Diagrama dos componentes do modelo Learning to Time
(LeT) – estados comportamentais, elos associativos e respostas operan-
tes – aplicado à uma tarefa de bissecção temporal. A cor e o tracejado
dos elos indicam a força de ligação entre os estados e as respostas: Li-
nhas pretas contínuas indicam força “elevada”, linhas pretas traceja-
das indicam força “intermediária” e linhas cinzas pontilhadas indicam
força “baixa”. Portanto, o estado n = 2 está fortemente ligado a ‘verde’ e
fracamente ligado a ‘vermelho’, e o estado n = 8 está fracamente ligado
a ‘verde’ e fortemente ligado a ‘vermelho’, por exemplo.
Marilia Pinheiro de Carvalho, Marco Vasconcelos, Armando Machado
151
sugerem de maneira bastante robusta que o
responder na tarefa de bissecção temporal
é baseado no valor absoluto das durações.
Permanece por identificar sob quais condi-
ções os animais aprendem a responder com
base na duração relativa dos estímulos tem-
porais.
Efeitos contextuais na tarefa de bis-
secção.
Para além dos estudos empíricos,
os pesquisadores do timing também têm
conduzido pesquisas teóricas. Em particu-
lar, elestêm proposto vários modelos ma-
temáticos para explicar o desempenho em
tarefas temporais. Dois dos modelos mais
influentes são o LeT, já apresentado, e o
Scalar Expectancy Theory (SET; Gibbon,
1977, 1991; Gibbon & Church, 1984; Gibbon,
Church, & Meck, 1984).
Os dois modelos diferem nos seus
pressupostos sobre o que é aprendido na
tarefa de bissecção temporal. Para compre-
endermos estas diferenças, tomemos uma
tarefa em que os sujeitos devem responder
‘vermelho’ após 1 s e ‘verde’ após 4 s. De
acordo com o SET, os sujeitos aprendem
apenas as contingências ‘1s→escolher ver-
melho’ e ‘4s→escolher verde’. O LeT, pelo
contrário, assume que os sujeitos apren-
dem ‘1s→escolher vermelho e evitar verde’
e ‘4s→escolher verde e evitar vermelho’.
Para testar os pressupostos dos mo-
delos, Machado e Keen (1999) desenvolve-
ram a tarefa de dupla bissecção temporal.
Como o nome da tarefa sugere, os sujeitos
são treinados em duas bissecções temporais.
A primeira é semelhante à que acabamos de
descrever entre 1 e 4 s. Na segunda, apren-
dem a responder ‘azul’ após 4 s e ‘amarelo’
após 16 s. Para o SET, os sujeitos aprendem
‘4s→escolher azul’ e ‘16s→escolher ama-
relo’. Para o LeT, eles aprendem ‘4s→esco-
lher azul e evitar amarelo’ e ‘16s→escolher
amarelo e evitar azul’. Aprendidas as duas
discriminações, é conduzido um teste com
durações que variam entre 1 e 16 s e no qual
as opções de reposta são ‘verde’ e ‘azul’.
Os modelos diferem nas previsões
que fazem do desempenho no teste. De
acordo com o SET, os sujeitos deveriam
distribuir aleatoriamente suas respostas
entre ‘verde’ e ‘azul’ durante o teste, porque
no treino prévio eles apenas aprenderam
‘1s→escolher vermelho, 4s→escolher ver-
de, 4s→escolher azul, 16s→escolher ama-
relo’ e, portanto, não deveriam apresentar
vieses em favor de uma ou outra resposta
em função das diferentes durações. Como
consequência, a proporção de respostas
‘verde’ não deveria variar com as durações
de teste.
De acordo com o LeT, os sujeitos
deveriam preferir ‘verde’ conforme as du-
rações de teste aumentassem porque no
treino prévio os sujeitos aprenderam (a)
a evitar ‘azul após as durações mais lon-
gas (próximas de 16 s) e (b) a evitar ‘verde’
após as durações mais curtas (próximas de
Capítulo IX | Bissecção Temporal
152
1 s). No teste, dada a escolha entre ‘verde’ e
‘azul’, a proporção de respostas ‘verde’ de-
veria aumentar com o aumento na duração
dos estímulos.
Diversos estudos usaram a tarefa de
dupla bissecção temporal (Arantes & Ma-
chado, 2008; Machado & Arantes, 2006;
Machado & Keen, 1999; Machado & Olivei-
ra, 2009; Machado & Pata, 2005; Oliveira &
Machado, 2008, 2009; Vieira de Castro &
Machado, 2012; Vieira de Castro, Machado,
& Tomanari, 2013) e sistematicamente con-
firmaram as previsões do LeT. A Figura 7
apresenta os resultados obtidos por Macha-
do e Pata (2005) com pombos. Dá-se o nome
de efeito de contexto a este padrão de resul-
tados, porque as respostas no teste são de-
terminadas pelo contexto original em que
os sujeitos aprenderam a escolher ou evitar
consideramos um treino discriminativo em
que as probabilidades de reforço das res-
postas corretas para cada duração de treino
eram iguais. Church e Deluty (1977) usaram
um esquema de Razão Fixa (FR) 1 para as
respostas ‘curto’ e ‘longo’. Sob este esquema,
verificamos que o PIS está usualmente na
média geométrica das durações de treino. A
linha contínua na Figura 8 ilustra uma fun-
ção psicométrica hipotética para um treino
discriminativo entre 1 e 4 s no qual as res-
postas ‘curto’ e ‘longo’ tinham igual proba-
bilidade de reforço. Observe que o PIS da
função é igual a 2 s.
Agora, o que aconteceria com o PIS,
em particular, e com a função psicométrica,
de um modo geral, se conduzíssemos um
treino discriminativo em que uma resposta
tem maior probabilidade de reforço do que
a outra? Por exemplo, o que aconteceria se a
probabilidade de reforço da resposta ‘longo’
fosse de 1.0 e a probabilidade de reforço da
resposta ‘curto’ fosse de 0.2? De maneira se-
melhante, o que aconteceria se a magnitude
do reforço fosse maior para a resposta ‘lon-
go’ do que para a resposta ‘curto’? Em am-
bos os casos, esperaríamos que a proporção
de respostas ‘longo’ aumentasse, resultando
em uma função psicométrica que está des-
locada para a esquerda da função que con-
sideramos anteriormente, e cujo PIS está
abaixo de 2 s. A linha pontilhada na Figura
8 ilustra o efeito.
De maneira similar, quando a proba-
bilidade de reforço da resposta ‘longo’ fosse
Figura 7. Efeito de contexto obtido por Machado e Pata (2005) com
pombos em uma tarefa de dupla bissecção temporal.
uma resposta em função das durações.
Efeitos da probabilidade do reforço
na função psicométrica. Até agora, apenas
Marilia Pinheiro de Carvalho, Marco Vasconcelos, Armando Machado
153
menor do que a probabilidade de reforço da
resposta ‘curto’, a proporção de respostas
‘longo’ diminuiria, a função psicométrica
deslocar-se-ia para a direita e o PIS seria
superior a 2 s. A linha tracejada na Figura 8
ilustra o efeito.
Até o momento, contudo, os resulta-
dos experimentais são escassos e inconsis-
tentes. Stubbs (1976), por exemplo, reportou
deslocamentos consistentes com as previ-
sões em uma tarefa em que a probabilidade
relativa de reforço diferia entre as respostas
‘curto’ e ‘longo’ (ver também Raslear, 1985).
Outros estudos que manipularam a mag-
nitude do reforço, no entanto, revelaram
tanto resultados consistentes quanto resul-
tados inconsistentes com as previsões (e.g.,
Galtress & Kirkpatrick, 2010).
Caso ocorram de fato, os desloca-
mentos da função psicométrica indicariam
que a distribuição das respostas entre as
duas opções (‘curto’ e ‘longo’) é sensível às
discrepâncias nas probabilidades e nas mag-
nitudes de reforço. Tais resultados seriam
consistentes com a Lei da Igualação (Herr-
nstein, 1970) e aproximariam o responder
em discriminações temporais do responder
observado em outros procedimentos que
envolvem escolha. Mais pesquisa sobre o
tópico é claramente necessária.
CONSIDERAÇÕES FINAIS
O estudo de Church e Deluty (1977)
é hoje considerado um clássico da pesqui-
sa em timing. Por um lado, foi pioneiro na
implementação de uma tarefa de bissecção
temporal recorrendo a um procedimento
psicofísico clássico (i.e., o método de estí-
mulos constantes). Anteriormente, Stubbs
(1968, 1976) tinha utilizado um procedimen-
to similar, mas, ao invés de reforçar apenas
as repostas para as durações mais curta e
mais longa, reforçava também as respostas
para as durações intermediárias. Church e
Deluty, por sua vez, foram os primeiros a
reportar funções psicométricas e PISs ob-
tidos em testes de generalização e sem re-
forçamento das respostas para as durações
intermediárias. Por outro lado, e porventu-
ra mais importante, o estudo de Church e
Deluty deu lugar a uma série de questões
consideradas ainda hoje centrais para a
nossa compreensão da percepção temporal
tanto em humanos como em animais não
humanos.
Como discutido anteriormente, o PIS
Figura 8. Funções psicométricas hipotéticas para diferentes probabi-
lidades de reforço na discriminação entre 1 e 4 s. Em cada linha da
legenda, o valor à esquerda representa a probabilidade de reforço da
resposta ‘curto’ e o valor à direita representa a probabilidade de reforço
da resposta ‘longo’.
Capítulo IX | Bissecção Temporal
154
na média geométrica sugere uma escala
logarítmica para o tempo subjetivo, com-
binada com uma regra de decisão baseada
na diferença entre tempos subjetivos. Con-
tudo, logo após o estudo de Church e Delu-
ty (1977), outros autores mostraram como o
PIS na média geométrica pode ser obtido a
partir de uma escala linear e de uma regra
de decisão baseada na razão entre os tem-
pos subjetivos (ver Gibbon, 1991). As ques-
tões sobre a métrica da escala subjetiva do
tempo – logarítmica versus linear – e sobre
a regra de decisão permanecem em aber-
to(e.g., Jozefowiez, Machado, & Staddon,
2013). Da mesma forma, há evidência de res-
ponder relacional em algumas circunstân-
cias (e.g., Zentall, Weaver, & Clement, 2004),
muito embora nosso laboratório tenha en-
contrado evidências sólidas de responder
absoluto, pelo menos em pombos. Ainda, a
tarefa de bissecção abriu a porta para pro-
cedimentos mais complexos como a dupla
bissecção. Esta última tem sido usada para
estudar efeitos de contexto na percepção
temporal, testando previsões contrastantes
de dois modelos proeminentes da área, o
SET e o LeT. Por fim, ainda não são claros
os efeitos da manipulação da probabilidade
e da magnitude do reforço na função psi-
cométrica. Os resultados obtidos por alguns
autores apontam para deslocamentos da
função induzidos por estas manipulações
(Galtress & Kirkpatrick, 2010; Raslear, 1985;
Stubbs, 1976), mas o assunto permanece por
esclarecer cabalmente.
A melhor prova do sucesso e impor-
tância do trabalho de Church e Deluty (1977)
são as linhas de pesquisa que abriu. Trinta
e nove anos após a sua publicação, as su-
gestões nele contidas permanecem atuais e
alvo de forte disputa e investigação.
PARA SABER MAIS
Carvalho & Machado (2012); Carvalho,
Machado, & Tonneau (2016). Em ambos
os artigos, os autores reproduziram o estu-
do original de Church e Deluty (1977) com
procedimentos que melhoraram o desenho
experimental e a análise de dados para es-
tudar a questão do responder relacional vs.
responder absoluto. Nos artigos, os autores
também apresentam uma revisão detalha-
da do trabalho de Church e Deluty (1977).
Carvalho, Machado, & Vasconcelos (2016).
Os autores revisam as principais tarefas ex-
perimentais usadas na pesquisa em timing
e os principais resultados obtidos até hoje.
Propõem uma abordagem integrativa dos
resultados que se baseia na interação de
gradientes de generalização temporal.
Richelle & Lejeune (1980). Livro de referên-
cia na área do timing, escrito por dois dos
principais pesquisadores da área. Resume
os principais procedimentos, resultados e
propriedades do responder controlado por
intervalos de tempo.
Marilia Pinheiro de Carvalho, Marco Vasconcelos, Armando Machado
155
REFERÊNCIAS
Arantes, J., & Machado, A. (2008). Context
effects in a temporal discrimination task:
Further tests of the Scalar Expectancy The-
ory and Learning-to-Time models. Journal
of the Experimental Analysis of Behavior,
90, 33-51.
Carvalho, M. P., & Machado, A. (2012). Rela-
tive versus absolute stimulus control in the
temporal bisection task. Journal of the Ex-
perimental Analysis of Behavior, 98, 23-44.
Carvalho, M. P., Machado, A., & Tonneau,
F. (2016). Learning in the temporal bisection
task: Relative or Absolute? Journal of Expe-
rimental Psychology, 42, 67-81.
Carvalho, M. P., Machado, A., & Vasconce-
los, M. (2016). Animal timing: a synthetic
approach. Animal Cognition, 1-26.
Catania, A. C. (1999). Aprendizagem: Com-
portamento, Linguagem e Cognição (4ª ed.).
Porto Alegre: Artes Médicas.
Church, R. M. (2002). Temporal learning.
In H. Pashler, & R. Gallistel (Eds), Stevens’
Handbook of Experimental Psychology,
Third Edition: Volume 3, Learning, Motiva-
tion, and Emotion (pp. 365-393). New York,
NY: Wiley.
Church, R. M., & Deluty, M. (1977). Bisec-
tion of temporal intervals. Journal of Expe-
rimental Psychology: Animal Behavior Pro-
cesses, 3, 216-228.
Galtress, T., & Kirkpatrick, K. (2010). Reward
magnitude effects on temporal discrimina-
tion. Learning and Motivation, 41, 108-124.
Gibbon, J. (1977). Scalar expectancy theory
and Weber’s law in animal timing. Psycho-
logical Review, 84, 279-325.
Gibbon, J. (1991). Origins of scalar timing.
Learning and Motivation, 22, 3-38.
Gibbon, J., & Church, R. M. (1984). Sources
of variance in an information processing
theory of timing. In H. L. Roitblat, T. G. Be-
ver, & H. S. Terrace (Eds), Animal Cognition
(pp. 465-488). Hillsdale, NJ: Lawrence Erl-
baum Associates.
Gibbon, J., Church, R. M., & Meck, W. H.
(1984). Scalar Timing in Memory. Annals of
the New York Academy of Sciences, 423, 52-
77.
Gulliksen, H. (1932). Studies of transfer of
response: I. Relative versus absolute factors
in the discrimination of size by the white
rat. Journal of Genetic Psychology, 40, 37-51.
Herrnstein, R. J. (1970). On the law of ef-
fect. Journal of the Experimental Analysis of
Behavior, 13, 243-266.
Köhler, W. (1918/1938). Simple structural
functions in the chimpanzee and in the chi-
cken. In W. D. Ellis (Ed), A source book of
Capítulo IX | Bissecção Temporal
156
gestalt psychology (pp. 217-227). New York:
Harcourt, Brace & World. (Trabalho original
publicado em alemão em 1918).
Machado, A. (1997). Learning the temporal
dynamics of behavior. Psychological Re-
view, 104, 241-265.
Machado, A., & Arantes, J. (2006). Further
tests of the Scalar Expectancy Theory (SET)
and the Learning-to-Time (LeT) model in a
temporal bisection task. Behavioural Pro-
cesses 72, 195-206.
Machado, A., & Keen, R. (1999). Learning
to Time (LeT) or Scalar Expectancy The-
ory (SET)? A critical test of two models of
timing. Psychological Science, 10, 285-290.
Machado, A., Malheiro, M. T., & Erlhagen,
W. (2009). Learning to time: A perspecti-
ve. Journal of the Experimental Analysis of
Behavior, 92, 423-458.
Machado, A., & Oliveira, L. (2009). Dupla
bissecção temporal: testes críticos de dois
modelos de timing. Acta Comportamenta-
lia, 17, 25-60.
Machado, A., & Pata, P. (2005). Testing the
scalar expectancy theory (SET) and the le-
arning-to-time model (LeT) in a double bi-
section task. Learning & Behavior, 33, 111-
122.
Oliveira, L., & Machado, A. (2008). The ef-
fect of sample duration and cue on a double
temporal discrimination. Learning and Mo-
tivation, 39, 71-94.
Oliveira, L., & Machado, A. (2009). Context
effect in a temporal bisection task with the
choice keys available during the sample.
Behavioural Processes, 81, 286-292.
Pavlov, I. (1927). Conditioned reflexes. Lon-
don: Oxford University Press.
Raslear, T. G. (1985). Perceptual bias and
response bias in temporal bisection. Per-
ception & Psychophysics, 38, 261-268.
Richelle, M., & Lejeune, H. (1980). Time in
animal behaviour. Oxford: Pergamon Press
Ltd.
Saldanha, E. L., & Bitterman, M. E. (1951).
Relational learning in the rat. The American
Journal of Psychology, 64, 37-53.
Santo Agostinho. (2004). Confissões, Livro
XI, XIV, 17 (2ª ed.). Lisboa: Imprensa Nacio-
nal da Casa da Moeda.
Spence, K. W. (1936). The nature of discri-
mination learning in animals. Psychological
Review, 43, 427-449.
Spence, K. W. (1937). The differential res-
ponse in animals to stimuli varying within
a single dimension. Psychological Review,
44, 430-444.
Stubbs, D. A. (1968). The discrimination of
Marilia Pinheiro de Carvalho, Marco Vasconcelos, Armando Machado
157
stimulus duration by pigeons. Journal of the
Experimental Analysis of Behavior, 11, 223-
238.
Stubbs, D. A. (1976). Response bias and the
discrimination of stimulus duration. Jour-
nal of the Experimental Analysis of Beha-
vior, 25, 243-250.
Vieira de Castro, A. C., & Machado, A. (2012).
The interaction of temporal generalization
gradients predicts the context effect. Jour-
nal of the Experimental Analysis of Beha-
vior, 97, 263-279.
Vieira de Castro, A. C., Machado, A., & To-
manari, G. Y. (2013). The context effect as
interaction of temporal generalization gra-
dients: Testing the fundamental assump-
tions of the Learning-to-Time model. Beha-
vioural Processes, 95, 18-30.
Hiroto Okouchi
158
Como você se sente?1, 2
Hiroto Okouchi
Universidade Osaka Kyoiku, Japão
Lubinski, D., & Thompson, T. (1987). An animal model of the interpersonal communication of
interoceptive (private) states. Journal of the Experimental Analysis of Behavior, 48, 1-15.
“Nós não precisamos supor que eventos que ocorrem dentro da pele de um organis-
mo tem propriedades especiais por essa razão”
(Skinner, 1953, p.257).
CapítuloX | Eventos Privados
159
INTRODUÇÃO À ÁREA DE PES-
QUISA E CONTEXTUALIZAÇÃO
DO EXPERIMENTO
Muitas pessoas, não somente os psi-
cólogos mas também os não especialistas
em Psicologia, estão interessados em com-
preender a “mente”. Analistas do comporta-
mento têm uma perspectiva única sobre ela,
baseada no Behaviorismo Radical (Skinner,
1945).
A entidade hipotética que geral-
mente tem sido chamada de “mente” está
relacionada com um dos conceitos analíti-
co-comportamentais, os eventos privados.
Eventos privados têm sido geralmente de-
finidos estruturalmente como eventos que
ocorrem dentro da pele de uma pessoa (Ca-
tania, 1992, p.388) e, funcionalmente, como
eventos que são diretamente acessíveis a
apenas uma pessoa (Skinner, 1953, p.257).
Sentimentos, como “depressão” e “entu-
siasmo”, são eventos privados não só estru-
turalmente, mas também funcionalmente,
porque ocorrem dentro da pele de uma pes-
soa e estão diretamente acessíveis apenas
para ele ou ela. Tais sentimentos, em ge-
ral, são considerados como “elementos da
mente” (Dicionário de Inglês Oxford, 2004,
pp.1047-1048).
Em oposição aos eventos privados,
eventos que ocorrem fora da pele de uma
pessoa e/ou eventos que são diretamen-
te acessíveis a mais do que um indivíduo
podem ser chamados de eventos públicos.
O pressionar de uma barra por um rato e a
entrega de uma pelota de comida, durante
um experimento de condicionamento ope-
rante, são exemplos típicos de eventos pú-
blicos. A análise experimental do compor-
tamento tem acumulado um extenso corpo
de conhecimento sobre as relações sistemá-
ticas entre tais eventos públicos (Ferster &
Skinner, 1957, Honig, 1966; Honig & Stad-
don, 1977; Iversen & Lattal, 1991; Madden,
2013).
Analistas do comportamento presu-
mem que eventos privados obedecem os
mesmos princípios comportamentais reve-
lados pela análise experimental de even-
tos públicos. De acordo com este ponto de
vista, por exemplo, até mesmo descrever
nossos próprios sentimentos é um resul-
tado de contingências de reforçamento.
Skinner (1945) argumentou que as respos-
tas verbais sob controle de estímulos pri-
vados são estabelecidas e mantidas prin-
cipalmente pelas contingências de reforço
“arranjadas” por outras pessoas. Suponha
que uma pessoa “deprimida” (um falante),
diga: “Estou deprimido.” Se alguém (um ou-
vinte) ouviu e entendeu a reclamação (isto
é, se o ouvinte pertencesse a uma mesma
comunidade verbal que o falante e pudesse
reagir de forma adequada ao que o falan-
te disse), e se o ouvinte soubesse que o fa-
1 Tradução realizada por João Henrique de Almeida, Carlos Renato Xa-
vier Cançado e Paulo Guerra Soares. O primeiro tradutor é bolsista de
pós-doutorado FAPESP processo número 2014/01874-7.
2 O artigo descrito nesse texto foi traduzido para a língua portuguesa
por Júlio de Rose e está publicado: Lubinski,D. & Thompson, T. (2010)
Um modelo animal de comunicação interpessoal de estados interocep-
tivos (privados). Revista Brasileira de Análise do Comportamento, 6,
229-252.
Hiroto Okouchi
160
lante tinha experimentado um evento que
normalmente provoca sentimentos de de-
pressão (por exemplo, a perda de um ente
querido), o ouvinte poderia dizer: “Eu sei
exatamente como você se sente.” Compor-
tamentalmente, o sentimento de depressão,
a queixa “estou deprimido”, e as palavras de
conforto “Eu sei exatamente como você se
sente”, respectivamente, são um estímulo
discriminativo, uma resposta e um refor-
çador do comportamento verbal do falante.
Uma resposta verbal (e.g., “vermelho”) a um
estímulo público (e.g., um cartão vermelho)
pode ser estabelecida pelo reforço dado por
outros (e.g., “Correto, esta é a cor do car-
tão.”). Os analistas do comportamento su-
põe que descrever os próprios sentimentos
(e.g., estar deprimido), também é aprendido
(e.g., Skinner, 1953, pp.257-282).
Skinner (1945) também demonstrou
que o relato de uma pessoa sobre um estí-
mulo privado não ocorre por reforço direto,
mas por meio de generalização. Uma pessoa
pode descrever seu sentimento novo como
“deprimido(a)” se ele ou ela aprendeu que a
palavra “deprimido(a)” é usada quando algo
(e.g. uma barra) foi empurrado para baixo
(generalização de eventos públicos para os
privados, Skinner, 1957, pp.132-133) ou a
palavra é usada quando ele ou ela experi-
menta um sentimento semelhante ao sen-
timento novo (i.e. generalização de eventos
privados conhecidos para aqueles desco-
nhecidos).
Apesar da grande quantidade de
análises conceituais (e.g., Leigland, 2014;
Schlinger, 2011; Tourinho, 2006), análises
experimentais de eventos privados têm
recebido relativamente pouca atenção. O
experimento conduzido por Lubinski e
Thompson (1987) é um dos raros casos em
que foi praticada uma análise experimental
de eventos privados.
DESCRIÇÃO DO EXPERIMENTO
Objetivos e Método
O objetivo do experimento de Lu-
binski e Thompson (1987) foi avaliar se ani-
mais não-humanos poderiam aprender a
interagir comunicativamente, com base em
eventos em seu ambiente interno.
Figura 1. Painéis adjacentes de trabalho das caixass para os dois grupos
de pombos. Os painéis de trabalho foram separados por uma divisória
de acrílico Os mandadores foram treinados na caixa esquerda; os tate-
adores foram treinados na caixa direita (figura reproduzida da tradução
de Lubinski & Thompson, com permissão da ReBAC e JEAB).
Capítulo X | Eventos Privados
161
Figura 2. Uma comunicação entre dois pombos com base na ingestão de drogas (estado interno) de um dos pombos. Da esquerda para a direita, os cinco
quadros (A-E) mostram os componentes sucessivos do procedimento. Os pombos à esquerda e à direita em cada quadro eram o mandador e o tateador,
respectivamente (reproduzida da tradução de Lubinski & Thompson, 1987, com permissão da ReBAC e JEAB).
de água e comida durante o experimento,
foram treinados em uma cadeia comporta-
mental com dois componentes, em que o
primeiro componente compreendia uma ta-
refa pareamento ao modelo arbitrária (arbi-
trary matching-to-sample )(o procedimen-
to deste treino será resumido em seguida).
Após o treino, a cadeia comportamental es-
tabelecida era a seguinte: (a) O tateador era
injetado com um depressor (pentobarbital),
um estimulante (cocaína) ou uma solução
salina isotônica; (b) três discos de resposta,
cada um marcado com a letra “D”, “N”, ou
“Σ” foram iluminados (Figura 1); (c) bicadas
correspondentes à substância injetada (o
disco “D” para o pentobarbital, o disco “Σ”
para a cocaína, e o disco “N” para a solução
Os sujeitos foram cinco pombos
White Carneau fêmeas, experimentalmen-
te ingênuas, distribuídos em dois grupos,
denominados “mandadores” (dois pombos)
e “tateadores” (três pombos).
Duas caixas experimentais contí-
guas, separadas por uma divisória de acríli-
co transparente, que permitiu que os pom-
bos vissem um ao outro, foram usadas (ver
Figuras 1 e 2). Os mandadores foram trei-
nados na caixa esquerda, os tateadores na
direita. Antes de serem colocados em suas
caixas simultaneamente, cada pombo foi
treinado individualmente.
Os tateadores, que estavam privados
Hiroto Okouchi
162
salina) foram seguidas pela apresentação de
uma luz azul piscando acima dos discos de
resposta; (d) as respostas em um disco aci-
ma de um comedouro (disco da comida) e
em um disco acima de um bebedouro (dis-
co da água) foram reforçadas com comida e
água, respectivamente.
A tarefa de pareamento ao modelo
que os tateadores experimentaram é co-
nhecida como um procedimento de discri-
minação de drogas (drug discrimination):
reforçar um tipo de comportamento após a
administração de uma droga e reforçar ou-
tro comportamento após a administração
de nenhuma droga ou alguma outra dro-
ga (Branch, 1991). Na ausência de qualquer
estímulo diferencial exteroceptivo corre-
lacionado com qualquer comportamento,
escolhas produziam reforçadores mais fre-
quentemente do que ao acaso e poderiam
ser atribuídas a estímulos interoceptivos
decorrentesda substância administrada
(e.g., a droga ou a solução salina). Assim,
os tateadores no experimento de Lubinski
e Thompson (1987) foram treinados para
“relatar seus sentimentos” pela tarefa de
pareamento ao modelo. Foram necessários
aproximadamente sete meses para os tate-
adores responderem de forma consistente
(i.e., pelo menos 80% de respostas corretas)
nesta tarefa.
Um segundo objetivo do experimen-
to Lubinski e Thompson (1987) foi avaliar
se as respostas dos pombos aos seus even-
tos internos (privados) poderiam funcionar
como um tato, o que foi estudado na parte
final do experimento (descrito em seguida).
Um tato, uma unidade do comportamento
verbal, é “um operante verbal em que uma
resposta de determinada forma é evocada
(ou pelo menos fortalecida) por um deter-
minado objeto ou evento ou propriedade
de um objeto ou evento” (Skinner, 1957,
pp. 81-82). Citando vários outros autores
(e.g., MacCorquodale, 1969; Skinner, 1957,
pp.81-82), Lubinski e Thompson afirmam
que tatos não são mantidos por reforços
específicos, nem mudam com o estado de
privação ou de estimulação aversiva do in-
divíduo, mas são mantidos por reforçadores
condicionados generalizados (e.g., dizendo
“Correto” quando alguém nomeia com pre-
cisão a cor de um cartão vermelho dizendo
“Vermelho”). A fim de alcançar este segun-
do objetivo, Lubinski e Thompson tentaram
estabelecer a luz azul intermitente como
um reforçador condicionado generalizado
que pudesse manter o comportamento dos
tateadores. Os tateadores foram privados
de comida de forma mais rigorosa do que
eles foram privados de água em um dia (i.e.,
privação de comida por 28 hr e privação de
água por 4hr), e eles foram privados de água
de forma mais rigorosa do que eles foram
privados de comida em outro dia (i.e., priva-
ção de água por 28 hr e privação de comida
por 4hr). Alternando essas duas condições
de uma forma A-B-A-B, os tateadores esco-
lhiam comida e água indiferenciadamente
quando a luz azul estava piscando.
Um mando, uma unidade mais pri-
Capítulo X | Eventos Privados
163
mitiva do comportamento verbal, é “um
operante verbal em que a resposta é reforça-
da por uma consequência particular, e está,
portanto, sob controle funcional das condi-
ções relevantes de privação ou de estimu-
lação aversiva” (Skinner, 1957, pp.35 -36).
Dizer a palavra “Doce” é um exemplo de um
mando quando reforçado pelo acesso a do-
ces, e a resposta “Doce” será mais provável
de ocorrer após um período de privação de
doces ou comida (Skinner, 1957, p.35). Os
mandadores, que foram mantidos sob pri-
vação de comida a 85% de seu peso com
livre acesso a comida, foram treinados em
uma cadeia comportamental com três com-
ponentes, em que o terceiro componente
envolvia uma tarefa de pareamento ao mo-
delo arbitrário. A cadeia estabelecida para
o mandador era a seguinte: (a) foi ilumina-
do um disco com letras em Inglês dispostas
para formar as palavras (Figura 1); “Como
você se sente?”; (b) as bicadas do mandador
ao disco “Como você se sente” foram segui-
das pela iluminação de um outro disco ro-
tulado “Obrigado”; (c) quando o mandador
bicava o disco “Obrigado”, a letra “D”, “N”,
ou “Σ” era projetada em um disco modelo;
(d) bicar o disco modelo e, em seguida, bicar
o disco de comparação contendo a respos-
ta com a correspondência correta (o disco
“P” para a letra “D”, o disco “C” para a letra
“Σ”, e o disco “S”para a letra”N”) produziam
comida. Depois de ambos os mandadors e
tateadores adquirirem independentemente
a precisão necessária (i.e., pelo menos 80%
de respostas corretas) no encadeamento,
tateadores e mandadors individuais fo-
ram colocados nas suas caixas simultane-
amente. Como a Figura 2 ilustra, a intera-
ção comportamental necessária de cada par
mandador-tateador foi: (a) foi iluminado o
disco do mandador “Como você se sente?” e
o mandador bicava esse disco; (b) foram ilu-
minados todos os discos de comparação do
tateador (i.e., os discos “D”, “N”, e “Σ”) e o ta-
teador bicava o disco de comparação corre-
lacionado com a substância injetada (ou os
próprios “sentimentos” do tateador); (c) foi
iluminado o disco “Obrigado” na caixa do
mandador e o mandador bicava esse disco;
(d) a letra (“D”, “N”, ou “Σ”, i.e., o “nome” da
droga ou o relato do tateador de seus “senti-
mentos”) previamente bicada pelo tateador
aparecia no disco modelo do mandador e a
luz azul começava a piscar a caixa do tate-
ador; o mandador bicava o disco modelo e,
em seguida, bicava do disco de comparação
correto; o tateador bicava o disco da comida
ou da água, produzindo comida ou água; (e)
o mandador recebeu comida. Se o tateador
bicasse o disco de comparação não corre-
lacionado com a substância injectada (uma
resposta incorreta), as luzes da caixa eram
escurecidas por 4 s e o elo inicial da cadeia
(a) era reiniciado. Assim, o estímulo modelo
apresentado ao mandador sempre foi corre-
to. Ambos os mandadors trabalharam com
cada um dos tateadores. Os pombos foram
testados nessa interação por 40 sessões ex-
perimentais.
Deve-se notar que o experimento
de Lubinski e Thompson (1987) apresenta-
va duas fases adicionais (Fases 2 e 3). Na
Hiroto Okouchi
164
Fase 2, os tateadores foram injetados com
novas drogas, clordiazepóxido e d-anfeta-
mina, que possuem propriedades farma-
cológicas em comum com o pentobarbital
e cocaína, respectivamente, como um tes-
te de generalização. Na Fase 3, os autores
examinaram se as respostas dos tateadores
aos seus eventos privados funcionavam
realmente como tatos. Foram testados os
desempenhos dos tateadores quando foram
colocados em suas caixas experimentais
depois de receberem 24 horas de acesso li-
vre a alimento e água (os tateadores foram
saciados com alimento e água), e quando
suas respostas corretas produziam apenas a
luz azul piscando, mas que não produziam
água ou comida (as respostas corretas dos
tateadores produziam apenas reforçadores
condicionados).
Resultados e Discussão
Resultados da Fase 1.
Como apenas uma única substância
(pentobarbital, cocaína, ou salina) foi inje-
tada antes de cada sessão, a escolha corre-
ta para o tateador foi a mesma em todas as
tentativas em uma sessão. Assim, o desem-
penho dos tateadores na primeira tentativa
de uma sessão foi importante neste experi-
mento. Tanto o mandador quanto o tatea-
dor responderam corretamente (e.g., o tate-
ador que recebeu o pentobarbital e bicou o
disco “D”, e o mandador bicou o disco “P”)
na primeira tentativa em 70-100% das ses-
sões, enquanto que a porcentagem de uma
discriminação correta acontecer por acaso
era de aproximadamente 11% (i.e., o produto
dos dois desempenhos individuais acon-
tecendo por acaso, i.e., 0,33 x 0,33). Estes
resultados sugerem que os pombos apren-
deram a interagir comunicativamente com
base em eventos do seu ambiente interno.
Resultados das Fases 2 e 3.
Os desempenhos observados na
Fase 1 persistiram na Fase 2, sugerindo que
as respostas dos tateadores aos seus even-
tos privados decorrentes do treino com as
drogas (pentobarbital e cocaína) generali-
zaram para os eventos privados semelhan-
tes decorrentes de drogas não utilizadas no
treino (clordiazepóxido e d-anfetamina).
Os desempenhos observados nas Fases 1 e
2 persistiram na Fase 3, sugerindo que as
respostas precisas dos tateadores aos seus
eventos privados não foram mantidas pelos
reforçadores específicos (comida ou água), e
não covariaram com os estados de privação
dos tateadores, mas foram mantidas por um
reforço condicionado generalizado (a luz
azul piscando).
A discussão do artigo de Lubinski
e Thompson (1987) pode ser resumida da
seguinte forma: (a) o comportamento dos
tateadores envolveu tatear os eventos pri-
vados; (b) os tateadores aprenderam a ta-
tear eventos privados sob um esquema de
reforçamento contínuo com 100% de preci-
são, isto é, por meio de uma contingência
em que cada resposta correta produzia um
reforçador e qualquer resposta incorreta
CapítuloX | Eventos Privados
165
não produzia reforçadores; por outro lado,
considera-se que humanos aprendem a ta-
tear eventos privados sob um esquema de
reforçamento intermitente com baixa pre-
cisão (Skinner, 1945); (c) a generalização ob-
tida na Fase 2 configura-se como um exem-
plo de tatos extendidos e exemplifica com
não-humanos a descrição de Skinner de
como humanos aprendem a relatar novos
sentimentos; (d) os resultados de Thomp-
son e Lubunski demonstram que o com-
portamento encoberto (e.g., pensamentos,
sentimentos e imaginação), que tem sido
um dos candidatos para análise por meio
de modelos experimentais com não-hu-
manos (Epstein, 1984), mas tem resistido à
análise empírica, é passível de uma análise
objetiva; (e) os desempenhos estudados por
Lubinski e Thompson podem não consistir
em um exemplo de “atividade lingüística”,
como o termo é geralmente entendido, mas
compartilham características com aqueles
comportamentos observados em crianças
muito novas ou indivíduos com diagnós-
tico de deficiências de desenvolvimento;
(f) Savage-Rumbaugh (1984) afirmou que o
comportamento controlado por contingên-
cias impostas por circuitos eletrônicos ao
invés de por um outro indivíduo não pode-
ria ser caracterizado como “comunicação”.
No entanto, as trocas diádicas humanas de
respostas muitas vezes são mediadas por
eventos externos, tais como ligações telefô-
nicas e quadros de avisos no computador, e
nós estamos satisfeitos em nos referirmos a
essas trocas como “verbais”.
DESDOBRAMENTOS
O experimento de Lubinski e Thomp-
son (1987) recebeu grande atenção (e.g., Ca-
tania, 1992, pp.219-220). Em 1993, a revista
Behavioral and Brain Sciences dedicou um
número para um debate sobre o mesmo,
com comentários de 27 estudiosos da aná-
lise do comportamento e de outras aborda-
gens (ver Lubinski & Thompson, 1993).
O experimento de Lubinski e Thomp-
son (1987), no entanto, não foi replicado
diretamente ou sistematicamente. Prova-
velmente, isto pode ser devido a razões de
ordem prática. O equipamento utilizado
por Lubinski e Thompson era muito dife-
rente de caixas operantes padrão. As dro-
gas psicoativas não são acessíveis a todos
os pesquisadores. Além disso, este tipo de
experimento demora muito tempo. Confor-
me descrito na parte de Objetivos e Método
deste capítulo, de fato, Lubinski e Thomp-
son passaram sete meses para ensinar os
tateadores a discriminação entre as drogas.
Dois estudos podem ser considera-
dos como sucessores Lubinski e Thompson
(1987). Um foi realizado por DeGrandpre,
Bickel, e Higgins (1992). Eles também usa-
ram o procedimento de discriminação de
drogas como Lubinski e Thompson fizeram,
e examinaram se relações de equivalência
podem surgir entre os estímulos interocep-
tivos (ativados por drogas) e os estímulos
exteroceptivos. Humanos adultos foram
treinados em discriminações de drogas com
Hiroto Okouchi
166
triazolam (reduzindo auto-relatos de ansie-
dade) e placebo (cápsulas cheias de lactose)
como estímulos modelo, e estímulos visuais
como estímulos de comparação. Quando o
triazolam (A1) foi apresentado, a escolha
de um estímulo visual B1 era a correta, en-
quanto a escolha dos estímulos visuais B2 e
A0 eram incorretas; ou quando escolher um
estímulo visual C1 era a escolha correta e a
escolha dos estímulos visuais C2 e C0 in-
corretas. Da mesma forma, quando o place-
bo (A2) era o modelo, as comparações cor-
retas eram B2 e C2. Após o estabelecimento
das relações condicionais A1B1, A1C1, A2B2,
A2C2 por meio desse treino de discrimi-
nação de drogas, as relações não treinadas
B1C1 e B2C2 emergiam. Estes resultados
demonstram que eventos privados podem
emergir como membros de uma classe equi-
valente, da mesma forma que ocorre com os
estímulos públicos (Sidman & Tailby, 1982)
e, como Lubinski e Thompson mostraram,
fornecem evidências de que os princípios
comportamentais que operam em eventos
públicos funcionam também com os even-
tos privados (Skinner, 1953, pp.257-258).
Outro exemplo relevante para o tema
é um experimento realizado por Okouchi
(2006). Como no experimento de Lubinski
e Thompson, no experimento de Okouchi
respostas a estímulos privados de um in-
divíduo configuravam estímulos modelos
para outro indivíduo. Diferente do experi-
mento de Lubinski e Thompson, no entan-
to, estímulos privados não eram estímulos
interoceptivos mas exteroceptivos, isto é,
estímulos visuais que apenas um indivíduo
de um par de estudantes de graduação po-
dia ver. De acordo com a definição funcio-
nal de eventos privados como eventos que
são diretamente acessíveis a uma só pessoa
(Skinner, 1953, p.257), eventos que ocorrem
fora da pele de uma pessoa podem ser pri-
vados (Rachlin, 2003, chamou esse tipo de
evento privado de Privacidade B e o distin-
guiu da Privacidade A, que são eventos que
ocorrem sob a pele de uma pessoa).
Empregando a definição funcional
de eventos privados, Okouchi (2006) exa-
minou uma das interpretações de Skinner
(1945) de como respostas verbais sob con-
trole de um estímulo privado são estabe-
lecidas: o relato de um estímulo privado
(e.g., dor) pode ser aprendido por meio de
reforços providos por outras pessoas que
inferem o estímulo privado das respostas
públicas colaterais (e.g., a mão no queixo,
expressões faciais, gemidos) ao estímulo.
Oito dos 16 participantes, descritos como
instrutores, aprendiam primeiro discrimi-
nações condicionais BC com os estímulos
B como os modelos e os estímulos C como
comparações. Em seguida, outros oito par-
ticipantes, descritos como aprendizes, fo-
ram expostos a um procedimento de pare-
amento ao modelo modificado em que as
respostas dos aprendizes foram reforçadas
ou punidas não pelas respostas do experi-
mentador, mas pelas respostas dos instru-
tores. As discriminações condicionais AC
deveriam ser estabelecidas para os aprendi-
zes, em que os estímulos modelos As foram
Capítulo X | Eventos Privados
167
apresentados simultaneamente com os es-
tímulos B para que os instrutores pudessem
ver os Bs, mas não os As. De acordo com a
definição funcional de eventos privados, os
estímulos A eram privados para os instru-
tores. Assim, os estímulos modelo As e os
estímulos modelo correlacionados Bs cor-
respondiam, respectivamente, a estímulos
privados e suas respostas públicas colate-
rais na interpretação de Skinner. Okouchi
examinou se os relatos dos aprendizes (Cs)
de seus próprios estímulos (As) seriam es-
tabelecidos pelo reforço diferencial provido
por outras pessoas (os instrutores) que po-
deriam ter acesso apenas aos estímulos co-
laterais (BS) e aos relatos (CS).
No experimento de Okouchi (2006),
dois de oito pares de participantes apre-
sentaram o desempenho previsto, no qual
aprenderam as discriminações condicio-
nais AC dos instrutores que não tinham
acesso aos estímulos A. Posteriormente,
Sonoda e Okouchi (2012) replicaram os re-
sultados de Okouchi utilizando um proce-
dimento modificado. Eles utilizaram es-
tímulos abstratos e um computador, por
exemplo, enquanto Okouchi havia usado
estímulos geométricos, sílabas sem sentido,
e estímulos coloridos e havia controlado a
apresentação no experimento manualmen-
te. Sonoda e Okouchi obtiveram os desem-
penhos esperados de todos os 26 pares de
alunos de graduação.
CONSIDERAÇÕES FINAIS
Talvez, simular o comportamento de
relatar eventos privados por animais não-
-humanos tenha sido uma das realizações
mais significativas de Lubinski e Thomp-
son (1987). Epstein (1981, 1984) insistiu que
as simulações animais, ou modelos experi-
mentais, sintetizando o chamado compor-
tamento humano “complexo” em animais,
poderiam dar insights sobre que tipos de
variáveis constituem alguns desses com-
portamentos “complexos” em seres huma-
nos. Epstein (1984) listou quatro classes
de comportamentos que tinham resistido
a essas análises e, portanto, tinham sido
considerados como “complexos”: (a) com-
portamentos encobertos (“pensamentos”,
“sentimentos” e “imaginações”);(b) com-
portamentos tipicamente humanos (lingua-
gem, comportamentos que são descritos
sob a rubrica do “self”, e o comportamento
de resolução de problemas); (c) os compor-
tamentos controlados por estímulos tempo-
ralmente remotos (“memória”); e (d) novos
comportamentos (“criatividade” e “pensa-
mento produtivo”). Exceto pela classe de
comportamentos encobertos, alguns com-
portamentos de cada uma dessas classes
foram simulados e estudados experimen-
talmente (e.g., Epstein, 1981; Epstein, Lanza,
& Skinner, 1980; Epstein & Skinner, 1981). O
trabalho de Lubinski e Thompson pode ser
considerado um sucesso de uma simulação
animal de comportamentos encobertos ou
eventos privados ( “sentimentos”).
Hiroto Okouchi
168
Como o título do artigo de Lubinski
e Thompson (1987) sugere, duas práticas
que ilustram um modelo de como exami-
nar eventos privados também podem ser
realizações significativas deste trabalho.
Em primeiro lugar, eles mostraram que os
processos de discriminação de drogas po-
dem ser utilizados em experimentos sobre
eventos privados. Uma das dificuldades na
experimentação sobre eventos privados é
a manipulação dos mesmos. Apresenta-
ção e não apresentação de um “sentimen-
to”, por exemplo, não é fácil, ao passo que
apresentações de uma luz colorida têm
sido comumente implementadas em expe-
rimentos comportamentais. O uso de dro-
gas psicoativas seria um dos poucos méto-
dos para manipular sentimentos de forma
relativamente confiável (mas ver Branch,
1991, para uma discussão sobre as dificul-
dades em usar drogas como estímulos dis-
criminativos). Em segundo lugar, Lubinski
e Thompson conduziram um experimen-
to sobre eventos privados no contexto das
interações entre indivíduos. Esta prática é
útil porque, de acordo com a definição fun-
cional de eventos privados (Skinner, 1953,
p.257), se um evento é privado ou não, de-
pende se ele é acessível a outras pessoas ou
não.
PARA SABER MAIS
DeGrandpre, Bickel, & Higgins (1992). Esse
artigo relata um experimento em que even-
tos privados humanos foram manipulados
por meio de drogas psicoativas.
Kohlenberg, & Tsai (1991). Este livro des-
creve como eventos privados, como emo-
ções, memória, cognições e crenças são
conceituados e manejados em uma psicote-
rapia analítico comportamental.
Okouchi (2006). Este artigo mostra como
eventos fora da pele do participante e não
acessíveis a outros participantes, mas a um
experimentador podem contribuir para a
análise experimental dos eventos privados,
e relata um experimento que investigou
uma das interpretações de Skinner (1945)
da maneira em que os humanos aprendem
a relatar eventos privados.
Rachlin (2003). Esse capítulo de livro des-
creve como o behaviorismo teleológico
compreende os eventos privados. O beha-
viorismo teleológico exclui eventos inter-
nos (eventos sob a pele do organismo) de
uma análise do comportamento e busca por
variáveis controladoras do comportamento
de forma ampla no ambiente temporalmen-
te estendido do organismo.
Skinner (1945). Esse é um clássico sobre
eventos privados. Você PRECISA ler se
você estuda eventos privados a partir de
uma perspectiva comportamental.
Sonoda, & Okouchi (2012). Esse artigo rela-
ta experimentos que replicam os resultados
de Okouchi (2006), utilizando um procedi-
mento modificado. No Experimento 2, os
Capítulo X | Eventos Privados
169
aprendizes aprenderam a tatear “eventos
privados” por reforçamento não com 100%
mas com 83,3% de precisão, ilustrando um
análogo de laboratório da vida diária, em
que se entende que os humanos aprendem
a tatear eventos privados sob um esquema
de reforçamento com fraca acurácia (Skin-
ner,1945).
REFERÊNCIAS
Branch, M. N. (1991). Behavioral pharma-
cology. In I. H. Iversen & K. A. Lattal (Eds.),
Experimental analysis of behavior (Part 2,
pp.21-77). Amsterdam: Elsevier.
Catania, A. C. (1992). Learning (3rd ed.).
Englewood Cliffs, NJ: Prentice-Hall.
DeGrandpre, R. J., Bickel, W. K., & Higgins,
S. T. (1992). Emergent equivalence rela-
tions between interoceptive (drug) and ex-
teroceptive (visual) stimuli. Journal of the
Experimental Analysis of Behavior, 58, 9-18.
Epstein, R. (1981). On pigeons and people:
A preliminary look at the columban simula-
tion project. The Behavior Analyst, 4, 43-55.
Epstein, R. (1984). Simulation research in
the analysis of behavior. Behaviorism, 12,
41-59.
Epstein, R., Lanza, R. P., & Skinner, B. F.
(1980). Symbolic communication between
two pigeons (Columba livia domestica). Sci-
ence, 207, 543-545.
Epstein, R., & Skinner, B. F. (1981). The
spontaneous use of memoranda by pigeons.
Behavior Analysis Letters, 1, 241-246.
Ferster, C. B., & Skinner, B. F. (1957). Sched-
ules of reinforcement. New York: Apple-
ton-Century-Crofts.
Honig, W. K. (Ed.). (1966). Operant behav-
ior: Areas of research and application. New
York: Appleton-Century-Crofts.
Honig, W. K., & Staddon, J. E. R. (Eds.).
(1977). Handbook of operant behavior. En-
glewood Cliffs, Prentice-Hall.
Iversen, I. H., & Lattal, K. L. (Eds.). (1991).
Experimental analysis of behavior (Part 1).
Amsterdam: Elsevier.
Kohlenberg, R. J., & Tsai, M. (1991). Func-
tional analytic psychotherapy: Creating
intense and curative therapeutic relation-
ships. New York: Plenum Press.
Leigland, S. (2014). Contingency horizon:
On private events and the analysis of be-
havior. The Behavior Analyst, 37, 13-24.
Lubinski, D., & Thompson, T. (1987). An
animal model of the interpersonal commu-
nication of interoceptive (private) states.
Journal of the Experimental Analysis of Be-
havior, 48, 1-15.
Hiroto Okouchi
170
Lubinski, D., & Thompson, T. (1993). Spe-
cies and individual differences in commu-
nication based on private states. Behavior-
al and Brain Sciences, 16, 627-680.
MacCorquodale, K. (1969). B. F. Skinner’s
verbal behavior: A retrospective apprecia-
tion. Journal of the Experimental Analysis
of Behavior, 12, 831-841.
Madden, G. J. (Ed.). (2013). APA handbook
of behavior analysis (Vol.1). Washington,
DC: American Psychological Association.
Okouchi, H. (2006). An experimental anal-
ysis of another privacy. The Psychological
Record, 56, 245-257.
Rachlin, H. (2003). Privacy. In K. A. Lattal,
& P. N. Chase (Eds.), Behavior theory and
philosophy (pp.187-201). New York: Kluwer
Academic/Plenum Publishers.
Savage-Rumbaugh, E. S. (1984). Verbal be-
havior at a procedural level in the chimpan-
zee. Journal of the Experimental Analysis of
Behavior, 41, 223-250.
Schlinger, H. D. (2011). Introduction: Pri-
vate events in a natural science of behavior.
The Behavior Analyst, 34, 181-184.
Sidman, M., & Tailby, W. (1982). Condition-
al discrimination vs. matching to sample:
An expansion of the testing paradigm. Jour-
nal of the Experimental Analysis of Behav-
ior, 37, 5-22.
Skinner, B. F. (1945). The operational anal-
ysis of psychological terms. Psychological
Review, 52, 270-277.
Skinner, B. F. (1953). Science and human
behavior. New York: Macmillan.
Skinner, B. F. (1957). Verbal behavior. New
York: Appleton-Century-Crofts.
Sonoda, A., & Okouchi, H. (2012). A revised
procedure for analyzing private events. The
Psychological Record, 62, 645-661.
The Oxford English Dictionary (2nd. ed.).
(2004). Oxford: Clarendon Press.
Tourinho, E. Z. (2006). Private stimuli, co-
vert responses, and private events: Con-
ceptual remarks. The Behavior Analyst, 29,
13-31.
Andréia Schmidt
171
“Esse não é um pitilics,
então só pode ser aquele”: o
responder por exclusão e a
aprendizagem de repertórios
verbais
Andréia Schmidt
Universidade de São Paulo
Dixon, L. S. (1977). The nature of control by spoken words over visual stimulus selection. Journal
of the Experimental Analysis of Behavior, 27, 433-442.
“- Mamãe, por que é que eu me chamo Marcelo?
(...) Por que é que não escolheram marmelo?
- Porque marmelo é nome de fruta, menino!
- E a fruta

iw4_experimentos_classicos_v1_2016

Artes

Ferramentas de estudo

Mais conteúdos dessa disciplina