Logo Passei Direto
Buscar

Lívro Noções de Probabilidade e Estatística - Magalhães parte 2 (1)

User badge image

Enviado por Ingrid Waclawiak em

Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original

t68 Capítulo 6: Variáveis Aleatórías Contínuas
ruxilia na atribuição de probabilidades. Assim, paÍa a variável aleatória contínua
X representando a profundidade do lençol de água, a função densidade f é dada)0r
r(,) : { 
tt:', para2}<r<100;
pafar ( 20 our > 100.
Tendo em vista que, nesse exemplo, a função densidade é bastante
;imples, a probabilidade de que a profundidade do lençol esteja em qm dado
rrtcrvalo pode ser calculada com o uso de áreas de figuras planas. Assi\r, para
rbter a probabilidade de uma profundidade pelo menos igual a 25, mas injerior a
,, portanto, P(25 < X < 29) : 4180.
Considerando o caso geral, vamos nos ocupar agora em formalizaÍ as
déias discutidas anteriormente. Faremos isso através da definição apresentada a
eguir.
)efinição 6.1: Função densidade de probabilidade
Dizemos que /(r) é uma função contínua de probabilidade ou função
ensidade de probabilidade para uma variável aleatória contínua X, se satisfaz
tuas condições:
i) Í(r) ) 0, para todo r e ( 
- 
oo, oo);
ii) A área definida por f (r) é igual a 1.
(t. I Introdução
Com o auxílio do cálculo diferencial e integral, podemos caracterizar a
condição ii) através de
r6I f@)dr:1.J--
Da mesma forma, para calcular probabilidades, temos que para a 1 b,
f(r) dr ;
a integral, acima, indica a írea sob a função / definida pelo intervalo [4, b].
Note que, pela forma como atribuímos as probabilidades no caso
contínuo, teremos áreazero sob qualquer valor individual, isto é, P(X: k): O
para qualquer k. Portanto, em se tratando de variáveis aleatórias contínuas, a
probabilidade de ocorrência de um valor isolado é sempre zero e,
consequentemente, as probabilidades calculadas sobre os intervalos
lu,,bl,la,b), (o,b) e (a, b) são as mesmas, para qudisquer valores de a e b.
Exemplo 6.2: Arqueólogos estudaram uma certa região e estabeleceram um
rnodelo teórico para a variável C, comprimento de fósseis da região (em cm).
Suponha que C é uma variável aleatória contínua com a seguinte função
densidade de probabilidade:
tG): se0(c120;
caso contrário.
É imediato observar que /(c) é positiva. Através do gráfico da função,
apresentado a seguir, podemos verificar com auxílio da fórmula da área de
trapézio que
1r3
área sob lk): ao : an x 2o : 1.2
Concluímos que /(c) é efetivamente uma densidade. Tendo em vista a forma
simples de /(c), o cálculo de probabilidades de interesse para esse exemplo
poderá ser feito sem dificuldades através de áreas'
169
P(o<x<b): I-::
{y'*""D
170
Capítulo 6: Variáveis Aleatóriqs &t Introduçao
ë, rssim, temos que P(C < B) : 7lZS. tr
Exemplo 6.3; Num teste educacional com crianças, o tempo para arealização de
Umit bateria de questões de raciocínio verbal e lógico é medido e anotado para ser
€ttttlparado com um modelo teórico. Este teste é utilizado para identificar o
descnvolvimento das crianças e auxiliar a aplicação de medidas corretivas. o
ütodelo teórico considera T, tempo de teste rem minuto,s, como uma variável
alcatória contínua com função densidade de probabilidade dada por:
h(t-+), se8(ú<L0;
h, se10(t<15;
0, caso contrário.
o gráfico da função densidade é apresentado a seguir. Deve ser notado que, pela
tlcrÍ'inição de /(ú), ela se anula parat ( 8 ou ú > 15.
171
[]
1140
A probabilidade de um fóssil, escorhido ao acaso nessa região, ap.comprimento inferior a. s-"- poa" ,", ã"rc"r"a" diretamenteìo granco oadensidade de probabitiauo",.ãrï;;ï figura a seguir:
Í(t):
J (t)
O cálculo da probabilidade envoÌve a soma de duas áreas:
172 Capítulo 6: Variáveis Aleatórias Contínuas
solicitamos ao leitor que verifique que a função /(ú") satisfaz a definiçáo
de densidade. Para calcular P(9 < T < 72), vamos obter a área sob /(Í) no
intervalo (9, 12]:
Segue, sem maiores dificuldades, que P(9 < f < L2): 7116, valor esse obtido
pela soma do trapézio definido no intervalo (9, 10) com o retângulo determinado
pelo intervalo [10, 12] (veja a figura).
Através do uso de integral, essa mesma probabilidade seria calculada da
seguinte forma:
P(e< T<12): ["yçr10,
Jg
: /n"
: 
In"
r12
l(t)dt+ | r(òdt
Jto
t r72q
^rt 
- 
4) dt + J,, *ot
: !(t- 4úì I'o * 1,1"40\2 -")ln'20"1,0
11 6
-_r_B0'20
,7
l
16
(t.l Introdução 173
A aplicação da integral foi dividida em duas partes, pois a função f(t) é diferente
nos intervalos (9,10) e [10,12]. tr
Vamos, agora, apresentar as expressões para valor esperado, mediana,
rnoda e variância no caso contínuo. A interpretação de cada uma dessas grandezas
ó semelhante àquela discutida no caso discreto. Algumas das expressões são
irlteradas devido à nova forma de atribuição de probabilidades.
Definição 6.2: Medidas de posição para varídveis aleatórias contínaas
O valor esperado ou média da variável aleat1tia contínua X, com função
tlensidade dada por Í("),ê' dada pela expressão:
B(x) : ,: I:" f @) d,r.
A mediana é o valor Md qte tem a propriedade de:
P(X > Md) > 0,5 e P(X,( Md) > 0,5'
A moda é o valor Mo tal qu'e,
l@o):maxf(r)'
tr
Observe que a definição de mediana é idêntica ao caso discreto. A média
tcve su4 expressão alterada com a substituição da somatória pela integral e de pi
ltor f (r)d,r.Para a moda, precisamos tomar o máximo da função densidade e,
como antes, ela não é necessariamente única. A notação para o caso contínuo será
iì mesma utilizada para as variáveis aleatórias discretas.
Definição 6.3: Variância para variáveis aleaÍórias contínuas
Para uma variável aleatória x com densidade r @), a variância é dada por
o, : f* {* - 1t)z f (r)dr.
tr
Como no caso discreto, a variância é a medida de dispersão mais utilizada
na prática. Aqui podemos, também, utilizar a expressão alternativa
o2 : E(x2) 
- F2 ,
t74
com E(X 2) sendo calculado como:
Capítulo 6: Variáveis Aleatórias 6,1 Introdução
E(x') : /_i* r@) d,r l::hrá* r)dc:
Itcsultando na equação do 2o. grau:
L c2 l2o
__t
+oo z l*u
, r@): {ÍT!:l/f;, :: ;,=1";l
r l2o
* 
^'l*u: 
o'5'
Vamos determinar a média e a variância de C. Temos,
"2o 7 c t 
-sPo t ct2or: l-"+(7+r\rtr-- 7 "tlto , L "'fro " n( 10 + 1) dc - _!_i_l n *ïl :20 
- 
35 aoo : lo - nTIo:To":T'
Para a variância, calculamos primeiro E(C2):
,t,: ! tl'o * 7 "tl'o 
-4oo4lo ,aoslo : 
,,
, fttt
i,no
ob: E(C'\ ' 500 235\2 275' ) - t-t- : ì-- ( r,) : ï :30,56cm2.
Logo, o desvio padrão é oc _ /fifi: b,5J cm.A moda segue diretamente do gráfico da futer a mediana nôrqmnc ;-:^:^r---,-. tnção-densidade e é igual a 20,iilffi ïï,ïïltlïï":*l:::J::':iiïïi";irï'ïffi l'ilã:","ilïïi,io',ï;lJli:ï ï ï,ï, iï :ï.:ï,ïl:',':: 
-": 
;;*;; ;ï; ï Ïï :ffi ; ïiil" ï:ïltu I c r r ct e r a c o rr d i ç ã o d a d e ri n i ç ao o 
" 
Á"àì.ï 
", 
uï r;;:", J":, ;ïn"** :,
Md2+2oMd-4oo:0,
ctr.ia solução é Md : 12,36 (o outro valor é abandonado por ser negativo). tr
As propriedades do valor esperado e da variância apresentadas para
vtrriáveis aleatórias discretas permanecem válidas e a verificação pode ser feita
alravés das propriedades da integral. A distribuição conjunta de duas ou mais
vuriáveis aleatórias contínuâs é definida através da função densidade conjunta de
prubabilidade. As idéias básicas são as mesmas do caso discreto, porém requerem
ttttt melhor conhecimento de cálculo diferencial e integral, envolvendo integrais
dtrplas. Não desenvolveremos esse tópico e recòmendamos ao leitor interessado a
eonsulta às referências.
l,lxcrcícios da Seção 6.1:
l. Verifique se as expressões a seguir são funções densidade de probabilidade
(assuma que elas se anulam fora dos intervalos especificados).
*f(r)-3r, se 0( r1L.t--'''
lr. /(r) : r2/2, r ) 0. ,. '
c. Í(r) : (r 
- 
3)12, 3 S r S {-/?/
d. f (r) :2,0 I r z-2. l-/
Lf@)- 
-rj se-7r<z<0.
2. o tempo, em minutos, de digitação de um texto por secretárias experientes é
rurna variável aleatória contínua X. Sua densidade é apresentada a seguir.
se0 ( r 12;
se2(r<6:
caso contrário.
E(c'): f'0",frf fi*r1
:1oo* T:T
ErrlÍio,
{!t
o desvio padrão é' a raiz quadrada..da variância e, como já menci
lÏ1,ïiiï1ïã1'J;:"#3#'#ì:uniaaaËJ".n"aioud";;;l;;"i'oiiËnu,,{u"n
Exemplo 6'4: A variâver c apresentada no Exemp ro 6.2tinha a ..gui7ì" rdensidade: r,v L^vrilpru t).2 Unna , 
,( t." t("): { tf, +r1, se o( c12o;I O, câso contrário.
P(C>Md):s,5. ï(r):
'.qlll!.F
176
Determine:
(ltpltttlo ô: VuricÍveis Alecttórius CctntínuaE
e{auaupoì:
I
a. P(X > J).{,,.. 
. 
t
b. p(l. ;ç < 4).'
c.P(X <BlX>r)., -
d. Um número b tal que,F(y s b): 0,6!_e. o vator esperado, à variância 
" 
árn"a;d" X. L \3' A quantia gasra anuarmenre, em mirhões g" r.1i:, na manurençao oo ugr)tro.rnuma cidade do inrerior e r"pr"r"ntJãi""tu uuriau"r I, com densidad/ar.r, ,.^",
ffu):{i,-t, se 0,5{yq2.( U, caso contrário.
Obtenha:
a. P(y < 0,8).
b. P(Y > 1,51I'> 1).
c. O valor esperado e a variância de )..d. A medianadey.
4' o grrifico abaixo representa a densidade de uma variáver areatória x.
a. Obtenha o valor a" ol " ,/. ..,..,.Ir.I)ctcr.min? p(X > 0l-r. s).'
tr. C"'irlcute A4d(X), E(X) e Vor(X)
ã.2 Príncipais Modelos Contínuos
5. Numa certa região, fósseis de pequenos animais são freqüentemente
encontrados e um arqueólogo estabeleceu o seguinte modelo de probabilidade
para o comprimento, em centímetros, desses fósseis.
41 r 18:
8(z(10;
10(r(11;
( h",
Í(*):J i" * *'
[ il,'
a. Faça um gráfico da função densidadé; ''-
b. Para um fóssil encontrado nessa região, determine a probabilidade do
comprimento ser inferior a 6 centímetros? E de ser superioi a 5 mas inferigr
a 10,5 cm? (
c. Encontre o valor esperado para o comprirnento dos fósseis da região.
6.2 Principais Modelos Contínuos
Apresentamos, nesta seção, os principais modelos teóricos para variáveis
ttlcatórias contínuas. Vimos que, para caracterizar completamente uma variável
ttlcatória contínua, precisamos fornecer sua função denìidade de probabilidade
11rrc, segundo sua definição, é uma função positiva e com integral iguãt a t.
DcfiniçQo 6.4: Modelo Uniforme Contínuo
uma variável aleatória x tem distribuição (Iniforme contínua no
irrtcrvalo fa,bl, a < b, se sua função densidade de próbabilioáoe o dada por:
caso contrário.
a1r1
caso contrário.
f (") :{ b-a'
0,
Usaremos a notação X 
- 
[J[a,b] para
t lrriforme Contínuo no intervalo considerado.
queXsegueomodelo
Note que não há restrição de valores paÍa cL e b, exceto o fato de a < b. A
f rigura 6.I mostra a densidade do modelo U[a,b], para a)b > 0. tr
t78 Capítulo 6: Variáveis Aleatórias
Figura 6.7: Densidade Ilnifurme Contínua.
o modelo uniforme pressupõe que os valores possíveis para a variál
aleatória têm todos a mesma probabilidade de ocorrência. seu válor esperado
sua variância são obtidos através do cálculo de integrais, de tal forma que:
f---_.
b2+ab+a2
-t
e}
logo,
b2+ab+a2
o2 : E(xz) 
- 
p, :
-(+)'
Exemplo ó.5.' com o objetivo de verificar a resistência à pressão de água, oi
técnicos de qualidade de uma empresa inspecionam os tubos ãe pvc produzidos
os tubos inspecionados têm 6 metros de comprimento e são submetidos a
pressões até, o aparecimento do primeiro vazamento, cuja distância a uma dag
extremidades (fixada à priori) é anotada para fins de análise posterior. Escolhe-se
um tubo ao acaso para ser inspecionado. Queremos calcular a probabilidade de
que o vazamento esteja, no máximo, a I metro das extremidades.
vamos denotar por x a variável areatória que indica a distâncie
correspondente ao vazamento. Admitindo igual probabilidade de ocorrência em
"-!
ô,2 Principais Modelos Contínuos 179
torlos os pontos, temos que X - U[0,6], com função densidade de probabilidade
clncla por
r@) : {',3; lï,ï=*ï,ã.1;
Para calcular a probabilidade de X e {[0,1]U [5,6]], podemos obter as
drças dos dois retângulos hachuriados na figura a seguir.
l@)
segrrc, sem maiores dificuldades, que a probabilidade desejadaê 113.
Esse mesmo cálculo poderia ser feito através de integrais da seguinte
P(x e {[0,1] u [5,6]]) :
Note que os intervaloj [0, 1] e [5,6] são disjuntos e, portanto, a
P(0<x<1)+P(5<x<6)
l"'*0. * l,"uo.
rrl r16
_l 
-L 
-l6lo' 6ls
1651
6-o+6-6:5'
plob.rbilidade
iltlcrvalo.
áu ,uu uniáo é, ffsoma das piobabilidades de ocorrência de cada;[iElf\
/l
tr
Definição 6.5: fuIodelo Exponencial
Uma variável aleatória contínua X,segue o modelo Exponencial 
"o_ 
puram.tro ,
180
A densidade está
X 
- 
Exp(a) para
Capítulo 6: Varitiveis Alecttórias
o
assumindo valores não) 0 se sua densidade é) 0:
negati
representada graficamente na Figura 6.2 e adotaremos a notÉindicar que X tem distribuiçã" ËÇ;;;;ju, o" parâmerro c.
r@): f ae-o*, rI o, 
",
caso contrário.
Fígura 6.2 : Densídade Exponencial.
Í(x)
. 
para calcular probabilidades com aintegrll correspondente, jâ qu" não-t".1ïo.
exenrplos considerados até aqui. arri., -'^'
Exponencial, precisamos resolver g
as figuras geométricas simples doJ
Note que a inclusão
acirna.
Para obter a
;rnrÍos, porém, não
P(n < X < b) : 
-[,," 
oe-.,:I;dr : 
- 
"-a:t:1rt 
: s-ítn, * 
"-art
ou não dos extremos a e ó não altera o cálculo efetuado
média e a variância,
véìmos fazer esse
6,2 I'rincipais Modelos Contínuos t81
êxprcssões finais. Temos, para X - Exp(a),
F:Ila e o2:I/az.
Exe ntplo 6.6: IJma indústria fabrica lâmpadas especiais que ficam em operação
efiptinuamente. A empresa oferece a seus clientes a garantia de reposição, caso a
lâlnpada dure menos de 50 horas. A vida útil dessas lâmpadas é modelada através
drr clistribuição Exponencial com parâmetro 1/8000. Determine a proporção de
trucas por defeito de fabricação.
' Cada lâmpada terá seu tempo de duração definido pela particular
feirlização da variável aleatória. Isto é, a vida útil da lâmpada pode ser pensada
ç(JlÌìo um valor escolhido de acordo com a densidade Exponencial de parâmetro
l/t1000. Representemos, pela variável aleatória T, o tempo de vida da lâmpada, e
assirn 7 
- 
Exp(I18000). A probabilidade desejada será
P(T <50) : /t'#"- #'dt- 1 - s-*s : 0,006.
l)ussa forma, a proporção de trocas por defeito de fabricação será de
nlrloximadamente 0,67o. Esse número é relativamente pequeno, o que não ê,
lfprpresa, tendo em vista que, como o parâmetro é a:1/8000, a duração média
drrs lâmpadas é Lr - If a':8000 horas. tr
A distribuição Exponencial tem sido amplamente utilizada nas áreas de
l'Ísicn, engenharia, computação e biologia, entre outras. Variáveis como a vida útil
dc equipamentos, tempos de falha, tempos de sobrevivência de espécies e
irrlcrvalos entre solicitações de recursos são algumas das quantidades que têm
sitlo modeladas, com bons resultados, pela Exponencial. Essa densidade tem,
nincla, a vantagem de ter propriedades matemáticas interessantes, conforme
' 
;:,:;;:ïïïï"ïïïÏ ;","0", em minuto s, entre emi s sões c onsecurivas de
rurra fonte radioativa é uma variável aleatória com distribuição Exponencial de
lrrrrâmetro a : 0,2. Vamos calcular a probabilidade de haver uma emissão em um
irrtcrvalo inferior a 2 minutos. Temos,
n2
P(x <D: 
Jno,z"-}'2:r 4*: - s-012t:13 = - "-0'a + 1 :0,33.
Calculemosl ugoro, a probabilidade do intervalo ser superior ou igual a 7,
sirbencJo-se que ele é superior ou igual a 5 minutos.
será necessário aplicar a integração por
catculo e, apenas, apresentamos os
182
P(x > Tlx > s1 : P(x 2 7, x > s)
r1x 2 s)
ïi0,2 
"-o'2t: 4,=Êì--J;0,2s-0,2t: 4,
P(x>t+slx)s): P(x>ú*s,x).çì
_ 
__l
P(X > s)
L'tt1tÍtttItt ô; Vuriúveitt AIeutórias
_P(x>7)
--+ P(x>st -
.Ïtï"q e-o''d,r
-7õ--
J" ae-''"4,
_ - 
r-"'ln._ e-a(i+")
-a-ôzl& - 
-
. 
- 1." e-4"
:0,67 
.
e-1'4:-
e-7por ou,.o lado' p(x > 2) pode ser carcurada pero comprementarP(x < 2)' resurtando em 0,62. N"í";r;;
iguardade J"*Jü,"res, sugere quP(x > 7lx > 5): P(x >2).
como veremos' adiante, isto não foi coincidêlcia mas sim uma importarpropriedade da densidaj" 9_n"í.r.ïrn palavras, a inforrntervalo é maior ou iguar a s, iaz";;;;";ï,,1Í:ïïl1t:,i ,inrormaÇão de quoI 7 possa ,". 
"ul"ulon 
A AtrqvÁo ,:^ --,-l .a probabilidade dele ser maior ou io'
i{:i y= ::l;'lrrffií,*l",mn ïili;f ;ï=ï,",:'itempo que devemos considerar puru 
.ur*iur a probabiridade àesejada.
_ 
A característica de permitir a hanslrìaãn Ã^ ^-.,-'--
:':!,#1iïi^!n:,:;z:í:;:i:j:,,:t,it,:'xïï.,:i,""ïïï;:JÍ:ïi",
propriedade, 
";;í;;;" verificc-^" - ^^__,1 
única distribuição conrínua com erpropriedade, conforme verit."-^"';::j..,' urtrca olstnbuição contínua com el
temos que Le verificamos a seguir. p"." ,"r, .".i"",ïï "Erpç*)e s, r )
_p(X>ú+s)
- PrxEì)-
:e-at:p(X>t).
t^uP:ldo que X represenra o tempo de vidzseguinte'int"ror"ïu" ão nar^ 4 6r^6-: ,t 9" u3 equipamento, podemogl'azer a seguinte int 
--rrvuv'r. 
" ""tï:.-YloÍ 9" um equipamento, podemogp.ouauiriJaãe;; 
"*,ïlfijïï:"r,l"ii^l,jï1,'hoide da rãïiã' o" memória: aprobabilidade do equ' 
--5*v rqr4 4 Pr'opfledade da falta de memória: al';;;' ïili ;ïï:iffi;ïj:fiï ff' :Jï::'* "," á,, ;r;i;" ï"ï, ;1:::, j' é iguat a i,',iu"uirlì;;ï í;""Ï:'"' t + s anos, sabendo-se qu" jáitnos' Em oú.u. puluurur. 
" 
;r*.-*ï:"::'llÏ:"to novo durar pelo rn*or'jii]_".' P3 outras palavras, a informaça- "YurParrÌento novo durar pelo meìos-úcsquecida 
" 
; q*'iÃoor,u, Dara o .Áta,tn 1l_:ll3::.do equipam"ì. p"J"-i,il:ffii]# Sue.imnorta, para o "arc"r" aÏi.ffi;'.ff"::ï1qucremos que dure. uantos anos a mais
6,2 Principais Modelos Contínuos
Dentre todos os modelos teóricos, sejam contínuos ou discretos, o mais
lmportante é o modelo Normal. Ele é muito utilizado èm aplicações e também
Eerve como aproximação para muitas outras distribuições.
Dcfinição 6.6: Modelo Normal
Dizemos que uma variável aleatória contínua X tem distribuição Normal
corn parâmetros p e 02, se sua função densidade é dada por:
f(n):+"- ,r'"P lpata -oo<r<oo.o1/2r
Usaremos a notação X 
- 
N (p,a2), para indicar que X tem distribuição Normal
corn parâmetros p e o2. A densidade é representada na Figura 6.3. !
Algumas propriedades da densidade da Normal podem ser, facilmente,
observadas de seu gráfico:
1) f @) é simétrica em relação à p;
ii) /(r)+ 0 quando r-r* oo ;
iii) o valor máximo de f (r) se dá para r : F.
r83
pl
,, 
Otfuro 6.3: Densidade Normsl-
Pode-se ainda verificar que os parâmetros
rcspectivamente, 
.a média e a variância da distribuição.
p--g--o' 
_tepre s ent am,
A demonstração requer
IEl
fnpftub 6; Vrtridvri,y Alertttjrius Ct
,.;ï+:i:=Ï:'fiiÏ*ì.l,ï ïl,',fj n:, oo r:i,?: interessado poue consu rrarimediatame n^T1i," ilo I : , 
" 
,rrer) : :;:o'tomos que x^- u ç1"-'oi\','r'),Nü;ïffiriáveis"";;,r;_
a rnregratda função densidade n;;;##;re inreresse, isro é,
P(o<y<b): [" | 
-u-,2: ",/ 
- J";ãe--Èf dr.
Entretanto, a integral acima só pode seriï:ïï::ïïi:*i;j*:t"i:í:ïïi::ffi ;[;x:J;# jïi,ï:,il:ï: jcaÌculadas com o ur*ifioï"_r#.; ï#oabitidades para o rnod"lo fVorÃojde tabelas para cada õ;ffiï::7ï:,""it]r a multiplicação o"rn"."i*conduz sempre 
"" "u,fïï"0:""i'."^T^'"Íf 
,,o,2), utitìz-r" ;;;';ânsrormacãn:^o1d.u, sempre uo 
",-i---- 
-" Yqru(ç' \l't, o,'), utiliza-se uma transformuçao(0, 1 ), r'i"'e,ïJr, ;ïïi:ri:,probabi lidaa"' .o'-u'"u ïïnrï., de parâmr
Considere y 
- 
NQJ,o27 e defina umâ nô\,Õ ì.^_j:propriedades do valor esperado e da variânc:ìlma 
nova variâvel z : Il
L 11a, segue que oE(z) :4! - u' 7;:): it6 - t) = lwet - r"l: o;
var(Z)-Vor(X-F\- !rr^-,u 
, 1. o, - --;v crr\-X. _ p) =,!_Var(X) : 1.
P(o < X < b) 
- 
p@ 
_ p < x__ p 1 b _ u)
_ora-lt aX_t" 
-b_1",-rl o o .____)
Pode-se ainda verificar orrê oo". ,-^-L oz
ï;;;*ï",;r;i,:ji'í":ij:::f iii'",,:*iï:lï"qffi ffij;1"i:ï::ïprocedemos r;;;*J;"#iri;Para determinu' u p.àluu-i'riãïilï: i :'t:,
e,portanto,quaisquer ' o 
jzì-;
para obter nroh"n;r;.r.f-11e-sejam gs vaÌores de pt e o, utiliztpara obter probabiìid: r --Jq'rr vo vcrurcs o:_1" 
" 
o, utilizamos a Normal
os 
'or^_^^ _-,_d., :o,T 
a distribuição Normal.os vatores para p(o 2-;":":ï:iït3,.
:e A. Com a simetrià A" a""",ir",r: íy .i" apresentados em tabelaâ";:Íi;:*;innlrtr;Í:ìl#.:*:#ï:i:ï,ï,::i"Hï#,ï::prúabilidades em outros inr..uuú* ïoà" r\ormal podemos calcular *r".", ,probabilidade de estar acima (ou abaixoì ,?:"":":tTïria também i-pli;;;;,probabilidade de esta vqrws' 't\ore que a simetrisem,.,rê Ìì,- nrí*^,- Lr acrma (ou abaixo) de zero é o ié 0,5. Como probàbitiaadesempre um número entre 0 e 1,; ra;;ü.ffi;i:ï;rïfJi}r#l
H
por exemplo , pa,ra x- ,,t,Ò], remosi'r-i
/'(? < x < 5) : pç?:3 
. 
x 
-r. 5- 2,
\/g t/g - -gl:P(o < z <1):0,3413;
eorrcspondendo à área sombreada no gráfico:
é, 2 I' r'i t t t: i puis M ode los Cott I frr r.to.ç
Para obter 
-P(0 < X < 2), usamos
5srgu ir):
185
1
a simetria da Normal (ver figura a
I
P(o < x < 2):p19: 3 < z <Çl : p(_2/J < z < o)
:p(0<Z<2/J):0,2486.
7', 186 /\ I
L
i, Jr'I r''
Cup Ítu lo ô ; Vl1 yi1lyt6, i,1 A I ett Ítí riu;t
apresentar tempo dã
il
t
t
l:
I
í, n'., ( |
""s"ti,J,"li;ï"1Ï* :i',:?' as. probabilidades de intervâlos comrecurs o imporranre 
" " 
:: 
"t:ï:jl^",id,e 
n tes. 
.i 
n teruot o. n o 0".ì"' ï"r,,, *recu rs o i mp orran re n o u s o a u t aa 
"r 
i i. affi ï, # iï ;ïïï:ï iïìï Ëï; ."#P(X>s):pçX-tr,3-2,
-/ q 3 ):P(Z>1/3)
.r, i :0,5_p(0 Szq7,
A rabera tu,,'ue- 
^^r" :: ì- 
' 
.t' 
: 0'5 
- 
0'7293 :0'3707'
cerra probabiria"aa lPét 
pode ser utilizada 
13^s1nti{o inverso, isro é, dado u
I", : : o, 
" 
;" ï (ï:, iï ;.5?;, ?;"1ïffi j: íï1.:ïi "."_o r o, qu i
iJ;'ro:1i1,,110,"_qu" rà,, se aproxima de 0.4 é o ?oo7. ^^__., p: ou^ tobËËserá o uutora"ll-'rorò òe aproxrma de 0,4 é 0,3997; 
""rr"r;;;ã;J;"tï:rïSuponha, ar
lï jËt:"ffi :ï:xï,;i;Ëïïï#lï:fi 
'lfr 
,;::,:Áí^ìP^,:,
probabiridade 0,8. pera. simet); ;,"íu";ï;ï fï,Ji: ïJ*ç2, g,$, ,m:Xï::;:::^::,''l^:i::"':;;;ilï:o,uìì0"*;:';:-0,84Exemplo ó.8.. Doente" cnfro-r^ r "'vÌ wPurtanto d: -0184,traram-ento;";;;,;ïr":, sofrendo o" 
":11u molésria, são submetidos a ua" 
-!o-i'"ï'ÏJ::ï;H;:ïtË*ï::ï .' 
'""a"r'"aã"il,. uïu ì*,idade Normc
P(x>rT):11x-15
' \/4- 77- 51/4"J -) P (
A.probabilidade de ur 
"\uct'- (( u'< è <' 4 )
)nor a 20 dias ..'u n",lp-1ïenre, escoÌhii,ioÁí13ír!;,,u,cura inferior a20 dias;;;;;Ë;
P(x <,20) : e(4 - ts. 2o - 151 
_ D/,7
' v4 rt / ,,:\z < 2,5): 0,993g.
uma questão interessanre seria saber o ,!riJ*:r;:ô- i
:|:ï1".'"çã". de 25vo ao' p*i"n-,;'ï ïï:^ï.t"":l: máximo necessário paro &
'itc 
ien tes é i nrerpreradu^'.o-Àï'ï ;"tdf,i,:ï. ïj.;'"ff 'u o "on,un,o aJ'*cnc'rcamente escorhido. Assim, p.*iJ",ï", obter umìaro. r iar oïï:" ;";;;;
")-r\z>t):0Ã582.bo,;P-' u---'r 1
olhiãË Áo à"t^'"In' 
-^-:^^ -
1)Z
Pt ittripuis Modelos Contínuos 187
P(X < t) :0,25,
,(#.'#):p(z<
€etrr ,r uso da tabela (e alguma reflexão) obtemos
t-15
-A:-0,67)t:13,66.
il-u],#=ã
ffi ffi
ffi' 1N
t-L5
._
Jt ) : 0,25.
r ,il 0r
,)''"
Çorrclrrírnos, então, informando que 25% dos pacientes ficarão curados antes de,
êpLox irnadamente, 14 dias.
. 
considere agora que r00 pacientes são escolhidos ao acaso, quar seria oõtlnrcru esperado de doentes óurados em menos de rr dias? obtemos,
lf,icirrlrnente, a probabilidade de um paciente genérico ser curado em menos de I Idl's. lirn seguida, essa probabilidade é interpietaau.o-à prú"ìça" de pacientes
ãiliil ::',o em menos de 11 dias e é multiplicada por lOopaia óbter a resposta.I t'lllos,
P(X<rr;:r( 11- 15, n.'t'' ",'1 ' jL 'ìt 
-, 
) : P(z < -2) :0,0228.
Errtii., para 100 pacientes, o número esperado com tempo de cura inferior a
tlirrs será de 100 x O,0Z2B 
- 
2 pacientes.
x-75
v4
ll
tr
Na Tabela 6.1 apresentamos as expressões
da média e da variância para
us rrrodelos contínuos estudados até aqui.
Tabela 6.1: Modelos contínuos - vsror esperado e variâncía.
,lv-
/88
Cultítulo 6: Varidveis Aleatórias
P ri t r c ipais M odelo s Contínuos
lnnrnial, melhor será a aproximação. Nos casos em que certa assimetria estiver
te, valores crescentes de n fornecerão melhores resultados.
Densidade de
Freqüência
Figura 6,4: Aproximação Normal para o Modelo Binomíal.
Para melhorar a aproximação, alguns autores introduzem a correção de
corltinuidade no cálculo com a Normal. Esse mecanismo consiste em alterar de
0,5 unidade o valor com que se deseja calcular a probabilidade. A alteração para
tuitis ou para menos depende, respectivamente, da probabilidade desejada excluir
ou incluir a igualdade ao valor desejado. Por exemplo, teríamos,
P(X > 50) 
- 
P(Y > 50,5) 
= 
P(Z > ) :0,9292.
Note que, com relação a Y e Z, é indiferente se a desigualdade inclui ou não o
sinal de igual.
Para calcular a igualdade a um valor, digamos X : 50, criamos um
intcrvalo artificial, pois com variáveis contínuas essa probabilidade seria zero.
189
::: r: fl.'; :ï'1,:',":?, ilïïïj;.:ï: ::'.'"" i mp ortan re s em Es tarís ti ca M
;"ï,i""1ï:ïiïi:,,ïq"""'à''ï''HJ'ïï-iiJ;,ïï"ffi il';"rï:H';;i
se refere à c,,o ,,,,,1ï:: da média. Uma outra razão daimnorÍÂn^i. r^ rÌ_se_refere à sua util' ""'"::l:u razãoda importânciad;No;
próximo 
"*;;;;, ï"ffi:XïffÏï,,fi|fà'*ação para outras 
- 
disrribuições.
Exemnln tÇ o, ,.-t-_:- ara aproximar o modelo Bin;;;.lxeryrto 6.9.' Estudo do sindicato oo, n-.n;;:;; :,ooelo 
smomial'
Fïï'ï:.',ï:*:'#:if ï#ffi 
" 
j#l':ï'ï,ï**fi :,"":il:í:;
menos 50 com 
"rru 
ào"nçu ? 's' Qual seria a probabilidaJ" ã";
Admitindo o,ro 
"."oo ho-^:_i_
i:r:Ëii:$ìrnrïïËrlJr*i'ï', trï*#ïïï:ï:rïïï
;lï:#,Tlt":*'ilï*l" r":ï Ë.'r'":ï ub1,:,i?que conra o número torar r;ifffrliil""ï""ülâ:::;;;;;;;;Jï:::;;:ï,ïff :ï::;üïiï:r:
1,ffïJ[i:,i,ïil,ï;J,i']i1ïH"l ã f#ï,ï"11;"'::i,?fi; indicando que a so,uçãodada pela distribuição N;;;d ; ##X; sera u'e484; indicando que a soluçãohistograma d" Bi;;iul e a densirran. n. 
^1oi1"l' 
Na.Figura 6.4, representamos ohistograma da Binãmiar 
" "ï""rrãÌ;ï';""ï'"""e1' 
Na Figura 6.4, representamoì obaseúa no r"or",ãu ôentral do Lïmite ,,,''1o*l_:1r.!zaaa,1a aproxìmaçã";;;;baseada no Teorema ; 
* 
- 
_ uwrròrudue oa lormaÌ utili
flo Canírrrt^ ? E* _ Central do Lïmite, um impo.tanie
P(x>50):f1zoo\
'tãn\ n )o'sro'7200-t'
P(x >5o) 
- 
P(Y > 4s,s) : P(z > W, : o,e4l4;
50,5 
- 
60
----------
\/ 42
n o c apíru r o 7 . Em g"'ur, q, *ì'ilï : ffi ,'ftïnï"r;"ïi r:: ilHf,ïffi :ï ;
FT çap#ulo 6: Vartdvels Alearárlas t9l
Assim,
P(X :50) 
- 
p(4g,5< f < 50,5)
- 
p150,5 - 60 
-'/42ì
3^:r1::,". exaro da probabilidade fornece oa qualidade da aproximaçao.
v _ 49,5_60.
' > 
-õ-) :0,0182.
valor 0,0190; mostrando,
Note como o histograma se aproxima de um modelo simétrico e em lbrma
Élrro (semelhante ao modelo Normal) à medida que caminhamos da esquerdo
ir direita (valores crescentes de n). Pode também ser notado que a
tvcrgência será mais râpida em situações em que a distribuição Binornial é'
Ëpftrxirnitclitmente simétrica, o que ocorre para valores de p próximos a 112. '
' Uma propriedade muito importante do modelo Normal, cuja
CCtttotrstração será omitida, é aquela que garante que qualquer combinação lineAr
de virriírveis Normais independentes, também, terâ distribuição Normal, Em
€gtlrrs palavras, se X1 , Xz, .. ., X, formam uma seqüência de variáveis aleatóriaS
N(tt,,r?) independentes è atta2,...,a,,, são constantes quaisquer, então
g,r . fouxuterá distribuição Normal. Seus parâmetros são determinados a partir
i=L
dns propriedades do valor esperado e da variância, ou seja,
'\tr 'n rL n,p*: E(DarXr):\n@rxr ) : Don E(Xn):Lorlu;i--r i:l i:l i--L
oï : V"r(Do;Xr, ) : \var(arXr ) : \alvar(Xr) : l"l ol,i:L i.:l i.:l i:l
liste resultado amplia, consideravelmente, o uso da Normal em várias sitUnçõeU,
conforme pode ser notado nos exemplos a seguir.
Iìxemplo 6.10: rJm serviço de fiscalização é criado para averiguar se garrafm de
u,r", 
""ito refrigerante 
contém, de fato, o volume especificado pelo fabricante. Parn
tanto, 10 gariafas do produto são compradas no varejo, em várias regiões dn
cidade. Cada uma dessas garrafas é esvaziada e o volume de seu conteúdo, que
denotaremos por I/, é aferido. Uma vez obtidos os 10 valores, a média aritmética
M é calculada e, se M < 290 mililitros (ml), a companhia é multada. Estudos na
linha de produção do fabricante mostraram que variações sempre ocorrem' rnesmo
," os 
"rp""ificações 
forem seguidas. Por essa tazáo, considera-se o volume dO
conteúdó das garrafas como seguindo um modelo Normal, com média P : 300 ml
e desvio-padrão o:25 ml. Gostaríamos de calcular qual é a probabilidade de
que o fabricante seja multado injustamente?
A multa será injusta se, apesar de dentro das especificações, o valor de M
for abaixo de 290 ml. Observe que isto pode ocorrer devido ànattreza aleatória
do enchimento das garrafas.
Como ilust
ïÌïïrïït*::ïïx';i;;ïïJ;'rïïïiii:íf r::ïï,",Í;'.,rrlvator de n ;.;,.i;ï; temos assim p iguat a 0,2.;0,j 
" 
õ; ;.,ioo o" cada linharumentado, tomando os valores ro, sóÍil,roo
P=0.3,n 
=10r[fl 'Àï'='
o'4l]Fn. Jl][
p=0.5,n=100
Â
p=0.2,n 
=tO p=0.2,n 
=30
p=0.2,n=100
p=0.5,n=10
P=0.5,n 
=30
Figura 6.5: Histogramas para valores simulados da Binomíal
''qItF
t92
Denotando por uo volume da z-ésima ganadaa ser aferida e suque o fabricanre esreja denrro das especificaço"i ;;;ìr]ã.ü 
_ weoo,'i : 7,... 
, 10. A média aritmética U-ãáá'Aupo,
nt:YJ-"+Vo 1-- 1:ro%+...+ruro,
que coffesponde a u.ma. combinação linear com ai :assumindo ìndependência entre as variávels aleatóriasqueM 
- 
N(pu,o2nn), com
10 10
t-LM : D"ur: à#ros : Boo;i:7
10
o3,r:Ë"i"r: Ë(#)'rrr:
P(mutta) : p(M < 290) : o(, - ro, 
-' \ otr /t/n -
: P(z < 
-r,26): o,1o3g.
Portanto, a probabilidade de que a empresa seja multada, indevidamente, será de,aproximadamente, I0 Vo. " "vJs 'rqrrcu.' ,ruçvr 
tr
iïJ#íJ",i ;í j;, H.ï:"" ï;:ï":: j:::11, r,J.':' n a Ì o r s a de var ore s e u til i za u mmodelo probabilístico para avaliar ,"r, l*'"o rrc Duròil ue valores e utili
comnrâ ê vcnrìe qi;6È^^ t-^^ . 
-ucros. 
Suas aplicações financei
:"i::ï":""n1 ï*:ï il9: áre as : a gri c u il;"il;;' ;ï *ffi:' :ïlïï1ïï'" Í:ffi:ïï ï#""i:lo representu o "o-portamenro do lucro di u;ïï ". 
":.:ilï,1ï:rnilhares de reais):
Cnpftulo 6: VtrlrÍvels Aletttórittt C,
If I0, para todo z.
V,i=1,...,10,
252
10'
Logo,
290 
- 
300\
I
25/\/n )
L:2Let-5Lr*BLc,
com 24, L1 e Ls representando, respectivamente, os lucros diários nos setores deagricultura, indústria e comércio. As distriúçr";;" o'rãf"olioude dessasvariáveis aleatórias são fe - N(3, 4), ir- lr(0,9) 
" 
t.l-nrça, 16). supondo
llï,ï],ï'S?ï*,ii,r" os rrês setor"r,'qíu-.".á a probabilioãae àe um lucro diário
'!ÇtF
P t i u t' i 1 tt t i,t M r x I t I tt:t Con! ít t ttt t,r
confbrme mencionado, a variável -L, sendo uma combinação linear
ruis inclependentes, segue distribuição Normal com parâmetros dados por:
" 
-2x3*5x6*3x4:48:;Itr 
- 
.
^2 
- 
22 x 4*52 x 9+32 x 16 : 385'uL-o 
^ïIv ^r I 
u
t L 
- 
N(48, 385) e, portanto,
P(L>bo) : P(z > 4ff) : P(z > o,1o) :0,4602;
' /385 '
clnclo uma alta probabilidade de lucros superiores a 50 mil'
Ercrcícios da Seção 6.2:
1, Sr:rrdo X - Ul\,4l, calcule
n. P(X > 2).
b. P(x > 2).
c.P(1 <X<2).
d.P(l <X<2lX<3).
c.P(X <311<X<2).
2. Admite-se que uma pane pode ocorrer em qualquer ponto de uma rede elétrica
cle 10 quilômetros.
a. euai é a probabilidade da pane ocorrer nos primeiros 500 metros? E de
ocorrer nos 3 quilômetros centrais da rede? , ,""
5. O custo de reparo da rede depende da distância do centro de
serviço aó-loóal
da pane. Considere que o centro de serviço está na origem da rede e que o
cusìo é de R$ 200 para distâncias até 3 quilômetros, de R$ 400 entre 3 e 8 e
de R$1.000 para as distâncias acima de 8 quilômetros. Qual é o custo
médio do conserto?
.ì, O tempo necessário para um medicamento contra dor fazer efeito foi modelado
de acordo com a dãnsidade Uniforme no intervalo de 5 a 15 (em minutos),
tendo por base experimentos conduzidos em animais' Um paciente' que esteja
sofrendo dor, reCebe o remédio e, supondo válido o modelo mencionado
acima, pergunta-se a probabilidade da dor :
a. Cessar em até 10 minutos?
b. Demorar pelo menos 12 minutos?
c. Durar mais de 7 minutos, sabendo-se que durou menos de 10?
de
tr
5. Sendo X 
- 
Exp(I), derermine:
a.P(0<X<2).
b. P(x < 2).
c.P( I<X<4).
d. P(x > 3).
e. P(X < 2lX > r).
7. Seja X- N(4,1). Derermine:
a. P(X < 4).b.P(4<X<5).
c.P(2<x<5).
d.P(5<X<7).
e. P(X < 1).
f.P(0<x<2\,
t-
8. Para X- N(90,100), obtenha:
a. P(X < 11b).
b. P(x > 80).
c.P(X < 75).
d.P(85<X<110).
e. P(lX 
- 
eol < 10).
f. O valor de atalquep(gO 
- 
a {X < g0 * a) : 1, 1 : 0,g5.
9. Para X- N(-5,10), calcule:
a.P(-5<X<-2).
b. P(x < 0).
c. P(X > 
-6).d.P(-7<X<_6).
c. P(lx + bl > 2).
-=
lí,.1 E.rerck:io't
6.3 Exercícios
l. tJrna vaiiável contínua tem densidade dada por:
1<rí3;
caso contrário.
a. Faça um gráfico da função acima e verifique que ela satisfaz as condições
para ser densidade.
b. Determine P(X > 2), P(X >- 2) 
" 
P(X:2)'
c. Calcule P(0 < X < 312), P(X > 312) e P(X > 312)'
cl. Obtenha P(312 < X < 5l2l X < 2)'
2. A densidade de probabilidade para uma variável aleatória contínuaX é' dada
pelo gráfico a seguir:
Determine:
a.P(-Lla< X <114).
b.P(o<x<314).
c.P(-314<x<0).
d.P(X>o,x>314).
e.P(X>0lX<Llz).
f.P(x<3l4lx>L12).
g. Um número b tal que P(X > b) : Ll4'
'r91
êapltulo 6: Vartávels Aleeftdrlatt
4. suponha que o varor esperado de uma varidver areatôr"ia corn distribuiluniforme contínuaé I e a variância é iguar a rl r2.Encont.e a probabiridade
variável assumir valores menores qu" ú+.
/(") : {á, 
'
6' Suponha que o tempo de vida ?de um vírus exposto ao meio ambiente seu-1 disrribuição Exponencial com parâmãtro 
.l : uioï. "õ;ì;"ì;probabilidade condicional p(T > 15 I 
" 
> 10).
i
3. Suponha que
dada por:
c. Supondo que um automóvel
a probabilidade de que seja
anos de uso?
uma variável aleatória contínua tenha densidade de
'-=F
(itpítuIo ó; Vuridveit AIetttõritu
0<u<3;
caso contrário.
condições descri
ano de uso? E
t96
ï(r):
a. Qual é o valor de k?
b. Quanro valeb,ral que p(X > b) :5/gtt 
ïï:f:;t"::1iï,*,11"^" 1: ,,n amorrecedor de cerra marca emsujeitos a uso contínun 
", 
*,.'"^ 
*::ï:":"""r oe certa maÍca em aul
contínua, medi'a 
"j":-:-r":e.ro, 
pode ser consideruOo 
"o.ã u.ucontínua, medida em ânôs o,,^"j-ïI*l ò,çr uonsloerado como uma varseguinre expressão: 1 anos' suponha que a função ;il;;; é dada.segulnte expressão:
0{r{2'
24r{6;
caso contrário.
lI,+t',
Ì0,
f (r) :Í; :
a' Verifique que a função-acima é, de fato, uma densidade.o. Sï:t é a probabiliãade d" 
"rn';r',;;óvel, sujeiro àsaclma, necessitar de froca de amortecedores antes de I1 e 3 anos?
está há 3 anos com o mesm.ì ah^rr^^^Ã^,-
necessário fazer a,.,t"t-o 
amortecedor, qual)ca antes de completar 4t 
fi;lí;r;"-no médio adequado para a troca do amorrecedor desses
5. O gráfico, a seguir. rX. _ representa a densidade de uma variável
a. Verifìque que f (r) representa uma densidade.b. Escreva a expressão dà funçao. "- se'o
c. Calcute p(X < S/12). 5---'
d. Determine um número c tal que p(X { c) : 112
ó.
6,J lirercícios t97
O acréscimo anual na área atingida por uma certa praga, numa região produtorit
cle frutas, pode ser modelado por uma variável aleatória contínua, medida em
hectares (10 mil m2), com densidade:(?", 0<z<1;
If@):{1-ã, 1(r13;
I
|. 0, caso contrário.
a. Construa o gráfico dessa densidade.
b. Qual seria a probabilidade da praga atingir entte 2 e 3 hectares esse ano?
c. Que âreaserâatingida com507o decetteza?
d. Determine o acréscimo médio anual na área atingida pela praga.
suponha que o peso de recém-nascidos (em kg) pode ser considerado uma
variável aleatória com a seguinte densidade:
í fi"+rl, 01r12;
If@):1-h"**, 2<r16;
I( 0, caso contrário'
Qual a probabilidade de, escolhendo ao acaso uma criança, ela ter peso:
a. Inferiora3kg?
b.Entrele4kg?
c. Pelo menos 3 kg?
7.
aleatória contínua
a. Determine a mediana e a média.b. Calcule a variância.
10. A função apresentada, a seguir,aleatóriacontínua X.
....-F
Ci t p / t t r I o ó ; Vet r i cí tt e i,t, A I e t r I tí r i us Co n t
corresponde à densidade de uma variâvel
0{r<>.
caso contrário.
l98
t. 
Y:^f:"fuso produzido por um rornovariação no i"u 
"";;.i;;:' '::i: 
automático poderá rer umacomporrame".*":;frï'#:ï:;,.,iïrJ,"r"&lï1;ïïã;f#ï*
f(r):{r"*#, #s'si3;
( 0, caso contrário.
a. Determine o valor
- 
probabilidaoe.*^-^ de k tal que f (r) seja, de fato, uma função densidade rb. Para um parafuso
quar a p.Ju"üiüãã"iJ;:,:;*;:,ïï""j.",.: os produzidos 
I
".cut"u"ï;;;;#""tomédiodesseso",Ïï:'ïï,;;ï*fi Jiiti*",.:ï
9. Suponha Que u[14 r
seguinte função: variâvel aletória contínua x tem densidade dada
Í(r):
0(r<r'
_ 
+,
7<r<>.
2ar{B;
caso contrário.
Í(r):
Determine:
a. P(X > 1).
b. P(x < 1'/2).
c.P(1/2<x< llX<3/2).
11. Suponha que o I
',"tfo, em meses, para a fecrrÍìernnõn ,r^ -^re crrurgia oo unor"ll,l i::::-q-:*çto. de pactentes submeridosa um certo tipo de cìrurgia ;;;;;.:ï-ïiïÏ-ry*n'o de pacientes submeridosvariível arearória contínua x, 
";;;;;;"";:*:::1,",ryde. 
ser moderado p;;;;;
{:*
por:;ï : 
*", ar e ar óri a 
" 
o n, rni i il ;íjï ;ilï"ï:ïn #ï j ïi:iïâ1ïj ï jff ï(*):
---
6,,1 lixercícios
(+, o(r(1;t'f(*):1-I*+*, L<r15;t'"[ 0, caso contrário.
a. Determine a média e a mediana do tempo de recuperação.
b. Calcule o desvio padrão.
12. A trava de segurança de um aparelho industrial deve ser trocada com
freqüência, de modo a evitar a quebra devido ao fim de sua vida útil. Estudos
anteriores admitem que essa vida útil pode ser representada por uma variável
aleatória contínua, assumindo valores entre 0 e 1 ano. Sua densidade é a
seguinte: (*(t-*'), ocr(1;f@):1'\ 't[ 0, caso contrário.
a. Calcule a probabilidade da vida útil ser superior a 6 meses.
b. Determine a vida útil média.
13. Suponha que o comprimento de fósseis encontrados em uma certa regiilo,
dado em centímetros, pode ser representado por uma variável aleatória X conr
função densidade de probabilidade dada por:
r@): L2<r120;
caso contrário.
a. Calcule a média e a variância de X.
b. Se um museu decide comprar os fósseis encontrados pagando R$ 100,00
para os de comprimento menor que 10 centímetros e R$ 200,00 para os
demais, quanto paga em média por exemplar?
'14. O tempo de corrosão, em anos, de uma certa peça metálica é uma varirivel
com densidade:
01r 1I;
Ilr12;
*3a,21r13;
caso contrário.
r99
T2;
{5
;:311ïï:áconstante a 
s
que 1,5 unor. T*Toa como tendo
exaramenre 
, oF ut ror"'i" ï; 
o"'resistência à co'
1 5. o c o n s u rn o d e 
"."' 
u' 
" 
o * ; ;;.# 
"oit 
u t' q' uï' u' ;ffiïlrr5i$:.iïï
medida-Jm"q;#T,:::'ível de um cerro auromóvel é r,*^ .a.,,uuu.iau;iï,ó..,;;;;dï::,liï""rf"ï:ï;,ïilïJ,il:f 
l:i,ffi:
lr, 
/
t,f
['- ..0, losz<1r;f(r):lrr-r, rr<rS12;
f, : 3"ïlï-ïïl#ï ::^" r:rJ'ï *," 
" "" 
ï'j on rrá ri o
em uma 
"'"*"Ãïïï;fiJ[ïl;;:ir:T+ì, quar será atu'^t"lg: *- ,t;,; derermine: )om esse;il;;;",." média da despesaa. P(0 < X'.'ti' --'çrrrrrll€ib. P6 
. 2).- -''
; iÍll â',. nr
e. P(x < 2lx > r).
17. Vigas de ferro
u'ã ãir'"'il:",ff""#ïT;":j:0" sua exrensão a urna
j:,_Í.rull::Í"fliifl 
"X,"'",,H:trï;#ËïH:;Ïi;x:"itïT"ï:Íxï
a. sabendo-Sê
que ,,* .^,r^-" 
t6uat ir o metros' deÍermine a probabiridade de
, 
ju, 
"Ã;ar"uma 
falha ocorreu, eÌa ser distante no mib' ocorrer rurr,ulï."rne h^- 
-, 
'-"'v rru rnaxlfilo em I metro
18. Dois ;;;"iil nos dois metros centrais da viga.
*l'n*ü*iryn+*ïrïr*i q,'mprobabiÌidad" ããr"r'iïIatamente se nãc ---"!v uu tnrervalo iniciaÌmente
e n c o n t ra re nì il ï i, ii. j ï.""1".ïlï ; 
"ïïïïïï ";, ,; i,sï#l#,ï
(irytft u|o ó; Wrriãyei,r Aiettkfu.icts Con.íínuqs 6.3 Exercícios
201
19. Em uma empresa, o equipamento de ar condicionado trabarha continuamentë,exceto quando ocorre alguma falha que causará uma interrupção e necessiduclede manurenção. vamos supor q""-;od"l;;;;'ïi'*ãï,ï", 
uma farha porsemana (7 dias), que ocorue 
"orn 
prãbubilidade OpS.^Ë_.fravendo falha, elnpode ocorrer em qualquer hora ao iia-p+horas).
a. Se o expediente na empresa vai de g às lg.horas de segunda a sexta, qual ttprobabilidade de uma falha durante o expediente?b. As falhas, durante o expediente, acarretam custos de Rg 300,00 enquantoque nos demais horários o cusro é de Rg ZOO,Oò. Ãa"irìnr" se não houver
::tl";:,ïï:,:,ï:ï :r^ o,"rnunu,, quar é o custo ;ãi" devido a fathns
20. Seja X 
- 
Exp(I/I}), calcule:
a. P(x < s).
b.P(4<x<6).
c.P(2<X<5).
d.P(X<7lX>2).
e. O valor esperado de y, sendo y : JX _12.f. A variânciadey.
, t 
;TïJ#""ïjr"ï:1"*^* l:.:ry.:o 1 . calcul e a probabilidade de s ortearmosi#:'::iï,ï,,ïï':i::""::"T?:11ib';.;;;oi;:ffi #;""ïï:::ï:ru;runção de disrribuição dessa 
""'ia'"ì. ôr;lJã ffiï;ï::ffi;ffï,ï?
'13.,ïïff;;ïJï:::ì;j: ::ltil:" d::i caixa eretrônico por crientes de unr;:ï1*ï :' ro i mo der ad o p o r ;; ";; á; -il; ï;: ff"ï : ffi ::-,1ï' Í i,ïï]
a. P(I: < r).
b. P(T > l:r < 4.
c. Um número a tal que p(T < a) : 0,4.
23. o tempo necessário para eriminar o perigo de contaminação de certo pesticicra,após sua apricação em um pomar, è u,'u variáver ur"utoriu Exponenciar creparâmetro 2 (em anos). o maior oo n,"no. tempo depende de fatores conro
iii"ïï;,1ïï,ï#'^t^"ie da região. r"noo ", uì*o áir" l"ornpor,omento, us
rr u r a s p u r ve. ;ffi ;".'"",ï,::ïï :ff ," _,ïïjïÍ;ï f ;, j|#; il :i.ïprobabiridade de um. f*rta_cresse porïr,.r.oihiao oo o.o'.o, não estar maiscontaminada após r ano cra purverizuçio. quar e 
" "ãrì- 
,,segurança,, 
seaguarderrrnos 2 anos pnru 
.unruini, 
"rra*'f,.utn*?
202
classificados como pessoa física é estimada emZ}Vo.
a. Sendo pessoa física, qual a probabilidade de mais de 2 minutos de conexão?b' Sendo pessoa jurídica, qual a probabilidade de ficar conectado menos de 6minutos?
c-' Determine a probabilidade de um cliente ficar mais de 2 minutos conectado.d. se um cliente fica mais de 5 minutos conectado, quar a probabilidade deleser pessoa jurídica?
25. Seja X- N(5,4). Determine:
a. P(X < 6).
b.P(7<X<s).
c.P(2<X<5).
d.P(-1 <X<2).
e. P(X < 
-1).f.P(-2<X< 1).
26.Para X- N(50, B1), obtenha:
a.P(X < 75).
b. P(x > 60).
c. P(X < 35).
d.P(85<X<100).
e. P(lx 
- 
401 < 10).
27. Sendo X- N(S/4,1/9), calcule:
a.P(X <7/s\.
b.P(0<x<6/5).
c.P(X < 3/5).
d. P(x 
- 
4/31< 1/2).
c. P(lx 
- 
Ll > r/4).
(t.-l Exercícios
2tì. Na distribuição X- N(p,,o2), encontre:
a. P(X 2 tL, + 2o).
b. P(lx 
- 
pl 3 o).
c. Onúmero otalque P(p 
- 
ao 1 X < lL,*oo) : 9,99.
d. O número a tal que P(X ) a) : 9,99.
2g.IJma clínica de emagrecimento recebe pacientes adultos com peso seguinclo
uma distribuição Normal de média 130 kg e desvio padrão 20kg' Para ef'eito
de determinar o tratamento mais adequado, os 257o pacientes de menor peso
são classificados de "magros", enquanto os 25Vo de maior peso de "obeSOS".
Determine os valores que delimitam cada uma dessas classificações.
30. Um teste de aptidão feito por pilotos de aeronaves em treinamento inicinl
requer que uma série de operações seja realizada em uma rápida sucessão.
Suponhá que o tempo necessário para completar o teste seja distribuído de
acórdo com uma Normal de média 90 minutos e desvio padrão 20 minutos.
a. para passar no teste, o candidato deve completálo em menos de 80 minutos,
Se 65 candidatos tomam o teste, quantos são esperados passar?
b. Se os 5Vo melhores candidatos são alocados para aeronaves maiores, quilo
rápido deve ser o candidato para que obtenha essa posição?
31. Com base em experiências anteriores, a Companhia Telefônica sabe que l07o
das contas dos seus clientes em uma comunidade são pagas com atraso. Pnra os
itens abaixo, compare a solução exata com aquela obtida através de
aproximação da variável aleatória pela distribuição Normal'
a. Se 20 contas são enviadas em um dia pela Companhia Telefônica, qual é n
probabilidade de que menos do que 3 sejam pagas com atraso?
b. Se 150 contas são enviadas mensalmente para a comunidade, encontre 0
probabilidade de que 17 ou mais sejam pagas com atraso'
32. A durabilidade de um tipo de pneu da mafca Rodabem é descrita por umg
variável aleatória Normal de média 60.000 km e desvio padrão de 8'300 km,
a. Se a Rodabem garante os pnÇus pelos primeiros 48.000 km, qual a proporção
de pneus que deverão ser trocados pela garantia?
b. O que aconteceria com a proporção do item (a), se a garantia fosse part os
primeiros 45.000km?
c. Óual deveria ser a garantia (em km) de tal forma a assegurar que o fabricnnte
trocaria sob garantia no máximo 2Vo dos pneus?
cl. se você comprar 4 pneus Rodabem, qual será a probabilidade de que voeê
utilizará a garantia (45.000 km) para trocar um ou mais destes pneus?
Capítulo 6: Variáveis Aleatórias C,
pessoa física ou jurídica,
porcentagem dos que são
203
24. Um banco faz operações via Internet e, após umprestado, concluiu o seguinte modelo teórico para o
minutos):
f@):|r"-ir",r)0,
com k sendo 1 ou 2, dependendo do cliente serDentre os clientes que se utilizam da Internet, a
204 (t t p h t t I o ó ; Vr t ri d y c i,t, A I t t t I il r. i t t,t, ( )r t t r I
";:ilff: ffïj;'uttcos indicam que a precipitação pluvibmérrica mensert, e
à i, t.i uu rç ío ú;;#'ilï:ï1ï rïïï' 
"ï$;L.,"ffi ,o Jo . o,n o s esu i n d oa' euar seria o 
'"r"'i"ïffiiÏïr:Jl'ï#,ï#P[r" que exisra
^ 
)?^r: !: probabitidad" o" r,àu"iulã'p."",0,,ução inreriàr*/.cô r,^,^.b.construiil;**;':##i:i",ffi ïïï"irï',:ïïm,ïi.;ii,:i;possíveis valores de precipitaça" pìr"i"_ étrica.
" âii:ffi;';;i"*ro "o""io ;;;' próximos 50 meses, em qr; uma precipitação pluviométri.u 
,rp"Jo. ázq 
^^z34' (use o computador) utilizando um gerador de números aleatórios, obten
;#,n:i;:ï":0,"n 
t,o^o 
;^os;1aeoe, ï" "rn" 
-oj,oïi,ïi# 
u,no_,u,, ccparâmerros n : 10. 
:0, qg, i00 ; i:-í,ri'ï.ir, ï;ïffi"."ïï1ffi:"".r"#de n e p' consrrua um hisrogra-á. g;;undo-se na ro.r*ïà, hisrogramas
i,""ïiïi'f"'' o que pode ser diio a ';'p;;; au upro'ìãuü;ï; a distribuição
35.^(Use o computador) Com os dados dCapítulo 1;. '*"**""' 
vur'us oaoos clo arquivo areas.txt (ver Exercício 25,
u. Po:1.cada bloco, construa um histosra ngráficos. Existe dif"r.n." ênrrê ^ --:^-11 
p,ata 
? vatiâvel Sala. Compare og
,.3ïllï::;ï:'ï",::::"i!":**;ffi#;';;:^ï^";:;:::''ìïi*ï
;lX'**;,i:lï:*ï',ï,;1:::F;il";J"';ï:ïï;'i""""ïsugeririapara a variável Sala, em cada blõco?
36' (use o computador) para o arquivo cancer.txt descrito no Exercíci o 24 do
":#r'ïi:rhconsidere 
u uuriau"iióï_l para os pacienres com pelo menos 40
a. Obtenha o histograma e algumas medidas descritivas.b' você diria que o modero üo*ut re!ìesentaria bem esses dados?
" 
"t"uoã1oo 
ÏïÏ'"0"r) com os dados do arquivo aeusp.txt(ver Exercíc io 26,
" Ï:ï[tüiffiJ,ïi]o"]rï",ï:"'o pode ser moderada por uma Normar com
b. Para cada região á" pro""aãncia, conslTemposn. c.,"-r"". 
^o õrír:^^^ n . 
lrua um histograma pata a variávelTemposp. compare os gráficos. É"iri" âirï 
u'r ltrslograma para a variável
sobre os rnoo"tár t"ori"os orìê nnÁa.i-* ^^-'111çu entre eles? Algum palpite;: iT::::"'"1 ï'::'"ã' qu" poJà,ú ;ffiill,'Lre eres r.. 
ãï"i:ïïf":,:;:?,,"
Ëon,in,; iï;;òj,;#ffi:;r a variáver ResidQualéasuaopinião?
H.
205
Capítulo 7
Inferência Bstatística - Estimação
T.L Introdução
A Inferência Estatística é um conjunto de técnicas que objetiva estudar a
população através de evidências fornecidas por uma amostra' E a amostra que
..,,ntém os elementos que podem ser observados e, a partir daí, quantidades cle
irrteresse podem ser medidas.
para ilustrar as idéias que discutiremos nesse capítulo, considere que é de
interesse estudar a proporção de alunos, em uma escola do ensino médiO, qUe
llretendem fazer vestibular. Para tanto, selecionamos uma amostra de alunos e
ircrguntamos a eles sobre suas intenções futuras de estudo. Com o intuito dd obter
irlguma indicação do valor da proporção na escola como um todo, podemos usar it
proporção dos que pretendem prosseguir os estudos no grupo selecionadO.
.Suponha que a escola tenha 1000 alunos e escolhemos 20 para a amostra. Esstt
cscolha pode ser em uma mesma classe ou espalhada entre os alunos das três
séries ou, ainda, realizada de tal modo a garantir igual presença de meninos e
rneninas no gmpo, independentemente da série cursada. Uma forma simples de
cscolher é associar um número acada um dos 1000 alunos, colocar todos esses
números numa lista e sortear 20 números. Os alunos correspondentes aos números
sorteados formariam a amostra. Suponha que você rcalize o sorteio dessa forma e
um amigo seu, desconhecendo sua iniciativa, repita o mesmo procedimento. Você
acha que as amostras sorteadas por você e por Seu amigo serão as mesmas? PareCe
intuitivo assumir que não. Queremos enfatizar que, se realizarmos várias vezes a
amostragem descrita, provavelmente obteremos amostras compostas por alunOs
diferentes. Uma questão que surge agora é: apesar de diferentes, podemos ter
respostas próximas ou iguais nas diversas amostras? A resposta é afirmativa c
estará subjacente às idóias que desenvolveremos neste capítulo'
Resumindo a discussão do parágrafo anterior, podemos dizer que devido rì
natureza aleatória, geralmente envolvida no procedimento amostral, não podentos
garantir que repetições de amostras produzam sempre resultados idênticos. Assim,
ao coletarmos uma amostra, não podemos prever antecipadamente seu resultado'
206 (e tpítuht 7: ln.fi'rf ncitt li,çttttí,ttit,rt _ Ii,
Em outras palavras, 
,todas as quantidades associadas à âmostra terãoaleatório e, portanto, devem r"""b", trataÃLnto probabilístico.Um ponto importante a destacar í
amosrra, remos, nu p,âti"u, roda a i"r"rÃJçïï ru,ï:iïïff iiÏïïrïitramostragem, ou seja, não há alearoriedad" Ënuotuà^ ;;;;;^rn 
-^ ^^ rF
E'.rrvurrqõvrrr' wu òçJa''..0 na ateatonedade envolvici\ por exemplo, se os l(iïï::"* ï::' i,ii:ï191 i"i T" ro."_ "n t*ul; ;;r\;;üli o uo r o. 
"* 
ntoproporção dos que desejam conrinuar os estudos ;;ffird;;":ï"rïï,
iSL: Xïïlli:",r:::::::-::" 1ïstra e o resurtaa" 
"utiàã,irá ser ,",n0,,mesmo, não importando qnanras vezes reperi',-,o. u 
";l;;j;;ffi. ; ilï:
:::ïï::":j3::iï,::: ::jlll": Ito trocam de opinião 
"nt.e a, coreras e, porracomo rodos os arunos sempre enrram na amosrra, a proporção 
"#ïl:ïffiïl
n" ,-r^_I"^Ìr^" iil]jy1:, formalizaremos alguns conceitos relacionados a um rânda Inferência Estatística denomina ao 
"rìi*oçao. Estudarem". ffiïn;ii
;ltïï**ï::.:: ,*:jïis, objerivanJo a obtençao de informações a reslde características de interesse na ptpulaçao. * ""'"""'w uç ''urrnaçoes a re
,_",_l::: ;:tiji:j1r,ïully": e,ãonrusões de noração, vamos repreuma amostra de ramanho ??, a ser rerirada da populaçã;,Ëìi,ï;; 
. .,"i;
Exemplo 7.r: uma empresa fabrica r00 equipamentos eletrônicos por semana
L:'"n ç:,1'::":::ï: ::,:"-.npo.j1 u,",i.tên"iu d",;; ;id ;e equipamento ereração à arreração de voltagem. um res;;;";*dil;#ïïr:ïJ'#ffiiï^:j:
3"""#Jff:,:":i"'ì: "-T r":"^*flsu;1s3ivas art".ãço"Jfuá.onlïuou, de vortagerle observar o efeiro no aparerho. serão consideiado, 
"o- ;Ë?ffiïffï:aparelhos que passarem no teste. como esses testes são demorados e demandamcustos expressivos, apenas 5. desses aparelhos ,"rao t"rtoáos. eue cuidadosprecisamos ter na escolha e na interpretação dos resultados?
os 5 aparelhos escorhido, pr""ià. ser "representativos,, da produção, ouseja, a amostra precisa representaì bem a popuração de aparerhos produzidos.Assim, se questões referentes a operado."s, máquinás utilizaãas ou, até mesmo, odia em que foram produzidos tiu"r"- efeito na quuriãuã" ao aparelho, erasprecisam ser consideradas na amostra. uma alte;ativa seria o sorteio, porexemplo, de um aparelho a cadadia, tentando não repetir op"râor". ou máquinasutilizadas' Além disso, fazer alguma froposta de mudança no processo deprodução, baseando-se apenas nos resurtados de ,,nu ,ãLuna, parece serprecipitado. o mais indicaão seria coretar amostras em várias semanas.uma vez escorhido o esquema de amostrag"^ 
"" ""oa 
elemento daamostra podem ser atribuídos varoìes 0 ou 1 depeniendo, ,"rp""tiuumente, doaparelho ser crassificado como tendo má ou bà ,"ririen"iu às arterações de
--F.
207I ltrlt rulttç'ïltt
$ãettt1il, 7.2: Dtvida-se da "honestidade" de um dado e decide-se lançá-lo l0
íãr',,,rr.'; de utilizálo em um jogo. Os resultados obtidos foram: I , 5, I , 4, I , 2,
g, 
.1, 2 c 3, A que conclusão chegamos?
A íÌeqüência de ocorrêniias de cada face é apresentada na tabela abatixo:
r. A amostrn (X1 ,X2,..',X5,) poderia ter a resposta (0, l, l' l' l) emtr
r.'olcta o numa outra ( l, l, 0, l, 0).
Face 1 2 J 4 5 6
Freqüência t.) 2 a 1 1 0
Freq. relativa 0,3 0,2 0,3 0,1 0,1 0
Ërrr scndo o dado equilibrado, as freqüências de ocorrência de todas as f'aces
Ghrvcrr.ianr ser próximas. Entretanto, a amostra coletada parece,indicar um certo
rlcshirlanceamànto do dado, favorecendo valores pequenos' E bom notar que
,,r..r,no um dado honesto pode produzir a amostra acima. Talvez uma amosttit
ti,,,i,,, pud"rse corrigir o deìvio encontrado, mas, baseado no que foi informado, o
tnclltor seria não jogarcom esse dado! tr
Ii.vcntploT.3..Noprimeirodia,apósmudarparaumnovobairro,vocêdecicle
1',"rgunto. às pessoas' no ponto de ônibus, quanto tempo se espera 
para o ônibus
.t,Jgnr. As li pessoas pràsentes forneceram os seguintes números (em minutos);
.5, lõ, 5, 15,lt,12, rc:15,20, 15,20,12, 8, 10 e 10' uma demora de l0 minutss
l)ilrece ser inevitável?
E claro que as pessoas deram suas op.iniões baseadas em experiêncins
Irnteriores, que devem sór diferentes entre si. É possível, também, que algumas
rlclas sejam mais atentas que outras na questão da demora, além do que nõO
clcvem 
""h"gu. 
todas no mesmo horário ao ponto. Algumas, talvez, levem em conta
o comportãmento das últimas semanas para dar a opinião, outras apenas o dia
itnterior.Também,quemsabeaSpessoaspessimistaspegugmodiademaior
clemora e as otimistas o de menor. Dessa maneira, a subjetividade da resposta é
Í'ruto da informalidade e imprecisão da pergunta. Das informações obtidas, temos
rnédia igual a 11,6; moda 10 e mediana igual a 12. Assim, num prirneiro
momento, parece ser razoável acreditar em espera pouco acima de 10 minutos. tr
Exercícios da Seção 7.L:
L. Liste as idades de cinco dos seus amigos' Escreva cada um desses números em
umpequenopedaçodepapel,deigualtamanho'ecoloque-osdentrodeum
"nu"lop". 
Antes de 
"aoa 
r"iirada, chacoalhe vigorosamente o envelope e I'eche
os olhos.
208 (it1tftub 7: ln.l'erêndu E,ytutls,tiut " Ii,rri
a. Qual é a intenção de toda a "engenharia" descrita acima?
b. Repita três vezes o seguinte procedimento: retire de uma vez três papéis do
envelope e anote seus números. Comente sobre as três trincas d" números
encontradas.
c. Repita três vezes o seguinte procedimento: retire um dos papéis do
envelope, anote o número e devorva-o ao envelope. Faça mais duas
retiradas nos mesmos moldes. Comente sobre as três trincas encontradas.
d. Que diferenças existem nos procedimentos descritos em (b) e (c)?
2. Deseja-se sortear 100 crianças
entre 4 e r0 anos, num certo bairro, para urnapesquisa sobre saúde bucal. Foram propostas três alternqtiÍaslpru u 
"ãl"tu,
l;Y#.lJlïio 
aleatório , reatizado enrre as crianças iir,uaár\g no.io
II: um sorteio aleatório de casas do bairro e, em seguida, uma escolha
aleatória de uma criança de cada casa sorteada, se houver.III: Escolhe-se, ao acaso, um dia de semana em uma das escolas dobairro. Nessa ocasião, 100 crianças são sorteadas dentre as várias
classes, com alunos na faixa etária de interesse.
comente as diferenças e dificuldades de cada alternativa.
7.2 Parãmetros, Estimadores e Estimativas
Para formalizar as idéias que serão apresentadas neste capítulo,precisamos definir alguns conceitos.
Definíção 7. I : Parâmetro
As quantidades da população, em geral desconhecidas, sobre as quais
temos interesse, são denominadas parâmetros e, usualmente, representadas por
letras gregas tais comol$ 
__ 
e gentre outras. tr
Dffinição 7.2: Estimador e estimativa
À combinação dos elementos da amostra, construída com a finalidade de
representar, ou estimar, um parâmetro de interesse na população, denominamos
estimador. E^m geral, denotamos os estimadores por ^rr-boio, com o acento
circunflexo: ê, fu, õ, etc. Aos valores numéricos assumidos pelos estimadores
denominamos estimativas pontuais ou simplesmente estimativcrs. tr
A notação utilizada paru a média de uma população é p, acrescida de um
subscrito, se houver possibilidade de confusao soúre a que população ou variável
209
7, J I'ttr(ìrtrttlrrts' lislittndttt'es r E:tlltttttliytts
s referimos. Por exemplo ' px e Fe 1ão-us1ct :J:Ï"':1i,ïì';;ïtï::i:i:iiïíïì,ïï:'ï":;,::JJJïïïïËil,:r:i.:,=T":lï^.,ïi:ïïTfi *fi'""jËjïï
llÍ:l : *ïJff :ï : ï.ilÏï,ï'ï í'"il1*::: |:3ï1i: ï;,:ïïï#ÍJi: i:
Ëï;ì,Ëlï:ilffi l.:1iïi.ï'T:',:íti""if ï;#"Ëï"ïilï,ï,::*ffÍ:1:llilll ïÍ 3Ï 8iÏ:: ï ffi ;: ;; 
" 
;; "r 
" 
ü'" * 
" 1 i. t,1"^ .',."*..ïff ,.: ï :? :Ï,''n l;
ïïliü:ïil:ïï"fi", aurores e tentaremos utilizar aquera que nos 
pareça mars
Notamos que um estimador' digamos 3' :,::"-função t*r:::U",:i
nr.,,,o.ijì iï'nï#;' J" am?stla' ,i":. i 3 ^:^!^Í:::^!-::;;*Ì;,ti:ï;""#
: iï i ìff:ï ffi:i';ï-" ;;;i;ï "ú:r' I ::ï::i :iÍ:i[ 
^l' ï111ï;:ï: i:;ïllilïffi "ïÏ?"ï-i';;;u,"-o*"eo*"no::ï#".:ïïii'"'*dlll-o*:ïil,ïïilï*iïi,ï*í*u" da amosrra para os parâmetros da população'
";;'r';;;;';.r,u"u'.,o'interessados*:::::.1ï*'ffi 
.tïii""ïït""i"i*:
':::,:'i:Íi;"J:ï:#"ìil;:"Ëq:"i:*..1"^Ti":,,:Jï:J:iïï,ïiï
; ïï ::,1"' 
"ï *1t i ó'ü.' ;;; d" s oeí e 1i,y1ltt:ï i i.ï"n'.ï;"'ï "l::,ffir::ìlï::ïï ","ï;'"'3ff:J'J'l;"Ëil, 
";'";ìhtd;' 
uo u"u'o dentre a popuração
ioï"n',*uoécompost"^p"l,.t^l::::i?1,ï:J:?iiïflïi::tlt;'::
,,,'",,n"LtÏïlï:t':H"Ë;#;ï;;'a*"o"4"*'ï::'ï;:liï:ïï:::f ï::i',',ïlïJiï:'"Ïï"::'Ëïru*;Ì{,:j:;"*l'li:ï,ïïl'3i;';""ïffi :iovens, representaoa PUr Á'' n orrrvu!rw'--'Lu" o."cisamos resolver é que função;ì;, ;;;t dizer algo a respeito de p' o- i .^*^^r^ ;",^ 6 n.ar será o estimador.ttcla, vamos üzet.a;1o a rçòPe*v uv r/' v â,uàtu, isto é, qual será o estimador.
rlos valores amostrais "ïti'"ÏÏ::f:i "t'
Apresentamos a seguir algumas opçoes:
ímínimo + máximo) .pr: f1(Xr, ..., Xro) :
frz: lz(Xt ..',Xto) : Xt"Xt*...+Xro
Ft: hlXr,..., Xto) : -----6-
Poderíamos listar outros estimadores' mas 
os três apresentados são
suficientes putu lo'itu'- *"u discussão' Inicialmente' 
vamos esclarecer o
significado de cada trn a"i"t' O estimado'fu' é 
a média aritmética entre os
valores mínimo e máximo da amostra e frz'é"simplesmente' 
o primei::"1'1]":
sorteado na amostra' Ëì""f-"tt"' F' é ?-eáiu dos valores da amostra' 
ou seJï' il
rnédia amostral.. Apresentamos, a seguir, 
os valores observados na amostra e âs
re spectivas 
"rti'nutiu 
u' ï;;iú ; 
"Ín o-s estimadores 
definido s acima'
Amostra (em metros): 1,65; !,57; !,72;1,66; |,7|; |,74; |,8|;1,68; 1,60 
e 1,77.
lï
2t0
Estimativas:
lJlno" :
u":
teria coletar a amostra?
concordam. Assim tomamos
Capítulo 7: Inferência Estcttístícq _ Es
: 1,69;
1,65;
7,65+r,57+...+r,77
10
16.91: 
-10 : 1'69 '
Apesar desses números, calculados para uma amostra particurar,
serem muito distintos uns dos outros, não devemos escolher o estimador olh:
apenas, se a estimativa correspondente é, razoâvel. como decidir qual deles u
X:,::lï, "1lllj:l que esra questão_é resolvida, estudando_s" u, p.opr"Aua",diversos estimadoràs. É .ómp." uo* t"-ú.u; õ;;ú"; Ëï;ï;.'
::ï:1i:ï:l:tïli--Íota na população, pois se eló fosse conhecido, que senti
Exemplo 7.5: Para detectar.o apoio popular a um projeto governamental
reforma agrâria, foram entrevistadãs +oô pessoas espalhadás 
".n-uá.iu, capitairamostra conrém as 400 resposras que'consistem de 
"r,, (o;:;tïn""Ï:ïtïconcordam com o projeto) e não (para os que discordam).
Para formarizar o problema, iniciàlmente caracterizamos a populaçãointeresse como aquela formada pelos habitantes adultos do país. A informa<desejada é a proporção das pessoãs que concordam com o ,"fàido projeto,
oparâmetro de interesse é p: proporlão dos que concordam com o projeto.
/ t, _, A oTorrra pode ser pensada como o vetor de variáveis aleatór\Ãt,Á2,...,xq00), cada uma delas seguindo um modelo Bernouili, ou seassumindo.valT. 1 para sucesso (resposta sin) e 0 parufraro"", çrerpo sta naQ.E intuitivo considerar como estimador ã prãporçao àmostral dos r
p- número dos entrevistados eue aprovctm o projeto
400
que, tendo em vista as variáveis de Bernoulli, pode ser escrito como:
ì-Xt+.Xz]-"'*Xqoo.
- 400
como veremos adiante, esse estimador arém de intuitivo tem boas propriedades. El
Suponha, como antes, que uma amostra de tamanhopopulação e representada pero cónjunto de variáveis areatóritrs
n é retirada da(Xr, Xz,'.., X,,),
(1,57 + 1,g1)
___
211
7.2 Parôtmetros, Estimadores e Estimativas
Xt*Xz-l +x"
l)cnote os parâmetros média, variância e
população PoÍ F, o'" p, respectivamente'
cprantidades são as correspondentes média,
proporção de certa característica nâ
Os estimadores "naturais" para estas
variância e proporção calculadas na
n rì1ostra. Representpnd-o-os, respectivamente, por /í., o- e P, temos
'^l l,e-
t '"-
X:
^2o.:
:i&,?nn
r1ìjf (xn 
- 
X), ;n-'
número de itens com a característica na amostra
f'í'hryt n
Note que cada um dos\estiàadores apresentados depende dos valores pertencentes
h o*oìtra aleatória (Xr,'..,Xr;'Como veremos no decorrer desta seção' os
;r;;;;;;r", X 
"?, uié* d" serem intuitivos, 
têm as boas propriedades que serão
tlcÍ'inidas adiante. No entanto, com respeito àG2, uma alteração na sua expresSãO
scrá necessár ia paraque satisfaça uma dessas importantes propriedades'
Iixcmplo 7.6: Paraestudar o nível de colesterol em uma população de esportistas,
colctamos uma amostra de 10 jovens atletas, obtendo os segUintes valores:
ItÌ0,196, 185, 165, 190, 195, 180, 176, 165 e195'
Vamos definir nosso interesse como sendo o nível médio de colesterol e'
irssumindo que não temos acesso à toda a população, estimaríamos o parâmetro p
(valor descoìhecido da população) pela média amostral calculada com os valores
rlirclos, isto é,
180 + 196 + 185 + + L76 + 165 + 195 : L82,7.Td,": 10
I'rrrtanto, a amostra, através do estimadot X, fornece para o parâmetrO pl n
trstimativa 182,7. O limite de colesterol para pessoas sadias é'200, isto é, acimn
rlcsse valor o indivíduo aumenta o seu risco de ter uma complicação cardíaCA' A
iilÌìostra forneceu um valor relativamente baixo, indicando que as pessoas que
lrrilticam esportes, aparentemente, estão mais protegidas de complicações 
do
coraçito.
Tendo em vista que a população em estudo é constituída de jovens atletas,
rrrn nível de colesterol acima de 190 poderia ser considerado preocupante e
inrlicativo para um acompanhamento médico mais freqüente. Dessa forma,
,ufnnno quà classifiqu"*o, como tendo taxa alta os atletas com valores acima de
2t2
790
e taxa baixa, os demais.
escolhido, definimos
(upltulo 7: In.f'ert)ut,itt listrttístit'tt - Ii,
Y
Sendo X,i o nível de colesterol do z-ésimo
\
_ | t, se X; >\e;.2:<
f 0, se X; ( 190.
Assim, Y; será 1 para as taxas altas e 0 para as baixas. As quantidades h , ... ,ytambém são variáveis aleatórias, uma vez que elas assumem o valor 0 ou
dependendo do valor assumido por X4, que, por sua vez, é uma variável aleatória;
Para os dados apresentados, podemos construir a tabela:
A proporção p de atletas com taxa de colesterol alta será estimada pela proporção
de taxas altas encontradas na amostra, p. A estimativa obtida é:
Y+vrt"'*Y16 o+1+.'.+1 :0r3.
Portanto, baseado na amostra disponível, assumiremos que 30zo de todos
atletas têm taxa relativamente alta de colesterol, indicando a necessidade
acompanhamento médico.
Exemplo 7.7: Foi coletada uma amostra de pacientes, sofrendo de um certo tipo
de câncer, para se ter uma idéia da variabilidade da ârea atingida pela doenia.
Para 12 pacientes sorteados ao acaso mediu-se, através de aparelhos, o tamanho
dos tumores observados. os dados foram os seguintes (em cm2): 3,52; 4,45;3,g5;
4,32; 6,12;5,88; 4,08; 5,9I; 4,50; 4,86; 5,48e 5,10.
Tendo em vista que se deseja estudar a variabilidade, vamos considerar
como parâmetro de interesse a variância o2. para estimador, considere duas
opções:
1 tL
a? :i)]fxo-x),;
TL-Z:I
^2 7máximo - mínimot 2
"r: \______ 2 ) .
A primeira escolha é a variância do conjunto de dados que foi observado,
enquanto que o segundo estimador proposto é a semi-amplitude de valores obtidos
na amostra. Vamos calcular suas estimativas:
Pobs:
1010
i I 2 ot) 4 5 6 7 8 I 10
X.; 180 196 185 165 190 195 180 176 165 195
V 0 1 0 0 0 1 0 0 0 1
rillFÉ
7, 2 l' ( t ríl n t ( l,rt s, Iis l i rttad o re s e t!ú l r t tt t l i v t t't
^2Oo:
máximo 
- 
mínimo
2ti
ã1.u": $Kt,r, - 4,84)2 + "' + (5,10 - 4,84)21 :0,67i
: {2'601' : 1.6g.\2 /
Esse:s números, apesar de bem distintos, dão idéia da dispersão 
de valores que
Jn,l*,' ser encontìados no tamanho dos tumores' Veremos mais adiante que um
il,il:ï ïãü;lã, poro*o, uma esrimariva melhor pode ser obtida. tr
Como vimos nos exemplos acima' mais de uma função da amostra pode
Her proposta para estimar o parãmetro de interesse. Para facilitar a escolha 
entre
ttris estimadores, torna-se importante verificar se possuem algumas das
propriedades que serão definidas a seguir'
Dc.finição 7.3: Vício
Um estimad ot? ê' não viciado ot não viesado
tl(?) : 0. Em outras palavras' um estimador é não
esperado coincide com o parâmetro de interesse'
Definição 7.4: Consistência
Um estimado, 3 é consistente, se' à medida que o tamanho da amostÍ&
iurrnenta, seu valor esperado converge^ para o parâmetro de interesse e sua
variância converge purã 
""'o' 
Ou seja' ? é consistente se as duas propriedades
seguintes são satisfeitas: |.d,r'i-i-o CIJ7'/ o
ilnn a(ì)i ï;lvod,t-dr.r
'n,+@
ii) limVar(?) : O.
nì@
para um parâmetro 0 se
viciado se o seu valor
tr
os
de
tr
tr
Noteque,nadefiniçãodeconsistência'estamosimplicitamenteusandoo
fato que o estimador depende de n, o tamanho da amostraaNa definição 
do vício,
o resultado deve valer para qualquer que seja n' isto é' E(0) :.0.' parc todo n' Na
definição da consistên"iu, ã eslimador necessita ser não viciado apenas piÌro
valores grandes de n.
Exemplo 7.8.' Considere que' numa certa população' um1- v1]ável aleatória X
assuma os valores 0, 10, 20 e 3O 
"o* 
pót"èntagens 20Vo' 3OVo' 30Vo e 207o'
respectivamente.Atravésdafunçãodeprobabilidade,podemoscalcularamédiae
a variância da população' nesse caso p': rÍe o:- l-05' Entretanto' para efeito
2t4
5\ ''| ,i'
\ ì\'
Capítulo 7: Inferência Esatística _
considere os
didático, imagine que ú não fosse conhécido e desejássemos obter informaçseu respeito arravés de uma amosrra a. ton.,oìÌòï{"'"'Jül"oor,ção. videntificar as possíveis amostras selecionadas.,sr qò puòòrv€ls amostras selecionadas.
t,:i^ï:*::i11-'"'á o p*.1i1,x2), com xt e xzsendo variáaleatórias independenres com u 
'n"rÀu dìr,;i;;ì;á;"iiriri^i"ïi ïïï,0 10 20 30
lr f:t":s amosrras são as seguinres: (0, 0), fl,'?Ol,o fO.;ii '(0,20),... e (30, 30).
::J;;', j"r, 
", 
ï,: 
^ 
i: _ lï,, rã "qu rpòu# i i' ;üil;,- ïí;;,i"1, ïu,irsrfas tem r
fi:ffiiiij:Í:,$."::ï::',': j:^ :*'xi' r3i 3.",ini;, ; ;;.,ra (0, I 0)probabilidade 0,06 enquanto que (10, 20) tem 0,09.Para estimar o valor d a média' p, na população,
estimadores:
ìt:Ít(Xt,Xz):Xr;
frz:lz(Xt,Xz):7:XrlXz
Como se comportam esses estimadores?
i,,Tl;::* f:Tr^rll9-"0", o"j, já_foi apresenrada e podemos carcu
::il *ï::ï::::.: ::.':l : : ::r'id : g ".; +,# ;#""ril:'ïï'"à; ï:"fs eu s val ores 
":o::il:.^ : r", l*it: e ;rortanro, ;,;;, Eiïij': ï;ì
probabilidade é:
o,l:2^u^.uurrâvet aleatória X, não i Aiiã,f'"*,.ri"'íì;" ,r"
Xl o r(s to 1b 20 25 Bo
e,
Calcularndo o valor esperado de X, obtemos
E(N) :0 x 0,04 -t 5 x 0,I2+ ... + J0 x 0,04 : 15.
Concluímos
viciacrospo.o",iião,1ffì""i"ilïÍifì"ft 
""iilïi1iïr1iiï'ÍJl;.ï:,i,u.o estimador Êr, gue é igual à x1,.tem.variância igual à variância de x,rìo caso r05, e não se altera com o tamánho da amostra. ï, our.o, paravras, 4#ï:ï"ïH"#tf. iil:ï:liportanão quão grande ror a amostra. Logo p1
é o q u o c i en, ;;;il ïï ï [ ij: ïï3 #;"$ï ï:ï gil fl ïJ ï:i i:1 lï,.ï ",ï:il
215
Pt t r[tmetros, Estimadores e Estímativas
rir, será influenciado pelo tamanho da amostra. Conforme veremos adiante, a
i,,',,mostral X serâum estimador consistente para a média populacional' tr
ttplo7.9:SuponhaqueésabidoqueumacertacaracterísticaX,na
rlirção, tem média pt e variãncia o2.lJma amostra aleatórìa de tamanho n,
sú,udu por (X1, X2,..',X,) é obtida para estimar o parâmetro'p'
Considere o estimador fut:X Assumimos que o vetor amostral
Xt, Xz,...,Xn) é constituído de váriáveis aleatórias independentes e todas com a
ner,,rnãirtribuíção da variável X, isto é, Xr, Xz, ..., X' ^segltem algum modelo
rrão foi especificado) com média p, e variãncia o2. Com o auxílio das
iiopriedades da esperança e da variância temos
E(F): E(X): nç4tJézJ-: é1:
Pnrit a variância temos,
'rì,
lVar(X';)4:l
- 
p.
no2 o2:-:-
n2n
função
Itrrr.tanto, mostramos que a média amostral é um estimador não viciado para a
irróclia populacional pr e' como Var(pt) : o2ln tende a 0 conforme ncresce'
c,,n"luí.nós hmbém que X é um estimador consistente pata pt'
ConsidereagoraqueespecificamosomodelodeXcomosendoNormal,
ist. é, temos X -'í1i, 
"'1. Os resultados apresentados 
acima para X
l)e r.manecem válidos, pois foram desenvolvidos sem nenhuma 
particularidade de
rrrçclelo. suponha qu. u* outro estimador é proposÍo:p,2: mediana(xr,...,x',,.).
A 
.f ustificaliva para o uso de frzdeve-se ao fato de que o modelo Normal é
sirnétrico 
" 
u 
-eàiuna, assim 
"o.nõ 
u média, é uma medida de tendência central'
Os cálculos referentes à P', sáo um pouco mais elaborados e não serão
tlcsenvolvidos aqui. Entretanto, pode-se demonstrar que E(fur) : t" e
i,,|çtr1 : Qr l2)('o2 ln), de tal formã que esse estimador é também não viciado e
cottsistente para LL 
- Ú
Iixentplo 7./0.' Supondo uma amostra (Xr, " ',X,) obtida de uma população
.,,,r.r Áédiu p e variânci a 02, ümestimador "natural" da variância foi apresentado
irlteriormente e motivado pelo cálculo da variância de um conjunto de dados'
lisse estimador foi denotado pori\ e é viciado pata o2 ' uma vez que:
2t6 Qtltltulo 7: Inl'erêttt,iu Elktthtic,rt -
E(õ?):*rtËrxt-x)z1
:*,"tttxt-tr+p-x),Ì
: 
*utDrx, - rò2\ì)1-,,,,
a'nls: ;2ts6o - P)' - E(x - p)'Z:I
7 , 1": 
-no'_ _o.nn
,Tl, 
- 
7, n: \-;)o"'
como é imediato verificar, o quociente (n- r)/nnunca será r, exceto no rimitcquando n tende a infinito. podemos eliminar ó vício ,nuriipri"uno o al po, , Idividindo por (n 
- 
1). Assim, definimos um novo
estimador
.s2 : 
-_l_tf" _ x), ,n 
- 
IZJ\"z /L) '
que é não viciado para o2. para seu cálcuro, podemos usar a expressão alternativa
.9': 1 /Én-t\ux?-"-*')
Esse estimador recebe o nome de variância amostrare será sempre denotado pors2 paradistinguir de outros estimadores denotados genericamen te porG2. D
Note que a variância ou o_ desvio padrão de um estimador fornece uma
::Í':_1L,':: llïïyl; ïor ìsso, 9 .-"''n; denominar 
" 
o"#ïi,ï""ï""H
:ïii::: i : .:. :"_ ! : d,*. eu ando a"i.. ",,iÃïãïï",'r;#';;ï,tJ:;ï:. ï Hilil::::,:fiïïé o mais nrecisn Nccra nn-t^ v+^ ^ ^^,^ - .,é o mais preciso. Nesre contexto, o conce iti de eficiênrr" i 
^ií*!"!r;ilïïL:?;Definíção 7.5 : Eficiência
" Dados dois estimadores ?1 e ê2, não viciados para um parâmetro d,dizemos qu" ?, é mais eficiente oo qu" ó) ," r"rìA,iï ,ïiïA; tr
-tF
V,. ) I' t t ríl t t t (t t ro s, lis t i t u rul o rc,r c b]l I i t r t t t I i v t t,r
*,_.***.{,
2t7
)Exttrnplo Z.//.. No Exemplo 7 .9, no caso de distribuição Normal, verificamos que
'ãl 
"tii*oaores 
p1 :X e frz:medtana(Xt,"',X") são não viciados e suas
vnriÍìrrcias foram calculadas' Então'
var(Q) 
- 
o' ln, : ? :0,63 < L + var(Fr) < var(fr,r),
V'4 p; : ç" 121"'1" iT
ê eottcluímos que p, é mais eficiente do que -1ìr'
Na tabela a seguir, apresentamos estimadores de p, p e 02'
Tabela 7.1: Estimadores para média, proporção e variância'
(x) a consistência não foi demonstrada no texto mas é válida
Exercícios da Seção 7.2:
l. Foram sorteadas 15 famílias com filhos num certo bairro e observado o número
de criancas de cada família, matriculadas na escola. Os dados foram: l, l,Z,D,
2, (,2,,'3,4, ), l, Z,0,0, e2. Obtenha as estimativas correspondentes aos
seguintes estimadores da médìa de crianças na escola nesse bairro:
(mínimo * máximo) 
.
PÚI 
-
^t (xr+x3.fr: --n- ,
frs:X'
Qual deles é o melhor estimador da média e por quê?
2.Para se estudar a variabilidade em um teste de Inglês (notas de 0 a 5), foram
sorteados 16 alunos de uma escola e suas notas anotadas: 0, 1, 2, 1,2,3,3,2,
3, 3, 4,5, 1, 3, 2 e 3. Paraestimar a variância foram propostos os estimadores:
n
218 Copltub 7: Ittferprrirt liyutíltictt - Ii,
,? : 
*E(xo - x)2 ;
Obtenha as estimativas e discuta qual é melhor.
3' o número de reclamaçõ;s,uue chegam por hora à uma centrar de Atendimentodo consumidor foi anotadó puru ,i-u amostra de argumas horas escorhidas,aoacaso. Deseja-se organizar o serviço de modo a ate-nder, iÃ"aiutu-" nte, 909"das chamadas que chegam. O"t"r,,'ln" uma estima tiv.a n^,o n 
-,í*^_^ rriru n c i s n f ri s s n ec L s s á r i o i, 
" 
u ?,";ì ;", ï;,;iïJ ïï; ï JË, i"ï1 ;, i,"{;r,V,l,B,+,$,b, l, X, +,+,i, L:'[,1, i, ìïì: d)V, ! 
" 
+.
4' IJm ônibus passa por um determinado ponto em intervalos regurares (emminutos inteiros) que você, por ser nouo no bairro, d"s"onh""e. Ao chegar a
::ì;,,ï"ï,,ïlï'":"ïj:::i^ 1li: pessoas e resorve ;",s"*;; 
" 
eras sobre ;seuônibus. uma delas diz_que está no ponro h;;;;; fi";ïftÍ;ï'JJJ: ff:passou. A outra está há cerca de 40 ^minutos e já viu passar dois desses ônibus,Faça uma estimativa da demora puru pu.ru, o seu ônibus.
5' um fabricante deseja estudar a duração de baterias que são utilizadas emrelógios de pulso. uma amostra de vãrios lotes rauric'aÃs por uma mesmacompanhia foi submetida a testes acererados 
" 
proaori*- JJ r"grint", temposde duração (em anos):. 1,2; I,4; 1,7; 1,3; 1,2;2,3;i,0,-i.S,"f 
,S ; 1,4; 1,6; 1,5;7'7;1,5 e 1,3' Determine estimatiu* puru a média e a variância do tempo deduração dessa p'has 
-para avariância,'use os estimadores da TaberaT.r.
7.3 Distribuições Amostrais
Vimos que estimadores. são funções de variáveis areatórias e, portanto,eles também são variáveis areatórias. N".'tu ,"çao vamos estudar a distribuição deprobabilidade de arguns dos estimadores mais utilizados. Iniciamo, com umexemplo simpres, em que não é difícil carcurar expticitamánte a função deprobabilidade dos estimadores de interesse.
Exemplo 7.12: um jogo consiste em lançar uma moeda honesta 3 vezes. paracada ,ançamento, se saircara você ganha-ì ponto, caso saia coroa, você perde um
-
219
poilto. Podemos modelar essa situação através de uma variável x que, em umn
i6pulação, pode assumir os valores -l e 1, com probabilidades iguais' Para uma
ãrri,,rtrá aleatória e independente de tamanho 3, vamos determinar as funções de
probabitidade dos estimadores X e ^92.
' Um cálculo simples fornece o valor da média e variância de X, obtendo'
tc, respectivamente, 0 e 1. O vetor amostral (Xt,Xz,Xt) é constituído de
Vlriírveis aleatórias independentes e identicamente distribuídas com função cle
probabilidade igual à de X. A tabela, a seguìr, apresenta as possíveis amostrâs,
i'espectivas probabilidades e valores de X e 52.
7, I I )ist rihuif:íics Arttttst rnl'r
(X1, X2, Xs) probabilidade X gz
-1, -1, -1) L/s -1 0
-1, -1, 1) T/B -113 413(-1, 1, 
-1) L18 -r/z 413(-1, 1, 1 rl8 U3 413( 1, 
-1, -1) tlB -L/3 413
1, 
-1, 1) 7/8 r13 413
1, 1, 
-1) r/8 L/3 413
I 1 1 L/s 1 0
Os valores da tabela foram obtidos através dos cálculos usuais. Por exemplo, parn
n umostra (-1,1, 
-1), temos
-1+1-1 : 
-tl3;rohs:
(-1)'?+ (1)2 + (-1)'z- 3(-1l3)'z
(3-1)
Baseando-se na tabela anterior, podemos construir as distribuições dos
cstimadores, dadas por:
t :413.
Xl-1 
-LlB rl3 1 ^
Os valores esperados podem ser calculados facilmente:
E(N) :(-r) x 1/8+ (-1l3) x 1/8 +Lll x 718* 1 x 1/8 : 0;
E(S') : o x rl4+ 413 x 314 : r'
eapftnlo 7: hlferëncio Erttttl,rtictt .
Dessa forma, uma vez que.E(-t) : 0 : ,,li. 
: E(s^r): 1 : var(x),ambosestimadores são não ui"iuooì fuluì**Ë.r,"os parâmerros esrimados.
_ t . No exemplo anterior, pudemos en
.'xiïJffi :::**;,ïrTJ*,ï;;riïfu 
*,ïi#:",ëJJ"ïï.ï:v ^^_1:x,"ìntinuu,'"''*'"ï"lïüi j#::""ïïïïï*#iílïl;l jï:,Ël
*: iïï* i! J; Jl ; ïï *r:iï'i:iil I utu,,,uc o n r ín u a o 
", " 
i.liï ïi" :ï*envolvidas, não seria viável ;il;;; ïoàï,"r".o conrinua das variáveis aleatóritobtenção das densidao", pu.u u^Àeji""l"t as amostras possíveis, o qu" l.p"ìo
apresentado flo Exemnl^ ? r. \Ì? para a variância amostral neln mÁr^rapresentado no Exempro 7 
13 .wr9 "Ã"íffi;,Hï#fiïï::r peÌo méror
,ffiïïil::rïi'J'::*; :::.o^.1*i" g,", é que o0,", u'oli;,ïff,:,:":
ïi::1,ffi :.ff 
"i"'::ii:d;õ;"iË'l'J,ïï,Jlfi "ï"ff :':':;;ïi;Í;..ïi,,;,trt1t*dï;JÍïiï:riïïJ,ï-áïLï,ï::ï:.ïil:rjit*ïyi
ii,ïlïtïfJ.';Í:ïry:ff 4i*:*:*lÈfiï1"Ë,,*,.ï,ü;l"1,::,'iffi "::
uu.iau"r ïïì;H:ï:,,.,n_i"iurm"nr",-;;," de umà õ;;ü; Normar, isro é, a
represenra uma 
^;^:.: : 
N(!".' o2)' Portan ; ffi;;ï"
:Íï;àïx"Ëïï.Jilïï:,.1i,#i,,;,n#llrdìÉ;J$*li:;i j
X'i 
- 
N(p,, o2), ,i: I,...rn;
X; é independente 4s X j, para todo i t' j.
XtTr, gue, para quaisquer consianres a,{; também tem disìribuìcãn a^ ^-:;:;,,.*l' ,"'.4:, a combinação lineart*f;*f f rui*ïÍlï* j:ï,J"ï,ii;."àïâ;,X,ïiLiïtï#ï:A distribuição da média ,-;;Ë*" Pruoa'Illdade dada pelo modeló Nor,r,ui.
a,; : 7/n, 'para i,: t, ..., n. A.ssi- u,' :of:n* desÍe resultado ao to-urn,ã.at : 7/n, para i, : I,...,,r."'Ã,,"}:"ïttetamente deste resulrado ao torr
propriedades dâ esrr."o-^ô ^,.^-:^ 
N(p*, ol) e, com o auxílipropri edades da esperança e variânciu uor"r"n ooxïJ,#".ï;:ï ;:ïnt o das
tt,: E(X) : uÉËx) : 
*n, : ,,
o1: va,(X) : v"4!txò : #ro, : #
Logo, para uma
clistribuição de
coleção de variáveis
probabilidade, dada
aleatóriás independentes com uma mesmapor um modelo Normal 
""_ 
;ã;;;'è
E:
Figura 7.1: Efeito de n na distribuíção amostral de X 
- 
N(10, L6ln).
*I-F '" - --"-=Çt
77t
'. I I t i.t' t riln i çilc,t A rru 
^! nli,t
nciã o2, a média amostral'X também terá distribuição Normal, com média p
vrrrifincia o2ln.
Note que, pelo resultado acima, podemos concluir que à medida em que o
talnlnho da amostra cresce, a probabilidade de a média amostral estar nil
Vlzinhança da média populacional torna-se
maior. Intuitivamente tal fato é
êFltclirdo, uma vez que, ao aumentarmos o tamanho da amostra, estamos tendo
ituis informação e, de certa forma, fazendo a amostra ficar "mais parecida" com tt
Apolrulação. E, assim, razoâvel acreditar que a média amostral será próxima dn
ntérlia populacional.
Excmplo 7.13: Considere uma amostra independente de tamanho zl de uma
vrrriírvel N(10,16). Isto é, Xt,X2,...,X,, são independentes e todas com
distribuição Normal com média 10 e variância 16. Como se comporta X em
lirrrçiro de n?
A variável aleatória X tem distribuição N(10, 16/n) e o gráfico de sua
elcrrsidade é apresentado, a seguir, para alguns valores de n.
Como podemos notar, à medida que n aumenta, a função densidade vai sc
eoncentrando ao redor da média 10, que é amédia populacional, indicando metior
probabilidade de amostras grandes fornecerem uma estimativa de X próxima dn
rnódia populacional.
Densidade
tr
222
omitida.
com Z 
-.À(0,1).
Cnpltulo 7; ltlferênrict E,rkttl,ytiett 
-
Exemplo z'14: suponha que a aceitação de.urn rote de r000 peças ocorra
:il ïifiïi,ï,ï:_lï j.:^ lo^tças. retirada, or"oto,lo*ãi,'. oo ro,.,entre 5 e 10 cm. Sabe-se.,r" 
^.).,.i^-r'*^v!'rssso 
oru'rlurralllenre oo lot
i*, * ;: *",,n"T:ïï J:, ï ïï : iü,1,",," r :i "ãï:iSe definirmos nor y. ^ ^^6.. . .V ì li : 1, . . . . 10. remos lÌ,.0"ïrf1 ,^o ,"^o'Ptimento -da i-ésima peçai- r,... , 10, remos q_ue a médiá d": t0;iç;;;;;ï";;ï'#,"_i:i:#:ïx' terá distribuição Normal com média i,s'"^ ;il;;ïôno:2 cmz.Lca probabilidade de aceitarmos o lote serrá
P(5<X<ro; :r(r-2,t.\ r/z X-p . ro-Z.s\;m.-õ-)
-P(-
obtida da rabela da N(0, 1).
I,77 < Z <I,TZ):0,,92J2;
Io q!" foi discutido até aquia!v Yuv rur (rrscutlclo ate aqui, consideramos a distribuição arnostralmédia X, calculada em uma amostra crrinq êlêmô6Í^^ ^:^ra cuJos elementos são constituídos
Jïïï:i:ï,.ï,,ïï:*""r":::"";:::;;,ü'o_EJÏï:ï'J1"'u;ï.ïï:ï"[
;; ?:ï;'i" ï":, :: t: :Tiçi:: : *:p ei t o ã a or s t,i bu i ç ão a u, uu.i #iï.liï3;,,ïl
lÍ,'3ffi ï::;,::""*::i:':i:;:-;ã;Ï'J'"*ï.:3:'fJ:ïïÏ:i:ï
:::;::;:;ï:;::;'iï:j;:u:'i*::::{::ï";iï;;;:ï;,:"^n)i""#"i":"i::i::n
':{;';:::#:i^r#(:,^l*:l',:x;;;"#b":':r:;:i:##i:n:í:#ï:ft
'ï*ilï:ïTÍ::;"::*:::',','":,'::"N:#;i-ilJ;;Jï-:ï3,xH'#j'.ï1:i mp orr an re s da 
- 
âr e a 
,1: ï:,:i,-,: ::""' Ë," *, iìlïl"ï : ïi :i, ,lÏ Z:H:ii:Central do Limite- cnir do-a-o+*-^x^
:,":;ií:doLimire,"u;aa"mons;;;õ#'ãï:;,".ïïï:::::r^?:,"*!á
Teorema Central do Limüe
suponha uma amostra aleatória simpres de tamanho n retiradade umapopulação com média p e variânc ia o2 (Ãote que o modelo da variável aleatórianão é especificado). Represenrunoo tìï amostra por n variáveis areatóriasindependentes (x1 
, ... , x ,,)", a"notunaoïru meaia por X , temos que
X-p,
"/t/"
-+ z,
{arFp.
223
í11 t i i I t tr i ç'íie s A t rtr ttl xti,r
lirn palavras, o teorema gârilnte que pâra n grande a distribuiç.ão da média
lrrl, devidamente padroniiada, se comporta segundo um modelo Normal
,,ró,lia 0 e variântia 1. De imediato, podemos notâr a importância do
rrlr central do Limite, pois em muitas situações práticas, em que o interesse
iif-'ìììì *Jai" 
"."rtral, o teorema 
permite que utilizemos a distribuição Normnl
ti 
"*t,,.tn. 
x probabilisticamente. Pelo teorema temos que quanto maior o
il;,';;;- J; 
".ori.o, melhor 
é a aproximação. Estudos, envolvendo simulações,
ggtt'ttut que, em muitos au'o', valores de n ao redor de 3O fornecem
ipro*i,ì',nçO"s bastante boas para as aplicações práticas' Em casos em 
que â
Grd,',t"iro distribuição dos ãados é simétrica, excelentes aproximações sãlo
gbtitlrrs, mesmo com valores de rz inferiores a 30'
Para verificar o efeito do tamanho da amostra sobre a distribuição de X,
Vfltrros considerar diversos modelos de variáveis aleatórias e vários tamanhos de
ãtrr,,stra. Com o auxílio do computador, simulamos a coleta de amostras de um
ãet.,r.,.,.rinodo tamanho do modelã escolhido. Repetindo essa coleta um número
gflrnrlc de vezes e calculando as correspondentes médias amostrais, podemoS
obtrrr um histograma dessas realizações, que ficaria muito próximo da função de
;;;ì;Jiiid"d" d" X. Por exemplo, ii*" um tamanho da amostra e repita a coletn
l(x) vezes. como cada amostra fornece uma média amostral, temos 100 médlns
rrrrrgstrais observadas e com elas construímos um histograma' E claro que' quetnt6
trririor for a coleta e as repetições, mais aproximado será o histograma, dtt
,i-,,r,aJ" de X. Teremos, então, através dessa simulação, uma idéia de corno X
s(j comportaria numa amostra grande e poderemos perceber sua semelhança com ü
tlistribuição Normal, conforme assegura o Teorema Central do Limite'
NaFiguraT'2,apresentamosumaaplicaçãodoprocedimentodescrito
ilcima. procuramos escolhèr modelos bem diferentes de modo a ilustrar a rapidez,
Iro sentido do tamanho da amostra, e a qualidade da aproximação' Os modelos
cscolhidos foram Uniforme Discreto (1,10)' Binomial (n -- 5, p:0,2),
lixponencial (À : 2) e o modelo contínuo definido pela densidade:
se0(r14;
se4( r15.f("): Ítls\tlz
Pode-se observar que' mesmo partindo de distribuição assimétricits,
cliscretas ou contínuas, à medida em que o tamanho da amostra cresce' tì
ãir,.lUriça" de X vai se aproximando pãra a forma de um modelo Normal. A
velocidade da convergência-depende da distribuição inicial, sendo mais rápida nas
distribuições simétricas.
224 Cnpítulo 7: Infi'rilnriu Eskttí,rticu - E,
Figura 7.2: Efeíto do tamanho da amostra sobre a dístribaíção de x.
Exemplo 7.IS: Ílma variável aleatória x assume os valores 3, 6 e g com,
respectivamente, probabilidades 0,4; 0,3 e 0,3. uma amostra com 40 obseré^rtorrTu*. A variável_X não rem disrribuição Normal 
" "b;;;;.;":;ïï;::ï,ffiJfi;
amostra grande o suficiente para usar o Teorema Central do Limite. para calcular
a probabilidade da média amostral superar o valor 5, temos:
P(x > 5): P( x,-,1'!=> fs,+í4,44/40 {4,4m) - P(z > -1'20) :0,8849;
com este último resultado obtido da tabela da N(0, 1). tr
Exemplo 7.16: Em uma certa cidade, a duração de conversas terefônicas emminutos, originárias de telefones púbricos, segue um modelo Exponencial com
Exponencial(a10)J
_l lh-.llllllF-r_,
Binomial (rl0) Binomial oFl0)
Exponencial(F50)
Densidade f(r50)
-
225
Fl tt r i I t r t i ç'iie t A ttrttsl rul s
ro l/3. Observando-se umíì amostra aleatória de 50 dessas chamadas, qual
a lrnrbabilidade delas, em média, nãoultrapassârem 1 
rnli"9t?
rt"pi.t.nr*do por X a dutaçáo 9T :11-ud:t' l"T:: .*,- t:!!'{}:":
,'1,, d, temos que E(X) : 3 e Var(X): 9' Admitindo uma amostra
it:rrtctnentegrande,pod"-o,calcularaprobabilidadedesejadadaseguinte
vt1\-.) 4-3
P(X < 4) : P(+:i:Ã < :ffi1 = P(z < 2,36): o,eeoe'@= Jqso
rtkr our vista o alto uaior de probabilidade encontrado, podemos dizer que é
iciturcnte certo que a média amostral estará abaixo de 4 minutos'
tr
p: Y +Y, + ... +Y, -v.
"qr
UniÍbrme (rF50)
Binomial (lc50)
Exponencial (n=100)
Uma aplicação importante do Teorema Central do Limite relaciona-se
€gtn ir clistribuição ãu p.oporçao amostral' Recorde que definimos-,1^plT":.ç::
ã;r;;,J ;;"'a fraçãà dìs indivíduos com uma dada característica em uma
Êltostt'it de tamanho n, isto é,
númerodeindiv.naamostracomdadacaracterístícaP- n
ge c0nstruirmos para o z-ésimo indivíduo uma variável aleatória f; tal que
( l, se o indivíduo apresenta a característica;t/ )
'u - \ 0, caso contrário ;
ltotlcmos reescrever a proporção amostral como
- 
\\}44n
l,ogo, a proporção amostral nada mais é do que a média d: u?tii]:t: aleatórias
..,,,ìu"ni"-nt"*"nt. definidas. Assumindo que a proporção de indivíduos com a
tlircla característica na populaçáo é, p e que os indivíduos são selecionados
irlcatoriamente, temos 
'qo; yt' 
"',i, formam uma seqüência de variáveis
irlcarórias independentes com ãirtriboição de Bernoulli. Assim, E(Y) : p e
.V,rr(Y)
: p(I 
- 
P). Logo,
E(?): utT.*l: o
ò:l
Assim,! é um estimador não
n \r'
e var(fi) : var(lil:
viciado e consistente Para P.
226 eapftub 7: Inlbrêttrlu Es,kttí,ttirtt .
Tendo em vista o Teorema Central do Limite temos quesuficientemente grande,
Notamos que a soma das variáveiszfe_xgias/, digamos W : Dïl-ttem disrribuição exara dada por uma Binomid ì#;;il;;", n e p. Deforma, probabilidades, envolvèndo a propárção amostrar, podem ser calculadagmodo exato usando essa distribuiçao. cáso o varor de n seja muito grande, eglprobabilidades darão aislm trabar"ho para serem carculadas L to-u_r" 
"onu.ni.Jutilizar a aproximação Normal.
,u::*!':.''f,;t\*:^q:: l proporção.de peças rora de especiricação em
?i^ 
"Í " lZ ^! !: :- T:-uo u 
-u 
-u_ u''à, tà ; 
" 
ã'"''r' ; rï, ; ïï'"ïi:ï: J
:i:jÏï 
"t:T,:,ï :11 t.:1,".:3: 
de 
. 
peças aereituosls- ;";i;"" 0, 5 0 pode
c arcur ada de l?:-" "I1" 
'.'. 
b ino'"iuL à ;d;#;"ilï#,:"üilJ:
::: Y l rari ável, aleatóri a represË"r""a" 
" 
-"',nÁ";"" 
;; il#;na amostra. Claramente, W _ b(80;0,40). Logo, se pp representa aamostral de peças defeituosas, temos que
P(ì < 0,50): p(W/80 < 0,50) : p(W < 15)
_ +{ /Bo\.: à\"i 1o'no' o'6s30-z: o'8250'
considerando agora 
.a aproximação Normal, temos, como conseqüência doTeorema Central do Limite -' --'^rvu' vvrrrv
? 
- 
N(0,40, o' no,t ; 
o, nor, 
.
Assim,
P@ < o,5o) 
- 
pç3-!- 
.
/ p(r-p)
v --;,
temos, então, mesmo para uma
razo6*el entre as duas respostas.
0,50 
- 
0.40 .
-ffi ): P(z < 7,72)
V ----m '
amostra não muito grande, uma
,.1 I t i t t rì h u i çi\e t A nttttl rtt I s 227
,_
rcÍcios da Seção 7.3:
I fltrrn variável de Bernoulli com probabilidade de sucesso p é amostrada, de
lìrlrna independente, duas vezes. Apresente a função de probabilidade da
ltrétliu amostral.
l, 11 ltirnero de divórcios por indivíduo adulto casado, em certa comunidade, foi
rrrorlelado pela variável aleatória D, cuja função de probabilidade é'
rrllrcsentada a seguir:
tlrna amostra, representada por (Dt,Dz), sorteada com dois desses
irrtlivíduos e os seguintes estimadores, para a média de divórcios, foram
e trttsiderados: 0r : JDõ e frz : máximo - mínimo' Para cada estimador'
otrtenha sua distribuição de probabilidade e verifique se é viciado.
!. [.lr-na variável aleatória assume quatro valores (-2, -I, 1, 2) com igual
plobabilidade. Para uma amostra de tamanho dois, obtenha a distribuição de
,92 e verifique se ele é não viesado para estimar a variância da variável.
4. Coleta-se uma amostra de 10 observações independentes de uma N(2,2),
I)etermine a probabilidade de a média amostral:
n. Ser inferior a l.
b. Ser superior a 2,5.
c. Estar entre 0 e 2.
5. Supõe-se que o consumo mensal de água por residência em um certo bairrO
poulirtunolem distribuição Normal com média 10 e desvio padrão 2 (em m3),
Para uma amostra de 25 dessas residências, qual é a probabilidade de a média
amostral não se afastar da verdadeira média por mais de 1 m3?
(r. Um fabricante afirma que sua vacina contra gripe imuniza em 807o dos casos.
Uma amostra de 25 indivíduos que tomaram a vacina foi sorteada e testes
foram feitos para verificar a imunizaçáo ou não desses indivíduos. Se o
fabricante estiver correto, qual é a probabilidade da proporção de imunizados
rra amostra ser inferior à0,75? E superior à 0,85?
ol
a
proximidade
tr
,.E'c
228 Cupítttlo 7: Infi'rêncict Ëstntí,ytittt - Ii,
7. A resistência de vigas de madeira utilizadas na construção está sendo
o fornecedor atesta que, em média, cada vigaresiste a-3 tonelJas com despadrão de aproximadamente 2 toneradas. úint" dessas vigas serãopara serem utilizadas numa obra. considerando que é verdãdeira a inf,do fornecedor e supondo que o modelo Normal é ãdequqdo, pergunta_se:
a. Qual a probabilidade de uma dessas ) ''t.,.ncleÃc,ì r..us us UIIÌa qessas"tgaE-ytar menos doa. Qual a probabilidade de uma dessas-"rgq tipgtrruí'-"ïo, do quetonelada?
b. Qual a probabilidade de
2,5 toneladas?
c. Qual a probabilidade em
suposição de normalidade
as vinte vigas suportarem, em média, pelo
(b), considerando agora 40 vigas e sem fazer
para os dados.
7 .4 Estímação por Intervalo
os estimadores discutidos até aqui são estimadores pontuais,fornecem como estimativa um único varor numérico puru 
-o'fuïã**o'
ïl1liïl:, Pi. r"r."T..variáveis_ aleatórias, os 
"rti-uããì", 
-ü;;;'""
distribuição de probabilidade e, levando este fato em consideração,
apresentar uma estimativa mais informativa para o parâmetro de interèsse
11]:1,::1 ryoi{ de precisão do valor obtido. Ésse métod" o" árìiÃ"çâülX:lY: i:t e rv a t : d e. c o nfi a n çÍ, .iLq 9.noru, à esti mati vu pon*t ;; Ëffi ;;informações a respeito de sua vãriabilidaàe. Intervalor o" 
"onrãïçã".il;tdrï
',1, : +#1/v(0,1).o/vn /
atrav.és da distribuição amostral de seus estimadores.
consideremos, inicialmente, o intervalo de confianç a paru a média 1t deuma certa população Normal, com variância conhecida o2. Supãndo uma amostrade tamanho n dada por (Xr,...,X,), vimos que a 
-eaiu amostral temdistribuição Normal com a meyq44q a 1_r e variância o2 f n.Assim,
-1 \
+\tr
Fixado um valorì ta7 tal que 0 < 7 < 1, podemos encontrar umvalor zrlz
p(Zl a r.,p)_ .P(_ z-112 { Z < zrlz) : 1.
o índice de zrlz apresenta o valor de 7 dividido por 2 uma vez que a ,,massa,'
deve ser distribuída iguarmente em tomo de 0 (veja a figura a seguir).
'"'uF.
'/.'l |ist ittrctção por I trle rvultt 22e)
-Zw 0 zvz
o valor z1p pode ser obtido da tabela da Normal padrão' localizando o
viúor de 7f2 no 
"orpo da tabela e obtendo 
o valor 4l'2 nas margens
correspondentes. Feito isso, temos o intervalo
T_,,
- 
ztlz<Z< z11zè 
- 
zt/2a'#1ztlz
" o/\/n
clue pode ser reescrito como'
com coeficiente de conflança'y' é dado
UI
; X + 2.,12--f;1.
\/ lú'
v
tal que
OOX 
- 
2.,126< t-L < X * zt1z76'
Assim, o intervalo de confiança paÍa p,
por
A interpretação do intervalo de confiança deve ser feita com cuidado' A
expressão IC(t+,'y) envolve a quantidade X que é uma.variável aleatória e'
portanto, o intervalo obtido tambdm é aleafório. Á probabilidade oue ele contenha
o verdadeiro valor da média populacional ;;õãtpìíì:ão aor"iut a amostra' X
i;.*-* ã;=, ètonìõ 
"ò-ntiéïéúo, 
o, n e z^,12, ó int"tuuto passa a ser numérico'
Desta forma, uma interpretação convenienti e a seguinta se obtivermos vórias
amostras de mesmo tamanho e, parq c:ada i*o delas' calcularmos os
correspondentes intervalos de confiança com coeficiente de confiança 'l'
230 Ctpftulrt 7; ln.li,rêncirt lhttttí,t,tit.tr _ Iilt
esperamos que a proporção de intervaros qne corúenh,am o varor de 1.t, sejaa j.O exemplo a seguir ilustra o, .on""ià. discutidos.
Exemplo z.1g: suponha que os comprimentos de jacarés adurtos de uma cerrit:;jil"#::;? ).*ï3 ::ï:;* pa","oni*r;;;#ïá"cia iguar a 0,0m2' Irma amostra de dez animais i"i;ïJ;ffüJ::lï:r',ïï,;'JDesejamos uma esrimativa para o po.arn"ìro d"*"aeg/;."""
, uora,ïï^S',lXl Íïlï?:jnr" de probabilidade de Ì é NormaÌ com médie variância oz/tO:0,001.r, poa"l_,o, pro""d., d" for_1.ffi:ïi:iti
ff:;ï"iJ,'i:::""j:ïï:::1":ïr^t-3j:iiìu " out". uma estimativa por intervapara p' Isro é, construimos um intervaro ae,"onriann" n;;-;;ïi:3iiffiJïEstabelecendo 7 : gSVo obtemo, Ou tuU"tu da Normal zt/2 : 2s,475 : I,g6.Segue, então, que
IC(p,nrr") 
:
1,69 
- 
1,96
I,63; I,751.
Adotando a interpretação, mencionada. acima,- de que em 100 intervalosconstruídos, 95 conteriam a verdadeira média, 
" 
â"" p"a"-J, orr", do intervaròobtido? De modo gerar, o qu" a urruiÀ",rt" conridìraâo é admitir que o intervarode confiança calculado e r- auqu"i".-liuon.,,, isto J, J"ï"ïru- a verdadeiramédia pr. Essa razão expri"u o n""*idade de, atem à" i-n-for_u, o intervalonumérico obtido, fornecei também o índi"€ de confiança que foi ut'izado. trA ampritude do intervaro
de confianç a ê,.!.ad,a pela diferença entre oexrremo superior e inferior, isro é, X * 
";;i:_"fX:;;'r-:;,tr- ;,;:,fr",o que craramente indica que era depende da confiança 7, do dásvio padrão o e do
':::::;";r::ostra n. É usual '" r"r".i. J" emi-amptitude, 
";; o erro envorvido
k::::;:":^*jll como a expressão da amplitude é influenciadaseus termo s 
." 1."^rj":-1i.os o s aspec r", in," i,i 
"ol Ë í in ïï *, ;t-ï4ü" * qca-rrqaiq{-eentgmente â nmnlirrrÁ- ,:^ ,-;,-'ì '-'
r ':l'11419ì rnarores rem maÌõÌ-podsÌbiliìladg d: 
",lc4rf-uÌa -õ 
""1affiffi]lffi;il:ï::ï#,ïg:.9,11fËo dã 0 a2,5 metros para a arrura médiaLde indivíduos adultos de uma cidaaei
também um fator
umeoruidelqlg!
importante. Uma
H
a possib:l-idads_de
''-É
2.t I
n
7,.1 1,,'.t' t i tt tttç,ãtt 1tt t r I n lt rwtlt t
àlst,r,rciamento dos possíveis valores amqstrqis ep relaç{g !,péc!-ia populacional,.
èuj' intervato de õontiança estamos obtendo. Dependendo do seu tamanho n, n
êtrr,,stra pode fornecer um valor médio (ro6r) muito influenciado pelos valores
'ex tt'cttros.
Com relaçãq- à.-amostra, temos uma clara intuição de que,-Ilg4!-tg 119igr
ftrr scu tory.qnhd -uior- seú-4 gggllld-4{q d-9-!l&fn+S1r-o-,45l9_1Í,"-"1' Note que,
pelrr expreísao da amplitude, para uma mesma variabilidade o e confiança 'y,
Vr,l,,rc, maiores de n piOduzem intervalos menores e, poftanto, mais informatiVOS.
pgr'cxemplo, para a-altura média de indivíduos, o intervalo 0 a 2,5 metros é
tlrcnos informativo. do que o intervalo I,3 a 1,7 metros'
Il.rcntplo 7.19: A, vida média de baterias automotivas de uma certa marca estí
gcrrclo estudada. Baseado em estudos similares, com outras marcas' é possível
rucluritir que a vida dessas baterias segue a distribuição Normal com desvio padrilo
llLr 4,5 meses. De qual tamanho deverá ser a amostra, para que a amplitucle do
irrtcrvalo de90vo de confiança para a vida média seja de 3 meses?
l'trra calcular o valor de n, consideramos a equação:
v/n:
o
2 x zr12 t- :3'" vn
L,64 (1 : 90Vo) e o :4,5 temos
2 zrpo 
_ 
2 x 1,6_4 x 4,5 : 4t,g2.33
Como o valor de n precisa ser um número inteiro, escolhemos o maior inteiro que
contém (4,92)2, obìendo n:25. Dessa forma, a amplitude do intervalo a ser
construído seiá ligeiramente menor do que 3 e, portanto, o intervalo será mnis
C'om os valores de z-,12:
informativo.
pelo A aplicação do Teorema Central do Limite permite a obtenção dc
iltervalos de confianç a para P, guando a distribuição das variáveis aleatórias' que
constituem a amostra, não segue um modelo Normal. Neste caso, o intervalg
construído terá um coeficiente de confianç a aproximadamente igual a 7, sendo
que esta aproximação melhora à medida que aumenta o tamanho da amostra'
Exemplo 7.20: IJmprovedor de acesso à Internet está monitorando a duraçãto do
tempo das conexões de seus clientes' com o objetivo de dimensionar seus
ecluipamentos. São desconhecidas a média e a distribuição de probabilidade desse
tempo, mas o desvio padrão, por analogia a outros serviços, é considerado igual a
'Áõ' -inuro.. um;
ou."ruuao J;;;;l amostra de 5oo rrtos. o qu" ;;".";;u;onexões resultou num valor
- 
o tempo de drrranã^ ,r^^ , 
- 
:rdadeira média' com confiançê
::*::'"".ïiiÏï"if :raçãod.as"on"*u",*o-.;';ffi ffi ":ÏÏapricaçao a; ï;#il""Ë;HïT"'ïiii:T,g, u"'" i"-"JiÍu u;au"r e bportanto, será bastan
Normar. Na verdade 
.te 
razoáve7 ro,ïï. ;," 
tamanho da amostra é iguar a
basranre boa. , com esse ,;il"ìr"l#Lir#irïï,,rï:r;j:.:,j:
Exemplo 7,21: Pteteníle-co o^+i 
- 
t'Lvvwtvdo p'
certo medicamento 
tende_se estimar a prr
do verme da 
"r":ï.1o"n,;;.oï,*ilfloreao 
p de cura' atralés do uso de uft
,n.ai"um"-n,"-ï*")lï'ïïï:f l*1#ïr.'*ïJ"ïi"1ïéumaJ^t"'"ïilroram",yoì'. ôïápoo.ro. dizer daoro]-o' uo u"uìJ, "";ï:;'' 
em aplicar o
Uma estimz
ff HiÉ"i{:*=tr#**:*fiffifr ,#í'**ffi
Nestes termc
média o" 
"À0" ã" ilL,i#,::ïï:::ïï:.conrianÇa aproximado de e2vo,
rC( t',s2qo) 
- [* - r,r5 ; X + rr1rfi]
- [rr-,,rrffi ;25 +r,rrffi
- [24,48;25,55].
Ior" nu"^, em virtude do uso do Teorema Cenrror r^ r :com coericiente de conri 
^n^-"0ì"ììã)l|rr";ï:ii:-timire, obtemos um inComo outro r
. on. id"ru. in t-"r;;:;: "Ittol^o de apl i c anto_l,o Teorema cen trar do Limi te,Evo*^r^ q ^a _ 
ue conÌrança para a proporção p.
? 
-N(p,e(t:e)r.
n
:::ï,'#Ïrï:"ï*i""* ràra a", no mínimo, -y. Lembrando que a variância de
--.
2.?.r
rc(p, esvo)' p - r,rur[@;? + t,eo
: [o,s - r,rurlry;0,8 * 1,e6
1o(: òt
tl - 
" 
I
Notequenestecaso,comopédesconhecido,ointervaloaindanãopodeser
citlculadodiretamentepoisenvolveumaquantidadedesconhecidadentrodaraiz
quadrada.
Uma possível solução é substituirmos p(1 - p)
t)essa forma, estamos utiiizando a estimativa pontual
parâmetro desconhecido p' O intervalo será:
rcr(p ,e'vo): [o,a- ,,nu1ff;o,B+ 1,e6
: 10,745;0,855 ]'
outra abordagem possível é baseada no fato que a expressão 
p(L 
- 
p) t"T
valor máximo igual ít1A',quando 0 < p í 1' Verifique essa afirmação' fazendo
o gráfico da função pçt'-. ei,"o.* I :itiJo de 0 a 1' Nesse caso' 
podemos obter
u'i int"ruuto de tonfiànça substituindo p(l - p) por Ll4:
rcz(p,elvo): Io,a -',nuffi; o'8* ''nuffi1
Iis I i rrtttçãt t Ptt r I rrl c rwilo
im, um intervalo de confiança
rnto zrlz: 1,96) é dado Por:
com coeficiente aproximado 7 : 0,95 (e
por ìou"(l - fioa).
obtida no lugar do
: [0,731; 0,8691.
Note que este intervalo tem amplitude maior que IC1'
Temos, portanto, duás alternativas- para o cál1ulo f lt:*::-*
"onriurrçuffi'o."o nri;;ira, 
dada por IC1, é úsualmente denominada abordagem
^Lr:,Á^ ^.tÁ "..finienfêrnêntê"],1*',ïì1,'Ëi; ;;;"" da crença qu? u. estimativa ::ttdl' ::t? *t""':::tr1Ï:
"r:;Ki#;^iïìJ#;"ì'"i""'i*"'"dT,1ï::ï(!:?)t"Í::i;:,ïyi*:
Ë'.ï iï :" "?) I ;.' t ; i ;;; I "91ï,": 
^ 
" :.t";1'^* 
""ï .l* ; i,ïï:ï H ï1ilïï:ff ; ur'l rïr rri, t"r, n"t' p'efúmos substituir a Ït"::t:ï:.ì:*^l:t "iÏffitr#"""*J;;;; ï,i" : rear',Assim' ":'1:::^-:ï :,::"ï'31*"1ï" ol
D
p(t 
- 
p)t
-. )
0,8 x 0,2 1
I200 I
7',
um estimador é ul
conservativa 
""ilïi"i;ï'ff ,f" ffi g lli'.lo: ao u ri r izarrmaror ampÌitude do i
c on fi an ç a oil;;. ln t"'uu o ã" lldïr:ïË;:;: *:lffi ï: ffiNa Tabela 7.
capíturo. Intervalos 1^'ol::"":"mos urn resumo dos inrervalos
s:::r*;,*lï*ï*iïl_i,,::n#:.t&ü,*ïï"+ï;ïïiïïtj
Exercícios da Seção 7.4:
l. Por.analogia a produtos similares, o temno rto n^^^=- ,pode ser consiàerado 
""r;;;;;;;j|To" de reação de umo z, rinuto, iì. n,,uoiu é desconhe.l',11iey.úãl;"J""r' novo medicamentoreceberam o mer
f":" l "; ; "; ;;,: ïffi r#, : J,:.ilïï 
={lii 
I Uï: i fudj4,8; 5,7; 5,g: 5-
confiançaou.uo',0^*1'q' ï:ü'ï,I,'í,à,t'ï',trt'Jti:rt'ti:"1:l:1*;,:,::r;i;ì
' ïïiffili#;#ï;::iï:,':il; i;;,':.," ";":. ::e 95vo para a.eaÏ' d" 8.' construa intt
3.serácoreradau"'u,uooou,*i"r"i.ï".""ïlJ:ï.:;#"i;:lï:: j|ff;;;;;:;Z:;
u q. pu.u uï"";;iÏ::'ra.de uma população Normat com de
;:l;i*,Uf Xiï';l;li:;;"f 'l::^'""';õ';;ï;ÏiiÏï:,'"'Hrente-as difer;;;;:.'"t casos em que o tamantr" o" 
"r""ro" e
Tabela 7.2: Intervalo, s de confiançapara pe p.
.qTF
1 I t,'t r't't'io,y 2.r5
* llttrir iÌrÌ.ìostra ern 100 ciclaclcs lrrasileiras, de até 20 mil habitantes, indicou que
n vltltlr médio da hora aula para os professores do ensino fundarnental õrn
rscolar mr:nicipais é de R$ 2,5. obtenha um intervalo de confiança paril o
vrtlol' tnédio nacional da hora aula em cidades do tipo mencionaclo. nascnclo
t'rrr cstudos anteriores, o desvio padrão é assumido ser igual a R$ l,l, use
'1' - 0,95.
t. Nurna pesquisa com 50 eÌeitores, o candidato José João obteve 0,34 cla
lrrcíbrência dos eleitores. construa, para a confiança 94vo, os intcrvalos
olirnista e conservador de confiança para a proporção de votos a screnì
lcccbidos pelo candidato mencionado, supondo que a eleição fossc ncsse
lììolnento.
7.5 Bxercícios
l. lÌrlam
sorteadas 20 escolas de ensino fundamental da rede privada, na cicllcte
clc São Paulo e observado o número classes de la. série em cada uma clclas, Os
rcsultados foram: 2, 3, 3, 4, 3, 2, I, Z, 3, 2, 3, 4, 5, 4, Z, 4, S, 5, l, e 2. Dcsejn. ,
sc estimar o número médio de classes nesse tipo de escola, com vistas u irnr
í'uturo levantamento de disponibilidade de vagas. Obtenha as estinrativus
correspondentes aos seguintes estimadores propostos:
Êr : mediana amostral;
frz: moda amostral;
I,IJ: Ã .
Tendo em vista o objetivo pretendido, discuta as vantagens de cada r.rm clclcs,
2. O Conselho Regional de Odontologia recomenda visitas periódicas ao dentista
e, para orientar sua campanha de divulgação, realìzou uma pesquisa corn 100
crianças com idades de 12 a 14 anos. Quanto ao número de visitas no últinro
ano, a amostra resultou em uma média de 0,5 e mediana e moda iguais a 0.
Com base nesses dados comente as afirmações abaixo.
a. A maioria não visitou o dentista no último ano.
b. Metade da população dessas crianças nunca foi ao dentista.
c. No último 0,5 ano as crianças tiveram em média I visita.
d. Talvez algumas crianças tenham feito mais de uma visita no último ano.
Capftuta 7: I4ferêncla Eshilrricu 
-
3. Um grupo de 15 al
fefruis.a sobre o T,9.:1" 
curso de Vererindria Íbi sorreado eË:iïï:HÍxï::*:i:.Ji:,,ï,;,;il;ï,:ï:ïïïlJqïì:ïïH,:
"ïf"* avariânciasegundo os esrimador.rl, ,, r, 3, 2 e
ãl : @ediana 
-d: (.;;;ï" 
--,ïï,ïtr' rì!:sz:{ÉGá,
o' 
^;H";ffi1;ïÍ: Ii :::l* : ;;
il*ï:::::":!*;mli",:*":,,1*r:*ii""?ffiï:iï::::,i:5. Estatísticas do Dena rtq,-o^,^ , :--" wrrrrlrôl'amédiade x.
o" moto-ti'"t" #-:i:mento de Trânsit
oseguinteriã"t;;'oo""oïf ::"mi;l?ïÏ::.ïil|ïilH:irï*
o l.::rlle_ a probabiridade de a médi- 
uragrama).
uma b(2;0,3) ser rnferior à I. a amostral de 3 obser
7. sendo x uma;",:ï:: I 
-' sv J u,servações arearórjas de
,, 
" 
r,"irïál;:ffi,',,'.'":ïi;:;í*ïH,li;l*" uma amosra de ramanho8. Uma amostra de
listados abaixo. n1l:t 
oot"tvações da
i?t"ht:ix:trËúl1iïï";ïffi i'ãrr"':'f'";ïff ,rÍ,:ï::ïïb.XéBernouilic
c.XéBinomiaÌcr
9. para uma Norma , ,o*' 
: 3 
" 
P: o'5'
". 
pff!;;;:' 15, 10) colerou-se uma arnosrra de ramanho 25. calcuÌe:
qF
\ l')t'r'trk'io,r'
b.t,(4,s<X<tr,11;,
t. Ir(X { 4,T ou Ì > 5,1),
l(1. lim l0 observações de uma variável seguindo o modeloNormal corn rnéctiu 3
c dcsvio padrão 2, qual será a probabilidade de a média amostral:
:r. Ser superior a 1,5?
b. Ser inferior a 0?
c. Não se afastar da verdadeira média por mais de I unidade?
I l. Trinta observações de uma Normal com média p e variância 36 são colctaclas,
a. Calcule P(lX 
- 
pl < :)
lr. Determine o valor de a tal que P(lX 
- 
pl > c) - 0,g.
12. Sendo a variável amostrada uma Normal de média p e variância 25, obtenht cl
vaf or de P(lx 
- 
pl < z) nos casos de tamanho da amosrra igual a 2,20 c 60,
Comente os resultados obtidos.
13. considere uma amostra de tamanho 30 de uma população Normal cle nrécliu p,
e variância o2. Derermine p(lX 
- 
pl < r) nos casos em que o2é igunl u ló,
64 e 100. Qual a conclusão?
14. A duração do "tonner" de uma máquina de fotocópias pode ser moclelndo
como Normal com média 15 e desvio padrão 2 (em milhares de cópias), pura
uma amostra de 12 fotocopiadoras a duração do "tonner" será observncln g
pergunta-se a probabilidade de, em média, durar:
a. Menos de 16 mil cópias?
b. Mais de 13 mil cópias?
c. Entre 12 e 14 mil cópias?
15. uma máquina enche pacotes de café com um peso que se comporta como umir
variável aleatória Normal de média 200 gramas e desvio padrão I0 grarnas.
Uma amostra de 25 pacotes é sorteada e pergunta-se:
a. Qual é o número esperado de pacotes da amostra com peso inferior a 205
gramas?
b. Qual é a probabilidade de que o peso total dos pacotes da amostra rriro
exceda 5125 gramas?
16. Para se ajustar a uma máquina, a correia deve ter entre 60 e 62 cm clc
comprimento. Tendo em vista o processo de fabricação, o comprimento dcssas
comeias pode ser considerado como uma variável aleatória cãm distr.ibuiçÍio
Normal de média 60,7 cme desvio padrão 0,8 cm. pergunta-se:
238 fnpilulo 7; lnlt,rirtt,irt li,yttttl.t,tit,tt _ Ii.
"' lïït ï"t#babilidade de uma correia' escothicJa ao acaso, poder ser
b. Um 
i:,11r1.T::T:o_or,o"^ïu: coneias esrabelece um conrrote de
ffi :' :i',n:" :#,tj: j l' *:::' " r " ;" ;;; ; ;;;;.ï' ïff : ï ï:.Jflã
f ;; 
" 
ï" "" ff ï,t"':T:l l",TÍj' : f i r "ãïï* ;" ïï " ì #.iï: ""::, il' i
tr.,i;i,"ïï:,;:::,"":::1:i::i,_" de uma ,ffitoria x com disrribu
*:::l :: 
"ï:: : ï: ";, 1i.,: " " " ;; ; ï;' ; ô:' ôï'ï:ï* J: ï,ï#'"'ilw l.rrnilnnoffi,"ï,r::i,lïl;jïlo:?? o: probabilidad", u Àédiu urno,ú,não difiramédia da população por mais de ã unidades?
18. Seja X-N(p,,36).
a'Para uma amostra rre tamanho 50, obtivemos média amostral 1g,5. co
^;1ïY,1""'::ï:,:"ri","ç2.s-rvo,ó;%;;;%';;."u"f, 
o""'o,'o'
b' para uma confian ça de 94vo, 
""".,-ì'.í;;"ï;. ï" 
"onfiunça supondo trêrtamanhos de amostra 25,50 e 100 (admita que ,"J* i"-"ceram a mesmÂmédia amostral igual a lg,5).
c. Comente sobre a precisão dos intervalos construídos em (a) e (b).
19.Interprete e comente as afirmações abaixo:
"' niÍjide sarário iniciar pu.u r".e- formados em Economia esrá enrre 7 e
b. "euanro dilï"":fr::i:ïi^^!-,1"?oi,^3ior é, aprobab'idade da médiaamostral estar próxima aa verOaaeira médiar,.
,0.ilifi,r#0"",f:,1ïïti1,ï:,1,:ll:ll",coresterol 
é uma variâvetalearória comÍlïï:Jf::T:ï*i:T:iT.1ï;;hJd"";;;#i:iï,iii-i;,
". :ïï,ïï"ïii ï: 
"1:.1,^,11, "* 
; Ëd ffi;ï:l #Ëiï3e c o, e s tero,
S: lSt"lqlll, c on stru a o i nterval o d; ã"iü; o J'r,;A :b. Se você desejasse diminuir 
" "_pfl,rã" à" irntervalo encontrado em a), quaisseriam suas alternativas?
,t;"ï""ï;ïi:"0;,:ïo::,,:.:i 
u. 
:.u, variâvet areatória com parâmerrosi:ff#ï j:, j r :: 
"':*:::v' "r : :r 
;rd'* ; ; ï'i' :J: ï*'ffi :i:ï
*?:ïïJ.ï1T:"i"""ï:::::ï"-::'iã.!;"ï;iï;;'i'3ï:áïi?,"""*":
lïï:ïtr"::ï:::j"_"^ j:i,umomédior;;;ï,:i,lá,ïi,;íï'."ï jfiïïff.ì
:ut:1l9veis desse modelo e observa_", ;;;;tiJ"r".a. Quem seria um estimador Oo 
"on*.Ã médio paradesse tipo?
ì
todos os automóveis
---
,{+Fs
2iq1 lt ti'tt'ít'itt,r
h. Sc a arl-ìostra Íbrnccctt uln consumo médio dc 9,3 krn/l, construiÌ tllìì
irrtcr.v0lo cle confianç d (94Vo) para a média de consumo desses cal'ros.
r.. sc a arnplitude de um intervalo de confiança, construído a partir clessu
atììostra, ó de 1,5; qual teria sido o coeficiente de confiança?
!2. ( ) irrtcrv .aJo 135,21; 35,gg), com confian ça 957o foi construído a partir de uttra
iilrìostra de tamanho 100, para a média p de uma população Normal cotlt
rlcsvio padrão igual a 2.
r. Qual o valor encontrado para a média dessa amostra?
ll. Sc r-rtilizássemos essa mesma amostra, mas uma confiança de 900/o, qutl
seria o novo intervalo de confiança?
2.ì. A dosagem de certa substância no sangue segue distribuição Normal corrr
rrródia pr e desvio padrão l5 mg/I. se uma amostra de tamanho 25 fot colctaclu,
clctermine:
l. A probabilidade de lX - pl ser inferior a 5'
lr. O ìntervalo para É, com confiança 98Vo, se temos Í otts= 98 mg/l'
2.1. Uma amostra de trinta dias do número de ocorrências policiais em um ccrto
bairro de são Paulo, apresentou os seguintes resultados: '7,I1,8,9, 10, 14,6,
B, 8,7, 8, 10, 10, 14,12,14, 12,g, r1,13,13, B, 6, 8, 13, 10, 14' 5' 14 c l0'
a. Fazendo as suposições devidas, construa um intervalo de confiança pilrü n
proporção de ãias violentos (com pelo menos 12 ocorrências). Use os dois
enfoques e a confiança de 887o'
b.Emu-ono(360dias)ecomamesmaconfiançadeBsTo,qualscriau
estimativa do número de dias violentos nesse bairro2
c. Dê uma interpretação para os intervalos encontrados em (a)'
25. Antes de uma eleição , um determinado partido está interessado em estirnar u
probabilidade p de eleitores favoráveis ao seu candidato. uma amostra piloto
de tamanho 100 revelou que 60Vo dos eleitores eram favoráveis ao candidatO'
a. Utilizando a informação da amostra piloto, determine o tamanho da amostra
para que, com 0,g dá probabilidade, o erro cometido na estimação seja uo
miximo 0,05.
b. Se na amostra final, com o tamanho obtido em (a), observou-se que 5l% cltls
eleitores eram favoráveis ao candidato, construa um intervalo de confiança
para p. com confiança957o.
26. A análise de ocorrência de um mineral numa região é uma variável aleatória
com média 4 e variânci a 312. A unidade de medida é porcentagem de mineral
por unidade de volume' Para uma amostra de tamanho 20:
24Õ fnpltulo 7; ln.f'er?ncltt li,rttttí,t,ticrt - Ils
a. Que dizer da distribuição de X?
b. Que tamanho deveria ter a amostra para que p(8,5 < X < 4,5) : 9,96727'? tempo de reação de uma pessoa a certadroga é considerado uma varlraleatória com média 5 minutos e desvio padrão 3 
-i;";;;. Esse tempomedido em uma amostra de g0 pessou, 
"raolhidus, sern reoosicão na eirnrisão paulo. r"rg,rn,u-r;;;"ilffilff: ;'":"'t'tas' seïr reposição, na cidade
a. O tempo médio amostral ser inferior a#b. o tempo médio na amostra não diferir da verdadeira média por mais de 0,
28' o comprimento de certo tipo de eixo, produzi.do pela empresa Duroaço,
:ï:"t""^nj::,:l1l'::t:9: n"ni para peça. A tei de pron"uirìá"ãe ;*#;
:"ì?: ::;'"n"iï: ",: : 1".: : on I "" i g u., p órém admi," _, " qu " o ã;;;il ;ffi; Ë:ï::ll::: uT1. uTo:tr_a ateatórii a" róô -ã",*J"ãr.^";;"dJ;;comprimento médio de 4,52 milímetros.
a. Construa um intervalo, com confiança 90Vo,
desses eixos fabricados pela Durooçà.
o. 
?.:^r:l_11::ïï"nuo lur? o intervalo encontrado. Será que podemos di
::: ", 1il:.valo. enconrrado em (a) tem probabilidade ;ïíü;'"*";verdadeira média?
29' Numa pesquisa de mercado, desejamos estimar a proporção de pessoascompram o sabonete Bom_cheiro.
". 3.ï:j:f::*j::f::: fevem3s.cylher para que, com probabilidade 0,e;
b.
c.
estimativa não se desvie do verdadei.o uuior;";"i;;;ï;ïi
Se tivermos a informação adicional de que a aceitação do sabonete ,Bon.cheiro é no mínimo 0,g, qual deve ser entâo o tamanho da amostra?Decidimos colher uma amostra de tamanho g1. eual o erro máximo quecometemos com probabilidade 0,9?
pata a média do compri
d' Para a amostra de tamanho gl, qual a probabilidade de que o erro máximoseja 0,08?
30.
,iï::1"::-: :?:ti:: Llolajstriluição Bernouni de parâmetro p. uma
1ï"ï*:tatória.de tamanho 2 é retiradacom o qúj"ìr"ã ã"^;;;,_u, '^ r;rï;,
1ï,j;"?*":ï1T:g"l:,lo,proposros: fr,= i" 
"-' 
i,=-0,ã Xr * 0,2 xzl.obtenha a.distribuição amostralìesses estimador", 
"-'ií"nrã o" il ;Í;,ïsuas propriedades.
31. Sendo X- b(n: I},p: 0,5),pergunta_se: ì
a' Para uma amostra de 2 observações dessa variável quar é,a probabilidade damédia amostral ser superior a 9? Justifique.
'-t
5 I: r,'r, ti'lrr,r
241
h. l,ru'l Llrno amostra clc 1(X) obscrvações dessa variável qual é a probabilidade
rlir rnóclia amostral ser supcrior a 4,72 Justifique'
l,lrr.il cstimar a média das alturas (em metros) numa certa população, dois
irrstitutos de pesquisa coletaram cada um a sua amostl'a e usaram estimadores
rliÍcrontes. Os resultados estão na tabela abaixo:
Tamanho Estimador Valor Observado
lnstituto I nr :100 frt:X l-,68
lnstituto 2 nz:200 fir:(mar+mi.n)12 I,73
Núm. de viagens 0-2 0-1. e e+r 0+2
Probab. 0,1 0,2 0,2 0,4 0,1
Aprcsente justificativas ao responder as questões abaixo:
rr. Você acha que o valor 1,73 está mais perto da verdadeira média por teÍ
vindo de uma amostra maior?
lr. A verdadeira média deve estar no intervalo 1,68 até 1',73?
t'. lnclique qual das estimativas você preferiria usar'
t-1.()tempodeemissãodeextratos,emsegundos,pelocaixaeletrônicodeum
banco foi modelado segundo uma distribuição Exponencial com paÍâmetfo
ll40.Parauma amostra aleatória de 50 clientes que solicitaram extratos:
lu. Qual a probabilidade do segundo cliente sorteado na amostra demorar muis
de 30 segundos na sua solicitação?
ll. Determine a probabilidade de que o intervalo médio de emissão, entfc os
clientes amostrados, seja inferior a 35 segundos?
.ì.t. O tempo de espera, em minutos, na fila de votação numa certa zona eleitot'Ul
com urna eletrônica, foi modelado segundo uma distribuição uniforrnc
Contínua com valores entre 0 e 30. Para uma amostra aleatória de 100
eleitores, resPonda:
a. Qual a probabilidade do último eleitor na amostra demorar mais dc 20
minutos?
b.QualaprobabilidadedamédiadaamostraserinferioralSminutos?
c. Você deseja pedir a um amigo que espere um tempo t pata lhe dar umtt
carona. usando a média da amostra, qual deve ser o valor de t para niict
perder a carona com probabilidade 0,8?
35. Admita que o número de viagens ao exterior é uma variável aleatória, com iì
distribuição abaixo, sendo que o valor de I depende da profissão exercida'
0 
€ {2,3,4, ...}.
z42fl EnpftuIo 7: In,ferênritt Fl,rtttt(ltlittt .
ïfi ,i":ï:11::::",1?9u"-,:,,isroé,"b;;;''õíi":,::::t:;Verifique quantos deles contêm a verdadeira média.
3ffi:::Ïi3;Ji,illïi::l:"'-"ïT'nte' indicou qug rez 4 viagens ao
r í)rroio oã^ ^^ ___r 
maçao, responda as questões abaixo:a. euais são os uut-"r_1:-rri;;t, J" d p*;;ffi,ìrXïffinoiurauob' Dê uma estimariva para o varor oe à. hoique o critério utirizado.tor:Yir""""r"iiliiÍ"ï?f""rï.oobjetivodesimutara{istribuieãoamosrrÂr
Gò òçËur'Les laretas: ì r:-
a' Gere 100 amosfas de ramanho 30 de uryaì{-orl com média 200 epadrão 5. Calcule, então, 
^ ^áiâ- Ëcorrespondenfe à es.o na-i,...r^ , , ,:udu amostra e faça o histco'espondenre à esse 
.conjunro oe meoias*J,,iilï:: il1t:J.il:lïiïlï"jï:":*:1"^:*au. a",",i,iualã;. 100 médias obtidas e comê,b' Repita o item (a) paraas amosrras ,","0ï"0:ï"#ï,ï:#iii;;:ili.
ffijffi í^ir?Íi:"Í:ï*.u ïfeito do hisrosrama e das meddescririvas obridas, t"nao 
"- 
uir; ; ïffi;;Ë"ï',.",ï:ïïJ,j"r ruuu
37' (use o computador) para estudar o comportamento do estimador,s2, gere ü;i::ff:.]ï"jïl;*ï 3?,,!:.ïlu-,u^lonenciar de parâmerro r/5. Em crlïï,ïlï;jÍï:l;;ï,''ativa de s, òo_ u, H 
",ï#,Ïïlï"íi;*ï,j
variância do modelo;ffi.XÏeama para comparar esses resulrados cor
38' (use o computador) considere os dados apresentados no arquiv o aeu,
::ïJffi:ï'i" lf,,::^^::r,t:,g rlnf_ representam uma amosrracomunidades de baixa rendaïo nur'í,alii Ëff::ïiïr:H"rïï;estimativas, da média a a" 
""rã".ìï ãvaríáveis: Idade, i"Àporp, Resid e Renda. 
:ssa população para as s
7:,;:;::::';l;ri )iÍT" .i"ï,::!:::',ao djdátiy e não prática, poisv e r d a d e i r a m é d i a n ã o fa a s e n t i d o c a t c i t a r *, 
": 
*iïi, ; r:::rr:;:; :, í; rX Ji,tr.ÍYfr"ï,ïïfïr:iiïÌ_1,-11". 
a coreta de 80 observações deïï"ï113;,ï*:','*i"-t'r';'i;.;õil"ïi'ffi ;;,1"^ uma
40' (use o computador) Gere 200 observações do modelo uniforme contínuo10,201' consrrua um inrervaro a" 
"""ï""ç ag*vopuru u Leãia. Repetindo 120vezes esse procedimento, quantos intervaros 
.ont"rao 
-u-i"roua"i 
ra média?Comenre os resulrado. 
" ";;;;i*", àr"r.
H.
243
'-
pÍtulo 8
fcrência Estatística - Testes de Hipóteses
ã,1 Introdução
Apresentaremos, neste capítulo, um dos principais tópicos da Inferência
Estrrtística conhecido como teste de hipóteses. Motivamos conceitualmente t
téclricl através de dois exemplos que ilustram sua utilidade e o tipo de questões
qur: procura responder.
E.tttmplo 8.1.. Suponha que, entre pessoas sadias, a concentração de certn
ãuhstância no sangue se comporta segundo um modelo Normal com média l4
ttnirllcles/ml e desvio padrão 6 unidades/ml. Pessoas sofrendo de uma doençO
crpccílica têm a concentração média da substância alterada para 18 unidades/ml'
Arlrlitimos que o modelo Normal, com desvio padrão 6 unidades/ml, continun
l,r"rllrcsentando de forma adequada a concentração da substância em pessoas cgm fl
rlocnçâ. A figura a seguir ilustra a situação descrita'
Note que as curvas, representando as concentrações,
irão se cruzaf em algUnt
rnomento, fazendo com que uma certa proporção de indivíduos na população
sadia possa apresentar valores de concentração tão altos quanto aqueles
observados para pessoas doentes, ainda que este evento ocorra com .baiXa
probabilidade.
Sadio
\
conhecendo
média. Repita
de confiança,
244 Capílulo 8: Ittlrrêrtcitt li,rttttl.rtiut; ,l,t,,t,ta,r tle I
Desejamos averiguar se um certo tratamento, proposto para comb
,Xï,ïft í "ï:::;"ïT, :11,1j1 "tajó;;; g" raman h o n : 30 é ser ec i o n ad aindivíduos doentes que roram ."b;;;;'ï:"ïL1#;,ï ï:HïffïXï"uJconcentrações dos indivíduos da amostra po, Xr, . ,r;;. Suu"oq, que !i : 1,2,... ,80, remos xn 
-_N@,ãâ),"r"ï* tt.: 14 ou 1" :18 dopèndendo
::,:::::1-1::rï1"n,",:u nao. òuro í aJostra de 30 valores fornc"o 
'a,^- *rd e c o n c en rraç ã; ;ï; ï :;# ;": ï: i .ïï::ii 
"," "r"?.#: i: ï ::ïil;iKïÍ;iïi; ".:, l"ï ï::il:,llJl u"i" " ffi,; : fi ï un i dades/m rrevelaria crer que o tratamento up."rlíu" ,íJ,"JiÏ:;,,ï?ulÏ::0f;ll"#'r:
#ïïïÏ jni::::*::^"'*10,'y'.**, poo"- ser vistos como membrospopulação com concen tracão 
---i-r^']lvò Puuçr, scr vlstos como membros
ffi"firií j:ïTïïïïË"itdl".i-Çi!,i,!li;;tln*:,ïï?i,,.ï;"próximo " dependè, entre ouìros ruto."r, ";;":::i::;:;^oiï"t'" signirica
^;xiiil; 
jiT:, : :ï::ï,i j: : o l"ãi,ï,s é ar e at óri 
", 
n."",ï ïlJ.,ïï','"jÍ,ïprobabitisticamenre o,prúrema, 
" 
;;;'.';ïì.;J';i:ï:ï ffïJ:ïï:ï:ilildenominada kstu de iipór"r", o";"; *ua,o 
"o* ,orrariio ,orh"rido eobjeto de discussão na Sàção g.2'. ' -' "'
,to 
"l"trôni"o Jil ffi ï j:" 1 ;'0,:,',ï"f l';;:l'ï : * 
^ 
i:,::, ";r;1;{'ï# ïe rabric aç ão d oequipamenro, é possíver.admitir il;; n-lJo*J"áJïïïiffi ,ï"" ::ï:',ïr,ï,rï;é' após cada impacto, exisre 
"-";;;úãiriouo" p o" q* ;;;,h". Representandopor X a variâvel aleatória 
"ri*"r, ã""i_pactos anteriores à falha, pretende_se
liï'"ï se o modero ceométric; ;,^;: ;,';;ï;;;:;ïr:'r:l^caracterizar essa
A decisão que precisamos tomar é, aceitarou não o modero sugerido. Noteque não é um simples varor a" pu;-"t.o que está sendo festado, mas sim aadequação ou não de uma função O" p.oOuOiliOuO..
Nossa conclusão r"rá uur"áJu-no. uutores amostrados da variável deinteresse' Neste exemplo, foram er"Jrrioor, ao acaso, g0 e
;:ff jï:iït?rï ; sucessivos i'npuao, rermo-erérri"o, *unïnifiiâtij,"oïl
rjiiiïi,,Ë*Í:ri" j,ï:.,í{ï:,;#:ïï::ïó**Jï*:ïã.",#
observados,o*;;'"xïi,H:Hi",'"ïj,ïr!ì-';r1,;;;ïï,â"ïJ*1ï',"Hïiï
grupo de varores) e 
:uas 
respecrivas freqüências ;" ;;;rrê";ãr. podemos criar,;ffi;:lilllïïl?ï;,um càrto ";.;;;;" "ut"guã,ï;;;; contendo um ou
'q-n
I Itrlttxlttç'ãtt
rrssociado à decisão. Vútu."-ot a esse problema na Seção 8.5' tr
i.unrport", coletivos acha que a n91tu{idad9 é puito 1Tp::tun'" e pretende
etrtrr k sendo o total de categorias a o4 c ei, respectivamente, a freqüência
obsr:rvada na amostra e a freqúência esperada da categoria i' Note que valores
õ_,i,"*r-a" e, inai"um que ò modelo pode ser adequado aos dados. 
Por outro
ïrrr.lu, uulor", uti-u de um certo ponto crítico q" d?u?T.levar à decisão de rejeitar
' 
rrrodelo. A determinação de q"ìepende da distribuiçáo d2Q2 e do possível erto
I
245
jScomodeloGeométricofosseverdadeiro,deveríamoster,paracada
ïêlor rl'Ì variável x, a freqüência observada não muito diferente daquela que seria
gÃi.,,t,,r'tn através da distribuição Geométrica que-é denominad? I::T::':
ãï1,,,,r,rtr,. Devido às aleatoriedaães envolvidas, poderão ocorrer 
pequenos desvios
ã-iri',,t,, assim o modelo ser adequado. Portanto, vamos decidir pela 
aceitação ou
Fão tla clistribuição Geométricá, avaliando a "distância" entre as freqüências
ãrp"ru,tn,, e obseivadas. para avaliar essa distância, consideramos a 
quantidade
elerrrtiria não negativa Q2 dada pela expressão
n,: i(o'::L,
' i:l
Os exemplos acima apresentam duas situações típicas de teste do
5ipóteses. No Exemplo 8.1, o teite se refere à média populacional, enquanto 
que
,,,, e^",''pto g.2, aãecisão é a respeito da função de probabilidade. Apesar de
ostarem em diferentes contextos, o irocedimento conceitual do teste é similar' Na
próxima seção, vamos apresentar a estrutura geral dessa técnica'
Ilxercícios da Seção 8.1:
l. Identifique as hipóteses que estão sendo testadas em cada caso'
". 
e à*purrnìu de tànsporte afirma que, em média, o intervalo entre
sucessivos ônibus e oe ts minutos. uma associação de usuários de
transportes coletivos acha que a pontualidade é murto lmport
testar a afirmação da companh ia. Lv " 
,1-' p13.,<1,y4 tl"+ 45
,il
\
1r ì'
,\
!,
,),b. os amortecedores de automóveis que circulam em 
cidades duram em média
30 mil quilômetros, segundó informação de al8umas.. ofici1al,
' 
especializadàs. Um proprietário de automóvel deseja testar essa atlrmÍìçiÌo' r'
c. um veterinário 
"onr"goi., 
ganho médio diário de 3 litros de leite por v4cit
com uma rrouu 
"o-pãsiçaã 
de raçáo. um pecuarista acredita que o ganho
não é tão grande utti-. ,U" = Za-rr-J'rlL' 11- '':l' 3
2.Garrafasdecervejadeveriamconter600mlporémexistemflutuações
-- 
"r""ià.i"s. os órgãás 
de fiscalização permitem oscilações e entendem esse
3.
t:_ 
__
246 Y
assim. Você poderia ajudáJos e indicar co;"'';;;,,q. 
"'il'#";4. Deseja-se verificar se o número de falhas
procedimento para ãecidir robr" 
-ur"it;õï ;r; # #3ij ïïr:::::t. 
::,i"*:Yï":*T^:-11:1" g" uma moeda, são feiros 100 lançamentos d
ïÍTr:"0"^ ïs é contado. Aceita_se oequitíbrio da moeda ,"'ffi:ii:
eficiência do critério.
uurslu(Js gn
ï;:? lïiÌ:.j.il" conrrário, a moeda é consideraau ui.tuou. Discuta
.---
?'l'rrt,' l)(tr(t (t Médkr Pttpultu'lrtnttl 247
lrlirrlc a iD. em qualquer uma das
:lrrsõcs discutidas acima:
decisões. A figura, a seguir, resume fls
É importante ter em mente que, para a argumentação anterior ficnr
eO'rpleta, pr"iiru*o, determinar o valor r" e quantificar os erros associados às
purrfu"ir conclusões. Observe que, sendo X uma variável aleatória, corremos o
lis.,, de concluir incorretamente que o tratamento é eftcaz' Ou, de mOdO
rcç,íproco, decidir que o tratamento não é eficiente quando ele é. Portanto, ó
neccssário estudar e quantificar os possíveis erros associados à decisão tomada'
As duas hipóieses sobre a eficácia do tratamento são denotadas por .Fí,, e
11,,. e, usualmente, denominadas hipótese nula e hipótese alternativa,
t'cspectivamente. Assim,
Ho : O tratamento náo ê eficaz;
Ho : O tratamento é eficaz.
Iìssas hipóteses coÍrespondem aos diferentes valores do parâmetÍo p et assim,
, podemos reescrevê-las como:
Ho : lJ : 18 versus Ho, : 11" : 14.
Ashipótesesdelrnrclq4afolmaagima,semconte.r_-desigualdades,são
t t' t r ,.1\íf,1, ;s ( 'ft t p lt u h t 8 ; l n|i, rl u c i t t li.r ft t t í,r t i t.t t : .1,t,,,1 t,.r t I t,
número como a média do.s conteúdos engarrafados. Discuta um critérioaplicação de multas por diminuição do .oït",iOo enganafado.
Um fabricante afirma que sua vacina previne g0Zo dos casosdoqnea,_Um grupo de médicos d"."oniiu que a vacina não é
de uma
tão efic
8.2 Teste para a Média populacional
Vamos desenvolver as idéias gerais de testeinicialmente, que o modelo Normal é aãequado para osgerais serão comentadas ao final desta seção.
de hipóteses supondo,
dados Situações mais
)ï ï"":* I ;,f "" : *,":::ï.::1ï ::: em res tar s e. a médi a p opu I ac i on ar(r[.r
irl*),?,,!^o:^"i:::T-?re.os indivíduo, p".,"n""m à populaçr" #rïoJ::""t"ïI1
::,;ï ::ï:_: j:: trl1l " t t, y1lo. qu" ..à,,".f il;;;õ;drr" ï" #;Hïffi :;iiï,#1Y:":ï, 1- T:dt". popuracionar,,tli;;i";;',;"; ;*n'ï ;#i;
:il:ï::: : 
-" ? ":,ï1 o'. n ã; ;; "ï;i; ;;;;,"* ïï , :'3L#" J*: ï 
"ï:ï;lï:l:ïii""i:f:i:r::1o-!:""u,,õ-.-;."-;;i'J::'ffi ïï:J:',ï:ïeficâcia do tratamento proposto.
Pelas suposições feitas no Exemplo 8.1,, a concentração da substânciasegue um modero Normar com desvio pádrao o" o uniáuãrv*r Então, para
otamanho de amostra iguar a 30, a média amostrar terá distribu içã,o N(p,, 36/30).Por ser uma variável aleatória, 
-t poderá apresentar uuro.", maiores que 14,mesmo quando F: L4. De fato, sabemos. que p(X > 14 I tt : I4): 0,b pelasirretria da distribuição Normal. um critério que pode ,"rìtftruao, para decidirsrlrre o valor de pt,'ê determinar um varor crítico, digamos r., tarque, se x forturior que r", concluímg, ql"-l amostra pertence-à polpulação "com média p : Ig,rrrr scj., o tratamento não é eficaz. por ãutro lado, quando a média amostral forr.'i'a(ìr .tr igual ao varot 
.r,., 
concluímos que a amostra pertence à população comnÈrlirr 1t' : 14, sendo o rraramento considerado eficaz,.ii;;;;p, como x é umavgri:ivt'l irlcatória contínua, em termos probabilísticos, poddfnos incluir a
,t"nolr;níaiífi fr *iií'rlplã,*Ú-nq's-,99mqq-o-usol:.4n4teggvccmpostas'
ustas últimas podem ainãì-s-er-õraJiiriCáOas õõmó ünj!4érái; õs--b-i,t-atèÌaií
clenominadas
tfi_grd-"úod*'sr_ainã-a se, úJ'lri"adaó õõmó ü'jiqtéráiJ õq-u-i,t-atOtnig
clependendo do interesse do pstu-do'
No caso do tratamento ser eficaz, é razoâvel assumirmos que ele foi capaz
de fazer com que os indivíduos da amostra mudassem para uma população cuja
média é inferiór a 18 unidades/ml, caso contrário, se o tratamento é ineficaz, p,
não se alteraria. Assim, as hipóteses de interesse seriam escritas como
Ho i F: IB versus Ho : 1t' {-18,
Nesta situação, temos--o l:e! te Qe lipó1eses unilateral'
248
'{"ç'
eapftulo 8: Ittlt'r0ncfu lilttttít;tiut; Tt:,rtt:.r dc IIil
IEIF'
,\.J ??,rlr' l\tï(t (t Méilfu Pqnldt'ilurttl 249
_se 
o tratamento produz algum efeito, se,ia ele
18), devemos construir um tustu*de hipóíeses L
Ho i F:78 versus Ho,: l-t# Ig.,
Por conveniência técnica' sempre, deixamos a igualdad) na hipótese nula.os dois erros que podem ser cometido 
" 
g/ ," rèahzar um testehipóteses são:
_ I (i) Rejeitar a hipótese .ÉIo, quando tal hipótese é verdadeira, e
,"t'"\ (ii) Não rejeitaia hipótese ã, quando eia deveria ,"r."i"i,uau.
Note que nenhum erro é cometido e a conclusão é correta, quando rejeitamos
e ela é falsa, ou, quando decidimos aceitâ-ra, no caso dela ser verdadeira. Ao rcometido em (i) denominamos erro do tipo I enquanto que ao erro emdenominamos erro do tipo 1L A figura, a seguir, ,".r,n" u, porriu"r, situações:
Figura g.I: Erros associados a testes de hipóteses.
como veremos- adiante, uma parte importante do teste de hipóteses
controlar a probabilidade de cometermos o 
".ro 
do tipo I. Essa probabilidadedenotada por a, sendo B a probabilidade de erro do tipã U. tsto e,
a: P(erro tipo I) : P(rejeitar Hol Hoverdadeira);
0 : P(erro tipo II) : p(não rejeitar H,l Hofalsa).
Considerando as hipóteses I1u : 7_r :
seguinte interpretação para os erros:
rv : P(concluir que o tratamento é, eficazquando na verdade ele não é);
{) : p(conctuir que o tratamento não é efrcazquando na verdade ele é)'
A situação ideal é aquela em que ambas as probabilidades, a e B, são
1rr(rximas de zero' Entretantó, é fárcrl ver que à medida que diminuímos 
rvn a
plrbabilidade de erro tipo II tende aaumentár' Identifique, na Figura 8'2, as áreas
rclativas a a e B e veia como, dependendo do posicionamento de tr", a diminuição
tlir írrea correspondente a a implica em um aumento da área correSpondente a B'
l,cvando isso em conta, devemìs cuidar para que, .ao definir as hipóteses' o erro
rrrais importante a ser evitado seja o erro áo tipo t A sua p19p1b!!idad19 lgnos o -
rrorne de nível de slg!19ryçLa-do-teste'
Pata verificarmos(p < 18) ou danoso (p )
14 xc 18
RrBiAo rt, Rri"içoo i R ção
Figura 8.2: Representação gráfica dos erros a e P'
supondo a conhecido, vamos descrever çomo determinar o valor crítico
:r;,.. Inicialmente, note que
com z 
- 
lú(0,1). Portanto, dado a obtemos z"natabeladaNormal e calculamos
r" da seguinte forma:
a: P(errotipo I) : P(rejeitar Hol Houeldadeirl)
' X-u ,"-18',: P(X 1r"lF: 18) : 
'(;mt u6,
: P(z 12"), t---'
Sadio ( 11, )
IB versus H, : F < 18, temos
250
i
- 
_n"_79L4--' 6/Jn
Por exempl o, paraa : 0,05 ternos,
Capltuln 8: Inïbrênt:ia Ettttttí,rtit,tt: Tt,rtet ile I
) r,. : L8 * z"+)
\/Bo
0,05:p(Z<2.)è2,.
logo,
r" : 18 
- 
1,64#õ: 16,20.
Umavez colhida a amostra, se a estimativa.7'o6ré tal que ro6, { l
:"#,::::j^t::,:::::la concluindo que o rratamenro é, efrcaz.A regiãopelo conjunto dos números reais menor", qu" 16,20 éo"no.i#ii:i:;r;:Rejeição ou Região crítica e representada por RC. Assim,
RC:{r 
€lR:e<16,20}.
Denominam os Região de Aceitação (RA) aocomplementar de RC.
,s; ::n;',.:"lj:ll l:-:".i. i",,r'nu-, iï'zl; : r r,;;; q ue perrenceRC, rejeitamos 11o ao nível de significânci--v' rvJvrlqr'vò rro 4u rlvel oe slgnlflcância a:0,05. Graficamente a situaçãopode ser visualizada na Figura 8.31 
"- 
que as curvas reDresenrâm q rÌicÍriL,,i^ã^as curvas representam a distribuição
i:,ï'!ï;*"::,,::,:oi:i?lerinidap'ln-ri-:il;;ilï;i:;::;;:ïï::H" (p : L4 para a curva Sadio).
Resido d( R!eiçào2220 18
ì,,;,
Fígara 8.3: Representação grdfica da região de rejeíçãp_ unilateral.
Sadio ( 11" )
r--
--
251
A construção de testes de hipóteses lilg1erylq é feilt !-9 ryr-4xeira similqr È . -
gpurr"nodu poru à 
"^o- 
üni!a19-gJ, 
-eIq9la,qug. qgqla, devem-oq-c-qpriderar gJng
ãïsino de ilejeiçãq-c-oú'peúà-!ç- dueq-pgger-4qj-u1tas,-Pari, "l:T{:T,i:
ã.1 I'ttte pilr(t u Média Poptrlü'hurtrl
,ãitf,,nt,o que p; é uma 
"óntiútôiôntróciaa 
e que as hipóteses nula e alternativa
ãtlo cxpressas como
A l{cgião Cryyga' serâdadapsr--
RC;fut eR ic í-{,", Ptt-g) 16}*
e, piìra um valor a fixado, determinamos os números Íc1 e :x', de modo que
P(N<ïctoL4X>r"r):a'
Dirda a simetria da densidade Normal, distribuímos a massa a igualmente entfe as
cluas partes da Região de Rejeição' Isto é,
P(X < r,,): P(X > r"") :
A í'igura a seguir ilustra, graficamente, a escolha dos valores críticos.
x", lro x',
Figura 8.4: Representação grdftca da região de reieição'bilateral'
Nopróximoexemplo,faremosumtestedehipótesesbilateral
calcularemos a probabilidade do erro tipo II'
Ho i F: [Loi
Ho : p.f po.
a
2
o
-e2
Distribuição de X sob Hs
252
tempo médio sofre arreração por influência í" ,"u"a"";-. Ëà;J,;J;ide interesse são:
Ho : as cobaias apresentam tempo de reação padrão;
Ho : as cobaias têm o tempo de reação attera'do.
:rïr,l;:ïnoesrarísricos, 
rais hipóreses envotvem o parâm etro 11, e podem
Ho: F: 8,0;
Ho:F*g,0.
uma vez que o teste envolve a média populacionar, consideramos a médiaamostral x para consrruir a esratísrica o",lr," 
"-";;;";;" x - N(u.A\.Tendo em vista a especificação de Ho, aregião críticaserá da f";;;' - '" \É''' Td'/'
RC : {r e jR : r < rc.l ott a > r.r}.
Logo, fixando a : 0,06 temos:
0,06 : p(emo tipo I)
-I
: p(rejeitar Hol H, verdadeira)
: P(X 
€ 
RCI/, : 8,0)
: P(X < rcr ottx > :rc2l p : g,0)
: p1X - 8,0 
. 
r", 
- 
8,0 
^,. 
-X 
- 
B,o 
- 
r." 
- 
g,o,
'\/4110 - lTm "";m r 6t
:p(Z{z.rouZrrr),
:y: z.i : (r.i - 8,0)/í rc, j :1,2 e z -t/(0,1). Dadistribuição Normal, segue que z"t : _I,gB 
" 
2., : t,gg. Logo,
Capltulo 8: lnferêttcfu Ettuttf,ttictt; Te;stt,,t ilr IIi,
Exemplo 8'3" um pequjsador deseja estudar o efeito de certa substância no teru
Í:""T1:Í.:,^1"^::":^:llos a um cerro iip" i. "rirrur;. il experimentodesenvolvido com cobaias que são ino"uiuàu, com a *urta*ìï ;ìt"ffii:1
::,:::ï]:,:-Yi::: ""T..r:u, l"Tpo, de reação (em segundos) anorados. (seguintes valores foram obtidos: 9,t;'9,3; 7,2; ì,5; ìã;ã, ,ô,l';ïí ;,lrïïï|hiAdmite-se que o tempo^de reação ."gu", em gera-I, o y'rodelo Normar com média
; j:',ï.f#::ï: ; : :::i1?: ; _q n "' úb^d; á;' " " "ï ", " *,re r an ro, qu o
-":
25i
!1,,'.'l'esltt pur(t (t Médh Pttpulntltuutl
,,,r=8-Lr}}\Ãln:6,8;
:1"":8+ 1,88 vqre :9,2'
Assim, podemos expressar a Região Crítica para
d: 0'06 como
RC :{r e R : r ( 6,8 oun > 9,2}'
clrrlculando a média amostral obtemos T ohs :9'1' Como este valor não pertence à
/{c, aceitamos a hipótes e Ho ao nível de significância 6Vo..Em outras palavras,
concluímos qoe o temfo de 
"reação 
das cobaias submetidas à substância não ficn
irlterado.
Podemos também calcular a probabilid ade B do erro tipo II, isto é, a
probabilidade de estar aceitando incorietamente Ho' Nt'"-qt:,p:Tj:t:"1ï:i;#
ffiffi-*";ifi;;", o que não é o caso para o erro tipo II' como a hipótesen---^ c^--,. 17;'ffiffirï;;;", exisrem diversos valôres possíveis para p,. Dessa forma, Ér f!--11-. 
--1..
scrá função de qual valor de pr foi escolhido dentro da região definida peltt
lripótese Ilo. Nesse caso, a probabilidade do erro tipo II será denotadapot BQt')'
Por exemplo , Para LL: 9,0 teríamos
B(9,0) : P(erro tiPo II )
: P(náo rejeitar H,lH'falsa)
: P(X É RC lp : 9,0)
:P(6,8<X<9,21tt:9,0)
z6.8-9.0 x-9,0 
- 
9,2-9,01
_nt 
- 
< 
-l
:'\1q^ 
-- J+F - 1/+1to t
:P(-3,48 < Z <0,32)
:0,4997 + 0,1255
:0,6252.
Assim, em sendo F:9,0 e com probabilidade0'6252 estaríamos concluindo' de
forma equivocada , qrre Hoé verdadeira tr
Para c aracteflzql o-1lgqelopenho &-tester-defnyo s a fln ç,ã o ; ! o d e I p:l
n(fi:V(ejeitar II' s" o-ïulot de Tlor aquele de Ho, r
mas essa discussão não será
tabela da
254 en p ltt t I o B : I nlb rê n c i a Es ttt t ís I i ct t ;,["e s t e.r t I c: I I i 1xí t a ;t e,r
6 7 I 9 10 11
Figara 8.5: Função poder.
):'":*T{,"j,:'^".:i":::, li}.u.:' a probabilidade do erro tipo r para
#:ï':ï::'J:'tï'ï::ïï"^:ïf:t ïllzada como regra de 4""i,ã' ïa'ffi 'fi:ï:_"^1"':'l"1jiy: os,dois e*os, simutraneamenre, il#*" ïj:',ï F::
iï;ïf t "; I " j,"^'"nïuçl:_ lo., srupos a""","- "-,ïü'ffi;;ffiï1"":il"a,';;
IirJj:_"1;1 jïï:"-1"^ _dlminuiriros "; ;;, ;,,*,'";,;#J "ï::';,#,ffi J:#ïJïJ'ïï:ii:dencR to^no
*: ï:j:::::^, 11: T:: *er,? u m, au',*, o 
" " "uJ; ü, ; ffi"""#ï :n:ï::
tilizado e maior é og teste..Observe que a variânciu Ao 
"rti_uOoFïã diminui à
recomendamos a leitura das referências mencionadas na bibriografia. para oExemplo 8'3, a funçã.o poder é apresentaoa.na rigu.a; ;;gri;, na quar pode-seobservar que à medida qr" no, árurtu-o. au ,"giao ou 1-õ;;r" nura, o poderaumenta, atingindo valores próximos a 1. A 
"r.uu 
ãpr"r"ntada é típica de um testede hipóteses bilateral.
n(p)
Nos testes desenvolvidos nesta seção, duas suposições básicas foramfeitas: a variável areatóriade interesse na populaçao segue o modelo Normal e suavariância é conhecida. a ausência de normalidade pode sqr contornada com o
--'
[J.2'li:ste puru o Médlu Popnltrituutl
,_,,*,_t
255
auxílio do Teorema Central do Limite o qual garante que' para amostras grandes,
a média amostral tem distribuição Normal. Nesses casos, praticamente não haverd
alteração nos procedimentos que estudamos até agora' pois continuamos a usar I
clensidade Normal para estabelecer a região crítica. Entretanto, se a variância for
desconhecida, ela precisará ser estimada e precisaremos de uma nova distribuição
para X. Discutiremos esse caso na Seção 8.3.
Apresentamos, a seguir, um sumário das etapas pafa a realizaçáo de um
teste de hipóteses:
Figura 8.6: Etapas de um teste de hipóteses.
Concluímos essa seção ilustrando as etapas acima descritas com um testc
de proporção. As definições, técnicas e conceitos utilizadas narcalizaçáo de testes
de hipãteses para a média populacional são aplicáveis, quando o interesse reside
na proporção de alguma característica na população. O próximo exemplo ilustra
esse caso.
Exemplo 8.4: IJm relatório de uma companhia afirma que 40Vo de toda a água
obtida, através de poços artesianos no nordeste, é salobra. Hâ muitas
controvérsias sobre essa informação, alguns dizem que a proporção é maior,
outros que é menor. Para dirimir as dúvidas, 400 poços foram sorteados e
observou-se , em l2O deles, água salobra. Qual seria a conclusão, ao nível de 3Vo?
Iniciamos com a definição das hipóteses. O parâmetro de interesse é a
proporção de poços com água salobra dentre todos os poços no nordeste.
Representemos essa proporção poï p. Pela informação fornecida, devemos
realizar um teste bilateral, com
Ho i p: 0,40 ;
Hoip+0,40.
-!iç|r
256 Co p ít u I t t {l : I n /i' rê n c fu !i:t kt I lst i r t t :,1'e ;t I r,r t I t: I I i prl t e ses
sabemos que o merhor estimador para p 
.é, a proporção amostral p cudistribuição pode ser bem aproximada por um modelo Normal, isto é, admitimos
ì-N(p,p(t-p)/").
Dado que o teste é bilateral, a Região Críticaé da forma
RC: {r e R l, < p", ou r > p.r}.
Para a: 0,03; os valores pc1 tr p", são calculados através de
P(ì < P.,lHo) : ry " P(ì ) p.,lHò :ry
Sob a hipótese Ho,p:0,40 e, portanto,,remos â _ lf{4ã,\*00). Assim,
P(ì < p.rlH,): pç3;!#-. 
_p",_9iaor
\/o,24l4oo \/o244ool
: 0,015 
.
Da tabela da l/(0, 1) segue que
p". 
- 
0.40
Jd24M- -L)Lt'
As11m, obtemos p.1 : 0,842. De forma anáIoga encontramo s p.z :0,4b3 eregião crítica será dada por
RC : {r e JR lr < 0,84T ou r } 0,458}.
A amostra forneceu i,t, 
. .L20/400: 0,300 que pertence à região crítica. Dessa
l"::*:: :t" lTo q qu,". o h ip ó te s e nu I a de ve . ; ."r, ; ;;;"-",;"J; :" ;Z;', iisto é,o relatório da companhia não está correto.
Exercícios da Seção 8.2:
1. uma variável aleatória tem distribuição Normar e desvio padrão iguar a 12.Estamos testando se sua média é igual ou é diferente de2õe coletamos umaamostra de 100 varores dessa variável, obtendo uma média a-;r;;i;';:;"'"
a. Formule as hipóteses.
b. ob-tenha a região críticae dê a conclusão do teste,{ara os seguintes níveis desigìificânci a: I!o, J%, 4Vo, 6Vo.e gTo. ,ú '- 
* "" ""
a
--
@
8,)'l'tslt: pdrct 4 Médla ltoPulnthmrl
!. lrara uma variável ateatória com densidade Normal e desvio padrão 5' o teste 
cla
rrróclia lt : Llcontra Lt = 14, t"y"i região crítica aa{1.99r '{r € R : o >. 12}
'iÌráÌ 
uma amostra de iamanho 25. Deteimine as probabilidades dos 
erros tipo I
oIL
.ì. urn estudo foi desenvolvido para avaliar o salário de empregadas 
domésticas ntr
cidade de são p"rl;. roràÍn sorteadas e entrevistadas 200 trabalhadoras.
Admitaqueooesviopadrãodessavariávelnacidadeéde0,8salários
mínimos' 
^ Áiotrìh.icãn rlo el ' é possível fazgrn. Você conhece a distribuição do estimador X? Se não
alguma suPosição?
b. Deseja_s" tesài se a média é igual a 3 salários mínimos ou é menor.
Formule as hiPóteses adequadas'
c.Paraumníveldesignificânciade3Eo,constfl]aareg|áocrítica.
d. Se u u*orr.u foï"""u média de 2'5 salários mínimos' qual seria a
conclusão?
4.oconsumomédiodegasolinanumcertotipodeautomóveléde15km/litro,
segundo ir.,ror-uço* 
"da 
montadora. uma revista especializada verificou o
"oïro-o em 
25 à"..", veículos, escolhidos ao acaso, e constatou consumo
médio de 14,3 km/litro. Admita que o consumo siga o modelo Normal com
variância igual 9 (km/litro)2'
a. Teste, uo niu"i-J" signíficânciade 6vo, a afirmação da montadora de 
que o
média o" 
"onrrr-o 
iiguut a 15 km/litro, contra a alternativa de ser igu^l 
'
14 km/litro.
b. Determine a probabilidade do erro tipo II'
5.Avidamédiadeumaamostradel00lâmpadasdecertamarcaé1615horas.
por similaridade com outros processos de fabricação, supomos o desvio 
padrão
igual a 120 horas. úilizando a:57o, desejamos testar se a duração média de
todas as lâmpadas dessa marca é igual oo é dif"t"nte de 1600 horas' Qual 
é a
conclusão? o"t".rrrin" também u pÃuuuitiaade do erro tipo II, se a média fosse
1620 horas'
6.Umcriadortemconstatadoumaproporçãodelr}vodorebanhocomverminosc,
O veterinário uri"Ã a dieta dos animáir e acredita que a doença diminuiu de
intensidade.Umexameeml00cabeçasdorebanho,escolhidasaoacaso'
indicousdelas"o-u"''ninose'AoníveldeïZo,hâindíciosdequea
proPorção diminuiu?
258 Capltulo 8: l4ferência E$ntí,ttlcet; Te,rtes rle
Ilipríte
8'3 Teste para a Média com variância Desconhecida
os testes de hipóteses e intervalos de confiança para média, q
:::"r'"ï:Tï'^:j: iq": pressupõem .qu: o valor da uuriãn"iu popuru.ionaiconhecido' Apesar de ser um caso particular, existem várias ,tró.ilrïï;ï
;ïi.ï:Í: :3ï:i:,: Tlïl"]..lly exe3nro, nump.rocesso indusrriar, se puderassegurar que uma certa máquina fornece *"àidu, 
"o- fr""irão const
:ïi:"1ï:,,:T1l11iL1gconhecida.. uma ourra situação sËria aquela empodemos utirizar resultados enconrrados em outros trabarhos, ;:Ë"ff#lïi
::ff:ïï,:: :'-,.1,::1":.:l:",1*:, que manrenham alguma similaridade com oproblema de interesse. Entretanto, 'no caso mais g"rul, q#i;'#; ::ilolinformação sobre a variância da variável 
. 
areatória q,r" ;J; sendo estudada,precisamos contornar essa dificurdade. Ìnicialmente, 
ryanterqnos a suposição doque a variável aleatória de interesse tem distribuição úrmal.b."e!" não Normalserá comentado no final da seção. -- --5*" ^ rvrr'*r' v-
i;;]!*s'V"lo.,l*ï: 1"'*"hecido, ele precisa ser estimado. supondo
:ï: ""'y in1^ï:l !:?r:r::"ju.r:p.r"::ntada pero veror de variáveis aleatóriagffi:;;:ï:ï#:nfilizqt n ri-oll^^*tr ^^.:,-, r -
,ïilJ;'l',"ïi
Capítulo 7 , é, a vafiãncia amosrra( S, : çiXl _ nX211çn_ lt)
Definindo agora avariável ouA.onìjI padroniZàda
T: X-l' 
-X-'p
-{-Lr x-À,
/S'/, t S/Jd{q;lt
vemos que T também é uma variâver ur"ìt-,:riu. Entretanto, apesar de x terdistribuição Normar, o denominador envolve a variâver areatóriL's2, que fará comque a função densidade de ? seja diferente da Normal. Esta náva densidade, quepode ser deduzida teoricamente, é denomi \gjq t de stqde4t er* pura-"tro tem o\e\?de-slqusdcJiher4qde-nest{íaso"ú"íponoã"ãïã"i"ËrãËïï;;;;;:-
1' A notação utìlizqda Le!-4 !1,-1,e, devido a 
"ompte*ia"à" au sua funçãodensidade, as probabilidades são ouiiau, de taberas consìruídas numericamente. Aexemplo da Normal, o modelo t-student tem densidade em forma de sino,gnlrqtaItto as-cau-das tem 4narol mq$,s3 qUe A_ry(0, f) (veja a fig"r" S.Zl.
^^-..^_^Y,11" 
x911f--9Ì9r se o tamanho 4a [qrostra aqruenta., a dp1.1s-idadçJ.sndentçorvgJge par-? a Noirnal p4drão. porìsia razã,o, as taberas conriruioa, se limitama valores de gr-auìTel-iueraaáe menores ou iguais a r20.p;;; graus superioresa 120, as probabilidades são obtidas da tabela da distriÀição Normal e
-
ll. | 'l\'ste l,(tftt (t Mfulirt utttt Vttri{lncit Dcst.orthcte:itkt
.4
259
reprcsentados por "oo" na tabela do Apêndice A. Tal fato é
r:rirrsistência do estimador 52 para o2, que faz com que a
rrlrltrxime de Z àmedida que aumenta o tamanho da amostra'
conseqüência da
quantidade ? se
Figura 8.7: Densidade t- Student.
Diferentemente do teste de hipóteses, construído para o caso em qUC S
variância é conhecida, a região crítica envolverá agora o termo,52, que é umA
quantidade aleatória. Dessa forma, amostras diferentes podem fornecer regiões
críticas distintas uma vez que, possivelmente' elas produzirão estimativas
diferentes para o2. éS!-Uq, qguo{q u Jqi4fql41gq-dqqqouhesüa' optarçmos por
utilizar na região crítica valores da qlantidade padronizadaT. Apresentamos esse
procedimento no próximo exemPlo'
Exemplo 8.5; Deseja-se investigar se uma certa moléstia que ataca o rim altera o
consumo de oxigênio desse órgão. Pata indivíduos sadios, admite-se que esse
consumo tem distribuição Normal com média 12 cm3lmin' Os valores medidos em
cinco pacientes com a moléstia foram: 14,4; 12,9;15,0; I3,7 e 13,5' Qual seria n
concluìão, ao nível de lvo de significância? ?t 'u'o I : qti,'\
O teste de interesse é:
Hn : Amoléstia não altera a média de consumo renal de oxigênio;
Í1, : Indivíduos portadores da moléstia têm média alterada'
260 Capltttlo 8; lttferência Esrnrl,rricn; Trs,te,y rle iliyitere,r
1)ea
Em termos da média populacional, estamos testando as hipóteses:
Ho : p,:12 versLts Ho : pt f L2,
e a região crítica é da forma
nC:{t€Rlú {t1ou 1>tz}.
Sendo o2 desconhecido, usaremos o estimador 
^g2 : rixr - rxr,1çn _quantidade ú discutida anteriormente. sendo n, u"rauíãlu, t",'o.
x-tzt:uru-tu)'
Logo,
l\T. úr) :0, 0r/2 + tt : _ 4,604;P(T > úz) : 0,005 * tz 
- 
4,604;
sendo o varor 4,604 obtido da tabera da distribui ção t-student, com4 graus deliberdade. Assim, a região crítica.".áOuão po.
RC : {te Rlú < _ 4,604 ou t } 4,604}.
Sendo Ìobs :13,90 e s|tr:0,62; calculamos o valorpadronizado
tor," : Ìon - 12 
- 
73,90 
- 
72wot)s 
- ;,JG: o,nrc:5,18'
Portanto, como Í,6, 5 RC d""ioimos pera rejeição da hipótese nura, ou seja, amoléstia tem influência no consumo ,"rr'J^,neoio de oxigênìo ao nível de rvo. tr
Intervalo de confiança para p, com variância desconhecida
euando a variância é desconhecida, construímos intervaros de confiançapara a média popuracionar ut'izando o n'i"to t_irrilïi. ô'0."""0r_enro para aobtenção do inrervaro é semerh;;," ; desenvolvid" 
"J- ""pr,uro anrerior.Supondo uma amosrn ateatória ir,.|.",X,, obtida;; ;;; população comdistribuição Normal com média e variân"ìa'desconhecidas, temos que
ru
.qIF
u..l'l'esle P(tr(t (t Méelkt t'ottt Varlllnrht I )ttctnrltcciiltt
!{
26l,
{t
Desta forma, fixando-se o coeficiente de confiança 'y (0 < 1. <. L) e utilizando a
tabela da distribui çáo t--Student com n- L graus de iiberdade 
(ver Apêndice A)'
podemos obter o valor t^,p tal que
X-uP('t1p.ffi< trlz):"t'
Logo, o intervalo com coeficiente de confiança 'y para É" com variâncin
desconhecida, será dado Por
q 
- 
S.
rC(t",ì:lX- ht2 Jn;X+ hn76l
Exemplo 8.6; Considerando o exemplo anterior, úfna vez que decidimos 
pela
rejeição da hipótese 
"ri", e boa 
prática fornecer um intervalo de confiançâ pnrtt tt
média populacional. Naquele exemplo foram obtidos Íut," :13,90 e S3r," = 0'67'
ComT:0,g0obtemos,databeladadistribuiçãot-Studentcom4grausde
. liberdade, tt12 :2,L32. Logo'
IC(1t,90Vo) : [13,90 - 2,132J o,w I s;13,90 + z,tzzJí,w 1 s 1
: [tS,OO; l+,7I]1.
deconfiançâ 
"i.on,.uOo 
não inclui o valor L2parapl' que foi
a hipótese nula no E.;;;1" 8.5. Dessa forma, confirma-se a conclusão de rejeiçiio
da hipótese f/, .
Se a variável de interesse, além de ter variância desconhecida' 
não tiver
densidade Normal, J n"""rrário utilizar técnicas não-paramétricas para 11
realizaçãodotestedemédia.Nãoapresentaremosessametodologiaaqui,
entretanto, um caminho para contornar essa dificuld ade é, novamente' 
considernf
um tamanho de amostra suficientemente grande' Neste câSo, é sabido 
que 
'52 se
aproxima de oz de tal forma que o seu úo, jrintamerrte com.uma aplicação do
Teorema Central do Limite, permite 
"on'iã"'ut -Í como tendo distribuiçio
Normal, resultando em aproximações bastante satisfatórias do ponto de 
vista
prático.
262 Capítulo 8: Inferência Estatística: Testes de Hipóteses
os procedimentos adotados nos testes realizados até ugoru 
"onrirtirurJl':_ryï:"1-g:trnri"an"iu",;;ffi ã":;ï*ïüã"":ïï":ïiï',i#":ï;il;td;ffi;procedimento clássico de testes de hipóteses. uma alternati
escorhida po. p",qui,í."ï". 
"ï'ìu,ï1, ïTïïii,ï;,':i:"i:'i#ïï";rl'iït#ï';priori. Este será o assunto da próxima seção. lste em não fixar a à
Exercícios da Seção 8.3:
1' com o auxflio da tabela t-student calcule (se necessário, aproxime):
a. P(-3,365 ( Ís < g,J6b).
b. P(lú81 < r,4).
c. P(-1,1 1tu ( 2,I5).
d. O valor de a tal que p(úe ) a) : g,g2.
e. O valor de b tal que p(ú16 í ô) : 0,0b.f. O valor de c tal que pflú111 S 
") : 0,101g. O valor de d ta| que p(t211 > d.): 0,0b.
\
2' uma amostra com 10 observações de uma variável aleatória Normal forneceu
média de 5,5 e variância amostral4. Deseja-se testar, ao nível de significânciade 5vo, se a média na população é igual oué menor que 6. eual é a conclusão?
3' Admitindo que a pressão sangüínea arterial em homens siga o modelo Normal,7 pacientes foram sorteados e tiveram sua pressão medida com os seguintes
resultados: 84, 81, 77, 95,69, g0
e 7V
a' Teste que a média é g2 contraa alternativa de ser g0. use a : 2vo.b. Determine o intervalo de confiança para LL comcoeficiente de confiança
'Y :98Vo.
4. o tempo de permanência de engenheiros recém formados no le emprego, emanos, foi estudado considerando um modero Normar com média e variânciadesconhecidas. por anarogia com outras. categorias profissionair, a"r"J;-r,testar se a média é z anos contra a alternativa dó ser 3 anos. para uma amostrade 15 engenheiros, a média obtida foi de 2,7 anos e o desvio padrão amostral1,4 anos. Ao nível de lVo, qual a conclusão do teste?
5. uma amostra de 20 observações de uma variável com distribuição Normar foicolhida, obtendo-se desvio padrão 1,1. No teste /_r:5 contra p > b, íbi
esrabelecida a região cririca {ú € R | ú > 2,033}. Derermine a probabiridade cloerro tipo I.
8.4 Nível Descritivo 263
6. O número de pontos em um exame de inglês tem sido historicamente ao redor
de 80. Sorteamos 10 estudantes que fizeram recentemente esse exame e
observamos as notas: 65, 74, 78, 86, 59, 84, 75, 72,81 e 83. Especialistas
desconfiam que a média diminuiu e desejam testar essa afirmação através de
um teste de hipóteses, com nível de significância de 5Vo. Fazendo as
suposições necessárias, qual seria a conclusão do teste?
8.4 Nível Descritivo '
Ao realizarmos um teste de hipóteses, partimos de um dado valor de a,
pré-fixado, para construir a rcgra de decisão. Uma alternativa é deixar a cargo de
quem vai utilizar as conclusões do teste a escolha do valor para a probabilidade a,
que não précisará ser fixado à priogi. A idéia consiste em calcular, supondo que a
hipótese nula seja verdadeira, a probabilidade de se obter estimativas mais
desfavoráveis ou extremas (à luz da hipótese alternativa) do que a que está sendo
fomecida pela amostra. Esta probabilidade será o nível descritivo, denotado por
a* (ou P-valor). Elgr"!_pqqqenos de qf -gyldqgclam qug a_hip$tese nula-é-falsa
pois, sendo a amostra nossa ferramenta de inferência sobre a população, ela
fornece uma estimativa que teria probabilidade muito pequena de acontecer, se
flo fosse verdadeira. O conceito do que é "pequeno" fica a cargo do usuário, que
assim decide qual a usar para comparar com o valor obtido a*.
Inicialmente, vamos considerar o caso do teste de hipóteses unilateral.
Para H,,: F : ltro, a expressão de a*.depende da hipótese alternativa, isto é,
(t* : P(X <T"h,lH,verd.)para Ho: pr,1 pu
ou
a* : P(X >Tot,lHo verd.) para Ho : p.) 1to.
Exemplo 8.7: Uma associação de defesa do consumidor desconfia que
embalagens de 450 gramas de um certo tipo de biscoito estão abaixo do peso. Para
r,lerificar tal afirmação, foram coletados ao acaso B0 pacotes em vários
supermercados, obtendo-se uma média de peso de 447 gramas. Admitindo-se que
o peso dos pacotes segue o modelo Normal com dejsvio padrão de 1-0 gramas, que
conclusão pode ser tirada através do nível descritivo?
O teste que está sendo executado é
H,, i F: 450 (peso médio conforme previsto na embalagem);
II,, : 1-t < 450 (peso módio abaixo do previsto na embalagern).
264 Capítulo 8: Inferência Estatística: Testes de Hinó1eses
,,,1" I
I
O valor observado na amostra foi Íob, :447 e as suposições feita$ sobre
a normalidade da variável peso implicam que X 
- 
N(p,10d/S0). Então,
d* : P(X <Tnn,lHu verd.) : p(X < aa7l p,:4b0)
:P(Z < 
-2,68) :0,0037.
Portanto o nível descritivo é de 0,37vo, indicando a probabilidade de que
encontremos valores da estimativa mais desfavoráveis à hipótese nula, Note que o
valor do nível descritivo se relaciona diretamente com o nível de significância.
Neste exemplo, se tivéssemos fixado o nível de significância em qualquer valor
igual ou superior a 0,377o, a conclusão seria pela rejeição de Ho, ao passo que
valores inferiores a 0,37vo conduziriam à aceitação da hiffiã\nula (ver Figura8.8). \ tr
- 2,68 0
Figura 8.8: Nível descritivo unilateral.
Para o teste de hipóteses bilateral, ao calcularmos o nível descritivo,
precisamos considerar que a forma da região ctítica envolve os valores de T olrn
que se distanciam muito (para mais ou para menos) daquele previsto pela hipóteso
nula. Dessa forma, um procedimento usual é multiplicar por dois a probabilidado
obtida em uma das caudas, de modo a preservar aidéia de afastamento bilateral,
Assim, ao testarmos Ho: p: Fo contra Ho: p * l-to, a definição do nível
descritivo depende da relação entre rob" e LLo.
1q caso: se ro6, 1 Fo, d* :2 x P(X <E4rlHo verd.);
ì 2ecaso: se7.,6r) u,o, a* :2 x P(X >TonrlHoverd.).
D istribu ição_N orm al Padrão
.{q
8.4 Nível Descritivo
No caso bilateral, o nível descritivo leva em conta a posição relativa entre A
estimativa xj obs è o valor po . Desta maneira, garantimos, a inclusão de valOres
mais extremos do estimador em relação à t"o . AFigura 8.9 ilustra esses casos.
Ínb, Fu
Figura 8.9: Regiões desfovoráveis num teste bilateral com Ho: Lr : Po'
Exemplo 8.8.. Vamos considerar o teste apresentado no Exemplo 8.3, AS
hipóteses sobre o tempo de reação de cobaias, submetidas a um estímulo elétrico,
foram as seguintes, 
, 
: , (tempo médio de reação sem alteração) ;
Ho i p I 8 (tempo médio de reação alterado).
Para uma amostra de 10 cobaias, observou-se 7"6':9,1' com as suposições jd
feitas naquele exemplo (normalidade com o :2 segundos), podemos obter o
nível descritivo. Note que aqui os valores da estimativa'mais desfavoráveis em
relação à H, correspondem a região X > 9,I. Assim, temos
a* : 2 x P( X >,-E ,hsl H,, verd.)
:2xp(X>9,11p:g)
:2 x P(Z > 1,74)
: 0,0818'
Logo, se desejarmos utilizar um nível de significância igual a 0,05 concluiríamos
pela aceitação da hipóte se Ho, ao passo que um nível de significância igual a 0,10
nos levaria a rejeitar a hipótese Ho (ver Figura 8.10).
265
. 
,n,í\'a i^ /
",'1r,, ] 
' 
,
Se lo6, > p.: região desfavorável a ÍÌ,,
Se -xo6" < p.,: região desfavorável a Íí,
2()6 Capítulo B: Inferência Estatística: Testes de Hìfuóteses
j
I
o nível descritivo nos fornece uma idéia da intensidade com a quaì estamosrejeitando, ou não, a hipótese nula. Dessa forma, tem papel importante do pontode vista exploratório, üma vez que pode nos fornecer indicações para pesquisasfuturas. E
Exercícios da Seção 8.4:
l' Um pesquisador está, realizando um teste para a média e obteve nível descritivoigual a 0,035. Ele aceitará a hipótese nula para níveis de significância
superiores ou inferiores à 0,035?
2. uma variável aleatória-tem distribuição Normal e desvio padrão igual a 10.urra amostra de 50 varores dessa variável forneceu média igual a 15,2. para
cada um dos testes abaixo responda qual é o nível descritivo. 't, H,, :1-l : 18 versus Ho i p : IJ.C/
h. Hu : &: 18 versus Ho: p, < IB.
c. H,, : l-t: IB versus H, : pt I Ig.d. H,, : l_t: 17 versus Ho : p,: llr.
3. A resistência de um certo tipo de cabo de aço é uma variável areatória
modelada pela distribuição Normal com desvio pádrao 6 kgf. uma amostra detamanho 25 desses cabos, escolhida ao acaso, fôrneceu meãia igual a 9,g kgf.Para o teste p : 13 contra & : 8, qual é o nível descritivo? eue conclusãovocê consideraria adequada?
8.5 Testes QuïQuadrado 267
4. Sorteamos, ao acaso, 12 observações de uma variável aleatória que segue o
modelo Normal. Da amostra obtivemos média 21,7 e desvio padrão 5,5,
Determine o nível descritivo do teste F:18 contra p > IB.
8.5 Testes Qui-Quadrado
Apresentamos, nesta seção, três testes que utilizam o modelo Qui-
Quadrado como estrutura probabilística e, por essa razão, são denominados, de
Íbrma geral, Testes Qui-Quadrado. Iniciamos testando a adequabilidade de um
modelo probabilístico para uma dada situação, depois discutimos o teste de
independência entre duas variáveis e encerramos a seção com o teste de
homogeneidade de subpopulações.
Nas seções anteriores, nosso problema foi testar hipóteses sobre os
parâmetros média e proporção. Em geral, as formas das distribuições
de
probabilidade eram conhecidas (ou seriam aproximadas) e tínhamos que decidir
cluanto a aceitar uma ou outra hipótese, sobre o valor desse parâmetro. Em termos
práticos, outra situação comum é termos observações de uma variável aleatória
cuja distribuição na população é desconhecida. Nesse caso, uma das primeiras
providências é tentar identificar o comportamento da variável com um modelo
tcórico. Em algumas situações, é possível incorporar informações de outras
variáveis que descrevam fenômenos aleatórios similares e tenham distribuição
'conhecida. Dessa forma, teríamos um candidato a modelo e nosso problema serin
cstabelecer um procedimento para aceitárlo ou não. Existem, contudo, vÍlriOS
outros casos em que não se tem a menor idéia do comportamento da variável,
Uma das maneiras iniciais de análise é construir um diagrama, com as freqüências
cle ocorrência, nos moldes do histograma. Dessa representação gtáfica, pode sair a
sugestão de modelos adequados aos dados. Em qualquer caso, o modelo proposto
pode ser testado através do chamado Teste de Aderência. Nesta seção,
itpresentaremos um desses testes que usa a distribuição Qui-Quadrado, outros
testes de aderência podem ser encontrados nas referências mencionadas na
bibliograiia.
Considere uma variável X para a qual temos uma amostra de valores e
cleseja-se verificar a adequação ou não de um certo modelo probabilístico. Os
valores observados da variável foram divididos em k categorias contendo, caclo
ulra, um ou mais valores que são apresentados numa tabela de freqüência:
Categoriit 1 2 3 h
lìrect, Observarlit O1 O2 Or oÀ,
268 Capítulo 8: Inferência Estatística: Testes de Hipóteses
Se X for discreta, as categorias são os próprios valores da variável, eventualmento
agregando mais de um valor na mesma categoria. No caso contínuo, as categorias
são definidas a partir de faixas de valores da variável. Do modelo que está sendo
sugerido, calculamos as freqüências esperadas em cada uma das categorias.
Assim,
Categoria 1 2 tJ k
Freq. Esperada e1 A2 93 êl'.,
se x seguir o modelo proposto, essas duas tabelas não devem ser muito
discrepantes. o teste de aderência cria, então, o critério, pazá?èèiÇir se podemor
aceitar ou não o modelo indicado. Em outras palavras, decidimo\ se os dadog
amostrais oderem ao modelo ou não. As hipóteses do teste são: \
Ho: X segue o modelo proposto; 
I
Ho: X não segue esse modelo.
A quantidade que usaremos para tomar nossa decisão será baseada na
diferença entre os valores esperados sob 
-F1, e aqueles observados na amostrô,
Podemos dizer que a diferença oi 
- 
ei dá uma idéia da compatibilidade entre og
valores observados e o modelo proposto. Assim, se as diferenças forem muito
grandes, é razoixel admitir que o modelo não deve ser adequado. por outro lado,
pequenas diferenças podem ser aceitas, pois estamos sempre sujeitos a flutuações,
quando trabalhamos com variáveis aleatórias. Baseando-se nessa idéia intuitiva, a
quantidade utilizada no teste será:
o,:fg=_:,y .
i:7 vx
sendo que k representa o número de categoriaS, o; â freqüência observada e e4 q
freqüência esperada para a categoriai.
Para interpretar a expressão d" Q2, note que o termo o,i. 
- 
et indica g
diferença, na categoria e, entre a freqüência observada e a esperada ou, em outraÉ
palavras, o desvio em relação ao modelo proposto. Se, simplesmente, fizéssemoB
a soma desses desvios para todas as categorias, obteríamos zero, pois o total dc
dados é o mesmo. Para evitar isso, tomamos o quadrado dos desvios. Entretanto,
por serem quantidades não negativas, sua soma poderia se tornar artificialmentc
alta e, por essa razáo, é conveniente fazermos uma mudança de escala dividindo
esses desvios ao quadrado pela freqüência esperada. Somando agora, para todae
8.5 Testes Qui-Quadrado
irs categorias, obtemos a expressão de Q2 que é, assim, uma medida da
d iscrepância que queremos quantificar.
É possível demonstrar que, para um tamanho de amostra suficientemente
grande, a distribuição de Q2 pode ser aproximada por um modelo Qui-Quadrado
com parâmetro k 
- 
L, denominado de número de graus de liberdade da,
rlistribuição. Essa distribuição é representada por X(r-1. O modelo Qui-Quadrndo
ó contínuo e assume valores não negativos. Sua densidade tem uma expressão
complexa de forma que probabilidades serão obtidas da tabela apresentada no
Apêndice. A aproximação para o modelo Qui-Quadrado será melhor, se todas as
l'r'cqüências esperadas forem ao menos iguais a 5. Se isto não acontecer pâra
irlguma categoria, devemos combiná-la a uma outra de forma conveniente,
glrantindo que todas as freqüências esperadas atendam a esse critério,
lÌctomamos agora o Exemplo 8.2, construindo formalmente o teste de aderôncia.
Iixcmplo 8.9; No Exemplo 8.2, definimos X como sendo o número de impactos
ttttteriores à falha em um equipamento eletrônico. Uma amostra de 80 ensaios foi
obtida, cada ensaio representando os testes feitos até a intemrpção por falha no
r.rrluipamento, resultando 80 observações da variável de interesse. Pretende-se
vcrificar se o modelo Geométrico com p : 0,4 ê adequado. O teste será:
Ho:X-G(0,4);
H,: X tem outra distribuição.
A rlecisão será baseada no comportamento de Q2, definido acima. Considerando o
lrrrnanho de amostra grande, a distribuição de Q2 pode ser aproximada pela Qui-
(Juadrado, com número de graus de liberdade que depende de quantas categorias
scriro estabelecidas. A região críticaé constituída de valores grandes de Q2, isto é,
RC : {ta : u2 q,,},
r'orì'ì q(, sendo determinado pelo nível de significância do teste, ou seja,
*: P(Q2 ) q,,lHu verdadeiro).
Para determinar o valor observado de Q2, denotado por qf;,,", precisamos
olrtcr as freqüências esperadas. Se 11, for verdadeiro, X segue o modclo
(icotrótrico, isto é, P(X : k): pt':0,4 x 0,6È. Logo,
lìreq. esperzrda clc rcsistôncia a À, impactos : 80 x Pl, : 80 x 0,4 x 0,6Â'.
Nir tabcla, a seguir, ilpresentilnìos ns l'reqüências esperadas e os valores que foram
obscrvados no teste cle resistênciit t'enlizaclo.
2ó9
270 Capítulo 8: Inferência Estatística: Testes de Hipóteses
Impactos 0 1 2 3 4 mais de 4
Freq. observada 30 26 10 5 5 4
Freq. esperada 32,0 19,2 11,5 6,9 4rr 6,3
como a categoria correspondente ao valorZ tern--{eqüência esperada
igual a 4,1 que é menor que 5, agregamos as duas últimas categorias formando a
dos maiores de 3, a qual terâ a freqüência observada de g e.esperada de 10,4,
Então,
q1u,: (30 - 32,0)2
32,0
e6 
- 
Le.2\2
---tgp-+"'+
Quadrado, com 4 graus de liberdade. Temos,
P(Q2 > q.l H.) 
- 
a + P( Q' > A.l H"): 0,0b.
Consultando a tabela na linha correspondente a 4 graus de liberdade e na coluna
de \Vo, o valor crítico será q" : 9,49 que é maior que o valor observado de 3,44,
concluímos pela aceitação do modelo proposto. A próxima figura apresenta a
densidade do modelo Xl coma região críticado teste. tr
qí,"= e,q+ e,4e
Fígura 8.11: Densidade X! e Região Crítica.
Í (x)
8. 5 Testes Qui-Quadrado 27t
Uma situação bastante comum é aquela em que desejainos testar se um&
variável segue um certo modelo, mas desconhecemos.um ou mais parâmetros da
distribuição. Sendo assim, vamos utilizar a amostra para chegarmos às estimativas
dos parâmetros desconhecidos, isto é, utilizando as próprias observações que
dispomos, vamos obter estimativas que serão consideradas como valores dos
parâmetros desconhecidos. Nesses casos, o número de graus de liberdade se altera
çtara k-I-e, com e representando o número de parâmetros que foram estimados.
No próximo exemplo, ilustramos essa situação ao testar a aderência de um
conjunto de observações a um modelo contínuo.
Ilxemplo 8.10: Deseja-se verificar a afirmação de que a porcentagem de cinzas
contidas em carvão, produzido por uma certa empresa, segue a distribuição
Normal. Os dados, apresentados a seguir, representam a quantidade percentual de
cinzas encontradas
em 250 amostras de carvão analisadas em laboratório.
Cinzas (em 7o) freq. observada
9,5 l- t-0,5 2
10,5 t- 11,5 5
rL,'l- L2,5 16
12,5 l- 13,5 42
13,5 l- 14,5 69
14,5 l- 15,5 51
15,5 l- 16,5 32
16,5 l- 17,5 .\tZ.)
17,5 t- 18,5 I
18,5 l- 19,5 1
(lrral decisão devemos tomar ao nível de significância de 4%o?
Como desconhecemos a média e a variância da Normal que será testada,
prccisamos, inicialmente, obter suas estimativas a partir da amostra. Os melhores
cstimadores desses parâmetros são a média e a variância amostral, representados
1,,,r X e ,S2, respectivamente. Para calcularmos suas estimativas, tomamos o ponto
rrróclio do intervalo como representante dos valores da respectiva classe. Entflo,
lrrììos
ì:Ía,"-I4,5;
G2=s?t":2,7.
l)cnominando por Õ n vnritlvel nlentóriui porcentagem de cinzas contidas no
'ì\ í,'6 '
272 Capítulo 8: Inferência Estatísïica: Testes de Hipóteses
carvão produzido pela empresa, as hipóteses a serem testadas são:
Ho:C 
-N(14,5;2,7);
H, : C tem outra distribuição. 
,
Como antes, usafemos a estatística Q2 paru tomar a de\isao e, considerando o
tamanho da amostra grande o suficiente, aproximamos a \tribuição de Q2 pela
Qui-Quadrado. Dessa forma, utilizando a:47o, obteremob'a região crítica do
teste.
As diversas faixas constituem as categorias de valores da variâvel C e
serão numeradas de 1 a 10. De modo a varrer os íalor\do intervalo (-oo, oo),
correspondentes ao modelo Normal, acrescentamos às\ategorias 1 e 10 os
valores, respectivamente, menores que 9,5 e maiores que 19$. Dessa forma, parA
calcular as freqüências esperadas, procedemos da seguinte forma:
et : 250 x P(C < 10,5 | flo verdadeiro);
e,i : 250 x P(C € categoria i,l H'veÃadeiro), i :2, . .. ,9;
en:250 x P(C > 18,5 | Í1, verdadeiro).
As probabilidades acima são calculadas da maneira usual através
tabela da Normal padrão. Por exemplo,
da
P(C <L0,slH,verdadeiro) : e19:ff. 10f#Él________/ , t/2,7 \/2,7
: P(z < 
-2,44)
: 0,0073.
Para a categoria 5,
P(13,5 < c < L4,5lH,) : P(Pry < 9-#--u/ 
' t/2,7 \/2,7
:P(-0,61 <z<o)
:0,229L'
As freqüências esperadas são apresentadas na tabela, a seguir, e deVefU
somar 250, o que foi considerado nos arredondamentos efetuados'
L4,5 
- 
L4,5,
-l
Jr7 )
'ç
8.5 Testes QuïQuadrado 273
Categoria freq. esperada
1 L,82
2 6,58
3 19,40
4 39,92
5 57,28
6 57,28
I 39,92
8 L9,40
I 6,58
10 L,82
Observamos que as categorias 1 e 10 devem ser anexadas a outras, pois suas
I'r'cqüências esperadas são menores que 5. Desse modo, agrupamos as categorias I
com 2 e 9 com 10. As novas categorias e suas respectivas freqüências esperadas e
observadas são apresentadas na tabela a seguir.
Categoria freq. esperada freq. observada
1 8,40 7
2 19,40 16
IJ 39,92 42
4 57,28 69
5 57,28 51
6 39,92 32
7 19,40 23
8 8,40 10
lilctuando o cálculo da estatística Q2, obtemos QZt":6,ío7. Para determinar a
rrgiiro crítica, utilizamos a distribuição Qui-Quadrado com 8 - 1 - 2 : 5 graus
tlc liberdade, em que perdemos dois graus de liberdade devido à estimação dos
lrrrrlìmetros p e 02. Com o auxílio da tabela da Qui-Quadrado, obtemos
RC:{w:w>11,64},
l)iu'ir cv : 4Vo. Note que lìC não contém Q?t," e, portanto, decidimos peln
rrccitirção do modelo Nonnal parfl a variável aleat1ria C . tr
Apresentamos, ttgortl, umu forma de testar a independência entre duas
vrrliÍrveis. Se dispomos da funçíln cle probabilidade conjunta de duas varialveis
274 Capítulo 8: Inferência Estatística: Testes de Hipóteses
aleatórias, podemos verificar se, para todos os possíveis valores das variáveis, o
produto das probabilidades marginais é igual à probabilidade conjunta.
Na situação mais comum em que não temos informação sobre a
ocorrência conjunta das variáveis aleatórias, o procedimento usual é coletar uma
amostra anotando a freqüência conjunta da ocorrência dos valores das variáveis.
Pode-se, então, utllizar um teste de hipóteses conhecido como Teste de
Independência. Este teste será apresentado através do próximo exemplo.
Exemplo 8.II: A tabela abaixo contém òì r"-sottatos obtidos por estudantes do
ensino médio, em um exame com questões nas disciplinas de física e matemática.
Deseja-se testar se existe dependência eú." u\otas dessas duas disciplinas que,
para efeito de apresentação na tabela e aná{ise de comportamento, foram
classificadas nas categorias alta, média e baixa. \
Física \ Matemática Alta Média Baixa Total
Alta 56 7I L2 139
Média 47 163 38 248
Baixa I4 42 85 L4L
Total II7 276 135 528
Iremos testar as hipóteses:
fI, : As notas de física e matemática são independentes;
fI" : Elas não são independentes.
De modo análogo ao que fizemos no teste de aderôncia, vamos construir
tabela de valores esperados. Para a casela (i, j), esse valor é:
uma
Total da linha i x Total da coluna j
T"t"t C.*t
Note que os valores esperados são calculados sob a hipótese Ho de independência
e, por essa razão, utilizamos os totais de linha e coluna que representam as
freqüências marginais das variáveis. Por exemplo, para a casela (7,2), temos:
Total da linha 1 x Total da coluna 2 739 x 276
52g :72'66 'e1 ,: Total geral nula, ou seja, as notas de físicn
8.5 Testes QuïQuadrado 275
A tabela completa de valores esperados é
Física \ Matemática Alta Média Baixa
Alta 30,80 72,66 35,54
Média 54,95 r29,64 63,4r
Baixa 3L,25 73,70 36,05
Para medir a diferença entre os valores esperados e observados,
usaremos:
n2 5l+- (or,i - ei,)2\{:Ì..L*,
-- 
'i:t i:l "t'u
com r e s representando o número de linhas e de colunas, respectivamente, A
argumentaçáo para sua utilização é a mesma já apresentada no teste de aderôncin
e, para um número grande de observações, a distribuição de Q2 se comporta como
um modelo Qui-Quadrado com (" 
- 
1) x (s 
- 
1) graus de liberdade. A rcgiÍio
críticacontém valores grandes de Q2, isto é,
RC:{w:u}q,,},
com qo sendo determinado pelo nível de significância do teste, ou seja,
o: P(Q2 ) q"lH' verdadeiro).
Para a: 0,01 a tabela da Qui-Quadrado com 4 graus de liberdade
Íbrnece g" : L3,28. Obtemos assim,
RC:{w:w>13,28}.
valor observado de Q2,
q?t"
Vamos calcular o
_ 
(56 
- 
3o,Bo)2
30,90
(7L 
- 
72,66)2 (85 
- 
36,05)2+.'.+ : L45,78,
72,66 36,05
Concluímos pela rejeição da hipótese
matemática não são independentes.
e
tr
276 Capítulo 8: Inferência Estatística: Testes de Hipóteses
Na construção da tabela de valores esperados, caso alguma casera tenha
valor menor que 5, será necessário agrupar categorias. Este procedimento visa
garantir uma melhor'aproximação para o uso do modelo Qui-euadrado para e2 .
consideremos agora o chamado Teste de Homogeneidade. Esse testol
consiste em verificar se uma variável aleatória se comporta de modo similar, ou
homogêneo, em várias subpopulações. Apesar da mecânica de realizaçáo do testc
ser semelhante a do Teste de Independência, uma distinção importante se refere à
forma como as amostras são coletadas. No teste de homogeneidade, fixamos o
tamanho da amostra em cada uma das subpo-pulações'e, então, selecionamos u
amostra de cada r
as subpopulações
uma delas. Na tabela apresJiltaqa a seguir, as linh
; e, as colunas, os diferentes valor\s ou categorias ,
Subpopulações Valores da variável total de linha
I ott otz TL1
2 ozt ozz TL2
total de coluna total Geral
delas as represe
da variável.
Fara o cálculo dos valores esperados (supondo homogeneidade entre at
subpopulações), utilizamos, para a casela (i,, j) 
,
total da coluna j
€i,.i : Tti 
" ,rur ,"rur
O total de linha ni indica o tamanho da amostra da subpopulação i,, ao passo quê
o quociente, total da coluna j dividido pelo total geral, representa a proporção dc
ocorrências do valor da variável correspondente à coluna j. caso haje
homogeneidade de comportamento da vàriável, esperamos que essa p.oporção
seja a mesma, em
todas as subpopulações. No próximo exemplo, apresentamog
mais detalhes.
Exemplo 8.12: Estamos interessados em saber se a preferência por certo tipo de
Í'ilme se altera com o estado civil. Selecionamos pessoas em cada uma dag
subpopulações: solteiro, casado, divorciado e viúvo. Os resultados estão na tabela
a seguir:
lJ. 5 Testes QuïQuadrado 277
Estado Civil \ Filme Policial Comédia Romance tam. amostra
Solteiro 45 25 30 100
Casado 36 61 43 L40
Divorciado 39 36 35 110
Viúvo I4 19 L7 50
total 134 t41. t25 400
Na tabela anterior, a última coluna representa o tamanho da amostra
sclecionada em cada subpopulação. Observe que esses valores foram fixados
lntes da coleta ser realizada. As hipóteses a serem testadas são:
Hu : Apreferência por certo tipo de filme é igual para qualquer estado civil;
H; : Apreferência muda.
A proporção dos indivíduos que preferem filmes policiais é 1341400. Se a
variável Filme for homogênea entre as subpopulações de Estado Civil, devemos
tcr essa mesma preferência por filmes policiais, para qualquer estado civil. Logo,
o valor esperado de preferência pelo gênero Policial, na subpopulação dos
solteiros, deve ser I00xL341400. Para as outras subpopulações, multiplicamos
1341400 pelos respectivos valores do tamanho de amostra, que são diferentes
tìcsse exemplo. A tabela de freqüências esperadas é apresentada a seguir:
Estado Civil \ Filme Policial Comódia Romance tam. amostra
Solteiro 33,50 35,25 37,25 100
Casado 46,90 49,35 43,75 t40
Divorciado 36,85 38,78 34,37 110
Viúvo 16,75 L7.62 15,63 50
total 134 741 t25 400
Cirlculamos a quantidade Q2 damesma forma como fizemos anteriormente, isto é,
virmos quantificar a "distância" entre os valores observados e aqueles esperados,
sC houvesse homogeneidade. Assim,
'' '- 
(oi,i 
- 
ei'.i)2
"-:LL;:r i:L et'i
para um número grande de observações, a distribuição de Q2 é Qui-
Quadrado com (r - 1) x (r - 1) graus de liberdade (r, número de linhas e s de
colunas). A regiào crítica contém vnlores grandes de Q2, isto é,
Cupítub 8: InJèrência Estatístiaa: Testes de Hipóteses
RC:{u:w}q"},
corn qí, sendo determinado pelo nível de significância do teste, ou seja,
a: P(Q2 ) q.lHo verdadeiro).
Escolhendo a : 0,05 obtemos, da tabera da densidade eui-euadradocom 6 graus de liberdade, g" : I2,5g. portanto, 
-,,RC:{w:w>I2,59j.
Para o valor observado de Ç2 temos: --\
Q?,,,. :(45 - 33,50)2 + (36 - 46'90)2 + ... 
-L (rL.- ,r,ur;,Y(,hs 
- 33J0 - -- 46p0 -t_ ..'f Ë : 13,29.
concluímos pela rejeição da hipótese nula, ou seja, a preferência de firmes não é, a
mesma nas diferentes subpopulações definidas pelo estado civil. tr
Exercícios da Seção 8.5:
l. utilizando a tabela da distribuição eui-euadrado determine (aproxime se
necessário):
a. P(Xl > 14,70).
b. P(x], > 3e).
c. P(Xr2, < g).
tl.P(L2<X?r<J0,2).
c. O valor de a tal que P(Xl, ) a) : 6,95.
f. O valor de b tal que p(Xl ) b) : 6,91.
g. O valor de c tal que P(X], ( c) : g,g5.
2. um pediatra pretende avaliar se o sexo de bebês pode ser modelado por umadistribuição de Bernoulli, com p: 0,55 indicando a probabilidade de
nascimento de meninas. Uma amostra.aleatória de 25 nasciÁ"nto. indicou l3
mcninas.
a. Formule as hipóteses adequadas.
b. Qual é a conclusão ao nível de significância de 5Vo?
27,\
8.5 Testes QuïQuadrado
3. Quatro máquinas de grande porte trabalham de forma independente e, ao fim dajornada de trabalho, são vistoriadas pelo controle de qualidade. Caso
necessitem, serão ajustadas. Das informações arquivadas pela empresa,
sorteamos 22 dias e anotamos o número de máquinas que sofreram ajuste
nesses dias. Os dados são apresentados na tabela abaixo. O engenheiro de
manutenção pretende verificar se é adequado o modelo Binomial com n : 4 e
probabilidade de ajuste p : 0,L Use um nível de significânci a de 4Vo.
Ajustes diários 0 1 2 tJ 4
Freqüência 13 6 2 1 0
Para verificar a qualidade do processo de fabricação, cabos de aço são
submetidos ao ensaio de tração até acontecer a ruptura. Os cabos têm 5 metros
de'comprimento e deseja-se testar se o modelo Uniforme Contínuo é adequado.
Para 30 cabos, sorteados ao acaso, obtivemos a seguinte tabela:
Faixa freqüência
0l-L 7
r l-2 6
2 t-3 4
3t- 4 6
4l- 5 7
Qual é a decisão para uma probabilidade de erro tipo I de 0,02?
Em um experimento para verificar a relação entre crises de asma e incidência
de gripe, 150 crianças foram escolhidas, ao acaso, dentre aquelas
acompanhadas pelo Posto de Saúde do bairro. Os dados referentes a uma
semana são apresentados na tabela abaixo.
Asma \ Gripe Sim Não
Sim 27 34
Não 42 47
Você acha que as ocorrências de asma e gripe são independentes? Use
a: 4Vo.
A opinião sobre o atendimento de pacientes com AIDS em hospitais públicos
foi estudada em duas cidades. Na cidade A, sorteou-se 150 usuários e, em B,
200. Com os resultados apresentados na tabela abaixo, você diria clue a opinião
é a mesma nas duas cidades? Use a : \Vo.
279
4.
5.
6.
Cidade \TtenAìmenro
7.
280
8.6 Exercícios
Em uma facurdade, o desempenho esportivo dos alunos está sendo estudadopara dois cursos diferentes. oi cursos âe administ.uçao"l"orioiriu fo_"""rumamostras que estão represenradas abaixo. você acredtr; ;;;';; arunos dessesdois cursos têm o mesmo desempen ho, ao nível 4Vo?
Ca píl u I o 8 ; l n I'e rô n c i tt El ttr I lt; t i er t :,1,t, ;i t e :t tI e I I i p(t I e.re s
Cursos fDesernpen[õ Bom Regular Ruim Totalô{lmtnlsraçAo 65 70 45 180Ecqnomia nÈ72t 10\ 20 150
1' Suponha que queiramos. testar Ho i k: 50 versus Ho :, ) 50, onde tt é amédia de uma variâver areatóriá úormal com desvio-padrão igual a 10.Extraída uma amostra de n:36 erementos da popuração, observou-seT obs : bB. Faça o teste utilizando os níveis lVo,2Vo, Sà à tO E".
2'uma fábrica de automóveis anuncia que seus caÍros consomem, em média, r0litros de gasolina por 100 quilômetroï, com desvio padrão de 0,g litros. umarevista desconfia que o consumo é maior e resolve tËrtu, 
"rru 
afirmação. paratal, analisa 35 automóveis dessa marca, obtendo 
"on,o "oàrumo médio 10,2litros por 100 quilômetros. considerando que o 
"on.uÁo siga o modeloNormal, o que a revista pode concluir sob.e o anúncio ão-nau.i"u ao nível de7Vo? Qual o erro tipo II só a média for 10,6? ---- ** 'J
3' uma máquina deve produzir peças com diâmet ro de 2cm. Entretanto, variaçõesaconrecem e vamos. assumir que o diâmerro d"rr", ;;;;, ,igu o modeloNormal com variância iguar u b,09 cm2. para t"rtu, ,"'a'iìaquinu está bemregulada, uma amostra de 100 peças é coletada.
a. Formule o problema como um teste de hipóteses.
b. Qual seria a região críticase a : 0,02?
c' se a região de aceitação fosse {r e JR r l,gb í r { 2,0s}, qual seria onível de significância do teste? N"rr" caso, determine a probabilidade doerro tipo II se 7_r : 1,95 cm.
d. Se para essa amostrã,Ì 
ort.s : L,g4:qual a decisão em (b)? E em (c)?
=!:FF
ll.(t lixcrclcirts
4. O atual tempo de travessia com balsas entre santos e Guarujá é considerndo
uma variável aleatória com distribuição Normal de média l0 minutos e desvio
padrão 3 minutos. Uma nova balsa vai entrar em operação e desconfia-se qUc
será mais lenta que as anteriores, isto é, haverá aumento na média especificadn
no modelo acima.
a. Especifique as hipóteses em discussão'
b. Interprete os erros tipo I e tipo II'
c. Para uma amostr a de 20 tempos de travessia com a nova balsa, obtenha tt
região críticaconsiderando um nível de 57o'
d. Calcule a probabilidade do erro tipo II, se a nova balsa demora, em média, 2
minutos a mais que as anteriores para completar a travessia.
5. O nível de colesterol no sangue é uma variável com distribuição Normal, de
média p desconhecida e desvio-padrão o = 60 mg/100 ml'
a. Suponha que várias amostras de tamanho n são escolhidas ao acaso desttt
população. Para cada indivíduo, o nível de colesterol é obtido e a média de
"uãu 
urrru das amostras
é calculada. Qual deve ser o valor de n para que
apenas lOVo das médias amostrais excedam a média populacional ern l0
unidades ou mais?
b. Teste a hipótese de que p:260, contra a alternativa de que p > 260com
base numa amostra de 50 pacientes, em que se observou uma méclin
amostral Í,"," :268. Utilize um nível de 5Vo'
c. Qual deve ser o tamanho da amostra, escolhida na população acima, paro que
o intervalo de confianç a para 1t tenhaum comprimento de 30 unidades? Use
'Y :997o '
d. Para o teste especificado em (b), calcule a probabilidade B para o erro de
tipo II, se o valor real de p for igual a790'
6. Suponhamos que o tempo de cura para um doente tratado pelo método A
obàdeça a uma distribuição Normal, com média de 7 dias e desvio-padráo de2
dias. Um novo tratamento B é proposto com a finalidade de dimjnuir o tempo
de cura desse tipo de paciente. Em um experimento clínico, 25 pacientes com.0
doença receberam o nouo tratamento B e ãbservou-se que a média do tempO de
restabelecimento para eles foi de 6 dias. '
a. Sabendo que o novo tratamento não influi na variância, identifique as
hipóteses adequadas e teste-as, considerando um nível de significânciit
a:0102.
b' construa um intervalo de confianç a ('Y : 95vo) para a verdadeira média da
distribuição do tempo de cura sob o tratamento B'
281
282 Capítulo 8: Inferência Estatística: Testes de Hipóteses
7. Uma empresa fabrica cilindros com 50 mm de diâmetro. O desvio-padrão dos
diâmetros produzidos é de 3,0 mm. A fim de saber se a produção encontra-se
dentro dos padrões esperados, a cada hora, 4 cilindros são amostrados e têm
seus diâmetros medidos. A média dos diâmetros é usada para decidir se o
processo de fabricação está operando satisfatoriamente. Assim, se o diâmetro
médio estiver entre 47 e 53 mm, o processo deve continuar, caso contrário, a
produção é interrompida e ajustes são feitos. Suponha que o comprimento dos
diâmetros é bem modelado por uma distribuição Normal.
a. Qual é a probabilidade de se parar incorretamente 4píodução, se a média do
diâmetro continuar em 50 mm?
b. Qual é a probabilidade da produção .ontíì\ se a média do diâmerro se
deslocar para p:52? 
t\
8. Sabe-se que a concentração média de cloro enco\ada na urina de recém-
nascidos, com gestação de 9 meses, é igual a 210 unidades e que o desvio-
padrão correspondente é igual a 20 unidades. Sabe-se também que, em recém-
nascidos prematuros, a concentração de cloro na urina tem um desvio-padrão
igual àquele observado para os outros recém-nascidos, porém suspeita-se que a
concentração média seja menor. Para testar a veracidade desta suspeita, uma
amostra de recém-nascidos prematuros será observada com relação às
concentrações de cloro na urina (admita que siga o modelo Normal).
a. Formule as hipóteses adequadas.
b. Quantos recém-nascidos prematuros devem ser observados para que
tenhamos simultaneamente d= IjVo e 0rzoo)= 57o.
c. Obtenha o nível descritivo do teste, se a concentração média de cloro
observada na urina de uma amostra de 25 prematuros foi de 200 unidades.
Interprete.
9. Um laboratório que fabrica comprimidos analgésicos anuncia que seu remédio
contra dor de cabeça leva em média 14 min para aliviar a dor, com desvio-
padrão de 5 min. Um médico sustenta que o tempo é maior e seleciona
aleatoriamente 40 pacientes. Pede a eles que tomem tais pílulas quando
tiverem dor de cabeça, anotando o tempo (em minutos) até o alivio da dor.
Após coletar todas as respostas, ele verifica que o tempo médio de alivio para
esses pacientes foi de 19 min. Estes resultados confirmam a afirmação feita
pelo laboratório? Faça as suposições necessárias e use a:\Vo.
10. Considere o teste p:0,6 contra p+0,6.Sendo n:100, indique a
probabilidade de erro tipo I para as seguintes regiões críticas:
a. RC : {r e IR lr < 0,56 ou r } 0,64}.
8.6 Exercícios 283
b. RC : {r e lR l" < 0,54 ou r > 0,66}.
11. Uma empresa não pode produzir mais que 5% de unidades defeituosas de um
artigo num mesmo lote. Seja p a proporção de unidades defeituosas em um
certo lote e suponha que, nesse lote, 100 artigos são sorteados para serem
inspecionados. Responda as seguintes questões:
a. Qual o parâmetro que se deseja testar?
b. Qual é o estimador a ser utilizado e sua distribuição?
c. Indique as hipóteses a serem testadas e interprete-as.
d. Determine o critério de decisão com nível de significância de SVo.
e. Com o critério obtido, calcule a probabilidade de aceitar um lote com77o de
defeituosos.
f,. Se forem observadas 10 unidades defeituosas, qual é o nível descritivo?
12.Uma urna contém bolas vermelhas e azuis. Para verificar a hipótese de iguais
proporções dessas cores, extraem-se com reposiçáo,64 dessas bolas e decide-
se aceitar a hipótese acima, se o número de bolas vermelhas retiradas estiver
entre 28 e 36.
a. Determine a probabilidade de rejeitar a hipótese, quando ela é realmente
correta.
b. Qual é a probabilidade do eno tipo II, se a verdadeira proporção de bolas
vermelhas é 0,6?
c. Quanto vale a função poder, se a proporção de bolas vermelhas é 0,4?
13. A experiência mostra que a taxa de complicações, associada a um
determinado procedimento ciúrgico , é de 0,,20. Com o objetivo de reduzir essn
taxa, um pesquisador desenvolveu um novo procedimento e o aplicou a umet
amostra de pacientes.
a. Se ele usar a nova técnica em 100 pacientes, qual deveria ser a taxa limite
para que conclua que a nova técnica é melhor que a anterior? Fixe o nível
de significância em 0,05. 
_
b. Se a verdadeira taxa de complicações associada à nova técnica for 0,08; qufll
é a probabilidade de que, em uma amostra de tamanho 100, ele não consigtt
rejeitar a hipótese nula?
c. Suponha que o pesquisador mantenha a : 0,05 e deseje goJ :0,05. Qual
deve ser o tamanho da amostra para que isso aconteça?
14. Entre milhares de casos de pneumonia não tratados com sulfa, a porcentagem
que desenvolveu complicações foi de lo7o. Com o intuito de saber se o
emprego das sulfas diminuiria essa porcentagem, 120 casos de pneumonit
Capítulo 8: Inferência Estatística: Testes de Hipóteses
foram tratados com sulfapiridina e destes, 6 apresentaram compricações.Admitindo que os pacientes são comparáveis em tudo, exceto quanto aotratamento, teste a hipótese de que a proporção de casos com compricações
entre os pacientes tratados com sulfa é signìficativamente menor do que os nãotratados. calcule o nível descritivo e tome a decisão considerando a : 0,05.
15' Uma caixa tem bolas pretas e brancas. Existem 3 de uma cor e 2de outra, masnão se sabe ao certo qual a cor predominante. Retiramos, ao acaso e comreposição, 50 bolas da urna e observamos 2g bolas bçancas. seja p u p.oporçãode bolas brancas na caixa, pergunta_se: - 7*'-*
a. Qual seria o teste adequado para decidir sobre a,composição da caixa?b.Qualconclusão, aonível a : I\Vo? --\ r---5
c. Determine a probabilidade do erro tipo II. ì
16. um milionário dá uma grande festa e resolve ru"lr r,nu brincadeira com seusconvidados (que a 'esú altura já esravam ;;h ";-"dos...). Dentre ospresentes, tidos como bons degustadores de vinho, sorteia 30 pessoas e oferecea cada uma dois- copos de champanhe, numerados r e i, e solicita queindiquem quar deles tem champanhe importada (é ob;ig;tório escolher umúnico copo). Na verdade, os dois copos contém a mesma òhampanhe nacional!Deseja-se decidir se o "grupo" ainda é um bom provador de champanhe.
a. Indique çomo formular as hipóteses nula e alternativa pu.u 
"rr" 
problema.b' Que decisão você tomaria, ao níver de significância o : 0,0g se 23 pessoas
escolhessem o copo número 1? I
c. E se 24 pessoas escolhessem o copo2?
17. um comerciante compra frutas para revenda e seu preço prevê no mâximo 5vode frutas estragadas para que ele consiga algum lucro. Corno não tem recursospara contratar um estatístico, ele adota a seguinte regra práticar toma, de cadalote, 30 frutas ao acaso. se 3 ou mais estiveie-
"rt.ulguaàr, o to," é devorvido;caso contrário é aceito.
a. Qual a probabilidade do erro tipo I, no teste adotado pelo comerciante?b' Esboce a função de poder do teste. comente o teste do comerciante.
18. um dado é lançado 216 vezes e o número de vezes que ocorreu a face 6 écontado. Decide-se aceitar a hipótese de que o dado e hánesio, se o número deocorrências estiver entre 31 e 41.
a. Formule as hipóteses nula e alternativa e indique a forma da região crítica.b. Qual é a probabilidade do erro tipo I?
c. Qual seria a região crítica do tesúe ao níver 2vo designificância?
2U4 2858.6 Exercícios
19. Suponha que se deseje estimar a proporção p de indivíduos com certa moléstia
em uma dãda região. Selecionou-se uma amostra aleatíria de 100 pesso4s e
constatou-se que 25 eram portadoras da moléstia.
a. Calcule a estimativa pontual da proporção p '
b. Construa um intervalo de confiança para p com coeficiente de confiançn
? : 0,95. Qual o comprimento do intervalo?
c. Um pesquisador acredita que a proporção de doentes é superior a20Vo,Teste
essa hipótese ao nível a : 0,05. Formule as hipóteses nula e alternativa.
20. Testes exaustivos realizados pela indústria Cookbem indicam que seu forno de
microondas tem probabilidade 0,1 de apresentar a 1a. falha antes de 900 horas
de uso. Um novo método de produção está sendo implantado e os engenheiros
garantem que a probabilidade acima indicada deve diminuir. Com vistas t
verificar essa afirmação, escolheu-se aleatoriamente 100 aparelhos parsl
realizar testes acelerados e os resultados indicaram que 8 deles tiveram sua lu.
falha antes de 900 horas.
a. Formule as hipóteses adequadas.
b. Determine o nível descritivo.
c. Verifique se os engenheiros tèm razáo, considerando um nível de
significância a : 6Vo.
2l.IJmaamostra de 10 adultos, na faixa de idade de 19 a 25 anos, apresentou Umtl
freqüência cardíaca média de 68,7 batidas/min, com desvio-padrão de 8t67
batidas/min. Um manual de procedimento clínico indica que a pulsação rnédin
para indivíduos nessa faixa etária deve ser igual a T2batidas/min. Admitindo
qu" u variável medida se comporte de acordo com um modelo Normal e
usando um nível de significância igual a a:47o, vocè diria que os dados
fornecidos são compatíveis com a informação do manual? Qual é o nível
descritivo correspondente aos resultados fornecidos pela amostra?
22. A resistência à ruptura em cabos de aço é considerada uma variável Normnl
com média e variância dependendo de outros fatores' Uma amostra de 12
cabos produzidos por uma empresa são levados a teste para indicar se eles
podem ser usados na construção de uma ponte. Cada cabo para ser uSudo
precisa ter carga média de ruptura de no mínimo 2500 kg. Indique a conclusÍIo
qu" ," pode tiãr, baseado no nível descritivo, se os seguintes resultados fbrenl
observados na amostra: 2518, 2492, 2450, 2535, 2547, 2486, 2455, 2499,
2522,2505,2469 e244O.
28() Capítulo B: Inferência Estatística: Testes de Hipóteses
23. o crescimento de-bebês, durante o primeiro mês de vida, pode ser modeladopela distribuição Normar. Admita que, em média, um crescimento de 5centímetros ou mais seja considerado satisfatório. Deseja-se verificar se ocrescimento de bebês de famílias em um bairro da periferia de são paulo
acompanha o padrão esperado. para tanto, 10 recém-nascidos na região foram
sorteados e sua altura acompanhada, fornecendo as seguintes medidas de
crescimento em centímetros: 5,03; 5,02;4,95;4,96;5,01; igl; q,gO;4,9I;4,90
e 4,93.
a. Que hipóteses estão sendo testadas?
b. Qual é o estimador a ser utilizado para testar as hipóteses em (a) e qual é a
sua distribuição?
c. se a região crítica^construída é {i e IR : I <--g.g7}, encontre o valor de a.Qualaconclusão? )-
d. Qual seria a região críticae a conclusão se a : Sh"t
24, Aporcentagem anual média da receita municipar kpr.guau em saneamentobásico em pequenos municípios de um estado tem sido ívo 6d^ituque esseíndice se comporte segundo um modelo Normal). o governo pretende
melhorar esse índice e' para isso, ofereceu alguns incentivos. para verificar aeficácia dessa atitude, sorteou 10 cidades e observou as porcentagens
investidas no último ano. os resultados foram (em porcentagem) g, 10, 9, 11,8, 12, 16, 9, lr e 12. os dados trazem evidência de merhoria, ao nível de 2To?
caso altere a média, dê um intervaro de confiança para anova média.
25. Alguns cientistas acreditam que em média 50|,o dosmateriais expelidos por
erupções vulcânicas são constituídos de enxofre. Seja X a massa de enxofre
contida a cada 2 quilos de material vulcânico. Acúita-se que essa variâvel
rrão tem distribuição Normal. uma amostra de 100 caixas de 2 quilos desse
rruterial forneceu Ër, : 98 (em kg; 
" 
flrf : 100 (em kg2).i:r l:1
a. Qual a distribuição de X? Indique as suposições feiras.
lr. Formule as hipóteses e obtenha a região críti.u p*u a : 5vo.
c. Qual a conclusão do teste?
d. Qual é a probabiridade do erro tipo II, se os vurcões experem 52vo de
enxofre?
26. Deseja-se verificar se o modelo uniforme Discreto com valores de 0 a 5 pode
ser usado para modelar o número de reclamações que chegam por hora a umacentral de Atendimento ao consumidor. o sorteiò ae tío períodos de umahora forneceu os seguintes dados:
8.6 Exercícios 287
Reclamações 0 1 2 tr) 4 5
Freqüência 8 tôÒt) 28 24 16 12
Formule as hipóteses testadas e dê a conclusão ao nível de 5Vo de significância,
27. rJma indústria registra, em cada semana, o número de dias em que ocofrem
acidentes de trabalho. Para uma amostra de 200 semanas, verifique se os dados
apresentados a seguir, aderem ao modelo Binomial com parâmetros n : 5 e
p : 0,2 (use nível de significância de lj%o).
No. de dias com acidentes 0 1 2 tJ 4 5
Freqüência 64 56 40 24 8 8
28. O número de chegadas de clientes a um banco foi anotado minuto a minuto
para uma amostra de 7O períodos (de um minuto). Os dados foram os
seguintes:
No. Chegadas 0 1 2 qJ 4 5 6 mais de 6
Freqüência I 15 77 11 7 5 4 2
O modelo de Poisson foi proposto para modelar essas chegadas, qual a suu
opinião?
29. O tempo residual do efeito de um agrotóxico está sendo analisado. Estudos
anteriores, com produtos similares, indicam que o modelo Exponencial cOm
média de 3 dias poderia ser adequado. Qual a conclusão, ao nível 57o, se Ll
análise em laboratório de uma amostra de 300 aplicações do agrotóxico
forneceu os seguintes tempos residuais:
Faixas de Tempo 10, 1) r,2) [2,3) [3,4) t4,5) [5,6) [6, oo)
Freqüência B9 60 43 40 25 22 2L
30. O preço unitário de mudas de laranjeira (em reais), em atacadistas
especializados, é uma variável aleatória que se pretende modelar pela Normal.
Com base nos clados apresentados na tabela a seguir, teste a hipótese de que o
288 Capítulo 8: Inferência Estatística: Testes de Hipóteses
modelo Normal é,
significância de 5Vo.
adequado a esse caso, considerando um nível de
3L. Usando os dados abai
entre o número de filhos
tal fato considerando u
formular as hipóteses).
Renda \ Filhos 0 1 2 >2
menos de 2000 15 27 50 43
2000 a 5000 25 37 l2 8
5000 ou mais 8 T3 9 10
32.8m uma escola de ensino médio, o desempenho dos alunos em matemática e
física foi observado (ver tabela a seguir) para testar se existe dependência entre
as duas disciplinas.
Física \ Matemática Notas Altas Notas Regulares Notas Baixas
Notas Altas 46 77 22
Notas Regulares 47 r43 5B
Notas Baixas 29 72 40
calcule o nível descritivo. Qual a decisão, ao nível de significânci a2vo ?
33. Acredita-se que o empenho de estudantes universitários muda no decorrer do
curso. Para investigar essa afirmação, decidiu-se estudar a relação entre ano de
curso e aprovação em disciplinas. Os pesquisadores obtiveram os registros de
186 estudantes universitários, selecionados aleatoriamente, dentre a totalidade
de alunos de uma certa instituição de ensino superior. Foram consideradas 3
Faixas de Preço Freqüência
0,50; 0,60) 23
0,60 0,65) 36
0,65; 0,70) 64
0,70; 0,75) 95
0,75; 0,80) L02 i
0,80; 0,85 71
0,85 0,90) 4ú
0,90; 1,00) .-14
xo, verifique descritivam$nte
e o rendimento familiar ({m r
m nível de sienificância Ne
: se existe dependência
reais). Em seguida, teste
17o. (Não esqueça de
8.6 Exercícios
disciplinas básicas em cada ano. Os resultados obtidos foram
apresentados na tabela a seguir.
Aprovação\ Ano I 2 J 4
Todas 6 5 7 l0
Duas l0 l6 T9 t8
Uma 23 20 t5 7
Nenhuma t5 7 6 2
a. Quantifique o grau de associação entre aprovação e ano cursado.
b. Teste a hipótese de que as duas variáveis são independentes, ao nível de
significânciade 57o.
c. Obtenha o nível descritivo.
34. Quatro grupos de pacientes com úlcera duodenal foram submetidos a
diferentes cirurgias caracterizadas pela porcentagem de tecido gástrico
removido. A tabela apresentada a seguir contém dados referentes à
classificação dos pacientes quanto à severidade de uma seqüela indesejável da
cirurgia.
Cirurgia\ Seqüela Nenhuma Pouca Moderada Total
Y+D (OVo) 61 28 7 96
Y+A(25Vo) 68 23 13 t04
V+H (507o) 58 40 12 110
G+R(75Vo) 53 38 6 97
Verificar se existe associação entre a porcentagem de tecido gástrico removido
e a severidade da seqüela. Utilize o nível descritivo.
35. Investiga-se, para um certo produto, a fidelidade (alta, média e baixa) de seus
consumidores. Em uma amostra de 200 homens e 200 mulheres, foram
classificados como tendo alto grau de fidelidade 120 homens e 80 mulheres,
enquanto com grau médio, 50 mulheres e 50 homens. Os dados fornecem
evidências (use a= 27o) de possíveis diferenças de grau de fidelidade entre os
sexos? Indique o teste realizado.
.Ì6. Um levantamento inicial sugere que o núrnero de filhos depende da rendn
familiar dos pais. Para confirmar essa suspeita, amostras de famílias foram
coletadas, em cada classe social, e o número de filhos em cada família foi
contado. Verificlue utravés de um teste de hipóteses se a variável tem
289
resumidos e são
290 Capítulo 8: Inferência Estatística: Testes de Hipóteses
comportamento diferente em cada uma das subpopulações estudadas (use nível
de significância de l%o).
37. Deseja-se comparar o grau de instrução dos hapitantes de quatro cidades
brasileiras que têm aproximadamente o mesmo tpmanho populacional. uma
amostra de 100 habitantes foi sorteada em cada iidade e o nível educacional
das
con
foi observado. Dos resultadosas pessoas rol oDservado. ljos resultaclos apÌesq
onclusão podemos tirar, usando o nível descritivo
na tabela abaixo,
Cidade\ Instrução Fundamental Médio Suderior Pós Graduação
A 26 65 I 1
B 10 46 30 L4
C 17t,rJ 22 5 0
D 55 40 2 tr)
que
38. A reação ao tratamento por quimioterapia foi estudada em quatro grupos de
pacientes com câncer. Retirou-se uma amostra de pacientes de cada grupo o
classificou-se a reação em três categorias: pouca, média e alta. Teste, ao nível
de 2Vo, se todos Òs tipos de câncer reagem da mesma maneira.
Câncer\ Reação Pouca Média Alta Total
Tipo I 51 tttJ r-, 16 100
Tipo II 58 29 13 100
Tipo III 48 42 30 L20
Tipo IV 26 38 16 80
39. um índice sobre qualidade de vida foi observado em uma amostra de 400
idosos. Os dados são apresentados a seguir.
Faixas [0, r0) r0,20) lzu,3u) 30,40) 140,45) 45,50)
Freq. 7 15 32 55 48 60
Faixas [50,55) 55,65) lbb, íu) 70,75) 175,85) 185, t00l
Frcq. 55 56 28 20 18 6
Classe\ Filhos 0 I 2 J >3
Baixa 15 27 40 64 54
Média 25 27 28 L2 8
Alta 10 25 15 8 2
8.6 Exercícios
a. Teste se a média do índice é ou não igual a 50.
b. Com base no item (a), verifique se o modelo Normal é adequado para este
índice. Como ficaria sua resposta sem utilizar a informação do item (a)?
40. As tabelas a seguir contêm o número de pessoas segundo origem e opinião a
respeito do aborto.
29t
Masculino
Orieem\ Opinião A favor Contra
Capital l-0 45
Interior 18 90
Feminino
Origem\ Opinião A tavor uontra
Capital 55 40
Interior 22 20
a. Para cada sexo, verifique se origem e opinião são independentes.
b. Combine as informações em uma única tabela desconsiderando sexo e teste
novamente a independência das variáveis-
c. Discuta os resultados obtidos em (a) e (b).
41. (Use o computador) Considerando os dados do arquivo cancer.txt descrito no
Exercício 24 do Capítulo 1, defina dois grupos: um de pacientes jovens,.com
idades inferiores a 54 anos, e um de pacientes idosos, com idades superiores a
54 anos. Os grupos deverão conter I9l e lTl pacientes. Considere a variável
nitrogênio na uréia (l/).
a. Construa um box-plot para a variável ltr, para cada um dos gnipos etórios e
compare-os descritivamente. Com base nos gráficos, existem indicações de
que a idade está influenciando a concentração de nitrogênio na uréia?
f. É Oe interesse verificar se a média populacional da variável .lü para os
pacientes idosos é superior a 15. Supondo que o modelo Normal com desvio
padrão o: 7 é adequado, qual a conclusão que pode ser tirada, para um
nível de significância e :0,001?
c. Considerando agora o grupo de pacientes mais jovens, verifique se a médiar
populacional para l/ é menor que 15. Suponha que o desvio padrão
populacional é conhecido igual a 5 e que o modelo Normal é adequndo.
Obtenha o nível descritivo.
d. Com base nos resultados dos itens (b) e (c), discuta o comportamento das
' 
médias da variável .A/ para os dois grupos de pacientes.
42. (Use o computador) Suponha que os dados do arquivo areas.txt (ver descriçf,o
no Exercício 25, Capítulo 1) corresponde a uma amostra de vdrios
crnpreendimentos de umiì nìesma empreiteira. Segundo o memorial descritivo
do empreenclimerrto, as uniclacles devem ter área total igual a 50 m2,
independentemente do bloco. Iintretnnto, suspeita-se que as unidades do bloco
B não satisl'azem s essn especiÍ'icitçÍio.
292 Capítulo 8: Inferência Estatística: Testes de Hipóteses
a. Paru cada bloco, construa um histograma païa as áreas de cada um dos
cômodos das unidades. Compare os gráficos. Para cada cômodo, discuta se
existe diferença entre os tamanhos para unidades do bloco A quando
comparadas com unidades do bloco B?
b. Teste a hipótese de que os apartamentos dos edifícios construídos
satisfazem, em média, ao memorial descritivo que especifica que a 6rea da
sala deve ter no mínimo 28 m2. Use a : 0,05.
c. Construa uma nova variável com a informação da ârea total (isto é, obtenha
uma variável que é a soma das áreas de cadq cômodo) e faça histogramas
considerando cada bloco. O modelo Normfl lhe parece adequado para
descrever o comportamento dessa nova variâ/el?
d. Verifique se, em média, a ârea total na<r as unidades do bloco A são
inferiores ao valor estipulado. Use a : Ò\03 e assuma que o modelo
Normal é adequado. I
e. Repita o item (d) para as unidades do bloco B(
f. Baseado nos resultados obtidos nos itens \anteriores, você diria que a
empreiteira está, de fato, desrespeitando a metragem estipulada?
43. (Use o computador) Considerando os dados do Exercício 40, suponha que
alguns proprietários de unidades, vendidas pela empreiteira, estão movendo
uma ação judicial. Eles alegam que a proporção de apartamentos apresentando
rachaduras está exageradamente alta, superando 30Vo das unidades.
a. Utilizando a variável Rachadura, discuta quais modelos probabilísticos
poderiam ser utilizados para descrevê-la.
b. Verifique se a proporção de apartamentos apresentando rachaduras está, de
fato, muito alta. Utilize um nível de significância de 2Vo.
44. (Use o computador) Considere os dados do arquivo aeusp.txt (Exercício 26,
Capítulo 1) que corresponde a uma amostra da população de baixa renda da
região do Butantã-SP.
a. Teste se o número médio de residentes em casas da população acima
mencionada é inferior a 4. Indique as suposições adicionais necessárias.
b. Verifique estatisticamente se a proporção de trabalhadores com carteira
assinada, nessa população, é inferior a 40Vo. Use a : 57o.
45. (Use
o computador) Continuando com os dados do arquivo aeusp.txt (veÍ
descrição no Exercíci o 26, Capítt lo 1), teste a independência entre as variáveis
Comun e Renda. Tome sua decisão calculando o nível descritivo.
Capítulo 9
Tópicos Especiais
9.1 Introdução
Neste capítulo, desenvolveremos alguns tópicos complementares que têm
grande utilidade no trabalho cotidiano de profissionais e pesquisadores que fazem
uso de métodos quantitativos. Boa parte da teoria necessária ao desenvolvimento
das'técnicas a serem apresentadas já foi discutida nos capítulos precedentes.
Alguns dos tópicos podem ser elaborados em maiores detalhes e generalidade,
entretanto, esta abordagem está além dos objetivos deste texto e demandaria
capítulos específicos. Dessa forma, para esses casos apresentaremos uma versão
mais simples a título de introdução ao tema. Para um aprofundamento maior,
recomendamos consultar a bibliografia apresentada ao final do livro.
Num primeiro momento, consideraremos a comparação de duas médias
populacionais. Em seguida, apresentaremos alguns procedimentos destinados ao
estudo da variância populacional, incluindo aí a comparação de variâncias de du&s
populações. uma generalizaçáo do método de comparação de médias, envolvendo
mais que duas populações, é considerada no tópico seguinte. O desenvolvimento é
baseado no conceito de modelo estatístico, que consiste em decompor o valor de
cada observação em uma parte com estrutura conhecida e uma parte residual, com
informações que não são explicadas pela mencionada estrutura. Quando o modelo
cstatístico é expresso em termos da equação de uma reta, podemos definir um
modelo de regressão linear simples, que será discutido na última seção.
9.2 Comparação de Duas Médias
Considere que estamos interessados em comparar duas populações com
rclação às suas médias. Uma das principais suposições feita no desenvolvimento
tlos testes de hipóteses, apresentados anteriormente, foi a de independência entre
os componentes da amostra. Ao tratarmos da comparação de parâmetros de duas
llopulações, precisamos veril'icrrr sc cstts estão on não relacionadas. Se estiverem
294 Capítulo 9: Tópicos Especiais
relacionadas, pode ocorrer dependência entre elementos de amostras diferentes,
ainda que cada amostra, internamente, seja composta por elementos
independentes. Por exemplo, é muito comum a situação em que observações são
tomadas em uma mesma unidade amostral, antes e depois de alguma intervenção.
Neste caso é razoâvel considerarmos que a repetição de mensurações em um
mesmo elemento cause dependência entre as duas amostras. Veremos, nos
próximos exemplos, alguns casos ôom e sem a presença de independência.
Exemplo 9.1: IJma distribuidora de combustíyeis deseja verificar se um novo tipo
de gasolina é eficaz na revitalização de m\tores velhos. Com esse objetivo,
seleciona 12 automóveis de um mesmo modelo\com mais de 8 anos de uso e, após
regulagem de seus motores, verifica o consufro de combustível. Em seguida, o
carro é abastecido com o novo tipo de combxs{ível durante 15 semanas, e uma
nova aferição do consumo é feita. Defina as vari{eis aleatórias Xt e Y como o
rendimento do automóvel z respectivamente antesf e após as 15 semanas. Vemos
que Xi eY foram medidas em uma mesma unid{de amostral e, assim, é razoável
assumir que exista alguma dependência entre ela\. Ressaltamos que, para i'+ i,
devemos ter Xi e Xy independentes. O mesmo deve ocorrer para Y e Y'i. Ao
medir a característica de interesse em duas ocasiões, para cada uma das unidades
amostrais, pretende-se diminuir a influência de outros fatores (muitas vezes
impossíveis de serem controlados) e ressaltar um possível efeito do tipo de
gasolina no desempenho do veículo. tr
Exemplo 9.2: TJmestudo envolve a avaliação de um novo sistema operacional de
computador, desenvolvido para crianças com idades entre 8 e 12 anos. Afirma-se
que o novo sistema é mais rápido do que o atual, líder de mercado. Para testar esta
afirmação, foram selecionados em uma mesma escola dois grupos com 15
crianças cada. As crianças, sem conhecimento prévio relacionado ao uso de
computadores, utilizaram máquinas de mesma configuração para realizar uma
certa tarefa, que teve seu tempo anotado. O primeiro grupo, denominado Grupo
A, trabalhou com o sistema operacional convencional ao passo que o segundo
grupo, Grupo B, desenvolveu atividades no novo sistema' Ao final do
experimento todas as 30 crianças haviam realizado a tarefa. Nesse exemplo, os
dois grupos selecionados consistem de 15 crianças diferentes e, portanto, pode-se
assumir que os dois grupos constituem duas amostras independentes. tr
A independência ou não das observações é um fator importante a ser
considerado mas, como visto em capítulos anteriores, também é importante
levarmos em consideração a variabilidade associada aos valores populacionais e
arnostrais. Note que, nos testes cle médiat, utilizamos o vnlor cla variârrcia
qt
9.2 Comparação de Duas Médias 295
populacional ou um es Dessa forma, para procedermos à
comparação das médias, precisamos analisar o que ocorre com as variâncias nas
duas populações. Em algumas situações elas são conhecidas por estudos
anteriores, censos ou ainda suposições. Se as variâncias populacionais são
desconhecidas, existe ainda a questão delas serem iguais ou diferentes. Alguns
autores argumentam que, no caso de variabilidades populacionais desiguais, o
teste de médias não deveria ser realizado pois as populações,já são diferentes,
Apesar dessas opiniões, iremos apresentar neste capítulo um procedimento parÉl
esse caso. Resumimos, a seguir, as possíveis situações na comparação de duas
populações.
Dependentes
(caso 1)
2 amostras Variâncias cohhecidas
(caso 2)
/
Variâncias isuais
.r' (caso 3A)-Independentes
Variâncias
desconhecidas
Variâncias diferentcs(caso 3B)
Figura 9.7: Casos na comparação de duas amostras.
Discutiremos apenas os testes conhecidos como paramétricos, para cada
um dos casos considerados na Figura 9.1. os testes paramétricos assumem que 0s
variáveis se comportam segundo um modelo Normal, ou que as amostras são
suficientemente grandes, de modo que uma boa aproximação pode ser conseguida
utilizando o modelo Normal.
Caso L: Amostras dependentes (teste ú - pareado)
No caso de amostras dependentes, desejamos comparar duas médias
populacionais sendo que, para cada unidade amostral, realizamos duas medições
cla característica de interesse, De modo geral, essas observações correspondem n
/
\
296 Capítulo 9: Tópicos Especiais
medidas tomadas antes e após uma dada intervenção. Para ilustrar esta situação,
considere o Exemplo 9.1 em que medimos o rendimento com a gasolina
tradicional e depois com o novo tipo de combustível. Essa é uma típica situação
em que o teste ú - pareado deve ser utilizado. Neste caso, é de se esperar que exista
alguma correlação entre as observações tomadab em uma mesma unidade
experimental.
As medidas tomadas antes e após a intervenção realizada serão
representadas pelas variáveis aleatórias Xo eY, respectivamente. Desta forma, o
efeito produzido pode ser representado, ppra o z-ésimo indivíduo, pela variável
Di : Y 
- 
X;. Supondo, para i : I, ... ,n,iJ
Du 
- 
N(Ab,o'o),
queremos testar as hipóteses: \
)
Ho : Fo: 0 (a intervenção nib Produz efeito)
Ho : pD # 0 (a intervenção p\duziu algum efeito),
sendo que a hipótese alternativa pode também ser unilateral.
O parâmetro po é estimado pela média amostral D e, como usualmente
não temos informação sobre dp, estimamos seu valor por S2p, dado por
si:#Dro,-D)'.
O teste de hipóteses é realizadoutilizando-se a quantidade
r:D-lto
_ 
solt/ã
c1ue, sob f/,, segue uma distribuição ú-Student com n 
- 
1 graus de liberdade. O
teste segue os mesmos passos discutidos no capítulo anterior.
Exemplo9.3.'No Exemplq 9.1, o rendimento foi'representado por Xt eYpara o
automóvel 'i,
respectivamente antes e após o novo combustível. Os valores
observados, em km/I,' junto com as diferenças Di:Y- X;, para os 12
automóveis são apresentados na tabela a seguir.
Autom. 2 3 4 5 6 7 8 9 10 1 T2
Após (Y) Iro 8,8 9,9 9,5 11,6 9,1 10,6 10,8 L3,4 t0,ti 10,5 l I,4
Antes (X ) 8,1 7,9 6,8 7.8 7,6 7,9 5,7 ó14 E'0 9,5 8,0 6,8
D:Y-X 3,5 0,9 J'I Ltl 4,0 t,2 4,9 2,4 5,4 1.1 2,5 4.0
.il
9.2 Comparação de Duas Médias
Os dados de consumo, antes a após o novo combustível, podem sêf
visualizados através de gráficos box-plot, apresentados a seguir, de onde podemos
notar indicações de que o rendimento é, aparentemente, maior após o uso do novo
combustível.
Depois
Para podermos verificar se o rendimento é de fato superior, precisamos
proceder ao teste:
Ho : Fo: 0 (o novo combustível não aumenta o rendimento);
Ho, : po > 0 (o novo combustível aumenta o rendimento),
com LLD representando o valor esperado da diferença de rendimento, isto é,po:E(Y-X). Estaremos assumindo que a distribuìção de Di:Yi-X,i,
para'í : I, ... ,12, é Normal com média pD evariãncia o2o.
Com os dados observados, obtemos ã,6" : 2,9 e estimamos oã por
s2D ru 
: 2 14' Logo, sob f/o'
tubr :ut'", P :''' . o' : 6148.so,,o,l{n r,551\/12
Com a : 0,05 e utilizando a tabela da distribuição Ú-Student com I I
graus de liberdade, obtemos Í,, resolvendo a equação P(T > Ú,,) : 0,05. Obtemos
t,,: I,796 e como t,,t* ) ú,,, concluímos que o novo combustível é eficaz nA
297
€14
E5
o
c
.Ë 12õco
cc
=-
298
similares.
2q9
melhora do rendimento, acafretando diminuição do consumo pere oveículo considerado no experimento.
caso 2. Amostras independentes com variâncias conhecidas
Consideramos agora o teste relacionado com a situação em quc ql
::in;1,ï T:1t1'^* jf: populações independ-entes, quando o, .orrrrpuvariâncias são conhecidas. A obtenção dà informaçã; ;;rp.t;';.ïË
variância populacional pode ser obtido de estudos anteriores ou experimc;
A ('t,nt!ì(t|(tção dct lhms Méllt,t
Pol)tllnçoes, :u]tts varrauvr.ò ò4v rasqrr ,rrïr" u* g1g/elo
.-^-Áõ 2lu,,,r,,rs; admitir que estas duas populações se comportam confcii:Ï."ï,::Ïiïffi, ;;; ;;. õ";;;; t ;, variáveis areatórias representando a
ttrrr.ircterística de interesse'em 
"ádu 
o*u das populações. Segue, 
.qotruilo,, 
q:í,::
Capítulo t);'ftíplrct
comparar dois sl
foram selecionadog i
,E
E
I
E
ó)
F-
Exemplo 9.4: Vimos no Exemplo 9.2 que, para
operacionais, dois grupos independentes de estuãantes
tempo necessário parurcalizar a tarefa foi anotado.
Os dados obtidos foram os seguintes (em minutos):
Grupo Tempo
182 185 193 175 184 tg2
92 76 76 90 97 90
175 173 I t78 162 179 t64 182 I
86 93 100 115 85 80 90 86
auxiliar
eco
GruPos
[.)rrir's medidas descritivas podem ser calculadas para auxiliar na comparaçõo' 
tr
utilizando a motivação fornecida pelo exemplo anterior, poderrtot{a realizer
-';'ilã; geral. Suponitu .1,," desejamos comparar 
.düN9 rru-:- llaSô-
;ì ;;ì;;'n*.,-"'ii"à'ra'cias sao" i guais u um t :,*: iZ ^ *: ^ 1:i1'j:i;
A inspeção visual dos dados sugere que o Grupo B tendetarefa num tempo inferior àquele observãdo puru o Grupo A. para
análise- inicial, podemos construir gráficos bàx_ptot puru'o, g*po,lado a lado conforme a figura u,"gui..
Podemos observar que' para os alunos considerados, o novo sisteffiê
_:ï:ï:":1t_:r,::::",i1ior_ facilidade de aprendizâdo , 
"urlut"rirado aqui pelo
Note que o valor da mediana do Grupo B é inferior ao do Grupo A, mas ointervalo enrre o primeiro. e 
.o. 
rerceiro quaitil é pró;i;;;;;u o. dois grupos,dando a idéia de que a variabilidade do tempo de aprendizaão é semerhante pareambos os sistemas operacionais.
E importante ressaltar que, para podermos concluir que o novo sistema éde fato eficaz, precisamos 
"*trupàlu, as conclusões anteriores para toda apopulação de crianças com idade entre g e 12 anos. Isto pode r", r"ito, realizando
o teste de hipóteses que será descrito em seguida u.rr" 
"*"Àpr,"-
A
B
tempo de execüção de certa tarefa, u.u u", qu 
" 
o Uo*'_pioì;;;ô;;Ë Ëãsensivelmente mais baixo. ;:ìïi lïJï:ï:ïuï" 
.àï"'."****"ã; il 9e;:' ;":'"'' a3"'a'à11: 1''1'Íï::
ïlìï:}Jr""ïlï tiï, .:Ïï;;-i'', ::.,ï, 
"), representando amostras 
areatóri âs,
--^r-^^ r^ ^*^stf0
:ffi';:,fi':.i]uïïl'ou, populações. Deve ser noiado que os ramanhos de amostrit
'il 1 a't72 podem, eventualmente, ser iguais' Queremos testar
-F1, : As médias populacionais são iguais;
f/" : As médias populacionais não são iguais'
listas hipóteses podem ser traduzidas em termo s de pq e 1t2:
Ho : 11,1 -- 1-tz',
H': t-tt, * l.tz.
300 Capítulo 9: Tópicos Especiais
Se a suspeita sobre a diferença entre as médias é de que a médiade umapopulação é maior (ou menor) do que a média da outra, podemos reescrever f/"
como /-r1 > ttz (ou ltt < ttò e proceder ao teste unilateral.
como estamos interessados em determinar se a diferença é
estatisticamente significante, podemos ainda reescrever as hipóteses em termos de
l"O : Itt 
- F2, isto é, ..,
Ho:P'p-Q;
H."rtto+í,
o que sugere trabalharmos com o estimador de p,p:
D:X-Y.
Comas suposições feitas, temos 
a--1
X.i 
- 
N(pr,o'), [.,: I,2,..., n1;
Y.- N(1"r,of;\, i: L,2,..., n2.
independência dessas variáveis, D terâ
) : po e quanto à variância, temos:
distribuição Normal comPelaE(D
Var(D) : Var(X 
- 
Y) : Var(X) + Var(y)
: or" +ú:rr(!*1\Tt1 rL2 "\r, ,,)'
Note que a independência entre as amostras foi necessá ria para obter essa
variância, uma vez que a covariância entre as médias amostrais é zero.
com estas informações, procedemos ao teste de hipóteses do modo usuar.
caso não saibamos qual é a distrìbuição da característica nu foprruçao podemos,para'amostras de tamanho grande, lãnçar mão do Teorema Central do Limite etrabalhar, de modo aproximado, com a distribuição Normal.
Exemplo 9.5.' continuando o Exemplo 9.4, sejam Tr e Tz variáveis aleatórias
representando os tempos de aprendi zado para os grupos A e B, respectivamente.Tendo em vista que nL: n2: 15, as amostras áu5. ,"rf""iío,populações são os conjuntos de variáveis aleatórias independentes(TIJ,'.. ,4,rs) e (Tz,!, ... ,T2Js). Além disso, assuma que informações
adicionais fornecidas pelas empresas indicam que a variabilidade dos tempos de
aprendizado é a mesma para ambos os sistemas operacionais e iguar o oi : 19
min. Logo, para i : I,2,...,15,
9.2 Comparação de Duas Médias
Tu 
- 
N(Pt,100);
' Tzr 
- 
l/(p2, 100).
Queremos testar
H, : Tempo médio é igual para ambos os sistemas ;
.F1, : Aprendizado do novo sistem a é, emmédia, mais rápido.
As hfnóteses podem ser formulad^ti,t:i 
: *,
Ho:FtlFz,
ou, equivalentemente,I HoiFo:FL-Fz:0;
Ho:l-ID-ltt-ttz)0.
A região críticaserá dada por RC : {d, €.IR : d > d,"} e o estimador de p,p ser6
dado por D :Tt 
-72, com
30t
15
DT'',n
:_1
^15
15
5- ?o,u
.i-1
e 1, : 
- 
'
-15
' Pela suposição de que os tempos seguem o modelo Normal e, lembrando
que as amostras são independentes, segue que a distribuição de D é Normal com
média p,p e variãncia
var(D) : var(Tt) + var(72): # * # : # : 13,88.
Utilizamos agora o procedimento usual para testes de hipóteses, fixando
a : 0,05 e encontrando um valor crítico d. tal que
P(rejeitar H"l H"verdadeira) : P(D € RC I po:0)
Consultando a tabela da distribuição Normal padrão, obtemos 2,, : L,64. Logo,
d,:L,64x3,65:5,99.
Então, R.C : {rJ e R l íí > 5,99}.
J02 Capítulo 9: Tópicos Especiais
considerando os valores amostrais observados, temos que a média para o
grupo A ê L79,73 min e, para o grupo B, é de 89,86 min. Assim,
ã ob, : 179,73 
- 
89,86 : 89,87.
como ãor, 
€ 
RC,rejeitamos a hipótese nula, iy'to é, a um nível de significância
de \vo concluímos que, para alunos .o- /idud" entre g e 12 anos sem
conhecimento computacional prévio, o tempo d{ aprendizado com o novo sistema
operacional é menor.
consideramos, agora, a situação em que as populações apresentam
médias desconhecidas e variâncias populacionais conhecidas, porém com valores
diferentes. Nesse caso, já sabemos quê as2a{ru)a{oes são difeàntes, uma vez quo
as variabilidades da característica de inty'ress" nui duu, populações são diferentes.
Ainda assim, podemos estar interessad[s em verificar se as médias também são
diferentes e utilizar a teoria de teste de hipóteses, para embasar estatisticamente a
decisão a ser tomada.
com as suposições e a notação já apresentada anteriormente, temos agora
que X 
- 
N(px, 
"ï) "V - N(py, o!,), com ox * oy.Então,
N 
- 
N(p*,"ï/"r) e Y 
- 
N(tr",oï/rz) 
.
ParaD 
- 
X 
-Y eutilizando a independência entre X e 7, temos que
,,
Var(D) : Var(X) + Var(Y) 
- 
ok 
+ 
o?,
fl,1 TL2
o, então, D 
- 
N1tx 
- lry,oï1ry + o!,1n2).A partir daqui, o teste prossegue n&
lbrma usual. No próximo exemplo, ilustramos o procedimento apresentado, de
vnriâncias conhecidas porém diferentes.
Ilxcntplo 9.6: uma empresa avaliadora de imóveis está estudando as regiõeo
cclrtral e oeste da cidade de São Paulo. o objetivo principal é verificar se o preço
médio, praticado para imóveis comerciais de um dado tamanho, é o mesmó nâs
duas áreas. De levantamentos anteriores, a empresa sabe que a área oestê
apresenta uma heterogeneidade de preços imobiliários (em UpC- unidade padrão
de construção) maior do que a região central, sendo os desvios padrões iguais a
0,82 uPc para a região oeste e 0,71 UPC para a região central. para verificar sc
os preços médios são iguais ou nãon duas amostras, uma de tamanho 20 e outra de
turnnnho 18 foram retiradas aleatoriamente de cada região. Os dados são og
segu irr tcs:
tr
9.2 Comparação de Duas Médias 303
Região Central
4L,2
40,6
39,6
39,2
40,5
40,3
39,4 38,9 39,1 40,9
40,6 39,7 40,3 40,9
4L,2 40,4 40,0
39,6 39,7 4L,2
Região Oeste
37,2 34,9 38,1
37,4 36,1 35,9
35,4 35,7 37,7
36,9 37,4 37,5
36,4 36,6 36,1
38,0 36,8 36,4
Algumas medidas resumo são apresentadas na próxima tabela:
Medidas
Descritivas
Região
Central Oeste Arnbas
n
Média
Mediana
Desvio-Padrão
Mínimo
Máximo
20
40,2
40,3
0,7
38,9
4L,2
18
36,7
36,7
0,9
34,9
38,0
38
38,5
39,0
1,9
34,9
4L,2
O comportamento dos dados pode ser visualizado através de gráficos tipo
hox-plot, mostrados a seguir.
304 Capítulo 9: Tópicos Especiais
Note que o valor do desvio padrão amostral sugere, de fato, que as
variâncias são diferentes nas duas regiões; mais ainda, a média de preço na região
central parcce ser superior à da região oeste. Para os dados observados, a região
central tem, aparentemente, preços superiores à região oeste. Além disso, a
variabilidade observada nos imóveis da região ogste é maior, o que, de certa
forma confirma a informação fornecida pela empfesa. Em resumo, para os dados
apresentados nas duas amostras, temos um maiof preço médio (amostral) para a
região central. Essas conclusões são válidas aflçnas para os valores amostrais
observados. Para podermos extrapolar esta conc\rsão para as regiões como um
todo, precisaremos ltilizar um procedimento esthtístico que controle os erros,
eventualmente, cometidos.
Representando a informação dos preços naYegião central pela variável
aleatória X e, para a região oeste, pela variável aleatória Y, assumimos que os
dados são obtidos de duas populações Normais de tal forma que
X 
- 
N(px,ollzo) e Y 
- 
N(try,ol,1ts1.
Nosso principar in**'* 
;:":ï":ïï:"'"'
Ho: Fx * ttv.
DefinindoD:X 
-Ttemos
v ar(D) : v ar(X) + v ar(Y) : +. Y : 0,06.
Logo, para a : 0,05 vem:
P(rejeitar H" I H,verdadeira) = P(D e RC I pt - tt'y : O)
:p(2.+ouZ>41:0,05.
/0,06 /0,06
Da tabela da distribuição Normal padrão obtemos os valores críticos:
Consequentemente,
E
9.2 Comparação de Duas Médias 305
RC : {d e R : d, < -0,49 ou d > 0,49}
Como em nosso caso ãu6*:40,2- 36,7:3,50 pertence à região crítica,
concluímos que os imóveis situados nas regiões central e oeste têm preços médios
diferentes, ao nível de significânciade 57o. El
caso 3A: Amostras independentes com variâncias desconhecidas e iguais
No caso anterior vimos que informações adicionais podem fornecer
subsídios para o conhecimento dos valores das variâncias populacionais. Em
gerâI, contudo, não temos informações a respeito do valor das variâncias,
Entretanto, os processos que geram os dados podem nos levar a crer que, apesar
de desconhecidas, as variâncias são iguais para as duas populações.
Exemplo 9.7: Digitadores são treinados em uma empresa em duas turmas
distintas. Na pri'neira, denominada Turma J, utiliza-se um método japonês de
ensino, ao passo que na segunda turma, denominada Turma A, utiliza-se um
método alemão. Deseja-se comparar os dois métodos e para tanto, 16 alunos de
cada turma foram escolhidos aleatoriamente e uma mesma tarefa foi atribuída a
cada um. Ao final do experimento, o tempo gasto na realização da tarefa, pam
cada aluno, foi anotado. No processo, dois computadores utilizados pelos alunos
selecionados da turma J e três da turma A apresentaram problemas que impediram
a realização da tarefa; o tamanho da amostra foi assim reduzido para 14 e 18,
respectivamente, para as turmas J e A.
Os dados obtidos foram:
Turma
J
A
10139
15 L2 18
Tempos (min)
10 L4 13 10 15 L2
16 15 L7 L7 15 16
109 1013L4
17 11 77 L4
Apesar de não conhecidas, as variâncias populacionais para as duas turmas são
consideradas iguais com base em estudos anteriores. tr
Para formalizar a situação apresentada, supomos que os dados para o
primeiro grupo são representados por variáveis aleatórias independentes
Xt, . . . 
, 
Xr,,rê, para o segundo, Yt, .. . ,Yrr. Alémdisso, assumimos que
Xt 
- 
N(px, o2), i : I,...,flri
Yi 
- 
N(pv,o2), j : 1,...,p2.
306 Calítulo 9: Tópícos Especiais
Para ambas as populações, temos a mesma variância o2 (desconhecida). Suponha
que nosso interesse é testar
HoiFX:lJyi
Hu: Fx * t"v.
Novamente, consideramôs o estimador D definido pela difeíençaX 
-Y. Dada a
independência entre as amostras, segue imediatamente l6e
/1 1\ ,/Var(D\:o2I:-+:-lr/
' \nt 
"'/(
Além disso, considerando também a normalidade do, ludor, segue que
e consequentemente,
Como a variância populacional o2 é desconhecida, precisará ser estimada. Tendo
em vista que S| e ,5| são ambos estimadores não viciados dessa variância,
usaremos como estimativa para o2 umacombinação deles, dada por:
'nl n2
Díx.u-N)'+DVi-T)'
:-1 ;-1
,J- L
D 
- 
N(p,x 
- 
py,o21t1n1+ rln2)).
D-(pt-pv)
: ^' Arln 1\
o 1/Lln1* If n2
nL+n2-2
Note que S! é :uma média ponderada entre 5| e,Sfl, com ponderação dada por
nt-I c nz- 1. Dessa forma, estaremos utilizando para estimar o2, toda a
informação disponível nas duas amostras. Além disso, pode-se mostrar que ,9"2 É
não viciado para o2.
Da mesma forma que na Seção 8.3 do Capítulo 8, o uso do estimador ,9ul
nos leva a trabalhar com a distribuição ú-Student, isto é,
D-(pr-pv)T_ s"\ÃFTTTM
9.2 Comparação de Duas Médias 307
tem, sob f/,, distribuição t-Student com nr * nz 
- 
2 graus de liberdade
Dada a hipótese alternativa apresentada, procedemos ao teste bilateral dn
forma usual, isto é, fixado a encontra-se o valor ú, tal que
a: P(rejeitar Ho I Il,verdadeira)
:P(7 1-t"ouT>t"lH").
A quantidade ú" é então obtida da tabela da distribuição ú-Student, com
nt I nz 
- 
2 graus de liberdade. A região crítica para o teste é dada por
RC :{t e m. : t 1 
- 
t" ou t > t"}.
Uma vez obtidas as amostras, substituindo as estimativas de D e S" na expresSãO
de ?, obtemos o valor úo6". Rejeitamos f/o se úo6" pertencer à região crítica.
Exemplo 9.8: Para o Exemplo 9.7, podemos escrever as hipóteses de interesse
como
Ho i Fx: py (os dois métodos são equivalentes);
Ho: Px * l.tv,
Çom p,y e púy representando, respectivamente, o tempo médio populacional pafn
alunos da turma J e da turma Á. As amostras forneceram os seguintes valOres:
nt: l4,Totts:11157 e sl"u": 4,L;
n2 : L3,Tot 
" 
:15,38 e szy"u" : 4,3 
'
Então,
ãot,"
-25,',0"
Como a hipótese alternativa apresentada é bilateral, a região crítica tem a
íbrma RC : {t e m :t 1. -t" ou t) Í"}.Logo, parao-:0,01temos
0,01 : P(rejeitar Ho I H"verdadeira)
:P(7 1-t.ou T>t"lH").
l)a tabela da distribuição ú-Student com 25 graus de liberdade, obtemos
1,,, : 2,79. Conseqüentemente,
:Íolts 
-Tot,r: LIr57 - 15,38 :(rr-Dtï*"*(n, 
-t)tï*":6 -3,81 
;
_ 
L3 x 4,I +_L2 x 4,3 : 4.2
25
.ï08 Ct plt tt I o g : 7'ó pi uts Esltet:itt ltt
RC: {te m.:t1_2,7g out}2,Tg}.
Utilizando as estimativas calculadas temos, sob I1o,
-3,81
\/4,2(rlL4 + 1/13)
I
Ique pertence à região crítica e, assim, concluímos que os métodos de fato diferem,
a um nível de significânciade LVo. tr
. 
dult"
-: í t?*"(rlu + Tlnz)
: _4,93;
Caso 38: Amostras independentes com variâncias desçÁnhecidas e diferentes/
o teste para o caso em que as variâncias são/esconhecidas e desiguais é
consideramos as mesmas hipóteses apresentadas no\
quantidade a ser usada para o teste será
o teste para o caso em que as variâncias sã?désconhecidas e desiguais éteoricamente mais envolvente. Assim, sem 
"nfru. em maiores detalhes,consideramos as mesmas hipóteses apresentadar no\cu.o 3A, só qu", ugoru, 4
,\ r: D-(t"x-ttv)
í sk/", + sl,ln2
A exemplo do caso anterior, ú também tem distribuição ú-student, mas osgraus de liberdade z são corrigidos pela expressão
(s'"1"t
A seqüência do teste é similar àquela apresentada nos casos anteriores.
Na Tabela 9.1 mostramos um resumo dos testes considerados nesta seção.
Encerramos esta seção, considerando a situação em que a característica deinteresse não se comporta segundo um modelo Normal. Novìmente, a alternativa
será coletar uma amostra de tamanho grande o suficiente, a fim de utilizar oTeorema Central do Limite e obter distribuições amostrais aproximadamente
Normais. como um exemplo desse procedimento, vamos desenvolver o teste para
n igualdade de duas proporções.
'j
,tr-tÊ.
Ctttttpuruç{lo de Duets Mérlilt,r
:'{
a.2 30e)
Tabela 9.1: Comparação de médias para duas populagões,
Exemplo 9.9.' Num estudo sobre doenças infantis, desejamos investigar se
a incidência de casos de contaminação por vermes é afetada pela idade. Dois
grupos de crianças, um com idades de 2 a 4 anos (Grupo I) e outro, com idades de
7 a 9 anos (Grupo II) foram escolhidos para serem examinados quanto iì
ocorrência de vermes. Os dados são apresentados a seguir:
3t0
Cttpítu\o g:'l'ópit tts l!,rpeciuis
Grupo Amostra Proporção comVerãJnõG
I 720 0,095
II 260 0,103
Para saber se as duas faixas etárias acima têm o mesmo comportamento, quanto aincidência dessa doença, podemos rearizar ; Ã;jJ,r,ïnot"r". 
"nuàtu.nooproporções. / tr
' Considere que desejamos verificar o .o-ponlmento de uma certacaracterística em duas popurações. se a amostra for suficientemente grandesabemos, pelo Teorema central do Limite, que a distribuição de probabilidade daproporção amostral tem um comportamento aproxim qbamente igual ao modeloNormal. Na comparação de proiorções 
"n., 
á;;r/d;Ës, usaremos comoestimador a diferença enrre as respectivas propgíções u,norr.uir. ìvão ã oiïr"ìïverificar que ela será um estimadoinao viesaoo 4Jr*""* diferença entre asproporções populacionais. \
população, teremos d'as proporções amostrais independentes e a diferença entreelas também terá distribuiçãó aproximadamente Normal. Assim, se o interesse étestar:
Ho : pt : Ih versus Ho i pt # h,
então o estimador a ser utilizado será fr, 
- fr, cuja distribuição será aproximadapela Normal cujos parâmetros são obtiioì, considerando-r" u, relações:
E(6r-fr):pt-pz;
Var(fi 
- fr) : Var(f1) +var(f2) 
- 
nQ 
- or) 
* 
m(L 
- m) 
.TL1 D2
Note que, para calcular a 
^variância, a independência entre as amostras garantiu aindependência entre ft 
" 
fr e, portanto, a covariância entre eres se anulou.Sendo a hipótese nula verdadeira, as proporções populacionais são iguais.Denotando seu valor comum por p, isto é pr : p2: p, foO"*os obter umestimador para p através da ponderação dos 
"rir*uããr"r'não viciad., ã ; ,:Dessa forma, obtemos
^ -ntfr.+n2fr,Yp--nrTíz'
-!-F
t).2 (:(,tnpurilçtlo de Duen Médhts
Srrlrstituindo os valores de p1 e Pz Porfl,na exptessão da V ar(f1 - fr), podemos
cscrever, sob fIo,
Pt -Pz
- 
N(0,1).
F,,(L -F)Gln, + Iln2)
l)irrir concluir o teste, calculamos a quantidadê zotts, substituindo bt e Íi por suas
crrrrespondentes estimativas. Verificamos se zobs peftence à região crítica, que nO
clso bilateral é dada por
RC :{z e IR l, 1 r", ou z > z"r}.
l)aclo um nível de significância a, os valores zct e zc2 são obtidos da tabela dt
tlistribuição Normal padrão. Como procedimento alternativo, podemos também
usáÌr o nível descritivo para decidir sobre a aceitaçáo ou não de Ho.
Iìxemplo 9.10: Parao Exemplo 9.9, testaremos
Ho: pt 
- 
p2 versus Ho: Pt # Pz,
com p1 e p2 representando as proporções de crianças com verminosg nn
população dos grupos I e I I, respectivamente. Pelas informações recebidns,
rt4 
- 
I20, nz : 260, fior,, :0,085 e frob" :0,103' Logo, sob 'FIo
120 x 0,085 +260 x 0,103 : ç,097;
120 +260
e também,
Fnr,"(L -\r,",,,)(Llu * rlnz): 0,097 x 0,903 x (LlL20 + L1260)
:0,0011'
Segue então que
Pt-Pz
- 
t/(0,1).
Para a: 0,08 os valores zct e zc2 são calculados através das expressões
P((it 
-DlJo,o}Lt 1 z.,lH,) :0,04;
P( (6t 
- D I Jo,ooLL ) z",l Ho) : o,o4 .
.1u
nt itot," * Trz ?2ot'"::rltobs n1 I n2
Jt2 Capítulo 9: Tópicos Especiais
I
xamés escolares, doze alunos
pois do exame.
10 11 t2
Assim,
RC :{z e R I z < -I,75 ou z } I,TS}.
Fazendo os cálculos, temos \ue 2o6": 
-0,54g não pertence à RC. Logo,
aceitamos a igualdade das proporções, ao níver gvo 
" "on"lrímos que a incidênóiade verminose nas duas faixas etárias pode ser considerâ{a a mesma. tr
Exercícios da Seção 9.2:
l. Para se avaliar o nível de tensão ocasionada por
foram escolhidos e sua pulsação medida antes e
Est
83 84 79 88
76 B0 82
75 81 74 77 78 73
76 79
76 71
Faça um teste, com nível de significânci a de l7o, para verificai se existe maior
tensão (isto é, maior pulsação) antes da realização dos exames. Indique as
suposições necessárias.
2. Sabe-se que o tempo necessário para percorrer uma determinada rota no final
da tarde pode ser estudado por um modero Normal com desvio padrão de 17
min. Foram instalados sensores para controlar o tempo de âbertura dos
semáforos presentes na rota e deseja-se verificar ." ó t"rrrpo gasto para
completar o percurso diminuiu. Estudos anteriores indicam que o tempo ãeve
continuar se comportando segundo um modelo Normal, com mesmo desvio
padrão. com os sensores desativados, 11 veículos de mesmo ano e marca,
denominado Grupo controle, tiveram o tempo gasto no percurso anotado. Em
seguida, os sensores foram ativados e outros 13 veículos (Grupo Teste)
pcrcorreram a mesma rota. os tempos observados, em minutos, foram os
seguintes:
Grupo
Controle
Teste
38 26
17 31 3218 35 29
Indique se o uso dos sensores contribui para diminuir o tempo médio de
percurso utilizando o nível descritivo do teste.
Instante
T utilizados no urso
16 26 38 32
50 2L 20 51
45 49
10 22
9.2 Comparação de Duas Médias 313
3. Para verificar se duas populações têm a mesmamédia, amostras independentes
foram retiradas. Sabendo que a população I é Normal (pt,25) e a população II
Normal (pz,4o), que conclusão pode ser tirada, ao nível 2vo? os valores obtidos
foram:
População
r 12L4 1514 131714 13
II 1317L4 131617 1816
4. As variáveis X e Y seguem a distribuição Normal com mesma variância,
Deseja-se testar se, também,
têm a mesma média. Doze observações de cada
variável foram escolhidas e os resultados foram os seguintes:
12 12 12 12
tq: 48, DAr:56, Dr?: 4.900 ,DY?: 5.650.
'i:L i:L i:L à:L
Qual é a conclusão ao nível de significância de 5To?
5. Para comparar as médias de duas poputações Normais, amostras aleatórias
foram obtidas. Sabe-se que as variâncias populacionais são diferentes, $endO
seus valores desconhecidos.
Dados
Amostra I
Amostra II
8 11 5 9
15 9 16 8
7 93
27 5
O que pode ser dito a respeito das médias das populações, com a : 0,05?
6. Dois medicamentos para tratamento de infecções bucais estão sendo estudados
e o melhor desempenho é definido pela rapidez em eliminar a infecção.
Pacientes escolhidos ao acaso receberam um dos medicamentos e tiveram a sua
cura classificada em rápida ou não. Deseja-se testar, ao nível 107o, se os
medicamentos são equivalentes. Os dados obtidos são apresentados a seguir,
Amostra Pacientes com cura râpida
Medicamento A 50 32
Medicamento B 100 48
Qual seria sua conclusão? Indique as hipóteses do teste e as
necessárias.
suposiçõcs
314 Capítulo 9: Tópicos Especiais
9.3 Testes para Variância
Os testes de hipóteses considerados até aqui envolveram, como
parâmetros de interesse, amédia ou a proporção populacionais. Na seção anterior,
vimos que, para desenvolver os testes de comparação,de médias, é importante
considerar o que ocorre com a variância populacionâ'1. Nesta seção, estamos
interessados em estudar a dispersão dos valores em ur\a ou mais populações,
através de suas variâncias. Para isso, apresentamos alguns festes envolvendo essas
quantidades. Iniciamos com o caso de uma única populay'ão, conforme motivado
pelo exemplo a seguir. ì
Exemplo 9./f.' Sabe-se que em uma região doTfaís a altura média é de 1,68 m,
com variância 0,30 m2. Um pesquisador acred{a que a alimentação rotineira em
uma cidade litorânea, sendo diferente da região òoqno um todo, contribui para que
as pessoas apresentem alturas mais homogêneas, apesar de não alterar a altura
média da população da cidade. Para verificar sua suspeita, ele coletou uma
amostra de 31- pessoas e obteve como estimativa para a variância o valor
s?t":0,25fif . Neste caso, o pesquisador deve realizar um teste de hipóteses
relacionado à variância populacional para tirar suas conclusões. tr
Considere as hipóteses nula e alternativa, dadas por:
Ho:o2:o2"1
Ho, : o2 I o! @u o' > oZ ot o2 < of;y.
Aqui, o2 representa'a variância populacional em que estamos interessados e of; é
um valor numérico particular para o parâmetro. Para testar a hipótese I/r,
obtemos uma amostra de tamanho n da população e consideramos a quantidade
rf @-r)s2
02'
que envolve 52, a variância amostral. Se a população da qual a amostra foi
retirada se comporta de acordo como um modelo Normal, então, sob a hipótese
.F/,, temos que
9.3 Testes para Variância 315
O estimador 52 é utilizado no teste pois, como visto anteriormente, é um
estimador não viciado para o2. Baseando-se em V, construímos o teste, cuja
região cútica, para o teste bilateral, terâ a forma
RC :{u e IR. I o 1 r", ouu > u"r},
com uí.r e u", determinados a partir da distribuição Qui-quadrado com n 
- 
L graus
de liberdade e nível de significância a. O procedimento ó ilustrado no próximo
exemplo.
Exemplo 9.72: Para o Exemplo 9.11, as hipóteses de interesse são
Ho : o2: 0,30 ;
Hn,: o2 < 0,30
Temos que, sob Ho, r-2: 0,30 . Logo,
a . 
- 
(n 
- 
r)s\,,"- 3ol<!-,25 : 2b,oo.obs: 
-------;- : 0130
A região crítica do teste será dada por RC : {u € IR I , < u"}. Utilizando a
tabela da distribuição de Qui-quadrado com 30 graus de liberdade e tomando
a : 0,05 vem
P(V < u" I o' :0,30) : 0,05 + u" : 18,49.
Logo, como uobs ) 18,49 não rejeitamos a hipótese fI,, isto é, as alturas nn
cidade não são mais homogêneas do que aquelas observadas na região como um
todo. Ao invés de fixar a, poderíamos calcular o nível descritivo, obtendo
a* 
- 
0,30. tr
Outro teste de interesse é aquele que verifica se as variâncias de duas
populações são iguais. O teste de comparação de variâncias é também útil como
um procedimento preliminar em testes de comparação de médias, auxiliando n
cscolha das técnicas adequadas.
Ilxemplo 9.13: IJm fabricante de esferas para rolamentos desenvolveu um novo
rnétodo de produção, mais barato. Entretanto, ele desconfia que os novos lotes
lpresentam variabilidude dil'erente daqueles produzidos pelo método antigo (com
rclação ao diâmetro dns esferas), Pnra cada método, ele selecionou aleatoriamente
l5 esferas que fornecerum os seguintcs cliâmetros (em mm):
.t tó Capítulo 9: Tópicos Especiais
Método
X (antigo) Y (novo)
29,9
29,8
29,9
29,7
29,9
29,8
29,9
29,9
30,1
29,9
30,0
30,0
29,6
30,4
29,9
29,8
29,8
30,4
29,8
30,5
29,6
29,3
29,4
30,3
29,9
29,7
30,3
30,4
29,L
30,0
)
Algumas medidas descritivas foram calculadas, sendo do6" : 29,g3 mm,
úubr:29,89 mm, r'*ou":0,03 mm2 
" 
tï*:0,19 mm2. Na figura que segue,
apresentamos os respectivos gráficos box-plot, que sugerem vari
diferentes entre os dois métodos.
Antigo
Métodosde Prodqão
Entreternto, para podermos tirar uma conclusão.objetiva, precisamos testar a
hipótese de igualdade de variâncias. E
E
E
th
o
o
EÍqo
E
3t79.3 Testes para Variância
Vamos construir agora o teste de igualdade de
populações, representadas por X ë Y, tais que
Y 
- 
N(p", o|). Desejamos testar as hipóteses
H": o2y : oï i
H": o2y * 
"ï.
Utilizaremos a quantidade
F : Sïf S?,
baseada nas amostras X1 ,...,X,n, a Yt,...,Yn", obtidas das populações de
interesse; cujas variâncias estão sendo comparadas. Sob a hipótese f/r, pode ser
mostrado que .F segue o modelo de Fisher-Snedecor, que é caracterizado pelos
graus de liberdade associados às quantidades presentes no numerador e nO
denominador de tr', no caso, nt 
- 
L e rlz 
- 
1, respectivamente. Para n
distribuição de Fisher-Snedecor, utilizaremos a notação F(a,b), sendo ae bos
graus de liberdade.
L
Figura 9.2: Dístribuição de Fisher- Snedecor.
Probabilidades baseadas na distribuição de Fisher-Snedecor têm de ser
calculadas computacionalmente e são obtidas em planilhas eletrônicas e
variâncias de duas
x 
- 
N(p,x,ol) e
P(F , f")
com
318 Capítulo 9: Tópicos Especiais
programas estatísticos. Para valores selecionados de n1 e nz, tabelas podem ser
consultadas e, em geral, são construídas de forma a fornecer, para uma dada
probabilidade, o valor /" conforme mostrado na Figura 9.2. No Apêndice A,
apresentamos tabelas dessa distribuição para probabilidades iguais a 0,05 e 0,95.
Assim, para um nível de significância a pré-fixado, podemos obter os
valores ft e fz tais que
P(F < fi ou F'V fz) : o,
\
\
\
F-F(nr-L n2-L).
A região crítiça para o teste bilateral é dada por
RC : {/ e re : f < hou f {f})', \_
Portanto, se 
.f,1" e RC , rejeitamos a hipótese de igualdade das variâncias.
Exemplo 9.14: Yoltando ao exemplo anterior, queremos testar se as variâncias do
diâmetro das esferas produzidas pelos métodos antigo (X) e novo (Y) são iguais
ou não. Isto é,
H": o!: oï ;
H,r: o2a I 
"ï .
Note que as hipóteses podem, de forma equivalente, ser expressas como
_2
H. : y{ : L;
oï
_2
n, , "] 1t.
o'Y
Sob a hipótese Ho, temos que
q2F:#-F(L4,I4).
' Dí/
Logo, fixando a : 0,10 determinamos a região crítica do teste, de modo que
P(F <,/r):0,05 e P(F > lz):0,05, Dada a forma das tabelas de Fisher-
Snedecor apresentadas no Apêndice A, precisamos determinar fi e /2 tais que
9.3 Testes para Variância 3le
P(F >"ft) : 1 
- 
P(F < /r) : 1" - 0'05 = 0,95;
P(F>/z) :0,05.
Essas quantidades estão representadas nas figuras a seguir.
Da tabela da distribuição de Fisher-Snedecor' com 14 graus de liberdade parn o
numerador e 14 graus de liberdade para o denominador, obtemos que "fi = 0,403
c lz:2,484'
Logo,
RC :{/ e m.* : / < 0,403 ou Í > 2,484}'
Para os dados disponíveis, temos que
fobs : t'*"0"/tï"u": 0,03/0,19 : 0,158 € RC.
Portanto, confirmando as evidências fornecidas pela análise descritiv&,
concluímos ao nível a: L07o que existem diferenças em termos dA
homogeneidade dos diâmetros das esferas, dependendo do método utilizado. tr
Uma peculiaridade aparece no caso de testes unilaterais, uma vez que tl
lorma da região crítica depende de qual quantidade é considerada no numerador
tla expressão de F. Para esses casos, a representação das hipóteses de interesse
crn teimos de frações evita possíveis confusões na construção de tr.. O exemplo, A
scguir, ilustra esse procedimento.
Ilxemplo 9.15: lJm fabricante de panetones costuma vender produtos de segunde
tlualidade (no que diz respeito ao formato) a preços reduzidos. Para panetones de
.i{)0 gro*or, súspeita-se que o procluto de segunda qualidade apresente maior
vuriabilidade no que sc referc ilo peso. Para tanto, 26 panetones de primeirn
tlualiclade e 20 de segundo tivcram seus pesos aferidos. Denotaremos esses pesos
320 Capítulo 9: Tópicos Especiais
por X1 
, 
.., , X26 e Yr, ... ,Yzo, respectivamente. Foram calculados os valores das
variâncias amostrais, sendo dados por sï,ô :0,29 e szru" 
- 
0,73.
As hipóteses de interesse são:
H" : ozy : oï versus Ho: oï < 
"? .
Para determinar a região crítica e a quantidade F corretamente,
reescrevemos as hipóteses como
n, : o2* I ol,, : L versus H" : o2* I ol, < L .
A construção de f' deve considerar a escolha darazão de variâncias nas hipóteses,
no caso com as quantidades relacionadas a X no numerador, isto é,
F : Sr*lS?, i
l
e a região crítica será da forma
RC : {/ e re | f < ï"}.
Sob a hipótese nula, .F 
- 
F(25,19), e para a:0,05 obtemos, da tabela da
distribuição Fisher-Snedecor, f. : 0,495.
Como
f obs : t'*.0"/ tïr" : 0,2g 10,73: 0,356 ;
temos Que .fol., € RC e, portanto, concluímos que os panetones classificados
cotto de segunda qualidade apresentam pesos com maior variabilidade do que os
panetones de primeira qualidade. tr
Itrxcrcícios da Seção 9.3:
l. Supondo X 
- 
F(a,b), encontre r" tal que:
a. P(X ) r,,) :0,05 com a : 18, b : 3.
b, P(X ) r,.) 
- 
0,05 com a : 3,ó : 18.
c. P(X , r,,) :0,05 com a : 180, b : I92.
d. P(X ; r,') :0,95 com a,:5,b : 12.
e. P(X > r,,) :0,95 com a : 30, b:40.
2. Umr linha de montagem produz peças cujos pesos, em gramas, obedecem ao
modelo Normal com variância30 g2. os equipamentos foram modernizados e,
pnrn verificar se o processo continua sob controle, foi tomada uma amostra de
9.4 Andlise de Variância
23 peças, que fornece\ s|tr:4O 82. Existem evidências indicando que A
variância mudou, considerando a : I07o?
3. Uma panificadora produz determinado tipo de pão, cujo peso médio é de 190
g,ramas, com desvio padrão de 18 gramas. Devido a mudanças na política
_-4ambral, que ocasionou aumento no preço do trigo, alguns ingredientes da
f receita foram substituídos. Uma equipe do governo resolveu verificar se a( variabilidade no peso do produto aumentou e escolheu, aleatoriamente, 16
' unidades, medindo o peso de cada uma. O peso médio obtido da amostra foi de
102 gramas e o desvio padrão foi de 24,5 gramas. Qual a conclusão para
a: I\Vo.
4. Para comparar o. grau de diversidade de duas populações primitivas, uma
medida antropométrica foi obtida em fósseis coletados em sítios arqueológicos,
fornecendo a tabela a seguir.
Característica Sítio A (n: Sítio B (n :23)
321
Média(cm) L5,L2
Variância (cm2) 0,L24 L2,2L0,184
O que pode ser concluído a respeito das variâncias? E das médias
populacionais?
9.4 LnáÃise de Variância
Consideramos nesta seção o caso de comparação de três ou mais
populações, definidas por uma variável qualitativa (fator) através de testes com as
correspondentes médias. Não abordaremos a situação com dois ou mais fatores
neste texto e o leitor interessado poderá consultar as referências mencionadas na
bibliografia. Iniciamos com o caso em que as amostras de cada população têm o
mesmo tamanho.
Exemplo 9.16: A gerência de um depósito que armazena cargas aéreas de
pequeno porte está estudando o peso das cargas que chegam ao seu terminal no
interior de São Paulo. Usualmente, o terminal recebe 4 tipos de cargas: doméstica
(D), administrativa (A), equipamentos industriais (E) e outros tipos (O). Deseja'se
verificar se, em média, existem diferenças entre os pesos dos 4 tipos de cargas,
Ao longo de 1 mês, cargas foram colhidas aleatoriamente e seus pesos foram
aferidos, fornecendo os dados (em kg):
322
--. 
Capítulo 9: Tópicos Especiais
Tipo de Carga
D
24,,9
20,4
24,2
22,3
20,3
24,0
23,5
A
27,9
28,7
E
38,4
38,6
43,9
40,2
40,2
37,3
o
23,8
25,3
23,5
27,6
25,5
23,9
22,6
28,4 4L,2
25,3
29,3
28,5
27,9
Estamos interessados em comparar os quatro grupos com diferentes tipos de
ciìrga. Descritivamente, observamos que os pesos de cargas do tipo E apresentam
os maiores valores dentre os quatro grupos. Algumas mqdidas descritivas para os
dados estão apresentadas na tabela a seguir. \
Medidas
Descritivas
Tipo de Carga
oAD
Média
Mediana
Desvio-Padrão
Mínimo
Máximo
,,R
23,5
1,9
20,3
24,9
27,9
28,L
r,2
25,3
29,3
40,L
40,2
t,
37,37
43,9
24,6
23,9
1,6
22,6
27,6
os valores descritivos também sugerem que cargas do grupo E tendem a
tcr maior peso. Note que o menor peso observado para esse tipo de carga é, maior
quc os máximos observados para todos os outros tipos. Após acargado tipo E, as
cilrgas do tipo A parecem ter, em média, maior peso. A carga de tipo D apresenta,
crn média, o menor peso. salientamos que os desvios padrões amostrais
cncontram-se razoavelmente próximos uns dos outros. tr
Para estudarmos a situação apresentada no exemplo anterior,
consideramos um modelo estatístico, em que cada observação y pode ser
clccomposta em duas componentes: sistemdtica e aleatória, esta última
rcpresentando variações individuais e todos os fatores que não são explicados
pela parte sistemática. Matematicamente, podemos escrever
f:p,*e.
3239.4 Análise de Variância
Assim, se Y representa a observação associada a uma unidade experimental, a
parte sistemâtica p, pode ser vista como a média populacional, que é fixa, e a parte
aleatíria e como a informação referente a outros fatores que podem influir nas
observações mas não são incorporadas em p.
Suponha que estamos interessados em comparar as médias de K
populações, isto é, queremos testar
Ho:Ft:P2:"':l-LN;
Ho : pelo menos uma das médias p.a é dlferente das demais.
Para tanto, obtemos K amostras independentes, com rn indivíduos em cada uma
delas. Nesta situação, o modelo estatístico para aj-ésima unidade experimental,
da i-ésima população é dado por
Caso a hipótese Hoseja verdadeira, teremos que todas as médias para as K
populações serão iguais a um valor comum p. O modelo pode, então, ser escrito
como
Modelo O:fii : tt -l eïi, 'i : L, ... , K; i :
Uma forma de levar em conta a informação não
sistemática é através das somas de quadrado
K rrt Krn Krn
L, ... ,n1,.
explicada pela formn
I( nt
DL"?,: Dltuj- tLò2 " II,4)' :!!(ui - ò2.i:t j:l i:L j:t i:r j:l 'i:L j:L
Essas expressões envolvem as quantidades desconhecidas [Li,'i - 1,...,1( e p,,
Utilizaremos os dados para obter as estimativas correspondentes. Levando-se em
conta que, no Modelo 1, estamos supondo diferentes médias para as K
populações, consideramos os dados oriundos de cada uma dessas populações para
estimar a correspondente média. Assim, segundo o Modelo 1 temos
fr, : LrU, -yr, i : r,...,K.' L mfi
Para o Modelo 0, como assumimos que todas as populações têm a mesma méclia,
utilizamos o estimador
324 Capítulo 9: Tópicos Especiais
p-
Substituindo as estimativas acima nas correspondentes somas de
quadrados apresentadas anteriormente,
definimos as quantidades soma de
quadrados dentro (SQD) e soma de quadrados total (SQT), da seguinte forma:
Knì KmI(
#,pin,:o
SQD:
SQT :
K,M\\(uti:t i:t
Krnf !(u:i.:t j:L
- i,n)' : t Dru, -Yn)' : t D",3 - *\1 ;i,:t j:t i.:1 j:r i.:t
K nì.
- ì)' :! !(ri - 7)= D,Dv,i - mKTzi:L j:l i:t j:r
É importante ressaltar que as expressões resultantes fornecem uma maneira mais
conveniente de se calcular, via computador ou manualmente, cada uma dessas
somas de quadrados.
A diferença entre SQT e SQD representa a somo de quadrados entre e
será denotada por SQE, isto é,
SQE: SQT _ SQD.
Das expressões para a soma de quadrados total e de dentro, segue que:
I{ I{
seE : *ltZu 
-Y)' : ^(DY? - NY').à:t i.:t
Cada uma das somas de quadrados envolve um certo número do
quantidades que estão sendo estimadas. Por exemplo, SQT contém 7 e SQD
contém Yi,i:1,...,1(. Levando este fato em considera!ão e o número dê
observações nas amostras, definimos os correspondentes quadrados médios:
QMT:
QMD:
SQT
Km-I
SQD
Km- K
: quadrado médio total;
: 
=j.g\:quadrado médio denrro;h\m- r)
SOEQME: È, quadrado médio entre.
T
9.4 Anólise de Variância 325
Note que, nesse caso, é preciso calcular as três quantidades anteriores
pois QMT não é igual à soma de QMD com QME.
O teste estatístico pataa hipótese.I/o envolve os quadrados médios. Se a
hipótese Ho náo for verdadeira, então, o Modelo 1 deve ser mais adequado aos
dados do que o Modelo 0. Em outras palavras, os resíduos produzidos pelo
Modelo 1 serão menores que os do Modelo 0. Analisando sob este ângulo,
podemos interpretar QME como sendo, em termos quantitativos, a informação
contida nos dados que ó captada pelo Modelo 1, enquanto que o QMD represento
a informação não explicada pelo Modelo 1. Portanto, se QME for grande
comparado à QMD, a parte sistemática do Modelo 1 estará captando grande parte
da informação dos dados e a hipótese Ho deverâ ser rejeitada. Definimos, então, a
quantidade
QMEH-_
'-eMD
Quanto maior for o valor de -F, maior será QME comparado a QMD e, assim,
maiores as evidências contra Ho.Para caracterizarmos o valor crítico a partir do
qual rejeitamos Ho, precisamos encontrar a distribuição de probabilidade para F,
Supondo as seguintes condições:
. Yi sáo variáveis aleatórias independentes;
. Todas as K populações têm variâncias iguais a o2;
'Yj - N(Po,o2),'i : L,..., K e j : !,.'.,m,
pode ser mostrado que
F-F(K-L,K(m-I))
isto é, a quantidade I' tem distribuição de Fisher-Snedecor com K 
- 
1 e
K(* 
- 
1-) graus de liberdade. Temos, agora, condições de encontrar o valor
crítico /, e determinar a região críticado teste, que será da forma
RC:{/ere*:f>fl}.
Das três suposições feitas, a mais impdrtante é a segunda , V ar(f;i) : o2 ,
para'i: L,...,K e j:1,...,Tn) que tem o nome técnico de homocedasticidade'
A suposição de normalidade é importante em termos teóricos, mas, muitas vezes,
na prática, o teste pode ainda ser utilizado quando ela não for válidn,
principalmente, se as amostras forem grandes. Nesses casos, o Teorema Central
do Limite pode ser utilizado para justificar o uso da distribuição de Fisher-
Snedecor. Caso a suposiçâto de hornocedasticidade não seja verdadeira, técnicas
J26 Capítulo 9: Tópicos Especials
alternativas podem ser utilizadas. Algumas delas envolvem aplicar urna
transformação logarítmica ou quadrática aos dados. Esse assunto envolve técnicat
mais avançadas e não será abordado nesse livro.
A discussão sobre o comportamento dos erros e das somas de quadrados é
resumida na Tabela 9.2 a seguir.
Tabela 9.2: Tabela de Análise de Variância (ANOVA).
A tabela ANovA fornece como subproduto um estimador para a
variância populacional o2, baseado na suposiçãã de homocedasticidade. Nessg
caso, a variância amostral para o z-ésimo grupo,
s?:J.Ë(Y1-To7z,
" rn-If,
pode ser usada para construir um estimador da variância populacional. Isto é feito
combinandoessesvaloresatravésdamédiaponderadaa"if,...,S?,
Knt
"z - 
(m 
- 
r)sÏ+ "' + (rn 
- 
t)sfu D D&i - v-o)'
""-@:__Nç*_g.
A expressão obtida para s! é a mesma que encontramos para eMD.Note aindaque a expressão de QMT também é um estimador para o2,uma vez que
QMT: 
=rtQt ' S S-rrr" -Y\2 - q2Km-I Km-ILí?r''" ') -r'
ou seja, QMT nada mais é do que a variância amostral s2 para uma amostrê
corïposta pelo conjunto de todas ai observações dos K grupos combinados,
E
9.4 Aruilise de Variância
Exemplo 9.77: Para os dados apresentados no Exemplo 9.16, temos K : 4
grupos e nt:7 observações por grupo. Além disso, obtemos Yt:22rïi
Tz:27,9; Ts:40,L e Ta:24,6. A média geral é Y:28,9' Cálculos
intermediários podem ser, facilmente, feitos em uma planilha eletrônica ou
calculadora fornecendo:
474
t t Yli : 24.672,42 " DT?: 3.b13,80.i:I j:r i:L
Usando as fórmulas de cálculo apresentadas anteriormente, obtemos
Ktnl(
sQD : DLUS - *:Dfi : 24.672,42 - 7 x 3.513,80 : 75,82;i:r j:L
i27
i.:t
K
sQE: *(DT? 
- 
KY'):7 x (3.513,80-4 x 28,86') =r.275,4U
i:l
It In
SQT: D,DU\-*KYz :24.672,42-T x 4x 28,862:1.351,23.i:r j:l
Uma vez calculadas duas das somas de quadrados acima, obtemos, sem
dificuldade, a terceira. A tabela ANOVA é apresentada a seguir.
Fonte de Graus de
Variação Liberdade
Soma de
Quadrados
Quadrado
Médio F
L.275,4L lgy : 452,,L4 W : L94,54
75,82 ff :3,,L6
Total 27 1.351,23
Através da distribuição de Fisher-Snedecor, com 3 e 24 graus de
liberdade e, considerando a :\Vo, obtemos 
"f":3,009. Logo, como calculamos
.f,,t,":L34r54 > /,, concluímos que, ao nível de significância de 5Vo, as médias
de peso dos grupos são diferentes, confirmando as observações descritivas feitas
Entre
Dentro
3
24
trrnteriormente.
328
Grupos de tamanhos diferentes
No desenvolvimento anterior, supomos que os 1( grupos têm todos o
mesmo tamanho. Podemos considerar uma situação mais geral em que isto não
acontece. Vamos denotar pot na o número de elementos do grupo e. Neste caso, o
total de indivíduos nos K grupos será igual a
n:nL*...1nx.
Todos os resultados anteriores permanecem válidos, mas modificações algé
são necessárias nas expressões que agora serão escritas da seguinte forma:
Kni
seD: It(0,,, - ro)r:i:t j:r
K
SQE : D"n(To -i':L
Kni
sQr : !!(ui -v),i:t j:r
Fonte de Graus de
Variação Liberdade
Soma de Quadrado
Quadrados Médio
Entre
Dentro
K_T
n- K
SQE
SQD
Total n 
- 
I
comF 
- 
F(K 
-I,n- K).
i:r
Kn;
: I D,ul -,Y'.à:t j:l
Note que, nesse caso, as médias geral e dos grupos são dadas por:
por
.I(niv::tDu"
'o i:l 
.i:7
o,: 
*,,\yi, i:r,...,K.
A Tabela de Análise de Variância sofre poucas modificações, sendo dada
SQT
-"tt
ncas
9.4 AnáIise de Variância 329
Exemplo 9.18: O volume de vendas, no ramo de vestuário, tem se mantido estóVOl
de ano para ano, mas açredita-se que sofra mudança de um quadrimestre pere
outro, dintro de um mesmo ano. Através de uma metodologia adequada, fOl
criado um índice que reflete a quantidade vendida. Em cada um dos quadrimestre8
do ano, foram escolhidas aleatoriamente algumas empresas de mesmo porte e $ÇUS
índices de venda foram calculados (ver abaixo)'
Quadl Quad2 Quada3
114,7 L44,7 153,1
L44,7 173,4 L92,5
119,1 L54,2 745,5
r!3,7 L54,7 168,8
108,9 125,9 L4L,5
96,7 119,5 1.4r,2
87,6 155,7 189,6
L32,4 213,9 178,4
L56,2 208,6
159,0
O comportamento das vendas pode ser visualizado na próxima figura'
RUI<tt ufi -1";Y'z1;i:t j:L i.:L
F
QME QME/QMD
QMD
.tJ0 Capítulo 9: Tópicos Especiais
uma rápida avaliação dos box-prol mostra o primeiro quadrimestre com
iï,T:ï::::índices. Os outros dois quadrimesrres apresenram vaÌores u,,, Oou"omais próximos.
O modelo de análise.. de variância pode ser aplicado parasignificância estatística_das diferenças obs"ruaà^ oì.;"". a#;
,-, : Lr, --8.,:r: L0 e ns 
-g. Faz"d; 
"r;;[;ì;r;;tï;H_^It
: 1.14,7.; .Y?: LS',T; % : ios,s ;ï:;í;,;':"üïdisponíveis e a ajuda de uma planilhalletrônica obtemos
3n;
J
LruV; :604.207,68.i:Lf f Y7:6tT.B5e,6B e
cat a
i, temos
obtemos
os dados
i:r j__l
Ilntiro,
3n;3
sQD : DDul -D"'Y?: 617'35e'6I - 604.207,68 : 13.332,00;L:L 
.:J:L 'i:7
I(
sQE: D"rY? - rY' :604.207,68-27 x 747,9J2 : rJ.844,90;i:l
c, com relação à variação total,
SQT : 13.392,00 + 18.844,90 :26.676,90 
.
Com esses valores calculados, construímos a tabela ANOVA:
liÌrnte de
Variação
Graus de
Liberdade
Soma de
Quadrados
Quadrado
Médio F
Entre
Dentro
73.344,90
13.332,00
13.s44,90
2
13.332,00
24
2
24
:6.672,45 trffi : r2,0L
: 555,50
Total 26 26.676,90
c) teste l'ornece o valor r1b": L2,01 que deve ser comparado com o varor crÍticoobtido de uma distribuição Fisher-snedecor com 2 e 24 graus de Iiberdade,Considerarrdo cv: 5Vo,.^obtemos 
.f..- 8,40J. Tendo 
"rn 
uï.io gue í,r,, ) ír,corrcluímos que existe diferença nas médias de venda dos quadrimestres. tr
9.4 Análise de Variância 331
Exercícios da Seção 9.4:
1. Três diferentes bancos possuem agências de mesmo porte em uma avenida
movimentada de Salvador, BA. Para testar se essas agências têm movimento
médio equivalente, foi escolhida uma semana típica de trabalho e o
desempenho, nesses dias, foi registrado. Os dados obtidos, em milhares de
reais, óstão apresentados na tabela a seguir:
Banco
2
146,4
r99,2
179,,5
98,4
263,7
L94,3 r73,7
227,2 246,5
203,,4 289,8
111,8 L27,,4
275,0 265,6
Qual seria a sua conclusão ao nível a : 57o?
2. Uma agência de empregos deseja verificar o grau de satisfação de seus clientes.
Para tanto, escolheu aleatoriamente domicflios de famílias de bairros classe A,
B e C, que fizeram uso da agência e solicitou que um questionário fosse
. preenchido pela pessoa responsável na família. Os questionários foram
devidamente codificados, a fim de fornecer um índice de satisfação que varia
de 1 a 5 (totalmente satisfeito). Os resultados estão apresentados a seguir. Qual
seria sua conclusão, considerando a : 0,05?
Classe
B
1,5 2,8
L,7 3,1
2,7 2,4
2r5
3. A fim de verificar o efeito de quatro tipos de propaganda de uma determinada
marca de goma de mascar, crianças foram atribuídas aleatoriamente a cada
uma de 4 salas que mostravam desenhos animados, com intervalos regulares
em que as correspondentes propagandas eram inseridas. Após a sessão, as
CA
2,7 3,7
4,3 4,6
3,4 4,7
2,9 3,5
4,5 3,8
4,0 4,r
2,3 4,2
2,5 3,5
2,5 4,2
.t.12 Capítulo 9: Tópicos Especiais
crianças foram entrevistadas por psicólogos, que atribuíram um índice de
assimilação a cada criança. Quanto maior 
"s" índi"", maior seria a lembrançado produto. Os dados são apresentados a seguir.
Tipo de PropagandaIIm
1572222
7 6 21 16 B 11 16 116 7 23 15 7 16 19 1810 6 2022 10 B 11 115 6 18 18 1315 11 105 8 2122 B 8 13 19
D"7 rco 4.876 L.465 2.444
9.5 Regressão Linear Simples
No capítulo 5, definimos o coeficiente de correlação como uma medidade dependência linear entre duas variáveis. Em muitas situações, além de
estzrrmos interessados em saber se existe relação entre duas variáveis, podemos
desejar estabelecer uma relação de causalidaae. tsto é, queremos quantifìcar qualó a mudança observada em uma das variáveis quando variamos os valores da
outra.
Exemplo 9.19: Em uma dada região de Bocaina-sp, acredita-se que o gado
nlimentado em um determinado pasto tem um ganho de peso maior qu" o uiual.
EsÍudos de laboratório detectaram uma substância no past; e deseja-se verificar se
ela pode ser utilizada para melhorar o ganho de peso dos bovinos. Foram
cscolhidos 15 bois de mesma raça e idade, 
" "ãdu animal recebeu umfldcterminada concentração da substância x (em mg/l). o ganho de peso após 30
dias, denotado por Y, foi anotado e os dados foramãs seguintes (em Èg):
X 2,5 3,0 3,5 4,0 4,5 5,0 5,5 6,0
Y L6,2 1.6,2 L7,7 L8,g L9,g 22,5 24,7 23,L
X 0,2 0,5 0,6 0,7 1,0 1,5 2,0
Y 9,4 TL,4 12,3 L0,2 11,9 13,6 14,2
-".il
9.5 Regressão Linear Simples
Observando a tabela de dados, notamos que, de fato, à medida que aumenta a
concentração da substância, ocorre um aumento no ganho de peso.
Conforme apresentado no Capítulo 5, o coeficiente de correlação linear
entre a concentração X e o ganho de peso Y é calctlado por:
n
DrnAo - rì,VobrUobsi,-lpx,l, :
333
I.-
\/ | E 4 - n"',,ll1rl - naZu,fv r-'
785,55-15x2,70x16,14 : 0,99.
/(163,39 - 1b x 2,702)(4.2J9,4J - 15 x r6,t42)
Desta forma, vemos que a variação do peso é sensivelmente influenciada pela
variação da concentração da substância.
Para observarmos como as variáveis se relacionam, construímos um
grâfico de dispersão, apresentado na figura a seguir.
30
25
E)
i1
8zoo
CL
ot
€rsc
oa
10
5
0
334 Capítulo 9: Tópicos Especiais
Nota-se que os pontos tendem a se alinhar sobre uma ,"ru,)uiuinclinação reflete
o sinal positivo observado no coeficiente de correla çao ca(liao. tr
\
Utilizando o desenvolvimento da Análise de Vahância apresentado na
seção anterior, consideramos para o conjunto de valores (Xt,y), i : \,:.. ,fr, o
seguinte modelo estatístico:
Y:g(xr)+q.
Isto é, o comportamento de Y é explicado em parte por x4, através da funçãog(xt) e' em uma outra parte não captada po, 
"rru 
úçao, representadapot ei.
várias opções paru g(xa) podem ser utilizadas, mas a que define o modìlo de
regressão linear simples é
g(Xr): ai 7Xr.
Portanto, dado um valor fixado 14 paÍax;, o modelo pode ser reescrito como
- 
"F:a-rprn+4
Além disso, supomos que os termos e;, i:L,...,fr, são independentes edistribuídos conforme um modelo Normal de média 0 e variânc ià o2. Dessa
forma, fixado Xi : ri, as variáveis \ são independentes e
Y 
- 
N(a * Br;,,o2), ,i : I,... )n.
Em modelos de regressão, a variável \ é, comumente, denominada
vorióvel resposta ou variável dependente, ao passo que a variável xi é, chamada
variável independente, explicativa ou ainda covariável. Os parâmetros do modelo
em que temos maior interesse são a e B. Eles têm interpretações muito úteis na
prírtica. Oparâmetro o 9_. ua]!g_g!p91qqo_!4lu a variávãl dçpqrylente ylquando
x, e i guqtã@õ pãamet.ò-piãnsi&ì aoi. uaoìË, pura
x,, dadòìpoìã e n* 1, eìepresenre por E(y l'x - r) o ualor esperado da
variável resposta quando X : r. Então,
E(Y t x; : r * 
" : ï;:{iï;!}") + p
Logo,
-
9.5 Regressão Linear Simples
Ê : E(Y I x : r +t) - n(Ul x : r),
indicando que P representa o acrtSscimo eqterado nale!êygf-Igqpgtlq ggqldo a.
cg-v3rriável è@to nos fornece uma iclãiãíe3p--cJïto aa'
intensidade com a qual a covariável atua na resposta.
A estimação de a e B pode ser feita através do método de mínimos
quadrados, que consiste em minimizar a soma dos quadrados dos resíduos obtidos
através da diferença entre valores observados A e valores esperados
B(Y I X: r), calculados para cada X: r. A Figura 9.3 ilustra essas
quantidades. Note que, caso o ajuste fosse perfeito, todos os pontos estariam
alinhados sobre a reta e os resíduos e seriam todos iguais azero.
E(YlX=x)
xX
Figura 9.3: Resíduos no modelo de regressão linear símples.
Como em geral os pontos não estão perfeitamente alinhados, escolhemos
â "melhor" reta possível no sentido de minimizar a soma de quadrados SQ@, B),
dada por
se(a,g) :f,@n 
- 
n(U I xr: rt))2
i:7
n'n
:D@o-d-grn)':D"?.
i:1. i--L
335
E(YlX=,r)=g*0x
Resíduo (e)
.736
"%!Flit|IF-
Matematicamente, temos que resolver o sistema de equações
p: LrtAn - nrA:1
- 
TLï'
Exemplo 9.20: Yimos, no Exemplo 9.19, que o diagrama de dispersão sugere
uma reta pode ser utilizada para representar o efeito da concentração de uma certe
substância no pasto (X), no ganho de peso bovinos (Y).
Para obtermos essa reta, precisamos calcular as estimativas de â e B. Dos
dados fornecidos obtemos:
-q -!!-
n : r5,D*nru: 785,55; D"?:
163,39;ri.:l à:t
Logo,
p:
n,
Lt&t - nI Ai:t 785,55-15x2,70x16,14
as derivadas de SQ(a,0) em relação a a e B. Deixamos aslpontas a cargo dq
leitor, apresentando aqui a solução para o sistema que fornecer/ os estimadores d;
mínimos quadrados para a e B. Temos /À-f,a:A_pr; \
D"7i:r
Tl,
st-,
Lx:í. - nr'i:l
163,39 
-I5x2,702
ã : U - pT : 16,1.4 - 2,44 x 2,70 : 9,55.
Portanto, dado X : {rit à reta ajustada fornece valores f,, dados por
0r, : ã +B rn: 9,55 * 2,44ri.
A figura a seguir mostra os dados originais e a reta ajustada. O gráfico
sugere que o modelo de regressão linear simples apresenta um ajuste adequado
aos dados.
L6,L4.
-*.!qlFF
9,.í rtegres,rrT u Llnea r,lhrpler
Modelo0: }j:al€it
caso Ifl seja rejeitada, o modelo é
337
25
El
.Y
8zooÍL
oIt
€rs
tr(É(5
10
5
0
01234567
Concentração (mg/l)
A interpretação dos valores estimados é feita da seguinte forma. O ganhO
de peso esperado em bovinos que não recebem a substância X é 9,55kg (obtidO
substituindo ri:0 na equação calculada acima). Por outro lado, um aumento de
1 mg/l na concentração de X implica em um ganho médio esperado de2,44kg.
Testes de hipóteses, envolvendo os parâmetros do modelo de regressãO
linear simples, baseiam-se na decomposição da variação total, discutida na Seção
anterior.
O principal teste de interesse é verificar se a covariável influencia na
resposta, o que é equivalente a testar
Hoi0:0versusH":Bl0'
Caso 11o não seja rejeitada, adotamos o modelo
:2144;
i : l, ... ,Tt',
i: 7r... )n.Modelol:\:a+PXilei,
Através do Modelo 0 obtemos a soma de quadrados total, dada por
--r
.ï.ï8 Cttpftulo 9: T'ópicrts lislteciuis
ser = D@, _ a)r, li:l 
/
clue contém a variação total contida nos dados. Por outro lffo, o Modelo 1 gera a
soma de quadrados residual \
seRes : f,@o - ã -ì *,)' ,i:I
clue contém a variação dos dados não explicada por esse modelo. A diferença
cntre as duas somas de quadrados fornece a soma de quadrados da regressão,
tlada por
SeReg : SeT 
- 
SeRes :3' * D,fr, - *)r.i:l
Para estabelecer os graus de liberdade associados às somas de quadrados,
precisamos levar em conta as estimativas envolvidas em suas expressões. Assim,
sQT envolve a média g, e assim, temos n 
- 
1 graus de liberdade associados a
essa quantidade; sQRes envolve duas estimativas, â 
"p, d" forma que teremosn 
- 
2 graus de liberdade. Para a SQReg, restam n 
- 
I 
- 
(" 
- 
2): 1 grau de
liberdade. Consequentemente, definimos os quadrados médios por
QMT:H 
-s',QMRes:H e QMReg:tQl"t.
Seguindo os passos da seção anterior, utilizamos
F_ QMReg
QMRes
para testar as hipóteses de interesse. Pode ser mostrado que .F tem distribuição de
Fisher-Snedecorcom \en- 2 graus de liberdade, isto é, F 
- 
F(1, n-2).
Em resumo, da mesma forma que na seção anterior, podemos apresentar
as informações apresentadas em uma tabela ANOVA, específica para o modelo
Y:a*?Xe*e;,dadapor
,=qF
9. 5 Il a g re s são l,in esr,S/rrryrle,r
Fonte de Grnus de
Variação Llberdade
Soma de Quadrado FQuadrados Médio
"*-*ru
.ï.19
Regressão 1
Residual n 
- 
2
SQReg QMReg QMReg/QMRes
SQRes QMRes
Total n-I SQT
Exemplo 9.21: (Continuação dos Exemplos 9.19 e 9.20) No estudo da relação
entre ganho de peso de bovinos (X) 
" 
a concentração de uma substância (Y),
estabelecemos uma reta de regressão.
Para verificar a evidência estatística do modelo realizamos um teste de
hipóteses:
Ho:B:g versus H":0*0'
os valores de QMReg e QMRes podem ser calculados com o uso de uma
planilha eletrônica, conforme a tabela seguinte
@u-ã- Br,i)2 / _\o\rr - r)"
1
2
t
t)
4
5
6
7
8
I
10
11
L2
13
t4
15
0,4r
0,39
1,65
L,L2
0,01
0,1-5
0,05
0,30
0,45
0,15
0,26
0,40
0,56
2,98
r,20
6,25
4,84
4,4L
4,00
2,89
L,44
0,49
0,04
0,09
0,64
1,69
3,24
5,29
7,84
10,89
Total 10,09 54,04
.140 ( | t p ít tt I t t 9 ;'liipi t't t,r lh pcc i t t i s
Com base nos valores apresentados na última linha da tabel )
\:'o''
327,73;
^z-SQReg : 0 \(ri - r), : 2,442 x 54,04 :
i:l
n,
SQRes : D@o - ã -Ê 
"ò, : 10,09 .i:1,
A tabela de ANOVA para o modelo de regressão proposto é dada por:
Fonte de
Variação
Graus de Soma deLiberdade euaeÌrados QuadradoMédio F
Regressão
Residual
327,73
10,09
327,73
0,78
472,471
13
Total t4 331,92
Para a:0,05 obtemos, da distribuição de Fisher-snedecor com I e 13 graus delìbetdade, f": 4,667. Como fob,:4i,2,47 ) f", rejeitu*o, u hipótese 11, econcluímos que existem evidências estatísticas de que a concentração dasubstância X,de fato, altera o ganho de peso dos bovinos. tr
Bxercícios da Seção 9.5:
1. um estudo deseja avaliar o efeito de determinado treinamento no tempo dereação de atletas submetidos a um certo estímulo. o treinamento consiste narepetição de um movimento e foi utilizada uma amostra de 37 atletas. paracada atleta foi atribuído um certo número de repetiçàãs (x) e, então, foimedido o tempo de reação ()'), em milisegundà.. Ü-u reta de mínimosquadrados foi ajustada aos dados, fornecendo a equação
ffi : 80,5 
- 
0,90r;, i : I, ... ,n.,
Interprete as estimativas de a e B .
2. Para verificar o efeito da variável x sobre a variâver y, foi realizado umexperimento que forne^cel 
-os.far9s (u,?lo) dados por (ã;'13,S), (Z; àl,ij','(5;15,9), (2; I2,8),^,(9; 29,6), (T; Zg,5),' \S: t+,i1, ìãi áS,Sl, (B; 32,6),(2;L2,0). e (1; 4,6). obtenha aretìajustada. construa o diagrama de dispersão,baseando-se nos pares de valores iornecidos e, em ,"guiou, desenhe a retaajustada. Baseando-se apenas no gráfico, você diria que o"ajuste é adequado?
:2
It
rÊ
F
*
*
.t
ÊI
ìi!:
l:
'li
().(t li.rerrício,t
Para verificar se existe relação entre a renda
número de filhos, foi coletada uma amostra
resultados obtidos estão na tabela a seguir:
familiar (em salários rnínimos) e o
de 8 famílias em uma ciditde, Os
141
3.
Família 1
Renda 12 14 15 LT
FilhosS22I
a. Que conclusões podem ser tiradas, baseando-se em um diagrarna de
dispersão e no coeficiente de correlação?
b. Calcule a reta de mínimos quadrados e interprete os parâmetros. Veril'iquo
se a renda influi no número de filhos, utilizando a : \Vo.
9.6 Exercícios
1. A seqüência de operações executadas por um operário para realizar uma ccrtt
tarefa está sendo estudada. Para tanto, 9 operários foram sorteados e mediu-se
o tempo necessário, em minutos, para que cada um realizasse a tarefa, cotÌl os
dois tipos de seqüências. Suponha que o modelo Normal é adequado.
Operário
23 27 34 43
1000
Atual
Nova
24 25
2t 23
27 22 23 28 26 28 29
28 27 24 26 25 22 23
Baseando-se nos dados fornecidos, você diria que houve diminuição no tempo
médio para a realizaçáo da tarefa? Use o : 57o.
2.Para se aferir o consumo de combustível, entre duas marcas de automóveis com
mesmas características, escolheu-se 8 carros de cada marca e anotou-se o
consumo após 100 quilômetros percorridos em uma estrada. Os resultados
estão abaixo:
Marca Consumo (krr/l)
xwx 9,5 9,4
YWY 9,0 9,3
9,6 9,1 9,3 9,9 9,8 10,1
8,6 8,1 8,3 8,9 8,8 7,9
Fazendo as suposições necessárias, verifique se
marcas é o mesmo. Use a :57o. Admita que
variabilidade.
3. O desempenho em duas classes de Estatística está
resultado dos dez melhores alunos de cada turma.
o consumo médio dzrs cluns
as marcas tenham a mesrnit
sendo comparado através do
.142
9,5 9,0 9,0 9,5
8,5 8,0 9,5 9,5
7,5 7,0 6,5
7,5 9,5 9,5
I
II
8,5
7,0
8,5
9,0
10,0
9,5
Admitindo que as variabilidades das classes são iguais, pode ser dito que erastêm o mesmo desempenho médio? Faça as ,upJriç0".'necessárias e utilizea:27o.
4' o salário de recém formados em veterinária foi amostrado em duas cidades. Nacidade A, 10 profissionais foram sorteados e na cidade B, 15. os resultados,
em salários mínimos, são apresentados
a seguir.
Cidade A: T,J;6,6; 6,g; 7,4; g,J; 6,5; T,g; B,Z; g,1; 8,5
Cidade B : 6,5; T,B; 8,2; 6,g; T,g; g,T ; g,I; g,5; T,4iB,0; 6,9; T,g; g,4;9,3; g,5
Admitindo que a variabilidade do salário seja a mesrna nas duas cidades e queo modelo Normal é adequado, verifique se ã cidade B paga, em média, melhordo que A. obtenha o nível descritivoã tome sua decisãó ulilizando um nível designificância a : 5Vo.
5. Motoristas novatos e experientes participaram de um experimento para avaliarse o tempo de habilitação altera o desgaste das pastilhas de freio. Dezmotoristas de cada tipo foram escolhidos e obsãrvou_se o número dequilômetros até a troca das pastilhas. Indicando por x a respostq dos novatos epor Y a dos experientes, os resultados amostrados (em mil'hares de km) foram
os seguintes:
10 10 10 10Drr:98, D,an: 106, t"?. :970 e ta?': I.I52.i.:t i:l l:t " Á"'
Admitindo que' para ambos os grupos, modelos com distribuição Normal com
mesma variância são adequados, o que pode ser concluído para um nível de
significância d :0,0b ?
6. Para estudar o impacto de cenas viorentas em desenhos animados, 5 criançastiveram seus batimentos cardíacos medidos, antes e após assistirem a um
clesenho comercialmente veicurado por uma grande emissora de TV. os dados
siro apresentados a seguir:
(i t 1t ít u I r t 9 ;'l'ópì ns Iì,rpt,c it t i t; .t4.1Q.(t lì.rertíritt,r
Batimentos
Criança Antes APós
I
2
3
4
5
96 tt{
t02 LL2
108 t12
89 83
85 99
Qual a conclusão, considerando-se um nível de significância Q:0,02? Que
suposições são necessárias?
7. Deseja-se comparar o consumo de refrigerantes entre alunos do ensino
fundamental e do ensino médio. Uma amostra desses alunos foi coletada e
solicitou-se que indicassem o número de latas de refrigerantes que consumilm
por dia. Os resultados, para cada grupo, foram os seguintes:
20 20
Ensino fundamental: lri :2/,, D"7: 610;i:L i:l
15 l5
Ensino médio: Drn: z+,lu?: 1.315.i,:l i:l
Supondo normalidade, verifique se as variâncias populacionais são iguais (use
a: I}Vo). Com base no resultado obtido, construa um teste de hipóteses parn
decidir, ao nível l7o, së os grupos têm o mesmo consumo médio'
8. O tempo de conexão à Internet tem sido modelado pela distribuição Normal
com desvio padrão de 10 e 7 minutos para o público jovem e adulto,
respectivamente. Amostras independentes desses dois públicos produziram:
6
Adultos: D4:217,2;i:t
10
Jovens: lur,:367 'i.:l
Teste, usando a : 5Vo, se o tempo médio de conexão dos jovens é maior.
.Ì4-l Ct t pít u I t t () :'l'ópi ct t,t Ih prr iu I t
I
9. Deseja-se comparar a durabilidade de amortecedores faUriqáOos pelas empresas
A e B. A medida observada é o índice de resistência de càdg1eça testaia em
laboratório, que é assumido ter a mesma variabilidade nas dús empresas. oB
resultados obtidos são apresentados a seguir.
Empresa A: 115, 723,134, L20,121- ;
Empresa B: 725, L26,I20,130, 128 .
Fazendo as suposições necessárias, qual a conclusão ao nível 2Vo?
10. Num programa de diminuição da poluição sonora em cidades grandes,
realizou-se uma campanha educativa durante 2 meses. A tabela abaixo
apresenta os índices alcançados antes e após a campanha em dez pontos cltt
cidade sorteados ao acaso.
Pontos da Cidade
4567 10
Antes
Depois
44 56
30 45
23
2L
34 25 67 21
35 26 50 23
23 73 58
22 57 46
verifique se a campanha surtiu efeito, ao nível de4vo.Indique as suposições
que devem ser feitas.
ll. um experimento com cobaias consistia em comparar o desempenho de uma
tarefa para dois métodos de aprendizagem. cada cobaia teve seu desempenho
medido, atribuindo-se uma nota de 0 a 10. Essa medição oóorr"u
imediatamente após cada aprendizagem. os idealizadores do Método 2 alegam
que seu método é mais eficiente e, portanto, deve produzir maior nota. De
estudos anteriores, sabe-se que, após uma semana, o aprendizado de um
método é esquecido e, portanto, fixou-se esse intervalo de tempo entre a
aplicação dos métodos. Além disso, foi estabelecido que o modelo Normal é
adequado para as variáveis envolvidas. As notas obtidas foram as seguintes:
Método1 B 3 7 4 6 2 7 3 I T
Mérodo2 8 4 B 3 7 3 8 3 B 6
Formule as hipóteses de interesse e faça o teste conveniente, considerando um
nível de significância a : SVo.
,:{!!--Ë=
3,159.6 lixan:ít:itt,t
L2. Deseja-se comparar o tempo de recuperação pós-operatória para duas técnicns
cinirgicas. pacientes opeìados, segundo cada uma das técnicas, lornnr
selecionados aleatoriamente e seu tempo de recuperação, em dias, registrnclo'
Todos os pacientes apresentavam o mesmo estado de saúde antes da cirurgia'
Os dados obtidos são:
Técnica 1
Té,cnica2
4 4 5 6 6
66778
a. Verifique se as variâncias
são iguais.
b. Verifique se a Técnica 1 é
recuperação. Use a :5Vo-
populacionais correspondentes às duas técrricas
mais eficiente com telaçáo ao tempo médio de
13. Um casal está procurando um apartamento para alugar' Duas cidadcs'
igualmente atrativas para o casal, estão sob consideraçáo' A decisão sobre qr,ral
a cidade escolhida dôpende do custo do aluguel. Neste sentido, eles obtiveratn
o preço médio e a vìriabilidade dos preços em cada uma das cidades. Nrt
pri-"i.u cidade, denominada cidade A, o preço médio e coÍrespondente desvio
padrao foram obtidos de uma pesquisa com 22 ' ofet.tas, fornecenclo,-respectivamente, 
R$ 455,00 e R$ 25,00' Na segunda cidade' B' fbrnm
escolhidas 30 ofertas que forneceram média de R$ 475,00 e desvio padriro de
R$ 18,00. Supondo normalidade e mesma variância, pergunta-se:
a. As cidades são equivalentes, ao nível 57o? Se não, qual é melhor?
b. Apresente um intervalo de confiança com 1 :0,95 para â diferença ele
preços entre as cidades A e B.
14. Duas raças de cavalos estão sendo pesquisadas quanto à. resistência a umit
certa doença intestinal. O experimènto consiste em ministrar uma dietit
especial, durante 3 meses e verificar a ocorrência ou não da doença, nos 6
*"r", seguintes. Os dados observados foram os seguintes:
Raça Tamanho da amostra Ocorrências
A 5B 6
B 85 10
Um veterinário afirma que a raça B tem maior propensão à doença' Vocô
concorda? Use a :6Vo.
15. Estão sendo testados dois aparelhos para estabelecer suas respectivas
confiabilidades no diagnóstico d" u*u 
""itu 
do"nça. Dados foram obtidos de
-
346 Capítulo 9: Tópicos Especiais
l
exames feitos em diversos pacientes, escol(idos ao acaso, que, após serem
avaliados por um dos aparelhos, tiveram \us casos estudados em maiorprofundidade. Desse modo, foi possível quàntificar o número de falsos
positivos ou falsos negativos advindos do uso do aparelho. Em outras
palavras, foi possível saber o número diagnosticado falsamente pelo aparelho
como tendo ou não a doença. Seguem as informações obtidas:
Aparelho Total Positivos Negativos Falsos positivos Falsos negativos
I r20 85 11 10 t4
2 135 90 27 72 6
a. Teste se os dois aparelhos produzem a mesma proporção de diagnósticos
falsos. Use a :4Vo.
b. Dentre os que estão efetivamente doentes, isto é, os positivos e falsos
negativos, teste se o aparelho 2 erra menos. Use a : 4Vo.
c; Com base nas decisões tomadas nos dois itens anteriores, que aparelho
seria mais aconselhável utilizar?
Queremos comparar três hospitais, através da satisfação demonstrada por
pacientes quanto ao atendimento, durante o período de internação. Para tanto,
foram selecionados, aleatoriamente, pacientes com grau de enfermidade
semelhante. Cada paciente preencheu um questionário e as respostas geraram
índices variando de 0 a 100, indicando o grau de satisfação. Os resultados
foram:
Hospital
9.6 Exercícios
pesos dos pacientes, tomados no início e no final do tratamento. Os dados
obtidos foram (em kg):
Número do paciente
45 910
347
Início 80
Final 78
r04 94
95 87
62 70 B0 r02
60 7t 82 94
58 78 84
65 78 80
L6.
a. Baseando-se nos dados apresentados, teste a igualdade
das variâncias para
os hospitais A e B. Use a : 0,10.
b. Teste se as médias populacionais são iguais. Qual sua conclusão? Use
a : 0,05.
17. Pacientes resolveram processar a clínica de emagrecimento Linha Fina sob a
alcgação de que o tratamento empregado não contribui para a diminuiçiro do
peso. O advogado de defesa contratou um estatístico que selecionou,
nleltoriamente, l0 prontuírrios que continham inlbnnaçiio a respeito dos
a. Faça uma análise descritiva para os dados e obtenha uma conclusão
preliminar.
b. Verifique se a conclusão do item anterior tem suporte estatístico. Formule
as hipóteses adequadas e encontre a região crítica correspondente a
a:0,05.
18. Uma linha de montagem utiliza robôs para a realização das tarefas necessárias
para a montagem de um produto. Os técnicos acreditam que é necessário umn
programação diferente para garantir a qualidade do produto final, mas
suspeitam que o tempo necessário para completar o processo pode aumentar,
Para verificar essa suspeita, 12 robôs foram selecionados e o tempo necessário
para a montagem do produto foi medido, considerando-se a programação usuül
e a nova proposta. Os tempos observados (em minutos) para cada unidndc
foram medidos, produzindo a tabela a seguir'
Tipo de Identificação do Robô
Programação 1 2 3 4 5 6 7 8 9 10 11 12
Usual 80 90 93 92 75 92 72 87 90 86 78 97
Nova 100 85 90 702 90 99 97 95 100 94 89 98
a. Faça uma análise descritiva adequada a estes dados. O que pode ser dito,
baseando-se nessa análise?
b. Existe diferença para os diferentes tipos de programação?
c. Construa um intervalo de confiança de confiança com 'Y : 95 Vo para t
diferença das médias populacionais dos tempos de montagem do produto.
19. O custo de manutenção de treminhões movidos a gasolina e a diesel são dados
abaixo para duas amostras aleatórias de 10 treminhões de cada tipo. Os
veículos considerados trafegam sob as mesmas condições em uma mesmiÌ
área.
A
Tamanho da amostra
Média amostral
Variância amostral
10 15 13
80,7 59,0 72,3
113,3 L0t,4 10d,5
rí8 Cupftnlo 9: 'l'ópicos lltperlalt
Combustível
Gasolina
Diesel
L4p7
8,gg
a. Quais são as hipóteses necessárias para construir um intervalo de confianç6,
para a diferença das médias dos custos?
b. Verifique se as variâncias dos dois grupos são semelhantes.
c. Teste-a igualdade de médias dos dois grupos, considerando a : ïVo.
20. (Use o computador) Uma loja de departamentos está interessada em saber sg
existem diferenças entre as quantias médias faturadas, através de três formag
de pagamento: dinheiro (D), cheque (C) e cartão de crédito (CC), Um
levantamento das vendas (em milhares de reais), em um dado período de
tempo, foi feito, produzindo os dados na tabela a seguir.
Formas de Pagamento
CC
56,00 80,90 73,25
20,50 5r,29 56,65
37,37 40,95 123,2t
29,64 72,65 56,50
132,47 37,29
60,32 44,65
60,00 40,64
CD
a. Calcule algumas medidas descritivas (média, variância, etc.) e,
nelas, discuta se existem evidências de diferenças.
b. Assumindo que as variâncias são iguais para os três grupos,
estatisticamente as médias populacionais para verificar se
diferenças. Use a : 0,05.
21. Quatro diferentes espécies de milho foram produzidas em laboratório. Deseja-
se testar, a um nível de significância a:ívo, se existe diferença
estatisticamente significativa entre as produtividades. Para tanto, foram
montados 34 canteiros, plantando-se neles o mesmo número de sementes e
garantindo-se a todos as mesmas condições de fertilidade, irrigação e
exposição à luz solar. Após um período de tempo pré-especificado, a
produção de cada canteiro, em kg, foi obtida. os resultados observados
baseado
compare
existem
5,05 10,99 15;00-ÌÍ-1--876-
4.r7 t2,72 g,g5 2,94 5,00
JÇlr
9.6 llxcrcícios
sofreram um tratamento
disponibilizadas:
I
90,56
13,28
34e
inicial, e as seguintes informações foram
Espécies
23
10 8
83,63
l_6,55
86,40 95,7L
74,27 13,23
ni
Ti
S?
O que plode ser concluído com base na tabela?
22. (ÍJse o computador) o custo mensal de manutenção de determinado tipo de
automóvel (excluindo-se combustível e trocas de óleo) está sendo analisado em
ionçao da idade do veículo. Nove automóveis fabricados em diferentes elnos
tiveram o custo averiguado' Os dados obtidos foram:
Idade do veículo (anos)
L2
Custo mensal (reais) 8 13
34567
18 20 24 26 29
89
32 37
a. Faça um gráfico de dispersão e calcule o coeficiente de correlação' comente
o resultado.
b.Ajustearetaderegressãopelométododemínimosquadrados.Comovocê
interPretaria o coeficiente B?
23.VerifiqueSeérazoâve|considerarummodeloderegressãolinear
relacionando u, noà, de Inglês (Y) e Português (X)' segundo os dados
apresentados na tabela a seguii. Suaconclusão deve ser baseada no coeficiente
dè correlação e no ajuste da reta de regressão'
lnas
s,s s,r 7,0 2,5 6,0 4,05,0 5,5
5,0
6,57,,0 4,5 8,5 3,5
24.(Useocomputador)Umaindústriasubmeteseusnovosoperáriosaumtestc
de aptidão (;ç; e;á; meses depois mede a produtividade destes operários (Y)'
Os rãsultados estão na tabela a seguir
Notas
Inglês
Português
9,5 6,5
9,0 4,5
t10
Operário A C
Aptidão (X)
Produtividade (I')
22
45
15
25
25
.7 I
a. Faça o gráfico de dispersão e calcule o coeficiente de correlação. Comente o
resultado.
b. Ajuste a reta de regressão e trace-a no gráfico de dispersão. eual a
interpretação para os coeficientes a e B?
c. Verifique estatisticamente se a produtividade é influenciada pela aptidão.
Use a : 0,05.
d. Para um indivíduo com aptidão igual a 20, qual seria a produtividade
esperada?
25. Um estudo pretende avaliar o efeito da obesidade na pressão sangüínea. Para
tanto, foram avaliados os pesos para 6 indivíduos e construída a variâvel X
representando a razão entre os pesos real e ideal. Estudos indicam que um
modelo de regressão linear simples é adequado para essa situação. os dados
obtidos foram:
Indivíduo
Razão (X )
Pressão sistólica (Y)
L,23
L29
I,42
130
1,35
133
a. Construa a variável auxiliar d, : r 
- 
r.
b.Ajuste aretay: al0d.
c. Qual a interpretação para o na reta obtida em (b)?
d. Qual a pressão sistólica esperada para indivíduos com razão peso real/peso
ideal igual a I,25?
26. Estuda-se a relação linear entre duas variáveis x e Y. uma amostra de 20
pares dessas variáveis forneceu os seguintes valores:
20 20 20 20 20
Dq :600, f sl : 2.150, D*? : 18.662, Dy? : 235.270, D*oyo : 65.92t .i:L i=t i-_7 i:t i:7
Determine a correlação e ajuste uma reta aos dados.
27. um estudo foi conduzido para verificar se as pessoas estimam os próprios
pesos corretamente. No experimento realizado, 15 pessoas foram selecionadas
19
40
18
30
22
tt
.) L)
9.(t litten:ícitts
''--t#- -:
.ï.í /
ao acaso e a cada uma delas perguntou-se os pesos' que depois foram aferidos
em balanças devidamente calibradas' Os resultados são apresentados a seguir'
O que pode ser concluído a partir dos dados?
2g. A quantidade de chuva é um fator importante na produtividade agrícola' Para
medir esse efeito, foram anotadas, para 8 regiões diferentes produtoras de soja,
o índice pluviométrico e a produção do último ano'
Chuva (mm) 120 140 r22 150 115 190 130 118
Produção (ton) 40 46 45 tF7tJl 25 54 ttJt-, 30
5557
1,67
139
1,65 1,56
136 L34
a. Faça um gráfico de dispersão e calcule o coeficiente de correlação. Comente
o resultado.
b. Ajuste a reta de regressão. Como você interpretaria o coeficiente B?
c. utilizando a reta ajustada no item (c), encontre a produção esperada parit
uma região com índice pluviométrico igual a l-60 mm'
d. É adequado utilizar o modelo ajustado para calcular a produção em um0
região cujo índice pluviométrico é igual a 30 mm? Comente'
,29. (Use o computador) Para os dados do arquivo areas.txt (vejaExercício 25 do
Capítulo 1), suponha que os apartamentos são classificados
como de andar
baúo, para a unidadã situada entre os 1s ao 6q andares (inclusive);
intermediário, se o apartamento se encontra do 7q ao 72e andar e de andar alto,
se estiver situado acima do l2e andar. Suspeita-se que apartamentos de andares
mais baixos podem não ter o tamanho especificado no memorial descritivo'
a. Construa histogramas para as medidas de área da sala para cada um dos
grupos formadãs (andar baixo, intermediário e alto). Discuta se o modelo
Normal é adequado para essa situação
b. Dependendo de cada uma das três categorias de andar criadas, construa unl
grá^fico box-plot para as áreas da sala e discuta se a localização interl'ere
com o tamanho da sala'
c. Usando um modelo de análise de variância, verifique se existem evidências
estatísticas que dêem suporte à conclusão apresentada no item (b)' Utilize
um nível de significância a : 0,01-
D
Indivíduo
6 789 13 t4
92 75 45 63
98 74 44
Peso 1 4
70
/c)
10 t2
Estimado
ts2 (' t t 
1 
t í t r r I r t () :' I I i I t i t' r t,y I i,t' 1 t r c i u i,t
d. Repita os itens anteriores para a ârea total do apartamento, definida conìo n
soma das áreas da sala, cozinha, banheiro e dormitório.
30. (Use o computador) Para este exercício será necessário utilizar o arquivo
cancer.rxt, cuja descrição é dada no Exercício 24 do capítulo 1. Deseja-se
verificar se conforme aumenta a idade, muda a concentração de nitrogênio nn
uréia.
a. suponha que selecionamos apenas os pacientes que têm a doença (isto é,
consideramos o grupo formado por pacientes cujo diagnóstico é falso-
negativo ou positivo). construa um gráfico de dispersão para idade e
concentração de nitrogênio. O que pode ser dito?
b. Supondo que a variável dependente é a concentração de nitrogênio e que a
covariável é a idade do paciente, calcule estimativas para a e p, em um
modelo de regressão linear. Qual é a interpretação de B nesse caso?
c. construa uma tabela ANovA para verificar, ao nível de 5vo, se existe
evidência estatística de que a idade influencia na concentração de
nitrogênio.
d. considere, agora, os pacientes que não têm a doença (diagnóstico negativo
ou falso-positivo). construa um gráfico de dispersão para idade e
concentração de nitrogênio. compare com o gráfico obtido no item (a).
e. calcule as estimativas para a e B nesse caso e interprete B. o que pode ser
dito ao se comparar com os resultados do item (b)?
f. verifique se a idade influencia a concentração de nitrogênio para os
pacientes sem a doença. Considere a : 5Va.
g. Com base nos itens anteriores, compare visualmente as retas ajustadas e as
estimativas obtidas. você diria que o efeito da idade, na concentração de
nitrogênio, é um dado importante para discriminar entre pacientes com e
sem a doença?
31. (Use o computador) Para este exercício será necessário utilizar o arquivo
aeusp.txt, cuja descrição é dada no Exercício 26 do Capítulo 1.
a. Teste se a média da variável Itrab é a mesma nas sub-populações definidas
pelo estado civil dos residentes.
b. Repita o item (a) com as'sub-populações definidas pelo local de moradia.
Apêndice A
I
I,
Distribuição t - Student
Distribuição Qui-Quadrado
Distribuição Fisher-Snedecor ( 0,05 )
Distribuição Fisher-Snedecor ( 0,95 )
353
.F?-!F.'
.7.í5
I ) i s t t'ilt t ti t;litt N t tt' t nt I
e P(0 < Z< zc) -p
o,2 o,o7g3 o,og32 o,o87l ô,osr; o,o9as o'og87 0'1026 0'10ó4 o'1103 0'1141 o'2
o,40,15540,tsçto,tozeo,1664o,170oo'ì73óO',17720'18080'18440'ì8790'4
0,6 0,2257 o,zZil o,)'.3'24 0,2357 O,23gg...9,2a22 0'2454 0'2486 0'2517 0'2549 0'ó
o,g 0,2BBt o,zcto o,'zísc 0,2967 o,29g5 0,3023 0'3051 0'3078 o'3loó 0'3t33 0'8
;;';Ëil; ãi,ïií ,í|irjl.tiïirï,:ïiAï+ì;ãisç':'or=rr3Lt=o;ssao: 'óill0icaail 0'e-
I,o 0,34t3 O,glsa o,sair ô,sags o,gsoe oJ53l 0,3s54 0'9577 o:3s99 0,3621 1,0
a 1,2 o,3g49 o,gaaç o,gôea o,sso7 o,392s 0,394'4 0'3962 0j399-0. iopïCz-r o'lots 1'2
! t,+ o,uez o,tzot o,.iazz o,ìztd o,+zst 0'4265 0'4279 0'4292 0'4306 0'43t9 1'4
8 ;; ói,ì^J ói,^iu, o,ttìt o,tteÁ o/44ss o'4so5 o'45r5 o'4s25 0'4535 o'454s t'6
.q ;:; ;:,;;;; ;1,;;;, ái,ooru o,,otoo 
''/u" óAoft 0'4686 
o'46e3 o'46ee 0'4706 r'8
' 
;:,;;,;;;, à,,osto o',tao'l o',tet' o'487s 0'4878 0'4881 o-t!P!4-:A.!87 0'48e0 2'2
P z,c o,ava o,492o ot,4922 0,4925 0,49'27 0'4929 0'4931 0'4932 0'4934 0'4936 2'4
9, z,o o,tgss o,tgss oì,tgsa o,49s7 0,4959 0'4960 0'4961 0'4962 0'4963 0'4964 2'6
Ë ;:.;;:,;;;; ;:,^;;t o,4e76 0,4s77 o,4e77 o'4e7e ot4e7e. o:4e-7e o'4e8o o'4e8r 2'8
2'9 :0'4981"':'0'4982 a 
49gg o,49*g o'498g o'499o o'49go 3'o3,O O,4g87 0,4987 0,4987 0,4988 0,4988 0,,
s,2 o,4993 o,tcss o,aòct o,49g4 o,4994 o,4gg4 o'4994.. o:4995....,o.i!99s o'4995 3'2
3,4 0,4997 0,4997 Ot,4997 O,4g97 0,4997 O'4g97 O'4g97 A'4997 0'4997 0'4998 3'4
3,6 0,4998 0,4998 0,4999 0,4gg9 0,4999 0,4999 o',4999 0',4999 o',4999 0'4999 3',ó
Segundo decimol de z.
op ô,'-oio o,oóoo'ò,ooto o,o'ro o.otóo o:olee o'o2se o'o27e o'o31e 0'0359 o'0
o,r o,oge''r,o,oïsa o,olzã.-,-o;o.ri.'ãióisit.o.;osçe - o,oose , .o,067s 6,e71a'f;,o,.ozs3 ,i'"0,1
c,i..o,sooo ô,sooo o,sooo o,sooo o;sooo'' o,5ooô o,Sboo o;sooo=ô,sôoõ o;soôo 3,9
I ì t tl t tl ttt tr.., t, t (.)t t t (. )t t, tt I r, t, l,'
a.
il
U
Fdo{hots@ooÉN
3NOOS
6FNoG
.j cì oi rt at
ll',,,,1,,, .I lìtlt, l,tt
6OÉdO$n€
Fddd(ddN
N-oFod({r.ìómddN.-.Or-,
"i ri 6 oo- oì ...: ÕÌ _i<$$<96(ìrí)
p I R R e g 3 È g 3 I I g P g : G È- Ë-t g-ã. Ë -9. ã :'Ê á ;' .; Ã- 
-' õ È *' d cì + ri Fi di o -. .? s o N @ o - c)'r+ ; 
= 
Ã' à.i o o c c rí iì ò õ i-' ó < t s t q s t n n LÕ ur
É r € F o o 6 N N ó 3 3 R 3 ã 3 3 q + x-3-8-€- ì. R- :-;
-ôó9N@s-cQ!F- q :' :' ì' .' 
"ì' + + ;- -' *' rr ao- o: 9 I i l : i : : : > = IôÔ
É 6ó O { 6@ O 6 d o F o € - €o : sl' óÓ 6 O N s N'6 É $ @ N € 
- ^ - 
d- ï- ô-'ó- { t- --'i. q'1 a a'- -1 l-- :' 3 ::õ- *- è' ã- ; 
-' cì.ì íi ct + d d d € N o @ 6 9 I 
= 
: : : : :'Ìoo
€dNÓ6€aONOn6-
õ ç n ì ò; ó qì N-ô-o-'1 \r't \o-
c\didcì{€N6-NtgN6oN
d:FììcìNiroooooootÌ
6N
60
o
sl
o
so
s
c{
s6
N
s Ë E N: g ff 3 Ç ãÈìï I Cf i sNB B eâg qR à s x s * - - € o o -q o o s @ 6 s o N 6 ï ó ;i : ij iì X X X ;] : S y J Sr 9 o9 \ € s 6 o 6 õ N 6ã g ã' s ;' ï' â ;- ;' ì i l- ï- i ;-.'- -'- 3 3 3- 3- 3- ì 5 S 5 5 ;. : : È. : 5 ;. J Ì $
€
\o 6@toÌ@h-NïQONNOg€O6.È R $ r 5 * Ê È e R id.{q R R ã t; Ë H ì.H.qì.€.$ i ë Ë g 3 à x ì 3 5d I Ë p * d ri ti Ç ì ì -i o' ;' ; ã ;' ;' ;' ;- ;- rt ct ci dì ci c,. F" c, o. o. rj ri ci c,. c,. e,.
^ 
pnFÍNN66O696NNN_óóFú{ s.s.;.È.Ìj R $ s n o o.; i\ = i\ õ Ê b +, F.g-ã È R R S p Ë F N È Ë g ã *; ;; ;'+ ï- ì;-;- S;;- 3-.'- S S S :-:.:. 1-N-.ì ôÌ cì.ì cì cì cì õì cì cì cì ôi ôi.ì 
^ì
-h-NOO@g-s6FN ú { ï{j Ìi õ õ q ô I ã 3 X 835 S SR PP Rll]9 Ír}q !eq!'q' o @ N@6ONO-6@diÉN
.-- d + c, d 
"ì N. N. ã "ì ", -s. 
j. i 
"8. 
i. n 5 i. Ì. s i 3 3 3 i. s. : :. s 3 s 3 F. $. Ï.
YôN6NNN6Óôó6r@6o;;+õóÃ3H$3fl NìHìËËiËìqËõ3ìsR33R;Ë ï'i S ì:'l- I-l- X-i-s cì.ì cì.ì 
"ì.ì N- ".- ";.;;: I.I ï.I.ï i: ì.I:.:.:.
Ës:tì[**.3*s3ì:.: 3ïs3:33ÈiÈ3s$È**3ãs:.Ii
Í9PN6OOOoN9N--O9Oïô6-tsã s s : õ ; s È B à È R \ I i i : È. { q s. ì i i R Ë. fl p. â. à. g. ë. * S Ë Sd ôì cì ôì ôr'-j 
-j 
-'
Ë Ê s. F Ë * 3- i- i- ï- i F Ë Ë :- Ë È- Ì r F ;. Ë ; F ; 3 Ë È ;:,,:,;
- 
dre 
- -::-:==ciroeèiirNÁõóoooí)'''r'r 
1
€ 3 s s 5 s s g P s ã 3 ì õ I 8-3.S-3 * ã E Ë d $-R-S 
"?':ìì. õ- :'li- ;' ;'+ ;'d G :' ;' ;'Ë' : É É g i ! : > e 3 I R I ::l llOF
s 3 3 € 3 g s s ã;; ã õ ü ã-;-J-;; ã õ ü;- ã-;-J-J- J;i
o 3-o-o-ai {- 
-,1';';';'i';';';-9- IFJdioìct'icìcìì-ì <i t6o-N'---;
'Ì
o-
NO
o- c1
o
sn
n-NÍ-O66
..1 ô- vl c.L o: €. Õi o:NN@669==
--o€o{o€Í- o- €- c.r 6: o- a\ @-
oNr@@6OO
Èó6OFdoq
;ÉFRdNNNprfì
Nx
\
0)fu
.2
o
oE
U'
c)t-
o
o
õE
o
'ìJ
(J
fu
I
'5
o
C)
-o
oÌO
.!If
-o
L
.9
o
ã33[ii3ì3]iIIÈiÌ33Ì]ÌiI3Ë! rï; ; Ë Ë R{RR
6\
c{
ô\\t
ô\
to
ô\o
ô\oN
@ÓNÈ
o- o..o- o-
90ôóNNN€
dddd
6666
ooôõ
oôóN
6- O- 6- !'ì
oooo
ddctd
o66@
ddo-d
ô@óó
NNNN
dddd
FNO<t
oppp.
f !?9egorooooê. 39R9:::993
* 9=@-o€o6oGH ì3.ì{iA$.3Aàs 
--oooooddd
\o QSu?-N@È€oQB 3õRXSf,FRRR
rô .jddddddddd
s \N!66O6€oNË tG3833;;;;\o dddddddddó
:e oors@ïN6@NÁ 
=ïN-OOO6G6:í vlÌÍÌtï!oooh dddddddddo'
:P o!ì.N-N6oNFoa^ !!@NN€999€9(!' o-c!a!NNNNNNN
€o ddddddddcio'
;9 @NNsN-oo66ô()ÌooooooNN
= 
--F-ï dddddddddd
lL Fflórta€h@6O
a_
I
-
lt
U
*-
È
U*
I
\
()
fF
.2
o
U+
q
C)
L
o
õ
ì
c
C)
(J
f+
tJl{
o
ìO
. !1"
l
-o
'Ë
.2
o
olo-6o
\o€
Oo
Oì .ô-
ï-ôNS!oFô^ó@N€6ONONOF9
à ã. 3. 3. 3. 3. 3- 3. 3. 3. E g. 3- 3. g 3 3 5 S ë 3 s
€OONFO6óóNú
Ë Ë,Ë Ë g. BB gsss g.B3ssgBx.g. g.*.
333333s333È33333333.ii3
€6!ïóoNN^--ï-ooo66@N€Y
oooooooóó.ió6q6, vì !ì o o ri iri õ õ ii 3-3-fi 3 3 ü il Ë il fi üo d d d d d d d d d d o' á ã à ã ã ã- ã l>l :,r à-
i. $. Ë. s. ã. s. s. g. 8. g. B. g. s â g B Ë Ë Ë È Ë Hd d d d d d d d o a o' ó o' ã' ã. ;. ;- ;- ;. ;- ;- o-
ft fr bìììì3sssËüË33333;;ffËiiiisiisiiSSSSSS5SSSi
@@óNNNNN \\NNN€9€€9N N N N N N N N r o ir r e o i.r & iì Ã Ã À (ì èrd d o'o- o'b'o- ã ;' ;-ã ;- ;- ;. ;- ;-ã ã ;. ã ;. ;.
n9N@6OFfloç6
- ( d.ì ii n ci RÈ R & g 3 3 B B RS
ôo
€F@NN@o-€-.1\o-o:
oo<to6
€6NF9ó
6OO-€N
oìF at+ìd
ôFdOqO
ô6óeó€oo
+6rN-oOa
o- 
-- 
ô' ci .j .j cì cì
o,.o
F:s.s.à.{s.3.u---oooF_d
oo
doçoots@6
g
6ô$:(ì :iËôo
*óRo;-
ê\9oì:?ô"-
OS6€X@OOÈNo
- - 
; n r ci ii R R F R R R g g e B g R S
ddddrl op snorc
.1.ía
\
,'lpítrtlit t, ,'l: 'lìtlrlrtt I )istt ilnrir;tttt Ii
::3eRãËRfiRRRRRtt!sI
; g ;. ã-.s. $. t. q. Ë fi. t $. F F,-a e e- ; .8- s- ì- 3- 3- ü' g' Ë' s' *' q :' I : i : I
Ë []i t i t- 
-:. 
s. t a'fl s.'H. n's. t Ê- qrË ã i €- 8- È- s- q : ï. : I : : : : I
r n;gË s.* ì.\ e ã.;n fi.flS-F-h-Ë-È Ë Èã H'H'Ë'H'e'e'ë'â-Ë'qR'I
s s, H s Ë â.ï i. 5. Q. s. ç ç €. 5 e à s a- ã- ã- F- il- ã :. u' ï Ì : : i : : : I
R Ë *. ã. s. Ë. ë- Ë- S. €. Ì. q. ì. g. {. $- €- Q- 5- q- ë- 
-s' ã' ã' H' A :* ;' =" i i i : I I
- â Ë s'i aeã.q.ï*.s.$.i.i.È.€-Eç-s-ì-s-*-ç-€-Ë ë €'F'e'e';'ãr I
= 
n *.8.3- 3. s. s. ë. ï. $. ì. i. s.3. s- E q- e- 
=- 
*- E s- q ï::::::::1 I
= I A Ë.3. s- Ë- Ë. ã- ì 'p= r. ì. ì- ì- =- i- 3- 5' E- e' 
q' E' q::::::::: i I
: Ê S 3 ã Ë s g ã-ç-e-+-8.i.ï S-ì-3-3 3 3-5-q'E'ì'q-g s'S'E3'{'ã':" I
: F. F, e. s. --. t Ë. Ë. ã. ã- è. i. ì. F- q i ï : t e- s i' : : : : : : : : : : : I
= 
s. s ã. à. s. Ë- s- s. Ë- ã- e e. s. *. ;. *. ç. *. ì. e- ì. ë. E ì- s- 3- : ï l- l 1 : : I
= 
;; * i s n s s Ë ã.ã Ë â.€ ë. ë.ì.ì-ì-ï-r-q{-*-ì-$-?'ç's'i' q'$'$' I
= 
ji*:',is r.s s s s.ã.ã.ã.s.e.Ç.ç.€.ã s ?-;-?ï-*-ì-i-i-E e'ï'q' I
= , n R à il. S. s. 5. Ë. Ë. 
g. Ë. Ë. $. Ë- H- È- s- ã- ã' H' Ë' ã' Ê' €' ë- * * : : : : : I
E a*tf'ek ei.ai.i+if : :'.'. :Ì:$i.3:ã: ï : : : : : Ip, i;í RrR ã. ã ã. *. a*. a*- 45. a=*. Ë-.!- n-€, g.$ È' g- :*t :,ï : i I I :
- Ë. fi. n s. n t ã- 3. :. ã. il. $. B. a Ë. s- Ë- ã- $- s- 3- 3 3- 5- S- Ë' ì' 3' 3' i A { n
' Ë. { : s t Ê Ë F { Ê ã H- H- â- 
=- 
ã' ã' â' i Ì * : : : Ì f : : : : : ï I
^ Ê. =., R i R R { R Ë. Ë R R Ë Ë- R â R R- R Ê { Ë' Ë R Ë' Ê â { Ë i 3 1 :
- 
p i R -Ë.. F, R F. I i i R R R a È, a n R R R R- R R R i I i 3' i i F' R Ë
- ; u * u u aH.R,*aËã.Ë.Ë.È.ì.RP*i.iRR{-s,{-{Ë-[{R-{RR
- E l. Ë. È. e. E Ë. Ë. ì E 3. 3- E Ê. E E E- Ë Ë Ë E Ë i ! r' x i ì Ì Ì : : :
. t69::::::::::>ÈÈÉ' a!. p.!- 
=.É. iËr = :. :,É : Ë^ iË. iËn ii_ =.,. 
-,1. 
l,,,ut f i f f I : :ï s.-du.'üË'âË Ë.Ë- iï :i:B:f 1; . t t :,:'ï':,,ï a 3 : : Ir ã:g *. i aé. aia u. s aè. a=à Ë. â à : i :. È : : Ê ã .ã- ë. Ë- È- â d-
-'rl 
- 
! 
--i o o x'o - P =l'l gii'p:':': : 54 s p'x 
p'x l'* I g g B e
o
il
.lJ
5\
ofu
.eb
ctEl+o
lç" b
lor Elzllri
lo*lO ol>Plr O)lrrI L'-lg;loTtIE,
IP Ë
l?"loll-c
l.e
ll!l6)Ir
lolrõl(,t:l-o
ll-l+lú!
lo
ropDurruoueP oP ePDPreqll ap snotc
I
B
ò(
:
5
s
:
s
fì
:I
9.
;:
:.
a
:-
:
;lÈ-l
=l
;l
;l
;l
:l
-81
:l
:l
:lclJI
*l
:l;l
-'l
'l
8
L'OoE-
P(l)oE'P;
oE:
c)!ogT::L ::=o;
o3E
..:::::
ut, 
=lô
oL() ,-.
\
\
()f
C'
.9
o
\U
q)
E
tn()
l-
o
o
I
o
L,,
oT
0)
c
v,
Il-q)c
.2
u-
o
-o
o
ro
. !1"f
-o
'tr
,2
o
t
,il
il
F
iï
I
roPoultuouap op apopJaqtl ap snDrc
Apêndice B
Respostas dos Exercícios
Observações:
1. Nos exercícios de seção a resposta será, na maioria das vezes, acompanhadA de
indicações da resolução.
2. Paru os exercícios de fim de capítulo
exercícios ímpares.
3. Os exercícios de computação e de
apresentadas.
4. Pequenas diferenças em algumas
aproximações e casas decimais utilizadas.
5. Para não tornar muito extenso esse
omitidos na apresentação das respostas.
serão apresentadas as respostas para os
demonstração não terão suas respostas
respostas poderão refletir diferentes
apêndice, os gráficos solicitados foram
361

Teste o Premium para desbloquear

Aproveite todos os benefícios por 3 dias sem pagar! 😉
Já tem cadastro?