Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
t68 Capítulo 6: Variáveis Aleatórías Contínuas ruxilia na atribuição de probabilidades. Assim, paÍa a variável aleatória contínua X representando a profundidade do lençol de água, a função densidade f é dada)0r r(,) : { tt:', para2}<r<100; pafar ( 20 our > 100. Tendo em vista que, nesse exemplo, a função densidade é bastante ;imples, a probabilidade de que a profundidade do lençol esteja em qm dado rrtcrvalo pode ser calculada com o uso de áreas de figuras planas. Assi\r, para rbter a probabilidade de uma profundidade pelo menos igual a 25, mas injerior a ,, portanto, P(25 < X < 29) : 4180. Considerando o caso geral, vamos nos ocupar agora em formalizaÍ as déias discutidas anteriormente. Faremos isso através da definição apresentada a eguir. )efinição 6.1: Função densidade de probabilidade Dizemos que /(r) é uma função contínua de probabilidade ou função ensidade de probabilidade para uma variável aleatória contínua X, se satisfaz tuas condições: i) Í(r) ) 0, para todo r e ( - oo, oo); ii) A área definida por f (r) é igual a 1. (t. I Introdução Com o auxílio do cálculo diferencial e integral, podemos caracterizar a condição ii) através de r6I f@)dr:1.J-- Da mesma forma, para calcular probabilidades, temos que para a 1 b, f(r) dr ; a integral, acima, indica a írea sob a função / definida pelo intervalo [4, b]. Note que, pela forma como atribuímos as probabilidades no caso contínuo, teremos áreazero sob qualquer valor individual, isto é, P(X: k): O para qualquer k. Portanto, em se tratando de variáveis aleatórias contínuas, a probabilidade de ocorrência de um valor isolado é sempre zero e, consequentemente, as probabilidades calculadas sobre os intervalos lu,,bl,la,b), (o,b) e (a, b) são as mesmas, para qudisquer valores de a e b. Exemplo 6.2: Arqueólogos estudaram uma certa região e estabeleceram um rnodelo teórico para a variável C, comprimento de fósseis da região (em cm). Suponha que C é uma variável aleatória contínua com a seguinte função densidade de probabilidade: tG): se0(c120; caso contrário. É imediato observar que /(c) é positiva. Através do gráfico da função, apresentado a seguir, podemos verificar com auxílio da fórmula da área de trapézio que 1r3 área sob lk): ao : an x 2o : 1.2 Concluímos que /(c) é efetivamente uma densidade. Tendo em vista a forma simples de /(c), o cálculo de probabilidades de interesse para esse exemplo poderá ser feito sem dificuldades através de áreas' 169 P(o<x<b): I-:: {y'*""D 170 Capítulo 6: Variáveis Aleatóriqs &t Introduçao ë, rssim, temos que P(C < B) : 7lZS. tr Exemplo 6.3; Num teste educacional com crianças, o tempo para arealização de Umit bateria de questões de raciocínio verbal e lógico é medido e anotado para ser €ttttlparado com um modelo teórico. Este teste é utilizado para identificar o descnvolvimento das crianças e auxiliar a aplicação de medidas corretivas. o ütodelo teórico considera T, tempo de teste rem minuto,s, como uma variável alcatória contínua com função densidade de probabilidade dada por: h(t-+), se8(ú<L0; h, se10(t<15; 0, caso contrário. o gráfico da função densidade é apresentado a seguir. Deve ser notado que, pela tlcrÍ'inição de /(ú), ela se anula parat ( 8 ou ú > 15. 171 [] 1140 A probabilidade de um fóssil, escorhido ao acaso nessa região, ap.comprimento inferior a. s-"- poa" ,", ã"rc"r"a" diretamenteìo granco oadensidade de probabitiauo",.ãrï;;ï figura a seguir: Í(t): J (t) O cálculo da probabilidade envoÌve a soma de duas áreas: 172 Capítulo 6: Variáveis Aleatórias Contínuas solicitamos ao leitor que verifique que a função /(ú") satisfaz a definiçáo de densidade. Para calcular P(9 < T < 72), vamos obter a área sob /(Í) no intervalo (9, 12]: Segue, sem maiores dificuldades, que P(9 < f < L2): 7116, valor esse obtido pela soma do trapézio definido no intervalo (9, 10) com o retângulo determinado pelo intervalo [10, 12] (veja a figura). Através do uso de integral, essa mesma probabilidade seria calculada da seguinte forma: P(e< T<12): ["yçr10, Jg : /n" : In" r12 l(t)dt+ | r(òdt Jto t r72q ^rt - 4) dt + J,, *ot : !(t- 4úì I'o * 1,1"40\2 -")ln'20"1,0 11 6 -_r_B0'20 ,7 l 16 (t.l Introdução 173 A aplicação da integral foi dividida em duas partes, pois a função f(t) é diferente nos intervalos (9,10) e [10,12]. tr Vamos, agora, apresentar as expressões para valor esperado, mediana, rnoda e variância no caso contínuo. A interpretação de cada uma dessas grandezas ó semelhante àquela discutida no caso discreto. Algumas das expressões são irlteradas devido à nova forma de atribuição de probabilidades. Definição 6.2: Medidas de posição para varídveis aleatórias contínaas O valor esperado ou média da variável aleat1tia contínua X, com função tlensidade dada por Í("),ê' dada pela expressão: B(x) : ,: I:" f @) d,r. A mediana é o valor Md qte tem a propriedade de: P(X > Md) > 0,5 e P(X,( Md) > 0,5' A moda é o valor Mo tal qu'e, l@o):maxf(r)' tr Observe que a definição de mediana é idêntica ao caso discreto. A média tcve su4 expressão alterada com a substituição da somatória pela integral e de pi ltor f (r)d,r.Para a moda, precisamos tomar o máximo da função densidade e, como antes, ela não é necessariamente única. A notação para o caso contínuo será iì mesma utilizada para as variáveis aleatórias discretas. Definição 6.3: Variância para variáveis aleaÍórias contínuas Para uma variável aleatória x com densidade r @), a variância é dada por o, : f* {* - 1t)z f (r)dr. tr Como no caso discreto, a variância é a medida de dispersão mais utilizada na prática. Aqui podemos, também, utilizar a expressão alternativa o2 : E(x2) - F2 , t74 com E(X 2) sendo calculado como: Capítulo 6: Variáveis Aleatórias 6,1 Introdução E(x') : /_i* r@) d,r l::hrá* r)dc: Itcsultando na equação do 2o. grau: L c2 l2o __t +oo z l*u , r@): {ÍT!:l/f;, :: ;,=1";l r l2o * ^'l*u: o'5' Vamos determinar a média e a variância de C. Temos, "2o 7 c t -sPo t ct2or: l-"+(7+r\rtr-- 7 "tlto , L "'fro " n( 10 + 1) dc - _!_i_l n *ïl :20 - 35 aoo : lo - nTIo:To":T' Para a variância, calculamos primeiro E(C2): ,t,: ! tl'o * 7 "tl'o -4oo4lo ,aoslo : ,, , fttt i,no ob: E(C'\ ' 500 235\2 275' ) - t-t- : ì-- ( r,) : ï :30,56cm2. Logo, o desvio padrão é oc _ /fifi: b,5J cm.A moda segue diretamente do gráfico da futer a mediana nôrqmnc ;-:^:^r---,-. tnção-densidade e é igual a 20,iilffi ïï,ïïltlïï":*l:::J::':iiïïi";irï'ïffi l'ilã:","ilïïi,io',ï;lJli:ï ï ï,ï, iï :ï.:ï,ïl:',':: -": ;;*;; ;ï; ï Ïï :ffi ; ïiil" ï:ïltu I c r r ct e r a c o rr d i ç ã o d a d e ri n i ç ao o " Á"àì.ï ", uï r;;:", J":, ;ïn"** :, Md2+2oMd-4oo:0, ctr.ia solução é Md : 12,36 (o outro valor é abandonado por ser negativo). tr As propriedades do valor esperado e da variância apresentadas para vtrriáveis aleatórias discretas permanecem válidas e a verificação pode ser feita alravés das propriedades da integral. A distribuição conjunta de duas ou mais vuriáveis aleatórias contínuâs é definida através da função densidade conjunta de prubabilidade. As idéias básicas são as mesmas do caso discreto, porém requerem ttttt melhor conhecimento de cálculo diferencial e integral, envolvendo integrais dtrplas. Não desenvolveremos esse tópico e recòmendamos ao leitor interessado a eonsulta às referências. l,lxcrcícios da Seção 6.1: l. Verifique se as expressões a seguir são funções densidade de probabilidade (assuma que elas se anulam fora dos intervalos especificados). *f(r)-3r, se 0( r1L.t--''' lr. /(r) : r2/2, r ) 0. ,. ' c. Í(r) : (r - 3)12, 3 S r S {-/?/ d. f (r) :2,0 I r z-2. l-/ Lf@)- -rj se-7r<z<0. 2. o tempo, em minutos, de digitação de um texto por secretárias experientes é rurna variável aleatória contínua X. Sua densidade é apresentada a seguir. se0 ( r 12; se2(r<6: caso contrário. E(c'): f'0",frf fi*r1 :1oo* T:T ErrlÍio, {!t o desvio padrão é' a raiz quadrada..da variância e, como já menci lÏ1,ïiiï1ïã1'J;:"#3#'#ì:uniaaaËJ".n"aioud";;;l;;"i'oiiËnu,,{u"n Exemplo 6'4: A variâver c apresentada no Exemp ro 6.2tinha a ..gui7ì" rdensidade: r,v L^vrilpru t).2 Unna , ,( t." t("): { tf, +r1, se o( c12o;I O, câso contrário. P(C>Md):s,5. ï(r): '.qlll!.F 176 Determine: (ltpltttlo ô: VuricÍveis Alecttórius CctntínuaE e{auaupoì: I a. P(X > J).{,,.. . t b. p(l. ;ç < 4).' c.P(X <BlX>r)., - d. Um número b tal que,F(y s b): 0,6!_e. o vator esperado, à variância " árn"a;d" X. L \3' A quantia gasra anuarmenre, em mirhões g" r.1i:, na manurençao oo ugr)tro.rnuma cidade do inrerior e r"pr"r"ntJãi""tu uuriau"r I, com densidad/ar.r, ,.^", ffu):{i,-t, se 0,5{yq2.( U, caso contrário. Obtenha: a. P(y < 0,8). b. P(Y > 1,51I'> 1). c. O valor esperado e a variância de )..d. A medianadey. 4' o grrifico abaixo representa a densidade de uma variáver areatória x. a. Obtenha o valor a" ol " ,/. ..,..,.Ir.I)ctcr.min? p(X > 0l-r. s).' tr. C"'irlcute A4d(X), E(X) e Vor(X) ã.2 Príncipais Modelos Contínuos 5. Numa certa região, fósseis de pequenos animais são freqüentemente encontrados e um arqueólogo estabeleceu o seguinte modelo de probabilidade para o comprimento, em centímetros, desses fósseis. 41 r 18: 8(z(10; 10(r(11; ( h", Í(*):J i" * *' [ il,' a. Faça um gráfico da função densidadé; ''- b. Para um fóssil encontrado nessa região, determine a probabilidade do comprimento ser inferior a 6 centímetros? E de ser superioi a 5 mas inferigr a 10,5 cm? ( c. Encontre o valor esperado para o comprirnento dos fósseis da região. 6.2 Principais Modelos Contínuos Apresentamos, nesta seção, os principais modelos teóricos para variáveis ttlcatórias contínuas. Vimos que, para caracterizar completamente uma variável ttlcatória contínua, precisamos fornecer sua função denìidade de probabilidade 11rrc, segundo sua definição, é uma função positiva e com integral iguãt a t. DcfiniçQo 6.4: Modelo Uniforme Contínuo uma variável aleatória x tem distribuição (Iniforme contínua no irrtcrvalo fa,bl, a < b, se sua função densidade de próbabilioáoe o dada por: caso contrário. a1r1 caso contrário. f (") :{ b-a' 0, Usaremos a notação X - [J[a,b] para t lrriforme Contínuo no intervalo considerado. queXsegueomodelo Note que não há restrição de valores paÍa cL e b, exceto o fato de a < b. A f rigura 6.I mostra a densidade do modelo U[a,b], para a)b > 0. tr t78 Capítulo 6: Variáveis Aleatórias Figura 6.7: Densidade Ilnifurme Contínua. o modelo uniforme pressupõe que os valores possíveis para a variál aleatória têm todos a mesma probabilidade de ocorrência. seu válor esperado sua variância são obtidos através do cálculo de integrais, de tal forma que: f---_. b2+ab+a2 -t e} logo, b2+ab+a2 o2 : E(xz) - p, : -(+)' Exemplo ó.5.' com o objetivo de verificar a resistência à pressão de água, oi técnicos de qualidade de uma empresa inspecionam os tubos ãe pvc produzidos os tubos inspecionados têm 6 metros de comprimento e são submetidos a pressões até, o aparecimento do primeiro vazamento, cuja distância a uma dag extremidades (fixada à priori) é anotada para fins de análise posterior. Escolhe-se um tubo ao acaso para ser inspecionado. Queremos calcular a probabilidade de que o vazamento esteja, no máximo, a I metro das extremidades. vamos denotar por x a variável areatória que indica a distâncie correspondente ao vazamento. Admitindo igual probabilidade de ocorrência em "-! ô,2 Principais Modelos Contínuos 179 torlos os pontos, temos que X - U[0,6], com função densidade de probabilidade clncla por r@) : {',3; lï,ï=*ï,ã.1; Para calcular a probabilidade de X e {[0,1]U [5,6]], podemos obter as drças dos dois retângulos hachuriados na figura a seguir. l@) segrrc, sem maiores dificuldades, que a probabilidade desejadaê 113. Esse mesmo cálculo poderia ser feito através de integrais da seguinte P(x e {[0,1] u [5,6]]) : Note que os intervaloj [0, 1] e [5,6] são disjuntos e, portanto, a P(0<x<1)+P(5<x<6) l"'*0. * l,"uo. rrl r16 _l -L -l6lo' 6ls 1651 6-o+6-6:5' plob.rbilidade iltlcrvalo. áu ,uu uniáo é, ffsoma das piobabilidades de ocorrência de cada;[iElf\ /l tr Definição 6.5: fuIodelo Exponencial Uma variável aleatória contínua X,segue o modelo Exponencial "o_ puram.tro , 180 A densidade está X - Exp(a) para Capítulo 6: Varitiveis Alecttórias o assumindo valores não) 0 se sua densidade é) 0: negati representada graficamente na Figura 6.2 e adotaremos a notÉindicar que X tem distribuiçã" ËÇ;;;;ju, o" parâmerro c. r@): f ae-o*, rI o, ", caso contrário. Fígura 6.2 : Densídade Exponencial. Í(x) . para calcular probabilidades com aintegrll correspondente, jâ qu" não-t".1ïo. exenrplos considerados até aqui. arri., -'^' Exponencial, precisamos resolver g as figuras geométricas simples doJ Note que a inclusão acirna. Para obter a ;rnrÍos, porém, não P(n < X < b) : -[,," oe-.,:I;dr : - "-a:t:1rt : s-ítn, * "-art ou não dos extremos a e ó não altera o cálculo efetuado média e a variância, véìmos fazer esse 6,2 I'rincipais Modelos Contínuos t81 êxprcssões finais. Temos, para X - Exp(a), F:Ila e o2:I/az. Exe ntplo 6.6: IJma indústria fabrica lâmpadas especiais que ficam em operação efiptinuamente. A empresa oferece a seus clientes a garantia de reposição, caso a lâlnpada dure menos de 50 horas. A vida útil dessas lâmpadas é modelada através drr clistribuição Exponencial com parâmetro 1/8000. Determine a proporção de trucas por defeito de fabricação. ' Cada lâmpada terá seu tempo de duração definido pela particular feirlização da variável aleatória. Isto é, a vida útil da lâmpada pode ser pensada ç(JlÌìo um valor escolhido de acordo com a densidade Exponencial de parâmetro l/t1000. Representemos, pela variável aleatória T, o tempo de vida da lâmpada, e assirn 7 - Exp(I18000). A probabilidade desejada será P(T <50) : /t'#"- #'dt- 1 - s-*s : 0,006. l)ussa forma, a proporção de trocas por defeito de fabricação será de nlrloximadamente 0,67o. Esse número é relativamente pequeno, o que não ê, lfprpresa, tendo em vista que, como o parâmetro é a:1/8000, a duração média drrs lâmpadas é Lr - If a':8000 horas. tr A distribuição Exponencial tem sido amplamente utilizada nas áreas de l'Ísicn, engenharia, computação e biologia, entre outras. Variáveis como a vida útil dc equipamentos, tempos de falha, tempos de sobrevivência de espécies e irrlcrvalos entre solicitações de recursos são algumas das quantidades que têm sitlo modeladas, com bons resultados, pela Exponencial. Essa densidade tem, nincla, a vantagem de ter propriedades matemáticas interessantes, conforme ' ;:,:;;:ïïïï"ïïïÏ ;","0", em minuto s, entre emi s sões c onsecurivas de rurra fonte radioativa é uma variável aleatória com distribuição Exponencial de lrrrrâmetro a : 0,2. Vamos calcular a probabilidade de haver uma emissão em um irrtcrvalo inferior a 2 minutos. Temos, n2 P(x <D: Jno,z"-}'2:r 4*: - s-012t:13 = - "-0'a + 1 :0,33. Calculemosl ugoro, a probabilidade do intervalo ser superior ou igual a 7, sirbencJo-se que ele é superior ou igual a 5 minutos. será necessário aplicar a integração por catculo e, apenas, apresentamos os 182 P(x > Tlx > s1 : P(x 2 7, x > s) r1x 2 s) ïi0,2 "-o'2t: 4,=Êì--J;0,2s-0,2t: 4, P(x>t+slx)s): P(x>ú*s,x).çì _ __l P(X > s) L'tt1tÍtttItt ô; Vuriúveitt AIeutórias _P(x>7) --+ P(x>st - .Ïtï"q e-o''d,r -7õ-- J" ae-''"4, _ - r-"'ln._ e-a(i+") -a-ôzl& - - . - 1." e-4" :0,67 . e-1'4:- e-7por ou,.o lado' p(x > 2) pode ser carcurada pero comprementarP(x < 2)' resurtando em 0,62. N"í";r;; iguardade J"*Jü,"res, sugere quP(x > 7lx > 5): P(x >2). como veremos' adiante, isto não foi coincidêlcia mas sim uma importarpropriedade da densidaj" 9_n"í.r.ïrn palavras, a inforrntervalo é maior ou iguar a s, iaz";;;;";ï,,1Í:ïïl1t:,i ,inrormaÇão de quoI 7 possa ,". "ul"ulon A AtrqvÁo ,:^ --,-l .a probabilidade dele ser maior ou io' i{:i y= ::l;'lrrffií,*l",mn ïili;f ;ï=ï,",:'itempo que devemos considerar puru .ur*iur a probabiridade àesejada. _ A característica de permitir a hanslrìaãn Ã^ ^-.,-'-- :':!,#1iïi^!n:,:;z:í:;:i:j:,,:t,it,:'xïï.,:i,""ïïï;:JÍ:ïi", propriedade, ";;í;;;" verificc-^" - ^^__,1 única distribuição conrínua com erpropriedade, conforme verit."-^"';::j..,' urtrca olstnbuição contínua com el temos que Le verificamos a seguir. p"." ,"r, .".i"",ïï "Erpç*)e s, r ) _p(X>ú+s) - PrxEì)- :e-at:p(X>t). t^uP:ldo que X represenra o tempo de vidzseguinte'int"ror"ïu" ão nar^ 4 6r^6-: ,t 9" u3 equipamento, podemogl'azer a seguinte int --rrvuv'r. " ""tï:.-YloÍ 9" um equipamento, podemogp.ouauiriJaãe;; "*,ïlfijïï:"r,l"ii^l,jï1,'hoide da rãïiã' o" memória: aprobabilidade do equ' --5*v rqr4 4 Pr'opfledade da falta de memória: al';;;' ïili ;ïï:iffi;ïj:fiï ff' :Jï::'* "," á,, ;r;i;" ï"ï, ;1:::, j' é iguat a i,',iu"uirlì;;ï í;""Ï:'"' t + s anos, sabendo-se qu" jáitnos' Em oú.u. puluurur. " ;r*.-*ï:"::'llÏ:"to novo durar pelo rn*or'jii]_".' P3 outras palavras, a informaça- "YurParrÌento novo durar pelo meìos-úcsquecida " ; q*'iÃoor,u, Dara o .Áta,tn 1l_:ll3::.do equipam"ì. p"J"-i,il:ffii]# Sue.imnorta, para o "arc"r" aÏi.ffi;'.ff"::ï1qucremos que dure. uantos anos a mais 6,2 Principais Modelos Contínuos Dentre todos os modelos teóricos, sejam contínuos ou discretos, o mais lmportante é o modelo Normal. Ele é muito utilizado èm aplicações e também Eerve como aproximação para muitas outras distribuições. Dcfinição 6.6: Modelo Normal Dizemos que uma variável aleatória contínua X tem distribuição Normal corn parâmetros p e 02, se sua função densidade é dada por: f(n):+"- ,r'"P lpata -oo<r<oo.o1/2r Usaremos a notação X - N (p,a2), para indicar que X tem distribuição Normal corn parâmetros p e o2. A densidade é representada na Figura 6.3. ! Algumas propriedades da densidade da Normal podem ser, facilmente, observadas de seu gráfico: 1) f @) é simétrica em relação à p; ii) /(r)+ 0 quando r-r* oo ; iii) o valor máximo de f (r) se dá para r : F. r83 pl ,, Otfuro 6.3: Densidade Normsl- Pode-se ainda verificar que os parâmetros rcspectivamente, .a média e a variância da distribuição. p--g--o' _tepre s ent am, A demonstração requer IEl fnpftub 6; Vrtridvri,y Alertttjrius Ct ,.;ï+:i:=Ï:'fiiÏ*ì.l,ï ïl,',fj n:, oo r:i,?: interessado poue consu rrarimediatame n^T1i," ilo I : , " ,rrer) : :;:o'tomos que x^- u ç1"-'oi\','r'),Nü;ïffiriáveis"";;,r;_ a rnregratda função densidade n;;;##;re inreresse, isro é, P(o<y<b): [" | -u-,2: ",/ - J";ãe--Èf dr. Entretanto, a integral acima só pode seriï:ïï::ïïi:*i;j*:t"i:í:ïïi::ffi ;[;x:J;# jïi,ï:,il:ï: jcaÌculadas com o ur*ifioï"_r#.; ï#oabitidades para o rnod"lo fVorÃojde tabelas para cada õ;ffiï::7ï:,""it]r a multiplicação o"rn"."i*conduz sempre "" "u,fïï"0:""i'."^T^'"Íf ,,o,2), utitìz-r" ;;;';ânsrormacãn:^o1d.u, sempre uo ",-i---- -" Yqru(ç' \l't, o,'), utiliza-se uma transformuçao(0, 1 ), r'i"'e,ïJr, ;ïïi:ri:,probabi lidaa"' .o'-u'"u ïïnrï., de parâmr Considere y - NQJ,o27 e defina umâ nô\,Õ ì.^_j:propriedades do valor esperado e da variânc:ìlma nova variâvel z : Il L 11a, segue que oE(z) :4! - u' 7;:): it6 - t) = lwet - r"l: o; var(Z)-Vor(X-F\- !rr^-,u , 1. o, - --;v crr\-X. _ p) =,!_Var(X) : 1. P(o < X < b) - p@ _ p < x__ p 1 b _ u) _ora-lt aX_t" -b_1",-rl o o .____) Pode-se ainda verificar orrê oo". ,-^-L oz ï;;;*ï",;r;i,:ji'í":ij:::f iii'",,:*iï:lï"qffi ffij;1"i:ï::ïprocedemos r;;;*J;"#iri;Para determinu' u p.àluu-i'riãïilï: i :'t:, e,portanto,quaisquer ' o jzì-; para obter nroh"n;r;.r.f-11e-sejam gs vaÌores de pt e o, utiliztpara obter probabiìid: r --Jq'rr vo vcrurcs o:_1" " o, utilizamos a Normal os 'or^_^^ _-,_d., :o,T a distribuição Normal.os vatores para p(o 2-;":":ï:iït3,. :e A. Com a simetrià A" a""",ir",r: íy .i" apresentados em tabelaâ";:Íi;:*;innlrtr;Í:ìl#.:*:#ï:i:ï,ï,::i"Hï#,ï::prúabilidades em outros inr..uuú* ïoà" r\ormal podemos calcular *r".", ,probabilidade de estar acima (ou abaixoì ,?:"":":tTïria também i-pli;;;;,probabilidade de esta vqrws' 't\ore que a simetrisem,.,rê Ìì,- nrí*^,- Lr acrma (ou abaixo) de zero é o ié 0,5. Como probàbitiaadesempre um número entre 0 e 1,; ra;;ü.ffi;i:ï;rïfJi}r#l H por exemplo , pa,ra x- ,,t,Ò], remosi'r-i /'(? < x < 5) : pç?:3 . x -r. 5- 2, \/g t/g - -gl:P(o < z <1):0,3413; eorrcspondendo à área sombreada no gráfico: é, 2 I' r'i t t t: i puis M ode los Cott I frr r.to.ç Para obter -P(0 < X < 2), usamos 5srgu ir): 185 1 a simetria da Normal (ver figura a I P(o < x < 2):p19: 3 < z <Çl : p(_2/J < z < o) :p(0<Z<2/J):0,2486. 7', 186 /\ I L i, Jr'I r'' Cup Ítu lo ô ; Vl1 yi1lyt6, i,1 A I ett Ítí riu;t apresentar tempo dã il t t l: I í, n'., ( | ""s"ti,J,"li;ï"1Ï* :i',:?' as. probabilidades de intervâlos comrecurs o imporranre " " :: "t:ï:jl^",id,e n tes. .i n teruot o. n o 0".ì"' ï"r,,, *recu rs o i mp orran re n o u s o a u t aa "r i i. affi ï, # iï ;ïïï:ï iïìï Ëï; ."#P(X>s):pçX-tr,3-2, -/ q 3 ):P(Z>1/3) .r, i :0,5_p(0 Szq7, A rabera tu,,'ue- ^^r" :: ì- ' .t' : 0'5 - 0'7293 :0'3707' cerra probabiria"aa lPét pode ser utilizada 13^s1nti{o inverso, isro é, dado u I", : : o, " ;" ï (ï:, iï ;.5?;, ?;"1ïffi j: íï1.:ïi "."_o r o, qu i iJ;'ro:1i1,,110,"_qu" rà,, se aproxima de 0.4 é o ?oo7. ^^__., p: ou^ tobËËserá o uutora"ll-'rorò òe aproxrma de 0,4 é 0,3997; ""rr"r;;;ã;J;"tï:rïSuponha, ar lï jËt:"ffi :ï:xï,;i;Ëïïï#lï:fi 'lfr ,;::,:Áí^ìP^,:, probabiridade 0,8. pera. simet); ;,"íu";ï;ï fï,Ji: ïJ*ç2, g,$, ,m:Xï::;:::^::,''l^:i::"':;;;ilï:o,uìì0"*;:';:-0,84Exemplo ó.8.. Doente" cnfro-r^ r "'vÌ wPurtanto d: -0184,traram-ento;";;;,;ïr":, sofrendo o" ":11u molésria, são submetidos a ua" -!o-i'"ï'ÏJ::ï;H;:ïtË*ï::ï .' '""a"r'"aã"il,. uïu ì*,idade Normc P(x>rT):11x-15 ' \/4- 77- 51/4"J -) P ( A.probabilidade de ur "\uct'- (( u'< è <' 4 ) )nor a 20 dias ..'u n",lp-1ïenre, escoÌhii,ioÁí13ír!;,,u,cura inferior a20 dias;;;;;Ë; P(x <,20) : e(4 - ts. 2o - 151 _ D/,7 ' v4 rt / ,,:\z < 2,5): 0,993g. uma questão interessanre seria saber o ,!riJ*:r;:ô- i :|:ï1".'"çã". de 25vo ao' p*i"n-,;'ï ïï:^ï.t"":l: máximo necessário paro & 'itc ien tes é i nrerpreradu^'.o-Àï'ï ;"tdf,i,:ï. ïj.;'"ff 'u o "on,un,o aJ'*cnc'rcamente escorhido. Assim, p.*iJ",ï", obter umìaro. r iar oïï:" ;";;;; ")-r\z>t):0Ã582.bo,;P-' u---'r 1 olhiãË Áo à"t^'"In' -^-:^^ - 1)Z Pt ittripuis Modelos Contínuos 187 P(X < t) :0,25, ,(#.'#):p(z< €etrr ,r uso da tabela (e alguma reflexão) obtemos t-15 -A:-0,67)t:13,66. il-u],#=ã ffi ffi ffi' 1N t-L5 ._ Jt ) : 0,25. r ,il 0r ,)''" Çorrclrrírnos, então, informando que 25% dos pacientes ficarão curados antes de, êpLox irnadamente, 14 dias. . considere agora que r00 pacientes são escolhidos ao acaso, quar seria oõtlnrcru esperado de doentes óurados em menos de rr dias? obtemos, lf,icirrlrnente, a probabilidade de um paciente genérico ser curado em menos de I Idl's. lirn seguida, essa probabilidade é interpietaau.o-à prú"ìça" de pacientes ãiliil ::',o em menos de 11 dias e é multiplicada por lOopaia óbter a resposta.I t'lllos, P(X<rr;:r( 11- 15, n.'t'' ",'1 ' jL 'ìt -, ) : P(z < -2) :0,0228. Errtii., para 100 pacientes, o número esperado com tempo de cura inferior a tlirrs será de 100 x O,0Z2B - 2 pacientes. x-75 v4 ll tr Na Tabela 6.1 apresentamos as expressões da média e da variância para us rrrodelos contínuos estudados até aqui. Tabela 6.1: Modelos contínuos - vsror esperado e variâncía. ,lv- /88 Cultítulo 6: Varidveis Aleatórias P ri t r c ipais M odelo s Contínuos lnnrnial, melhor será a aproximação. Nos casos em que certa assimetria estiver te, valores crescentes de n fornecerão melhores resultados. Densidade de Freqüência Figura 6,4: Aproximação Normal para o Modelo Binomíal. Para melhorar a aproximação, alguns autores introduzem a correção de corltinuidade no cálculo com a Normal. Esse mecanismo consiste em alterar de 0,5 unidade o valor com que se deseja calcular a probabilidade. A alteração para tuitis ou para menos depende, respectivamente, da probabilidade desejada excluir ou incluir a igualdade ao valor desejado. Por exemplo, teríamos, P(X > 50) - P(Y > 50,5) = P(Z > ) :0,9292. Note que, com relação a Y e Z, é indiferente se a desigualdade inclui ou não o sinal de igual. Para calcular a igualdade a um valor, digamos X : 50, criamos um intcrvalo artificial, pois com variáveis contínuas essa probabilidade seria zero. 189 ::: r: fl.'; :ï'1,:',":?, ilïïïj;.:ï: ::'.'"" i mp ortan re s em Es tarís ti ca M ;"ï,i""1ï:ïiïi:,,ïq"""'à''ï''HJ'ïï-iiJ;,ïï"ffi il';"rï:H';;i se refere à c,,o ,,,,,1ï:: da média. Uma outra razão daimnorÍÂn^i. r^ rÌ_se_refere à sua util' ""'"::l:u razãoda importânciad;No; próximo "*;;;;, ï"ffi:XïffÏï,,fi|fà'*ação para outras - disrribuições. Exemnln tÇ o, ,.-t-_:- ara aproximar o modelo Bin;;;.lxeryrto 6.9.' Estudo do sindicato oo, n-.n;;:;; :,ooelo smomial' Fïï'ï:.',ï:*:'#:if ï#ffi " j#l':ï'ï,ï**fi :,"":il:í:; menos 50 com "rru ào"nçu ? 's' Qual seria a probabilidaJ" ã"; Admitindo o,ro "."oo ho-^:_i_ i:r:Ëii:$ìrnrïïËrlJr*i'ï', trï*#ïïï:ï:rïïï ;lï:#,Tlt":*'ilï*l" r":ï Ë.'r'":ï ub1,:,i?que conra o número torar r;ifffrliil""ï""ülâ:::;;;;;;;;Jï:::;;:ï,ïff :ï::;üïiï:r: 1,ffïJ[i:,i,ïil,ï;J,i']i1ïH"l ã f#ï,ï"11;"'::i,?fi; indicando que a so,uçãodada pela distribuição N;;;d ; ##X; sera u'e484; indicando que a soluçãohistograma d" Bi;;iul e a densirran. n. ^1oi1"l' Na.Figura 6.4, representamos ohistograma da Binãmiar " "ï""rrãÌ;ï';""ï'"""e1' Na Figura 6.4, representamoì obaseúa no r"or",ãu ôentral do Lïmite ,,,''1o*l_:1r.!zaaa,1a aproxìmaçã";;;;baseada no Teorema ; * - _ uwrròrudue oa lormaÌ utili flo Canírrrt^ ? E* _ Central do Lïmite, um impo.tanie P(x>50):f1zoo\ 'tãn\ n )o'sro'7200-t' P(x >5o) - P(Y > 4s,s) : P(z > W, : o,e4l4; 50,5 - 60 ---------- \/ 42 n o c apíru r o 7 . Em g"'ur, q, *ì'ilï : ffi ,'ftïnï"r;"ïi r:: ilHf,ïffi :ï ; FT çap#ulo 6: Vartdvels Alearárlas t9l Assim, P(X :50) - p(4g,5< f < 50,5) - p150,5 - 60 -'/42ì 3^:r1::,". exaro da probabilidade fornece oa qualidade da aproximaçao. v _ 49,5_60. ' > -õ-) :0,0182. valor 0,0190; mostrando, Note como o histograma se aproxima de um modelo simétrico e em lbrma Élrro (semelhante ao modelo Normal) à medida que caminhamos da esquerdo ir direita (valores crescentes de n). Pode também ser notado que a tvcrgência será mais râpida em situações em que a distribuição Binornial é' Ëpftrxirnitclitmente simétrica, o que ocorre para valores de p próximos a 112. ' ' Uma propriedade muito importante do modelo Normal, cuja CCtttotrstração será omitida, é aquela que garante que qualquer combinação lineAr de virriírveis Normais independentes, também, terâ distribuição Normal, Em €gtlrrs palavras, se X1 , Xz, .. ., X, formam uma seqüência de variáveis aleatóriaS N(tt,,r?) independentes è atta2,...,a,,, são constantes quaisquer, então g,r . fouxuterá distribuição Normal. Seus parâmetros são determinados a partir i=L dns propriedades do valor esperado e da variância, ou seja, '\tr 'n rL n,p*: E(DarXr):\n@rxr ) : Don E(Xn):Lorlu;i--r i:l i:l i--L oï : V"r(Do;Xr, ) : \var(arXr ) : \alvar(Xr) : l"l ol,i:L i.:l i.:l i:l liste resultado amplia, consideravelmente, o uso da Normal em várias sitUnçõeU, conforme pode ser notado nos exemplos a seguir. Iìxemplo 6.10: rJm serviço de fiscalização é criado para averiguar se garrafm de u,r", ""ito refrigerante contém, de fato, o volume especificado pelo fabricante. Parn tanto, 10 gariafas do produto são compradas no varejo, em várias regiões dn cidade. Cada uma dessas garrafas é esvaziada e o volume de seu conteúdo, que denotaremos por I/, é aferido. Uma vez obtidos os 10 valores, a média aritmética M é calculada e, se M < 290 mililitros (ml), a companhia é multada. Estudos na linha de produção do fabricante mostraram que variações sempre ocorrem' rnesmo ," os "rp""ificações forem seguidas. Por essa tazáo, considera-se o volume dO conteúdó das garrafas como seguindo um modelo Normal, com média P : 300 ml e desvio-padrão o:25 ml. Gostaríamos de calcular qual é a probabilidade de que o fabricante seja multado injustamente? A multa será injusta se, apesar de dentro das especificações, o valor de M for abaixo de 290 ml. Observe que isto pode ocorrer devido ànattreza aleatória do enchimento das garrafas. Como ilust ïÌïïrïït*::ïïx';i;;ïïJ;'rïïïiii:íf r::ïï,",Í;'.,rrlvator de n ;.;,.i;ï; temos assim p iguat a 0,2.;0,j " õ; ;.,ioo o" cada linharumentado, tomando os valores ro, sóÍil,roo P=0.3,n =10r[fl 'Àï'=' o'4l]Fn. Jl][ p=0.5,n=100  p=0.2,n =tO p=0.2,n =30 p=0.2,n=100 p=0.5,n=10 P=0.5,n =30 Figura 6.5: Histogramas para valores simulados da Binomíal ''qItF t92 Denotando por uo volume da z-ésima ganadaa ser aferida e suque o fabricanre esreja denrro das especificaço"i ;;;ìr]ã.ü _ weoo,'i : 7,... , 10. A média aritmética U-ãáá'Aupo, nt:YJ-"+Vo 1-- 1:ro%+...+ruro, que coffesponde a u.ma. combinação linear com ai :assumindo ìndependência entre as variávels aleatóriasqueM - N(pu,o2nn), com 10 10 t-LM : D"ur: à#ros : Boo;i:7 10 o3,r:Ë"i"r: Ë(#)'rrr: P(mutta) : p(M < 290) : o(, - ro, -' \ otr /t/n - : P(z < -r,26): o,1o3g. Portanto, a probabilidade de que a empresa seja multada, indevidamente, será de,aproximadamente, I0 Vo. " "vJs 'rqrrcu.' ,ruçvr tr iïJ#íJ",i ;í j;, H.ï:"" ï;:ï":: j:::11, r,J.':' n a Ì o r s a de var ore s e u til i za u mmodelo probabilístico para avaliar ,"r, l*'"o rrc Duròil ue valores e utili comnrâ ê vcnrìe qi;6È^^ t-^^ . -ucros. Suas aplicações financei :"i::ï":""n1 ï*:ï il9: áre as : a gri c u il;"il;;' ;ï *ffi:' :ïlïï1ïï'" Í:ffi:ïï ï#""i:lo representu o "o-portamenro do lucro di u;ïï ". ":.:ilï,1ï:rnilhares de reais): Cnpftulo 6: VtrlrÍvels Aletttórittt C, If I0, para todo z. V,i=1,...,10, 252 10' Logo, 290 - 300\ I 25/\/n ) L:2Let-5Lr*BLc, com 24, L1 e Ls representando, respectivamente, os lucros diários nos setores deagricultura, indústria e comércio. As distriúçr";;" o'rãf"olioude dessasvariáveis aleatórias são fe - N(3, 4), ir- lr(0,9) " t.l-nrça, 16). supondo llï,ï],ï'S?ï*,ii,r" os rrês setor"r,'qíu-.".á a probabilioãae àe um lucro diário '!ÇtF P t i u t' i 1 tt t i,t M r x I t I tt:t Con! ít t ttt t,r confbrme mencionado, a variável -L, sendo uma combinação linear ruis inclependentes, segue distribuição Normal com parâmetros dados por: " -2x3*5x6*3x4:48:;Itr - . ^2 - 22 x 4*52 x 9+32 x 16 : 385'uL-o ^ïIv ^r I u t L - N(48, 385) e, portanto, P(L>bo) : P(z > 4ff) : P(z > o,1o) :0,4602; ' /385 ' clnclo uma alta probabilidade de lucros superiores a 50 mil' Ercrcícios da Seção 6.2: 1, Sr:rrdo X - Ul\,4l, calcule n. P(X > 2). b. P(x > 2). c.P(1 <X<2). d.P(l <X<2lX<3). c.P(X <311<X<2). 2. Admite-se que uma pane pode ocorrer em qualquer ponto de uma rede elétrica cle 10 quilômetros. a. euai é a probabilidade da pane ocorrer nos primeiros 500 metros? E de ocorrer nos 3 quilômetros centrais da rede? , ,"" 5. O custo de reparo da rede depende da distância do centro de serviço aó-loóal da pane. Considere que o centro de serviço está na origem da rede e que o cusìo é de R$ 200 para distâncias até 3 quilômetros, de R$ 400 entre 3 e 8 e de R$1.000 para as distâncias acima de 8 quilômetros. Qual é o custo médio do conserto? .ì, O tempo necessário para um medicamento contra dor fazer efeito foi modelado de acordo com a dãnsidade Uniforme no intervalo de 5 a 15 (em minutos), tendo por base experimentos conduzidos em animais' Um paciente' que esteja sofrendo dor, reCebe o remédio e, supondo válido o modelo mencionado acima, pergunta-se a probabilidade da dor : a. Cessar em até 10 minutos? b. Demorar pelo menos 12 minutos? c. Durar mais de 7 minutos, sabendo-se que durou menos de 10? de tr 5. Sendo X - Exp(I), derermine: a.P(0<X<2). b. P(x < 2). c.P( I<X<4). d. P(x > 3). e. P(X < 2lX > r). 7. Seja X- N(4,1). Derermine: a. P(X < 4).b.P(4<X<5). c.P(2<x<5). d.P(5<X<7). e. P(X < 1). f.P(0<x<2\, t- 8. Para X- N(90,100), obtenha: a. P(X < 11b). b. P(x > 80). c.P(X < 75). d.P(85<X<110). e. P(lX - eol < 10). f. O valor de atalquep(gO - a {X < g0 * a) : 1, 1 : 0,g5. 9. Para X- N(-5,10), calcule: a.P(-5<X<-2). b. P(x < 0). c. P(X > -6).d.P(-7<X<_6). c. P(lx + bl > 2). -= lí,.1 E.rerck:io't 6.3 Exercícios l. tJrna vaiiável contínua tem densidade dada por: 1<rí3; caso contrário. a. Faça um gráfico da função acima e verifique que ela satisfaz as condições para ser densidade. b. Determine P(X > 2), P(X >- 2) " P(X:2)' c. Calcule P(0 < X < 312), P(X > 312) e P(X > 312)' cl. Obtenha P(312 < X < 5l2l X < 2)' 2. A densidade de probabilidade para uma variável aleatória contínuaX é' dada pelo gráfico a seguir: Determine: a.P(-Lla< X <114). b.P(o<x<314). c.P(-314<x<0). d.P(X>o,x>314). e.P(X>0lX<Llz). f.P(x<3l4lx>L12). g. Um número b tal que P(X > b) : Ll4' 'r91 êapltulo 6: Vartávels Aleeftdrlatt 4. suponha que o varor esperado de uma varidver areatôr"ia corn distribuiluniforme contínuaé I e a variância é iguar a rl r2.Encont.e a probabiridade variável assumir valores menores qu" ú+. /(") : {á, ' 6' Suponha que o tempo de vida ?de um vírus exposto ao meio ambiente seu-1 disrribuição Exponencial com parâmãtro .l : uioï. "õ;ì;"ì;probabilidade condicional p(T > 15 I " > 10). i 3. Suponha que dada por: c. Supondo que um automóvel a probabilidade de que seja anos de uso? uma variável aleatória contínua tenha densidade de '-=F (itpítuIo ó; Vuridveit AIetttõritu 0<u<3; caso contrário. condições descri ano de uso? E t96 ï(r): a. Qual é o valor de k? b. Quanro valeb,ral que p(X > b) :5/gtt ïï:f:;t"::1iï,*,11"^" 1: ,,n amorrecedor de cerra marca emsujeitos a uso contínun ", *,.'"^ *::ï:":"""r oe certa maÍca em aul contínua, medi'a "j":-:-r":e.ro, pode ser consideruOo "o.ã u.ucontínua, medida em ânôs o,,^"j-ïI*l ò,çr uonsloerado como uma varseguinre expressão: 1 anos' suponha que a função ;il;;; é dada.segulnte expressão: 0{r{2' 24r{6; caso contrário. lI,+t', Ì0, f (r) :Í; : a' Verifique que a função-acima é, de fato, uma densidade.o. Sï:t é a probabiliãade d" "rn';r',;;óvel, sujeiro àsaclma, necessitar de froca de amortecedores antes de I1 e 3 anos? está há 3 anos com o mesm.ì ah^rr^^^Ã^,- necessário fazer a,.,t"t-o amortecedor, qual)ca antes de completar 4t fi;lí;r;"-no médio adequado para a troca do amorrecedor desses 5. O gráfico, a seguir. rX. _ representa a densidade de uma variável a. Verifìque que f (r) representa uma densidade.b. Escreva a expressão dà funçao. "- se'o c. Calcute p(X < S/12). 5---' d. Determine um número c tal que p(X { c) : 112 ó. 6,J lirercícios t97 O acréscimo anual na área atingida por uma certa praga, numa região produtorit cle frutas, pode ser modelado por uma variável aleatória contínua, medida em hectares (10 mil m2), com densidade:(?", 0<z<1; If@):{1-ã, 1(r13; I |. 0, caso contrário. a. Construa o gráfico dessa densidade. b. Qual seria a probabilidade da praga atingir entte 2 e 3 hectares esse ano? c. Que âreaserâatingida com507o decetteza? d. Determine o acréscimo médio anual na área atingida pela praga. suponha que o peso de recém-nascidos (em kg) pode ser considerado uma variável aleatória com a seguinte densidade: í fi"+rl, 01r12; If@):1-h"**, 2<r16; I( 0, caso contrário' Qual a probabilidade de, escolhendo ao acaso uma criança, ela ter peso: a. Inferiora3kg? b.Entrele4kg? c. Pelo menos 3 kg? 7. aleatória contínua a. Determine a mediana e a média.b. Calcule a variância. 10. A função apresentada, a seguir,aleatóriacontínua X. ....-F Ci t p / t t r I o ó ; Vet r i cí tt e i,t, A I e t r I tí r i us Co n t corresponde à densidade de uma variâvel 0{r<>. caso contrário. l98 t. Y:^f:"fuso produzido por um rornovariação no i"u "";;.i;;:' '::i: automático poderá rer umacomporrame".*":;frï'#:ï:;,.,iïrJ,"r"&lï1;ïïã;f#ï* f(r):{r"*#, #s'si3; ( 0, caso contrário. a. Determine o valor - probabilidaoe.*^-^ de k tal que f (r) seja, de fato, uma função densidade rb. Para um parafuso quar a p.Ju"üiüãã"iJ;:,:;*;:,ïï""j.",.: os produzidos I ".cut"u"ï;;;;#""tomédiodesseso",Ïï:'ïï,;;ï*fi Jiiti*",.:ï 9. Suponha Que u[14 r seguinte função: variâvel aletória contínua x tem densidade dada Í(r): 0(r<r' _ +, 7<r<>. 2ar{B; caso contrário. Í(r): Determine: a. P(X > 1). b. P(x < 1'/2). c.P(1/2<x< llX<3/2). 11. Suponha que o I ',"tfo, em meses, para a fecrrÍìernnõn ,r^ -^re crrurgia oo unor"ll,l i::::-q-:*çto. de pactentes submeridosa um certo tipo de cìrurgia ;;;;;.:ï-ïiïÏ-ry*n'o de pacientes submeridosvariível arearória contínua x, ";;;;;;"";:*:::1,",ryde. ser moderado p;;;;; {:* por:;ï : *", ar e ar óri a " o n, rni i il ;íjï ;ilï"ï:ïn #ï j ïi:iïâ1ïj ï jff ï(*): --- 6,,1 lixercícios (+, o(r(1;t'f(*):1-I*+*, L<r15;t'"[ 0, caso contrário. a. Determine a média e a mediana do tempo de recuperação. b. Calcule o desvio padrão. 12. A trava de segurança de um aparelho industrial deve ser trocada com freqüência, de modo a evitar a quebra devido ao fim de sua vida útil. Estudos anteriores admitem que essa vida útil pode ser representada por uma variável aleatória contínua, assumindo valores entre 0 e 1 ano. Sua densidade é a seguinte: (*(t-*'), ocr(1;f@):1'\ 't[ 0, caso contrário. a. Calcule a probabilidade da vida útil ser superior a 6 meses. b. Determine a vida útil média. 13. Suponha que o comprimento de fósseis encontrados em uma certa regiilo, dado em centímetros, pode ser representado por uma variável aleatória X conr função densidade de probabilidade dada por: r@): L2<r120; caso contrário. a. Calcule a média e a variância de X. b. Se um museu decide comprar os fósseis encontrados pagando R$ 100,00 para os de comprimento menor que 10 centímetros e R$ 200,00 para os demais, quanto paga em média por exemplar? '14. O tempo de corrosão, em anos, de uma certa peça metálica é uma varirivel com densidade: 01r 1I; Ilr12; *3a,21r13; caso contrário. r99 T2; {5 ;:311ïï:áconstante a s que 1,5 unor. T*Toa como tendo exaramenre , oF ut ror"'i" ï; o"'resistência à co' 1 5. o c o n s u rn o d e "."' u' " o * ; ;;.# "oit u t' q' uï' u' ;ffiïlrr5i$:.iïï medida-Jm"q;#T,:::'ível de um cerro auromóvel é r,*^ .a.,,uuu.iau;iï,ó..,;;;;dï::,liï""rf"ï:ï;,ïilïJ,il:f l:i,ffi: lr, / t,f ['- ..0, losz<1r;f(r):lrr-r, rr<rS12; f, : 3"ïlï-ïïl#ï ::^" r:rJ'ï *," " "" ï'j on rrá ri o em uma "'"*"Ãïïï;fiJ[ïl;;:ir:T+ì, quar será atu'^t"lg: *- ,t;,; derermine: )om esse;il;;;",." média da despesaa. P(0 < X'.'ti' --'çrrrrrll€ib. P6 . 2).- -'' ; iÍll â',. nr e. P(x < 2lx > r). 17. Vigas de ferro u'ã ãir'"'il:",ff""#ïT;":j:0" sua exrensão a urna j:,_Í.rull::Í"fliifl "X,"'",,H:trï;#ËïH:;Ïi;x:"itïT"ï:Íxï a. sabendo-Sê que ,,* .^,r^-" t6uat ir o metros' deÍermine a probabiridade de , ju, "Ã;ar"uma falha ocorreu, eÌa ser distante no mib' ocorrer rurr,ulï."rne h^- -, '-"'v rru rnaxlfilo em I metro 18. Dois ;;;"iil nos dois metros centrais da viga. *l'n*ü*iryn+*ïrïr*i q,'mprobabiÌidad" ããr"r'iïIatamente se nãc ---"!v uu tnrervalo iniciaÌmente e n c o n t ra re nì il ï i, ii. j ï.""1".ïlï ; "ïïïïïï ";, ,; i,sï#l#,ï (irytft u|o ó; Wrriãyei,r Aiettkfu.icts Con.íínuqs 6.3 Exercícios 201 19. Em uma empresa, o equipamento de ar condicionado trabarha continuamentë,exceto quando ocorre alguma falha que causará uma interrupção e necessiduclede manurenção. vamos supor q""-;od"l;;;;'ïi'*ãï,ï", uma farha porsemana (7 dias), que ocorue "orn prãbubilidade OpS.^Ë_.fravendo falha, elnpode ocorrer em qualquer hora ao iia-p+horas). a. Se o expediente na empresa vai de g às lg.horas de segunda a sexta, qual ttprobabilidade de uma falha durante o expediente?b. As falhas, durante o expediente, acarretam custos de Rg 300,00 enquantoque nos demais horários o cusro é de Rg ZOO,Oò. Ãa"irìnr" se não houver ::tl";:,ïï:,:,ï:ï :r^ o,"rnunu,, quar é o custo ;ãi" devido a fathns 20. Seja X - Exp(I/I}), calcule: a. P(x < s). b.P(4<x<6). c.P(2<X<5). d.P(X<7lX>2). e. O valor esperado de y, sendo y : JX _12.f. A variânciadey. , t ;TïJ#""ïjr"ï:1"*^* l:.:ry.:o 1 . calcul e a probabilidade de s ortearmosi#:'::iï,ï,,ïï':i::""::"T?:11ib';.;;;oi;:ffi #;""ïï:::ï:ru;runção de disrribuição dessa ""'ia'"ì. ôr;lJã ffiï;ï::ffi;ffï,ï? '13.,ïïff;;ïJï:::ì;j: ::ltil:" d::i caixa eretrônico por crientes de unr;:ï1*ï :' ro i mo der ad o p o r ;; ";; á; -il; ï;: ff"ï : ffi ::-,1ï' Í i,ïï] a. P(I: < r). b. P(T > l:r < 4. c. Um número a tal que p(T < a) : 0,4. 23. o tempo necessário para eriminar o perigo de contaminação de certo pesticicra,após sua apricação em um pomar, è u,'u variáver ur"utoriu Exponenciar creparâmetro 2 (em anos). o maior oo n,"no. tempo depende de fatores conro iii"ïï;,1ïï,ï#'^t^"ie da região. r"noo ", uì*o áir" l"ornpor,omento, us rr u r a s p u r ve. ;ffi ;".'"",ï,::ïï :ff ," _,ïïjïÍ;ï f ;, j|#; il :i.ïprobabiridade de um. f*rta_cresse porïr,.r.oihiao oo o.o'.o, não estar maiscontaminada após r ano cra purverizuçio. quar e " "ãrì- ,,segurança,, seaguarderrrnos 2 anos pnru .unruini, "rra*'f,.utn*? 202 classificados como pessoa física é estimada emZ}Vo. a. Sendo pessoa física, qual a probabilidade de mais de 2 minutos de conexão?b' Sendo pessoa jurídica, qual a probabilidade de ficar conectado menos de 6minutos? c-' Determine a probabilidade de um cliente ficar mais de 2 minutos conectado.d. se um cliente fica mais de 5 minutos conectado, quar a probabilidade deleser pessoa jurídica? 25. Seja X- N(5,4). Determine: a. P(X < 6). b.P(7<X<s). c.P(2<X<5). d.P(-1 <X<2). e. P(X < -1).f.P(-2<X< 1). 26.Para X- N(50, B1), obtenha: a.P(X < 75). b. P(x > 60). c. P(X < 35). d.P(85<X<100). e. P(lx - 401 < 10). 27. Sendo X- N(S/4,1/9), calcule: a.P(X <7/s\. b.P(0<x<6/5). c.P(X < 3/5). d. P(x - 4/31< 1/2). c. P(lx - Ll > r/4). (t.-l Exercícios 2tì. Na distribuição X- N(p,,o2), encontre: a. P(X 2 tL, + 2o). b. P(lx - pl 3 o). c. Onúmero otalque P(p - ao 1 X < lL,*oo) : 9,99. d. O número a tal que P(X ) a) : 9,99. 2g.IJma clínica de emagrecimento recebe pacientes adultos com peso seguinclo uma distribuição Normal de média 130 kg e desvio padrão 20kg' Para ef'eito de determinar o tratamento mais adequado, os 257o pacientes de menor peso são classificados de "magros", enquanto os 25Vo de maior peso de "obeSOS". Determine os valores que delimitam cada uma dessas classificações. 30. Um teste de aptidão feito por pilotos de aeronaves em treinamento inicinl requer que uma série de operações seja realizada em uma rápida sucessão. Suponhá que o tempo necessário para completar o teste seja distribuído de acórdo com uma Normal de média 90 minutos e desvio padrão 20 minutos. a. para passar no teste, o candidato deve completálo em menos de 80 minutos, Se 65 candidatos tomam o teste, quantos são esperados passar? b. Se os 5Vo melhores candidatos são alocados para aeronaves maiores, quilo rápido deve ser o candidato para que obtenha essa posição? 31. Com base em experiências anteriores, a Companhia Telefônica sabe que l07o das contas dos seus clientes em uma comunidade são pagas com atraso. Pnra os itens abaixo, compare a solução exata com aquela obtida através de aproximação da variável aleatória pela distribuição Normal' a. Se 20 contas são enviadas em um dia pela Companhia Telefônica, qual é n probabilidade de que menos do que 3 sejam pagas com atraso? b. Se 150 contas são enviadas mensalmente para a comunidade, encontre 0 probabilidade de que 17 ou mais sejam pagas com atraso' 32. A durabilidade de um tipo de pneu da mafca Rodabem é descrita por umg variável aleatória Normal de média 60.000 km e desvio padrão de 8'300 km, a. Se a Rodabem garante os pnÇus pelos primeiros 48.000 km, qual a proporção de pneus que deverão ser trocados pela garantia? b. O que aconteceria com a proporção do item (a), se a garantia fosse part os primeiros 45.000km? c. Óual deveria ser a garantia (em km) de tal forma a assegurar que o fabricnnte trocaria sob garantia no máximo 2Vo dos pneus? cl. se você comprar 4 pneus Rodabem, qual será a probabilidade de que voeê utilizará a garantia (45.000 km) para trocar um ou mais destes pneus? Capítulo 6: Variáveis Aleatórias C, pessoa física ou jurídica, porcentagem dos que são 203 24. Um banco faz operações via Internet e, após umprestado, concluiu o seguinte modelo teórico para o minutos): f@):|r"-ir",r)0, com k sendo 1 ou 2, dependendo do cliente serDentre os clientes que se utilizam da Internet, a 204 (t t p h t t I o ó ; Vr t ri d y c i,t, A I t t t I il r. i t t,t, ( )r t t r I ";:ilff: ffïj;'uttcos indicam que a precipitação pluvibmérrica mensert, e à i, t.i uu rç ío ú;;#'ilï:ï1ï rïïï' "ï$;L.,"ffi ,o Jo . o,n o s esu i n d oa' euar seria o '"r"'i"ïffiiÏïr:Jl'ï#,ï#P[r" que exisra ^ )?^r: !: probabitidad" o" r,àu"iulã'p."",0,,ução inreriàr*/.cô r,^,^.b.construiil;**;':##i:i",ffi ïïï"irï',:ïïm,ïi.;ii,:i;possíveis valores de precipitaça" pìr"i"_ étrica. " âii:ffi;';;i"*ro "o""io ;;;' próximos 50 meses, em qr; uma precipitação pluviométri.u ,rp"Jo. ázq ^^z34' (use o computador) utilizando um gerador de números aleatórios, obten ;#,n:i;:ï":0,"n t,o^o ;^os;1aeoe, ï" "rn" -oj,oïi,ïi# u,no_,u,, ccparâmerros n : 10. :0, qg, i00 ; i:-í,ri'ï.ir, ï;ïffi"."ïï1ffi:"".r"#de n e p' consrrua um hisrogra-á. g;;undo-se na ro.r*ïà, hisrogramas i,""ïiïi'f"'' o que pode ser diio a ';'p;;; au upro'ìãuü;ï; a distribuição 35.^(Use o computador) Com os dados dCapítulo 1;. '*"**""' vur'us oaoos clo arquivo areas.txt (ver Exercício 25, u. Po:1.cada bloco, construa um histosra ngráficos. Existe dif"r.n." ênrrê ^ --:^-11 p,ata ? vatiâvel Sala. Compare og ,.3ïllï::;ï:'ï",::::"i!":**;ffi#;';;:^ï^";:;:::''ìïi*ï ;lX'**;,i:lï:*ï',ï,;1:::F;il";J"';ï:ïï;'i""""ïsugeririapara a variável Sala, em cada blõco? 36' (use o computador) para o arquivo cancer.txt descrito no Exercíci o 24 do ":#r'ïi:rhconsidere u uuriau"iióï_l para os pacienres com pelo menos 40 a. Obtenha o histograma e algumas medidas descritivas.b' você diria que o modero üo*ut re!ìesentaria bem esses dados? " "t"uoã1oo ÏïÏ'"0"r) com os dados do arquivo aeusp.txt(ver Exercíc io 26, " Ï:ï[tüiffiJ,ïi]o"]rï",ï:"'o pode ser moderada por uma Normar com b. Para cada região á" pro""aãncia, conslTemposn. c.,"-r"". ^o õrír:^^^ n . lrua um histograma pata a variávelTemposp. compare os gráficos. É"iri" âirï u'r ltrslograma para a variável sobre os rnoo"tár t"ori"os orìê nnÁa.i-* ^^-'111çu entre eles? Algum palpite;: iT::::"'"1 ï'::'"ã' qu" poJà,ú ;ffiill,'Lre eres r.. ãï"i:ïïf":,:;:?,," Ëon,in,; iï;;òj,;#ffi:;r a variáver ResidQualéasuaopinião? H. 205 Capítulo 7 Inferência Bstatística - Estimação T.L Introdução A Inferência Estatística é um conjunto de técnicas que objetiva estudar a população através de evidências fornecidas por uma amostra' E a amostra que ..,,ntém os elementos que podem ser observados e, a partir daí, quantidades cle irrteresse podem ser medidas. para ilustrar as idéias que discutiremos nesse capítulo, considere que é de interesse estudar a proporção de alunos, em uma escola do ensino médiO, qUe llretendem fazer vestibular. Para tanto, selecionamos uma amostra de alunos e ircrguntamos a eles sobre suas intenções futuras de estudo. Com o intuito dd obter irlguma indicação do valor da proporção na escola como um todo, podemos usar it proporção dos que pretendem prosseguir os estudos no grupo selecionadO. .Suponha que a escola tenha 1000 alunos e escolhemos 20 para a amostra. Esstt cscolha pode ser em uma mesma classe ou espalhada entre os alunos das três séries ou, ainda, realizada de tal modo a garantir igual presença de meninos e rneninas no gmpo, independentemente da série cursada. Uma forma simples de cscolher é associar um número acada um dos 1000 alunos, colocar todos esses números numa lista e sortear 20 números. Os alunos correspondentes aos números sorteados formariam a amostra. Suponha que você rcalize o sorteio dessa forma e um amigo seu, desconhecendo sua iniciativa, repita o mesmo procedimento. Você acha que as amostras sorteadas por você e por Seu amigo serão as mesmas? PareCe intuitivo assumir que não. Queremos enfatizar que, se realizarmos várias vezes a amostragem descrita, provavelmente obteremos amostras compostas por alunOs diferentes. Uma questão que surge agora é: apesar de diferentes, podemos ter respostas próximas ou iguais nas diversas amostras? A resposta é afirmativa c estará subjacente às idóias que desenvolveremos neste capítulo' Resumindo a discussão do parágrafo anterior, podemos dizer que devido rì natureza aleatória, geralmente envolvida no procedimento amostral, não podentos garantir que repetições de amostras produzam sempre resultados idênticos. Assim, ao coletarmos uma amostra, não podemos prever antecipadamente seu resultado' 206 (e tpítuht 7: ln.fi'rf ncitt li,çttttí,ttit,rt _ Ii, Em outras palavras, ,todas as quantidades associadas à âmostra terãoaleatório e, portanto, devem r"""b", trataÃLnto probabilístico.Um ponto importante a destacar í amosrra, remos, nu p,âti"u, roda a i"r"rÃJçïï ru,ï:iïïff iiÏïïrïitramostragem, ou seja, não há alearoriedad" Ënuotuà^ ;;;;;^rn -^ ^^ rF E'.rrvurrqõvrrr' wu òçJa''..0 na ateatonedade envolvici\ por exemplo, se os l(iïï::"* ï::' i,ii:ï191 i"i T" ro."_ "n t*ul; ;;r\;;üli o uo r o. "* ntoproporção dos que desejam conrinuar os estudos ;;ffird;;":ï"rïï, iSL: Xïïlli:",r:::::::-::" 1ïstra e o resurtaa" "utiàã,irá ser ,",n0,,mesmo, não importando qnanras vezes reperi',-,o. u ";l;;j;;ffi. ; ilï: :::ïï::":j3::iï,::: ::jlll": Ito trocam de opinião "nt.e a, coreras e, porracomo rodos os arunos sempre enrram na amosrra, a proporção "#ïl:ïffiïl n" ,-r^_I"^Ìr^" iil]jy1:, formalizaremos alguns conceitos relacionados a um rânda Inferência Estatística denomina ao "rìi*oçao. Estudarem". ffiïn;ii ;ltïï**ï::.:: ,*:jïis, objerivanJo a obtençao de informações a reslde características de interesse na ptpulaçao. * ""'"""'w uç ''urrnaçoes a re ,_",_l::: ;:tiji:j1r,ïully": e,ãonrusões de noração, vamos repreuma amostra de ramanho ??, a ser rerirada da populaçã;,Ëìi,ï;; . .,"i; Exemplo 7.r: uma empresa fabrica r00 equipamentos eletrônicos por semana L:'"n ç:,1'::":::ï: ::,:"-.npo.j1 u,",i.tên"iu d",;; ;id ;e equipamento ereração à arreração de voltagem. um res;;;";*dil;#ïïr:ïJ'#ffiiï^:j: 3"""#Jff:,:":i"'ì: "-T r":"^*flsu;1s3ivas art".ãço"Jfuá.onlïuou, de vortagerle observar o efeiro no aparerho. serão consideiado, "o- ;Ë?ffiïffï:aparelhos que passarem no teste. como esses testes são demorados e demandamcustos expressivos, apenas 5. desses aparelhos ,"rao t"rtoáos. eue cuidadosprecisamos ter na escolha e na interpretação dos resultados? os 5 aparelhos escorhido, pr""ià. ser "representativos,, da produção, ouseja, a amostra precisa representaì bem a popuração de aparerhos produzidos.Assim, se questões referentes a operado."s, máquinás utilizaãas ou, até mesmo, odia em que foram produzidos tiu"r"- efeito na quuriãuã" ao aparelho, erasprecisam ser consideradas na amostra. uma alte;ativa seria o sorteio, porexemplo, de um aparelho a cadadia, tentando não repetir op"râor". ou máquinasutilizadas' Além disso, fazer alguma froposta de mudança no processo deprodução, baseando-se apenas nos resurtados de ,,nu ,ãLuna, parece serprecipitado. o mais indicaão seria coretar amostras em várias semanas.uma vez escorhido o esquema de amostrag"^ "" ""oa elemento daamostra podem ser atribuídos varoìes 0 ou 1 depeniendo, ,"rp""tiuumente, doaparelho ser crassificado como tendo má ou bà ,"ririen"iu às arterações de --F. 207I ltrlt rulttç'ïltt $ãettt1il, 7.2: Dtvida-se da "honestidade" de um dado e decide-se lançá-lo l0 íãr',,,rr.'; de utilizálo em um jogo. Os resultados obtidos foram: I , 5, I , 4, I , 2, g, .1, 2 c 3, A que conclusão chegamos? A íÌeqüência de ocorrêniias de cada face é apresentada na tabela abatixo: r. A amostrn (X1 ,X2,..',X5,) poderia ter a resposta (0, l, l' l' l) emtr r.'olcta o numa outra ( l, l, 0, l, 0). Face 1 2 J 4 5 6 Freqüência t.) 2 a 1 1 0 Freq. relativa 0,3 0,2 0,3 0,1 0,1 0 Ërrr scndo o dado equilibrado, as freqüências de ocorrência de todas as f'aces Ghrvcrr.ianr ser próximas. Entretanto, a amostra coletada parece,indicar um certo rlcshirlanceamànto do dado, favorecendo valores pequenos' E bom notar que ,,r..r,no um dado honesto pode produzir a amostra acima. Talvez uma amosttit ti,,,i,,, pud"rse corrigir o deìvio encontrado, mas, baseado no que foi informado, o tnclltor seria não jogarcom esse dado! tr Ii.vcntploT.3..Noprimeirodia,apósmudarparaumnovobairro,vocêdecicle 1',"rgunto. às pessoas' no ponto de ônibus, quanto tempo se espera para o ônibus .t,Jgnr. As li pessoas pràsentes forneceram os seguintes números (em minutos); .5, lõ, 5, 15,lt,12, rc:15,20, 15,20,12, 8, 10 e 10' uma demora de l0 minutss l)ilrece ser inevitável? E claro que as pessoas deram suas op.iniões baseadas em experiêncins Irnteriores, que devem sór diferentes entre si. É possível, também, que algumas rlclas sejam mais atentas que outras na questão da demora, além do que nõO clcvem ""h"gu. todas no mesmo horário ao ponto. Algumas, talvez, levem em conta o comportãmento das últimas semanas para dar a opinião, outras apenas o dia itnterior.Também,quemsabeaSpessoaspessimistaspegugmodiademaior clemora e as otimistas o de menor. Dessa maneira, a subjetividade da resposta é Í'ruto da informalidade e imprecisão da pergunta. Das informações obtidas, temos rnédia igual a 11,6; moda 10 e mediana igual a 12. Assim, num prirneiro momento, parece ser razoável acreditar em espera pouco acima de 10 minutos. tr Exercícios da Seção 7.L: L. Liste as idades de cinco dos seus amigos' Escreva cada um desses números em umpequenopedaçodepapel,deigualtamanho'ecoloque-osdentrodeum "nu"lop". Antes de "aoa r"iirada, chacoalhe vigorosamente o envelope e I'eche os olhos. 208 (it1tftub 7: ln.l'erêndu E,ytutls,tiut " Ii,rri a. Qual é a intenção de toda a "engenharia" descrita acima? b. Repita três vezes o seguinte procedimento: retire de uma vez três papéis do envelope e anote seus números. Comente sobre as três trincas d" números encontradas. c. Repita três vezes o seguinte procedimento: retire um dos papéis do envelope, anote o número e devorva-o ao envelope. Faça mais duas retiradas nos mesmos moldes. Comente sobre as três trincas encontradas. d. Que diferenças existem nos procedimentos descritos em (b) e (c)? 2. Deseja-se sortear 100 crianças entre 4 e r0 anos, num certo bairro, para urnapesquisa sobre saúde bucal. Foram propostas três alternqtiÍaslpru u "ãl"tu, l;Y#.lJlïio aleatório , reatizado enrre as crianças iir,uaár\g no.io II: um sorteio aleatório de casas do bairro e, em seguida, uma escolha aleatória de uma criança de cada casa sorteada, se houver.III: Escolhe-se, ao acaso, um dia de semana em uma das escolas dobairro. Nessa ocasião, 100 crianças são sorteadas dentre as várias classes, com alunos na faixa etária de interesse. comente as diferenças e dificuldades de cada alternativa. 7.2 Parãmetros, Estimadores e Estimativas Para formalizar as idéias que serão apresentadas neste capítulo,precisamos definir alguns conceitos. Definíção 7. I : Parâmetro As quantidades da população, em geral desconhecidas, sobre as quais temos interesse, são denominadas parâmetros e, usualmente, representadas por letras gregas tais comol$ __ e gentre outras. tr Dffinição 7.2: Estimador e estimativa À combinação dos elementos da amostra, construída com a finalidade de representar, ou estimar, um parâmetro de interesse na população, denominamos estimador. E^m geral, denotamos os estimadores por ^rr-boio, com o acento circunflexo: ê, fu, õ, etc. Aos valores numéricos assumidos pelos estimadores denominamos estimativas pontuais ou simplesmente estimativcrs. tr A notação utilizada paru a média de uma população é p, acrescida de um subscrito, se houver possibilidade de confusao soúre a que população ou variável 209 7, J I'ttr(ìrtrttlrrts' lislittndttt'es r E:tlltttttliytts s referimos. Por exemplo ' px e Fe 1ão-us1ct :J:Ï"':1i,ïì';;ïtï::i:i:iiïíïì,ïï:'ï":;,::JJJïïïïËil,:r:i.:,=T":lï^.,ïi:ïïTfi *fi'""jËjïï llÍ:l : *ïJff :ï : ï.ilÏï,ï'ï í'"il1*::: |:3ï1i: ï;,:ïïï#ÍJi: i: Ëï;ì,Ëlï:ilffi l.:1iïi.ï'T:',:íti""if ï;#"Ëï"ïilï,ï,::*ffÍ:1:llilll ïÍ 3Ï 8iÏ:: ï ffi ;: ;; " ;; "r " ü'" * " 1 i. t,1"^ .',."*..ïff ,.: ï :? :Ï,''n l; ïïliü:ïil:ïï"fi", aurores e tentaremos utilizar aquera que nos pareça mars Notamos que um estimador' digamos 3' :,::"-função t*r:::U",:i nr.,,,o.ijì iï'nï#;' J" am?stla' ,i":. i 3 ^:^!^Í:::^!-::;;*Ì;,ti:ï;""# : iï i ìff:ï ffi:i';ï-" ;;;i;ï "ú:r' I ::ï::i :iÍ:i[ ^l' ï111ï;:ï: i:;ïllilïffi "ïÏ?"ï-i';;;u,"-o*"eo*"no::ï#".:ïïii'"'*dlll-o*:ïil,ïïilï*iïi,ï*í*u" da amosrra para os parâmetros da população' ";;'r';;;;';.r,u"u'.,o'interessados*:::::.1ï*'ffi .tïii""ïït""i"i*: ':::,:'i:Íi;"J:ï:#"ìil;:"Ëq:"i:*..1"^Ti":,,:Jï:J:iïï,ïiï ; ïï ::,1"' "ï *1t i ó'ü.' ;;; d" s oeí e 1i,y1ltt:ï i i.ï"n'.ï;"'ï "l::,ffir::ìlï::ïï ","ï;'"'3ff:J'J'l;"Ëil, ";'";ìhtd;' uo u"u'o dentre a popuração ioï"n',*uoécompost"^p"l,.t^l::::i?1,ï:J:?iiïflïi::tlt;':: ,,,'",,n"LtÏïlï:t':H"Ë;#;ï;;'a*"o"4"*'ï::'ï;:liï:ïï:::f ï::i',',ïlïJiï:'"Ïï"::'Ëïru*;Ì{,:j:;"*l'li:ï,ïïl'3i;';""ïffi :iovens, representaoa PUr Á'' n orrrvu!rw'--'Lu" o."cisamos resolver é que função;ì;, ;;;t dizer algo a respeito de p' o- i .^*^^r^ ;",^ 6 n.ar será o estimador.ttcla, vamos üzet.a;1o a rçòPe*v uv r/' v â,uàtu, isto é, qual será o estimador. rlos valores amostrais "ïti'"ÏÏ::f:i "t' Apresentamos a seguir algumas opçoes: ímínimo + máximo) .pr: f1(Xr, ..., Xro) : frz: lz(Xt ..',Xto) : Xt"Xt*...+Xro Ft: hlXr,..., Xto) : -----6- Poderíamos listar outros estimadores' mas os três apresentados são suficientes putu lo'itu'- *"u discussão' Inicialmente' vamos esclarecer o significado de cada trn a"i"t' O estimado'fu' é a média aritmética entre os valores mínimo e máximo da amostra e frz'é"simplesmente' o primei::"1'1]": sorteado na amostra' Ëì""f-"tt"' F' é ?-eáiu dos valores da amostra' ou seJï' il rnédia amostral.. Apresentamos, a seguir, os valores observados na amostra e âs re spectivas "rti'nutiu u' ï;;iú ; "Ín o-s estimadores definido s acima' Amostra (em metros): 1,65; !,57; !,72;1,66; |,7|; |,74; |,8|;1,68; 1,60 e 1,77. lï 2t0 Estimativas: lJlno" : u": teria coletar a amostra? concordam. Assim tomamos Capítulo 7: Inferência Estcttístícq _ Es : 1,69; 1,65; 7,65+r,57+...+r,77 10 16.91: -10 : 1'69 ' Apesar desses números, calculados para uma amostra particurar, serem muito distintos uns dos outros, não devemos escolher o estimador olh: apenas, se a estimativa correspondente é, razoâvel. como decidir qual deles u X:,::lï, "1lllj:l que esra questão_é resolvida, estudando_s" u, p.opr"Aua",diversos estimadoràs. É .ómp." uo* t"-ú.u; õ;;ú"; Ëï;ï;.' ::ï:1i:ï:l:tïli--Íota na população, pois se eló fosse conhecido, que senti Exemplo 7.5: Para detectar.o apoio popular a um projeto governamental reforma agrâria, foram entrevistadãs +oô pessoas espalhadás ".n-uá.iu, capitairamostra conrém as 400 resposras que'consistem de "r,, (o;:;tïn""Ï:ïtïconcordam com o projeto) e não (para os que discordam). Para formarizar o problema, iniciàlmente caracterizamos a populaçãointeresse como aquela formada pelos habitantes adultos do país. A informa<desejada é a proporção das pessoãs que concordam com o ,"fàido projeto, oparâmetro de interesse é p: proporlão dos que concordam com o projeto. / t, _, A oTorrra pode ser pensada como o vetor de variáveis aleatór\Ãt,Á2,...,xq00), cada uma delas seguindo um modelo Bernouili, ou seassumindo.valT. 1 para sucesso (resposta sin) e 0 parufraro"", çrerpo sta naQ.E intuitivo considerar como estimador ã prãporçao àmostral dos r p- número dos entrevistados eue aprovctm o projeto 400 que, tendo em vista as variáveis de Bernoulli, pode ser escrito como: ì-Xt+.Xz]-"'*Xqoo. - 400 como veremos adiante, esse estimador arém de intuitivo tem boas propriedades. El Suponha, como antes, que uma amostra de tamanhopopulação e representada pero cónjunto de variáveis areatóritrs n é retirada da(Xr, Xz,'.., X,,), (1,57 + 1,g1) ___ 211 7.2 Parôtmetros, Estimadores e Estimativas Xt*Xz-l +x" l)cnote os parâmetros média, variância e população PoÍ F, o'" p, respectivamente' cprantidades são as correspondentes média, proporção de certa característica nâ Os estimadores "naturais" para estas variância e proporção calculadas na n rì1ostra. Representpnd-o-os, respectivamente, por /í., o- e P, temos '^l l,e- t '"- X: ^2o.: :i&,?nn r1ìjf (xn - X), ;n-' número de itens com a característica na amostra f'í'hryt n Note que cada um dos\estiàadores apresentados depende dos valores pertencentes h o*oìtra aleatória (Xr,'..,Xr;'Como veremos no decorrer desta seção' os ;r;;;;;;r", X "?, uié* d" serem intuitivos, têm as boas propriedades que serão tlcÍ'inidas adiante. No entanto, com respeito àG2, uma alteração na sua expresSãO scrá necessár ia paraque satisfaça uma dessas importantes propriedades' Iixcmplo 7.6: Paraestudar o nível de colesterol em uma população de esportistas, colctamos uma amostra de 10 jovens atletas, obtendo os segUintes valores: ItÌ0,196, 185, 165, 190, 195, 180, 176, 165 e195' Vamos definir nosso interesse como sendo o nível médio de colesterol e' irssumindo que não temos acesso à toda a população, estimaríamos o parâmetro p (valor descoìhecido da população) pela média amostral calculada com os valores rlirclos, isto é, 180 + 196 + 185 + + L76 + 165 + 195 : L82,7.Td,": 10 I'rrrtanto, a amostra, através do estimadot X, fornece para o parâmetrO pl n trstimativa 182,7. O limite de colesterol para pessoas sadias é'200, isto é, acimn rlcsse valor o indivíduo aumenta o seu risco de ter uma complicação cardíaCA' A iilÌìostra forneceu um valor relativamente baixo, indicando que as pessoas que lrrilticam esportes, aparentemente, estão mais protegidas de complicações do coraçito. Tendo em vista que a população em estudo é constituída de jovens atletas, rrrn nível de colesterol acima de 190 poderia ser considerado preocupante e inrlicativo para um acompanhamento médico mais freqüente. Dessa forma, ,ufnnno quà classifiqu"*o, como tendo taxa alta os atletas com valores acima de 2t2 790 e taxa baixa, os demais. escolhido, definimos (upltulo 7: In.f'ert)ut,itt listrttístit'tt - Ii, Y Sendo X,i o nível de colesterol do z-ésimo \ _ | t, se X; >\e;.2:< f 0, se X; ( 190. Assim, Y; será 1 para as taxas altas e 0 para as baixas. As quantidades h , ... ,ytambém são variáveis aleatórias, uma vez que elas assumem o valor 0 ou dependendo do valor assumido por X4, que, por sua vez, é uma variável aleatória; Para os dados apresentados, podemos construir a tabela: A proporção p de atletas com taxa de colesterol alta será estimada pela proporção de taxas altas encontradas na amostra, p. A estimativa obtida é: Y+vrt"'*Y16 o+1+.'.+1 :0r3. Portanto, baseado na amostra disponível, assumiremos que 30zo de todos atletas têm taxa relativamente alta de colesterol, indicando a necessidade acompanhamento médico. Exemplo 7.7: Foi coletada uma amostra de pacientes, sofrendo de um certo tipo de câncer, para se ter uma idéia da variabilidade da ârea atingida pela doenia. Para 12 pacientes sorteados ao acaso mediu-se, através de aparelhos, o tamanho dos tumores observados. os dados foram os seguintes (em cm2): 3,52; 4,45;3,g5; 4,32; 6,12;5,88; 4,08; 5,9I; 4,50; 4,86; 5,48e 5,10. Tendo em vista que se deseja estudar a variabilidade, vamos considerar como parâmetro de interesse a variância o2. para estimador, considere duas opções: 1 tL a? :i)]fxo-x),; TL-Z:I ^2 7máximo - mínimot 2 "r: \______ 2 ) . A primeira escolha é a variância do conjunto de dados que foi observado, enquanto que o segundo estimador proposto é a semi-amplitude de valores obtidos na amostra. Vamos calcular suas estimativas: Pobs: 1010 i I 2 ot) 4 5 6 7 8 I 10 X.; 180 196 185 165 190 195 180 176 165 195 V 0 1 0 0 0 1 0 0 0 1 rillFÉ 7, 2 l' ( t ríl n t ( l,rt s, Iis l i rttad o re s e t!ú l r t tt t l i v t t't ^2Oo: máximo - mínimo 2ti ã1.u": $Kt,r, - 4,84)2 + "' + (5,10 - 4,84)21 :0,67i : {2'601' : 1.6g.\2 / Esse:s números, apesar de bem distintos, dão idéia da dispersão de valores que Jn,l*,' ser encontìados no tamanho dos tumores' Veremos mais adiante que um il,il:ï ïãü;lã, poro*o, uma esrimariva melhor pode ser obtida. tr Como vimos nos exemplos acima' mais de uma função da amostra pode Her proposta para estimar o parãmetro de interesse. Para facilitar a escolha entre ttris estimadores, torna-se importante verificar se possuem algumas das propriedades que serão definidas a seguir' Dc.finição 7.3: Vício Um estimad ot? ê' não viciado ot não viesado tl(?) : 0. Em outras palavras' um estimador é não esperado coincide com o parâmetro de interesse' Definição 7.4: Consistência Um estimado, 3 é consistente, se' à medida que o tamanho da amostÍ& iurrnenta, seu valor esperado converge^ para o parâmetro de interesse e sua variância converge purã ""'o' Ou seja' ? é consistente se as duas propriedades seguintes são satisfeitas: |.d,r'i-i-o CIJ7'/ o ilnn a(ì)i ï;lvod,t-dr.r 'n,+@ ii) limVar(?) : O. nì@ para um parâmetro 0 se viciado se o seu valor tr os de tr tr Noteque,nadefiniçãodeconsistência'estamosimplicitamenteusandoo fato que o estimador depende de n, o tamanho da amostraaNa definição do vício, o resultado deve valer para qualquer que seja n' isto é' E(0) :.0.' parc todo n' Na definição da consistên"iu, ã eslimador necessita ser não viciado apenas piÌro valores grandes de n. Exemplo 7.8.' Considere que' numa certa população' um1- v1]ável aleatória X assuma os valores 0, 10, 20 e 3O "o* pót"èntagens 20Vo' 3OVo' 30Vo e 207o' respectivamente.Atravésdafunçãodeprobabilidade,podemoscalcularamédiae a variância da população' nesse caso p': rÍe o:- l-05' Entretanto' para efeito 2t4 5\ ''| ,i' \ ì\' Capítulo 7: Inferência Esatística _ considere os didático, imagine que ú não fosse conhécido e desejássemos obter informaçseu respeito arravés de uma amosrra a. ton.,oìÌòï{"'"'Jül"oor,ção. videntificar as possíveis amostras selecionadas.,sr qò puòòrv€ls amostras selecionadas. t,:i^ï:*::i11-'"'á o p*.1i1,x2), com xt e xzsendo variáaleatórias independenres com u 'n"rÀu dìr,;i;;ì;á;"iiriri^i"ïi ïïï,0 10 20 30 lr f:t":s amosrras são as seguinres: (0, 0), fl,'?Ol,o fO.;ii '(0,20),... e (30, 30). ::J;;', j"r, ", ï,: ^ i: _ lï,, rã "qu rpòu# i i' ;üil;,- ïí;;,i"1, ïu,irsrfas tem r fi:ffiiiij:Í:,$."::ï::',': j:^ :*'xi' r3i 3.",ini;, ; ;;.,ra (0, I 0)probabilidade 0,06 enquanto que (10, 20) tem 0,09.Para estimar o valor d a média' p, na população, estimadores: ìt:Ít(Xt,Xz):Xr; frz:lz(Xt,Xz):7:XrlXz Como se comportam esses estimadores? i,,Tl;::* f:Tr^rll9-"0", o"j, já_foi apresenrada e podemos carcu ::il *ï::ï::::.: ::.':l : : ::r'id : g ".; +,# ;#""ril:'ïï'"à; ï:"fs eu s val ores ":o::il:.^ : r", l*it: e ;rortanro, ;,;;, Eiïij': ï;ì probabilidade é: o,l:2^u^.uurrâvet aleatória X, não i Aiiã,f'"*,.ri"'íì;" ,r" Xl o r(s to 1b 20 25 Bo e, Calcularndo o valor esperado de X, obtemos E(N) :0 x 0,04 -t 5 x 0,I2+ ... + J0 x 0,04 : 15. Concluímos viciacrospo.o",iião,1ffì""i"ilïÍifì"ft ""iilïi1iïr1iiï'ÍJl;.ï:,i,u.o estimador Êr, gue é igual à x1,.tem.variância igual à variância de x,rìo caso r05, e não se altera com o tamánho da amostra. ï, our.o, paravras, 4#ï:ï"ïH"#tf. iil:ï:liportanão quão grande ror a amostra. Logo p1 é o q u o c i en, ;;;il ïï ï [ ij: ïï3 #;"$ï ï:ï gil fl ïJ ï:i i:1 lï,.ï ",ï:il 215 Pt t r[tmetros, Estimadores e Estímativas rir, será influenciado pelo tamanho da amostra. Conforme veremos adiante, a i,,',,mostral X serâum estimador consistente para a média populacional' tr ttplo7.9:SuponhaqueésabidoqueumacertacaracterísticaX,na rlirção, tem média pt e variãncia o2.lJma amostra aleatórìa de tamanho n, sú,udu por (X1, X2,..',X,) é obtida para estimar o parâmetro'p' Considere o estimador fut:X Assumimos que o vetor amostral Xt, Xz,...,Xn) é constituído de váriáveis aleatórias independentes e todas com a ner,,rnãirtribuíção da variável X, isto é, Xr, Xz, ..., X' ^segltem algum modelo rrão foi especificado) com média p, e variãncia o2. Com o auxílio das iiopriedades da esperança e da variância temos E(F): E(X): nç4tJézJ-: é1: Pnrit a variância temos, 'rì, lVar(X';)4:l - p. no2 o2:-:- n2n função Itrrr.tanto, mostramos que a média amostral é um estimador não viciado para a irróclia populacional pr e' como Var(pt) : o2ln tende a 0 conforme ncresce' c,,n"luí.nós hmbém que X é um estimador consistente pata pt' ConsidereagoraqueespecificamosomodelodeXcomosendoNormal, ist. é, temos X -'í1i, "'1. Os resultados apresentados acima para X l)e r.manecem válidos, pois foram desenvolvidos sem nenhuma particularidade de rrrçclelo. suponha qu. u* outro estimador é proposÍo:p,2: mediana(xr,...,x',,.). A .f ustificaliva para o uso de frzdeve-se ao fato de que o modelo Normal é sirnétrico " u -eàiuna, assim "o.nõ u média, é uma medida de tendência central' Os cálculos referentes à P', sáo um pouco mais elaborados e não serão tlcsenvolvidos aqui. Entretanto, pode-se demonstrar que E(fur) : t" e i,,|çtr1 : Qr l2)('o2 ln), de tal formã que esse estimador é também não viciado e cottsistente para LL - Ú Iixentplo 7./0.' Supondo uma amostra (Xr, " ',X,) obtida de uma população .,,,r.r Áédiu p e variânci a 02, ümestimador "natural" da variância foi apresentado irlteriormente e motivado pelo cálculo da variância de um conjunto de dados' lisse estimador foi denotado pori\ e é viciado pata o2 ' uma vez que: 2t6 Qtltltulo 7: Inl'erêttt,iu Elktthtic,rt - E(õ?):*rtËrxt-x)z1 :*,"tttxt-tr+p-x),Ì : *utDrx, - rò2\ì)1-,,,, a'nls: ;2ts6o - P)' - E(x - p)'Z:I 7 , 1": -no'_ _o.nn ,Tl, - 7, n: \-;)o"' como é imediato verificar, o quociente (n- r)/nnunca será r, exceto no rimitcquando n tende a infinito. podemos eliminar ó vício ,nuriipri"uno o al po, , Idividindo por (n - 1). Assim, definimos um novo estimador .s2 : -_l_tf" _ x), ,n - IZJ\"z /L) ' que é não viciado para o2. para seu cálcuro, podemos usar a expressão alternativa .9': 1 /Én-t\ux?-"-*') Esse estimador recebe o nome de variância amostrare será sempre denotado pors2 paradistinguir de outros estimadores denotados genericamen te porG2. D Note que a variância ou o_ desvio padrão de um estimador fornece uma ::Í':_1L,':: llïïyl; ïor ìsso, 9 .-"''n; denominar " o"#ïi,ï""ï""H :ïii::: i : .:. :"_ ! : d,*. eu ando a"i.. ",,iÃïãïï",'r;#';;ï,tJ:;ï:. ï Hilil::::,:fiïïé o mais nrecisn Nccra nn-t^ v+^ ^ ^^,^ - .,é o mais preciso. Nesre contexto, o conce iti de eficiênrr" i ^ií*!"!r;ilïïL:?;Definíção 7.5 : Eficiência " Dados dois estimadores ?1 e ê2, não viciados para um parâmetro d,dizemos qu" ?, é mais eficiente oo qu" ó) ," r"rìA,iï ,ïiïA; tr -tF V,. ) I' t t ríl t t t (t t ro s, lis t i t u rul o rc,r c b]l I i t r t t t I i v t t,r *,_.***.{, 2t7 )Exttrnplo Z.//.. No Exemplo 7 .9, no caso de distribuição Normal, verificamos que 'ãl "tii*oaores p1 :X e frz:medtana(Xt,"',X") são não viciados e suas vnriÍìrrcias foram calculadas' Então' var(Q) - o' ln, : ? :0,63 < L + var(Fr) < var(fr,r), V'4 p; : ç" 121"'1" iT ê eottcluímos que p, é mais eficiente do que -1ìr' Na tabela a seguir, apresentamos estimadores de p, p e 02' Tabela 7.1: Estimadores para média, proporção e variância' (x) a consistência não foi demonstrada no texto mas é válida Exercícios da Seção 7.2: l. Foram sorteadas 15 famílias com filhos num certo bairro e observado o número de criancas de cada família, matriculadas na escola. Os dados foram: l, l,Z,D, 2, (,2,,'3,4, ), l, Z,0,0, e2. Obtenha as estimativas correspondentes aos seguintes estimadores da médìa de crianças na escola nesse bairro: (mínimo * máximo) . PÚI - ^t (xr+x3.fr: --n- , frs:X' Qual deles é o melhor estimador da média e por quê? 2.Para se estudar a variabilidade em um teste de Inglês (notas de 0 a 5), foram sorteados 16 alunos de uma escola e suas notas anotadas: 0, 1, 2, 1,2,3,3,2, 3, 3, 4,5, 1, 3, 2 e 3. Paraestimar a variância foram propostos os estimadores: n 218 Copltub 7: Ittferprrirt liyutíltictt - Ii, ,? : *E(xo - x)2 ; Obtenha as estimativas e discuta qual é melhor. 3' o número de reclamaçõ;s,uue chegam por hora à uma centrar de Atendimentodo consumidor foi anotadó puru ,i-u amostra de argumas horas escorhidas,aoacaso. Deseja-se organizar o serviço de modo a ate-nder, iÃ"aiutu-" nte, 909"das chamadas que chegam. O"t"r,,'ln" uma estima tiv.a n^,o n -,í*^_^ rriru n c i s n f ri s s n ec L s s á r i o i, " u ?,";ì ;", ï;,;iïJ ïï; ï JË, i"ï1 ;, i,"{;r,V,l,B,+,$,b, l, X, +,+,i, L:'[,1, i, ìïì: d)V, ! " +. 4' IJm ônibus passa por um determinado ponto em intervalos regurares (emminutos inteiros) que você, por ser nouo no bairro, d"s"onh""e. Ao chegar a ::ì;,,ï"ï,,ïlï'":"ïj:::i^ 1li: pessoas e resorve ;",s"*;; " eras sobre ;seuônibus. uma delas diz_que está no ponro h;;;;; fi";ïftÍ;ï'JJJ: ff:passou. A outra está há cerca de 40 ^minutos e já viu passar dois desses ônibus,Faça uma estimativa da demora puru pu.ru, o seu ônibus. 5' um fabricante deseja estudar a duração de baterias que são utilizadas emrelógios de pulso. uma amostra de vãrios lotes rauric'aÃs por uma mesmacompanhia foi submetida a testes acererados " proaori*- JJ r"grint", temposde duração (em anos):. 1,2; I,4; 1,7; 1,3; 1,2;2,3;i,0,-i.S,"f ,S ; 1,4; 1,6; 1,5;7'7;1,5 e 1,3' Determine estimatiu* puru a média e a variância do tempo deduração dessa p'has -para avariância,'use os estimadores da TaberaT.r. 7.3 Distribuições Amostrais Vimos que estimadores. são funções de variáveis areatórias e, portanto,eles também são variáveis areatórias. N".'tu ,"çao vamos estudar a distribuição deprobabilidade de arguns dos estimadores mais utilizados. Iniciamo, com umexemplo simpres, em que não é difícil carcurar expticitamánte a função deprobabilidade dos estimadores de interesse. Exemplo 7.12: um jogo consiste em lançar uma moeda honesta 3 vezes. paracada ,ançamento, se saircara você ganha-ì ponto, caso saia coroa, você perde um - 219 poilto. Podemos modelar essa situação através de uma variável x que, em umn i6pulação, pode assumir os valores -l e 1, com probabilidades iguais' Para uma ãrri,,rtrá aleatória e independente de tamanho 3, vamos determinar as funções de probabitidade dos estimadores X e ^92. ' Um cálculo simples fornece o valor da média e variância de X, obtendo' tc, respectivamente, 0 e 1. O vetor amostral (Xt,Xz,Xt) é constituído de Vlriírveis aleatórias independentes e identicamente distribuídas com função cle probabilidade igual à de X. A tabela, a seguìr, apresenta as possíveis amostrâs, i'espectivas probabilidades e valores de X e 52. 7, I I )ist rihuif:íics Arttttst rnl'r (X1, X2, Xs) probabilidade X gz -1, -1, -1) L/s -1 0 -1, -1, 1) T/B -113 413(-1, 1, -1) L18 -r/z 413(-1, 1, 1 rl8 U3 413( 1, -1, -1) tlB -L/3 413 1, -1, 1) 7/8 r13 413 1, 1, -1) r/8 L/3 413 I 1 1 L/s 1 0 Os valores da tabela foram obtidos através dos cálculos usuais. Por exemplo, parn n umostra (-1,1, -1), temos -1+1-1 : -tl3;rohs: (-1)'?+ (1)2 + (-1)'z- 3(-1l3)'z (3-1) Baseando-se na tabela anterior, podemos construir as distribuições dos cstimadores, dadas por: t :413. Xl-1 -LlB rl3 1 ^ Os valores esperados podem ser calculados facilmente: E(N) :(-r) x 1/8+ (-1l3) x 1/8 +Lll x 718* 1 x 1/8 : 0; E(S') : o x rl4+ 413 x 314 : r' eapftnlo 7: hlferëncio Erttttl,rtictt . Dessa forma, uma vez que.E(-t) : 0 : ,,li. : E(s^r): 1 : var(x),ambosestimadores são não ui"iuooì fuluì**Ë.r,"os parâmerros esrimados. _ t . No exemplo anterior, pudemos en .'xiïJffi :::**;,ïrTJ*,ï;;riïfu *,ïi#:",ëJJ"ïï.ï:v ^^_1:x,"ìntinuu,'"''*'"ï"lïüi j#::""ïïïïï*#iílïl;l jï:,Ël *: iïï* i! J; Jl ; ïï *r:iï'i:iil I utu,,,uc o n r ín u a o ", " i.liï ïi" :ï*envolvidas, não seria viável ;il;;; ïoàï,"r".o conrinua das variáveis aleatóritobtenção das densidao", pu.u u^Àeji""l"t as amostras possíveis, o qu" l.p"ìo apresentado flo Exemnl^ ? r. \Ì? para a variância amostral neln mÁr^rapresentado no Exempro 7 13 .wr9 "Ã"íffi;,Hï#fiïï::r peÌo méror ,ffiïïil::rïi'J'::*; :::.o^.1*i" g,", é que o0,", u'oli;,ïff,:,:": ïi::1,ffi :.ff "i"'::ii:d;õ;"iË'l'J,ïï,Jlfi "ï"ff :':':;;ïi;Í;..ïi,,;,trt1t*dï;JÍïiï:riïïJ,ï-áïLï,ï::ï:.ïil:rjit*ïyi ii,ïlïtïfJ.';Í:ïry:ff 4i*:*:*lÈfiï1"Ë,,*,.ï,ü;l"1,::,'iffi ":: uu.iau"r ïïì;H:ï:,,.,n_i"iurm"nr",-;;," de umà õ;;ü; Normar, isro é, a represenra uma ^;^:.: : N(!".' o2)' Portan ; ffi;;ï" :Íï;àïx"Ëïï.Jilïï:,.1i,#i,,;,n#llrdìÉ;J$*li:;i j X'i - N(p,, o2), ,i: I,...rn; X; é independente 4s X j, para todo i t' j. XtTr, gue, para quaisquer consianres a,{; também tem disìribuìcãn a^ ^-:;:;,,.*l' ,"'.4:, a combinação lineart*f;*f f rui*ïÍlï* j:ï,J"ï,ii;."àïâ;,X,ïiLiïtï#ï:A distribuição da média ,-;;Ë*" Pruoa'Illdade dada pelo modeló Nor,r,ui. a,; : 7/n, 'para i,: t, ..., n. A.ssi- u,' :of:n* desÍe resultado ao to-urn,ã.at : 7/n, para i, : I,...,,r."'Ã,,"}:"ïttetamente deste resulrado ao torr propriedades dâ esrr."o-^ô ^,.^-:^ N(p*, ol) e, com o auxílipropri edades da esperança e variânciu uor"r"n ooxïJ,#".ï;:ï ;:ïnt o das tt,: E(X) : uÉËx) : *n, : ,, o1: va,(X) : v"4!txò : #ro, : # Logo, para uma clistribuição de coleção de variáveis probabilidade, dada aleatóriás independentes com uma mesmapor um modelo Normal ""_ ;ã;;;'è E: Figura 7.1: Efeito de n na distribuíção amostral de X - N(10, L6ln). *I-F '" - --"-=Çt 77t '. I I t i.t' t riln i çilc,t A rru ^! nli,t nciã o2, a média amostral'X também terá distribuição Normal, com média p vrrrifincia o2ln. Note que, pelo resultado acima, podemos concluir que à medida em que o talnlnho da amostra cresce, a probabilidade de a média amostral estar nil Vlzinhança da média populacional torna-se maior. Intuitivamente tal fato é êFltclirdo, uma vez que, ao aumentarmos o tamanho da amostra, estamos tendo ituis informação e, de certa forma, fazendo a amostra ficar "mais parecida" com tt Apolrulação. E, assim, razoâvel acreditar que a média amostral será próxima dn ntérlia populacional. Excmplo 7.13: Considere uma amostra independente de tamanho zl de uma vrrriírvel N(10,16). Isto é, Xt,X2,...,X,, são independentes e todas com distribuição Normal com média 10 e variância 16. Como se comporta X em lirrrçiro de n? A variável aleatória X tem distribuição N(10, 16/n) e o gráfico de sua elcrrsidade é apresentado, a seguir, para alguns valores de n. Como podemos notar, à medida que n aumenta, a função densidade vai sc eoncentrando ao redor da média 10, que é amédia populacional, indicando metior probabilidade de amostras grandes fornecerem uma estimativa de X próxima dn rnódia populacional. Densidade tr 222 omitida. com Z -.À(0,1). Cnpltulo 7; ltlferênrict E,rkttl,ytiett - Exemplo z'14: suponha que a aceitação de.urn rote de r000 peças ocorra :il ïifiïi,ï,ï:_lï j.:^ lo^tças. retirada, or"oto,lo*ãi,'. oo ro,.,entre 5 e 10 cm. Sabe-se.,r" ^.).,.i^-r'*^v!'rssso oru'rlurralllenre oo lot i*, * ;: *",,n"T:ïï J:, ï ïï : iü,1,",," r :i "ãï:iSe definirmos nor y. ^ ^^6.. . .V ì li : 1, . . . . 10. remos lÌ,.0"ïrf1 ,^o ,"^o'Ptimento -da i-ésima peçai- r,... , 10, remos q_ue a médiá d": t0;iç;;;;;ï";;ï'#,"_i:i:#:ïx' terá distribuição Normal com média i,s'"^ ;il;;ïôno:2 cmz.Lca probabilidade de aceitarmos o lote serrá P(5<X<ro; :r(r-2,t.\ r/z X-p . ro-Z.s\;m.-õ-) -P(- obtida da rabela da N(0, 1). I,77 < Z <I,TZ):0,,92J2; Io q!" foi discutido até aquia!v Yuv rur (rrscutlclo ate aqui, consideramos a distribuição arnostralmédia X, calculada em uma amostra crrinq êlêmô6Í^^ ^:^ra cuJos elementos são constituídos Jïïï:i:ï,.ï,,ïï:*""r":::"";:::;;,ü'o_EJÏï:ï'J1"'u;ï.ïï:ï"[ ;; ?:ï;'i" ï":, :: t: :Tiçi:: : *:p ei t o ã a or s t,i bu i ç ão a u, uu.i #iï.liï3;,,ïl lÍ,'3ffi ï::;,::""*::i:':i:;:-;ã;Ï'J'"*ï.:3:'fJ:ïïÏ:i:ï :::;::;:;ï:;::;'iï:j;:u:'i*::::{::ï";iï;;;:ï;,:"^n)i""#"i":"i::i::n ':{;';:::#:i^r#(:,^l*:l',:x;;;"#b":':r:;:i:##i:n:í:#ï:ft 'ï*ilï:ïTÍ::;"::*:::',','":,'::"N:#;i-ilJ;;Jï-:ï3,xH'#j'.ï1:i mp orr an re s da - âr e a ,1: ï:,:i,-,: ::""' Ë," *, iìlïl"ï : ïi :i, ,lÏ Z:H:ii:Central do Limite- cnir do-a-o+*-^x^ :,":;ií:doLimire,"u;aa"mons;;;õ#'ãï:;,".ïïï:::::r^?:,"*!á Teorema Central do Limüe suponha uma amostra aleatória simpres de tamanho n retiradade umapopulação com média p e variânc ia o2 (Ãote que o modelo da variável aleatórianão é especificado). Represenrunoo tìï amostra por n variáveis areatóriasindependentes (x1 , ... , x ,,)", a"notunaoïru meaia por X , temos que X-p, "/t/" -+ z, {arFp. 223 í11 t i i I t tr i ç'íie s A t rtr ttl xti,r lirn palavras, o teorema gârilnte que pâra n grande a distribuiç.ão da média lrrl, devidamente padroniiada, se comporta segundo um modelo Normal ,,ró,lia 0 e variântia 1. De imediato, podemos notâr a importância do rrlr central do Limite, pois em muitas situações práticas, em que o interesse iif-'ìììì *Jai" "."rtral, o teorema permite que utilizemos a distribuição Normnl ti "*t,,.tn. x probabilisticamente. Pelo teorema temos que quanto maior o il;,';;;- J; ".ori.o, melhor é a aproximação. Estudos, envolvendo simulações, ggtt'ttut que, em muitos au'o', valores de n ao redor de 3O fornecem ipro*i,ì',nçO"s bastante boas para as aplicações práticas' Em casos em que â Grd,',t"iro distribuição dos ãados é simétrica, excelentes aproximações sãlo gbtitlrrs, mesmo com valores de rz inferiores a 30' Para verificar o efeito do tamanho da amostra sobre a distribuição de X, Vfltrros considerar diversos modelos de variáveis aleatórias e vários tamanhos de ãtrr,,stra. Com o auxílio do computador, simulamos a coleta de amostras de um ãet.,r.,.,.rinodo tamanho do modelã escolhido. Repetindo essa coleta um número gflrnrlc de vezes e calculando as correspondentes médias amostrais, podemoS obtrrr um histograma dessas realizações, que ficaria muito próximo da função de ;;;ì;Jiiid"d" d" X. Por exemplo, ii*" um tamanho da amostra e repita a coletn l(x) vezes. como cada amostra fornece uma média amostral, temos 100 médlns rrrrrgstrais observadas e com elas construímos um histograma' E claro que' quetnt6 trririor for a coleta e as repetições, mais aproximado será o histograma, dtt ,i-,,r,aJ" de X. Teremos, então, através dessa simulação, uma idéia de corno X s(j comportaria numa amostra grande e poderemos perceber sua semelhança com ü tlistribuição Normal, conforme assegura o Teorema Central do Limite' NaFiguraT'2,apresentamosumaaplicaçãodoprocedimentodescrito ilcima. procuramos escolhèr modelos bem diferentes de modo a ilustrar a rapidez, Iro sentido do tamanho da amostra, e a qualidade da aproximação' Os modelos cscolhidos foram Uniforme Discreto (1,10)' Binomial (n -- 5, p:0,2), lixponencial (À : 2) e o modelo contínuo definido pela densidade: se0(r14; se4( r15.f("): Ítls\tlz Pode-se observar que' mesmo partindo de distribuição assimétricits, cliscretas ou contínuas, à medida em que o tamanho da amostra cresce' tì ãir,.lUriça" de X vai se aproximando pãra a forma de um modelo Normal. A velocidade da convergência-depende da distribuição inicial, sendo mais rápida nas distribuições simétricas. 224 Cnpítulo 7: Infi'rilnriu Eskttí,rticu - E, Figura 7.2: Efeíto do tamanho da amostra sobre a dístribaíção de x. Exemplo 7.IS: Ílma variável aleatória x assume os valores 3, 6 e g com, respectivamente, probabilidades 0,4; 0,3 e 0,3. uma amostra com 40 obseré^rtorrTu*. A variável_X não rem disrribuição Normal " "b;;;;.;":;ïï;::ï,ffiJfi; amostra grande o suficiente para usar o Teorema Central do Limite. para calcular a probabilidade da média amostral superar o valor 5, temos: P(x > 5): P( x,-,1'!=> fs,+í4,44/40 {4,4m) - P(z > -1'20) :0,8849; com este último resultado obtido da tabela da N(0, 1). tr Exemplo 7.16: Em uma certa cidade, a duração de conversas terefônicas emminutos, originárias de telefones púbricos, segue um modelo Exponencial com Exponencial(a10)J _l lh-.llllllF-r_, Binomial (rl0) Binomial oFl0) Exponencial(F50) Densidade f(r50) - 225 Fl tt r i I t r t i ç'iie t A ttrttsl rul s ro l/3. Observando-se umíì amostra aleatória de 50 dessas chamadas, qual a lrnrbabilidade delas, em média, nãoultrapassârem 1 rnli"9t? rt"pi.t.nr*do por X a dutaçáo 9T :11-ud:t' l"T:: .*,- t:!!'{}:": ,'1,, d, temos que E(X) : 3 e Var(X): 9' Admitindo uma amostra it:rrtctnentegrande,pod"-o,calcularaprobabilidadedesejadadaseguinte vt1\-.) 4-3 P(X < 4) : P(+:i:à < :ffi1 = P(z < 2,36): o,eeoe'@= Jqso rtkr our vista o alto uaior de probabilidade encontrado, podemos dizer que é iciturcnte certo que a média amostral estará abaixo de 4 minutos' tr p: Y +Y, + ... +Y, -v. "qr UniÍbrme (rF50) Binomial (lc50) Exponencial (n=100) Uma aplicação importante do Teorema Central do Limite relaciona-se €gtn ir clistribuição ãu p.oporçao amostral' Recorde que definimos-,1^plT":.ç:: ã;r;;,J ;;"'a fraçãà dìs indivíduos com uma dada característica em uma Êltostt'it de tamanho n, isto é, númerodeindiv.naamostracomdadacaracterístícaP- n ge c0nstruirmos para o z-ésimo indivíduo uma variável aleatória f; tal que ( l, se o indivíduo apresenta a característica;t/ ) 'u - \ 0, caso contrário ; ltotlcmos reescrever a proporção amostral como - \\}44n l,ogo, a proporção amostral nada mais é do que a média d: u?tii]:t: aleatórias ..,,,ìu"ni"-nt"*"nt. definidas. Assumindo que a proporção de indivíduos com a tlircla característica na populaçáo é, p e que os indivíduos são selecionados irlcatoriamente, temos 'qo; yt' "',i, formam uma seqüência de variáveis irlcarórias independentes com ãirtriboição de Bernoulli. Assim, E(Y) : p e .V,rr(Y) : p(I - P). Logo, E(?): utT.*l: o ò:l Assim,! é um estimador não n \r' e var(fi) : var(lil: viciado e consistente Para P. 226 eapftub 7: Inlbrêttrlu Es,kttí,ttirtt . Tendo em vista o Teorema Central do Limite temos quesuficientemente grande, Notamos que a soma das variáveiszfe_xgias/, digamos W : Dïl-ttem disrribuição exara dada por uma Binomid ì#;;il;;", n e p. Deforma, probabilidades, envolvèndo a propárção amostrar, podem ser calculadagmodo exato usando essa distribuiçao. cáso o varor de n seja muito grande, eglprobabilidades darão aislm trabar"ho para serem carculadas L to-u_r" "onu.ni.Jutilizar a aproximação Normal. ,u::*!':.''f,;t\*:^q:: l proporção.de peças rora de especiricação em ?i^ "Í " lZ ^! !: :- T:-uo u -u -u_ u''à, tà ; " ã'"''r' ; rï, ; ïï'"ïi:ï: J :i:jÏï "t:T,:,ï :11 t.:1,".:3: de . peças aereituosls- ;";i;"" 0, 5 0 pode c arcur ada de l?:-" "I1" '.'. b ino'"iuL à ;d;#;"ilï#,:"üilJ: ::: Y l rari ável, aleatóri a represË"r""a" " -"',nÁ";"" ;; il#;na amostra. Claramente, W _ b(80;0,40). Logo, se pp representa aamostral de peças defeituosas, temos que P(ì < 0,50): p(W/80 < 0,50) : p(W < 15) _ +{ /Bo\.: à\"i 1o'no' o'6s30-z: o'8250' considerando agora .a aproximação Normal, temos, como conseqüência doTeorema Central do Limite -' --'^rvu' vvrrrv ? - N(0,40, o' no,t ; o, nor, . Assim, P@ < o,5o) - pç3-!- . / p(r-p) v --;, temos, então, mesmo para uma razo6*el entre as duas respostas. 0,50 - 0.40 . -ffi ): P(z < 7,72) V ----m ' amostra não muito grande, uma ,.1 I t i t t rì h u i çi\e t A nttttl rtt I s 227 ,_ rcÍcios da Seção 7.3: I fltrrn variável de Bernoulli com probabilidade de sucesso p é amostrada, de lìrlrna independente, duas vezes. Apresente a função de probabilidade da ltrétliu amostral. l, 11 ltirnero de divórcios por indivíduo adulto casado, em certa comunidade, foi rrrorlelado pela variável aleatória D, cuja função de probabilidade é' rrllrcsentada a seguir: tlrna amostra, representada por (Dt,Dz), sorteada com dois desses irrtlivíduos e os seguintes estimadores, para a média de divórcios, foram e trttsiderados: 0r : JDõ e frz : máximo - mínimo' Para cada estimador' otrtenha sua distribuição de probabilidade e verifique se é viciado. !. [.lr-na variável aleatória assume quatro valores (-2, -I, 1, 2) com igual plobabilidade. Para uma amostra de tamanho dois, obtenha a distribuição de ,92 e verifique se ele é não viesado para estimar a variância da variável. 4. Coleta-se uma amostra de 10 observações independentes de uma N(2,2), I)etermine a probabilidade de a média amostral: n. Ser inferior a l. b. Ser superior a 2,5. c. Estar entre 0 e 2. 5. Supõe-se que o consumo mensal de água por residência em um certo bairrO poulirtunolem distribuição Normal com média 10 e desvio padrão 2 (em m3), Para uma amostra de 25 dessas residências, qual é a probabilidade de a média amostral não se afastar da verdadeira média por mais de 1 m3? (r. Um fabricante afirma que sua vacina contra gripe imuniza em 807o dos casos. Uma amostra de 25 indivíduos que tomaram a vacina foi sorteada e testes foram feitos para verificar a imunizaçáo ou não desses indivíduos. Se o fabricante estiver correto, qual é a probabilidade da proporção de imunizados rra amostra ser inferior à0,75? E superior à 0,85? ol a proximidade tr ,.E'c 228 Cupítttlo 7: Infi'rêncict Ëstntí,ytittt - Ii, 7. A resistência de vigas de madeira utilizadas na construção está sendo o fornecedor atesta que, em média, cada vigaresiste a-3 tonelJas com despadrão de aproximadamente 2 toneradas. úint" dessas vigas serãopara serem utilizadas numa obra. considerando que é verdãdeira a inf,do fornecedor e supondo que o modelo Normal é ãdequqdo, pergunta_se: a. Qual a probabilidade de uma dessas ) ''t.,.ncleÃc,ì r..us us UIIÌa qessas"tgaE-ytar menos doa. Qual a probabilidade de uma dessas-"rgq tipgtrruí'-"ïo, do quetonelada? b. Qual a probabilidade de 2,5 toneladas? c. Qual a probabilidade em suposição de normalidade as vinte vigas suportarem, em média, pelo (b), considerando agora 40 vigas e sem fazer para os dados. 7 .4 Estímação por Intervalo os estimadores discutidos até aqui são estimadores pontuais,fornecem como estimativa um único varor numérico puru -o'fuïã**o' ïl1liïl:, Pi. r"r."T..variáveis_ aleatórias, os "rti-uããì", -ü;;;'"" distribuição de probabilidade e, levando este fato em consideração, apresentar uma estimativa mais informativa para o parâmetro de interèsse 11]:1,::1 ryoi{ de precisão do valor obtido. Ésse métod" o" árìiÃ"çâülX:lY: i:t e rv a t : d e. c o nfi a n çÍ, .iLq 9.noru, à esti mati vu pon*t ;; Ëffi ;;informações a respeito de sua vãriabilidaàe. Intervalor o" "onrãïçã".il;tdrï ',1, : +#1/v(0,1).o/vn / atrav.és da distribuição amostral de seus estimadores. consideremos, inicialmente, o intervalo de confianç a paru a média 1t deuma certa população Normal, com variância conhecida o2. Supãndo uma amostrade tamanho n dada por (Xr,...,X,), vimos que a -eaiu amostral temdistribuição Normal com a meyq44q a 1_r e variância o2 f n.Assim, -1 \ +\tr Fixado um valorì ta7 tal que 0 < 7 < 1, podemos encontrar umvalor zrlz p(Zl a r.,p)_ .P(_ z-112 { Z < zrlz) : 1. o índice de zrlz apresenta o valor de 7 dividido por 2 uma vez que a ,,massa,' deve ser distribuída iguarmente em tomo de 0 (veja a figura a seguir). '"'uF. '/.'l |ist ittrctção por I trle rvultt 22e) -Zw 0 zvz o valor z1p pode ser obtido da tabela da Normal padrão' localizando o viúor de 7f2 no "orpo da tabela e obtendo o valor 4l'2 nas margens correspondentes. Feito isso, temos o intervalo T_,, - ztlz<Z< z11zè - zt/2a'#1ztlz " o/\/n clue pode ser reescrito como' com coeficiente de conflança'y' é dado UI ; X + 2.,12--f;1. \/ lú' v tal que OOX - 2.,126< t-L < X * zt1z76' Assim, o intervalo de confiança paÍa p, por A interpretação do intervalo de confiança deve ser feita com cuidado' A expressão IC(t+,'y) envolve a quantidade X que é uma.variável aleatória e' portanto, o intervalo obtido tambdm é aleafório. Á probabilidade oue ele contenha o verdadeiro valor da média populacional ;;õãtpìíì:ão aor"iut a amostra' X i;.*-* ã;=, ètonìõ "ò-ntiéïéúo, o, n e z^,12, ó int"tuuto passa a ser numérico' Desta forma, uma interpretação convenienti e a seguinta se obtivermos vórias amostras de mesmo tamanho e, parq c:ada i*o delas' calcularmos os correspondentes intervalos de confiança com coeficiente de confiança 'l' 230 Ctpftulrt 7; ln.li,rêncirt lhttttí,t,tit.tr _ Iilt esperamos que a proporção de intervaros qne corúenh,am o varor de 1.t, sejaa j.O exemplo a seguir ilustra o, .on""ià. discutidos. Exemplo z.1g: suponha que os comprimentos de jacarés adurtos de uma cerrit:;jil"#::;? ).*ï3 ::ï:;* pa","oni*r;;;#ïá"cia iguar a 0,0m2' Irma amostra de dez animais i"i;ïJ;ffüJ::lï:r',ïï,;'JDesejamos uma esrimativa para o po.arn"ìro d"*"aeg/;.""" , uora,ïï^S',lXl Íïlï?:jnr" de probabilidade de Ì é NormaÌ com médie variância oz/tO:0,001.r, poa"l_,o, pro""d., d" for_1.ffi:ïi:iti ff:;ï"iJ,'i:::""j:ïï:::1":ïr^t-3j:iiìu " out". uma estimativa por intervapara p' Isro é, construimos um intervaro ae,"onriann" n;;-;;ïi:3iiffiJïEstabelecendo 7 : gSVo obtemo, Ou tuU"tu da Normal zt/2 : 2s,475 : I,g6.Segue, então, que IC(p,nrr") : 1,69 - 1,96 I,63; I,751. Adotando a interpretação, mencionada. acima,- de que em 100 intervalosconstruídos, 95 conteriam a verdadeira média, " â"" p"a"-J, orr", do intervaròobtido? De modo gerar, o qu" a urruiÀ",rt" conridìraâo é admitir que o intervarode confiança calculado e r- auqu"i".-liuon.,,, isto J, J"ï"ïru- a verdadeiramédia pr. Essa razão expri"u o n""*idade de, atem à" i-n-for_u, o intervalonumérico obtido, fornecei também o índi"€ de confiança que foi ut'izado. trA ampritude do intervaro de confianç a ê,.!.ad,a pela diferença entre oexrremo superior e inferior, isro é, X * ";;i:_"fX:;;'r-:;,tr- ;,;:,fr",o que craramente indica que era depende da confiança 7, do dásvio padrão o e do ':::::;";r::ostra n. É usual '" r"r".i. J" emi-amptitude, ";; o erro envorvido k::::;:":^*jll como a expressão da amplitude é influenciadaseus termo s ." 1."^rj":-1i.os o s aspec r", in," i,i "ol Ë í in ïï *, ;t-ï4ü" * qca-rrqaiq{-eentgmente â nmnlirrrÁ- ,:^ ,-;,-'ì '-' r ':l'11419ì rnarores rem maÌõÌ-podsÌbiliìladg d: ",lc4rf-uÌa -õ ""1affiffi]lffi;il:ï::ï#,ïg:.9,11fËo dã 0 a2,5 metros para a arrura médiaLde indivíduos adultos de uma cidaaei também um fator umeoruidelqlg! importante. Uma H a possib:l-idads_de ''-É 2.t I n 7,.1 1,,'.t' t i tt tttç,ãtt 1tt t r I n lt rwtlt t àlst,r,rciamento dos possíveis valores amqstrqis ep relaç{g !,péc!-ia populacional,. èuj' intervato de õontiança estamos obtendo. Dependendo do seu tamanho n, n êtrr,,stra pode fornecer um valor médio (ro6r) muito influenciado pelos valores 'ex tt'cttros. Com relaçãq- à.-amostra, temos uma clara intuição de que,-Ilg4!-tg 119igr ftrr scu tory.qnhd -uior- seú-4 gggllld-4{q d-9-!l&fn+S1r-o-,45l9_1Í,"-"1' Note que, pelrr expreísao da amplitude, para uma mesma variabilidade o e confiança 'y, Vr,l,,rc, maiores de n piOduzem intervalos menores e, poftanto, mais informatiVOS. pgr'cxemplo, para a-altura média de indivíduos, o intervalo 0 a 2,5 metros é tlrcnos informativo. do que o intervalo I,3 a 1,7 metros' Il.rcntplo 7.19: A, vida média de baterias automotivas de uma certa marca estí gcrrclo estudada. Baseado em estudos similares, com outras marcas' é possível rucluritir que a vida dessas baterias segue a distribuição Normal com desvio padrilo llLr 4,5 meses. De qual tamanho deverá ser a amostra, para que a amplitucle do irrtcrvalo de90vo de confiança para a vida média seja de 3 meses? l'trra calcular o valor de n, consideramos a equação: v/n: o 2 x zr12 t- :3'" vn L,64 (1 : 90Vo) e o :4,5 temos 2 zrpo _ 2 x 1,6_4 x 4,5 : 4t,g2.33 Como o valor de n precisa ser um número inteiro, escolhemos o maior inteiro que contém (4,92)2, obìendo n:25. Dessa forma, a amplitude do intervalo a ser construído seiá ligeiramente menor do que 3 e, portanto, o intervalo será mnis C'om os valores de z-,12: informativo. pelo A aplicação do Teorema Central do Limite permite a obtenção dc iltervalos de confianç a para P, guando a distribuição das variáveis aleatórias' que constituem a amostra, não segue um modelo Normal. Neste caso, o intervalg construído terá um coeficiente de confianç a aproximadamente igual a 7, sendo que esta aproximação melhora à medida que aumenta o tamanho da amostra' Exemplo 7.20: IJmprovedor de acesso à Internet está monitorando a duraçãto do tempo das conexões de seus clientes' com o objetivo de dimensionar seus ecluipamentos. São desconhecidas a média e a distribuição de probabilidade desse tempo, mas o desvio padrão, por analogia a outros serviços, é considerado igual a 'Áõ' -inuro.. um; ou."ruuao J;;;;l amostra de 5oo rrtos. o qu" ;;".";;u;onexões resultou num valor - o tempo de drrranã^ ,r^^ , - :rdadeira média' com confiançê ::*::'"".ïiiÏï"if :raçãod.as"on"*u",*o-.;';ffi ffi ":ÏÏapricaçao a; ï;#il""Ë;HïT"'ïiii:T,g, u"'" i"-"JiÍu u;au"r e bportanto, será bastan Normar. Na verdade .te razoáve7 ro,ïï. ;," tamanho da amostra é iguar a basranre boa. , com esse ,;il"ìr"l#Lir#irïï,,rï:r;j:.:,j: Exemplo 7,21: Pteteníle-co o^+i - t'Lvvwtvdo p' certo medicamento tende_se estimar a prr do verme da "r":ï.1o"n,;;.oï,*ilfloreao p de cura' atralés do uso de uft ,n.ai"um"-n,"-ï*")lï'ïïï:f l*1#ïr.'*ïJ"ïi"1ïéumaJ^t"'"ïilroram",yoì'. ôïápoo.ro. dizer daoro]-o' uo u"uìJ, "";ï:;'' em aplicar o Uma estimz ff HiÉ"i{:*=tr#**:*fiffifr ,#í'**ffi Nestes termc média o" "À0" ã" ilL,i#,::ïï:::ïï:.conrianÇa aproximado de e2vo, rC( t',s2qo) - [* - r,r5 ; X + rr1rfi] - [rr-,,rrffi ;25 +r,rrffi - [24,48;25,55]. Ior" nu"^, em virtude do uso do Teorema Cenrror r^ r :com coericiente de conri ^n^-"0ì"ììã)l|rr";ï:ii:-timire, obtemos um inComo outro r . on. id"ru. in t-"r;;:;: "Ittol^o de apl i c anto_l,o Teorema cen trar do Limi te,Evo*^r^ q ^a _ ue conÌrança para a proporção p. ? -N(p,e(t:e)r. n :::ï,'#Ïrï:"ï*i""* ràra a", no mínimo, -y. Lembrando que a variância de --. 2.?.r rc(p, esvo)' p - r,rur[@;? + t,eo : [o,s - r,rurlry;0,8 * 1,e6 1o(: òt tl - " I Notequenestecaso,comopédesconhecido,ointervaloaindanãopodeser citlculadodiretamentepoisenvolveumaquantidadedesconhecidadentrodaraiz quadrada. Uma possível solução é substituirmos p(1 - p) t)essa forma, estamos utiiizando a estimativa pontual parâmetro desconhecido p' O intervalo será: rcr(p ,e'vo): [o,a- ,,nu1ff;o,B+ 1,e6 : 10,745;0,855 ]' outra abordagem possível é baseada no fato que a expressão p(L - p) t"T valor máximo igual ít1A',quando 0 < p í 1' Verifique essa afirmação' fazendo o gráfico da função pçt'-. ei,"o.* I :itiJo de 0 a 1' Nesse caso' podemos obter u'i int"ruuto de tonfiànça substituindo p(l - p) por Ll4: rcz(p,elvo): Io,a -',nuffi; o'8* ''nuffi1 Iis I i rrtttçãt t Ptt r I rrl c rwilo im, um intervalo de confiança rnto zrlz: 1,96) é dado Por: com coeficiente aproximado 7 : 0,95 (e por ìou"(l - fioa). obtida no lugar do : [0,731; 0,8691. Note que este intervalo tem amplitude maior que IC1' Temos, portanto, duás alternativas- para o cál1ulo f lt:*::-* "onriurrçuffi'o."o nri;;ira, dada por IC1, é úsualmente denominada abordagem ^Lr:,Á^ ^.tÁ "..finienfêrnêntê"],1*',ïì1,'Ëi; ;;;"" da crença qu? u. estimativa ::ttdl' ::t? *t""':::tr1Ï: "r:;Ki#;^iïìJ#;"ì'"i""'i*"'"dT,1ï::ï(!:?)t"Í::i;:,ïyi*: Ë'.ï iï :" "?) I ;.' t ; i ;;; I "91ï,": ^ " :.t";1'^* ""ï .l* ; i,ïï:ï H ï1ilïï:ff ; ur'l rïr rri, t"r, n"t' p'efúmos substituir a Ït"::t:ï:.ì:*^l:t "iÏffitr#"""*J;;;; ï,i" : rear',Assim' ":'1:::^-:ï :,::"ï'31*"1ï" ol D p(t - p)t -. ) 0,8 x 0,2 1 I200 I 7', um estimador é ul conservativa ""ilïi"i;ï'ff ,f" ffi g lli'.lo: ao u ri r izarrmaror ampÌitude do i c on fi an ç a oil;;. ln t"'uu o ã" lldïr:ïË;:;: *:lffi ï: ffiNa Tabela 7. capíturo. Intervalos 1^'ol::"":"mos urn resumo dos inrervalos s:::r*;,*lï*ï*iïl_i,,::n#:.t&ü,*ïï"+ï;ïïiïïtj Exercícios da Seção 7.4: l. Por.analogia a produtos similares, o temno rto n^^^=- ,pode ser consiàerado ""r;;;;;;;j|To" de reação de umo z, rinuto, iì. n,,uoiu é desconhe.l',11iey.úãl;"J""r' novo medicamentoreceberam o mer f":" l "; ; "; ;;,: ïffi r#, : J,:.ilïï ={lii I Uï: i fudj4,8; 5,7; 5,g: 5- confiançaou.uo',0^*1'q' ï:ü'ï,I,'í,à,t'ï',trt'Jti:rt'ti:"1:l:1*;,:,::r;i;ì ' ïïiffili#;#ï;::iï:,':il; i;;,':.," ";":. ::e 95vo para a.eaÏ' d" 8.' construa intt 3.serácoreradau"'u,uooou,*i"r"i.ï".""ïlJ:ï.:;#"i;:lï:: j|ff;;;;;:;Z:; u q. pu.u uï"";;iÏ::'ra.de uma população Normat com de ;:l;i*,Uf Xiï';l;li:;;"f 'l::^'""';õ';;ï;ÏiiÏï:,'"'Hrente-as difer;;;;:.'"t casos em que o tamantr" o" "r""ro" e Tabela 7.2: Intervalo, s de confiançapara pe p. .qTF 1 I t,'t r't't'io,y 2.r5 * llttrir iÌrÌ.ìostra ern 100 ciclaclcs lrrasileiras, de até 20 mil habitantes, indicou que n vltltlr médio da hora aula para os professores do ensino fundarnental õrn rscolar mr:nicipais é de R$ 2,5. obtenha um intervalo de confiança paril o vrtlol' tnédio nacional da hora aula em cidades do tipo mencionaclo. nascnclo t'rrr cstudos anteriores, o desvio padrão é assumido ser igual a R$ l,l, use '1' - 0,95. t. Nurna pesquisa com 50 eÌeitores, o candidato José João obteve 0,34 cla lrrcíbrência dos eleitores. construa, para a confiança 94vo, os intcrvalos olirnista e conservador de confiança para a proporção de votos a screnì lcccbidos pelo candidato mencionado, supondo que a eleição fossc ncsse lììolnento. 7.5 Bxercícios l. lÌrlam sorteadas 20 escolas de ensino fundamental da rede privada, na cicllcte clc São Paulo e observado o número classes de la. série em cada uma clclas, Os rcsultados foram: 2, 3, 3, 4, 3, 2, I, Z, 3, 2, 3, 4, 5, 4, Z, 4, S, 5, l, e 2. Dcsejn. , sc estimar o número médio de classes nesse tipo de escola, com vistas u irnr í'uturo levantamento de disponibilidade de vagas. Obtenha as estinrativus correspondentes aos seguintes estimadores propostos: Êr : mediana amostral; frz: moda amostral; I,IJ: à . Tendo em vista o objetivo pretendido, discuta as vantagens de cada r.rm clclcs, 2. O Conselho Regional de Odontologia recomenda visitas periódicas ao dentista e, para orientar sua campanha de divulgação, realìzou uma pesquisa corn 100 crianças com idades de 12 a 14 anos. Quanto ao número de visitas no últinro ano, a amostra resultou em uma média de 0,5 e mediana e moda iguais a 0. Com base nesses dados comente as afirmações abaixo. a. A maioria não visitou o dentista no último ano. b. Metade da população dessas crianças nunca foi ao dentista. c. No último 0,5 ano as crianças tiveram em média I visita. d. Talvez algumas crianças tenham feito mais de uma visita no último ano. Capftuta 7: I4ferêncla Eshilrricu - 3. Um grupo de 15 al fefruis.a sobre o T,9.:1" curso de Vererindria Íbi sorreado eË:iïï:HÍxï::*:i:.Ji:,,ï,;,;il;ï,:ï:ïïïlJqïì:ïïH,: "ïf"* avariânciasegundo os esrimador.rl, ,, r, 3, 2 e ãl : @ediana -d: (.;;;ï" --,ïï,ïtr' rì!:sz:{ÉGá, o' ^;H";ffi1;ïÍ: Ii :::l* : ;; il*ï:::::":!*;mli",:*":,,1*r:*ii""?ffiï:iï::::,i:5. Estatísticas do Dena rtq,-o^,^ , :--" wrrrrlrôl'amédiade x. o" moto-ti'"t" #-:i:mento de Trânsit oseguinteriã"t;;'oo""oïf ::"mi;l?ïÏ::.ïil|ïilH:irï* o l.::rlle_ a probabiridade de a médi- uragrama). uma b(2;0,3) ser rnferior à I. a amostral de 3 obser 7. sendo x uma;",:ï:: I -' sv J u,servações arearórjas de ,, " r,"irïál;:ffi,',,'.'":ïi;:;í*ïH,li;l*" uma amosra de ramanho8. Uma amostra de listados abaixo. n1l:t oot"tvações da i?t"ht:ix:trËúl1iïï";ïffi i'ãrr"':'f'";ïff ,rÍ,:ï::ïïb.XéBernouilic c.XéBinomiaÌcr 9. para uma Norma , ,o*' : 3 " P: o'5' ". pff!;;;:' 15, 10) colerou-se uma arnosrra de ramanho 25. calcuÌe: qF \ l')t'r'trk'io,r' b.t,(4,s<X<tr,11;, t. Ir(X { 4,T ou Ì > 5,1), l(1. lim l0 observações de uma variável seguindo o modeloNormal corn rnéctiu 3 c dcsvio padrão 2, qual será a probabilidade de a média amostral: :r. Ser superior a 1,5? b. Ser inferior a 0? c. Não se afastar da verdadeira média por mais de I unidade? I l. Trinta observações de uma Normal com média p e variância 36 são colctaclas, a. Calcule P(lX - pl < :) lr. Determine o valor de a tal que P(lX - pl > c) - 0,g. 12. Sendo a variável amostrada uma Normal de média p e variância 25, obtenht cl vaf or de P(lx - pl < z) nos casos de tamanho da amosrra igual a 2,20 c 60, Comente os resultados obtidos. 13. considere uma amostra de tamanho 30 de uma população Normal cle nrécliu p, e variância o2. Derermine p(lX - pl < r) nos casos em que o2é igunl u ló, 64 e 100. Qual a conclusão? 14. A duração do "tonner" de uma máquina de fotocópias pode ser moclelndo como Normal com média 15 e desvio padrão 2 (em milhares de cópias), pura uma amostra de 12 fotocopiadoras a duração do "tonner" será observncln g pergunta-se a probabilidade de, em média, durar: a. Menos de 16 mil cópias? b. Mais de 13 mil cópias? c. Entre 12 e 14 mil cópias? 15. uma máquina enche pacotes de café com um peso que se comporta como umir variável aleatória Normal de média 200 gramas e desvio padrão I0 grarnas. Uma amostra de 25 pacotes é sorteada e pergunta-se: a. Qual é o número esperado de pacotes da amostra com peso inferior a 205 gramas? b. Qual é a probabilidade de que o peso total dos pacotes da amostra rriro exceda 5125 gramas? 16. Para se ajustar a uma máquina, a correia deve ter entre 60 e 62 cm clc comprimento. Tendo em vista o processo de fabricação, o comprimento dcssas comeias pode ser considerado como uma variável aleatória cãm distr.ibuiçÍio Normal de média 60,7 cme desvio padrão 0,8 cm. pergunta-se: 238 fnpilulo 7; lnlt,rirtt,irt li,yttttl.t,tit,tt _ Ii. "' lïït ï"t#babilidade de uma correia' escothicJa ao acaso, poder ser b. Um i:,11r1.T::T:o_or,o"^ïu: coneias esrabelece um conrrote de ffi :' :i',n:" :#,tj: j l' *:::' " r " ;" ;;; ; ;;;;.ï' ïff : ï ï:.Jflã f ;; " ï" "" ff ï,t"':T:l l",TÍj' : f i r "ãïï* ;" ïï " ì #.iï: ""::, il' i tr.,i;i,"ïï:,;:::,"":::1:i::i,_" de uma ,ffitoria x com disrribu *:::l :: "ï:: : ï: ";, 1i.,: " " " ;; ; ï;' ; ô:' ôï'ï:ï* J: ï,ï#'"'ilw l.rrnilnnoffi,"ï,r::i,lïl;jïlo:?? o: probabilidad", u Àédiu urno,ú,não difiramédia da população por mais de ã unidades? 18. Seja X-N(p,,36). a'Para uma amostra rre tamanho 50, obtivemos média amostral 1g,5. co ^;1ïY,1""'::ï:,:"ri","ç2.s-rvo,ó;%;;;%';;."u"f, o""'o,'o' b' para uma confian ça de 94vo, """.,-ì'.í;;"ï;. ï" "onfiunça supondo trêrtamanhos de amostra 25,50 e 100 (admita que ,"J* i"-"ceram a mesmÂmédia amostral igual a lg,5). c. Comente sobre a precisão dos intervalos construídos em (a) e (b). 19.Interprete e comente as afirmações abaixo: "' niÍjide sarário iniciar pu.u r".e- formados em Economia esrá enrre 7 e b. "euanro dilï"":fr::i:ïi^^!-,1"?oi,^3ior é, aprobab'idade da médiaamostral estar próxima aa verOaaeira médiar,. ,0.ilifi,r#0"",f:,1ïïti1,ï:,1,:ll:ll",coresterol é uma variâvetalearória comÍlïï:Jf::T:ï*i:T:iT.1ï;;hJd"";;;#i:iï,iii-i;, ". :ïï,ïï"ïii ï: "1:.1,^,11, "* ; Ëd ffi;ï:l #Ëiï3e c o, e s tero, S: lSt"lqlll, c on stru a o i nterval o d; ã"iü; o J'r,;A :b. Se você desejasse diminuir " "_pfl,rã" à" irntervalo encontrado em a), quaisseriam suas alternativas? ,t;"ï""ï;ïi:"0;,:ïo::,,:.:i u. :.u, variâvet areatória com parâmerrosi:ff#ï j:, j r :: "':*:::v' "r : :r ;rd'* ; ; ï'i' :J: ï*'ffi :i:ï *?:ïïJ.ï1T:"i"""ï:::::ï"-::'iã.!;"ï;iï;;'i'3ï:áïi?,"""*": lïï:ïtr"::ï:::j"_"^ j:i,umomédior;;;ï,:i,lá,ïi,;íï'."ï jfiïïff.ì :ut:1l9veis desse modelo e observa_", ;;;;tiJ"r".a. Quem seria um estimador Oo "on*.à médio paradesse tipo? ì todos os automóveis --- ,{+Fs 2iq1 lt ti'tt'ít'itt,r h. Sc a arl-ìostra Íbrnccctt uln consumo médio dc 9,3 krn/l, construiÌ tllìì irrtcr.v0lo cle confianç d (94Vo) para a média de consumo desses cal'ros. r.. sc a arnplitude de um intervalo de confiança, construído a partir clessu atììostra, ó de 1,5; qual teria sido o coeficiente de confiança? !2. ( ) irrtcrv .aJo 135,21; 35,gg), com confian ça 957o foi construído a partir de uttra iilrìostra de tamanho 100, para a média p de uma população Normal cotlt rlcsvio padrão igual a 2. r. Qual o valor encontrado para a média dessa amostra? ll. Sc r-rtilizássemos essa mesma amostra, mas uma confiança de 900/o, qutl seria o novo intervalo de confiança? 2.ì. A dosagem de certa substância no sangue segue distribuição Normal corrr rrródia pr e desvio padrão l5 mg/I. se uma amostra de tamanho 25 fot colctaclu, clctermine: l. A probabilidade de lX - pl ser inferior a 5' lr. O ìntervalo para É, com confiança 98Vo, se temos Í otts= 98 mg/l' 2.1. Uma amostra de trinta dias do número de ocorrências policiais em um ccrto bairro de são Paulo, apresentou os seguintes resultados: '7,I1,8,9, 10, 14,6, B, 8,7, 8, 10, 10, 14,12,14, 12,g, r1,13,13, B, 6, 8, 13, 10, 14' 5' 14 c l0' a. Fazendo as suposições devidas, construa um intervalo de confiança pilrü n proporção de ãias violentos (com pelo menos 12 ocorrências). Use os dois enfoques e a confiança de 887o' b.Emu-ono(360dias)ecomamesmaconfiançadeBsTo,qualscriau estimativa do número de dias violentos nesse bairro2 c. Dê uma interpretação para os intervalos encontrados em (a)' 25. Antes de uma eleição , um determinado partido está interessado em estirnar u probabilidade p de eleitores favoráveis ao seu candidato. uma amostra piloto de tamanho 100 revelou que 60Vo dos eleitores eram favoráveis ao candidatO' a. Utilizando a informação da amostra piloto, determine o tamanho da amostra para que, com 0,g dá probabilidade, o erro cometido na estimação seja uo miximo 0,05. b. Se na amostra final, com o tamanho obtido em (a), observou-se que 5l% cltls eleitores eram favoráveis ao candidato, construa um intervalo de confiança para p. com confiança957o. 26. A análise de ocorrência de um mineral numa região é uma variável aleatória com média 4 e variânci a 312. A unidade de medida é porcentagem de mineral por unidade de volume' Para uma amostra de tamanho 20: 24Õ fnpltulo 7; ln.f'er?ncltt li,rttttí,t,ticrt - Ils a. Que dizer da distribuição de X? b. Que tamanho deveria ter a amostra para que p(8,5 < X < 4,5) : 9,96727'? tempo de reação de uma pessoa a certadroga é considerado uma varlraleatória com média 5 minutos e desvio padrão 3 -i;";;;. Esse tempomedido em uma amostra de g0 pessou, "raolhidus, sern reoosicão na eirnrisão paulo. r"rg,rn,u-r;;;"ilffilff: ;'":"'t'tas' seïr reposição, na cidade a. O tempo médio amostral ser inferior a#b. o tempo médio na amostra não diferir da verdadeira média por mais de 0, 28' o comprimento de certo tipo de eixo, produzi.do pela empresa Duroaço, :ï:"t""^nj::,:l1l'::t:9: n"ni para peça. A tei de pron"uirìá"ãe ;*#; :"ì?: ::;'"n"iï: ",: : 1".: : on I "" i g u., p órém admi," _, " qu " o ã;;;il ;ffi; Ë:ï::ll::: uT1. uTo:tr_a ateatórii a" róô -ã",*J"ãr.^";;"dJ;;comprimento médio de 4,52 milímetros. a. Construa um intervalo, com confiança 90Vo, desses eixos fabricados pela Durooçà. o. ?.:^r:l_11::ïï"nuo lur? o intervalo encontrado. Será que podemos di ::: ", 1il:.valo. enconrrado em (a) tem probabilidade ;ïíü;'"*";verdadeira média? 29' Numa pesquisa de mercado, desejamos estimar a proporção de pessoascompram o sabonete Bom_cheiro. ". 3.ï:j:f::*j::f::: fevem3s.cylher para que, com probabilidade 0,e; b. c. estimativa não se desvie do verdadei.o uuior;";"i;;;ï;ïi Se tivermos a informação adicional de que a aceitação do sabonete ,Bon.cheiro é no mínimo 0,g, qual deve ser entâo o tamanho da amostra?Decidimos colher uma amostra de tamanho g1. eual o erro máximo quecometemos com probabilidade 0,9? pata a média do compri d' Para a amostra de tamanho gl, qual a probabilidade de que o erro máximoseja 0,08? 30. ,iï::1"::-: :?:ti:: Llolajstriluição Bernouni de parâmetro p. uma 1ï"ï*:tatória.de tamanho 2 é retiradacom o qúj"ìr"ã ã"^;;;,_u, '^ r;rï;, 1ï,j;"?*":ï1T:g"l:,lo,proposros: fr,= i" "-' i,=-0,ã Xr * 0,2 xzl.obtenha a.distribuição amostralìesses estimador", "-'ií"nrã o" il ;Í;,ïsuas propriedades. 31. Sendo X- b(n: I},p: 0,5),pergunta_se: ì a' Para uma amostra de 2 observações dessa variável quar é,a probabilidade damédia amostral ser superior a 9? Justifique. '-t 5 I: r,'r, ti'lrr,r 241 h. l,ru'l Llrno amostra clc 1(X) obscrvações dessa variável qual é a probabilidade rlir rnóclia amostral ser supcrior a 4,72 Justifique' l,lrr.il cstimar a média das alturas (em metros) numa certa população, dois irrstitutos de pesquisa coletaram cada um a sua amostl'a e usaram estimadores rliÍcrontes. Os resultados estão na tabela abaixo: Tamanho Estimador Valor Observado lnstituto I nr :100 frt:X l-,68 lnstituto 2 nz:200 fir:(mar+mi.n)12 I,73 Núm. de viagens 0-2 0-1. e e+r 0+2 Probab. 0,1 0,2 0,2 0,4 0,1 Aprcsente justificativas ao responder as questões abaixo: rr. Você acha que o valor 1,73 está mais perto da verdadeira média por teÍ vindo de uma amostra maior? lr. A verdadeira média deve estar no intervalo 1,68 até 1',73? t'. lnclique qual das estimativas você preferiria usar' t-1.()tempodeemissãodeextratos,emsegundos,pelocaixaeletrônicodeum banco foi modelado segundo uma distribuição Exponencial com paÍâmetfo ll40.Parauma amostra aleatória de 50 clientes que solicitaram extratos: lu. Qual a probabilidade do segundo cliente sorteado na amostra demorar muis de 30 segundos na sua solicitação? ll. Determine a probabilidade de que o intervalo médio de emissão, entfc os clientes amostrados, seja inferior a 35 segundos? .ì.t. O tempo de espera, em minutos, na fila de votação numa certa zona eleitot'Ul com urna eletrônica, foi modelado segundo uma distribuição uniforrnc Contínua com valores entre 0 e 30. Para uma amostra aleatória de 100 eleitores, resPonda: a. Qual a probabilidade do último eleitor na amostra demorar mais dc 20 minutos? b.QualaprobabilidadedamédiadaamostraserinferioralSminutos? c. Você deseja pedir a um amigo que espere um tempo t pata lhe dar umtt carona. usando a média da amostra, qual deve ser o valor de t para niict perder a carona com probabilidade 0,8? 35. Admita que o número de viagens ao exterior é uma variável aleatória, com iì distribuição abaixo, sendo que o valor de I depende da profissão exercida' 0 € {2,3,4, ...}. z42fl EnpftuIo 7: In,ferênritt Fl,rtttt(ltlittt . ïfi ,i":ï:11::::",1?9u"-,:,,isroé,"b;;;''õíi":,::::t:;Verifique quantos deles contêm a verdadeira média. 3ffi:::Ïi3;Ji,illïi::l:"'-"ïT'nte' indicou qug rez 4 viagens ao r í)rroio oã^ ^^ ___r maçao, responda as questões abaixo:a. euais são os uut-"r_1:-rri;;t, J" d p*;;ffi,ìrXïffinoiurauob' Dê uma estimariva para o varor oe à. hoique o critério utirizado.tor:Yir""""r"iiliiÍ"ï?f""rï.oobjetivodesimutara{istribuieãoamosrrÂr Gò òçËur'Les laretas: ì r:- a' Gere 100 amosfas de ramanho 30 de uryaì{-orl com média 200 epadrão 5. Calcule, então, ^ ^áiâ- Ëcorrespondenfe à es.o na-i,...r^ , , ,:udu amostra e faça o histco'espondenre à esse .conjunro oe meoias*J,,iilï:: il1t:J.il:lïiïlï"jï:":*:1"^:*au. a",",i,iualã;. 100 médias obtidas e comê,b' Repita o item (a) paraas amosrras ,","0ï"0:ï"#ï,ï:#iii;;:ili. ffijffi í^ir?Íi:"Í:ï*.u ïfeito do hisrosrama e das meddescririvas obridas, t"nao "- uir; ; ïffi;;Ë"ï',.",ï:ïïJ,j"r ruuu 37' (use o computador) para estudar o comportamento do estimador,s2, gere ü;i::ff:.]ï"jïl;*ï 3?,,!:.ïlu-,u^lonenciar de parâmerro r/5. Em crlïï,ïlï;jÍï:l;;ï,''ativa de s, òo_ u, H ",ï#,Ïïlï"íi;*ï,j variância do modelo;ffi.XÏeama para comparar esses resulrados cor 38' (use o computador) considere os dados apresentados no arquiv o aeu, ::ïJffi:ï'i" lf,,::^^::r,t:,g rlnf_ representam uma amosrracomunidades de baixa rendaïo nur'í,alii Ëff::ïiïr:H"rïï;estimativas, da média a a" ""rã".ìï ãvaríáveis: Idade, i"Àporp, Resid e Renda. :ssa população para as s 7:,;:;::::';l;ri )iÍT" .i"ï,::!:::',ao djdátiy e não prática, poisv e r d a d e i r a m é d i a n ã o fa a s e n t i d o c a t c i t a r *, ": *iïi, ; r:::rr:;:; :, í; rX Ji,tr.ÍYfr"ï,ïïfïr:iiïÌ_1,-11". a coreta de 80 observações deïï"ï113;,ï*:','*i"-t'r';'i;.;õil"ïi'ffi ;;,1"^ uma 40' (use o computador) Gere 200 observações do modelo uniforme contínuo10,201' consrrua um inrervaro a" """ï""ç ag*vopuru u Leãia. Repetindo 120vezes esse procedimento, quantos intervaros .ont"rao -u-i"roua"i ra média?Comenre os resulrado. " ";;;;i*", àr"r. H. 243 '- pÍtulo 8 fcrência Estatística - Testes de Hipóteses ã,1 Introdução Apresentaremos, neste capítulo, um dos principais tópicos da Inferência Estrrtística conhecido como teste de hipóteses. Motivamos conceitualmente t téclricl através de dois exemplos que ilustram sua utilidade e o tipo de questões qur: procura responder. E.tttmplo 8.1.. Suponha que, entre pessoas sadias, a concentração de certn ãuhstância no sangue se comporta segundo um modelo Normal com média l4 ttnirllcles/ml e desvio padrão 6 unidades/ml. Pessoas sofrendo de uma doençO crpccílica têm a concentração média da substância alterada para 18 unidades/ml' Arlrlitimos que o modelo Normal, com desvio padrão 6 unidades/ml, continun l,r"rllrcsentando de forma adequada a concentração da substância em pessoas cgm fl rlocnçâ. A figura a seguir ilustra a situação descrita' Note que as curvas, representando as concentrações, irão se cruzaf em algUnt rnomento, fazendo com que uma certa proporção de indivíduos na população sadia possa apresentar valores de concentração tão altos quanto aqueles observados para pessoas doentes, ainda que este evento ocorra com .baiXa probabilidade. Sadio \ conhecendo média. Repita de confiança, 244 Capílulo 8: Ittlrrêrtcitt li,rttttl.rtiut; ,l,t,,t,ta,r tle I Desejamos averiguar se um certo tratamento, proposto para comb ,Xï,ïft í "ï:::;"ïT, :11,1j1 "tajó;;; g" raman h o n : 30 é ser ec i o n ad aindivíduos doentes que roram ."b;;;;'ï:"ïL1#;,ï ï:HïffïXï"uJconcentrações dos indivíduos da amostra po, Xr, . ,r;;. Suu"oq, que !i : 1,2,... ,80, remos xn -_N@,ãâ),"r"ï* tt.: 14 ou 1" :18 dopèndendo ::,:::::1-1::rï1"n,",:u nao. òuro í aJostra de 30 valores fornc"o 'a,^- *rd e c o n c en rraç ã; ;ï; ï :;# ;": ï: i .ïï::ii "," "r"?.#: i: ï ::ïil;iKïÍ;iïi; ".:, l"ï ï::il:,llJl u"i" " ffi,; : fi ï un i dades/m rrevelaria crer que o tratamento up."rlíu" ,íJ,"JiÏ:;,,ï?ulÏ::0f;ll"#'r: #ïïïÏ jni::::*::^"'*10,'y'.**, poo"- ser vistos como membrospopulação com concen tracão ---i-r^']lvò Puuçr, scr vlstos como membros ffi"firií j:ïTïïïïË"itdl".i-Çi!,i,!li;;tln*:,ïï?i,,.ï;"próximo " dependè, entre ouìros ruto."r, ";;":::i::;:;^oiï"t'" signirica ^;xiiil; jiT:, : :ï::ï,i j: : o l"ãi,ï,s é ar e at óri ", n."",ï ïlJ.,ïï','"jÍ,ïprobabitisticamenre o,prúrema, " ;;;'.';ïì.;J';i:ï:ï ffïJ:ïï:ï:ilildenominada kstu de iipór"r", o";"; *ua,o "o* ,orrariio ,orh"rido eobjeto de discussão na Sàção g.2'. ' -' "' ,to "l"trôni"o Jil ffi ï j:" 1 ;'0,:,',ï"f l';;:l'ï : * ^ i:,::, ";r;1;{'ï# ïe rabric aç ão d oequipamenro, é possíver.admitir il;; n-lJo*J"áJïïïiffi ,ï"" ::ï:',ïr,ï,rï;é' após cada impacto, exisre "-";;;úãiriouo" p o" q* ;;;,h". Representandopor X a variâvel aleatória "ri*"r, ã""i_pactos anteriores à falha, pretende_se liï'"ï se o modero ceométric; ;,^;: ;,';;ï;;;:;ïr:'r:l^caracterizar essa A decisão que precisamos tomar é, aceitarou não o modero sugerido. Noteque não é um simples varor a" pu;-"t.o que está sendo festado, mas sim aadequação ou não de uma função O" p.oOuOiliOuO.. Nossa conclusão r"rá uur"áJu-no. uutores amostrados da variável deinteresse' Neste exemplo, foram er"Jrrioor, ao acaso, g0 e ;:ff jï:iït?rï ; sucessivos i'npuao, rermo-erérri"o, *unïnifiiâtij,"oïl rjiiiïi,,Ë*Í:ri" j,ï:.,í{ï:,;#:ïï::ïó**Jï*:ïã.",# observados,o*;;'"xïi,H:Hi",'"ïj,ïr!ì-';r1,;;;ïï,â"ïJ*1ï',"Hïiï grupo de varores) e :uas respecrivas freqüências ;" ;;;rrê";ãr. podemos criar,;ffi;:lilllïïl?ï;,um càrto ";.;;;;" "ut"guã,ï;;;; contendo um ou 'q-n I Itrlttxlttç'ãtt rrssociado à decisão. Vútu."-ot a esse problema na Seção 8.5' tr i.unrport", coletivos acha que a n91tu{idad9 é puito 1Tp::tun'" e pretende etrtrr k sendo o total de categorias a o4 c ei, respectivamente, a freqüência obsr:rvada na amostra e a freqúência esperada da categoria i' Note que valores õ_,i,"*r-a" e, inai"um que ò modelo pode ser adequado aos dados. Por outro ïrrr.lu, uulor", uti-u de um certo ponto crítico q" d?u?T.levar à decisão de rejeitar ' rrrodelo. A determinação de q"ìepende da distribuiçáo d2Q2 e do possível erto I 245 jScomodeloGeométricofosseverdadeiro,deveríamoster,paracada ïêlor rl'Ì variável x, a freqüência observada não muito diferente daquela que seria gÃi.,,t,,r'tn através da distribuição Geométrica que-é denominad? I::T::': ãï1,,,,r,rtr,. Devido às aleatoriedaães envolvidas, poderão ocorrer pequenos desvios ã-iri',,t,, assim o modelo ser adequado. Portanto, vamos decidir pela aceitação ou Fão tla clistribuição Geométricá, avaliando a "distância" entre as freqüências ãrp"ru,tn,, e obseivadas. para avaliar essa distância, consideramos a quantidade elerrrtiria não negativa Q2 dada pela expressão n,: i(o'::L, ' i:l Os exemplos acima apresentam duas situações típicas de teste do 5ipóteses. No Exemplo 8.1, o teite se refere à média populacional, enquanto que ,,,, e^",''pto g.2, aãecisão é a respeito da função de probabilidade. Apesar de ostarem em diferentes contextos, o irocedimento conceitual do teste é similar' Na próxima seção, vamos apresentar a estrutura geral dessa técnica' Ilxercícios da Seção 8.1: l. Identifique as hipóteses que estão sendo testadas em cada caso' ". e à*purrnìu de tànsporte afirma que, em média, o intervalo entre sucessivos ônibus e oe ts minutos. uma associação de usuários de transportes coletivos acha que a pontualidade é murto lmport testar a afirmação da companh ia. Lv " ,1-' p13.,<1,y4 tl"+ 45 ,il \ 1r ì' ,\ !, ,),b. os amortecedores de automóveis que circulam em cidades duram em média 30 mil quilômetros, segundó informação de al8umas.. ofici1al, ' especializadàs. Um proprietário de automóvel deseja testar essa atlrmÍìçiÌo' r' c. um veterinário "onr"goi., ganho médio diário de 3 litros de leite por v4cit com uma rrouu "o-pãsiçaã de raçáo. um pecuarista acredita que o ganho não é tão grande utti-. ,U" = Za-rr-J'rlL' 11- '':l' 3 2.Garrafasdecervejadeveriamconter600mlporémexistemflutuações -- "r""ià.i"s. os órgãás de fiscalização permitem oscilações e entendem esse 3. t:_ __ 246 Y assim. Você poderia ajudáJos e indicar co;"'';;;,,q. "'il'#";4. Deseja-se verificar se o número de falhas procedimento para ãecidir robr" -ur"it;õï ;r; # #3ij ïïr:::::t. ::,i"*:Yï":*T^:-11:1" g" uma moeda, são feiros 100 lançamentos d ïÍTr:"0"^ ïs é contado. Aceita_se oequitíbrio da moeda ,"'ffi:ii: eficiência do critério. uurslu(Js gn ï;:? lïiÌ:.j.il" conrrário, a moeda é consideraau ui.tuou. Discuta .--- ?'l'rrt,' l)(tr(t (t Médkr Pttpultu'lrtnttl 247 lrlirrlc a iD. em qualquer uma das :lrrsõcs discutidas acima: decisões. A figura, a seguir, resume fls É importante ter em mente que, para a argumentação anterior ficnr eO'rpleta, pr"iiru*o, determinar o valor r" e quantificar os erros associados às purrfu"ir conclusões. Observe que, sendo X uma variável aleatória, corremos o lis.,, de concluir incorretamente que o tratamento é eftcaz' Ou, de mOdO rcç,íproco, decidir que o tratamento não é eficiente quando ele é. Portanto, ó neccssário estudar e quantificar os possíveis erros associados à decisão tomada' As duas hipóieses sobre a eficácia do tratamento são denotadas por .Fí,, e 11,,. e, usualmente, denominadas hipótese nula e hipótese alternativa, t'cspectivamente. Assim, Ho : O tratamento náo ê eficaz; Ho : O tratamento é eficaz. Iìssas hipóteses coÍrespondem aos diferentes valores do parâmetÍo p et assim, , podemos reescrevê-las como: Ho : lJ : 18 versus Ho, : 11" : 14. Ashipótesesdelrnrclq4afolmaagima,semconte.r_-desigualdades,são t t' t r ,.1\íf,1, ;s ( 'ft t p lt u h t 8 ; l n|i, rl u c i t t li.r ft t t í,r t i t.t t : .1,t,,,1 t,.r t I t, número como a média do.s conteúdos engarrafados. Discuta um critérioaplicação de multas por diminuição do .oït",iOo enganafado. Um fabricante afirma que sua vacina previne g0Zo dos casosdoqnea,_Um grupo de médicos d"."oniiu que a vacina não é de uma tão efic 8.2 Teste para a Média populacional Vamos desenvolver as idéias gerais de testeinicialmente, que o modelo Normal é aãequado para osgerais serão comentadas ao final desta seção. de hipóteses supondo, dados Situações mais )ï ï"":* I ;,f "" : *,":::ï.::1ï ::: em res tar s e. a médi a p opu I ac i on ar(r[.r irl*),?,,!^o:^"i:::T-?re.os indivíduo, p".,"n""m à populaçr" #rïoJ::""t"ïI1 ::,;ï ::ï:_: j:: trl1l " t t, y1lo. qu" ..à,,".f il;;;õ;drr" ï" #;Hïffi :;iiï,#1Y:":ï, 1- T:dt". popuracionar,,tli;;i";;',;"; ;*n'ï ;#i; :il:ï::: : -" ? ":,ï1 o'. n ã; ;; "ï;i; ;;;;,"* ïï , :'3L#" J*: ï "ï:ï;lï:l:ïii""i:f:i:r::1o-!:""u,,õ-.-;."-;;i'J::'ffi ïï:J:',ï:ïeficâcia do tratamento proposto. Pelas suposições feitas no Exemplo 8.1,, a concentração da substânciasegue um modero Normar com desvio pádrao o" o uniáuãrv*r Então, para otamanho de amostra iguar a 30, a média amostrar terá distribu içã,o N(p,, 36/30).Por ser uma variável aleatória, -t poderá apresentar uuro.", maiores que 14,mesmo quando F: L4. De fato, sabemos. que p(X > 14 I tt : I4): 0,b pelasirretria da distribuição Normal. um critério que pode ,"rìtftruao, para decidirsrlrre o valor de pt,'ê determinar um varor crítico, digamos r., tarque, se x forturior que r", concluímg, ql"-l amostra pertence-à polpulação "com média p : Ig,rrrr scj., o tratamento não é eficaz. por ãutro lado, quando a média amostral forr.'i'a(ìr .tr igual ao varot .r,., concluímos que a amostra pertence à população comnÈrlirr 1t' : 14, sendo o rraramento considerado eficaz,.ii;;;;p, como x é umavgri:ivt'l irlcatória contínua, em termos probabilísticos, poddfnos incluir a ,t"nolr;níaiífi fr *iií'rlplã,*Ú-nq's-,99mqq-o-usol:.4n4teggvccmpostas' ustas últimas podem ainãì-s-er-õraJiiriCáOas õõmó ünj!4érái; õs--b-i,t-atèÌaií clenominadas tfi_grd-"úod*'sr_ainã-a se, úJ'lri"adaó õõmó ü'jiqtéráiJ õq-u-i,t-atOtnig clependendo do interesse do pstu-do' No caso do tratamento ser eficaz, é razoâvel assumirmos que ele foi capaz de fazer com que os indivíduos da amostra mudassem para uma população cuja média é inferiór a 18 unidades/ml, caso contrário, se o tratamento é ineficaz, p, não se alteraria. Assim, as hipóteses de interesse seriam escritas como Ho i F: IB versus Ho : 1t' {-18, Nesta situação, temos--o l:e! te Qe lipó1eses unilateral' 248 '{"ç' eapftulo 8: Ittlt'r0ncfu lilttttít;tiut; Tt:,rtt:.r dc IIil IEIF' ,\.J ??,rlr' l\tï(t (t Méilfu Pqnldt'ilurttl 249 _se o tratamento produz algum efeito, se,ia ele 18), devemos construir um tustu*de hipóíeses L Ho i F:78 versus Ho,: l-t# Ig., Por conveniência técnica' sempre, deixamos a igualdad) na hipótese nula.os dois erros que podem ser cometido " g/ ," rèahzar um testehipóteses são: _ I (i) Rejeitar a hipótese .ÉIo, quando tal hipótese é verdadeira, e ,"t'"\ (ii) Não rejeitaia hipótese ã, quando eia deveria ,"r."i"i,uau. Note que nenhum erro é cometido e a conclusão é correta, quando rejeitamos e ela é falsa, ou, quando decidimos aceitâ-ra, no caso dela ser verdadeira. Ao rcometido em (i) denominamos erro do tipo I enquanto que ao erro emdenominamos erro do tipo 1L A figura, a seguir, ,".r,n" u, porriu"r, situações: Figura g.I: Erros associados a testes de hipóteses. como veremos- adiante, uma parte importante do teste de hipóteses controlar a probabilidade de cometermos o ".ro do tipo I. Essa probabilidadedenotada por a, sendo B a probabilidade de erro do tipã U. tsto e, a: P(erro tipo I) : P(rejeitar Hol Hoverdadeira); 0 : P(erro tipo II) : p(não rejeitar H,l Hofalsa). Considerando as hipóteses I1u : 7_r : seguinte interpretação para os erros: rv : P(concluir que o tratamento é, eficazquando na verdade ele não é); {) : p(conctuir que o tratamento não é efrcazquando na verdade ele é)' A situação ideal é aquela em que ambas as probabilidades, a e B, são 1rr(rximas de zero' Entretantó, é fárcrl ver que à medida que diminuímos rvn a plrbabilidade de erro tipo II tende aaumentár' Identifique, na Figura 8'2, as áreas rclativas a a e B e veia como, dependendo do posicionamento de tr", a diminuição tlir írrea correspondente a a implica em um aumento da área correSpondente a B' l,cvando isso em conta, devemìs cuidar para que, .ao definir as hipóteses' o erro rrrais importante a ser evitado seja o erro áo tipo t A sua p19p1b!!idad19 lgnos o - rrorne de nível de slg!19ryçLa-do-teste' Pata verificarmos(p < 18) ou danoso (p ) 14 xc 18 RrBiAo rt, Rri"içoo i R ção Figura 8.2: Representação gráfica dos erros a e P' supondo a conhecido, vamos descrever çomo determinar o valor crítico :r;,.. Inicialmente, note que com z - lú(0,1). Portanto, dado a obtemos z"natabeladaNormal e calculamos r" da seguinte forma: a: P(errotipo I) : P(rejeitar Hol Houeldadeirl) ' X-u ,"-18',: P(X 1r"lF: 18) : '(;mt u6, : P(z 12"), t---' Sadio ( 11, ) IB versus H, : F < 18, temos 250 i - _n"_79L4--' 6/Jn Por exempl o, paraa : 0,05 ternos, Capltuln 8: Inïbrênt:ia Ettttttí,rtit,tt: Tt,rtet ile I ) r,. : L8 * z"+) \/Bo 0,05:p(Z<2.)è2,. logo, r" : 18 - 1,64#õ: 16,20. Umavez colhida a amostra, se a estimativa.7'o6ré tal que ro6, { l :"#,::::j^t::,:::::la concluindo que o rratamenro é, efrcaz.A regiãopelo conjunto dos números reais menor", qu" 16,20 éo"no.i#ii:i:;r;:Rejeição ou Região crítica e representada por RC. Assim, RC:{r €lR:e<16,20}. Denominam os Região de Aceitação (RA) aocomplementar de RC. ,s; ::n;',.:"lj:ll l:-:".i. i",,r'nu-, iï'zl; : r r,;;; q ue perrenceRC, rejeitamos 11o ao nível de significânci--v' rvJvrlqr'vò rro 4u rlvel oe slgnlflcância a:0,05. Graficamente a situaçãopode ser visualizada na Figura 8.31 "- que as curvas reDresenrâm q rÌicÍriL,,i^ã^as curvas representam a distribuição i:,ï'!ï;*"::,,::,:oi:i?lerinidap'ln-ri-:il;;ilï;i:;::;;:ïï::H" (p : L4 para a curva Sadio). Resido d( R!eiçào2220 18 ì,,;, Fígara 8.3: Representação grdfica da região de rejeíçãp_ unilateral. Sadio ( 11" ) r-- -- 251 A construção de testes de hipóteses lilg1erylq é feilt !-9 ryr-4xeira similqr È . - gpurr"nodu poru à "^o- üni!a19-gJ, -eIq9la,qug. qgqla, devem-oq-c-qpriderar gJng ãïsino de ilejeiçãq-c-oú'peúà-!ç- dueq-pgger-4qj-u1tas,-Pari, "l:T{:T,i: ã.1 I'ttte pilr(t u Média Poptrlü'hurtrl ,ãitf,,nt,o que p; é uma "óntiútôiôntróciaa e que as hipóteses nula e alternativa ãtlo cxpressas como A l{cgião Cryyga' serâdadapsr-- RC;fut eR ic í-{,", Ptt-g) 16}* e, piìra um valor a fixado, determinamos os números Íc1 e :x', de modo que P(N<ïctoL4X>r"r):a' Dirda a simetria da densidade Normal, distribuímos a massa a igualmente entfe as cluas partes da Região de Rejeição' Isto é, P(X < r,,): P(X > r"") : A í'igura a seguir ilustra, graficamente, a escolha dos valores críticos. x", lro x', Figura 8.4: Representação grdftca da região de reieição'bilateral' Nopróximoexemplo,faremosumtestedehipótesesbilateral calcularemos a probabilidade do erro tipo II' Ho i F: [Loi Ho : p.f po. a 2 o -e2 Distribuição de X sob Hs 252 tempo médio sofre arreração por influência í" ,"u"a"";-. Ëà;J,;J;ide interesse são: Ho : as cobaias apresentam tempo de reação padrão; Ho : as cobaias têm o tempo de reação attera'do. :rïr,l;:ïnoesrarísricos, rais hipóreses envotvem o parâm etro 11, e podem Ho: F: 8,0; Ho:F*g,0. uma vez que o teste envolve a média populacionar, consideramos a médiaamostral x para consrruir a esratísrica o",lr," "-";;;";;" x - N(u.A\.Tendo em vista a especificação de Ho, aregião críticaserá da f";;;' - '" \É''' Td'/' RC : {r e jR : r < rc.l ott a > r.r}. Logo, fixando a : 0,06 temos: 0,06 : p(emo tipo I) -I : p(rejeitar Hol H, verdadeira) : P(X € RCI/, : 8,0) : P(X < rcr ottx > :rc2l p : g,0) : p1X - 8,0 . r", - 8,0 ^,. -X - B,o - r." - g,o, '\/4110 - lTm "";m r 6t :p(Z{z.rouZrrr), :y: z.i : (r.i - 8,0)/í rc, j :1,2 e z -t/(0,1). Dadistribuição Normal, segue que z"t : _I,gB " 2., : t,gg. Logo, Capltulo 8: lnferêttcfu Ettuttf,ttictt; Te;stt,,t ilr IIi, Exemplo 8'3" um pequjsador deseja estudar o efeito de certa substância no teru Í:""T1:Í.:,^1"^::":^:llos a um cerro iip" i. "rirrur;. il experimentodesenvolvido com cobaias que são ino"uiuàu, com a *urta*ìï ;ìt"ffii:1 ::,:::ï]:,:-Yi::: ""T..r:u, l"Tpo, de reação (em segundos) anorados. (seguintes valores foram obtidos: 9,t;'9,3; 7,2; ì,5; ìã;ã, ,ô,l';ïí ;,lrïïï|hiAdmite-se que o tempo^de reação ."gu", em gera-I, o y'rodelo Normar com média ; j:',ï.f#::ï: ; : :::i1?: ; _q n "' úb^d; á;' " " "ï ", " *,re r an ro, qu o -": 25i !1,,'.'l'esltt pur(t (t Médh Pttpulntltuutl ,,,r=8-Lr}}\Ãln:6,8; :1"":8+ 1,88 vqre :9,2' Assim, podemos expressar a Região Crítica para d: 0'06 como RC :{r e R : r ( 6,8 oun > 9,2}' clrrlculando a média amostral obtemos T ohs :9'1' Como este valor não pertence à /{c, aceitamos a hipótes e Ho ao nível de significância 6Vo..Em outras palavras, concluímos qoe o temfo de "reação das cobaias submetidas à substância não ficn irlterado. Podemos também calcular a probabilid ade B do erro tipo II, isto é, a probabilidade de estar aceitando incorietamente Ho' Nt'"-qt:,p:Tj:t:"1ï:i;# ffiffi-*";ifi;;", o que não é o caso para o erro tipo II' como a hipótesen---^ c^--,. 17;'ffiffirï;;;", exisrem diversos valôres possíveis para p,. Dessa forma, Ér f!--11-. --1.. scrá função de qual valor de pr foi escolhido dentro da região definida peltt lripótese Ilo. Nesse caso, a probabilidade do erro tipo II será denotadapot BQt')' Por exemplo , Para LL: 9,0 teríamos B(9,0) : P(erro tiPo II ) : P(náo rejeitar H,lH'falsa) : P(X É RC lp : 9,0) :P(6,8<X<9,21tt:9,0) z6.8-9.0 x-9,0 - 9,2-9,01 _nt - < -l :'\1q^ -- J+F - 1/+1to t :P(-3,48 < Z <0,32) :0,4997 + 0,1255 :0,6252. Assim, em sendo F:9,0 e com probabilidade0'6252 estaríamos concluindo' de forma equivocada , qrre Hoé verdadeira tr Para c aracteflzql o-1lgqelopenho &-tester-defnyo s a fln ç,ã o ; ! o d e I p:l n(fi:V(ejeitar II' s" o-ïulot de Tlor aquele de Ho, r mas essa discussão não será tabela da 254 en p ltt t I o B : I nlb rê n c i a Es ttt t ís I i ct t ;,["e s t e.r t I c: I I i 1xí t a ;t e,r 6 7 I 9 10 11 Figara 8.5: Função poder. ):'":*T{,"j,:'^".:i":::, li}.u.:' a probabilidade do erro tipo r para #:ï':ï::'J:'tï'ï::ïï"^:ïf:t ïllzada como regra de 4""i,ã' ïa'ffi 'fi:ï:_"^1"':'l"1jiy: os,dois e*os, simutraneamenre, il#*" ïj:',ï F:: iï;ïf t "; I " j,"^'"nïuçl:_ lo., srupos a""","- "-,ïü'ffi;;ffiï1"":il"a,';; IirJj:_"1;1 jïï:"-1"^ _dlminuiriros "; ;;, ;,,*,'";,;#J "ï::';,#,ffi J:#ïJïJ'ïï:ii:dencR to^no *: ï:j:::::^, 11: T:: *er,? u m, au',*, o " " "uJ; ü, ; ffi"""#ï :n:ï:: tilizado e maior é og teste..Observe que a variânciu Ao "rti_uOoFïã diminui à recomendamos a leitura das referências mencionadas na bibriografia. para oExemplo 8'3, a funçã.o poder é apresentaoa.na rigu.a; ;;gri;, na quar pode-seobservar que à medida qr" no, árurtu-o. au ,"giao ou 1-õ;;r" nura, o poderaumenta, atingindo valores próximos a 1. A "r.uu ãpr"r"ntada é típica de um testede hipóteses bilateral. n(p) Nos testes desenvolvidos nesta seção, duas suposições básicas foramfeitas: a variável areatóriade interesse na populaçao segue o modelo Normal e suavariância é conhecida. a ausência de normalidade pode sqr contornada com o --' [J.2'li:ste puru o Médlu Popnltrituutl ,_,,*,_t 255 auxílio do Teorema Central do Limite o qual garante que' para amostras grandes, a média amostral tem distribuição Normal. Nesses casos, praticamente não haverd alteração nos procedimentos que estudamos até agora' pois continuamos a usar I clensidade Normal para estabelecer a região crítica. Entretanto, se a variância for desconhecida, ela precisará ser estimada e precisaremos de uma nova distribuição para X. Discutiremos esse caso na Seção 8.3. Apresentamos, a seguir, um sumário das etapas pafa a realizaçáo de um teste de hipóteses: Figura 8.6: Etapas de um teste de hipóteses. Concluímos essa seção ilustrando as etapas acima descritas com um testc de proporção. As definições, técnicas e conceitos utilizadas narcalizaçáo de testes de hipãteses para a média populacional são aplicáveis, quando o interesse reside na proporção de alguma característica na população. O próximo exemplo ilustra esse caso. Exemplo 8.4: IJm relatório de uma companhia afirma que 40Vo de toda a água obtida, através de poços artesianos no nordeste, é salobra. Hâ muitas controvérsias sobre essa informação, alguns dizem que a proporção é maior, outros que é menor. Para dirimir as dúvidas, 400 poços foram sorteados e observou-se , em l2O deles, água salobra. Qual seria a conclusão, ao nível de 3Vo? Iniciamos com a definição das hipóteses. O parâmetro de interesse é a proporção de poços com água salobra dentre todos os poços no nordeste. Representemos essa proporção poï p. Pela informação fornecida, devemos realizar um teste bilateral, com Ho i p: 0,40 ; Hoip+0,40. -!iç|r 256 Co p ít u I t t {l : I n /i' rê n c fu !i:t kt I lst i r t t :,1'e ;t I r,r t I t: I I i prl t e ses sabemos que o merhor estimador para p .é, a proporção amostral p cudistribuição pode ser bem aproximada por um modelo Normal, isto é, admitimos ì-N(p,p(t-p)/"). Dado que o teste é bilateral, a Região Críticaé da forma RC: {r e R l, < p", ou r > p.r}. Para a: 0,03; os valores pc1 tr p", são calculados através de P(ì < P.,lHo) : ry " P(ì ) p.,lHò :ry Sob a hipótese Ho,p:0,40 e, portanto,,remos â _ lf{4ã,\*00). Assim, P(ì < p.rlH,): pç3;!#-. _p",_9iaor \/o,24l4oo \/o244ool : 0,015 . Da tabela da l/(0, 1) segue que p". - 0.40 Jd24M- -L)Lt' As11m, obtemos p.1 : 0,842. De forma anáIoga encontramo s p.z :0,4b3 eregião crítica será dada por RC : {r e JR lr < 0,84T ou r } 0,458}. A amostra forneceu i,t, . .L20/400: 0,300 que pertence à região crítica. Dessa l"::*:: :t" lTo q qu,". o h ip ó te s e nu I a de ve . ; ."r, ; ;;;"-",;"J; :" ;Z;', iisto é,o relatório da companhia não está correto. Exercícios da Seção 8.2: 1. uma variável aleatória tem distribuição Normar e desvio padrão iguar a 12.Estamos testando se sua média é igual ou é diferente de2õe coletamos umaamostra de 100 varores dessa variável, obtendo uma média a-;r;;i;';:;"'" a. Formule as hipóteses. b. ob-tenha a região críticae dê a conclusão do teste,{ara os seguintes níveis desigìificânci a: I!o, J%, 4Vo, 6Vo.e gTo. ,ú '- * "" "" a -- @ 8,)'l'tslt: pdrct 4 Médla ltoPulnthmrl !. lrara uma variável ateatória com densidade Normal e desvio padrão 5' o teste cla rrróclia lt : Llcontra Lt = 14, t"y"i região crítica aa{1.99r '{r € R : o >. 12} 'iÌráÌ uma amostra de iamanho 25. Deteimine as probabilidades dos erros tipo I oIL .ì. urn estudo foi desenvolvido para avaliar o salário de empregadas domésticas ntr cidade de são p"rl;. roràÍn sorteadas e entrevistadas 200 trabalhadoras. Admitaqueooesviopadrãodessavariávelnacidadeéde0,8salários mínimos' ^ Áiotrìh.icãn rlo el ' é possível fazgrn. Você conhece a distribuição do estimador X? Se não alguma suPosição? b. Deseja_s" tesài se a média é igual a 3 salários mínimos ou é menor. Formule as hiPóteses adequadas' c.Paraumníveldesignificânciade3Eo,constfl]aareg|áocrítica. d. Se u u*orr.u foï"""u média de 2'5 salários mínimos' qual seria a conclusão? 4.oconsumomédiodegasolinanumcertotipodeautomóveléde15km/litro, segundo ir.,ror-uço* "da montadora. uma revista especializada verificou o "oïro-o em 25 à"..", veículos, escolhidos ao acaso, e constatou consumo médio de 14,3 km/litro. Admita que o consumo siga o modelo Normal com variância igual 9 (km/litro)2' a. Teste, uo niu"i-J" signíficânciade 6vo, a afirmação da montadora de que o média o" "onrrr-o iiguut a 15 km/litro, contra a alternativa de ser igu^l ' 14 km/litro. b. Determine a probabilidade do erro tipo II' 5.Avidamédiadeumaamostradel00lâmpadasdecertamarcaé1615horas. por similaridade com outros processos de fabricação, supomos o desvio padrão igual a 120 horas. úilizando a:57o, desejamos testar se a duração média de todas as lâmpadas dessa marca é igual oo é dif"t"nte de 1600 horas' Qual é a conclusão? o"t".rrrin" também u pÃuuuitiaade do erro tipo II, se a média fosse 1620 horas' 6.Umcriadortemconstatadoumaproporçãodelr}vodorebanhocomverminosc, O veterinário uri"à a dieta dos animáir e acredita que a doença diminuiu de intensidade.Umexameeml00cabeçasdorebanho,escolhidasaoacaso' indicousdelas"o-u"''ninose'AoníveldeïZo,hâindíciosdequea proPorção diminuiu? 258 Capltulo 8: l4ferência E$ntí,ttlcet; Te,rtes rle Ilipríte 8'3 Teste para a Média com variância Desconhecida os testes de hipóteses e intervalos de confiança para média, q :::"r'"ï:Tï'^:j: iq": pressupõem .qu: o valor da uuriãn"iu popuru.ionaiconhecido' Apesar de ser um caso particular, existem várias ,tró.ilrïï;ï ;ïi.ï:Í: :3ï:i:,: Tlïl"]..lly exe3nro, nump.rocesso indusrriar, se puderassegurar que uma certa máquina fornece *"àidu, "o- fr""irão const :ïi:"1ï:,,:T1l11iL1gconhecida.. uma ourra situação sËria aquela empodemos utirizar resultados enconrrados em outros trabarhos, ;:Ë"ff#lïi ::ff:ïï,:: :'-,.1,::1":.:l:",1*:, que manrenham alguma similaridade com oproblema de interesse. Entretanto, 'no caso mais g"rul, q#i;'#; ::ilolinformação sobre a variância da variável . areatória q,r" ;J; sendo estudada,precisamos contornar essa dificurdade. Ìnicialmente, ryanterqnos a suposição doque a variável aleatória de interesse tem distribuição úrmal.b."e!" não Normalserá comentado no final da seção. -- --5*" ^ rvrr'*r' v- i;;]!*s'V"lo.,l*ï: 1"'*"hecido, ele precisa ser estimado. supondo :ï: ""'y in1^ï:l !:?r:r::"ju.r:p.r"::ntada pero veror de variáveis aleatóriagffi:;;:ï:ï#:nfilizqt n ri-oll^^*tr ^^.:,-, r - ,ïilJ;'l',"ïi Capítulo 7 , é, a vafiãncia amosrra( S, : çiXl _ nX211çn_ lt) Definindo agora avariável ouA.onìjI padroniZàda T: X-l' -X-'p -{-Lr x-À, /S'/, t S/Jd{q;lt vemos que T também é uma variâver ur"ìt-,:riu. Entretanto, apesar de x terdistribuição Normar, o denominador envolve a variâver areatóriL's2, que fará comque a função densidade de ? seja diferente da Normal. Esta náva densidade, quepode ser deduzida teoricamente, é denomi \gjq t de stqde4t er* pura-"tro tem o\e\?de-slqusdcJiher4qde-nest{íaso"ú"íponoã"ãïã"i"ËrãËïï;;;;;:- 1' A notação utìlizqda Le!-4 !1,-1,e, devido a "ompte*ia"à" au sua funçãodensidade, as probabilidades são ouiiau, de taberas consìruídas numericamente. Aexemplo da Normal, o modelo t-student tem densidade em forma de sino,gnlrqtaItto as-cau-das tem 4narol mq$,s3 qUe A_ry(0, f) (veja a fig"r" S.Zl. ^^-..^_^Y,11" x911f--9Ì9r se o tamanho 4a [qrostra aqruenta., a dp1.1s-idadçJ.sndentçorvgJge par-? a Noirnal p4drão. porìsia razã,o, as taberas conriruioa, se limitama valores de gr-auìTel-iueraaáe menores ou iguais a r20.p;;; graus superioresa 120, as probabilidades são obtidas da tabela da distriÀição Normal e - ll. | 'l\'ste l,(tftt (t Mfulirt utttt Vttri{lncit Dcst.orthcte:itkt .4 259 reprcsentados por "oo" na tabela do Apêndice A. Tal fato é r:rirrsistência do estimador 52 para o2, que faz com que a rrlrltrxime de Z àmedida que aumenta o tamanho da amostra' conseqüência da quantidade ? se Figura 8.7: Densidade t- Student. Diferentemente do teste de hipóteses, construído para o caso em qUC S variância é conhecida, a região crítica envolverá agora o termo,52, que é umA quantidade aleatória. Dessa forma, amostras diferentes podem fornecer regiões críticas distintas uma vez que, possivelmente' elas produzirão estimativas diferentes para o2. éS!-Uq, qguo{q u Jqi4fql41gq-dqqqouhesüa' optarçmos por utilizar na região crítica valores da qlantidade padronizadaT. Apresentamos esse procedimento no próximo exemPlo' Exemplo 8.5; Deseja-se investigar se uma certa moléstia que ataca o rim altera o consumo de oxigênio desse órgão. Pata indivíduos sadios, admite-se que esse consumo tem distribuição Normal com média 12 cm3lmin' Os valores medidos em cinco pacientes com a moléstia foram: 14,4; 12,9;15,0; I3,7 e 13,5' Qual seria n concluìão, ao nível de lvo de significância? ?t 'u'o I : qti,'\ O teste de interesse é: Hn : Amoléstia não altera a média de consumo renal de oxigênio; Í1, : Indivíduos portadores da moléstia têm média alterada' 260 Capltttlo 8; lttferência Esrnrl,rricn; Trs,te,y rle iliyitere,r 1)ea Em termos da média populacional, estamos testando as hipóteses: Ho : p,:12 versLts Ho : pt f L2, e a região crítica é da forma nC:{t€Rlú {t1ou 1>tz}. Sendo o2 desconhecido, usaremos o estimador ^g2 : rixr - rxr,1çn _quantidade ú discutida anteriormente. sendo n, u"rauíãlu, t",'o. x-tzt:uru-tu)' Logo, l\T. úr) :0, 0r/2 + tt : _ 4,604;P(T > úz) : 0,005 * tz - 4,604; sendo o varor 4,604 obtido da tabera da distribui ção t-student, com4 graus deliberdade. Assim, a região crítica.".áOuão po. RC : {te Rlú < _ 4,604 ou t } 4,604}. Sendo Ìobs :13,90 e s|tr:0,62; calculamos o valorpadronizado tor," : Ìon - 12 - 73,90 - 72wot)s - ;,JG: o,nrc:5,18' Portanto, como Í,6, 5 RC d""ioimos pera rejeição da hipótese nura, ou seja, amoléstia tem influência no consumo ,"rr'J^,neoio de oxigênìo ao nível de rvo. tr Intervalo de confiança para p, com variância desconhecida euando a variância é desconhecida, construímos intervaros de confiançapara a média popuracionar ut'izando o n'i"to t_irrilïi. ô'0."""0r_enro para aobtenção do inrervaro é semerh;;," ; desenvolvid" "J- ""pr,uro anrerior.Supondo uma amosrn ateatória ir,.|.",X,, obtida;; ;;; população comdistribuição Normal com média e variân"ìa'desconhecidas, temos que ru .qIF u..l'l'esle P(tr(t (t Méelkt t'ottt Varlllnrht I )ttctnrltcciiltt !{ 26l, {t Desta forma, fixando-se o coeficiente de confiança 'y (0 < 1. <. L) e utilizando a tabela da distribui çáo t--Student com n- L graus de iiberdade (ver Apêndice A)' podemos obter o valor t^,p tal que X-uP('t1p.ffi< trlz):"t' Logo, o intervalo com coeficiente de confiança 'y para É" com variâncin desconhecida, será dado Por q - S. rC(t",ì:lX- ht2 Jn;X+ hn76l Exemplo 8.6; Considerando o exemplo anterior, úfna vez que decidimos pela rejeição da hipótese "ri", e boa prática fornecer um intervalo de confiançâ pnrtt tt média populacional. Naquele exemplo foram obtidos Íut," :13,90 e S3r," = 0'67' ComT:0,g0obtemos,databeladadistribuiçãot-Studentcom4grausde . liberdade, tt12 :2,L32. Logo' IC(1t,90Vo) : [13,90 - 2,132J o,w I s;13,90 + z,tzzJí,w 1 s 1 : [tS,OO; l+,7I]1. deconfiançâ "i.on,.uOo não inclui o valor L2parapl' que foi a hipótese nula no E.;;;1" 8.5. Dessa forma, confirma-se a conclusão de rejeiçiio da hipótese f/, . Se a variável de interesse, além de ter variância desconhecida' não tiver densidade Normal, J n"""rrário utilizar técnicas não-paramétricas para 11 realizaçãodotestedemédia.Nãoapresentaremosessametodologiaaqui, entretanto, um caminho para contornar essa dificuld ade é, novamente' considernf um tamanho de amostra suficientemente grande' Neste câSo, é sabido que '52 se aproxima de oz de tal forma que o seu úo, jrintamerrte com.uma aplicação do Teorema Central do Limite, permite "on'iã"'ut -Í como tendo distribuiçio Normal, resultando em aproximações bastante satisfatórias do ponto de vista prático. 262 Capítulo 8: Inferência Estatística: Testes de Hipóteses os procedimentos adotados nos testes realizados até ugoru "onrirtirurJl':_ryï:"1-g:trnri"an"iu",;;ffi ã":;ï*ïüã"":ïï":ïiï',i#":ï;il;td;ffi;procedimento clássico de testes de hipóteses. uma alternati escorhida po. p",qui,í."ï". "ï'ìu,ï1, ïTïïii,ï;,':i:"i:'i#ïï";rl'iït#ï';priori. Este será o assunto da próxima seção. lste em não fixar a à Exercícios da Seção 8.3: 1' com o auxflio da tabela t-student calcule (se necessário, aproxime): a. P(-3,365 ( Ís < g,J6b). b. P(lú81 < r,4). c. P(-1,1 1tu ( 2,I5). d. O valor de a tal que p(úe ) a) : g,g2. e. O valor de b tal que p(ú16 í ô) : 0,0b.f. O valor de c tal que pflú111 S ") : 0,101g. O valor de d ta| que p(t211 > d.): 0,0b. \ 2' uma amostra com 10 observações de uma variável aleatória Normal forneceu média de 5,5 e variância amostral4. Deseja-se testar, ao nível de significânciade 5vo, se a média na população é igual oué menor que 6. eual é a conclusão? 3' Admitindo que a pressão sangüínea arterial em homens siga o modelo Normal,7 pacientes foram sorteados e tiveram sua pressão medida com os seguintes resultados: 84, 81, 77, 95,69, g0 e 7V a' Teste que a média é g2 contraa alternativa de ser g0. use a : 2vo.b. Determine o intervalo de confiança para LL comcoeficiente de confiança 'Y :98Vo. 4. o tempo de permanência de engenheiros recém formados no le emprego, emanos, foi estudado considerando um modero Normar com média e variânciadesconhecidas. por anarogia com outras. categorias profissionair, a"r"J;-r,testar se a média é z anos contra a alternativa dó ser 3 anos. para uma amostrade 15 engenheiros, a média obtida foi de 2,7 anos e o desvio padrão amostral1,4 anos. Ao nível de lVo, qual a conclusão do teste? 5. uma amostra de 20 observações de uma variável com distribuição Normar foicolhida, obtendo-se desvio padrão 1,1. No teste /_r:5 contra p > b, íbi esrabelecida a região cririca {ú € R | ú > 2,033}. Derermine a probabiridade cloerro tipo I. 8.4 Nível Descritivo 263 6. O número de pontos em um exame de inglês tem sido historicamente ao redor de 80. Sorteamos 10 estudantes que fizeram recentemente esse exame e observamos as notas: 65, 74, 78, 86, 59, 84, 75, 72,81 e 83. Especialistas desconfiam que a média diminuiu e desejam testar essa afirmação através de um teste de hipóteses, com nível de significância de 5Vo. Fazendo as suposições necessárias, qual seria a conclusão do teste? 8.4 Nível Descritivo ' Ao realizarmos um teste de hipóteses, partimos de um dado valor de a, pré-fixado, para construir a rcgra de decisão. Uma alternativa é deixar a cargo de quem vai utilizar as conclusões do teste a escolha do valor para a probabilidade a, que não précisará ser fixado à priogi. A idéia consiste em calcular, supondo que a hipótese nula seja verdadeira, a probabilidade de se obter estimativas mais desfavoráveis ou extremas (à luz da hipótese alternativa) do que a que está sendo fomecida pela amostra. Esta probabilidade será o nível descritivo, denotado por a* (ou P-valor). Elgr"!_pqqqenos de qf -gyldqgclam qug a_hip$tese nula-é-falsa pois, sendo a amostra nossa ferramenta de inferência sobre a população, ela fornece uma estimativa que teria probabilidade muito pequena de acontecer, se flo fosse verdadeira. O conceito do que é "pequeno" fica a cargo do usuário, que assim decide qual a usar para comparar com o valor obtido a*. Inicialmente, vamos considerar o caso do teste de hipóteses unilateral. Para H,,: F : ltro, a expressão de a*.depende da hipótese alternativa, isto é, (t* : P(X <T"h,lH,verd.)para Ho: pr,1 pu ou a* : P(X >Tot,lHo verd.) para Ho : p.) 1to. Exemplo 8.7: Uma associação de defesa do consumidor desconfia que embalagens de 450 gramas de um certo tipo de biscoito estão abaixo do peso. Para r,lerificar tal afirmação, foram coletados ao acaso B0 pacotes em vários supermercados, obtendo-se uma média de peso de 447 gramas. Admitindo-se que o peso dos pacotes segue o modelo Normal com dejsvio padrão de 1-0 gramas, que conclusão pode ser tirada através do nível descritivo? O teste que está sendo executado é H,, i F: 450 (peso médio conforme previsto na embalagem); II,, : 1-t < 450 (peso módio abaixo do previsto na embalagern). 264 Capítulo 8: Inferência Estatística: Testes de Hinó1eses ,,,1" I I O valor observado na amostra foi Íob, :447 e as suposições feita$ sobre a normalidade da variável peso implicam que X - N(p,10d/S0). Então, d* : P(X <Tnn,lHu verd.) : p(X < aa7l p,:4b0) :P(Z < -2,68) :0,0037. Portanto o nível descritivo é de 0,37vo, indicando a probabilidade de que encontremos valores da estimativa mais desfavoráveis à hipótese nula, Note que o valor do nível descritivo se relaciona diretamente com o nível de significância. Neste exemplo, se tivéssemos fixado o nível de significância em qualquer valor igual ou superior a 0,377o, a conclusão seria pela rejeição de Ho, ao passo que valores inferiores a 0,37vo conduziriam à aceitação da hiffiã\nula (ver Figura8.8). \ tr - 2,68 0 Figura 8.8: Nível descritivo unilateral. Para o teste de hipóteses bilateral, ao calcularmos o nível descritivo, precisamos considerar que a forma da região ctítica envolve os valores de T olrn que se distanciam muito (para mais ou para menos) daquele previsto pela hipóteso nula. Dessa forma, um procedimento usual é multiplicar por dois a probabilidado obtida em uma das caudas, de modo a preservar aidéia de afastamento bilateral, Assim, ao testarmos Ho: p: Fo contra Ho: p * l-to, a definição do nível descritivo depende da relação entre rob" e LLo. 1q caso: se ro6, 1 Fo, d* :2 x P(X <E4rlHo verd.); ì 2ecaso: se7.,6r) u,o, a* :2 x P(X >TonrlHoverd.). D istribu ição_N orm al Padrão .{q 8.4 Nível Descritivo No caso bilateral, o nível descritivo leva em conta a posição relativa entre A estimativa xj obs è o valor po . Desta maneira, garantimos, a inclusão de valOres mais extremos do estimador em relação à t"o . AFigura 8.9 ilustra esses casos. Ínb, Fu Figura 8.9: Regiões desfovoráveis num teste bilateral com Ho: Lr : Po' Exemplo 8.8.. Vamos considerar o teste apresentado no Exemplo 8.3, AS hipóteses sobre o tempo de reação de cobaias, submetidas a um estímulo elétrico, foram as seguintes, , : , (tempo médio de reação sem alteração) ; Ho i p I 8 (tempo médio de reação alterado). Para uma amostra de 10 cobaias, observou-se 7"6':9,1' com as suposições jd feitas naquele exemplo (normalidade com o :2 segundos), podemos obter o nível descritivo. Note que aqui os valores da estimativa'mais desfavoráveis em relação à H, correspondem a região X > 9,I. Assim, temos a* : 2 x P( X >,-E ,hsl H,, verd.) :2xp(X>9,11p:g) :2 x P(Z > 1,74) : 0,0818' Logo, se desejarmos utilizar um nível de significância igual a 0,05 concluiríamos pela aceitação da hipóte se Ho, ao passo que um nível de significância igual a 0,10 nos levaria a rejeitar a hipótese Ho (ver Figura 8.10). 265 . ,n,í\'a i^ / ",'1r,, ] ' , Se lo6, > p.: região desfavorável a ÍÌ,, Se -xo6" < p.,: região desfavorável a Íí, 2()6 Capítulo B: Inferência Estatística: Testes de Hìfuóteses j I o nível descritivo nos fornece uma idéia da intensidade com a quaì estamosrejeitando, ou não, a hipótese nula. Dessa forma, tem papel importante do pontode vista exploratório, üma vez que pode nos fornecer indicações para pesquisasfuturas. E Exercícios da Seção 8.4: l' Um pesquisador está, realizando um teste para a média e obteve nível descritivoigual a 0,035. Ele aceitará a hipótese nula para níveis de significância superiores ou inferiores à 0,035? 2. uma variável aleatória-tem distribuição Normal e desvio padrão igual a 10.urra amostra de 50 varores dessa variável forneceu média igual a 15,2. para cada um dos testes abaixo responda qual é o nível descritivo. 't, H,, :1-l : 18 versus Ho i p : IJ.C/ h. Hu : &: 18 versus Ho: p, < IB. c. H,, : l-t: IB versus H, : pt I Ig.d. H,, : l_t: 17 versus Ho : p,: llr. 3. A resistência de um certo tipo de cabo de aço é uma variável areatória modelada pela distribuição Normal com desvio pádrao 6 kgf. uma amostra detamanho 25 desses cabos, escolhida ao acaso, fôrneceu meãia igual a 9,g kgf.Para o teste p : 13 contra & : 8, qual é o nível descritivo? eue conclusãovocê consideraria adequada? 8.5 Testes QuïQuadrado 267 4. Sorteamos, ao acaso, 12 observações de uma variável aleatória que segue o modelo Normal. Da amostra obtivemos média 21,7 e desvio padrão 5,5, Determine o nível descritivo do teste F:18 contra p > IB. 8.5 Testes Qui-Quadrado Apresentamos, nesta seção, três testes que utilizam o modelo Qui- Quadrado como estrutura probabilística e, por essa razão, são denominados, de Íbrma geral, Testes Qui-Quadrado. Iniciamos testando a adequabilidade de um modelo probabilístico para uma dada situação, depois discutimos o teste de independência entre duas variáveis e encerramos a seção com o teste de homogeneidade de subpopulações. Nas seções anteriores, nosso problema foi testar hipóteses sobre os parâmetros média e proporção. Em geral, as formas das distribuições de probabilidade eram conhecidas (ou seriam aproximadas) e tínhamos que decidir cluanto a aceitar uma ou outra hipótese, sobre o valor desse parâmetro. Em termos práticos, outra situação comum é termos observações de uma variável aleatória cuja distribuição na população é desconhecida. Nesse caso, uma das primeiras providências é tentar identificar o comportamento da variável com um modelo tcórico. Em algumas situações, é possível incorporar informações de outras variáveis que descrevam fenômenos aleatórios similares e tenham distribuição 'conhecida. Dessa forma, teríamos um candidato a modelo e nosso problema serin cstabelecer um procedimento para aceitárlo ou não. Existem, contudo, vÍlriOS outros casos em que não se tem a menor idéia do comportamento da variável, Uma das maneiras iniciais de análise é construir um diagrama, com as freqüências cle ocorrência, nos moldes do histograma. Dessa representação gtáfica, pode sair a sugestão de modelos adequados aos dados. Em qualquer caso, o modelo proposto pode ser testado através do chamado Teste de Aderência. Nesta seção, itpresentaremos um desses testes que usa a distribuição Qui-Quadrado, outros testes de aderência podem ser encontrados nas referências mencionadas na bibliograiia. Considere uma variável X para a qual temos uma amostra de valores e cleseja-se verificar a adequação ou não de um certo modelo probabilístico. Os valores observados da variável foram divididos em k categorias contendo, caclo ulra, um ou mais valores que são apresentados numa tabela de freqüência: Categoriit 1 2 3 h lìrect, Observarlit O1 O2 Or oÀ, 268 Capítulo 8: Inferência Estatística: Testes de Hipóteses Se X for discreta, as categorias são os próprios valores da variável, eventualmento agregando mais de um valor na mesma categoria. No caso contínuo, as categorias são definidas a partir de faixas de valores da variável. Do modelo que está sendo sugerido, calculamos as freqüências esperadas em cada uma das categorias. Assim, Categoria 1 2 tJ k Freq. Esperada e1 A2 93 êl'., se x seguir o modelo proposto, essas duas tabelas não devem ser muito discrepantes. o teste de aderência cria, então, o critério, pazá?èèiÇir se podemor aceitar ou não o modelo indicado. Em outras palavras, decidimo\ se os dadog amostrais oderem ao modelo ou não. As hipóteses do teste são: \ Ho: X segue o modelo proposto; I Ho: X não segue esse modelo. A quantidade que usaremos para tomar nossa decisão será baseada na diferença entre os valores esperados sob -F1, e aqueles observados na amostrô, Podemos dizer que a diferença oi - ei dá uma idéia da compatibilidade entre og valores observados e o modelo proposto. Assim, se as diferenças forem muito grandes, é razoixel admitir que o modelo não deve ser adequado. por outro lado, pequenas diferenças podem ser aceitas, pois estamos sempre sujeitos a flutuações, quando trabalhamos com variáveis aleatórias. Baseando-se nessa idéia intuitiva, a quantidade utilizada no teste será: o,:fg=_:,y . i:7 vx sendo que k representa o número de categoriaS, o; â freqüência observada e e4 q freqüência esperada para a categoriai. Para interpretar a expressão d" Q2, note que o termo o,i. - et indica g diferença, na categoria e, entre a freqüência observada e a esperada ou, em outraÉ palavras, o desvio em relação ao modelo proposto. Se, simplesmente, fizéssemoB a soma desses desvios para todas as categorias, obteríamos zero, pois o total dc dados é o mesmo. Para evitar isso, tomamos o quadrado dos desvios. Entretanto, por serem quantidades não negativas, sua soma poderia se tornar artificialmentc alta e, por essa razáo, é conveniente fazermos uma mudança de escala dividindo esses desvios ao quadrado pela freqüência esperada. Somando agora, para todae 8.5 Testes Qui-Quadrado irs categorias, obtemos a expressão de Q2 que é, assim, uma medida da d iscrepância que queremos quantificar. É possível demonstrar que, para um tamanho de amostra suficientemente grande, a distribuição de Q2 pode ser aproximada por um modelo Qui-Quadrado com parâmetro k - L, denominado de número de graus de liberdade da, rlistribuição. Essa distribuição é representada por X(r-1. O modelo Qui-Quadrndo ó contínuo e assume valores não negativos. Sua densidade tem uma expressão complexa de forma que probabilidades serão obtidas da tabela apresentada no Apêndice. A aproximação para o modelo Qui-Quadrado será melhor, se todas as l'r'cqüências esperadas forem ao menos iguais a 5. Se isto não acontecer pâra irlguma categoria, devemos combiná-la a uma outra de forma conveniente, glrantindo que todas as freqüências esperadas atendam a esse critério, lÌctomamos agora o Exemplo 8.2, construindo formalmente o teste de aderôncia. Iixcmplo 8.9; No Exemplo 8.2, definimos X como sendo o número de impactos ttttteriores à falha em um equipamento eletrônico. Uma amostra de 80 ensaios foi obtida, cada ensaio representando os testes feitos até a intemrpção por falha no r.rrluipamento, resultando 80 observações da variável de interesse. Pretende-se vcrificar se o modelo Geométrico com p : 0,4 ê adequado. O teste será: Ho:X-G(0,4); H,: X tem outra distribuição. A rlecisão será baseada no comportamento de Q2, definido acima. Considerando o lrrrnanho de amostra grande, a distribuição de Q2 pode ser aproximada pela Qui- (Juadrado, com número de graus de liberdade que depende de quantas categorias scriro estabelecidas. A região críticaé constituída de valores grandes de Q2, isto é, RC : {ta : u2 q,,}, r'orì'ì q(, sendo determinado pelo nível de significância do teste, ou seja, *: P(Q2 ) q,,lHu verdadeiro). Para determinar o valor observado de Q2, denotado por qf;,,", precisamos olrtcr as freqüências esperadas. Se 11, for verdadeiro, X segue o modclo (icotrótrico, isto é, P(X : k): pt':0,4 x 0,6È. Logo, lìreq. esperzrda clc rcsistôncia a À, impactos : 80 x Pl, : 80 x 0,4 x 0,6Â'. Nir tabcla, a seguir, ilpresentilnìos ns l'reqüências esperadas e os valores que foram obscrvados no teste cle resistênciit t'enlizaclo. 2ó9 270 Capítulo 8: Inferência Estatística: Testes de Hipóteses Impactos 0 1 2 3 4 mais de 4 Freq. observada 30 26 10 5 5 4 Freq. esperada 32,0 19,2 11,5 6,9 4rr 6,3 como a categoria correspondente ao valorZ tern--{eqüência esperada igual a 4,1 que é menor que 5, agregamos as duas últimas categorias formando a dos maiores de 3, a qual terâ a freqüência observada de g e.esperada de 10,4, Então, q1u,: (30 - 32,0)2 32,0 e6 - Le.2\2 ---tgp-+"'+ Quadrado, com 4 graus de liberdade. Temos, P(Q2 > q.l H.) - a + P( Q' > A.l H"): 0,0b. Consultando a tabela na linha correspondente a 4 graus de liberdade e na coluna de \Vo, o valor crítico será q" : 9,49 que é maior que o valor observado de 3,44, concluímos pela aceitação do modelo proposto. A próxima figura apresenta a densidade do modelo Xl coma região críticado teste. tr qí,"= e,q+ e,4e Fígura 8.11: Densidade X! e Região Crítica. Í (x) 8. 5 Testes Qui-Quadrado 27t Uma situação bastante comum é aquela em que desejainos testar se um& variável segue um certo modelo, mas desconhecemos.um ou mais parâmetros da distribuição. Sendo assim, vamos utilizar a amostra para chegarmos às estimativas dos parâmetros desconhecidos, isto é, utilizando as próprias observações que dispomos, vamos obter estimativas que serão consideradas como valores dos parâmetros desconhecidos. Nesses casos, o número de graus de liberdade se altera çtara k-I-e, com e representando o número de parâmetros que foram estimados. No próximo exemplo, ilustramos essa situação ao testar a aderência de um conjunto de observações a um modelo contínuo. Ilxemplo 8.10: Deseja-se verificar a afirmação de que a porcentagem de cinzas contidas em carvão, produzido por uma certa empresa, segue a distribuição Normal. Os dados, apresentados a seguir, representam a quantidade percentual de cinzas encontradas em 250 amostras de carvão analisadas em laboratório. Cinzas (em 7o) freq. observada 9,5 l- t-0,5 2 10,5 t- 11,5 5 rL,'l- L2,5 16 12,5 l- 13,5 42 13,5 l- 14,5 69 14,5 l- 15,5 51 15,5 l- 16,5 32 16,5 l- 17,5 .\tZ.) 17,5 t- 18,5 I 18,5 l- 19,5 1 (lrral decisão devemos tomar ao nível de significância de 4%o? Como desconhecemos a média e a variância da Normal que será testada, prccisamos, inicialmente, obter suas estimativas a partir da amostra. Os melhores cstimadores desses parâmetros são a média e a variância amostral, representados 1,,,r X e ,S2, respectivamente. Para calcularmos suas estimativas, tomamos o ponto rrróclio do intervalo como representante dos valores da respectiva classe. Entflo, lrrììos ì:Ía,"-I4,5; G2=s?t":2,7. l)cnominando por Õ n vnritlvel nlentóriui porcentagem de cinzas contidas no 'ì\ í,'6 ' 272 Capítulo 8: Inferência Estatísïica: Testes de Hipóteses carvão produzido pela empresa, as hipóteses a serem testadas são: Ho:C -N(14,5;2,7); H, : C tem outra distribuição. , Como antes, usafemos a estatística Q2 paru tomar a de\isao e, considerando o tamanho da amostra grande o suficiente, aproximamos a \tribuição de Q2 pela Qui-Quadrado. Dessa forma, utilizando a:47o, obteremob'a região crítica do teste. As diversas faixas constituem as categorias de valores da variâvel C e serão numeradas de 1 a 10. De modo a varrer os íalor\do intervalo (-oo, oo), correspondentes ao modelo Normal, acrescentamos às\ategorias 1 e 10 os valores, respectivamente, menores que 9,5 e maiores que 19$. Dessa forma, parA calcular as freqüências esperadas, procedemos da seguinte forma: et : 250 x P(C < 10,5 | flo verdadeiro); e,i : 250 x P(C € categoria i,l H'veÃadeiro), i :2, . .. ,9; en:250 x P(C > 18,5 | Í1, verdadeiro). As probabilidades acima são calculadas da maneira usual através tabela da Normal padrão. Por exemplo, da P(C <L0,slH,verdadeiro) : e19:ff. 10f#Él________/ , t/2,7 \/2,7 : P(z < -2,44) : 0,0073. Para a categoria 5, P(13,5 < c < L4,5lH,) : P(Pry < 9-#--u/ ' t/2,7 \/2,7 :P(-0,61 <z<o) :0,229L' As freqüências esperadas são apresentadas na tabela, a seguir, e deVefU somar 250, o que foi considerado nos arredondamentos efetuados' L4,5 - L4,5, -l Jr7 ) 'ç 8.5 Testes QuïQuadrado 273 Categoria freq. esperada 1 L,82 2 6,58 3 19,40 4 39,92 5 57,28 6 57,28 I 39,92 8 L9,40 I 6,58 10 L,82 Observamos que as categorias 1 e 10 devem ser anexadas a outras, pois suas I'r'cqüências esperadas são menores que 5. Desse modo, agrupamos as categorias I com 2 e 9 com 10. As novas categorias e suas respectivas freqüências esperadas e observadas são apresentadas na tabela a seguir. Categoria freq. esperada freq. observada 1 8,40 7 2 19,40 16 IJ 39,92 42 4 57,28 69 5 57,28 51 6 39,92 32 7 19,40 23 8 8,40 10 lilctuando o cálculo da estatística Q2, obtemos QZt":6,ío7. Para determinar a rrgiiro crítica, utilizamos a distribuição Qui-Quadrado com 8 - 1 - 2 : 5 graus tlc liberdade, em que perdemos dois graus de liberdade devido à estimação dos lrrrrlìmetros p e 02. Com o auxílio da tabela da Qui-Quadrado, obtemos RC:{w:w>11,64}, l)iu'ir cv : 4Vo. Note que lìC não contém Q?t," e, portanto, decidimos peln rrccitirção do modelo Nonnal parfl a variável aleat1ria C . tr Apresentamos, ttgortl, umu forma de testar a independência entre duas vrrliÍrveis. Se dispomos da funçíln cle probabilidade conjunta de duas varialveis 274 Capítulo 8: Inferência Estatística: Testes de Hipóteses aleatórias, podemos verificar se, para todos os possíveis valores das variáveis, o produto das probabilidades marginais é igual à probabilidade conjunta. Na situação mais comum em que não temos informação sobre a ocorrência conjunta das variáveis aleatórias, o procedimento usual é coletar uma amostra anotando a freqüência conjunta da ocorrência dos valores das variáveis. Pode-se, então, utllizar um teste de hipóteses conhecido como Teste de Independência. Este teste será apresentado através do próximo exemplo. Exemplo 8.II: A tabela abaixo contém òì r"-sottatos obtidos por estudantes do ensino médio, em um exame com questões nas disciplinas de física e matemática. Deseja-se testar se existe dependência eú." u\otas dessas duas disciplinas que, para efeito de apresentação na tabela e aná{ise de comportamento, foram classificadas nas categorias alta, média e baixa. \ Física \ Matemática Alta Média Baixa Total Alta 56 7I L2 139 Média 47 163 38 248 Baixa I4 42 85 L4L Total II7 276 135 528 Iremos testar as hipóteses: fI, : As notas de física e matemática são independentes; fI" : Elas não são independentes. De modo análogo ao que fizemos no teste de aderôncia, vamos construir tabela de valores esperados. Para a casela (i, j), esse valor é: uma Total da linha i x Total da coluna j T"t"t C.*t Note que os valores esperados são calculados sob a hipótese Ho de independência e, por essa razão, utilizamos os totais de linha e coluna que representam as freqüências marginais das variáveis. Por exemplo, para a casela (7,2), temos: Total da linha 1 x Total da coluna 2 739 x 276 52g :72'66 'e1 ,: Total geral nula, ou seja, as notas de físicn 8.5 Testes QuïQuadrado 275 A tabela completa de valores esperados é Física \ Matemática Alta Média Baixa Alta 30,80 72,66 35,54 Média 54,95 r29,64 63,4r Baixa 3L,25 73,70 36,05 Para medir a diferença entre os valores esperados e observados, usaremos: n2 5l+- (or,i - ei,)2\{:Ì..L*, -- 'i:t i:l "t'u com r e s representando o número de linhas e de colunas, respectivamente, A argumentaçáo para sua utilização é a mesma já apresentada no teste de aderôncin e, para um número grande de observações, a distribuição de Q2 se comporta como um modelo Qui-Quadrado com (" - 1) x (s - 1) graus de liberdade. A rcgiÍio críticacontém valores grandes de Q2, isto é, RC:{w:u}q,,}, com qo sendo determinado pelo nível de significância do teste, ou seja, o: P(Q2 ) q"lH' verdadeiro). Para a: 0,01 a tabela da Qui-Quadrado com 4 graus de liberdade Íbrnece g" : L3,28. Obtemos assim, RC:{w:w>13,28}. valor observado de Q2, q?t" Vamos calcular o _ (56 - 3o,Bo)2 30,90 (7L - 72,66)2 (85 - 36,05)2+.'.+ : L45,78, 72,66 36,05 Concluímos pela rejeição da hipótese matemática não são independentes. e tr 276 Capítulo 8: Inferência Estatística: Testes de Hipóteses Na construção da tabela de valores esperados, caso alguma casera tenha valor menor que 5, será necessário agrupar categorias. Este procedimento visa garantir uma melhor'aproximação para o uso do modelo Qui-euadrado para e2 . consideremos agora o chamado Teste de Homogeneidade. Esse testol consiste em verificar se uma variável aleatória se comporta de modo similar, ou homogêneo, em várias subpopulações. Apesar da mecânica de realizaçáo do testc ser semelhante a do Teste de Independência, uma distinção importante se refere à forma como as amostras são coletadas. No teste de homogeneidade, fixamos o tamanho da amostra em cada uma das subpo-pulações'e, então, selecionamos u amostra de cada r as subpopulações uma delas. Na tabela apresJiltaqa a seguir, as linh ; e, as colunas, os diferentes valor\s ou categorias , Subpopulações Valores da variável total de linha I ott otz TL1 2 ozt ozz TL2 total de coluna total Geral delas as represe da variável. Fara o cálculo dos valores esperados (supondo homogeneidade entre at subpopulações), utilizamos, para a casela (i,, j) , total da coluna j €i,.i : Tti " ,rur ,"rur O total de linha ni indica o tamanho da amostra da subpopulação i,, ao passo quê o quociente, total da coluna j dividido pelo total geral, representa a proporção dc ocorrências do valor da variável correspondente à coluna j. caso haje homogeneidade de comportamento da vàriável, esperamos que essa p.oporção seja a mesma, em todas as subpopulações. No próximo exemplo, apresentamog mais detalhes. Exemplo 8.12: Estamos interessados em saber se a preferência por certo tipo de Í'ilme se altera com o estado civil. Selecionamos pessoas em cada uma dag subpopulações: solteiro, casado, divorciado e viúvo. Os resultados estão na tabela a seguir: lJ. 5 Testes QuïQuadrado 277 Estado Civil \ Filme Policial Comédia Romance tam. amostra Solteiro 45 25 30 100 Casado 36 61 43 L40 Divorciado 39 36 35 110 Viúvo I4 19 L7 50 total 134 t41. t25 400 Na tabela anterior, a última coluna representa o tamanho da amostra sclecionada em cada subpopulação. Observe que esses valores foram fixados lntes da coleta ser realizada. As hipóteses a serem testadas são: Hu : Apreferência por certo tipo de filme é igual para qualquer estado civil; H; : Apreferência muda. A proporção dos indivíduos que preferem filmes policiais é 1341400. Se a variável Filme for homogênea entre as subpopulações de Estado Civil, devemos tcr essa mesma preferência por filmes policiais, para qualquer estado civil. Logo, o valor esperado de preferência pelo gênero Policial, na subpopulação dos solteiros, deve ser I00xL341400. Para as outras subpopulações, multiplicamos 1341400 pelos respectivos valores do tamanho de amostra, que são diferentes tìcsse exemplo. A tabela de freqüências esperadas é apresentada a seguir: Estado Civil \ Filme Policial Comódia Romance tam. amostra Solteiro 33,50 35,25 37,25 100 Casado 46,90 49,35 43,75 t40 Divorciado 36,85 38,78 34,37 110 Viúvo 16,75 L7.62 15,63 50 total 134 741 t25 400 Cirlculamos a quantidade Q2 damesma forma como fizemos anteriormente, isto é, virmos quantificar a "distância" entre os valores observados e aqueles esperados, sC houvesse homogeneidade. Assim, '' '- (oi,i - ei'.i)2 "-:LL;:r i:L et'i para um número grande de observações, a distribuição de Q2 é Qui- Quadrado com (r - 1) x (r - 1) graus de liberdade (r, número de linhas e s de colunas). A regiào crítica contém vnlores grandes de Q2, isto é, Cupítub 8: InJèrência Estatístiaa: Testes de Hipóteses RC:{u:w}q"}, corn qí, sendo determinado pelo nível de significância do teste, ou seja, a: P(Q2 ) q.lHo verdadeiro). Escolhendo a : 0,05 obtemos, da tabera da densidade eui-euadradocom 6 graus de liberdade, g" : I2,5g. portanto, -,,RC:{w:w>I2,59j. Para o valor observado de Ç2 temos: --\ Q?,,,. :(45 - 33,50)2 + (36 - 46'90)2 + ... -L (rL.- ,r,ur;,Y(,hs - 33J0 - -- 46p0 -t_ ..'f Ë : 13,29. concluímos pela rejeição da hipótese nula, ou seja, a preferência de firmes não é, a mesma nas diferentes subpopulações definidas pelo estado civil. tr Exercícios da Seção 8.5: l. utilizando a tabela da distribuição eui-euadrado determine (aproxime se necessário): a. P(Xl > 14,70). b. P(x], > 3e). c. P(Xr2, < g). tl.P(L2<X?r<J0,2). c. O valor de a tal que P(Xl, ) a) : 6,95. f. O valor de b tal que p(Xl ) b) : 6,91. g. O valor de c tal que P(X], ( c) : g,g5. 2. um pediatra pretende avaliar se o sexo de bebês pode ser modelado por umadistribuição de Bernoulli, com p: 0,55 indicando a probabilidade de nascimento de meninas. Uma amostra.aleatória de 25 nasciÁ"nto. indicou l3 mcninas. a. Formule as hipóteses adequadas. b. Qual é a conclusão ao nível de significância de 5Vo? 27,\ 8.5 Testes QuïQuadrado 3. Quatro máquinas de grande porte trabalham de forma independente e, ao fim dajornada de trabalho, são vistoriadas pelo controle de qualidade. Caso necessitem, serão ajustadas. Das informações arquivadas pela empresa, sorteamos 22 dias e anotamos o número de máquinas que sofreram ajuste nesses dias. Os dados são apresentados na tabela abaixo. O engenheiro de manutenção pretende verificar se é adequado o modelo Binomial com n : 4 e probabilidade de ajuste p : 0,L Use um nível de significânci a de 4Vo. Ajustes diários 0 1 2 tJ 4 Freqüência 13 6 2 1 0 Para verificar a qualidade do processo de fabricação, cabos de aço são submetidos ao ensaio de tração até acontecer a ruptura. Os cabos têm 5 metros de'comprimento e deseja-se testar se o modelo Uniforme Contínuo é adequado. Para 30 cabos, sorteados ao acaso, obtivemos a seguinte tabela: Faixa freqüência 0l-L 7 r l-2 6 2 t-3 4 3t- 4 6 4l- 5 7 Qual é a decisão para uma probabilidade de erro tipo I de 0,02? Em um experimento para verificar a relação entre crises de asma e incidência de gripe, 150 crianças foram escolhidas, ao acaso, dentre aquelas acompanhadas pelo Posto de Saúde do bairro. Os dados referentes a uma semana são apresentados na tabela abaixo. Asma \ Gripe Sim Não Sim 27 34 Não 42 47 Você acha que as ocorrências de asma e gripe são independentes? Use a: 4Vo. A opinião sobre o atendimento de pacientes com AIDS em hospitais públicos foi estudada em duas cidades. Na cidade A, sorteou-se 150 usuários e, em B, 200. Com os resultados apresentados na tabela abaixo, você diria clue a opinião é a mesma nas duas cidades? Use a : \Vo. 279 4. 5. 6. Cidade \TtenAìmenro 7. 280 8.6 Exercícios Em uma facurdade, o desempenho esportivo dos alunos está sendo estudadopara dois cursos diferentes. oi cursos âe administ.uçao"l"orioiriu fo_"""rumamostras que estão represenradas abaixo. você acredtr; ;;;';; arunos dessesdois cursos têm o mesmo desempen ho, ao nível 4Vo? Ca píl u I o 8 ; l n I'e rô n c i tt El ttr I lt; t i er t :,1,t, ;i t e :t tI e I I i p(t I e.re s Cursos fDesernpen[õ Bom Regular Ruim Totalô{lmtnlsraçAo 65 70 45 180Ecqnomia nÈ72t 10\ 20 150 1' Suponha que queiramos. testar Ho i k: 50 versus Ho :, ) 50, onde tt é amédia de uma variâver areatóriá úormal com desvio-padrão igual a 10.Extraída uma amostra de n:36 erementos da popuração, observou-seT obs : bB. Faça o teste utilizando os níveis lVo,2Vo, Sà à tO E". 2'uma fábrica de automóveis anuncia que seus caÍros consomem, em média, r0litros de gasolina por 100 quilômetroï, com desvio padrão de 0,g litros. umarevista desconfia que o consumo é maior e resolve tËrtu, "rru afirmação. paratal, analisa 35 automóveis dessa marca, obtendo "on,o "oàrumo médio 10,2litros por 100 quilômetros. considerando que o "on.uÁo siga o modeloNormal, o que a revista pode concluir sob.e o anúncio ão-nau.i"u ao nível de7Vo? Qual o erro tipo II só a média for 10,6? ---- ** 'J 3' uma máquina deve produzir peças com diâmet ro de 2cm. Entretanto, variaçõesaconrecem e vamos. assumir que o diâmerro d"rr", ;;;;, ,igu o modeloNormal com variância iguar u b,09 cm2. para t"rtu, ,"'a'iìaquinu está bemregulada, uma amostra de 100 peças é coletada. a. Formule o problema como um teste de hipóteses. b. Qual seria a região críticase a : 0,02? c' se a região de aceitação fosse {r e JR r l,gb í r { 2,0s}, qual seria onível de significância do teste? N"rr" caso, determine a probabilidade doerro tipo II se 7_r : 1,95 cm. d. Se para essa amostrã,Ì ort.s : L,g4:qual a decisão em (b)? E em (c)? =!:FF ll.(t lixcrclcirts 4. O atual tempo de travessia com balsas entre santos e Guarujá é considerndo uma variável aleatória com distribuição Normal de média l0 minutos e desvio padrão 3 minutos. Uma nova balsa vai entrar em operação e desconfia-se qUc será mais lenta que as anteriores, isto é, haverá aumento na média especificadn no modelo acima. a. Especifique as hipóteses em discussão' b. Interprete os erros tipo I e tipo II' c. Para uma amostr a de 20 tempos de travessia com a nova balsa, obtenha tt região críticaconsiderando um nível de 57o' d. Calcule a probabilidade do erro tipo II, se a nova balsa demora, em média, 2 minutos a mais que as anteriores para completar a travessia. 5. O nível de colesterol no sangue é uma variável com distribuição Normal, de média p desconhecida e desvio-padrão o = 60 mg/100 ml' a. Suponha que várias amostras de tamanho n são escolhidas ao acaso desttt população. Para cada indivíduo, o nível de colesterol é obtido e a média de "uãu urrru das amostras é calculada. Qual deve ser o valor de n para que apenas lOVo das médias amostrais excedam a média populacional ern l0 unidades ou mais? b. Teste a hipótese de que p:260, contra a alternativa de que p > 260com base numa amostra de 50 pacientes, em que se observou uma méclin amostral Í,"," :268. Utilize um nível de 5Vo' c. Qual deve ser o tamanho da amostra, escolhida na população acima, paro que o intervalo de confianç a para 1t tenhaum comprimento de 30 unidades? Use 'Y :997o ' d. Para o teste especificado em (b), calcule a probabilidade B para o erro de tipo II, se o valor real de p for igual a790' 6. Suponhamos que o tempo de cura para um doente tratado pelo método A obàdeça a uma distribuição Normal, com média de 7 dias e desvio-padráo de2 dias. Um novo tratamento B é proposto com a finalidade de dimjnuir o tempo de cura desse tipo de paciente. Em um experimento clínico, 25 pacientes com.0 doença receberam o nouo tratamento B e ãbservou-se que a média do tempO de restabelecimento para eles foi de 6 dias. ' a. Sabendo que o novo tratamento não influi na variância, identifique as hipóteses adequadas e teste-as, considerando um nível de significânciit a:0102. b' construa um intervalo de confianç a ('Y : 95vo) para a verdadeira média da distribuição do tempo de cura sob o tratamento B' 281 282 Capítulo 8: Inferência Estatística: Testes de Hipóteses 7. Uma empresa fabrica cilindros com 50 mm de diâmetro. O desvio-padrão dos diâmetros produzidos é de 3,0 mm. A fim de saber se a produção encontra-se dentro dos padrões esperados, a cada hora, 4 cilindros são amostrados e têm seus diâmetros medidos. A média dos diâmetros é usada para decidir se o processo de fabricação está operando satisfatoriamente. Assim, se o diâmetro médio estiver entre 47 e 53 mm, o processo deve continuar, caso contrário, a produção é interrompida e ajustes são feitos. Suponha que o comprimento dos diâmetros é bem modelado por uma distribuição Normal. a. Qual é a probabilidade de se parar incorretamente 4píodução, se a média do diâmetro continuar em 50 mm? b. Qual é a probabilidade da produção .ontíì\ se a média do diâmerro se deslocar para p:52? t\ 8. Sabe-se que a concentração média de cloro enco\ada na urina de recém- nascidos, com gestação de 9 meses, é igual a 210 unidades e que o desvio- padrão correspondente é igual a 20 unidades. Sabe-se também que, em recém- nascidos prematuros, a concentração de cloro na urina tem um desvio-padrão igual àquele observado para os outros recém-nascidos, porém suspeita-se que a concentração média seja menor. Para testar a veracidade desta suspeita, uma amostra de recém-nascidos prematuros será observada com relação às concentrações de cloro na urina (admita que siga o modelo Normal). a. Formule as hipóteses adequadas. b. Quantos recém-nascidos prematuros devem ser observados para que tenhamos simultaneamente d= IjVo e 0rzoo)= 57o. c. Obtenha o nível descritivo do teste, se a concentração média de cloro observada na urina de uma amostra de 25 prematuros foi de 200 unidades. Interprete. 9. Um laboratório que fabrica comprimidos analgésicos anuncia que seu remédio contra dor de cabeça leva em média 14 min para aliviar a dor, com desvio- padrão de 5 min. Um médico sustenta que o tempo é maior e seleciona aleatoriamente 40 pacientes. Pede a eles que tomem tais pílulas quando tiverem dor de cabeça, anotando o tempo (em minutos) até o alivio da dor. Após coletar todas as respostas, ele verifica que o tempo médio de alivio para esses pacientes foi de 19 min. Estes resultados confirmam a afirmação feita pelo laboratório? Faça as suposições necessárias e use a:\Vo. 10. Considere o teste p:0,6 contra p+0,6.Sendo n:100, indique a probabilidade de erro tipo I para as seguintes regiões críticas: a. RC : {r e IR lr < 0,56 ou r } 0,64}. 8.6 Exercícios 283 b. RC : {r e lR l" < 0,54 ou r > 0,66}. 11. Uma empresa não pode produzir mais que 5% de unidades defeituosas de um artigo num mesmo lote. Seja p a proporção de unidades defeituosas em um certo lote e suponha que, nesse lote, 100 artigos são sorteados para serem inspecionados. Responda as seguintes questões: a. Qual o parâmetro que se deseja testar? b. Qual é o estimador a ser utilizado e sua distribuição? c. Indique as hipóteses a serem testadas e interprete-as. d. Determine o critério de decisão com nível de significância de SVo. e. Com o critério obtido, calcule a probabilidade de aceitar um lote com77o de defeituosos. f,. Se forem observadas 10 unidades defeituosas, qual é o nível descritivo? 12.Uma urna contém bolas vermelhas e azuis. Para verificar a hipótese de iguais proporções dessas cores, extraem-se com reposiçáo,64 dessas bolas e decide- se aceitar a hipótese acima, se o número de bolas vermelhas retiradas estiver entre 28 e 36. a. Determine a probabilidade de rejeitar a hipótese, quando ela é realmente correta. b. Qual é a probabilidade do eno tipo II, se a verdadeira proporção de bolas vermelhas é 0,6? c. Quanto vale a função poder, se a proporção de bolas vermelhas é 0,4? 13. A experiência mostra que a taxa de complicações, associada a um determinado procedimento ciúrgico , é de 0,,20. Com o objetivo de reduzir essn taxa, um pesquisador desenvolveu um novo procedimento e o aplicou a umet amostra de pacientes. a. Se ele usar a nova técnica em 100 pacientes, qual deveria ser a taxa limite para que conclua que a nova técnica é melhor que a anterior? Fixe o nível de significância em 0,05. _ b. Se a verdadeira taxa de complicações associada à nova técnica for 0,08; qufll é a probabilidade de que, em uma amostra de tamanho 100, ele não consigtt rejeitar a hipótese nula? c. Suponha que o pesquisador mantenha a : 0,05 e deseje goJ :0,05. Qual deve ser o tamanho da amostra para que isso aconteça? 14. Entre milhares de casos de pneumonia não tratados com sulfa, a porcentagem que desenvolveu complicações foi de lo7o. Com o intuito de saber se o emprego das sulfas diminuiria essa porcentagem, 120 casos de pneumonit Capítulo 8: Inferência Estatística: Testes de Hipóteses foram tratados com sulfapiridina e destes, 6 apresentaram compricações.Admitindo que os pacientes são comparáveis em tudo, exceto quanto aotratamento, teste a hipótese de que a proporção de casos com compricações entre os pacientes tratados com sulfa é signìficativamente menor do que os nãotratados. calcule o nível descritivo e tome a decisão considerando a : 0,05. 15' Uma caixa tem bolas pretas e brancas. Existem 3 de uma cor e 2de outra, masnão se sabe ao certo qual a cor predominante. Retiramos, ao acaso e comreposição, 50 bolas da urna e observamos 2g bolas bçancas. seja p u p.oporçãode bolas brancas na caixa, pergunta_se: - 7*'-* a. Qual seria o teste adequado para decidir sobre a,composição da caixa?b.Qualconclusão, aonível a : I\Vo? --\ r---5 c. Determine a probabilidade do erro tipo II. ì 16. um milionário dá uma grande festa e resolve ru"lr r,nu brincadeira com seusconvidados (que a 'esú altura já esravam ;;h ";-"dos...). Dentre ospresentes, tidos como bons degustadores de vinho, sorteia 30 pessoas e oferecea cada uma dois- copos de champanhe, numerados r e i, e solicita queindiquem quar deles tem champanhe importada (é ob;ig;tório escolher umúnico copo). Na verdade, os dois copos contém a mesma òhampanhe nacional!Deseja-se decidir se o "grupo" ainda é um bom provador de champanhe. a. Indique çomo formular as hipóteses nula e alternativa pu.u "rr" problema.b' Que decisão você tomaria, ao níver de significância o : 0,0g se 23 pessoas escolhessem o copo número 1? I c. E se 24 pessoas escolhessem o copo2? 17. um comerciante compra frutas para revenda e seu preço prevê no mâximo 5vode frutas estragadas para que ele consiga algum lucro. Corno não tem recursospara contratar um estatístico, ele adota a seguinte regra práticar toma, de cadalote, 30 frutas ao acaso. se 3 ou mais estiveie- "rt.ulguaàr, o to," é devorvido;caso contrário é aceito. a. Qual a probabilidade do erro tipo I, no teste adotado pelo comerciante?b' Esboce a função de poder do teste. comente o teste do comerciante. 18. um dado é lançado 216 vezes e o número de vezes que ocorreu a face 6 écontado. Decide-se aceitar a hipótese de que o dado e hánesio, se o número deocorrências estiver entre 31 e 41. a. Formule as hipóteses nula e alternativa e indique a forma da região crítica.b. Qual é a probabilidade do erro tipo I? c. Qual seria a região crítica do tesúe ao níver 2vo designificância? 2U4 2858.6 Exercícios 19. Suponha que se deseje estimar a proporção p de indivíduos com certa moléstia em uma dãda região. Selecionou-se uma amostra aleatíria de 100 pesso4s e constatou-se que 25 eram portadoras da moléstia. a. Calcule a estimativa pontual da proporção p ' b. Construa um intervalo de confiança para p com coeficiente de confiançn ? : 0,95. Qual o comprimento do intervalo? c. Um pesquisador acredita que a proporção de doentes é superior a20Vo,Teste essa hipótese ao nível a : 0,05. Formule as hipóteses nula e alternativa. 20. Testes exaustivos realizados pela indústria Cookbem indicam que seu forno de microondas tem probabilidade 0,1 de apresentar a 1a. falha antes de 900 horas de uso. Um novo método de produção está sendo implantado e os engenheiros garantem que a probabilidade acima indicada deve diminuir. Com vistas t verificar essa afirmação, escolheu-se aleatoriamente 100 aparelhos parsl realizar testes acelerados e os resultados indicaram que 8 deles tiveram sua lu. falha antes de 900 horas. a. Formule as hipóteses adequadas. b. Determine o nível descritivo. c. Verifique se os engenheiros tèm razáo, considerando um nível de significância a : 6Vo. 2l.IJmaamostra de 10 adultos, na faixa de idade de 19 a 25 anos, apresentou Umtl freqüência cardíaca média de 68,7 batidas/min, com desvio-padrão de 8t67 batidas/min. Um manual de procedimento clínico indica que a pulsação rnédin para indivíduos nessa faixa etária deve ser igual a T2batidas/min. Admitindo qu" u variável medida se comporte de acordo com um modelo Normal e usando um nível de significância igual a a:47o, vocè diria que os dados fornecidos são compatíveis com a informação do manual? Qual é o nível descritivo correspondente aos resultados fornecidos pela amostra? 22. A resistência à ruptura em cabos de aço é considerada uma variável Normnl com média e variância dependendo de outros fatores' Uma amostra de 12 cabos produzidos por uma empresa são levados a teste para indicar se eles podem ser usados na construção de uma ponte. Cada cabo para ser uSudo precisa ter carga média de ruptura de no mínimo 2500 kg. Indique a conclusÍIo qu" ," pode tiãr, baseado no nível descritivo, se os seguintes resultados fbrenl observados na amostra: 2518, 2492, 2450, 2535, 2547, 2486, 2455, 2499, 2522,2505,2469 e244O. 28() Capítulo B: Inferência Estatística: Testes de Hipóteses 23. o crescimento de-bebês, durante o primeiro mês de vida, pode ser modeladopela distribuição Normar. Admita que, em média, um crescimento de 5centímetros ou mais seja considerado satisfatório. Deseja-se verificar se ocrescimento de bebês de famílias em um bairro da periferia de são paulo acompanha o padrão esperado. para tanto, 10 recém-nascidos na região foram sorteados e sua altura acompanhada, fornecendo as seguintes medidas de crescimento em centímetros: 5,03; 5,02;4,95;4,96;5,01; igl; q,gO;4,9I;4,90 e 4,93. a. Que hipóteses estão sendo testadas? b. Qual é o estimador a ser utilizado para testar as hipóteses em (a) e qual é a sua distribuição? c. se a região crítica^construída é {i e IR : I <--g.g7}, encontre o valor de a.Qualaconclusão? )- d. Qual seria a região críticae a conclusão se a : Sh"t 24, Aporcentagem anual média da receita municipar kpr.guau em saneamentobásico em pequenos municípios de um estado tem sido ívo 6d^ituque esseíndice se comporte segundo um modelo Normal). o governo pretende melhorar esse índice e' para isso, ofereceu alguns incentivos. para verificar aeficácia dessa atitude, sorteou 10 cidades e observou as porcentagens investidas no último ano. os resultados foram (em porcentagem) g, 10, 9, 11,8, 12, 16, 9, lr e 12. os dados trazem evidência de merhoria, ao nível de 2To? caso altere a média, dê um intervaro de confiança para anova média. 25. Alguns cientistas acreditam que em média 50|,o dosmateriais expelidos por erupções vulcânicas são constituídos de enxofre. Seja X a massa de enxofre contida a cada 2 quilos de material vulcânico. Acúita-se que essa variâvel rrão tem distribuição Normal. uma amostra de 100 caixas de 2 quilos desse rruterial forneceu Ër, : 98 (em kg; " flrf : 100 (em kg2).i:r l:1 a. Qual a distribuição de X? Indique as suposições feiras. lr. Formule as hipóteses e obtenha a região críti.u p*u a : 5vo. c. Qual a conclusão do teste? d. Qual é a probabiridade do erro tipo II, se os vurcões experem 52vo de enxofre? 26. Deseja-se verificar se o modelo uniforme Discreto com valores de 0 a 5 pode ser usado para modelar o número de reclamações que chegam por hora a umacentral de Atendimento ao consumidor. o sorteiò ae tío períodos de umahora forneceu os seguintes dados: 8.6 Exercícios 287 Reclamações 0 1 2 tr) 4 5 Freqüência 8 tôÒt) 28 24 16 12 Formule as hipóteses testadas e dê a conclusão ao nível de 5Vo de significância, 27. rJma indústria registra, em cada semana, o número de dias em que ocofrem acidentes de trabalho. Para uma amostra de 200 semanas, verifique se os dados apresentados a seguir, aderem ao modelo Binomial com parâmetros n : 5 e p : 0,2 (use nível de significância de lj%o). No. de dias com acidentes 0 1 2 tJ 4 5 Freqüência 64 56 40 24 8 8 28. O número de chegadas de clientes a um banco foi anotado minuto a minuto para uma amostra de 7O períodos (de um minuto). Os dados foram os seguintes: No. Chegadas 0 1 2 qJ 4 5 6 mais de 6 Freqüência I 15 77 11 7 5 4 2 O modelo de Poisson foi proposto para modelar essas chegadas, qual a suu opinião? 29. O tempo residual do efeito de um agrotóxico está sendo analisado. Estudos anteriores, com produtos similares, indicam que o modelo Exponencial cOm média de 3 dias poderia ser adequado. Qual a conclusão, ao nível 57o, se Ll análise em laboratório de uma amostra de 300 aplicações do agrotóxico forneceu os seguintes tempos residuais: Faixas de Tempo 10, 1) r,2) [2,3) [3,4) t4,5) [5,6) [6, oo) Freqüência B9 60 43 40 25 22 2L 30. O preço unitário de mudas de laranjeira (em reais), em atacadistas especializados, é uma variável aleatória que se pretende modelar pela Normal. Com base nos clados apresentados na tabela a seguir, teste a hipótese de que o 288 Capítulo 8: Inferência Estatística: Testes de Hipóteses modelo Normal é, significância de 5Vo. adequado a esse caso, considerando um nível de 3L. Usando os dados abai entre o número de filhos tal fato considerando u formular as hipóteses). Renda \ Filhos 0 1 2 >2 menos de 2000 15 27 50 43 2000 a 5000 25 37 l2 8 5000 ou mais 8 T3 9 10 32.8m uma escola de ensino médio, o desempenho dos alunos em matemática e física foi observado (ver tabela a seguir) para testar se existe dependência entre as duas disciplinas. Física \ Matemática Notas Altas Notas Regulares Notas Baixas Notas Altas 46 77 22 Notas Regulares 47 r43 5B Notas Baixas 29 72 40 calcule o nível descritivo. Qual a decisão, ao nível de significânci a2vo ? 33. Acredita-se que o empenho de estudantes universitários muda no decorrer do curso. Para investigar essa afirmação, decidiu-se estudar a relação entre ano de curso e aprovação em disciplinas. Os pesquisadores obtiveram os registros de 186 estudantes universitários, selecionados aleatoriamente, dentre a totalidade de alunos de uma certa instituição de ensino superior. Foram consideradas 3 Faixas de Preço Freqüência 0,50; 0,60) 23 0,60 0,65) 36 0,65; 0,70) 64 0,70; 0,75) 95 0,75; 0,80) L02 i 0,80; 0,85 71 0,85 0,90) 4ú 0,90; 1,00) .-14 xo, verifique descritivam$nte e o rendimento familiar ({m r m nível de sienificância Ne : se existe dependência reais). Em seguida, teste 17o. (Não esqueça de 8.6 Exercícios disciplinas básicas em cada ano. Os resultados obtidos foram apresentados na tabela a seguir. Aprovação\ Ano I 2 J 4 Todas 6 5 7 l0 Duas l0 l6 T9 t8 Uma 23 20 t5 7 Nenhuma t5 7 6 2 a. Quantifique o grau de associação entre aprovação e ano cursado. b. Teste a hipótese de que as duas variáveis são independentes, ao nível de significânciade 57o. c. Obtenha o nível descritivo. 34. Quatro grupos de pacientes com úlcera duodenal foram submetidos a diferentes cirurgias caracterizadas pela porcentagem de tecido gástrico removido. A tabela apresentada a seguir contém dados referentes à classificação dos pacientes quanto à severidade de uma seqüela indesejável da cirurgia. Cirurgia\ Seqüela Nenhuma Pouca Moderada Total Y+D (OVo) 61 28 7 96 Y+A(25Vo) 68 23 13 t04 V+H (507o) 58 40 12 110 G+R(75Vo) 53 38 6 97 Verificar se existe associação entre a porcentagem de tecido gástrico removido e a severidade da seqüela. Utilize o nível descritivo. 35. Investiga-se, para um certo produto, a fidelidade (alta, média e baixa) de seus consumidores. Em uma amostra de 200 homens e 200 mulheres, foram classificados como tendo alto grau de fidelidade 120 homens e 80 mulheres, enquanto com grau médio, 50 mulheres e 50 homens. Os dados fornecem evidências (use a= 27o) de possíveis diferenças de grau de fidelidade entre os sexos? Indique o teste realizado. .Ì6. Um levantamento inicial sugere que o núrnero de filhos depende da rendn familiar dos pais. Para confirmar essa suspeita, amostras de famílias foram coletadas, em cada classe social, e o número de filhos em cada família foi contado. Verificlue utravés de um teste de hipóteses se a variável tem 289 resumidos e são 290 Capítulo 8: Inferência Estatística: Testes de Hipóteses comportamento diferente em cada uma das subpopulações estudadas (use nível de significância de l%o). 37. Deseja-se comparar o grau de instrução dos hapitantes de quatro cidades brasileiras que têm aproximadamente o mesmo tpmanho populacional. uma amostra de 100 habitantes foi sorteada em cada iidade e o nível educacional das con foi observado. Dos resultadosas pessoas rol oDservado. ljos resultaclos apÌesq onclusão podemos tirar, usando o nível descritivo na tabela abaixo, Cidade\ Instrução Fundamental Médio Suderior Pós Graduação A 26 65 I 1 B 10 46 30 L4 C 17t,rJ 22 5 0 D 55 40 2 tr) que 38. A reação ao tratamento por quimioterapia foi estudada em quatro grupos de pacientes com câncer. Retirou-se uma amostra de pacientes de cada grupo o classificou-se a reação em três categorias: pouca, média e alta. Teste, ao nível de 2Vo, se todos Òs tipos de câncer reagem da mesma maneira. Câncer\ Reação Pouca Média Alta Total Tipo I 51 tttJ r-, 16 100 Tipo II 58 29 13 100 Tipo III 48 42 30 L20 Tipo IV 26 38 16 80 39. um índice sobre qualidade de vida foi observado em uma amostra de 400 idosos. Os dados são apresentados a seguir. Faixas [0, r0) r0,20) lzu,3u) 30,40) 140,45) 45,50) Freq. 7 15 32 55 48 60 Faixas [50,55) 55,65) lbb, íu) 70,75) 175,85) 185, t00l Frcq. 55 56 28 20 18 6 Classe\ Filhos 0 I 2 J >3 Baixa 15 27 40 64 54 Média 25 27 28 L2 8 Alta 10 25 15 8 2 8.6 Exercícios a. Teste se a média do índice é ou não igual a 50. b. Com base no item (a), verifique se o modelo Normal é adequado para este índice. Como ficaria sua resposta sem utilizar a informação do item (a)? 40. As tabelas a seguir contêm o número de pessoas segundo origem e opinião a respeito do aborto. 29t Masculino Orieem\ Opinião A favor Contra Capital l-0 45 Interior 18 90 Feminino Origem\ Opinião A tavor uontra Capital 55 40 Interior 22 20 a. Para cada sexo, verifique se origem e opinião são independentes. b. Combine as informações em uma única tabela desconsiderando sexo e teste novamente a independência das variáveis- c. Discuta os resultados obtidos em (a) e (b). 41. (Use o computador) Considerando os dados do arquivo cancer.txt descrito no Exercício 24 do Capítulo 1, defina dois grupos: um de pacientes jovens,.com idades inferiores a 54 anos, e um de pacientes idosos, com idades superiores a 54 anos. Os grupos deverão conter I9l e lTl pacientes. Considere a variável nitrogênio na uréia (l/). a. Construa um box-plot para a variável ltr, para cada um dos gnipos etórios e compare-os descritivamente. Com base nos gráficos, existem indicações de que a idade está influenciando a concentração de nitrogênio na uréia? f. É Oe interesse verificar se a média populacional da variável .lü para os pacientes idosos é superior a 15. Supondo que o modelo Normal com desvio padrão o: 7 é adequado, qual a conclusão que pode ser tirada, para um nível de significância e :0,001? c. Considerando agora o grupo de pacientes mais jovens, verifique se a médiar populacional para l/ é menor que 15. Suponha que o desvio padrão populacional é conhecido igual a 5 e que o modelo Normal é adequndo. Obtenha o nível descritivo. d. Com base nos resultados dos itens (b) e (c), discuta o comportamento das ' médias da variável .A/ para os dois grupos de pacientes. 42. (Use o computador) Suponha que os dados do arquivo areas.txt (ver descriçf,o no Exercício 25, Capítulo 1) corresponde a uma amostra de vdrios crnpreendimentos de umiì nìesma empreiteira. Segundo o memorial descritivo do empreenclimerrto, as uniclacles devem ter área total igual a 50 m2, independentemente do bloco. Iintretnnto, suspeita-se que as unidades do bloco B não satisl'azem s essn especiÍ'icitçÍio. 292 Capítulo 8: Inferência Estatística: Testes de Hipóteses a. Paru cada bloco, construa um histograma païa as áreas de cada um dos cômodos das unidades. Compare os gráficos. Para cada cômodo, discuta se existe diferença entre os tamanhos para unidades do bloco A quando comparadas com unidades do bloco B? b. Teste a hipótese de que os apartamentos dos edifícios construídos satisfazem, em média, ao memorial descritivo que especifica que a 6rea da sala deve ter no mínimo 28 m2. Use a : 0,05. c. Construa uma nova variável com a informação da ârea total (isto é, obtenha uma variável que é a soma das áreas de cadq cômodo) e faça histogramas considerando cada bloco. O modelo Normfl lhe parece adequado para descrever o comportamento dessa nova variâ/el? d. Verifique se, em média, a ârea total na<r as unidades do bloco A são inferiores ao valor estipulado. Use a : Ò\03 e assuma que o modelo Normal é adequado. I e. Repita o item (d) para as unidades do bloco B( f. Baseado nos resultados obtidos nos itens \anteriores, você diria que a empreiteira está, de fato, desrespeitando a metragem estipulada? 43. (Use o computador) Considerando os dados do Exercício 40, suponha que alguns proprietários de unidades, vendidas pela empreiteira, estão movendo uma ação judicial. Eles alegam que a proporção de apartamentos apresentando rachaduras está exageradamente alta, superando 30Vo das unidades. a. Utilizando a variável Rachadura, discuta quais modelos probabilísticos poderiam ser utilizados para descrevê-la. b. Verifique se a proporção de apartamentos apresentando rachaduras está, de fato, muito alta. Utilize um nível de significância de 2Vo. 44. (Use o computador) Considere os dados do arquivo aeusp.txt (Exercício 26, Capítulo 1) que corresponde a uma amostra da população de baixa renda da região do Butantã-SP. a. Teste se o número médio de residentes em casas da população acima mencionada é inferior a 4. Indique as suposições adicionais necessárias. b. Verifique estatisticamente se a proporção de trabalhadores com carteira assinada, nessa população, é inferior a 40Vo. Use a : 57o. 45. (Use o computador) Continuando com os dados do arquivo aeusp.txt (veÍ descrição no Exercíci o 26, Capítt lo 1), teste a independência entre as variáveis Comun e Renda. Tome sua decisão calculando o nível descritivo. Capítulo 9 Tópicos Especiais 9.1 Introdução Neste capítulo, desenvolveremos alguns tópicos complementares que têm grande utilidade no trabalho cotidiano de profissionais e pesquisadores que fazem uso de métodos quantitativos. Boa parte da teoria necessária ao desenvolvimento das'técnicas a serem apresentadas já foi discutida nos capítulos precedentes. Alguns dos tópicos podem ser elaborados em maiores detalhes e generalidade, entretanto, esta abordagem está além dos objetivos deste texto e demandaria capítulos específicos. Dessa forma, para esses casos apresentaremos uma versão mais simples a título de introdução ao tema. Para um aprofundamento maior, recomendamos consultar a bibliografia apresentada ao final do livro. Num primeiro momento, consideraremos a comparação de duas médias populacionais. Em seguida, apresentaremos alguns procedimentos destinados ao estudo da variância populacional, incluindo aí a comparação de variâncias de du&s populações. uma generalizaçáo do método de comparação de médias, envolvendo mais que duas populações, é considerada no tópico seguinte. O desenvolvimento é baseado no conceito de modelo estatístico, que consiste em decompor o valor de cada observação em uma parte com estrutura conhecida e uma parte residual, com informações que não são explicadas pela mencionada estrutura. Quando o modelo cstatístico é expresso em termos da equação de uma reta, podemos definir um modelo de regressão linear simples, que será discutido na última seção. 9.2 Comparação de Duas Médias Considere que estamos interessados em comparar duas populações com rclação às suas médias. Uma das principais suposições feita no desenvolvimento tlos testes de hipóteses, apresentados anteriormente, foi a de independência entre os componentes da amostra. Ao tratarmos da comparação de parâmetros de duas llopulações, precisamos veril'icrrr sc cstts estão on não relacionadas. Se estiverem 294 Capítulo 9: Tópicos Especiais relacionadas, pode ocorrer dependência entre elementos de amostras diferentes, ainda que cada amostra, internamente, seja composta por elementos independentes. Por exemplo, é muito comum a situação em que observações são tomadas em uma mesma unidade amostral, antes e depois de alguma intervenção. Neste caso é razoâvel considerarmos que a repetição de mensurações em um mesmo elemento cause dependência entre as duas amostras. Veremos, nos próximos exemplos, alguns casos ôom e sem a presença de independência. Exemplo 9.1: IJma distribuidora de combustíyeis deseja verificar se um novo tipo de gasolina é eficaz na revitalização de m\tores velhos. Com esse objetivo, seleciona 12 automóveis de um mesmo modelo\com mais de 8 anos de uso e, após regulagem de seus motores, verifica o consufro de combustível. Em seguida, o carro é abastecido com o novo tipo de combxs{ível durante 15 semanas, e uma nova aferição do consumo é feita. Defina as vari{eis aleatórias Xt e Y como o rendimento do automóvel z respectivamente antesf e após as 15 semanas. Vemos que Xi eY foram medidas em uma mesma unid{de amostral e, assim, é razoável assumir que exista alguma dependência entre ela\. Ressaltamos que, para i'+ i, devemos ter Xi e Xy independentes. O mesmo deve ocorrer para Y e Y'i. Ao medir a característica de interesse em duas ocasiões, para cada uma das unidades amostrais, pretende-se diminuir a influência de outros fatores (muitas vezes impossíveis de serem controlados) e ressaltar um possível efeito do tipo de gasolina no desempenho do veículo. tr Exemplo 9.2: TJmestudo envolve a avaliação de um novo sistema operacional de computador, desenvolvido para crianças com idades entre 8 e 12 anos. Afirma-se que o novo sistema é mais rápido do que o atual, líder de mercado. Para testar esta afirmação, foram selecionados em uma mesma escola dois grupos com 15 crianças cada. As crianças, sem conhecimento prévio relacionado ao uso de computadores, utilizaram máquinas de mesma configuração para realizar uma certa tarefa, que teve seu tempo anotado. O primeiro grupo, denominado Grupo A, trabalhou com o sistema operacional convencional ao passo que o segundo grupo, Grupo B, desenvolveu atividades no novo sistema' Ao final do experimento todas as 30 crianças haviam realizado a tarefa. Nesse exemplo, os dois grupos selecionados consistem de 15 crianças diferentes e, portanto, pode-se assumir que os dois grupos constituem duas amostras independentes. tr A independência ou não das observações é um fator importante a ser considerado mas, como visto em capítulos anteriores, também é importante levarmos em consideração a variabilidade associada aos valores populacionais e arnostrais. Note que, nos testes cle médiat, utilizamos o vnlor cla variârrcia qt 9.2 Comparação de Duas Médias 295 populacional ou um es Dessa forma, para procedermos à comparação das médias, precisamos analisar o que ocorre com as variâncias nas duas populações. Em algumas situações elas são conhecidas por estudos anteriores, censos ou ainda suposições. Se as variâncias populacionais são desconhecidas, existe ainda a questão delas serem iguais ou diferentes. Alguns autores argumentam que, no caso de variabilidades populacionais desiguais, o teste de médias não deveria ser realizado pois as populações,já são diferentes, Apesar dessas opiniões, iremos apresentar neste capítulo um procedimento parÉl esse caso. Resumimos, a seguir, as possíveis situações na comparação de duas populações. Dependentes (caso 1) 2 amostras Variâncias cohhecidas (caso 2) / Variâncias isuais .r' (caso 3A)-Independentes Variâncias desconhecidas Variâncias diferentcs(caso 3B) Figura 9.7: Casos na comparação de duas amostras. Discutiremos apenas os testes conhecidos como paramétricos, para cada um dos casos considerados na Figura 9.1. os testes paramétricos assumem que 0s variáveis se comportam segundo um modelo Normal, ou que as amostras são suficientemente grandes, de modo que uma boa aproximação pode ser conseguida utilizando o modelo Normal. Caso L: Amostras dependentes (teste ú - pareado) No caso de amostras dependentes, desejamos comparar duas médias populacionais sendo que, para cada unidade amostral, realizamos duas medições cla característica de interesse, De modo geral, essas observações correspondem n / \ 296 Capítulo 9: Tópicos Especiais medidas tomadas antes e após uma dada intervenção. Para ilustrar esta situação, considere o Exemplo 9.1 em que medimos o rendimento com a gasolina tradicional e depois com o novo tipo de combustível. Essa é uma típica situação em que o teste ú - pareado deve ser utilizado. Neste caso, é de se esperar que exista alguma correlação entre as observações tomadab em uma mesma unidade experimental. As medidas tomadas antes e após a intervenção realizada serão representadas pelas variáveis aleatórias Xo eY, respectivamente. Desta forma, o efeito produzido pode ser representado, ppra o z-ésimo indivíduo, pela variável Di : Y - X;. Supondo, para i : I, ... ,n,iJ Du - N(Ab,o'o), queremos testar as hipóteses: \ ) Ho : Fo: 0 (a intervenção nib Produz efeito) Ho : pD # 0 (a intervenção p\duziu algum efeito), sendo que a hipótese alternativa pode também ser unilateral. O parâmetro po é estimado pela média amostral D e, como usualmente não temos informação sobre dp, estimamos seu valor por S2p, dado por si:#Dro,-D)'. O teste de hipóteses é realizadoutilizando-se a quantidade r:D-lto _ solt/ã c1ue, sob f/,, segue uma distribuição ú-Student com n - 1 graus de liberdade. O teste segue os mesmos passos discutidos no capítulo anterior. Exemplo9.3.'No Exemplq 9.1, o rendimento foi'representado por Xt eYpara o automóvel 'i, respectivamente antes e após o novo combustível. Os valores observados, em km/I,' junto com as diferenças Di:Y- X;, para os 12 automóveis são apresentados na tabela a seguir. Autom. 2 3 4 5 6 7 8 9 10 1 T2 Após (Y) Iro 8,8 9,9 9,5 11,6 9,1 10,6 10,8 L3,4 t0,ti 10,5 l I,4 Antes (X ) 8,1 7,9 6,8 7.8 7,6 7,9 5,7 ó14 E'0 9,5 8,0 6,8 D:Y-X 3,5 0,9 J'I Ltl 4,0 t,2 4,9 2,4 5,4 1.1 2,5 4.0 .il 9.2 Comparação de Duas Médias Os dados de consumo, antes a após o novo combustível, podem sêf visualizados através de gráficos box-plot, apresentados a seguir, de onde podemos notar indicações de que o rendimento é, aparentemente, maior após o uso do novo combustível. Depois Para podermos verificar se o rendimento é de fato superior, precisamos proceder ao teste: Ho : Fo: 0 (o novo combustível não aumenta o rendimento); Ho, : po > 0 (o novo combustível aumenta o rendimento), com LLD representando o valor esperado da diferença de rendimento, isto é,po:E(Y-X). Estaremos assumindo que a distribuìção de Di:Yi-X,i, para'í : I, ... ,12, é Normal com média pD evariãncia o2o. Com os dados observados, obtemos ã,6" : 2,9 e estimamos oã por s2D ru : 2 14' Logo, sob f/o' tubr :ut'", P :''' . o' : 6148.so,,o,l{n r,551\/12 Com a : 0,05 e utilizando a tabela da distribuição Ú-Student com I I graus de liberdade, obtemos Í,, resolvendo a equação P(T > Ú,,) : 0,05. Obtemos t,,: I,796 e como t,,t* ) ú,,, concluímos que o novo combustível é eficaz nA 297 €14 E5 o c .Ë 12õco cc =- 298 similares. 2q9 melhora do rendimento, acafretando diminuição do consumo pere oveículo considerado no experimento. caso 2. Amostras independentes com variâncias conhecidas Consideramos agora o teste relacionado com a situação em quc ql ::in;1,ï T:1t1'^* jf: populações independ-entes, quando o, .orrrrpuvariâncias são conhecidas. A obtenção dà informaçã; ;;rp.t;';.ïË variância populacional pode ser obtido de estudos anteriores ou experimc; A ('t,nt!ì(t|(tção dct lhms Méllt,t Pol)tllnçoes, :u]tts varrauvr.ò ò4v rasqrr ,rrïr" u* g1g/elo .-^-Áõ 2lu,,,r,,rs; admitir que estas duas populações se comportam confcii:Ï."ï,::Ïiïffi, ;;; ;;. õ";;;; t ;, variáveis areatórias representando a ttrrr.ircterística de interesse'em "ádu o*u das populações. Segue, .qotruilo,, q:í,:: Capítulo t);'ftíplrct comparar dois sl foram selecionadog i ,E E I E ó) F- Exemplo 9.4: Vimos no Exemplo 9.2 que, para operacionais, dois grupos independentes de estuãantes tempo necessário parurcalizar a tarefa foi anotado. Os dados obtidos foram os seguintes (em minutos): Grupo Tempo 182 185 193 175 184 tg2 92 76 76 90 97 90 175 173 I t78 162 179 t64 182 I 86 93 100 115 85 80 90 86 auxiliar eco GruPos [.)rrir's medidas descritivas podem ser calculadas para auxiliar na comparaçõo' tr utilizando a motivação fornecida pelo exemplo anterior, poderrtot{a realizer -';'ilã; geral. Suponitu .1,," desejamos comparar .düN9 rru-:- llaSô- ;ì ;;ì;;'n*.,-"'ii"à'ra'cias sao" i guais u um t :,*: iZ ^ *: ^ 1:i1'j:i; A inspeção visual dos dados sugere que o Grupo B tendetarefa num tempo inferior àquele observãdo puru o Grupo A. para análise- inicial, podemos construir gráficos bàx_ptot puru'o, g*po,lado a lado conforme a figura u,"gui.. Podemos observar que' para os alunos considerados, o novo sisteffiê _:ï:ï:":1t_:r,::::",i1ior_ facilidade de aprendizâdo , "urlut"rirado aqui pelo Note que o valor da mediana do Grupo B é inferior ao do Grupo A, mas ointervalo enrre o primeiro. e .o. rerceiro quaitil é pró;i;;;;;u o. dois grupos,dando a idéia de que a variabilidade do tempo de aprendizaão é semerhante pareambos os sistemas operacionais. E importante ressaltar que, para podermos concluir que o novo sistema éde fato eficaz, precisamos "*trupàlu, as conclusões anteriores para toda apopulação de crianças com idade entre g e 12 anos. Isto pode r", r"ito, realizando o teste de hipóteses que será descrito em seguida u.rr" "*"Àpr,"- A B tempo de execüção de certa tarefa, u.u u", qu " o Uo*'_pioì;;;ô;;Ë Ëãsensivelmente mais baixo. ;:ìïi lïJï:ï:ïuï" .àï"'."****"ã; il 9e;:' ;":'"'' a3"'a'à11: 1''1'Íï:: ïlìï:}Jr""ïlï tiï, .:Ïï;;-i'', ::.,ï, "), representando amostras areatóri âs, --^r-^^ r^ ^*^stf0 :ffi';:,fi':.i]uïïl'ou, populações. Deve ser noiado que os ramanhos de amostrit 'il 1 a't72 podem, eventualmente, ser iguais' Queremos testar -F1, : As médias populacionais são iguais; f/" : As médias populacionais não são iguais' listas hipóteses podem ser traduzidas em termo s de pq e 1t2: Ho : 11,1 -- 1-tz', H': t-tt, * l.tz. 300 Capítulo 9: Tópicos Especiais Se a suspeita sobre a diferença entre as médias é de que a médiade umapopulação é maior (ou menor) do que a média da outra, podemos reescrever f/" como /-r1 > ttz (ou ltt < ttò e proceder ao teste unilateral. como estamos interessados em determinar se a diferença é estatisticamente significante, podemos ainda reescrever as hipóteses em termos de l"O : Itt - F2, isto é, .., Ho:P'p-Q; H."rtto+í, o que sugere trabalharmos com o estimador de p,p: D:X-Y. Comas suposições feitas, temos a--1 X.i - N(pr,o'), [.,: I,2,..., n1; Y.- N(1"r,of;\, i: L,2,..., n2. independência dessas variáveis, D terâ ) : po e quanto à variância, temos: distribuição Normal comPelaE(D Var(D) : Var(X - Y) : Var(X) + Var(y) : or" +ú:rr(!*1\Tt1 rL2 "\r, ,,)' Note que a independência entre as amostras foi necessá ria para obter essa variância, uma vez que a covariância entre as médias amostrais é zero. com estas informações, procedemos ao teste de hipóteses do modo usuar. caso não saibamos qual é a distrìbuição da característica nu foprruçao podemos,para'amostras de tamanho grande, lãnçar mão do Teorema Central do Limite etrabalhar, de modo aproximado, com a distribuição Normal. Exemplo 9.5.' continuando o Exemplo 9.4, sejam Tr e Tz variáveis aleatórias representando os tempos de aprendi zado para os grupos A e B, respectivamente.Tendo em vista que nL: n2: 15, as amostras áu5. ,"rf""iío,populações são os conjuntos de variáveis aleatórias independentes(TIJ,'.. ,4,rs) e (Tz,!, ... ,T2Js). Além disso, assuma que informações adicionais fornecidas pelas empresas indicam que a variabilidade dos tempos de aprendizado é a mesma para ambos os sistemas operacionais e iguar o oi : 19 min. Logo, para i : I,2,...,15, 9.2 Comparação de Duas Médias Tu - N(Pt,100); ' Tzr - l/(p2, 100). Queremos testar H, : Tempo médio é igual para ambos os sistemas ; .F1, : Aprendizado do novo sistem a é, emmédia, mais rápido. As hfnóteses podem ser formulad^ti,t:i : *, Ho:FtlFz, ou, equivalentemente,I HoiFo:FL-Fz:0; Ho:l-ID-ltt-ttz)0. A região críticaserá dada por RC : {d, €.IR : d > d,"} e o estimador de p,p ser6 dado por D :Tt -72, com 30t 15 DT'',n :_1 ^15 15 5- ?o,u .i-1 e 1, : - ' -15 ' Pela suposição de que os tempos seguem o modelo Normal e, lembrando que as amostras são independentes, segue que a distribuição de D é Normal com média p,p e variãncia var(D) : var(Tt) + var(72): # * # : # : 13,88. Utilizamos agora o procedimento usual para testes de hipóteses, fixando a : 0,05 e encontrando um valor crítico d. tal que P(rejeitar H"l H"verdadeira) : P(D € RC I po:0) Consultando a tabela da distribuição Normal padrão, obtemos 2,, : L,64. Logo, d,:L,64x3,65:5,99. Então, R.C : {rJ e R l íí > 5,99}. J02 Capítulo 9: Tópicos Especiais considerando os valores amostrais observados, temos que a média para o grupo A ê L79,73 min e, para o grupo B, é de 89,86 min. Assim, ã ob, : 179,73 - 89,86 : 89,87. como ãor, € RC,rejeitamos a hipótese nula, iy'to é, a um nível de significância de \vo concluímos que, para alunos .o- /idud" entre g e 12 anos sem conhecimento computacional prévio, o tempo d{ aprendizado com o novo sistema operacional é menor. consideramos, agora, a situação em que as populações apresentam médias desconhecidas e variâncias populacionais conhecidas, porém com valores diferentes. Nesse caso, já sabemos quê as2a{ru)a{oes são difeàntes, uma vez quo as variabilidades da característica de inty'ress" nui duu, populações são diferentes. Ainda assim, podemos estar interessad[s em verificar se as médias também são diferentes e utilizar a teoria de teste de hipóteses, para embasar estatisticamente a decisão a ser tomada. com as suposições e a notação já apresentada anteriormente, temos agora que X - N(px, "ï) "V - N(py, o!,), com ox * oy.Então, N - N(p*,"ï/"r) e Y - N(tr",oï/rz) . ParaD - X -Y eutilizando a independência entre X e 7, temos que ,, Var(D) : Var(X) + Var(Y) - ok + o?, fl,1 TL2 o, então, D - N1tx - lry,oï1ry + o!,1n2).A partir daqui, o teste prossegue n& lbrma usual. No próximo exemplo, ilustramos o procedimento apresentado, de vnriâncias conhecidas porém diferentes. Ilxcntplo 9.6: uma empresa avaliadora de imóveis está estudando as regiõeo cclrtral e oeste da cidade de São Paulo. o objetivo principal é verificar se o preço médio, praticado para imóveis comerciais de um dado tamanho, é o mesmó nâs duas áreas. De levantamentos anteriores, a empresa sabe que a área oestê apresenta uma heterogeneidade de preços imobiliários (em UpC- unidade padrão de construção) maior do que a região central, sendo os desvios padrões iguais a 0,82 uPc para a região oeste e 0,71 UPC para a região central. para verificar sc os preços médios são iguais ou nãon duas amostras, uma de tamanho 20 e outra de turnnnho 18 foram retiradas aleatoriamente de cada região. Os dados são og segu irr tcs: tr 9.2 Comparação de Duas Médias 303 Região Central 4L,2 40,6 39,6 39,2 40,5 40,3 39,4 38,9 39,1 40,9 40,6 39,7 40,3 40,9 4L,2 40,4 40,0 39,6 39,7 4L,2 Região Oeste 37,2 34,9 38,1 37,4 36,1 35,9 35,4 35,7 37,7 36,9 37,4 37,5 36,4 36,6 36,1 38,0 36,8 36,4 Algumas medidas resumo são apresentadas na próxima tabela: Medidas Descritivas Região Central Oeste Arnbas n Média Mediana Desvio-Padrão Mínimo Máximo 20 40,2 40,3 0,7 38,9 4L,2 18 36,7 36,7 0,9 34,9 38,0 38 38,5 39,0 1,9 34,9 4L,2 O comportamento dos dados pode ser visualizado através de gráficos tipo hox-plot, mostrados a seguir. 304 Capítulo 9: Tópicos Especiais Note que o valor do desvio padrão amostral sugere, de fato, que as variâncias são diferentes nas duas regiões; mais ainda, a média de preço na região central parcce ser superior à da região oeste. Para os dados observados, a região central tem, aparentemente, preços superiores à região oeste. Além disso, a variabilidade observada nos imóveis da região ogste é maior, o que, de certa forma confirma a informação fornecida pela empfesa. Em resumo, para os dados apresentados nas duas amostras, temos um maiof preço médio (amostral) para a região central. Essas conclusões são válidas aflçnas para os valores amostrais observados. Para podermos extrapolar esta conc\rsão para as regiões como um todo, precisaremos ltilizar um procedimento esthtístico que controle os erros, eventualmente, cometidos. Representando a informação dos preços naYegião central pela variável aleatória X e, para a região oeste, pela variável aleatória Y, assumimos que os dados são obtidos de duas populações Normais de tal forma que X - N(px,ollzo) e Y - N(try,ol,1ts1. Nosso principar in**'* ;:":ï":ïï:"'"' Ho: Fx * ttv. DefinindoD:X -Ttemos v ar(D) : v ar(X) + v ar(Y) : +. Y : 0,06. Logo, para a : 0,05 vem: P(rejeitar H" I H,verdadeira) = P(D e RC I pt - tt'y : O) :p(2.+ouZ>41:0,05. /0,06 /0,06 Da tabela da distribuição Normal padrão obtemos os valores críticos: Consequentemente, E 9.2 Comparação de Duas Médias 305 RC : {d e R : d, < -0,49 ou d > 0,49} Como em nosso caso ãu6*:40,2- 36,7:3,50 pertence à região crítica, concluímos que os imóveis situados nas regiões central e oeste têm preços médios diferentes, ao nível de significânciade 57o. El caso 3A: Amostras independentes com variâncias desconhecidas e iguais No caso anterior vimos que informações adicionais podem fornecer subsídios para o conhecimento dos valores das variâncias populacionais. Em gerâI, contudo, não temos informações a respeito do valor das variâncias, Entretanto, os processos que geram os dados podem nos levar a crer que, apesar de desconhecidas, as variâncias são iguais para as duas populações. Exemplo 9.7: Digitadores são treinados em uma empresa em duas turmas distintas. Na pri'neira, denominada Turma J, utiliza-se um método japonês de ensino, ao passo que na segunda turma, denominada Turma A, utiliza-se um método alemão. Deseja-se comparar os dois métodos e para tanto, 16 alunos de cada turma foram escolhidos aleatoriamente e uma mesma tarefa foi atribuída a cada um. Ao final do experimento, o tempo gasto na realização da tarefa, pam cada aluno, foi anotado. No processo, dois computadores utilizados pelos alunos selecionados da turma J e três da turma A apresentaram problemas que impediram a realização da tarefa; o tamanho da amostra foi assim reduzido para 14 e 18, respectivamente, para as turmas J e A. Os dados obtidos foram: Turma J A 10139 15 L2 18 Tempos (min) 10 L4 13 10 15 L2 16 15 L7 L7 15 16 109 1013L4 17 11 77 L4 Apesar de não conhecidas, as variâncias populacionais para as duas turmas são consideradas iguais com base em estudos anteriores. tr Para formalizar a situação apresentada, supomos que os dados para o primeiro grupo são representados por variáveis aleatórias independentes Xt, . . . , Xr,,rê, para o segundo, Yt, .. . ,Yrr. Alémdisso, assumimos que Xt - N(px, o2), i : I,...,flri Yi - N(pv,o2), j : 1,...,p2. 306 Calítulo 9: Tópícos Especiais Para ambas as populações, temos a mesma variância o2 (desconhecida). Suponha que nosso interesse é testar HoiFX:lJyi Hu: Fx * t"v. Novamente, consideramôs o estimador D definido pela difeíençaX -Y. Dada a independência entre as amostras, segue imediatamente l6e /1 1\ ,/Var(D\:o2I:-+:-lr/ ' \nt "'/( Além disso, considerando também a normalidade do, ludor, segue que e consequentemente, Como a variância populacional o2 é desconhecida, precisará ser estimada. Tendo em vista que S| e ,5| são ambos estimadores não viciados dessa variância, usaremos como estimativa para o2 umacombinação deles, dada por: 'nl n2 Díx.u-N)'+DVi-T)' :-1 ;-1 ,J- L D - N(p,x - py,o21t1n1+ rln2)). D-(pt-pv) : ^' Arln 1\ o 1/Lln1* If n2 nL+n2-2 Note que S! é :uma média ponderada entre 5| e,Sfl, com ponderação dada por nt-I c nz- 1. Dessa forma, estaremos utilizando para estimar o2, toda a informação disponível nas duas amostras. Além disso, pode-se mostrar que ,9"2 É não viciado para o2. Da mesma forma que na Seção 8.3 do Capítulo 8, o uso do estimador ,9ul nos leva a trabalhar com a distribuição ú-Student, isto é, D-(pr-pv)T_ s"\ÃFTTTM 9.2 Comparação de Duas Médias 307 tem, sob f/,, distribuição t-Student com nr * nz - 2 graus de liberdade Dada a hipótese alternativa apresentada, procedemos ao teste bilateral dn forma usual, isto é, fixado a encontra-se o valor ú, tal que a: P(rejeitar Ho I Il,verdadeira) :P(7 1-t"ouT>t"lH"). A quantidade ú" é então obtida da tabela da distribuição ú-Student, com nt I nz - 2 graus de liberdade. A região crítica para o teste é dada por RC :{t e m. : t 1 - t" ou t > t"}. Uma vez obtidas as amostras, substituindo as estimativas de D e S" na expresSãO de ?, obtemos o valor úo6". Rejeitamos f/o se úo6" pertencer à região crítica. Exemplo 9.8: Para o Exemplo 9.7, podemos escrever as hipóteses de interesse como Ho i Fx: py (os dois métodos são equivalentes); Ho: Px * l.tv, Çom p,y e púy representando, respectivamente, o tempo médio populacional pafn alunos da turma J e da turma Á. As amostras forneceram os seguintes valOres: nt: l4,Totts:11157 e sl"u": 4,L; n2 : L3,Tot " :15,38 e szy"u" : 4,3 ' Então, ãot," -25,',0" Como a hipótese alternativa apresentada é bilateral, a região crítica tem a íbrma RC : {t e m :t 1. -t" ou t) Í"}.Logo, parao-:0,01temos 0,01 : P(rejeitar Ho I H"verdadeira) :P(7 1-t.ou T>t"lH"). l)a tabela da distribuição ú-Student com 25 graus de liberdade, obtemos 1,,, : 2,79. Conseqüentemente, :Íolts -Tot,r: LIr57 - 15,38 :(rr-Dtï*"*(n, -t)tï*":6 -3,81 ; _ L3 x 4,I +_L2 x 4,3 : 4.2 25 .ï08 Ct plt tt I o g : 7'ó pi uts Esltet:itt ltt RC: {te m.:t1_2,7g out}2,Tg}. Utilizando as estimativas calculadas temos, sob I1o, -3,81 \/4,2(rlL4 + 1/13) I Ique pertence à região crítica e, assim, concluímos que os métodos de fato diferem, a um nível de significânciade LVo. tr . dult" -: í t?*"(rlu + Tlnz) : _4,93; Caso 38: Amostras independentes com variâncias desçÁnhecidas e diferentes/ o teste para o caso em que as variâncias são/esconhecidas e desiguais é consideramos as mesmas hipóteses apresentadas no\ quantidade a ser usada para o teste será o teste para o caso em que as variâncias sã?désconhecidas e desiguais éteoricamente mais envolvente. Assim, sem "nfru. em maiores detalhes,consideramos as mesmas hipóteses apresentadar no\cu.o 3A, só qu", ugoru, 4 ,\ r: D-(t"x-ttv) í sk/", + sl,ln2 A exemplo do caso anterior, ú também tem distribuição ú-student, mas osgraus de liberdade z são corrigidos pela expressão (s'"1"t A seqüência do teste é similar àquela apresentada nos casos anteriores. Na Tabela 9.1 mostramos um resumo dos testes considerados nesta seção. Encerramos esta seção, considerando a situação em que a característica deinteresse não se comporta segundo um modelo Normal. Novìmente, a alternativa será coletar uma amostra de tamanho grande o suficiente, a fim de utilizar oTeorema Central do Limite e obter distribuições amostrais aproximadamente Normais. como um exemplo desse procedimento, vamos desenvolver o teste para n igualdade de duas proporções. 'j ,tr-tÊ. Ctttttpuruç{lo de Duets Mérlilt,r :'{ a.2 30e) Tabela 9.1: Comparação de médias para duas populagões, Exemplo 9.9.' Num estudo sobre doenças infantis, desejamos investigar se a incidência de casos de contaminação por vermes é afetada pela idade. Dois grupos de crianças, um com idades de 2 a 4 anos (Grupo I) e outro, com idades de 7 a 9 anos (Grupo II) foram escolhidos para serem examinados quanto iì ocorrência de vermes. Os dados são apresentados a seguir: 3t0 Cttpítu\o g:'l'ópit tts l!,rpeciuis Grupo Amostra Proporção comVerãJnõG I 720 0,095 II 260 0,103 Para saber se as duas faixas etárias acima têm o mesmo comportamento, quanto aincidência dessa doença, podemos rearizar ; Ã;jJ,r,ïnot"r". "nuàtu.nooproporções. / tr ' Considere que desejamos verificar o .o-ponlmento de uma certacaracterística em duas popurações. se a amostra for suficientemente grandesabemos, pelo Teorema central do Limite, que a distribuição de probabilidade daproporção amostral tem um comportamento aproxim qbamente igual ao modeloNormal. Na comparação de proiorções "n., á;;r/d;Ës, usaremos comoestimador a diferença enrre as respectivas propgíções u,norr.uir. ìvão ã oiïr"ìïverificar que ela será um estimadoinao viesaoo 4Jr*""* diferença entre asproporções populacionais. \ população, teremos d'as proporções amostrais independentes e a diferença entreelas também terá distribuiçãó aproximadamente Normal. Assim, se o interesse étestar: Ho : pt : Ih versus Ho i pt # h, então o estimador a ser utilizado será fr, - fr, cuja distribuição será aproximadapela Normal cujos parâmetros são obtiioì, considerando-r" u, relações: E(6r-fr):pt-pz; Var(fi - fr) : Var(f1) +var(f2) - nQ - or) * m(L - m) .TL1 D2 Note que, para calcular a ^variância, a independência entre as amostras garantiu aindependência entre ft " fr e, portanto, a covariância entre eres se anulou.Sendo a hipótese nula verdadeira, as proporções populacionais são iguais.Denotando seu valor comum por p, isto é pr : p2: p, foO"*os obter umestimador para p através da ponderação dos "rir*uããr"r'não viciad., ã ; ,:Dessa forma, obtemos ^ -ntfr.+n2fr,Yp--nrTíz' -!-F t).2 (:(,tnpurilçtlo de Duen Médhts Srrlrstituindo os valores de p1 e Pz Porfl,na exptessão da V ar(f1 - fr), podemos cscrever, sob fIo, Pt -Pz - N(0,1). F,,(L -F)Gln, + Iln2) l)irrir concluir o teste, calculamos a quantidadê zotts, substituindo bt e Íi por suas crrrrespondentes estimativas. Verificamos se zobs peftence à região crítica, que nO clso bilateral é dada por RC :{z e IR l, 1 r", ou z > z"r}. l)aclo um nível de significância a, os valores zct e zc2 são obtidos da tabela dt tlistribuição Normal padrão. Como procedimento alternativo, podemos também usáÌr o nível descritivo para decidir sobre a aceitaçáo ou não de Ho. Iìxemplo 9.10: Parao Exemplo 9.9, testaremos Ho: pt - p2 versus Ho: Pt # Pz, com p1 e p2 representando as proporções de crianças com verminosg nn população dos grupos I e I I, respectivamente. Pelas informações recebidns, rt4 - I20, nz : 260, fior,, :0,085 e frob" :0,103' Logo, sob 'FIo 120 x 0,085 +260 x 0,103 : ç,097; 120 +260 e também, Fnr,"(L -\r,",,,)(Llu * rlnz): 0,097 x 0,903 x (LlL20 + L1260) :0,0011' Segue então que Pt-Pz - t/(0,1). Para a: 0,08 os valores zct e zc2 são calculados através das expressões P((it -DlJo,o}Lt 1 z.,lH,) :0,04; P( (6t - D I Jo,ooLL ) z",l Ho) : o,o4 . .1u nt itot," * Trz ?2ot'"::rltobs n1 I n2 Jt2 Capítulo 9: Tópicos Especiais I xamés escolares, doze alunos pois do exame. 10 11 t2 Assim, RC :{z e R I z < -I,75 ou z } I,TS}. Fazendo os cálculos, temos \ue 2o6": -0,54g não pertence à RC. Logo, aceitamos a igualdade das proporções, ao níver gvo " "on"lrímos que a incidênóiade verminose nas duas faixas etárias pode ser considerâ{a a mesma. tr Exercícios da Seção 9.2: l. Para se avaliar o nível de tensão ocasionada por foram escolhidos e sua pulsação medida antes e Est 83 84 79 88 76 B0 82 75 81 74 77 78 73 76 79 76 71 Faça um teste, com nível de significânci a de l7o, para verificai se existe maior tensão (isto é, maior pulsação) antes da realização dos exames. Indique as suposições necessárias. 2. Sabe-se que o tempo necessário para percorrer uma determinada rota no final da tarde pode ser estudado por um modero Normal com desvio padrão de 17 min. Foram instalados sensores para controlar o tempo de âbertura dos semáforos presentes na rota e deseja-se verificar ." ó t"rrrpo gasto para completar o percurso diminuiu. Estudos anteriores indicam que o tempo ãeve continuar se comportando segundo um modelo Normal, com mesmo desvio padrão. com os sensores desativados, 11 veículos de mesmo ano e marca, denominado Grupo controle, tiveram o tempo gasto no percurso anotado. Em seguida, os sensores foram ativados e outros 13 veículos (Grupo Teste) pcrcorreram a mesma rota. os tempos observados, em minutos, foram os seguintes: Grupo Controle Teste 38 26 17 31 3218 35 29 Indique se o uso dos sensores contribui para diminuir o tempo médio de percurso utilizando o nível descritivo do teste. Instante T utilizados no urso 16 26 38 32 50 2L 20 51 45 49 10 22 9.2 Comparação de Duas Médias 313 3. Para verificar se duas populações têm a mesmamédia, amostras independentes foram retiradas. Sabendo que a população I é Normal (pt,25) e a população II Normal (pz,4o), que conclusão pode ser tirada, ao nível 2vo? os valores obtidos foram: População r 12L4 1514 131714 13 II 1317L4 131617 1816 4. As variáveis X e Y seguem a distribuição Normal com mesma variância, Deseja-se testar se, também, têm a mesma média. Doze observações de cada variável foram escolhidas e os resultados foram os seguintes: 12 12 12 12 tq: 48, DAr:56, Dr?: 4.900 ,DY?: 5.650. 'i:L i:L i:L à:L Qual é a conclusão ao nível de significância de 5To? 5. Para comparar as médias de duas poputações Normais, amostras aleatórias foram obtidas. Sabe-se que as variâncias populacionais são diferentes, $endO seus valores desconhecidos. Dados Amostra I Amostra II 8 11 5 9 15 9 16 8 7 93 27 5 O que pode ser dito a respeito das médias das populações, com a : 0,05? 6. Dois medicamentos para tratamento de infecções bucais estão sendo estudados e o melhor desempenho é definido pela rapidez em eliminar a infecção. Pacientes escolhidos ao acaso receberam um dos medicamentos e tiveram a sua cura classificada em rápida ou não. Deseja-se testar, ao nível 107o, se os medicamentos são equivalentes. Os dados obtidos são apresentados a seguir, Amostra Pacientes com cura râpida Medicamento A 50 32 Medicamento B 100 48 Qual seria sua conclusão? Indique as hipóteses do teste e as necessárias. suposiçõcs 314 Capítulo 9: Tópicos Especiais 9.3 Testes para Variância Os testes de hipóteses considerados até aqui envolveram, como parâmetros de interesse, amédia ou a proporção populacionais. Na seção anterior, vimos que, para desenvolver os testes de comparação,de médias, é importante considerar o que ocorre com a variância populacionâ'1. Nesta seção, estamos interessados em estudar a dispersão dos valores em ur\a ou mais populações, através de suas variâncias. Para isso, apresentamos alguns festes envolvendo essas quantidades. Iniciamos com o caso de uma única populay'ão, conforme motivado pelo exemplo a seguir. ì Exemplo 9./f.' Sabe-se que em uma região doTfaís a altura média é de 1,68 m, com variância 0,30 m2. Um pesquisador acred{a que a alimentação rotineira em uma cidade litorânea, sendo diferente da região òoqno um todo, contribui para que as pessoas apresentem alturas mais homogêneas, apesar de não alterar a altura média da população da cidade. Para verificar sua suspeita, ele coletou uma amostra de 31- pessoas e obteve como estimativa para a variância o valor s?t":0,25fif . Neste caso, o pesquisador deve realizar um teste de hipóteses relacionado à variância populacional para tirar suas conclusões. tr Considere as hipóteses nula e alternativa, dadas por: Ho:o2:o2"1 Ho, : o2 I o! @u o' > oZ ot o2 < of;y. Aqui, o2 representa'a variância populacional em que estamos interessados e of; é um valor numérico particular para o parâmetro. Para testar a hipótese I/r, obtemos uma amostra de tamanho n da população e consideramos a quantidade rf @-r)s2 02' que envolve 52, a variância amostral. Se a população da qual a amostra foi retirada se comporta de acordo como um modelo Normal, então, sob a hipótese .F/,, temos que 9.3 Testes para Variância 315 O estimador 52 é utilizado no teste pois, como visto anteriormente, é um estimador não viciado para o2. Baseando-se em V, construímos o teste, cuja região cútica, para o teste bilateral, terâ a forma RC :{u e IR. I o 1 r", ouu > u"r}, com uí.r e u", determinados a partir da distribuição Qui-quadrado com n - L graus de liberdade e nível de significância a. O procedimento ó ilustrado no próximo exemplo. Exemplo 9.72: Para o Exemplo 9.11, as hipóteses de interesse são Ho : o2: 0,30 ; Hn,: o2 < 0,30 Temos que, sob Ho, r-2: 0,30 . Logo, a . - (n - r)s\,,"- 3ol<!-,25 : 2b,oo.obs: -------;- : 0130 A região crítica do teste será dada por RC : {u € IR I , < u"}. Utilizando a tabela da distribuição de Qui-quadrado com 30 graus de liberdade e tomando a : 0,05 vem P(V < u" I o' :0,30) : 0,05 + u" : 18,49. Logo, como uobs ) 18,49 não rejeitamos a hipótese fI,, isto é, as alturas nn cidade não são mais homogêneas do que aquelas observadas na região como um todo. Ao invés de fixar a, poderíamos calcular o nível descritivo, obtendo a* - 0,30. tr Outro teste de interesse é aquele que verifica se as variâncias de duas populações são iguais. O teste de comparação de variâncias é também útil como um procedimento preliminar em testes de comparação de médias, auxiliando n cscolha das técnicas adequadas. Ilxemplo 9.13: IJm fabricante de esferas para rolamentos desenvolveu um novo rnétodo de produção, mais barato. Entretanto, ele desconfia que os novos lotes lpresentam variabilidude dil'erente daqueles produzidos pelo método antigo (com rclação ao diâmetro dns esferas), Pnra cada método, ele selecionou aleatoriamente l5 esferas que fornecerum os seguintcs cliâmetros (em mm): .t tó Capítulo 9: Tópicos Especiais Método X (antigo) Y (novo) 29,9 29,8 29,9 29,7 29,9 29,8 29,9 29,9 30,1 29,9 30,0 30,0 29,6 30,4 29,9 29,8 29,8 30,4 29,8 30,5 29,6 29,3 29,4 30,3 29,9 29,7 30,3 30,4 29,L 30,0 ) Algumas medidas descritivas foram calculadas, sendo do6" : 29,g3 mm, úubr:29,89 mm, r'*ou":0,03 mm2 " tï*:0,19 mm2. Na figura que segue, apresentamos os respectivos gráficos box-plot, que sugerem vari diferentes entre os dois métodos. Antigo Métodosde Prodqão Entreternto, para podermos tirar uma conclusão.objetiva, precisamos testar a hipótese de igualdade de variâncias. E E E th o o EÍqo E 3t79.3 Testes para Variância Vamos construir agora o teste de igualdade de populações, representadas por X ë Y, tais que Y - N(p", o|). Desejamos testar as hipóteses H": o2y : oï i H": o2y * "ï. Utilizaremos a quantidade F : Sïf S?, baseada nas amostras X1 ,...,X,n, a Yt,...,Yn", obtidas das populações de interesse; cujas variâncias estão sendo comparadas. Sob a hipótese f/r, pode ser mostrado que .F segue o modelo de Fisher-Snedecor, que é caracterizado pelos graus de liberdade associados às quantidades presentes no numerador e nO denominador de tr', no caso, nt - L e rlz - 1, respectivamente. Para n distribuição de Fisher-Snedecor, utilizaremos a notação F(a,b), sendo ae bos graus de liberdade. L Figura 9.2: Dístribuição de Fisher- Snedecor. Probabilidades baseadas na distribuição de Fisher-Snedecor têm de ser calculadas computacionalmente e são obtidas em planilhas eletrônicas e variâncias de duas x - N(p,x,ol) e P(F , f") com 318 Capítulo 9: Tópicos Especiais programas estatísticos. Para valores selecionados de n1 e nz, tabelas podem ser consultadas e, em geral, são construídas de forma a fornecer, para uma dada probabilidade, o valor /" conforme mostrado na Figura 9.2. No Apêndice A, apresentamos tabelas dessa distribuição para probabilidades iguais a 0,05 e 0,95. Assim, para um nível de significância a pré-fixado, podemos obter os valores ft e fz tais que P(F < fi ou F'V fz) : o, \ \ \ F-F(nr-L n2-L). A região crítiça para o teste bilateral é dada por RC : {/ e re : f < hou f {f})', \_ Portanto, se .f,1" e RC , rejeitamos a hipótese de igualdade das variâncias. Exemplo 9.14: Yoltando ao exemplo anterior, queremos testar se as variâncias do diâmetro das esferas produzidas pelos métodos antigo (X) e novo (Y) são iguais ou não. Isto é, H": o!: oï ; H,r: o2a I "ï . Note que as hipóteses podem, de forma equivalente, ser expressas como _2 H. : y{ : L; oï _2 n, , "] 1t. o'Y Sob a hipótese Ho, temos que q2F:#-F(L4,I4). ' Dí/ Logo, fixando a : 0,10 determinamos a região crítica do teste, de modo que P(F <,/r):0,05 e P(F > lz):0,05, Dada a forma das tabelas de Fisher- Snedecor apresentadas no Apêndice A, precisamos determinar fi e /2 tais que 9.3 Testes para Variância 3le P(F >"ft) : 1 - P(F < /r) : 1" - 0'05 = 0,95; P(F>/z) :0,05. Essas quantidades estão representadas nas figuras a seguir. Da tabela da distribuição de Fisher-Snedecor' com 14 graus de liberdade parn o numerador e 14 graus de liberdade para o denominador, obtemos que "fi = 0,403 c lz:2,484' Logo, RC :{/ e m.* : / < 0,403 ou Í > 2,484}' Para os dados disponíveis, temos que fobs : t'*"0"/tï"u": 0,03/0,19 : 0,158 € RC. Portanto, confirmando as evidências fornecidas pela análise descritiv&, concluímos ao nível a: L07o que existem diferenças em termos dA homogeneidade dos diâmetros das esferas, dependendo do método utilizado. tr Uma peculiaridade aparece no caso de testes unilaterais, uma vez que tl lorma da região crítica depende de qual quantidade é considerada no numerador tla expressão de F. Para esses casos, a representação das hipóteses de interesse crn teimos de frações evita possíveis confusões na construção de tr.. O exemplo, A scguir, ilustra esse procedimento. Ilxemplo 9.15: lJm fabricante de panetones costuma vender produtos de segunde tlualidade (no que diz respeito ao formato) a preços reduzidos. Para panetones de .i{)0 gro*or, súspeita-se que o procluto de segunda qualidade apresente maior vuriabilidade no que sc referc ilo peso. Para tanto, 26 panetones de primeirn tlualiclade e 20 de segundo tivcram seus pesos aferidos. Denotaremos esses pesos 320 Capítulo 9: Tópicos Especiais por X1 , .., , X26 e Yr, ... ,Yzo, respectivamente. Foram calculados os valores das variâncias amostrais, sendo dados por sï,ô :0,29 e szru" - 0,73. As hipóteses de interesse são: H" : ozy : oï versus Ho: oï < "? . Para determinar a região crítica e a quantidade F corretamente, reescrevemos as hipóteses como n, : o2* I ol,, : L versus H" : o2* I ol, < L . A construção de f' deve considerar a escolha darazão de variâncias nas hipóteses, no caso com as quantidades relacionadas a X no numerador, isto é, F : Sr*lS?, i l e a região crítica será da forma RC : {/ e re | f < ï"}. Sob a hipótese nula, .F - F(25,19), e para a:0,05 obtemos, da tabela da distribuição Fisher-Snedecor, f. : 0,495. Como f obs : t'*.0"/ tïr" : 0,2g 10,73: 0,356 ; temos Que .fol., € RC e, portanto, concluímos que os panetones classificados cotto de segunda qualidade apresentam pesos com maior variabilidade do que os panetones de primeira qualidade. tr Itrxcrcícios da Seção 9.3: l. Supondo X - F(a,b), encontre r" tal que: a. P(X ) r,,) :0,05 com a : 18, b : 3. b, P(X ) r,.) - 0,05 com a : 3,ó : 18. c. P(X , r,,) :0,05 com a : 180, b : I92. d. P(X ; r,') :0,95 com a,:5,b : 12. e. P(X > r,,) :0,95 com a : 30, b:40. 2. Umr linha de montagem produz peças cujos pesos, em gramas, obedecem ao modelo Normal com variância30 g2. os equipamentos foram modernizados e, pnrn verificar se o processo continua sob controle, foi tomada uma amostra de 9.4 Andlise de Variância 23 peças, que fornece\ s|tr:4O 82. Existem evidências indicando que A variância mudou, considerando a : I07o? 3. Uma panificadora produz determinado tipo de pão, cujo peso médio é de 190 g,ramas, com desvio padrão de 18 gramas. Devido a mudanças na política _-4ambral, que ocasionou aumento no preço do trigo, alguns ingredientes da f receita foram substituídos. Uma equipe do governo resolveu verificar se a( variabilidade no peso do produto aumentou e escolheu, aleatoriamente, 16 ' unidades, medindo o peso de cada uma. O peso médio obtido da amostra foi de 102 gramas e o desvio padrão foi de 24,5 gramas. Qual a conclusão para a: I\Vo. 4. Para comparar o. grau de diversidade de duas populações primitivas, uma medida antropométrica foi obtida em fósseis coletados em sítios arqueológicos, fornecendo a tabela a seguir. Característica Sítio A (n: Sítio B (n :23) 321 Média(cm) L5,L2 Variância (cm2) 0,L24 L2,2L0,184 O que pode ser concluído a respeito das variâncias? E das médias populacionais? 9.4 LnáÃise de Variância Consideramos nesta seção o caso de comparação de três ou mais populações, definidas por uma variável qualitativa (fator) através de testes com as correspondentes médias. Não abordaremos a situação com dois ou mais fatores neste texto e o leitor interessado poderá consultar as referências mencionadas na bibliografia. Iniciamos com o caso em que as amostras de cada população têm o mesmo tamanho. Exemplo 9.16: A gerência de um depósito que armazena cargas aéreas de pequeno porte está estudando o peso das cargas que chegam ao seu terminal no interior de São Paulo. Usualmente, o terminal recebe 4 tipos de cargas: doméstica (D), administrativa (A), equipamentos industriais (E) e outros tipos (O). Deseja'se verificar se, em média, existem diferenças entre os pesos dos 4 tipos de cargas, Ao longo de 1 mês, cargas foram colhidas aleatoriamente e seus pesos foram aferidos, fornecendo os dados (em kg): 322 --. Capítulo 9: Tópicos Especiais Tipo de Carga D 24,,9 20,4 24,2 22,3 20,3 24,0 23,5 A 27,9 28,7 E 38,4 38,6 43,9 40,2 40,2 37,3 o 23,8 25,3 23,5 27,6 25,5 23,9 22,6 28,4 4L,2 25,3 29,3 28,5 27,9 Estamos interessados em comparar os quatro grupos com diferentes tipos de ciìrga. Descritivamente, observamos que os pesos de cargas do tipo E apresentam os maiores valores dentre os quatro grupos. Algumas mqdidas descritivas para os dados estão apresentadas na tabela a seguir. \ Medidas Descritivas Tipo de Carga oAD Média Mediana Desvio-Padrão Mínimo Máximo ,,R 23,5 1,9 20,3 24,9 27,9 28,L r,2 25,3 29,3 40,L 40,2 t, 37,37 43,9 24,6 23,9 1,6 22,6 27,6 os valores descritivos também sugerem que cargas do grupo E tendem a tcr maior peso. Note que o menor peso observado para esse tipo de carga é, maior quc os máximos observados para todos os outros tipos. Após acargado tipo E, as cilrgas do tipo A parecem ter, em média, maior peso. A carga de tipo D apresenta, crn média, o menor peso. salientamos que os desvios padrões amostrais cncontram-se razoavelmente próximos uns dos outros. tr Para estudarmos a situação apresentada no exemplo anterior, consideramos um modelo estatístico, em que cada observação y pode ser clccomposta em duas componentes: sistemdtica e aleatória, esta última rcpresentando variações individuais e todos os fatores que não são explicados pela parte sistemática. Matematicamente, podemos escrever f:p,*e. 3239.4 Análise de Variância Assim, se Y representa a observação associada a uma unidade experimental, a parte sistemâtica p, pode ser vista como a média populacional, que é fixa, e a parte aleatíria e como a informação referente a outros fatores que podem influir nas observações mas não são incorporadas em p. Suponha que estamos interessados em comparar as médias de K populações, isto é, queremos testar Ho:Ft:P2:"':l-LN; Ho : pelo menos uma das médias p.a é dlferente das demais. Para tanto, obtemos K amostras independentes, com rn indivíduos em cada uma delas. Nesta situação, o modelo estatístico para aj-ésima unidade experimental, da i-ésima população é dado por Caso a hipótese Hoseja verdadeira, teremos que todas as médias para as K populações serão iguais a um valor comum p. O modelo pode, então, ser escrito como Modelo O:fii : tt -l eïi, 'i : L, ... , K; i : Uma forma de levar em conta a informação não sistemática é através das somas de quadrado K rrt Krn Krn L, ... ,n1,. explicada pela formn I( nt DL"?,: Dltuj- tLò2 " II,4)' :!!(ui - ò2.i:t j:l i:L j:t i:r j:l 'i:L j:L Essas expressões envolvem as quantidades desconhecidas [Li,'i - 1,...,1( e p,, Utilizaremos os dados para obter as estimativas correspondentes. Levando-se em conta que, no Modelo 1, estamos supondo diferentes médias para as K populações, consideramos os dados oriundos de cada uma dessas populações para estimar a correspondente média. Assim, segundo o Modelo 1 temos fr, : LrU, -yr, i : r,...,K.' L mfi Para o Modelo 0, como assumimos que todas as populações têm a mesma méclia, utilizamos o estimador 324 Capítulo 9: Tópicos Especiais p- Substituindo as estimativas acima nas correspondentes somas de quadrados apresentadas anteriormente, definimos as quantidades soma de quadrados dentro (SQD) e soma de quadrados total (SQT), da seguinte forma: Knì KmI( #,pin,:o SQD: SQT : K,M\\(uti:t i:t Krnf !(u:i.:t j:L - i,n)' : t Dru, -Yn)' : t D",3 - *\1 ;i,:t j:t i.:1 j:r i.:t K nì. - ì)' :! !(ri - 7)= D,Dv,i - mKTzi:L j:l i:t j:r É importante ressaltar que as expressões resultantes fornecem uma maneira mais conveniente de se calcular, via computador ou manualmente, cada uma dessas somas de quadrados. A diferença entre SQT e SQD representa a somo de quadrados entre e será denotada por SQE, isto é, SQE: SQT _ SQD. Das expressões para a soma de quadrados total e de dentro, segue que: I{ I{ seE : *ltZu -Y)' : ^(DY? - NY').à:t i.:t Cada uma das somas de quadrados envolve um certo número do quantidades que estão sendo estimadas. Por exemplo, SQT contém 7 e SQD contém Yi,i:1,...,1(. Levando este fato em considera!ão e o número dê observações nas amostras, definimos os correspondentes quadrados médios: QMT: QMD: SQT Km-I SQD Km- K : quadrado médio total; : =j.g\:quadrado médio denrro;h\m- r) SOEQME: È, quadrado médio entre. T 9.4 Anólise de Variância 325 Note que, nesse caso, é preciso calcular as três quantidades anteriores pois QMT não é igual à soma de QMD com QME. O teste estatístico pataa hipótese.I/o envolve os quadrados médios. Se a hipótese Ho náo for verdadeira, então, o Modelo 1 deve ser mais adequado aos dados do que o Modelo 0. Em outras palavras, os resíduos produzidos pelo Modelo 1 serão menores que os do Modelo 0. Analisando sob este ângulo, podemos interpretar QME como sendo, em termos quantitativos, a informação contida nos dados que ó captada pelo Modelo 1, enquanto que o QMD represento a informação não explicada pelo Modelo 1. Portanto, se QME for grande comparado à QMD, a parte sistemática do Modelo 1 estará captando grande parte da informação dos dados e a hipótese Ho deverâ ser rejeitada. Definimos, então, a quantidade QMEH-_ '-eMD Quanto maior for o valor de -F, maior será QME comparado a QMD e, assim, maiores as evidências contra Ho.Para caracterizarmos o valor crítico a partir do qual rejeitamos Ho, precisamos encontrar a distribuição de probabilidade para F, Supondo as seguintes condições: . Yi sáo variáveis aleatórias independentes; . Todas as K populações têm variâncias iguais a o2; 'Yj - N(Po,o2),'i : L,..., K e j : !,.'.,m, pode ser mostrado que F-F(K-L,K(m-I)) isto é, a quantidade I' tem distribuição de Fisher-Snedecor com K - 1 e K(* - 1-) graus de liberdade. Temos, agora, condições de encontrar o valor crítico /, e determinar a região críticado teste, que será da forma RC:{/ere*:f>fl}. Das três suposições feitas, a mais impdrtante é a segunda , V ar(f;i) : o2 , para'i: L,...,K e j:1,...,Tn) que tem o nome técnico de homocedasticidade' A suposição de normalidade é importante em termos teóricos, mas, muitas vezes, na prática, o teste pode ainda ser utilizado quando ela não for válidn, principalmente, se as amostras forem grandes. Nesses casos, o Teorema Central do Limite pode ser utilizado para justificar o uso da distribuição de Fisher- Snedecor. Caso a suposiçâto de hornocedasticidade não seja verdadeira, técnicas J26 Capítulo 9: Tópicos Especials alternativas podem ser utilizadas. Algumas delas envolvem aplicar urna transformação logarítmica ou quadrática aos dados. Esse assunto envolve técnicat mais avançadas e não será abordado nesse livro. A discussão sobre o comportamento dos erros e das somas de quadrados é resumida na Tabela 9.2 a seguir. Tabela 9.2: Tabela de Análise de Variância (ANOVA). A tabela ANovA fornece como subproduto um estimador para a variância populacional o2, baseado na suposiçãã de homocedasticidade. Nessg caso, a variância amostral para o z-ésimo grupo, s?:J.Ë(Y1-To7z, " rn-If, pode ser usada para construir um estimador da variância populacional. Isto é feito combinandoessesvaloresatravésdamédiaponderadaa"if,...,S?, Knt "z - (m - r)sÏ+ "' + (rn - t)sfu D D&i - v-o)' ""-@:__Nç*_g. A expressão obtida para s! é a mesma que encontramos para eMD.Note aindaque a expressão de QMT também é um estimador para o2,uma vez que QMT: =rtQt ' S S-rrr" -Y\2 - q2Km-I Km-ILí?r''" ') -r' ou seja, QMT nada mais é do que a variância amostral s2 para uma amostrê corïposta pelo conjunto de todas ai observações dos K grupos combinados, E 9.4 Aruilise de Variância Exemplo 9.77: Para os dados apresentados no Exemplo 9.16, temos K : 4 grupos e nt:7 observações por grupo. Além disso, obtemos Yt:22rïi Tz:27,9; Ts:40,L e Ta:24,6. A média geral é Y:28,9' Cálculos intermediários podem ser, facilmente, feitos em uma planilha eletrônica ou calculadora fornecendo: 474 t t Yli : 24.672,42 " DT?: 3.b13,80.i:I j:r i:L Usando as fórmulas de cálculo apresentadas anteriormente, obtemos Ktnl( sQD : DLUS - *:Dfi : 24.672,42 - 7 x 3.513,80 : 75,82;i:r j:L i27 i.:t K sQE: *(DT? - KY'):7 x (3.513,80-4 x 28,86') =r.275,4U i:l It In SQT: D,DU\-*KYz :24.672,42-T x 4x 28,862:1.351,23.i:r j:l Uma vez calculadas duas das somas de quadrados acima, obtemos, sem dificuldade, a terceira. A tabela ANOVA é apresentada a seguir. Fonte de Graus de Variação Liberdade Soma de Quadrados Quadrado Médio F L.275,4L lgy : 452,,L4 W : L94,54 75,82 ff :3,,L6 Total 27 1.351,23 Através da distribuição de Fisher-Snedecor, com 3 e 24 graus de liberdade e, considerando a :\Vo, obtemos "f":3,009. Logo, como calculamos .f,,t,":L34r54 > /,, concluímos que, ao nível de significância de 5Vo, as médias de peso dos grupos são diferentes, confirmando as observações descritivas feitas Entre Dentro 3 24 trrnteriormente. 328 Grupos de tamanhos diferentes No desenvolvimento anterior, supomos que os 1( grupos têm todos o mesmo tamanho. Podemos considerar uma situação mais geral em que isto não acontece. Vamos denotar pot na o número de elementos do grupo e. Neste caso, o total de indivíduos nos K grupos será igual a n:nL*...1nx. Todos os resultados anteriores permanecem válidos, mas modificações algé são necessárias nas expressões que agora serão escritas da seguinte forma: Kni seD: It(0,,, - ro)r:i:t j:r K SQE : D"n(To -i':L Kni sQr : !!(ui -v),i:t j:r Fonte de Graus de Variação Liberdade Soma de Quadrado Quadrados Médio Entre Dentro K_T n- K SQE SQD Total n - I comF - F(K -I,n- K). i:r Kn; : I D,ul -,Y'.à:t j:l Note que, nesse caso, as médias geral e dos grupos são dadas por: por .I(niv::tDu" 'o i:l .i:7 o,: *,,\yi, i:r,...,K. A Tabela de Análise de Variância sofre poucas modificações, sendo dada SQT -"tt ncas 9.4 AnáIise de Variância 329 Exemplo 9.18: O volume de vendas, no ramo de vestuário, tem se mantido estóVOl de ano para ano, mas açredita-se que sofra mudança de um quadrimestre pere outro, dintro de um mesmo ano. Através de uma metodologia adequada, fOl criado um índice que reflete a quantidade vendida. Em cada um dos quadrimestre8 do ano, foram escolhidas aleatoriamente algumas empresas de mesmo porte e $ÇUS índices de venda foram calculados (ver abaixo)' Quadl Quad2 Quada3 114,7 L44,7 153,1 L44,7 173,4 L92,5 119,1 L54,2 745,5 r!3,7 L54,7 168,8 108,9 125,9 L4L,5 96,7 119,5 1.4r,2 87,6 155,7 189,6 L32,4 213,9 178,4 L56,2 208,6 159,0 O comportamento das vendas pode ser visualizado na próxima figura' RUI<tt ufi -1";Y'z1;i:t j:L i.:L F QME QME/QMD QMD .tJ0 Capítulo 9: Tópicos Especiais uma rápida avaliação dos box-prol mostra o primeiro quadrimestre com iï,T:ï::::índices. Os outros dois quadrimesrres apresenram vaÌores u,,, Oou"omais próximos. O modelo de análise.. de variância pode ser aplicado parasignificância estatística_das diferenças obs"ruaà^ oì.;"". a#; ,-, : Lr, --8.,:r: L0 e ns -g. Faz"d; "r;;[;ì;r;;tï;H_^It : 1.14,7.; .Y?: LS',T; % : ios,s ;ï:;í;,;':"üïdisponíveis e a ajuda de uma planilhalletrônica obtemos 3n; J LruV; :604.207,68.i:Lf f Y7:6tT.B5e,6B e cat a i, temos obtemos os dados i:r j__l Ilntiro, 3n;3 sQD : DDul -D"'Y?: 617'35e'6I - 604.207,68 : 13.332,00;L:L .:J:L 'i:7 I( sQE: D"rY? - rY' :604.207,68-27 x 747,9J2 : rJ.844,90;i:l c, com relação à variação total, SQT : 13.392,00 + 18.844,90 :26.676,90 . Com esses valores calculados, construímos a tabela ANOVA: liÌrnte de Variação Graus de Liberdade Soma de Quadrados Quadrado Médio F Entre Dentro 73.344,90 13.332,00 13.s44,90 2 13.332,00 24 2 24 :6.672,45 trffi : r2,0L : 555,50 Total 26 26.676,90 c) teste l'ornece o valor r1b": L2,01 que deve ser comparado com o varor crÍticoobtido de uma distribuição Fisher-snedecor com 2 e 24 graus de Iiberdade,Considerarrdo cv: 5Vo,.^obtemos .f..- 8,40J. Tendo "rn uï.io gue í,r,, ) ír,corrcluímos que existe diferença nas médias de venda dos quadrimestres. tr 9.4 Análise de Variância 331 Exercícios da Seção 9.4: 1. Três diferentes bancos possuem agências de mesmo porte em uma avenida movimentada de Salvador, BA. Para testar se essas agências têm movimento médio equivalente, foi escolhida uma semana típica de trabalho e o desempenho, nesses dias, foi registrado. Os dados obtidos, em milhares de reais, óstão apresentados na tabela a seguir: Banco 2 146,4 r99,2 179,,5 98,4 263,7 L94,3 r73,7 227,2 246,5 203,,4 289,8 111,8 L27,,4 275,0 265,6 Qual seria a sua conclusão ao nível a : 57o? 2. Uma agência de empregos deseja verificar o grau de satisfação de seus clientes. Para tanto, escolheu aleatoriamente domicflios de famílias de bairros classe A, B e C, que fizeram uso da agência e solicitou que um questionário fosse . preenchido pela pessoa responsável na família. Os questionários foram devidamente codificados, a fim de fornecer um índice de satisfação que varia de 1 a 5 (totalmente satisfeito). Os resultados estão apresentados a seguir. Qual seria sua conclusão, considerando a : 0,05? Classe B 1,5 2,8 L,7 3,1 2,7 2,4 2r5 3. A fim de verificar o efeito de quatro tipos de propaganda de uma determinada marca de goma de mascar, crianças foram atribuídas aleatoriamente a cada uma de 4 salas que mostravam desenhos animados, com intervalos regulares em que as correspondentes propagandas eram inseridas. Após a sessão, as CA 2,7 3,7 4,3 4,6 3,4 4,7 2,9 3,5 4,5 3,8 4,0 4,r 2,3 4,2 2,5 3,5 2,5 4,2 .t.12 Capítulo 9: Tópicos Especiais crianças foram entrevistadas por psicólogos, que atribuíram um índice de assimilação a cada criança. Quanto maior "s" índi"", maior seria a lembrançado produto. Os dados são apresentados a seguir. Tipo de PropagandaIIm 1572222 7 6 21 16 B 11 16 116 7 23 15 7 16 19 1810 6 2022 10 B 11 115 6 18 18 1315 11 105 8 2122 B 8 13 19 D"7 rco 4.876 L.465 2.444 9.5 Regressão Linear Simples No capítulo 5, definimos o coeficiente de correlação como uma medidade dependência linear entre duas variáveis. Em muitas situações, além de estzrrmos interessados em saber se existe relação entre duas variáveis, podemos desejar estabelecer uma relação de causalidaae. tsto é, queremos quantifìcar qualó a mudança observada em uma das variáveis quando variamos os valores da outra. Exemplo 9.19: Em uma dada região de Bocaina-sp, acredita-se que o gado nlimentado em um determinado pasto tem um ganho de peso maior qu" o uiual. EsÍudos de laboratório detectaram uma substância no past; e deseja-se verificar se ela pode ser utilizada para melhorar o ganho de peso dos bovinos. Foram cscolhidos 15 bois de mesma raça e idade, " "ãdu animal recebeu umfldcterminada concentração da substância x (em mg/l). o ganho de peso após 30 dias, denotado por Y, foi anotado e os dados foramãs seguintes (em Èg): X 2,5 3,0 3,5 4,0 4,5 5,0 5,5 6,0 Y L6,2 1.6,2 L7,7 L8,g L9,g 22,5 24,7 23,L X 0,2 0,5 0,6 0,7 1,0 1,5 2,0 Y 9,4 TL,4 12,3 L0,2 11,9 13,6 14,2 -".il 9.5 Regressão Linear Simples Observando a tabela de dados, notamos que, de fato, à medida que aumenta a concentração da substância, ocorre um aumento no ganho de peso. Conforme apresentado no Capítulo 5, o coeficiente de correlação linear entre a concentração X e o ganho de peso Y é calctlado por: n DrnAo - rì,VobrUobsi,-lpx,l, : 333 I.- \/ | E 4 - n"',,ll1rl - naZu,fv r-' 785,55-15x2,70x16,14 : 0,99. /(163,39 - 1b x 2,702)(4.2J9,4J - 15 x r6,t42) Desta forma, vemos que a variação do peso é sensivelmente influenciada pela variação da concentração da substância. Para observarmos como as variáveis se relacionam, construímos um grâfico de dispersão, apresentado na figura a seguir. 30 25 E) i1 8zoo CL ot €rsc oa 10 5 0 334 Capítulo 9: Tópicos Especiais Nota-se que os pontos tendem a se alinhar sobre uma ,"ru,)uiuinclinação reflete o sinal positivo observado no coeficiente de correla çao ca(liao. tr \ Utilizando o desenvolvimento da Análise de Vahância apresentado na seção anterior, consideramos para o conjunto de valores (Xt,y), i : \,:.. ,fr, o seguinte modelo estatístico: Y:g(xr)+q. Isto é, o comportamento de Y é explicado em parte por x4, através da funçãog(xt) e' em uma outra parte não captada po, "rru úçao, representadapot ei. várias opções paru g(xa) podem ser utilizadas, mas a que define o modìlo de regressão linear simples é g(Xr): ai 7Xr. Portanto, dado um valor fixado 14 paÍax;, o modelo pode ser reescrito como - "F:a-rprn+4 Além disso, supomos que os termos e;, i:L,...,fr, são independentes edistribuídos conforme um modelo Normal de média 0 e variânc ià o2. Dessa forma, fixado Xi : ri, as variáveis \ são independentes e Y - N(a * Br;,,o2), ,i : I,... )n. Em modelos de regressão, a variável \ é, comumente, denominada vorióvel resposta ou variável dependente, ao passo que a variável xi é, chamada variável independente, explicativa ou ainda covariável. Os parâmetros do modelo em que temos maior interesse são a e B. Eles têm interpretações muito úteis na prírtica. Oparâmetro o 9_. ua]!g_g!p91qqo_!4lu a variávãl dçpqrylente ylquando x, e i guqtã@õ pãamet.ò-piãnsi&ì aoi. uaoìË, pura x,, dadòìpoìã e n* 1, eìepresenre por E(y l'x - r) o ualor esperado da variável resposta quando X : r. Então, E(Y t x; : r * " : ï;:{iï;!}") + p Logo, - 9.5 Regressão Linear Simples Ê : E(Y I x : r +t) - n(Ul x : r), indicando que P representa o acrtSscimo eqterado nale!êygf-Igqpgtlq ggqldo a. cg-v3rriável è@to nos fornece uma iclãiãíe3p--cJïto aa' intensidade com a qual a covariável atua na resposta. A estimação de a e B pode ser feita através do método de mínimos quadrados, que consiste em minimizar a soma dos quadrados dos resíduos obtidos através da diferença entre valores observados A e valores esperados B(Y I X: r), calculados para cada X: r. A Figura 9.3 ilustra essas quantidades. Note que, caso o ajuste fosse perfeito, todos os pontos estariam alinhados sobre a reta e os resíduos e seriam todos iguais azero. E(YlX=x) xX Figura 9.3: Resíduos no modelo de regressão linear símples. Como em geral os pontos não estão perfeitamente alinhados, escolhemos â "melhor" reta possível no sentido de minimizar a soma de quadrados SQ@, B), dada por se(a,g) :f,@n - n(U I xr: rt))2 i:7 n'n :D@o-d-grn)':D"?. i:1. i--L 335 E(YlX=,r)=g*0x Resíduo (e) .736 "%!Flit|IF- Matematicamente, temos que resolver o sistema de equações p: LrtAn - nrA:1 - TLï' Exemplo 9.20: Yimos, no Exemplo 9.19, que o diagrama de dispersão sugere uma reta pode ser utilizada para representar o efeito da concentração de uma certe substância no pasto (X), no ganho de peso bovinos (Y). Para obtermos essa reta, precisamos calcular as estimativas de â e B. Dos dados fornecidos obtemos: -q -!!- n : r5,D*nru: 785,55; D"?: 163,39;ri.:l à:t Logo, p: n, Lt&t - nI Ai:t 785,55-15x2,70x16,14 as derivadas de SQ(a,0) em relação a a e B. Deixamos aslpontas a cargo dq leitor, apresentando aqui a solução para o sistema que fornecer/ os estimadores d; mínimos quadrados para a e B. Temos /À-f,a:A_pr; \ D"7i:r Tl, st-, Lx:í. - nr'i:l 163,39 -I5x2,702 ã : U - pT : 16,1.4 - 2,44 x 2,70 : 9,55. Portanto, dado X : {rit à reta ajustada fornece valores f,, dados por 0r, : ã +B rn: 9,55 * 2,44ri. A figura a seguir mostra os dados originais e a reta ajustada. O gráfico sugere que o modelo de regressão linear simples apresenta um ajuste adequado aos dados. L6,L4. -*.!qlFF 9,.í rtegres,rrT u Llnea r,lhrpler Modelo0: }j:al€it caso Ifl seja rejeitada, o modelo é 337 25 El .Y 8zooÍL oIt €rs tr(É(5 10 5 0 01234567 Concentração (mg/l) A interpretação dos valores estimados é feita da seguinte forma. O ganhO de peso esperado em bovinos que não recebem a substância X é 9,55kg (obtidO substituindo ri:0 na equação calculada acima). Por outro lado, um aumento de 1 mg/l na concentração de X implica em um ganho médio esperado de2,44kg. Testes de hipóteses, envolvendo os parâmetros do modelo de regressãO linear simples, baseiam-se na decomposição da variação total, discutida na Seção anterior. O principal teste de interesse é verificar se a covariável influencia na resposta, o que é equivalente a testar Hoi0:0versusH":Bl0' Caso 11o não seja rejeitada, adotamos o modelo :2144; i : l, ... ,Tt', i: 7r... )n.Modelol:\:a+PXilei, Através do Modelo 0 obtemos a soma de quadrados total, dada por --r .ï.ï8 Cttpftulo 9: T'ópicrts lislteciuis ser = D@, _ a)r, li:l / clue contém a variação total contida nos dados. Por outro lffo, o Modelo 1 gera a soma de quadrados residual \ seRes : f,@o - ã -ì *,)' ,i:I clue contém a variação dos dados não explicada por esse modelo. A diferença cntre as duas somas de quadrados fornece a soma de quadrados da regressão, tlada por SeReg : SeT - SeRes :3' * D,fr, - *)r.i:l Para estabelecer os graus de liberdade associados às somas de quadrados, precisamos levar em conta as estimativas envolvidas em suas expressões. Assim, sQT envolve a média g, e assim, temos n - 1 graus de liberdade associados a essa quantidade; sQRes envolve duas estimativas, â "p, d" forma que teremosn - 2 graus de liberdade. Para a SQReg, restam n - I - (" - 2): 1 grau de liberdade. Consequentemente, definimos os quadrados médios por QMT:H -s',QMRes:H e QMReg:tQl"t. Seguindo os passos da seção anterior, utilizamos F_ QMReg QMRes para testar as hipóteses de interesse. Pode ser mostrado que .F tem distribuição de Fisher-Snedecorcom \en- 2 graus de liberdade, isto é, F - F(1, n-2). Em resumo, da mesma forma que na seção anterior, podemos apresentar as informações apresentadas em uma tabela ANOVA, específica para o modelo Y:a*?Xe*e;,dadapor ,=qF 9. 5 Il a g re s são l,in esr,S/rrryrle,r Fonte de Grnus de Variação Llberdade Soma de Quadrado FQuadrados Médio "*-*ru .ï.19 Regressão 1 Residual n - 2 SQReg QMReg QMReg/QMRes SQRes QMRes Total n-I SQT Exemplo 9.21: (Continuação dos Exemplos 9.19 e 9.20) No estudo da relação entre ganho de peso de bovinos (X) " a concentração de uma substância (Y), estabelecemos uma reta de regressão. Para verificar a evidência estatística do modelo realizamos um teste de hipóteses: Ho:B:g versus H":0*0' os valores de QMReg e QMRes podem ser calculados com o uso de uma planilha eletrônica, conforme a tabela seguinte @u-ã- Br,i)2 / _\o\rr - r)" 1 2 t t) 4 5 6 7 8 I 10 11 L2 13 t4 15 0,4r 0,39 1,65 L,L2 0,01 0,1-5 0,05 0,30 0,45 0,15 0,26 0,40 0,56 2,98 r,20 6,25 4,84 4,4L 4,00 2,89 L,44 0,49 0,04 0,09 0,64 1,69 3,24 5,29 7,84 10,89 Total 10,09 54,04 .140 ( | t p ít tt I t t 9 ;'liipi t't t,r lh pcc i t t i s Com base nos valores apresentados na última linha da tabel ) \:'o'' 327,73; ^z-SQReg : 0 \(ri - r), : 2,442 x 54,04 : i:l n, SQRes : D@o - ã -Ê "ò, : 10,09 .i:1, A tabela de ANOVA para o modelo de regressão proposto é dada por: Fonte de Variação Graus de Soma deLiberdade euaeÌrados QuadradoMédio F Regressão Residual 327,73 10,09 327,73 0,78 472,471 13 Total t4 331,92 Para a:0,05 obtemos, da distribuição de Fisher-snedecor com I e 13 graus delìbetdade, f": 4,667. Como fob,:4i,2,47 ) f", rejeitu*o, u hipótese 11, econcluímos que existem evidências estatísticas de que a concentração dasubstância X,de fato, altera o ganho de peso dos bovinos. tr Bxercícios da Seção 9.5: 1. um estudo deseja avaliar o efeito de determinado treinamento no tempo dereação de atletas submetidos a um certo estímulo. o treinamento consiste narepetição de um movimento e foi utilizada uma amostra de 37 atletas. paracada atleta foi atribuído um certo número de repetiçàãs (x) e, então, foimedido o tempo de reação ()'), em milisegundà.. Ü-u reta de mínimosquadrados foi ajustada aos dados, fornecendo a equação ffi : 80,5 - 0,90r;, i : I, ... ,n., Interprete as estimativas de a e B . 2. Para verificar o efeito da variável x sobre a variâver y, foi realizado umexperimento que forne^cel -os.far9s (u,?lo) dados por (ã;'13,S), (Z; àl,ij','(5;15,9), (2; I2,8),^,(9; 29,6), (T; Zg,5),' \S: t+,i1, ìãi áS,Sl, (B; 32,6),(2;L2,0). e (1; 4,6). obtenha aretìajustada. construa o diagrama de dispersão,baseando-se nos pares de valores iornecidos e, em ,"guiou, desenhe a retaajustada. Baseando-se apenas no gráfico, você diria que o"ajuste é adequado? :2 It rÊ F * * .t ÊI ìi!: l: 'li ().(t li.rerrício,t Para verificar se existe relação entre a renda número de filhos, foi coletada uma amostra resultados obtidos estão na tabela a seguir: familiar (em salários rnínimos) e o de 8 famílias em uma ciditde, Os 141 3. Família 1 Renda 12 14 15 LT FilhosS22I a. Que conclusões podem ser tiradas, baseando-se em um diagrarna de dispersão e no coeficiente de correlação? b. Calcule a reta de mínimos quadrados e interprete os parâmetros. Veril'iquo se a renda influi no número de filhos, utilizando a : \Vo. 9.6 Exercícios 1. A seqüência de operações executadas por um operário para realizar uma ccrtt tarefa está sendo estudada. Para tanto, 9 operários foram sorteados e mediu-se o tempo necessário, em minutos, para que cada um realizasse a tarefa, cotÌl os dois tipos de seqüências. Suponha que o modelo Normal é adequado. Operário 23 27 34 43 1000 Atual Nova 24 25 2t 23 27 22 23 28 26 28 29 28 27 24 26 25 22 23 Baseando-se nos dados fornecidos, você diria que houve diminuição no tempo médio para a realizaçáo da tarefa? Use o : 57o. 2.Para se aferir o consumo de combustível, entre duas marcas de automóveis com mesmas características, escolheu-se 8 carros de cada marca e anotou-se o consumo após 100 quilômetros percorridos em uma estrada. Os resultados estão abaixo: Marca Consumo (krr/l) xwx 9,5 9,4 YWY 9,0 9,3 9,6 9,1 9,3 9,9 9,8 10,1 8,6 8,1 8,3 8,9 8,8 7,9 Fazendo as suposições necessárias, verifique se marcas é o mesmo. Use a :57o. Admita que variabilidade. 3. O desempenho em duas classes de Estatística está resultado dos dez melhores alunos de cada turma. o consumo médio dzrs cluns as marcas tenham a mesrnit sendo comparado através do .142 9,5 9,0 9,0 9,5 8,5 8,0 9,5 9,5 7,5 7,0 6,5 7,5 9,5 9,5 I II 8,5 7,0 8,5 9,0 10,0 9,5 Admitindo que as variabilidades das classes são iguais, pode ser dito que erastêm o mesmo desempenho médio? Faça as ,upJriç0".'necessárias e utilizea:27o. 4' o salário de recém formados em veterinária foi amostrado em duas cidades. Nacidade A, 10 profissionais foram sorteados e na cidade B, 15. os resultados, em salários mínimos, são apresentados a seguir. Cidade A: T,J;6,6; 6,g; 7,4; g,J; 6,5; T,g; B,Z; g,1; 8,5 Cidade B : 6,5; T,B; 8,2; 6,g; T,g; g,T ; g,I; g,5; T,4iB,0; 6,9; T,g; g,4;9,3; g,5 Admitindo que a variabilidade do salário seja a mesrna nas duas cidades e queo modelo Normal é adequado, verifique se ã cidade B paga, em média, melhordo que A. obtenha o nível descritivoã tome sua decisãó ulilizando um nível designificância a : 5Vo. 5. Motoristas novatos e experientes participaram de um experimento para avaliarse o tempo de habilitação altera o desgaste das pastilhas de freio. Dezmotoristas de cada tipo foram escolhidos e obsãrvou_se o número dequilômetros até a troca das pastilhas. Indicando por x a respostq dos novatos epor Y a dos experientes, os resultados amostrados (em mil'hares de km) foram os seguintes: 10 10 10 10Drr:98, D,an: 106, t"?. :970 e ta?': I.I52.i.:t i:l l:t " Á"' Admitindo que' para ambos os grupos, modelos com distribuição Normal com mesma variância são adequados, o que pode ser concluído para um nível de significância d :0,0b ? 6. Para estudar o impacto de cenas viorentas em desenhos animados, 5 criançastiveram seus batimentos cardíacos medidos, antes e após assistirem a um clesenho comercialmente veicurado por uma grande emissora de TV. os dados siro apresentados a seguir: (i t 1t ít u I r t 9 ;'l'ópì ns Iì,rpt,c it t i t; .t4.1Q.(t lì.rertíritt,r Batimentos Criança Antes APós I 2 3 4 5 96 tt{ t02 LL2 108 t12 89 83 85 99 Qual a conclusão, considerando-se um nível de significância Q:0,02? Que suposições são necessárias? 7. Deseja-se comparar o consumo de refrigerantes entre alunos do ensino fundamental e do ensino médio. Uma amostra desses alunos foi coletada e solicitou-se que indicassem o número de latas de refrigerantes que consumilm por dia. Os resultados, para cada grupo, foram os seguintes: 20 20 Ensino fundamental: lri :2/,, D"7: 610;i:L i:l 15 l5 Ensino médio: Drn: z+,lu?: 1.315.i,:l i:l Supondo normalidade, verifique se as variâncias populacionais são iguais (use a: I}Vo). Com base no resultado obtido, construa um teste de hipóteses parn decidir, ao nível l7o, së os grupos têm o mesmo consumo médio' 8. O tempo de conexão à Internet tem sido modelado pela distribuição Normal com desvio padrão de 10 e 7 minutos para o público jovem e adulto, respectivamente. Amostras independentes desses dois públicos produziram: 6 Adultos: D4:217,2;i:t 10 Jovens: lur,:367 'i.:l Teste, usando a : 5Vo, se o tempo médio de conexão dos jovens é maior. .Ì4-l Ct t pít u I t t () :'l'ópi ct t,t Ih prr iu I t I 9. Deseja-se comparar a durabilidade de amortecedores faUriqáOos pelas empresas A e B. A medida observada é o índice de resistência de càdg1eça testaia em laboratório, que é assumido ter a mesma variabilidade nas dús empresas. oB resultados obtidos são apresentados a seguir. Empresa A: 115, 723,134, L20,121- ; Empresa B: 725, L26,I20,130, 128 . Fazendo as suposições necessárias, qual a conclusão ao nível 2Vo? 10. Num programa de diminuição da poluição sonora em cidades grandes, realizou-se uma campanha educativa durante 2 meses. A tabela abaixo apresenta os índices alcançados antes e após a campanha em dez pontos cltt cidade sorteados ao acaso. Pontos da Cidade 4567 10 Antes Depois 44 56 30 45 23 2L 34 25 67 21 35 26 50 23 23 73 58 22 57 46 verifique se a campanha surtiu efeito, ao nível de4vo.Indique as suposições que devem ser feitas. ll. um experimento com cobaias consistia em comparar o desempenho de uma tarefa para dois métodos de aprendizagem. cada cobaia teve seu desempenho medido, atribuindo-se uma nota de 0 a 10. Essa medição oóorr"u imediatamente após cada aprendizagem. os idealizadores do Método 2 alegam que seu método é mais eficiente e, portanto, deve produzir maior nota. De estudos anteriores, sabe-se que, após uma semana, o aprendizado de um método é esquecido e, portanto, fixou-se esse intervalo de tempo entre a aplicação dos métodos. Além disso, foi estabelecido que o modelo Normal é adequado para as variáveis envolvidas. As notas obtidas foram as seguintes: Método1 B 3 7 4 6 2 7 3 I T Mérodo2 8 4 B 3 7 3 8 3 B 6 Formule as hipóteses de interesse e faça o teste conveniente, considerando um nível de significância a : SVo. ,:{!!--Ë= 3,159.6 lixan:ít:itt,t L2. Deseja-se comparar o tempo de recuperação pós-operatória para duas técnicns cinirgicas. pacientes opeìados, segundo cada uma das técnicas, lornnr selecionados aleatoriamente e seu tempo de recuperação, em dias, registrnclo' Todos os pacientes apresentavam o mesmo estado de saúde antes da cirurgia' Os dados obtidos são: Técnica 1 Té,cnica2 4 4 5 6 6 66778 a. Verifique se as variâncias são iguais. b. Verifique se a Técnica 1 é recuperação. Use a :5Vo- populacionais correspondentes às duas técrricas mais eficiente com telaçáo ao tempo médio de 13. Um casal está procurando um apartamento para alugar' Duas cidadcs' igualmente atrativas para o casal, estão sob consideraçáo' A decisão sobre qr,ral a cidade escolhida dôpende do custo do aluguel. Neste sentido, eles obtiveratn o preço médio e a vìriabilidade dos preços em cada uma das cidades. Nrt pri-"i.u cidade, denominada cidade A, o preço médio e coÍrespondente desvio padrao foram obtidos de uma pesquisa com 22 ' ofet.tas, fornecenclo,-respectivamente, R$ 455,00 e R$ 25,00' Na segunda cidade' B' fbrnm escolhidas 30 ofertas que forneceram média de R$ 475,00 e desvio padriro de R$ 18,00. Supondo normalidade e mesma variância, pergunta-se: a. As cidades são equivalentes, ao nível 57o? Se não, qual é melhor? b. Apresente um intervalo de confiança com 1 :0,95 para â diferença ele preços entre as cidades A e B. 14. Duas raças de cavalos estão sendo pesquisadas quanto à. resistência a umit certa doença intestinal. O experimènto consiste em ministrar uma dietit especial, durante 3 meses e verificar a ocorrência ou não da doença, nos 6 *"r", seguintes. Os dados observados foram os seguintes: Raça Tamanho da amostra Ocorrências A 5B 6 B 85 10 Um veterinário afirma que a raça B tem maior propensão à doença' Vocô concorda? Use a :6Vo. 15. Estão sendo testados dois aparelhos para estabelecer suas respectivas confiabilidades no diagnóstico d" u*u ""itu do"nça. Dados foram obtidos de - 346 Capítulo 9: Tópicos Especiais l exames feitos em diversos pacientes, escol(idos ao acaso, que, após serem avaliados por um dos aparelhos, tiveram \us casos estudados em maiorprofundidade. Desse modo, foi possível quàntificar o número de falsos positivos ou falsos negativos advindos do uso do aparelho. Em outras palavras, foi possível saber o número diagnosticado falsamente pelo aparelho como tendo ou não a doença. Seguem as informações obtidas: Aparelho Total Positivos Negativos Falsos positivos Falsos negativos I r20 85 11 10 t4 2 135 90 27 72 6 a. Teste se os dois aparelhos produzem a mesma proporção de diagnósticos falsos. Use a :4Vo. b. Dentre os que estão efetivamente doentes, isto é, os positivos e falsos negativos, teste se o aparelho 2 erra menos. Use a : 4Vo. c; Com base nas decisões tomadas nos dois itens anteriores, que aparelho seria mais aconselhável utilizar? Queremos comparar três hospitais, através da satisfação demonstrada por pacientes quanto ao atendimento, durante o período de internação. Para tanto, foram selecionados, aleatoriamente, pacientes com grau de enfermidade semelhante. Cada paciente preencheu um questionário e as respostas geraram índices variando de 0 a 100, indicando o grau de satisfação. Os resultados foram: Hospital 9.6 Exercícios pesos dos pacientes, tomados no início e no final do tratamento. Os dados obtidos foram (em kg): Número do paciente 45 910 347 Início 80 Final 78 r04 94 95 87 62 70 B0 r02 60 7t 82 94 58 78 84 65 78 80 L6. a. Baseando-se nos dados apresentados, teste a igualdade das variâncias para os hospitais A e B. Use a : 0,10. b. Teste se as médias populacionais são iguais. Qual sua conclusão? Use a : 0,05. 17. Pacientes resolveram processar a clínica de emagrecimento Linha Fina sob a alcgação de que o tratamento empregado não contribui para a diminuiçiro do peso. O advogado de defesa contratou um estatístico que selecionou, nleltoriamente, l0 prontuírrios que continham inlbnnaçiio a respeito dos a. Faça uma análise descritiva para os dados e obtenha uma conclusão preliminar. b. Verifique se a conclusão do item anterior tem suporte estatístico. Formule as hipóteses adequadas e encontre a região crítica correspondente a a:0,05. 18. Uma linha de montagem utiliza robôs para a realização das tarefas necessárias para a montagem de um produto. Os técnicos acreditam que é necessário umn programação diferente para garantir a qualidade do produto final, mas suspeitam que o tempo necessário para completar o processo pode aumentar, Para verificar essa suspeita, 12 robôs foram selecionados e o tempo necessário para a montagem do produto foi medido, considerando-se a programação usuül e a nova proposta. Os tempos observados (em minutos) para cada unidndc foram medidos, produzindo a tabela a seguir' Tipo de Identificação do Robô Programação 1 2 3 4 5 6 7 8 9 10 11 12 Usual 80 90 93 92 75 92 72 87 90 86 78 97 Nova 100 85 90 702 90 99 97 95 100 94 89 98 a. Faça uma análise descritiva adequada a estes dados. O que pode ser dito, baseando-se nessa análise? b. Existe diferença para os diferentes tipos de programação? c. Construa um intervalo de confiança de confiança com 'Y : 95 Vo para t diferença das médias populacionais dos tempos de montagem do produto. 19. O custo de manutenção de treminhões movidos a gasolina e a diesel são dados abaixo para duas amostras aleatórias de 10 treminhões de cada tipo. Os veículos considerados trafegam sob as mesmas condições em uma mesmiÌ área. A Tamanho da amostra Média amostral Variância amostral 10 15 13 80,7 59,0 72,3 113,3 L0t,4 10d,5 rí8 Cupftnlo 9: 'l'ópicos lltperlalt Combustível Gasolina Diesel L4p7 8,gg a. Quais são as hipóteses necessárias para construir um intervalo de confianç6, para a diferença das médias dos custos? b. Verifique se as variâncias dos dois grupos são semelhantes. c. Teste-a igualdade de médias dos dois grupos, considerando a : ïVo. 20. (Use o computador) Uma loja de departamentos está interessada em saber sg existem diferenças entre as quantias médias faturadas, através de três formag de pagamento: dinheiro (D), cheque (C) e cartão de crédito (CC), Um levantamento das vendas (em milhares de reais), em um dado período de tempo, foi feito, produzindo os dados na tabela a seguir. Formas de Pagamento CC 56,00 80,90 73,25 20,50 5r,29 56,65 37,37 40,95 123,2t 29,64 72,65 56,50 132,47 37,29 60,32 44,65 60,00 40,64 CD a. Calcule algumas medidas descritivas (média, variância, etc.) e, nelas, discuta se existem evidências de diferenças. b. Assumindo que as variâncias são iguais para os três grupos, estatisticamente as médias populacionais para verificar se diferenças. Use a : 0,05. 21. Quatro diferentes espécies de milho foram produzidas em laboratório. Deseja- se testar, a um nível de significância a:ívo, se existe diferença estatisticamente significativa entre as produtividades. Para tanto, foram montados 34 canteiros, plantando-se neles o mesmo número de sementes e garantindo-se a todos as mesmas condições de fertilidade, irrigação e exposição à luz solar. Após um período de tempo pré-especificado, a produção de cada canteiro, em kg, foi obtida. os resultados observados baseado compare existem 5,05 10,99 15;00-ÌÍ-1--876- 4.r7 t2,72 g,g5 2,94 5,00 JÇlr 9.6 llxcrcícios sofreram um tratamento disponibilizadas: I 90,56 13,28 34e inicial, e as seguintes informações foram Espécies 23 10 8 83,63 l_6,55 86,40 95,7L 74,27 13,23 ni Ti S? O que plode ser concluído com base na tabela? 22. (ÍJse o computador) o custo mensal de manutenção de determinado tipo de automóvel (excluindo-se combustível e trocas de óleo) está sendo analisado em ionçao da idade do veículo. Nove automóveis fabricados em diferentes elnos tiveram o custo averiguado' Os dados obtidos foram: Idade do veículo (anos) L2 Custo mensal (reais) 8 13 34567 18 20 24 26 29 89 32 37 a. Faça um gráfico de dispersão e calcule o coeficiente de correlação' comente o resultado. b.Ajustearetaderegressãopelométododemínimosquadrados.Comovocê interPretaria o coeficiente B? 23.VerifiqueSeérazoâve|considerarummodeloderegressãolinear relacionando u, noà, de Inglês (Y) e Português (X)' segundo os dados apresentados na tabela a seguii. Suaconclusão deve ser baseada no coeficiente dè correlação e no ajuste da reta de regressão' lnas s,s s,r 7,0 2,5 6,0 4,05,0 5,5 5,0 6,57,,0 4,5 8,5 3,5 24.(Useocomputador)Umaindústriasubmeteseusnovosoperáriosaumtestc de aptidão (;ç; e;á; meses depois mede a produtividade destes operários (Y)' Os rãsultados estão na tabela a seguir Notas Inglês Português 9,5 6,5 9,0 4,5 t10 Operário A C Aptidão (X) Produtividade (I') 22 45 15 25 25 .7 I a. Faça o gráfico de dispersão e calcule o coeficiente de correlação. Comente o resultado. b. Ajuste a reta de regressão e trace-a no gráfico de dispersão. eual a interpretação para os coeficientes a e B? c. Verifique estatisticamente se a produtividade é influenciada pela aptidão. Use a : 0,05. d. Para um indivíduo com aptidão igual a 20, qual seria a produtividade esperada? 25. Um estudo pretende avaliar o efeito da obesidade na pressão sangüínea. Para tanto, foram avaliados os pesos para 6 indivíduos e construída a variâvel X representando a razão entre os pesos real e ideal. Estudos indicam que um modelo de regressão linear simples é adequado para essa situação. os dados obtidos foram: Indivíduo Razão (X ) Pressão sistólica (Y) L,23 L29 I,42 130 1,35 133 a. Construa a variável auxiliar d, : r - r. b.Ajuste aretay: al0d. c. Qual a interpretação para o na reta obtida em (b)? d. Qual a pressão sistólica esperada para indivíduos com razão peso real/peso ideal igual a I,25? 26. Estuda-se a relação linear entre duas variáveis x e Y. uma amostra de 20 pares dessas variáveis forneceu os seguintes valores: 20 20 20 20 20 Dq :600, f sl : 2.150, D*? : 18.662, Dy? : 235.270, D*oyo : 65.92t .i:L i=t i-_7 i:t i:7 Determine a correlação e ajuste uma reta aos dados. 27. um estudo foi conduzido para verificar se as pessoas estimam os próprios pesos corretamente. No experimento realizado, 15 pessoas foram selecionadas 19 40 18 30 22 tt .) L) 9.(t litten:ícitts ''--t#- -: .ï.í / ao acaso e a cada uma delas perguntou-se os pesos' que depois foram aferidos em balanças devidamente calibradas' Os resultados são apresentados a seguir' O que pode ser concluído a partir dos dados? 2g. A quantidade de chuva é um fator importante na produtividade agrícola' Para medir esse efeito, foram anotadas, para 8 regiões diferentes produtoras de soja, o índice pluviométrico e a produção do último ano' Chuva (mm) 120 140 r22 150 115 190 130 118 Produção (ton) 40 46 45 tF7tJl 25 54 ttJt-, 30 5557 1,67 139 1,65 1,56 136 L34 a. Faça um gráfico de dispersão e calcule o coeficiente de correlação. Comente o resultado. b. Ajuste a reta de regressão. Como você interpretaria o coeficiente B? c. utilizando a reta ajustada no item (c), encontre a produção esperada parit uma região com índice pluviométrico igual a l-60 mm' d. É adequado utilizar o modelo ajustado para calcular a produção em um0 região cujo índice pluviométrico é igual a 30 mm? Comente' ,29. (Use o computador) Para os dados do arquivo areas.txt (vejaExercício 25 do Capítulo 1), suponha que os apartamentos são classificados como de andar baúo, para a unidadã situada entre os 1s ao 6q andares (inclusive); intermediário, se o apartamento se encontra do 7q ao 72e andar e de andar alto, se estiver situado acima do l2e andar. Suspeita-se que apartamentos de andares mais baixos podem não ter o tamanho especificado no memorial descritivo' a. Construa histogramas para as medidas de área da sala para cada um dos grupos formadãs (andar baixo, intermediário e alto). Discuta se o modelo Normal é adequado para essa situação b. Dependendo de cada uma das três categorias de andar criadas, construa unl grá^fico box-plot para as áreas da sala e discuta se a localização interl'ere com o tamanho da sala' c. Usando um modelo de análise de variância, verifique se existem evidências estatísticas que dêem suporte à conclusão apresentada no item (b)' Utilize um nível de significância a : 0,01- D Indivíduo 6 789 13 t4 92 75 45 63 98 74 44 Peso 1 4 70 /c) 10 t2 Estimado ts2 (' t t 1 t í t r r I r t () :' I I i I t i t' r t,y I i,t' 1 t r c i u i,t d. Repita os itens anteriores para a ârea total do apartamento, definida conìo n soma das áreas da sala, cozinha, banheiro e dormitório. 30. (Use o computador) Para este exercício será necessário utilizar o arquivo cancer.rxt, cuja descrição é dada no Exercício 24 do capítulo 1. Deseja-se verificar se conforme aumenta a idade, muda a concentração de nitrogênio nn uréia. a. suponha que selecionamos apenas os pacientes que têm a doença (isto é, consideramos o grupo formado por pacientes cujo diagnóstico é falso- negativo ou positivo). construa um gráfico de dispersão para idade e concentração de nitrogênio. O que pode ser dito? b. Supondo que a variável dependente é a concentração de nitrogênio e que a covariável é a idade do paciente, calcule estimativas para a e p, em um modelo de regressão linear. Qual é a interpretação de B nesse caso? c. construa uma tabela ANovA para verificar, ao nível de 5vo, se existe evidência estatística de que a idade influencia na concentração de nitrogênio. d. considere, agora, os pacientes que não têm a doença (diagnóstico negativo ou falso-positivo). construa um gráfico de dispersão para idade e concentração de nitrogênio. compare com o gráfico obtido no item (a). e. calcule as estimativas para a e B nesse caso e interprete B. o que pode ser dito ao se comparar com os resultados do item (b)? f. verifique se a idade influencia a concentração de nitrogênio para os pacientes sem a doença. Considere a : 5Va. g. Com base nos itens anteriores, compare visualmente as retas ajustadas e as estimativas obtidas. você diria que o efeito da idade, na concentração de nitrogênio, é um dado importante para discriminar entre pacientes com e sem a doença? 31. (Use o computador) Para este exercício será necessário utilizar o arquivo aeusp.txt, cuja descrição é dada no Exercício 26 do Capítulo 1. a. Teste se a média da variável Itrab é a mesma nas sub-populações definidas pelo estado civil dos residentes. b. Repita o item (a) com as'sub-populações definidas pelo local de moradia. Apêndice A I I, Distribuição t - Student Distribuição Qui-Quadrado Distribuição Fisher-Snedecor ( 0,05 ) Distribuição Fisher-Snedecor ( 0,95 ) 353 .F?-!F.' .7.í5 I ) i s t t'ilt t ti t;litt N t tt' t nt I e P(0 < Z< zc) -p o,2 o,o7g3 o,og32 o,o87l ô,osr; o,o9as o'og87 0'1026 0'10ó4 o'1103 0'1141 o'2 o,40,15540,tsçto,tozeo,1664o,170oo'ì73óO',17720'18080'18440'ì8790'4 0,6 0,2257 o,zZil o,)'.3'24 0,2357 O,23gg...9,2a22 0'2454 0'2486 0'2517 0'2549 0'ó o,g 0,2BBt o,zcto o,'zísc 0,2967 o,29g5 0,3023 0'3051 0'3078 o'3loó 0'3t33 0'8 ;;';Ëil; ãi,ïií ,í|irjl.tiïirï,:ïiAï+ì;ãisç':'or=rr3Lt=o;ssao: 'óill0icaail 0'e- I,o 0,34t3 O,glsa o,sair ô,sags o,gsoe oJ53l 0,3s54 0'9577 o:3s99 0,3621 1,0 a 1,2 o,3g49 o,gaaç o,gôea o,sso7 o,392s 0,394'4 0'3962 0j399-0. iopïCz-r o'lots 1'2 ! t,+ o,uez o,tzot o,.iazz o,ìztd o,+zst 0'4265 0'4279 0'4292 0'4306 0'43t9 1'4 8 ;; ói,ì^J ói,^iu, o,ttìt o,tteÁ o/44ss o'4so5 o'45r5 o'4s25 0'4535 o'454s t'6 .q ;:; ;:,;;;; ;1,;;;, ái,ooru o,,otoo ''/u" óAoft 0'4686 o'46e3 o'46ee 0'4706 r'8 ' ;:,;;,;;;, à,,osto o',tao'l o',tet' o'487s 0'4878 0'4881 o-t!P!4-:A.!87 0'48e0 2'2 P z,c o,ava o,492o ot,4922 0,4925 0,49'27 0'4929 0'4931 0'4932 0'4934 0'4936 2'4 9, z,o o,tgss o,tgss oì,tgsa o,49s7 0,4959 0'4960 0'4961 0'4962 0'4963 0'4964 2'6 Ë ;:.;;:,;;;; ;:,^;;t o,4e76 0,4s77 o,4e77 o'4e7e ot4e7e. o:4e-7e o'4e8o o'4e8r 2'8 2'9 :0'4981"':'0'4982 a 49gg o,49*g o'498g o'499o o'49go 3'o3,O O,4g87 0,4987 0,4987 0,4988 0,4988 0,, s,2 o,4993 o,tcss o,aòct o,49g4 o,4994 o,4gg4 o'4994.. o:4995....,o.i!99s o'4995 3'2 3,4 0,4997 0,4997 Ot,4997 O,4g97 0,4997 O'4g97 O'4g97 A'4997 0'4997 0'4998 3'4 3,6 0,4998 0,4998 0,4999 0,4gg9 0,4999 0,4999 o',4999 0',4999 o',4999 0'4999 3',ó Segundo decimol de z. op ô,'-oio o,oóoo'ò,ooto o,o'ro o.otóo o:olee o'o2se o'o27e o'o31e 0'0359 o'0 o,r o,oge''r,o,oïsa o,olzã.-,-o;o.ri.'ãióisit.o.;osçe - o,oose , .o,067s 6,e71a'f;,o,.ozs3 ,i'"0,1 c,i..o,sooo ô,sooo o,sooo o,sooo o;sooo'' o,5ooô o,Sboo o;sooo=ô,sôoõ o;soôo 3,9 I ì t tl t tl ttt tr.., t, t (.)t t t (. )t t, tt I r, t, l,' a. il U Fdo{hots@ooÉN 3NOOS 6FNoG .j cì oi rt at ll',,,,1,,, .I lìtlt, l,tt 6OÉdO$n€ Fddd(ddN N-oFod({r.ìómddN.-.Or-, "i ri 6 oo- oì ...: ÕÌ _i<$$<96(ìrí) p I R R e g 3 È g 3 I I g P g : G È- Ë-t g-ã. Ë -9. ã :'Ê á ;' .; Ã- -' õ È *' d cì + ri Fi di o -. .? s o N @ o - c)'r+ ; = Ã' à.i o o c c rí iì ò õ i-' ó < t s t q s t n n LÕ ur É r € F o o 6 N N ó 3 3 R 3 ã 3 3 q + x-3-8-€- ì. R- :-; -ôó9N@s-cQ!F- q :' :' ì' .' "ì' + + ;- -' *' rr ao- o: 9 I i l : i : : : > = IôÔ É 6ó O { 6@ O 6 d o F o € - €o : sl' óÓ 6 O N s N'6 É $ @ N € - ^ - d- ï- ô-'ó- { t- --'i. q'1 a a'- -1 l-- :' 3 ::õ- *- è' ã- ; -' cì.ì íi ct + d d d € N o @ 6 9 I = : : : : :'Ìoo €dNÓ6€aONOn6- õ ç n ì ò; ó qì N-ô-o-'1 \r't \o- c\didcì{€N6-NtgN6oN d:FììcìNiroooooootÌ 6N 60 o sl o so s c{ s6 N s Ë E N: g ff 3 Ç ãÈìï I Cf i sNB B eâg qR à s x s * - - € o o -q o o s @ 6 s o N 6 ï ó ;i : ij iì X X X ;] : S y J Sr 9 o9 \ € s 6 o 6 õ N 6ã g ã' s ;' ï' â ;- ;' ì i l- ï- i ;-.'- -'- 3 3 3- 3- 3- ì 5 S 5 5 ;. : : È. : 5 ;. J Ì $ € \o 6@toÌ@h-NïQONNOg€O6.È R $ r 5 * Ê È e R id.{q R R ã t; Ë H ì.H.qì.€.$ i ë Ë g 3 à x ì 3 5d I Ë p * d ri ti Ç ì ì -i o' ;' ; ã ;' ;' ;' ;- ;- rt ct ci dì ci c,. F" c, o. o. rj ri ci c,. c,. e,. ^ pnFÍNN66O696NNN_óóFú{ s.s.;.È.Ìj R $ s n o o.; i\ = i\ õ Ê b +, F.g-ã È R R S p Ë F N È Ë g ã *; ;; ;'+ ï- ì;-;- S;;- 3-.'- S S S :-:.:. 1-N-.ì ôÌ cì.ì cì cì cì õì cì cì cì ôi ôi.ì ^ì -h-NOO@g-s6FN ú { ï{j Ìi õ õ q ô I ã 3 X 835 S SR PP Rll]9 Ír}q !eq!'q' o @ N@6ONO-6@diÉN .-- d + c, d "ì N. N. ã "ì ", -s. j. i "8. i. n 5 i. Ì. s i 3 3 3 i. s. : :. s 3 s 3 F. $. Ï. YôN6NNN6Óôó6r@6o;;+õóÃ3H$3fl NìHìËËiËìqËõ3ìsR33R;Ë ï'i S ì:'l- I-l- X-i-s cì.ì cì.ì "ì.ì N- ".- ";.;;: I.I ï.I.ï i: ì.I:.:.:. Ës:tì[**.3*s3ì:.: 3ïs3:33ÈiÈ3s$È**3ãs:.Ii Í9PN6OOOoN9N--O9Oïô6-tsã s s : õ ; s È B à È R \ I i i : È. { q s. ì i i R Ë. fl p. â. à. g. ë. * S Ë Sd ôì cì ôì ôr'-j -j -' Ë Ê s. F Ë * 3- i- i- ï- i F Ë Ë :- Ë È- Ì r F ;. Ë ; F ; 3 Ë È ;:,,:,; - dre - -::-:==ciroeèiirNÁõóoooí)'''r'r 1 € 3 s s 5 s s g P s ã 3 ì õ I 8-3.S-3 * ã E Ë d $-R-S "?':ìì. õ- :'li- ;' ;'+ ;'d G :' ;' ;'Ë' : É É g i ! : > e 3 I R I ::l llOF s 3 3 € 3 g s s ã;; ã õ ü ã-;-J-;; ã õ ü;- ã-;-J-J- J;i o 3-o-o-ai {- -,1';';';'i';';';-9- IFJdioìct'icìcìì-ì <i t6o-N'---; 'Ì o- NO o- c1 o sn n-NÍ-O66 ..1 ô- vl c.L o: €. Õi o:NN@669== --o€o{o€Í- o- €- c.r 6: o- a\ @- oNr@@6OO Èó6OFdoq ;ÉFRdNNNprfì Nx \ 0)fu .2 o oE U' c)t- o o õE o 'ìJ (J fu I '5 o C) -o oÌO .!If -o L .9 o ã33[ii3ì3]iIIÈiÌ33Ì]ÌiI3Ë! rï; ; Ë Ë R{RR 6\ c{ ô\\t ô\ to ô\o ô\oN @ÓNÈ o- o..o- o- 90ôóNNN€ dddd 6666 ooôõ oôóN 6- O- 6- !'ì oooo ddctd o66@ ddo-d ô@óó NNNN dddd FNO<t oppp. f !?9egorooooê. 39R9:::993 * 9=@-o€o6oGH ì3.ì{iA$.3Aàs --oooooddd \o QSu?-N@È€oQB 3õRXSf,FRRR rô .jddddddddd s \N!66O6€oNË tG3833;;;;\o dddddddddó :e oors@ïN6@NÁ =ïN-OOO6G6:í vlÌÍÌtï!oooh dddddddddo' :P o!ì.N-N6oNFoa^ !!@NN€999€9(!' o-c!a!NNNNNNN €o ddddddddcio' ;9 @NNsN-oo66ô()ÌooooooNN = --F-ï dddddddddd lL Fflórta€h@6O a_ I - lt U *- È U* I \ () fF .2 o U+ q C) L o õ ì c C) (J f+ tJl{ o ìO . !1" l -o 'Ë .2 o olo-6o \o€ Oo Oì .ô- ï-ôNS!oFô^ó@N€6ONONOF9 à ã. 3. 3. 3. 3. 3- 3. 3. 3. E g. 3- 3. g 3 3 5 S ë 3 s €OONFO6óóNú Ë Ë,Ë Ë g. BB gsss g.B3ssgBx.g. g.*. 333333s333È33333333.ii3 €6!ïóoNN^--ï-ooo66@N€Y oooooooóó.ió6q6, vì !ì o o ri iri õ õ ii 3-3-fi 3 3 ü il Ë il fi üo d d d d d d d d d d o' á ã à ã ã ã- ã l>l :,r à- i. $. Ë. s. ã. s. s. g. 8. g. B. g. s â g B Ë Ë Ë È Ë Hd d d d d d d d o a o' ó o' ã' ã. ;. ;- ;- ;. ;- ;- o- ft fr bìììì3sssËüË33333;;ffËiiiisiisiiSSSSSS5SSSi @@óNNNNN \\NNN€9€€9N N N N N N N N r o ir r e o i.r & iì à à À (ì èrd d o'o- o'b'o- ã ;' ;-ã ;- ;- ;. ;- ;-ã ã ;. ã ;. ;. n9N@6OFfloç6 - ( d.ì ii n ci RÈ R & g 3 3 B B RS ôo €F@NN@o-€-.1\o-o: oo<to6 €6NF9ó 6OO-€N oìF at+ìd ôFdOqO ô6óeó€oo +6rN-oOa o- -- ô' ci .j .j cì cì o,.o F:s.s.à.{s.3.u---oooF_d oo doçoots@6 g 6ô$:(ì :iËôo *óRo;- ê\9oì:?ô"- OS6€X@OOÈNo - - ; n r ci ii R R F R R R g g e B g R S ddddrl op snorc .1.ía \ ,'lpítrtlit t, ,'l: 'lìtlrlrtt I )istt ilnrir;tttt Ii ::3eRãËRfiRRRRRtt!sI ; g ;. ã-.s. $. t. q. Ë fi. t $. F F,-a e e- ; .8- s- ì- 3- 3- ü' g' Ë' s' *' q :' I : i : I Ë []i t i t- -:. s. t a'fl s.'H. n's. t Ê- qrË ã i €- 8- È- s- q : ï. : I : : : : I r n;gË s.* ì.\ e ã.;n fi.flS-F-h-Ë-È Ë Èã H'H'Ë'H'e'e'ë'â-Ë'qR'I s s, H s Ë â.ï i. 5. Q. s. ç ç €. 5 e à s a- ã- ã- F- il- ã :. u' ï Ì : : i : : : I R Ë *. ã. s. Ë. ë- Ë- S. €. Ì. q. ì. g. {. $- €- Q- 5- q- ë- -s' ã' ã' H' A :* ;' =" i i i : I I - â Ë s'i aeã.q.ï*.s.$.i.i.È.€-Eç-s-ì-s-*-ç-€-Ë ë €'F'e'e';'ãr I = n *.8.3- 3. s. s. ë. ï. $. ì. i. s.3. s- E q- e- =- *- E s- q ï::::::::1 I = I A Ë.3. s- Ë- Ë. ã- ì 'p= r. ì. ì- ì- =- i- 3- 5' E- e' q' E' q::::::::: i I : Ê S 3 ã Ë s g ã-ç-e-+-8.i.ï S-ì-3-3 3 3-5-q'E'ì'q-g s'S'E3'{'ã':" I : F. F, e. s. --. t Ë. Ë. ã. ã- è. i. ì. F- q i ï : t e- s i' : : : : : : : : : : : I = s. s ã. à. s. Ë- s- s. Ë- ã- e e. s. *. ;. *. ç. *. ì. e- ì. ë. E ì- s- 3- : ï l- l 1 : : I = ;; * i s n s s Ë ã.ã Ë â.€ ë. ë.ì.ì-ì-ï-r-q{-*-ì-$-?'ç's'i' q'$'$' I = ji*:',is r.s s s s.ã.ã.ã.s.e.Ç.ç.€.ã s ?-;-?ï-*-ì-i-i-E e'ï'q' I = , n R à il. S. s. 5. Ë. Ë. g. Ë. Ë. $. Ë- H- È- s- ã- ã' H' Ë' ã' Ê' €' ë- * * : : : : : I E a*tf'ek ei.ai.i+if : :'.'. :Ì:$i.3:ã: ï : : : : : Ip, i;í RrR ã. ã ã. *. a*. a*- 45. a=*. Ë-.!- n-€, g.$ È' g- :*t :,ï : i I I : - Ë. fi. n s. n t ã- 3. :. ã. il. $. B. a Ë. s- Ë- ã- $- s- 3- 3 3- 5- S- Ë' ì' 3' 3' i A { n ' Ë. { : s t Ê Ë F { Ê ã H- H- â- =- ã' ã' â' i Ì * : : : Ì f : : : : : ï I ^ Ê. =., R i R R { R Ë. Ë R R Ë Ë- R â R R- R Ê { Ë' Ë R Ë' Ê â { Ë i 3 1 : - p i R -Ë.. F, R F. I i i R R R a È, a n R R R R- R R R i I i 3' i i F' R Ë - ; u * u u aH.R,*aËã.Ë.Ë.È.ì.RP*i.iRR{-s,{-{Ë-[{R-{RR - E l. Ë. È. e. E Ë. Ë. ì E 3. 3- E Ê. E E E- Ë Ë Ë E Ë i ! r' x i ì Ì Ì : : : . t69::::::::::>ÈÈÉ' a!. p.!- =.É. iËr = :. :,É : Ë^ iË. iËn ii_ =.,. -,1. l,,,ut f i f f I : :ï s.-du.'üË'âË Ë.Ë- iï :i:B:f 1; . t t :,:'ï':,,ï a 3 : : Ir ã:g *. i aé. aia u. s aè. a=à Ë. â à : i :. È : : Ê ã .ã- ë. Ë- È- â d- -'rl - ! --i o o x'o - P =l'l gii'p:':': : 54 s p'x p'x l'* I g g B e o il .lJ 5\ ofu .eb ctEl+o lç" b lor Elzllri lo*lO ol>Plr O)lrrI L'-lg;loTtIE, IP Ë l?"loll-c l.e ll!l6)Ir lolrõl(,t:l-o ll-l+lú! lo ropDurruoueP oP ePDPreqll ap snotc I B ò( : 5 s : s fì :I 9. ;: :. a :- : ;lÈ-l =l ;l ;l ;l :l -81 :l :l :lclJI *l :l;l -'l 'l 8 L'OoE- P(l)oE'P; oE: c)!ogT::L ::=o; o3E ..::::: ut, =lô oL() ,-. \ \ ()f C' .9 o \U q) E tn() l- o o I o L,, oT 0) c v, Il-q)c .2 u- o -o o ro . !1"f -o 'tr ,2 o t ,il il F iï I roPoultuouap op apopJaqtl ap snDrc Apêndice B Respostas dos Exercícios Observações: 1. Nos exercícios de seção a resposta será, na maioria das vezes, acompanhadA de indicações da resolução. 2. Paru os exercícios de fim de capítulo exercícios ímpares. 3. Os exercícios de computação e de apresentadas. 4. Pequenas diferenças em algumas aproximações e casas decimais utilizadas. 5. Para não tornar muito extenso esse omitidos na apresentação das respostas. serão apresentadas as respostas para os demonstração não terão suas respostas respostas poderão refletir diferentes apêndice, os gráficos solicitados foram 361