Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
Testes de Hipóteses Referência: Estas notas de aula baseiam-se na seguinte referência bibliográfica: ESTATÍSTICA BÁSICA - Wilton de O. Bussab, Pedro A. Morettin – 5a ed. - São Paulo - Saraiva, 2002. Introdução Inferência estatística → Estimação de parâmetros → Testes de hipóteses sobre parâmetros Objetivo do teste estatístico de hipóteses: Fornecer um critério que nos permita validar ou refutar uma hipótese estatística através dos resultados de uma amostra. A hipótese estatística é uma afirmação concernente a um parâmetro θ da população (θ desconhecido). Procedimento 1 HIPÓTESES CONCERNENTES A DUAS POPULAÇÕES Exemplo: Um lote de 25 parafusos, de origem desconhecida, será leiloado a um preço convidativo. Sabe-se que a resistência média desta amostra de parafusos é 148=x (Kg-f). Para que uma indústria saiba se faz ou não uma oferta no leilão, ela necessita saber qual de dois países (Japão ou Estados Unidos) produziu tais parafusos, o que não é informado. Contudo, sabe-se que os parafusos japoneses apresentam resistência média µ1=155 e desvio padrão σ1=20; os parafusos americanos apresentam µ2=145 e desvio padrão σ2=12. Que regra de decisão a indústria deve adotar para dizer qual a procedência dos parafusos? Uma resposta imediata seria: Regra de decisão: Se x150 → procedência americana; Se x150 → procedência japonesa. Conclusão: Como 148=x , concluiríamos uma procedência americana. • Podemos estar enganados nesta conclusão? Resposta: Sim, pois é possível que uma amostra de origem japonesa apresente 150<x . 2 ponto médio parafusos japoneses µ 1 =145 σ 1 =12 µ 2 =155 σ 1 =20 150 ↓ µ 1 +µ 2 2 parafusos americanos • Procedimento para uma melhor escolha da regra de decisão: Seja : X → resistência de cada parafuso; X → resistência média da amostra de n = 25 parafusos. População 1 (parafusos japoneses) : 20,155: 111 === σµXX População 2 (parafusos americanos): 12,145: 222 === σµXX Teorema Central do Limite ==Ν ==Ν σµσµ 76,5,145:16,155: 2 2 22 2 1 11 n X n X Hipóteses ( ) ( )americanossãoparafusososXXH japonesessãoparafusososXXH 12,145:: 20,155:: 2221 1110 === === σµ σµ Erros dos tipos I e II Erro do tipo I: Rejeitar H0 quando H0 verdadeiro. Concluir que os parafusos são americanos quando são, na verdade, japoneses. Erro do tipo II: Aceitar H0 quando H0 falso. Concluir que os parafusos são japoneses quando, na verdade, são americanos. Probabilidades dos Erros I e II α = Probabilidade ( erro I ) = P ( erro I ) β = Probabilidade ( erro II ) = P ( erro II ) 3 • O novo limiar CX pode ser escolhido dependendo de α e β: Se 0HXX C ⇒≤ falso ⇒ parafusos são americanos Se 0HXX C ⇒> verdadeiro ⇒ parafusos são japoneses • No caso em que escolhemos 150=CX , quais as probabilidades α e β ? ( ) ( ) ( ) ( ) ( ) ( ) americanossãoqdojaponenessãoqueconcluirprob zPXP n XXP falsoHHaceitarPIIerroP japonenessãoqdoamericanossãoqueconcluirprob zPXP n XXP verdadeiroHHrejeitarPIerroP XX XX ..%88,1 01876,008,2 76,5 145150 76,5 145 76,5,145:150 ..%56,10 10565,025,1 4 155150 4 155 16,155:150 2 2 22 2 00 1 2 12 1 00 →≈ =>= − > − = ===µ=µΝ>= ==β →≈ =−≤= −≤−= ===µ=µΝ≤= ==α σ σ σ σ Portanto: A regra de decisão que foi adotada com 150=CX conduz a valores α ≈ 10,56 % e β ≈ 1,88 % o que privilegia a afirmação de que os parafusos são americanos ! 4 japoneses µ 1 =145 µ2=155 americanos =? Esquema: HIPÓTESES H0 Verdadeiro H0 Falso DECISÃO (parafusos são japoneses) (parafusos são americanos) Aceita-se H0 Sem Erro Erro II CXX > (Probabilidade β) Rejeita-se H0 Erro I Sem Erro CXX ≤ (Probabilidade α) DISTRIBUIÇÃO AMOSTRAL DE X PARA H0 VERDADEIRO OU H0 FALSO 5 α β CX Região de Rejeição de H 0 H 0 FALSO ⇒ paraf. americanos H 0 VERDADEIRO ⇒ paraf. são japoneses x • Para solucionar o problema de privilegiar a afirmação de que os parafusos são americanos, uma proposta seria escolher CX tal que: α =β Isto significaria que a probabilidade de errar contra japoneses é a mesma de errar contra americanos. ( ) ( ) ( ) ( ) ( )( ) ( )( ) − >= − ≤ Ν>=Ν≤ = = β=α⇔= 2 1 76,5 145 4 155 76,5,145:16,155: ? 0000 z C z C CC C X zP X zP XXXPXXXP falsoHHaceitarPverdadeiroHHrejeitarP IIerroPIerroP X ( ) ( ) 1 2 155 145 4 5,76 2,4 372 4 580 6,4 952 148,75 148,75 155 1,563 4 0,5 0 1,563 0,5 0,44062 0,0594 5,94% C C C C C C X Xz z X X X X P z P z P z β α α β − − ∴ = − ⇒ = − − = − + ⇒ = ⇒ = − ∴ = = ≤ = ≤ − = − ≤ ≤ − = − ≈ ∴ = = • Procedimento usual: Fixa-se o erro α e determina-se CX , pois como será visto, no caso geral nem sempre se encontra β. 6 z 1 z 20 z z 2 z 10 z z 2 z 10 = z área 2 área 1 área 1 área 2 Exemplo: Fixando-se ?05,0 =⇔= CXα ( ) ( ) ( )( ) ( ) 0 0 0,05 0,05 0,05 : 155 ,16 0,05 155 0,05 4 155 0,05 4 1550 0,5 0,05 0,45 4 155 : 1,645 1,645 148,42 4 C C C C C z C C C P erro I P rejeitar H H verdadeiro P X X X XP z XP z XP z X Da Tabela z X α = = = ≤ Ν = − ≤ = − ≥ − = − ≤ ≤ − = − = − = ∴ − = ⇒ = 14243 Regra de decisão para α = 0,05 Rejeita-se H0 se 42,148≤X Aceita-se H0 se 42,148>X Região de rejeição de H0 (Região Crítica – RC) { }42,148≤∈= XRXRC Cálculo de β (para α = 0,05): Neste caso em particular, é possível calcular o valor de β: ( ) ( ) ( )( ) ( )( ) ( ) ( ) ( ) %64,70764,042364,05,043,105,0 425,105,0425,1 76,5 14542,148 76,5,145:42,148 76,5,145: 00 ≈=−=≤≤−≈ ≤≤−=−>= − > =Ν> =Ν> ===β zP zPzPzP XXP XXXP falsoHHaceitarPIIerroP c 7 Procedimento 2 (Geral) HIPÓTESE H0 CONCERNENTE À POPULAÇÃO 1 E HIPÓTESE H1 CONCERNENTE A QUALQUER OUTRA POPULAÇÃO Exemplo: Considere o mesmo lote de 25 parafusos com resistência média 148=x (Kg-f). Mas agora os parafusos poderiam ser produzidos por outros países além dos dois citados (Japão e EUA). Suponha que o interesse da indústria seja o de fazer uma proposta apenas no caso de o parafuso ser de origem japonesa. Sabe-se que os parafusos japoneses têm resistência média µ = 155 e desvio padrão σ = 20. Qual a regra de decisão que a indústria deve adotar? As hipóteses são: ( ) japonesessãonãoparafusosH japonesessãoparafusoseH : 20155: 1 0 ⇔== σµ Observações: 1. Na hipótese alternativa H1 , já não podemos especificar os parâmetros, pois os parafusos não japoneses podem ser de vários outros países. 2. Α especificação da hipótese alternativa depende do grau de informação que se tem do problema. Segundo este grau de informação, pode-se construir dois tipos de testes, o teste unilateral (à esquerda ou à direita) e o teste bilateral. (A) TESTE UNILATERAL (à esquerda) HIPÓTESES ( ) ( )japonesessãonãoparafusososH japonesessãoparafusososH 155: 155: 1 0 <µ =µ Obs: A hipótese alternativa foi especificada em termos de uma desigualdade ( µ < 155 ) pois neste exemplo estamos admitindo que a indústria japonesa seja a mais desenvolvida e nenhum outro país produz parafusos com µ > 155 ! 8 • REGRA DE DECISÃO Rejeita-se CXXseH ≤0 Obs.: Isto porque só desconfiamos de 1550 < <XseH ! • VALOR CRÍTICO ( )0,05CX α = Como a hipótese alternativa é compatível com vários possíveis valores de µ ( µ < 155), não podemos encontrar β se não especificarmos qual destes possíveis valores . Assim, o procedimento usual é fixar α; por exemplo, α = 0,05: ( ) ( ) ( )( ) 42,148 05,0 4 155 05,016,155: 05,0 2 00 =⇒ = − ≤⇒===µΝ≤ ===α σ C C XC XTabelaDa X zPXXXP verdadeiroHHrejeitarPIerroP Obs: Com a hipótese H1 mais ampla, não podemos encontrar β, pois não temos um único parâmetro µ especificado em H1, pelo contrário, temos infinitos possíveis valores em H1: µ < 155. Não podemos encontrar o erro II ! DISTRIBUIÇÃO AMOSTRAL DE X NO CASO UNILATERAL 9 µ’’ µ’ CX µ = 155 ? 155 2 0 = <µ σ X falsoH 16,155 2 0 ==µ σ X verdadeiroH Região de rejeição: x α (B) TESTE BILATERAL • HIPÓTESES ( ) ( )japonesessãonãoparafusososH japonesessãoparafusososH 155: 155: 1 0 ≠µ =µ Obs: Neste exemplo estamos admitindo que os parafusos japoneses não são necessariamente os superiores. Portanto, pode haver parafusos não japoneses com resistência média inferior ou superior à dos parafusos japoneses ( µ ≠ 155 ⇔ µ < 155 ou µ > 155). • REGRA DE DECISÃO 0 1 2 0 1 2 Rejeita-se se ou Aceita-se se C C C C H x x x x H x x x < > ≤ < Obs: No teste bilateral só desconfiaremos de H0 se ( ) !155000 =µµ> >µ< < xoux DISTRIBUIÇÃO AMOSTRAL DE X NO CASO BILATERAL 10 ( ) ?,155 155 2 0 =>µ ≠µ σ X falsoH x ?155 2 0 ==µ σ X verdadeiroH 1C X 2C Xµ = 155 α / 2 α / 2 Região de rejeição: ( ) ? 155155 2 0 = <≠ σ µµ X falsoH • REGIÃO DE REJEIÇÃO Valores Críticos: xc1 e xc2 simétricos (α = 0,05) ( ) ( ) ( )( ) ( )( ) 05,016,155:16,155: 05,0 21 00 =Ν>+Ν< === XXXPXXXP verdadeiroHHrejeitarPIerroP CC α Escolhe-se xc1 e xc2 simétricos em relação à média µ, isto é: ( )( ) ( )( ) 025,0 4 155 4 155 : 025,0 2 16,155: 025,0 2 16,155: 2 2 1 1 21 1 = − >= − < = α =Ν> = α =Ν< z C z C C C X zP X zP segueondeDe XXXP XXXP Ou seja: ( ) ( ) ( ) ( ) ( ) 84,162 16,147 96,1 4 155 96,1475,00025,005,0 025,0025,0 : 310155155 4 155 4 155 2 1 1 1221 21 1 111 11 21 =⇒ =⇒ −= − = =−⇒=−<<⇒=−<<− =−>⇒=< +−=⇒−−=−⇒ / − −= / − ⇒−= C C C CCCC CC X X X z zzzPzzP zzPzzP tabelaDa XXXX XX zz Região de Rejeição: { }84,16216,147 ><∈= XouXRXRC Conclusão: Como RC148∉=ox , aceita-se H0 . 11 z 1 z 20 0,0250,025 z PROCEDIMENTO GERAL DO TESTE DE HIPÓTESES 1. Considera-se uma variável aleatória X de uma população. 2. Formula-se uma hipótese sobre um parâmetro θ: θ = θ0 (em que θ0 é o parâmetro suposto). 3. Extrai-se uma amostra da população. Através da estatística observada, aceita-se ou rejeita-se tal hipótese. HIPÓTESES Hipótese Nula: H0 : θ = θ0 Hipótese Alternativa: H1 : θ ≠ θ0 (teste bilateral) ou H1 : θ < θ0 (teste unilateral à esquerda) ou H1 : θ > θ0 (teste unilateral à direita) . ERROS Erro do tipo I: rejeitar a hipótese H0 quando esta é verdadeira.( ) ( )verdadeirorejeitarerro 00 HHPIP ==α Erro do tipo II: aceitar H0 quando esta é falsa.( ) ( )falsoaceitarerro 00 HHPIIP ==β OBJETIVO DO TESTE DE HIPÓTESES Através de uma estatística θˆ obtida de uma amostra, dizer se H0 é ou não aceitável: ( ) 0 0 rejeitasenãoˆSe serejeitarejeiçãodeoucríticaregiãoˆSe HRC HRC ⇒∉ −⇒∈ θ θ CONSTRUÇÃO DE REGIÃO CRÍTICA (RC) ( ) ( )fixovalor verdadeiraˆ 0 αθ =∈ HRCP NÍVEL DE SIGNIFICÂNCIA (α) ) erro( IP=α Valores usualmente utilizados: α = 0,05 ; 0,01 ; 0,001. 12 PASSOS PARA CONSTRUÇÃO DE UM TESTE DE HIPÓTESES 1. HIPÓTESES: as hipóteses H0 e H1 são formuladas. 2. ESTIMADOR: decide-se qual estimador θˆ será usado para testar o parâmetro suposto em H0. Considera-se a distribuição amostral de θˆ supondo-se H0 verdadeira. 3. REGIÃO CRÍTICA: O nível de significância α = P (erro I) é fixado e a região crítica (RC) é construída. 4. ESTATÍSTICA DO TESTE (valor observado): calcula-se o valor da estatística θˆ para a amostra extraída. 5. REGRA DE DECISÃO E CONCLUSÃO: Se θˆ ∉ RC aceita-se H0 ; caso contrário, rejeita-se H0 . TESTE DE HIPÓTESES SOBRE A MÉDIA DE UMA POPULAÇÃO COM VARIÂNCIA CONHECIDA Exemplo: Uma máquina automática de encher pacotes de café enche-os segundo uma distribuição normal, com média µ e variância 400 g2. O valor de µ pode ser fixado num mostrador situado em posição pouco acessível. A máquina foi regulada para µ = 500 g. A cada meia hora, desejamos colher uma amostra de 16 pacotes e verificar se a produção está sob controle, isto é, se µ = 500 g ou não. Se uma dessas amostras apresentar uma média 492=x você pararia ou não a produção para verificar se o mostrador está na posição correta ? Teste de hipóteses: 1. Hipóteses Seja X o peso de cada pacote, então ( )400,: µΝX . ( ) ≠ == gH gH 500: 500500: :Hipóteses 1 00 µ µµ 13 2. Estimador: ( ) ( ) Ν⇒ Ν Ν = 25,500:verdadeirase 25,:ou 16 400,: )16( 0 XH XX nX µµ 3. Região Crítica. Adota-se α = 0,01. A partir de H1, vemos que H0 deve ser rejeitada se .ou 21 CC XXXX << ( ) ( ) ( )( )25,500:ou01,0 verdadeirorejeitarerro 21 00 Ν><= == XXXXXP HHPIP CC α Teste bilateral: ( ) ( ) ( ) { } 1 1 1 1 1 1 2 2 1 500 500 0,005 0,005 0 0,495 5 5 500 2,58 487,10 5 500 500 487,10 512,90 512,90 487,10 512,90 C C C z C C C C X X P X X P z P z X z X X X pela simetria RC X R x ou x − − + < = ⇒ < = ⇒ < < = − + = + = ⇒ = ∴ = + − = ⇒ = = ∈ < > 14243 4. Estatística do teste: 492ˆ 0 ==θ x (para a particular amostra) 5. Conclusão: como RCx ∉0 , não se rejeita H0 . Logo, a diferença entre 00 e µx pode ser atribuída ao sorteio aleatório dos pacotes, apenas. 14 1C x 2C x500 005,0 2 = α 005,0 2 = α ( ) 525,500::0 =Ν σ XXverdadeiroH X PODER DE UM TESTE Região Crítica (ou Região de Rejeição): RC Fixa-se ( )verdadeiroˆ 0HRCP ∈= θα Região de Aceitação (Complementar): RC’( )verdadeiroˆ1 0HCRP ′∈=−∴ θα Exemplo: No exemplo anterior, uma máquina automática enche pacotes de café segundo uma distribuição normal, com média µ e variância 400 g2. A máquina foi regulada para µ = 500 g. A cada meia hora, extrai-se uma amostra de 16 pacotes e calcula-se sua média x como estatística de teste para verificar se a produção está sob controle, isto é, se µ = 500 g ou não. { } { }9,51210,487 9,512ou10,487 controlesobestánãoproduçãoserejeitaSe controlesobproduçãoseaceitaSe 0 0 ≤≤∈=′ ><∈= ⇒−⇒∈ ⇒−⇒′∈ xRxCR xxRxRC HRCx HCRx 15 =487,10 =512,90 500 2 α X ( ) ( )controlesobproduçãoX verdadeiroH 25,500: 500:0 Ν =µ 2 α RC RC RC’ 1 - α Notação compacta: P ( RC | H0 ) → probabilidade de RC∈θˆ dado H0 verdadeiro; ≡ probabilidade de rejeitar H0 quando H0 verdadeiro. P ( RC’ | H1 ) → probabilidade de CR ′∈θˆ dado H1 verdadeiro; probabilidade de aceitar H0 quando H1 verdadeiro. Hipóteses: H0 : µ = 500 ( especifica um valor) H1 : µ ≠ 500 ( especifica uma família de valores alternativos) Erros dos tipos I e II: α = P(Erro I) = P ( RC | H0 ) → pode ser calculado β = P(Erro II) = P ( RC’ | H1 ) → pode ser calculado somente se for especificado o valor de µ em H1 Exemplo de cálculo de β : Se a máquina se desregulou para µ = 505, então: ( ) ( ) ( )( ) ( ) ( ) ( ) ( ) ( ) ( )[ ] ( ) ( ) %28,949428,049983,044295,058,3058,10 58,305,058,105,058,358,1 5 5051,487 5 5059,512 25,505:505 12 1 =⇒=+=⇒<<+<<= <<−−<<+=⇒−<−<= − <− − <=⇒<−<= Ν′=⇒=′∈=′= βββ ββ ββ βµβ zPzP zPzPzPzP zPzPXXPXXP XCRPCRXPHCRP CC 16 1C x 500 2Cx 505 X 5051 =µparaH β 0H Tabela: HIPÓTESES H0 : µ = 500 H1 : µ ≠ 500 DECISÃO (produção sob controle) (produção descontrolada) Aceita-se H0 (máquina sob controle µ = 500) Sem Erro P (RC’| H0 ) = 1 - α = 0,99 Erro II P (RC’| H1 ) = β Depende do valor de µ especificado em H1 Rejeita-se H0 (máquina descontrolada µ ≠ 500) Erro I P (RC | H0 ) = α = 0,01 Sem Erro Poder do Teste Função Poder do Teste: Como β depende de µ, isto é, β = β(µ), é conveniente definir uma função Φ(µ) que caracterize o desempenho do teste. O poder do teste Φ(µ) é a probabilidade de se tomar a decisão correta quando H1 for verdadeiro (i.e., H0 falso): Φ(µ) = 1 - β(µ) O poder do teste indica o comportamento do teste em termos da probabilidade de acerto, como função de µ, com exceção do valor µ = µ0 = 500 (especificado em H0). Cálculo do Poder do Teste para alguns valores de µ: Verdadeiro Valor de µ Probabilidade Probabilidade µ ≤ 500 µ ≥ 500 de acertar de errar H0 verd: µ=500 µ=500 1 - α = 0,99 = 99 % α = 0,01 = 1 % H1 verd: µ=498 µ=502 1 - β = 1,7 % β = 98,3 % " µ=495 µ=505 1 - β = 5,8 % β = 94,2 % " µ=490 µ=510 1 - β = 28,1 % β = 71,9 % " µ=485 µ=515 1 - β = 66,3 % β = 34,7 % " µ=480 µ=520 1 - β = 92,1 % β = 7,9 % 17 Áreas 1-β(µ) para valores especificados de µ: Gráfico do poder do teste 1-β(µ) : Gráfico para α = 1 % fixo com RC definida,{ }2,505ou8,494 ><∈= XXRXRC para valores n = 16 e n = 100. 18 =487,10 =512,90 500 = 0,5 % X H 0 =0,5 % RC H 0 : µ = 500 (verdad) α = 1 % 2C x 510 X H 1 : µ ≠ 500 (µ = 510) (verd) 1C x 500 1 – β = 28,1 % H 0 Aumento de | µ - 500 | ⇒ Aumento de 1 - β 1 - β 90 % 480 500 520 n = 16 µ Definição Geral da Função Poder do Teste: H0 : θ = θ0 Fixa-se α ⇒ RC (Região de Rejeição) 1- β = P( rejeitar H0 | H1 verdadeiro ) Função Poder do Teste: ( ) ( )θθθβ RCP ∈=− ˆ1 O poder do teste é a probabilidade de decisão correta para uma alternativa θ (verdadeira). Para um dado µ , 1 - β(µ) aumenta com n . TESTE PARA PROPORÇÃO Considere uma população e uma hipótese sobre a proporção p de indivíduos que apresentam certa característica. Os passos para a construção do teste para a proporção são os seguintes: 1. Hipóteses 0 0 0 proporção de individuos com uma dada : : característica na população valor suposto p H p p onde p → = → Hipóteses alternativas: (i) H1 : p ≠ p0 (teste bilateral ou bicaudal) (ii) H1 : p > p0 (teste unilateral ou monocaudal à direita) (iii) H1 : p < p0 (teste unilateral ou monocaudal à esquerda) 2. Estimador ( ) −Ν n pppp 1,:ˆ 19 3. Região Crítica Fixa-se α ⇒ RC (Região Crítica) ( ) ( ) ( ) 0 0 0 0 0 ˆ 1 ˆ : , P erro I P p RC H p p H verdadeiro p p n α = = ∈ − ⇒ Ν 4. Estatística do teste (valor observado) 0pˆ → proporção observada na amostra 5. Decisão e conclusão Rejeita-se RCpseH ∈00 ˆ . Exemplo: Uma estação de televisão afirma que 60% dos televisores estavam ligados no seu programa especial. Uma rede competidora deseja contestar a afirmação e decide entrevistar uma amostra de 200 famílias, obtendo 104 respostas afirmativas. Qual o procedimento que deve ser adotado para julgar a veracidade da afirmação ? 1. Hipóteses: ( )valoro"erestimadosup"teriaemissoraa60,0: 60,0: 1 00 < == pH ppH 2. Estimador: n = 200 ( )(1 )ˆ : , 200 p pp p estatística− ⇒ Ν 3. Região crítica: Fixando-se α = 0,05, ( ) ( ) Ν⇒ ∈== 200 24,0;60,0:ˆverdadeiroSe ˆIerro 0 0 pH HRCpPPα : 20 ( ) { } 1,645 0,60 0,60ˆ ˆ 0,05 0,05 0 0,45 0,24 0,24 200 200 ˆ0,60 ˆ ˆ1,645 0,60 0,0570 0,5430 0,24 200 ˆ ˆRegião Crítica : 0,5430 C C c C C C c p pP p p P z P z p z p p RC p RC p − − = < = ⇒ < = ⇒ = < < = − = = ⇒ − = ⇒ = = ∈ ≤ 123 4. Estatística do teste (valor observado na amostra): 5200,0 200 104ˆˆ 0 === pp 5. Decisão e conclusão Como ⇒∈ RCp0ˆ Rejeita-se H0 ⇒ audiência p é inferior a 60 % . 21 0,6 0 05,0=α pˆ Cpˆ P P NÍVEL DESCRITIVO (p-valor) Um outro procedimento adotado no teste de hipóteses difere do procedimento clássico apenas pelo fato de que, ao invés de se construir a região crítica (RC), apresenta-se o denominado nível descritivo ou p-valor. Nível descritivo ou p-valor O p-valor é a probabilidade de ocorrer valores da estatística tão extremos ou mais extremos do que o observado, se a hipótese H0 for verdadeira. Outra possível definição (equivalente): O p-valor é o menor nível de significância ( )αˆ para o qual o valor observado conduz à rejeição de H0. Exemplo - Nível descritivo em um teste unilateral Hipóteses: 60,0: 60,0: 1 0 < = pH pH Valor observado: 52,0 200 104ˆ200 0 ==⇒= pn 22 µ 0 αˆ X Nível Descritivo α 0X 1CX 01 00 : : µ<µ µ=µ→ H verdadeiroH Valor Crítico: Estatística: Se rejeita-se H 0 Nível descritivo (p-valor):( ) ( ) ( ) %101,0ˆ 48956,05,031,2 03464,0 60,052,0 52,0ˆˆˆ 000 =≈ −=−<= − <= <=<= α α α zPzP HpPHppP Interpretação: Se H0 for verdadeiro, isto é, se a audiência for fato %60=p , a probabilidade de se obter uma amostra com %52ˆ 0 =p ou menos é de apenas %1ˆ =α . Neste caso, ou continuamos admitindo que a hipótese H0 é verdadeira e a amostra obtida é improvável de ocorrer ou então concluímos que a hipótese H0 não é verdadeira. O teste é construído de modo a se optar pela última possibilidade, isto é, rejeita-se H0 . Decisão: Rejeita-se H0 se: α≤αˆ indica o que é raro ( 1%, 5%, etc) Exemplo - Nível descritivo em um teste bilateral O tempo de duração das viagens entre duas cidades é normal com média µ = 300 minutos e desvio padrão σ = 30 minutos, segundo um estudo preliminar. Em 10 viagens realizadas neste trajeto, o tempo médio foi 3140 =x minutos. Este resultado comprova ou não o estudo preliminar? 23 αˆ pˆ = 0,05 o Cpˆ 60,00 =p [ ]0012,0;60,0 200 40,060,0;60,0:ˆ 0 Ν= ×Νp verdadeiroH Hipóteses: ( ) 300: 30,300:300: 1 2 0 ≠ Ν= µ µ H XH Estimador: σµΝ 10 ,: 2 X pelo T.L.C. Se H0 verdadeiro ⇒ Ν 10 900,300:X Valor observado: 3140 =x ( ) ( ) ( ) ( )?rejeitarseparararoeventoumé%7%707,048,1 2 ˆ 49,9 300314314 2 ˆ 0 00 HZP ZPxPHxxP ==>= − >=>=>= α α Nível descritivo: 0HrejeitarseparaαciasignificândenívelMenor%14ˆ →=α Nível descritivo unilateral: %7 2 ˆˆ = α =α ′ Para 0Hrejeitasenão%5%14ˆ%5 ⇒=>=⇒= ααα 24 300 2 αˆ X 2 αˆ 286 3140 =X H 0 (BILATERAL) TESTES QUE ENVOLVEM A DISTRIBUIÇÃO NORMAL Em geral, suponha que para testar hipótese H0: θ = θ0 , em um teste bilateral ou unilateral, utilizemos uma estatística θˆ cuja distribuição é normal com média e desvio padrão , isto é: ),(:ˆ 2θθ σµθ N . Neste caso, também podemos utilizar como estatística de teste a variável θ θ σ µσ − = ˆZ cuja distribuição é normal padronizada: Z : N 0,1 . A região crítica RC é então definida em termos da estatística Z. Em termos da variável Z, o valor observado Zo é calculado como θ θ σ µσ − = o oZ ˆ , em que o é o valor da estatística observado na amostra. A regra de decisão estabelece que H0 é rejeitada se Z o∈RC . Um teste como este, que envolve a distribuição normal padrão e, portanto, a estatística Z, é conhecido como teste Z. Exemplo: De uma população com distribuição normal e variância 92 =σ , extraiu- se uma amostra casual de 40=n elementos e calculou-se a média x desta amostra, obtendo-se 60=x . Ao nível de significância 05,0=α , teste as hipóteses: (a) 59:0 =µH contra 59:0 ≠µH . (b) 59:0 =µH contra 59:0 >µH . 25 (a) Teste bilateral Sigamos os passos do procedimento geral: Hipóteses: 59:0 =µH 59:1 ≠µH Distribuição amostral de X (se 59:0 =µH for verdadeira). Ë dada pelo teorema central do limite: === 40 9,59: 2 2 n NX XX σ σµ Região crítica RC: como a hipótese alternativa é da forma 59:1 ≠µH , o teste é bilateral . Em termos da variável normal padronizada XXXZ σµ )( −= , a região de rejeição de 0H é da forma: { }cc zZzZIRZRC −<>∈= ou| O valor crítico cz é determinado igualando-se 025,0 2 )( ==> αczZP pois o teste é bilateral. Da tabela da distribuição normal padrão, obtemos : 96,1=cz . ● Valor observado: 108,2 403 5960 = − = − = X X o XZ σ µ Decisão: como }96,1ou96,1{108,2 −<>=∈= ZZRCZo , rejeita-se 0H . Conclusão: 59≠µ ao nível 05,0=α . (b) Teste unilateral à direita Sigamos os passos do procedimento geral: Hipóteses: 59:0 =µH 59:1 >µH Distribuição amostral de X (se 59:0 =µH for verdadeira). É dada pelo teorema central do limite: === 40 9,59: 2 2 n NX XX σ σµ 26 Região crítica RC: como a hipótese alternativa é da forma 59:1 >µH , o teste é unilateral à direita . Em termos da variável normal padronizada XXXZ σµ )( −= , a região de rejeição de 0H é da forma: { }czZIRZRC >∈= | O valor crítico cz é determinado igualando-se 05,0)( ==> αczZP pois o teste é unilateral. Da tabela da distribuição normal padrão, obtemos : 645,1=cz . ● Valor observado: 108,2 403 5960 = − = − = X X o XZ σ µ ● Decisão: como }645,1{108,2 >=∈= ZRCZo , rejeita-se 0H . Conclusão: 59≠µ ao nível 05,0=α . 27