Logo Passei Direto
Buscar

Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original

Teste de Hipóteses
Nesta aula estudaremos outro aspecto de inferência estatística: o Teste de Hipóteses.
Objetivo: Decidir se uma conjectura sobre determinada característica de uma ou mais 
populações é, ou não, apoiada pela evidência obtida dos dados amostrais. Tal
conjectura é o que se chama hipótese estatística, e a regra usada para decidir se ela 
é verdadeira ou não é o teste de hipótese.
Exemplo: Com base na produtividade de uma hortaliça cultivada em uma área onde 
foi usado um novo fertilizante, e em outra área onde se utiliza o fertilizante padrão, 
temos de decidir se o novo fertilizante é, ou não, melhor. A dificuldade aqui − e daí a 
necessidade de métodos estatísticos − é que a produtividade varia de planta para 
planta.
Os testes de hipóteses permitem-nos tomar decisões em presença da variabilidade, 
ou seja, verificar se estamos diante de uma diferença real (significativa) ou de uma 
diferença devida simplesmente à flutuação aleatória ao processo.
Hipótese estatística: Uma hipótese estatística, que denotaremos por H, é qualquer 
afirmação sobre a população em estudo.
Na formulação de um teste de hipóteses, duas hipóteses são definidas. A hipótese de 
investigação, Ha, denominada hipótese alternativa e a hipótese nula, H0, que consiste 
na negação de Ha. Então, o teste de hipóteses consiste numa regra de decisão entre 
H0 e Ha. Nesta regra de decisão são utilizadas as informações obtidas na amostra.
Exemplos: 
1) Um pesquisador deseja estudar o efeito de certa substância no tempo de reação de 
seres vivos a um certo tipo de estímulo. Um experimento é desenvolvido com cobaias 
que são inoculadas com a substância e submetidas a um estímulo elétrico, com seus 
tempos de reação (em segundos) anotados. Admite-se que o tempo de reação segue, 
em geral, o modelo N(8 seg; 2 seg). O pesquisador desconfia, entretanto, que o 
tempo médio sofre alteração por influência da substância.
Neste caso, as hipóteses de interesse são:
H0: as cobaias apresentam tempo de reação padrão
Ha: as cobaias apresentam tempo de reação alterado
Em termos estatísticos, tais hipóteses envolvem o parâmetro  e podem ser escritas 
como
H0:  = 8,0 seg
Ha:  ≠ 8,0 seg
2) Suponha que entre pessoas sadias a concentração de certa substância no sangue 
se comporta segundo um modelo Normal com média 14 unidades/ml e desvio padrão 
6 unidades/ml. Pessoas sofrendo de uma doença específica têm a concentração 
média da substância alterada para 18 unidades/ml. Admitimos que o modelo Normal, 
com desvio padrão 6 unidades/ml, contínua representando de forma adequada a 
concentração da substância em pessoas com a doença. 
A figura a seguir ilustra a situação descrita.
DoenteSadio
Note que as curvas, representando as concentrações, se cruzaram, fazendo com que 
uma certa proporção de indivíduos na população sadia possa apresentar valores de 
concentração tão altos quanto aqueles observados para pessoas doentes, ainda que 
este evento ocorra com baixa probabilidade.
Desejamos verificar se um certo tratamento, proposto para combater a doença, é
eficaz.
Uma amostra aleatória de tamanho n é selecionada entre os indivíduos doentes que 
foram submetidos ao tratamento.
Representamos as concentrações dos indivíduos da amostra por X1, ..., Xn.
Xi ~N( , 6), para i = 1, ..., n, sendo = 14 ou  = 18 dependendo do tratamento ser 
eficiente ou não.
Caso a amostra de n indivíduos forneça valor médio de concentração alto e “próximo”
de 18, teremos evidências de que o tratamento não é eficaz, ao passo que um valor 
baixo e “próximo” de 14 unidades/ml nos revelaria crer que o tratamento apresenta
resultados satisfatórios. Isto é, se o tratamento for eficaz, então os n indivíduos 
podem ser vistos como sendo da população com concentração modelada por uma 
N(14; 6), caso contrário, eles pertencerão à população N(18; 6).
Neste caso, as hipóteses de interesse são:
H0: o tratamento não é eficaz
Ha: o tratamento é eficaz
No caso do tratamento ser eficaz, é razoável assumirmos que ele foi capaz de fazer 
com que os indivíduos da amostra mudassem para uma população cuja média é
inferior a 18 unidades/ml, caso contrário, se o tratamento é ineficaz,  não se alteraria. 
Assim, as hipóteses de interesse seriam:
H0:  = 18 versus Ha:  < 18 
A caracterização do que significa ser “próximo” depende, entre outros fatores, da 
variabilidade da concentração na população.
Como a amostra de n indivíduos é aleatória, precisaremos estudar probabilisticamente 
o problema, o que será feito, mais a frente, através da técnica estatística denominada 
teste de hipóteses para a média com variância conhecida.
Por conveniência técnica, sempre, deixamos a igualdade na hipótese nula.
Queremos decidir entre H0 e Ha. 
Em todo processo de decisão existe a chance de uma decisão errada. Neste processo 
de decisão dois tipos de erro são possíveis, como mostra o quadrado seguinte. 
Erros possíveis associados a teste de hipóteses
Situação Real
Decisão H0 verdadeira H0 falsa
Rejeitar H0
decisão incorreta
(Erro tipo I)
decisão correta
Não rejeitar H0
decisão correta decisão incorreta
(Erro tipo II)
Podemos rejeitar H0 quando H0 é verdadeira, que consiste no erro tipo I e podemos 
não rejeitar H0 quando H0 é falsa, que consiste no erro tipo II.
No exemplo anterior, estes dois erros são:
Erro tipo I: concluir que o tratamento é eficaz quando na verdade ele não é concluir 
que <18 quando na verdade  = 18.
Erro tipo II: concluir que o tratamento não é eficaz quando na verdade ele é 
concluir que  = 18 quando na verdade  < 18.
As probabilidades do erro tipo I e do erro tipo II serem cometidos são, 
respectivamente:
 = P(erro tipo I) = P(rejeitar H0 | H0 verdadeira) = nível de significância do teste
 = P(erro tipo II) = P(não rejeitar H0 | H0 falsa)
Os dois tipos de erro são indesejáveis. 
Para um tamanho de amostra fixo, isto é, coletados os dados, não é possível controlar 
os dois erros simultaneamente.
Nos testes que iremos apresentar, o erro tipo I é considerado mais grave e vamos 
controlar este erro.
O erro tipo II pode ser controlado no planejamento do estudo, determinando um 
tamanho de amostra adequado.
Então, queremos encontrar uma regra de decisão entre H0 e Ha tal que o erro tipo I 
seja controlado.
Vamos controlar este erro pré-fixando a probabilidade de sua ocorrência em um valor 
 pequeno.
O valor de  é estabelecido pelo pesquisador. É usual trabalhar com valores de 
menores ou iguais a 5%, sendo que o mais comum é o de 5% ( = 0,05). 
A capacidade de um teste identificar diferenças que realmente existem, ou seja, de 
rejeitar H0 quando é realmente falsa, é denominada poder do teste e é definida 
como 1 – . Poder do teste = P(rejeitar H0 | H0 falsa) = 1 – . 
Etapas para Testar uma Hipótese Estatística
1. Definir a hipótese nula H0 e a hipótese alternativa Ha.
2. Escolher a estatística de teste adequada.
3. Escolher o nível de significância  e estabelecer a região crítica.
4. Calcular o valor da estatística de teste com base em uma amostra de tamanho n 
extraída da população.
5. Rejeitar H0 se o valor calculado da estatística está na região crítica. Não rejeitar H0
em caso contrário.
Uma forma alternativa de testar uma hipótese estatística – atualmente mais usada –
é através da probabilidade de significância ou p-valor.
O p-valor nos fornece a probabilidade, calculada supondo H0 verdadeira, de que
ocorram valores tão ou mais extremos que o observado para a estatística de teste.
Se p-valor for menor do que o limite tolerável, a, para a probabilidade do erro tipo I, 
decide-se por rejeitar H0. Ou seja, se p-valor <   rejeitar Ho.
1.Teste de Hipóteses para uma média populacional
1.1 - População Normal,  conhecido
População X ~ N (
Estatística de teste:
Teste unilateral
esquerdo: Região crítica: RC:. Zobs < -z
H0 : 0 ou H0:  ≥ 
Ha : < 0 ou Ha :  < 0
 
n
XZ


 sob Ho verdadeira Z ~ N (0 ; 1)
-z
RCp-valor: p = P(Z < Zobs) , rejeita-se H0 se p < 
Teste unilateral direito: Região crítica: RC:. Zobs > za
H0 :  = 0 ou H0:  ≤ 0
Ha :  > 0 ou Ha :  > 0
p-valor: p = P(Z > Zobs) , rejeita-se H0 se p < 


z RC
Teste bilateral: Região crítica: RC:. Zobs < -z ou Zobs > z
H0 :  = 0
Ha :  ≠ 0
p-valor: p = 2P(Z > | Zobs| ) , rejeita-se H0 se p < 

z
RC
z
RC
Exemplo: Suspeita-se de que um medicamento vasodilatador (Nifedipina) para 
hipertensão arterial, amplamente receitado, esteja aumentando a freqüência cardíaca 
dos pacientes. É sabido que a freqüência cardíaca na população de pacientes com 
hipertensão arterial tem distribuição normal com média 69,8 bat/min e desvio-padrão 
de 1,86 bat/min. Para verificar essa suspeita colheu-se uma amostra aleatória de 50 
pacientes que recebem Nifedipina e mediu-se a freqüência cardíaca de cada um, 
obtendo-se os seguintes resultados: 
71,47 71,67 68,26 69,19 72,53 70,85 71,64 67,93 73,52 67,22
67,95 68,84 72,45 72,44 70,54 70,70 74,47 68,38 71,38 69,70
68,89 69,45 73,18 72,89 71,02 69,89 68,29 71,00 70,69 69,95
71,44 69,21 71,54 71,29 72,15 69,99 67,10 68,56 67,65 72,17
70,59 72,46 72,13 70,88 72,11 72,66 71,21 70,02 69,40 70,55
Por analogia a estudos anteriores, o desvio padrão da freqüência cardíaca de 
pacientes que fazem uso do vasodilatador pode ser considerado igual ao dos 
pacientes que não fazem uso do medicamento.
Deseja-se testar se a freqüência cardíaca de pacientes com hipertensão arterial que 
fazem uso do vasodilatador é superior à freqüência cardíaca de pacientes normais.
Isto é, queremos testar se: H0 :  = 69,8 versus Ha :  > 69,8 (teste unilateral 
direito).
Temos que:  = 1,86, n = 50 e 
Como os dados são de uma distribuição normal com s conhecido usamos a 
estatística de teste Z.
590,70
50
1

i
i
n
xX
00,3
50
86,1
80,69590,70




 obsZ
n
XZ 


RC
Como Zobs > 1,64, conclui-se que existem evidências amostrais para se rejeitar Ho
ao nível de significância  = 5%. 
Logo, há evidências de que a freqüência cardíaca média de pacientes que tomam o 
remédio é maior que a dos pacientes que não fazem uso do medicamento, com  de 
5%.
p-valor = P(Z>3,00) = 0,5 - P(0<Z<3,00) = 0,5 - 0,4987 = 0,0013
0,0013 < 0,05  rejeita-se H0
1.2 - População Normal,  desconhecido
Se o desvio padrão é desconhecido, ele precisa ser estimado. Supondo que a 
amostra aleatória seja de uma população X ~ N (   utilizamos o “melhor”
estimador que conhecemos para 2 que, como visto, é dado por 
Estatística de teste:
A variável padronizada T segue uma distribuição t-Student com n-1 graus de 
liberdade.
   
11
22
2





 
n
xx
S
n
xx
S ii
n
s
XT 
Teste unilateral esquerdo: Região crítica: RC:. Tobs < -tn1,
H0 : 0 ou H0:  ≥ 
Ha : < 0 ou Ha :  < 0
p-valor: p = P(T < Tobs) , rejeita-se H0 se p < 
Teste unilateral direito: Região crítica: RC:. Tobs > tn-1,
H0 :  = 0 ou H0:  ≤ 0
Ha :  > 0 ou Ha :  > 0
p-valor: p = P(T > Tobs) , rejeita-se H0 se p < 
Teste bilateral: Região crítica: RC:. Tobs < -tn-1, ou Tobs > tn-1,
H0 :  = 0
Ha :  ≠ 0
p-valor: p = 2P(T > | Tobs | ) , rejeita-se H0 se p < 

-tn-1,
RC

RC
tn-1,
 
-tn-1,
RC RC
tn-1,
Exemplo: Deseja-se investigar se uma moléstia que ataca o rim altera o consumo de 
oxigênio desse órgão. Para indivíduos sadios, admite-se que esse consumo tem 
distribuição Normal com média 12 cm3/min. Os valores medidos em 16 pacientes com 
a moléstia foram: 14,4; 12,9; 15,0; 13,7; 13,5; 14,6; 13,0; 13,7; 14,5; 14,8; 13,9; 14,0; 
14,3; 15,0; 13,3 e 12,9. Qual seria conclusão, ao nível de 1% de significância?
O teste de interesse é:
H0 : A moléstia não altera a média de consumo renal de oxigênio
Ha : Indivíduos portadores da moléstia têm média de consumo renal de oxigênio
alterada
Isto é,
H0 :  = 12 versus Ha :  ≠ 12.
Sendo 2 desconhecido usaremos o estimador S2.
   
11
22
2





 
n
xx
S
n
xx
S ii
Assumindo que a amostra de 16 pacientes é de uma população N( ; ), usaremos a 
estatística de teste T.
 
723,0
1
969,13
16
9,12...0,159,124,14
2
1










n
xx
S
n
x
X
i
n
i
i
Estatística de teste:
n
s
XT 
T
-2,947

2,9470

RC RC
893,10
16723,0
12969,13


obsT
RC.: Tobs < -tn-1,  ou Tobs > tn-1,
Para  = 0,01 e  = n-1 = 16 - 1 =15 graus de liberdade  t15, 0,005 = 2,947 (valor 
encontrado na tabela da distribuição t.
RC.: Tobs < -2,947 ou Tobs > 2,947 
Portanto, como Tobs pertence à RC, decidimos pela
rejeição da hipótese nula, ou seja, a moléstia tem
influência no consumo médio de
oxigênio ao nível de significância de 1%.
1.3 - População não segue uma distribuição Normal, grandes amostras
Pelo Teorema Central do Limite:
O que nos permitirá usar a estatística de teste:
Teste unilateral esquerdo: Região crítica: RC:. Zobs < -z
H0 :  = 0 ou H0:  ≥ 0
Ha :  < 0 ou Ha :  < 0
____________________________________________________________________
Teste unilateral direito: Região crítica: RC:. Zobs > z
H0 :  = 0 ou H0 :  ≤ 0
Ha :  > 0 ou Ha :  > 0







n
sNX ;
n
s
XZ 
p-valor: p = P(Z < Zobs) , rejeita-se H0 se p < 
-Z

RC
p-valor: p = P(Z > Zobs) , rejeita-se H0 se p <  Z RC
Teste bilateral: Região crítica: RC:. Zobs < -z ou Zobs > z
H0 :  = 0
Ha :  ≠ 0
Exemplo: Um laboratório farmacêutico introduz no mercado um novo comprimido 
contra dor de cabeça, retirando de circulação o antigo, com a justificativa de que o 
novo produto tem ação mais rápida. O remédio que estava no mercado tem um tempo 
médio de 37 minutos para o início do efeito. Em uma amostra de 34 pessoas que 
tomaram o novo comprimido, obteve-se um tempo médio de 36 minutos, com desvio 
padrão de 4 minutos. Ao nível de significância de 5% podemos afirmar que o novo 
comprimido tem ação mais rápida?
Solução: 
H0 :  = 37 (o novo comprimido não é melhor que o antigo)
Ha :  < 37 ( o novo comprimido tem ação mais rápida que o antigo)
Estamos diante de uma situação em que não conhecemos a distribuição, mas o 
tamanho da amostra, n = 34, pode ser considerada grande. Devemos, pois, usar o 
Teorema Central do Limite.
p-valor: p = 2P(Z > | Zobs | ) , rejeita-se H0 se p < 
 
-z
RC RC
z
n
s
XZ  46,1
34
4
3736


obsZ
RC
Estatística de teste:
Pela tabela da distribuição Normal, z0,05 = -1,64. Então, a RC é dada por: Z < -1,64.
O valor de Z calculado, Zobs, com base na amostra não está na região 
de rejeição, RC. Logo, não rejeitamos H0 e concluímos que o tempo
médio de ação do novo comprimido não é inferior ao tempo
médio de ação do comprimido que estava no mercado, 
ao nível  = 0,05.
Utilizando o p valor, teríamos: p = P(Z
< -1,46) = 0,5 - 0,4279 = 0,00721. Como p > 
0,05, não rejeitamos H0.
2.Teste de Hipóteses para uma proporção populacional, grandes amostras
Estatística de teste:
Teste unilateral esquerdo: Região crítica: RC:. Zobs < -za
H0 : p = p0 ou H0: p ≥ p0
Ha : p < p0 ou Ha : p < p0
p-valor: p = P(Z < Zobs) , rejeita-se H0 se p < 
)1;0(
)1(
ˆ)1(;ˆ N
n
pp
ppZ
n
pppNp 







 

n
pp
ppZ
)1(
ˆ
0
0



Teste unilateral direito: Região crítica: RC:. Zobs > za
H0 : p = p0 ou H0: p ≤ p0
Ha : p > p0 ou Ha : p > p0
p-valor: p = P(Z > Zobs) , rejeita-se H0 se p < 
Teste bilateral: Região crítica: RC:. Zobs < -z ou Zobs > z
H0 : p = p0
Ha : p ≠ p0
p-valor: p = 2P(Z > | Zobs| ) , rejeita-se H0 se p < 
Exemplo: Um modelo genético sugere que 80% das plantas oriundas do cruzamento de 
dois tipos de sementes serão da variedade anã. Após observar o crescimento de 200 
destas plantas, constatou-se que 144 eram anãs. Os dados contradizem o modelo 
genético?
Solução:
Sejam p a proporção de plantas da variedade anã e p0 a proporção sugerida pelo 
modelo genético. As hipótese são:
H0: p = p0 isto é H0: p = 0,80
Ha : p  p0 isto é Ha: p  0,80
Estatística de teste: 
RC.: Zobs < - Z  ou Zobs > Z
Para  = 0,05, temos, pela tabela, Z = 1,96  RC.: Zobs < -1,96 ou Zobs > 1,96.
Como Zobs < -1,96, ao nível de significância de 5% rejeitamos a hipótese nula, ou seja, 
os dados contradizem o modelo genético.
p-valor = 2P(Z<-2,83) = 2.(0,5 – 0,4977) = 2.0,0023) = 0,0046
Como p-valor < 0,05, rejeita-se H0 ao nível de significância de 5%
0,72 0,80 2,83
0,80.0, 20
200
obsZ

  
72,0
200
144ˆ p

Teste o Premium para desbloquear

Aproveite todos os benefícios por 3 dias sem pagar! 😉
Já tem cadastro?