Logo Passei Direto
Buscar

Nocoes de Estatistica e Probabilidade - 2012 Parte 2

User badge image

Enviado por Mauricio da Silva Pires em

Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original

Noções de Estatística e Probabilidade 108 Profª Berenice C. Damasceno 
14. AMOSTRAGEM 
14.1 INTRODUÇÃO 
CONFIABILIDADE DA AMOSTRA 
A estimativa do tamanho da amostra é um dos fatores determinantes para o sucesso de 
uma Pesquisa Estatística. O tamanho da amostra pode ser pequeno em relação à 
população geral. Veremos formas específicas para o cálculo da amostra mínima 
necessária para dar confiança aos resultados obtidos. 
Entretanto, existem dois fatores estatísticos que devem ser mantidos em mente: 
- Quanto maior o tamanho da amostra, as informações sobre a população serão mais 
precisas; 
- Acima de determinado tamanho poucas informações extras sobre a população 
podem ser obtidas, no entanto, o tempo e os custos aumentam. 
 
PLANEJAMENTO DA AMOSTRA 
 
A amostragem ideal para todo o estudo estatístico é a Amostragem Aleatória Simples. 
Em estatística, um planejamento da amostra é um plano definido completamente antes 
da coleta de quaisquer dados e que tem por objetivo a obtenção de uma amostra de uma 
população. 
 
Os métodos mais usuais de amostragem além da amostragem aleatória simples são: 
 
- Amostragem Sistemática; 
 
- Amostragem Estratificada; 
 
- Amostragem por Conglomerados. 
Noções de Estatística e Probabilidade 109 Profª Berenice C. Damasceno 
ERROS PROVENIENTES DA AMOSTRAGEM 
 
Estes erros surgem do fato da amostra não ser representativa em relação à população 
em questão. Eles geralmente são minimizados com a consideração cuidadosa do 
método de amostragem a ser utilizado. Com amostras aleatórias, o tamanho desses 
erros de amostragem pode ser posteriormente estimado e existem métodos de cálculo 
para estimá-lo. 
 
ERROS NÃO PROVENIENTES DA AMOSTRAGEM 
 
Estes erros surgem devido a várias causas, incluindo: 
 
- Registros incorretos dos dados; 
- Transferência incorreta de dados para a calculadora ou computador para 
processamento; 
- Medições incorretas; 
- Perguntas mal elaboradas; 
 
PLANEJAMENTO GERAL DA PESQUISA 
 
Para resumir, aqui temos uma lista de verificação das principais etapas do projeto de uma 
pesquisa: 
 
– Defina as metas da pesquisa; 
– Defina a população; 
– Identifique o esquema de Amostragem (definir a amostra e o tamanho que ela deve 
ter); 
– Decida que método de coleta de dados utilizar (questionário pessoal, entrevista, 
medições, etc); 
– Caso decida usar questionário, preparar um apropriado para entrevistas pessoais; 
– Selecione e treine qualquer pessoa envolvida no processo de coleta de dados. 
Noções de Estatística e Probabilidade 110 Profª Berenice C. Damasceno 
14.2 DISTRIBUIÇÕES AMOSTRAIS 
A distribuição amostral é provavelmente o conceito mais fundamental da inferência 
estatística, e está relacionado com a idéia de variação aleatória que permite enfatizar a 
necessidade de medir a variabilidade de dados. 
Para ilustrar o conceito de distribuição amostral vamos construir a distribuição da média 
de uma amostra aleatória de tamanho n=2 extraídas sem reposição, de uma população 
finita de tamanho N=5 cujos dados poderiam ser (3,5,7,9 e 11). 
Neste caso teremos: 
 
7
5
119753
=
++++
=µµµµ 
e seu desvio padrão é: 
8
5
)711()79()77()75()73( 22222
=
−+−+−+−+−
=σσσσ 
 
Se tomarmos agora amostra n=2 neste caso temos 10 possibilidades, isto é, a 
combinação 5,2 , ou seja, 10
2
4.5
!3.2
!3.4.5
!3.!2
!5
)!25!.(2
!5C 2,5 ====
−
= . Tais possibilidades são: 
 
(3 e 5) (3 e 7) (3 e 9) (3 e 11) (5 e 7) (5 e 9) (5 e 11) (7 e 9) (7 e 11) (9 e 11) 
 
e suas médias são: 
 4 5 6 7 6 7 8 8 9 10 
Como cada amostra tem probabilidade 1/10, obtemos a seguinte Distribuição Amostral da 
Média: 
Média 
__
X 
Probabilidade 
4 1/10 
5 1/10 
6 2/10 
7 2/10 
8 2/10 
9 1/10 
10 1/10 
Noções de Estatística e Probabilidade 111 Profª Berenice C. Damasceno 
 
Desta forma o Histograma da Distribuição das Probabilidades fica: 
 
 
 
 
 
 
 
 
Observa-se que para 
__
X = 6, 7, 8 há uma probabilidade de 6/10 de uma Média Amostral 
não ser diferente de 1 da Média Populacional μ = 7. 
Também para média 
__
X = 5, 6, 7, 8 ou 9 há uma probabilidade de 8/10 de uma Média 
Amostral não ser diferente de 2 da Média Populacional μ = 7 
Assim, se não conhecêssemos a Média da População dada e quiséssemos estimá-la com 
a média de uma Amostra Aleatória de tamanho n = 2, o processo acima nos daria uma 
idéia do tamanho possível do erro envolvido. 
Para obtermos outras informações úteis sobre a Distribuição Amostral da Média 
calculamos : __
X
µµµµ e __
X
σσσσ . 
7
10
10988776654
__
X
=
+++++++++
=µµµµ 
10
2)710(2)79(2)78(2)78(2)77(2)77(2)76(2)76(2)75(2)74(
X
__
−+−+−+−+−+−+−+−+−+−
=σσσσ 
3__
X
=σσσσ 
876
10954
0,0
0,1
0,2
4 5 6 7 8 9 10
MÉDIA
PR
O
B
A
B
IL
ID
A
D
E
Noções de Estatística e Probabilidade 112 Profª Berenice C. Damasceno 
14.2.1 ERRO PADRÃO DA MÉDIA 
Para amostras aleatórias de tamanho n extraídas de uma População com média μ e 
desvio padrão σ, a Distribuição Normal de __X tem média: 
µµµµµµµµ =__
X
 
e o Desvio Padrão da Média é definido como: 
n
__
X
σσσσ
σσσσ =
 ou 
1N
nN
.
n
__
X −
−
=
σσσσ
σσσσ
 
Dependendo da População ser infinita ou finita de tamanho N, costuma-se referir-se a σ 
como o Erro Padrão da Média, onde: 
- se __
X
σσσσ for pequeno há uma boa chance que a Média da Amostra (ou Amostral) 
esteja próxima da Média da População; 
- se __
X
σσσσ for grande a Média Amostral será consideravelmente diferente da Média 
da População 
O Fator 
1N
nN
−
−
 é chamado de Fator de Correção para População Finita. 
Exemplo: Com referência ao exercício anterior, tínhamos n = 2 e N = 5 e 8=σ , 
verifique que a segunda das fórmulas de __
X
σσσσ é igual a 3 . 
Fazendo n = 2, N = 5 e 8=σσσσ para a fórmula para populações finitas temos: 
8
24
4.2
3.8
4
3
2
8
15
25
2
8
1N
nN
.
n
__
X
===
−
−
=
−
−
=
σσσσ
σσσσ 
3__
X
=σσσσ 
Noções de Estatística e Probabilidade 113 Profª Berenice C. Damasceno 
EXERCÍCIOS: 
 
1- Qual é o fator de correção para a população finita, quando: 
 
(a) n = 10 e N = 200 
(b) n = 10 e N = 500 
(c) n = 10 e N = 2000 
(d) n = 20 e N = 200 
(e) n = 40 e N = 400 
(f) n = 400 e N = 4000 
 
2- Dada uma População Finita de N = 6 números: 6, 9, 12, 15, 18 e 21: 
 
(a) Calcule a Média Populacional e o Desvio Padrão 
(b) Calcule quantas amostras são possíveis se n = 2 (combinação 6,2) 
(c) Liste todas as amostras possíveis e calcule as suas médias 
__
X 
(d) Construa o Histograma da Distribuição Amostral da Média para 
amostras aleatórias de tamanho n = 2 extraídas, sem reposição, 
dessa População Finita 
(e) Determine o Desvio Padrão da Distribuição Amostral da Média __
X
σσσσ . 
 
Noções de Estatística e Probabilidade 114 Profª Berenice C. Damasceno 
14.3 TEOREMA CENTRAL DO LIMITE 
A capacidade de usar AMOSTRAS para se fazer inferências sobre parâmetros 
populacionais depende do conhecimento da Distribuição Amostral. 
Já sabemos calcular a média e o desvio padrão, mas temos também que saber a forma 
da Distribuição Amostral. 
 
 
 
 
Isso significa que para qualquer distribuição individual, podemos ter a distribuição normal 
com a única restrição que o tamanho da amostra seja grande, ou seja, acima de 30 
amostras. 
Esses resultados são conhecidos como o Teorema Central do Limite ou do Limite Central. 
O TEOREMA CENTRAL DO LIMITE 
1- Se a população sob amostragem tem distribuição normal, a distribuição das médias 
também será normal para todos os tamanhos de amostras. 
2- Se a População básica não é
normal, a distribuição das médias amostrais será 
aproximadamente normal para grandes amostras. 
Exemplo 1 - Uma População muito grande tem média µ = 20 e desvio padrão σ = 1,4. 
Extrai-se uma amostra de 49 observações. 
Questões Resolvidas: 
(A) Qual é a média da Distribuição Amostral? 
A média da distribuição Amostral é sempre igual à média da População µ, logo 
20__
X
=µµµµ .
Se uma distribuição 
individual é normal, 
a distribuição das médias também será 
normal para qualquer número de amostras. 
Se uma distribuição 
individual não é normal, 
a distribuição das médias será normal 
apenas para amostras grandes. 
Noções de Estatística e Probabilidade 115 Profª Berenice C. Damasceno 
Qual o desvio padrão da distribuição amostral? 
2,0
7
4,1
49
4,1
n
____
XX
=⇒=== σσσσ
σσσσ
σσσσ 
(B) Qual a porcentagem das possíveis médias amostrais que diferirão por mais de 0,2 
da média da População? 
Como n > 30, podemos supor que a distribuição é normal. 
Temos: 
2,0__
X
=σσσσ e 20__
X
=µµµµ 
Portanto a curva normal seria 
 
Z 
 (
__
X
µ -3
__
X
σ )(
__
X
µ -2
__
X
σ )(
__
X
µ -
__
X
σ )
__
X
µ (
__
X
µ +
__
X
σ )(
__
X
µ +2
__
X
σ )(
__
X
µ +3
__
X
σ ) 
Z2 Z1 
0,3413 0,3413 
F(X) 
 
3413,0I1
2,0
2,0
2,0
208,19Z
1Z1 =⇒−=
−
=
−
= 
3413,0I1
2,0
2,0
2,0
202,20Z
2Z2 =⇒==
−
= 
3174,01587,01587,0I34132,05,03413,05,0I TT =+⇒−+−= = 
Médias Inferiores a 19,8 e Superiores a 20,2. 
Noções de Estatística e Probabilidade 116 Profª Berenice C. Damasceno 
EXERCÍCIOS: 
1- Um fabricante de baterias alega que seu artigo, de primeira categoria, tem uma vida 
média esperada de 50 meses. Sabe-se que o desvio padrão correspondente é de 4 
meses. Que porcentagem da amostra de 36 observações acusará vida média no intervalo 
de 1 mês em torno de 50 meses, admitindo-se ser de 50 meses a verdadeira vida média 
das baterias, qual será a resposta para uma amostra de 64 observações? 
2- A média de uma distribuição amostral de médias é 50 e seu desvio padrão é 10. 
Suponha que a Distribuição Amostral seja normal: 
(a) Que porcentagem de médias amostrais estará entre 45 e 55? 
(b) Idem para 42,5 e 57,5 
(c) Qual a porcentagem de médias amostrais será menor que a média populacional? 
(d) Qual a porcentagem de médias amostrais será igual à média populacional? 
3- Determine a média da distribuição de médias amostrais, dada cada uma das seguintes 
médias populacionais: 
(a) 5,01 
(b) 199,5 
4- Calcule o desvio padrão da distribuição amostral de médias para cada um dos 
seguintes casos: 
(a) 6ne0,5 ==σσσσ 
(b) 100ne2,6 ==σσσσ 
(c) 36ne0,1 ==σσσσ 
(d) 44ne2,3 ==σσσσ 
(e) 40ne0,2 ==σσσσ 
Noções de Estatística e Probabilidade 117 Profª Berenice C. Damasceno 
 
5- Deve-se extrair uma amostra de 36 observações de uma máquina que cunha moedas 
comemorativas. A espessura média das moedas é de 0,2 cm, com desvio padrão 
amostral de 0,01 cm. 
(a) É preciso saber que a população é normal para determinar a porcentagem de 
médias amostrais que estão dentro de certos intervalos? Explique. 
(b) Qual a porcentagem de médias amostrais estará no intervalo (0,20 ± 0,004) cm ? 
(c) Qual a probabilidade de se obter uma média amostral que se afaste por mais de 
0,005 cm da média do processo? 
 
 
 
 
 
 
 
 
 
 
 
 
Noções de Estatística e Probabilidade 118 Profª Berenice C. Damasceno 
15 ESTIMATIVAS E TAMANHO DE AMOSTRAS 
15.1 ASPECTOS GERAIS 
 
Quando decidimos usar métodos de Amostragem para chegar a uma decisão sobre a 
variável investigada, devemos definir rigorosamente nossos conceitos e procedimentos. 
Em seguida, devemos assegurar que nossa “Amostra” reflita as características do 
agregado no máximo grau possível. 
A principal vantagem de se adotar seleção Aleatória de amostras em investigação 
cientifica é a de que sabemos matematicamente alguma coisa sobre a natureza do 
comportamento destas Amostras Aleatórias. 
Do ponto de vista do Estatístico as amostras devem ser tão grandes quanto possíveis. 
Quanto maior é a amostra, maior é a confiança que se tem nos resultados. Para 
entender as razões desse ponto de vista, imagine que em uma cidade existem dois 
hospitais. Em um deles nascem 120 bebês por dia e no outro 12. A razão de meninos e 
meninas é, em média, 50% nos dois hospitais. 
Uma vez nasceu, em um dos hospitais, duas vezes mais meninos do que meninas (67% 
meninos e 33% meninas). Em qual dos hospitais é provável que isso tenha ocorrido? É 
claro que foi no menor. 
A probabilidade de obter uma estimativa que se desvia muito do parâmetro aumenta 
quando a amostra for pequena. 
As amostras muito pequenas são inúteis por que não dão, em geral, boas estimativas. 
No entanto amostras muito grandes, porém mal feitas, são piores porque dão a ilusão de 
conter a verdade. 
 
Noções de Estatística e Probabilidade 119 Profª Berenice C. Damasceno 
15.2 ESTIMATIVAS DE UMA MÉDIA POPULACIONAL: 
GRANDES AMOSTRAS 
Em geral a média amostral 
__
X é a melhor estimativa de uma média populacional µ. 
Um estimador é uma estatística amostral (como a média amostral 
__
X ) utilizada para 
obter uma aproximação de um parâmetro populacional. 
 
Uma estimativa é um valor específico, ou um intervalo de valores, usado para 
aproximar um parâmetro populacional. 
Há duas razões para explicar por que uma média amostral 
__
X tende a centrar-se em 
torno da média populacional µ. 
1- Para muitas populações, a distribuição de médias amostrais 
__
X tende a ser 
consistente (apresenta menor variação) do que as distribuições de outras 
estatísticas amostrais (mediana ou moda) 
2- A média amostral 
__
X tende a centrar-se em torno da média populacional µ. 
 
8
__
X
 
4
__
X
 
µµµµ 
1
__
X
 
2
__
X
 
3
__
X
 
5
__
X
 
6
__
X
 
7
__
X
 
 
15.2.1 INTERVALOS DE CONFIANÇA 
Quando usamos a média 
__
X para estimar a média populacional µ e fazemos uma 
estimativa pontual não temos qualquer indicação de quão boa é essa estimativa. Para 
isso foi desenvolvido outro tipo de estimativa que efetivamente indica quão boa é uma 
estimativa pontual. 
Noções de Estatística e Probabilidade 120 Profª Berenice C. Damasceno 
Essa estimativa, chamada intervalo de confiança ou estimativa intervalar, consiste em 
uma amplitude (ou um intervalo) de valores, em lugar de um único valor. 
Um intervalo de confiança está associado a um grau de confiança que é a medida da 
nossa certeza de que o intervalo contem o parâmetro populacional. 
Para tanto usa-se a probabilidade α, que corresponde à área na curva normal, a qual 
pela simetria da curva divide-se em duas partes como aparece sombreada na curva 
abaixo: 
 
αααα 
 αααα/2 Z=0 αααα/2 
 
São escolhas comuns para o grau de confiança: 
90% (com α = 0,10) 
95% (com α = 0,05) 
99% (com α = 0,01) 
A opção mais comum é a opção 95% 
EXEMPLO 
Ache os valores críticos 2/Zαααα correspondentes aos graus de confiança: 
90% 
95% 
99%
Noções de Estatística e Probabilidade 121 Profª Berenice C. Damasceno 
90% α = 0,10 10% DE INCERTEZA 
95% α = 0,05 5% DE INCERTEZA 
 
 
 
 
αααα/2=0.05 
α/2=0,05 
 
 z=-1,645 z=0 z=1,645 
 
 
 
 
α/2=0.025 
α/2=0.025 
 
 
 z=-1,96 z=0 z=1,96
0,45 0,45 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
0,475 0,475 
 
 
 
 
 
 
 
 
 
Noções de Estatística e Probabilidade 122 Profª Berenice C. Damasceno 
99% α = 0,01 1% DE INCERTEZA 
 
 
 
 
α/2=0.005 
α/2=0.005 
 
 z=-2,576 z=0 z=2,576 
 
 
 
 
 
 zα/2 z=0 zα/2 
ÁREAS SIMÉTRICAS NAS CAUDAS 
ÁREA 2/Zαααα ÁREA 2/Zαααα ÁREA 2/Zαααα ÁREA 2/Zαααα 
0,001 3,291 0,01 2,576 0,06 1,881 0,20 1,282 
0,002 3,090 0,02 2,326 0,07 1,812 0,30 1,036 
0,003 2,968 0,03 2,170 0,08 1,751 0,40 0,842 
0,004 2,878 0,04 2,054 0,09 1,695 0,50 0,674 
0,005 2,807 0,05 1,960 0,10 1,645 0,60 0,524 
 
 
 
 
 
 
 
 
 
 
 0,495 0,495 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 α 
 
 
 
 
 
 
 
 
 
 
 
Noções de Estatística e Probabilidade 123 Profª Berenice C. Damasceno 
Quando utilizamos dados amostrais para estimar uma média populacional µ, a margem 
de erro, denotada por E é a diferença máxima provável (com probabilidade 1 - α) entre a 
média amostral observada e a verdadeira média populacional µ. 
E ≡≡≡≡ erro máximo da estimativa 
FÓRMULA 
n
ZE 2/
σσσσ
αααα= 
Esta fórmula só pode ser usada quando conhecemos σ (Desvio Padrão da População). 
 
Quando σ é desconhecido, temos: 
- Se n > 30, podemos substituir σ na fórmula acima pelo Desvio Padrão 
Amostral S. 
- Se n ≤ 30, a curva deve ser normal e devemos conhecer obrigatoriamente o σ 
para aplicar a fórmula. 
Adiante daremos uma outra solução quando n ≤ 30. 
Com base na definição da margem de erro E, podemos agora identificar o intervalo de 
confiança para a média populacional µ. 
Intervalo de confiança (ou estimativa intervalar) para a média populacional µ (com base 
em grandes amostras: n > 30) é: 
EXEX
____
+≤≤− µµµµ
 , onde: 
n
ZE 2/
σσσσ
αααα= 
Noções de Estatística e Probabilidade 124 Profª Berenice C. Damasceno 
RESUMO 
Processo de construção de um intervalo de confiança para a média µ (n > 30). 
1- Determinar o valor critico 2/Zαααα correspondente ao grau de confiança desejado. 
Exemplo: 95% 96,1Z 2/ =⇒ αααα 
2 - Calcular a margem de erro 
n
ZE 2/
σσσσ
αααα= . Se o desvio padrão da população não for 
conhecido, utilizar o desvio padrão da amostra S, desde que n > 30. 
3 - Com a margem de erro e o valor da média amostral 
__
X , calcular os valores EX
__
− e 
EX
__
+ . Levar esses valores na expressão do intervalo de confiança. 
EXEX
____
+≤≤− µµµµ 
ou 
E
__
X
±
=µµµµ ou (X – E; X + E). 
Noções de Estatística e Probabilidade 125 Profª Berenice C. Damasceno 
EXERCÍCIOS: 
1 - Determine o intervalo de confiança 95% para a média populacional µ para os valores 
abaixo: 
69,9 69,9 72,6 70,2 70,0 71,8 70,6 72,8 69,0 68,4 
60,0 68,4 68,3 69,6 71,7 69,2 70,8 71,0 70,4 66,8 
70,4 66,8 69,9 69,2 70,5 70,2 70,0 70,8 72,6 70,6 
72,8 70,8 70,2 71,7 70,0 68,3 66,8 69,9 69,0 69,4 
70,4 69,4 69,9 70,0 71,7 70,2 70,8 72,8 71,0 69,9 
2 - Determine o valor critico de 2/Zαααα que corresponde ao grau de confiança indicado: 
a- 99% 
b- 94% 
c- 98% 
d- 92% 
e- 96% 
3 - Use o grau de confiança e os valores amostrais dados para achar a margem de erro e 
o intervalo de confiança para a média populacional µ. 
a- Altura das alunas: 95% de confiança, n = 50, 
__
X = 164, S = 4,5 
b- Médias das notas: 99% de confiança, n = 70, 
__
X = 7,0, S = 0,88 
c- Notas de um teste: 90% de confiança, n = 150, 
__
X = 77,6 , S = 14,6 
d- Salário da Policia: 92% de confiança, n = 64, 
__
X = R$ 1200,00 , S = R$ 
80,00 
4 - A partir de uma amostra de 35 crânios de homens egípcios que viveram por volta de 
1850 AC mede-se a largura máxima de cada crânio, obtendo-se: 
__
X = 134,5 mm e S = 3,48 mm. Com esses dados amostrais construa um intervalo de 
95% de confiança para a média populacional µ. 
Noções de Estatística e Probabilidade 126 Profª Berenice C. Damasceno 
15.2.2 DETERMINAÇÃO DO TAMANHO DA AMOSTRA 
Suponha que estamos definindo um procedimento para uma pesquisa cientifica. Como 
sabemos quantos elementos da População devem ser escolhidos? 
Suponha, por exemplo, que queiramos estimar a renda média de pessoas que concluíram 
um curso superior, no primeiro ano após a formatura. Quantas rendas devemos incluir em 
nossa amostra? 
Partindo-se da expressão da margem de erro E e resolvendo em relação ao tamanho da 
amostra n temos: 
2
2/
E
.Z
n 





=
σσσσαααα
 
O número da amostra deve ser um número inteiro, quando isso não ocorre devemos 
arredondar usando o número inteiro mais próximo para cima. 
EXEMPLO: 
Um economista deseja estimar a renda média para o primeiro ano de trabalho de um 
bacharel por uma faculdade, que teve a feliz idéia de fazer um curso de Estatística. 
Quantos valores de renda devem ser tomados se o economista deseja ter 95% de 
confiança que a média amostral esteja a menos de R$ 20,00 da verdadeira média 
populacional? Suponha que saibamos por um estudo prévio, que, para tais rendas o 
desvio padrão σ = R$ 100,00. 
SOLUÇÃO: Queremos determinar o tamanho da amostra “n” dado que α = 0,05 (95% de 
confiança). 
Desejamos que a média amostral esteja a menos de R$ 20,00 da média populacional de 
forma que o Erro seja E = 20. Supondo que σ = R$ 100,00, aplicamos a Fórmula 
9704,96
20
100.96,1
E
.Z
n
22
2/
≈=





=





=
σσσσαααα valores de renda 
Noções de Estatística e Probabilidade 127 Profª Berenice C. Damasceno 
Devemos, portanto, obter uma amostra de 97 rendas de primeiro ano, selecionadas 
aleatoriamente, de Bacharéis de Faculdades que tenham feito um curso de Estatística. 
Com tal amostra teremos 95% de confiança de que a média amostral 
__
X difira em menos 
de R$ 20,00 da verdadeira média populacional, 
20X20XEXEX
________
+≤≤−⇒+≤≤− µµµµµµµµ 
Quando não conhecemos o valor de σ podemos estimar o valor a partir pelo menos de 31 
valores amostrais selecionando aleatoriamente em um estudo piloto. No caso anterior 
poderíamos encontrar o valor R$ 2300,00 como a maior renda e R$ 1900,00 como a 
menor renda, o σ pode ser estimado por: 
100
4
400
4
RT
==⇒= σσσσσσσσ 
Noções de Estatística e Probabilidade 128 Profª Berenice C. Damasceno 
15.3 ESTIMATIVA DE UMA MÉDIA POPULACIONAL: 
PEQUENAS AMOSTRAS 
Agora veremos a estimativa da média populacional “µ” quando o tamanho “n” da 
amostra é pequeno, ou seja, n ≤ 30. 
Neste caso: 
A melhor estimativa continua sendo a partir de 
__
X . 
Usaremos intervalo de confiança a partir da curva normal com a mesma margem de erro 
do capítulo anterior. 
Usaremos a Distribuição t de Student: 
n
S
Xt µµµµ−−−−==== 
 
O número de graus de liberdade para um conjunto de dados corresponde ao número de 
valores que podem variar após terem sido impostas certas restrições a todos os
valores. 
 
EXEMPLO 
Se 10 estudantes têm em um teste média 80, podemos atribuir valores arbitrários a nove 
delas, mas a décima fica determinada univocamente. 
A soma das 10 notas deve ser 800, de modo que a 10ª deve ser igual a 800 menos a 
soma das 9 primeiras. 
Como as 9 primeiras podem ser escolhidas arbitrariamente, dizemos que há 9 graus de 
liberdade (n – 1 ). 
Noções de Estatística e Probabilidade 129 Profª Berenice C. Damasceno 
Propriedades importantes da Distribuição t de Student: 
1- A distribuição t de Student é diferente, conforme o tamanho da amostra; 
2- A distribuição t de Student tem a mesma forma geral simétrica (forma de 
sino) que a distribuição normal, mas reflete a maior variabilidade que é 
esperada em pequenas amostras; 
3- A distribuição t de Student tem média t = 0 igual à distribuição normal 
padronizada que tem média Z = 0; 
4- O desvio padrão da distribuição t de Student varia com o tamanho da 
amostra ”n” mas é superior a 1, ao contrário da distribuição normal onde σ = 1; 
5- À medida que aumenta o tamanho “n” da amostra a Distribuição t de 
Student se aproxima mais e mais da distribuição normal padronizada 
Condições para o uso da Distribuição t de Student: 
1- O tamanho da amostra é pequeno (n ≤ 30) 
2- σ é desconhecido 
3- A População original tem distribuição Normal 
Margem de erro para a estimativa de µ para n ≤ 30: 
n
SE 2/tαααα= onde 2/tαααα tem (n - 1) graus de liberdade 
Intervalo de confiança para estimativa de µ: 
EXEX
____
+≤≤− µµµµ 
Noções de Estatística e Probabilidade 130 Profª Berenice C. Damasceno 
EXEMPLO: Testes Destrutivos 
 
O teste de colisão de carros é um exemplo muito dispendioso de teste destrutivo. 
Dificilmente pode-se fazer colidir mais de 30 carros, a fim de poder utilizar uma 
distribuição normal. 
Suponhamos que tenhamos feito teste de colisão de 12 carros de um tipo “A” cujo preço 
de venda seja R$ 59.000,00 sob diversas condições que simulam colisões típicas. 
A análise de 12 carros danificados resulta em custos de conserto que parecem ter 
distribuição em forma de sino com média de R$ 26.000,00 e desvio padrão 
S = R$ 15.000,00. Determine: 
a- A melhor estimativa da média populacional µ do custo do conserto de cada carro 
danificado. 
b- A estimativa intervalar de 95% de µ. 
SOLUÇÃO: 
a- A melhor estimativa pontual de µ é o valor 
__
X , neste caso R$ 26.000,00. 
b- Usamos t de Student porque as condições básicas estão satisfeitas: 
- n ≤ 30 (n=12) 
- σ desconhecido, porém conhecemos S= R$ 15.000,00 
- A curva tem a forma de sino 
Então: 
61,530.9
12
15000
.201,2E
n
SE 2/t ==⇒= αααα 
 Podemos agora escrever a estimativa intervalar de 95% de confiança: 
Noções de Estatística e Probabilidade 131 Profª Berenice C. Damasceno 
⇒+≤≤− EXEX
____
µµµµ 
⇒+<<−⇒ 61,95302600061,953026000 µµµµ 
3553016469 <<⇒ µ ou 953026000± ou (16469 ; 35530) 
Com base nesse resultado, temos 95% de confiança de que os limites 16490 e 35530 
contem o valor da média populacional µ. 
Esse exemplo é real e trata de um carro americano, dos mais caros para consertar em 
caso de colisão. 
Esta informação é de grande importância para as companhias de seguros. 
Noções de Estatística e Probabilidade 132 Profª Berenice C. Damasceno 
EXERCÍCIOS: 
1- Ache os valores críticos t α/2 que corresponde ao grau de confiança e ao tamanho da 
amostra “n”, para: 
a- 98% e n=10 
b- 98% e n=21 
c- 95% e n=16 
d- 90% e n=8 
2- Dados os graus de confiança e os elementos amostrais, determine: 
I- Margem de erro 
II- O intervalo de confiança para a média µ. Admita que a População tenha 
distribuição normal 
a- Altura das alunas: 95% de confiança; n=10; 
__
X = 164; S= 4,5cm. 
b- Média das Notas: 99% de confiança; n=15; 
__
X = 7,0; S= 0,88 
c- Notas de um teste: 90% de confiança; n= 16, 
__
X = 77,6; S= 14,2 
d- Salário da Polícia: 98% de confiança, n=19, 
__
X =R$1200,00; S= R$80,00 
3- Determine corretamente se os intervalos de confiança são calculados com a 
distribuição normal padronizada ou com a Distribuição t de Student. Em um teste de 
colisão feito em 15 minivans Honda, os custos de conserto apresentam distribuição em 
forma de sino, com média de R$ 1786 e desvio padrão de R$ 937. Construa um intervalo 
de confiança de 99% para o custo médio de conserto para esse tipo de veículo. 
4- Suponha que tenhamos apenas 10 temperaturas do corpo humano. Para esses 
valores a média 
__
X = 98,44°F e S= 0,30°F. Construa um intervalo de co nfiança de 95% 
para a média de todas as temperaturas do corpo humano. Sabendo-se que essa 
distribuição é normal. 
Noções de Estatística e Probabilidade 133 Profª Berenice C. Damasceno 
15.4 ESTIMATIVA DE UMA PROPORÇÃO POPULACIONAL 
Vamos abordar agora os mesmos três conceitos estudados anteriormente. 
(1) Estimativa pontual 
(2) Intervalo de confiança 
(3) Determinação do tamanho da Amostra “n” 
Anteriormente aplicamos esses conceitos à estimativa de uma média populacional µ; 
neste capitulo vamos aplicá-lo à Proporção Populacional “P”. 
EXEMPLO: 
Uma companhia de seguros poderia se interessar na estimativa da proporção de 
motoristas embriagados. 
Vamos trabalhar com a denominação p^ (lê-se p chapéu) para a proporção amostral. 
Já sabemos que Q=1-P; podemos associar que Q^= 1-P^, desta forma: 
P= Proporção Populacional 
P^= Proporção Amostral 
FÓRMULAS 
Estimativa Pontual 
A proporção Amostral P^ é a melhor estimativa pontual da Proporção Populacional P. 
Margem de Erro da Estimativa P 
n
^Q^PE 2/Zαααα= 
Intervalo de confiança (ou estimativa intervalar de uma Proporção Populacional P) 
E^PPE^P +≤≤− 
Noções de Estatística e Probabilidade 134 Profª Berenice C. Damasceno 
Eventualmente podemos dizer: 
E
^PP ±= ou (P^ - E; P^ + E) 
EXEMPLO: 
Os pesquisadores de opinião pública são atormentados por uma diversidade de fatores de 
confusão, como secretárias eletrônicas. Em uma pesquisa junto a 1068 Americanos, 673 
informaram ter secretária eletrônica. Com esses resultados amostrais determine: 
a- A estimativa pontual da proporção populacional de todos os Americanos que 
possuem secretária eletrônica. 
b- A estimativa intervalar 95% da proporção Populacional de todos os Americanos 
que têm secretária eletrônica 
SOLUÇÃO: 
A- A estimativa pontual de P é: 
630,0
1068
673
n
X
^P === 
e 37,063,01^Q^P1^Q =−=⇒−= 
B- A construção do intervalo de confiança exige primeiro o cálculo da 
margem de erro E. 
03,0029,0
1068
37,0.63,0
.96,1^^2/ ≅===
n
QPE Zα 
Podemos agora achar o intervalo de confiança usando P^=0,63 e E= 0,03: 
E^PPE^P +≤≤− 
03,063,003,063,0 +<<− P 
%66%6066,060,0 ≤≤≤≤ PouP 
O resultado costuma ser apresentado da seguinte forma: 
“Entre os Americanos, a porcentagem dos que têm secretária eletrônica é 
estimada em 63%, com uma margem de erro de ± 3 pontos percentuais”. 
Noções de Estatística e Probabilidade 135 Profª Berenice C. Damasceno 
 
C- Determinação do tamanho da amostra 
Se 
n
^Q^PE 2/Zαααα= 
Podemos definir: 
- Quando se conhece uma estimativa de P^: 
2
2
2/
E
^Q.^P.Z
n
αααα
= 
- Quando não se conhece uma estimativa de P^: 
2
2
2/
E
25,0.Z
n
αααα
= 
EXEMPLO: As companhias de seguros estão preocupadas com o fato de que o número 
crescente de telefones celulares resulte em um maior número de colisões de veículos. 
Então, por isso, pensando em cobrar um prêmio maior para motoristas que usam celular, 
deseja-se estimar, com uma margem de erro de três pontos percentuais (3%), a 
porcentagem de motoristas que falam ao celular enquanto estão dirigindo. Supondo que 
se pretende um nível de confiança de 95% nos resultados, quantos motoristas devem ser
pesquisados? 
A- Suponha que tenhamos uma estimativa de P^ com base em estudos anteriores que 
mostrou que 18% dos motoristas falam ao telefone dirigindo. 
B- Suponha que não tenhamos qualquer informação que possa sugerir um valor de P^. 
SOLUÇÃO: 
A- P^ = 0,18 e Q^ = 0,82 
Ao nível de 95%, temos 96,12/Z =αααα 
 
Noções de Estatística e Probabilidade 136 Profª Berenice C. Damasceno 
Margem de erro 3% ou 0,03 
631
03,0
82,0.18,0.96,1
E
^Q.^P.Z
n 2
2
2
2
2/
===
αααα
 (arredondado para cima) 
B- Quando não conhecemos P^ usamos P^ . Q^ = 0,25: 
1068
03,0
25,0.96,1
E
25,0.Z
n 2
2
2
2
2/
===
αααα
 (arredondado para cima) 
EXEMPLO: No caso da pesquisa eleitoral, determine o tamanho da amostra necessária 
para saber a preferência do eleitorado com um nível de confiança de 95% e admitindo um 
erro de mais ou menos 2,2 pontos percentuais. 
SOLUÇÃO: 
Como desconhecemos as proporções P^ dos candidatos usamos a fórmula: 
1985
022,0
25,0.96,1
E
25,0.Z
n 2
2
2
2
2/
===
αααα
 (arredondado para cima) 
Refaça o exemplo acima para os seguintes casos: 
a- Um nível de confiança de 99% com margem de erro de ± 2 pontos percentuais. 
b- Um nível de confiança de 90% com margem de erro de ± 2 pontos percentuais. 
Note que essas fórmulas não incluem o tamanho da População N, neste caso é 
irrelevante. 
A maioria das pesquisas de opinião apresentadas em jornais, revistas e tv envolvem 
amostras com tamanho de 1000 a 2000 elementos. 
Noções de Estatística e Probabilidade 137 Profª Berenice C. Damasceno 
EXERCÍCIOS: 
1- Usando uma amostra para estimar uma proporção populacional P, determine a 
margem de erro que corresponde aos valores dados n, X e o grau de confiança: 
a- n= 800 X=600 grau de confiança 95% 
b- n= 4275 X=2576 grau de confiança 98% 
c- n= 1400 X=420 grau de confiança 99% 
d- n= 887 X=209 grau de confiança 90% 
 
2- Utilize os dados amostrais e o grau de confiança para construir uma estimativa 
intervalar para a proporção populacional P: 
a- n= 800 X=600 grau de confiança 95% 
b- n= 2000 X=300 grau de confiança 99% 
c- n= 2475 X=992 grau de confiança 90% 
d- n= 5200 X=1024 grau de confiança 98% 
 
3- Utilize os dados abaixo para determinar o tamanho da amostra necessária para estimar 
uma proporção ou porcentagem populacional: 
a- Margem de erro 0,02, nível de confiança 95%, P^ e Q^ desconhecidos. 
b- Margem de erro 0,01, nível de confiança 90%, P^ e Q^ desconhecidos 
c- Margem de erro 4 pontos percentuais, nível de confiança 99%, P^ estimado em 0,20 
com base em estudos anteriores. 
Noções de Estatística e Probabilidade 138 Profª Berenice C. Damasceno 
d- Margem de erro 2 pontos percentuais, nível de confiança 97%, P^ estimado em 0,85 
com base em estudos anteriores. 
 
4- A Itaú seguros deseja estimar a porcentagem dos motoristas que trocam fita ou CD 
enquanto dirigem. Uma amostra de 850 motoristas acusou 544 que trocam fitas ou CD 
quando dirigem. 
a- Determine a estimativa pontual da porcentagem de todos os motoristas que trocam 
fitas ou CD quando dirigem. 
b- Determine uma estimativa intervalar de 90% da porcentagem de todos os 
motoristas que trocam fitas ou CD. 
 
5- Selecionados aleatoriamente e pesquisados 500 estudantes universitários, verificou-se 
que 135 deles têm computadores pessoais. 
A- Determine a estimativa pontual da verdadeira proporção populacional de 
todos os universitários que têm computador pessoal. 
B- Determine um intervalo de confiança de 95% para a verdadeira proporção 
de todos os universitários que têm computador pessoal. 
 
 
 
Noções de Estatística e Probabilidade 139 Profª Berenice C. Damasceno 
 5 10 15 20 25 30 35 40 45 
GL=20 
GL=10 
15.5 ESTIMATIVA DE UMA VARIÂNCIA POPULACIONAL 
Mantendo a linha de estudos dos itens anteriores usaremos agora a VARIÂNCIA 
POPULACIONAL σ², no lugar do desvio padrão σ. 
Para isso usaremos a Distribuição Qui-Quadrado: 
2
2
2 S.)1n(X
σσσσ
−
= , onde: 
n ≡ tamanho da amostra 
S² ≡ variância amostral 
σ² ≡ variância populacional 
Denotamos Qui-Quadrado por Χ². 
Para achar os valores críticos dos valores Qui-Quadrado, recorremos à Tabela 1 a seguir. 
A Distribuição Qui-Quadrado é determinada pelo número de graus de liberdade. Neste 
capitulo utilizamos (n-1) graus de liberdade. 
Propriedades da Distribuição Qui-Quadrado. 
1- A Distribuição Qui-Quadrado não é simétrica ao contrário das distribuições Normal 
e t de Student. Na medida que aumenta o número de graus de liberdade, a 
distribuição vai se tornando menos assimétrica. 
 
 
 
 
 
2- Os valores podem ser zero ou positivos, nunca negativos. 
3- Há uma distribuição Qui-Quadrado diferente para cada número de graus de 
liberdade. À medida que eles aumentam a distribuição tende à distribuição 
normal. 
Noções de Estatística e Probabilidade 140 Profª Berenice C. Damasceno 
Tabela 1 Cada valor critico Χ ² corresponde à uma área dada na linha superior da Tabela, e essa área 
representa a região total localizada à direita do valor critico. v é o Nº de graus de liberdade. 
 
v 
X2 
0,995 
X2 
0,99 
X2 
0,975 
X2 
0,95 
X2 
0,90 
X2 
0,75 
X2 
0,50 
X2 
0,25 
X2 
0,10 
X2 
0,05 
X2 
0,025 
X2 
0,01 
X2 
0,005 
1 7,88 6,63 5,02 3,84 2,71 1,32 0,455 0,102 0,0158 0,0039 0,0010 0,0002 0,0000 
2 10,6 9,21 7,38 5,99 4,61 2,77 1,39 0,575 0,211 0,103 0,05,6 0,0201 0,0100 
3 12,8 11,3 9,35 7,81 6,25 4,11 2,37 1,21 0,584 0,352 0,216 0,115 0,072 
4 14,9 13,3 11,1 9,49 7,78 5,39 3,36 1,92 1,06 0,711 0,484 0,297 0,207 
5 16,7 15,1 12,8 11,1 9,24 6,63 4,35 2,67 1,61 1,15 0,831 0,554 0,412 
6 18,5 16,8 14,4 12,6 10,6 7,84 5,35 3,45 2,20 1,64 1,24 0,872 0,676 
7 20,3 18,5 16,0 14,1 12,0 9,04 6,35 4,25 2,83 2,17 1,69 1,24 0,989 
8 22,0 20,1 17,5 15,5 13,4 10,2 7,34 5,07 3,49 2,73 2,18 1,65 1,34 
9 23,6 21,7 19,0 16,9 14,7 11,4 8,34 5,90 4,17 3,33 2,70 2,09 1,73 
10 25,2 23,2 20,5 18,3 16,0 12,5 9,34 6,74 4,87 3,94 3,25 2,56 2,16 
11 26,8 24,7 21,9 19,7 17,3 13,7 10,3 7,58 5,58 4,57 3,82 3,05 2,60 
12 28,3 26,2 23,3 21,0 18,5 14,8 11,3 8,44 6,30 5,23 4,40 3,57 3,07 
13 29,8 27,7 24,7 22,4 19,8 16,0 12,3 9,30 7,04 5,89 5,01 4,11 3,57 
14 31,3 29,1 26,1 23,7 21,1 17,1 13,3 10,2 7,79 6,57 5,63 4,66 4,07 
15 32,8 30,6 27,5 25,0 22,3 18,2 14,3 11,0 8,55 7,26 6,26 5,23 4,60 
16 34,3 32,0 28,8 26,3 23,5 19,4 15,3 11,9 9,31 7,96 6,91 5,81 5,14 
17 35,7 33,4 30,2 27,6 24,8 20,5 16,3 12,8 10,1 8,67 7,56 6,41 5,70 
18 37,2 34,8 31,5 28,9 26,0 21,6 17,3 13,7 10,9 9,39 8,23 7,01 6,26 
19 38,6 36,2 32,9 30,1 27,2 22,7 18,3 14,6 11,7 10,1 8,91 7,63 6,84 
20 40,0 37,6 34,2 31,4 28,4 23,8 19,3 15,5 12,4 10,9 9,59 8,26 7,43 
21 41,4 38,9 35,5 32,7 29,6 24,9 20,3 16,3 13,2 11,6 10,3 8,90 8,03 
22 42,8 40,3 36,8 33,9 30,8 26,0 21,3 17,2 14,0 12,3 11,0 9,54 8,64 
23 44,2 41,6 38,1 35,2 32,0 27,1 22,3 18,1 14,8 13,1 11,7 10,2 9,26 
24 45,6 43,0 39,4 36,4 33,2 28,2 23,3 19,0 15,7 13,8 12,4 10,9 9,89 
25 46,9 44,3 40,6 37,7 34,4 29,3 24,3 19,9 16,5 14,6 13,1 11,5 10,5 
26 48,3 45,5 41,9 38,9 35,6 30,4 25,3 20,8 17,3 15,4 13,8 12,2 11,2 
27 49,6 47,0 43,2 40,1 36,7 31,5 26,3 21,7 18,1 16,2 14,6 12,9 11,8 
28 51,0 48,3 44,5 41,3 37,9 32,6 27,3 22,7 18,9 16,9 15,3 13,6 12,5 
29 52,3 49,6 45,7 42,6 39,1 33,7 28,3 23,6 19,8 17,7 16,0 14,3 13,1 
30 53,7 50,9 47,0 43,8 40,3 34,8 29,3 24,5 20,6 18,5 16,8 15,0 13,8 
40 66,8 63,7 59,3 55,8 51,8 45,6 39,3 33,7 29,1 26,5 24,4 22,2 20,7 
50 79,5 76,2 71,4 67,5
63,2 56,3 49,3 42,9 37,7 34,8 32,4 29,7 28,0 
60 92,0 88,4 83,3 79,1 74,4 67,0 59,3 52,3 46,5 43,2 40,5 37,5 35,5 
70 104,2 100,4 95,0 90,5 85,5 77,6 69,3 61,7 55,3 51,7 48,8 45,4 43,3 
80 116,3 112,3 106,0 101,9 96,6 88,1 79,3 71,1 64,3 60,4 57,2 53,5 51,2 
90 128,3 124,1 118,1 113,3 107,6 98,6 89,3 80,6 73,3 69,1 65,6 61,8 59,2 
100 140,2 135,8 129,6 124,3 118,5 109,1 99,3 90,1 82,4 77,9 74,2 70,1 67,3 
Noções de Estatística e Probabilidade 141 Profª Berenice C. Damasceno 
0,025 
0,025 
 X2L = 2,7 X2R = 19,0 
EXEMPLO: Determine os valores críticos de Χ² que definem regiões criticas contendo 
uma área de 0,025 em cada cauda. Suponha que o tamanho da amostra seja 10, de 
modo que o número de graus de liberdade é 10-1= 9. 
 
Solução: Conforme a figura abaixo, o valor critico é obtido à direita (Χ² = 19,023) 
diretamente, localizando 9 na coluna de graus de liberdade à esquerda e 0,025 na parte 
superior. O valor critico Χ² = 2,70 à esquerda mais uma vez correspondente a 9 na coluna 
de graus de liberdade mas devemos localizar 0,975 (1- 0,025) na parte superior, porque 
os valores no topo são sempre áreas à direita do valor critico. Verifique na figura abaixo 
que a área total à direita de Χ ² = 2,70 e 0,975. 
 
 
 
 
 
 
 
(Χ²L=2,7 , onde L ≡ “Left” ≡ esquerda) (Χ²R=19,0 , onde R ≡ “Rigth” ≡ direita) 
Este valor corresponde na coluna Este valor corresponde na coluna 
esquerda a 9 graus de liberdade esquerda a 9 graus de liberdade e 
e 0,025 na linha superior 0,975 na linha superior. 
Χ² (GL=9) 
 
Estimadores de σ² 
 
A variância amostral S² é a melhor estimativa pontual da variância populacional σ². 
Embora S² seja a melhor estimativa de σ² não podemos avaliar quão boa é essa 
estimativa, portanto estabelecemos uma estimativa intervalar mais reveladora. 
Noções de Estatística e Probabilidade 142 Profª Berenice C. Damasceno 
Intervalo de confiança (ou estimativa intervalar) para a variância populacional σ². 
2
L
2
2
2
R
2
X
S.)1n(
X
S.)1n( −−−−
<<<<σσσσ<<<<
−−−−
 
Dessa expressão deferimos a estimativa intervalar para o desvio padrão populacional 
através da raiz quadrada de cada componente. 
2
L
2
2
R
2
X
S.)1n(
X
S.)1n( −−−−
<<<<σσσσ<<<<
−−−−
 
Com uma área total α dividida igualmente entre as extremidades de uma distribuição Qui-
Quadrado, X2L denota o valor crítico da extrema esquerda e X2R denota o valor crítico da 
extrema direita. 
 
EXEMPLO: 
Uma confeitaria fabrica bombons que são embalados em pacotes com 12 unidades 
pesando no total 420 gramas. Se a variação dos bombons é muito grande, algumas 
caixas terão peso a menos (prejudicando o consumidor) e outras terão peso a mais 
(diminuindo o lucro). Este problema pode ser evitado se os bombons tiverem um peso 
médio de 35 gramas e um desvio padrão de 0,60 gramas ou menos. Selecionam-se 
aleatoriamente, na linha de produção, dez bombons que são pesados, dando os 
resultados a seguir: 
 35,8 35,0 36,8 36,1 34,2 35,2 36,6 35,0 33,6 34,2 (gramas) 
 
Construa dois intervalos de confiança de 95%, um para σ²σ²σ²σ² e outro para σσσσ, e determine se 
o processo está com problemas. 
Noções de Estatística e Probabilidade 143 Profª Berenice C. Damasceno 
SOLUÇÃO: 
Calculamos: 
25,35X
__
= e 070,1S ==== superior ao desejado 0,60. 
Passamos à construção do intervalo de confiança de σ²σ²σ²σ²: 
Com uma amostra de 10 valores, temos 9 graus de liberdade. Com o grau de confiança 
de 95%, dividimos α = 0,05 igualmente entre as duas caudas de distribuição Χ² e 
localizamos os valores 0,975 e 0,025 na linha superior. Os valores críticos de X2L e X2R na 
tabela são: 
X2L = 2,70 
X2R = 19,0 
e 25,35X
__
= e 070,1S ==== 
n = 10 
Aplicamos a fórmula 
2
L
2
2
2
R
2
X
S.)1n(
X
S.)1n( −−−−
<<<<σσσσ<<<<
−−−−
 
70,2
07,1.)110(
0,19
07,1.)110( 222 −<<− σσσσ 
8163,35423,0 2 << σσσσ 
ou 
9535,17364,0 << σσσσ 
 
Com base nesses resultados parece que o desvio padrão populacional é sempre superior 
ao desejado σσσσ = 0,60 mostrando que o peso dos bombons deve ser mais consistente. 
Deve-se controlar melhor o processo. 
 
 
Noções de Estatística e Probabilidade 144 Profª Berenice C. Damasceno 
EXERCÍCIOS: 
1- Ache os valores críticos X2L e X2R que correspondem ao grau de confiança e ao 
tamanho da amostra, dados: 
a- 95% n = 26 
b- 90% n = 60 
c- 99% n = 17 
d- 95% n = 50 
 
2- Use o grau de confiança e os dados amostrais indicados para achar um intervalo de 
confiança para o desvio padrão populacional σσσσ. Em cada caso admita que a população 
tenha distribuição normal. 
a- Altura das alunas: 95% de confiança, n = 10, 164X
__
= , S = 4,5 
b- Médias das notas: 99% de confiança, n = 15, 0,7X
__
= , S = 0,88 
c- Notas de um teste: 95% de confiança, n = 16, 6,77X
__
= , S = 14,2 
d- Salário da Polícia: 92% de confiança, n = 19, 00,1200$RX
__
= , S= R$ 80,00 
3- Suponha uma pesquisa numa Universidade, junto aos formandos do curso de 
Administração, sobre o tempo gasto para se formarem. A média é de 5,15 anos e o desvio 
padrão 1,68 anos. Suponha que a amostra seja de 100 alunos. Com base nesses dados 
amostrais, construa o intervalo de 99% de confiança para o desvio padrão do tempo gasto 
por todos os formandos. 
Noções de Estatística e Probabilidade 145 Profª Berenice C. Damasceno 
16 TESTE DE HIPÓTESES ESTATÍSTICAS 
Já foi visto como uma amostra pode ser usada para desenvolver estimativas 
pontuais e do intervalo dos parâmetros da população. Agora, continuaremos a discussão 
da inferência estatística mostrando como o teste de hipóteses pode ser usado para 
determinar se uma declaração sobre o valor de um parâmetro da população deve ser 
rejeitado. 
No teste de hipóteses começamos fazendo uma hipótese tentativa sobre um 
parâmetro da população. Essa hipótese tentativa é chamada de hipótese nula e é 
denotada por H0. Definimos então uma outra hipótese, chamada de hipótese alternativa, 
que é o oposto do que foi estabelecido na hipótese nula. A hipótese alternativa é 
denotada por Ha. O procedimento do teste de hipóteses implica em usar dados de uma 
amostra para testar as duas declarações contrárias indicadas por H0 e Ha. 
O objetivo aqui é mostrar como o teste de hipóteses pode ser conduzido sobre uma 
média da população. Começaremos dando exemplos que ilustram abordagens para 
desenvolver as hipóteses nula e alternativa. 
16.1 DESENVOLVENDO AS HIPÓTESES NULA E ALTERNATIVA 
Em algumas aplicações pode não ser óbvio como as hipóteses nula e alternativa 
devem ser formuladas. Deve-se tomar cuidado para estar seguro de que as hipóteses são 
estruturadas apropriadamente e que a conclusão do teste de hipóteses forneça as 
informações que o pesquisador ou o tomador de decisão deseja. Diretrizes para 
estabelecer as hipóteses nula e alternativa são dadas para três tipos de situações nas 
quais os procedimentos do teste de hipóteses são comumente empregados. 
Testando Hipóteses de Pesquisa 
 Considere um modelo particular de automóvel que atualmente atinge uma 
eficiência média de combustível de 24 Km por litro. Um grupo de pesquisa do produto 
desenvolveu um novo motor especificamente projetado para aumentar a relação 
quilômetros por litro. Para avaliar o novo motor, diversos deles são fabricados, instalados 
em automóveis e submetidos aos testes de condução controlados pela pesquisa. Note 
Noções de Estatística e Probabilidade 146 Profª Berenice C. Damasceno 
que o grupo de pesquisa do produto está buscando evidências para concluir que o novo 
motor aumenta a média de quilômetros por
litro. Neste caso, a hipótese de pesquisa é 
que o novo motor fornecerá uma média de quilômetros por litro que exceda 24; isto é, 
µ > 24. Como diretriz geral, uma hipótese de pesquisa como essa deve ser formulada 
como hipótese alternativa. Por isso as hipóteses nula e alternativa para esse estudo são: 
 H0 : µ ≤ 24 
 Ha : µ > 24 
 
Se os resultados da amostra indicam que H0 não pode ser rejeitada, os pesquisadores 
não podem concluir que o novo motor seja melhor. Talvez mais pesquisas e testes 
subseqüentes devam ser realizados. No entanto, se os resultados da amostra indicam 
que H0 pode ser rejeitada, os pesquisadores podem fazer a inferência de que Ha : µ > 24 
seja verdadeira. Com essa conclusão, os pesquisadores têm o suporte estatístico 
necessário para estabelecer que o novo motor aumenta o número médio de quilômetros 
por litro. A ação para iniciar a produção com o novo motor pode ser empreendida. 
 Em estudos de pesquisa como esse, as hipóteses nula e alternativa devem ser 
formuladas de modo que a rejeição de H0 suporte a conclusão e a ação que estão sendo 
procuradas. Em tais casos, a hipótese de pesquisa deve ser expressa como a hipótese 
alternativa. 
 
Testando a Validade de uma Afirmação 
 
 Como uma ilustração do teste da validade de uma afirmação, considere a situação 
de um fabricante de refrigerantes que estabelece que os recipientes de dois litros de seus 
produtos têm uma média de pelo menos 2,1 litros de líquido. Uma amostra de recipientes 
de dois litros será selecionada e o conteúdo será medido para testar a afirmação do 
fabricante. Neste tipo de situação de teste de hipóteses, geralmente partimos do 
pressuposto de que a afirmação do fabricante é verdadeira. Usando essa abordagem 
para o exemplo dos refrigerantes, poderíamos estabelecer as hipóteses nula e alternativa 
como segue: 
 H0 : µ ≥ 2,1 
 Ha : µ < 2,1 
 
Noções de Estatística e Probabilidade 147 Profª Berenice C. Damasceno 
Se os resultados da amostra indicam que H0 não pode ser rejeitada, a afirmação do 
fabricante não pode ser desafiada. No entanto, se os resultados da amostra indicam que 
H0 pode ser rejeitada, será feita a inferência de que Ha : µ < 2,1 é verdadeira. Com essa 
conclusão, a evidência estatística indica que a afirmação do fabricante está incorreta e 
que os recipientes de refrigerante estão sendo preenchidos com uma média menor do 
que os 2,1 litros declarados. Uma ação apropriada contra o fabricante pode ser 
considerada. 
 Em qualquer situação que implica testar a validade de uma afirmação sobre o 
produto, a hipótese nula é geralmente baseada na hipótese de que a afirmação é 
verdadeira. A hipótese alternativa é então formulada de modo que a rejeição de H0 
fornecerá evidência estatística de que a hipótese estabelecida está incorreta. A ação para 
corrigir a afirmação deve ser considerada sempre que H0 é rejeitada. 
 
Testando em Situações de Tomada de Decisão 
 
 Ao testar hipóteses de pesquisa ou testar a validade de uma afirmação, uma ação 
é tomada se H0 for rejeitada. Em muitos casos, no entanto, a ação precisa ser tomada 
tanto quando H0 não pode ser rejeitada como quando H0 pode ser rejeitada. Em geral, 
esse tipo de situação ocorre quando um tomador de decisão precisa escolher entre dois 
cursos de ação, um associado com a hipótese nula e um outro associado com a hipótese 
alternativa. Por exemplo, com base em uma amostra de peças de um embarque que 
acabou de ser recebido, o inspetor de controle de qualidade precisa decidir se aceita o 
carregamento inteiro ou retorna o carregamento ao fornecedor porque ele não satisfaz as 
especificações. Considere que as especificações para uma determinada peça 
estabeleçam que um comprimento médio de duas polegadas seja desejado. Se a média 
for maior ou menor que duas polegadas, as peças causarão problemas de controle de 
qualidade na operação de montagem. Neste caso, as hipóteses nula e alternativa seriam 
formuladas como segue: 
 H0 : µ = 2 
 Ha : µ ≠ 2 
 
Se o resultado da amostra indica que H0 não pode ser rejeitada, o inspetor de controle de 
qualidade não terá razões para duvidar de que o embarque satisfaz as especificações e o 
embarque será aceito. No entanto, se os resultados da amostra indicam que H0 deva ser 
Noções de Estatística e Probabilidade 148 Profª Berenice C. Damasceno 
rejeitada, a conclusão será de que as peças não satisfazem as especificações. Neste 
caso, o inspetor de qualidade terá evidência suficiente para retornar o embarque ao 
fornecedor. Assim, que para esses tipos de situações, a ação é tomada tanto quando H0 
não pode ser rejeitada como quando H0 pode ser rejeitada. 
 
Resumo das Formas para as Hipóteses Nula e Alternativa 
 
 Seja µ0 denotando o valor numérico específico que está sendo considerado nas 
hipóteses nula e alternativa. Em geral, um teste de hipóteses ao redor dos valores de uma 
média de população µ precisa tomar uma das seguintes três formas: 
 
 H0 : µ ≥ µ0 H0 : µ ≤ µ0 H0 : µ = µ0 
 Ha : µ < µ0 Ha : µ > µ0 Ha : µ ≠ µ0 
 
 Em muitas situações, a escolha de H0 e de Ha não é óbvia e é necessário 
julgamento para selecionar a forma apropriada. No entanto, como as formas acima 
mostram, a parte de igualdade da expressão (tanto ≥, ≤ ou =) sempre aparece na hipótese 
nula. Ao selecionar a forma apropriada de H0 e de Ha tenha em mente que a hipótese 
alternativa é o que o teste está tentando estabelecer. Por isso, perguntar se o usuário 
está procurando por evidência para confirmar µ < µ0, µ > µ0 ou µ ≠ µ0 ajudará a determinar 
Ha. 
 A seguir, temos dois exercícios para proporcionar alguma prática na escolha da 
forma apropriada para o teste de hipóteses. 
Noções de Estatística e Probabilidade 149 Profª Berenice C. Damasceno 
EXERCÍCIOS 
 
1. O gerente de uma revenda de automóveis está considerando um novo plano de bônus 
concebido para aumentar o volume de vendas. Atualmente, o volume médio de vendas 
é de 14 automóveis por mês. O gerente quer realizar uma pesquisa para verificar se o 
novo plano de bônus aumentará o volume de vendas. Para coletar dados sobre o 
plano, uma amostra do pessoal de vendas terá permissão de realizar vendas sob o 
novo plano de bônus por um período de um mês. 
 
a. Desenvolva as hipóteses nula e alternativa mais apropriadas para essa situação de 
pesquisa. 
b. Comente a conclusão quando H0 não pode ser rejeitada. 
c. Comente a conclusão quando H0 pode ser rejeitada. 
 
2. Devido aos tempos e aos altos custos das mudanças de turno, um diretor de 
fabricação precisa convencer a administração de que um proposto método de 
fabricação reduz os custos antes que o novo método seja implementado. O método 
corrente de produção opera com um custo médio de US$ 220 por hora. Uma pesquisa 
está para ser realizada em que o custo do novo método será medido com relação a um 
período de produção da amostra. 
 
a. Desenvolva as hipóteses nula e alternativa mais apropriadas para esse estudo. 
b. Comente a conclusão quando H0 não pode ser rejeitada. 
c. Comente a conclusão quando H0 pode ser rejeitada. 
 
Noções de Estatística e Probabilidade 150 Profª Berenice C. Damasceno 
16.2 ERROS DO TIPO I E DO TIPO II 
As hipóteses nula e alternativa são declarações que rivalizam sobre um parâmetro 
da população. Tanto a hipótese nula H0 pode ser verdadeira como a hipótese alternativa 
Ha pode ser verdadeira, mas não ambas. Idealmente o procedimento de teste de 
hipóteses deve levar à aceitação de H0 quando H0 é verdadeira e à rejeição de H0 quando 
Ha é verdadeira. Infelizmente esse resultado ideal nem sempre é possível. Como os 
testes de hipóteses estão baseados na informação da amostra, precisamos levar em 
consideração a possibilidade de erros. A tabela a seguir ilustra os dois tipos de erros que 
podem ocorrer ao testar hipóteses. 
 
ERROS E CONCLUSÕES CORRETAS NO TESTE DE HIPÓTESE
Conclusão 
 Condição da População 
H0 Verdadeira Ha Verdadeira 
Aceitar H0 Conclusão Correta Erro do Tipo II 
Rejeitar Ho Erro do Tipo I Conclusão Correta 
 
A primeira linha da tabela acima mostra o que pode acontecer quando a conclusão 
é aceitar H0. Como tanto H0 como Ha são verdadeiras, se H0 é verdadeira e a conclusão é 
aceitar H0, essa conclusão é correta. No entanto se Ha é verdadeira e a conclusão é 
aceitar H0, comete-se um erro do Tipo II; isto é, aceita-se H0 quando ela é falsa. A 
segunda linha da tabela acima mostra o que acontece quando a conclusão é para rejeitar 
H0. Nesse caso, se H0 é verdadeira, comete-se um erro do Tipo I; isto é, rejeitamos H0 
quando ela é verdadeira. No entanto, se Ha é verdadeira e a conclusão é rejeitar H0, essa 
conclusão é correta. 
Embora não possamos eliminar a possibilidade de erros no teste de hipóteses, 
podemos considerar as possibilidades de suas ocorrências. Usando a notação usual de 
estatística, denotamos as possibilidades de se cometer os dois erros como segue: 
 
α ≡ a possibilidade de se cometer um erro do Tipo I 
β ≡ a possibilidade de se cometer um erro do Tipo II 
 
Noções de Estatística e Probabilidade 151 Profª Berenice C. Damasceno 
Lembre-se da ilustração do teste de hipóteses discutida na página 136, em que um 
grupo de pesquisa de produtos para automóveis tinha desenvolvido um novo motor 
projetado para aumentar a taxa de quilômetros por litro de um determinado automóvel. 
Com o atual motor fazendo uma média de 24 quilômetros por litro, o teste de hipóteses foi 
formulado como segue: 
 
 H0 : µ ≤ 24 
 Ha : µ > 24 
A hipótese alternativa Ha : µ > 24, indica que os pesquisadores estão procurando por uma 
evidência de amostra que confirmará a conclusão de que a média de quilômetros por litro 
é maior que 24. 
 Nesta aplicação, o erro do Tipo I de rejeitar H0 quando ela é verdadeira 
corresponde aos pesquisadores afirmarem que o novo motor melhora a média de 
quilômetros por litro (µ > 24) quando de fato o novo motor não é nada melhor do que o 
motor em uso. Em contraste, o erro do Tipo II de aceitar H0 quando ela é falsa 
corresponde aos pesquisadores concluírem que o novo motor não é nada melhor do que 
o motor em uso (µ ≤ 24) quando de fato o novo motor melhora o desempenho de 
quilômetros por litro. 
 Na prática, a pessoa que conduz o teste de hipóteses especifica a probabilidade 
máxima permissível de se cometer o erro do Tipo I, chamado de nível de significância 
para o teste. Escolhas comuns para o nível de significância são 0,05 e 0,01. Referindo-se 
à segunda linha da tabela acima, observe que a conclusão de rejeitar H0 indica que tanto 
um erro do Tipo I como uma conclusão correta foram feitos. Assim, se a probabilidade de 
se cometer um erro do Tipo I é controlada por selecionar um pequeno valor para o nível 
de significância, temos um alto grau de confiança de que a conclusão para rejeitar H0 está 
correta. Em tais casos, temos o suporte estatístico para concluir que H0 é falsa e que Ha é 
verdadeira. Qualquer ação sugerida pela hipótese alternativa Ha é apropriada. 
 Embora a maioria das aplicações de teste de hipóteses esteja atenta à 
probabilidade de se cometer um erro do Tipo I, nem sempre estão atentas à probabilidade 
de se cometer um erro do Tipo II. Por isso se decidimos aceitar H0 não podemos 
determinar quão confiantes podemos estar com aquela decisão. Por causa da incerteza 
associada com o “cometer o erro do Tipo II”, os estatísticos freqüentemente recomendam 
que usemos a declaração “não rejeitar H0” em vez de “aceitar H0”. Usar a declaração 
“não rejeitar H0” inclui a recomendação para reter tanto o julgamento como a ação. Com 
Noções de Estatística e Probabilidade 152 Profª Berenice C. Damasceno 
efeito, por nunca aceitar diretamente H0, o estatístico evita o risco de se cometer o erro do 
Tipo II. Sempre que a probabilidade de se cometer um erro do tipo II não tenha sido 
determinada e controlada, não tiraremos a conclusão de aceitar H0. Em tais casos, 
somente duas conclusões são possíveis: não rejeitar H0 ou rejeitar H0. 
 
Observação: Muitas aplicações de teste de hipóteses têm um objetivo de tomada de 
decisão. A conclusão rejeitar H0 fornece o suporte estatístico para concluir que Ha é 
verdadeira e tomar a ação apropriada, seja ela qual for. A declaração de não rejeitar H0, 
embora inconclusiva, freqüentemente força os tomadores de decisão (como por exemplo, 
os gerentes) a se comportarem como se H0 fosse verdadeira. Neste caso, os tomadores 
de decisão precisam estar cientes do fato que tal comportamento pode resultar num erro 
do Tipo II. 
 
 
 
Noções de Estatística e Probabilidade 153 Profª Berenice C. Damasceno 
EXERCÍCIOS 
 
1. O rótulo em um recipiente de três quartos de suco de laranja indica que esse suco 
contem uma média de um grama de gordura ou menos. Responda às seguintes 
questões para um teste de hipóteses que poderia ser usado para testar a declaração 
no rótulo. 
 
a. Desenvolva as hipóteses nula e alternativa apropriadas. 
b. Qual é o erro do Tipo I nessa situação? Quais são as conseqüências de se cometer 
esse erro? 
c. Qual é o erro do Tipo II nessa situação? Quais são as conseqüências de se cometer 
esse erro? 
 
2. Suponha que um novo método de produção será implementado se um teste de 
hipóteses suportar a conclusão de que o novo método reduz os custos médios 
operacionais por hora. 
 
a. Estabeleça as hipóteses nula e alternativa apropriadas se o custo médio para o 
corrente método de produção é US$ 220 por hora. 
b. Qual é o erro do Tipo I nessa situação? Quais são as conseqüências de se cometer 
esse erro? 
c. Qual é o erro do Tipo II nessa situação? Quais são as conseqüências de se cometer 
esse erro? 
Noções de Estatística e Probabilidade 154 Profª Berenice C. Damasceno 
16.3 TESTES UNILATERAIS (OU UNICAUDAIS) DA MÉDIA DA 
POPULAÇÃO: O CASO DA GRANDE AMOSTRA 
Testes Unilaterais da Média da População 
 
Vamos generalizar o procedimento de teste de hipótese para testes unilaterais sobre a 
média da população. Consideramos o caso de grande amostra (n ≥ 30) no qual o 
Teorema do Limite Central nos possibilita assumir que a distribuição amostral de 
__
X possa 
ser aproximada por uma distribuição normal de probabilidade. No caso de grande amostra 
com σσσσ desconhecido, simplesmente substituímos o desvio-padrão da amostra s por σσσσ no 
cálculo da estatística do teste. A forma geral de um teste de cauda inferior, onde µ0 é um 
valor estabelecido para a média da população, é apresentado a seguir. 
 
Teste de Hipótese de Grande Amostra (n ≥≥≥≥ 30) da Média da População para um 
Teste Unilateral da forma: 
H0 : µ ≥ µ0 
Ha : µ < µ0 
Estatística do Teste: σσσσ conhecido: 
n
z
σ
µ0
__
X −
= 
Estatística do Teste: σσσσ desconhecido: 
n
s
z 0
__
X µ−
= 
Regra de Rejeição a um Nível de Significância de αααα: 
Rejeitar H0 se z < - zα 
 
OBS.: Na maioria das aplicações usa-se o desvio-padrão da amostra s no cálculo da 
estatística do teste porque o desvio-padrão σ é desconhecido 
Noções de Estatística e Probabilidade 155 Profª Berenice C. Damasceno 
 
Uma segunda forma do teste unilateral rejeita a hipótese nula quando a estatística do 
teste está na cauda superior da distribuição amostral. Esse teste unilateral e a regra de 
rejeição são resumidamente apresentados a seguir. Novamente, estamos considerando o 
caso da grande amostra; quando σ é desconhecido, σ pode ser substituído por s na 
estatística do teste z. 
 
Teste de Hipótese de Grande Amostra (n ≥≥≥≥ 30) da Média da População para um 
Teste Unilateral da forma: 
H0 : µ ≤ µ0 
Ha : µ > µ0 
Estatística do Teste: σσσσ conhecido: 
n
z
σ
µ0
__
X −
= 
Estatística do Teste: σσσσ desconhecido: 
n
s
z 0
__
X µ−
=
Regra de Rejeição a um Nível de Significância de αααα: 
Rejeitar H0 se z > zα 
 
 
Noções de Estatística e Probabilidade 156 Profª Berenice C. Damasceno 
Seja µ0 representando o valor da média da população na hipótese. A forma geral do teste 
de hipótese bilateral da média da população é apresentada a seguir: 
Teste de Hipótese de Grande Amostra (n ≥≥≥≥ 30) da Média da População para um 
Teste Bilateral da forma: 
H0 : µ = µ0 
Ha : µ ≠ µ0 
Estatística do Teste: σσσσ conhecido: 
n
z
σ
µ0
__
X −
= 
Estatística do Teste: σσσσ desconhecido: 
n
s
z 0
__
X µ−
= 
Regra de Rejeição a um Nível de Significância de αααα: 
Rejeitar H0 se z < - zα/2 ou se z > zα/2 
 
 
Etapas do Teste de Hipóteses 
 
Um resumo das etapas que podem ser aplicadas a qualquer teste de hipóteses é 
apresentado a seguir: 
1. Determinar as hipóteses nula e alternativa que são apropriadas para a aplicação. 
2. Selecionar a estatística de teste que será usada para decidir rejeitar ou não a 
hipótese nula. 
3. Especificar o nível de significância α para o teste. 
4. Usar o nível de significância para desenvolver a regra de rejeição que indica os 
valores da estatística de teste que levará à rejeição de H0. 
5. Coletar os dados amostrais e calcular o valor da estatística de teste. 
6. Comparar o valor da estatística do teste com o(s) valor(es) crítico(s0 
especificado(s) na regra de rejeição para determinar se H0 deve ser rejeitada. 
Noções de Estatística e Probabilidade 157 Profª Berenice C. Damasceno 
EXEMPLO 
 
Suponha que entre pessoas sadias a concentração de certa substância se comporta 
segundo um modelo normal com média 14 unidades/ml e desvio-padrão 6 unidades/ml. 
Pessoas sofrendo de uma doença específica têm a concentração alterada para 18 
unidades/ml. Admitimos que o modelo normal, com desvio-padrão 6 unidades/ml, 
continua representando de forma adequada a concentração da substância em pessoas 
com a doença. 
 
 
 
14 18 
sadio doente
 
Observe que as curvas, representando as concentrações, irão se cruzar em algum 
momento, fazendo com que uma certa proporção de indivíduos na população sadia possa 
apresentar valores de concentração tão altos (ver região marcada na figura acima) quanto 
aqueles observados para pessoas doentes, ainda que este evento ocorra com baixa 
probabilidade. 
 
Desejamos averiguar se um certo tratamento, proposto para combater a doença, é eficaz. 
Noções de Estatística e Probabilidade 158 Profª Berenice C. Damasceno 
 
 
Uma amostra aleatória de tamanho n = 30 é selecionada entre indivíduos doentes que 
foram submetidos ao tratamento. Representemos as concentrações dos indivíduos da 
amostra por X1 , ..., X30. Sabemos que para i = 1, 2, ..., 30, temos Xi aproximada por uma 
distribuição normal com µ e σ2 , isto é, 
 
Xi ~ N(µ, 36), 
 
Onde: 
σ2 = 62 = 36 e, 
µ = 14 ou µ = 18 dependendo se o tratamento for eficiente ou não. 
 
Caso a amostra forneça valor alto “próximo” de 18 unidades/ml, teremos evidências de 
que o tratamento não é eficaz, ao passo que um valor baixo e “próximo” de 14 nos levaria 
a crer que o tratamento apresenta resultados satisfatórios, logo: 
 
H0 : o tratamento não é eficaz 
 Ha : o tratamento é eficaz 
 
Ou seja, 
 
 H0 : µ = 18 Hipóteses 
 Ha : µ = 14 Simples 
Noções de Estatística e Probabilidade 159 Profª Berenice C. Damasceno 
 
Resumindo: 
 
- Pessoa sadia: 14 unidades/ml N(14,36) 
6 unidades/ml 
 
- Pessoa doente: 18 unidades/ml N(18,36) 
 6 unidades/ml 
 
Deseja-se testar se a média populacional µ é igual a 14, caso em que os indivíduos 
pertencem à população de sadios, contra a alternativa µ é igual a 18, correspondente à 
população de doentes. 
 
Se o tratamento for eficaz, então uma amostra com 30 indivíduos podem ser vistos como 
membros da população com concentração modelada por uma normal N(14,36); caso 
contrário, eles pertencerão à população N(18,36). 
 
Observação: a caracterização do que significa “próximo” depende, entre outros fatores, 
da variabilidade da concentração na população. Como n = 30 é aleatório, o problema 
necessita de uma análise probabilística: teste de hipóteses para a média com variância 
conhecida. 
 
No teste teremos: 
- 
__
X ≡ média amostral (
__
X é um estimador de µ) 
- a tomada de decisão será baseada no valor observado, denotado por obs
__
x
 
- n = 30 (tamanho da amostra) 
 
N(µµµµ, 36/30) (lembrando que 
n
 s
σ
= e 
n
 s
2
2 σ
= ) 
 
Noções de Estatística e Probabilidade 160 Profª Berenice C. Damasceno 
 
Observações: 
 
(1) Mesmo quando µ = 14, 
__
X pode apresentar valores maiores que 14, e, 
 
P(
__
X > 14  µ =14) = 0,5 (pela simetria) 
 
(2) Um critério que pode ser utilizado, para decidir sobre o valor de µ, é determinar um 
valor crítico, xC, tal que, 
se 
__
X > xC a amostra pertence à população com µ = 18, ou seja, 
o tratamento não é eficaz. 
 
(3) Quando 
__
X ≤ xC a amostra pertence à população com µ = 14, ou seja, 
o tratamento é eficaz. 
 
 
µ = 14 µ = 18 
xC 
__
x obs 
 
 
(4) Hipóteses simples: 
 H0 : µ = 18, tratamento não é eficaz 
Ha : µ = 14, tratamento é eficaz 
 
É mais usual utilizarmos hipóteses unilaterais ou bilaterais, ou seja: 
Noções de Estatística e Probabilidade 161 Profª Berenice C. Damasceno 
 H0 : µ = 18, tratamento não é eficaz 
Unilateral 
 Ha : µ < 18, tratamento é eficaz 
 
 
 
 H0 : µ = 18, tratamento não produz efeito 
Bilateral 
 Ha : µ ≠ 18, tratamento produz efeito 
 
 
 
Lembrando que: 
 
α = P(erro do tipo I) = P(rejeitar H0  H0 verdadeira) 
β = P(erro do tipo II) = P(não rejeitar H0  H0 falsa) 
Noções de Estatística e Probabilidade 162 Profª Berenice C. Damasceno 
Considerando o teste UNILATERAL, temos: 
H0 : µµµµ = 18 
Ha : µµµµ < 18 
 
α = P(concluir que o tratamento é eficaz quando na verdade ele não é) 
β = P(concluir que o tratamento não é eficaz quando na verdade ele é) 
 
(A situação ideal é: α e β próximas de zero.). 
 
 
14 18 
Sadio Ha Doente H0 
 
xC 
Região de Região de 
Rejeição de H0 Aceitação de H0 
αααα ββββ 
 
À medida que diminuirmos α, β tende a aumentar, fato diretamente relacionado com a 
posição (ou valor) de xC. 
 
αααα é chamado de nível de significância do teste e é o erro mais importante a ser 
evitado. 
Noções de Estatística e Probabilidade 163 Profª Berenice C. Damasceno 
 
Supondo α conhecido, podemos encontrar xC da seguinte forma: 
 
 α = P(erro do tipo I) = P(rejeitar H0  H0 verdadeira) 
 = P(
__
X < xC  µ =18) (ou simplesmente P(
__
X < xC)) 
 = P












<
−
30
6
18-xX C
__
n
σ
µ
 ( ou seja, P(z < zC), com z ~ N(0, 1).) 
 
 
30
6
18-x
z
C
C = 
30
6
.z18x CC += 
 
Por exemplo, para α = 0,05, temos: 
 
 
18 
α=0,05 
 
Noções de Estatística e Probabilidade 164 Profª Berenice C. Damasceno 
Logo, da tabela de áreas simétricas nas caudas (página 122), temos: 
 
para 0,05 em uma das caudas, por simetria, temos uma área total nas duas caudas igual 
a 0,10, logo 
 
zα/2 (= zC) = -1,645 (pois está à esquerda do eixo da média) 
 
Portanto: 
 
16,20x1980,16
30
6)645,1(18x CC ≅⇒=−+=
 
 
 
14 18 
 
16,20
 
Região de 
Rejeição ou 
Região Crítica (RC) 
 
Noções de Estatística e Probabilidade 165 Profª Berenice C. Damasceno 
 
 
 
Se obs
__
x
 < 16,20 ⇒ H0 é rejeitada ⇒ o tratamento é eficaz 
 
 RC = {x ∈ |R : x < 16,20} 
 
(Teste Unilateral) 
 
 
(obs. : RA ≡ Região
de Aceitação, que é complementar à RC) 
 
Noções de Estatística e Probabilidade 166 Profª Berenice C. Damasceno 
 
Considerando o teste BILATERAL, temos: 
H0 : µµµµ = µµµµ0 
Ha : µµµµ ≠≠≠≠ µµµµ0 
 
RC = {x ∈ |R : x < xC1 ou x > xC2} 
 
 
µ0 xC1 xC2 
 
 
α = P(
__
X < xC1 ou 
__
X > xC2), onde: 
 
=
2
α
 P(
__
X < xC1) e =2
α
 P(
__
X > xC2) 
 
se α = 0,05 ⇒ tab. pág. 122 ⇒ zC1 = -1,96 e zC2 = 1,96 
 
logo, 
Noções de Estatística e Probabilidade 167 Profª Berenice C. Damasceno 
 
30
6
.z18x C1C1 += e 
30
6
.z18x C2C2 += 
30
6
.)96,1(18xC1 −+= e 
30
6
.)96,1(18xC2 += 
 
15,85xC1 = e 20,15xC2 = 
 
 
18
 
15,85 20,15
 
 
 
RC = {x ∈ |R : x < 15,85 ou x > 20,15} 
(Teste Bilateral) 
 
Noções de Estatística e Probabilidade 168 Profª Berenice C. Damasceno 
EXEMPLO: 
 
Uma variável aleatória tem distribuição normal e desvio-padrão 12. Estamos testando se a 
sua média é igual ou diferente de 20 e coletamos uma amostra de 100 valores dessa 
variável, obtendo uma média amostral de 17,4. 
 
(a) Formule as hipóteses; 
(b) Obtenha a RC e dê a conclusão para os seguintes níveis de significância (α): 1%, 
2%, 4%, 6% e 8%. 
 
Noções de Estatística e Probabilidade 169 Profª Berenice C. Damasceno 
SOLUÇÃOSOLUÇÃOSOLUÇÃOSOLUÇÃO: 
 
(a) H0 : µ = 20 
Ha : µ ≠ 20 
 
 
 
(b) Para n = 100, dados µ = 20 e σ = 12, temos N (µ, σ2) = N (20, 144/100) e 
 
RC = {x ∈ |R : x < xC1 ou x > xC2} 
α = P(
__
X < xC1 ou 
__
X > xC2), onde: 
 
=
2
α
 P(
__
X < xC1) e =2
α
 P(
__
X > xC2) 
 
(b.1) se α = 0,01 ⇒ tab. pág. 122 ⇒ zC1 = -2,576 e zC2 = 2,576 
 
logo, 
100
12
.z20x C1C1 += e 
100
12
.z20x C2C1 += 
100
12
.)576,2(20xC1 −+= e 
100
12
.)576,2(20xC1 += 
16,91xC1 = e 23,09xC2 = 
Portanto: 
para αααα = 1% ⇒⇒⇒⇒ RC = {x ∈∈∈∈ ||||R : x < 16,91 ou x > 23,09} 
⇒⇒⇒⇒não rejeitar H0 pois 17,4 ∉∉∉∉ RC 
 
 
µ0 xC1 xC2 
 
20
 
16,91 23,09
 
Noções de Estatística e Probabilidade 170 Profª Berenice C. Damasceno 
Analogamente, temos: 
 
(b.2) para αααα = 2% ⇒⇒⇒⇒ RC = {x ∈∈∈∈ ||||R : x < 17,21 ou x > 22,79} 
⇒⇒⇒⇒não rejeitar H0 pois 17,4 ∉∉∉∉ RC 
 
(b.3) para αααα = 4% ⇒⇒⇒⇒ RC = {x ∈∈∈∈ ||||R : x < 17,54 ou x > 22,46} 
⇒⇒⇒⇒rejeitar H0 pois 17,4 ∈∈∈∈ RC 
 
(b.4) para αααα = 6% ⇒⇒⇒⇒ RC = {x ∈∈∈∈ ||||R : x < 17,74 ou x > 22,26} 
⇒⇒⇒⇒rejeitar H0 pois 17,4 ∈∈∈∈ RC 
 
(b.5) para αααα = 8% ⇒⇒⇒⇒ RC = {x ∈∈∈∈ ||||R : x < 17,90 ou x > 22,10} 
⇒⇒⇒⇒rejeitar H0 pois 17,4 ∈∈∈∈ RC 
 
 
 
 
Noções de Estatística e Probabilidade 171 Profª Berenice C. Damasceno 
17 CORRELAÇÃO 
 
17.1 INTRODUÇÃO 
 
Até agora nossa preocupação era descrever a distribuição de valores de uma única 
variável. Com esse objetivo, aprendemos a calcular medidas de tendência central (média, 
mediana e moda) e variabilidade (variância e desvio padrão). 
 
Quando, porém, consideramos observações de duas ou mais variáveis, surge um novo 
problema: as relações que podem existir e obter duas ou mais variáveis estudadas. 
 
Assim, quando consideramos variáveis como peso e altura de um grupo de pessoas, uso 
do cigarro e incidência do câncer, a potência gasta e a temperatura da água no chuveiro, 
procuramos verificar se existe alguma relação entre as variáveis de cada um dos pares e 
qual o grau dessa relação. 
 
Para isso, é necessário o conhecimento de novas medidas. 
 
Sendo a relação entre as variáveis de natureza quantitativa, a correlação é o 
instrumento adequado para descobrir e medir essa relação. 
 
Uma vez caracterizada a relação, procuramos descrevê-la através de uma função 
matemática. A regressão é o instrumento adequado para a determinação dos parâmetros 
dessa função. 
 
17.2 RELAÇÃO FUNCIONAL E RELAÇÃO ESTATÍSTICA 
 
Como sabemos, o perímetro e o lado de um quadrado estão relacionados. A relação que 
liga é perfeitamente definida e pode ser expressa por meio de uma sentença matemática: 
 
 P = 4 L P= PERÍMETRO L= LADO DO QUADRADO 
Atribuindo-se, então, um valor qualquer de L, é possível determinar exatamente o valor 
do perímetro. 
Noções de Estatística e Probabilidade 172 Profª Berenice C. Damasceno 
Considerando, agora a relação que existe entre o peso e a estatura de um grupo de 
pessoas, é evidente que essa relação não é do mesmo tipo da anterior, ela é bem menos 
precisa. Assim, pode acontecer que as estaturas diferentes correspondam a pesos iguais 
ou que estaturas iguais correspondam a pesos diferentes. 
 
Porém, em média, quanto maior a estatura, maior o peso. 
 
As relações do tipo perímetro são conhecidas como relações funcionais. 
As relações do tipo peso-estatura, como relações estatísticas. 
 
Quando duas variáveis estão ligadas por uma relação estatística, dizemos que existe 
uma correlação entre elas. 
 
 
17.3 DIAGRAMA DE DISPERSÃO 
 
Consideremos uma amostra aleatória, formada por 98 alunos de uma classe de uma 
Universidade e pelas notas obtidas por eles em matemática e estatística: 
 
 NOTAS 
 Nº MATEMÁTICA ESTATÍSTICA 
 (xi) (yi) 
 
 01 5,0 6,0 
 08 8,0 9,0 
 24 7,0 8,0 
 38 10,0 10,0 
 44 6,0 5,0 
 58 7,0 7,0 
 59 9,0 8,0 
 72 3,0 4,0 
 80 8,0 6,0 
 92 2,0 2,0 
 
Noções de Estatística e Probabilidade 173 Profª Berenice C. Damasceno 
 
Representando, em um sistema cartesiano ortogonal de coordenadas, os parâmetros (xi ; 
yi), obtemos uma nuvem de pontos que denominamos DIAGRAMA DE DISPERSÃO. 
Esse diagrama nos fornece uma idéia grosseira, porém útil, da correlação existente: 
 yi 
 10 . o 
 
 . 
 o 
 8 . o o 
 
 . o 
 
 6 . o o 
 
 . o 
 
 4 . o 
 
 . 
 
 2 . o 
 
 . 
 
 . . . . . . . . . . 
 2 4 6 8 10 xi 
 
 
17.4 CORRELAÇÃO LINEAR 
 
Os pontos obtidos, vistos em conjunto formam uma elipse em diagonal. 
 
Podemos imaginar que, quanto mais fina for a elipse mais ela se aproximara de uma reta. 
 
Dizemos, então, que a correlação de forma elíptica tem como “imagem” uma reta, sendo, 
por isso denominada de correlação Linear. 
Noções de Estatística e Probabilidade 174 Profª Berenice C. Damasceno 
É possível verificar que a cada correlação está associada como “imagem“ uma relação 
funcional. Por esse motivo, as relações funcionais são chamadas relações Perfeitas.
yi 
 10 . RETA IMAGEM o 
 
 . 
 o 
 8 . o o 
 
 . o 
 
 6 . o o 
 
 . o 
 
 4 . o 
 
 . 
 
 2 . o 
 
 . 
 
 . . . . . . . . . . 
 2 4 6 8 10 xi 
 
 
Como a correlação em estudo tem como “imagem” uma reta ascendente, ela e chamada 
de correlação Linear Positiva. 
 
Assim uma correlação é: 
a- Linear Positiva se os pontos do diagrama têm como “imagem” uma reta ascendente; 
b- Linear Negativa se os pontos têm como ”imagem” uma reta descendente; 
c- Não Linear se os pontos têm como “imagem” uma curva. 
 
Noções de Estatística e Probabilidade 175 Profª Berenice C. Damasceno 
 
Se os pontos apresentam-se dispersos, não oferecendo uma “imagem” definida, 
concluímos que não há relação alguma entre as variáveis em estudo. 
Temos: 
 
 o 
 oo 
 ooo 
 oo 
 ooooo correlação positiva 
 ooo 
 ooooo 
 oo 
 o 
 oo 
 
 
 o 
 oo 
 ooo 
 oo 
 ooooo correlação negativa 
 ooo 
 ooooo 
 oo 
 o 
 oo 
 
 
 o 
 o oo 
 oo oooo 
 ooo oo 
 oo ooo 
 ooooo o correlação não linear 
 ooo oooo 
 ooooo ooo 
 oo oo 
 o oooo 
 oo ooo 
 
 
 oo 
 o o o o 
 o o o oooo ooo o ooo 
 oo ooo oooo oooo oooo o não há correlação 
 o oo ooo ooooo o 
 o ooo oo o 
 ooooo 
 
Noções de Estatística e Probabilidade 176 Profª Berenice C. Damasceno 
17.5 COEFICIENTE DE CORRELAÇÃO LINEAR 
 
O instrumento empregado para a medida de correlação Linear é o Coeficiente de 
correlação. Esse coeficiente deve indicar o grau de intensidade da correlação entre duas 
variáveis e, ainda, o sentido dessa correlação (positivo ou negativo). 
Faremos uso do coeficiente de correlação de Person, que é dado por: 
])y(yn[])x(xn[
)y()x(yxn
r
2
i
2
i
2
i
2
i
iiii
∑ ∑∑ ∑
∑ ∑∑
−−
−
= 
Onde: 
n = número de observações 
Os valores limites de r são -1 e +1, isto é, o valor de r pertence ao intervalo [ -1 e +1]. 
Assim: 
 
A- Se a correlação entre duas variáveis é perfeita e positiva, então r = +1. 
 
B- Se a correlação é perfeita e negativa, então r = -1 
 
C- Se não há correlação entre as variáveis ou a relação é por acaso não linear, 
então r = 0. 
 
NOTAS 
- Para que uma relação possa ser descrita por meio do Coeficiente de 
correlação de Person é imprescindível que ela se aproxime de uma função 
Linear. Uma maneira prática de verificarmos a linearidade da relação é a 
inspeção do Diagrama de Dispersão: se a elipse apresenta saliências ou 
reentrâncias muito acentuadas, provavelmente trata-se de uma relação 
curvilínea. 
- Para podermos tirar algumas conclusões significativas sobre o comportamento 
simultâneo das variáveis analisadas, é necessário que: 
 0,6 ≤ | r | ≤ 1 
Se 0,3 ≤ | r | < 0,6, há uma correlação relativamente fraca entre as variáveis. 
Se 0 < | r | < 0,3, a correlação é muito fraca e, praticamente, nada podemos 
concluir sobre a relação entre as variáveis em estudo. 
 
Noções de Estatística e Probabilidade 177 Profª Berenice C. Damasceno 
Em seguida vamos calcular o coeficiente de correlação relativos ao exercício anterior. 
O modo mais prático para obtermos r é abrir, na tabela, colunas correspondentes aos 
valores de xi yi, 2ix e 2iy . Assim: 
 
 
 
 
 MATEMÁTICA ESTATÍSTICA 
 (xi) (yi) xi yi 2ix 2iy 
 
 5,0 6,0 30 25 36 
 8,0 9,0 72 64 81 
 7,0 8,0 56 49 64 
 10,0 10,0 100 100 100 
 6,0 5,0 30 36 25 
 7,0 7,0 49 49 49 
 9,0 8,0 72 81 64 
 3,0 4,0 12 09 16 
 8,0 6,0 48 64 36 
 2,0 2,0 04 04 04 
 Σ=65 Σ=65 Σ=473 Σ=481 Σ=475 
 
 
Logo: 
911,0
18,554
505
525.585
505
]42254750[]42254810[
65.65473.10
r ============
−−−−−−−−
−−−−
==== 
 
Daí: r = 0,91 - Resultado que indica uma correlação linear positiva altamente significativa 
entre as duas variáveis. 
 
Noções de Estatística e Probabilidade 178 Profª Berenice C. Damasceno 
17.6 CUIDADOS COM OS ERROS COM A INTERPRETAÇÃO DE 
CORRELAÇÃO 
 
Identificamos a seguir três dos erros mais comuns cometidos na interpretação de 
resultados que envolvem correlação. 
 
1- Devemos evitar a conclusão de que a correlação implica em casualidade. Um 
estudo
mostrou uma correlação entre salários de professores de estatística e o consumo 
individual de cerveja. Porém essas duas variáveis são afetadas pelas condições 
econômicas que envolvem não só os professores de estatística. Aparece, neste caso, 
uma terceira variável oculta. 
 
2- Surge outra fonte de erro potencial quando os dados se baseiam em taxas ou 
médias. Quando utilizamos taxas ou médias para os dados, suprimimos a variação entre 
os indivíduos ou elementos, e isto pode levar a um coeficiente de correlação 
inflacionado. 
 
3- Um terceiro erro diz respeito à propriedade de linearidade. A conclusão de que não 
há correlação linear significativa não quer dizer que x e y não estejam relacionados de 
alguma forma provavelmente possa haver uma correlação não linear. 
 
 
 
 
 
 
 
Noções de Estatística e Probabilidade 179 Profª Berenice C. Damasceno 
EXERCÍCIOS: 
 
 
1- Complete o esquema de cálculo do coeficiente de correlação para os valores das 
variáveis xi e yi : 
 
 xi 4 6 8 10 12 
 yi 12 10 8 12 14 
 
Temos: 
 
 
 
 
 (xi) (yi) xi yi 2ix 2iy 
 
 4,0 12,0 
 ……. ……. 
 ……. …… 
 ..….. …… 
 12,0 14,0 
 Σ= Σ= Σ= Σ= Σ= 
 
 
Logo: 
 
===
−−
−
=
.][][
..
r 
 
ONDE: r = 
 
 
 
Noções de Estatística e Probabilidade 180 Profª Berenice C. Damasceno 
2- Padronize cada conjunto de escores e calcule o coeficiente de correlação. 
A- 
 
 (xi) (yi) xi yi 2ix 2iy 
 
 34 21 
 30 22 
 40 25 
 34 28 
 39 15 
 35 24 
 42 24 
 45 22 
 43 17 
 
 Σ= Σ= Σ= Σ= Σ= 
 
B- 
 
 
 (xi) (yi) xi yi 2ix 2iy 
 
 3,9 46 
 4,6 46 
 6,0 52 
 2,8 50 
 3,1 48 
 3,4 40 
 4,2 42 
 4,0 44 
 
 Σ= Σ= Σ= Σ= Σ= 
Noções de Estatística e Probabilidade 181 Profª Berenice C. Damasceno 
3- Determine o coeficiente de correlação para os dois conjuntos de valores abaixo: 
 
 
 1ª AVALIAÇÃO 2ª AVALIAÇÃO 
 estudante (xi) (yi) xi yi 2ix 2iy 
 
 1 82 92 
 2 84 91 
 3 86 90 
 4 83 92 
 5 88 87 
 6 87 86 
 7 85 89 
 8 83 90 
 9 86 92 
 10 85 90 
 11 87 91 
 Σ= Σ= Σ= Σ= Σ= 
 
4- Com os dados abaixo, sobre crimes violentos e a temperatura média entre 21 e 2 horas 
das noites de sábado numa grande comunidade, monte o gráfico para os dados e calcule 
o coeficiente de correlação. 
 
Crimes Violentos/ 1000 residentes temperatura média (°F) 
 5,0 87 
 2,2 50 
 4,1 75 
 5,4 90 
 2,8 55 
 3,0 54 
 3,6 68 
 4,9 85 
 4,1 82 
 4,2 80 
 2,0 45 
 2,7 58 
 3,1 66 
 
Noções de Estatística e Probabilidade 182 Profª Berenice C. Damasceno 
18 REGRESSÃO 
 
18.1 INTRODUÇÃO 
 
Sempre que desejamos estudar determinada variável em função de outra fazemos 
sempre uma análise de regressão. 
 
Podemos dizer que a análise de regressão tem por objetivo descrever, através de um 
modelo matemático, a relação entre duas variáveis, partindo de n observações das 
mesmas. 
 
A variável sobre a qual desejamos fazer uma estimativa recebe o nome de variável 
dependente e a outra recebe o nome de variável independente. 
 
Assim, supondo X a variável independente e Y a dependente, vamos procurar determinar o ajustamento de uma reta à 
relação entre essas variáveis. 
 
18.2 GRÁFICO DE LINHAS 
 
É comum, para quem trabalha na área de administração e negócios, observar o 
comportamento de uma variável ao longo do tempo. Por exemplo, um executivo 
acompanha a cotação diária das ações da sua empresa, um gerente acompanha o 
volume semanal de vendas da sua loja, um engenheiro de produção acompanha 
características de qualidade do produto que fabrica. 
 
As séries temporais são dados produzidos e monitorados ao longo do tempo. 
 
Quando se fazem observações ao longo do tempo, é preciso registrar tanto o valor 
observado como o momento de observação. Depois, com esse conjunto de dados, é 
possível fazer um gráfico de linhas. 
 
O gráfico de linhas é usado para apresentar a variação das séries temporais. 
 
Noções de Estatística e Probabilidade 183 Profª Berenice C. Damasceno 
Para fazer o gráfico de linhas: 
i. colete os valores da variável Y nos tempos que você pretende 
estudar; 
ii. trace um sistema de eixos cartesianos e represente o tempo no eixo 
das abscissas e a variável Y no eixo das ordenadas; 
iii. estabeleça as escalas; 
iv. escreva o nome das variáveis nos respectivos eixos. Depois faça as 
graduações;
v. faça um ponto para representar cada par de valores x e y; 
vi. una os pontos por segmentos de reta; 
vii. escrever o título. 
 
Exemplo: 
Variação percentual do PIB, no Brasil 
Ano 
Variação percentual do PIB, 
no Brasil 
 
1991 1,03 
1992 -0,54 
1993 4,92 
1994 5,85 
1995 4,22 
1996 2,76 
1997 3,68 
1998* 0,15 
*Nota: O valor do PIB em 1998 foi de 901 bilhões 
de Reais. Fonte IBGE, (1999) 
Gráfico de linhas
Variação percentual do PIB, no Brasil
-1,00
0,00
1,00
2,00
3,00
4,00
5,00
6,00
7,00
1991 1992 1993 1994 1995 1996 1997 1998*
Va
ria
çã
o
 
do
 
PI
B
 
Noções de Estatística e Probabilidade 184 Profª Berenice C. Damasceno 
18.3 REGRESSÃO LINEAR SIMPLES 
 
Se você aumentar o lado de um quadrado em 1 cm, a área aumenta, não é mesmo? E se 
você continuar aumentando o lado do quadrado de 1 cm em 1 cm, a área continuará 
aumentando. Você saberia dizer exatamente a área do quadrado para cada tamanho de 
lado. 
Pense agora em um supermercado que vai aumentar seu gasto com propaganda porque 
– dizem – quem não se anuncia se esconde. Vamos então pensar o aumento do volume 
de vendas como função do aumento dos gastos com propaganda. Você acha que existe 
uma relação exata entre essas variáveis, isto é, para cada real a mais gasto com 
propaganda haverá um aumento fixo no volume de vendas? 
Não é bem assim. As vendas aumentam em certas épocas do ano. O volume de vendas 
também depende dos preços e aumentos de salário, depende da concorrência e outras 
coisas além, é claro, da propaganda. Mesmo que nós conhecêssemos todas as causas 
que explicam o volume de vendas em supermercados, ainda assim não saberíamos 
prever exatamente o volume de vendas. Sempre existiria o acaso, aumentando ou 
diminuindo o volume de vendas. 
Com estes exemplos queremos lembrar que existem relações determinísticas como é a 
relação entre lado e área de um quadrado e relações probabilísticas como é a relação 
entre gasto com propaganda e volume de vendas. No primeiro caso, não existe espaço 
para erro na previsão, isto é, dado o lado de um quadrado você pode dizer exatamente 
qual é a área. No segundo caso é possível alguma previsão,mas dentro de certas 
margens de erro. Então a relação entre as duas variáveis admite o que os estatísticos 
chamam de erro aleatório. 
O exemplo a seguir, mostra que o tempo de entrega de um carregamento aumenta em 
função da distância rodoviária a ser percorrida. Então é possível prever o tempo de 
entrega de um carregamento, desde que se conheça a distância rodoviária a ser 
percorrida e se tenha o modelo matemático que estabelece a relação entre as variáveis. É 
o que se chama, em Estatística, análise de regressão. Mas como se acha o modelo 
matemático da função? 
Observe cuidadosamente o diagrama de dispersão feito para o exemplo a seguir. 
Noções de Estatística e Probabilidade 185 Profª Berenice C. Damasceno 
 
 
Exemplo: 
Tempo de entrega de dez carregamentos em 
função da distância rodoviária 
Distância 
(em Km) 
Tempo de entrega 
(em dias) 
 
825 3,50 
215 1,00 
1070 4,00 
550 2,00 
480 1,00 
920 3,00 
1350 4,50 
325 1,50 
670 3,00 
1215 5,00 
Fonte Kazmier, (1982) 
 
Diagrama de Dispersão
Tempo de entrega de dez carregamentos em funçaõ da 
distância rodoviária
0
1
2
3
4
5
6
0 200 400 600 800 1000 1200 1400 1600
Distância
Te
m
po
 
de
 
e
n
tre
ga
 
 
Parece existir uma reta que dá o tempo de entrega de um carregamento em função da 
distância rodoviária a ser percorrida. Você se lembra da equação de uma reta? Veja a 
figura abaixo e lembre que uma reta é dada pela equação: 
 
Y = α + βX. 
Noções de Estatística e Probabilidade 186 Profª Berenice C. Damasceno 
O coeficiente linear α dá a altura em que a reta corta o eixo das ordenadas e o coeficiente 
angular β é a tangente trigonométrica do ângulo θ, formado pela reta Y = α + βX e uma 
paralela ao eixo das abscissas, de ordenada igual a α. 
 
Y 
X 
Y = α + βX 
β = tg θ 
θ 
α
Reta de regressão 
 
 
Se X é a variável que representa a distância rodoviária e Y é a variável que representa o 
tempo de entrega, então o modelo que relaciona as duas variáveis é: 
 
Y = α + βX + ε, 
 
onde α e β indicam os coeficientes linear e angular da reta, respectivamente, e ε indica o 
erro aleatório. 
Para obter as estimativas 
∧
αααα e 
∧
ββββ de α e β, aplicam-se as fórmulas apresentadas em 
seguida. 
 
Fórmula do coeficiente angular: Fórmula do coeficiente linear: 
 
 
∑ ∑
∑ ∑ ∑
−
−
=
∧
n
)x(
x
n
yx
xy
2
2
ββββ
 
__
xy
∧∧
−= ββββαααα
 
 
 
Reta de regressão é a reta que relaciona as variáveis X e Y. A variável Y é 
denominada dependente e a variável X é denominada explanatória. 
Noções de Estatística e Probabilidade 187 Profª Berenice C. Damasceno 
 
Cálculos intermediários 
X Y XY 
 
 
825 3,50 2887,5 680625,00 12,25 
215 1,00 215,0 46225,00 1,00 
1070 4,00 4280,0 1144900,00 16,00 
550 2,00 1100,0 302500,00 4,00 
480 1,00 480,0 230400,00 1,00 
920 3,00 2760,0 846400,00 9,00 
1350 4,50 6075,0 1822500,00 20,25 
325 1,50 487,5 105625,00 2,25 
670 3,00 2010,0 448900,00 9,00 
1215 5,00 6075,0 1476225,00 25,00 
 
7620 28,50 26370,0 7104300,00 99,75 
Para obter 
∧
ββββ : 
0036,00035851,0
8602971
4653
10
)7620(3001047
10
5,28.76200,26370
2 ≅===
−
−
=
∧
ββββ 
Para obter 
∧
αααα : 
762
10
7620
x
_
== e 85,2
10
5,28y
_
== 
11,01068,0762.0036,085,2xy
__
≅=−=−=⇒
∧∧
ββββαααα 
Reta de regressão ajustada aos dados
Tempo de entrega de dez carregamentos em função da 
distância rodoviária
0
1
2
3
4
5
6
0 200 400 600 800 1000 1200 1400 1600
Distância
Te
m
po
 
de
 
e
n
tre
ga
 
2X 2Y
Noções de Estatística e Probabilidade 188 Profª Berenice C. Damasceno 
Observação: Antes de ajustar uma reta de regressão, desenhe o diagrama de dispersão. 
Esse cuidado ajuda a prevenir o uso de modelos inadequados. Algumas vezes, basta 
observar o diagrama para perceber que a relação entre as variáveis não é linear. 
 
EXERCÍCIO: 
 
1- A tabela abaixo apresenta o tempo, em meses, que seis pessoas estão trabalhando na 
inspeção de carros e o número de carros que elas inspecionaram em uma tarde de 
trabalho. Ajuste uma reta de regressão aos dados e calcule o coeficiente de 
determinação. Se uma pessoa tivesse trabalhado dez meses, quantos caros ela teria 
inspecionado? 
 
Exercício: 
Número de carros inspecionados, segundo o 
tempo de serviço, em meses, de seis pessoas 
Tempo Carros inspecionados 
 
5 16 
1 15 
7 19 
9 23 
2 14 
12 21 
 
 
 
 
Noções de Estatística e Probabilidade 189 Profª Berenice C. Damasceno 
PRINCIPAIS REFERÊNCIAS BILBIOGRÁFICAS 
 
ANDERSON, D.R.; SWEENEY, D.J.; WILLIAMS, T.A. Estatística Aplicada à 
Administração e Economia; Ed. Thomson, 2003. 
 
BUSSAB, W.O.; MORETTIN, P.A. Métodos Quantitativos: Estatística Básica; Atual 
Editora, 1987. 
 
LEITE, O.P.; DAMASCENO, B.C. Apostilas de “Estatística”, “Estatística Aplicada” e 
“Probabilidade e Estatística” dos cursos de Administração de Negócios 2º semestre, 
Administração de Negócios 3º semestre e Sistemas de Informação, respectivamente. 
UNISO – Universidade de Sorocaba, 2002. 
 
MAGALHÃES, M.N.; LIMA, A.C.P. Noções de Probabilidade e Estatística; EDUSP, 2002. 
 
VIEIRA, S. Princípios de Estatística; Ed Pioneira, 1999. 
 
 
Anexo 1: Tabela: Distribuição t de Student 
 
Estatística e Probabilidade i Profª Berenice C. Damasceno 
 
 
 
 
 
 
 
 
 
 
 
 
 
Anexo : TABELA: DISTRIBUIÇÃO
t DE STUDENT 
 
Anexo 1: Tabela: Distribuição t de Student 
 
Noções de Estatística e Probabilidade ii Profª Berenice C. Damasceno 
 
 
Anexo 2: Apresentação do Curso 
 
Noções de Estatística e Probabilidade Profª Berenice C. Damasceno 
 
 
UNIDADE UNIVERSITÁRIA: FACULDADE DE ENGENHARIA 
 UNESP- CAMPUS DE ILHA SOLTEIRA 
CURSO: ENGENHARIAS ELÉTRICA E MECÂNICA 
DEPARTAMENTO RESPONSÁVEL: MATEMÁTICA 
DISCIPLINA: ESTATÍSTICA E PROBABILIDADE 
PROFª: BERENICE CAMARGO DAMASCENO 
 
 
BIBLIOGRAFIA BÁSICA 
 
BUSSAB, W.O. e MORETTIN, P.A. Métodos Quantitativos: Estatística Básica. 
3.ed. São Paulo, Atual, 1986. 
FONSECA, J.S. e MARTINS, G.A. Curso de Estatística. 3.ed. São Paulo, Atlas. 
LEME, R.A.S. Curso de Estatística: Elementos. Rio de Janeiro, Livros Técnicos e 
Científicos, 1974. 
MEYER, P.L. Probabilidade: Aplicações à Estatística. São Paulo, Livros Técnicos 
e Científicos, 1976. 
MORETTIN, P.A. Introdução à Estatística para Ciências Exatas. São Paulo, Atual, 
1981. 
MORETTIN, P.A. Métodos Quantitativos para Economistas e Administradores. São 
Paulo, Atual, 1981. 
 
 
Anexo 2: Apresentação do Curso 
 
Noções de Estatística e Probabilidade Profª Berenice C. Damasceno 
 
 
CRITÉRIOS DE AVALIAÇÃO 
Serão realizadas 03 (três) provas escritas, sendo uma substitutiva. 
A nota de aproveitamento será a média aritmética ponderada entre as notas de 
provas e uma nota de avaliação de trabalhos. 
 
MF = 
8
Sub)ou (P 4 +Sub)ou (P 3 + 1T 21
 
 
onde: MF = Média Final 
 T = Média das notas de trabalhos e de exercícios 
 P1 = Nota da 1ª Prova 
 P2 = Nota da 2ª Prova 
 Sub = Nota da Prova Substitutiva (optativa) 
Haverá uma Prova Substitutiva, para alunos que faltarem a uma das provas. 
A prova substitutiva abrangerá todo o conteúdo da disciplina, e será optativa. 
 
NÃO SERÁ OFERECIDA RECUPERAÇÃO 
 
 
 
DATAS DAS AVALIAÇÕES 
 
 P1 : / / 2012 – ª FEIRA 
 P2 : / / 2012 – ª FEIRA 
 Sub : / / 2012 – ª FEIRA 
 
 
 
Anexo 2: Apresentação do Curso 
 
Noções de Estatística e Probabilidade Profª Berenice C. Damasceno 
 
 
EMENTA: - alguns dos tópicos a serem abordados: 
Estatística Descritiva 
Probabilidade 
Variáveis Aleatórias Discretas e Contínuas 
Distribuição e Parâmetros de Variável Aleatória 
Distribuições Discretas e Distribuições Contínuas 
Distribuições Amostrais 
Estimação por Ponto 
Estimação por Intervalo 
Inferência Estatística 
Regressão Linear

Teste o Premium para desbloquear

Aproveite todos os benefícios por 3 dias sem pagar! 😉
Já tem cadastro?