Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
Curso: Bacharelado em Estatística
Turma: Estatística Básica –(1° período)
Período: 2013/01 Data: 02/09/2013
Professora: Vania C. Mota, Msc.
Aluno (a):
7.4 SEPARATRIZES
As separatrizes, como o próprio nome sugere, separam a série estatística em
grupos que apresentam o mesmo número valores observados.
As principais separatrizes são, a mediana, os quartis, os decis e os percentis.
7.4.1 Quartis
Denominamos quartis os valores que dividem uma série em quatro partes
iguais.
Portanto há 3 quartis em uma série, que são chamados primeiro quartil
(Q1), segundo quartil (Q2) e terceiro (Q3).
Obs: O segundo quartil (Q2) - coincide com a mediana (Q2=Md).
Quando os dados são agrupados, usamos a mesma técnica do cálculo da
mediana, bastando substituir na formula da mediana
por:
sendo k o número de ordem do quartil. (k= 1, 2, 3)
Assim temos:
,
onde:
FUNDAÇÃO UNIVERSIDADE FEDERAL DE RONDÔNIA
CAMPUS de JI - PARANÁ - RO
é o limite inferior da classe quartilica;
é a frequência acumulada da classe anterior à classe
quartilica;
é a frequência absoluta da classe quartilica;
é a amplitude da classe quartilica.
,
Exemplo 1) Tabela 7. 4.1
Estaturas fi
150 154 4 4
154 158 9 13
158 162 11 24
162 166 8 32
166 170 5 37
170 174 3 40
Total 40
Resp:
Q1= 156,7
Q2=Md= 160,54
Q3=165
Exemplo 2:
A partir dos dados abaixo determine os quartis.
2; 3; 3; 3; 5; 5 ; 6; 7; 8; 9; 10
Resp:
Q1= 3
Q2=Md= 5
Q3=8
(Obs: dividiu a série 4 partes iguais )
7.4.2 Decis
Denominamos decis os valores que dividem uma série em dez partes iguais.
Logo há 9 decis em uma série estatística, que são chamados
primeiro decil (D1) segundo decil (D2) até o nono decil (D9).
Podemos determinar os decis pela seguinte relação:
, k= 1, 2, 3, … 9,
onde:
é o limite inferior da classe decíclica;
é a frequência acumulada da classe anterior à classe
decíclica;
é a frequência absoluta da classe decíclica;
é a amplitude da classe decíclica.
Exemplo 3)
Calcule o D5 para os dados da Tabela 7. 4.1.
Resp: D5=Q2=Md
7.4.3 Percentis
Denomina-se percentis os valores que dividem uma série em cem partes
iguais.
Portando há 99 percentis em uma série, que são chamados de primeiro percentil
(P1), segundo (P2), até o nonagésimo nono percentil (P99).
Podemos determinar os percentis pela seguinte relação:
, k= 1, 2, 3, … 99,
onde:
é o limite inferior da classe percentílica;
é a frequência acumulada da classe anterior à classe
percentílica;
é a frequência absoluta da classe percentílica;
é a amplitude da classe percentílica.
Exemplo 4)
Calcule o P50 para os dados da Tabela 7. 4.1.
Resp: P50=D5=Q2=Md
Obs:
Q1=P25 D1=P10
Q2=P50 D2=P20
Q3=P75 D3=P30
D4=P40
D5=P50
MEDIANA = : P50=D5=Q2 D6=P60
D7=P70
D8=P80
D9=P90
D10=P100
OUTRAS ESTATÍSTICAS SÃO DEFINIDAS USANDO-SE QUARTIS
PERCENTIS, COMO AS SEGUINTES:
Intervalo interquartílico (ou IIR) = Q3 – Q1.
Intervalo semi-interquartílico (ou IIR) = (Q3 – Q1)/2.
Ponto médio dos quartis= (Q3 + Q1)/2.
Intervalo percentílico 10___90 = P90 – P10.
Exercícios
8) Calcule o primeiro e terceiro quartil das distribuições do exercício 5.
9) Calcule o 10º, o 1º, o 23º, o 15º e o 90º percentil da distribuição “b” do exercício 5.
6.5 – MEDIDAS DE DISPERSÃO
São estatísticas utilizadas para caracterizar a variabilidade de um
conjunto de observações. Geralmente só a medida de posição não nos
fornece uma boa caracterização da variável.
Veja o exemplo:
A={10; 10; 10; 10; 10; 10; 10}
B={1; 8; 10; 10; 11; 12; 18}
C= {1; 2; 10; 10; 10; 13; 24}
A B C
Média=10 Média=10 Média=10
Mediana=10 Mediana=10 Mediana=10
Moda=10 Moda=10 Moda=10
As principais medidas de dispersão são:
Amplitude Total (A), Variância e o desvio padrão, coeficiente de variação
e erro padrão da média.
6.5 .1 Amplitude Total (A)
A= MVO – mvo,
Onde:
MVO é o maior valor observado e mvo é o menor valor observado.
Exemplo 6)
Encontre a amplitude total do conjunto A={ 2, 4, 5, 7, 8, 11, 13}
A= 13 – 2
A= 11
Problemas relacionados a essa medida:
a) Não considera todas as observações no cálculo;
b) Não se tem ideia do comportamento dos dados entre os extremos.
Veja os seguinte exemplos:
B={ 0; 2; 4; 6; 8; 8; 10} A= 10 – 0 = 10
C={ 0; 1; 2; 3; 4; 5; 6; 7; 8; 9; 10} B= 10 – 0 = 10
D={ 0; 3; 3; 3; 4; 4; 5; 5; 8; 8; 8; 10} D= 10 – 0 = 10
CARACRTERISTICAS DESEJADAS DE UMA MEDIDA DE
DISPERSÃO:
a) Utilizar todas as observações no cálculo;
b) Ser facilmente calculável e compreensível;
c) Adaptar – se bem ao comportamento algébrico;
d) Estar exposta a menos possível às flutuações das amostras.
6.5. 2 - Variância (S2) e desvio padrão (S)
Estas duas estatísticas apresentam as características anteriormente
citadas.
Obs: Variância populacional =
Variância Amostral = S2
a) Variância Amostral S2
(Mostre algebricamente)
Portanto:
b) Desvio padrão
É simplesmente a raiz quadrada positiva da variância.
Assim se a variância é 81 o desvio padrão é 9.
Portanto a formula do desvio padrão é dado por:
.
Unidades: O desvio Padrão tem a mesma unidade da variável e a
variância terá a unidade dos dados ao quadrado.
Exemplo 1:
Calcule a variância e o desvio padrão da amostra 2, 4, 6, 8, 10.
Resp: S2 = 10 e S = 3,16
Exemplo 2:
Os dados abaixo referem-se à produção, em toneladas, de uma
industria.
50 280 560 170 180 500 250
200 1050 240 180 1000 1100 120
420 510 480 90 870 360
a) Calcule a produção média da indústria.
b) Calcule a variância e o desvio padrão.
c) Interprete os resultados.
Resp: Ma = 430,5 ton; S2 = 109478,7 e S= 330, 9 ton.
Espera-se que a média da indústria seja de 430,5 ton, com
dispersão em torno de 330, 876 ton.
c) Variânicia para dados agrupados.
=
onde xi é o ponto médio da classe e, é a frequência da classe i.
Exemplo:
Dada a distribuição de frequência dos pesos de pessoas em uma
certa faixa ataria, calcular a média, a variância e o desvio padrão de
peso.
Classes
40 45 3 42,5 127,5 1806,25 5418,75
45 50 8 47,5 380,0 2256,25 18050,00
50 55 16 52,5 840,0 2756,25 44100,00
55 60 12 57,7 690,0 3306,25 27343,75
60 65 7 62,5 437,5 3906,25 27343,75
65 70 3 67,5 202,5 4556,25 13668,75
70 75 1 72,5 72,5 5256,25 5256,25
Total 50 2750,00 153512,50
Resp:
Ma = 55kg.
46,2 e o S= 6,8.
d) Propriedades e características do desvio padrão e da variância
a) O desvio padrão é um valor mínimo de erro, pois, os
desvios são obtidos em relação a média.
b) Se somarmos ou subtrairmos uma constante k a cada valor observado, o desvio padrão e a variância
não se alteram.
Ex: 1 , 2 , 3, 4, 5 = =3 somando k=2
3, 4, 5, 6, 7 =
c) Se multiplicamos ou dividimos cada observação de um conjunto de dados por uma constante k, a
variância ficará multiplicada ou dividida por k
2
e o desvio por k.
Ex: 1, 3, 5
S
2
= 4 e S = 2.
Vamos multiplicar cada valor por 3 (k=3), temos então: 3, 9, 15
S
2
= 36 (4 x 3
2
) e S= 6 (3x 2).
d) S2 e S são estatísticas pouco influenciadas por variações de amostras.
e) Valores extremos exercem maior influência em S2 e S que os valores centrais (próximo à média).
f) S2 e S são sempre positivos.
g) São estatísticas que apresentam todos os valores observados no cálculo.
h) Exerce papel importante na distribuição de probabilidade normal e nas inferências estatísticas.
i) S2(k)=0 sendo k uma constante.
j) S2(x )= S2(x) S2( ) se e somente se x e forem variáveis independentes.
6.5. 3 – Coeficiente de Variação (CV)
Mede a variação relativa de um conjunto de dados.
È utilizado para comparar a variabilidade entre amostras ou variáveis.
Exemplo:
Uma pesquisa sobre temperatura (ºC) e pressão (ATM) em uma
caldeira industrial mostrou os seguintes resultados:
T (ºC) 400 450 350 500 600 550
P (ATM) 40 52 37 67 70 72
a) Calcular a média e o desvio padrão para cada variável.
b) Que atributo apresenta maior variabilidade.
Resp:
T (ºC) P (ATM)
Ma= 475,0 Ma=56,3
S= 93,5 ºC S=15,5 atm
CV= 19,7% CV=27,5%
6.5. 4 – Erro padrão da média (ou desvio padrão da média)
È uma estatística que mostra a precisão com que a média amostral
foi calculada.
Exemplo:
O ph de um certo produto é apresentado abaixo:
5,1 5,3 5,2 5,5 4,9
6,2 6,0 5,8 5,3 5,0
5,1 5,4 5,1 6,1 5,6
5,4 5,8 5,7 5,1 5,1
a) Calcule o erro padrão da média usando as duas primeiras linhas
de dados.
b) Usando todos os dados.
Resp:
8 MOMENTOS ESTÁTISTICOS
È utilizado para a caracterização de determinadas medidas, tais
como a média e a variância, fornecendo ainda outros critérios para a
determinação de medidas importantes, como a assimetria e a curtose.
8.1 Momento de Ordem r (Mr)
Se tivermos um conjunto de números, X = {X1, X2 X3 ,..., Xn},
Podemos definir uma quantidade numérica.
Duas primeiras linhas Todos os dados
Ma= 5,43 Ma= 5,44
S= 0,44 S= 0,39
= 0,14 = 0,09
Ou
(Obs: O M1 = Média)
Exemplo:
Seja o conjunto X= {1, 3, 5, 7, 9} aplique o 1º o 2º e o 3º momento.
Resp:
M1= 5; M2= 33 e M3= 245.
8.2 Momento de Ordem r centrado numa origem qualquer (
)
Se tivermos um conjunto de números, X = {X1, X2 X3 ,..., Xn},
e uma origem centrada em uma constante “a” podemos definir uma
quantidade numérica:
ou
Exemplo:
Seja o conjunto X= {1, 3, 5, 7, 9} e a=1 determine o 1º e o 2º momento.
Resp:
= 4;
= 24 .
8.3 Momento de Ordem r centrado na média
Se tivermos um conjunto de números, X = {X1, X2 X3 ,..., Xn},
com a origem centrada na média ( , podemos definir uma quantidade
numérica:
ou
Obs:
a) Se r = 1 e a = →
b) Se r = 2 e a = →
Exemplo:
Seja o conjunto X= {1, 3, 5, 7, 9} e a= determine e r = 1 e r = 2.
Resp:
= 4; = 8.
9 ASSIMETRIA
É e o desvio ou afastamento da simetria de uma curva de
frequência de uma distribuição estatística. Assim, podemos caracterizar
as distribuições de frequências em assimétrica à direita, assimétrica à
esquerda e simétrica.
Diremos que uma distribuição é simétrica quando X = Md = Mo.
Se uma distribuição não for simétrica, será classificada como
assimétrica.
Existem duas alternativas para uma distribuição assimétrica:
(a) (b)
No caso (a): A distribuição é classificada de assimétrica positiva.
No caso (b): A distribuição é classificada de assimétrica negativa.
9.1 Medidas de Assimetria
Coeficiente de Assimetria de Pearson.
O momento de terceira ordem centrado em relação a média pode
ser usado como medida de assimetria.
Entretanto, é mais conveniente a utilização de uma média, o que
leva a definição do coeficiente de assimetria
=
.
10 CURTOSE
È o grau de achatamento de uma distribuição em relação à
disribuição Normal. Assim podemos classificar a Curtose em:
Leptocúrtica, Mesocúrtica e platicúrtica.
mais afilada (Leptocúrtica)
Padrão – Similar à Normal (Mesocúrtica)
mais achatada (Platicúrtica)
10.1 Medidas de Curtose
a) Coeficiente de Momento de Curtose (C).
É uma medida que utiliza a “técnica” de momentos, baseando-se
no cálculo do quarto momento centrado na média (m4).
Quando çã
O cálculo então é determinado por , assim:
Se é positivo Leptocúrtica.
Se é negativo Platicúrtica.
Se = nulo Mesocúrtica (Normal).
Exemplo:
Ao se obter o coeficiente de curtose
, encontrou-se o valor 2,7.
Resp: Como 2,7 – 3,0 = Negativo Platicúrtica.
Se o C=3,5;
3,5 – 3,0 = positivo Leptocúrtica.
Se o C = 3,0;
3,0 – 3,0 = nulo Mesocúrtica (Normal).
b) Coeficiente Percentílico de Curtose (K).
É uma medida que utiliza os quartis e percentis:
O valor normal de K = 0,263, assim podemos ter:
Exemplo:
Dada uma distribuição com os seguintes dados Q1=156,67, Q3=165,
P10=154 e P90=169,2 classifique segundo o grau de achatamento.
Resp: Substituindo os valores na formula temos: K = 0,274
Como a distribuição e
Exercícios
10) Duas equipes de medição foram analisadas em termos do número de parcelas medidas por dia:
Equipe A: {24, 26, 26, 10, 15, 12, 13, 24, 18, 12}
Equipe B: {19, 16, 16, 18, 18, 19, 20, 17, 17, 15}
Encontre: média, mediana, variância, desvio padrão e coeficiente de variação. Com base nestes resultados,
responda: Qual a equipe é mais produtiva? Qual equipe é mais consistente?
As questões 11, 12, 13 e 14 dizem respeito a distribuição de frequências seguinte associada ao atributo de
interesse X. Não existem observações coincidentes com os extremos das classes.
Classes Frequências simples
0 10 120
10 20 90
20 30 70
30 40 40
40 50 20
11) Assinale a opção que dá, aproximadamente, a média amostral de X .
A) 25 B) 17,48 C) 18 D) 17,65 E) 19
12) (1,00) Assinale a opção que dá a moda no conceito de Czuber.
A) 5 B) 4 C) 8 D) 10 E)15
13) Assinale a opção que dá o valor aproximado da mediana amostral das observações de X .
A) 20 B) 5 C) 12 D) 15,8 E) 15,6
14) Assinale a opção que dá o coeficiente de
Assimetria e o de Curtose respectivamente:
a) Simétrica a direita e Platicúrtica
b) Assimétrica à esquerda e Platicúrtica
c) Assimétrica à direita e Leptocúrtica
d) Assimétrica à direita e Platicúrtica
e) Assimétrica à esquerda e Mesocúrtica
15) Os dados abaixo referem-se à produção, em toneladas, de uma indústria.
50 280 560 170 180 500 250
200 1050 240 180 1000 1100 120
420 510 480 90 870 360
a) Calcular a produção média da industria.
b) Calcular a variância e o desvio padrão.
c) Interprete os resultados.
16) Classifique, quanto à assimetria, a distribuição abaixo, segundo o coeficiente de Pearson. (Amostra).
Classe Int. cl. fi
1 0 ← 4 10
2 4 ← 8 15
3 8 ← 12 6
4 12 ← 16 2
5 16 ← 20 1
17) Classifique, quanto à assimetria, a distribuição abaixo, segundo o coeficiente de Pearson. (Amostra).
Classe Int. cl. fi
1 3 ← 5 14
2 5 ← 7 16
3 7 ← 9 18
4 9 ← 11 19
5 11 ← 13 17
18) Calcule a variância e o desvio padrão da população:
Idade (anos)
xi
Número de alunos
fi
17 3
18 18
19 17
20 8
21 4
19) Calcule a variância e o desvio padrão para o número de acidentes diários, observados em um
cruzamento, durante 40 dias. (Amostra)
Número de
acidentes por dia
xi
Número
de dias
fi
0 30
1 5
2 3
3 1
4 1
20) Calcule a variância e o desvio padrão para a distribuição de valores de 54 notas fiscais emitidas na
mesma data, selecionadas em uma loja de departamentos. (Amostra)
Classe Consumo por nota R$ Número de notas
1 0,00 ← 50,00 10
2 50,00 ← 100,00 28
3 100,00 ← 150,00 12
4 150,00 ← 200,00 2
5 200,00 ← 250,00 1
6 250,00 ← 300,00 1
21) A distribuição de frequência abaixo representa o consumo por nota de 54 notas fiscais emitidas
durante um dia em uma loja de departamentos:
Classe Consumo por nota R$ Número de notas
1 0,00 ← 50,00 10
2 50,00 ← 100,00 28
3 100,00 ← 150,00 12
4 150,00 ← 200,00 2
5 200,00 ← 250,00 1
6 250,00 ← 300,00 1
Calcule:
a) Q1 b) K2 c) D3 d) Q3 e) D7 f) P98