Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
Curso: Bacharelado em Estatística Turma: Estatística Básica –(1° período) Período: 2013/01 Data: 02/09/2013 Professora: Vania C. Mota, Msc. Aluno (a): 7.4 SEPARATRIZES As separatrizes, como o próprio nome sugere, separam a série estatística em grupos que apresentam o mesmo número valores observados. As principais separatrizes são, a mediana, os quartis, os decis e os percentis. 7.4.1 Quartis Denominamos quartis os valores que dividem uma série em quatro partes iguais. Portanto há 3 quartis em uma série, que são chamados primeiro quartil (Q1), segundo quartil (Q2) e terceiro (Q3). Obs: O segundo quartil (Q2) - coincide com a mediana (Q2=Md). Quando os dados são agrupados, usamos a mesma técnica do cálculo da mediana, bastando substituir na formula da mediana por: sendo k o número de ordem do quartil. (k= 1, 2, 3) Assim temos: , onde: FUNDAÇÃO UNIVERSIDADE FEDERAL DE RONDÔNIA CAMPUS de JI - PARANÁ - RO é o limite inferior da classe quartilica; é a frequência acumulada da classe anterior à classe quartilica; é a frequência absoluta da classe quartilica; é a amplitude da classe quartilica. , Exemplo 1) Tabela 7. 4.1 Estaturas fi 150 154 4 4 154 158 9 13 158 162 11 24 162 166 8 32 166 170 5 37 170 174 3 40 Total 40 Resp: Q1= 156,7 Q2=Md= 160,54 Q3=165 Exemplo 2: A partir dos dados abaixo determine os quartis. 2; 3; 3; 3; 5; 5 ; 6; 7; 8; 9; 10 Resp: Q1= 3 Q2=Md= 5 Q3=8 (Obs: dividiu a série 4 partes iguais ) 7.4.2 Decis Denominamos decis os valores que dividem uma série em dez partes iguais. Logo há 9 decis em uma série estatística, que são chamados primeiro decil (D1) segundo decil (D2) até o nono decil (D9). Podemos determinar os decis pela seguinte relação: , k= 1, 2, 3, … 9, onde: é o limite inferior da classe decíclica; é a frequência acumulada da classe anterior à classe decíclica; é a frequência absoluta da classe decíclica; é a amplitude da classe decíclica. Exemplo 3) Calcule o D5 para os dados da Tabela 7. 4.1. Resp: D5=Q2=Md 7.4.3 Percentis Denomina-se percentis os valores que dividem uma série em cem partes iguais. Portando há 99 percentis em uma série, que são chamados de primeiro percentil (P1), segundo (P2), até o nonagésimo nono percentil (P99). Podemos determinar os percentis pela seguinte relação: , k= 1, 2, 3, … 99, onde: é o limite inferior da classe percentílica; é a frequência acumulada da classe anterior à classe percentílica; é a frequência absoluta da classe percentílica; é a amplitude da classe percentílica. Exemplo 4) Calcule o P50 para os dados da Tabela 7. 4.1. Resp: P50=D5=Q2=Md Obs: Q1=P25 D1=P10 Q2=P50 D2=P20 Q3=P75 D3=P30 D4=P40 D5=P50 MEDIANA = : P50=D5=Q2 D6=P60 D7=P70 D8=P80 D9=P90 D10=P100 OUTRAS ESTATÍSTICAS SÃO DEFINIDAS USANDO-SE QUARTIS PERCENTIS, COMO AS SEGUINTES: Intervalo interquartílico (ou IIR) = Q3 – Q1. Intervalo semi-interquartílico (ou IIR) = (Q3 – Q1)/2. Ponto médio dos quartis= (Q3 + Q1)/2. Intervalo percentílico 10___90 = P90 – P10. Exercícios 8) Calcule o primeiro e terceiro quartil das distribuições do exercício 5. 9) Calcule o 10º, o 1º, o 23º, o 15º e o 90º percentil da distribuição “b” do exercício 5. 6.5 – MEDIDAS DE DISPERSÃO São estatísticas utilizadas para caracterizar a variabilidade de um conjunto de observações. Geralmente só a medida de posição não nos fornece uma boa caracterização da variável. Veja o exemplo: A={10; 10; 10; 10; 10; 10; 10} B={1; 8; 10; 10; 11; 12; 18} C= {1; 2; 10; 10; 10; 13; 24} A B C Média=10 Média=10 Média=10 Mediana=10 Mediana=10 Mediana=10 Moda=10 Moda=10 Moda=10 As principais medidas de dispersão são: Amplitude Total (A), Variância e o desvio padrão, coeficiente de variação e erro padrão da média. 6.5 .1 Amplitude Total (A) A= MVO – mvo, Onde: MVO é o maior valor observado e mvo é o menor valor observado. Exemplo 6) Encontre a amplitude total do conjunto A={ 2, 4, 5, 7, 8, 11, 13} A= 13 – 2 A= 11 Problemas relacionados a essa medida: a) Não considera todas as observações no cálculo; b) Não se tem ideia do comportamento dos dados entre os extremos. Veja os seguinte exemplos: B={ 0; 2; 4; 6; 8; 8; 10} A= 10 – 0 = 10 C={ 0; 1; 2; 3; 4; 5; 6; 7; 8; 9; 10} B= 10 – 0 = 10 D={ 0; 3; 3; 3; 4; 4; 5; 5; 8; 8; 8; 10} D= 10 – 0 = 10 CARACRTERISTICAS DESEJADAS DE UMA MEDIDA DE DISPERSÃO: a) Utilizar todas as observações no cálculo; b) Ser facilmente calculável e compreensível; c) Adaptar – se bem ao comportamento algébrico; d) Estar exposta a menos possível às flutuações das amostras. 6.5. 2 - Variância (S2) e desvio padrão (S) Estas duas estatísticas apresentam as características anteriormente citadas. Obs: Variância populacional = Variância Amostral = S2 a) Variância Amostral S2 (Mostre algebricamente) Portanto: b) Desvio padrão É simplesmente a raiz quadrada positiva da variância. Assim se a variância é 81 o desvio padrão é 9. Portanto a formula do desvio padrão é dado por: . Unidades: O desvio Padrão tem a mesma unidade da variável e a variância terá a unidade dos dados ao quadrado. Exemplo 1: Calcule a variância e o desvio padrão da amostra 2, 4, 6, 8, 10. Resp: S2 = 10 e S = 3,16 Exemplo 2: Os dados abaixo referem-se à produção, em toneladas, de uma industria. 50 280 560 170 180 500 250 200 1050 240 180 1000 1100 120 420 510 480 90 870 360 a) Calcule a produção média da indústria. b) Calcule a variância e o desvio padrão. c) Interprete os resultados. Resp: Ma = 430,5 ton; S2 = 109478,7 e S= 330, 9 ton. Espera-se que a média da indústria seja de 430,5 ton, com dispersão em torno de 330, 876 ton. c) Variânicia para dados agrupados. = onde xi é o ponto médio da classe e, é a frequência da classe i. Exemplo: Dada a distribuição de frequência dos pesos de pessoas em uma certa faixa ataria, calcular a média, a variância e o desvio padrão de peso. Classes 40 45 3 42,5 127,5 1806,25 5418,75 45 50 8 47,5 380,0 2256,25 18050,00 50 55 16 52,5 840,0 2756,25 44100,00 55 60 12 57,7 690,0 3306,25 27343,75 60 65 7 62,5 437,5 3906,25 27343,75 65 70 3 67,5 202,5 4556,25 13668,75 70 75 1 72,5 72,5 5256,25 5256,25 Total 50 2750,00 153512,50 Resp: Ma = 55kg. 46,2 e o S= 6,8. d) Propriedades e características do desvio padrão e da variância a) O desvio padrão é um valor mínimo de erro, pois, os desvios são obtidos em relação a média. b) Se somarmos ou subtrairmos uma constante k a cada valor observado, o desvio padrão e a variância não se alteram. Ex: 1 , 2 , 3, 4, 5 = =3 somando k=2 3, 4, 5, 6, 7 = c) Se multiplicamos ou dividimos cada observação de um conjunto de dados por uma constante k, a variância ficará multiplicada ou dividida por k 2 e o desvio por k. Ex: 1, 3, 5 S 2 = 4 e S = 2. Vamos multiplicar cada valor por 3 (k=3), temos então: 3, 9, 15 S 2 = 36 (4 x 3 2 ) e S= 6 (3x 2). d) S2 e S são estatísticas pouco influenciadas por variações de amostras. e) Valores extremos exercem maior influência em S2 e S que os valores centrais (próximo à média). f) S2 e S são sempre positivos. g) São estatísticas que apresentam todos os valores observados no cálculo. h) Exerce papel importante na distribuição de probabilidade normal e nas inferências estatísticas. i) S2(k)=0 sendo k uma constante. j) S2(x )= S2(x) S2( ) se e somente se x e forem variáveis independentes. 6.5. 3 – Coeficiente de Variação (CV) Mede a variação relativa de um conjunto de dados. È utilizado para comparar a variabilidade entre amostras ou variáveis. Exemplo: Uma pesquisa sobre temperatura (ºC) e pressão (ATM) em uma caldeira industrial mostrou os seguintes resultados: T (ºC) 400 450 350 500 600 550 P (ATM) 40 52 37 67 70 72 a) Calcular a média e o desvio padrão para cada variável. b) Que atributo apresenta maior variabilidade. Resp: T (ºC) P (ATM) Ma= 475,0 Ma=56,3 S= 93,5 ºC S=15,5 atm CV= 19,7% CV=27,5% 6.5. 4 – Erro padrão da média (ou desvio padrão da média) È uma estatística que mostra a precisão com que a média amostral foi calculada. Exemplo: O ph de um certo produto é apresentado abaixo: 5,1 5,3 5,2 5,5 4,9 6,2 6,0 5,8 5,3 5,0 5,1 5,4 5,1 6,1 5,6 5,4 5,8 5,7 5,1 5,1 a) Calcule o erro padrão da média usando as duas primeiras linhas de dados. b) Usando todos os dados. Resp: 8 MOMENTOS ESTÁTISTICOS È utilizado para a caracterização de determinadas medidas, tais como a média e a variância, fornecendo ainda outros critérios para a determinação de medidas importantes, como a assimetria e a curtose. 8.1 Momento de Ordem r (Mr) Se tivermos um conjunto de números, X = {X1, X2 X3 ,..., Xn}, Podemos definir uma quantidade numérica. Duas primeiras linhas Todos os dados Ma= 5,43 Ma= 5,44 S= 0,44 S= 0,39 = 0,14 = 0,09 Ou (Obs: O M1 = Média) Exemplo: Seja o conjunto X= {1, 3, 5, 7, 9} aplique o 1º o 2º e o 3º momento. Resp: M1= 5; M2= 33 e M3= 245. 8.2 Momento de Ordem r centrado numa origem qualquer ( ) Se tivermos um conjunto de números, X = {X1, X2 X3 ,..., Xn}, e uma origem centrada em uma constante “a” podemos definir uma quantidade numérica: ou Exemplo: Seja o conjunto X= {1, 3, 5, 7, 9} e a=1 determine o 1º e o 2º momento. Resp: = 4; = 24 . 8.3 Momento de Ordem r centrado na média Se tivermos um conjunto de números, X = {X1, X2 X3 ,..., Xn}, com a origem centrada na média ( , podemos definir uma quantidade numérica: ou Obs: a) Se r = 1 e a = → b) Se r = 2 e a = → Exemplo: Seja o conjunto X= {1, 3, 5, 7, 9} e a= determine e r = 1 e r = 2. Resp: = 4; = 8. 9 ASSIMETRIA É e o desvio ou afastamento da simetria de uma curva de frequência de uma distribuição estatística. Assim, podemos caracterizar as distribuições de frequências em assimétrica à direita, assimétrica à esquerda e simétrica. Diremos que uma distribuição é simétrica quando X = Md = Mo. Se uma distribuição não for simétrica, será classificada como assimétrica. Existem duas alternativas para uma distribuição assimétrica: (a) (b) No caso (a): A distribuição é classificada de assimétrica positiva. No caso (b): A distribuição é classificada de assimétrica negativa. 9.1 Medidas de Assimetria Coeficiente de Assimetria de Pearson. O momento de terceira ordem centrado em relação a média pode ser usado como medida de assimetria. Entretanto, é mais conveniente a utilização de uma média, o que leva a definição do coeficiente de assimetria = . 10 CURTOSE È o grau de achatamento de uma distribuição em relação à disribuição Normal. Assim podemos classificar a Curtose em: Leptocúrtica, Mesocúrtica e platicúrtica. mais afilada (Leptocúrtica) Padrão – Similar à Normal (Mesocúrtica) mais achatada (Platicúrtica) 10.1 Medidas de Curtose a) Coeficiente de Momento de Curtose (C). É uma medida que utiliza a “técnica” de momentos, baseando-se no cálculo do quarto momento centrado na média (m4). Quando çã O cálculo então é determinado por , assim: Se é positivo Leptocúrtica. Se é negativo Platicúrtica. Se = nulo Mesocúrtica (Normal). Exemplo: Ao se obter o coeficiente de curtose , encontrou-se o valor 2,7. Resp: Como 2,7 – 3,0 = Negativo Platicúrtica. Se o C=3,5; 3,5 – 3,0 = positivo Leptocúrtica. Se o C = 3,0; 3,0 – 3,0 = nulo Mesocúrtica (Normal). b) Coeficiente Percentílico de Curtose (K). É uma medida que utiliza os quartis e percentis: O valor normal de K = 0,263, assim podemos ter: Exemplo: Dada uma distribuição com os seguintes dados Q1=156,67, Q3=165, P10=154 e P90=169,2 classifique segundo o grau de achatamento. Resp: Substituindo os valores na formula temos: K = 0,274 Como a distribuição e Exercícios 10) Duas equipes de medição foram analisadas em termos do número de parcelas medidas por dia: Equipe A: {24, 26, 26, 10, 15, 12, 13, 24, 18, 12} Equipe B: {19, 16, 16, 18, 18, 19, 20, 17, 17, 15} Encontre: média, mediana, variância, desvio padrão e coeficiente de variação. Com base nestes resultados, responda: Qual a equipe é mais produtiva? Qual equipe é mais consistente? As questões 11, 12, 13 e 14 dizem respeito a distribuição de frequências seguinte associada ao atributo de interesse X. Não existem observações coincidentes com os extremos das classes. Classes Frequências simples 0 10 120 10 20 90 20 30 70 30 40 40 40 50 20 11) Assinale a opção que dá, aproximadamente, a média amostral de X . A) 25 B) 17,48 C) 18 D) 17,65 E) 19 12) (1,00) Assinale a opção que dá a moda no conceito de Czuber. A) 5 B) 4 C) 8 D) 10 E)15 13) Assinale a opção que dá o valor aproximado da mediana amostral das observações de X . A) 20 B) 5 C) 12 D) 15,8 E) 15,6 14) Assinale a opção que dá o coeficiente de Assimetria e o de Curtose respectivamente: a) Simétrica a direita e Platicúrtica b) Assimétrica à esquerda e Platicúrtica c) Assimétrica à direita e Leptocúrtica d) Assimétrica à direita e Platicúrtica e) Assimétrica à esquerda e Mesocúrtica 15) Os dados abaixo referem-se à produção, em toneladas, de uma indústria. 50 280 560 170 180 500 250 200 1050 240 180 1000 1100 120 420 510 480 90 870 360 a) Calcular a produção média da industria. b) Calcular a variância e o desvio padrão. c) Interprete os resultados. 16) Classifique, quanto à assimetria, a distribuição abaixo, segundo o coeficiente de Pearson. (Amostra). Classe Int. cl. fi 1 0 ← 4 10 2 4 ← 8 15 3 8 ← 12 6 4 12 ← 16 2 5 16 ← 20 1 17) Classifique, quanto à assimetria, a distribuição abaixo, segundo o coeficiente de Pearson. (Amostra). Classe Int. cl. fi 1 3 ← 5 14 2 5 ← 7 16 3 7 ← 9 18 4 9 ← 11 19 5 11 ← 13 17 18) Calcule a variância e o desvio padrão da população: Idade (anos) xi Número de alunos fi 17 3 18 18 19 17 20 8 21 4 19) Calcule a variância e o desvio padrão para o número de acidentes diários, observados em um cruzamento, durante 40 dias. (Amostra) Número de acidentes por dia xi Número de dias fi 0 30 1 5 2 3 3 1 4 1 20) Calcule a variância e o desvio padrão para a distribuição de valores de 54 notas fiscais emitidas na mesma data, selecionadas em uma loja de departamentos. (Amostra) Classe Consumo por nota R$ Número de notas 1 0,00 ← 50,00 10 2 50,00 ← 100,00 28 3 100,00 ← 150,00 12 4 150,00 ← 200,00 2 5 200,00 ← 250,00 1 6 250,00 ← 300,00 1 21) A distribuição de frequência abaixo representa o consumo por nota de 54 notas fiscais emitidas durante um dia em uma loja de departamentos: Classe Consumo por nota R$ Número de notas 1 0,00 ← 50,00 10 2 50,00 ← 100,00 28 3 100,00 ← 150,00 12 4 150,00 ← 200,00 2 5 200,00 ← 250,00 1 6 250,00 ← 300,00 1 Calcule: a) Q1 b) K2 c) D3 d) Q3 e) D7 f) P98