Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
04/05/2012 1 UNIDADE II – ESTATÍSTICA DESCRITIVA PROF.: RÔMULO MÔRA CUIABÁ, MT 1. Introdução É a parte da estatística que possui a finalidade da organização, apresentação e descrição dos dados coletados, que podem ser de natureza discreta ou contínua, sem fazer nenhuma inferência sobre a população. 2. Resumo da Estatística Descritiva 1. Definição do Problema 2. Planejamento 3. Coleta de dados 4. Crítica dos dados 5. Apresentação dos dados Série Estatística 6. Descrição dos dados 3. Conceitos de Estatística Descritiva 1. Dados Brutos Dados coletados que não foram numericamente ordenados. 2. Rol Ordenação dos dados de forma crescente ou decrescente. 3. Amplitude total (AT) È a diferença entre o maior e o menor valor do rol. 4. Frequência absoluta (fi) É o número de vezes que um valor xi foi observado. 5. Intervalo de Classe É cada um dos intervalos disjuntos em que subdivide-se o intervalo total do conjunto de valores observados da variável de estudo. Muitas vezes definidos apenas por classe. Existem quatro tipos: a) Significa um intervalo fechado à esquerda e à direita. b) significa um intervalo aberto à direita e à esquerda. c) significa um intervalo fechado à direita e aberto á esquerda d) significa um intervalo fechado à esquerda e aberto á direita. 6. Limite de classes São os extremos dos intervalos de classes Li = limite inferior Ls = limite superior 7. Amplitude de classe (hi) É a diferença entre o limite superior e inferior da classe. hi = Ls – Li 04/05/2012 2 8. Pontos Médios ou Centro de Classe (Pmi) É a média aritmética entre o limite superior e inferior de uma classe. 9. Frequência acumulada (fai) Frequência acumulada de uma classe (ou de um valor) é a soma de frequencia absoluta até essa classe. 22 h L LL Pm i si i 10. Frequência Relativa Simples (fri) É o quociente entre a frequência absoluta (fi) pelo número de observações (n) ou 11. Frequência Relativa acumulada (frai) É o quociente da frequência acumulada (fai) pelo número total de observações (n) ou n f fr ii 100% n f fr ii n fa far ii 100% n fa far ii 4. Distribuição de frequência É um arranjo dos valores observados em uma tabela com suas respectivas frequências. 1. Separação em Classes (Número de classes) - K n > 25, , se não K = 5 Fórmula de Sturges K = 1 + 3,22.log(n) 2. Amplitude de Classe (h) nK K AT h 4.1. Representação Gráfica da Distribuição de Frequência 1. Histograma 2. Polígono de Frequência 2. Polígono de Frequência Acumulada (Ogiva) 04/05/2012 3 5. Medidas de Posição ou medidas de tendência central 1. Médias 1.1 Média Aritmética n X n XXX X n i i n 121 ... n i i n i ii n nn f Xf fff XfXfXf X 1 1 21 2211 ... ... Dados não agrupados Dados agrupados 1.2 Média Aritmética Ponderada 1.2.1 Propriedades da Média Aritmética Propriedade 1 A soma algébrica dos desvios de um conjunto de números em relação à média aritmética é zero. n i i n i ii n nn p Xp ppp XpXpXp X 1 1 21 2211 ... ... 0)( 1 XXSD n i i Propriedade 2 Somando-se ou subtraindo-se uma constante a cada um dos valores de conjunto de números, a média fica somada ou subtraída dessa constante. Propriedade 3 Multiplicando-se ou dividindo-se cada um dos valores de conjunto de números por uma constante, a média fica multiplicada ou dividida dessa constante. KX n KX X n i i )( 1 XK n KX X n i i 1 X Kn X K X n i i 1 1 1 Propriedade 4 A soma algébrica dos quadrados dos desvios tomados em relação à média é um mínimo, isto é, 2 1 )( XX n i i mínimo 1.3 Média Geométrica Regida pela propriedade: Utilizada no cálculo das médias de razões ou grandezas inversamente proporcionais. 1 1 n i G i X X n n i i n G XXXXX 1 321 ....... n i i n i i n n i iG X n X n XX 111 log 1 log 1 loglog n X antX n i i G 1 log log Obs.: Não pode ser calculada se tiver um dado nulo ou dado negativo. 1.3 Média Harmônica Têm utilização muito rara. Utilizada quando deseja- se comparar quantidades variáveis de uma espécie com um quantidade constante da outra, quando se deseja na média o fator que é variável na razão. n i i n i i G X n n X X 11 11 1 Obs.: Não pode ser calculada se tiver um dado nulo. 04/05/2012 4 2. Moda Dados não agrupados É o valor que ocorre com maior frequência na série de dados. Serve para dados qualitativos e quantitativos. A série pode ser amodal, unimodal, bimodal ou multimodal. Dados agrupados O primeiro passo é localizar a classe que apresenta maior frequência, denominada classe modal. em que: Δ1= diferença entre a frequência da classe modal e da classe anterior Δ2= diferença entre a frequência da classe modal e da classe posterior h = amplitude de classe li= limite inferior da classe modal. 21 1 hlMo i 3. Separatrizes Dividem o conjunto de dados em k partes iguais. 3.1 Mediana É o valor abaixo ou acima do qual tem-se 50 % dos dados da série estatística. Dados não agrupados - Determinar a posição do elemento mediano. - verificar no rol qual o elemento mediano. 2 1 nXMd 2 1 22 nn XX Md se n é ímpar se n é par Dados agrupados O primeiro passo é localizar a classe que apresenta o elemento correspondente a mediana. em que: P = posição do elemento mediano: n/2.. Determinar o elemento que ocupa essa posição fi = frequência da classe da mediana fai-1 = frequência acumulada da classe anterior à classe mediana h = amplitude de classe li= limite inferior da classe da mediana h f faP lMd i i i 1 3.2 Quartis Divide a distribuição em 4 partes iguais. em que: P = posição do elemento mediano: n/2.. Determinar o elemento que ocupa essa posição fi = frequência da classe da mediana fai-1 = frequência acumulada da classe anterior à classe mediana h = amplitude de classe li= limite inferior da classe da mediana h f faP lQ i i ii 14 .ni Qi i Corresponde ao valor P 3.3 Decis Divide a distribuição em 10 partes iguais. em que: P = posição do elemento mediano: n/2.. Determinar o elemento que ocupa essa posição fi = frequência da classe da mediana fai-1 = frequência acumulada da classe anterior à classe mediana h = amplitude de classe li= limite inferior da classe da mediana h f faP lD i i ii 110 .ni Di i Corresponde ao valor P 04/05/2012 5 3.4 Percentis Divide a distribuição em 100 partes iguais. em que: P = posição do elemento mediano: n/2.. Determinar o elemento que ocupa essa posição fi = frequência da classe da mediana fai-1 = frequência acumulada da classe anterior à classe mediana h = amplitude de classe li= limite inferior da classe da mediana h f faP lP i i ii 1100 .ni Pi i Corresponde ao valor P 6. Medidas de Dispersão ou Medidas de Variabilidade 1. Variância Amostral 1 )( 1 1 2 2 n XX n SQD s n i i Dados não agrupados 1 1 2 12 2 n n X X s n i n i i i 2. Desvio padrão Dados agrupados 1 1 1 1 2 12 2 n i i n i n i i n i ii ii f f Xf Xf s 2ss 3. Coeficiente de Variação X S CV x 100(%) X S CV x > CV – mais heterogêneo < CV – mais homogêneo 4. Erro padrão da Média n S Xs x)( Indica a precisão com que foi estimada a média da amostra. Quanto menor for o erro padrão da média, melhor será a estimativa da média da amostra. 7. MEDIDAS DE ASSIMETRIA E CURTOSE Medidas utilizadas para descrever se uma população da qual a amostra foi coletada pode ser descrita por uma curva normal. 04/05/2012 6 7.1. Medidas de Assimetria 7.1.1 Coeficiente de Assimetria 3 3 22 3 s m ss m As n XX m n i i 1 3 3 )( ou s MoX As )( As positivo (As > 0) = indica uma assimetria à direita; As negativo (As < 0) = indica uma assimetria à esquerda. As igual a zero (As = 0) = indica uma simetria 7.2. Medidas de Curtose 7.2.1 Coeficiente de Curtose 4 4 22 4 s m ss m K n XX m n i i 1 4 4 )( K > 3 = indica uma distribuição afiada chamada leptocúrtica; K < 3 = indica uma distribuição achatada chamada platicúrtica; K = 3 = indica uma distribuição semelhante a normal chamada mesocúrtica. 7.2.2 Coeficiente de Curtose 1090 13 2 PP QQ K K > 0,263 = indica uma distribuição afiada chamada leptocúrtica; K < 0,263 = indica uma distribuição achatada chamada platicúrtica; K = 0,263 = indica uma distribuição semelhante a normal chamada mesocúrtica. 04/05/2012 7 EXERCÍCIO DE APLICAÇÃO 1 Considere o seguinte conjunto de dados: 9; 3; 8; 8; 9; 8; 9; 1; 8. Calcular a) Média; b) Moda; c) Mediana; d) Variância; e) Desvio-padrão; f) Erro padrão da média; g) Coeficiente de Variação h) Coeficiente de Assimetria. i) Coeficiente de Curtose. EXERCÍCIO DE APLICAÇÃO 2 Considere o seguinte tabela de frequência: Calcular a) Média; b) Moda; c) Mediana; d) Q1 e) D2 f) P55 g) Variância; h) Desvio-padrão; i) Erro padrão da média; j) Coeficiente de Variação k) Coeficiente de Assimetria. l) Coeficiente de Curtose. m) Desenhar o Histograma, o polígono de frequência e a ogiva 8. COEFICIENTE DE CORRELAÇÃO LINEAR 1. Coeficiente de correlação amostral YX XY Y Y X X XY xy SQDSQD SP n SQD n SQD n SP YVXV YXCOV r . 1 . 1 1 )()( ),( ^^ ^ 11 xyr n YX YXSP n i i n i i i n i ixy 11 1 n X XSQD n i in i iX 2 1 1 2 n Y YSQD n i in i iY 2 1 1 2 - Coeficiente de correlação de Pearson 1 . 1 1 . ),cov( 2 1 22 1 2 1 n yny n xnx n yxnyx ss YX r n i i n i i i n i i yx xy 11 xyr 2 1 22 1 2 1 . . ),cov( ynyxnx yxnyx ss YX r n i i n i i i n i i yx xy 04/05/2012 8 O coeficiente de correlação linear é usado para expressar o grau de aproximação dos pontos do diagrama de dispersão aos de uma reta, chamada reta de regressão. Em outras palavras, diz-se que é o grau de fidelidade com que uma reta descreve a relação entre as variáveis. Esta medida tem a importante propriedade de não somente ser adimensional, como de variar entre –1 e +1. Um coeficiente de correlação próximo da unidade positiva ou negativa significa uma grande concentração de pontos em torno da reta, enquanto um coeficiente menor, próximo de zero, significa maior dispersão dos pontos com respeito a essa reta. Quando o valor da correlação for positivo indica correlação diretamente proporcional, se não a associação das variáveis é inversamente proporcional. EXERCÍCIO DE APLICAÇÃO 3 Calcular o coeficiente de correlação entre as variáveis: X = índice de preço para o consumidor e Y = índice de preço por atacado FIM Apresentação dos dados Tabelas Tabela 1 - Número de árvores mortas, com cipó e epifitas numa Floresta Nativa, por parcela, 2012 Parcela Árvores Mortas Cipós Epifitas 1 - ... 3 2 2 6 4 3 10 20 8 4 9 4 6 Fonte: coleta de dados própria Gráficos 0 5 10 15 20 25 1 2 3 4 F re q u ê n c ia Parcela Quantidade de árvores Mortas Cipós Epifitas Fonte: coleta de dados própria Exemplo1 Considere o seguinte conjunto de diâmetros à altura do peito, medidos em um parcela permanente de Eucalipto. 19 – 16 – 23 – 15 – 20 – 25 – 20 – 13 – 17 – 19 – 14 – 22 – 14 – 17 – 23 – 10 – 18 – 13 – 17 – 22 – 19 – 20 – 24 – 15 – 19 – 18 – 23 – 14 – 16 – 10 – 9 – 13 – 11 – 15 – 13 – 12 – 9 – 20 – 15 – 25 04/05/2012 9 Exemplo 2 a) Calcular a Média, Moda e Mediana para o conjunto de dados: 2 – 3 – 5 – 8 – 9 – 10 – 11 – 12 – 13 Exemplo 3 Em determinado teste de medição de altura de mudas foram obtidos os seguintes pontos: Classe Pmi fi Fai fiXi 0 <- 5 2,5 7 7 17,5 5 < - 10 7,5 9 16 67,5 10 <- 15 12,5 11 27 137,5 15 <- 20 17,5 8 35 140 20 < - 25 22,5 12 47 270 25 <- 30 27,5 3 50 82,5 Total 50 715 Calcule: a) Média b) Moda c) Mediana d) Q3 e) P35 f) D6