Prévia do material em texto
Aula 3: Estatística MEDIDAS DE DISPERSÃO Consideremos dois conjuntos de dados: 10 11 11 11 12 12 12 12 13 14 14 1 5 6 9 11 12 12 15 18 21 22 Esses conjuntos de dados apresentam valores iguais de média, mediana e moda e, no entanto, existem diferenças entre os dois conjuntos de dados. Isto indica que precisamos de um outro tipo de medida para distinguir os dois conjuntos de dados. Observando os dois conjuntos, podemos notar que o primeiro conjunto de dados apresenta valores concentrados em relação à média, enquanto que o segundo apresenta valores espalhados em relação à média. As medidas que tratam dessa característica são chamadas medidas de dispersão. As principais medidas de dispersão que veremos são: amplitude, intervalo interquartil, desvio médio absoluto, variância e desvio padrão. Amplitude Amplitude é a diferença entre o maior e o menor valores dos dados. Esta medida utiliza somente dois valores (máximo e m mínimo) para o seu cálculo, e é geralmente utilizada para pequeno conjunto de dados. Amplitude = (máximo) – (mínimo) O menor valor possível da amplitude é zero, quando todos os dados são iguais. Como a amplitude é calculada somente com valores extremos, ela é muito influenciada por valores discrepantes. Ex 10 11 11 11 12 12 12 12 13 14 14 Amplitude = 14 -10 = 4 1 5 6 9 11 12 12 15 18 21 22 Amplitude = 22 – 1 = 21 Considerando-se os valores das amplitudes, podemos concluir que o segundo conjunto de dados é mais disperso que o primeiro. Intervalo Interquartil O intervalo interquartil é a diferença entre o terceiro e o primeiro quartis e, portanto, considera 50% dos dados e não é influenciado pelos valores discrepantes, uma vez que os valores discrepantes estão nos 25% das caudas da distribuição. Intervalo Interquartil = Q3 (terceiro quartil) – Q1 (primeiro quartil) Ex Consideremos os seguintes dados: 10 11 11 11 12 12 12 12 13 14 14 Intervalo Interquartil = Q3 - Q1 = 13 -11 = 2 Desvio médio absoluto Chamamos de desvio a diferença entre um valor e a média dos dados, ou seja: desvio = xi - Uma vez que estamos interessados em analisar todos os dados, devemos calcular a média dos desvios. O problema surge quando somamos todos os desvios, pois a soma será sempre zero. Como estamos interessados na distância de um valor em relação a média , devemos considerar o módulo (valor absoluto) dos desvios, evitando, deste modo, valores negativos de alguns desvios. Portanto o desvio médio absoluto será dado por: Ex: Consideremos os seguintes dados: 10 11 11 12 12 13 13 14 A média dos dados é: O desvio médio absoluto é: VARIÂNCIA E DESVIO PADRÃO Um dos problemas em se trabalhar com o desvio médio absoluto é a dificuldade matemática que o módulo apresenta. Uma outra forma de contornar o problema apresentado pelos valores negativos dos desvios é elevar cada desvio ao quadrado. A média dos quadrados dos desvios é chamada variância. Variância Podemos definir duas variâncias: Variância populacional (leia-se sigma ao quadrado) e variância amostral (s2) A variância populacional é dada por: , onde: N é o número de dados da população e μ (mi) é a média populacional A variância amostral é dada por: , onde: n é o número de dados da amostra e é a média amostral. Ex: Consideremos os seguintes dados amostrais: 10 15 11 13 12 Cálculo da média: Cálculo da variância amostral: Desvio Padrão Os dados geralmente têm unidades de cedidas como metro, quilograma, segundo, etc. Ao elevar os desvios ao quadrado, estas unidades também serão elevadas ao quadrado, dificultando a comparação do valor da variância com os dados. Para resolver este problema, podemos extrair a raiz quadrada positiva da variância, que é chamada desvio padrão. O desvio padrão populacional é a raiz quadrada positiva da variância populacional, ou seja: ou O desvio padrão amostral (s) é a raiz quadrada positiva da variância ou _1251740663.unknown _1251741315.unknown _1251742918.unknown _1251743024.unknown _1251743194.unknown _1251743274.unknown _1251742993.unknown _1251742391.unknown _1251742474.unknown _1251742177.unknown _1251741050.unknown _1251741164.unknown _1251740761.unknown _1251660883.unknown _1251740593.unknown _1251660553.unknown