Logo Passei Direto
Buscar
left-side-bubbles-backgroundright-side-bubbles-background

Experimente o Premium!star struck emoji

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

left-side-bubbles-backgroundright-side-bubbles-background

Experimente o Premium!star struck emoji

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

left-side-bubbles-backgroundright-side-bubbles-background

Experimente o Premium!star struck emoji

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

left-side-bubbles-backgroundright-side-bubbles-background

Experimente o Premium!star struck emoji

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Prévia do material em texto

Aula 3: Estatística
MEDIDAS DE DISPERSÃO
Consideremos dois conjuntos de dados:
10 11 11 11 12 12 12 12 13 14 14
1 5 6 9 11 12 12 15 18 21 22
Esses conjuntos de dados apresentam valores iguais de média, mediana e moda e, no entanto, existem diferenças entre os dois conjuntos de dados. Isto indica que precisamos de um outro tipo de medida para distinguir os dois conjuntos de dados. Observando os dois conjuntos, podemos notar que o primeiro conjunto de dados apresenta valores concentrados em relação à média, enquanto que o segundo apresenta valores espalhados em relação à média. As medidas que tratam dessa característica são chamadas medidas de dispersão. As principais medidas de dispersão que veremos são: amplitude, intervalo interquartil, desvio médio absoluto, variância e desvio padrão.
Amplitude
Amplitude é a diferença entre o maior e o menor valores dos dados. Esta medida utiliza somente dois valores (máximo e m mínimo) para o seu cálculo, e é geralmente utilizada para pequeno conjunto de dados.
Amplitude = (máximo) – (mínimo)
O menor valor possível da amplitude é zero, quando todos os dados são iguais. Como a amplitude é calculada somente com valores extremos, ela é muito influenciada por valores discrepantes.
Ex
10 11 11 11 12 12 12 12 13 14 14 Amplitude = 14 -10 = 4
1 5 6 9 11 12 12 15 18 21 22 Amplitude = 22 – 1 = 21
Considerando-se os valores das amplitudes, podemos concluir que o segundo conjunto de dados é mais disperso que o primeiro.
Intervalo Interquartil
O intervalo interquartil é a diferença entre o terceiro e o primeiro quartis e, portanto, considera 50% dos dados e não é influenciado pelos valores discrepantes, uma vez que os valores discrepantes estão nos 25% das caudas da distribuição.
Intervalo Interquartil = Q3 (terceiro quartil) – Q1 (primeiro quartil)
Ex
Consideremos os seguintes dados:
10 11 11 11 12 12 12 12 13 14 14
Intervalo Interquartil = Q3 - Q1 = 13 -11 = 2
Desvio médio absoluto
Chamamos de desvio a diferença entre um valor e a média dos dados, ou seja:
desvio = xi - 
Uma vez que estamos interessados em analisar todos os dados, devemos calcular a média dos desvios. O problema surge quando somamos todos os desvios, pois a soma será sempre zero.
Como estamos interessados na distância de um valor em relação a média , devemos considerar o módulo (valor absoluto) dos desvios, evitando, deste modo, valores negativos de alguns desvios. Portanto o desvio médio absoluto será dado por:
Ex:
Consideremos os seguintes dados:
10 11 11 12 12 13 13 14
A média dos dados é: 
O desvio médio absoluto é:
VARIÂNCIA E DESVIO PADRÃO
Um dos problemas em se trabalhar com o desvio médio absoluto é a dificuldade matemática que o módulo apresenta. Uma outra forma de contornar o problema apresentado pelos valores negativos dos desvios é elevar cada desvio ao quadrado. A média dos quadrados dos desvios é chamada variância.
Variância
Podemos definir duas variâncias: Variância populacional 
 (leia-se sigma ao quadrado) e variância amostral (s2)
A variância populacional é dada por: 
,
onde: N é o número de dados da população e μ (mi) é a média populacional 
A variância amostral é dada por:
,
onde: n é o número de dados da amostra e 
 é a média amostral.
Ex:
Consideremos os seguintes dados amostrais: 10 15 11 13 12
Cálculo da média: 
Cálculo da variância amostral:
 
Desvio Padrão
Os dados geralmente têm unidades de cedidas como metro, quilograma, segundo, etc. Ao elevar os desvios ao quadrado, estas unidades também serão elevadas ao quadrado, dificultando a comparação do valor da variância com os dados. Para resolver este problema, podemos extrair a raiz quadrada positiva da variância, que é chamada desvio padrão.
O desvio padrão populacional 
 é a raiz quadrada positiva da variância populacional, ou seja:
 ou 
O desvio padrão amostral (s) é a raiz quadrada positiva da variância
 ou 
_1251740663.unknown
_1251741315.unknown
_1251742918.unknown
_1251743024.unknown
_1251743194.unknown
_1251743274.unknown
_1251742993.unknown
_1251742391.unknown
_1251742474.unknown
_1251742177.unknown
_1251741050.unknown
_1251741164.unknown
_1251740761.unknown
_1251660883.unknown
_1251740593.unknown
_1251660553.unknown