Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
ESTATÍSTICA DESCRITIVA FLÁVIO TAMBELLINI I F S P Matão - 2013 i Sumário 1 – Introdução.......................................................................................................................... 1 1.1 – Definição ......................................................................................................................... 1 1.2 – Ramos da Estatística ................................................................................................... 1 1.3 – Conceitos Básicos ....................................................................................................... 1 1.4 – Dados Estatísticos ....................................................................................................... 1 2 – Estatística Descritiva .......................................................................................................... 3 2.1 – Séries Estatísticas........................................................................................................ 3 2.2 – Gráficos ........................................................................................................................... 4 2.3 – Distribuição de Frequência........................................................................................ 6 2.3.1 – Distribuição de frequência discreta ............................................................................. 6 2.3.2 – Distribuição de frequência para dados agrupados em classe ...................................... 8 2.4 – Medidas de Tendência Central para Dados não Agrupados .......................... 12 2.5 – Medidas de Tendência Central para Dados Agrupados .................................. 15 2.6 – Medidas de Tendência Central para Dados Agrupados em Classe ............. 17 2.7 – Medidas de Dispersão ............................................................................................... 18 Exercícios de Estatística Descritiva .................................................................................... 24 ii Nomenclatura Letras latinas A = amplitude total ou amostral CV = coeficiente de variação f = frequência simples absoluta F = frequência acumulada fr = frequência simples relativa Fr = frequência relativa acumulada ou frequência acumulada relativa G = média geométrica h = amplitude da classe H = média harmônica Li = limite inferior da classe Ls = limite superior da classe Md = mediana Mo = moda n = tamanho da amostra P = peso, fator de ponderação (na fórmula de média ponderada) S2 = variância da amostra S = desvio padrão da amostra x = variável de interesse, de estudo ̅ = média aritmética, média da amostra, média ponderada ̿ = média geral Letras gregas σ2 = variância da população σ = desvio padrão da população Σ = soma de termos µ = média da população 1 1 – Introdução 1.1 – Definição É uma metodologia ou um conjunto de técnicas que utiliza a coleta de dados, sua classificação, sua apresentação ou representação, sua análise e sua interpretação visando sua utilização dentro de um processo decisório. 1.2 – Ramos da Estatística Estatística Descritiva: é a parte da Estatística que procura descrever e analisar um certo conjunto de dados, normalmente denominado amostra, procurando expressar estas informações através de representações (tabelas ou gráficos) ou através de medidas de posições. Teoria da Probabilidade: utiliza métodos e técnicas apropriadas no cálculo de probabilidade de um determinado evento ocorrer, tanto na Estatística Descritiva como na Estatística Inferencial, sendo que nesta última, existe uma incerteza inerente ao processo de generalização. Estatística Inferencial: é a parte da Estatística que tem o objetivo de tirar conclusões a respeito da população a partir de observações, análises e interpretações feitas em uma amostra. 1.3 – Conceitos Básicos População: é um conjunto de elementos que tem pelos menos uma característica em comum para um determinado estudo. Amostra: é um subconjunto da população, desde que não seja vazio e nem a própria população. Censo: é avaliação direta de um parâmetro usando-se todos os elementos da população. Amostragem: é a maneira pela qual os elementos da população serão escolhidos para compor a amostra. Estimativa: é o processo que consiste em utilizar dados amostrais para estimar parâmetros populacionais. 1.4 – Dados Estatísticos Podemos caracterizá-los quanto a sua organização ou quanto à sua espécie ou tipo característico. Quanto à sua organização podem ser classificados em: Brutos ou em Rol. Dados Brutos: são dados estatísticos que não estão numericamente organizados. Exemplo: uma relação das notas de 50 estudantes, feita em ordem alfabética (não há organização de valores em ordem crescente ou decrescente). Rol: é um conjunto de dados estatísticos organizados em ordem crescente ou decrescente. Exemplo: relação das notas em ordem decrescente (os nomes não estarão em ordem alfabética). 2 Quanto a sua espécie ou tipo característico podem ser classificados em dados discretos, contínuos, nominais e por postos. Dados Discretos: neste tipo de dados existem variáveis que assumem valores inteiros. Os dados discretos são usados para contagem. Exemplo: quantidade de erros de digitação por página; número de veículos que passam em um rodovia por dia; número de acidentes de trabalho diários, etc. Dados Contínuos: podem assumir qualquer valor dentro de um intervalo. Estes dados estão associados às variáveis contínuas que fazem parte do conjunto dos reais. Estes tipos de dados são usados para medição. Exemplo: altura, peso, comprimento, temperatura, venda, lucro, etc. Dados Nominais: surgem quando se definem categorias e não existe ordenamento entre os dados, então se conta o número de observações pertencente a cada categoria. Exemplo: as variáveis nominais que envolvem categorias, tais como: sexo (masculino ou feminino); se condução própria (sim, não); campo de estudo (medicina, direito, administração, engenharia), nacionalidade (brasileira, francesa, italiana, espanhola). Dados Por Postos: de um modo geral, são sujeitos a avaliações subjetivas quanto à preferência ou desempenho em um conjunto de observações. Neste caso existe um ordenamento entre os dados. Exemplo: competições de atletismo, (classificação em termos de quem é mais rápido); concurso de quem come mais frango; classificação de filmes (livre, impróprio para menores de 12 anos, impróprio para menores de 14 anos, impróprio para menores de 16 anos, impróprio para menores de 18 anos); Nível de estudo (sem instrução, primeiro grau, segundo grau, terceiro grau, especialização, mestrado, doutorado, pós-doutorado). 3 2 – Estatística Descritiva Esta parte da Estatística coleta os dados e os apresenta em forma de tabelas ou gráficos, podendo ser feita uma análise posterior para se tirar conclusões a respeito dos dados coletados. 2.1 – Séries Estatísticas Podemos dizer que uma série estatística é um conjunto de dados estatísticos referenciados aos seguintes fatores: tempo, local e fenômeno e eles são apresentados em forma de tabelas. Série Temporal: varia o tempo, também chamada de cronológica, histórica ou evolutiva. Investimentos Estrangeiros nas Bolsas de Valores Brasileiras Ano US$ milhões 1990 104 1991 578 1992 1.704 1993 6.591 1994 5.079 1995 4.753 1996 6.118 Fonte: Banco Central do Brasil Série Geográfica: varia o local, também chamada de territorial ou espacial. Proporção de Doadores em Relação à População Países Número de doadores por milhão de habitantes Espanha 33,7 Portugal 21,7 Estados Unidos 21,5 França 20,3 Cuba 19,9 Itália 18,0 Brasil 5,6 Fonte: Ministério da Saúde Série Específica: varia o fenômeno, também chamada de especificativa. Motivo de Acidentes nas Rodovias Motivo % Alta velocidade 39 Desrespeito à sinalização 28 Ultrapassagem proibida 19 Defeito do veículo 11 Defeito da via 2 Problema de sinalização 1 Fonte: Polícia Rodoviária de São Paulo 4 Série Conjugada: onde mais de um dos fatores citados variam (tempo, local e fenômeno). Porcentagem de Pessoas Analfabetas Região 1991 1999 Nordeste 38% 27% Norte 25% 12% Sudeste 12% 8% Sul 12% 8% Centro-Oeste 17% 11% Total 20% 13% Fonte: Instituto Nacional de Estudos e Pesquisas Educacionais/MEC 2.2 – Gráficos Os gráficos fornecem uma visão qualitativa e mais rápida dos dados coletados. Os principais gráficos são: em colunas, em barras, em setores e em curvas. Gráfico em Colunas 52 70 93 120 147 170 0 20 40 60 80 100 120 140 160 180 1950 1960 1970 1980 1991 2000 Q u an ti d ad e (m il h õ e s) Ano População Brasileira 5 Gráfico em Barras Gráfico em Setores 18% 45% 11% 7% 19% Área das Regiões Brasileiras Nordeste Norte Sudeste Sul Centro-Oeste 0 0,2 0,4 0,6 0,8 1 Brasil Cingapura Malásia Coréia do Sul China IDH de 0 a 1 Índice de Desenvolvimento Humano 2000 1975 6 Gráfico em Curvas 2.3 – Distribuição de Frequência Este é um caso especial para a representação dos dados estatísticos coletados na amostragem. Serão apresentados dois tipos de tratamento tabular, um para dados discretos e o outro para dados contínuos. 2.3.1 – Distribuição de frequência discreta Em um período de 20 dias foi feita uma amostragem em uma loja, onde foram coletados os dados sobre a quantidade de produtos vendidos diariamente. Dia 1 2 3 4 5 6 7 8 9 10 Quantidade 13 10 13 14 11 12 12 14 13 15 Dia 11 12 13 14 15 16 17 18 19 20 Quantidade 12 11 14 12 13 11 13 13 12 14 Vejamos alguns conceitos: Rol: colocar os dados em ordem crescente. Aqui estão eles: 10, 11, 11, 11, 12, 12, 12, 12, 12, 13, 13, 13, 13, 13, 13, 14, 14, 14, 14, 15. Amplitude (A): é a diferença entre o maior valor e o menor valor. A = 15 – 10 = 5 A = 5. Tamanho de amostra: n = 20. Frequência Simples Absoluta (f): é o número de vezes que a variável aparece na amostra. Exemplo: 100 120 140 160 180 200 220 1988 1990 1992 1994 1996 1998 V a lo re s e m B il h õ e s d e U S $ Ano Dívida Externa do Brasil 7 f(10) = 1 f(13) = 6 f(11) = 3 f(14) = 4 f(12) = 5 f(15) = 1 Frequência Acumulada (F): é a soma das frequências absolutas simples até a variável em questão. Exemplo: F(10) = 1 F(11) = 1 + 3 = 4 F(12) = 1 + 3 + 5 = 9 F(13) = 1 + 3 + 5 + 6 = 15 F(14) = 1 + 3 + 5+ 6 + 4 = 19 F(15) = 1 + 3 + 5 + 6 + 4 + 1 = 20 Frequência Simples Relativa (fr): é a frequência absoluta simples dividida pelo número de observações (tamanho da amostra ou tamanho da população). Exemplo: fr(10) = 1/20 = 0,05 = 5% fr(13) = 6/20 = 0,30 = 30% fr(11) = 3/20 = 0,15 = 15% fr(14) = 4/20 = 0,20 = 20% fr(12) = 5/20 = 0,25 = 25% fr(15) = 1/20 = 0,05 = 5% Frequência Relativa Acumulada ou Frequência Acumulada Relativa (Fr): frequência relativa acumulada é a soma das frequências relativas ou frequência acumulada relativa é a frequência acumulada dividida pelo número de observações (tamanho da amostra ou tamanho da população). Exemplo: Fr(10) = 1/20 = 0,05 = 5% Fr(13) = 15/20 = 0,75 = 75% Fr(11) = 4/20 = 0,20 = 20% Fr(14) = 19/20 = 0,95 = 95% Fr(12) = 10/20 = 0,50 = 50% Fr(15) = 20/20 = 1,00 = 100% A frequência relativa também fornece a porcentagem, por exemplo, fr(11) = 3/20 = 0,15 = 15%. Isto quer dizer que dos 20 dias, 15% deles, ou seja, 3 dias, 11 produtos foram vendidos diariamente. A frequência relativa acumulada fornece a porcentagem acumulada até aquela quantidade. Por exemplo, Fr(11) = 4/20 = 0,20 = 20%. Isto quer dizer que 20% dos dias (4 dias) foram vendidos até 11 produtos por dia. Tabela de Distribuição de Frequência x f F fr = f/n Fr 10 1 1 1/20 = 0,05 = 5% 0,05 = 5% 11 3 4 3/20 = 0,15 = 15% 0,20 = 20% 12 5 9 5/20 = 0,25 = 25% 0,45 = 45% 13 6 15 6/20 = 0,30 = 30% 0,75 = 75% 14 4 19 4/20 = 0,20 = 20% 0,95 = 95% 15 1 20 1/20 = 0,05 = 5% 1,00 = 100% 20 1 8 Gráfico da Frequência Simples Absoluta Gráfico da Frequência Acumulada 2.3.2 – Distribuição de frequência para dados agrupados em classe Foi feita uma pesquisa com um grupo de 40 pessoas, medindo-se as alturas destas pessoas, em centímetros, sendo que os dados já estão em ordem crescente. 160 161 163 164 165 166 167 167 168 169 169 170 170 171 172 172 172 173 173 174 174 175 175 176 176 177 177 178 178 181 182 183 183 184 184 185 186 187 188 189 Uma distribuição de frequência é um agrupamento de dados em classes, exibindo o número ou a porcentagem de observações em cada classe. Uma distribuição de frequência pode ser apresentada sob a forma gráfica ou tabular. Principais estágios na construção de uma distribuição de frequência para os dados contínuos: 1 3 5 6 4 1 0 1 2 3 4 5 6 7 10 11 12 13 14 15 Fr e q u ên ci a Si m p le s Quantidade de Produtos Vendidos Diariamente 1 4 9 15 19 20 0 5 10 15 20 25 10 11 12 13 14 15 Fr e q u ê n ci a A cu m u la d a Quantidade de Produtos Vendidos Diariamente 9 1 - Determinar a amplitude do conjunto de dados. 2 - Decidir quanto ao número de classes a usar. É aconselhável escolher de 5 a 15 classes. 3 - Dividir a amplitude pelo número de classes para obter a amplitude das classes. 4 - Estabelecer os limites das classes. 5 - Enquadrar os dados nas classes. Amplitude (A) A = 189 - 160 = 29. Número de classes (K) O número de classe pode ser obtido pela seguinte fórmula. √ Onde: n é o tamanho do conjunto de dados e K é número de classes. No nosso exemplo, temos: n =40, então: √ . Então usaremos 6 classes. Amplitude das classes (h): é um subintervalo da amplitude, que leva em consideração esta última e o número de classes. No nosso exemplo, a amplitude total é igual a 29 e o número de classes é igual a 6. Dividindo a amplitude total pelo número de classes, temos: A amplitude das classes poderá ser igual a 4,83. Observação 1: existem fórmulas e tabelas orientando quanto ao número de classes, mas pode ser feita a escolha de qualquer número de classes, então para este exemplo, foram escolhidas 6 classes, ou seja, K = 6. Observação 2: neste exemplo, pode-se observar que o menor valor encontrado nos dados é 160 e o maior valor é 189. Então a primeira classe deve começar com um valor inferior ou igual ao menor valor encontrado nos dados (160), por exemplo, podemos adotar o valor 160 e a última classe deve ter um valor superior ou igual ao maior valor encontrado (189), por exemplo, podemos adotar o valor 190. Os valores 160 e 190 garantem que todos os dados da amostra situar-se-ão entre esses dois valores. É melhor ter classes com números "mais redondos", ou seja, números de preferência que sejam inteiros. Isto garante que se tenha uma tabela com uma melhor apresentação dos dados. Fazendo esta mudança, então a nova amplitude das classes será: Então a nova amplitude de classe será 5 ao invés de 4,83. Classes: são subintervalos onde os dados serão enquadrados. Levando-se em conta que a amplitude da classe é 5 e que podemos começar a partir do número 160, tem-se: 10 A primeira classe vai de 160 a 165. A segunda classe vai de 165 a 170. A terceira classe vai de 170 a 175. A quarta classe vai de 175 a 180. A quinta classe vai de 180 a 185. A sexta classe vai de 185 a 190. Limite das Classes Existem algumas maneiras de expressar os limites das classes. Eis algumas: a) 165├─ 170 compreende todos os valores entre 165 e 170, exceto o 170. b) 165 ─┤170 compreende todos os valores entre 165 e 170 exceto o 165. c) 165 ├─┤170 compreende todos os valores entre 165 e 170, inclusive o 165 e o 170. d) 165 ─ 170 compreende todos os valores entre 165 e 170 exceto o 165 e o 170. Atenção: os limites são importantes somente na hora do enquadramento dos dados. Limite inferior (Li) é o menor valor da classe. Limite superior (Ls) é o maior valor da classe. Por exemplo: 160├─ 165 150 é o limite inferior e o 165 é o limite superior da primeira classe. 165├─ 170 160 é o limite inferior e o 170 é o limite superior da segunda classe. 170├─ 175 170 é o limite inferior e o 175 é o limite superior da terceira classe. 175├─ 180 175 é o limite inferior e o 180 é o limite superior da quarta classe. 180├─ 185 180 é o limite inferior e o 185 é o limite superior da quinta classe. 185├─ 190 185 é o limite inferior e o 190 é o limite superior da sexta classe. Ponto Médio da Classe (x): é a soma do limite inferior da classe com o limite superior da classe dividida por 2. Por exemplo, se a classe for 180 ├─ 185, tem-se: x = 182,5 é o ponto médio da classe que vai de 180 a 185. Distribuição de Frequência: é o arranjo dos valores e de suas respectivas frequências. Assim, a distribuição de frequências é mostrada na tabela abaixo, conforme o exemplo das alturas das pessoas. Na primeira coluna estão as classes; na segunda coluna estão as frequências absolutas; na terceira coluna estão as frequências acumuladas; na quarta coluna estão as frequências relativas; na quinta classe estão as frequências relativas acumuladas e na sexta coluna estão os pontos médios das classes. 11 Classes f F fr = f/n Fr x 160├─ 165 4 4 4/40 = 0,100 (10,0%) 0,10 = 10% 162,5 165├─ 170 7 11 7/40 = 0,175 (17,5%) 0,275 = 27,5% 167,5 170├─ 175 10 21 10/40 = 0,250 (25,0%) 0,525 = 52,5% 172,5 175├─ 180 8 29 8/40 = 0,200 (20,0%) 0,725 = 72,5% 177,5 180├─ 185 6 35 6/40 = 0,150 (15,0%) 0,875 = 87,5% 182,5 185├─ 190 5 40 5/40 = 0,125 (12,5%) 1,00 = 100% 187,5 40 1 ou 100% Representação Gráfica A representação gráfica dos dados é comumente representada pelo histograma (gráfico em colunas) e pelo polígono de frequência (gráfico em curvas) Histograma: é a representação gráfica de distribuição de frequência por meio de retângulos justapostos (gráfico em colunas). Polígono de Frequências: é a representação gráfica de uma distribuição de frequência por meio de um polígono (gráfico em curvas), que estão relacionados com os pontos médios das classes. Não existe uma norma rígida para a representação gráfica da frequência simples (absoluta ou relativa) e acumulada (absoluta ou relativa), pois tanto a aquela como esta podem ser representadas por histogramas ou polígonos de frequência. Gráfico da frequência simples absoluta A representação gráfica de distribuição de frequência absoluta para o exemplo da altura dos alunos é mostrada, conforme a figura a seguir. 12 Observação: note que no ponto médio da classe anterior à primeira classe, ou seja, o 157,5, a frequência simples vale zero e que no ponto médio da classe posterior à última classe, ou seja, o 192,5, a frequência simples vale zero. Gráfico da frequência acumulada Observação 1: note que a frequência acumulada está relacionada com o limite superior da classe, ou seja, F = 4 para Ls = 165; F = 11 para Ls = 170; F = 21 para Ls = 175; F = 29 para Ls = 180; F = 35 para Ls = 185; F = 40 para Ls = 190. Observação 2: note que a frequência acumulada vale zero para o limite inferior da primeira classe, ou seja, F = 0 para Li = 160. Porcentagem: a porcentagem é igual à frequência relativa, ou seja, fornece a idéia relativa, na base de 0 a 100%, de quantos elementos existem em relação ao total. Por exemplo, no caso da altura dos alunos, qual a porcentagem de alunos que medem entre 165 cm e 175 cm? Como existem 7 alunos que medem entre 165 cm e 170 cm e 10 alunos que medem entre 170 cm e 175 cm num total de 40 alunos, então se têm 17 alunos num total de 40, consequentemente a porcentagem de alunos que medem entre 165 cm e 175 cm é igual a: 2.4 – Medidas de Tendência Central para Dados não Agrupados O objetivo das medidas de tendência central é resumir toda a informação dos dados coletados em uma só palavra. As principais medidas de tendência central são: média, mediana e moda. Média Aritmética: é soma de um conjunto de valores dividida pela quantidade deles. ̅ ̅ ∑ 13 ∑ Onde: n é o tamanho da amostra; N é o tamanho da população; x é a média da amostra; μ é a média da população; significa soma ou somatório dos valores; Exemplo Um vendedor, durante cinco semanas consecutivas, vendeu a seguinte quantidade de produtos por semana: 15, 20, 18, 20 e 17. Determine a quantidade média de produtos vendidos semanalmente. Utilizando a fórmula de média aritmética amostral, temos: ̅ ∑ O vendedor teve uma venda média de 18 produtos por semana. Média Geométrica: é a raiz e-nésima do produto dos valores de x, ou também pode ser entendido como o produto dos valores de x, todos eles elevado a 1/n. √ Exemplo Sejam os seguintes valores: 1, 3, 9, 27, 81. Calcule a média geométrica destes valores. √ Média Harmônica: é a quantidade de valores dividida pela soma dos inversos dos valores. ∑( ⁄ ) Exemplo Sejam os seguintes valores: 1, 2, 2, 4, 8. Calcule a média aritmética destes valores. Média Ponderada Sejam as variáveis x1, x2, x3,....,xn com os seguintes pesos P1, P2, P3, ...,Pn. A média ponderada de x representada por x é dada por: ̅ ∑ ∑ Onde: n é o número de elementos do conjunto ou o tamanho da amostra; 14 P é o peso de cada variável. Exemplo Calcule a nota média final de uma estudante de uma determinada matéria para os quatro bimestres, conforme as notas e os pesos dados a seguir. Bimestre Nota Peso Primeiro 8,0 2 Segundo 9,0 2 Terceiro 7,5 3 Quarto 6,5 3 A nota média será: ̅ A nota média da estudante será 7,6. Média Geral Sejam as médias aritméticas ̅ ̅ ̅ com as seguintes quantidades . A média geral representada por ̿, é dada por: ̿ ̅ ̅ ̅ ̅ ∑ ̅ ∑ Exemplo Um grupo de funcionários constituído por 30 homens e 20 mulheres, sendo que a média salarial dos homens é de 3 salários-mínimos e a média salarial das mulheres é de 2,5 salários-mínimos. Calcule o salário médio deste grupo de funcionários. Média dos homens = 3 ( ̅ e quantidade de homens = 30 (n1 = 30). Média das mulheres = 2,5 ( ̅ e quantidade de mulheres = 20 (n2 = 20). Cálculo da média geral. ̿ ∑ ̅ ∑ ̅ ̅ O salário médio deste grupo é de 2,8 salários-mínimos. Mediana Colocados os elementos em ordem crescente, a mediana é o elemento que ocupa a posição central, ou seja, possuirá o mesmo número de elementos abaixo dela e acima dela. A mediana divide este conjunto de elementos em duas partes iguais. Para variável discreta, existem dois casos: quando o número de elementos é ímpar e quando o número de elementos é par. 15 a) ÍMPAR Quando o número de elementos do conjunto de dados é ímpar, teremos um elemento central de ordem (n+1)/2. Neste caso, o elemento de ordem (n+1)/2 será a própria mediana. Calcule a mediana da seguinte amostra: 35, 20, 40, 30, 28. Colocando a amostra em ordem crescente, temos: 20, 28, 30, 35, 40 A série de dados estatísticos possui 5 elementos, ou seja, n = 5 (ímpar), então a mediana será o elemento de ordem (n + 1)/2, que corresponde ao elemento de ordem (5 + 1)/2 3o elemento. Neste exemplo, o 3o elemento é o 30, consequentemente a mediana será igual a 30, ou seja, Md = 30. Portanto, a mediana vale 30. b) PAR Quando o número de elementos do conjunto de dados é par, teremos dois elementos centrais, um de ordem (n/2) e outro de ordem (n/2 + 1). Neste caso, a mediana será a média aritmética entre os dois elementos centrais, em que se somam os dois elementos centrais e divide-se por dois. Lembre-se: em ambos os casos, é preciso colocar os elementos em ordem crescente. Calcule a mediana da seguinte amostra: 140, 115, 100, 155, 135, 125, 122, 147. Colocando a amostra em ordem crescente, temos: 100, 115, 122, 125, 135, 140, 147, 155 A série possui 6 elementos, ou seja, n = 8 (par), então a mediana será a média entre o elemento de ordem (n /2) e o elemento de ordem (n/2 +1). O elemento de ordem (n/2) é o elemento de ordem (8/2) 4o elemento, que neste exemplo corresponde ao número 125. O elemento de ordem (n/2 +1) é o elemento de ordem (8/2 +1) 5o elemento, que neste exemplo corresponde ao número 135. Neste caso, a mediana será a média aritmética entre o 125 e o 135, ou seja: Portanto, a mediana vale 130. Moda Para um conjunto de dados, a moda será o valor que mais aparece ou aquele valor que possui a maior frequência. Se tivermos dois valores com maior frequência, então teremos uma distribuição bimodal. Se todos tiverem a mesma frequência, teremos uma distribuição amodal, ou seja, sem moda. Determine a moda para os valores: 3, 3, 4, 4, 5, 5, 6, 6, 6, 6, 7, 7, 7, 8. A moda vale 6, pois aparece mais vezes, ou seja, 4 vezes, portanto Mo = 6. 2.5 – Medidas de Tendência Central para Dados Agrupados Média Aritmética Quando os dados estiverem agrupados numa distribuição de frequência, a média aritmética dos valores x1, x2, x3,....,xn ponderados pelas respectivas frequências absolutas f1, f2, f3, ...,fn será: 16 ̅ ∑ ∑ ∑ Neste caso, n = f1 + f2 + ... + fn = f e x é a média da amostra. ∑ ∑ ∑ A média aritmética também pode ser calculada utilizando-se a frequência relativa na forma decimal (ou unitária) ou na forma percentual. Média aritmética utilizando a frequência relativa na forma decimal (unitária) ̅ ∑ ∑ ∑ ̅ ∑ Média aritmética utilizando a frequência relativa na forma percentual ̅ ∑ ∑ ∑ ̅ ∑ Mediana O cálculo da mediana para dados discretos agrupados é o mesmo procedimento anterior para o cálculo da mediana para dados não agrupados, ou seja, é preciso que a distribuição esteja em ordem crescente e é preciso verificar se o tamanho da distribuição é par ou ímpar, só que agora, a identificação da ordem do elemento central (para o caso de n ímpar) ou dos elementos centrais (n par) será feita através da frequência acumulada. Moda Idem ao caso anterior, portanto é só verificar qual elemento que tem a maior frequência simples (absoluta ou relativa). Exemplo Calcule a média aritmética, a mediana e a moda da amostra abaixo. x 5 7 8 10 12 13 F 2 3 5 6 3 1 17 Montando a tabela para nos auxiliar nas contas, temos: x f x · f Frequência Acumulada 5 2 5 2 = 10 2 1 o e 2o elementos 7 3 7 3 = 21 5 do 3 o ao 5o elemento 8 5 8 5 = 40 10 do 6 o ao 10o elemento 10 6 10 6 = 60 16 do 11 o ao 16o elemento 12 3 12 3 = 36 19 18 o e 19o elementos 13 1 13 1 = 13 20 20 o elemento 20 180 • Média Aritmética ̅ ∑ • Mediana O tamanho da amostra é par, ou seja, n = 20, há dois elementos centrais. 1o elemento central: n/2 = 20/2 = 10o elemento 8 2o elemento central: (n/2) + 1 = (20/2) + 1 = 11o elemento 10 • Moda Mo = 10 (é o valor que mais aparece) Portanto, a média aritmética é igual a 9; a mediana é igual a 9 e a moda é igual a 10. 2.6 – Medidas de Tendência Central para Dados Agrupados em Classe Média Aritmética São as mesmas fórmulas utilizadas para as medidas de tendência central para dados agrupados, mas agora a variável x é o ponto médio das classes. Exemplo Seja a seguinte amostra com os dados agrupados em classe. Classes 30 – 50 50 – 70 70 – 90 90 – 110 110 – 130 130 – 150 Frequência 5 8 15 10 8 4 Calcule a média para os dados da tabela. 18 Tabela para auxiliar nos cálculos necessários. Classes F x x · f 30 – 50 5 40 40 5 = 200 50 – 70 8 60 60 8 = 480 70 – 90 15 80 80 15 = 1.200 90 – 110 10 100 100 10 = 1.000 110 – 130 8 120 120 8 = 960 130 – 150 4 140 140 4 = 560 Soma 50 4.400 A terceira coluna, ou seja, x é o ponto médio da classe, que é a soma do limite inferior com o limite superior dividida por dois. • Média Aritmética ̅ ∑ Considerações finais sobre média, mediana e moda Geralmente utiliza-se a moda quando se tem preferência por algum tipo ou produto, por exemplo: o sabor de sorvete que mais vende; o tipo de pizza que é mais pedido; a marca de sabão em pó mais vendida; a cor de carro preferida; um questionário com escala ótimo, bom, regular e péssimo, qual teve maior porcentagem. Geralmente utiliza-se a mediana quando se quer dividir um conjunto em duas partes iguais, por exemplo: um concurso de música em que se classificam os 50% melhores; vaga para emprego, em que os 50% melhores irão para a segunda etapa de entrevista; a divisão entre um grupo de pessoas, os 50% mais altos e os 50% mais baixos. De um modo geral, o que ficou serve para calcular a média aritmética, por exemplo, as vendas médias de uma empresa ao longo do ano; o salário médio de uma categoria em uma determinada região; o consumo médio de combustível de um grupo de carros; a média de consumo de água por habitante, a nota média de um grupo de estudantes. 2.7 – Medidas de Dispersão Servem para verificar a representatividade das medidas de posição, pois é muito comum encontrarmos séries que, apesar de terem a mesma média, são compostas de maneira distinta. É importante ressaltar que a análise completa dos dados requer não apenas sua apresentação através de tabelas e gráficos, ou cálculo das medidas de posições já estudadas, principalmente quando se deseja comparar dois conjuntos, onde as médias são iguais, pois caracterizá-los somente através dela, às vezes torna-se insuficiente ou quase impossível. As principais medidas de dispersão, que veremos logo a seguir são: amplitude total, variância, desvio padrão e coeficiente de variação. 19 Amplitude Total É a diferença entre o maior valor e o menor valor. A = Maior Valor – Menor Valor Onde: A é a amplitude total. Variância Populacional É a soma dos desvios elevados ao quadrado dividida pelo tamanho da população. ∑ ∑ ∑ ∑ ∑ ∑ Variância Amostral É a soma dos desvios elevados ao quadrado dividida pelo tamanho da amostra menos um (n – 1). ∑ ̅ ∑ ∑ ∑ ̅ ∑ ∑ Onde: S2 é a variância amostral; n é o tamanho da amostra; x é a média da amostra; f é a frequência absoluta; σ2 é a variância populacional; µ é a média populacional; N é o tamanho da população. Desvio Padrão Definido como a raiz quadrada positiva da variância. É uma medida de erro em torno da média, quanto maior o desvio padrão, maior a dispersão dos valores em torno da média e vice-versa. √ √ √ Onde: σ2 é a variância da população; σ é o desvio padrão da população; S2 é a variância da amostra; S é o desvio padrão da amostra. Todas as medidas de dispersão vistas até agora são absolutas, ou seja, elas têm unidades. Por exemplo, se estivermos interessados na altura em centímetros (cm), a amplitude e o desvio padrão estarão em centímetros (cm) e a variância estará em centímetros ao quadrado (cm2 ). 20 Coeficiente de Variação É uma medida de dispersão relativa, ou seja, não tem unidade e ela é o desvio padrão dividido pela média. O coeficiente de variação pode ser dado em porcentagem, para isto, basta multiplicar por 100%. O coeficiente de variação serve para comparar a dispersão de dois conjuntos de dados com médias diferentes e desvios padrões diferentes. ̅ Onde: CV é o coeficiente de variação. Exemplo: medidas de dispersão para dados não agrupados Calcular a variância, o desvio padrão e o coeficiente de variação para o caso do vendedor, que durante cinco semanas consecutivas, vendeu a seguinte quantidade de produtos por semana: 15, 17, 18, 20 e 20. Como foi calculada a média de produtos, que foi igual 18 produtos por semana, já se pode calcular o desvio absoluto médio, a variância e o desvio padrão. Neste caso, estas 5 semanas serão consideradas como uma amostra. Aplicaremos a fórmula de desvio aboluto médio, variância para dados não agrupados. Variância Amostral (Primeira fórmula) ∑ ̅ X ̅ 15 (15 – 18)2 = 9 17 (17 – 18)2 = 1 18 (18 – 18)2 = 0 20 (20 – 18)2 = 4 20 (20 – 18)2 = 4 Σ 18 ∑ ̅ Variância Amostral (Segunda fórmula) Σx = 15 + 17 + 18 + 20 + 20 = 90 Σx = 90 Σx2 = 152 + 172 + 182 + 202 + 202 = 225 + 289 + 324 + 400 + 400 = 1.638 Σx2 = 1.638 21 ∑ ∑ Portanto, a variância amostral vale 4,5 produtos vendidos ao quadrado por semana. Desvio Padrão Amostral √ √ O desvio padrão amostral vale 2,12 produtos vendidos por semana. Coeficiente de Variação ̅ O coeficiente de variação vale 0,118 ou 11,8%. Exemplo: medidas de dispersão para dados agrupados Calcular o desvio absoluto médio, a variância, o desvio padrão e o coeficiente de variação para a seguinte amostra. X 5 7 8 10 12 13 F 2 3 5 6 3 1 Este exemplo foi usado anteriormente para o cálculo das medidas de tendência central, sendo que a média aritmética vale 9. Será feita uma tabela auxiliar para o cálculo do desvio absoluto médio e da variância. X f x ·f ̅ 5 2 5 · 2 = 10 (5 – 9)2·2 = 32 7 3 7 · 3 = 21 (7 – 9)2·3 = 12 8 5 8 · 5 = 40 (8 – 9)2·5 = 5 10 6 10 · 6 = 60 (10 – 9)2·6 = 6 12 3 12 · 3 = 36 (12 – 9)2·3 = 27 13 1 13 · 1 = 13 (13 – 9)2·1 = 16 Soma 20 180 98 Média Aritmética ̅ ∑ Variância (primeiro modo da fórmula) ∑ ̅ 22 Variância (segundo modo da fórmula) x f x · f x2 · f 5 2 5 · 2 = 10 52 · 2 = 50 7 3 7 · 3 = 21 72 · 3 = 147 8 5 8 · 5 = 40 82 · 5 = 320 10 6 10 · 6 = 60 102 · 6 = 600 12 3 12 · 3 = 36 122 · 3 = 432 13 1 13 · 1 = 13 132 · 1 = 169 Soma 20 180 1.718 Sabendo-se que: ∑ ∑ , teremos: ∑ ∑ Desvio Padrão √ Coeficiente de Variação ̅ Para esta amostra, a variância vale 5,158, o desvio padrão vale 2,271 e o coeficiente de variação vale 0,252 ou 25,2%. Exemplo: medidas de dispersão para dados agrupados em classe Calcule a variância, o desvio padrão e o coeficiente de variação da amostra abaixo. Classes 30 – 50 50 – 70 70 – 90 90 – 110 110 – 130 130 – 150 Frequência 5 8 15 10 8 4 Do exemplo de medidas de tendência central para dados agrupados em classe, sabe-se que a média aritmética calculada foi igual a 88. Variância Amostral (primeiro modo da fórmula) ∑ ̅ 23 Tabela para auxiliar nos cálculos necessários. Classes F x ̅ 30 – 50 5 40 (40 – 88)2 · 5 = 11.520 50 – 70 8 60 (60 – 88)2 · 8 = 6.272 70 – 90 15 80 (80 – 88)2 · 15 = 960 90 – 110 10 100 (100 – 88)2 · 10 = 1.440 110 – 130 8 120 (120 – 88)2 · 8 = 8.192 130 – 150 4 140 (140 – 88)2 · 4 = 10.816 Soma 50 39.200 ∑ ̅ Variância Amostral (segundo modo da fórmula) ∑ ∑ Tabela para auxiliar nos cálculos necessários. Classes f x 30 – 50 5 40 40 · 5 = 200 402 · 5 = 8.000 50 – 70 8 60 60 · 8 = 480 602 · 8 = 28.800 70 – 90 15 80 80 · 15 = 1.200 802 · 15 = 96.000 90 – 110 10 100 100 · 10 = 1.000 1002 · 10 = 100.000 110 – 130 8 120 120 · 8 = 960 1202 · 8 = 115.200 130 – 150 4 140 140 · 4 = 560 1402 · 4 = 78.400 Soma 50 4.400 426.400 Sabendo-se que: ∑ ∑ , teremos: ∑ ∑ Desvio Padrão √ √ Coeficiente de Variação ̅ Para esta amostra, a variância vale 800, o desvio padrão vale 28,28 e o coeficiente de variação vale 0,321 ou 32,1%. 24 Exercícios de Estatística Descritiva GRÁFICOS 2.1) O Prato Quente, um restaurante em São Paulo, usa um questionário para solicitar aos clientes uma avaliação da qualidade do restaurante. Esta característica é avaliada em uma escala de ótimo (O), bom (B), médio (M) regular (R) e fraco (F). Use a estatística descritiva para sintetizar os seguintes dados coletados sobre a qualidade do restaurante. a) Qual é o tamanho da amostra? b) Monte uma tabela com as frequências absolutas e relativas. c) Qual a conclusão? d) Qual é a porcentagem de pessoas que avaliaram o restaurante como Bom ou Ótimo? e) Qual é a porcentagem de pessoas que avaliaram o restaurante como Médio ou Regular? f) Faça um gráfico em colunas da frequência relativa em função dos atributos. O B O M B O B M B O M O R O M O F O M B O R B B B O B B O R O B F O M B O M M O O R O M R B O B F M 2.2) Os empregados na Digital Eletrônica estão num sistema de horário flexível: eles podem começar a almoçar às 11h, 11h30min, 12h, 12h30min ou 13h. Os seguintes dados representam uma amostra do horário de início escolhido pelos empregados: 11h 12h 12h30 12h 11h 12h30 12h 13h 11h30 12h 12h30 11h30 13h 12h30 12h 11h30 12h 12h30 13h 11h 11h30 12h 11h 12h 12h30 13h 12h30 12h 12h 13h 12h30 13h 13h 11h30 12h 12h 11h 11h30 12h30 12h 12h 12h30 12h 12h30 11h30 12h30 12h 12h 11h 11h30 13h 12h 11h30 11h 12h 11h 13h 11h30 12h30 12h30 Sintetize os dados, conforme os itens a seguir. a) Uma tabela de distribuição de frequência simples e relativa. b) Um gráfico em colunas da frequência simples. c) O que os itens anteriores revelam sobre a preferência dos empregados quanto ao sistema de horário flexível? d) Qual a porcentagem de empregados que prefere almoçar às 12h ou às 12h30min? e) Qual a porcentagem de empregados que prefere almoçar até às 12h? 2.3) Uma pesquisa realizada com um grupo de 70 pessoas sobre a preferência de cor de carros está listada abaixo. Cor Preferida Número de Pessoas Prata 26 Branca 10 Azul 9 Preta 8 Vermelha 3 Verde 3 Bege 3 Outras 8 25 a) Construa uma tabela com a cor preferida e a frequência relativa. b) Qual a porcentagem de pessoas que prefere a cor prata ou branca ou azul? c) Qual a porcentagem de pessoas que prefere a cor vermelha ou verde? 2.4) Uma pizzaria fez uma pesquisa pela internet sobre a qualidade das pizzas dela, conforme as categorias: excelente, muito bom, médio, pobre e horrível. Dos 78 responderam o questionário, 44 opinaram que a pizzaria é excelente, 21 responderam que a pizzaria é muito boa, 9 avaliaram-na como média, 2 afirmaram que a pizzaria é pobre e 2 avaliaram-na como horrível. a) Construa uma tabela das categorias com a frequência simples e com a frequência relativa. b) Construa um gráfico em coluna da frequência em função das categorias c) Qual a porcentagem de pessoas que avaliaram a pizzaria como excelente ou como muito boa? d) Qual a porcentagem de pessoas que avaliaram a pizzaria como pobre ou horrível? 2.5) Considere os dados obtidos pelas medidas das alturas de 60 indivíduos em centímetros. 154 155 156 157 157 158 159 161 162 163 163 163 164 165 165 166 167 167 168 168 169 170 170 170 171 171 172 172 173 173 173 173 173 174 174 174 175 175 175 175 176 176 176 177 177 178 178 179 179 180 180 181 181 182 183 184 185 186 187 190 a) Determine a amplitude da amostra. b) Monte uma distribuição de frequência com as classes, frequência simples, frequência acumulada, frequência relativa em porcentagem, frequência relativa acumulada em porcentagem e ponto médio das classes. Para a montagem das classes, utilize 8 classes de amplitude 5, começando pelo 150 (limite inferior a primeira classe) e terminando com o 190 (limite superior da oitava classe). Utilize o limite aberto do lado esquerdo e limite fechado do lado direito. c) Faça o gráfico da frequência relativa em função das classes, histograma e polígono. d) Faça o gráfico da frequência relativa acumulada em função das classes, histograma e polígono. 2.6) Abaixo estão as notas de uma prova de Matemática de um grupo de 40 alunos. 0,6 1,7 2,3 2,7 2,7 2,9 2,9 3,3 3,3 3,8 4,4 5,0 5,2 5,4 5,5 5,6 5,8 6,0 6,3 6,3 6,3 6,9 7,1 7,1 7,2 7,5 7,7 8,0 8,2 8,3 8,4 8,4 8,5 8,7 9,0 9,1 9,4 9,5 9,6 9,7 a) Qual é a amplitude amostral? b) Monte uma distribuição de frequência com as classes, frequência simples, frequência acumulada, frequências relativa em porcentagem, frequência relativa acumulada em porcentagem e ponto médio das classes. Para a montagem das classes, utilize 5 classes de amplitude 2, começando pelo zero (limite inferior da primeira classe) e terminando com o dez (limite superior da quinta classe). Utilize o limite fechado do lado esquerdo e limite aberto do lado direito. c) Faça o gráfico da frequência simples absoluta em função das classes, histograma e polígono. d) Faça o gráfico da frequência acumulada em função das classes, histograma e polígono. 26 2.7) Os dados a seguir são valores contábeis (em reais), isto é, o valor líquido dividido pelo número de títulos em destaque, para uma amostra aleatória de 30 ações da Bolsa de Valores de São Paulo: 11 9 12 6 11 15 9 10 9 11 8 11 14 10 7 9 10 8 5 11 10 13 16 18 10 12 13 11 7 15 a) Construa uma tabela de distribuição de frequência (não enquadrar os dados em classes). b) Construa o gráfico da frequência relativa e o gráfico da frequência relativa acumulada. DADOS NÃO AGRUPADOS 2.8) Uma amostra de salários iniciais de algumas profissões é apresentada a seguir. Os dados estão em reais. 1.500,00 1.800,00 1.300,00 1.500,00 1.400,00 1.600,00 1.400,00 1.800,00 1.700,00 1.600,00 1.300,00 1.400,00 a) Qual é a média do salário inicial? b) Qual é a mediana do salário inicial? c) Qual é a moda do salário inicial? 2.9) Um fabricante de baterias pegou uma amostra de 8 baterias fabricadas em um mesmo dia de produção e utilizou as mesmas até que falhassem. O número de horas que cada uma demorou até falhar foi: 340 520 360 450 630 510 490 560 550 a) Calcule a média aritmética. b) Calcule a mediana. c) Calcule a variância amostral. 2.10) Uma amostragem foi feita com os pacotes de farinha de mandioca em um determinado estabelecimento por um representante de pesos e medidas, sendo que os dados estão em gramas: 965 980 970 950 1.050 960 995 1.010 970 1.020 a) Calcule o peso médio da amostra. b) Calcule o peso mediano. O que isto significa? c) Calcule a amplitude amostral. d) Calcule o desvio padrão da amostra. e) Calcule o coeficiente de variação. 2.11) Uma pesquisa feita com algumas marcas de água mineral revelou os seguintes valores de pH da água à temperatura de 25 oC, conforme o quadro a seguir. 27 Marca pH Marca pH Carrefour 5,48 Genuína Lindoya 6,30 Schinchariol 7,59 Magna 5,76 Fratelli Vita 6,02 Crystal 7,22 Levíssima 4,86 Premiata 7,69 Minalba 7,80 Acqua Sadia 7,80 Prata 5,87 São Lourenço 5,29 a) Qual é a amplitude amostral? b) Calcule o pH médio. c) Calcule o pH mediano. d) Calcule o desvio padrão. e) Calcule o coeficiente de variação. f) Qual a porcentagem do pH da água estar entre 5,5 e 7? 2.12) Uma amostra de 15 vendedores apresentou os seguintes custos (em reais) com despesas diárias de alimentação e transporte 175 170 180 185 265 175 190 200 155 205 235 165 165 175 210 a) Qual é a amplitude amostral? b) Qual é média amostral? c) Qual é o custo mediano? d) Calcule a variância e) Calcule o desvio padrão. f) Calcule o coeficiente de variação. g) Qual a porcentagem do custo estar entre R$ 170,00 e R$ 220,00? 2.13) Comparando a amostra do exercício sobre o pH da água (exercício 2.11) e o custo diário (exercício 2.12), qual deles tem um comportamento mais uniforme em relação à média aritmética? Explique por que usou tal medida para comparar? 2.14) Uma pesquisa realizada com carros 1.0 no dia 15 de julho de 2006, verificou-se os seguintes preços. Tipo de Carro Preço (reais) Ka GL 1.0 22.890,00 Fiesta Hatch Pers. 5p 1.0 27.890,00 Celta Life Flex Power 3p 1.0 24.390,00 Palio Fire Flex 2p 1.0 23.490,00 Uno Mille Fire Flex 1.0 2p 21.490,00 Gol City 1.0 Total Flex 2p G4 23.390,00 Fox City 1.0 Total Flex 2p 26.990,00 a) Calcule a amplitude amostral. b) Calcule o preço médio do carro 1.0. c) Calcule o preço mediano do carro 1.0. d) Calcule o desvio padrão da amostra. e) Calcule o coeficiente de variação. 28 2.15) A inflação no ano, conforme os institutos são dados a seguir. Instituto Inflação (%) INPC 3,31 IGP-M (FGV) 1,41 IGP-DI 1,12 IPC (FIPE) 3,02 ICV (Dieese) 2,62 IPCA (IBGE) 3,31 CUB 4,42 a) Qual a inflação média? b) Qual a inflação mediana? c) Qual é a inflação modal? d) Qual é a amplitude? e) Qual a variância amostral? 2.16) Durante quatro semanas consecutivas, a temperatura (oC), foi medida todos os dias, conforme o quadro abaixo. DOM SEG TER QUA QUI SEX SAB Semana 1 29 25 26 29 28 29 24 Semana 2 29 28,5 28 28,5 28 24 27 Semana 3 28 24,5 26 24 28,5 22 26 Semana 4 22,5 28 28,5 26 27 29 27 a) Calcule a temperatura média em cada semana. b) Calcule a temperatura média nas quatro semanas conjuntamente. c) Calcule a amplitude de temperatura em cada semana. d) Calcule amplitude de temperatura nas quatro semanas conjuntamente. e) Calcule a temperatura mediana em cada semana. f) Calcule a temperatura mediana nas quatro semanas conjuntamente. g) Calcule a temperatura modal em cada semana. h) Calcule a temperatura modal nas quatro semanas conjuntamente. i) Calcule o desvio padrão amostral em cada semana. j) Calcule o coeficiente de variação em cada semana. k) Calcule o desvio padrão amostral nas quatro semanas conjuntamente l) Calcule o coeficiente de variação nas quatro semanas conjuntamente. m) Calcule a temperatura média para cada dia da semana, ou seja, para domingo, segunda-feira, até sábado. n) Calcule a temperatura média a partir dos resultados do item a. o) Calcule a temperatura média a partir dos resultados do item m. p) O que você conclui sobre o resultado obtido no item b, no item n e no item o? 29 2.17) Os maiores produtores de carneiro do ano de 2002 em mil toneladas são dados a seguir. Países Mil toneladas China 3,31 União Européia 1,41 Austrália 1,12 Nova Zelândia 3,02 Irã 2,62 a) Qual a produção média destes países? b) Qual a variância amostral? c) Qual o desvio padrão amostral? d) Qual o coeficiente de variação? DADOS AGRUPADOS 2.18) Os dados amostrais seguintes foram obtidos da Escola Morro da Cruz que empresta livros para as pessoas lerem. Foi feito uma amostragem sobre a quantidade de livros retirados por dia num período de 60 dias. Número de livros retirados diariamente Número de Dias 12 3 13 4 14 6 15 7 16 10 17 8 18 6 19 5 20 5 21 4 22 2 Total 60 a) Construa um gráfico em colunas da frequência relativa em função do número de livros retirados diariamente. b) Calcule o número médio de livros retirados diariamente. c) Calcule o número mediano de livros retirados diariamente. d) Calcule o número modal de livros retirados diariamente. e) Calcule a variância amostral. f) Calcule o desvio padrão amostral. g) Calcule o coeficiente de variação. h) Qual a porcentagem de se retirar mais de 19 livros por dia? i) Calcule a amplitude amostral. 30 2.19) Uma empresa prestadora de serviços anota semanalmente o número as reclamações dos clientes sobre alguma insatisfação sobre o serviço prestado com o intuito de melhorar o seu desempenho no mercado. Uma amostra de 80 semanas revelou o número de reclamações por semana. Número de reclamações por semana Semanas 0 18 1 24 2 16 3 10 4 6 5 4 6 2 Total 80 a) Faça o gráfico em colunas da frequência simples em função do número de reclamações por semana. b) Calcule a amplitude amostral. c) Calcule o número médio de reclamações por semana. d) Calcule o número mediano de reclamações por semana. e) Calcule o número modal de reclamações por semana. f) Calcule a variância da amostra. g) Calcule o desvio padrão da amostra. h) Qual a porcentagem de semanas em que houve pelos menos 4 reclamações por semana? i) Qual a porcentagem de semanas em que houve até 1 reclamação por semana? 2.20) A revista Quatro Rodas fez uma pesquisa pela Internet entre seus assinantes em uma determinada região para saber quantos carros eles possuíam, sendo que o número de respostas obtidas foi igual a 180. Número de carros por assinante Número de assinantes 0 18 1 72 2 45 3 27 4 9 5 9 Total 180 a) Faça o gráfico em colunas da frequência relativa acumulada em função do número de carros por assinante. b) Qual a porcentagem de um assinante ter 1 carro? c) Qual a porcentagem de um assinante ter mais de 3 carros? d) Qual a porcentagem de um assinante ter menos de 2 carros? e) Qual é o número médio de carros? f) Calcule o número mediano de carros. g) Calcule o número modal de carros. h) Calcule o desvio padrão amostral. 31 2.21) A seguinte pesquisa indica o número de acidentes diários ocorridos em 200 dias em uma estrada, sendo que os valores do número de acidentes diários estão na coluna 1 e a coluna P representa a frequência relativa acumulada. Número de acidentes diários P 0 27,5 1 52,5 2 70 3 80 4 87,5 5 92,5 6 97,5 7 100 a) Faça o gráfico em linhas da frequência simples em função o número de acidentes diários. b) Faça o gráfico em linhas da frequência acumulada em função o número de acidentes diários. c) Qual o número de dias em que houve pelo menos 4 acidentes? d) Qual a porcentagem de dias em que houve 2 ou 5 acidentes? e) Calcule o número médio de acidentes. f) Calcule o número mediano de acidentes. g) Calcule o número modal de acidentes. h) Calcule a variância amostral. i) Calcule o coeficiente de variação. j) Qual o número de dias em que houve de 2 a 4 acidentes? DADOS AGRUPADOS EM CLASSE 2.22) Em uma fazenda que tem 2.000 laranjeiras, foi feita uma amostragem para um grupo de 80 laranjeiras, em que se pesou a quantidade, em quilogramas, de laranja produzida por árvore. Os dados estão tabulados abaixo. Quantidade de Laranja por Árvore (kg) No de Árvores 65 a 70 4 70 a 75 8 75 a 80 10 80 a 85 20 85 a 90 18 90 a 95 14 95 a 100 6 Total 80 a) Faça o gráfico da frequência relativa (histograma e polígono) em função das classes. b) Faça o gráfico da frequência relativa acumulada (histograma e polígono) em função das classes. c) Calcule a amplitude amostral. d) Calcule a quantidade média de laranja por árvore. e) Calcule a quantidade mediana de laranja por árvore. f) Calcule a quantidade modal de laranja por árvore. 32 g) Calcule a variância da amostra. h) Calcule o coeficiente de variação. i) Qual a porcentagem de laranjeiras que produzem entre 75 e 90 kg de laranjas? j) Qual a porcentagem de laranjeiras que produzem até 80 kg de laranjas? 2.23) Um posto de combustível registrou a seguinte distribuição de frequências para o número de litros de combustível vendidos por carro em uma amostra de 93 carros durante um dia. Litros de combustível por carro Número de carros 0 – 8 15 8 – 16 25 16 – 24 20 24 – 32 18 32 – 40 8 40 – 48 7 Total 93 a) Faça o gráfico da frequência simples (histograma e polígono) em função das classes. b) Faça o gráfico da frequência acumulada (histograma e polígono) em função das classes. c) Calcule a amplitude amostral. d) Calcule o volume médio de combustível vendido. e) Calcule o volume mediano de combustível vendido. f) Calcule o volume modal de combustível vendido. g) Calcule o desvio padrão amostral. h) Qual a porcentagem de se vender mais de 24 litros de combustível por carro? 2.24) Os dados abaixo se referem ao tempo em dias exigido para se completar auditorias de fim de ano para uma amostra de 120 clientes da Audicon, uma empresa de contabilidade. Tempo de Auditoria por cliente (dias) Número de clientes 10 – 14 10 14 – 18 11 18 – 22 15 22 – 26 25 26 – 30 32 30 – 34 16 34 – 38 11 Total 120 a) Complete a tabela com as frequências acumuladas, com frequências relativas e com as frequências relativas acumuladas. b) Construa o gráfico da frequência relativa (histograma e polígono). c) Construa o gráfico da frequência relativa acumulada (histograma e polígono). d) Calcule o tempo médio de auditoria. e) Calcule o tempo mediano de uma auditoria. f) Calcule o tempo modal de uma auditoria. g) Calcule a variância da amostra. 33 h) Qual é a porcentagem de uma auditoria durar até 22 dias? i) Qual é a porcentagem de uma auditoria durar entre 18 e 30 dias? 2.25) Em um shopping foi pesquisa com 300 pessoas para saber o valor do consumo por pessoa por faixa etária, conforme a tabela a seguir. Faixa etária Número de consumidores 10 – 20 18 20 – 30 35 30 – 40 50 40 – 50 77 50 – 60 75 60 – 70 30 70 – 80 15 Total 300 a) Complete a tabela com as frequências acumuladas, com frequências relativas e com as frequências relativas acumuladas. b) Calcule a idade média de consumo no shopping. c) Calcule a idade mediana de consumo no shopping. d) Calcule a idade modal de consumo no shopping. e) Calcule a variância da amostra. f) Calcule o desvio padrão da amostra. g) Calcule o coeficiente de variação. h) Qual é a porcentagem de alguém entre 30 e 60 anos consumir no shopping? i) Qual é a porcentagem de alguém com pelo menos 50 anos consumir no shopping? OUTROS EXERCÍCIOS 2.26) Um supermercado tem 200 empregados, sendo 140 mulheres e 60 homens. A média salarial das mulheres é de 3 salários mínimos e a dos homens é de 4 salários mínimos. Qual a média salarial dos empregados deste supermercado, em salários mínimos? 2.27) Um estudante que fez 4 provas bimestrais com as respectivas notas: 7,5; 8,0; 7,0; 10. Os pesos das provas dos 4 bimestres foram: 2, 3, 3 e 4, respectivamente. A nota final é baseada nas 4 notas bimestrais com seus respectivos pesos. Calcule a nota final dele. 2.28) Em uma empresa, existem três classes de funcionários: os funcionários da produção, os funcionários da área administrativa e a gerência. Nesta empresa existem 60 funcionários na produção, 20 funcionários na área administrativa e 5 na gerência. Os salários são atribuídos de acordo com a classe, sendo que os funcionários da produção recebem R$ 720,00 por mês, os funcionários da área administrativa recebem R$ 1.280,00 por mês e o pessoal da gerência tem um salário de R$ 3.500,00 por mês. Calcule o salário médio dos funcionários desta empresa. 34 2.29) Uma pesquisa de preços de determinado produto, realizada em dois mercados, produziu os resultados mostrados na tabela abaixo. MERCADO PREÇO MÉDIO (R$/kg) DESVIO PADRÃO (R$/kg) I 5,00 2,00 II 4,00 1,84 a) Qual mercado apresenta menor dispersão absoluta? b) Qual mercado apresenta menor dispersão relativa? c) Qual das duas medidas é mais confiável, por quê? 2.30) Calcular o salário médio horário de 200 funcionários de uma fábrica de tecidos, em que 60% deles recebem R$ 20,00/h, 30% recebem R$ 55,00/h e os demais ganham R$ 70,00/h. 35 Respostas dos Exercícios de Estatística Descritiva Respostas dos Gráficos Exercício 2.1 a) Tamanho da amostra = 50. b) Categoria Freq. Absoluta Freq. Relativa Ótimo 18 36% Bom 14 28% Médio 10 20% Regular 5 10% Fraco 3 6% 50 100% c) A maioria acha o restaurante ótimo. d) 64% e) 30% f) Gráfico Exercício 2.2 a) Atributo F. Simples Freq. Rel. 11h 8 13,3% 11h30 10 16,7% 12h 19 31,7% 12h30 14 23,3% 13h 9 15,0% 60 100% c) A maioria prefere almoçar às 12 horas. d) 55% b) e) 61,7% 0 10 20 30 40 Ótimo Bom Médio Regular Fraco 0 5 10 15 20 11h 11h30 12h 12h30 13h 36 Exercício 2.3 a) Cor Preferida Freq Rel (%) b) 64,3% Prata 37,1 Branca 14,3 c) 15,7% Azul 12,9 Preta 11,4 Vermelha 4,3 Verde 4,3 Bege 4,3 Outras 11,4 Exercício 2.4 a) Categoria Freq. Simples Freq. Rel. Excelente 44 56,4 Muito Boa 21 26,9 Média 9 11,5 Pobre 2 2,6 Horrível 2 2,6 78 100% c) 83,3% d) 5,2% b) Exercício 2.5 a) Amplitude da amostra = 190 – 154 = 36. b) Distribuição de Frequência Classes f F fr (%) Fr (%) X 150 ─┤155 2 2 3,3 3,3 152,5 155 ─┤160 5 7 8,3 11,7 157,5 160 ─┤165 8 15 13,3 25 162,5 165 ─┤170 9 24 15 40 167,5 170 ─┤175 16 40 26,7 66,7 172,5 175 ─┤180 11 51 18,3 85 177,5 180 ─┤185 6 57 10 95 182,5 185 ─┤190 3 60 5 100 187,5 0 10 20 30 40 Excelente Muito Boa Média Pobre Horrível Qualidade da Pizzaria 37 c) d) Exercício 2.6 a) Amplitude da amostra = 9,7 – 0,6 = 9,1. b) Distribuição de Frequência Classes f F fr (%) Fr (%) X 0├─ 2 2 2 5 5 1 2├─ 4 8 10 20 25 3 4├─ 6 7 17 17,5 42,5 5 6├─ 8 10 27 25 67,5 7 8├─ 10 13 40 32,5 100 9 c) d) 38 Exercício 2.7 a) Tabela de distribuição de frequência X f F Fr (%) Fr 5 1 1 3,33 3,33 6 1 2 3,33 6,66 7 2 4 6,67 13,33 8 2 6 6,67 20 9 4 10 13,33 33,33 10 5 15 16,67 50 11 6 21 20 70 12 2 23 6,67 76,67 13 2 25 6,67 83,34 14 1 26 3,33 86,67 15 2 28 6,67 93,34 16 1 29 3,33 96,67 17 0 29 0 96,67 18 1 30 3,33 100 b) Gráfico da frequência relativa Gráfico da frequência relativa acumulada 0 5 10 15 20 25 5 6 7 8 9 10 11 12 13 14 15 16 17 18 Gráfico da Freq. Relativa 0 20 40 60 80 100 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Gráfico da Freq. Rel. Acumulada 39 Respostas dos Dados Não Agrupados Exercício 2.8 a) 1.525,00 b) 1.500,00 c) 1.400,00 Exercício 2.9 a) 490 b) 510 c) 8.800 Exercício 2.10 a) 987 b) 975. Significa que existem 5 pacotes abaixo de 975 e existem 5 pacotes acima de 975, ou seja, divide o conjunto em duas partes iguais. c) 100 d) 31,38 e) 3,18% Exercício 2.11 a) 2,94 b) 6,47 c) 6,16 d) 1,08 e) 16,7% f) 41,7% Exercício 2.12 a) 110 b) 190 c) 180 d) 860,71 e) 29,34 f) 15,4% g) 66,7% Exercício 2.13 O exercício 2.12 tem um comportamento menos disperso em relação à média, pois apresenta um coeficiente de variação menor, 15,4% contra 16,7%. Utilizou-se como medida de dispersão o coeficiente de variação, pois é uma medida de dispersão relativa, pois os dois exercícios têm médias e desvio padrões diferentes. Exercício 2.14 a) 6.400,00 b) 24.361,43 c) 23.490,00 d) 2.290,53 e) 9,40% Exercício 2.15 a) 2,74 b) 3,02 c) 3,31 d) 3,3 e) 1,33 Exercício 2.16 a) Semana 1 2 3 4 Temp. Média 27,14 27,57 25,57 26,86 b) 26,79 c) Semana 1 2 3 4 Amplitude 5 5 6,5 6,5 d) 7 e) Semana 1 2 3 4 Temperatura Mediana 28 28 26 27 f) 27,5 g) Semana 1 2 3 4 Temperatura Modal 29 28,5 26 27 h) 28 e 29 Aparecem cinco vezes cada uma. i) Semana 1 2 3 4 Desvio Padrão 2,116 1,694 2,281 2,174 40 j) Semana 1 2 3 4 Coeficiente de Variação 7,79 6,14 8,92 8,09 k) 2,101 l) 7,84 m) Dia da Semana Dom Seg Ter Qua Qui Sex Sab Temperatura Média 27,13 26,5 27,13 26,88 27,88 26 26 n) 26,79 o) 26,79 p) A temperatura média geral pode ser calculada a partir dos 28 valores, a partir das médias de cada semana e de cada dia da semana, pois resultarão no valor de 26,79. Exercício 2.17 a) 2,296 b) 0,956 c) 0,978 d) 42,59 Respostas dos Dados Agrupados Exercício 2.18 a) b) 16,73 c) 16,5 d) 16 e) 6,98 f) 2,64 g) 15,8% h) 18,3% i) 10 Exercício 2.19 a) b) 6 c) 1,775 d) 1 e) 1 f) 2,46 g) 1,57 h) 15% i) 52,5% 0 2 4 6 8 10 12 13 14 15 16 17 18 19 20 21 22 N ú m e ro d e d ia s Número de livros retirados diariamente 0 5 10 15 20 25 0 1 2 3 4 5 6 N ú m e ro d e s e m an as Número de reclamações 41 Exercício 2.20 a) b) 40% c) 10% d) 50% e) 1,8 f) 1,5 g) 1 h) 1,26 Exercício 2.21 a) b) 0 20 40 60 80 100 0 1 2 3 4 5 P o rc e n ta ge m a cu m u la d a Número de carros por assinante 0 10 20 30 40 50 60 0 2 4 6 8 N ú m e ro d e d ia s Número de acidentes diários 50 75 100 125 150 175 200 0 2 4 6 8 N ú m e ro d e d ia s ac u m u la d o s Número de acidentes diários 42 c) 40 d) 22,5% e) 1,925 f) 1 g) 0 h) 3,64 i) 99,1% j) 70 Exercício 2.22 a) b) c) 35 d) 84,125 e) 84,5 f) 84,17 g) 65,52 h) 9,40% i) 2,1 j) 605 k) 27,5% Exercício 2.23 a) b) c) 48 d) 20 e) 18,6 f) 13,33 g) 11,74 h) 27,96% Exercício 2.24 a) Tempo de Auditoria por cliente (dias) Frequência relativa Frequência acumulada Frequência relativa acumulada 10 – 14 8,33 10 8,33 14 – 18 9,17 21 17,5 18 – 22 12,50 36 30 22 – 26 20,83 61 50,83 26 – 30 26,67 93 77,5 30 – 34 13,33 109 90,83 34 – 38 9,17 120 100 43 b) c) d) 25 e) 25,84 f) 27,22 g) 45,24 h) 30% i) 60% Exercício 2.25 a) Faixa etária Frequência acumulada Frequência Relativa (%) Frequência relativa Acumulada (%) 10 – 20 18 6 6 20 – 30 53 11,67 17,67 30 – 40 103 16,67 34,33 40 – 50 180 25,67 60 50 – 60 255 25 85 60 – 70 285 10 95 70 – 80 300 5 100 b) 45,2 c) 46,1 d) 49,3 e) 228,05 f) 15,10 g) 33,4% h) 67,3% i) 40% RESPOSTA DE OUTROS EXERCÍCIOS 2.26) 3,3 2.27) 8,3 2.28) 1.015,29 2.29) a) O mercado B. b) O mercado A. c) É a medida do item b, pois ela é relativa, serve para comparar dados com médias e desvios padrões diferentes. 2.30) 35,5