Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
Ponto dos Concursos www.pontodosconcursos.com.br Atenção. O conteúdo deste curso é de uso exclusivo do aluno matriculado, cujo nome e CPF constam do texto apresentado, sendo vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição. É vedado, também, o fornecimento de informações cadastrais inexatas ou incompletas – nome, endereço, CPF, e-mail - no ato da matrícula. O descumprimento dessas vedações implicará o imediato cancelamento da matrícula, sem prévio aviso e sem devolução de valores pagos - sem prejuízo da responsabilização civil e criminal do infrator. Em razão da presença da marca d’ água, identificadora do nome e CPF do aluno matriculado, em todas as páginas deste material, recomenda-se a sua impressão no modo econômico da impressora. CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 1 PROFESSOR: VÍTOR MENEZES AULA 3 VII MEDIDAS SEPARATRIZES ................................................................................................................ 3 VIII FORMAS DE APRESENTAÇÃO DOS DADOS AGRUPADOS EM CLASSES........................... 53 1 Histograma.............................................................................................................................................. 53 2 Polígono de freqüências.......................................................................................................................... 67 IX ASSIMETRIA ............................................................................................................................................ 69 1 Noções de assimetria............................................................................................................................... 69 2 Formas da curva de freqüência. ............................................................................................................. 73 LISTA DAS QUESTÕES DE CONCURSOS ................................................................................................... 82 GABARITO DAS QUESTÕES DE CONCURSOS ......................................................................................... 99 ANEXO .............................................................................................................................................................. 100 www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 2 PROFESSOR: VÍTOR MENEZES Antes da matéria nova, vamos às correções. Eu mando as aulas para o Ponto, que dá uma última formatada no arquivo, passa para pdf, e disponibiliza no site. Assim, pode ser que a numeração de página que eu vou indicar seja ligeiramente diferente da que vocês têm aí. O erro foi na página 5 da aula 2. Eu escrevi: Como regra geral, se tivermos ‘n’ elementos, podemos dizer que: n ∑ f i = n i =1 Para o caso acima, ‘n’ vale 10 (são dez salários pesquisados). Então, ficamos com: 10 ∑ f i = ? i 1= O que significa mesmo a expressão acima? Significa que queremos somar valores (pois há um símbolo de somatório). Que valores? Valores de if (freqüência absoluta simples). Quais valores de f i ? Aqueles para os quais ‘i’ vai de 1 até 10. 10 ∑ f i = i 1= f1 + f 2 + f 3 + f 4 + f 5 + f 6 + f 7 + f8 + f 9 + f10 10 ∑ f i = 1 + 3 + 1 + 2 + 1 + 1 + 1 = 10 i 1= Mas o correto seria: Como regra geral, se tivermos ‘n’ elementos, podemos dizer que: ∑ f i = n Para o caso acima, ‘n’ vale 10 (são dez salários pesquisados). Então, ficamos com: ∑ f = n i O que significa mesmo a expressão acima? Significa que queremos somar valores (pois há um símbolo de somatório). Que valores? Valores de if (freqüência absoluta simples). Quais valores de de 1 até 7). f i ? Como são 7 valores de X i , temos 7 valores de f i (ou seja, ‘i’ vai 7 ∑ f i = i 1= f1 + f 2 + f 3 + f 4 + f 5 + f 6 + f 7 7 ∑ f i = 1 + 3 + 1 + 2 + 1 + 1 + 1 = 10 i 1= Vamos analisar com calma o erro cometido. Se são ‘n’ elementos e se somarmos todas as freqüências, realmente o valor da soma será igual a n. www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 3 PROFESSOR: VÍTOR MENEZES No exemplo acima, onde temos 10 elementos, somando todas as freqüências obtemos, de fato, o número 10. Então qual o problema? O problema é que temos 10 elementos (1, 2, 2, 2, 3, 4, 4, 5, 6, 7), mas não temos dez valores de X i . Temos apenas 7. São eles: X 1 = 1; X 2 = 2 ; X 3 = 3 , X 4 = 4 , X 5 = 5 , X 6 = 6 , X 7 = 7 Consequentemente, temos sete valores de freqüência. São elas: f1 = 1 ; f 2 = 3 ; f 3 = 1 , f 4 = 2 , f 5 = 1 , f 6 = 1 , f 7 = 1 10 Portanto, na hora de somar todos os valores de freqüência, não podemos escrever ∑ f i . i =1 Esta simbologia significa que queremos somar dez valores de freqüência. Mas não há dez valores de freqüência. Há apenas 7. Então, para somar todos os valores de freqüência, neste caso, deveríamos escrever: 7 ∑ f i = ? i 1= E o resultado seria: 7 ∑ f i = 1 + 3 + 1 + 2 + 1 + 1 + 1 = 10 i 1= A correção a ser feita na aula passada é essa. Na hora de somar todas as freqüências, ‘i’ vai de 1 até 7. Vamos à matéria de hoje! VII MEDIDAS SEPARATRIZES Medidas separatrizes são medidas que separam os dados de formas bem específicas. Uma medida separatriz que nós já estudamos é a mediana. Quando a vimos pela primeira vez, dissemos que ela era uma medida de tendência central. Ela, assim como a média e a moda, fornece pontos em torno dos quais os dados “giram”. Além de ser uma medida de tendência central, ela também é uma medida separatriz. Isto porque ela separa os dados de uma forma bem específica. Sendo a mediana o termo do meio, ela deixa metade dos dados à sua esquerda e a outra metade à sua direita. O nosso ROL do começo do curso (pesquisa salarial no bairro Nova Vila) era: 1, 2, 2, 2, 3, 4, 4, 5, 6, 7. A mediana foi calculada com sendo 3,5. Ora, temos 5 valores menores que 3,5 (são eles: 1, 2, 2, 2, 3). E temos outros 5 valores maiores que 3,5 (4, 4, 5, 6, 7). Por isto a mediana é uma medida separatriz. Ela separa os dados em duas partes iguais. E esta foi a única medida separatriz que nós vimos. Outra medida separatriz é o quartil. São três quartis, dividindo a seqüência de dados em quatro partes iguais (em quatro partes com o mesmo número de termos). www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 4 PROFESSOR: VÍTOR MENEZES O primeiro quartil separa a seqüência de dados de forma que à sua esquerda fiquem 25% dos valores e à sua direita 75%. Assim, o primeiro quartil é o valor que não é superado por 25% das observações. O segundo quartil coincide com a mediana, deixando 50% dos valores de cada lado. O terceiro quartil deixa à sua esquerda 75% dos valores e à sua direita 25%. Logo, o terceiro quartil é o valor que não é superado por 75% das observações. Outra medida separatriz é o decil. São nove decis que dividem a série em dez partes iguais. O primeiro decil deixa à sua esquerda 10% dos valores; à sua direita 90% (ou seja, não é superado por 10% das observações). O segundo decil deixa à sua esquerda 20% dos valores; à sua direita 80%. E assim por diante. O quinto decil coincide com a mediana, deixando 50% dos valores de cada lado. A última medida separatriz que veremos é o percentil. O primeiro percentil deixa à sua esquerda 1% dos valores e à sua direita 99% (ou seja, não é superado por 1% das observações). O segundo percentil deixa à sua esquerda 2% dos valores e à sua direita 98%. E assim por diante. O qüinquagésimo percentil coincide com a mediana, deixando 50% dos valores de cada lado. Então, resumindo as medidas separatrizes que estudaremos, temos: a mediana, os quartis, os decis, os percentis. Quando os dados estão em ROL ou agrupados por valor, o cálculo das medidas separatrizes pode ser meio complicado. Para a mediana, nós vimos que bastava identificar o termo central. Ou, caso o conjunto tivesse um número par de termos, bastava identificar os dois termos centrais e fazer a média. Para as demais medidas, a maneira de calcular varia bastante. Costumo dizer que “vai do gosto do freguês”. Talvez por isso dificilmente caia em prova. Em seguida, veremos alguns exercícios de concursos, tirados de provas específicas para a área de estatística. Antes, vamos ver um exemplo. Neste ponto específico, vou utilizar a mesma idéia apresentada no livro “Estatística Aplicada à Economia, Administração e Contablidade”, dos autores John Freund e Gary Simon. Os autores trabalham com um exemplo envolvendo quartis, demonstrando que “há vasto campo para a arbitrariedade na definição do quartil inferior Q1 e do quartil superior Q3”. Então é isso. O exemplo abaixo é uma adaptação dos exemplos do livro citado. Estamos pesquisando as alturas das crianças de uma escola. Selecionamos doze crianças. Medimos suas alturas, obtendo o seguinte rol (valores em metros): 1,40; 1,41; 1,44; 1,45; 1,46; 1,47; 1,49; 1,51; 1,52; 1,53; 1,55; 1,56. São doze valores. Se vamos dividir o ROL em quatro partes iguais, cada parte terá três elementos. Ficaremos com: www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 5 PROFESSOR: VÍTOR MENEZES 1,40; 1,41; 1,44; 1,45; 1,46; 1,47; 1,49; 1,51; 1,52; 1,53; 1,55; 1,56 Acima temos as quatro partes de três elementos. Portanto, quatro partes iguais. Neste exemplo, uma forma de determinar os quartis poderia ser a que segue: tomamos os números que ficam perto das “fronteiras” entre as partes e fazemos a média entre eles. A primeira parte termina no 1,44. A segunda parte começa no 1,45. Fazendo a média entre eles temos: ,1 44 + ,1 45 = ,1 445 2 Assim, o primeiro quartil seria 1,445 ( 1 Q = ,1 445 ). A segunda parte termina no 1,47. A terceira parte começa no 1,49. Fazendo a média entre eles temos: ,1 47 + ,1 49 = ,1 48 2 O segundo quartil (que coincide com a mediana) é 1,48 ( Q2 = ,1 48 ). A terceira parte termina no 1,52. A quarta parte começa no 1,53. Fazendo a média entre eles temos: 1 52, + 1 53, = 1 525, 2 E o terceiro quartil é igual a 1,525 ( 3 Q = 1 525, ). Pronto, descobrimos os três quartis. Três valores que separam a série de dados em quatro partes iguais. 1,40; 1,41; 1,44; 1,45; 1,46; 1,47; 1,49; 1,51; 1,52; 1,53; 1,55; 1,56 Q1=1,445 Q2=1,48 Q3=1,525 Agora vamos mudar a situação. Em vez de 12 crianças, medimos altura de apenas 11. A criança mais baixa, com 1,40, não foi analisada. O novo ROL, com 11 termos, fica: 1,41; 1,44; 1,45; 1,46; 1,47; 1,49; 1,51; 1,52; 1,53; 1,55; 1,56. E agora? 11 não é múltiplo de 4. Como separar a seqüência em quatro partes iguais? Bom, o segundo quartil sempre coincide com a mediana. Agora temos um número ímpar de elementos. Há um termo do meio, que é o sexto. A mediana é igual a 1,49. Portanto, o segundo quartil também é igual a 1,49. O problema é achar os demais quartis. Neste caso, podemos pensar que: · à direita do primeiro quartil existem três vezes mais termos que à sua esquerda; à esquerda do terceiro quartil existem três vezes mais termos que à sua direita; · o número de elementos entre Q1 e Q2 é igual ao número de elementos à esquerda de Q1, que é igual ao número de elementos à direita de Q3; · metade dos dados está entre Q1 e Q3. www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 6 PROFESSOR: VÍTOR MENEZES Quando a seqüência tinha 12 termos (múltiplo de quatro) todas estas propriedades foram satisfeitas (pode conferir). Agora, quando a seqüência tem apenas 11 termos, não é possível fazer com que todas sejam observadas ao mesmo tempo. Adotando a segunda propriedade, poderíamos determinar os quartis do seguinte modo: 1,41; 1,44; 1,45; 1,46; 1,47; 1,49; 1,51; 1,52; 1,53; 1,55; 1,56 Q1=1,45 Q2=1,49 Q3=1,53 Mas observe que as demais propriedades não foram satisfeitas. Pois bem, este mesmo problema enfrentado com os quartis acontece com todas as demais medidas separatrizes (decis e percentis). Foi por isso que não estudamos as medidas separatrizes nas aulas anteriores, quando vimos dados em ROL e agrupados por valor. Talvez, devido a este tipo de problema, não seja comum a cobrança de tais medidas em provas de concursos (para dados em ROL ou agrupados por valor). No caso específico de quartis, ainda se vê cobrança vez ou outra (seguem exemplos na seqüência, tirados de provas voltadas para a área de estatística). E o método que se costuma utilizar para determinar o valor dos quartis é sempre o mesmo e acaba correspondendo à aplicação da segunda propriedade. O segundo quartil divide a seqüência em duas partes iguais. Consideramos que o primeiro quartil é a mediana da primeira parte. E o terceiro quartil é a mediana da segunda parte. EC 1 EXERCÍCIOS DE CONCURSOS AFC/CGU - 2008. Área: Estatística e cálculos atuariais. [ESAF] [Conjunto de dados da questão anterior: 58, 95, 17, 44, 63, 9, 57, 21, 88, 12, 31, 28, 73, 5 e 56]. Dado o conjunto de dados da questão anterior, determine a amplitude interquartilica Q3 – Q1. a) 33. b) 37. c) 40. d) 46. e) 51. Vamos obter o ROL. ROL: 5, 9, 12, 17, 21, 28, 31, 44, 56, 57, 58, 63, 73, 88, 95. Amplitude interquartílica ou intervalo interquartil nada mais é que a diferença entre o terceiro quartil ( 3Q ) e o primeiro quartil ( 1Q ) . Este conceito é muito importante, pois não são raras as questões que exigem seu conhecimento. www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 7 PROFESSOR: VÍTOR MENEZES Amplitude interquartílica (ou intervalo interquartílico): Diferença entre o terceiro quartil e o primeiro quartil. Vamos encontrar os quartis Q3 e Q1. O primeiro quartil é o valor que deixa à sua esquerda 25% dos dados e à sua esquerda 75%. O terceiro quartil é o valor que deixa à sua esquerda 75% dos dados e à sua direita 25%. Só que a série tem 15 dados. 25% de 15 é um número quebrado. Da mesma forma, 75% de 15 também não é um número inteiro. Como fazer? Nestes casos, como já dissemos, há diferentes formas de se encontrar os quartis. Vai “do gosto do freguês”. A forma necessária para resolver a questão era: Primeiro: encontramos a mediana. A mediana deste conjunto nós já calculamos na aula 1, em que resolvemos um outro exercício da mesma prova. Foi lá no EC 17. A mediana é 44. A mediana separa os dados em duas partes iguais (com sete termos cada uma). Segundo: assumimos que o primeiro quartil é a mediana da primeira parte. A primeira parte tem os seguintes termos: 5, 9, 12, 17, 21, 28, 31. São sete termos. O do meio é o quarto (=17). O primeiro quartil é igual a 17. Q1 = 17 Terceiro: assumimos que o terceiro quartil é a mediana da segunda parte. A segunda parte tem os seguintes termos: 56, 57, 58, 63, 73, 88, 95 São sete termos. O do meio é o quarto. O terceiro quartil é 63. Q3 = 63 A amplitude interquartílica fica: Q3 − 1 Q = 63 − 17 = 46 Resposta: D Mais um exemplo: EC 2 Analista CVM 2001 [ESAF] www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 8 PROFESSOR: VÍTOR MENEZES Uma firma distribuidora de eletrodomésticos está interessada em estudar o comportamento de suas contas a receber em dois meses consecutivos. Com este objetivo, seleciona, para cada mês, uma amostra de 50 contas. As observações amostrais constam da tabela seguinte: Valor (R$) Freqüência de março Freqüência de abril 1.000,00 6 10 3.000,00 13 14 5.000,00 12 10 7.000,00 15 13 9.000,00 4 - 11.000,00 - 3 Assinale a opção que corresponde ao intervalo interquartílico, em reais, para o mês de março. a) 3.250,00 b) 5.000,00 c) 4.000,00 d) 6.000,00 e) 2.000,00 Intervalo interquartílico corresponde à diferença entre o terceiro quartil e o primeiro quartil. Valor (R$) Freqüência de março Freqüência acumulada de março 1.000,00 6 6 3.000,00 13 19 5.000,00 12 31 7.000,00 15 46 9.000,00 4 50 Vamos encontrar a mediana. São 50 termos. Temos dois elementos centrais: o 25º e o 26º. O 19º termo é igual a 3.000. O 20º, o 21º, o 22º, .... e o 31º termo são iguais a 5.000. Portanto, o 25º e o 26º termos são iguais a 5.000. A mediana fica: D = 5.000 A mediana divide o conjunto de dados em duas partes. A primeira parte tem 25 termos. O termo do meio é o 13º. O 13º termo é igual a 3.000. Assumimos que a mediana da primeira parte é o primeiro quartil. Q1 = 3.000 A segunda parte tem 25 termos. O do meio é o 13º. O 1º termo da segunda parte é o 26º termo da seqüência inteira. Portanto, o 13º termo da segunda parte é o 38º termo da seqüência inteira. O 38º termo é igual a 7.000. www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 9 PROFESSOR: VÍTOR MENEZES Vamos assumir que a mediana da segunda parte corresponde ao terceiro quartil. Q3 = 7 000. Logo, o intervalo interquartil fica: Q3 − 1 Q = 7 000. − 3 000. = 4 000. Resposta: C. Pronto. Vimos exemplos de exercícios de cálculo de medidas separatrizes para dados em ROL e dados agrupados por valor. Pelas dificuldades já comentadas, acaba sendo um assunto pouco cobrado. De qualquer modo, faço alguns comentários adicionais em anexo. O que realmente cai em prova, e cai bastante, é o cálculo de medidas separatrizes para dados agrupados em classes. Eu diria que, de toda a estatística descritiva, este é o assunto mais importante, justamente porque é o mais cobrado em concursos. A representação dos dados na forma “agrupados em classes” é comum quando o número de observações é muito grande. Nestas situações, os problemas que vimos na determinação das medidas separatrizes tornam-se irrelevantes. Especialmente considerando-se que nem acesso a todos os dados nós temos (ou seja, obrigatoriamente considerações têm que ser feitas). Quando os dados estão agrupados em classes, não há mais “vasto campo de arbitrariedade” na determinação dos quartis (ou dos decis, ou dos percentis). O método é sempre o mesmo. Para resolver exercícios de medidas separatrizes para dados agrupados em classes, utilizamos interpolação linear. Vai funcionar mais ou menos assim. Precisamos trabalhar com valores de freqüências acumuladas (não importa se absolutas ou relativas, importa que sejam acumuladas). Neste ponto a conta é diferente de média e moda. Lembram? Para média e moda sempre usamos freqüências simples. Para medidas separatrizes (incluindo mediana) é o contrário: freqüências acumuladas. Para determinados valores de freqüências acumuladas, saberemos muito bem quais os valores da nossa seqüência de dados são correspondentes. Para outros, não. Estes outros valores nós determinaremos por meio da interpolação linear. Novamente: se tivéssemos que apontar um tópico de estatística descritiva como o mais cobrado em concursos, seria exatamente este. O cálculo de medidas separatrizes para dados agrupados em classes utilizando interpolação linear. Vamos a alguns exercícios para ver como fica. EC 3 AFRF – 2003 [ESAF] Considere a tabela de freqüências seguinte correspondente a uma amostra da variável X. Não existem observações coincidentes com os extremos das classes. Classes Freqüências Acumuladas 2.000 – 4.000 5 4.000 – 6.000 16 6.000 – 8.000 42 8.000 – 10.000 77 10.000 – 12.000 89 12.000 – 14.000 100 Assinale a opção que corresponde à estimativa do valor x da distribuição amostral de X que não é superado por cerca de 80% das observações. a) 10.000 www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 10 PROFESSOR: VÍTOR MENEZES b) 12.000 c) 12.500 d) 11.000 e) 10.500 Questão da ESAF. A pergunta pode ser resumida como: qual o valor do oitavo decil? Ou seja, quer se saber qual valor deixa à sua esquerda 80% dos dados. Ou ainda, qual valor não é superado por 80% das observações. O primeiro passo é verificar se as freqüências dadas são acumuladas. Para medidas separatrizes, sempre devemos utilizar freqüências acumuladas. Não importa se forem absolutas ou relativas. Basta que sejam acumuladas. Lembre que aqui é o contrário do cálculo para média e moda. Para média e moda sempre utilizamos freqüências simples. No caso, o exercício já deu as freqüências acumuladas. Não temos que fazer nenhuma transformação. Antes de responder à pergunta, vamos relembrar um pouco do significado de uma tabela de freqüências acumuladas. Observe a linha em vermelho. O que ela significa? Classes Freqüências Acumuladas 2.000 – 4.000 5 4.000 – 6.000 16 6.000 – 8.000 42 8.000 – 10.000 77 10.000 – 12.000 89 12.000 – 14.000 100 O que significa dizer que a freqüência acumulada da classe 8.000 – 10.000 é igual a 77? Significa que temos 77 valores de X nesta classe ou nas classes anteriores. Significa que temos 77 valores de X entre 2.000 e 10.000. E se a pergunta fosse: qual o valor que não é superado por 77% das observações? Se a pergunta fosse essa, não precisaríamos fazer nenhuma conta. Bastaria olhar direto na tabela. Se 77 valores de X estão entre 2.000 e 10.000, concluímos que o valor de X que não é superado por 77% das observações é justamente 10.000. Classes Freqüências Acumuladas 2.000 – 4.000 5 4.000 – 6.000 16 6.000 – 8.000 42 8.000 – 10.000 77 10.000 – 12.000 89 12.000 – 14.000 100 O valor 10.000 não é superado por 77% observações E se a pergunta fosse: qual o valor não é superado por 89% das observações? Novamente, não precisaríamos fazer nenhuma conta. Bastaria olhar na tabela. Veja a linha em vermelho. www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 11 PROFESSOR: VÍTOR MENEZES Classes Freqüências Acumuladas 2.000 – 4.000 5 4.000 – 6.000 16 6.000 – 8.000 42 8.000 – 10.000 77 10.000 – 12.000 89 12.000 – 14.000 100 Temos 89 valores entre 2.000 e 12.000. Ou seja, 12.000 não é superado por 89% das observações. Classes Freqüências Acumuladas 2.000 – 4.000 5 4.000 – 6.000 16 6.000 – 8.000 42 8.000 – 10.000 77 10.000 – 12.000 89 12.000 – 14.000 100 O valor 12.000 não é superado por 89% observações O problema é que a pergunta foi qual o valor não é superado por 80% das observações. E na coluna de freqüências acumuladas não temos o valor 80. Logo, não temos como saber qual é o valor de X que não é superado por 80% das observações. O que faremos? Vamos “chutar”. Vamos fazer uma consideração. Vamos considerar que o gráfico dos valores de freqüências acumuladas versus valores de X se comporta como um conjunto de segmentos de reta. Neste curso nós não vamos ficar desenhando gráficos de segmentos de reta. Vamos só utilizar o resultado destes gráficos. Classes Freqüências Acumuladas 2.000 – 4.000 5 4.000 – 6.000 16 6.000 – 8.000 42 8.000 – 10.000 77 10.000 – 12.000 89 12.000 – 14.000 100 Sabemos que o valor 10.000 corresponde a uma freqüência acumulada de 77. Sabemos que o valor 12.000 corresponde a uma freqüência acumulada de 89. A pergunta é: quem corresponde a 80? (vamos chamar de Z) Sabemos que 80 está entre 77 e 89. Portanto, o valor que a ele corresponde tem que estar entre 10.000 e 12.000. 10.000 77 10.000 corresponde a 77 Z = ? 80 Quem corresponde a 80? 12.000 89 12.000 corresponde a 89 www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 12 PROFESSOR: VÍTOR MENEZES Na interpolação linear, nós vamos fazer o seguinte. Fazemos a segunda linha menos a primeira. Fazemos a terceira linha menos a primeira. Primeira linha 10.000 77 Segunda linha Z 80 Terceira linha 12.000 89 Subtraindo, ficamos com: Z − 10.000 12.000 − 10.000 80 − 77 89 − 77 A interpolação linear nos diz que as diferenças das linhas de baixo com a linha de cima são proporcionais. Z − 10 000. = 80 − 77 12 000. − 10 000. 89 − 77 Isolando o Z, temos: Z = 10 000. Z = 10 500. + 2 000. × 3 12 Concluindo: O valor 10.500 não é superado por 80 observações. Resposta: letra E. Antes de passarmos para o próximo exercício, vamos mostrar graficamente o que foi feito. Para os dados fornecidos, podemos construir a seguinte tabela de freqüências acumuladas: Valores F 2.000 0 4.000 5 6.000 16 8.000 42 10.000 77 12.000 89 14.000 100 Podemos plotar estes valores num gráfico. www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 13 PROFESSOR: VÍTOR MENEZES 100 80 60 40 20 0 0 2.000 4.000 6.000 8.000 10.000 12.000 14.000 Valores Ou seja, para alguns valores, sabemos exatamente as respectivas freqüências acumuladas. Mas não sabemos qual valor corresponde à freqüência acumulada 80 (ou qual o oitavo decil). Assim, supomos que o gráfico acima é composto por diversos segmentos de retas que unem os pontos conhecidos. 100 80 60 40 20 0 0 2.000 4.000 6.000 8.000 10.000 12.000 14.000 Valores Com esta suposição, passamos a ter, para qualquer freqüência acumulada, a respectiva observação. E vice-versa. Esta suposição de que o gráfico é formado por segmentos de reta é justamente a interpolação linear. O gráfico acima é por vezes chamado de ogiva de Galton. E a interpolação linear acaba sendo chamada de interpolação da Ogiva. Mas estes são só nomes diferentes para a mesma coisa. Assim, em vez de resolvermos o exercício da forma como fizemos, poderíamos trabalhar diretamente com o gráfico. Mas como ficar desenhando gráfico é meio trabalhoso, vou fazer uma vez só. A pergunta é: qual valor corresponde à freqüência acumulada 80? www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 14 PROFESSOR: VÍTOR MENEZES 100 80 60 40 20 0 0 2.000 4.000 6.000 8.000 10.000 12.000 14.000 Valores Z=? Ou ainda: qual o valor de Z da figura acima? Vamos analisar apenas uma parte do gráfico. Vamos olhar apenas para o último segmento de reta. 89 86 83 80 77 10.000 12.000 Z=? Valores Podemos visualizar dois triângulos no gráfico acima. O primeiro, menor, destacado em verde: www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 15 PROFESSOR: VÍTOR MENEZES A altura deste triângulo é igual a 3 (=80-77). A base deste triângulo é igual a ( Z − 10.000 ). Há um outro triângulo, maior, destacado em laranja: A altura deste triângulo maior é 12 (=89-77). Sua base é igual a 2.000 (=12.000 – 10.000). Esses dois triângulos são semelhantes. Portanto, a relação entre as alturas é igual à relação entre as bases. Assim: base _ triangulo _ verde = altura _ triangulo _ verde base _ triangulo _ laranja Z − 10 000. = 3 altura _ triangulo _ laranja 2 000. 12 E foi exatamente desta igualdade que partimos para resolver o problema. Ou seja, esta igualdade nada mais é que o resultado da semelhança de triângulos, triângulos estes obtidos por causa da interpolação linear. Aqui no curso on line, acho que não é muito proveitoso ficar resolvendo os exercícios diretamente no gráfico. Portanto, nos próximos exercícios de concursos, faremos o primeiro procedimento visto, achando as três linhas, subtraindo as duas de baixo pela de cima. EC 4 AFRF/2002-2 [ESAF] O atributo do tipo contínuo X, observado como um inteiro, numa amostra de tamanho 100 obtida de uma população de 1000 indivíduos, produziu a tabela de freqüências seguinte: Classes Freqüência ( f ) 29,5-39,5 4 39,5-49,5 8 49,5-59,5 14 59,5-69,5 20 69,5-79,5 26 79,5-89,5 18 www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 16 PROFESSOR: VÍTOR MENEZES 89,5-99,5 10 Assinale a opção que corresponde à estimativa da mediana amostral do atributo X. a) 71,04 b) 65,02 c) 75,03 d) 68,08 e) 70,02 Questão da ESAF. A pergunta é: qual a mediana? Ou seja, temos que calcular o valor que deixa à sua esquerda 50% das observações. Ou ainda: o valor que não é superado por 50% das observações. Antes de começar qualquer conta, vejamos as freqüências fornecidas. São freqüências simples. Temos que passá-las para freqüências acumuladas. Classes Freqüência simples ( f ) Freqüência acumulada (F) 29,5-39,5 4 4 39,5-49,5 8 12 49,5-59,5 14 26 59,5-69,5 20 46 69,5-79,5 26 72 79,5-89,5 18 90 89,5-99,5 10 100 Não temos o valor 50 na coluna de freqüências acumuladas. E se a pergunta fosse: qual o valor que não é superado por 46 observações? A resposta seria: 69,5. Sem fazer contas. Basta a leitura da tabela. Se a pergunta fosse: qual o valor que não é superado por 72 observações? A resposta seria: 79,5. Também, sem contas. Classes Freqüência acumulada (F) 29,5-39,5 4 39,5-49,5 12 49,5-59,5 26 59,5-69,5 46 69,5-79,5 72 79,5-89,5 90 89,5-99,5 100 Mas a pergunta é sobre o valor que não é superado por 50 observações. Este dado não tem na tabela. Mas sabemos que 50 está entre 46 e 72. Portanto, o valor procurado está entre 69,5 e 79,5. 69,5 46 69,5 corresponde a 46 Z 50 Quem corresponde a 50? 79,5 72 79,5 corresponde a 72 www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 17 PROFESSOR: VÍTOR MENEZES Primeira linha 69,5 46 Segunda linha Z 50 Terceira linha 79,5 72 Subtraindo as linhas: Z − 69 5, 50 − 46 79 5, − 69 5, 72 − 46 Essas diferenças são proporcionais: Z − 69 5, = 50 − 46 79 5, − 69 5, 72 − 46 Z = 69 5, + 10 × 4 � 71 04, 26 Resposta: A. Para fugir do denominador 26, dava para aproximar a fração. Ficaria assim: Z = 69 5, + 10 × 4 � 69 5, 26 + 10 × 4 = 69 5, 25 + 8 = 69 5, 5 + 1 6, = 7110, Quando trocamos o denominador 26 por 25, nós aumentamos um pouco o valor de Z. Portanto, Z é, na verdade, um pouco menor que 71,10. Vejamos a questão a seguir, ligeiramente diferente. EC 5 Auditor Fiscal ICMS/BA – 2004 [FCC] Considere a tabela abaixo que mostra a distribuição de salários (em reais) de 160 funcionários de determinada empresa, com suas respectivas freqüências relativas acumuladas. Classes em reais Freqüência relativa acumulada (%) [600,1000) 10 [1000,1400) 30 [1400,1800) 70 [1800,2200) 95 [2200,2600) 100 Utilizando a interpolação linear, o número de funcionários que ganham salários menores ou iguais a R$ 1.700,00 é: a) 96 b) 84 c) 72 d) 64 e) 56 E se a pergunta fosse qual o valor de freqüência acumulada corresponde a 1.400? Neste caso, não precisaríamos fazer contas. A resposta seria 30%. www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 18 PROFESSOR: VÍTOR MENEZES E se a pergunta fosse: qual o valor de freqüência acumulada corresponde a 1.800? Também não precisaríamos de contas. A resposta seria 70%. Classes em reais Freqüência relativa acumulada (%) [600,1000) 10 [1000,1400) 30 [1400,1800) 70 [1800,2200) 95 [2200,2600) 100 Só que queremos saber o valor de freqüência acumulada que corresponde a 1.700. Sabemos que 1.700 está entre 1.400 e 1.800. Logo, o valor de freqüência acumulada correspondente deve estar entre 30% e 70%. 1.400 30% 1.400 corresponde a 30% 1.700 W 1.700 corresponde a quem? 1.800 70% 1.800 corresponde a 70% Primeira linha 1.400 30% Segunda linha 1.700 W Terceira linha 1.800 70% Subtraindo as linhas: 1.700 − 1.400 W − 0 3, 1.800 − 1.400 0 7, − 0 3, Fazendo as razões: 1 700. − 1 400. = W − 0 3, 1 800. − 1 400. 0 7, − 0 3, Isolando o W: W = ,0 4 × 300 + 0 3, 400 = 0 6, Ou seja, sabemos que a freqüência acumulada correspondente a 1.700 é de 60%. O que isso significa? Que 60% das pessoas ganham R$ 1.700,00 ou menos. Como foram entrevistados 160 funcionários, temos: 60 ×160 = 96 100 96 funcionários ganham R$ 1.700 ou menos. Resposta: A. www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 19 PROFESSOR: VÍTOR MENEZES EC 6 Auditor Fiscal ICMS/BA – 2004 [FCC] Considere a tabela abaixo que mostra a distribuição de salários (em reais) de 160 funcionários de determinada empresa, com suas respectivas freqüências relativas acumuladas. Classes em reais Freqüência relativa acumulada (%) [600,1000) 10 [1000,1400) 30 [1400,1800) 70 [1800,2200) 95 [2200,2600) 100 O valor absoluto da diferença entre a mediana, obtida por interpolação linear, e a média aritmética dos salários, em reais, é [considere que você já sabe que a média é 1580]: a) 20 b) 80 c) 100 d) 200 e) 300 A média desta seqüência de dados nós já achamos. Ela vale 1580 (ver EC 4 da aula passada). Passemos à mediana de X. Classes em reais Freqüência relativa acumulada (%) [600,1000) 10 [1000,1400) 30 [1400,1800) 70 [1800,2200) 95 [2200,2600) 100 Podemos montar o seguinte quadro: 1400 30% 1400 corresponde a 30% D 50% Quem corresponde a 50%? 1800 70% 1800 corresponde a 70% Olha como a questão veio generosa. 50% está exatamente no meio, entre 30% e 70%. Consequentemente, a mediana (=D) estará bem no meio entre 1400 e 1800. D = 1400 + 1800 = 1600 2 De todo modo, vamos manter o procedimento de sempre. Primeira linha 1400 30% Segunda linha D 50% Terceira linha 1800 70% www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 20 PROFESSOR: VÍTOR MENEZES Subtraindo as linhas: Fazendo as razões: D − 1400 = 50 − 30 D − 1400 1800 − 1400 50 − 30 70 − 30 1800 − 1400 Isolando o D: 70 − 30 D = 400 × 20 + 1400 = 1600 40 A diferença entre a mediana e a média é: D − X = 1600 − 1580 = 20 Resposta: A. EC 7 Fiscal ICMS/PA – 2002 [ESAF] A tabela de freqüências abaixo apresenta as freqüências acumuladas (F) correspondentes a uma amostra da distribuição dos salários anuais de economistas (Y) – em R$ 1.000,00, do departamento de fiscalização da Cia. X. Não existem realizações de Y coincidentes com as extremidades das classes salariais. Classes F 29,5 – 39,5 2 39,5 – 49,5 6 49,5 – 59,5 13 59,5 – 69,5 23 69,5 – 79,5 36 79,5 – 89,5 45 89,5 – 99,5 50 Assinale a opção que corresponde ao valor z, obtido por interpolação da ogiva, que, estima-se, não é superado por 80% das realizações de Y. a) 82,0 b) 80,0 c) 83,9 d) 74,5 e) 84,5 As freqüências fornecidas são acumuladas. Como o problema é de medidas separatrizes, não precisamos fazer nenhuma transformação. O valor Z que não é superado por 80% das observações é o oitavo decil. Ou ainda, o 80º percentil. www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 21 PROFESSOR: VÍTOR MENEZES São 50 observações ao todo. Como sabemos disto? Basta ver a última linha de freqüência acumulada. Lembrem-se de que o último valor de freqüência acumulada é sempre igual a n. Portanto, n = 50 . São 50 valores na amostra. 80% de 50 é igual a 40. Assim, queremos saber qual o valor Z que não é superado por 40 observações. Se a pergunta fosse sobre o valor que não é superado por 45 observações, não precisaríamos fazer conta. A resposta seria 89,5. Bastava consultar a tabela fornecida. Se a pergunta fosse qual o valor que não é superado por 36 observações, também bastaria consulta direta à tabela. A resposta seria 79,5. Mas a pergunta foi qual o valor que não é superado por 40 observações. E 40 não tem na nossa coluna de freqüência acumulada. Vamos, portanto, fazer a interpolação linear. Classes F 29,5 – 39,5 2 39,5 – 49,5 6 49,5 – 59,5 13 59,5 – 69,5 23 69,5 – 79,5 36 79,5 – 89,5 45 89,5 – 99,5 50 Sabemos que: Ou seja: 79,5 36 79,5 corresponde a 36 Z 40 Quem corresponde a 40??? 89,5 45 89,5 corresponde a 45 Primeira linha 79,5 36 Segunda linha Z 40 Terceira linha 89,5 45 Subtraindo as linhas: Z – 79,5 40 – 36 89,5 – 79,5 45 - 36 A interpolação linear nos diz que estas diferenças são proporcionais: Z − 79 5, = 40 − 36 89 5, − 79 5, 45 − 36 Z − 79 5, = 4 10 9 Z = 40 + 79 5, 9 Resposta: C. = 83 944, Para fugir do denominador 9 dava para aproximar a fração. Z = 40 + 79 5, 9 � 40 + 79 5, 10 = 83 5, www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 22 PROFESSOR: VÍTOR MENEZES Quando nós trocamos o denominador 9 por 10, nós diminuímos um pouco o valor de Z. Portanto, na verdade, Z é um pouco maior que 83,5. EC 8 Fiscal ICMS PI - 2001 [ESAF] A tabela abaixo mostra a distribuição de freqüência obtida de uma amostra aleatória dos salários anuais em reais de uma firma. As freqüências são acumuladas. Classes de salário Freqüências 5.000 – 6.500 12 6.500 – 8.000 28 8.000 – 9.500 52 9.500 – 11.000 74 11.000 – 12.500 89 12.500 – 14.000 97 14.000 – 15.000 100 Deseja-se estimar, via interpolação da ogiva, o nível salarial populacional que não é ultrapassado por 79% da população. Assinale a opção que corresponde a essa estimativa. a) R$ 10.000,00 b) R$ 9.500,00 c) R$ 12.500,00 d) R$ 11.000,00 e) R$ 11.500,00 As freqüências fornecidas são acumuladas. Como o problema é de medidas separatrizes, não precisamos fazer nenhuma transformação. O valor Z que não é superado por 79% das observações é o 79º percentil. São 100 observações ao todo. Como sabemos disto? Basta ver a última linha de freqüência acumulada. Lembrem-se de que o último valor de freqüência acumulada é sempre igual a n. Portanto, n = 100 . São 100 valores na amostra. 79% de 100 é igual a 79. Assim, queremos saber qual o valor Z que não é superado por 79 observações. Se a pergunta fosse qual o valor que não é superado por 74 observações, não precisaríamos fazer conta. A resposta seria 11.000. Direto, sem fazer contas. Bastava consultar a tabela fornecida. Se a pergunta fosse qual o valor que não é superado por 89 observações, também bastaria consulta direta à tabela. A resposta seria 12.500. Mas a pergunta foi qual o valor que não é superado por 79 observações. E 79 não tem na nossa coluna de freqüência acumulada. Vamos, portanto, fazer a interpolação linear. Classes de salário Freqüências 5.000 – 6.500 12 6.500 – 8.000 28 8.000 – 9.500 52 9.500 – 11.000 74 11.000 – 12.500 89 12.500 – 14.000 97 www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 23 PROFESSOR: VÍTOR MENEZES 14.000 – 15.000 100 Sabemos que: 11.000 74 11.000 corresponde a 74 Z 79 Quem corresponde a 79??? 12.500 89 12.500 corresponde a 89 Antes de continuarmos as contas, olha só que interessante. 79 está entre 74 e 89. Portanto, o número que corresponde a 79 (que estamos chamando de Z) está entre 11.000 e 12.500. Pronto. Só aí já eliminamos as alternativas A, B, C e D. A resposta só pode ser letra E. Continuando com a resolução: Primeira linha 11.000 74 Segunda linha Z 79 Terceira linha 12.500 89 Subtraindo as linhas: Z – 11.000 79-74 12.500 – 11.000 89 - 74 A interpolação linear nos diz que estas diferenças são proporcionais: Z − 11 000. = 79 − 74 12 500. − 11 000. 89 − 74 Z − 11 000. = 5 1 500. 15 Z = 500 + 11.000 = 11.500 Resposta: E. EC 9 Auditor ISS/Recife - 2003 [ESAF] O quadro seguinte apresenta a distribuição de freqüências da variável valor do aluguel (X) para uma amostra de 200 apartamentos de uma região metropolitana de certo município. Não existem observações coincidentes com os extremos das classes. Assinale a opção que corresponde à estimativa do valor Z tal que a freqüência relativa de observações de X menores ou iguais a Z seja 80%. Classes R$ Freqüências 350 – 380 3 380 – 410 8 410 – 440 10 440 – 470 13 470 – 500 33 500 – 530 40 530 – 560 35 560 – 590 30 590 – 620 16 www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 24 PROFESSOR: VÍTOR MENEZES a) 530 b) 560 c) 590 d) 578 e) 575 620 - 650 12 No fundo, o que se pede é o oitavo decil (ou ainda, o octogésimo percentil). Ou seja, é um problema de medidas separatrizes, que é resolvido por interpolação linear, baseada em freqüências acumuladas. Foram fornecidas freqüências simples. Precisamos passá-las para acumuladas. Classes R$ Freqüências Simples Freqüências Acumuladas Memória de cálculo 350 – 380 3 3 =3 380 – 410 8 11 =3+8 410 – 440 10 21 =11+10 440 – 470 13 34 =21+13 470 – 500 33 67 =34+33 500 – 530 40 107 =67+40 530 – 560 35 142 =107+35 560 – 590 30 172 =142+30 590 – 620 16 188 =172+16 620 – 650 12 200 =188+12 São 200 observações ao todo. 80% de 200 é igual a 160. Assim, queremos saber qual o valor Z que não é superado por 160 observações. Se a pergunta fosse qual o valor que não é superado por 142 observações, não precisaríamos fazer conta. A resposta seria 560. Consulta direta à tabela. Se a pergunta fosse qual o valor que não é superado por 172 observações, também bastaria consulta direta à tabela. A resposta seria 590. Mas a pergunta foi qual o valor que não é superado por 160 observações. E 160 não tem na nossa coluna de freqüência acumulada. Vamos, portanto, fazer a interpolação linear. Classes R$ Freqüências Acumuladas 350 – 380 3 380 – 410 11 410 – 440 21 440 – 470 34 470 – 500 67 500 – 530 107 530 – 560 142 560 – 590 172 590 – 620 188 620 - 650 200 Sabemos que: www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 25 PROFESSOR: VÍTOR MENEZES 560 142 560 corresponde a 142 Z 160 Quem corresponde a 160??? 590 172 590 corresponde a 172 Antes de continuarmos as contas, vamos tentar arriscar uma resposta, por meio de contas mais rápidas. E se a pergunta fosse: que corresponde a 157? 157 está bem no meio entre 142 e 172. Portanto, o número que corresponde a 157 está bem no meio entre 560 e 590. � + O número que corresponde a 157 é 575 , pois: 575 = 560 590 � � 2 � Mas nós estamos procurando quem corresponde a 160. 160 é um pouquinho maior que 157. Portanto, o número que corresponde a 160 deve ser um pouquinho maior que 575. Já descartamos as letras A, B e E. Um bom chute é a letra D, que de fato é a resposta. Vamos continuar com a resolução usual: Primeira linha 560 142 Segunda linha Z 160 Terceira linha 590 172 Subtraindo as linhas: Z-560 160-142 590-560 172-142 A interpolação linear nos diz que estas diferenças são proporcionais: Z − 560 = 160 − 142 590 − 560 172 − 142 Z − 560 = 18 30 30 Z = 18 + 560 = 578 Resposta: D. AFRF/96 [ESAF] Texto para as questões EC 10 e EC 11 Distribuição de Freqüências das Idades dos funcionários da Empresa Alfa, em 1/1/90. Classes de idades (anos) if Ptos médios ( X i ) 37X i − 5 d= i d i × f i id 2 × f i id 3 f× i id 4 × f i 19,5-24,5 2 22 -3 -6 18 -54 162 24,5-29,5 9 27 -2 -18 36 -72 144 29,5-34,5 23 32 -1 -23 23 -23 23 www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 26 PROFESSOR: VÍTOR MENEZES 34,5-39,5 29 37 0 0 0 0 0 39,5-44,5 18 42 1 18 18 18 18 44,5-49,5 12 47 2 24 48 96 192 49,5-54,5 7 52 3 21 63 189 567 TOTAL 100 16 206 154 1106 EC 10 AFRF 96 [ESAF] Marque a opção que representa a mediana das idades dos funcionários em 1/1/90. a) 35,49 b) 35,73 c) 35,91 d) 37,26 e) 38,01 Foram fornecidas freqüências simples. Precisamos passar para freqüências acumuladas. Classes de idades (anos) f i iF Memória de cálculo 19,5-24,5 2 2 =2 24,5-29,5 9 11 =2+9 29,5-34,5 23 34 =11+23 34,5-39,5 29 63 =34+29 39,5-44,5 18 81 =63+18 44,5-49,5 12 93 =81+12 49,5-54,5 7 100 =93+7 Precisamos saber qual o valor não é superado por 50% das observações (=mediana). Como são 100 observações, precisamos saber qual valor não é superado por 50 observações. Classes de idades (anos) iF 19,5-24,5 2 24,5-29,5 11 29,5-34,5 34 34,5-39,5 63 39,5-44,5 81 44,5-49,5 93 49,5-54,5 100 Sabemos que: Ou seja: 34,5 34 34,5 corresponde a 34 Z 50 Quem corresponde a 50??? 39,5 63 39,5 corresponde a 63 Primeira linha 34,5 34 Segunda linha Z 50 Terceira linha 39,5 63 Subtraindo as linhas: Z-34,5 50-34 www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 27 PROFESSOR: VÍTOR MENEZES 39,5-34,5 63-34 A interpolação linear nos diz que estas diferenças são proporcionais: Z − 34 5, = 50 − 34 39 5, − 34 5, 63 − 34 Z − 34 5, = 16 5 Z = 34 5, 29 + 80 � ,37 26 29 Note que o denominador 29 atrapalha as contas. Tentando fugir do denominador 29, podemos aproximar a fração: Z = 34 5, + 80 � 34 5, 29 + 80 � 34 5, 30 + 2 66, = 37 16, Quando trocamos o denominador 29 por 30, nós diminuímos um pouco o valor de Z. Portanto, na verdade, Z é um pouco maior que 37,16. Resposta: D EC 11 AFRF 96 [ESAF] Sabe-se que o quadro de pessoal da empresa continua o mesmo em 1/1/96. Marque a opção que representa a mediana das idades dos funcionários em 1/1/96 a) 35,49 b) 36,44 c) 41,49 d) 41,91 e) 43,26 Agora nem precisa fazer muita conta. Se todos os valores foram aumentados em seis anos, a mediana também é aumentada em seis anos. A nova mediana fica: 37,26+6= 43,26 Resposta: E Algumas propriedades que vimos para média valem para mediana e moda. Se adicionarmos ou subtrairmos uma constante c em todos os valores da série de dados, a mediana e a moda sofrem a mesma alteração. Se multiplicarmos ou dividirmos todos os dados por uma constante c, a mediana e a moda sofrem a mesma alteração. O detalhe é que estas propriedades (aplicadas à mediana e moda) raramente são exigidas em prova. O que cai mesmo é saber as propriedades para a média. Este exercício do AFRF 96 é que foi uma exceção. www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 28 PROFESSOR: VÍTOR MENEZES EC 12 AFRF/2002-1 [ESAF] Em um ensaio para o estudo da distribuição de um atributo financeiro (X) foram examinados 200 itens de natureza contábil do balanço de uma empresa. Esse exercício produziu a tabela de freqüências abaixo. A coluna Classes representa intervalos de valores de X em reais e a coluna P representa a freqüência relativa acumulada. Não existem observações coincidentes com os extremos das classes. Classes P (%) 70-90 5 90-110 15 110-130 40 130-150 70 150-170 85 170-190 95 190-210 100 Assinale a opção que corresponde à estimativa do quinto decil da distribuição de X. a) 138,00 b) 140,00 c) 136,67 d) 139,01 e) 140,66 Quinto decil é sinônimo de mediana. É o valor que não é superado por 50% das observações. Foram dadas freqüências acumuladas. Não importa que sejam relativas. Basta que sejam acumuladas. Podemos começar a resolver a questão. Classes P (%) 70-90 5 90-110 15 110-130 40 130-150 70 150-170 85 170-190 95 190-210 100 Sabemos que: Ou seja: 130 40 130 corresponde a 40 Z 50 Quem corresponde a 50??? 150 70 150 corresponde a 70 Primeira linha 130 40 Segunda linha Z 50 Terceira linha 150 70 Subtraindo as linhas: Z-130 50-40 150-130 70-40 www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 29 PROFESSOR: VÍTOR MENEZES A interpolação linear nos diz que estas diferenças são proporcionais: Z − 130 = 50 − 40 150 − 130 70 − 40 Z − 130 = 10 20 30 Z = 130 + 20 � 136 66, 30 Resposta: C. Note que 50 está a uma distância de 10 em relação a 40 (50-40=10). E 50 está a uma distância de 20 em relação a 70 (70-50=20). A primeira distância é metade da segunda. Por isso, a distância de Z em relação a 130 (=6,66) é metade da distância de Z em relação a 150 (=13,34). EC 13 AFRF - 2001 [ESAF] Freqüências Acumuladas de Salários Anuais, em Milhares de Reais, da Cia. Alfa Classes de Salário Freqüências Acumuladas ( 3 ; 6] 12 ( 6 ; 9] 30 ( 9 ; 12] 50 (12 ; 15] 60 (15 ; 18] 65 (18 ; 21] 68 Suponha que a tabela de freqüências acumuladas tenha sido construída a partir de uma amostra de 10% dos empregados da Cia. Alfa. Deseja-se estimar, utilizando interpolação linear da ogiva, a freqüência populacional de salários anuais iguais ou inferiores a R$ 7.000,00 na Cia. Alfa. Assinale a opção que corresponde a este número. a) 180 b) 120 c) 150 d) 160 e) 130 Foram dadas freqüências acumuladas. Não precisamos fazer nenhuma transformação. Se a pergunta fosse: quantos empregados, na amostra feita, têm salários menores ou iguais a R$ 6.000, a resposta seria: 12. Basta consulta à tabela. Se a pergunta fosse: quantos empregados, na amostra feita, têm salários menores ou iguais a R$ 9.000,00, a resposta seria: 30. Novamente, basta consulta à tabela. Mas a pergunta foi: quantos funcionários têm salários menores ou iguais a R$ 7.000,00. Para este valor não temos informação na tabela. Precisamos fazer uma interpolação linear. www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 30 PROFESSOR: VÍTOR MENEZES Classes de Salário Freqüências Acumuladas ( 3 ; 6] 12 ( 6 ; 9] 30 ( 9 ; 12] 50 (12 ; 15] 60 (15 ; 18] 65 (18 ; 21] 68 Sabemos que: Ou seja: 6 12 6 corresponde a 12 7 W 7 corresponde a quem??? 9 30 9 corresponde a 30 Primeira linha 6 12 Segunda linha 7 W Terceira linha 9 30 Subtraindo as linhas: 7-6 W-12 9-6 30-12 A interpolação linear nos diz que estas diferenças são proporcionais: 7 − 6 = W − 12 9 − 6 30 − 12 18 + 12 = W 3 W = 18 OU seja, na amostra selecionada, 18 funcionários têm salários menores ou iguais a R$ 7.000,00. Só que não tem nenhuma opção com 18. Erramos em alguma coisa?? Não, nós não erramos nada. Os cálculos feitos foram todos referentes à amostra de 10% dos funcionários. Dentro desta amostra, 18 pessoas têm salários menores ou iguais a R$ 7.000,00. Só que a pergunta do exercício foi outra. Considerando toda a empresa (e não apenas a amostra feita), quantos funcionários têm salários menores ou iguais a R$ 7.000,00? (contando inclusive os que não foram pesquisados). Nós só sabemos os salários daqueles que foram pesquisados. Ou seja, para responder à questão, vamos “dar um chute”. Vamos considerar que a proporção de pessoas que ganham salários menores ou iguais a R$ 7.000,00 seja a mesma, tanto na amostra, quanto na população. É como se fôssemos fazer uma regra de três: Em 10% dos funcionários ...... 18 funcionários ganham menos de 7 mil www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 31 PROFESSOR: VÍTOR MENEZES Em 100% dos funcionários ...... X ganham menos de 7 mil 10% ---- 18 100% ---- X Multiplicando cruzado: X ×10 = 18 ×100 � X Resposta: A = 180 EC 14 Analista IRB 2006 [ESAF] No campo estatístico, ogivas são: a) polígonos de freqüência acumulada b) polígonos de freqüência acumulada relativa ou percentual. c) histograma de distribuição de freqüência d) histograma de distribuição de freqüência relativa ou percentual e) o equivalente à amplitude do intevalo. Nós vimos que o gráfico de freqüência acumulada também é chamado de ogiva. Resposta: A Texto para as questões EC 15 e EC 16 Analista MPU 2004 – Área Pericial. Especialidade: Estatística [ESAF] A distribuição de freqüências de determinado atributo X é dada na tabela abaixo. Não existem observações coincidentes com os extremos das classes. Classes Freqüências 2.000 – 4.000 18 4.000 – 6.000 45 6.000 – 8.000 102 8.000 – 10.000 143 10.000 – 12.000 51 12.000 – 14.000 41 EC 15 Analista MPU 2004 – Área Pericial. Especialidade: Estatística [ESAF] Assinale a opção que corresponde à amplitude interquartílica. a) 4.500,1 b) 6.200,2 c) 3.000,4 d) 3.162,6 e) 2.400,0 www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 32 PROFESSOR: VÍTOR MENEZES Foram dadas freqüências simples. Precisamos de freqüências acumuladas. Classes Freqüências Simples Freqüências acumuladas 2.000 – 4.000 18 18 4.000 – 6.000 45 63 6.000 – 8.000 102 165 8.000 – 10.000 143 308 10.000 – 12.000 51 359 12.000 – 14.000 41 400 Encontremos o terceiro quartil. O terceiro quartil é o valor que não é superado por 75% das observações. 75% de 400 equivale a 300. Classes Freqüências acumuladas 2.000 – 4.000 18 4.000 – 6.000 63 6.000 – 8.000 165 8.000 – 10.000 308 10.000 – 12.000 359 12.000 – 14.000 400 Sabemos que: Ou seja: 8.000 165 8.000 corresponde a 165 Z 300 Quem corresponde a 300??? 10.000 308 10.000 corresponde a 308 Primeira linha 8.000 165 Segunda linha Z 300 Terceira linha 10.000 308 Subtraindo as linhas: Z – 8.000 300-165 10.000 – 8.000 308-165 A interpolação linear nos diz que estas diferenças são proporcionais: Z − 8 000. = 300 − 165 10 000. − 8 000. 308 − 165 Z − 8 000. = 135 2 000 . 143 Z = 135 × 2 000. + 8 000. 143 O terceiro quartil vale: 3Q = 135 × 2 000. + 8 000. 143 www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 33 PROFESSOR: VÍTOR MENEZES Encontremos o primeiro quartil. O primeiro quatil é o valor que não é superado por 25% das observações. 25% de 400 equivale a 100. Classes Freqüências Acumuladas 2.000 – 4.000 18 4.000 – 6.000 63 6.000 – 8.000 165 8.000 – 10.000 308 10.000 – 12.000 359 12.000 – 14.000 400 Sabemos que: Ou seja: 6.000 63 6.000 corresponde a 63 Z 100 Quem corresponde a 100??? 8.000 165 8.000 corresponde a 165 Primeira linha 6.000 63 Segunda linha Z 100 Terceira linha 8.000 165 Subtraindo as linhas: Z – 6.000 100-63 8.000-6.000 165-63 A interpolação linear nos diz que estas diferenças são proporcionais: Z − 6 000. = 100 − 63 8 000. − 6 000. 165 − 63 Z − 6 000. = 2 000. 37 102 Z = 6 000. + 37 × 2 000. 102 O primeiro quartil é igual a: 1Q = 6 000. + 37 × 2 000. 102 A amplitude interquartílica é igual à diferença entre o terceiro e o primeiro quartis. 3Q − Q1 = 8 000. + 135 × 2 000. − 6 000. 143 − 37 × 2 000. 102 Q3 − 1 Q = 3162 62, Resposta: D. Questão chata, hein. Com muita conta pra fazer. A ESAF muitas vezes exagera nas contas. Vejamos uma solução “alternativa”, fazendo aproximações. Vamos começar pelo terceiro quartil. www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 34 PROFESSOR: VÍTOR MENEZES Tínhamos o seguinte quadro: 8.000 165 8.000 corresponde a 165 Z 300 Quem corresponde a 300??? 10.000 308 10.000 corresponde a 308 Ou seja: Primeira linha 8.000 165 Segunda linha Z 300 Terceira linha 10.000 308 Procuramos quem corresponde a 300. Mas 300 é bem próximo de 308. 300 é um pouquinho menor que 308. Sabemos que 308 corresponde a 10.000. Portanto, o número que corresponde a 300 deve ser bem próximo a 10.000. O número que corresponde a 300 deve ser um pouquinho menor que 10.000. Vamos aproximar? Vamos dizer que o terceiro quartil é aproximadamente 10.000. Q3 � 10 000. Agora vamos para o primeiro quartil. Sabemos que: Ou seja: Subtraindo as linhas: 6.000 63 6.000 corresponde a 63 Z 100 Quem corresponde a 100??? 8.000 165 8.000 corresponde a 165 Primeira linha 6.000 63 Segunda linha Z 100 Terceira linha 8.000 165 Z – 6.000 100-63 8.000-6.000 165-63 A interpolação linear nos diz que estas diferenças são proporcionais: Z − 6 000. = 100 − 63 8 000. − 6 000. 165 − 63 Z − 6 000. = 2 000. 37 102 Z = 6 000. + 37 × 2 000. 102 O denominador 102 é muito ruim. Vamos aproximar? Vamos trocá-lo por 100. Z � 6 000. + 37 × 2 000. = 6 000. 100 + 37 × 20 = 6 740. O primeiro quartil vale, aproximadamente, 6.740. Q1 � 6.740 A amplitude interquartílica fica, aproximadamente, igual a: www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 35 PROFESSOR: VÍTOR MENEZES Q3 − 1 Q � 10 000. − 6 740. = 3 260. E a alternativa mais próxima é a letra D. EC 16 Analista MPU 2004 – Área Pericial. Especialidade: Estatística [ESAF] Assinale a opção que corresponde à estimativa do valor de X que não é superado por 80% das observações do atributo X a) 12.000 b) 10.000 c) 10.471 d) 9.000 e) 11.700 Oitenta por cento de 400 corresponde a 320. Assim, estamos buscando pelo valor que não é superado por 320 observações. Sabemos que: Ou seja: Classes Freqüências acumuladas 2.000 – 4.000 18 4.000 – 6.000 63 6.000 – 8.000 165 8.000 – 10.000 308 10.000 – 12.000 359 12.000 – 14.000 400 10.000 308 10.000 corresponde a 308 Z 320 Quem corresponde a 320??? 12.000 359 12.000 corresponde a 359 Primeira linha 10.000 308 Segunda linha Z 320 Terceira linha 12.000 359 Antes de continuarmos as contas, olha que detalhe interessante. 320 está entre 308 e 359. Portanto, o número que corresponde a 320 (que estamos chamando de Z), está entre 10.000 e 12.000. Já dá para descartar as letras A, B e D. 320 está mais próximo de 308 do que de 359. Portanto, Z está mais próximo de 10.000 do que de 12.000. Com isso, descartamos a letra E e ficamos com a letra C. De todo modo, vamos continuar com a resolução de sempre. Subtraindo as linhas: www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 36 PROFESSOR: VÍTOR MENEZES Z – 10.000 320-308 12.000-10.000 359-308 A interpolação linear nos diz que estas diferenças são proporcionais: Z − 10 000. = 320 − 308 12 000. − 10 000. 359 − 308 Z − 10 000. = 12 2 000. Z = 2 000. 51 × 12 + 10 000. 51 � 10 470. 58, Note como o denominador 51 dificulta as contas. Vamos tentar “fugir” dele. Aproximando a fração: Z = 2 000. × 12 + 10 000. 51 � 2 000. × 12 + 10 000. 50 = 10 480. Quando trocamos o denominador 51 por 50, nós aumentamos um pouco o valor de Z. Portanto, na verdade Z, é um pouco menor que 10.480. Resposta: C Texto para as questões EC 17 e EC 18. Analista IRB 2004 [ESAF] As questões EC 17 e EC 18 dizem respeito à distribuição de freqüências conforme o quadro abaixo, no qual não existem observações coincidentes com os extremos das classes. Classe Freqüência acumulada 129,5 – 139,5 4 139,5 – 149,5 12 149,5 – 159,5 26 159,5 – 169,5 46 169,5 – 179,5 72 179,5 – 189,5 90 189,5 – 199,5 100 EC 17 Analista IRB 2004 [ESAF] Assinale a opção que corresponde ao oitavo decil a) 179,5 b) 189,5 c) 183,9 d) 184,5 e) 174,5 www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 37 PROFESSOR: VÍTOR MENEZES O oitavo decil é o valor que não é superado por 80% das observações. Como foram dadas freqüências acumuladas, não precisamos fazer nenhuma transformação. Sabemos que: Ou seja: Classe Freqüência acumulada 129,5 – 139,5 4 139,5 – 149,5 12 149,5 – 159,5 26 159,5 – 169,5 46 169,5 – 179,5 72 179,5 – 189,5 90 189,5 – 199,5 100 179,5 72 179,5 corresponde a 72 Z 80 Quem corresponde a 80??? 189,5 90 189,5 corresponde a 90 Primeira linha 179,5 72 Segunda linha Z 80 Terceira linha 189,5 90 Antes de iniciarmos as contas, vamos olhar as alternativas. Z está entre 179,5 e 189,5. Já descartamos as letras A e B. 81 está no exatamente no meio entre 72 e 90. O número que corresponde a 81, portanto, está bem no meio entre 179,5 e 189,5. Logo, o número que corresponde a 81 é 184,5. 80 é um pouquinho menor que 81. Portanto, o número que corresponde a 80 (que estamos chamando de Z), é um pouquinho menor que 184,5. Descartamos a letra D. E entre as letras C e E, ficamos com certeza com a letra C. Retomemos nossa resolução usual. Subtraindo as linhas: Z – 179,5 80-72 189,5-179,5 90-72 A interpolação linear nos diz que estas diferenças são proporcionais: Z − 179 5, = 80 − 72 189 5, − 179 5, 90 − 72 Z − 179 5, = 8 10 18 Z = 179 5, + 80 � 183 94, 18 Note como a fração 80/18 não é muito “amigável”. Aproximando a fração: Z = 179 5, + 80 � 179 5, 18 + 81 = 179 5, 18 + 9 = 179 5, 2 + 4 5, = 184 www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 38 PROFESSOR: VÍTOR MENEZES Quando nós trocamos o numerador 80 por 81, nós aumentamos um pouco o valor de Z. Z é na verdade um pouco menor que 184. Resposta: C EC 18 Analista IRB 2004 [ESAF] Assinale a opção que corresponde à estimativa, via interpolação da ogiva, do número de observações menores ou iguais ao valor 164. a) 46 b) 26 c) 72 d) 35 e) 20 Sabemos que: Ou seja: Classe Freqüência acumulada 129,5 – 139,5 4 139,5 – 149,5 12 149,5 – 159,5 26 159,5 – 169,5 46 169,5 – 179,5 72 179,5 – 189,5 90 189,5 – 199,5 100 159,5 26 159,5 corresponde a 26 164 W 164 corresponde a quem??? 169,5 46 169,5 corresponde a 46 Primeira linha 159,5 26 Segunda linha 164 W Terceira linha 169,5 46 Novamente, antes de iniciarmos as contas, vamos ver as alternativas. W está entre 26 e 46. Já descartamos as letras A, B, C e E. E marcamos a letra D. Marcada a resposta correta, vejamos as contas. Subtraindo as linhas: 164-159,5 W-26 169,5-159,5 46-26 A interpolação linear nos diz que estas diferenças são proporcionais: 164 − 159 5, = W − 26 169 5, − 159 5, 46 − 26 4 5, = W − 26 10 20 www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 39 PROFESSOR: VÍTOR MENEZES W = 4 5, × 20 + 26 = 9 + 26 = 35 10 Resposta: D EC 19 AFRF - 2002-2 – [ESAF] O atributo do tipo contínuo X, observado como um inteiro, numa amostra de tamanho 100 obtida de uma população de 1000 indivíduos, produziu a tabela de freqüências seguinte: Classes Freqüência ( f ) 29,5-39,5 4 39,5-49,5 8 49,5-59,5 14 59,5-69,5 20 69,5-79,5 26 79,5-89,5 18 89,5-99,5 10 Assinale a opção que corresponde à estimativa do número de indivíduos na população com valores do atributo X menores ou iguais a 95,5 e maiores do que 50,5. a) 700 b) 638 c) 826 d) 995 e) 900 Questão um pouco mais trabalhosa, pois precisamos fazer duas interpolações. Primeira interpolação: vamos encontrar quantas observações são menores ou iguais a 95,5. Para tanto, precisamos das freqüências acumuladas. Classes Freqüência ( f ) Freqüência acumulada (F) 29,5-39,5 4 4 39,5-49,5 8 12 49,5-59,5 14 26 59,5-69,5 20 46 69,5-79,5 26 72 79,5-89,5 18 90 89,5-99,5 10 100 Classes Freqüência acumulada (F) 29,5-39,5 4 39,5-49,5 12 49,5-59,5 26 59,5-69,5 46 www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 40 PROFESSOR: VÍTOR MENEZES 69,5-79,5 72 79,5-89,5 90 89,5-99,5 100 Sabemos que: Ou seja: 89,5 90 89,5 corresponde a 90 95,5 W 95,5 corresponde a quem??? 99,5 100 99,5 corresponde a 100 Primeira linha 89,5 90 Segunda linha 95,5 W Terceira linha 99,5 100 Subtraindo as linhas: 95,5-89,5 W-90 99,5-89,5 100-90 A interpolação linear nos diz que estas diferenças são proporcionais: 95 5, 99 5, − 89 5, = − 89 5, W − 90 100 − 90 6 = W − 90 � W = 96 10 10 Segunda interpolação: vamos encontrar quantas observações são menores ou iguais a 50,5. Classes Freqüência acumulada (F) 29,5-39,5 4 39,5-49,5 12 49,5-59,5 26 59,5-69,5 46 69,5-79,5 72 79,5-89,5 90 89,5-99,5 100 Sabemos que: Ou seja: 49,5 12 49,5 corresponde a 12 50,5 W’ 50,5 corresponde a quem??? 59,5 26 59,5 corresponde a 26 Primeira linha 49,5 12 Segunda linha 50,5 W’ Terceira linha 59,5 26 Subtraindo as linhas: 50,5-49,5 W’-12 www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 41 PROFESSOR: VÍTOR MENEZES 59,5-49,5 26-12 A interpolação linear nos diz que estas diferenças são proporcionais: 50 5, − 49 5, = W ' 12− 59 5, − 49 5, 26 − 12 1 = W '−12 � W ' = ,13 4 10 14 Ou seja, 13,4 observações são menores ou iguais a 50,5. Eu sei que não faz sentido falar em 13,4 observações (pois deveríamos apenas ter números naturais quando nos referimos a observações). Mas tudo bem, continuemos o exercício. Feitas as duas interpolações, sabemos que: 96 observações são menores ou iguais a 95,5. Isto na amostra de tamanho 100. Na população de tamanho 1.000, são 960 observações menores ou iguais a 95,5. É como se fôssemos fazer uma regra de três, a exemplo da que fizemos no EC 13 (fl.29). Na amostra de tamanho 100 .... 96 observações são menores ou iguais a 95,5. Na população de tamanho 1.000 ... X observações são menores ou iguais a 95,5 X ×100 = 96 ×1.000 � X = 960 Sabemos também que 13,4 observações são menores ou iguais a 50,5. Isto na amostra de tamanho 100. Na população de tamanho 1.000 são 134 observações menores ou iguais a 50,5. Basta fazer outra regra de três. Na amostra de tamanho 100 ...... 13,4 observações são menores ou iguais a 50,5 Na população de tamanho 1.000 .... X’ observações são menores ou iguais a 50,5 X '×100 = ,13 4 ×1 000. � X ' = 134 Assim, sabemos que, na população, temos 960 observações menores ou iguais a 95,5. Destas 960, 134 são menores ou iguais a 50,5. Portanto, 826 (=960-134) observações são menores ou iguais a 95,5 e maiores que 50,5. Resposta: C. Muita conta, né? Vamos ver uma solução alternativa, fazendo aproximações. Na primeira interpolação nós tínhamos: Primeira linha 89,5 90 Segunda linha 95,5 W Terceira linha 99,5 100 Sabemos que 94,5 está bem no meio entre 89,5 e 99,5. Portanto, ele corresponde a 95, que está bem no meio entre 90 e 100. www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 42 PROFESSOR: VÍTOR MENEZES 95,5 é um pouquinho maior que 94,5. Logo, o número que corresponde a 95,5 (que estamos chamando de W) é um pouquinho maior que 95. Vamos aproximar? W � 95 Na segunda interpolação nós tínhamos: 49,5 12 49,5 corresponde a 12 50,5 W’ 50,5 corresponde a quem??? 59,5 26 59,5 corresponde a 26 49,5 corresponde a 12. 50,5 é um pouquinho maior que 49,5. Portanto, o número que corresponde a 50,5 (que estamos chamando de W’) é um pouco maior que 12. Vamos aproximar? W ' � 12 E a diferença entre os resultados das interpolações fica: W − W ' = 95 − 12 = 83 Isso na amostra. Na população, temos que multiplicar esse valor por 10. 83 ×10 = 830 E novamente marcamos a letra C. EC 20 Técnico Municipal de Nível Superior – Estatística – Prefeitura Municipal de Vila Velha [CESPE] Uma prefeitura registrou o aumento do valor venal V (em R$ por metro quadrado) de 200 imóveis localizados em certo bairro residencial, conforme apresentado na tabela a seguir: Valor V (R$/m2) Número de imóveis V = 0 80 0 < V ≤ 10 50 10 < V ≤ 20 35 20 < V ≤ 30 25 30 < V ≤ 50 10 Total 200 Com base nessas informações, julgue os itens a seguir. 99. A mediana, que é igual a R$ 25,00/m2, divide os 50% valores mais baixos dos 50% valores mais altos. Questão do CESPE. Como as freqüências fornecidas são simples, calculemos as freqüências acumuladas. www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 43 PROFESSOR: VÍTOR MENEZES Valor V (R$/m2) f F V = 0 80 80 0 < V ≤ 10 50 130 10 < V ≤ 20 35 165 20 < V ≤ 30 25 190 30 < V ≤ 50 10 200 Note que na primeira linha nem temos realmente uma classe. Sabemos que todas as 80 observações da primeira linha são exatamente iguais a 0. Não é uma classe, é um valor único. A pergunta é sobre a mediana. Ou seja, o valor que não é superado por 100 observações (= 50% de 200). Sabemos que a freqüência acumulada que corresponde ao valor 0 é 80. A freqüência acumulada que corresponde ao valor 10 é 130. Sabemos que 100 está entre 80 e 130. Portanto, o valor procurado está entre 0 e 10. 0 80 0 corresponde a 80 Z 100 Quem corresponde a 100? 10 130 10 corresponde a 130 Ora, se sabemos que 0 < Z < 10, concluímos que o valor procurado não pode ser igual a 25. Portanto, a questão está incorreta. EC 21 Analista Previdenciário Pleno – Área de Estatística – Paraná Previdência – 2002 [CESPE] Texto II Em estudos previdenciários, é importante avaliar estatisticamente o tempo de sobrevida dos beneficiários. O tempo de sobrevida, em geral, depende do perfil do beneficiário, que abrange um conjunto de características como idade, espécie de benefícios (aposentadoria por idade, invalidez etc.), tipo de clientela (urbana/rural) etc. Para um estudo realizado acerca do tempo de sobrevida de beneficiários com um certo perfil, foram obtidos os resultados apresentados na tabela abaixo. Tempo de sobrevida T em anos 0≤ T < 5 5≤ T < 10 10≤T< 20 20≤T< 40 Total Freqüência de beneficiários falecidos (%) 20 40 30 10 100 Com base nos estudos obtidos para o estudo apresentado no texto II, julgue o item que se segue. 1. O primeiro quartil da distribuição é inferior a 5 anos. Outra questão do CESPE. Também, não precisa de muita conta. Foram fornecidas freqüências relativas simples. Precisamos achar as freqüências acumuladas. Classes Freqüência relativa simples (fr) Freqüência relativa acumulada (Fr) [0;5) 20 20 www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 44 PROFESSOR: VÍTOR MENEZES Classes Freqüência relativa simples (fr) Freqüência relativa acumulada (Fr) [5;10) 40 60 [10;20) 30 90 [20;40) 10 100 O primeiro quartil é o valor que não é superado por 25% das observações. Portanto, temos que achar o valor que corresponde à freqüência acumulada de 25%. Só que na tabela acima não tem o valor 25%. Sabemos que 25 está entre 20 e 60. Portanto o valor procurado está entre 5 e 10. 5 20 5 corresponde a 20 Z 25 Quem corresponde a 25? 10 60 10 corresponde a 60 Se o valor procurado está entre 5 e 10, então não pode ser inferior a 5. A questão está errada. EC 22 Analista de Regulação – Economista – ARCE/2006 [FCC] Uma empresa tem 1.000 empregados, classificados conforme a tabela abaixo: Salários (R$) Homens Mulheres Total (500; 1.500] 40 40 80 (1.500; 2.500] 140 100 240 (2.500; 3.500] 180 120 300 (3.500; 4.500] 140 80 220 (4.500; 5.500] 100 60 160 Total 600 400 1000 Observação: calculou-se as médias aritméticas correspondentes para grupo e geral considerando que todos os valores incluídos num certo intervalo de classe são coincidentes com o ponto médio deste intervalo. Para o cálculo das medianas utilizou-se o método da interpolação linear. Analisando os valores obtidos com relação aos empregados desta empresa, tem-se que: a) a média aritmética e a mediana dos salários dos homens são iguais a R$ 3.250,00 e R$ 3.000,00, respectivamente. b) a média aritmética e a mediana dos salários das mulheres são iguais a R$ 3.200,00 e R$ 3.000,00, respectivamente. c) o valor encontrado para a média aritmética dos salários dos empregados de toda a empresa é igual a 3.125,00. d) o módulo da diferença entre as médias aritméticas dos salários dos 2 grupos é igual a R$ 150,00 e) o módulo da diferença entre os valores das medianas dos salários entre os 2 grupos é inferior a R$ 150,00. Comecemos pela letra A. Segue a tabela salarial dos homens, considerando freqüências acumuladas: Salários (R$) f F www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 45 PROFESSOR: VÍTOR MENEZES (500; 1.500] 40 40 (1.500; 2.500] 140 180 (2.500; 3.500] 180 360 (3.500; 4.500] 140 500 (4.500; 5.500] 100 600 Vamos achar a mediana dos homens. A mediana é o valor salarial que não é superado por 300 observações (são 600 homens; 50% de 600 = 300). Sabemos que: 2.500 180 2500 corresponde a 180 Z 300 quem corresponde a 300? 3.500 360 3500 corresponde a 360 Ficamos com: Primeira linha 2500 180 Segunda linha Z 300 Terceira linha 3500 360 Subtraindo as linhas: Z-2500 300-180 3500-2500 360-180 A interpolação linear nos diz que estas diferenças são proporcionais. Z − 2500 = 300 − 180 3500 − 2500 Isolando o Z: 360 − 180 Z = 1000 × 120 + 2500 � 666 + 2500 = 3 166. 180 A mediana salarial masculina não é de R$ 3.000. Descartamos a letra A. Vejamos à mediana feminina. Salários (R$) f F (500; 1.500] 40 40 (1.500; 2.500] 100 140 (2.500; 3.500] 120 260 (3.500; 4.500] 80 340 (4.500; 5.500] 60 400 São 400 mulheres. A mediana é o valor que não é superado por 200 observações (200 = 50% de 400). Podemos montar o seguinte quadro: 2.500 140 2500 corresponde a 140 Z’ 200 quem corresponde a 200? 3.500 260 3500 corresponde a 260 Ficamos com: www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 46 PROFESSOR: VÍTOR MENEZES Primeira linha 2500 140 Segunda linha Z’ 200 Terceira linha 3500 260 Observe que 200 está bem no meio entre 140 e 260. Portanto, Z’ está bem no meio entre 2500 e 3500. Temos que: Z ' = 3000 A mediana feminina é de R$ 3.000,00. Ainda não deu para descartar a letra B. Vamos calcular a média das mulheres. Para tanto, façamos uso da variável transformada. Classes Pontos médios d = X − 1000 f d × f ( X ) 1000 (500; 1.500] 1.000 0 40 0 (1.500; 2.500] 2.000 1 100 100 (2.500; 3.500] 3.000 2 120 240 (3.500; 4.500] 4.000 3 80 240 (4.500; 5.500] 5.000 4 60 240 TOTAL 400 820 E a média de d fica: d = 820 400 Vamos achar a média de X: X = 1000 × d + 1000 X = 1000 × d + 1000 X = 1000 × 820 + 1000 = 3 050. 400 Descartamos a letra B. A letra E também está errada. A mediana dos homens é de R$ 3.166,00. A mediana das mulheres é R$ 3.000,00. A diferença entre ambas é maior que R$ 150,00. Sobraram as letras C e D. Vamos achar a média dos homens. Classes Pontos médios d = X − 1000 f d × f ( X ) 1000 (500; 1.500] 1.000 0 40 0 (1.500; 2.500] 2.000 1 140 140 (2.500; 3.500] 3.000 2 180 360 (3.500; 4.500] 4.000 3 140 420 (4.500; 5.500] 5.000 4 100 400 TOTAL 600 1320 A média de d fica: www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 47 PROFESSOR: VÍTOR MENEZES d = 1320 = ,2 2 600 Sabemos que: X = 1000 + 1000 × d Portanto: X = 1000 + 1000 × d = 1000 + 1000 × ,2 2 = 3 200. A média salarial dos homens é de 3.200,00 A diferença entre as médias dos homens e das mulheres, de fato, é de R$ 150,00. Resposta: C. Vejam que a questão não é difícil. Mas é trabalhosa. Tomou muito tempo. Foi preciso calcular várias medidas (médias e medianas para cada grupo). Na hora da prova, se você se deparar com algo desse tipo, pense na hipótese de deixar a questão para depois. Principalmente se você não for muito rápido em contas. Se sobrar tempo, ao final da prova você volta e resolve. Você não vai para uma prova para fazer todas as questões. Você vai para tentar fazer o maior número de pontos possível. Às vezes compensa pular uma questão muito trabalhosa, poupando tempo para fazer muitas questões fáceis. E não custa destacar que esta questão foi extraída de uma prova específica da área de Economia, onde os candidatos, possivelmente, já têm mais agilidade em fazer contas. Texto para as questões EC 23 e EC 24 A tabela abaixo apresenta a distribuição de freqüências das notas obtidas num teste de matemática, realizado por 50 estudantes. Notas Freqüência absoluta 0 │− 2 4 2 │− 4 12 4 │− 6 15 6 │− 8 13 8 │− 10 6 EC 23 Analista Judiciário. Especialidade: estatística. TRF 1ª Região [FCC] Se a nota mínima para aprovação no teste é 5,8, a porcentagem de aprovação é de: a) 51% b) 48% c) 45% d) 41% e) 38% EC 24 Analista Judiciário. Especialidade: estatística. TRF 1ª Região [FCC] A nota mediana desses estudantes é: a) 4,8 www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 48 PROFESSOR: VÍTOR MENEZES b) 5,0 c) 5,2 d) 5,5 e) 5,8 Comecemos pelo EC 23 Vamos achar as freqüências acumuladas. Notas Freqüência simples Freqüência acumulada 0 │− 2 4 4 2 │− 4 12 16 4 │− 6 15 31 6 │− 8 13 44 8 │− 10 6 50 Queremos saber qual a freqüência acumulada que corresponde a 5,8. Podemos montar o seguinte quadro: 4 16 4 corresponde a 16 5,8 W 5,8 corresponde a quem? 6 31 6 corresponde a 31 Ficamos com: Subtraindo as linhas: Primeira linha 4 16 Segunda linha 5,8 W Terceira linha 6 31 5,8-4 W-16 6-4 31-16 A interpolação linear nos garante que estas diferenças são proporcionais. 5 8, − 4 = W − 16 6 − 4 31 − 16 Isolando o W: W = 1 8, ×15 + 16 = 29 5, 2 Então 29,5 alunos tiraram notas menores ou iguais a 5,8. Eu sei que não faz sentido falar em 29,5 alunos (pois só podemos ter um número inteiro de alunos). Mas vamos continuar. Se 29,5 alunos tiraram menos que 5,8 e, ao todo, são 50 alunos, então 20,5 alunos tiraram mais que 5,8. O percentual de alunos aprovados é: 20 5, = %41 50 Resposta: D. www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 49 PROFESSOR: VÍTOR MENEZES Agora vamos para o EC 24. A mediana é o valor que não é superado por 50% das observações. Ou seja, é o valor que não é superado por 25 observações. Podemos montar o seguinte quadro: 4 16 4 corresponde a 16 Z 25 quem corresponde a 25? 6 31 6 corresponde a 31 Ficamos com: Subtraindo as linhas: Primeira linha 4 16 Segunda linha Z 25 Terceira linha 6 31 Z - 4 25-16 6 - 4 31-16 A interpolação linear nos diz que estas diferenças são proporcionais. Z − 4 = 25 − 16 6 − 4 31 − 16 Isolando o Z: =Z 9 × 2 + 4 = ,5 2 15 A mediana é 5,2. Resposta: C. EC 25 Especialista em regulação de saúde suplementar. Especialidade: Estatística. Ministério da Saúde/2007 [FCC] A tabela fornece informações sobre o tipo de câncer e a idade de 500 pacientes que sofrem desta doença, internados num determinado hospital especializado na doença. Idade Câncer estomacal Câncer pulmonar Outros Total [0;10) 0 6 60 66 [10;30) 30 9 25 64 [30;50) 100 75 55 230 [50;70) 70 60 10 140 Total 200 150 150 500 A idade mediana dos 150 pacientes com câncer pulmonar é: a) 30 anos b) 38 anos c) 40 anos d) 46 anos e) 49 anos www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 50 PROFESSOR: VÍTOR MENEZES Para o câncer pulmonar, temos: Idade Freqüência simples Freqüência acumulada [0;10) 6 6 [10;30) 9 15 [30;50) 75 90 [50;70) 60 150 A mediana é o valor que não é superado por 75 observações. Podemos montar o seguinte quadro: 30 15 30 corresponde a 15 Z 75 quem corresponde a 75? 50 90 50 corresponde a 90 Ficamos com: Subtraindo as linhas: Primeira linha 30 15 Segunda linha Z 75 Terceira linha 50 90 Z – 30 75 – 15 50 – 30 90 – 15 A interpolação linear nos diz que estas diferenças são proporcionais. Z − 30 = 75 − 15 � Z = 60 × 20 + 30 = 46 50 − 30 90 − 15 75 Resposta: D. EC 26 Técnico de planejamento e pesquisa – IPEA/2004 [ESAF] Para uma amostra aleatória de determinado tributo encontrou-se a seguinte distribuição de freqüências. Não existem observações coincidentes com os extremos das classes. Classes Freqüências 2.000 – 4.000 18 4.000 – 6.000 45 6.000 – 8.000 102 8.000 – 10.000 143 10.000 – 12.000 32 12.000 – 14.000 60 Assinale a opção que corresponde à melhor aproximação do nonagésimo quinto percentil. a) 13.000 b) 12.585 c) 13.333 d) 12.667 e) 13.900 O nonagésimo quinto percentil é o valor que não é superado por 95% das observações. Como são 400 observações, o nonagésimo quinto percentil não é superado por 380 observações. www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 51 PROFESSOR: VÍTOR MENEZES Classes Freqüências Freqüências acumuladas 2.000 – 4.000 18 18 4.000 – 6.000 45 63 6.000 – 8.000 102 165 8.000 – 10.000 143 308 10.000 – 12.000 32 340 12.000 – 14.000 60 400 Podemos montar o seguinte quadro: 12000 340 12000 corresponde a 340 Z 380 quem corresponde a 380? 14000 400 14000 corresponde a 400 Note que 380 é mais próximo de 400 do que de 340. Portanto, o número que a ele corresponde (que estamos chamando de Z) é mais próximo de 14000 do que de 12000. Já descartamos as letras A, B e D. Ficamos com: Subtraindo as linhas: Primeira linha 12000 340 Segunda linha Z 380 Terceira linha 1400 400 Z – 12000 380 - 340 14000 – 12000 400 – 340 A interpolação linear nos diz que estas diferenças são proporcionais. Z − 12000 = 380 − 340 14000 − 12000 400 − 340 Z = 12 000. + 40 × 2 000. = 13 333. 60 Desse modo, a minha resposta seria letra C. O gabarito preliminar foi letra D. E, no gabarito definitivo, a questão foi anulada. Confesso que não sei o motivo. EC 27 Analista BACEN/2006 – Área 5 [FCC] www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 52 PROFESSOR: VÍTOR MENEZES O valor da mediana dos salários dos empregados da empresa XYZ, obtida pelo método da interpolação linear, é igual a: a) R$ 3.500,00 b) R$ 3.625,00 c) R$ 3.650,00 d) R$ 3.800,00 e) R$ 4.000,00 A mediana é o valor que não é superado por 50% das observações. Como são 40 observações, a mediana não é superada por 20 observações. Classes Freqüências Freqüências acumuladas [1.000 – 2.000) 2 2 [2.000 – 3.000) 8 10 [3.000 – 4.000) 16 26 [4.000 – 5.000) 10 36 [5.000 – 6.000) 4 40 Podemos montar o seguinte quadro: 3.000 10 8 corresponde a 10 Z 20 quem corresponde a 20? 4.000 26 4000 corresponde a 26 Z está entre 3.000 e 4.000. Já descartamos a letra E. Repare que 20 está mais próximo de 26 do que de 10. Portanto, Z está mais próximo de 4.000 do que de 3.000. Descartamos a letra A. Ficamos com: Subtraindo as linhas: Primeira linha 3000 10 Segunda linha Z 20 Terceira linha 4000 26 Z – 3.000 20 – 10 4.000 – 3.000 26 - 10 A interpolação linear nos diz que estas diferenças são proporcionais. www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 53 PROFESSOR: VÍTOR MENEZES Z − 3 000. = 20 − 10 � Z = 3 000. + 1 000. ×10 = 3 625. 4 000. − 3 000. 26 − 10 16 Resposta: B. Acho que deu para notar que o cálculo de medidas separatrizes com interpolação linear cai e cai bastante em provas. Dentro de estatística descritiva este é disparado o assunto mais importante (se considerarmos o número de questões cobradas). E olha que ainda não terminamos as questões em que este assunto é cobrado. Vamos apenas dar uma pausa. Isto porque, para resolvermos as demais questões, precisamos estudar o histograma. Em sala de aula costumo falar: se você não gosta muito de exatas e quer só estudar um pouco de estatística para tentar fazer o mínimo, o assunto que você vai estudar é este: medidas separatrizes para dados em classes. Lembrete de medidas separatrizes. Sempre utilize freqüências acumuladas. Nunca utilize freqüências simples. Identificar o valor de freqüência acumulada desejada. Utilizar interpolação linear. VIII FORMAS DE APRESENTAÇÃO DOS DADOS AGRUPADOS EM CLASSES Desde a aula passada temos estudados os dados agrupados em classes. E vimos uma única forma de apresentá-los: por meio de tabelas. Pois bem, agora vejamos outras formas. 1 Histograma O histograma é uma forma gráfica de representar uma distribuição de dados agrupados em classes. Creio que a melhor maneira de explicar é por meio de um exemplo. EC 28 Auditor Fiscal ICMS/BA – 2004 O gráfico abaixo é o histograma de freqüências absolutas de uma amostra de valores arrecadados de determinado tributo em um município. Com relação aos dados desta amostra, é verdade que: www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 54 PROFESSOR: VÍTOR MENEZES a) 60% dos valores são maiores ou iguais a R$ 1.500,00 e menores que R$ 3.000,00. b) Mais de 30% dos valores são maiores ou iguais a R$ 2.500,00 e menores que R$ 3.500,00 c) A porcentagem dos valores iguais ou superiores a R$ 3.500,00 é maior que a porcentagem dos valores inferiores a R$ 1.500,00 d) A freqüência relativa de valores inferiores a R$ 1.500,00 é menos que 10% e) A amplitude da amostra é R$ 4.000,00. Vamos analisar o histograma. A primeira coluna é amarela. Ela corresponde à classe 0,5 – 1. Sua altura corresponde à freqüência 100. Isto significa que temos 100 valores entre R$ 500,00 e R$ 1.000,00. A segunda coluna é laranja. Ela corresponde à classe 1,0 – 1,5. Sua altura corresponde à freqüência 100. Isto significa que temos 100 valores entre R$ 1.000,00 e R$ 1.500,00. A terceira coluna é azul. Ela corresponde à classe 1,5 – 2,0. Sua altura corresponde à freqüência 200. Isto significa que temos 200 valores entre R$ 1.500,00 e R$ 2.000,00. E assim por diante. Podemos dizer que o histograma acima é outra forma de representar a tabela abaixo: Classe Freqüência absoluta simples 0,5 ≤ x < 1,0 100 1,0 ≤ x < 1,5 100 1,5 ≤ x < 2,0 200 2,0 ≤ x < 2,5 400 2,5 ≤ x < 3 300 3 ≤ x < 3,5 300 3,5 ≤ x < 4 200 Total 1600 Vamos às alternativas. A alternativa ‘A’ afirma que 60% dos valores são maiores ou iguais a R$ 1.500,00 e menores que R$ 3.000,00. Os valores que se enquadram nessas condições são os da terceira, quarta e quinta classes (ver destaque em vermelho na tabela abaixo) Classe Freqüência absoluta simples 0,5 ≤ x < 1,0 100 1,0 ≤ x < 1,5 100 1,5 ≤ x < 2,0 200 2,0 ≤ x < 2,5 400 2,5 ≤ x < 3 300 3 ≤ x < 3,5 300 3,5 ≤ x < 4 200 Total 1600 Somando, são: 200 + 400 + 300 = 900. São 900 valores nesta condição. 900 representa apenas 56,25% do total dos valores. A alternativa está errada. www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 55 PROFESSOR: VÍTOR MENEZES Segundo a alternativa ‘B’, mais de 30% dos valores são maiores ou iguais a R$ 2.500,00 e menores que R$ 3.500,00. Os valores que estão nesta condição estão destacados na tabela abaixo. Classe Freqüência absoluta simples 0,5 ≤ x < 1,0 100 1,0 ≤ x < 1,5 100 1,5 ≤ x < 2,0 200 2,0 ≤ x < 2,5 400 2,5 ≤ x < 3 300 3 ≤ x < 3,5 300 3,5 ≤ x < 4 200 Total 1600 Somando, são: 300 + 300 = 600. São 600 valores nesta condição. 600 corresponde a 37,5% de 1.600. Portanto, mais de 30% dos valores são maiores ou iguais a R$ 2.500,00 e menores que R$ 3.500,00. Alternativa correta. Resposta: B. Vamos verificar os erros das demais alternativas. A alternativa C afirma que a porcentagem dos valores iguais ou superiores a R$ 3.500,00 é maior que a porcentagem dos valores inferiores a R$ 1.500,00. 200 valores são maiores ou iguais a R$ 3.500,00. E valores inferiores a R$ 1.500,00 também são 200. Ou seja, as duas porcentagens são iguais. A alternativa D afirma que a freqüência relativa de valores inferiores a R$ 1.500,00 é menos que 10% São 200 valores inferiores a R$ 1.500,00. 200 é 12,5% de 1600. Alternativa errada. A alternativa E fala da amplitude dos dados. A amplitude é dada pela diferença entre o maior limite superior e o menor limite inferior. No caso, a amplitude fica: 4 – 0,5 = 3,5. Portanto, a amplitude é de R$ 3.500,00. Pronto! Vimos o tal do histograma. Não é difícil. Mas poderia deixar confuso quem nunca tivesse visto um. Para treinar, vamos a outros exercícios de histograma. EC 29 Fiscal ICMS/SP – 2006 [FCC] O histograma de freqüências absolutas, abaixo, demonstra o comportamento dos valores arrecadados de um determinado tributo, no ano de 2005, em uma região a ser analisada: www.pontodosconcursos.com.br PROFESSOR: VÍTOR MENEZES Observação – Considere que todos os intervalos de classe do histograma são fechados à esquerda e abertos à direita. Utilizando as informações contidas neste histograma, calculou-se a média aritmética destes valores arrecadados, considerando que todos os valores incluídos num certo intervalo de classe são coincidentes com o ponto médio deste intervalo. Também calculou-se a mediana de tais valores pelo método da interpolação linear. Então, o módulo da diferença entre a média aritmética e a mediana é igual a: a) R$ 100,00 b) R$ 400,00 c) R$ 800,00 d) R$ 900,00 e) R$ 1.000,00 Temos um histograma. O histograma é uma outra forma de representar dados em classes. A primeira classe é [1;2). A ela corresponde uma freqüência simples de 200. Como sabemos que a freqüência é simples? Basta ver que as freqüências aumentam, até a classe [4;5), e depois diminuem. Se o histograma fosse um histograma de freqüências acumuladas, as freqüências sempre aumentariam, nunca decresceriam. Ok, então vamos transformar o histograma na tabela correspondente. Classe Freqüência simples [1.000 ; 2.000) 200 [2.000 ; 3.000) 400 [3.000 ; 4.000) 500 [4.000 ; 5.000) 600 [5.000 ; 6.000) 300 Temos que calcular a média e a mediana. Para calcular a média, consideramos que todos as observações correspondem aos pontos médios das classes. Sempre que tivermos dados em classes, este é o procedimento visto (matéria da aula anterior). Note que o exercício foi até legal nesse sentido, dando a dica de como calcular a média. Para cálculo da média, sempre trabalhamos com freqüências simples. Não importa se absolutas ou relativas. Basta que sejam simples. www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 57 PROFESSOR: VÍTOR MENEZES Classe (valores em R$ 1.000,00) Ponto médio de classe (valores em R$ 1.000,00) Freqüência simples [1 ; 2) 1,5 200 [2 ; 3) 2,5 400 [3 ; 4) 3,5 500 [4 ; 5) 4,5 600 [5 ; 6) 5,5 300 Poderíamos criar uma variável auxiliar ‘d’, da maneira vista na aula 2. Mas acho que os valores envolvidos são relativamente tranqüilos, e as contas não estão difíceis. Assim, vou abrir mão desta variável auxiliar. Se você quiser criar a variável auxiliar, sem problemas, o resultado tem que ser o mesmo. Vamos criar a coluna adicional, de valor vezes freqüência. Ponto médio de classe X (em R$ 1.000,00) Freqüência simples f X × f 1,5 200 300 2,5 400 1000 3,5 500 1750 4,5 600 2700 5,5 300 1650 Somamos as colunas: Ponto médio de classe X (em R$ 1.000,00) Freqüência simples f X × f E a média fica: X = 7400 = 3 7, 2000 1,5 200 300 2,5 400 1000 3,5 500 1750 4,5 600 2700 5,5 300 1650 TOTAL 2000 7400 Lembrando que este valor está em R$ 1.000,00. Na verdade a média é igual a R$ 3.700,00. Para achar a mediana, precisamos trabalhar com freqüências acumuladas. Transformando as freqüências simples em freqüências acumuladas, temos: Classe Freqüência simples Freqüência acumulada Memória de cálculo [1.000 ; 2.000) 200 200 =200 [2.000 ; 3.000) 400 600 =200+400 [3.000 ; 4.000) 500 1100 =600+500 [4.000 ; 5.000) 600 1700 =1100+600 [5.000 ; 6.000) 300 2000 =1700+300 www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 58 PROFESSOR: VÍTOR MENEZES São 2000 observações. Queremos saber qual o valor que não é superado por 50% das observações (ou seja, o valor que não é superado por 1000 observações). Classe Freqüência acumulada [1.000 ; 2.000) 200 [2.000 ; 3.000) 600 [3.000 ; 4.000) 1100 [4.000 ; 5.000) 1700 [5.000 ; 6.000) 2000 Sabemos que: Portanto: 3000 600 3000 corresponde a 600 Z 1000 Quem corresponde a 1000? 4000 1100 4000 corresponde a 1100 Primeira linha 3000 600 Segunda linha Z 1000 Terceira linha 4000 1100 Fazendo a subtração das linhas: Z-3000 1000-600 4000-3000 1100-600 A interpolação linear nos diz que as diferenças acima são proporcionais. Z − 3000 = 1000 − 600 4000 − 3000 1100 − 600 Z − 3000 = 400 1000 500 Z = 400 ×1000 + 3000 = 800 + 3000 = 3800 500 A mediana é igual a R$ 3.800,00. Portanto, o módulo da diferença entre a média e a mediana é de R$ 100,00. Resposta: A. EC 30 Analista – Área documentação. Especialidade – Estatística – MPU/2007 [FCC] Considere o histograma da variável X a seguir, em que as freqüências simples absolutas foram anotadas no interior dos retângulos. www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 59 PROFESSOR: VÍTOR MENEZES O valor do terceiro quartil de X é: a) 40 b) 35 c) 30 d) 25 e) 12 Vamos achar qual a tabela de freqüências simples que corresponde ao histograma acima. O histograma dado corresponde à seguinte tabela: Classes Freqüência absoluta simples 20 – 25 5 25 – 30 15 30 – 35 25 35 – 40 8 40 - 45 7 Total 60 O terceiro quartil é o valor que não é superado por 75% das observações. Como são 60 dados, o terceiro quartil é valor que não é superado a 45 observações. Ou seja, é o valor que corresponde à freqüência acumulada 45. Abaixo segue a tabela de freqüências acumuladas: Classes Freqüência absoluta simples Freqüência acumulada simples 20 – 25 5 5 25 – 30 15 20 30 – 35 25 45 35 – 40 8 53 40 - 45 7 60 E nem precisamos fazer a interpolação linear. Na tabela acima temos direto o valor que corresponde à freqüência acumulada 45. Este valor é 35. Ou seja, 35 é o terceiro quartil. Resposta: B. Agora eu queria chama a atenção para um detalhe. Voltemos ao histograma. Considere apenas a área à esquerda do terceiro quartil. É a área destacada em verde na figura abaixo. www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 60 PROFESSOR: VÍTOR MENEZES Temos três retângulos verdes. O primeiro tem altura igual a 5. O segundo tem altura igual a 15. O terceiro tem altura igual a 25. Todos eles tem base igual a 5. A área total desses três retângulos fica: A _ verde = 5 × 5 + 5 ×15 + 5 × 25 = 225 Agora vejamos qual a área total de todos os retângulos (área amarela da figura abaixo). Temos cinco retângulos, todos com base 5. Os três primeiros nós já analisamos. Juntos, eles têm área de 225. Os dois últimos têm alturas de 8 e 7. A área dos dois últimos fica: 5 × 8 + 5 × 7 = 75 Portanto, a área amarela é de: A _ amarela = 225 + 75 = 300 Vamos dividir as áreas? A _ verde = 225 = 0 75, = %75 A _ amarela 300 A área à esquerda de 35 (=área verde) é igual a 75% da área total. E 35 é justamente o terceiro quartil, ou seja, o valor que não é superado por 75% das observações. Isso não é coincidência. Um histograma também pode ser útil para achar medidas separatrizes. As áreas a esquerda de um dado valor têm íntima relação com a posição que este valor ocupa. Por exemplo, a área à esquerda da mediana será sempre igual a 50% da área total. www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 61 PROFESSOR: VÍTOR MENEZES A área à esquerda do primeiro quartil será sempre igual a 25% da área total. E assim por diante. Por enquanto não precisam se preocupar em utilizar esta propriedade para resolver as questões. Só quis fazer alguns comentários a respeito porque esta propriedade será extremamente importante quando entrarmos em estatística inferencial. EC 31 Especialista em regulação de saúde suplementar. Especialidade: Estatística. Ministério da Saúde/2007 [FCC] O histograma abaixo representa a distribuição das idades dos pacientes atendidos no ano de 2000 em uma clínica infantil, expressa em anos. A idade que separa os 30% mais jovens é: a) 3,5 b) 4,2 c) 4,4 d) 4,6 e) 5,0 Vamos achar a tabela que corresponde ao histograma. Classes Freqüência relativa simples Freqüência relativa acumulada 2 – 4 18 18 4 – 6 40 58 6 – 8 25 83 8 – 10 17 100 Queremos saber qual o valor que corresponde à freqüência relativa acumulada de 30%. Podemos montar o seguinte quadro: Sabemos que: Portanto: 4 18 4 corresponde a 18% Z 30 Quem corresponde a 35%? 6 58 6 corresponde a 58% Primeira linha 4 18 Segunda linha Z 30 Terceira linha 6 58 Fazendo a subtração das linhas: Z-4 30 – 18 6 – 4 58 – 18 www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 62 PROFESSOR: VÍTOR MENEZES A interpolação linear nos diz que as diferenças acima são proporcionais. Z − 4 = 30 − 18 6 − 4 58 − 18 Z − 4 = 12 � Z = 4 6, 2 40 Resposta: D Novamente, vamos ver como ficam as áreas do histograma. A área à esquerda de 4,6 é: 4,6 Temos um retângulo de base 2 e altura 0,18. E outro de base 0,6 e altura 0,40. A área total desses dois retângulos é de: A _ verde = 2 × 0 18, + 0 6, × ,0 40 = 0 6, E a área de todo o histograma é igual a 2. Portanto, a área verde representa 30% da área de todo o histograma. A área verde é a área à esquerda de 4,6, que é justamente o valor que separa os 30% mais jovens. Novamente, isto não é coincidência! EC 32 Analista Judiciário. Área apoio especializado. Especialidade: Estatística. TRF 2ª Região/2007 [FCC] Considere o histograma da variável X: www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 63 PROFESSOR: VÍTOR MENEZES O valor da mediana de X é: a) 25,0 b) 32,5 c) 37,5 d) 40,0 e) 42,0 Para resolver esse problema, você pode perfeitamente montar a tabela de freqüências e fazer o procedimento que temos visto desde o começo da aula (montando o quadro com as três linhas, subtraindo as debaixo pela de cima, fazendo as razões, et). Para variar um pouco, vou fazer uma solução diferente. Vou usar a propriedade do histograma. A área total da figura é igual a: A _ total = 10 × 8( + 12 + 16 + 12 + 8 + )8 = 640 A mediana é o valor que divide esta área em duas partes iguais. Ou seja, em duas áreas de 320. O primeiro retângulo da figura tem área de 80. O segundo retângulo tem área de 120. Somando esses dois retângulos, temos uma área de 200. Para completar 320, precisamos de mais uma área de 120. O terceiro retângulo tem área de 160. Se levarmos em conta toda a sua área, extrapolamos os 320. Assim, temos que considerar apenas parte de sua área. Como o terceiro retângulo tem altura igual a 16, precisamos de uma base igual a 7,5, para que a área seja de 120. www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 64 PROFESSOR: VÍTOR MENEZES 37,5 Note como a área verde da figura acima atende ao que precisamos. Ela é exatamente igual a 320. Ou seja, em vez de usarmos todo o terceiro retângulo, usamos apenas parte dele. Apenas a parte à esquerda do 37,5. Pronto. O número 37,5 é tal que a área à sua esquerda é metade da área inteira do histograma. Ele é a nossa mediana. Resposta: C Antes de passarmos ao próximo exercício, um detalhe. O histograma é uma forma gráfica de representar dados agrupados em classes. Quando todas as classes têm a mesma amplitude, o histograma é exatamente do jeito que vimos acima. As alturas dos retângulos correspondem às freqüências absolutas de cada classe. Há uma outra maneira de montar o histograma, que é mais usual quando as classes têm amplitudes diferentes (embora também possa ser usada para o caso de amplitude de classe constante). Quando as classes tiverem amplitudes diferentes, o histograma muda. Em vez de as alturas corresponderem às freqüências, elas correspondem às densidades de freqüência (= freqüência dividida pela amplitude de classe). É exatamente a mesma adaptação que fizemos quando comentamos algo sobre cálculo de moda para dados agrupados em classes quando a amplitude de classe não é constante (lembram do finalzinho da aula passada? Foi lá na página 62). E aí vem a pergunta: já caiu alguma questão cobrando histograma quando a amplitude de classe não é constante? Novamente, não conheço nenhuma questão assim. Mas esta informação nos será muito útil quando entrarmos em estatística inferencial. Retomamos este assunto lá na aula 5. EC 33 Analista BACEN/2006 – Área 5 [FCC] O histograma de freqüências absolutas a seguir foi elaborado com base nas informações contidas na revista “O empreiteiro”, de junho de 2005, que demonstra o comportamento das empresas construtoras do ramo da construção civil no Brasil que obtiveram faturamento em 2004 maior ou igual a 15 milhões de reais e menor o igual a 120 milhões de reais. www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 65 PROFESSOR: VÍTOR MENEZES Com base nestas informações, obteve-se a média aritmética do faturamento das empresas deste estudo, considerando que todos os valores incluídos num certo intervalo de classe são coincidentes com o ponto médio deste intervalo. Com relação ao total de empresas deste histograma, o valor encontrado para esta média pertence ao intervalo de classe que contém a) 24% das empresas b) 16% das empresas c) 9% das empresas d) 7% das empresas e) 5% das empresas Podemos encontrar a tabela correspondente ao histograma. Ponto médio ( X ) d = X − 22 5, Freqüência ( f ) 15 d × f 22,5 0 31 0 37,5 1 24 24 52,5 2 16 32 67,5 3 9 27 82,5 4 5 20 97,5 5 7 35 112,5 6 8 48 TOTAL 100 186 A média de d fica: d = 186 100 Agora temos que encontrar a média de X. =d X − 22 5, � X 15 = 15 × d + 22 5, X = 15 × d + 22 5, X� = ,50 4 Esse valor está na terceira classe, que contém 16% das empresas. Resposta: B www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 66 PROFESSOR: VÍTOR MENEZES Lá na página 59 da aula passada, nós falamos sobre a moda de Pearson. Dissemos que sua fórmula era: M � 3D − 2 X Nessa fórmula temos: · M é a moda · D é a mediana · X é a média. E não foi possível passar nenhum exercício, porque ainda não tínhamos estudado a mediana para dados em classes. Agora chegou a hora de ver um exercício a respeito. Ele engloba moda de Pearson e histograma. EC 34 Técnico de controle externo III – TCE/MG – 2007. Área – Economia [FCC] O histograma de freqüências absolutas a seguir demonstra a distribuição dos salários dos empregados de uma empresa em dezembro de 2006: Sabendo-se que todos os intervalos de classe referentes a este histograma são fechados à esquerda e abertos à direita, calculou-se a média aritmética dos salários dos empregados, considerando que todos os valores incluídos num certo intervalo de classe são coincidentes com o ponto médio deste intervalo. A moda de Pearson é igual a: a) R$ 3.200,00 b) R$ 2.950,00 c) R$ 2.900,00 d) R$ 2.850,0 e) 2.800,00 Podemos montar a seguinte tabela: Classes Freqüências [0,5; 1,5) 40 [1,5; 2,5) 50 [2,5; 3,5) 100 [3,5; 4,5) 40 [4,5; 5,5) 20 www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 67 PROFESSOR: VÍTOR MENEZES Primeiro vamos calcular a média. Classes Ponto médio ( X ) Freqüências ( f ) X × f [0,5; 1,5) 1 40 40 [1,5; 2,5) 2 50 100 [2,5; 3,5) 3 100 300 [3,5; 4,5) 4 40 160 [4,5; 5,5) 5 20 100 TOTAL 250 700 A média de X fica: X = 700 = 2 8, 250 Para encontrar a mediana, precisamos das freqüências acumuladas. Classes Freqüências Freqüências acumuladas [0,5; 1,5) 40 40 [1,5; 2,5) 50 90 [2,5; 3,5) 100 190 [3,5; 4,5) 40 230 [4,5; 5,5) 20 250 A mediana não é superada por 125 observações. Podemos montar o seguinte quadro: 2,5 90 2,5 corresponde a 90 Z 125 quem corresponde a 125? 3,5 190 3,5 corresponde a 190 Ficamos com: Subtraindo as linhas: Primeira linha 2,5 90 Segunda linha Z 125 Terceira linha 3,5 190 Z – 2,5 125 – 90 3,5 – 2,5 190 – 90 A interpolação linear nos diz que estas diferenças são proporcionais. Z − 2 5, = 125 − 90 � Z = 2 5, + 1× 35 = 2 85, 3 5, − 2 5, 190 − 90 100 A mediana é igual a 2,85. Portanto, a moda de Pearson fica: M = 3 × 2 85, − 2 × 2 8, M = 2 85, + 2 × 2 85, − 2 × 2 8, M = 2 85, + 2 × (2 85, − ,2 )8 = 2 95, Resposta: B 2 Polígono de freqüências Considere o seguinte histograma: www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 68 PROFESSOR: VÍTOR MENEZES Se nós passarmos uma linha unindo todos os pontos médios das laterais superiores dos retângulos do histograma, obtemos o seguinte gráfico: 25 20 15 10 5 0 0 1 2 3 4 Este gráfico acima é chamado de polígono de freqüência. É uma forma alternativa de representação de dados, que pode substituir o histograma. EC 35 Analista IRB 2006 [ESAF] Histograma e Polígono de freqüência são: a) a mesma representação gráfica (idênticas) de uma distribuição de freqüência. b) um texto descritivo e uma representação gráfica de uma distribuição de freqüência. c) um texto descritivo e uma função gráfica de uma distribuição de freqüência. d) duas representações gráficas de uma distribuição de freqüência. e) duas representações gráficas de uma distribuição de freqüência, porém com sentidos opostos. Resposta: D O histograma é uma representação gráfica. Temos várias barras, cada uma associada a uma classe. A altura das barras tem relação com a freqüência da classe, no caso das amplitudes de classe serem todas iguais. Se forem diferentes, a altura das barras têm relação com a densidade de freqüência da classe. www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 69 PROFESSOR: VÍTOR MENEZES O polígono de freqüência é um gráfico de linhas que relaciona valores e freqüências. IX ASSIMETRIA 1 Noções de assimetria No último edital NÃO constou o tópico “assimetria”. Assim, nós não vamos estudar como calcular os diversos índices de assimetria. A idéia é só que vocês tenham uma noção do que se trata. Por quê? Porque isso pode ajudar a resolver questões de medidas separatrizes com maior rapidez. Em vez de definir assimetria, vamos a alguns exemplos. Considere a seguinte seqüência de dados, que representam as idades de 16 pessoas. ROL: 2, 4, 4, 5, 5, 5, 6, 6, 6, 6, 7, 7, 7, 8, 8, 10 Vamos colocar estes dados em uma tabela: Idade Freqüência 2 1 4 2 5 3 6 4 7 3 8 2 10 1 TOTAL 16 Esta seqüência acima é simétrica. Temos sete valores diferentes (2, 4, 5, 6, 7, 8, 10). Por enquanto, vamos esquecer a coluna de freqüências. Vamos considerar apenas a coluna das idades. O valor do meio é o 6. considerando apenas a coluna de idades, este é o termo do meio Idade Freqüência 2 1 4 2 5 3 6 4 7 3 8 2 10 1 TOTAL 16 Analisemos agora os termos vizinhos ao seis. Temos o 5 e o 7. Os dois estão igualmente distantes de 6. 6-1=5 6+1=7 Idade Freqüência 2 1 4 2 5 3 estão a uma distância de1 6 4 7 3 em relação a 6 8 2 10 1 TOTAL 16 Na seqüência, afastando-nos do 6, temos o 4 e o 8. E ambos estão igualmente espaçados em relação a 6. www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 70 PROFESSOR: VÍTOR MENEZES 6-2=4 6+2=8 Idade Freqüência 2 1 4 2 5 3 6 4 estão a uma distância de 2 7 3 em relação a 6 8 2 10 1 TOTAL 16 Na seqüência, afastando-nos ainda mais de 6, temos o 2 e o 10. E ambos estão igualmente espaçados em relação a 6. Idade Freqüência 6-4=2 6+4=10 2 1 3 0 4 2 5 3 6 4 Estão a uma distância de 7 3 4 em relação a 6 8 2 9 0 10 1 TOTAL 16 Pronto, vimos que, à medida que nos afastamos de 6, os valores estão, aos pares, à mesma distância do centro. Analisemos agora as freqüências. A freqüência que corresponde ao 6 é 4. Idade Freqüência 2 1 4 2 5 3 6 4 frequencia correspondente 7 3 ao 6 8 2 10 1 TOTAL 16 A partir da freqüência 4, analisemos as demais freqüências. As freqüências imediatamente vizinhas são 3 e 3. Idade Freqüência 2 1 4 2 5 3 6 4 frequencias iguais 7 3 8 2 10 1 TOTAL 16 Afastando-nos mais do 4, as próximas freqüências também são iguais entre si (2 e 2). www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 71 PROFESSOR: VÍTOR MENEZES Idade Freqüência 2 1 4 2 5 3 6 4 frequencias iguais 7 3 8 2 10 1 TOTAL 16 E, afastando-nos ainda mais da freqüência 4, as freqüências continuam iguais. Idade Freqüência 2 1 4 2 5 3 6 4 frequencias iguais 7 3 8 2 10 1 TOTAL 16 Quando isto acontece, ou seja, quando os valores estão igualmente espaçados em relação ao valor central, e quando as freqüências igualmente espaçadas em relação à freqüência central são iguais entre si, dizemos que a seqüência de dados é simétrica. Quando uma seqüência é simétrica, a média e a mediana são iguais ao termo do meio. Neste caso, a média, a mediana (e a moda) são iguais a 6. A visualização de uma seqüência simétrica é mais fácil por meio de gráficos. 5 4 3 2 1 0 2 3 4 5 6 7 8 9 10 Idades Observe o gráfico de colunas correspondente à nossa série de dados. Se você colocar um espelho bem em cima da coluna correspondente à idade 6, as duas partes vão se sobrepor perfeitamente. Quando os dados estão em classes, o raciocínio é análogo. Vamos criar um outro exemplo, bem parecido: Classes de idade Freqüência 2 – 3 1 www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 72 PROFESSOR: VÍTOR MENEZES Classes de idade Freqüência 3 – 4 2 4 – 5 3 5 – 6 4 6 – 7 3 7 – 8 2 8 – 9 1 TOTAL 16 Agora, em vez de fazer um gráfico de colunas, vamos fazer um histograma. Novamente, observe que, se colocássemos um espelho bem no meio da classe central (classe de 5 a 6), a parte esquerda se sobreporia com perfeição à parte direita. Esta seqüência de dados é simétrica. A visualização também fica facilitada por meio do polígono de freqüência: 5 4 3 2 1 0 2 3 4 5 6 7 8 9 Idades Nestes casos, a média e a mediana são justamente iguais ao ponto médio da classe central. Ou seja, são iguais ao ponto médio da classe 5 – 6. Portanto, a média e a mediana são iguais a 5,5. Ainda em relação às seqüências simétricas, em geral, a moda também coincidirá com a média e a mediana. Usei a expressão “em geral” porque seria perfeitamente possível a seguinte situação: www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 73 PROFESSOR: VÍTOR MENEZES 5 4 3 2 1 0 2 3 4 5 6 7 8 9 Idades Numa situação assim, a seqüência continua simétrica. A média e a mediana continuam sendo iguais a 5,5 (o ponto médio da classe central). Mas a moda não é 5,5. Pelo contrário. A classe central é a classe com menor freqüência. As classes modais são as classes extremas. Mas esta situação, embora possível, não é usual. O mais “normal” é que, em seqüências simétricas, a moda seja igual à média e à mediana. Pois bem, sempre que um conjunto de dados não for simétrico, dizemos que ele é assimétrico. Nesses casos, não será possível construir um gráfico de colunas (ou um histograma, se tivermos dados em classes) de tal forma que existam duas partes que se sobreponham com perfeição. 2 Formas da curva de freqüência. As curvas de freqüência (ou os polígonos de freqüência) podem ter vários formatos. Um, em especial, é algumas vezes perguntado em provas. É o que tem formato de sino: As maiores freqüências correspondem aos valores do meio. Um exemplo deste tipo de gráfico poderia ser as notas dos alunos em uma dada prova. www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 74 PROFESSOR: VÍTOR MENEZES 6 5 4 3 2 1 0 4 5 6 7 8 9 10 Notas A grande maioria das notas girou em torno de 7. Algumas poucas pessoas tiraram notas baixa. E tivemos algumas poucas notas altas. Note que, se colocarmos um espelho sobre o valor 7, as duas partes se sobrepõem com perfeição. A seqüência é simétrica. A média é igual à mediana que é igual à moda, e todas elas são iguais a 7. 6 média = moda = mediana = 7 5 4 3 2 1 0 4 5 6 7 8 9 10 Notas A partir deste gráfico simétrico, podemos imaginar outras curvas, assimétricas. A primeira é a que segue: www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 75 PROFESSOR: VÍTOR MENEZES 6 5 4 3 2 1 0 4 5 6 7 8 9 10 Notas Este gráfico já representa uma prova mais difícil, em que não houve muitas notas altas. Observe que há uma “cauda” mais alongada na parte esquerda do gráfico. Dizemos que a curva é assimétrica negativa, ou desviada à esquerda. 6 5 4 3 cauda 2 1 0 4 5 6 7 8 9 10 Notas Como lembrar desses nomes? Bom, lembre sempre da cauda. A cauda está à esquerda, então a curva é desviada à esquerda. E como a cauda está mais próxima dos números negativos da reta real, então a curva é assimétrica negativa. Para encontrar a moda não tem erro. A moda corresponde ao termo de maior freqüência que, no caso, é o 7. A média sempre estará do lado da cauda. E a mediana estará entre a média e a moda. Assim, se tivéssemos que apontar, “mais ou menos”, onde se encontram cada uma destas medidas, ficaria assim: www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 76 PROFESSOR: VÍTOR MENEZES 6 mediana: entre a média e a moda 5 4 3 2 moda = 7 1 0 4 5 6 7 8 9 10 Notas média: está em algum lugar à esquerda do 7 (portanto, do lado da cauda) A moda seria igual a 7. A média estaria a esquerda de 7 (portanto, do lado da cauda). E a mediana estaria entre a média e a moda. Agora imagine uma outra prova, em que as questões foram bem fáceis. A curva de freqüências das notas seria: 6 5 4 3 2 1 0 4 5 6 7 8 9 10 Notas Observe que, agora, as notas são bem altas. Há uma cauda mais alongada do lado direito. Dizemos que a curva é desviada à direita ou assimétrica positiva. Como lembrar desses nomes? É só lembrar da cauda. Se a cauda está do lado direito, a curva é assimétrica à direita. Como a cauda está do lado dos números positivos, a assimetria é positiva. www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 77 PROFESSOR: VÍTOR MENEZES 6 5 4 cauda 3 2 1 0 4 5 6 7 8 9 10 Notas Vamos localizar as medidas de tendência central? A moda é fácil. A moda é igual a 7. A média, novamente, estará do lado da cauda. Será, portanto, um pouco maior que 7. E a mediana estará entre a média e a moda. 6 mediana: entre a média e a moda 5 4 3 2 moda = 7 1 0 4 5 6 7 8 9 10 Notas média: está em algum lugar à direita do 7 (portanto, do lado da cauda) Agora vejamos algumas questões. Não de assimetria, mas de medidas de posição. Vou apenas usá-las como exemplo para mostrar a vantagem de ter uma noção de assimetria. EC 36 Analista Ministerial MPE PE/2006. Área: estatística [FCC] Considere a tabela a seguir: www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 78 PROFESSOR: VÍTOR MENEZES A tabela acima apresenta a distribuição de freqüências relativas do valor do salário pago aos funcionários da fábrica Y no mês de abril de 2006. A média e a mediana do valor do salário pago pela fábrica Y no mês de abril de 2006 são, respectivamente, a) R$ 200,00 e R$ 400,00 b) R$900,00 e R$1.000,00 c) R$1.050,00 e R$1.000,00 d) R$800,00 e R$800,00 e) R$900,00 e R$900,00 Repare que a distribuição fornecida é simétrica. Nesse caso, a média coincide com a mediana. Portanto, já descartamos as letras A, B e C. Ficamos entre as letras D e E. E para achar a média (ou a mediana), não precisa de muita conta. Simplesmente adotamos o ponto médio da classe central. Media = Mediana = 800 + 1000 = 900 2 Resposta: E. EC 37 Auditor do Tesouro Municipal – Prefeitura Municipal de Natal – 2008 [ESAF] A coleta de dados do município, relativa ao ensino fundamental, apresentou a seguinte composição etária: Composição Etária dos Alunos do Ensino Fundamental: Faixa Etária Masc. Fem. Até 06 anos 9.000 10.200 De 07 a 08 anos 10.000 9.300 De 09 a 10 anos 8.000 8.500 De 11 a 12 anos 7.000 5.500 De 12 a 14 anos 5.000 3.500 De 15 a 18 anos 3.000 2.500 Acima de 18 anos 1.000 1.500 Total 43.200 40.800 Com base nos dados acima, temos as seguintes sentenças: I. A Moda está na faixa etária até os 06 anos. II. A Média de alunos está na faixa etária de 12 a 14 anos. III. A Mediana é superior à média. www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 79 PROFESSOR: VÍTOR MENEZES Apontando nos 3 (três) itens acima como V – Verdadeiro e F – Falso, a opção correta é: a) V, V, V b) V, F, V c) F, V, F d) F, F, F e) V, V, F Observe que as classes têm amplitudes diferentes. O primeiro item é sobre a moda. Não se pediu o cálculo da moda. Apenas se afirmou que a classe modal era a primeira, o que é falso. A segunda classe (de 7 a 8 anos) tem a maior freqüência absoluta (19.300) e, o que é realmente importante, a maior relação f h . Algumas críticas à questão. Em primeiro lugar, a última linha (com os totais) está errada, não representando realmente as somas das colunas. Em segundo lugar, ‘faltaram classes’. De acordo com a tabela acima, não há nenhum aluno com 8 anos e tantos meses. Ou com 10 anos e tantos meses. Ou com 14 anos e tantos meses. Embora seja uma situação possível, é bastante improvável. Estas classes faltantes dificultam um pouco a resposta ao item III, sendo necessário que o candidato faça algumas suposições. Reescrevendo a tabela, corrigindo a linha com os totais, temos: Faixa Etária Masc. Fem. Total Até 06 anos 9.000 10.200 19.200 De 07 a 08 anos 10.000 9.300 19.300 De 09 a 10 anos 8.000 8.500 16.500 De 11 a 12 anos 7.000 5.500 12.500 De 12 a 14 anos 5.000 3.500 8.500 De 15 a 18 anos 3.000 2.500 5.500 Acima de 18 anos 1.000 1.500 2.500 Total 43.000 41.000 84.000 O segundo item afirma que a média está na classe 12 a 14 anos. Sem fazer contas, isto é falso. Notem como as quatro primeiras classes têm muito mais alunos que as três últimas. A média deve ser menor que 12 anos. De todo modo, vamos fazer as contas. Para achar a média, supomos que todas as idades correspondam ao ponto médio das classes. Só que para a primeira e a última classes não foram fornecidos os dois limites. Na primeira classe só foi fornecido o limite superior. Na última classe só foi fornecido o limite inferior. Vamos tentar elevar ao máximo a média. Vamos supor que a primeira classe represente um valor único (represente apenas as crianças com exatamente 6 anos). E vamos supor que o limite superior da última classe seja 50 anos (uma idade extremamente alta para o ensino fundamental). A média, nesta situação ‘exagerada’, ficaria: www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 80 PROFESSOR: VÍTOR MENEZES Faixa Etária Ponto médio f da classe ( X ) X × f 6 anos 6 19.200 115.200,00 De 07 a 08 anos 7,5 19.300 144.750,00 De 09 a 10 anos 9,5 16.500 156.750,00 De 11 a 12 anos 11,5 12.500 143.750,00 De 12 a 14 anos 13 8.500 110.500,00 De 15 a 18 anos 16,5 5.500 90.750,00 De 18 a 50 anos 34 2.500 85.000,00 Total 84.000 846.700 X = 846 700. � 10 08, 84 000. Ou seja, mesmo numa situação exagerada, a média não ficou na classe de 12 a 14 anos. Ficou bem longe disso. O segundo item está falso. Agora vamos à mediana. Creio que a intenção da questão era que o candidato usasse as propriedades de assimetria. Esta curva seria assimétrica à direita. A média é maior que a mediana, que é maior que a moda. Concluímos que o terceiro item também está falso. E a resposta é a letra D. Pronto, treinamos o posicionamento relativo de média, mediana e moda para seqüências assimétricas. Esse era o meu intuito quando coloquei a questão. Só que tem um porém. Essa questão tem uma falha que atrapalha um pouco as coisas. Esse posicionamento relativo de média, mediana e moda vale quando a curva é mais “bem comportada”. Não é o caso desses dados acima. Como já dissemos, há várias classes faltantes, o que tornam esta curva atípica. Em situações assim, não há garantias que média, mediana e moda obedeçam ao posicionamento visto. Portanto, para uma resolução com maior segurança, teríamos que buscar estimar a mediana. Vamos achar a mediana. No cálculo da mediana, a primeira e a última classe não importam muito. Faixa Etária Ponto médio f F da classe ( X ) Até 6 anos 6 19.200 19.200 De 07 a 08 anos 7,5 19.300 38.500 De 09 a 10 anos 9,5 16.500 55.000 De 11 a 12 anos 11,5 12.500 67.500 De 12 a 14 anos 13 8.500 76.000 De 15 a 18 anos 16,5 5.500 81.500 Acima de 18 anos 34 2.500 84.000 A mediana é o valor que corresponde à freqüência acumulada de 42.000. E aqui, devido às classes ‘faltantes’, vamos reescrever a tabela acima, para facilitar a visualização: www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 81 PROFESSOR: VÍTOR MENEZES Faixa Etária Ponto médio f F Da classe ( X ) Até 6 anos 6 19.200 19.200 De 6 até 7 anos 6,5 0 19.200 De 07 a 08 anos 7,5 19.300 38.500 De 08 a 09 anos 8,5 0 38.500 De 09 a 10 anos 9,5 16.500 55.000 De 10 a 11 anos 10,5 0 55.000 De 11 a 12 anos 11,5 12.500 67.500 De 12 a 14 anos 13 8.500 76.000 De 14 a 15 anos 14,5 0 76.000 De 15 a 18 anos 16,5 5.500 81.500 Acima de 18 anos 34 2.500 84.000 Agora podemos continuar com o cálculo da mediana. A idade de 9 anos corresponde à freqüência acumulada de 38.500. A idade de 10 anos corresponde à freqüência acumulada de 55.000. A pergunta é: quem corresponde à freqüência acumulada de 42.000? 9 38.500 9 corresponde a 38.500 Z 42.000 Quem corresponde a 42.000? 10 55.000 10 corresponde a 55.000 Primeira linha 9 38.500 Segunda linha Z 42.000 Terceira linha 10 55.000 Subtraindo as linhas: Fazendo as razões: Z − 9 10 − 9 42.000 − 38.500 55.000 − 38.500 Z − 9 10 − 9 = 42 000. 55 000. − 38 500. − 38 500. Z − 9 = 3 500. = ,0 21 16 500. Z = ,9 21 E a mediana é igual a 9,21. O último item pede que comparemos a média e a mediana. Como a tabela em questão é ‘meio esquisita’, é conveniente fazermos alguns cálculos. O primeiro foi achar a mediana (=9,21). O segundo é achar uma nova estimativa para a média. No item anterior, tentamos achar uma estimativa máxima para a média (criando uma situação exagerada que aumentasse seu valor e fizesse que a média fosse bem grande). Ainda assim a média não ficou na classe 12 – 14, o que nos fez marcar falso no segundo item. Agora vamos achar uma estimativa mínima para a média (criando uma situação exagerada que diminua o valor da média). www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 82 PROFESSOR: VÍTOR MENEZES Vamos supor que o limite inferior da primeira classe é 4 (crianças com menos de 4 anos no ensino fundamental seria ‘forçar demais’). E vamos supor que a última classe se refira apenas às pessoas com exatamente 18 anos. A nova média fica: Faixa Etária Ponto médio f da classe ( X ) X × f E a média fica: De 04 a 06 anos 5 19.200 96.000 De 07 a 08 anos 7,5 19.300 144.750 De 09 a 10 anos 9,5 16.500 156.750 De 11 a 12 anos 11,5 12.500 143.750 De 12 a 14 anos 13 8.500 110.500 De 15 a 18 anos 16,5 5.500 90.750 18 anos 18 2.500 45.000 Total 81 84.000 787.500 X = 787 500. = 9 38, 84 000. Ou seja, numa situação extrema, tentando fazer com que a média seja mínima, ela seria igual a 9,38 anos. Ainda assim, seria maior que a mediana e o último item também estaria falso. Caso a tabela do exercício representasse uma situação real, não precisaríamos fazer tantas suposições e tantas contas para resolver. Bastaria aplicar os conceitos que vimos lá em assimetria que a questão seria respondida praticamente sem contas. Não é o caso deste exercício. Como já dissemos, é muito improvável que um município não tenha nenhum aluno no ensino fundamental com 10 anos e tantos meses, ou 14 anos e tantos meses. Estas ‘classes faltantes’ dificultam um pouco as coisas. LISTA DAS QUESTÕES DE CONCURSOS EC 1 AFC/CGU - 2008. Área: Estatística e cálculos atuariais. [ESAF] [Conjunto de dados da questão anterior: 58, 95, 17, 44, 63, 9, 57, 21, 88, 12, 31, 28, 73, 5 e 56]. Dado o conjunto de dados da questão anterior, determine a amplitude interquartilica Q3 – Q1. a) 33. b) 37. c) 40. d) 46. e) 51. EC 2 Analista CVM 2001 [ESAF] www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 83 PROFESSOR: VÍTOR MENEZES Uma firma distribuidora de eletrodomésticos está interessada em estudar o comportamento de suas contas a receber em dois meses consecutivos. Com este objetivo, seleciona, para cada mês, uma amostra de 50 contas. As observações amostrais constam da tabela seguinte: Valor (R$) Freqüência de março Freqüência de abril 1.000,00 6 10 3.000,00 13 14 5.000,00 12 10 7.000,00 15 13 9.000,00 4 - 11.000,00 - 3 Assinale a opção que corresponde ao intervalo interquartílico, em reais, para o mês de março. a) 3.250,00 b) 5.000,00 c) 4.000,00 d) 6.000,00 e) 2.000,00 EC 3 AFRF – 2003 [ESAF] Considere a tabela de freqüências seguinte correspondente a uma amostra da variável X. Não existem observações coincidentes com os extremos das classes. Classes Freqüências Acumuladas 2.000 – 4.000 5 4.000 – 6.000 16 6.000 – 8.000 42 8.000 – 10.000 77 10.000 – 12.000 89 12.000 – 14.000 100 Assinale a opção que corresponde à estimativa do valor x da distribuição amostral de X que não é superado por cerca de 80% das observações. a) 10.000 b) 12.000 c) 12.500 d) 11.000 e) 10.500 EC 4 AFRF/2002-2 [ESAF] O atributo do tipo contínuo X, observado como um inteiro, numa amostra de tamanho 100 obtida de uma população de 1000 indivíduos, produziu a tabela de freqüências seguinte: Classes Freqüência ( f ) 29,5-39,5 4 39,5-49,5 8 49,5-59,5 14 59,5-69,5 20 www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 84 PROFESSOR: VÍTOR MENEZES 69,5-79,5 26 79,5-89,5 18 89,5-99,5 10 Assinale a opção que corresponde à estimativa da mediana amostral do atributo X. a) 71,04 b) 65,02 c) 75,03 d) 68,08 e) 70,02 EC 5 Auditor Fiscal ICMS/BA – 2004 [FCC] Considere a tabela abaixo que mostra a distribuição de salários (em reais) de 160 funcionários de determinada empresa, com suas respectivas freqüências relativas acumuladas. Classes em reais Freqüência relativa acumulada (%) [600,1000) 10 [1000,1400) 30 [1400,1800) 70 [1800,2200) 95 [2200,2600) 100 Utilizando a interpolação linear, o número de funcionários que ganham salários menores ou iguais a R$ 1.700,00 é: a) 96 b) 84 c) 72 d) 64 e) 56 EC 6 Auditor Fiscal ICMS/BA – 2004 [FCC] Considere a tabela abaixo que mostra a distribuição de salários (em reais) de 160 funcionários de determinada empresa, com suas respectivas freqüências relativas acumuladas. Classes em reais Freqüência relativa acumulada (%) [600,1000) 10 [1000,1400) 30 [1400,1800) 70 [1800,2200) 95 [2200,2600) 100 O valor absoluto da diferença entre a mediana, obtida por interpolação linear, e a média aritmética dos salários, em reais, é [considere que você já sabe que a média é 1580]: a) 20 b) 80 c) 100 www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 85 PROFESSOR: VÍTOR MENEZES d) 200 e) 300 EC 7 Fiscal ICMS/PA – 2002 [ESAF] A tabela de freqüências abaixo apresenta as freqüências acumuladas (F) correspondentes a uma amostra da distribuição dos salários anuais de economistas (Y) – em R$ 1.000,00, do departamento de fiscalização da Cia. X. Não existem realizações de Y coincidentes com as extremidades das classes salariais. Classes F 29,5 – 39,5 2 39,5 – 49,5 6 49,5 – 59,5 13 59,5 – 69,5 23 69,5 – 79,5 36 79,5 – 89,5 45 89,5 – 99,5 50 Assinale a opção que corresponde ao valor z, obtido por interpolação da ogiva, que, estima-se, não é superado por 80% das realizações de Y. a) 82,0 b) 80,0 c) 83,9 d) 74,5 e) 84,5 EC 8 Fiscal ICMS PI - 2001 [ESAF] A tabela abaixo mostra a distribuição de freqüência obtida de uma amostra aleatória dos salários anuais em reais de uma firma. As freqüências são acumuladas. Classes de salário Freqüências 5.000 – 6.500 12 6.500 – 8.000 28 8.000 – 9.500 52 9.500 – 11.000 74 11.000 – 12.500 89 12.500 – 14.000 97 14.000 – 15.000 100 Deseja-se estimar, via interpolação da ogiva, o nível salarial populacional que não é ultrapassado por 79% da população. Assinale a opção que corresponde a essa estimativa. a) R$ 10.000,00 b) R$ 9.500,00 c) R$ 12.500,00 d) R$ 11.000,00 e) R$ 11.500,00 www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 86 PROFESSOR: VÍTOR MENEZES EC 9 Auditor ISS/Recife - 2003 [ESAF] O quadro seguinte apresenta a distribuição de freqüências da variável valor do aluguel (X) para uma amostra de 200 apartamentos de uma região metropolitana de certo município. Não existem observações coincidentes com os extremos das classes. Assinale a opção que corresponde à estimativa do valor Z tal que a freqüência relativa de observações de X menores ou iguais a Z seja 80%. Classes R$ Freqüências 350 – 380 3 380 – 410 8 410 – 440 10 440 – 470 13 470 – 500 33 500 – 530 40 530 – 560 35 560 – 590 30 590 – 620 16 620 - 650 12 a) 530 b) 560 c) 590 d) 578 e) 575 AFRF/96 [ESAF] Texto para as questões EC 10 e EC 11 Distribuição de Freqüências das Idades dos funcionários da Empresa Alfa, em 1/1/90. Classes de idades (anos) if Ptos médios ( X i ) 37X i − 5 d= i d i × f i id 2 × f i id 3 × f i id 4 × f i 19,5-24,5 2 22 -3 -6 18 -54 162 24,5-29,5 9 27 -2 -18 36 -72 144 29,5-34,5 23 32 -1 -23 23 -23 23 34,5-39,5 29 37 0 0 0 0 0 39,5-44,5 18 42 1 18 18 18 18 44,5-49,5 12 47 2 24 48 96 192 49,5-54,5 7 52 3 21 63 189 567 TOTAL 100 16 206 154 1106 EC 10 AFRF 96 [ESAF] Marque a opção que representa a mediana das idades dos funcionários em 1/1/90. a) 35,49 b) 35,73 c) 35,91 d) 37,26 e) 38,01 www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 87 PROFESSOR: VÍTOR MENEZES EC 11 AFRF 96 [ESAF] Sabe-se que o quadro de pessoal da empresa continua o mesmo em 1/1/96. Marque a opção que representa a mediana das idades dos funcionários em 1/1/96 a) 35,49 b) 36,44 c) 41,49 d) 41,91 e) 43,26 EC 12 AFRF/2002-1 [ESAF] Em um ensaio para o estudo da distribuição de um atributo financeiro (X) foram examinados 200 itens de natureza contábil do balanço de uma empresa. Esse exercício produziu a tabela de freqüências abaixo. A coluna Classes representa intervalos de valores de X em reais e a coluna P representa a freqüência relativa acumulada. Não existem observações coincidentes com os extremos das classes. Classes P (%) 70-90 5 90-110 15 110-130 40 130-150 70 150-170 85 170-190 95 190-210 100 Assinale a opção que corresponde à estimativa do quinto decil da distribuição de X. a) 138,00 b) 140,00 c) 136,67 d) 139,01 e) 140,66 EC 13 AFRF - 2001 [ESAF] Freqüências Acumuladas de Salários Anuais, em Milhares de Reais, da Cia. Alfa Classes de Salário Freqüências Acumuladas ( 3 ; 6] 12 ( 6 ; 9] 30 ( 9 ; 12] 50 (12 ; 15] 60 (15 ; 18] 65 (18 ; 21] 68 www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 88 PROFESSOR: VÍTOR MENEZES Suponha que a tabela de freqüências acumuladas tenha sido construída a partir de uma amostra de 10% dos empregados da Cia. Alfa. Deseja-se estimar, utilizando interpolação linear da ogiva, a freqüência populacional de salários anuais iguais ou inferiores a R$ 7.000,00 na Cia. Alfa. Assinale a opção que corresponde a este número. a) 180 b) 120 c) 150 d) 160 e) 130 EC 14 Analista IRB 2006 [ESAF] No campo estatístico, ogivas são: a) polígonos de freqüência acumulada b) polígonos de freqüência acumulada relativa ou percentual. c) histograma de distribuição de freqüência d) histograma de distribuição de freqüência relativa ou percentual e) o equivalente à amplitude do intevalo. Texto para as questões EC 15 e EC 16 Analista MPU 2004 – Área Pericial. Especialidade: Estatística [ESAF] A distribuição de freqüências de determinado atributo X é dada na tabela abaixo. Não existem observações coincidentes com os extremos das classes. Classes Freqüências 2.000 – 4.000 18 4.000 – 6.000 45 6.000 – 8.000 102 8.000 – 10.000 143 10.000 – 12.000 51 12.000 – 14.000 41 EC 15 Analista MPU 2004 – Área Pericial. Especialidade: Estatística [ESAF] Assinale a opção que corresponde à amplitude interquartílica. a) 4.500,1 b) 6.200,2 c) 3.000,4 d) 3.162,6 e) 2.400,0 EC 16 www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 89 PROFESSOR: VÍTOR MENEZES Analista MPU 2004 – Área Pericial. Especialidade: Estatística [ESAF] Assinale a opção que corresponde à estimativa do valor de X que não é superado por 80% das observações do atributo X a) 12.000 b) 10.000 c) 10.471 d) 9.000 e) 11.700 Texto para as questões EC 17 e EC 18. Analista IRB 2004 [ESAF] As questões EC 17 e EC 18 dizem respeito à distribuição de freqüências conforme o quadro abaixo, no qual não existem observações coincidentes com os extremos das classes. Classe Freqüência acumulada 129,5 – 139,5 4 139,5 – 149,5 12 149,5 – 159,5 26 159,5 – 169,5 46 169,5 – 179,5 72 179,5 – 189,5 90 189,5 – 199,5 100 EC 17 Analista IRB 2004 [ESAF] Assinale a opção que corresponde ao oitavo decil a) 179,5 b) 189,5 c) 183,9 d) 184,5 e) 174,5 EC 18 Analista IRB 2004 [ESAF] Assinale a opção que corresponde à estimativa, via interpolação da ogiva, do número de observações menores ou iguais ao valor 164. a) 46 b) 26 c) 72 d) 35 www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 90 PROFESSOR: VÍTOR MENEZES e) 20 EC 19 AFRF - 2002-2 – [ESAF] O atributo do tipo contínuo X, observado como um inteiro, numa amostra de tamanho 100 obtida de uma população de 1000 indivíduos, produziu a tabela de freqüências seguinte: Classes Freqüência ( f ) 29,5-39,5 4 39,5-49,5 8 49,5-59,5 14 59,5-69,5 20 69,5-79,5 26 79,5-89,5 18 89,5-99,5 10 Assinale a opção que corresponde à estimativa do número de indivíduos na população com valores do atributo X menores ou iguais a 95,5 e maiores do que 50,5. a) 700 b) 638 c) 826 d) 995 e) 900 EC 20 Técnico Municipal de Nível Superior – Estatística – Prefeitura Municipal de Vila Velha [CESPE] Uma prefeitura registrou o aumento do valor venal V (em R$ por metro quadrado) de 200 imóveis localizados em certo bairro residencial, conforme apresentado na tabela a seguir: Valor V (R$/m2) Número de imóveis V = 0 80 0 < V ≤ 10 50 10 < V ≤ 20 35 20 < V ≤ 30 25 30 < V ≤ 50 10 Total 200 Com base nessas informações, julgue os itens a seguir. 99. A mediana, que é igual a R$ 25,00/m2, divide os 50% valores mais baixos dos 50% valores mais altos. EC 21 Analista Previdenciário Pleno – Área de Estatística – Paraná Previdência – 2002 [CESPE] Texto II www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 91 PROFESSOR: VÍTOR MENEZES Em estudos previdenciários, é importante avaliar estatisticamente o tempo de sobrevida dos beneficiários. O tempo de sobrevida, em geral, depende do perfil do beneficiário, que abrange um conjunto de características como idade, espécie de benefícios (aposentadoria por idade, invalidez etc.), tipo de clientela (urbana/rural) etc. Para um estudo realizado acerca do tempo de sobrevida de beneficiários com um certo perfil, foram obtidos os resultados apresentados na tabela abaixo. Tempo de sobrevida T em anos 0≤ T < 5 5≤ T < 10 10≤T< 20 20≤T< 40 Total Freqüência de beneficiários falecidos (%) 20 40 30 10 100 Com base nos estudos obtidos para o estudo apresentado no texto II, julgue o item que se segue. 1. O primeiro quartil da distribuição é inferior a 5 anos. EC 22 Analista de Regulação – Economista – ARCE/2006 [FCC] Uma empresa tem 1.000 empregados, classificados conforme a tabela abaixo: Salários (R$) Homens Mulheres Total (500; 1.500] 40 40 80 (1.500; 2.500] 140 100 240 (2.500; 3.500] 180 120 300 (3.500; 4.500] 140 80 220 (4.500; 5.500] 100 60 160 Total 600 400 1000 Observação: calculou-se as médias aritméticas correspondentes para grupo e geral considerando que todos os valores incluídos num certo intervalo de classe são coincidentes com o ponto médio deste intervalo. Para o cálculo das medianas utilizou-se o método da interpolação linear. Analisando os valores obtidos com relação aos empregados desta empresa, tem-se que: a) a média aritmética e a mediana dos salários dos homens são iguais a R$ 3.250,00 e R$ 3.000,00, respectivamente. b) a média aritmética e a mediana dos salários das mulheres são iguais a R$ 3.200,00 e R$ 3.000,00, respectivamente. c) o valor encontrado para a média aritmética dos salários dos empregados de toda a empresa é igual a 3.125,00. d) o módulo da diferença entre as médias aritméticas dos salários dos 2 grupos é igual a R$ 150,00 e) o módulo da diferença entre os valores das medianas dos salários entre os 2 grupos é inferior a R$ 150,00. Texto para as questões EC 23 e EC 24 A tabela abaixo apresenta a distribuição de freqüências das notas obtidas num teste de matemática, realizado por 50 estudantes. Notas Freqüência absoluta 0 │− 2 4 2 │− 4 12 4 │− 6 15 www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 92 PROFESSOR: VÍTOR MENEZES 6 │− 8 13 8 │− 10 6 EC 23 Analista Judiciário. Especialidade: estatística. TRF 1ª Região [FCC] Se a nota mínima para aprovação no teste é 5,8, a porcentagem de aprovação é de: a) 51% b) 48% c) 45% d) 41% e) 38% EC 24 Analista Judiciário. Especialidade: estatística. TRF 1ª Região [FCC] A nota mediana desses estudantes é: a) 4,8 b) 5,0 c) 5,2 d) 5,5 e) 5,8 EC 25 Especialista em regulação de saúde suplementar. Especialidade: Estatística. Ministério da Saúde/2007 [FCC] A tabela fornece informações sobre o tipo de câncer e a idade de 500 pacientes que sofrem desta doença, internados num determinado hospital especializado na doença. Idade Câncer estomacal Câncer pulmonar Outros Total [0;10) 0 6 60 66 [10;30) 30 9 25 64 [30;50) 100 75 55 230 [50;70) 70 60 10 140 Total 200 150 150 500 A idade mediana dos 150 pacientes com câncer pulmonar é: a) 30 anos b) 38 anos c) 40 anos d) 46 anos e) 49 anos EC 26 www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 93 PROFESSOR: VÍTOR MENEZES Técnico de planejamento e pesquisa – IPEA/2004 [ESAF] Para uma amostra aleatória de determinado tributo encontrou-se a seguinte distribuição de freqüências. Não existem observações coincidentes com os extremos das classes. Classes Freqüências 2.000 – 4.000 18 4.000 – 6.000 45 6.000 – 8.000 102 8.000 – 10.000 143 10.000 – 12.000 32 12.000 – 14.000 60 Assinale a opção que corresponde à melhor aproximação do nonagésimo quinto percentil. a) 13.000 b) 12.585 c) 13.333 d) 12.667 e) 13.900 EC 27 Analista BACEN/2006 – Área 5 [FCC] O valor da mediana dos salários dos empregados da empresa XYZ, obtida pelo método da interpolação linear, é igual a: a) R$ 3.500,00 b) R$ 3.625,00 c) R$ 3.650,00 d) R$ 3.800,00 e) R$ 4.000,00 EC 28 Auditor Fiscal ICMS/BA – 2004 O gráfico abaixo é o histograma de freqüências absolutas de uma amostra de valores arrecadados de determinado tributo em um município. www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 94 PROFESSOR: VÍTOR MENEZES Com relação aos dados desta amostra, é verdade que: a) 60% dos valores são maiores ou iguais a R$ 1.500,00 e menores que R$ 3.000,00. b) Mais de 30% dos valores são maiores ou iguais a R$ 2.500,00 e menores que R$ 3.500,00 c) A porcentagem dos valores iguais ou superiores a R$ 3.500,00 é maior que a porcentagem dos valores inferiores a R$ 1.500,00 d) A freqüência relativa de valores inferiores a R$ 1.500,00 é menos que 10% e) A amplitude da amostra é R$ 4.000,00. EC 29 Fiscal ICMS/SP – 2006 [FCC] O histograma de freqüências absolutas, abaixo, demonstra o comportamento dos valores arrecadados de um determinado tributo, no ano de 2005, em uma região a ser analisada: Observação – Considere que todos os intervalos de classe do histograma são fechados à esquerda e abertos à direita. Utilizando as informações contidas neste histograma, calculou-se a média aritmética destes valores arrecadados, considerando que todos os valores incluídos num certo intervalo de classe são coincidentes com o ponto médio deste intervalo. Também calculou-se a mediana de tais valores pelo método da interpolação linear. Então, o módulo da diferença entre a média aritmética e a mediana é igual a: a) R$ 100,00 b) R$ 400,00 c) R$ 800,00 d) R$ 900,00 www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 95 PROFESSOR: VÍTOR MENEZES e) R$ 1.000,00 EC 30 Analista – Área documentação. Especialidade – Estatística – MPU/2007 [FCC] Considere o histograma da variável X a seguir, em que as freqüências simples absolutas foram anotadas no interior dos retângulos. O valor do terceiro quartil de X é: a) 40 b) 35 c) 30 d) 25 e) 12 EC 31 Especialista em regulação de saúde suplementar. Especialidade: Estatística. Ministério da Saúde/2007 [FCC] O histograma abaixo representa a distribuição das idades dos pacientes atendidos no ano de 2000 em uma clínica infantil, expressa em anos. A idade que separa os 30% mais jovens é: a) 3,5 b) 4,2 c) 4,4 d) 4,6 e) 5,0 www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 96 PROFESSOR: VÍTOR MENEZES EC 32 Analista Judiciário. Área apoio especializado. Especialidade: Estatística. TRF 2ª Região/2007 [FCC] Considere o histograma da variável X: O valor da mediana de X é: a) 25,0 b) 32,5 c) 37,5 d) 40,0 e) 42,0 EC 33 Analista BACEN/2006 – Área 5 [FCC] O histograma de freqüências absolutas a seguir foi elaborado com base nas informações contidas na revista “O empreiteiro”, de junho de 2005, que demonstra o comportamento das empresas construtoras do ramo da construção civil no Brasil que obtiveram faturamento em 2004 maior ou igual a 15 milhões de reais e menor o igual a 120 milhões de reais. Com base nestas informações, obteve-se a média aritmética do faturamento das empresas deste estudo, considerando que todos os valores incluídos num certo intervalo de classe são coincidentes com o ponto médio deste intervalo. Com relação ao total de empresas deste histograma, o valor encontrado para esta média pertence ao intervalo de classe que contém www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 97 PROFESSOR: VÍTOR MENEZES a) 24% das empresas b) 16% das empresas c) 9% das empresas d) 7% das empresas e) 5% das empresas EC 34 Técnico de controle externo III – TCE/MG – 2007. Área – Economia [FCC] O histograma de freqüências absolutas a seguir demonstra a distribuição dos salários dos empregados de uma empresa em dezembro de 2006: Sabendo-se que todos os intervalos de classe referentes a este histograma são fechados à esquerda e abertos à direita, calculou-se a média aritmética dos salários dos empregados, considerando que todos os valores incluídos num certo intervalo de classe são coincidentes com o ponto médio deste intervalo. A moda de Pearson é igual a: a) R$ 3.200,00 b) R$ 2.950,00 c) R$ 2.900,00 d) R$ 2.850,0 e) 2.800,00 EC 35 Analista IRB 2006 [ESAF] Histograma e Polígono de freqüência são: a) a mesma representação gráfica (idênticas) de uma distribuição de freqüência. b) um texto descritivo e uma representação gráfica de uma distribuição de freqüência. c) um texto descritivo e uma função gráfica de uma distribuição de freqüência. d) duas representações gráficas de uma distribuição de freqüência. e) duas representações gráficas de uma distribuição de freqüência, porém com sentidos opostos. EC 36 Analista Ministerial MPE PE/2006. Área: estatística [FCC] www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 98 PROFESSOR: VÍTOR MENEZES Considere a tabela a seguir: A tabela acima apresenta a distribuição de freqüências relativas do valor do salário pago aos funcionários da fábrica Y no mês de abril de 2006. A média e a mediana do valor do salário pago pela fábrica Y no mês de abril de 2006 são, respectivamente, a) R$ 200,00 e R$ 400,00 b) R$900,00 e R$1.000,00 c) R$1.050,00 e R$1.000,00 d) R$800,00 e R$800,00 e) R$900,00 e R$900,00 EC 37 Auditor do Tesouro Municipal – Prefeitura Municipal de Natal – 2008 [ESAF] A coleta de dados do município, relativa ao ensino fundamental, apresentou a seguinte composição etária: Composição Etária dos Alunos do Ensino Fundamental: Faixa Etária Masc. Fem. Até 06 anos 9.000 10.200 De 07 a 08 anos 10.000 9.300 De 09 a 10 anos 8.000 8.500 De 11 a 12 anos 7.000 5.500 De 12 a 14 anos 5.000 3.500 De 15 a 18 anos 3.000 2.500 Acima de 18 anos 1.000 1.500 Total 43.200 40.800 Com base nos dados acima, temos as seguintes sentenças: I. A Moda está na faixa etária até os 06 anos. II. A Média de alunos está na faixa etária de 12 a 14 anos. III. A Mediana é superior à média. Apontando nos 3 (três) itens acima como V – Verdadeiro e F – Falso, a opção correta é: a) V, V, V b) V, F, V c) F, V, F d) F, F, F e) V, V, F www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 99 PROFESSOR: VÍTOR MENEZES EC 1 - D EC 2 - C EC 3 - E EC 4 - A EC 5 - A EC 6 - A EC 7 - C EC 8 - E EC 9 - D EC 10 - D EC 11 - E EC 12 - C EC 13 - A EC 14 - A EC 15 - D EC 16 - C EC 17 - C EC 18 - D EC 19 - C EC 20 - ERRADO EC 21 - ERRADO EC 22 - C EC 23 - D EC 24 - C EC 25 - D GABARITO DAS QUESTÕES DE CONCURSOS EC 26 – GABARITO PRELIMINAR: D; MINHA RESPOSTA: C; GABARITO DEFINITIVO: QUESTÃO ANULADA EC 27 - B EC 28 - B EC 29 - A EC 30 - B EC 31 - D EC 32 - C EC 33 - B EC 34 - B EC 35 - D EC 36 - E EC 37 – D www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP PROFESSOR: VÍTOR MENEZES 100 ANEXO Em anexo trago mais alguns comentários sobre medidas separatrizes. Basicamente, vou reproduzir aqui um texto que eu coloquei no site (Ponto 17), que fala como sistematizar o cálculo de medidas separatrizes para dados em ROL ou agrupados por valor. É um procedimento que não tem sido cobrado em provas. Mas, pra quem tiver curiosidade, fica a informação. Ponto 17: Hoje respondo a uma dúvida de Tarcísio Garcia, sobre medidas separatrizes. E aproveito a dúvida dele para complementar alguns comentários que fizemos na aula 2 do curso de estatística para AFRFB. Quando temos dados em classes, a forma de se calcular os quantis (mediana, quartis, decis, percentis, etc) é sempre a mesma. Basta fazer uma interpolação linear usando os valores de freqüência acumulada. Quem está fazendo o nosso curso de estatística viu isso exaustivamente na aula 2, em que resolvemos dezoito exercícios só sobre este assunto. Pois bem, o problema surge quando temos dados em ROL ou dados agrupados por valor. O Tarcísio inicia o e-mail explicando que aprendeu duas formas de se calcular quantis nessas situações. Uma para dados em ROL, outra para dados agrupados por valor (no e- mail ele usou a expressão ‘dados tabulados’ em vez de ‘dados agrupados por valor’). E disse que as duas formas resultam em respostas diferentes e que aí estaria a sua dificuldade. Como resolver os exercícios? Bom Tarcísio, na verdade dados em ROL e dados agrupados por valor guardam uma correspondência perfeita. Qualquer medida que você calcular será a mesma, estejam os dados em ROL ou agrupados por valor. Como você bem disse no seu e-mail, são duas formas diferentes de se representar exatamente o mesmo conjunto de dados. O cálculo de quantis não é influenciado pela forma de organização de dados (Rol ou agrupados por valor). Quando temos dados em classes sim, o cálculo de quantis é padronizado (interpolação linear a partir dos valores de freqüência acumulada). A finalidade das medidas separatrizes é separar os dados de forma bem específica. Vamos trabalhar, por exemplo, com os quartis. Eles separam os dados em quatro partes com o mesmo número de observações. Ocorre que, nestas duas situações (dados em rol ou agrupados por valor), é muito comum que surjam dificuldades na determinação dos quartis. Pode ser que existam muitas possibilidades para o mesmo quartil. Assim, pode ser que dois números diferentes consigam fazer o papel de primeiro quartil (deixando à sua esquerda 25% das observações e 75% à direita). Ou pode ser também que nenhum número consiga fazer este papel. Um exemplo. A seqüência: 1, 2, 3, 4. O número 1,5 consegue deixar à sua esquerda 25% das observações e à sua direita 75% das observações. Poderia ser um candidato ao primeiro quartil. Só que o número 1,6 também consegue deixar à sua esquerda 25% das observações e à sua direita 75% das observações. O mesmo vale para 1,4. Ou para 1,37895. Qual deles adotar? www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP PROFESSOR: VÍTOR MENEZES 101 Outro exemplo. A seqüência 1, 2, 3, 4, 5. O primeiro quartil é o número que deixa à sua esquerda 25% das observações. Neste caso, 25% das observações corresponde a 1,25 observações. Qual é o número que deixa à sua esquerda 25% das observações? Nenhum. 1,25 não é um número inteiro. Não dá para deixar à esquerda 1,25 observações. Nesta hipótese, geralmente procuramos atender a pelo menos uma das seguintes propriedades: · à direita do primeiro quartil existem três vezes mais termos que à sua esquerda; à esquerda do terceiro quartil existem três vezes mais termos que à sua direita; · o número de elementos entre Q1 e Q2 é igual ao número de elementos à esquerda de Q1, que é igual ao número de elementos à direita de Q3; · metade dos dados está entre Q1 e Q3. Quando queremos calcular quantis para dados em rol (ou agrupados por valor), há diversas formas de se proceder. Cada uma faz uma consideração diferente. No nosso curso de estatística até mencionamos alguns comentários extraídos do livro “Estatística aplicada à Economia, Administração e Contabilidade” dos autores Freund e Simon, justamente nesse sentido. No nosso curso procuramos ver a forma necessária para resolver os últimos exercícios da ESAF que têm caído a respeito. Vimos alguns da última prova de Analista da CGU/2008. E vimos outro, um pouco mais antigo, de Analista CVM/2001. Ambos eram sobre quartis e mediana. E a resolução envolvia sempre a mesma consideração. Considerávamos que a mediana é sempre o termo do meio (ou a média dos termos centrais, em caso de um número par de observações). A mediana separa a série de dados em duas partes iguais. Calculada a mediana, tomamos apenas a primeira parte dos dados. A mediana desta primeira parte é o primeiro quartil. Depois, tomamos apenas a segunda metade dos dados. A mediana desta segunda parte é o terceiro quartil. Acontece que o Tarcísio achou um exercício mais antigo da ESAF em que a consideração feita para resolver a questão era outra. Vamos ao exercício. AFC-94 – ESAF Para a solução das duas questões seguintes, utilize a série estatística abaixo: 52 7 13 63 9 13 63 11 13 64 11 13 74 12 15 Os valores do 1° e do 3° quartil da série são, respectivamente: a) 2 e 15 b) 5 e 12 c) 4 e 13 d) 4 e 12 e) 6 e 13 www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP PROFESSOR: VÍTOR MENEZES 102 O Tarcísio informa que a resposta da questão foi letra C. Notem que são 20 observações. Neste caso, é possível separar o conjunto de dados em quatro partes iguais. 2 5 7 13 3 6 9 13 3 6 11 13 4 6 11 13 4 7 12 15 primeira parte segunda parte terceira parte quarta parte Ou seja, é possível calcularmos os quartis de modo que o conjunto de dados seja separado em quatro partes iguais. Para tanto, o primeiro quartil deve estar entre 4 e 5. De forma que à sua esquerda fiquem 5 observações (=25% das observações). O segundo quartil deve estar entre o primeiro 7 e o segundo 7, de forma a separar o conjunto de dados em duas partes iguais. E o terceiro quartil deve estar entre 12 e 13, de forma a deixar à sua esquerda 75% das observações e à sua direita 25% das observações. A resposta dada como correta indica 4 para o primeiro quartil e 13 para o terceiro quartil. Mas estes dois valores só satisfazem à terceira propriedade vista. Contudo, num caso em que o número de dados é múltiplo de 4, era perfeitamente possível satisfazer todas as três propriedades. A figura abaixo apresenta a resposta fornecida. 10 valores 2 3 3 4 4 5 6 6 6 7 7 9 11 11 12 13 13 13 13 15 4 valores 4 valores Acho que o enunciado é questionável. Bom, de qualquer forma, dentre as alternativas fornecidas, sem dúvidas a melhor é a letra C mesmo, que pelo menos deixa metade dos dados entre o primeiro e o terceiro quartil. Numa situação dessas, não brigue com o enunciado. Marque a resposta mais razoável. Vamos agora resolver a questão da forma que vimos no nosso curso. Esta forma envolve a mesma consideração feita para se resolver a recente prova da CGU/2008. E também foi cobrada pela ESAF na prova de Analista da CVM 2001. Estas questões estão resolvidas lá na aula 2 (EC 16, 17 e 18) Primeiro achamos a mediana. Como são 20 termos (número par), a mediana é a média dos dois termos centrais. www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP PROFESSOR: VÍTOR MENEZES 103 Os termos centrais são o 10° e o 11°. O 10° termo é 7. O 11° também é 7. A mediana fica: D = 7 + 7 = 7 2 A mediana separa os dados em duas partes. www.pontodosconcursos.com.br 104 2 3 3 4 4 5 6 6 6 7 7 9 11 11 12 13 13 13 13 15 primeira parte segunda parte i i Na primeira parte são dez observações. Vamos achar a mediana desta primeira parte. Como são dez valores (número par), a mediana é a média dos dois termos centrais. Os termos centrais são o quinto e o sexto elementos. O quinto termo é 4. O sexto termo é 5. A mediana desta primeira parte é justamente o primeiro quartil. Ficamos com: Q1 = 4 + 5 = 4 5, 2 Na segunda parte também temos dez observações. Vamos achar a mediana da segunda parte. Como são dez valores (número par), a mediana é a média dos dois termos centrais. Os termos centrais são o quinto e o sexto elementos. O quinto termo da segunda parte é 12. O sexto termo da segunda parte é 13. A mediana desta segunda parte é justamente o terceiro quartil. Ficamos com: Q3 = 12 + 13 = 12 5, 2 Com esses quartis, todas as propriedades foram obedecidas e conseguimos de fato separar o conjunto de dados em quatro partes iguais, o que não foi feito com o gabarito fornecido. 2 3 3 4 4 5 6 6 6 7 7 9 11 11 12 13 13 13 13 15 O Tarcísio também pergunta se, para achar os quartis, ele pode simplesmente utilizar os valores de freqüência acumulada. Assim, por exemplo, o primeiro quartil seria o valor que corresponde à freqüência acumulada 5 (pois 5 é igual a 25% de 20). Bom Tarcísio, quando o número de dados é bem grande, este método é razoável, fornecendo bons resultados. Ele acaba coincidindo com a metodologia empregada para cálculo de medidas separatrizes para dados em classes. Quando o número de dados não é tão grande, o resultado já não fica bom. Vamos usar este exercício como exemplo. Tomando como primeiro quartil o quinto elemento (pois 5 é igual a 25% de 20), temos que o primeiro quartil seria igual a 4. Ele já não estaria entre 4 e 5. Já não seria apto a deixar à sua esquerda 25% das observações. Fazendo isso, até a mediana pode ser calculada de forma incorreta. Por exemplo, o conjunto: 1, 2, 4, 6. A mediana é igual a 3. É a média entre os termos centrais. www.pontodosconcursos.com.br 105 Com a utilização da freqüência acumulada, tomaríamos o termo que corresponde à freqüência acumulada 2 (pois 2 é igual a 50% de 4). E a mediana, por este raciocínio, seria igual a 2. Mais alguns comentários sobre este exercício. Interessante observar que, como temos 20 observações (múltiplo de 4), haveria diversas outras possibilidades de quartis que também separariam os dados em quatro partes iguais. Por exemplo. Se os quartis fossem: 4,8; 7; 12,3, Também teríamos separado os dados em quatro partes iguais. Uma forma bem interessante (e sistemática) de se achar qualquer medida separatriz é apresentada no livro Estatística Básica dos autores Bussab e Morettin. Contudo, apesar de ser um procedimento bem interessante, não tem sido cobrado em provas de concursos. Como já vimos, os valores de freqüência acumulada não podem ser usados, no caso de dados em rol e dados agrupados por valor, para achar medidas separatrizes. Mas é possível adaptar os valores de freqüência acumulada de forma a definir tais medidas. Esta é a idéia apresentada pelos autores. E, para quem está fazendo o nosso curso de estatística, aqui está novidade. Isso eu não comentei na aula. E não comentei porque não tem sido cobrado em concursos. Basicamente, considera-se uma função que passa pelos pontos formados por: � − � � X , i 0 5, � � i n � A tabela abaixo detalha os cálculos envolvidos. freq. Acumulada relativa adaptada i Xi (i-0,5)/20 1 2 0,025 2 3 0,075 3 3 0,125 4 4 0,175 5 4 0,225 6 5 0,275 7 6 0,325 8 6 0,375 9 6 0,425 10 7 0,475 11 7 0,525 12 9 0,575 13 11 0,625 14 11 0,675 15 12 0,725 16 13 0,775 17 13 0,825 18 13 0,875 19 13 0,925 20 15 0,975 Assim, a mediana é o valor que corresponde a 0,5 (=50%). Só que 0,5 não tem na tabela acima. Fazemos interpolação linear considerando os valores vizinhos a 0,5. Ou seja, considerando que o primeiro 7 corresponde a 0,475 e o segundo 7 corresponde a 0,525. www.pontodosconcursos.com.br 106 Fazendo interpolação linear, obtém-se que a mediana é igual a 7. O primeiro quartil é o valor que corresponde a 0,25 (=25%). Só que 0,25 não tem na coluna de freqüências relativas acumuladas adaptadas. Consideramos, novamente, os valores vizinhos. Consideramos que o segundo 4 corresponde a 0,225 e 5 corresponde a 0,275. Fazendo interpolação linear, descobrimos que o primeiro quartil é igual a 4,5. De forma análoga, descobrimos que o terceiro quartil é igual a 12,5. Por fim, não custa lembrar que quando os dados estão em classes, o método para se achar medidas separatrizes é sempre por interpolação linear a partir dos valores de freqüências acumuladas. É que a utilização de dados em classes faz mais sentido quando o número de dados é bem grande. Sendo uma forma de apresentação que resulta em perda de informação, não é adequado o seu uso quando são poucos dados. Pois bem, quando o número de dados cresce muito, todos os problemas listados, referentes à determinação dos quantis, ficam minimizados. Isso pode ser visto mesmo no caso de dados em Rol. Quando o número de dados cresce, os vários métodos de se determinar os quantis tendem a fornecer resultados muito próximos. E, voltando para o caso de dados em classes, além do número de dados ser grande, ainda temos a questão da perda de informação. Não tendo acesso a todas as observações, teremos que, invariavelmente, fazer considerações sobre a forma de distribuição dos dados. Razoável, portanto, tratá-los como se fossem realizações de uma variável contínua, fazendo interpolação linear a partir do gráfico de freqüências acumuladas. Então Tarcísio, resumindo tudo, temos: · Quando os dados estão em rol ou agrupados por valor, há diversas formas de cálculo de medidas separatrizes; · A maneira que eu tenho visto ser cobrada se refere especificamente aos quartis: achamos a mediana e dividimos os dados em duas partes; a mediana da primeira parte é o primeiro quartil; a mediana da segunda parte é o terceiro quartil; apesar de ser uma forma sistemática de resolução, só se aplica aos quartis; · Existe uma maneira bem interessante que sistematiza o cálculo de medidas separatrizes (quaisquer que sejam elas), usando uma adaptação da freqüência acumulada; tal procedimento não tem sido cobrado nas provas de concursos. · Sobre esta questão do AFC 94 que você mandou, não concordei com o gabarito não; numa série de dados com 20 valores é sim possível dividir em quatro partes iguais, o que não foi feito com o gabarito fornecido (embora, das alternativas fornecidas, realmente a melhor seja a letra C). · O cálculo de medidas separatrizes para dados em rol ou agrupados por valor é muito pouco cobrado em provas; a grande exigência é sobre medidas separatrizes para dados em classes. É isso. Abraços. Vítor. www.pontodosconcursos.com.br