Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
�PAGE � �PAGE �26� ESCOLA DE ENGENHARIA DE LORENA – EEL – USP DISCIPLINA: ESTATÍSTICA CAPÍTULO 1: Levantamento e Apresentação de Dados 1.0 Histórico O Conceito de Estatística Tipos de Estatísticas População e Amostra Tipos de Variáveis Fases do Método Estatístico Coleta de Dados Apuração de Dados Apresentação de Dados Análise, Interpretação e Conclusão sobre os Dados Distribuições de Freqüências Dados Brutos Rol Distribuição de Freqüências Intervalos e Limites de Classes Limites Reais ou Verdadeiros de Classes Amplitudes das Classes Regras Gerais para Elaborar uma Distribuição de Freqüências Representação Gráfica de uma Distribuição de Freqüências - Histograma Representação Gráfica de uma Distribuição de Freqüências Acumuladas – Ogivas de Galton Histograma Alisado Função de Distribuição Acumulada Ramo e Folhas 1.0 Histórico A Estatística é a “ciência” que estuda os métodos de coleta de dados experimentais. Sua origem está associada às primeiras contagens de objetos, animais, pessoas, etc. e a conseqüente transmissão das informações às pessoas, consistindo em uma forma rudimentar da Estatística. As primeiras contagens de pessoas (recenseamentos), avaliações de bens e riquezas, efetuadas a mando dos reis da antiguidade, já constituíam trabalhos estatísticos. Durante milhares de anos foram estas as únicas técnicas de contagem conhecidas. Porém os conhecimentos primários foram se acumulando, até que no século XVII, os grandes matemáticos Pascal e Fermat desenvolveram as bases da Análise Combinatória e da Teoria das Probabilidades. No século seguinte estes conceitos foram mais detalhados por J. Bernoulli e por Laplace. O século XIX viu o nascimento de Estatística Moderna, através dos trabalhos de Gauss, que retomando o estudo de uma função matemática descoberta por De Moivre em 1753, e deduzida também independentemente por Laplace em 1774; percebeu a sua grande importância para a Estatística; pelo que a curva correspondente definida passou a ser designada pelo seu nome: Curva de Gauss. A importância dos trabalhos de Bernoulli, Laplace e Gauss, consistiu no seguinte aspecto: até então a obtenção de conclusões válidas a respeito de uma certa característica de uma população (altura média dos habitantes de uma cidade, por exemplo), implicava na obtenção das medidas desta característica considerada, de todos os indivíduos componentes da população. Posteriormente a estes trabalhos, tornou-se possível efetuar o estudo da característica através da técnica de amostragem, em que as medidas passaram a ser efetuadas apenas sobre uma parcela da população total (amostra). Assim mesmo, verificou-se logo que os métodos de avaliação baseados na curva de Gauss só apresentavam resultados corretos quando a amostra era grande (mais de 200 elementos, por exemplo, sendo perceptível as falhas nas conclusões extraídas a partir de menos de 30 dados coletados), sendo que nem sequer essa condição era suficiente para garantir sempre a validade dos resultados. Mesmo essa última condição (amostra de tamanho maior) não era suficiente para garantir que todos os fenômenos seguiam a lei expressa pela Curva de Gauss, sendo que a maioria dos fenômenos aparentemente regidos pela curva de Gauss, só a seguiam de forma aproximada; indicando a necessidade de se introduzir outras funções matemáticas para servir de base ao estudo, nos casos em que a Lei de Gauss não se aplicava ou quando o afastamento dela era grande. Quanto à insuficiência de dados para a aplicabilidade da Curva de Gauss; o problema foi resolvido por “Student” (pseudônimo de W. S. Gosset), que introduziu em 1908 a chamada “Distribuição t” e por meio da qual podem ser tiradas conclusões seguras a partir de amostras pequenas. Paralelamente, K. Pearson apresentou em 1900, uma outra função, “ ”, através da qual se tornava possível avaliar a discrepância entre observações e hipóteses (desvios). Nessa altura, a atenção dos estatísticos se deslocou para os métodos de coleta de dados, datando de 1922 o trabalho fundamental de R. A. Fisher concernente ao “Delineamento Experimental”, trabalho esse seguido por muitos outros trabalhos, tanto do próprio Fisher, como de seus colaboradores (F. Yates) e de pesquisadores independentes. Na atualidade, esse delineamento é um dos mais importantes capítulos da Estatística Aplicada e existem muitos planos experimentais extensamente estudados. Pouco antes da 2a Guerra Mundial o problema do Controle Estatístico da Qualidade foi abordado sistematicamente por Shewhart e na mesma época surgiram os primeiros Planos de Inspeção por Amostragem, assunto este que foi amplamente desenvolvido de lá para cá, dando origem também à Teoria da Amostragem. O ramo mais moderno da Estatística é a “Teoria da Decisão em Condições de Incerteza”, de maior aplicação nas áreas de Economia, Administração e Finanças. Verifica-se que a Estatística passou a lançar mão de Métodos Matemáticos para solucionar problemas específicos, sendo que deste ponto de vista ela pode ser classificada como um ramo definido da Matemática Aplicada, especialmente apoiado na Teoria das Probabilidades. Assim o seu estudo pode seguir dois caminhos fundamentalmente distintos: pelo método dedutivo, partindo-se de modelos matemáticos pertinentes; ou pelo método intuitivo ou empírico, tomando como ponto de partida a observação e aos poucos introduzindo o aparato matemático, na medida da necessidade aparente. O primeiro caminho apresenta a vantagem de uma exposição rigorosa, aliada à grande concisão e elegância inerentes ao desenvolvimento da Estatística Matemática em geral, sendo assim mais apropriado para cursos em Escolas de caráter mais teórico como a linha da Filosofia; o segundo é de apreensão mais imediata e de aprendizado mais fácil, sendo assim mais apropriado para Escolas com o objetivo da aplicação imediata como as Escolas de Engenharia. Nesse segundo tipo o objetivo é disponibilizar as técnicas estatísticas de maior uso dentro de suas especialidades, bem como capacitar a ampliar seus conhecimentos por auto-instrução, possibilitando a discussão de problemas de caráter mais elevado em momentos de estudos e discussão em grupos. O caminho utilizado aqui será o segundo, que possibilitará uma maior velocidade de aprendizado, bem como viabilizará linhas futuras específicas de estudos. Conceito de Estatística A Estatística se ocupa da coleta, organização, descrição, análise e interpretação de dados experimentais e pode ser dividida em duas grandes partes: Coleta, Organização e Descrição dos Dados (Tabelas e Gráficos) Análise e Interpretação dos Dados (Inferência) Tipos de Estatísticas Estatística Descritiva: se ocupa da coleta, organização e descrição dos dados. Estatística Indutiva: se ocupa da análise e interpretação dos dados. População e Amostra - População ou Universo: No sentido geral é um conjunto de elementos com pelo menos uma característica comum, a qual deve delimitar de forma inequívoca quais os elementos que fazem parte da população e quais os que não fazem. Às vezes não é fácil definir a população, porém, deve-se procurar caracterizá-la da melhor maneira possível, antes de se efetuar o levantamento de dados. - Amostra: É uma parte da população, que às vezes é utilizada para minimizar o trabalho de manipulação dos dados da população como um todo. É um subconjunto da população, necessariamente finito. Entre as causas para a utilização de amostras, destacam-se: custo, tempo de resposta, acesso á população, etc. Observações: A Estatística Indutiva tem por objetivo obter conclusões sobre POPULAÇÕES, com base em resultados observados em AMOSTRAS extraídas dessas populações. O processo indutivo é um processo de raciocínio em que, partindo-se do conhecimento de uma parte do todo, procura-se tirar conclusões sobre a realidade do todo. Logo, não é um processo exato e pode estar sujeito a erros; o que leva a definir a Estatística não como uma ciência, propriamente dita. A Estatística Indutiva, entretanto, irá dizer até que ponto pode estar ocorrendo o erro nas induções, e com que grau de possibilidade (probabilidade). Esse fato é fundamental para que uma indução (ou inferência) possa ser considerada estatística, e isto é parte integrante dos objetivos da Estatística Indutiva. O cálculo de probabilidade é fundamental ao estudo da Estatística Indutiva. Quanto maior for a amostra, mais precisas e mais confiáveis deverão ser as induções realizadas sobre a População. Exagerando, concluí-se que os resultados mais perfeitos são aqueles obtidos pelo exame completo de toda a População, ao qual se costuma denominar CENSO ou RECENSEAMENTO. Na prática, às vezes, o emprego de amostras pode ser feito de modo tal que se obtenha resultados confiáveis, em termos práticos equivalentes, ou até mesmo melhores do que os que seriam obtidos através de um censo. A Estatística Descritiva vai organizar os dados das amostras: surge então a necessidade de certos cuidados básicos no processo de obtenção dessas amostras, o que é estudado na teoria da “AMOSTRAGEM”. Para se desenvolver um estudo completo de Estatística, todos os aspectos abaixo indicados, devem abordados em maior ou menor grau, dentro da seqüência indicada: Figura 1: Aspectos do estudo da Estatística Tipos de Variáveis Dependendo da característica de interesse tem-se: Variável Qualitativa: quando resultar de uma classificação por tipos ou atributos. Esse tipo se subdivide em: A1) Nominal: quando não existe qualquer ordenação das possíveis realizações. Exemplos: - Estado civil - Cor dos olhos - Sexo da pessoa A2) Ordinal: quando existe a possibilidade de ordenação nas realizações. Exemplos: - Grau de instrução - Posto militar Variável Quantitativa: quando resultar de uma classificação por números (numérica). Esse tipo se subdivide em: B1) Discreta: quando pode assumir apenas valores pertencentes a um conjunto enumerável; isto é, são pontuais (contagem). Exemplos: - Número de filhos - Pontos no lançamento de um dado. B2) Contínua: quando pode assumir qualquer valor dentro de um certo intervalo Exemplos: - Idade - Peso líquido - Diâmetro externo Fases do Método Estatístico Coleta de Dados Coleta de dados primários: os valores são obtidos na fonte originária. Coleta de dados secundários: os valores são obtidos de levantamentos anteriores Apuração dos Dados Após a coleta dos dados, torna-se necessária sua apuração ou contagem, denominada também de tabulação. Para tanto costuma-se ordená-los mediante critérios de classificação. Apresentação dos Dados Depois de estarem apurados, os dados podem ser apresentados em forma de: - Tabelas ou Quadros - Gráficos Análise, Interpretação e Conclusão sobre os Dados Esta é a fase mais importante do processo estatístico, que depende diretamente das fases anteriores. A conclusão do levantamento estatístico deve ser coerente, pois em caso contrário, todo o trabalho anterior perderá valor. Distribuições de Freqüências Dados Brutos Quando os dados oriundos dos levantamentos, são apresentados em sua forma de obtenção (aleatoriamente dispostos), eles são chamados Dados Brutos. Exemplo: Dados das estaturas de 76 alunos de uma determinada classe (em metros): 1,72 1,80 1,74 1,82 1,76 1,67 1,60 1,62 1,62 1,64 1,67 1,74 1,69 1,55 1,55 1,56 1,63 1,69 1,55 1,80 1,76 1,71 1,79 1,67 1,73 1,80 1,91 1,92 1,72 1,63 1,68 1,65 1,83 1,89 1,78 1,64 1,72 1,64 1,54 1,65 1,70 1,68 1,69 1,80 1,74 1,75 1,72 1,76 1,72 1,74 1,73 1,65 1,65 1,63 1,81 1,56 1,80 1,68 1,50 1,66 1,78 1,78 1,68 1,81 1,84 1,66 1,77 1,67 1,66 1,73 1,60 1,80 1,86 1,85 1,69 1,79 Rol Chama-se Rol, à apresentação dos dados brutos de forma ORDENADA; crescente da esquerda para a direita e de cima para baixo. Exemplo: Rol das estaturas dos 76 alunos do exemplo anterior 1,50 1,54 1,55 1,55 1,55 1,56 1,56 1,60 1,60 1,62 1,62 1,63 1,63 1,63 1,64 1,64 1,64 1,65 1,65 1,65 1,65 1,66 1,66 1,66 1,67 1,67 1,67 1,67 1,68 1,68 1,68 1,68 1,69 1,69 1,69 1,69 1,70 1,71 1,72 1,72 1,72 1,72 1,72 1,73 1,73 1,73 1,74 1,74 1,74 1,74 1,75 1,76 1,76 1,76 1,77 1,78 1,78 1,78 1,79 1,79 1,80 1,80 1,80 1,80 1,80 1,80 1,81 1,81 1,82 1,83 1,84 1,85 1,86 1,89 1,91 1,92 1.6.3 Distribuição de Freqüências As distribuições de freqüências indicam como estão distribuídas as freqüências ocorridas pelas observações. Podem ser dadas através de duas formas: Dados não agrupados ou não tabulados em classes Dados agrupados ou tabulados em classes. Exemplo: Considerando o exemplo dos 76 alunos.... Tabela 1: Dados não Agrupados em classes Estaturas (m) Tabulação Freqüência 1,50 / 1 1,54 / 1 1,55 /// 3 1,56 // 2 1,60 // 2 1,62 // 2 1,63 /// 3 1,64 /// 3 1,65 //// 4 1,66 /// 3 1,67 //// 4 1,68 //// 4 1,69 //// 4 1,70 / 1 1,71 / 1 1,72 ///// 5 1,73 /// 3 1,74 //// 4 1,75 / 1 1,76 /// 3 1,77 / 1 1,78 /// 3 1,79 // 2 1,80 ////// 6 1,81 // 2 1,82 / 1 1,83 / 1 1,84 / 1 1,85 / 1 1,86 / 1 1,89 / 1 1,91 / 1 1,92 / 1 Total 76 Tabela 2: Dados agrupados em classes Estaturas (m) Tabulação Freqüência 1,50 1,56 ///// 5 1,56 1,62 //// 4 1,62 1,68 /////////////////// 19 1,68 1,74 ////////////////// 18 1,74 1,80 ////////////// 14 1,80 1,86 //////////// 12 1,86 1,92 /// 3 1,92 1,98 / 1 Total - 76 As freqüências indicadas correspondem às quantidades de ocorrências observadas e são comumente chamadas de “Freqüências Absolutas”, sendo indicada por fi ou ni e, geralmente, chamada apenas de freqüência. A totalidade das observações é chamada “Freqüência Total”, sendo indicada por ft ou N. Logo: N = ft = ( fi = ( ni ou Representando graficamente a distribuição de freqüência, considerando os dados agrupados do exemplo anterior, tem-se: fi 1,50 1,56 1,62 1,68 1,74 1,80 1,86 1,92 1,98 Estaturas (m) Esta representação gráfica é também chamada de “HISTOGRAMA”. A “Freqüência Relativa” – fRi – é a relação (quociente) entre a freqüência absoluta e a freqüência total. Logo: fRi = = , e As propriedades da freqüência relativa são: 1) 2) se o evento A ocorrer em todas as n repetições 3) se o evento A nunca ocorrer nas n repetições 4) Se A e B forem eventos mutuamente exclusivos, então: 5) Estabilidade das freqüências ou Lei da Regularidade Estatística: ao se repetir um experimento, um número bastante grande de vezes, a freqüência relativa de um determinado evento vai se aproximando de sua característica natural. Por exemplo, ao se lançar uma moeda honesta, buscando a verificação de freqüência relativa de “CARA”, observa-se que quanto maior o número de lançamentos, a freqüência relativa de “CARA” tende a ficar em torno do valor 0,50. Freqüência Percentual (%): é o produto da freqüência relativa por 100%. Intervalos e Limites de Classes Cada classe da distribuição será definida pelos limites (inferior e superior) e pelo seu intervalo. Limite inferior da Classe: li Limite superior da Classe: Li Limites não Definidos São aqueles levantamentos nos quais geralmente não são definidos os intervalos de classe (primeiro intervalo e último intervalo) da distribuição. Exemplo: Distribuição de domicílios da grande São Paulo, segundo a classe de renda (1974) Renda Domiciliar ($1,00) Número de Domicílios Até 800 622.720 801 a 1.600 733.920 1.601 a 2.300 356.265 2.301 a 3.500 256.455 3.501 a 5.900 109.115 Mais que 5.901 83.400 Total 2.171.875 As classes, primeira e última, são de limites não definidos. Limites Reais ou Verdadeiros da Classe São obtidos através da média aritmética simples entre o limite superior de uma classe e o limite inferior da classe seguinte Exemplo: No exemplo anterior: Limite Superior Real da 1ª classe: Limite Superior Real da 2ª classe: Amplitudes das Classes (h) O intervalo de uma classe corresponde ao comprimento desta classe. Numericamente pode ser definido como: A diferença existente entre o limite inferior de uma classe, e o limite inferior da classe seguinte; ou A diferença existente entre o limite superior de uma classe, e o limite superior da classe anterior; ou A diferença entre o limite superior e o limite inferior da classe. OBS: a) Amplitude Total ou Oscilação ou Range de uma Distribuição – (AT ou R) É a diferença entre os valores extremos do Rol. AT = R = Xmáx. – Xmín. b) Pontos Médios ou Centrais das Classes – (Ci ou PMi) Numericamente pode ser definido como: A média aritmética simples, entre o limite superior e o limite inferior de uma mesma classe: Ci = PMi = , ou A soma do limite inferior de uma classe, com a metade da amplitude dessa classe: Ci = PMi = li + , ou A diferença entre o limite superior da classe e a metade da amplitude dessa classe: Ci = PMi = Li - . Exemplo: Considerando o exemplo da distribuição das estaturas dos 76 alunos, calcular para as classes: Amplitude Ponto Médio Freqüência Absoluta Freqüência Relativa Solução: Classes Amplitudes H Ponto Médio Freqüências Absoluta fi Relativa fRi 1,50 1,56 0,06 1,53 1,53 5 0,07 1,56 1,62 0,06 1,59 1,59 4 0,05 1,62 1,68 0,06 1,65 1,65 19 0,25 1,68 1,74 0,06 1,71 1,71 18 0,24 1,74 1,80 0,06 1,77 1,77 14 0,18 1,80 1,86 0,06 1,83 1,83 12 0,16 1,86 1,92 0,06 1,89 1,89 3 0,04 1,92 1,98 0,06 1,95 1,95 1 0,01 Regras Gerais para elaborar uma distribuição de freqüências 1ª) Monta-se o Rol dos dados existentes (dados brutos); 2ª) Calcula-se o range ou amplitude total da distribuição; 3ª) Calcula-se o número de classes da distribuição – k -, que será aproximadamente igual a: k = , onde: k = número de classes N = número total de observações Este número de classes deverá sempre estar entre 5 e 20. Outro caminho de cálculo do número de classes é através da Regra de Sturges: k = 1 + 3,3 log N Esta regra também é apresentada na forma gráfica. 4ª) Determinam-se os intervalos das classes que serão dados por: h = 5ª) Determina-se o número de observações que cai em cada classe, achando-se as freqüências de cada classe. Estes dados (freqüências absolutas) são colocados em tabelas de distribuição de freqüência, onde são também indicados os valores de freqüências relativas ou porcentagens. Exemplo: Considerando o exemplo das estaturas dos 76 alunos... O rol já foi montado no item 1.6.2 Amplitude total At = Xmáx. – Xmin. = 1,92 – 1,50 = 0,42 Número de classes K = 8,71 9 Amplitude da classe h = = = 0,0467 0,05 As observações de cada classe estão indicadas na tabela 3. Tabela 3 Classes Amplitudes H Centro da Classe Freqüências Porcentagem fr x 100% Absoluta - fa Relativa - fr 1,50 1,55 0,05 1,525 2 0,03 3 1,55 1,60 0,05 1,575 5 0,07 7 1,60 1,65 0,05 1,625 10 0,13 13 1,65 1,70 0,05 1,675 19 0,25 25 1,70 1,75 0,05 1,725 14 0,18 18 1,75 1,80 0,05 1,775 10 0,13 13 1,80 1,85 0,05 1,825 11 0,14 14 1,85 1,90 0,05 1,875 3 0,04 4 1,90 1,95 0,05 1,925 2 0,03 3 Total - - 76 1,00 100 Representação Gráfica de uma Distribuição de Freqüências A distribuição de freqüências pode ser representada graficamente de duas maneiras: A) Histograma ou Histograma de Freqüências (Absoluta, Relativa ou Porcentagem) Consiste em um grupo de retângulos que têm: - as bases sobre um eixo horizontal, com centro no ponto médio e as larguras iguais às amplitudes dos intervalos das classes: - as alturas proporcionais às freqüências das classes (quando as classes têm intervalos de igual amplitude, as áreas dos retângulos serão, também, proporcionais às freqüências das classes) Exemplo: Considerando o exemplo das estaturas dos 76 alunos... fi 1,50 1,55 1,60 1,65 1,70 1,75 1,80 1,85 1,90 1,95 (m) fr % 1,50 1,55 1,60 1,65 1,70 1,75 1,80 1,85 1,90 1,95 (m) B) Polígono de Freqüências É um gráfico de linhas em que as freqüências são locadas considerando os pontos médios superiores das classes; ligando-se esses pontos entre si. fi 1,50 1,55 1,60 1,65 1,70 1,75 1,80 1,85 1,90 1,95 (m) 1.6.9 Representação Gráfica de uma Distribuição de Freqüências Acumuladas – Ogivas A freqüência total de todos os valores inferiores ou superiores ao limite inferior ou superior de um dado intervalo de classes é denominada Freqüência Acumulada até ou após, incluindo o intervalo. A tabela que apresenta essas freqüências acumuladas denomina-se Distribuição de Freqüências Acumuladas, ou Distribuição Acumulada. Este tipo de distribuição pode ser elaborada em termos de freqüência absoluta, de freqüência relativa ou de porcentagem. As freqüências acumuladas são indicadas por F (maiúsculo). A representação gráfica da distribuição de freqüências acumuladas é denominada Polígono de Freqüências Acumuladas ou Ogivas de Galton. Exemplo: Considerando os dados da tabela 3, estão apresentadas abaixo, as distribuições de freqüências acumuladas de freqüências absolutas, de freqüências relativas e de porcentagens, na tabela 4. Tabela 4 Classes fi Fi ACUMULADA fr Fr ACUMULADA % % ACUMULADA 1,50 1,55 2 2 0,03 0,03 3 3 1,55 1,60 5 7 0,07 0,10 7 10 1,60 1,65 10 17 0,13 0,23 13 23 1,65 1,70 19 36 0,25 0,48 25 48 1,70 1,75 14 50 0,18 0,66 18 66 1,75 1,80 10 60 0,13 0,79 13 79 1,80 1,85 11 71 0,14 0,93 14 93 1,85 1,90 3 74 0,04 0,97 4 97 1,90 1,95 2 76 0,03 1,00 3 100 Total 76 - 1,00 - 100 - A distribuição de freqüências acumulada gráfica, será: fi 1,50 1,55 1,60 1,65 1,70 1,75 1,80 1,85 1,90 1,95 (m) As ogivas poderão ser construídas considerando freqüências absolutas, relativas ou percentuais; podendo ser crescentes (abaixo de) ou decrescente (acima de). fi Ogiva de Galton Ogiva de Galton Decrescente Crescente 76 71 23 9 5 1,50 1,56 1,62 1,68 1,74 1,80 1,86 1,92 1,90 Estaturas (m) OBS: DISTRIBUIÇÃO COM INTERVALOS DE CLASSES DESIGUAIS Nos casos em que a distribuição apresente classes com intervalos desiguais, a análise comparativa não pode ser efetuada diretamente; deve-se fazer ajustes para possibilitar a comparação. A comparação deverá ser feita através da densidade de freqüência, a qual vai indicar a concentração de freqüência, por unidade da variável. Logo: Densidade de Freqüência = , onde: = freqüência absoluta da classe; = Amplitude da classe A densidade pode ser calculada em termos absolutos, relativos ou porcentagens. Exemplo: Considerando a distribuição de 250 empresas, segundo o número de empregados. Número de Empregados Amplitude da Classe Freqüência Absoluta Densidade de Freqüência Absoluta Porcentagem (%) Densidade de Porcentagem 00 10 10 5 0,50 2 0,20 10 20 10 20 2,00 8 0,80 20 30 10 35 3,50 14 1,40 30 40 10 40 4,00 16 1,60 40 60 20 50 2,50 20 1,00 60 80 20 30 1,50 12 0,60 80 100 20 20 1,00 8 0,40 100 140 40 20 0,50 8 0,20 140 180 40 15 0,38 6 0,15 180 260 80 15 0,19 6 0,08 TOTAL - 250 - 100 - O histograma da distribuição será: (%) 1,6 1,4 1,0 0,8 0,6 0,4 0,2 0,15 0,08 10 20 30 40 60 80 100 140 180 260 Nº de empregados Histograma Alisado Quando os intervalos das classes diminuem de tamanho, o histograma obtido vai ficando cada vez mais irregular, chegando a atingir um ponto limite como uma curva bem suave. Este tipo de histograma é chamado, então, de histograma alisado e é útil para ilustrar rapidamente qual o tipo geral de comportamento da distribuição de uma variável. A interpretação deste tipo de gráfico é a mesma do histograma; isto é, nas regiões onde a curva é mais elevada, significa uma maior densidade de observações. Exemplo: Considere os dados: Classes Centros Freqüências Absolutas - fi 5 6 5,5 1 6 7 6,5 3 7 8 7,5 11 8 9 8,5 12 9 10 9,5 18 10 11 10,5 22 11 12 11,5 18 12 13 12,5 13 13 14 13,5 11 14 15 14,5 7 15 16 15,5 4 16 17 16,5 0 Total - 120 O histograma dos dados seria: fi � 5 6 7 8 9 10 11 12 13 14 15 16 x O histograma alisado também é denominado de Histograma Polido, pois cada classe passaria a ser representada por um único ponto, conforme estrutura algébrica abaixo: onde: fp = freqüência polida fc = freqüência da classe fa = freqüência da classe anterior fs = freqüência da classe seguinte A representação gráfica ficaria: � Função de Distribuição Acumulada Dadas N observações de uma variável quantitativa, e um número x real qualquer, indicar-se-á por N(x), a função que apresenta o número de observações menores ou iguais a x, e que é denominada de função de distribuição acumulada (f. d. a.), e é indicada por: Exemplo: Considerando a distribuição de freqüências do número de filhos de 20 pessoas: Número de filhos Freqüência - fi Procentagem (%) 0 4 20 1 5 25 2 7 35 3 3 15 5 1 5 Total 20 100 A função de distribuição acumulada será dada por: = 0,00 se x < 0 0,20 se 0 ≤ x < 1 0,45 se 1 ≤ x < 2 0,80 se 2 ≤ x < 3 0,95 se 3 ≤ x < 5 1,00 se x ≥ 5 Ramo e Folhas É um procedimento alternativo para resumir um conjunto de valores, com o objetivo de se obter uma idéia da forma de sua distribuição. É conhecido também como Diagrama de TUKEY (1977) e possui a vantagem de apresentar os dados reais levantados; e possui a desvantagem de em alguns casos assumir grandes dimensões. A técnica de montagem consiste em dividir a observação em duas partes: - a primeira (RAMO): é colocada à esquerda de uma linha vertical - a segunda (FOLHA): é colocada à direita desta linha vertical. Exemplo: Considerando o exemplo da distribuição das estaturas dos 76 alunos RAMO E FOLHAS 1,5 0 4 5 5 5 6 6 1,6 0 0 2 2 3 3 3 4 4 4 5 5 5 5 6 6 6 7 7 7 7 8 8 8 8 9 9 9 9 1,7 0 1 2 2 2 2 2 3 3 4 4 4 4 5 6 6 6 7 8 8 8 9 9 1,8 0 0 0 0 0 0 1 1 2 3 4 5 6 9 1,9 1 2 Exemplo: Considerando a distribuição de salários de 36 funcionários de uma empresa (em termos de salários mínimos) ROL 4,00 4,56 5,25 5,73 6,26 6,66 6,86 7,39 7,59 7,64 8,12 8,46 8,74 8,95 9,13 9,35 9,77 9,80 10,53 10,76 11,06 11,59 12,00 12,79 13,23 13,60 13,85 14,69 14,71 15,99 16,22 16,61 17,26 18,75 19,40 23,30 RAMO E FOLHAS 4 00 56 5 25 73 6 26 66 86 7 39 59 64 8 12 46 74 95 9 13 35 77 80 10 53 76 11 06 59 12 00 79 13 23 60 85 14 69 71 15 99 16 22 61 17 26 18 75 19 40 20 21 22 23 30 Observação: Para minimizar o número de linhas de um ramo e folhas, costuma-se subdividi-lo em valores múltiplos de 10 (em dezenas) ou mais. Exemplo: Considerando a distribuição das produções de 20 Companhias Químicas, em toneladas: ROL: 50 90 120 170 180 180 200 240 250 280 360 480 500 560 870 1000 1050 1100 4200 5100 RAMO E FOLHAS – 1ª FORMA 0 6 7 8 0 1 20 70 80 80 2 00 40 50 80 3 60 4 80 5 00 60 6 7 70 1 000 050 100 2 3 4 200 5 100 RAMO E FOLHAS – 2ª FORMA 0 50 90 1 20 70 80 80 2 00 40 50 80 3 60 4 80 5 00 60 6 7 8 70 9 1 000 050 100 2 3 4 200 5 100 OBSERVAÇÕES 1ª) Existem outros tipos de representações gráficas de distribuições que são menos utilizadas, como por exemplo: GRÁFICO DE LINHAS (lineares) Exemplo: Produção de Pneumáticos no Brasil – 1971/1976 Períodos Pneumáticos (1.000 peças) 1971 9.393 1972 10.710 1973 13.466 1974 16.238 1975 16.704 1976 19.149 Fonte: Conjuntura Econômica, julho/77 Pneumáticos (1.000 peças) 19.500 18.000 16.500 15.000 13.500 12.000 10.500 9.000 Anos 71 72 73 74 75 76 DIAGRAMA DE BASTÃO Exemplo: Número de crianças do sexo masculino, em 5 famílias com 4 crianças cada. . Nº de Filhos 4 3 2 1 A B C D E Anos DIAGRAMA DE BARRAS Exemplo: Fundo de garantia por tempo de serviço (Arrecadação líquida) Períodos Milhões $ 1975 7.963 1976 11.014 1977 16.900 1978 27.148 1979 40.718 1980 68.372 Fonte: Conjuntura Econômica – Fev/83 Anos 80 79 78 77 76 75 6 12 18 24 30 36 42 48 54 60 66 72 $ milhões SETOGRAMA Exemplo: Consumo industrial de energia elétrica (milhões de kwh – 1976/Brasil) Empresas Milhões de kwh % de consumo Ângulo correspondente (graus) RIO – LIGHT 3.226 12,4 44,6 SP – LIGHT 13.617 52,3 188,3 CEMIG 6.763 26,0 93,6 CHESP 1.183 4,5 16,2 CESP 1.258 4,8 17,3 TOTAL 26.047 100 360,0 Fonte: Conjuntura Econômica – julho/77 � GRÁFICO POLAR É utilizado para mostrar as variações sazonais durante doze meses do ano, ou para outras séries de tempo. Desenvolve-se a partir do ponto central (origem) até a sua borda ou além ela. Exemplo: Produção brasileira de Celulose, em 1.000 toneladas Período Produção (1.000 t) 1969 567,3 1970 664,0 1971 721,5 1972 898,3 1973 971,7 1974 1.129,5 1975 1.189,6 1976 1.253,8 1977 1.502,3 TOTAL 8.898,0 Fonte: Associação Paulista dos Fabricantes de Papel e Celulose 1971 1969 1972 1977 1973 1976 1974 1975 2ª) Tipos de Curvas de Freqüência Curvas de Freqüências Simétricas ou em forma de sino Caracterizam-se pelo fato das observações eqüidistantes do ponto central máximo, apresentarem as mesmas freqüências. Curvas de Freqüências Moderadamente Assimétricas ou Desviadas Caracterizam-se pelo fato da cauda de um lado da ordenada máxima ser mais longa do que a do outro lado. Se o ramo mais alongado fica à direita, a curva é chamada de DESVIADA PARA A DIREITA, ou de ASSIMETRIA POSITIVA. Se o ramo mais alongado fica à esquerda, a curva é chamada de DESVIADA PARA A ESQUERDA, ou de ASSIMETRIA NEGATIVA. Curvas em forma de “J” ou de “J” INVERTIDO Caracterizam-se pelo fato do ponto de ordenada máxima ocorrer em uma das extremidades. Curvas em forma de “U” Caracterizam-se pelo fato de apresentar ordenadas máximas em ambas as extremidades. e) Curvas de duas ordenadas máximas f) Curvas com várias ordenadas máximas ESTATÍSTICA INDUTIVA AMOSTRAGEM ESTATÍSTICA DESCRITIVA CÁLCULO DE PROBABILIDADE CESP 4,8% RIO LIGHT 12,4% SP LIGHT CHESP 4,5% 52,3% CEMIG 26,0% 26% 26% fp _1246277966.unknown _1280923965.unknown _1280924088.unknown _1327238440.unknown _1327238803.unknown _1330951420.unknown _1376483401.unknown _1327304106.unknown _1327305031.unknown _1327300981.unknown _1327238661.unknown _1327238403.unknown _1280924123.unknown _1327238344.unknown _1280924010.unknown _1246279645.unknown _1246280332.unknown _1280923245.unknown _1246279736.unknown _1246278953.unknown _1246279204.unknown _1246278047.unknown _1059400061.unknown _1246274691.unknown _1246274768.unknown _1059400124.unknown _1059400302.unknown _1058880784.unknown _1059399999.unknown _1058880782.unknown _1058880781.unknown