Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
Estatística Descritiva Vanêssa Brito Fernandes Neves ESTATÍSTICA APLICADA À INVESTIGAÇÃO SOCIAL ALGUNS CONCEITOS IMPORTANTES • Método: é um conjunto de meios dispostos convenientemente para se chegar a um fim que se deseja. • Método experimental: consiste em manter constantes todas as causas (fatores), menos uma, e variar esta causa de modo que o pesquisador possa descobrir seus efeitos, caso existam. • Método estatístico: diante da impossibilidade de manter as causas constantes, admite todas essas causas presentes variando-as, registrando essas variações e procurando determinar, no resultado final, que influências cabem a cada uma delas. ESTATÍSTICA DESCRITIVA A Estatística basicamente se divide em 2 partes, a saber: • Estatística Descritiva: Parte da Estatística que utiliza números para descrever fatos. Compreende a coleta, a organização, o resumo e, em geral, a simplificação de informações que podem ser muito complexas. • Inferência: Diz respeito a redução, análise e interpretação de dados amostrais, a partir do que, tira- se conclusões sobre a população na qual os dados (amostra) foram obtidos. ESTATÍSTICA DESCRITIVA ESTATÍSTICA DESCRITIVA OBSERVAÇÃO Como as informações provêm de um conjunto menor que a população, cometem-se erros ao se fazer uma inferência. Esses erros são quantificados por um valor numérico. O erro mencionado neste contexto não deve ser confundido com engano, erro de mensuração. É consequência inevitável da tentativa de generalizações ou da flutuação de amostra para amostra. ESTATÍSTICA DESCRITIVA Após a coleta dos dados, estes devem ser dispostos de forma ordenada, quando possível, e resumida, a fim de auxiliar o pesquisador na sua análise e facilitar a compreensão das conclusões apresentadas ao leitor. Os dados podem ser apresentados na forma de tabelas estatísticas, que devem ser auto-suficientes. Tabelas ESTATÍSTICA DESCRITIVA Elementos essenciais: Título – explica o que a tabela contém, ou seja, aponta o fenômeno, a época e o local da ocorrência; Corpo – mostra os dados, é formado pelo cabeçalho, pela coluna indicadora e pelas linhas e colunas de dados: Cabeçalho – especifica o conteúdo das colunas; Coluna indicadora – especifica o conteúdo das linhas; Os componentes de uma tabela estatística são: ESTATÍSTICA DESCRITIVA Fonte – cita o informante (caracterizando a confiabilidade dos dados); Elementos complementares: Nota – esclarece o conteúdo e indica a metodologia adotada na obtenção ou elaboração das informações; Chamada – classificam pontos específicos da tabela. ESTATÍSTICA DESCRITIVA cabeçalho corpo coluna de dados Coluna Indicadora Conteúdo da linha Célula Tabela (nº) - Título respondendo às perguntas: o quê, onde e quando? Fonte /Nota /Chamada ESTATÍSTICA DESCRITIVA Destaca-se que: 1- As tabelas devem ser enumeradas em ordem crescente ou na ordem que aparecem no texto, como é o caso de trabalhos científicos; 2- As bordas superiores e inferiores devem ser fechadas com traços horizontais enquanto às da esquerda e direita não, a separação das colunas no corpo da tabela podem ou não existir; ESTATÍSTICA DESCRITIVA 3- É conveniente também que o número de casas decimais seja padronizado, assim como a substituição de dados numéricos por sinais quando: - o dado numérico for omitido (X); - o dado não existir( – ) ; - existir a informação, mas ela não está disponível (...); - o valor numérico é resultante de um arredondamento (0 - zero); - o valor numérico igual a zero ( ) – (espaço vazio ). ESTATÍSTICA DESCRITIVA Uma tabela estatística que apresenta distribuição de um conjunto de dados estatísticos em função da época, do local e da espécie é chamada de Série Estatística. Conforme o critério de agrupamento, as séries apresentadas nas tabelas classificam-se em 2 tipos: Séries Estatísticas ESTATÍSTICA DESCRITIVA Séries Homógradas: aquelas em que a variável descrita apresenta variação discreta ou descontínua, como as séries: Temporal (ou Cronológica), Geográfica (ou Espacial), Específica (ou Categórica), Mista (ou Composta). Séries Heterógradas: aquelas nas quais o fenômeno ou o fato apresenta gradações ou subdivisões. Embora fixo, o fenômeno varia em intensidade. A Distribuição de freqüências é uma série heterógrada. ESTATÍSTICA DESCRITIVA Série Temporal: Também chamada de série cronológica, série histórica, série evolutiva ou marcha, identifica-se pelo caráter variável do fator cronológico. Assim, deve-se ter: Elemento variável: Época Elementos fixos: Local e Fenômeno Tabela 1 - Operadora WKX – Venda de bilhetes aéreos – Mercado Interno - 1995 Fonte: Departamento de Análise de Mercado Séries Homógradas: Meses Vendas ( em milhares de reais) Janeiro 2300 Fevereiro 1800 Março 2200 Abril 2210 Maio 2360 Junho 2600 Julhp 2690 Agosto 3050 Setembro 3500 Outubro 3440 Novembro 3100 Dezembro 2760 TOTAL ANUAL 31510 ESTATÍSTICA DESCRITIVA Série Geográfica: Também chamada de série territorial, série espacial ou série de localização, identifica-se pelo caráter variável do fator geográfico. Assim, deve-se ter: Elemento variável: Local Elementos fixos: Época e Fenômeno Tabela 2 – Operadora WKX - Vendas por Unidade da Federação – 1995 Fonte : Departamento de Análise de Mercado Unidades da Federação Vendas (em milhares de reais) Minas Gerais 4000 Paraná 2230 Rio Grande do Sul 6470 Rio de Janeiro 8300 São Paulo 10090 Outros 420 TOTAL BRASIL 31510 Série Específica: Também chamada de série categórica, série por categoria, identifica-se pelo caráter variável de fator especificativo. Assim, deve-se ter: Elemento variável: Fenômeno Elemento fixos: Local e Época Tabela 3– Operadora WKX - Venda de bilhetes aéreos por Linha– 1995 Fonte : Departamento de Análise de Mercado Linha do Produto Vendas (em milhares de reais) Linha A 6450 Linha B 9310 Linha C 15750 TODAS AS LINHAS 31510 Série Mista: As tabelas apresentadas anteriormente são tabelas estatísticas simples, onde apenas uma série está representada. É comum, todavia, haver necessidade de apresentar, em uma única tabela, mais do que uma série. Quando as séries aparecem conjugadas, tem-se uma tabela de dupla ou tripla entrada. Série específico-temporal Série geográfico-temporal Série geográfico-específico Série geográfico-específico-temporal Setor População ( 1 000 Hab.) 1940 1950 1960 Primário 8 968 10 255 12 163 Secundário 1 414 2 347 2 962 Terciário 3 620 4 516 7 525 Tabela 4 – População economicamente ativa por setor de atividades – Brasil Fonte : IPEA Distribuição de Frequência: Método de agrupamento em categorias, classes, ou intervalos, de tal forma que se possa determinar o número ou a percentagem de cada uma delas. Distribuição de Frequência Pontual – sem perda de informação; Distribuição de Frequência em Classe – com perda de informação. Séries Heterógradas: Para que se entenda melhor a distribuição de frequência, é necessário conhecer alguns conceitos básicos: Dados Brutos: são os valores numéricos obtidos após a coleta dos dados. Rol: é o arranjo dos dados brutos em ordem de freqüência crescente ou decrescente. Amplitude total (A): é a diferença entre o maior e o menor valor observados. A = Xmaior – Xmenor Frequência Absoluta (Fi): é o número de vezes que o elemento aparece na amostra, ou o número de elementos pertencentes a uma mesma classe, sendo i = índice correspondente ao número de linha da tabela. Distribuição de Frequência Pontual: A construção desse tipo de distribuição equivale à construção de uma tabela simples, onde se listam os valores observados da variável, com suas frequências absolutas (Fi ). Exemplo: Uma empresa fabricante de instrumentos de precisão está interessada em saber o número de aparelhos defeituosos rejeitados pela seção encarregada de controle de qualidade. Tabela 5: Número mensal de aparelhos defeituosos Ano Mês Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez 01 6 2 5 6 0 8 7 6 3 4 5 8 02 10 9 7 6 3 4 6 4 5 4 5 1 03 3 6 7 9 3 1 4 6 5 3 5 4 04 7 2 5 8 6 4 2 5 1 6 5 2 Tabela 6: Distribuição de frequência pontual do número mensal de aparelhos defeituosos Nº de aparelhos com defeito (xi) Nº de meses (Fi) 0 2 1 3 2 4 3 5 4 7 5 8 6 9 7 4 8 3 9 2 10 1 Total 48 Observa-se que esta variável foi resumida em 11 linhas, assim i = 1,2, ..., 11, e, portanto tem 11 valores para as frequências absolutas. A soma de todas as frequências absolutas deve ser igual ao número total de observações da variável, neste caso 48. Como colunas complementares em uma distribuição de frequência e considerado i, a ordem da linha na tabela, tem- se: Frequência Absoluta Acumulada (Fai): são obtidas somando-se a frequência absoluta do valor considerado , às frequências absolutas anteriores a este mesmo valor. Frequência Relativa (fi): definida com a razão entre a frequência absoluta e o número total de observações. Lembrando que a soma das fi de todas as categorias é igual a 1. Frequência Relativa Percentual (fpi): definida com a porcentagem de um valor na amostra e é dada por fpi. A soma das fpi deve ser igual a 100%. Tabela 7: Distribuição de frequência pontual do número mensal de aparelhos defeituosos Nº de aparelhos com defeito (xi) Nº de meses (Fi) Fai fi Fpi 0 2 2 0,042 4,2 1 3 5 0,062 6,2 2 4 9 0,083 8,3 3 5 14 0,104 10,4 4 7 21 0,146 14,6 5 8 29 0,167 16,7 6 9 38 0,188 18,8 7 4 42 0,083 8,3 8 3 45 0,062 6,2 9 2 47 0,042 4,2 10 1 48 0,021 2,1 Total 48 1,000 100,0 Distribuição de Frequência em Classe: Apropriado para apresentar dados quantitativos contínuos ou discretos com um número elevado de informações, sendo necessário dividi-los em intervalos de valores denominados Classe (em cada linha da distribuição. Exemplo: Considere o peso ao nascer (kg) de 50 bezerros da raça guzerá. Tabela 8: Pesos ao nascer (kg) de 50 bezerros guzerá 21,0 21,6 22,1 22,2 22,8 23,0 23,7 24,1 24,2 24,3 24,5 24,5 24,9 25,0 25,2 25,3 25,6 25,8 25,9 26,0 26,0 26,1 26,2 26,2 26,5 26,5 26,8 26,8 26,9 26,9 27,2 27,2 27,2 27,2 27,8 28,1 28,1 28,5 28,6 28,7 29,2 29,3 29,5 29,6 29,8 30,5 31,0 31,3 31,8 33,0 ROTEIRO 1º - Organize os dados brutos em um ROL. 2º - Calcule a amplitude amostral (A). 3º - Calcule o número de classes (k). A determinação do número de classe (k) é em função do tamanho da amostra, seguindo os seguintes critérios: Para amostras com n ≤ 100, usa-se k = √n; Para amostras acima de 100, usa-se k = 1 + 3,3 log n. 4º - Calcule a amplitude do intervalo de classe (c). 5º - A 1ª classe será o menor número do Rol – c/2. Tabela 9: Pesos ao nascer (kg) de 50 bezerros guzerá Classes Fi fi Fpi [20 ;22 ) 2 0,04 4 [22 ;24 ) 5 0,10 10 [24 ;26 ) 12 0,24 24 [26 ;28 ) 16 0,32 32 [28 ;30 ) 10 0,20 20 [30 ;32 ) 4 0,08 8 [32 ;34 ) 1 0,02 2 Total 50 1,000 100,0 Estatística Descritiva Vanêssa Brito Fernandes Neves