Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
4.1 INTRODUÇÃO A amostragem é naturalmente usada em nossa vida diária. Por exemplo, para verificar o tempero de um alimento, podemos provar uma pequena porção deste alimento. Neste momento, estamos extraindo uma amostra, ou seja, subtraímos do todo, (população) uma parte (amostra), com o propósito de avaliarmos (inferirmos) a qualidade de tempero de todo o alimento. Portanto, podemos afirmar que: • População é o conjunto de objetos, seres, pessoas etc. relacionados a uma pesquisa, ou seja, o universo. • Amostra é uma parte da população – um subconjunto do universo – extraída com o propósito de inferirmos características da população. • Amostragem são técnicas estatísticas utilizadas na determinação da amostra, com a finalidade de torná-las as mais fidedignas possíveis, ou seja, que represente “o melhor possível” toda à população. A amostragem e, em particular, os processos de amostragem se aplicam em variadíssimas áreas de conhecimento e se constituem, muitas vezes, na única forma de conseguir informações de uma determinada realidade que importa conhecer. A teoria da amostragem é assim um instrumento que possibilita esse conhecimento científico da realidade (sempre complexa), onde outros processos ou métodos alternativos, por razões diversas, não se mostram adequados ou até mesmo possíveis. É compreensível que o estudo de todos os elementos da população, possibilita preciso conhecimento das variáveis que estão sendo pesquisadas, todavia nem sempre é possível obter as informações de todos os elementos da população. Limitações de tempo, custo e as vantagens do uso das técnicas estatísticas de inferências, justificam o uso de planos amostrais. Torna-se claro que a representação da amostra dependerá do seu tamanho (quanto maior, melhor) e de outras considerações de ordem metodológica. Isto é, o investigador procurará acerca-se de cuidados, visando à obtenção de uma amostra significativa, ou seja, que de fato represente “o melhor possível” toda à população. 4.2 QUESTÕES PRÉVIAS AO PROCESSO DE AMOSTRAGEM É fundamental que antes de desenvolver o processo de amostragem que se definam com clareza alguns pontos: • Os objetivos de estudos; • As características da população que se pretende estudar; • O que será pesquisado (parâmetros); • Sua abrangência, o grau de precisão, o tempo disponível, os custos previstos etc.; • A sistematização ideal na escolha da amostra, que deve ser feita de acordo com as características dos elementos da população; • Como deve ser feita a tabulação dos dados e outras informações necessárias ao bom desempenho da pesquisa. 4.3 ALGUNS EXEMPLOS QUE SE RECOMENDA O USO DE AMOSTRAGEM Numa pesquisa eleitoral em determinado município, a população deve ser definida como todos os eleitores com domicílio eleitoral no município: • Parâmetro observado: percentual de votos de cada candidato à prefeitura. • Abrangência: todos os eleitores com domicílio eleitoral no município. • Para planejar as políticas de recursos humanos em uma grande empresa com milhares de funcionários: • Parâmetros observados: tempo médio de serviço dos funcionários, níveis de formação, desempenho dos funcionários em realizar certa tarefa etc. • Abrangência: todos os funcionários desta empresa. • Numa pesquisa epidemiológica: • Parâmetro observado: percentagens de pessoas contaminadas. • Abrangência: todas as pessoas da região em estudo, no momento da pesquisa. 4.4 POR QUE AMOSTRAGEM? Algumas razões que justificam o uso de amostragem, quando se trabalha com uma grande população: • Economia: em geral quando se trabalha com amostra torna-se muito mais econômico o levantamento das informações. • Tempo: o fator tempo na realização de uma pesquisa é um fator preponderante, pois os resultados nem sempre podem esperar. Exemplo: numa pesquisa eleitoral, a três dias de uma eleição municipal de uma grande cidade, não haveria tempo suficiente para pesquisar toda população. • Confiabilidade dos dados: quando o plano amostral é bem elaborado, se consegue retratar bem o universo; mesmo com o levantamento de dados reduzido, pode-se dar mais atenção aos casos individuais, evitando com isso erros nas respostas. • Operacionalidade: é mais fácil realizar operações de pequena escala. Um dos problemas dos grandes censos é o controle dos entrevistadores. 4.5 QUANDO O USO DE AMOSTRAGEM NÃO É INTERESSANTE? Algumas razões que justificam quando o uso de amostragem não é interessante: • População pequena: quando a população for pequena (digamos, de 50 elementos) para termos uma boa representatividade, necessitamos normalmente de uma amostra relativamente grande (em torno de 80% da população), a não ser que a população seja muito homogênea. • Características de fácil mensuração: quando a variável que se quer observar é de fácil mensuração não compensa investir num plano de amostragem; compensa fazer o levantamento no próprio local de ocorrência. Por exemplo, para verificar o percentual de alunos de uma turma favoráveis a paralisação da universidade no período de greve dos motoristas de ônibus. • Necessidade de alta precisão: no final do expediente bancário é necessário que se faça a contagem do dinheiro arrecadado; neste caso, o parâmetro valor monetário precisa ser avaliado com grande precisão, por isso, se contabiliza todo valor arrecadado. 4.6 PLANO DE AMOSTRAGEM Para fazermos um plano da amostragem devemos ter bem definidos os objetivos da pesquisa, a abrangência, bem como os parâmetros que deveremos estimar para alcançar os objetivos propostos. Num plano de amostragem deve constar a definição da unidade da amostragem, a forma de seleção dos elementos da população e o tamanho da amostra. A seleção dos elementos que farão parte da amostra pode ser feita sob alguma forma de sorteio, chamadas de amostragens aleatórias, ou por amostragem não aleatória que inclui técnicas conhecidas como amostragem intencional por cotas ou por julgamento. A seguir serão definidos alguns modelos utilizados na seleção dos elementos que irão compor a amostra e definem posteriormente o tamanho da mesma. 4.7 MODELOS PROBABILÍSTICOS Os elementos que farão parte da amostra poderão ser selecionados sob alguma forma de sorteio, chamadas amostragens aleatórias, estas são particularmente interessantes por permitirem a utilização das técnicas de inferência estatística, facilitando a análise dos dados e dando maior segurança na generalização dos mesmos. Alguns modelos utilizados na escolha de uma amostra aleatória. 4.7.1 Amostragem aleatória simples Para a seleção de uma amostra aleatória simples precisamos ter uma lista completa dos elementos da população (ou de unidades de amostragem apropriada). Este tipo de amostragem consiste em selecionar a amostra mediante um sorteio, sem restrição. Seja uma população com N elementos, uma forma de extrair uma amostra aleatória simples de tamanho n, sendo n < N, é identificar os elementos da população em pequenos pedaços de papel e retirar, ao acaso, n pedaços. Consideraremos, neste livro, que o sorteio seja feito sem reposição, ou seja, cada elemento da população só é sorteado uma vez. A amostragem aleatória simples apresenta a seguinte propriedade: qualquer subconjunto da população, com o mesmo número de elementos, tem a mesma probabilidade de fazer parte da amostra. Em particular, cada elemento da população tem a mesma probabilidade de pertencer à amostra. O uso de tabelas de números aleatórios. As tabelas de números aleatórios facilitam o processo de seleção de uma amostra aleatória. Estas tabelas são formadas por sucessivos sorteios de algarismos do conjunto {0, 1, 2, 3,..., 9}, com reposição. Para o nosso trabalho, extraímos parte de uma destas tabelas normalmente encontrada em apêndice de livros que descreve processos de amostragem. 98 08 62 48 26 45 24 02 84 04 44 99 90 88 96 39 09 47 34 07 35 44 13 18 80 33 18 51 62 32 41 94 15 09 49 89 43 54 85 81 88 69 54 18 94 37 54 87 30 43 80 95 10 04 06 96 38 27 07 74 20 15 12 33 87 25 01 62 52 98 94 62 46 11 71 79 75 24 91 40 71 96 12 82 96 69 86 10 25 91 74 85 22 05 39 00 38 75 95 79 18 63 33 25 37 98 14 50 65 71 31 01 02 46 74 05 45 56 14 27 77 93 89 19 36 74 02 94 39 02 77 55 73 22 70 97 79 01 71 19 52 52 75 80 21 80 81 45 17 48 54 17 84 56 11 80 99 33 71 43 05 33 51 29 69 56 12 71 93 55 36 04 09 03 24 11 66 44 98 83 52 07 98 48 27 59 38 17 15 39 09 97 33 34 40 88 46 12 33 56 48 32 47 79 28 31 24 96 47 10 02 29 53 68 70 32 30 75 75 46 15 02 00 99 94 69 07 49 41 38 87 63 79 19 76 35 58 40 44 01 10 51 82 16 15 01 84 87 69 38 Exemplo: Com o objetivo de estudar algumas características dos funcionários de certa empresa, vamos extrair uma amostra aleatória simples de tamanho 8. A listagem dos funcionários da empresa é apresentada a seguir. Alberto Alexandre Arnaldo Bernardo Beto Cardoso Carlito Carlos Castro Celso Cláudio Edson Emílio Ester Eurico Fabrício Felipe Francisco Germano Getúlio Gabriel Hilário Íbson João Joana Josefa Josafá Maria Joana Mauro Paulo Sávio Ziraldo. Para utilizarmos à tabela de números aleatórios, é importante que se associe cada elemento da população a um número inteiro dentro de certa ordem, então a população anteriormente citada ficou relacionada assim: 01. Alberto 02. Alexandre 03. Arnaldo. 04. Bernardo. 05. Beto 06. Cardoso 07. Carlito 08. Carlos 09. Castro 10. Celso 11. Cláudio 12. Edson 13. Emílio 14. Ester 15. Eurico 16. Fabrício 17. Felipe 18. Francisco 19. Germano 20. Getúlio 21. Gabriel 22. Hilário 23. Íbson 24. João 25. Joana 26. Josefa 26. Josafá 27. Maria Joana 29. Mauro 30. Paulo 31. Sávio 32. Ziraldo. Então, para extraímos a amostra solicitada de tamanho n = 8, basta tomar oito números aleatórios do conjunto {01, 02, 03,..., 32}. Os funcionários relacionados a estes números formarão a amostra. Não existe forma específica para extrair estes números, a escolha deverá ser a mais aleatória possível. Para o exemplo, usaremos a 2ª linha, como poderia ser outra qualquer, desprezando os valores repetidos ou que estiverem fora do intervalo solicitado. • Então os números extraídos da tabela foram: 18, 32, 15, 09, 30, 10, 04, 06. • A amostra é composta por: Francisco; Ziraldo; Eurico; Castro; Paulo; Celso; Bernardo; Cardoso. Obs.: usamos no exemplo anterior a tabela de números aleatórios; poderíamos ter usado outras formas como: identificar os elementos da população em pequenos pedaços de papel e retirar, ao acaso, n pedaços (sorteio). Não é costume retirar uma amostra aleatória simples quando a população é muito pequena, o exemplo anterior foi usado com o intuito de facilitar o entendimento das técnicas de amostragem. Na prática, estamos interessados em observar certas variáveis associadas aos elementos da amostra. 4.7.2 Amostragem sistemática Não deixa de ser uma variação da amostragem aleatória simples, utilizada de forma conveniente quando a população se encontra ordenada, como fichas de um fichário, lista telefônica etc. Procedimentos para a escolha: • Calcula-se o intervalo amostral ou de seleção “a = N/n”, aproximando para o inteiro mais próximo. • Escolhe-se aleatoriamente ou sorteia-se um número x entre 1 e “a”. • A amostra corresponderá aos números: x; x + a; x + 2a;... ; x + (n – 1)a. Exemplo: Numa certa população ordenada, constituída por 220 funcionários, deseja-se extrair uma amostra de forma sistemática com 18 funcionários, com a finalidade de observar o tempo de serviço dos mesmos. Qual o procedimento a ser adotado e quais as posições destes funcionários na relação? Procedimentos: • Calcula-se o intervalo amostral ou de seleção “ a = N/n”, onde N = 220 e n = 18, então: a = 220 / 18 = 12,222... = 12. • Sorteia-se um número x entre 1 e “a” ou seja, um nº. x entre 1 e 12, por exemplo, o nº. sorteado foi o 8. (x = 8). • A amostra corresponderá aos números: x; x + a; x + 2a;... ; x + (n – 1)a, então as posições dos funcionários escolhidos para fazer parte da amostra na relação da empresa são: 8; 20; 32; 40;... ; 212. Obs.: esta relação é considerada aleatória, pois depende do sorteio do 1º elemento e, conseqüentemente, da seleção dos demais. De posse da lista de funcionários, identificaremos os elementos da amostra que responderá as informações solicitadas. 4.7.3 Amostragem estratificada A técnica é normalmente utilizada quando nos deparamos com uma população que apresenta características heterogêneas e se quer distinguir subpopulações com características mais homogêneas. Consiste em dividir esta população em subgrupos, denominados de estratos. Estes estratos apresentam internamente características mais homogêneas do que a população toda, com respeito às variáveis em estudo, devemos escolher critérios de estratificação que forneça estratos bem homogêneos. Amostragem estratificada proporcional: neste caso de amostragem estratificada, a proporcionalidade do tamanho de cada estrato da população é mantida na amostra. Por exemplo, se um estrato corresponde a 70% da população, ele também corresponderá na mesma proporcionalidade da amostra: (70%). População: universo 10% 70% 20% Categoria A Categoria B Categoria C Amostra: parte da população 10% 20%70% Fig.01- Amostra estratificada proporcional. Exemplo: Pela necessidade de realizar uma enquete, com categorias influentes, sobre o projeto em trâmite no Congresso Nacional a respeito da liberdade vigiada com o uso de rastreadores para detentos, extraiu-se uma amostra com 40 opiniões de forma estratificada, numa população composta por 50 juristas, 150 parlamentares e 300 jornalistas. O número de opiniões extraídas proporcionalmente de cada categoria, respectivamente, é de: Procedimento: Determina-se a razão amostral : 40 500 n q = = = 0,08 N Determina-se o tamanho da amostra nos subgrupos: ni = Ni. q ,onde: i i N Número de elementos dos estratos n Número de elementos da amostra nos estratos → → Portanto: n1 = N1. q = 50 . 0,08 = 4 n2 = N2. q = 150 . 0,08 = 12 n3 = N1. q = 300 . 0,08 = 24 Estratos N° da população nos estratos (Ni) Tamanho de subgrupo na amostra (ni) Juristas → A N1 = 50 n1 = 4 Parlamentares → B N2 = 150 n2 = 12 Jornalistas → C N3 = 300 n3 = 24 • Para a escolha dos representantes nos estratos usaremos a técnica da amostragem simples aplicada em cada subgrupo ou em cada estrato. a) Se fizer uso da tabela de números aleatórios, no 1° estrato usará apenas duas casas decimais, ou seja, {01, 02, 03, ... , 50}; no 2º estrato: três casas {001, 002,..., 150}; e no 3º também três casas, sendo de {001, 002, 003, ... , 300} e a escolha destes números na tabela pode ser em posições diferentes e aleatoriamente. b) Se for feito um sorteio, este deverá ser feito para cada subgrupo isoladamente e neste sorteio deverá ter apenas os números necessários. Então, para extraímos a amostra solicitada, definiremos os seguintes procedimentos: • Para a seleção dos Juristas (estrato A) usaremos a 1ª coluna com dois dígitos da tabela de números aleatórios e tomaremos quatro dezenas do conjunto {01, 02, 03, ... , 50}. Os Juristas escolhidos estarão nas posições: {33, 18, 11, 48}. • Para a seleção dos Parlamentares (estrato B) usaremos a 1ª linha da tabela e tomaremos doze centenas do conjunto {001, 002, 003, ..., 150}. Os Parlamentares escolhidos estarão nas posições: {044, 094, 004, 069, 016, 071, 102, 053, 131, 010, 029, 027}. • Para a seleção dos Jornalistas (estrato C) usaremos a 5ª linha da tabela e tomaremos vinte e quatro centenas do conjunto {001, 002, 003, ..., 300}. Os Jornalistas escolhidos estarão nas posições: {186, 253, 145, 065, 101, 024, 054, 142, 227, 097, 171, 195, 252, 021, 174, 178, 118, 099, 143, 053, 296, 127, 193, 090, 116}. Obs.: a escolha das informações na tabela dos números aleatórios é feita ao acaso e a população nos estratos deverá estar ordenada. 4.7.4 Amostragem por conglomerados Algumas populações tornam extremamente difíceis a identificação de seus elementos. Não obstante pode ser relativamente fácil identificar grupos de elementos que tenha aproximadamente as mesmas composições da população. Neste caso, uma amostra aleatória simples desses grupos (conglomerados) pode ser escolhida e uma contagem completa pode ser feita para o conglomerado sorteado. Conglomerados típicos ou agregados são quarteirões, organizações, blocos de edifícios etc. Aqui, destacamos a diferença entre um conglomerado e um estrato. Conglomerado: parte da população com características idênticas ao todo, se for uma população heterogênea este conglomerado também será constituído por uma população heterogênea. Estratos: parte da população com características internas mais ou menos homogêneas, diferentes da população que possui características heterogêneas. Exemplo: No levantamento da população de uma cidade, podemos dispor de um mapa identificando cada quarteirão, em detrimento de uma relação atualizada de seus moradores. Podemos, então, coletar uma amostra dos quarteirões e fazer uma contagem completa de todos os residentes naqueles quarteirões sorteados. 4.8 MODELOS NÃO PROBABILÍSTICOS São amostragens em que há uma escolha deliberada dos elementos da amostra. Não é possível generalizar os resultados das pesquisas para a população, pois as amostras não-probabilísticas não garantem a representatividade da população, por serem não aleatórias. Em geral, as técnicas de amostragens não aleatórias procuram gerar amostras que, de certa forma, representam razoavelmente bem a população de onde foram extraídas. 4.8.1 Amostragem por cotas A amostragem por cota tem uma grande semelhança com a amostragem estratificada proporcional. A população é subdividida em diversos subgrupos e seleciona-se uma cota de cada subgrupo para fazer parte da amostra, sendo esta escolha de forma proporcional ao tamanho do subgrupo. O que difere da amostragem estratificada é a seleção que não precisa ser aleatória. Para compensar a falta de aleatoriedade na seleção, costuma-se dividir a população num grande número de subgrupos. Por exemplo, numa pesquisa socioeconômica, a população pode ser dividida por localidade; por níveis de instrução; por faixa de renda; por sexo etc. 4.8.2 Amostragem por julgamento Os elementos escolhidos são aqueles julgados como típicos da população que se deseja estudar. Por exemplo, num estudo sobre a produção científica dos departamentos de ensino de uma grande universidade, um estudioso sobre o assunto pode escolher os departamentos que ele considera serem aqueles que melhor representam à universidade em ensino. Numa população deste tipo, a utilização de uma amostra aleatória pode ser não recomendável, visto que temos uma população relativamente pequena. Por outro lado, dependendo do que se pretende estudar sobre a produção científica, um levantamento de todos os departamentos pode gastar muito tempo. Então, o uso de uma amostragem por julgamento pode ser uma boa alternativa, mesmo com a limitação de que os resultados desta pesquisa não necessariamente sirvam para todos os departamentos da universidade. 4.8.3 Tamanho de uma amostra aleatória simples O cálculo do tamanho de uma amostra é complexo, o nosso estudo fica restrito ao tamanho de uma amostra aleatória simples. Alguns conceitos: • Parâmetro: aracterística descritiva dos elementos da população. • Estatística: aracterística descritiva dos elementos da amostra. Exemplo: na população de alunos da universidade, o percentual de alunos favorável ao projeto da Educação a Distância é um parâmetro. Numa amostra retirada de 400 alunos desta universidade, a percentagem – de alunos favoráveis ao projeto da Educação a Distância – nesta amostra é uma estatística. • Estimativa do parâmetro: o valor acusado por certa estatística, considerando a particular amostra, observada. Exemplo: ao observarmos uma amostra de 400 alunos desta universidade, detectamos que 62% dos alunos são favoráveis a este projeto, podemos afirmar que a estimativa deste parâmetro para a universidade é de 60%. • Erro amostral é a diferença entre o valor que a estatística pode acusar e o verdadeiro valor do parâmetro que se deseja estimar. • Para a determinação do tamanho da amostra, o pesquisador precisa especificar o erro amostral tolerável, ou seja, o quanto ele admite errar na avaliação dos parâmetros de interesse de estudo. Por exemplo, na divulgação das pesquisas eleitorais é comum encontramos algo como: o candidato “W” no presente instante apresenta uma preferência de 42% de seu eleitorado com uma margem de erro • calculado em torno de 3%, isto quer dizer que o valor estimado de votos deste candidato admite um valor entre 39% e 45%. Ou seja, 42% ± 3%. A especificação do erro amostral deve ser feita sobre um enfoque probabilístico, pois, por maior que seja a amostra, existe sempre o risco de o sorteio gerar uma amostra com características totalmente diferentes das da população de onde está sendo extraída. 4.8.4 Fórmula para o cálculo do tamanho mínimo da amostra Sejam: → → → → tolerável amostral ErroE amostra da tamanho o para oaproximaçã primeira n amostra da tamanho n população da tamanho N o o O tamanho da amostra pode ser calculado sem, contudo, conhecer o tamanho da população, por intermédio da seguinte expressão: 2 o o E 1 n = Se conhecermos o tamanho da população N, podemos corrigir o cálculo anterior, por: o o n N n . N n += Exemplo: Planeja-se um levantamento por amostragem para avaliar a opinião de 600 moradores do bairro A, a respeito do projeto de urbanização daquele bairro, esta característica é do tipo percentagem. Qual deve ser o tamanho mínimo de uma amostra aleatória simples, tal que possamos admitir, com alta confiança, que o erro amostral não ultrapasse a 5 % ( )0,05 Eo = ? Solução: • Uma primeira aproximação: ( ) moradores 400 0,05 1 E 1 n 22 o o === • Corrigindo em função da população N , temos: ( N = 600 ) moradores 240 400 600 400 . 600 n N n . N n o o =+=+= 4.8.5 Tamanho de uma amostra em subgrupos da população Quando temos interesse no estudo de subgrupos da população separadamente, ou quando queremos estimar parte da população, precisamos calcular o tamanho da amostra para cada uma destas partes. O tamanho total da amostra corresponde à soma dos tamanhos das amostras de cada parte. Pelo exposto anteriormente, o tamanho total da amostra deve crescer bastante quando se deseja fazer estimativa isolada para diversos grupos da população. Neste sentido, é comum o pesquisador ser mais tolerante na precisão das estimativas nos subgrupos tolerando erros amostrais maiores. Exemplo: A Secretaria de Segurança Pública deseja estimar a percentagem de funcionários favoráveis a um programa de treinamento sobre o combate de entorpecente. Conta com um quadro de 300 funcionários, dos quais 180 são do sexo masculino. Determine o tamanho da amostra aleatória simples, levando em consideração a opinião de ambos os sexos isoladamente, que garanta um alto nível de significância e um erro amostral não superior a 5% (E0= 0,05). • Uma primeira aproximação: ( ) 1 1n 400 fun cionários o 2 2E 0 ,05o = = = • Corrigindo em função da população Ni , temos: Para o sexo masculino: Para o sexo feminino: Acesse a Ferramenta Atividades e realize a Atividade 1. osfuncionári 124 400 180 400 . 180 n N n . N n o o =+=+= osfuncionári 92 400 120 400 . 120 n N n . N n o o =+=+=