Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
4.1 INTRODUÇÃO
A amostragem é naturalmente usada em nossa vida diária. Por exemplo, para
verificar o tempero de um alimento, podemos provar uma pequena porção deste
alimento. Neste momento, estamos extraindo uma amostra, ou seja, subtraímos do
todo, (população) uma parte (amostra), com o propósito de avaliarmos (inferirmos) a
qualidade de tempero de todo o alimento. Portanto, podemos afirmar que:
• População é o conjunto de objetos, seres, pessoas etc. relacionados a uma
pesquisa, ou seja, o universo.
• Amostra é uma parte da população – um subconjunto do universo – extraída com o
propósito de inferirmos características da população.
• Amostragem são técnicas estatísticas utilizadas na determinação da amostra, com a
finalidade de torná-las as mais fidedignas possíveis, ou seja, que represente “o
melhor possível” toda à população.
A amostragem e, em particular, os processos de amostragem se aplicam em
variadíssimas áreas de conhecimento e se constituem, muitas vezes, na única forma de
conseguir informações de uma determinada realidade que importa conhecer. A teoria
da amostragem é assim um instrumento que possibilita esse conhecimento científico da
realidade (sempre complexa), onde outros processos ou métodos alternativos, por
razões diversas, não se mostram adequados ou até mesmo possíveis.
É compreensível que o estudo de todos os elementos da população, possibilita
preciso conhecimento das variáveis que estão sendo pesquisadas, todavia nem sempre
é possível obter as informações de todos os elementos da população. Limitações de
tempo, custo e as vantagens do uso das técnicas estatísticas de inferências, justificam
o uso de planos amostrais. Torna-se claro que a representação da amostra dependerá
do seu tamanho (quanto maior, melhor) e de outras considerações de ordem
metodológica. Isto é, o investigador procurará acerca-se de cuidados, visando à
obtenção de uma amostra significativa, ou seja, que de fato represente “o melhor
possível” toda à população.
4.2 QUESTÕES PRÉVIAS AO PROCESSO DE AMOSTRAGEM
É fundamental que antes de desenvolver o processo de amostragem que se
definam com clareza alguns pontos:
• Os objetivos de estudos;
• As características da população que se pretende estudar;
• O que será pesquisado (parâmetros);
• Sua abrangência, o grau de precisão, o tempo disponível, os custos previstos etc.;
• A sistematização ideal na escolha da amostra, que deve ser feita de acordo com as
características dos elementos da população;
• Como deve ser feita a tabulação dos dados e outras informações necessárias ao
bom desempenho da pesquisa.
4.3 ALGUNS EXEMPLOS QUE SE RECOMENDA O USO DE AMOSTRAGEM
Numa pesquisa eleitoral em determinado município, a população deve ser definida
como todos os eleitores com domicílio eleitoral no município:
• Parâmetro observado: percentual de votos de cada candidato à prefeitura.
• Abrangência: todos os eleitores com domicílio eleitoral no município.
• Para planejar as políticas de recursos humanos em uma grande empresa com
milhares de funcionários:
• Parâmetros observados: tempo médio de serviço dos funcionários, níveis de
formação, desempenho dos funcionários em realizar certa tarefa etc.
• Abrangência: todos os funcionários desta empresa.
• Numa pesquisa epidemiológica:
• Parâmetro observado: percentagens de pessoas contaminadas.
• Abrangência: todas as pessoas da região em estudo, no momento da pesquisa.
4.4 POR QUE AMOSTRAGEM?
Algumas razões que justificam o uso de amostragem, quando se trabalha com
uma grande população:
• Economia: em geral quando se trabalha com amostra torna-se muito mais
econômico o levantamento das informações.
• Tempo: o fator tempo na realização de uma pesquisa é um fator preponderante, pois
os resultados nem sempre podem esperar.
Exemplo: numa pesquisa eleitoral, a três dias de uma eleição municipal de uma grande
cidade, não haveria tempo suficiente para pesquisar toda população.
• Confiabilidade dos dados: quando o plano amostral é bem elaborado, se consegue
retratar bem o universo; mesmo com o levantamento de dados reduzido, pode-se
dar mais atenção aos casos individuais, evitando com isso erros nas respostas.
• Operacionalidade: é mais fácil realizar operações de pequena escala. Um dos
problemas dos grandes censos é o controle dos entrevistadores.
4.5 QUANDO O USO DE AMOSTRAGEM NÃO É INTERESSANTE?
Algumas razões que justificam quando o uso de amostragem não é interessante:
• População pequena: quando a população for pequena (digamos, de 50 elementos)
para termos uma boa representatividade, necessitamos normalmente de uma
amostra relativamente grande (em torno de 80% da população), a não ser que a
população seja muito homogênea.
• Características de fácil mensuração: quando a variável que se quer observar é de
fácil mensuração não compensa investir num plano de amostragem; compensa fazer
o levantamento no próprio local de ocorrência.
Por exemplo, para verificar o percentual de alunos de uma turma favoráveis a
paralisação da universidade no período de greve dos motoristas de ônibus.
• Necessidade de alta precisão: no final do expediente bancário é necessário que se
faça a contagem do dinheiro arrecadado; neste caso, o parâmetro valor monetário
precisa ser avaliado com grande precisão, por isso, se contabiliza todo valor
arrecadado.
4.6 PLANO DE AMOSTRAGEM
Para fazermos um plano da amostragem devemos ter bem definidos os objetivos
da pesquisa, a abrangência, bem como os parâmetros que deveremos estimar para
alcançar os objetivos propostos.
Num plano de amostragem deve constar a definição da unidade da amostragem,
a forma de seleção dos elementos da população e o tamanho da amostra.
A seleção dos elementos que farão parte da amostra pode ser feita sob alguma
forma de sorteio, chamadas de amostragens aleatórias, ou por amostragem não
aleatória que inclui técnicas conhecidas como amostragem intencional por cotas ou por
julgamento. A seguir serão definidos alguns modelos utilizados na seleção dos
elementos que irão compor a amostra e definem posteriormente o tamanho da mesma.
4.7 MODELOS PROBABILÍSTICOS
Os elementos que farão parte da amostra poderão ser selecionados sob alguma
forma de sorteio, chamadas amostragens aleatórias, estas são particularmente
interessantes por permitirem a utilização das técnicas de inferência estatística,
facilitando a análise dos dados e dando maior segurança na generalização dos
mesmos.
Alguns modelos utilizados na escolha de uma amostra aleatória.
4.7.1 Amostragem aleatória simples
Para a seleção de uma amostra aleatória simples precisamos ter uma lista
completa dos elementos da população (ou de unidades de amostragem apropriada).
Este tipo de amostragem consiste em selecionar a amostra mediante um sorteio, sem
restrição.
Seja uma população com N elementos, uma forma de extrair uma amostra
aleatória simples de tamanho n, sendo n < N, é identificar os elementos da população
em pequenos pedaços de papel e retirar, ao acaso, n pedaços. Consideraremos, neste
livro, que o sorteio seja feito sem reposição, ou seja, cada elemento da população só é
sorteado uma vez.
A amostragem aleatória simples apresenta a seguinte propriedade: qualquer
subconjunto da população, com o mesmo número de elementos, tem a mesma
probabilidade de fazer parte da amostra. Em particular, cada elemento da população
tem a mesma probabilidade de pertencer à amostra.
O uso de tabelas de números aleatórios.
As tabelas de números aleatórios facilitam o processo de seleção de uma
amostra aleatória. Estas tabelas são formadas
por sucessivos sorteios de algarismos do
conjunto {0, 1, 2, 3,..., 9}, com reposição. Para o nosso trabalho, extraímos parte de
uma destas tabelas normalmente encontrada em apêndice de livros que descreve
processos de amostragem.
98 08 62 48 26 45 24 02 84 04 44 99 90 88 96 39 09 47 34 07 35 44 13 18 80
33 18 51 62 32 41 94 15 09 49 89 43 54 85 81 88 69 54 18 94 37 54 87 30 43
80 95 10 04 06 96 38 27 07 74 20 15 12 33 87 25 01 62 52 98 94 62 46 11 71
79 75 24 91 40 71 96 12 82 96 69 86 10 25 91 74 85 22 05 39 00 38 75 95 79
18 63 33 25 37 98 14 50 65 71 31 01 02 46 74 05 45 56 14 27 77 93 89 19 36
74 02 94 39 02 77 55 73 22 70 97 79 01 71 19 52 52 75 80 21 80 81 45 17 48
54 17 84 56 11 80 99 33 71 43 05 33 51 29 69 56 12 71 93 55 36 04 09 03 24
11 66 44 98 83 52 07 98 48 27 59 38 17 15 39 09 97 33 34 40 88 46 12 33 56
48 32 47 79 28 31 24 96 47 10 02 29 53 68 70 32 30 75 75 46 15 02 00 99 94
69 07 49 41 38 87 63 79 19 76 35 58 40 44 01 10 51 82 16 15 01 84 87 69 38
Exemplo:
Com o objetivo de estudar algumas características dos funcionários de certa
empresa, vamos extrair uma amostra aleatória simples de tamanho 8. A listagem dos
funcionários da empresa é apresentada a seguir.
Alberto Alexandre Arnaldo Bernardo Beto Cardoso Carlito
Carlos Castro Celso Cláudio Edson Emílio Ester
Eurico Fabrício Felipe Francisco Germano Getúlio Gabriel
Hilário Íbson João Joana Josefa Josafá Maria
Joana Mauro Paulo Sávio Ziraldo.
Para utilizarmos à tabela de números aleatórios, é importante que se associe
cada elemento da população a um número inteiro dentro de certa ordem, então a
população anteriormente citada ficou relacionada assim:
01. Alberto 02. Alexandre 03. Arnaldo. 04. Bernardo. 05. Beto
06. Cardoso 07. Carlito 08. Carlos 09. Castro 10. Celso
11. Cláudio 12. Edson 13. Emílio 14. Ester 15. Eurico
16. Fabrício 17. Felipe 18. Francisco 19. Germano 20. Getúlio
21. Gabriel 22. Hilário 23. Íbson 24. João 25. Joana
26. Josefa 26. Josafá 27. Maria Joana 29. Mauro 30. Paulo
31. Sávio 32. Ziraldo.
Então, para extraímos a amostra solicitada de tamanho n = 8, basta tomar oito
números aleatórios do conjunto {01, 02, 03,..., 32}. Os funcionários relacionados a estes
números formarão a amostra.
Não existe forma específica para extrair estes números, a escolha deverá ser a
mais aleatória possível. Para o exemplo, usaremos a 2ª linha, como poderia ser outra
qualquer, desprezando os valores repetidos ou que estiverem fora do intervalo
solicitado.
• Então os números extraídos da tabela foram: 18, 32, 15, 09, 30, 10, 04, 06.
• A amostra é composta por: Francisco; Ziraldo; Eurico; Castro; Paulo; Celso;
Bernardo; Cardoso.
Obs.: usamos no exemplo anterior a tabela de números aleatórios; poderíamos ter
usado outras formas como: identificar os elementos da população em pequenos
pedaços de papel e retirar, ao acaso, n pedaços (sorteio).
Não é costume retirar uma amostra aleatória simples quando a população é
muito pequena, o exemplo anterior foi usado com o intuito de facilitar o entendimento
das técnicas de amostragem.
Na prática, estamos interessados em observar certas variáveis associadas aos
elementos da amostra.
4.7.2 Amostragem sistemática
Não deixa de ser uma variação da amostragem aleatória simples, utilizada de
forma conveniente quando a população se encontra ordenada, como fichas de um
fichário, lista telefônica etc.
Procedimentos para a escolha:
• Calcula-se o intervalo amostral ou de seleção “a = N/n”, aproximando para o inteiro
mais próximo.
• Escolhe-se aleatoriamente ou sorteia-se um número x entre 1 e “a”.
• A amostra corresponderá aos números: x; x + a; x + 2a;... ; x + (n – 1)a.
Exemplo:
Numa certa população ordenada, constituída por 220 funcionários, deseja-se
extrair uma amostra de forma sistemática com 18 funcionários, com a finalidade
de observar o tempo de serviço dos mesmos. Qual o procedimento a ser adotado
e quais as posições destes funcionários na relação?
Procedimentos:
• Calcula-se o intervalo amostral ou de seleção “ a = N/n”, onde N = 220 e n = 18,
então: a = 220 / 18 = 12,222... = 12.
• Sorteia-se um número x entre 1 e “a” ou seja, um nº. x entre 1 e 12, por exemplo, o
nº. sorteado foi o 8. (x = 8).
• A amostra corresponderá aos números: x; x + a; x + 2a;... ; x + (n – 1)a, então as
posições dos funcionários escolhidos para fazer parte da amostra na relação da
empresa são: 8; 20; 32; 40;... ; 212.
Obs.: esta relação é considerada aleatória, pois depende do sorteio do 1º elemento e,
conseqüentemente, da seleção dos demais.
De posse da lista de funcionários, identificaremos os elementos da amostra que
responderá as informações solicitadas.
4.7.3 Amostragem estratificada
A técnica é normalmente utilizada quando nos deparamos com uma população
que apresenta características heterogêneas e se quer distinguir subpopulações com
características mais homogêneas.
Consiste em dividir esta população em subgrupos, denominados de estratos.
Estes estratos apresentam internamente características mais homogêneas do que a
população toda, com respeito às variáveis em estudo, devemos escolher critérios de
estratificação que forneça estratos bem homogêneos.
Amostragem estratificada proporcional: neste caso de amostragem estratificada,
a proporcionalidade do tamanho de cada estrato da população é mantida na amostra.
Por exemplo, se um estrato corresponde a 70% da população, ele também
corresponderá na mesma proporcionalidade da amostra: (70%).
População: universo
10%
70%
20%
Categoria A
Categoria B
Categoria C
Amostra: parte da população
10%
20%70%
Fig.01- Amostra estratificada proporcional.
Exemplo:
Pela necessidade de realizar uma enquete, com categorias influentes, sobre o
projeto em trâmite no Congresso Nacional a respeito da liberdade vigiada com o uso de
rastreadores para detentos, extraiu-se uma amostra com 40 opiniões de forma
estratificada, numa população composta por 50 juristas, 150 parlamentares e 300
jornalistas. O número de opiniões extraídas proporcionalmente de cada categoria,
respectivamente, é de:
Procedimento:
Determina-se a razão amostral : 40
500
n q = = = 0,08
N
Determina-se o tamanho da amostra nos subgrupos: ni = Ni. q ,onde:
i
i
N Número de elementos dos estratos
n Número de elementos da amostra nos estratos
→ →
Portanto:
n1 = N1. q = 50 . 0,08 = 4
n2 = N2. q = 150 . 0,08 = 12
n3 = N1. q = 300 . 0,08 = 24
Estratos
N° da população
nos estratos (Ni)
Tamanho de
subgrupo na
amostra (ni)
Juristas →
A
N1 = 50 n1 = 4
Parlamentares →
B
N2 = 150 n2 = 12
Jornalistas →
C
N3 = 300 n3 = 24
• Para a escolha dos representantes nos estratos usaremos a técnica da amostragem
simples aplicada em cada subgrupo ou em cada estrato.
a) Se fizer uso da tabela de números aleatórios, no 1° estrato usará apenas duas
casas decimais,
ou seja, {01, 02, 03, ... , 50}; no 2º estrato: três casas {001, 002,...,
150}; e no 3º também três casas, sendo de {001, 002, 003, ... , 300} e a escolha
destes números na tabela pode ser em posições diferentes e aleatoriamente.
b) Se for feito um sorteio, este deverá ser feito para cada subgrupo isoladamente e
neste sorteio deverá ter apenas os números necessários.
Então, para extraímos a amostra solicitada, definiremos os seguintes
procedimentos:
• Para a seleção dos Juristas (estrato A) usaremos a 1ª coluna com dois dígitos da
tabela de números aleatórios e tomaremos quatro dezenas do conjunto {01, 02, 03,
... , 50}. Os Juristas escolhidos estarão nas posições: {33, 18, 11, 48}.
• Para a seleção dos Parlamentares (estrato B) usaremos a 1ª linha da tabela e
tomaremos doze centenas do conjunto {001, 002, 003, ..., 150}. Os Parlamentares
escolhidos estarão nas posições: {044, 094, 004, 069, 016, 071, 102, 053, 131, 010,
029, 027}.
• Para a seleção dos Jornalistas (estrato C) usaremos a 5ª linha da tabela e
tomaremos vinte e quatro centenas do conjunto {001, 002, 003, ..., 300}. Os
Jornalistas escolhidos estarão nas posições: {186, 253, 145, 065, 101, 024, 054,
142, 227, 097, 171, 195, 252, 021, 174, 178, 118, 099, 143, 053, 296, 127, 193, 090,
116}.
Obs.: a escolha das informações na tabela dos números aleatórios é feita ao
acaso e a população nos estratos deverá estar ordenada.
4.7.4 Amostragem por conglomerados
Algumas populações tornam extremamente difíceis a identificação de seus
elementos. Não obstante pode ser relativamente fácil identificar grupos de elementos
que tenha aproximadamente as mesmas composições da população. Neste caso, uma
amostra aleatória simples desses grupos (conglomerados) pode ser escolhida e uma
contagem completa pode ser feita para o conglomerado sorteado. Conglomerados
típicos ou agregados são quarteirões, organizações, blocos de edifícios etc.
Aqui, destacamos a diferença entre um conglomerado e um estrato.
Conglomerado: parte da população com características idênticas ao todo, se for
uma população heterogênea este conglomerado também será constituído por uma
população heterogênea.
Estratos: parte da população com características internas mais ou menos
homogêneas, diferentes da população que possui características heterogêneas.
Exemplo:
No levantamento da população de uma cidade, podemos dispor de um mapa
identificando cada quarteirão, em detrimento de uma relação atualizada de seus
moradores. Podemos, então, coletar uma amostra dos quarteirões e fazer uma
contagem completa de todos os residentes naqueles quarteirões sorteados.
4.8 MODELOS NÃO PROBABILÍSTICOS
São amostragens em que há uma escolha deliberada dos elementos da amostra.
Não é possível generalizar os resultados das pesquisas para a população, pois as
amostras não-probabilísticas não garantem a representatividade da população, por
serem não aleatórias.
Em geral, as técnicas de amostragens não aleatórias procuram gerar amostras
que, de certa forma, representam razoavelmente bem a população de onde foram
extraídas.
4.8.1 Amostragem por cotas
A amostragem por cota tem uma grande semelhança com a amostragem
estratificada proporcional. A população é subdividida em diversos subgrupos e
seleciona-se uma cota de cada subgrupo para fazer parte da amostra, sendo esta
escolha de forma proporcional ao tamanho do subgrupo. O que difere da amostragem
estratificada é a seleção que não precisa ser aleatória.
Para compensar a falta de aleatoriedade na seleção, costuma-se dividir a
população num grande número de subgrupos. Por exemplo, numa pesquisa
socioeconômica, a população pode ser dividida por localidade; por níveis de instrução;
por faixa de renda; por sexo etc.
4.8.2 Amostragem por julgamento
Os elementos escolhidos são aqueles julgados como típicos da população que
se deseja estudar. Por exemplo, num estudo sobre a produção científica dos
departamentos de ensino de uma grande universidade, um estudioso sobre o assunto
pode escolher os departamentos que ele considera serem aqueles que melhor
representam à universidade em ensino.
Numa população deste tipo, a utilização de uma amostra aleatória pode ser não
recomendável, visto que temos uma população relativamente pequena. Por outro lado,
dependendo do que se pretende estudar sobre a produção científica, um levantamento
de todos os departamentos pode gastar muito tempo. Então, o uso de uma amostragem
por julgamento pode ser uma boa alternativa, mesmo com a limitação de que os
resultados desta pesquisa não necessariamente sirvam para todos os departamentos
da universidade.
4.8.3 Tamanho de uma amostra aleatória simples
O cálculo do tamanho de uma amostra é complexo, o nosso estudo fica restrito
ao tamanho de uma amostra aleatória simples.
Alguns conceitos:
• Parâmetro: aracterística descritiva dos elementos da população.
• Estatística: aracterística descritiva dos elementos da amostra.
Exemplo: na população de alunos da universidade, o percentual de alunos favorável ao
projeto da Educação a Distância é um parâmetro. Numa amostra retirada de 400 alunos
desta universidade, a percentagem – de alunos favoráveis ao projeto da Educação a
Distância – nesta amostra é uma estatística.
• Estimativa do parâmetro: o valor acusado por certa estatística, considerando a
particular amostra, observada.
Exemplo: ao observarmos uma amostra de 400 alunos desta universidade, detectamos
que 62% dos alunos são favoráveis a este projeto, podemos afirmar que a estimativa
deste parâmetro para a universidade é de 60%.
• Erro amostral é a diferença entre o valor que a estatística pode acusar e o
verdadeiro valor do parâmetro que se deseja estimar.
• Para a determinação do tamanho da amostra, o pesquisador precisa especificar o
erro amostral tolerável, ou seja, o quanto ele admite errar na avaliação dos
parâmetros de interesse de estudo. Por exemplo, na divulgação das pesquisas
eleitorais é comum encontramos algo como: o candidato “W” no presente instante
apresenta uma preferência de 42% de seu eleitorado com uma margem de erro
•
calculado em torno de 3%, isto quer dizer que o valor estimado de votos deste
candidato admite um valor entre 39% e 45%. Ou seja, 42% ± 3%.
A especificação do erro amostral deve ser feita sobre um enfoque probabilístico,
pois, por maior que seja a amostra, existe sempre o risco de o sorteio gerar uma
amostra com características totalmente diferentes das da população de onde está
sendo extraída.
4.8.4 Fórmula para o cálculo do tamanho mínimo da amostra
Sejam:
→
→
→
→
tolerável amostral ErroE
amostra da tamanho o para oaproximaçã primeira n
amostra da tamanho n
população da tamanho N
o
o
O tamanho da amostra pode ser calculado sem, contudo, conhecer o tamanho
da população, por intermédio da seguinte expressão:
2
o
o E
1 n =
Se conhecermos o tamanho da população N, podemos corrigir o cálculo anterior,
por:
o
o
n N
n . N n +=
Exemplo:
Planeja-se um levantamento por amostragem para avaliar a opinião de 600
moradores do bairro A, a respeito do projeto de urbanização daquele bairro, esta
característica é do tipo percentagem. Qual deve ser o tamanho mínimo de uma amostra
aleatória simples, tal que possamos admitir, com alta confiança, que o erro amostral
não ultrapasse a 5 % ( )0,05 Eo = ?
Solução:
• Uma primeira aproximação: ( ) moradores 400 0,05
1
E
1 n 22
o
o ===
• Corrigindo em função da população N , temos: ( N = 600 )
moradores 240
400 600
400 . 600
n N
n . N n
o
o =+=+=
4.8.5 Tamanho de uma amostra em subgrupos da população
Quando temos interesse no estudo de subgrupos da população separadamente,
ou quando queremos estimar parte da população, precisamos calcular o tamanho da
amostra para cada uma destas partes. O tamanho total da amostra corresponde à soma
dos tamanhos das amostras de cada parte.
Pelo exposto anteriormente, o tamanho total da amostra deve crescer bastante
quando se deseja fazer estimativa isolada para diversos grupos da população. Neste
sentido, é comum o pesquisador ser mais tolerante na precisão das estimativas nos
subgrupos tolerando erros amostrais maiores.
Exemplo:
A Secretaria de Segurança Pública deseja estimar a percentagem de
funcionários favoráveis a um programa de treinamento sobre o combate de
entorpecente. Conta com um quadro de 300 funcionários, dos quais 180 são do sexo
masculino. Determine o tamanho da amostra aleatória simples, levando em
consideração a opinião de ambos os sexos isoladamente, que garanta um alto nível de
significância e um erro amostral não superior a 5% (E0= 0,05).
• Uma primeira aproximação:
( )
1 1n 400 fun cionários o 2 2E 0 ,05o
= = =
• Corrigindo em função da população Ni , temos:
Para o sexo masculino:
Para o sexo feminino:
Acesse a Ferramenta Atividades e realize a Atividade 1.
osfuncionári 124
400 180
400 . 180
n N
n . N n
o
o =+=+=
osfuncionári 92
400 120
400 . 120
n N
n . N
n
o
o =+=+=