O que é Amostragem?

Teoria da Amostragem

A teoria da amostragem estuda as relações existentes entre uma população e as amostras extraídas dessa população. É útil para avaliação de grandezas desconhecidas da população, ou para determinar se as diferenças observadas entre duas amostras são devidas ao acaso ou se são verdadeiramente significativas.

O que é amostragem?

Amostragem é o processo de determinação de uma amostra a ser pesquisada. A amostra é uma parte de elementos selecionada de uma população estatística.

Enquanto um censo envolve o exame de todos os elementos de um dado grupo, a amostragem envolve o estudo apenas de uma parte dos elementos. A finalidade da amostragem é fazer generalizações sem precisar examinar todos os elementos de um dado grupo.

O censo apresenta dificuldades que tornam a amostragem um processo muito mais atraente. Entre as dificuldades que o censo apresenta, podemos enumerar as seguintes:

1. A população pode ser infinita, neste caso o censo seria impossível;
2. A amostra pode ser atualizada mais facilmente que o censo;
3. Em testes destrutivos, o censo estaria informando resultados sobre itens que são destruídos em seu exame;
4. O custo do censo pode torná-lo proibitivo;
5. A precisão de um censo varia de acordo com o tamanho da população examinada;
6. Fatores tempo e custo podem apontar pela preferência entre uma amostra e um censo.

Porém há ocasiões em que o levantamento do censo pode ser vantajoso:

1. Quando a população é pequena e o custo entre o censo e a amostra forem praticamente iguais;
2. Se o tamanho da amostra necessária tiver que ser muito grande em relação à população examinada;
3. Nas ocasiões em que se exige precisão completa;
4. Nas ocasiões em que já existe informação completa.

Amostra X População

Já mostramos que a parcela examinada de um grupo é chamada de amostra enquanto o grupo todo é chamado de universo ou população. No entanto, é importante lembrar que simplesmente selecionar uma parcela do grupo não é suficiente. A amostra deve ser representativa da população.

“Uma amostra representativa tem as mesmas características da população de onde foi retirada.”

Uma população é composta por itens que possuem uma característica comum que os identifica dentro da mesma categoria. Desta forma, pode ser mensurada, contada ou ordenada de acordo com algum critério classificatório. Exemplo: indivíduos, firmas, produtos manufaturados, inventários, escolas, preços, etc.

“Uma população consiste de todas as observações concebíveis (ou hipoteticamente possíveis) de um determinado fenômeno, enquanto uma amostra é simplesmente parte de uma população.”

Uma vez que o propósito da amostra é permitir que se façam generalizações sobre a população básica, é necessário que esta amostra seja representativa da população para permitir generalizações válidas.

Os erros possíveis de serem cometidos na realização de uma amostragem podem ser evitados ou corrigidos aplicando técnicas adequadas e estabelecendo resultados com estimativa de erro, por exemplo, um intervalo de confiança.

Amostragem Probabilística e Não Probabilística

Há duas grandes divisões no processo de amostragem: a probabilística e a não-probabilística.

A amostragem probabilística também é chamada de amostragem aleatória ou ao acaso. Este tipo de amostragem é submetida a tratamento estatístico que permite compensar erros amostrais. Hoje, dificilmente se aceita uma amostragem não-probabilística, exceto nos casos em que a amostragem probabilística não pode ser feita.

“Em uma amostragem probabilística ou aleatória qualquer amostra tem a mesma probabilidade de ser selecionada.”

A amostragem não-probabilística, por não fazer uso de forma aleatória de seleção, não aceita diversas aplicações estatísticas e, por isto, é preterida.

O tipo mais comum de amostragem não-probabilística é a intencional. Neste tipo de amostragem o pesquisador está interessado na opinião de determinados elementos da população estatística, mas não representativos da mesma.

O pesquisador não se dirige à “massa” mas àqueles que entende serem os líderes, pressupondo que estes têm a capacidade de influenciar toda a população estatística. Evidentemente esta técnica não permite generalizações do resultado e tem validade apenas dentro de um certo contexto.

Por exemplo, uma pesquisa de opinião com diretores de Faculdades de Contábeis sobre a obrigatoriedade do diploma universitário para o exercício da profissão de Contador. Da mesma forma, algumas revistas costumam publicar estatísticas sobre o comportamento baseadas em uma pesquisa junto a seus assinantes.

Como os assinantes não constituem uma amostra aleatória da população, é impossível fazer inferências estatísticas válidas sobre a população como um todo, a partir destas pesquisas. Como não há seleção aleatória, não é de modo algum apropriado generalizar esses resultados a uma população maior.

Antes do advento dos computadores, a melhor maneira de se obter uma amostra aleatória era utilizar uma tabela de números aleatórios. Uma tabela de dígitos aleatórios é uma tabela criada por alguém cujo objetivo era gerar números aleatórios. Os números foram testados para ver se satisfaziam certos testes de aleatoriedade.

Hoje, os números aleatórios podem ser gerados por computador. A maioria dos computadores tem programas que geram esses números. Os números assim obtidos não são, na verdade, completamente aleatórios, pois são gerados de acordo com uma regra fixa. Mas a regra é suficientemente imprevisível de modo que para todos os fins práticos, os números parecem ter sido gerados de maneira totalmente aleatória.

Pontos importantes:

1. É muito dispendioso entrevistar cada pessoa de toda uma população; recorremos, então, as amostras;
2. Usa-se a proporção de pessoas em uma amostra, portadoras de determinada característica, para estimar a proporção, na população das que tem essa característica.
3. O melhor método de escolha de uma amostra é a escolha aleatória, isto é, que toda amostra possível tenha a mesma chance de ser escolhida.
4. Antes de se proceder a observação de uma determinada população surge a questão se a amostragem será com ou sem reposição. Se o tamanho da amostra é insignificante em relação à população o impacto da reposição será desprezível, porém, se a amostra for grande então a reposição ou não pode causar um impacto significativo no resultado da probabilidade.
5. Como as características das populações estatísticas variam, às vezes, é necessário se adequar esta população estatística para submetê-la a um critério de seleção possível, sem, contudo, perder seu caráter aleatório.

Principais Métodos Aleatórios

Método Aleatório Simples

O método aleatório simples é aquele em que cada elemento da população tem a mesma chance de ser escolhido para a amostra. A população é numerada sequencialmente e depois a amostra é sorteada aleatoriamente ou relacionada a uma tabela de números aleatórios.

Este tipo de amostragem é chamado também de simples, ao acaso, aleatória, casual, elementar, randômica, etc., é equivalente a um sorteio lotérico.

Amostragem Estratificada

Se a população pode ser dividida em subgrupos que consistem, todos eles, em indivíduos bastante semelhantes entre si, podemos obter uma amostra representativa entrevistando uma amostra aleatória de pessoas de cada grupo.

Este processo pode gerar amostras bastante precisas, mas só é viável quando a população pode ser dividida em grupos homogêneos, ou estratos, e de cada um deles toma-se a amostra aleatória. Alguns exemplos: sexo (dois), grupos etários, as ocupações ou outras divisões em grupos que possam ser relevantes a um estudo em questão.

Uma das vantagens da estratificação é a diminuição das variâncias tendo em vista a maior homogeneidade dentro de cada estrato do que em comparação com a média da população total.

Amostragem por Conglomerado (ou em cacho)

Neste método a população é dividida em diferentes conglomerados, extraindo-se uma amostra apenas dos conglomerados selecionados, e não toda a população. O ideal seria que cada conglomerado representasse tanto quanto possível o total da população.

Na prática, selecionam-se os conglomerados geograficamente, escolhe-se aleatoriamente algumas regiões, em seguida algumas sub-regiões e finalmente alguns lares. Este processo assegura que as pessoas da amostra vivam em conglomerados, possibilitando ao pesquisador entrevistar poucas pessoas para obter o resultado desejado.

Aplica-se este método quando não se dispõe de uma lista dos membros da população ou de unidades estatísticas sobre as quais se aplicaria a seleção. Em tais casos é mais fácil obter-se o registro de grupos, entidades em que a população estatística esteja agrupada.

Ao invés de se selecionar itens individuais da população, seleciona-se um grupo ou entidade e examina-se a totalidade dos componentes deste grupo. Exemplo: todos os alunos de uma escola, todos os componentes de uma família. Como estes aglomerados podem ser heterogêneos, pode-se estratificá-los de acordo com categorias que interessem à pesquisa.

Método de Amostragem por Estágios Múltiplos

Sempre que não é possível atribuir a cada elemento da amostra um número para que todos tenham a mesma chance de seleção, como por exemplo, numa população estatística muito grande, pode-se optar por seleção preliminar de áreas geográficas, localidades, grupos ou conglomerados e, depois, numerar e sortear membros destas partes escolhidas que integram o universo.

Assim, num inquérito epidemiológico a ser aplicado sobre uma área muito extensa, pode-se sortear previamente alguns municípios, dentro destes, alguns distritos, e nestes últimos, um certo número de casas ou escolas onde serão examinados todos os indivíduos ou se seleciona uma amostra aleatória para estudo.

Pontos importantes:

1. Na prática, é muito dispendioso selecionar amostras puramente aleatórias; assim, empregam-se dois outros métodos de amostragem, a amostragem por conglomerados e a amostragem estratificada;
2. Na amostragem por conglomerado, a população é dividida em grupos, ou conglomerados; selecionam-se aleatoriamente alguns conglomerados, e deles se extraem aleatoriamente os elementos que irão compor a amostra;
3. Na amostragem estratificada, a população é dividida em estratos, ou camadas tão semelhantes entre si quanto possível;
4. Não é apropriado aplicar a análise estatística à amostras que consistam em pessoas ou outras unidades às quais houve maior facilidade de acesso do entrevistador.

Extensão da Amostra

Uma das perguntas mais frequentes em estatística é: “Qual o tamanho da amostra que devemos tomar?” Para que a amostra represente com fidelidade o universo é necessário que ela agrupe um número suficiente de casos. Este número, por sua vez, depende dos seguintes fatores:

a) amplitude do universo

A extensão da amostra tem a ver com a extensão do universo, para tanto, os universos são classificados em finitos e infinitos.

De acordo com Gil (1991:84) “universos finitos são aqueles cujo número de elementos não excede 100.000. Universos infinitos, por sua vez, são aqueles que apresentam elementos em número superior a esse. São assim denominados porque, acima de 100.000, qualquer que seja o número de elementos do universo, o número de elementos da amostra a ser selecionada será praticamente o mesmo”.

b) O nível de confiança estabelecido

De acordo com as normas gerais de probabilidade, a distribuição das informações coletadas tende, geralmente, a ajustar-se à curva “ normal “ (curva de Gauss) , que apresenta valores centrais elevados e valores extremos reduzidos.

O nível de confiança refere-se à distância entre um ponto em relação à média. Numa curva normal, a área compreendida por um desvio padrão à direita e um desvio padrão à esquerda da média cobre 68% de seu total.

Da mesma forma dois desvios-padrão cobrem 95,5% e três desvios-padrão cobrem 99,7%. Isso significa que, quando na seleção de uma amostra são considerados dois desvios-padrão, trabalha-se com um nível de confiança de 95,5%.

c) Erro máximo permitido

Os resultados obtidos a partir de uma amostra não são exatamente exatos em relação ao universo de onde foram extraídos. O resultado apresenta um erro de medição que diminui à proporção que a amostra aumenta. O erro de medição é uma tolerância dentro da qual se considera a amostra normal.

d) Percentagem com que o fenômeno se verifica:

A estimação prévia da porcentagem que um fenômeno se verifica é importante para definir o tamanho da amostra conforme veremos a seguir.

Como calcular a extensão da amostra

O cálculo de extensão da amostra pode ser obtido através da fórmula:

Onde:

n = tamanho da amostra
s² = nível de confiança escolhido, expresso em números de desvio padrão
p = percentagem com a qual o fenômeno se verifica
q = percentagem complementar ( 100 –p)
N = tamanho da população
 = erro máximo permitido.

Exemplo: na pesquisa de 10.000 sindicalizados , quantos são analfabetos? Presume-se que o número seja superior a 30% e deseja-se um nível de confiança de 95% (dois desvios) com a tolerância de erro de até 3%.

Sindicalizados serão pesquisados.

Como determinar a margem de erro

A margem de erro de uma amostra varia em função do valor encontrado, portanto, sua determinação só é possível após a obtenção dos dados. É calculada a partir da seguinte fórmula:

sp = erro-padrão ou desvio da percentagem com que se verifica determinado fenômeno;
p = percentagem com que se verifica o fenômeno;
q = percentagem complementar (100p);
n = número de elementos incluídos na amostra.

Exemplo: em uma pesquisa realizada com 1.000 pessoas adultas, se verificou que 30% bebem café pelo menos uma vez por dia, qual a possibilidade do resultado ser verdadeiro para todo o universo?

Como o valor encontrado (1,45) corresponde a um desvio, para dois desvios teremos o dobro (2,95). Isto significa que para um nível de confiança de 95% (dois desvios), o resultado da pesquisa apresentará uma margem de erro de 2,95%. É provável que o número de consumidores de café esteja entre 27,05% (30 – 2,95) e 32,95% (30+2,95) do total da população.

O que é Amostragem?

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *