23 Junho 2021 7:58

Amostragem Aleatória Estratificada

O que é amostragem aleatória estratificada?

A amostragem aleatória estratificada é um método de amostragem que envolve a divisão de uma população em subgrupos menores conhecidos como estratos. Na amostragem aleatória estratificada, ou estratificação, os estratos são formados com base nos atributos ou características compartilhados dos membros, como renda ou realização educacional.

A amostragem aleatória estratificada também é chamada de amostragem aleatória proporcional ou amostragem aleatória de cota.

Principais vantagens

  • A amostragem aleatória estratificada permite que os pesquisadores obtenham uma amostra da população que melhor representa toda a população em estudo.
  • A amostragem aleatória estratificada envolve a divisão de toda a população em grupos homogêneos chamados estratos.
  • A amostragem aleatória estratificada difere da amostragem aleatória simples, que envolve a seleção aleatória de dados de uma população inteira, de modo que cada amostra possível tem a mesma probabilidade de ocorrer.

Como funciona a amostragem aleatória estratificada

Ao concluir a análise ou pesquisa em um grupo de entidades com características semelhantes, um pesquisador pode descobrir que o tamanho da população é muito grande para a conclusão da pesquisa. Para economizar tempo e dinheiro, um analista pode adotar uma abordagem mais viável, selecionando um pequeno grupo da população. O pequeno grupo é conhecido como tamanho de amostra, que é um subconjunto da população usado para representar toda a população. Uma amostra pode ser selecionada de uma população de várias maneiras, uma das quais é o método de amostragem aleatória estratificada.

Uma amostragem aleatória estratificada envolve a divisão de toda a população em grupos homogêneos chamados estratos (plural para estrato). Amostras aleatórias são então selecionadas de cada estrato. Por exemplo, considere um pesquisador acadêmico que gostaria de saber quantos alunos de MBA em 2007 receberam uma oferta de emprego três meses após a formatura.

Ele logo descobrirá que havia quase 200.000 formados em MBA naquele ano. Ele pode decidir amostra aleatória simples de 50.000 graduados e fazer uma pesquisa. Melhor ainda, ele poderia dividir a população em estratos e tirar uma amostra aleatória dos estratos. Para fazer isso, ele criaria grupos populacionais com base em gênero, faixa etária, raça, país de nacionalidade e histórico profissional. Uma amostra aleatória de cada estrato é retirada em um número proporcional ao tamanho do estrato em relação à população. Esses subconjuntos dos estratos são então agrupados para formar uma amostra aleatória.

[Importante: a amostragem estratificada é usada para destacar as diferenças entre os grupos em uma população, em oposição à amostragem aleatória simples, que trata todos os membros de uma população como iguais, com uma probabilidade igual de serem amostrados.]

Exemplo de Amostragem Aleatória Estratificada

Suponha que uma equipe de pesquisa queira determinar o GPA de estudantes universitários nos Estados Unidos. A equipe de pesquisa tem dificuldade em coletar dados de todos os 21 milhões de estudantes universitários; ele decide fazer uma amostra aleatória da população usando 4.000 alunos.

Agora suponha que a equipe analise os diferentes atributos dos participantes da amostra e se pergunte se há alguma diferença nos GPAs e nos cursos dos alunos. Suponha que ele descubra que 560 alunos são graduados em inglês, 1.135 são graduados em ciências, 800 são graduados em ciência da computação, 1.090 são graduados em engenharia e 415 são graduados em matemática. A equipe deseja usar uma amostra aleatória estratificada proporcional onde o estrato da amostra é proporcional à amostra aleatória da população.

Suponha que a equipe pesquise os  dados demográficos  de estudantes universitários nos Estados Unidos e encontre a porcentagem em que os alunos se especializam: 12% de especialização em inglês, 28% de especialização em ciências, 24% de especialização em ciência da computação, 21% de especialização em engenharia e 15% major em matemática. Assim, cinco estratos são criados a partir do processo de amostragem aleatória estratificada.

A equipe então precisa confirmar se o estrato da população é proporcional ao estrato da amostra; no entanto, eles descobrem que as proporções não são iguais. A equipe então precisa reamostrar 4.000 alunos da população e selecionar aleatoriamente 480 alunos de inglês, 1.120 de ciências, 960 de ciência da computação, 840 de engenharia e 600 de matemática.

Com eles, tem uma amostra aleatória estratificada proporcional de estudantes universitários, o que fornece uma melhor representação dos alunos graduados em faculdades nos EUA. Os pesquisadores podem então destacar estratos específicos, observar os estudos variados de estudantes universitários dos EUA e observar as várias médias de notas.

Amostras Aleatórias Simples Versus Amostras Aleatórias Estratificadas

Amostras aleatórias simples  e amostras aleatórias estratificadas são ferramentas de medição estatística. Uma amostra aleatória simples é usada para representar toda a população de dados. Uma amostra aleatória estratificada divide a população em grupos menores, ou estratos, com base em características compartilhadas.

A amostra aleatória simples é freqüentemente usada quando há muito pouca informação disponível sobre a população de dados, quando a população de dados tem muitas diferenças para se dividir em vários subconjuntos ou quando há apenas uma característica distinta entre a população de dados.

Por exemplo, uma empresa de doces pode querer estudar os hábitos de compra de seus clientes para determinar o futuro de sua linha de produtos. Se houver 10.000 clientes, ele pode escolher 100 desses clientes como uma amostra aleatória. Ele pode então aplicar o que descobrir desses 100 clientes ao restante de sua base. Ao contrário da estratificação, ele irá amostrar 100 membros puramente ao acaso, sem qualquer consideração por suas características individuais.

Estratificação proporcional e desproporcional

A amostragem aleatória estratificada garante que cada subgrupo de uma determinada população seja adequadamente representado em toda a população da amostra de um estudo de pesquisa. A estratificação pode ser proporcional ou desproporcional. Em um método estratificado proporcional, o tamanho da amostra de cada estrato é proporcional ao tamanho da população do estrato.

Por exemplo, se o pesquisador desejava uma amostra de 50.000 graduados por faixa etária, a amostra aleatória estratificada proporcional será obtida por meio desta fórmula: (tamanho da amostra / tamanho da população) x tamanho do estrato. A tabela abaixo assume uma população de 180.000 graduados em MBA por ano.

O tamanho da amostra de estratos para graduados em MBA na faixa etária de 24 a 28 anos é calculado como (50.000 / 180.000) x 90.000 = 25.000. O mesmo método é usado para as outras faixas etárias. Agora que o tamanho da amostra dos estratos é conhecido, o pesquisador pode realizar uma amostragem aleatória simples em cada estrato para selecionar seus participantes da pesquisa. Em outras palavras, 25.000 graduados da faixa etária de 24 a 28 anos serão selecionados aleatoriamente de toda a população, 16.667 graduados da faixa etária de 29 a 33 anos serão selecionados aleatoriamente da população, e assim por diante.

Em uma amostra estratificada desproporcional, o tamanho de cada estrato não é proporcional ao seu tamanho na população. O pesquisador pode decidir amostrar 1/2 dos graduados na faixa etária de 34-37 e 1/3 dos graduados na faixa etária de 29-33.

É importante observar que uma pessoa não pode se encaixar em vários estratos. Cada entidade deve caber apenas em um estrato. Ter subgrupos sobrepostos significa que alguns indivíduos terão maiores chances de serem selecionados para a pesquisa, o que nega completamente o conceito de amostragem estratificada como um tipo de amostragem probabilística.



Os gerentes de portfólio podem usar a amostragem aleatória estratificada para criar carteiras, replicando um índice, como um índice de títulos.

Vantagens da Amostragem Aleatória Estratificada

A principal vantagem da amostragem aleatória estratificada é que ela captura características chave da população na amostra. Semelhante a uma média ponderada, este método de amostragem produz características na amostra que são proporcionais à população geral. A amostragem aleatória estratificada funciona bem para populações com uma variedade de atributos, mas é ineficaz se os subgrupos não puderem ser formados.

A estratificação fornece um erro menor na estimativa e maior precisão do que o método de amostragem aleatória simples. Quanto maiores forem as diferenças entre os estratos, maior será o ganho de precisão.

Desvantagens da Amostragem Aleatória Estratificada

Infelizmente, esse método de pesquisa não pode ser usado em todos os estudos. A desvantagem do método é que várias condições devem ser atendidas para que ele seja usado corretamente. Os pesquisadores devem identificar cada membro de uma população que está sendo estudada e classificar cada um deles em uma, e apenas uma, subpopulação. Como resultado, a amostragem aleatória estratificada é desvantajosa quando os pesquisadores não conseguem classificar com segurança cada membro da população em um subgrupo. Além disso, encontrar uma lista completa e definitiva de uma população inteira   pode ser um desafio.

A sobreposição pode ser um problema se houver assuntos que se enquadram em vários subgrupos. Quando uma amostragem aleatória simples é realizada, aqueles que estão em vários subgrupos são mais propensos a serem escolhidos. O resultado pode ser uma deturpação ou reflexo impreciso da população.

Os exemplos acima facilitam: graduação, pós-graduação, homens e mulheres são grupos claramente definidos. Em outras situações, entretanto, pode ser muito mais difícil. Imagine incorporar características como raça, etnia ou religião. O processo de classificação torna-se mais difícil, tornando a amostragem aleatória estratificada um método ineficaz e inferior ao ideal.