Distribuição de amostras
O que é uma distribuição de amostragem?
Uma distribuição de amostragem é uma distribuição de probabilidade de uma estatística obtida de um grande número de amostras retiradas de uma população específica. A distribuição de amostragem de uma determinada população é a distribuição de frequências de uma gama de resultados diferentes que podem ocorrer para uma estatística de uma população.
Em estatísticas, uma população é todo o conjunto do qual uma amostra estatística é extraída. Uma população pode se referir a um grupo inteiro de pessoas, objetos, eventos, visitas a hospitais ou medições. Uma população pode, portanto, ser considerada uma observação agregada de assuntos agrupados por uma característica comum.
- Uma distribuição de amostragem é uma estatística obtida por meio de amostragem repetida de uma população maior.
- Ele descreve uma gama de resultados possíveis de uma estatística, como a média ou modo de alguma variável, uma vez que realmente existe uma população.
- A maioria dos dados analisados pelos pesquisadores é, na verdade, extraída de amostras, e não de populações.
Compreendendo a distribuição de amostragem
Muitos dados extraídos e usados por acadêmicos, estatísticos, pesquisadores, profissionais de marketing, analistas etc. são, na verdade, amostras, não populações. Uma amostra é um subconjunto de uma população. Por exemplo, um pesquisador médico que quisesse comparar o peso médio de todos os bebês nascidos na América do Norte de 1995 a 2005 com os nascidos na América do Sul no mesmo período não pode, em um período de tempo razoável, extrair os dados de toda a população mais de um milhão de partos ocorridos no período de dez anos. Em vez disso, ele usará apenas o peso de, digamos, 100 bebês em cada continente para fazer uma conclusão. O peso de 200 bebês utilizado é a amostra e o peso médio calculado é a média da amostra.
Agora, suponha que em vez de pegar apenas uma amostra de 100 pesos de recém-nascidos de cada continente, o pesquisador médico pegue amostras aleatórias repetidas da população geral e calcule a média da amostra para cada grupo de amostra. Assim, para a América do Norte, ele obtém dados de 100 pesos de recém-nascidos registrados nos EUA, Canadá e México da seguinte forma: quatro 100 amostras de hospitais selecionados nos EUA, cinco 70 amostras do Canadá e três 150 registros do México, para um total de 1200 pesos de bebês recém-nascidos agrupados em 12 conjuntos. Ele também coleta uma amostra de dados de 100 pesos ao nascer de cada um dos 12 países da América do Sul.
Cada amostra tem sua própria média amostral e a distribuição das médias amostrais é conhecida como distribuição amostral.
O peso médio calculado para cada conjunto de amostra é a distribuição de amostragem da média. Não apenas a média pode ser calculada a partir de uma amostra. Outras estatísticas, como desvio padrão, variância, proporção e intervalo, podem ser calculadas a partir dos dados da amostra. O desvio padrão e a variância medem a variabilidade da distribuição da amostra.
O número de observações em uma população, o número de observações em uma amostra e o procedimento usado para desenhar os conjuntos de amostra determinam a variabilidade de uma distribuição amostral. O desvio padrão de uma distribuição de amostragem é chamado de erro padrão. Embora a média de uma distribuição amostral seja igual à média da população, o erro padrão depende do desvio padrão da população, do tamanho da população e do tamanho da amostra.
Saber como a média de cada um dos conjuntos de amostra está espalhada entre si e da média da população dará uma indicação de quão próxima a média da amostra está da média da população. O erro padrão da distribuição da amostra diminui à medida que o tamanho da amostra aumenta.
Considerações Especiais
Uma população ou um conjunto de números de amostra terá uma distribuição normal. No entanto, como uma distribuição de amostragem inclui vários conjuntos de observações, ela não terá necessariamente uma forma curva em sino.
Seguindo nosso exemplo, o peso médio da população de bebês na América do Norte e na América do Sul tem uma distribuição normal porque alguns bebês estarão abaixo do peso (abaixo da média) ou acima do peso (acima da média), com a maioria dos bebês caindo no meio (em torno da média ) Se o peso médio dos recém-nascidos na América do Norte for sete libras, o peso médio da amostra em cada um dos 12 conjuntos de observações amostrais registradas para a América do Norte também será próximo a sete libras.
No entanto, se você representar graficamente cada uma das médias calculadas em cada um dos 1.200 grupos de amostra, a forma resultante pode resultar em uma distribuição uniforme, mas é difícil prever com certeza qual será a forma real. Quanto mais amostras o pesquisador usar da população de mais de um milhão de figuras de peso, mais o gráfico começará a formar uma distribuição normal.