Teste de Duas Caudas
O que é um teste de duas caudas?
Em estatística, um teste bicaudal é um método no qual a área crítica de uma distribuição é bilateral e testa se uma amostra é maior ou menor que um determinado intervalo de valores. É usado em teste de hipótese nula e teste de significância estatística. Se a amostra testada cair em qualquer uma das áreas críticas, a hipótese alternativa é aceita em vez da hipótese nula.
Principais vantagens
- Em estatística, um teste bicaudal é um método no qual a área crítica de uma distribuição é bilateral e testa se uma amostra é maior ou menor que um intervalo de valores.
- É usado em teste de hipótese nula e teste de significância estatística.
- Se a amostra testada cair em qualquer uma das áreas críticas, a hipótese alternativa é aceita em vez da hipótese nula.
- Por convenção, testes bicaudais são usados para determinar a significância no nível de 5%, o que significa que cada lado da distribuição é cortado em 2,5%.
Compreendendo um Teste de Duas Caudas
Um conceito básico de estatística inferencial é o teste de hipótese, que determina se uma afirmação é verdadeira ou não, dado um parâmetro populacional. Um teste de hipótese projetado para mostrar se a média de uma amostra é significativamente maior e significativamente menor que a média de uma população é denominado teste bicaudal. O teste de duas caudas recebe o nome do teste da área sob as duas caudas de uma distribuição normal, embora o teste possa ser usado em outras distribuições não normais.
Um teste bicaudal é projetado para examinar ambos os lados de um intervalo de dados especificado, conforme designado pela distribuição de probabilidade envolvida. A distribuição de probabilidade deve representar a probabilidade de um resultado especificado com base em padrões predeterminados. Isso requer a configuração de um limite que designa os valores de variável mais alto (ou superior) e mais baixo (ou inferior) aceitos incluídos dentro da faixa. Qualquer ponto de dados que existe acima do limite superior ou abaixo do limite inferior é considerado fora da faixa de aceitação e em uma área conhecida como faixa de rejeição.
Não existe um padrão inerente com relação ao número de pontos de dados que devem existir dentro da faixa de aceitação. Nos casos em que a precisão é necessária, como na criação de medicamentos, uma taxa de rejeição de 0,001% ou menos pode ser instituída. Em casos onde a precisão é menos crítica, como o número de itens alimentícios em uma sacola de produto, uma taxa de rejeição de 5% pode ser apropriada.
Amostragem Aleatória
Um teste bicaudal também pode ser usado praticamente durante certas atividades de produção em uma empresa, como com a produção e embalagem de doces em uma instalação específica. Se a unidade de produção designar 50 balas por saca como sua meta, com uma distribuição aceitável de 45 a 55 balas, qualquer sacola encontrada com uma quantidade abaixo de 45 ou acima de 55 é considerada dentro da faixa de rejeição.
Para confirmar se os mecanismos de embalagem estão devidamente calibrados para atender à saída esperada, uma amostra aleatória pode ser realizada para confirmar a precisão. Uma amostra aleatória simples pega uma pequena porção aleatória de toda a população para representar todo o conjunto de dados, onde cada membro tem uma probabilidade igual de ser escolhido.
Para que os mecanismos de embalagem sejam considerados precisos, é necessária uma média de 50 balas por saca com uma distribuição adequada. Além disso, o número de sacolas que se enquadram na faixa de rejeição precisa estar dentro do limite de distribuição de probabilidade considerado aceitável como uma taxa de erro. Aqui, a hipótese nula seria que a média é 50, enquanto a hipótese alternativa seria que não é 50.
Se, após a realização do teste bicaudal, o z-score cair na região de rejeição, significando que o desvio está muito longe da média desejada, então ajustes na instalação ou equipamento associado podem ser necessários para corrigir o erro. O uso regular de métodos de teste de duas caudas pode ajudar a garantir que a produção permaneça dentro dos limites a longo prazo.
Tenha o cuidado de observar se um teste estatístico é unilateral ou bicaudal, pois isso influenciará muito a interpretação de um modelo.
Duas Caudas vs. Teste unilateral
Quando um teste de hipótese é configurado para mostrar que a média da amostra seria maior ou menor do que a média da população, isso é chamado de teste unicaudal. O teste unicaudal recebe o nome de testar a área sob uma das caudas (lados) de uma distribuição normal. Ao usar um teste unicaudal, um analista está testando a possibilidade de relacionamento em uma direção de interesse e desconsiderando completamente a possibilidade de um relacionamento em outra direção.
Se a amostra testada cair na área crítica unilateral, a hipótese alternativa será aceita em vez da hipótese nula. Um teste unilateral também é conhecido como hipótese direcional ou teste direcional.
Um teste bicaudal, por outro lado, é projetado para examinar ambos os lados de um intervalo de dados especificado para testar se uma amostra é maior ou menor que o intervalo de valores.
Exemplo de um teste de duas caudas
Como um exemplo hipotético, imagine que um novo corretor da bolsa (XYZ) alega que suas taxas de corretagem são mais baixas do que as de seu corretor da bolsa atual (ABC). Os dados disponíveis de uma empresa de pesquisa independente indicam que a média e o desvio padrão de todos os clientes da corretora ABC são de $ 18 e $ 6, respectivamente.
É feita uma amostra de 100 clientes da ABC e os encargos de corretagem são calculados com as novas taxas do corretor XYZ. Se a média da amostra for $ 18,75 e o desvio padrão da amostra for $ 6, pode ser feita alguma inferência sobre a diferença na nota média da corretora entre o corretor ABC e XYZ?
- H 0 : Hipótese nula: média = 18
- H 1 : Hipótese alternativa: média 18 (isso é o que queremos provar.)
- Região de rejeição: Z = Z 2,5 (assumindo um nível de significância de 5%, dividir 2,5 cada em cada lado).
- Z = (amostra média – média) / (std-dev / sqrt (no. De amostras)) = (18,75 – 18) / (6 / (sqrt (100)) = 1,25
Este valor Z calculado fica entre os dois limites definidos por: – Z 2,5 = -1,96 e Z 2,5 = 1,96.
Isso conclui que não há evidências suficientes para inferir que haja alguma diferença entre as taxas de seu corretor existente e o novo corretor. Portanto, a hipótese nula não pode ser rejeitada. Alternativamente, o valor p = P (Z 1,25) = 2 * 0,1056 = 0,2112 = 21,12%, que é maior que 0,05 ou 5%, leva à mesma conclusão.
perguntas frequentes
Como um teste de duas caudas é projetado?
Um teste bicaudal é projetado para determinar se uma afirmação é verdadeira ou não, dado um parâmetro populacional. Ele examina ambos os lados de um intervalo de dados especificado, conforme designado pela distribuição de probabilidade envolvida. Como tal, a distribuição de probabilidade deve representar a probabilidade de um resultado especificado com base em padrões predeterminados. Isso requer a configuração de um limite que designa os valores de variável mais alto (ou superior) e mais baixo (ou inferior) aceitos incluídos dentro da faixa. Qualquer ponto de dados que existe acima do limite superior ou abaixo do limite inferior é considerado fora da faixa de aceitação e a reivindicação é rejeitada.
Qual é a diferença entre um teste bicaudal e um teste unilateral?
Um teste de hipótese bicaudal é projetado para mostrar se a média da amostra é significativamente maior e significativamente menor do que a média de uma população. O teste de duas caudas recebe o nome do teste da área sob as duas caudas (lados) de uma distribuição normal. Um teste de hipótese unilateral, por outro lado, é estabelecido para mostrar que a média da amostra seria maior ou menor do que a média da população. O teste unilateral recebe o nome de testar a área sob uma das caudas de uma distribuição normal.
O que é um Z-Score?
Um Z-score descreve numericamente a relação de um valor com a média de um grupo de valores e é medido em termos de número de desvios padrão da média. Se um escore Z for 0, indica que o escore do ponto de dados é idêntico ao escore médio, enquanto escores Z de 1,0 e -1,0 indicariam valores um desvio padrão acima ou abaixo da média. Na maioria dos grandes conjuntos de dados, 99% dos valores têm um Z-score entre -3 e 3, o que significa que estão dentro de três desvios padrão acima e abaixo da média.