Análise de Variância (ANOVA)
O que é Análise de Variância (ANOVA)?
A análise de variância (ANOVA) é uma ferramenta de análise usada em estatísticas que divide uma variabilidade agregada observada encontrada dentro de um conjunto de dados em duas partes: fatores sistemáticos e fatores aleatórios. Os fatores sistemáticos têm uma influência estatística sobre o conjunto de dados fornecido, enquanto os fatores aleatórios não. Os analistas usam o teste ANOVA para determinar a influência que as variáveis independentes têm sobre a variável dependente em um estudo de regressão.
Os métodos de teste t e z desenvolvidos no século 20 foram usados para análise estatística até 1918, quando Ronald Fisher criou o método de análise de variância.1 ANOVA também é chamada de análise de variância de Fisher e é a extensão dos testes t e z. O termo tornou-se conhecido em 1925, após aparecer no livro de Fisher, “Statistical Methods for Research Workers”. Foi empregado na psicologia experimental e posteriormente expandido para assuntos mais complexos.
A Fórmula para ANOVA é:
O que a análise de variância revela?
O teste ANOVA é a etapa inicial na análise dos fatores que afetam um determinado conjunto de dados. Assim que o teste é concluído, um analista executa testes adicionais nos fatores metódicos que contribuem de forma mensurável para a inconsistência do conjunto de dados. O analista utiliza os resultados do teste ANOVA em um teste f para gerar dados adicionais que se alinham com os modelos de regressão propostos.
O teste ANOVA permite a comparação de mais de dois grupos ao mesmo tempo para determinar se existe uma relação entre eles. O resultado da fórmula ANOVA, a estatística F (também chamada de razão F), permite a análise de vários grupos de dados para determinar a variabilidade entre as amostras e dentro das amostras.
Se não houver diferença real entre os grupos testados, o que é chamado de hipótese nula, o resultado da estatística F-ratio da ANOVA será próximo a 1. A distribuição de todos os valores possíveis da estatística F é a distribuição F. Este é, na verdade, um grupo de funções de distribuição, com dois números característicos, chamados de graus de liberdade do numerador e graus de liberdade do denominador.
Principais vantagens
- Análise de variância, ou ANOVA, é um método estatístico que separa os dados de variância observados em diferentes componentes para uso em testes adicionais.
- Uma ANOVA unilateral é usada para três ou mais grupos de dados, para obter informações sobre a relação entre as variáveis dependentes e independentes.
- Se não houver variação verdadeira entre os grupos, o F-ratio da ANOVA deve ser próximo a 1.
Exemplo de como usar ANOVA
Um pesquisador pode, por exemplo, testar alunos de várias faculdades para ver se os alunos de uma das faculdades superam consistentemente os alunos de outras faculdades. Em uma aplicação de negócios, um pesquisador de P&D pode testar dois processos diferentes de criação de um produto para ver se um processo é melhor do que o outro em termos de eficiência de custos.
O tipo de teste ANOVA usado depende de vários fatores. É aplicado quando os dados precisam ser experimentais. A análise de variância é empregada se não houver acesso ao software estatístico, resultando no cálculo da ANOVA à mão. É simples de usar e mais adequado para pequenas amostras. Com muitos projetos experimentais, os tamanhos das amostras devem ser os mesmos para as várias combinações de nível de fator.
ANOVA é útil para testar três ou mais variáveis. É semelhante a vários testes t de duas amostras. No entanto, isso resulta em menos erros do tipo I e é apropriado para uma série de problemas. ANOVA agrupa diferenças comparando as médias de cada grupo e inclui espalhar a variância em diversas fontes. É empregado com sujeitos, grupos de teste, entre grupos e dentro de grupos.
ANOVA unilateral versus ANOVA bidirecional
Existem dois tipos principais de ANOVA: unidirecional (ou unidirecional) e bidirecional. Também existem variações de ANOVA. Por exemplo, MANOVA (ANOVA multivariada) difere de ANOVA, pois a primeira testa várias variáveis dependentes simultaneamente, enquanto a última avalia apenas uma variável dependente por vez. Uma ou duas vias referem-se ao número de variáveis independentes em seu teste de análise de variância. Uma ANOVA unilateral avalia o impacto de um único fator em uma única variável de resposta. Ele determina se todas as amostras são iguais. A ANOVA unilateral é usada para determinar se há alguma diferença estatisticamente significativa entre as médias de três ou mais grupos independentes (não relacionados).
Uma ANOVA de duas vias é uma extensão da ANOVA de uma via. Com uma via unilateral, você tem uma variável independente afetando uma variável dependente. Com uma ANOVA bidirecional, existem duas independentes. Por exemplo, uma ANOVA bidirecional permite que uma empresa compare a produtividade do trabalhador com base em duas variáveis independentes, como salário e conjunto de habilidades. É utilizado para observar a interação entre os dois fatores e testar o efeito de dois fatores ao mesmo tempo.