Hipótese Nula
O que é uma hipótese nula?
Uma hipótese nula é um tipo de hipótese usada em estatística que propõe que não há diferença entre certas características de uma população (ou processo de geração de dados).
Por exemplo, um jogador pode estar interessado em saber se um jogo de azar é justo. Se for justo, os ganhos esperados por jogada chegam a 0 para ambos os jogadores. Se o jogo não for justo, os ganhos esperados são positivos para um jogador e negativos para o outro. Para testar se o jogo é justo, o jogador coleta dados de ganhos de muitas repetições do jogo, calcula o ganho médio a partir desses dados e testa a hipótese nula de que os ganhos esperados não são diferentes de zero.
Se os ganhos médios dos dados da amostra estiverem suficientemente longe de zero, o jogador rejeitará a hipótese nula e concluirá a hipótese alternativa – a saber, que os ganhos esperados por jogada são diferentes de zero. Se os ganhos médios dos dados da amostra forem próximos de zero, o jogador não rejeitará a hipótese nula, concluindo, em vez disso, que a diferença entre a média dos dados e 0 é explicável apenas pelo acaso.
Principais vantagens
- Uma hipótese nula é um tipo de conjectura usada em estatística que propõe que não há diferença entre certas características de uma população ou processo de geração de dados.
- A hipótese alternativa propõe que há uma diferença.
- O teste de hipótese fornece um método para rejeitar uma hipótese nula dentro de um determinado nível de confiança. (No entanto, hipóteses nulas não podem ser provadas.)
Como funciona uma hipótese nula
A hipótese nula, também conhecida como conjectura, assume que qualquer tipo de diferença entre as características escolhidas que você vê em um conjunto de dados é devido ao acaso. Por exemplo, se os ganhos esperados para o jogo de azar forem realmente iguais a 0, então qualquer diferença entre os ganhos médios nos dados e 0 é devido ao acaso.
As hipóteses estatísticas são testadas usando um processo de quatro etapas. O primeiro passo é o analista apresentar as duas hipóteses de modo que apenas uma possa estar certa. A próxima etapa é formular um plano de análise, que descreve como os dados serão avaliados. A terceira etapa é realizar o plano e analisar fisicamente os dados da amostra. A quarta e última etapa é analisar os resultados e rejeitar a hipótese nula ou afirmar que as diferenças observadas são explicáveis apenas pelo acaso.
Os analistas procuram rejeitar a hipótese nula porque fazer isso é uma conclusão forte. Isso requer fortes evidências na forma de uma diferença observada que é grande demais para ser explicada apenas pelo acaso. Deixar de rejeitar a hipótese nula – que os resultados são explicáveis apenas pelo acaso – é uma conclusão fraca porque permite que outros fatores além do acaso possam estar em ação, mas podem não ser fortes o suficiente para serem detectados pelo teste estatístico usado.
Importante
Os analistas procuram rejeitar a hipótese nula para descartar apenas o acaso como explicação para os fenômenos de interesse.
Exemplos de uma hipótese nula
Aqui está um exemplo simples. Uma diretora de escola afirma que os alunos de sua escola têm uma média de 7 pontos em 10 nos exames. A hipótese nula é que a média da população é 7,0. Para testar essa hipótese nula, registramos marcas de, digamos, 30 alunos (amostra) de toda a população de alunos da escola (digamos 300) e calculamos a média dessa amostra.
Podemos então comparar a média da amostra (calculada) com a média da população (hipotética) de 7,0 e tentar rejeitar a hipótese nula. (A hipótese nula aqui – que a média da população é 7,0 – não pode ser provada usando os dados da amostra; ela só pode ser rejeitada.)
Veja outro exemplo: o retorno anual de um determinado fundo mútuo é de 8%. Suponha que um fundo mútuo exista há 20 anos. A hipótese nula é que o retorno médio é de 8% para o fundo mútuo. Pegamos uma amostra aleatória dos retornos anuais do fundo mútuo por, digamos, cinco anos (amostra) e calculamos a média da amostra. Em seguida, comparamos a média da amostra (calculada) com a média da população (reivindicada) (8%) para testar a hipótese nula.
Para os exemplos acima, as hipóteses nulas são:
- Exemplo A: Os alunos da escola têm uma média de 7 pontos em 10 nos exames.
- Exemplo B: O retorno médio anual do fundo mútuo é de 8% ao ano.
Para fins de determinar se a hipótese nula deve ser rejeitada, a hipótese nula (abreviada como H 0 ) é assumida, para fins de argumentação, como verdadeira. Em seguida, a faixa provável de valores possíveis da estatística calculada (por exemplo, a pontuação média em testes de 30 alunos) é determinada sob esta presunção (por exemplo, a faixa de médias plausíveis pode variar de 6,2 a 7,8 se a média da população for 7,0). Então, se a média da amostra estiver fora dessa faixa, a hipótese nula é rejeitada. Caso contrário, diz-se que a diferença é “explicável apenas pelo acaso”, estando dentro da faixa que é determinada apenas pelo acaso.
Um ponto importante a observar é que estamos testando a hipótese nula porque há um elemento de dúvida sobre sua validade. Qualquer informação que seja contra a hipótese nula declarada é capturada na hipótese alternativa (H 1 ). Para os exemplos acima, a hipótese alternativa seria:
- Os alunos obtêm uma média que não é igual a 7.
- O retorno médio anual do fundo mútuo não é igual a 8% ao ano.
Em outras palavras, a hipótese alternativa é uma contradição direta da hipótese nula.
Teste de Hipóteses para Investimentos
Como um exemplo relacionado aos mercados financeiros, suponha que Alice veja que sua estratégia de investimento produz retornos médios mais elevados do que simplesmente comprar e manter uma ação. A hipótese nula afirma que não há diferença entre os dois retornos médios, e Alice tende a acreditar nisso até que possa concluir resultados contraditórios.
Refutar a hipótese nula exigiria mostrar significância estatística, que pode ser encontrada usando uma variedade de testes. A hipótese alternativa afirmaria que a estratégia de investimento tem um retorno médio mais alto do que uma estratégia tradicional de compra e manutenção.
Uma ferramenta que pode ser usada para determinar a significância estatística dos resultados é o valor p. Um valor p representa a probabilidade de que uma diferença tão grande ou maior do que a diferença observada entre os dois retornos médios possa ocorrer apenas por acaso.
Um valor de p menor ou igual a 0,05 é freqüentemente usado para indicar se há evidência contra a hipótese nula. Se Alice realizar um desses testes, como um teste usando o modelo normal, resultando em uma diferença significativa entre seus retornos e os retornos de compra e manutenção (o valor p é menor ou igual a 0,05), ela pode então rejeite a hipótese nula e conclua a hipótese alternativa.