Definição da estatística qui-quadrado (χ2) - KamilTaylan.blog
22 Junho 2021 17:48

Definição da estatística qui-quadrado (χ2)

O que é uma estatística qui-quadrado?

Uma estatística qui-quadrado ( χ 2 ) é um teste que mede como um modelo se compara aos dados reais observados. Os dados usados ​​no cálculo de uma estatística qui-quadrado devem ser aleatórios, brutos, mutuamente exclusivos, extraídos de variáveis ​​independentes e extraídos de uma amostra grande o suficiente. Por exemplo, os resultados do lançamento de uma moeda justa atendem a esses critérios.

Os testes de qui-quadrado são frequentemente usados ​​em testes de hipóteses. A estatística qui-quadrado compara o tamanho de quaisquer discrepâncias entre os resultados esperados e os resultados reais, dado o tamanho da amostra e o número de variáveis ​​na relação. Para esses testes, graus de liberdade são utilizados para determinar se uma determinada  hipótese nula  pode ser rejeitada com base no número total de variáveis ​​e amostras dentro do experimento. Como acontece com qualquer estatística, quanto maior o tamanho da amostra, mais confiáveis ​​são os resultados.

Principais vantagens

  • Uma estatística qui-quadrado ( χ 2 ) é uma medida da diferença entre as frequências observadas e esperadas dos resultados de um conjunto de eventos ou variáveis.
  • χ 2 depende do tamanho da diferença entre os valores reais e observados, os graus de liberdade e o tamanho das amostras.
  • χ 2 pode ser usado para testar se duas variáveis ​​estão relacionadas ou independentes uma da outra ou para testar a qualidade do ajuste entre uma distribuição observada e uma distribuição teórica de frequências.

A Fórmula do Qui-Quadrado é

O que uma estatística de qui-quadrado diz a você?

Existem dois tipos principais de testes de qui-quadrado: o teste de independência, que faz uma questão de relacionamento, como, por exemplo, “Existe uma relação entre o sexo do aluno e a escolha do curso?”; e o  teste de adequação, que pergunta algo como “Quão bem a moeda em minha mão combina com uma moeda teoricamente justa?”

Independência

Ao considerar o sexo do aluno e a escolha do curso, um teste χ 2 para independência pode ser usado. Para fazer este teste, o pesquisador iria coletar dados sobre as duas variáveis ​​escolhidas (sexo e cursos escolhidos) e, em seguida, comparar as frequências com que os alunos do sexo masculino e feminino selecionam entre as aulas oferecidas usando a fórmula fornecida acima e uma tabela estatística χ 2.

Se não houver relação entre sexo e seleção de curso (ou seja, se eles forem independentes), então as frequências reais em que os alunos do sexo masculino e feminino selecionam cada curso oferecido devem ser aproximadamente iguais, ou inversamente, a proporção de alunos do sexo masculino e feminino alunos do sexo feminino em qualquer curso selecionado devem ser aproximadamente iguais à proporção de alunos do sexo masculino e feminino na amostra. Um teste de χ 2 para independência pode nos dizer quão provável é que o acaso aleatório possa explicar qualquer diferença observada entre as frequências reais nos dados e essas expectativas teóricas.

Qualidade de ajuste

χ 2 fornece uma maneira de testar o quão bem uma amostra de dados corresponde às características (conhecidas ou presumidas) da população maior que a amostra pretende representar. Se os dados da amostra não se ajustam às propriedades esperadas da população em que estamos interessados, não gostaríamos de usar essa amostra para tirar conclusões sobre a população maior.

Por exemplo, considere uma moeda imaginária com exatamente 50/50 de chance de dar cara ou coroa e uma moeda real que você joga 100 vezes. Se esta moeda real tiver um é justo, então também terá uma probabilidade igual de cair em ambos os lados, e o resultado esperado de jogar a moeda 100 vezes é que cara sairá 50 vezes e coroa 50 vezes. Nesse caso, χ 2 pode nos dizer quão bem os resultados reais de 100 lançamentos de moeda se comparam ao modelo teórico de que uma moeda justa dará resultados 50/50. O lance real pode ser 50/50, 60/40 ou mesmo 90/10. Quanto mais longe os resultados reais dos 100 lançamentos estiverem de 50/50, menos bom será o ajuste desse conjunto de lançamentos à expectativa teórica de 50/50 e mais provavelmente poderemos concluir que esta moeda não é realmente justa moeda.