Intervalo de confiança - KamilTaylan.blog
22 Junho 2021 18:23

Intervalo de confiança

O que é intervalo de confiança?

Um intervalo de confiança, em estatística, refere-se à probabilidade de que um parâmetro da população caia entre um conjunto de valores por uma determinada proporção de vezes.

Principais vantagens

  • Um intervalo de confiança exibe a probabilidade de que um parâmetro caia entre um par de valores em torno da média.
  • Os intervalos de confiança medem o grau de incerteza ou certeza em um método de amostragem.
  • Eles são mais frequentemente construídos com níveis de confiança de 95% ou 99%.

Compreendendo o intervalo de confiança

Os intervalos de confiança medem o grau de incerteza ou certeza em um método de amostragem. Eles podem assumir qualquer número de limites de probabilidade, sendo o mais comum um nível de confiança de 95% ou 99%. Os intervalos de confiança são conduzidos usando métodos estatísticos, como um  teste t.

Os estatísticos usam intervalos de confiança para medir a incerteza em uma variável de amostra. Por exemplo, um pesquisador seleciona diferentes amostras aleatoriamente da mesma população e calcula um intervalo de confiança para cada amostra para ver como ela pode representar o verdadeiro valor da variável populacional. Os conjuntos de dados resultantes são todos diferentes; alguns intervalos incluem o verdadeiro parâmetro da população e outros não.

Um intervalo de confiança é um intervalo de valores, limitado acima e abaixo da média da estatística, que provavelmente conteria um parâmetro desconhecido da população. O nível de confiança se refere à porcentagem de probabilidade, ou certeza, de que o intervalo de confiança conteria o verdadeiro parâmetro da população quando você desenha uma amostra aleatória muitas vezes. Ou, no vernáculo, “temos 99% de certeza ( nível de confiança) de que a maioria dessas amostras (intervalos de confiança) contém o verdadeiro parâmetro populacional”.

O maior equívoco em relação aos intervalos de confiança é que eles representam a porcentagem de dados de uma determinada amostra que fica entre os limites superior e inferior. Por exemplo, pode-se interpretar erroneamente o referido intervalo de confiança de 99% de 70 a 78 polegadas como uma indicação de que 99% dos dados em uma amostra aleatória estão entre esses números. Isso é incorreto, embora exista um método separado de análise estatística para fazer tal determinação. Fazer isso envolve identificar a média e o desvio padrão da amostra e traçar esses números em uma curva em forma de sino.



O intervalo de confiança e o nível de confiança estão inter-relacionados, mas não são exatamente os mesmos.

Calculando o intervalo de confiança

Suponha que um grupo de pesquisadores esteja estudando a altura de jogadores de basquete do ensino médio. Os pesquisadores pegam uma amostra aleatória da população e estabelecem uma altura média de 74 polegadas.

A média de 74 polegadas é uma estimativa pontual da média da população. Uma estimativa pontual por si só tem utilidade limitada porque não revela a incerteza associada à estimativa; você não tem uma boa noção de quão longe esta média da amostra de 74 polegadas pode estar da média da população. O que está faltando é o grau de incerteza nesta amostra única.

Os intervalos de confiança fornecem mais informações do que as estimativas pontuais. Ao estabelecer um intervalo de confiança de 95% usando a média e o desvio padrão da amostra, e assumindo uma distribuição normal representada pela curva do sino, os pesquisadores chegam a um limite superior e inferior que contém a média verdadeira 95% do tempo.

Suponha que o intervalo seja entre 72 polegadas e 76 polegadas. Se os pesquisadores pegarem 100 amostras aleatórias da população de jogadores de basquete do ensino médio como um todo, a média deve ficar entre 72 e 76 polegadas em 95 dessas amostras.

Se os pesquisadores quiserem ainda mais confiança, eles podem expandir o intervalo para 99% de confiança. Fazer isso invariavelmente cria um intervalo mais amplo, pois abre espaço para um número maior de médias de amostra. Se eles estabelecerem o intervalo de confiança de 99% entre 70 polegadas e 78 polegadas, eles podem esperar que 99 das 100 amostras avaliadas contenham um valor médio entre esses números.

 Um nível de confiança de 90%, por outro lado, implica que esperaríamos que 90% das estimativas de intervalo incluíssem o parâmetro da população e assim por diante.

perguntas frequentes

O que um intervalo de confiança revela?

Um intervalo de confiança é um intervalo de valores, limitado acima e abaixo da média da estatística, que provavelmente conteria um parâmetro de população desconhecido. O nível de confiança se refere à porcentagem de probabilidade, ou certeza, de que o intervalo de confiança conteria o verdadeiro parâmetro da população quando você desenha uma amostra aleatória muitas vezes.

Como os intervalos de confiança são usados?

Os estatísticos usam intervalos de confiança para medir a incerteza em uma variável de amostra. Por exemplo, um pesquisador seleciona diferentes amostras aleatoriamente da mesma população e calcula um intervalo de confiança para cada amostra para ver como ela pode representar o verdadeiro valor da variável populacional. Os conjuntos de dados resultantes são todos diferentes, onde alguns intervalos incluem o parâmetro da população verdadeira e outros não.

O que é um equívoco comum sobre intervalos de confiança?

O maior equívoco em relação aos intervalos de confiança é que eles representam a porcentagem de dados de uma determinada amostra que fica entre os limites superior e inferior. Em outras palavras, seria incorreto supor que um intervalo de confiança de 99% significa que 99% dos dados em uma amostra aleatória estão entre esses limites. O que isso realmente significa é que podemos ter 99% de certeza de que o intervalo conterá a média da população.

O que é um teste T?

Os intervalos de confiança são conduzidos usando métodos estatísticos, como um teste t. Um teste t é um tipo de estatística inferencial usada para determinar se há uma diferença significativa entre as médias de dois grupos, que podem estar relacionadas em certas características. O cálculo de um teste t requer três valores-chave de dados. Eles incluem a diferença entre os valores médios de cada conjunto de dados (chamada de diferença média), o desvio padrão de cada grupo e o número de valores de dados de cada grupo.