23 Junho 2021 8:29

Definição de Distribuição T

O que é uma distribuição T?

A distribuição T, também conhecida como distribuição t de Student, é um tipo de distribuição de probabilidade semelhante à distribuição normal com sua forma de sino, mas tem caudas mais pesadas. As distribuições T têm uma chance maior de valores extremos do que as distribuições normais, daí as caudas mais grossas.

Principais vantagens

  • A distribuição T é uma distribuição de probabilidade contínua do z-score quando o desvio padrão estimado é usado no denominador em vez do verdadeiro desvio padrão.
  • A distribuição T, assim como a distribuição normal, é em forma de sino e simétrica, mas tem caudas mais pesadas, o que significa que tende a produzir valores que caem longe de sua média.
  • Os testes T são usados ​​em estatísticas para estimar a significância.

O que uma distribuição T lhe diz? 

O peso da cauda é determinado por um parâmetro da distribuição T denominado graus de liberdade, com valores menores resultando em caudas mais pesadas e com valores mais altos fazendo com que a distribuição T se assemelhe a uma distribuição normal padrão com uma média de 0 e um desvio padrão de 1. O A distribuição T também é conhecida como “Distribuição T do Aluno”.

Quando uma amostra de n observações é retirada de uma população normalmente distribuída com média M e desvio padrão D, a média da amostra, m, e o desvio padrão da amostra, d, serão diferentes de M e D devido à aleatoriedade da amostra.

Um z-score pode ser calculado com o desvio padrão da população como Z = (x – M) / D, e este valor tem a distribuição normal com média 0 e desvio padrão 1. Mas ao usar o desvio padrão estimado, um t-score é calculado como T = (m – M) / {d / sqrt (n)}, a diferença entre d e D torna a distribuição uma distribuição T com (n – 1) graus de liberdade em vez da distribuição normal com média 0 e desvio padrão 1. 

Exemplo de como usar uma distribuição T

Veja o seguinte exemplo de como as distribuições t são utilizadas na análise estatística. Primeiro, lembre-se de que um intervalo de confiança para a média é um intervalo de valores, calculado a partir dos dados, com o objetivo de capturar uma média da “população”. Este intervalo é m + – t * d / sqrt (n), onde t é um valor crítico da distribuição T.

Por exemplo, um intervalo de confiança de 95% para o retorno médio da Dow Jones Industrial Average nos 27 dias de negociação anteriores a 11/9/2001 é -0,33%, (+/- 2,055) * 1,07 / sqrt (27), dando um retorno médio (persistente) como algum número entre -0,75% e + 0,09%. O número 2.055, a quantidade de erros padrão pelos quais ajustar, é encontrado na distribuição T.

Como a distribuição T tem caudas mais grossas do que uma distribuição normal, ela pode ser usada como um modelo para retornos financeiros que exibem curtose excessiva, o que permitirá um cálculo mais realista do Valor em Risco ( VaR ) em tais casos.

A diferença entre uma distribuição T e uma distribuição normal 

As distribuições normais são usadas quando a distribuição da população é considerada normal. A distribuição T é semelhante à distribuição normal, apenas com caudas mais grossas. Ambos assumem uma população normalmente distribuída. As distribuições T têm curtose mais alta do que as distribuições normais. A probabilidade de obter valores muito distantes da média é maior com uma distribuição T do que com uma distribuição normal.

Limitações do uso de uma distribuição T 

A distribuição T pode distorcer a exatidão em relação à distribuição normal. Sua deficiência só surge quando há necessidade de uma normalidade perfeita. No entanto, a diferença entre usar uma distribuição normal e uma distribuição T é relativamente pequena.