23 Junho 2021 3:45
Qual é a distribuição normal?
A fórmula de distribuição normal é baseada em dois parâmetros simples – média e desvio padrão – que quantificam as características de um determinado conjunto de dados.
Enquanto a média indica o valor “central” ou médio de todo o conjunto de dados, o desvio padrão indica a “dispersão” ou variação dos pontos de dados em torno desse valor médio.
Principais vantagens
- A fórmula de distribuição normal é baseada em dois parâmetros simples – média e desvio padrão – que quantificam as características de um determinado conjunto de dados.
- Para facilitar um método padrão uniforme para cálculos fáceis e aplicabilidade a problemas do mundo real, a conversão padrão para valores Z foi introduzida, que faz parte da Tabela de Distribuição Normal.
- As propriedades de uma distribuição normal incluem: a curva normal é simétrica em relação à média; a média está no meio e divide a área em metades; a área total sob a curva é igual a 1 para média = 0 e stdev = 1; e a distribuição é completamente descrita por sua média e stddev.
- As tabelas de distribuição normal são usadas na negociação de títulos para ajudar a identificar tendências de alta ou baixa, níveis de suporte ou resistência e outros indicadores técnicos.
Exemplo de distribuição normal
Considere os 2 conjuntos de dados a seguir:
- Conjunto de dados 1 = {10, 10, 10, 10, 10, 10, 10, 10, 10, 10}
- Conjunto de dados 2 = {6, 8, 10, 12, 14, 14, 12, 10, 8, 6}
Para Dataset1, média = 10 e desvio padrão (stddev) = 0
Para o conjunto de dados 2, média = 10 e desvio padrão (desvio padrão) = 2,83
Vamos plotar esses valores para DataSet1:
Da mesma forma para DataSet2:
A linha horizontal vermelha em ambos os gráficos acima indica a “média” ou valor médio de cada conjunto de dados (10 em ambos os casos). As setas rosa no segundo gráfico indicam a dispersão ou variação dos valores dos dados do valor médio. Isso é representado pelo valor de desvio padrão de 2,83 no caso de DataSet2. Como DataSet1 tem todos os valores iguais (como 10 cada) e nenhuma variação, o valor stddev é zero e, portanto, nenhuma seta rosa é aplicável.
O valor stddev tem algumas características significativas e úteis que são extremamente úteis na análise de dados. Para uma distribuição normal, os valores dos dados são distribuídos simetricamente em ambos os lados da média. Para qualquer conjunto de dados normalmente distribuído, gráfico de plotagem com stddev no eixo horizontal e número de valores de dados no eixo vertical, o gráfico a seguir é obtido.
Propriedades de uma distribuição normal
- A curva normal é simétrica em relação à média;
- A média está no meio e divide a área em duas metades;
- A área total sob a curva é igual a 1 para média = 0 e stdev = 1;
- A distribuição é completamente descrita por sua média e stddev
Como pode ser visto no gráfico acima, stddev representa o seguinte:
- 68,3% dos valores dos dados estão dentro de 1 desvio padrão da média (-1 a +1)
- 95,4% dos valores dos dados estão dentro de 2 desvios padrão da média (-2 a +2)
- 99,7% dos valores dos dados estão dentro de 3 desvios padrão da média (-3 a +3)
A área sob a curva em forma de sino, quando medida, indica a probabilidade desejada de um determinado intervalo:
- menor que X: por exemplo, probabilidade de valores de dados serem menores que 70
- maior que X: por exemplo, probabilidade de valores de dados serem maiores que 95
- entre X 1 e X 2 : por exemplo, probabilidade de valores de dados entre 65 e 85
onde X é um valor de interesse (exemplos abaixo).
Traçar e calcular a área nem sempre é conveniente, pois diferentes conjuntos de dados terão diferentes valores médios e desvios padrão. Para facilitar um método padrão uniforme para cálculos fáceis e aplicabilidade a problemas do mundo real, a conversão padrão para valores Z foi introduzida, que faz parte da Tabela de Distribuição Normal.
Z = (X – média) / stddev, onde X é a variável aleatória.
Basicamente, essa conversão força a média e o desvio padrão a serem padronizados em 0 e 1 respectivamente, o que permite que um conjunto definido de valores Z (da Tabela de distribuição normal ) seja usado para cálculos fáceis. Um instantâneo da tabela de valor z padrão contendo valores de probabilidade é o seguinte:
Para encontrar a probabilidade relacionada ao valor z de 0,239865, primeiro arredonde para 2 casas decimais (ou seja, 0,24). Em seguida, verifique os primeiros 2 dígitos significativos (0,2) nas linhas e o dígito menos significativo (0,04 restantes) na coluna. Isso resultará em um valor de 0,09483.
A tabela de distribuição normal completa, com precisão de até 5 casas decimais para valores de probabilidade (incluindo aqueles para valores negativos), pode ser encontrada aqui.
Vamos ver alguns exemplos da vida real. A altura dos indivíduos em um grande grupo segue um padrão de distribuição normal. Suponha que temos um conjunto de 100 indivíduos cujas alturas são registradas e a média e o desvio padrão são calculados em 66 e 6 polegadas, respectivamente.
Aqui estão alguns exemplos de perguntas que podem ser facilmente respondidas usando a tabela de valor z:
Qual é a probabilidade de uma pessoa do grupo ter 70 polegadas ou menos?
A questão é encontrar o valor cumulativo de P (X <= 70), ou seja, em todo o conjunto de dados de 100, quantos valores estarão entre 0 e 70.
Vamos primeiro converter o valor X de 70 no valor Z equivalente.
Z = (X – média) / desvio padrão = (70-66) / 6 = 4/6 = 0,666667 = 0,67 (arredondado para 2 casas decimais)
Agora precisamos encontrar P (Z <= 0,67) = 0. 24857 (da tabela z acima)
ou seja, há uma probabilidade de 24,857% de que um indivíduo no grupo seja menor ou igual a 70 polegadas.
Mas espere – o acima está incompleto. Lembre-se, estamos procurando a probabilidade de todas as alturas possíveis até 70, ou seja, de 0 a 70. O item acima apenas fornece a parte da média até o valor desejado (ou seja, 66 a 70). Precisamos incluir a outra metade – de 0 a 66 – para chegar à resposta correta.
Uma vez que 0 a 66 representa a metade da porção (ou seja, uma média extrema a intermediária), sua probabilidade é simplesmente 0,5.
Portanto, a probabilidade correta de uma pessoa ter 70 polegadas ou menos = 0,24857 + 0,5 = 0,74857 = 74,857%
Graficamente (calculando a área), essas são as duas regiões somadas que representam a solução:
Qual é a probabilidade de uma pessoa ter 75 polegadas ou mais?
ou seja, Encontre P cumulativo Complementar (X> = 75).
Z = (X – média) / desvio padrão = (75-66) / 6 = 9/6 = 1,5
P (Z> = 1,5) = 1- P (Z <= 1,5) = 1 – (0,5 + 0,43319) = 0,06681 = 6,681%
Qual é a probabilidade de uma pessoa ter entre 52 e 67 polegadas?
Encontre P (52 <= X <= 67).
P (52 <= X <= 67) = P [(52-66) / 6 <= Z <= (67-66) / 6] = P (-2,33 <= Z <= 0,17)
= P (Z <= 0,17) –P (Z <= -0,233) = (0,5 + 0,56749) – (0,40905) =
Esta tabela de distribuição normal (e valores z) normalmente encontra uso para quaisquer cálculos de probabilidade nos movimentos de preços esperados no mercado de ações para ações e índices. Eles são usados em negociações baseadas em faixa, identificando tendência de alta ou tendência de baixa, níveis de indicadores técnicos baseados em conceitos de distribuição normal de média e desvio padrão.