Regra empírica
Qual é a regra empírica?
A regra empírica, também conhecida como regra de três sigma ou regra de 68-95-99,7, é uma regra estatística que afirma que, para uma distribuição normal, quase todos os dados observados cairão dentro de três desvios padrão (denotados por σ) do média ou média (denotada por µ).
Em particular, a regra empírica prevê que 68% das observações caem no primeiro desvio padrão (µ ± σ), 95% nos primeiros dois desvios padrão (µ ± 2σ) e 99,7% nos três primeiros desvios padrão (µ ± 3σ).
Principais vantagens
- A regra empírica afirma que 99,7% dos dados observados seguindo uma distribuição normal estão dentro de 3 desvios padrão da média.
- Sob esta regra, 68% dos dados estão dentro de um desvio padrão, 95% por cento dentro de dois desvios padrão e 99,7% dentro de três desvios padrão da média.
- Os limites de três sigma que seguem a regra empírica são usados para definir os limites de controle superior e inferior em gráficos de controle de qualidade estatísticos e em análises de risco, como VaR.
Compreendendo a regra empírica
A regra empírica é freqüentemente usada em estatísticas para prever resultados finais. Depois de calcular o desvio padrão e antes de coletar dados exatos, esta regra pode ser usada como uma estimativa aproximada do resultado dos dados iminentes a serem coletados e analisados.
Essa distribuição de probabilidade pode, portanto, ser usada como uma heurística provisória, pois a coleta dos dados apropriados pode ser demorada ou mesmo impossível em alguns casos. Essas considerações entram em jogo quando uma empresa está revisando suas medidas de controle de qualidade ou avaliando sua exposição ao risco. Por exemplo, a ferramenta de risco popularmente usada, conhecida como valor em risco (VaR), pressupõe que a probabilidade de eventos de risco segue uma distribuição normal.
A regra empírica também é usada como uma forma aproximada de testar a “normalidade” de uma distribuição. Se muitos pontos de dados ficarem fora dos três limites de desvio padrão, isso sugere que a distribuição não é normal e pode, em vez disso, ser distorcida ou seguir alguma outra distribuição.
As regras empíricas também são conhecidas como regra de três sigma, pois “três sigma” se refere a uma distribuição estatística de dados dentro de três desvios padrão da média em uma distribuição normal ( curva de sino ), conforme indicado pela figura abaixo.
Exemplos da regra empírica
Vamos supor que uma população de animais em um zoológico seja normalmente distribuída. Cada animal vive em média 13,1 anos (média), e o desvio padrão da expectativa de vida é 1,5 anos. Se alguém quiser saber a probabilidade de um animal viver mais de 14,6 anos, pode usar a regra empírica. Sabendo que a média da distribuição é de 13,1 anos, as seguintes faixas de idade ocorrem para cada desvio padrão:
- Um desvio padrão (µ ± σ): (13,1 – 1,5) a (13,1 + 1,5), ou 11,6 a 14,6
- Dois desvios padrão (µ ± 2σ): 13,1 – (2 x 1,5) a 13,1 + (2 x 1,5), ou 10,1 a 16,1
- Três desvios padrão (µ ± 3σ): 13,1 – (3 x 1,5) a 13,1 + (3 x 1,5), ou, 8,6 a 17,6
A pessoa que resolve esse problema precisa calcular a probabilidade total de o animal viver 14,6 anos ou mais. A regra empírica mostra que 68% da distribuição encontra-se dentro de um desvio padrão, neste caso, de 11,6 a 14,6 anos. Portanto, os 32% restantes da distribuição encontram-se fora dessa faixa. Metade encontra-se acima de 14,6 e a outra metade abaixo de 11,6. Portanto, a probabilidade de o animal viver por mais de 14,6 é de 16% (calculado como 32% dividido por dois).
Como outro exemplo, suponha que um animal no zoológico viva em média até 10 anos de idade, com um desvio padrão de 1,4 anos. Suponha que o tratador tente descobrir a probabilidade de um animal viver por mais de 7,2 anos. Esta distribuição é a seguinte:
- Um desvio padrão (µ ± σ): 8,6 a 11,4 anos
- Dois desvios padrão (µ ± 2σ): 7,2 a 12,8 anos
- Três desvios padrão ((µ ± 3σ): 5,8 a 14,2 anos