23 Junho 2021 3:42

Estatística Não Paramétrica

O que são estatísticas não paramétricas?

A estatística não paramétrica refere-se a um método estatístico no qual os dados não são considerados provenientes de modelos prescritos que são determinados por um pequeno número de parâmetros; exemplos de tais modelos incluem o modelo de distribuição normal e o modelo de regressão linear. As estatísticas não paramétricas às vezes usam dados ordinais, o que significa que não dependem de números, mas sim de uma classificação ou ordem de classificação. Por exemplo, uma pesquisa transmitindo as preferências do consumidor, variando de gostar a não gostar, seria considerada um dado ordinal.

Estatísticas não paramétricas incluem estatísticas descritivas não paramétricas, modelos estatísticos, inferência e testes estatísticos. A estrutura do modelo de modelos não paramétricos não é especificada a priori, mas, em vez disso, determinada a partir de dados. O termo não paramétrico não significa que tais modelos não tenham parâmetros, mas sim que o número e a natureza dos parâmetros são flexíveis e não fixados de antemão. Um histograma é um exemplo de estimativa não paramétrica de uma distribuição de probabilidade.

Principais vantagens

  • As estatísticas não paramétricas são fáceis de usar, mas não oferecem a precisão exata de outros modelos estatísticos.
  • Esse tipo de análise geralmente é mais adequado ao considerar a ordem de algo, onde mesmo que os dados numéricos sejam alterados, os resultados provavelmente permanecerão os mesmos.

Compreendendo as estatísticas não paramétricas

Em estatística, a estatística paramétrica inclui parâmetros como média, desvio padrão, correlação de Pearson, variância, etc. Esta forma de estatística usa os dados observados para estimar os parâmetros da distribuição. Nas estatísticas paramétricas, os dados são frequentemente assumidos como provenientes de uma distribuição normal com parâmetros desconhecidos μ (média da população) e σ2 (variância da população), que são estimados usando a média da amostra e a variância da amostra.



As estatísticas não paramétricas não fazem suposições sobre o tamanho da amostra ou se os dados observados são quantitativos.

As estatísticas não paramétricas não pressupõem que os dados sejam extraídos de uma distribuição normal. Em vez disso, a forma da distribuição é estimada sob esta forma de medição estatística. Embora existam muitas situações em que uma distribuição normal pode ser assumida, também existem alguns cenários em que o verdadeiro processo de geração de dados está longe da distribuição normal.

Exemplos de estatísticas não paramétricas

No primeiro exemplo, considere um analista financeiro que deseja estimar o valor em risco (VaR) de um investimento. O analista reúne dados de lucros de centenas de investimentos semelhantes em um horizonte de tempo semelhante. Em vez de presumir que os ganhos seguem uma distribuição normal, ela usa o histograma para estimar a distribuição de forma não paramétrica. O 5º percentil desse histograma fornece ao analista uma estimativa não paramétrica do VaR.

Para um segundo exemplo, considere um pesquisador diferente que deseja saber se a média de horas de sono está ligada à frequência com que alguém fica doente. Como muitas pessoas raramente adoecem, se é que adoecem, e outras ocasionalmente adoecem com muito mais frequência do que a maioria das outras, a distribuição da frequência da doença é claramente não normal, sendo distorcida para a direita e propensa a exceções. Assim, em vez de usar um método que assume uma distribuição normal para a frequência da doença, como é feito na análise de regressão clássica, por exemplo, o pesquisador decide usar um método não paramétrico, como a análise de regressão quantílica.

Considerações Especiais

As estatísticas não paramétricas ganharam valor devido à sua facilidade de uso. Conforme a necessidade de parâmetros é aliviada, os dados se tornam mais aplicáveis ​​a uma variedade maior de testes. Este tipo de estatística pode ser usado sem a média, tamanho da amostra, desvio padrão ou a estimativa de quaisquer outros parâmetros relacionados quando nenhuma dessas informações está disponível.

Como as estatísticas não paramétricas fazem menos suposições sobre os dados da amostra, sua aplicação é mais ampla em escopo do que as estatísticas paramétricas. Nos casos em que o teste paramétrico é mais apropriado, os métodos não paramétricos serão menos eficientes. Isso ocorre porque as estatísticas não paramétricas descartam algumas informações que estão disponíveis nos dados, ao contrário das estatísticas paramétricas.