23 Junho 2021 3:08

Multicolinearidade

O que é multicolinearidade?

Multicolinearidade é a ocorrência de altas intercorrelações entre duas ou mais variáveis ​​independentes em um modelo de regressão múltipla. A multicolinearidade pode levar a resultados distorcidos ou enganosos quando um pesquisador ou analista tenta determinar quão bem cada variável independente pode ser usada de forma mais eficaz para prever ou compreender a variável dependente em um modelo estatístico.

Em geral, a multicolinearidade pode levar a intervalos de confiança mais amplos que produzem probabilidades menos confiáveis ​​em termos do efeito das variáveis ​​independentes em um modelo. Ou seja, as inferências estatísticas de um modelo com multicolinearidade podem não ser confiáveis.

Principais vantagens

  • Multicolinearidade é um conceito estatístico onde as variáveis ​​independentes em um modelo são correlacionadas.
  • A multicolinearidade entre as variáveis ​​independentes resultará em inferências estatísticas menos confiáveis.
  • É melhor usar variáveis ​​independentes que não são correlacionadas ou repetitivas ao construir modelos de regressão múltipla que usam duas ou mais variáveis.

Compreendendo a multicolinearidade

Os analistas estatísticos usam vários modelos de regressão para prever o valor de uma variável dependente especificada com base nos valores de duas ou mais variáveis ​​independentes. A variável dependente às vezes é chamada de variável de resultado, objetivo ou critério.

Um exemplo é um modelo de regressão multivariado que tenta antecipar os retornos das ações com base em itens como relações preço / lucro ( relações P / L), capitalização de mercado, desempenho anterior ou outros dados. O retorno das ações é a variável dependente e os vários bits de dados financeiros são as variáveis ​​independentes.

A multicolinearidade em um modelo de regressão múltipla indica que as variáveis ​​independentes colineares estão relacionadas de alguma forma, embora a relação possa ou não ser casual. Por exemplo, o desempenho anterior pode estar relacionado à capitalização de mercado, pois as ações que tiveram um bom desempenho no passado terão valores de mercado crescentes. Em outras palavras, a multicolinearidade pode existir quando duas variáveis ​​independentes são altamente correlacionadas. Também pode acontecer se uma variável independente for calculada a partir de outras variáveis ​​no conjunto de dados ou se duas variáveis ​​independentes fornecerem resultados semelhantes e repetitivos.

Uma das maneiras mais comuns de eliminar o problema da multicolinearidade é primeiro identificar as variáveis ​​independentes colineares e, em seguida, remover todas, exceto uma. Também é possível eliminar a multicolinearidade combinando duas ou mais variáveis ​​colineares em uma única variável. A análise estatística pode então ser conduzida para estudar a relação entre a variável dependente especificada e apenas uma única variável independente.

Exemplo de multicolinearidade

Para investir, a multicolinearidade é uma consideração comum ao realizar análises técnicas para prever os movimentos de preços futuros prováveis ​​de um título, como uma ação ou commodity futura.

Os analistas de mercado desejam evitar o uso de indicadores técnicos colineares, pois se baseiam em dados muito semelhantes ou relacionados; eles tendem a revelar previsões semelhantes em relação à variável dependente do movimento dos preços. Em vez disso, a análise de mercado deve ser baseada em variáveis ​​independentes marcadamente diferentes para garantir que elas analisem o mercado de diferentes pontos de vista analíticos independentes.



Um exemplo de um problema potencial de multicolinearidade é a realização de análises técnicas usando apenas vários indicadores semelhantes.

O notável analista técnico John Bollinger, criador do indicador Bollinger Bands, observa que “uma regra fundamental para o uso bem-sucedido da análise técnica requer evitar a multicolinearidade em meio aos indicadores”. Para resolver o problema, os analistas evitam usar dois ou mais indicadores técnicos do mesmo tipo. Em vez disso, eles analisam um título usando um tipo de indicador, como um indicador de momentum, e então fazem uma análise separada usando um tipo diferente de indicador, como um indicador de tendência.

Por exemplo, estocástico, o índice de força relativa (RSI) e Williams% R são todos indicadores de momentum que dependem de entradas semelhantes e provavelmente produzirão resultados semelhantes. Nesse caso, é melhor remover todos menos um dos indicadores ou encontrar uma maneira de mesclar vários deles em apenas um indicador, ao mesmo tempo que adiciona um indicador de tendência que provavelmente não será altamente correlacionado com o indicador de momentum.