23 Junho 2021 2:53

Regressão Linear Múltipla (MLR)

O que é regressão linear múltipla (MLR)?

A regressão linear múltipla (MLR), também conhecida simplesmente como regressão múltipla, é uma técnica estatística que usa várias variáveis ​​explicativas para prever o resultado de uma variável de resposta. O objetivo da regressão linear múltipla (MLR) é modelar a relação linear entre as variáveis ​​explicativas (independentes) e a variável de resposta (dependente).

Em essência, a regressão múltipla é a extensão do comum dos mínimos quadrados (OLS) regressão, pois envolve mais de uma variável explicativa.

Principais vantagens

  • A regressão linear múltipla (MLR), também conhecida simplesmente como regressão múltipla, é uma técnica estatística que usa várias variáveis ​​explicativas para prever o resultado de uma variável de resposta.
  • A regressão múltipla é uma extensão da regressão linear (OLS) que usa apenas uma variável explicativa.
  • MLR é amplamente utilizado em econometria e inferência financeira.

Fórmula e cálculo de regressão linear múltipla

O que a regressão linear múltipla pode lhe dizer

A regressão linear simples é uma função que permite a um analista ou estatístico fazer previsões sobre uma variável com base nas informações conhecidas sobre outra variável. A regressão linear só pode ser usada quando se tem duas variáveis ​​contínuas – uma variável independente e uma variável dependente. A variável independente é o parâmetro usado para calcular a variável dependente ou resultado. Um modelo de regressão múltipla se estende a várias variáveis ​​explicativas.

O modelo de regressão múltipla é baseado nas seguintes suposições:

  • Existe uma relação linear entre as variáveis ​​dependentes e as variáveis ​​independentes
  • As variáveis ​​independentes não são altamente correlacionadas entre si
  • y i observações são selecionadas de forma independente e aleatória da população
  • Os resíduos devem ser normalmente distribuídos com uma média de 0 e variância σ

O coeficiente de determinação (R-quadrado) é uma métrica estatística usada para medir o quanto da variação no resultado pode ser explicado pela variação nas variáveis ​​independentes. R 2 sempre aumenta à medida que mais preditores são adicionados ao modelo MLR, mesmo que os preditores possam não estar relacionados à variável de resultado.

Portanto, oR2 por si só não pode ser usado para identificar quais preditores devem ser incluídos em um modelo e quais devem ser excluídos. R2 só pode estar entre 0 e 1, onde 0 indica que o resultado não pode ser previsto por nenhuma das variáveis ​​independentes e 1 indica que o resultado pode ser previsto sem erro das variáveis ​​independentes.

Ao interpretar os resultados da regressão múltipla, os coeficientes beta são válidos enquanto mantêm todas as outras variáveis ​​constantes (“todo o resto igual”). A saída de uma regressão múltipla pode ser exibida horizontalmente como uma equação ou verticalmente em forma de tabela.

Exemplo de como usar a regressão linear múltipla

Por exemplo, um analista pode querer saber como o movimento do mercado afeta o preço da ExxonMobil (XOM). Nesse caso, sua equação linear terá o valor do índice S&P 500 como variável independente, ou preditor, e o preço de XOM como variável dependente.

Na realidade, existem vários fatores que predizem o resultado de um evento. O movimento de preços da ExxonMobil, por exemplo, depende de mais do que apenas o desempenho do mercado geral. Outros preditores, como o preço do petróleo, as taxas de juros e o movimento dos preços dos futuros do petróleo, podem afetar o preço do XOM e os preços das ações de outras empresas petrolíferas. Para entender um relacionamento no qual mais de duas variáveis ​​estão presentes, a regressão linear múltipla é usada.

A regressão linear múltipla (MLR) é usada para determinar uma relação matemática entre várias variáveis ​​aleatórias. Em outros termos, o MLR examina como várias variáveis ​​independentes estão relacionadas a uma variável dependente. Uma vez que cada um dos fatores independentes foi determinado para prever a variável dependente, as informações sobre as variáveis ​​múltiplas podem ser usadas para criar uma previsão precisa sobre o nível de efeito que elas têm na variável de resultado. O modelo cria um relacionamento na forma de uma linha reta (linear) que melhor se aproxima de todos os pontos de dados individuais.

Referindo-se à equação MLR acima, em nosso exemplo:

  • y i = variável dependente – o preço de XOM
  • x i1 = taxas de juros
  • x i2 = preço do petróleo
  • x i3 = valor do índice S&P 500
  • x i4 = preço do petróleo futuro
  • B 0 = interceptação y no tempo zero
  • B 1 = coeficiente de regressão que mede uma mudança de unidade na variável dependente quando x i1 muda – a mudança no preço de XOM quando as taxas de juros mudam
  • B 2 = valor do coeficiente que mede uma mudança de unidade na variável dependente quando x i2 muda – a mudança no preço de XOM quando os preços do petróleo mudam

As estimativas de mínimos quadrados, B 0, B 1, B 2 … B p, são normalmente calculadas por software estatístico. Muitas variáveis ​​podem ser incluídas no modelo de regressão em que cada variável independente é diferenciada com um número – 1,2, 3, 4… p. O modelo de regressão múltipla permite que um analista preveja um resultado com base nas informações fornecidas em várias variáveis ​​explicativas.

Ainda assim, o modelo nem sempre é perfeitamente preciso, pois cada ponto de dados pode ser ligeiramente diferente do resultado previsto pelo modelo. O valor residual, E, que é a diferença entre o resultado real e o resultado previsto, é incluído no modelo para contabilizar essas pequenas variações.

Supondo que executemos nosso modelo de regressão de preços XOM por meio de um software de computação estatística, que retorna esta saída:

Um analista interpretaria esta saída como significando que se outras variáveis ​​forem mantidas constantes, o preço do XOM aumentará 7,8% se o preço do petróleo nos mercados aumentar 1%. O modelo também mostra que o preço do XOM diminuirá 1,5% após um aumento de 1% nas taxas de juros. R 2 indica que 86,5% das variações no preço das ações da Exxon Mobil podem ser explicadas por mudanças na taxa de juros, preço do petróleo, futuros de petróleo e índice S&P 500.

A diferença entre regressão linear e múltipla

A regressão de quadrados lineares ordinários (OLS) compara a resposta de uma variável dependente dada uma mudança em algumas variáveis ​​explicativas. No entanto, é raro que uma variável dependente seja explicada por apenas uma variável. Nesse caso, um analista usa regressão múltipla, que tenta explicar uma variável dependente usando mais de uma variável independente. As regressões múltiplas podem ser lineares e não lineares.

As regressões múltiplas baseiam-se no pressuposto de que existe uma relação linear entre as variáveis ​​dependentes e independentes. Também não assume nenhuma correlação significativa entre as variáveis ​​independentes.

perguntas frequentes

O que torna uma regressão múltipla ‘múltipla’?

Uma regressão múltipla considera o efeito de mais de uma variável explicativa em algum resultado de interesse. Ele avalia o efeito relativo dessas variáveis ​​explicativas, ou independentes, na variável dependente ao manter todas as outras variáveis ​​no modelo constante.

Por que alguém usaria uma regressão múltipla sobre uma regressão OLS simples?

É raro que uma variável dependente seja explicada por apenas uma variável. Nesses casos, um analista usa regressão múltipla, que tenta explicar uma variável dependente usando mais de uma variável independente. O modelo, entretanto, assume que não há correlações importantes entre as variáveis ​​independentes.

Posso fazer uma regressão múltipla manualmente?

Provavelmente não. Modelos de regressão múltipla são complexos e se tornam ainda mais complexos quando há mais variáveis ​​incluídas no modelo ou quando a quantidade de dados a analisar aumenta. Para executar uma regressão múltipla, você provavelmente precisará usar um software estatístico especializado ou funções em programas de negócios como o Excel.

O que significa uma regressão múltipla ser “linear”?

Em uma regressão linear múltipla, o modelo calcula a linha de melhor ajuste que minimiza as variâncias de cada uma das variáveis ​​incluídas no que se refere à variável dependente. Por se ajustar a uma linha, é um modelo linear. Existem também modelos de regressão não linear envolvendo múltiplas variáveis, como regressão logística, regressão quadrática e modelos probit.

Como os modelos de regressão múltipla são usados ​​em finanças?

Qualquer modelo econométrico que olhe para mais de uma variável pode ser uma regressão múltipla. Os modelos de fator, por exemplo, comparam dois ou mais fatores para analisar as relações entre as variáveis ​​e o desempenho resultante. O Mod de três fatores de Fama e French é um modelo que expande o modelo de precificação de ativos de capital (CAPM) adicionando fatores de risco de tamanho e valor ao fator de risco de mercado no CAPM (que é um modelo de regressão). Ao incluir esses dois fatores adicionais, o modelo se ajusta a essa tendência de desempenho superior, que se acredita torná-lo uma ferramenta melhor para avaliar o desempenho do gerente.