Regressão Linear Múltipla (MLR)
O que é regressão linear múltipla (MLR)?
A regressão linear múltipla (MLR), também conhecida simplesmente como regressão múltipla, é uma técnica estatística que usa várias variáveis explicativas para prever o resultado de uma variável de resposta. O objetivo da regressão linear múltipla (MLR) é modelar a relação linear entre as variáveis explicativas (independentes) e a variável de resposta (dependente).
Em essência, a regressão múltipla é a extensão do comum dos mínimos quadrados (OLS) regressão, pois envolve mais de uma variável explicativa.
Principais vantagens
- A regressão linear múltipla (MLR), também conhecida simplesmente como regressão múltipla, é uma técnica estatística que usa várias variáveis explicativas para prever o resultado de uma variável de resposta.
- A regressão múltipla é uma extensão da regressão linear (OLS) que usa apenas uma variável explicativa.
- MLR é amplamente utilizado em econometria e inferência financeira.
Fórmula e cálculo de regressão linear múltipla
O que a regressão linear múltipla pode lhe dizer
A regressão linear simples é uma função que permite a um analista ou estatístico fazer previsões sobre uma variável com base nas informações conhecidas sobre outra variável. A regressão linear só pode ser usada quando se tem duas variáveis contínuas – uma variável independente e uma variável dependente. A variável independente é o parâmetro usado para calcular a variável dependente ou resultado. Um modelo de regressão múltipla se estende a várias variáveis explicativas.
O modelo de regressão múltipla é baseado nas seguintes suposições:
- Existe uma relação linear entre as variáveis dependentes e as variáveis independentes
- As variáveis independentes não são altamente correlacionadas entre si
- y i observações são selecionadas de forma independente e aleatória da população
- Os resíduos devem ser normalmente distribuídos com uma média de 0 e variância σ
O coeficiente de determinação (R-quadrado) é uma métrica estatística usada para medir o quanto da variação no resultado pode ser explicado pela variação nas variáveis independentes. R 2 sempre aumenta à medida que mais preditores são adicionados ao modelo MLR, mesmo que os preditores possam não estar relacionados à variável de resultado.
Portanto, oR2 por si só não pode ser usado para identificar quais preditores devem ser incluídos em um modelo e quais devem ser excluídos. R2 só pode estar entre 0 e 1, onde 0 indica que o resultado não pode ser previsto por nenhuma das variáveis independentes e 1 indica que o resultado pode ser previsto sem erro das variáveis independentes.
Ao interpretar os resultados da regressão múltipla, os coeficientes beta são válidos enquanto mantêm todas as outras variáveis constantes (“todo o resto igual”). A saída de uma regressão múltipla pode ser exibida horizontalmente como uma equação ou verticalmente em forma de tabela.
Exemplo de como usar a regressão linear múltipla
Por exemplo, um analista pode querer saber como o movimento do mercado afeta o preço da ExxonMobil (XOM). Nesse caso, sua equação linear terá o valor do índice S&P 500 como variável independente, ou preditor, e o preço de XOM como variável dependente.
Na realidade, existem vários fatores que predizem o resultado de um evento. O movimento de preços da ExxonMobil, por exemplo, depende de mais do que apenas o desempenho do mercado geral. Outros preditores, como o preço do petróleo, as taxas de juros e o movimento dos preços dos futuros do petróleo, podem afetar o preço do XOM e os preços das ações de outras empresas petrolíferas. Para entender um relacionamento no qual mais de duas variáveis estão presentes, a regressão linear múltipla é usada.
A regressão linear múltipla (MLR) é usada para determinar uma relação matemática entre várias variáveis aleatórias. Em outros termos, o MLR examina como várias variáveis independentes estão relacionadas a uma variável dependente. Uma vez que cada um dos fatores independentes foi determinado para prever a variável dependente, as informações sobre as variáveis múltiplas podem ser usadas para criar uma previsão precisa sobre o nível de efeito que elas têm na variável de resultado. O modelo cria um relacionamento na forma de uma linha reta (linear) que melhor se aproxima de todos os pontos de dados individuais.
Referindo-se à equação MLR acima, em nosso exemplo:
- y i = variável dependente – o preço de XOM
- x i1 = taxas de juros
- x i2 = preço do petróleo
- x i3 = valor do índice S&P 500
- x i4 = preço do petróleo futuro
- B 0 = interceptação y no tempo zero
- B 1 = coeficiente de regressão que mede uma mudança de unidade na variável dependente quando x i1 muda – a mudança no preço de XOM quando as taxas de juros mudam
- B 2 = valor do coeficiente que mede uma mudança de unidade na variável dependente quando x i2 muda – a mudança no preço de XOM quando os preços do petróleo mudam