22 Junho 2021 23:12

Criando um modelo de regressão linear no Excel

O que é regressão linear?

A regressão linear é um gráfico de dados que representa graficamente a relação linear  entre uma variável independente e uma dependente. É normalmente usado para mostrar visualmente a força da relação e a dispersão dos resultados – tudo com o propósito de explicar o comportamento da variável dependente.

Digamos que quiséssemos testar a força da relação entre a quantidade de sorvete ingerido e a obesidade. Pegávamos a variável independente, a quantidade de sorvete, e relacionávamos com a variável dependente, obesidade, para ver se havia uma relação. Dada uma regressão é uma exibição gráfica dessa relação, quanto menor a variabilidade nos dados, mais forte será a relação e mais estreito será o ajuste à linha de regressão.   

Principais vantagens

  • A regressão linear modela a relação entre uma (s) variável (es) dependente (s) e independente (s).
  • A análise de regressão pode ser alcançada se as variáveis ​​forem independentes, não houver heterocedasticidade e os termos de erro das variáveis ​​não estiverem correlacionados.
  • Modelar a regressão linear no Excel é mais fácil com o Data Analysis ToolPak.

Considerações Importantes

Existem algumas suposições críticas sobre seu conjunto de dados que devem ser verdadeiras para prosseguir com uma análise de regressão :

  1. As variáveis ​​devem ser verdadeiramente independentes (usando um teste de qui-quadrado ).
  2. Os dados não devem ter variâncias de erro diferentes (isso é chamado de heteroscedasticidade (também escrita heterocedasticidade)).
  3. Os termos de erro de cada variável devem ser não correlacionados. Caso contrário, significa que as variáveis ​​estão  correlacionadas em série.

Se essas três coisas parecem complicadas, são. Mas o efeito de uma dessas considerações não ser verdadeira é uma estimativa tendenciosa. Essencialmente, você declararia erroneamente o relacionamento que está medindo.

Gerando uma regressão no Excel

A primeira etapa para executar a análise de regressão no Excel é verificar novamente se o plugin gratuito do Excel Data Analysis ToolPak está instalado. Este plugin torna o cálculo de uma série de estatísticas muito fácil. É não  necessárias para traçar uma linha de regressão linear, mas faz a criação de tabelas estatísticas mais simples. Para verificar se instalado, selecione “Dados” na barra de ferramentas. Se “Análise de dados” for uma opção, o recurso está instalado e pronto para uso. Se não estiver instalado, você pode solicitar esta opção clicando no botão Office e selecionando “Opções do Excel”.

Usando o Data Analysis ToolPak, criar uma saída de regressão com apenas alguns cliques.



A variável independente vai no intervalo de X.

Dados os retornos do S&P 500 , digamos que queremos saber se podemos estimar a força e a relação dos retornos das ações da Visa (

  1. Selecione “Dados” na barra de ferramentas. O menu “Dados” é exibido.
  2. Selecione “Análise de dados”. A caixa de diálogo Análise de dados – Ferramentas de análise é exibida.
  3. No menu, selecione “Regressão” e clique em “OK”.
  4. Na caixa de diálogo Regressão, clique na caixa “Intervalo de entrada Y” e selecione os dados da variável dependente (retornos de ações Visa (V)).
  5. Clique na caixa “Input X Range” e selecione os dados da variável independente (retornos do S&P 500).
  6. Clique em “OK” para executar os resultados.

[Observação: se a mesa parecer pequena, clique com o botão direito na imagem e abra em uma nova guia para obter uma resolução mais alta.]

Interprete os resultados

Usando esses dados (os mesmos de nosso artigo R-quadrado ), obtemos a seguinte tabela:

O valor de R 2, também conhecido como coeficiente de determinação, mede a proporção da variação na variável dependente explicada pela variável independente ou quão bem o modelo de regressão se ajusta aos dados. O valor de R 2 varia de 0 a 1 e um valor mais alto indica um melhor ajuste. O valor p, ou valor de probabilidade, também varia de 0 a 1 e indica se o teste é significativo. Em contraste com o valor de R 2, um valor de p menor é favorável, pois indica uma correlação entre as variáveis ​​dependentes e independentes.

Traçando uma regressão no Excel

Podemos traçar uma regressão no Excel destacando os dados e traçando-os como um gráfico de dispersão. Para adicionar uma linha de regressão, escolha “Layout” no menu “Ferramentas de gráfico”. Na caixa de diálogo, selecione “Trendline” e depois “Linear Trendline”. Para adicionar o valor de R 2, selecione “Mais opções de linha de tendência” no menu “Linha de tendência. Por último, selecione” Exibir valor de R ao quadrado no gráfico “. O resultado visual resume a força da relação, embora às custas de não fornecer tantos detalhes quanto a tabela acima.