Criando um modelo de regressão linear no Excel
O que é regressão linear?
A regressão linear é um gráfico de dados que representa graficamente a relação linear entre uma variável independente e uma dependente. É normalmente usado para mostrar visualmente a força da relação e a dispersão dos resultados – tudo com o propósito de explicar o comportamento da variável dependente.
Digamos que quiséssemos testar a força da relação entre a quantidade de sorvete ingerido e a obesidade. Pegávamos a variável independente, a quantidade de sorvete, e relacionávamos com a variável dependente, obesidade, para ver se havia uma relação. Dada uma regressão é uma exibição gráfica dessa relação, quanto menor a variabilidade nos dados, mais forte será a relação e mais estreito será o ajuste à linha de regressão.
Principais vantagens
- A regressão linear modela a relação entre uma (s) variável (es) dependente (s) e independente (s).
- A análise de regressão pode ser alcançada se as variáveis forem independentes, não houver heterocedasticidade e os termos de erro das variáveis não estiverem correlacionados.
- Modelar a regressão linear no Excel é mais fácil com o Data Analysis ToolPak.
Considerações Importantes
Existem algumas suposições críticas sobre seu conjunto de dados que devem ser verdadeiras para prosseguir com uma análise de regressão :
- As variáveis devem ser verdadeiramente independentes (usando um teste de qui-quadrado ).
- Os dados não devem ter variâncias de erro diferentes (isso é chamado de heteroscedasticidade (também escrita heterocedasticidade)).
- Os termos de erro de cada variável devem ser não correlacionados. Caso contrário, significa que as variáveis estão correlacionadas em série.
Se essas três coisas parecem complicadas, são. Mas o efeito de uma dessas considerações não ser verdadeira é uma estimativa tendenciosa. Essencialmente, você declararia erroneamente o relacionamento que está medindo.
Gerando uma regressão no Excel
A primeira etapa para executar a análise de regressão no Excel é verificar novamente se o plugin gratuito do Excel Data Analysis ToolPak está instalado. Este plugin torna o cálculo de uma série de estatísticas muito fácil. É não necessárias para traçar uma linha de regressão linear, mas faz a criação de tabelas estatísticas mais simples. Para verificar se instalado, selecione “Dados” na barra de ferramentas. Se “Análise de dados” for uma opção, o recurso está instalado e pronto para uso. Se não estiver instalado, você pode solicitar esta opção clicando no botão Office e selecionando “Opções do Excel”.
Usando o Data Analysis ToolPak, criar uma saída de regressão com apenas alguns cliques.
A variável independente vai no intervalo de X.
Dados os retornos do S&P 500 , digamos que queremos saber se podemos estimar a força e a relação dos retornos das ações da Visa (
- Selecione “Dados” na barra de ferramentas. O menu “Dados” é exibido.
- Selecione “Análise de dados”. A caixa de diálogo Análise de dados – Ferramentas de análise é exibida.
- No menu, selecione “Regressão” e clique em “OK”.
- Na caixa de diálogo Regressão, clique na caixa “Intervalo de entrada Y” e selecione os dados da variável dependente (retornos de ações Visa (V)).
- Clique na caixa “Input X Range” e selecione os dados da variável independente (retornos do S&P 500).
- Clique em “OK” para executar os resultados.
[Observação: se a mesa parecer pequena, clique com o botão direito na imagem e abra em uma nova guia para obter uma resolução mais alta.]
Interprete os resultados
Usando esses dados (os mesmos de nosso artigo R-quadrado ), obtemos a seguinte tabela:
O valor de R 2, também conhecido como coeficiente de determinação, mede a proporção da variação na variável dependente explicada pela variável independente ou quão bem o modelo de regressão se ajusta aos dados. O valor de R 2 varia de 0 a 1 e um valor mais alto indica um melhor ajuste. O valor p, ou valor de probabilidade, também varia de 0 a 1 e indica se o teste é significativo. Em contraste com o valor de R 2, um valor de p menor é favorável, pois indica uma correlação entre as variáveis dependentes e independentes.
Traçando uma regressão no Excel
Podemos traçar uma regressão no Excel destacando os dados e traçando-os como um gráfico de dispersão. Para adicionar uma linha de regressão, escolha “Layout” no menu “Ferramentas de gráfico”. Na caixa de diálogo, selecione “Trendline” e depois “Linear Trendline”. Para adicionar o valor de R 2, selecione “Mais opções de linha de tendência” no menu “Linha de tendência. Por último, selecione” Exibir valor de R ao quadrado no gráfico “. O resultado visual resume a força da relação, embora às custas de não fornecer tantos detalhes quanto a tabela acima.