23 Junho 2021 5:47

Noções básicas de regressão para análise de negócios

Se você já se perguntou como duas ou mais peças de dados se relacionam entre si (por exemplo, como o PIB é impactado por mudanças no desemprego e na inflação), ou se você já pediu ao seu chefe para criar uma previsão ou analisar as previsões com base nas relações entre as variáveis, então a análise de regressão de aprendizagem valeria a pena.

Neste artigo, você aprenderá os fundamentos da regressão linear simples, às vezes chamada de ‘mínimos quadrados ordinários’ ou regressão OLS – uma ferramenta comumente usada em previsões e análises financeiras. Começaremos aprendendo os princípios básicos da regressão, primeiro aprendendo sobre covariância e correlação e, em seguida, passando para a construção e interpretação de uma saída de regressão. Softwares de negócios populares, como o Microsoft Excel, podem fazer todos os cálculos de regressão e resultados para você, mas ainda é importante aprender a mecânica subjacente.

principais conclusões

  • A regressão linear simples é comumente usada em previsões e análises financeiras – para uma empresa dizer como uma mudança no PIB poderia afetar as vendas, por exemplo.
  • O Microsoft Excel e outros softwares podem fazer todos os cálculos, mas é bom saber como funciona a mecânica da regressão linear simples.

Variáveis

No centro de um modelo de regressão está a relação entre duas variáveis ​​diferentes, chamadas de variáveis ​​dependentes e independentes. Por exemplo, suponha que você queira fazer uma previsão de vendas para sua empresa e concluiu que as vendas dela aumentam e diminuem dependendo das mudanças no PIB.

As vendas que você está prevendo seriam a variável dependente porque seu valor “depende” do valor do PIB e o PIB seria a variável independente. Em seguida, você precisaria determinar a força da relação entre essas duas variáveis ​​para prever as vendas. Se o PIB aumentar / diminuir em 1%, quanto suas vendas aumentarão ou diminuirão?

Covariância

A fórmula para calcular a relação entre duas variáveis ​​é chamada de covariância. Este cálculo mostra a direção do relacionamento. Se uma variável aumenta e a outra variável também tende a aumentar, a covariância seria positiva. Se uma variável aumenta e a outra tende a diminuir, a covariância seria negativa.

O número real que você obtém ao calcular isso pode ser difícil de interpretar porque não é padronizado. Uma covariância de cinco, por exemplo, pode ser interpretada como uma relação positiva, mas a força da relação só pode ser considerada mais forte do que se o número fosse quatro ou mais fraca do que se o número fosse seis.

Coeficiente de correlação

Correeuumateuon=ρxy=Covxysxsy\ begin {alinhado} & Correlação = \ rho_ {xy} = \ frac {Cov_ {xy}} {s_x s_y} \\ \ end {alinhado}​CorreLumtion=ρxy​=sx​sy​

Precisamos padronizar a covariância para nos permitir melhor interpretá-la e usá-la na previsão, e o resultado é o cálculo da correlação. O cálculo da correlação simplesmente pega a covariância e a divide pelo produto do desvio padrão das duas variáveis. Isso vinculará a correlação entre um valor de -1 e +1.

Uma correlação de +1 pode ser interpretada para sugerir que ambas as variáveis ​​se movem perfeitamente positivamente uma com a outra e -1 implica que elas estão perfeitamente correlacionadas negativamente. Em nosso exemplo anterior, se a correlação for +1 e o PIB aumentar em 1%, as vendas aumentariam em 1%. Se a correlação for -1, um aumento de 1% no PIB resultaria em uma diminuição de 1% nas vendas – exatamente o oposto.

Equação de regressão

Agora que sabemos como a relação relativa entre as duas variáveis ​​é calculada, podemos desenvolver uma equação de regressão para prever ou prever a variável que desejamos. Abaixo está a fórmula para uma regressão linear simples. O “y” é o valor que estamos tentando prever, o “b” é a inclinação da linha de regressão, o “x” é o valor do nosso valor independente e o “a” representa a interceptação do y. A equação de regressão simplesmente descreve a relação entre a variável dependente (y) e a variável independente (x).

A interceptação, ou “a”, é o valor de y (variável dependente) se o valor de x (variável independente) for zero e, portanto, às vezes é simplesmente referido como a ‘constante’. Então, se não houvesse variação no PIB, sua empresa ainda faria algumas vendas. Este valor, quando a variação do PIB é zero, é a interceptação. Dê uma olhada no gráfico abaixo para ver uma representação gráfica de uma equação de regressão. Neste gráfico, existem apenas cinco pontos de dados representados pelos cinco pontos no gráfico. A regressão linear tenta estimar uma linha que melhor se ajusta aos dados (uma linha de melhor ajuste ) e a equação dessa linha resulta na equação de regressão.

Regressões no Excel

Agora que você entende alguns dos antecedentes que entram em uma análise de regressão, vamos fazer um exemplo simples usando as ferramentas de regressão do Excel. Vamos nos basear no exemplo anterior de tentar prever as vendas do próximo ano com base nas mudanças no PIB. A próxima tabela lista alguns pontos de dados artificiais, mas esses números podem ser facilmente acessíveis na vida real.

Apenas olhando a tabela, você pode ver que haverá uma correlação positiva entre as vendas e o PIB. Ambos tendem a subir juntos. Usando o Excel, tudo o que você precisa fazer é clicar no menu suspenso Ferramentas, selecionar Análise de dados  e, a partir daí, escolher Regressão. A caixa pop-up é fácil de preencher a partir daí; seu intervalo de entrada Y é sua coluna “Vendas” e seu intervalo de entrada X é a mudança na coluna PIB; escolha o intervalo de saída para onde deseja que os dados apareçam na planilha e pressione OK. Você deve ver algo semelhante ao que é fornecido na tabela abaixo:

                                            Coeficientes de estatísticas de regressão

Interpretação

Os principais resultados com os quais você precisa se preocupar para a regressão linear simples são o R-quadrado, a interceptação (constante) e o coeficiente beta (b) do PIB. O número R-quadrado neste exemplo é 68,7%. Isso mostra o quão bem nosso modelo prevê ou prevê as vendas futuras, sugerindo que as variáveis ​​explicativas do modelo previram 68,7% da variação da variável dependente. A seguir, temos uma interceptação de 34,58, que nos diz que se a variação do PIB fosse projetada para ser zero, nossas vendas seriam de cerca de 35 unidades. E, finalmente, o beta do PIB ou coeficiente de correlação de 88,15 nos diz que se o PIB aumentar 1%, as vendas provavelmente aumentarão cerca de 88 unidades.

The Bottom Line

Então, como você usaria esse modelo simples em seu negócio? Bem, se sua pesquisa leva você a acreditar que a próxima variação do PIB será uma certa porcentagem, você pode inserir essa porcentagem no modelo e gerar uma previsão de vendas. Isso pode ajudá-lo a desenvolver um plano e um orçamento mais objetivos para o próximo ano.

Claro, esta é apenas uma regressão simples e existem regressões lineares múltiplas. Mas as regressões lineares múltiplas são mais complicadas e têm vários problemas que precisariam de outro artigo para discutir.