Definindo Regressão Não Linear
A regressão não linear é uma forma de análise de regressão na qual os dados são ajustados a um modelo e, em seguida, expressos como uma função matemática. A regressão linear simples relaciona duas variáveis (X e Y) com uma linha reta (y = mx + b), enquanto a regressão não linear relaciona as duas variáveis em uma relação não linear (curva).
O objetivo do modelo é fazer com que a soma dos quadrados seja a menor possível. A soma dos quadrados é uma medida que rastreia o quão longe as observações Y variam da função não linear (curva) que é usada para prever Y.
É calculado encontrando primeiro a diferença entre a função não linear ajustada e cada ponto Y de dados no conjunto. Então, cada uma dessas diferenças é elevada ao quadrado. Por último, todas as figuras quadradas são somadas. Quanto menor a soma desses quadrados, melhor a função se ajusta aos pontos de dados no conjunto. A regressão não linear usa funções logarítmicas, funções trigonométricas, funções exponenciais, funções de potência, curvas de Lorenz, funções Gaussianas e outros métodos de ajuste.
Principais vantagens
- A regressão linear e não linear prediz respostas Y de uma variável X (ou variáveis).
- A regressão não linear é uma função curva de uma variável X (ou variáveis) que é usada para prever uma variável Y
- A regressão não linear pode mostrar uma previsão do crescimento populacional ao longo do tempo.
A modelagem de regressão não linear é semelhante à modelagem de regressão linear, pois ambas buscam rastrear uma resposta específica de um conjunto de variáveis graficamente. Modelos não lineares são mais complicados do que modelos lineares para desenvolver porque a função é criada por meio de uma série de aproximações (iterações) que podem resultar de tentativa e erro. Os matemáticos usam vários métodos estabelecidos, como o método de Gauss-Newton e o método de Levenberg-Marquardt.
Freqüentemente, os modelos de regressão que parecem não lineares à primeira vista são, na verdade, lineares. O procedimento de estimativa de curva pode ser usado para identificar a natureza das relações funcionais em jogo em seus dados, para que você possa escolher o modelo de regressão correto, linear ou não linear. Os modelos de regressão linear, embora normalmente formem uma linha reta, também podem formar curvas, dependendo da forma da equação de regressão linear. Da mesma forma, é possível usar a álgebra para transformar uma equação não linear de modo que imite uma equação linear – essa equação não linear é chamada de “intrinsecamente linear”.
A regressão linear relaciona duas variáveis com uma linha reta; a regressão não linear relaciona as variáveis por meio de uma curva.
Exemplo de regressão não linear
Um exemplo de como a regressão não linear pode ser usada é prever o crescimento da população ao longo do tempo. Um gráfico de dispersão das mudanças nos dados da população ao longo do tempo mostra que parece haver uma relação entre o tempo e o crescimento da população, mas que é uma relação não linear, exigindo o uso de um modelo de regressão não linear. Um modelo logístico de crescimento populacional pode fornecer estimativas da população para períodos que não foram medidos e previsões de crescimento populacional futuro.
As variáveis independentes e dependentes usadas na regressão não linear devem ser quantitativas. Variáveis categóricas, como região de residência ou religião, devem ser codificadas como variáveis binárias ou outros tipos de variáveis quantitativas.
Para obter resultados precisos do modelo de regressão não linear, você deve certificar-se de que a função especificada descreve a relação entre as variáveis independentes e dependentes com precisão. Bons valores iniciais também são necessários. Valores iniciais ruins podem resultar em um modelo que falha em convergir, ou uma solução que é ideal apenas localmente, em vez de globalmente, mesmo se você tiver especificado a forma funcional correta para o modelo.