23 Junho 2021 6:00

Soma residual dos quadrados (RSS)

Qual é a soma residual dos quadrados (RSS)?

Uma soma de quadrados residual (RSS) é uma técnica estatística usada para medir a quantidade de variância em um conjunto de dados que não é explicada pelo próprio modelo de regressão. Em vez disso, estima a variação nos resíduos, ou termo de erro.

A regressão linear é uma medida que ajuda a determinar a força da relação entre uma variável dependente e um ou mais outros fatores, conhecidos como variáveis ​​independentes ou explicativas.

Principais vantagens

  • Uma soma de quadrados residual (RSS) mede o nível de variância no termo de erro, ou resíduos, de um modelo de regressão.
  • Idealmente, a soma dos resíduos quadrados deve ser um valor menor ou menor do que a soma dos quadrados das entradas do modelo de regressão.
  • O RSS é usado por analistas financeiros para estimar a validade de seus modelos econométricos.

A fórmula para a soma residual dos quadrados (RSS)

RSS =

n
i = 1 (
y i
f (
x i ))
2

Onde:

  • y i = o i ésimo valor da variável a ser prevista
  • f (x i ) = valor previsto de y i
  • n = limite superior da soma

Compreendendo a soma residual dos quadrados (RSS)

Em termos gerais, a soma dos quadrados é uma técnica estatística usada na análise de regressão para determinar a dispersão dos pontos de dados. Em uma análise de regressão, o objetivo é determinar o quão bem uma série de dados pode ser ajustada a uma função que pode ajudar a explicar como a série de dados foi gerada. A soma dos quadrados é usada como uma forma matemática de encontrar a função que  melhor se ajusta  (varia menos) a partir dos dados.

O RSS mede a quantidade de erro restante entre a função de regressão e o conjunto de dados após a execução do modelo. Uma figura RSS menor representa uma função de regressão.

O RSS, também conhecido como a soma dos resíduos quadrados, essencialmente determina o quão bem um modelo de regressão explica ou representa os dados no modelo.

Soma residual dos quadrados (RSS) vs. Erro padrão residual (RSE)

O erro padrão residual (RSE) é outro termo estatístico usado para descrever a diferença nos  desvios padrão  dos valores observados em relação aos valores previstos, conforme mostrado por pontos em uma análise de regressão. É uma   medida de adequação que pode ser usada para analisar como um conjunto de pontos de dados se ajusta ao modelo real.

O RSE é calculado dividindo o RSS pelo número de observações na amostra menos 2 e, em seguida, obtendo a raiz quadrada: RSE = [RSS / (n-2)] 1/2

A soma residual dos quadrados (RSS), finanças e economometria

Os mercados financeiros tornaram-se cada vez mais orientados quantitativamente; assim, em busca de uma vantagem, muitos investidores estão utilizando técnicas estatísticas avançadas para auxiliar em suas decisões. Os aplicativos de big data, aprendizado de máquina e inteligência artificial exigem ainda o uso de propriedades estatísticas para orientar as estratégias de investimento contemporâneas. A soma residual dos quadrados – ou estatísticas RSS – é uma das muitas propriedades estatísticas que estão passando por um renascimento.

Modelos estatísticos são usados ​​por investidores e gerentes de portfólio para rastrear o preço de um investimento e usar esses dados para prever movimentos futuros. O estudo – chamado de análise de regressão – pode envolver a análise da relação nos movimentos de preços entre uma commodity e as ações de empresas envolvidas na produção da commodity.

Qualquer modelo pode ter variações entre os valores previstos e os resultados reais. Embora as variações possam ser explicadas pela análise de regressão, o RSS representa as variações ou erros que não são explicados.

Uma vez que uma função de regressão suficientemente complexa pode ser feita para se ajustar virtualmente a qualquer conjunto de dados, estudos adicionais são necessários para determinar se a função de regressão é, de fato, útil para explicar a variação do conjunto de dados. Normalmente, no entanto, um valor menor ou menor para o RSS é ideal em qualquer modelo, pois significa que há menos variação no conjunto de dados. Em outras palavras, quanto menor a soma dos resíduos quadrados, melhor o modelo de regressão explica os dados.