Soma residual dos quadrados (RSS)
Qual é a soma residual dos quadrados (RSS)?
Uma soma de quadrados residual (RSS) é uma técnica estatística usada para medir a quantidade de variância em um conjunto de dados que não é explicada pelo próprio modelo de regressão. Em vez disso, estima a variação nos resíduos, ou termo de erro.
A regressão linear é uma medida que ajuda a determinar a força da relação entre uma variável dependente e um ou mais outros fatores, conhecidos como variáveis independentes ou explicativas.
Principais vantagens
- Uma soma de quadrados residual (RSS) mede o nível de variância no termo de erro, ou resíduos, de um modelo de regressão.
- Idealmente, a soma dos resíduos quadrados deve ser um valor menor ou menor do que a soma dos quadrados das entradas do modelo de regressão.
- O RSS é usado por analistas financeiros para estimar a validade de seus modelos econométricos.
A fórmula para a soma residual dos quadrados (RSS)
RSS =
∑
n
i = 1 (
y i –
f (
x i ))
2
Onde:
- y i = o i ésimo valor da variável a ser prevista
- f (x i ) = valor previsto de y i
- n = limite superior da soma
Compreendendo a soma residual dos quadrados (RSS)
Em termos gerais, a soma dos quadrados é uma técnica estatística usada na análise de regressão para determinar a dispersão dos pontos de dados. Em uma análise de regressão, o objetivo é determinar o quão bem uma série de dados pode ser ajustada a uma função que pode ajudar a explicar como a série de dados foi gerada. A soma dos quadrados é usada como uma forma matemática de encontrar a função que melhor se ajusta (varia menos) a partir dos dados.
O RSS mede a quantidade de erro restante entre a função de regressão e o conjunto de dados após a execução do modelo. Uma figura RSS menor representa uma função de regressão.
O RSS, também conhecido como a soma dos resíduos quadrados, essencialmente determina o quão bem um modelo de regressão explica ou representa os dados no modelo.
Soma residual dos quadrados (RSS) vs. Erro padrão residual (RSE)
O erro padrão residual (RSE) é outro termo estatístico usado para descrever a diferença nos desvios padrão dos valores observados em relação aos valores previstos, conforme mostrado por pontos em uma análise de regressão. É uma medida de adequação que pode ser usada para analisar como um conjunto de pontos de dados se ajusta ao modelo real.
O RSE é calculado dividindo o RSS pelo número de observações na amostra menos 2 e, em seguida, obtendo a raiz quadrada: RSE = [RSS / (n-2)] 1/2
A soma residual dos quadrados (RSS), finanças e economometria
Os mercados financeiros tornaram-se cada vez mais orientados quantitativamente; assim, em busca de uma vantagem, muitos investidores estão utilizando técnicas estatísticas avançadas para auxiliar em suas decisões. Os aplicativos de big data, aprendizado de máquina e inteligência artificial exigem ainda o uso de propriedades estatísticas para orientar as estratégias de investimento contemporâneas. A soma residual dos quadrados – ou estatísticas RSS – é uma das muitas propriedades estatísticas que estão passando por um renascimento.
Modelos estatísticos são usados por investidores e gerentes de portfólio para rastrear o preço de um investimento e usar esses dados para prever movimentos futuros. O estudo – chamado de análise de regressão – pode envolver a análise da relação nos movimentos de preços entre uma commodity e as ações de empresas envolvidas na produção da commodity.
Qualquer modelo pode ter variações entre os valores previstos e os resultados reais. Embora as variações possam ser explicadas pela análise de regressão, o RSS representa as variações ou erros que não são explicados.
Uma vez que uma função de regressão suficientemente complexa pode ser feita para se ajustar virtualmente a qualquer conjunto de dados, estudos adicionais são necessários para determinar se a função de regressão é, de fato, útil para explicar a variação do conjunto de dados. Normalmente, no entanto, um valor menor ou menor para o RSS é ideal em qualquer modelo, pois significa que há menos variação no conjunto de dados. Em outras palavras, quanto menor a soma dos resíduos quadrados, melhor o modelo de regressão explica os dados.