23 Junho 2021 8:06

Soma dos quadrados

Qual é a soma dos quadrados?

A soma dos quadrados é uma técnica estatística usada na análise de regressão para determinar a dispersão dos pontos de dados. Em uma análise de regressão, o objetivo é determinar o quão bem uma série de dados pode ser ajustada a uma função que pode ajudar a explicar como a série de dados foi gerada. A soma dos quadrados é usada como uma forma matemática de encontrar a função que melhor se ajusta (varia menos) a partir dos dados.

A fórmula para a soma dos quadrados é

A soma dos quadrados também é conhecida como variação.

O que a soma dos quadrados diz a você?

A soma dos quadrados é uma medida de desvio da média. Em estatística, a média é a média de um conjunto de números e é a medida de tendência central mais comumente usada. A média aritmética é calculada simplesmente somando os valores no conjunto de dados e dividindo pelo número de valores.

Digamos que os preços de fechamento da Microsoft (MSFT) nos últimos cinco dias foram 74,01, 74,77, 73,94, 73,61 e 73,40 em dólares americanos. A soma dos preços totais é $ 369,73 e o preço médio ou médio do livro seria $ 369,73 / 5 = $ 73,95.

Mas saber a média de um conjunto de medidas nem sempre é suficiente. Às vezes, é útil saber quanta variação existe em um conjunto de medições. O quão distantes os valores individuais estão da média pode fornecer algumas dicas sobre como as observações ou valores são adequados ao modelo de regressão que é criado.

Por exemplo, se um analista quiser saber se o preço da ação da MSFT se move em conjunto com o preço da Apple (AAPL), ele pode listar o conjunto de observações para o processo de ambas as ações por um determinado período, digamos 1, 2, ou 10 anos e criar um modelo linear com cada uma das observações ou medições registradas. Se a relação entre as duas variáveis ​​(ou seja, o preço da AAPL e o preço da MSFT) não for uma linha reta, então há variações no conjunto de dados que precisam ser examinadas.

Falando em estatísticas, se a linha no modelo linear criado não passa por todas as medidas de valor, então parte da variabilidade observada nos preços das ações é inexplicada. A soma dos quadrados é usada para calcular se existe uma relação linear entre duas variáveis ​​e qualquer variabilidade inexplicada é referida como a soma residual dos quadrados.

A soma dos quadrados é a soma do quadrado da variação, em que a variação é definida como o spread entre cada valor individual e a média. Para determinar a soma dos quadrados, a distância entre cada ponto de dados e a linha de melhor ajuste é quadrada e então somada. A linha de melhor ajuste minimizará esse valor.

Como calcular a soma dos quadrados

Agora você pode ver por que a medição é chamada de soma dos desvios quadrados ou, abreviadamente, a soma dos quadrados. Usando nosso exemplo MSFT acima, a soma dos quadrados pode ser calculada como:

  • SS = (74,01 – 73,95) 2 + (74,77 – 73,95) 2 + (73,94 – 73,95) 2 + (73,61 – 73,95) 2 + (73,40 – 73,95) 2
  • SS = (0,06) 2 + (0,82) 2 + (-0,01) 2 + (-0,34) 2 + (-0,55) 2
  • SS = 1.0942

Adicionar a soma dos desvios por si só, sem quadratura, resultará em um número igual ou próximo a zero, pois os desvios negativos compensarão quase perfeitamente os desvios positivos. Para obter um número mais realista, a soma dos desvios deve ser elevada ao quadrado. A soma dos quadrados sempre será um número positivo porque o quadrado de qualquer número, seja positivo ou negativo, é sempre positivo.

Exemplo de como usar a soma dos quadrados

Com base nos resultados do cálculo MSFT, uma soma alta de quadrados indica que a maioria dos valores está mais longe da média e, portanto, há grande variabilidade nos dados. Uma baixa soma de quadrados refere-se à baixa variabilidade no conjunto de observações.

No exemplo acima, 1.0942 mostra que a variabilidade no preço das ações da MSFT nos últimos cinco dias é muito baixa e os investidores que desejam investir em ações caracterizadas pela estabilidade de preços e baixa volatilidade podem optar pela MSFT.

Principais vantagens

  • A soma dos quadrados mede o desvio dos pontos de dados do valor médio.
  • Um resultado de soma de quadrados mais alto indica um grande grau de variabilidade dentro do conjunto de dados, enquanto um resultado mais baixo indica que os dados não variam consideravelmente do valor médio.

Limitações do uso da soma dos quadrados

Tomar uma decisão de investimento sobre qual ação comprar requer muito mais observações do que as listadas aqui. Um analista pode ter que trabalhar com anos de dados para saber com maior certeza quão alta ou baixa é a variabilidade de um ativo. À medida que mais pontos de dados são adicionados ao conjunto, a soma dos quadrados se torna maior, pois os valores serão mais espalhados.

As medidas de variação mais amplamente utilizadas são o desvio padrão e a variância. No entanto, para calcular qualquer uma das duas métricas, a soma dos quadrados deve primeiro ser calculada. A variância é a média da soma dos quadrados (ou seja, a soma dos quadrados dividida pelo número de observações). O desvio padrão é a raiz quadrada da variância.

Existem dois métodos de análise de regressão que utilizam a soma dos quadrados: o método dos mínimos quadrados linear e o método dos mínimos quadrados não linear. O método dos mínimos quadrados refere-se ao fato de que a função de regressão minimiza a soma dos quadrados da variância dos pontos de dados reais. Desta forma, é possível desenhar uma função que forneça estatisticamente o melhor ajuste para os dados. Observe que uma função de regressão pode ser linear (uma linha reta) ou não linear (uma linha curva).