23 Junho 2021 0:19
Seu consultor de investimentos propõe um plano de investimento de renda mensal que promete um retorno variável a cada mês. Você só investirá nele se tiver a garantia de uma renda média mensal de $ 180. Seu consultor também lhe disse que, nos últimos 300 meses, o esquema teve retornos de investimento com um valor médio de $ 190 e um desvio padrão de $ 75. Você deve investir neste esquema? O teste de hipóteses auxilia nessa tomada de decisão.
Principais vantagens
- O teste de hipóteses é uma ferramenta matemática para confirmar uma ideia ou afirmação financeira ou comercial.
- O teste de hipótese é útil para os investidores que estão tentando decidir em que investir e se o instrumento tem probabilidade de fornecer um retorno satisfatório.
- Apesar da existência de diferentes metodologias de teste de hipóteses, as mesmas quatro etapas são utilizadas: definir a hipótese, definir os critérios, calcular a estatística e chegar a uma conclusão.
- Este modelo matemático, como a maioria das ferramentas e modelos estatísticos, tem limitações e está sujeito a certos erros, fazendo com que os investidores também considerem outros modelos em conjunto com este
O que é teste de hipóteses?
Teste de hipótese ou significância é um modelo matemático para testar uma afirmação, ideia ou hipótese sobre um parâmetro de interesse em um determinado conjunto de população, usando dados medidos em um conjunto de amostra. Os cálculos são realizados em amostras selecionadas para reunir informações mais decisivas sobre as características de toda a população, o que permite uma forma sistemática de testar afirmações ou ideias sobre todo o conjunto de dados.
Aqui está um exemplo simples: O diretor de uma escola relata que os alunos em sua escola pontuam em média 7 em 10 nos exames. Para testar essa “hipótese”, registramos marcas de, digamos, 30 alunos (amostra) de toda a população de alunos da escola (digamos 300) e calculamos a média dessa amostra. Podemos então comparar a média da amostra (calculada) com a média da população (relatada) e tentar confirmar a hipótese.
Para dar outro exemplo, o retorno anual de um determinado fundo mútuo é de 8%. Suponha que esse fundo mútuo exista há 20 anos. Pegamos uma amostra aleatória dos retornos anuais do fundo mútuo por, digamos, cinco anos (amostra) e calculamos sua média. Em seguida, comparamos a média da amostra (calculada) com a média da população (reivindicada) para verificar a hipótese.
Este artigo pressupõe a familiaridade dos leitores com os conceitos de uma tabela de distribuição normal, fórmula, valor p e noções básicas de estatística relacionadas.
Existem diferentes metodologias para o teste de hipóteses, mas as mesmas quatro etapas básicas estão envolvidas:
Etapa 1: Definir a hipótese
Normalmente, o valor relatado (ou as estatísticas de sinistro) é declarado como a hipótese e considerado verdadeiro. Para os exemplos acima, a hipótese será:
- Exemplo A: Os alunos da escola têm uma média de 7 pontos em 10 nos exames.
- Exemplo B: O retorno anual do fundo mútuo é de 8% ao ano.
Esta descrição declarada constitui a “ Hipótese Nula (H 0 ) ” e é considerada verdadeira – a forma como um réu em um julgamento por júri é presumido inocente até que seja provado culpado pelas evidências apresentadas em tribunal. Da mesma forma, o teste de hipótese começa declarando e assumindo uma “ hipótese nula ” e, em seguida, o processo determina se a suposição é provavelmente verdadeira ou falsa.
O ponto importante a observar é que estamos testando a hipótese nula porque há um elemento de dúvida sobre sua validade. Qualquer informação que seja contra a hipótese nula declarada é capturada na Hipótese Alternativa (H 1 ). Para os exemplos acima, a hipótese alternativa será:
- Os alunos obtêm uma média que não é igual a 7.
- O retorno anual do fundo mútuo não é igual a 8% ao ano.
Em outras palavras, a hipótese alternativa é uma contradição direta da hipótese nula.
Como em um julgamento, o júri presume a inocência do réu (hipótese nula). O promotor deve provar o contrário (hipótese alternativa). Da mesma forma, o pesquisador deve provar que a hipótese nula é verdadeira ou falsa. Se o procurador não conseguir provar a hipótese alternativa, o júri deve dispensar o réu (baseando a decisão na hipótese nula). Da mesma forma, se o pesquisador não consegue provar uma hipótese alternativa (ou simplesmente não faz nada), então a hipótese nula é considerada verdadeira.
Os critérios de tomada de decisão devem ser baseados em certos parâmetros de conjuntos de dados.
Etapa 2: definir os critérios
Os critérios de tomada de decisão devem ser baseados em certos parâmetros de conjuntos de dados e é aqui que a conexão com a distribuição normal entra em cena.
De acordo com o postulado de estatísticas padrão sobre a distribuição de amostragem, “Para qualquer tamanho de amostra n, a distribuição de amostragem de X̅ é normal se a população X da qual a amostra é retirada é normalmente distribuída” Conseqüentemente, as probabilidades de todas as outras médias de amostra possíveis que alguém poderia selecionar são normalmente distribuídas.
Por exemplo, determine se o retorno médio diário, de qualquer ação listada no mercado de ações XYZ, em torno do dia de Ano Novo é superior a 2%.
H 0 : Hipótese nula: média = 2%
H 1 : Hipótese alternativa: média> 2% (isso é o que queremos provar)
Pegue a amostra (digamos, 50 ações de um total de 500) e calcule a média da amostra.
Para uma distribuição normal, 95% dos valores estão dentro de dois desvios padrão da média da população. Portanto, essa distribuição normal e suposição de limite central para o conjunto de dados da amostra nos permite estabelecer 5% como um nível de significância. Faz sentido, pois, sob essa suposição, há menos de 5% de probabilidade (100-95) de obter outliers que estão além de dois desvios padrão da média da população. Dependendo da natureza dos conjuntos de dados, outros níveis de significância podem ser considerados em 1%, 5% ou 10%. Para cálculos financeiros (incluindo finanças comportamentais), 5% é o limite geralmente aceito. Se encontrarmos cálculos que vão além dos dois desvios-padrão usuais, então temos um caso forte de outliers para rejeitar a hipótese nula.
Graficamente, é representado da seguinte forma:
No exemplo acima, se a média da amostra for muito maior do que 2% (digamos 3,5%), rejeitamos a hipótese nula. A hipótese alternativa (média> 2%) é aceita, o que confirma que o retorno médio diário das ações é de fato superior a 2%.
No entanto, se a média da amostra provavelmente não for significativamente maior do que 2% (e permanecer em, digamos, cerca de 2,2%), NÃO PODEMOS rejeitar a hipótese nula. O desafio está em como decidir esses casos de curto alcance. Para fazer uma conclusão a partir de amostras e resultados selecionados, um nível de significância deve ser determinado, o que permite uma conclusão sobre a hipótese nula. A hipótese alternativa permite estabelecer o nível de significância ou o conceito de “valor crítico” para decidir sobre tais casos de curto alcance.
De acordo com adefinição padrão do livro didático, “Um valor crítico é um valor de corte que define os limites além dos quais menos de 5% das médias da amostra podem ser obtidas se a hipótese nula for verdadeira. As médias amostrais obtidas além de um valor crítico resultarão na decisão de rejeitar a hipótese nula. ” No exemplo acima, se definimos o valor crítico como 2,1% e a média calculada chega a 2,2%, então rejeitamos o hipótese nula – um valor crítico estabelece uma demarcação clara sobre aceitação ou rejeição.
Etapa 3: Calcular a estatística
Esta etapa envolve o cálculo da (s) figura (s) necessária (s), conhecidas como estatísticas de teste (como média, pontuação z, valor p, etc.), para a amostra selecionada. (Veremos isso em uma seção posterior.)
Etapa 4: chegue a uma conclusão
Com o (s) valor (es) calculado (s), decida sobre a hipótese nula. Se a probabilidade de obter uma média amostral for inferior a 5%, a conclusão é rejeitar a hipótese nula. Caso contrário, aceite e retenha a hipótese nula.
Tipos de Erros
Pode haver quatro resultados possíveis na tomada de decisão com base em amostra, no que diz respeito à aplicabilidade correta para toda a população:
Os casos “corretos” são aqueles em que as decisões tomadas nas amostras são verdadeiramente aplicáveis a toda a população. Os casos de erros surgem quando se decide reter (ou rejeitar) a hipótese nula com base nos cálculos amostrais, mas essa decisão não se aplica realmente a toda a população. Esses casos constituem erros Tipo 1 ( alfa ) e Tipo 2 ( beta ), conforme indicado na tabela acima.
Selecionar o valor crítico correto permite eliminar os erros alfa do tipo 1 ou limitá-los a um intervalo aceitável.
Alfa denota o erro no nível de significância e é determinado pelo pesquisador. Para manter a significância padrão de 5% ou nível de confiança para cálculos de probabilidade, isso é mantido em 5%.
De acordo com as referências e definições de tomada de decisão aplicáveis:
- “Este critério (alfa) é geralmente definido em 0,05 (a = 0,05), e comparamos o nível alfa com o valor p. Quando a probabilidade de um erro Tipo I é menor que 5% (p <0,05), decidimos rejeitar a hipótese nula;caso contrário, retemos a hipótese nula. ”
- O termo técnico usado para essa probabilidade é ovalor p.É definida como “a probabilidade de se obter um resultado amostral, visto que o valor declarado na hipótese nula é verdadeiro. O valor de p para a obtenção de um desfecho da amostra é comparado ao nível de significância. “
- Um erro do Tipo II, ou erro beta, é definido como a probabilidade de reter incorretamente a hipótese nula, quando na verdade não é aplicável a toda a população.
Mais alguns exemplos demonstrarão este e outros cálculos.
Exemplo 1
Existe um esquema de investimento de renda mensal que promete retornos mensais variáveis. Um investidor só investirá nele se tiver a garantia de uma renda média mensal de $ 180. O investidor tem uma amostra de retornos de 300 meses, com média de $ 190 e desvio padrão de $ 75. Eles deveriam investir neste esquema?
Vamos resolver o problema. O investidor investirá no esquema se tiver certeza do retorno médio de $ 180 desejado pelo investidor.
H 0 : Hipótese nula: média = 180
H 1 : Hipótese alternativa: média> 180
Método 1: Abordagem de valor crítico
Identifique um valor crítico X L para a média da amostra, que é grande o suficiente para rejeitar a hipótese nula – ou seja, rejeitar a hipótese nula se a média da amostra> = valor crítico X L
P (identificar um erro alfa Tipo I) = P (rejeitar H 0 dado que H 0 é verdadeiro),
Isso seria alcançado quando a média da amostra ultrapassasse os limites críticos.
= P (dado que H 0 é verdadeiro) = alfa
Graficamente, é o seguinte:
Considerando alfa = 0,05 (ou seja, nível de significância de 5%), Z 0,05 = 1,645 (da tabela Z ou tabela de distribuição normal)
=> X L = 180 + 1,645 * (75 / sqrt (300)) = 187,12
Como a média da amostra (190) é maior que o valor crítico (187,12), a hipótese nula é rejeitada e a conclusão é que o retorno médio mensal é de fato maior que $ 180, então o investidor pode considerar investir neste esquema.
Método 2: usando estatísticas de teste padronizadas
Também se pode usar o valor z padronizado.
Estatística de teste, Z = (média da amostra – média da população) / (std-dev / sqrt (nº de amostras).
Então, a região de rejeição se torna a seguinte:
Z = (190 – 180) / (75 / sqrt (300)) = 2,309
Nossa região de rejeição ao nível de significância de 5% é Z> Z 0,05 = 1,645.
Uma vez que Z = 2,309 é maior que 1,645, a hipótese nula pode ser rejeitada com uma conclusão semelhante mencionada acima.
Método 3: cálculo do valor P
Nosso objetivo é identificar P (média da amostra> = 190, quando média = 180).
= P (Z> = (190- 180) / (75 / sqrt (300))
= P (Z> = 2,309) = 0,0084 = 0,84%
A tabela a seguir para inferir cálculos de valor p conclui que há evidências confirmadas de retornos médios mensais sendo superiores a 180:
Exemplo 2
Um novo corretor da bolsa (XYZ) afirma que suas taxas de corretagem são mais baixas do que as do seu atual corretor da bolsa (ABC). Os dados disponíveis de uma empresa de pesquisa independente indicam que a média e o desvio padrão de todos os clientes da corretora ABC são de $ 18 e $ 6, respectivamente.
Uma amostra de 100 clientes da ABC é retirada e os encargos de corretagem são calculados com as novas taxas do corretor XYZ. Se a média da amostra for $ 18,75 e std-dev for o mesmo ($ 6), pode ser feita alguma inferência sobre a diferença na nota média da corretora entre o corretor ABC e o corretor XYZ?
H 0 : Hipótese nula: média = 18
H 1 : Hipótese alternativa: média 18 (isso é o que queremos provar.)
Região de rejeição: Z = Z 2,5 (assumindo um nível de significância de 5%, dividir 2,5 cada em cada lado).
Z = (média da amostra – média) / (dev-std / sqrt (nº de amostras))
= (18,75 – 18) / (6 / (sqrt (100)) = 1,25
Este valor Z calculado fica entre os dois limites definidos por:
– Z 2,5 = -1,96 e Z 2,5 = 1,96.
Isso conclui que não há evidências suficientes para inferir que haja alguma diferença entre as taxas de seu corretor existente e o novo corretor.
Alternativamente, o valor p = P (Z 1,25)
= 2 * 0,1056 = 0,2112 = 21,12% que é maior que 0,05 ou 5%, levando à mesma conclusão.
Graficamente, é representado pelo seguinte:
Pontos de crítica para o método de teste hipotético:
- Um método estatístico baseado em suposições
- Propenso a erros, conforme detalhado em termos de erros alfa e beta
- A interpretação do valor p pode ser ambígua, levando a resultados confusos
The Bottom Line
O teste de hipóteses permite que um modelo matemático valide uma afirmação ou ideia com um certo nível de confiança. No entanto, como a maioria das ferramentas e modelos estatísticos, ele tem algumas limitações. O uso deste modelo para a tomada de decisões financeiras deve ser considerado com um olhar crítico, tendo todas as dependências em mente. Métodos alternativos como a inferência bayesiana também valem a pena explorar para análises semelhantes.