Estatísticas descritivas
O que são estatísticas descritivas?
As estatísticas descritivas são coeficientes descritivos breves que resumem um determinado conjunto de dados, que pode ser uma representação do todo ou uma amostra de uma população. As estatísticas descritivas são divididas em medidas de tendência central e medidas de variabilidade (spread). As medidas de tendência central incluem a média, mediana e moda, enquanto as medidas de variabilidade incluem curtose e assimetria.
Principais vantagens
- As estatísticas descritivas resumem ou descrevem as características de um conjunto de dados.
- A estatística descritiva consiste em duas categorias básicas de medidas: medidas de tendência central e medidas de variabilidade (ou dispersão).
- As medidas de tendência central descrevem o centro de um conjunto de dados.
- As medidas de variabilidade ou propagação descrevem a dispersão dos dados dentro do conjunto.
Compreendendo as estatísticas descritivas
As estatísticas descritivas, em suma, ajudam a descrever e compreender as características de um conjunto de dados específico, fornecendo breves resumos sobre a amostra e as medidas dos dados. Os tipos mais reconhecidos de estatísticas descritivas são medidas de centro: a média, a mediana e a moda, que são usadas em quase todos os níveis de matemática e estatística. A média, ou a média, é calculada somando todos os números dentro do conjunto de dados e então dividindo pelo número de números dentro do conjunto. Por exemplo, a soma do seguinte conjunto de dados é 20: (2, 3, 4, 5, 6). A média é 4 (20/5). O modo de um conjunto de dados é o valor que aparece com mais frequência, e a mediana é a figura situada no meio do conjunto de dados. É a figura que separa as figuras mais altas das mais baixas em um conjunto de dados. No entanto, existem tipos menos comuns de estatísticas descritivas que ainda são muito importantes.
As pessoas usam estatísticas descritivas para adaptar insights quantitativos difíceis de entender em um grande conjunto de dados em descrições pequenas. A média de notas de um aluno (GPA), por exemplo, fornece uma boa compreensão de estatísticas descritivas. A ideia de um GPA é que ele pega pontos de dados de uma ampla variedade de exames, aulas e notas e faz a média deles para fornecer uma compreensão geral do desempenho acadêmico geral do aluno. O GPA pessoal de um aluno reflete seu desempenho acadêmico médio.
Medidas de estatística descritiva
Todas as estatísticas descritivas são medidas de tendência central ou medidas de variabilidade, também conhecidas como medidas de dispersão. As medidas de tendência central se concentram nos valores médios ou intermediários dos conjuntos de dados, enquanto as medidas de variabilidade se concentram na dispersão dos dados. Essas duas medidas usam gráficos, tabelas e discussões gerais para ajudar as pessoas a entender o significado dos dados analisados.
As medidas de tendência central descrevem a posição central de uma distribuição para um conjunto de dados. Uma pessoa analisa a frequência de cada ponto de dados na distribuição e o descreve usando a média, mediana ou modo, que mede os padrões mais comuns do conjunto de dados analisado.
As medidas de variabilidade, ou as medidas de dispersão, ajudam a analisar a extensão da distribuição de um conjunto de dados. Por exemplo, embora as medidas de tendência central possam dar a uma pessoa a média de um conjunto de dados, não descrevem como os dados são distribuídos dentro do conjunto. Portanto, embora a média dos dados possa ser 65 de 100, ainda pode haver pontos de dados em 1 e 100. As medidas de variabilidade ajudam a comunicar isso, descrevendo a forma e a distribuição do conjunto de dados. Intervalo, quartis, desvio absoluto e variância são todos exemplos de medidas de variabilidade.
Considere o seguinte conjunto de dados: 5, 19, 24, 62, 91, 100. O intervalo desse conjunto de dados é 95, que é calculado subtraindo o número mais baixo (5) no conjunto de dados do mais alto (100).
perguntas frequentes
Por que precisamos de estatísticas que simplesmente descrevam os dados?
As estatísticas descritivas são usadas para descrever ou resumir as características de uma amostra ou conjunto de dados, como média, desvio padrão ou frequência de uma variável. Estatística inferencial. Esse tipo de estatística pode nos ajudar a entender as propriedades coletivas dos elementos de uma amostra de dados. Essas medidas podem nos dar uma ideia sobre a distribuição de probabilidade ou a “forma” geral dos dados, que podem ser representados em um gráfico, como um histograma ou gráfico de pontos. Saber a média, a variância e a distribuição da amostra de uma variável pode nos ajudar a entender o mundo ao nosso redor.
O que são média e desvio padrão?
Estas são duas estatísticas descritivas comumente empregadas. Média é o nível médio observado em algum dado, enquanto o desvio padrão descreve a variância, ou quão dispersos os dados observados naquela variável estão distribuídos em torno de sua média.
A estatística descritiva pode ser usada para fazer inferências ou previsões?
Não. Embora esses descritivos sejam úteis na compreensão dos atributos dos dados, as técnicas de estatística inferencial – um ramo separado da estatística – são necessárias para entender como as variáveis interagem umas com as outras em um conjunto de dados.