Estatística básica – Aula 4: Medidas de Tendência Central

Postado em 01/04/2020 por Gleydson Fernandes

Cursos, Estatística

Ao observar um conjunto de dados é comum os encontrarmos dispersos. Por esse motivo, encontrar medidas centrais, em torno dos quais esses dados se organizam, pode ser esclarecedor na análise de dados, trazendo a tona informações importantes sobre o sistema de interesse.

Para isso, três medidas de tendência central são bastante utilizadas: a mediana, a moda, e a mais conhecida de todas, a média.

Média

A média de um conjunto de dados numéricos é a razão entre a soma de todos os dados e a própria quantidade de dados. Dessa forma, para um conjunto amostral de N observações:

$\mu = \frac{\sum_{i=1}^{N}X_i}{N}$

Onde a letra grega $\mu$ (lê-se mi) representa a nossa média amostral.

Podemos ainda escrever a média de uma população, com um conjunto n de dados, apenas modificando o índice:

$\bar{X} = \frac{\sum_{i=1}^{n}X_i}{n}$

Não há diferença algébrica entre a escrita das duas formas, mas é importante diferenciar a média da amostra e a média da população.

Obviamente, não existe média para um conjunto de dados qualitativos, pois não faz sentido somá-los e dividi-los.

Mediana

A mediana divide um conjunto quantitativo ordenado no meio, separando numericamente os 50% dos dados que estão acima dela e os 50% que estão abaixo. Assim como no caso da média, a mediana é uma medida para variáveis quantitativas.

Para um conjunto ímpar de dados, a mediana é dada por:

$M_e = X_{(\frac{n+1}{2})}$

Para um conjunto par de dados:

$M_e = \frac{X_{(\frac{n}{2})}+X_{(\frac{N+2}{2})}}{2}$

Exemplo: Para o conjunto de números de sapatos: 28, 30, 32, 36, 37, 38, 40

$M_{e} = X_{(\frac{7+1}{2})}$

$= X_{\frac{8}{2}}$

$= X_{4}$

= 36

Observe que é muito importante que o conjunto de dados esteja ordenado. Caso estivessem embaralhados a mediana não dividiria os valores entre os 50% maiores e os 50% menores.

Moda

A moda é uma medida de tendência central que se refere ao valor que mais se repete em um conjunto.

$M_o = X_{freq}$

Essa medida pode ser feita em qualquer conjunto de dados, seja ele um conjunto quantitativo ou um conjunto qualitativo. Nessa categoria, os conjuntos podem ser classificados como:

Amodal: quando não apresenta valor mais frequente;

Unimodal: quando o conjunto apresenta um valor mais frequente;

Bimodal: Quando o conjunto apresenta dois valores mais frequentes;

Multimodal: Quando apresenta três ou mais valores mais frequentes.

Comparação

Como foi dito na introdução, as três medidas apresentadas no texto são valores em torno dos quais os dados se organizam. Dessa forma, pode parecer que utilizar qualquer uma delas pouco importa. De fato, quando a distribuição dos dados é simétrica, ou seja, em situações em que as três medidas são iguais, ou quando ela é aproximadamente simétrica, caso em que são muito próximos, podemos utilizar qualquer uma das três medidas. Quando essas situações não ocorrerem é necessário observar os objetivos do estudo e escolher a medida que mais couber ao caso.

Algebricamente, a média possui propriedades preferíveis que serão expostas na próxima aula.

Para visualizar as fontes e outras informações sobre o curso, siga para a publicação inicial da série.

Se você gostou dessa iniciativa e deseja apoiar o curso financeiramente, visite a nossa campanha no catarse. Estaremos sempre com atualizações e recompensas para os apoiadores.

image_pdfimage_print
Compartilhar:

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *