PUBLICIDADE
Dentro da Estatística, existem diversas formas de analisar um conjunto de dados, a depender da necessidade em cada caso. Imagine que um treinador anote o tempo gasto por cada um de seus atletas a cada treino de corrida e, depois, observe que o tempo de alguns de seus corredores está apresentando considerável variação, o que pode resultar em derrota em uma competição oficial. Nesse caso, é interessante que o treinador tenha algum método para verificar a dispersão entre os tempos de cada atleta.
É claro que a Estatística tem a ferramenta adequada para esse treinador! A variância é uma medida de dispersão que permite identificar a distância em que os tempos de cada atleta estão de um valor médio. Suponha que o treinador registrou em uma tabela os tempos de três atletas após realizarem o mesmo percurso em cinco dias diferentes:
Antes de calcular a variância, é necessário encontrar a média aritmética (x) dos tempos de cada atleta. Para tanto, o treinador fez os seguintes cálculos:
João → xJ = 63 + 60 + 59 + 55 + 62 = 299 = 59,8 min.
5 5
Pedro → xP = 54 + 59 + 60 + 57 + 61 = 291 = 58,2 min.
5 5
Marcos → xM = 60 + 63 + 58 + 62 + 55 = 298 = 59,6 min.
5 5
Agora que o treinador já conhece o tempo médio de cada atleta, ele pode utilizar a variância para obter a distância dos períodos de cada corrida em relação a esse valor médio. Para calcular a variância de cada corredor, pode ser realizado o seguinte cálculo:
Var = (dia 1 – x)² + (dia 2 – x)² + (dia 3 – x)² + (dia 4 – x)² + (dia 5 – x)²
total de dias (5)
Para cada atleta, o treinador calculou a variância:
João
Var (J) = (63 – 59,8)² + (60 – 59,8)² + (59 – 59,8)² + (55 – 59,8)² + (62 – 59,8)²
5
Var (J) = 10,24 + 0,04 + 0,64 + 23,04 + 4,84
5
Var (J) = 38,8
5
Var (J) = 7,76 min
Pedro
Var (P) = (54 – 58,2)² + (59 – 58,2)² + (60 – 58,2)² + (57 – 58,2)² + (61 – 58,2)²
5
Var (P) = 17,64 + 0,64 + 3,24 + 1,44 + 7,84
5
Var (P) = 30,8
5
Var (P) = 6,16 min
Marcos
Var (M) = (60 – 59,6)² + (63 – 59,6)² + (58 – 59,6)² + (62 – 59,6)² + (55 – 59,6)²
5
Var (M) = 0,16 + 11,56 + 2,56 + 5,76 + 21,16
5
Var (M) = 41,2
5
Var (M) = 8,24 min
De acordo com os cálculos da variância, o atleta que apresenta os tempos mais dispersos da média é o Marcos. Já Pedro apresentou tempos mais próximos de sua média do que os demais corredores.
Que tal sintetizarmos tudo o que vimos sobre a variância com esse exemplo?
-
Dado um conjunto de dados, a variância é uma medida de dispersão que mostra o quão distante cada valor desse conjunto está do valor central (médio);
-
Quanto menor a variância, mais próximos os valores estão da média. Da mesma forma, quanto maior ela é, mais os valores estão distantes da média.
Como nesse exemplo calculamos a variância de todos os dias em que os atletas treinaram sob a supervisão do treinador, dizemos que fizemos o cálculo da variância populacional. Agora imagine que o treinador deseje analisar os tempos desses atletas ao longo de um ano. Serão muitos dados, não é mesmo? Nesse caso, o adequado seria que o pesquisador selecionasse apenas alguns registros de tempo, uma espécie de amostra. Esse cálculo seria de uma variância amostral. A única diferença entre a variância amostral e o cálculo que realizamos é que o divisor é o número de dias subtraído de 1:
Var. amostral = (dia a – x)² + (dia b – x)² + (dia c – x)² + ... + (dia n – x)²
(total de dias) – 1
Por Amanda Gonçalves
Graduada em Matemática