X

Por que preferir o desvio padrão ao desvio médio absoluto?

Prof. Lang

Por que o desvio padrão é mais utilizado do que o desvio médio absoluto como medida de dispersão de um conjunto de dados? Existe uma relação entre ambos, isto é, conhecido o valor de um se pode saber o valor do outro?

O desvio médio absoluto me parece ser mais intuitivo do que o desvio padrão. Deve haver uma razão mais profunda para o desvio padrão ser preferido ao desvio médio absoluto como medida de dispersão do que a resposta do Google abaixo: O desvio padrão é mais utilizado do que o desvio médio absoluto porque é mais tratável analiticamente e permite uma interpretação mais clara da dispersão dos dados, além de ser menos sensível a valores extremosO desvio padrão também é mais frequentemente usado em cálculos estatísticos e para medir a confiança em resultados experimentais. 

Grato!

 

Respondido por: Prof. Fernando Lang da Silveira - www.if.ufrgs.br/~lang/

Existem muitas medidas estatísticas de dispersão. Entre elas o perguntante destacou o desvio absoluto médio (DAM) e o desvio padrão (DP). Também notou apropriadamente que o DAM parece ser mais intuitivo do que o DP.

De fato o DP (e o seu quadrado – a variância) é mais tratável analiticamente do que o DAM.

A única afirmação geral que se pode fazer sobre a relação entre o DP e o DAM é que o DP sempre resulta maior ou igual ao DAM em um conjunto de dados.

A razão entre DP por DAM muda com a distribuição de probabilidades dos dados. Alguns exemplos:

Distribuição de Gauss ou normal: DP dividido por DAM é aproximadamente 1,25.

Distribuição uniforme contínua: DP dividido por DAM é aproximadamente 1,15.

Distribuição triangular simétrica: DP dividido por DAM é aproximadamente 1,23.

Distribuição de Bernoulli equiprovável: DP dividido por DAM é igual à unidade.

Quanto à afirmação do Google de que o DP é  menos sensível a valores extremos está errada. De fato o DP é mais sensível a valores extremos do que o DAM. A razão da maior sensibilidade a valores extremos decorre de que para o DP os desvios absolutos em relação à média são somados ao quadrado ao invés de na primeira potência no caso do DAM.  Como exemplo da maior sensibilidade a valores extremos para o DP em relação ao DAM a tabela 1 apresenta 10 medidas do alcance de um projétil “nas mesmas condições” em um experimento de Física Experimental I .

Como os resultados experimentais para o alcance do projétil estão em ordem crescente, percebe-se que o primeiro deles é muito discrepante em relação aos demais, possivelmente devido a uma falha no lançador.  Aqui interessa notar o efeito de um dado extremo como esse para o DP e o DAM pois na situação real de laboratório o experimentador optará por eliminar tal dado e refazer a medida.

O DP dos dez resultados, que tem média de 178,1 cm, é 8,8 cm. O DAM para esses dez resultados é 5,5 cm. Portanto a razão do DP pelo DAM resulta em aproximadamente 1,6.

Quando se desconsidera o valor de 155 cm, a média do alcance se modifica para 180,1 cm e o desvio padrão resulta em 3,6 cm. O DAM para esses nove resultados é 2,8 cm. Portanto a razão do DP pelo DAM resulta em aproximadamente 1,3.

O diminuição da razão do DP pelo DAM  corrobora que o DP é mais sensível do que o DAM para  dados extremos pois a remoção do dado extremo reduziu mais o DP do que o DAM.

Afinal, por que se prefere o DP ao DAM como medida de dispersão?

A resposta se encontra em que o DP aparece explicitamente em um resultado muito geral denominado Desigualdade de Chebychef. Tal desigualdade afirma que, para qualquer distribuição (com variância ou desvio padrão finito), a proporção dos valores que se encontra em relação à média μ a mais de  desvios padrão é no máximo {\displaystyle 1/k^{2}}. Formalmente:

Ou equivalentemente:

P( ∣X−μ∣ < . DP )≥ 1 −    

Isso significa, por exemplo, sem assumir nenhuma distribuição específica, que pelo menos 75% dos dados estão dentro de 2 desvios padrão em torno da média. E que pelo menos 89% dos dados estão dentro de 3 desvios padrão  em torno da média.

Já para o DAM não existe uma desigualdade universal comparável a Desigualdade de Chebychef. Embora seja uma boa medida, mais robusta (menos afetada por dados extremos) e intuitiva da variabilidade, ele não fornece garantias teóricas sobre a concentração dos dados ao redor da média. Isso limita sua utilidade em contextos onde é preciso fazer afirmações gerais e rigorosas sobre a dispersão.

Aqui um livro que trata também de tópicos de estatística no contexto do laboratório de Física: Laboratório de Mecânica – Subsídios para o ensino de Física Experimental

Outras postagens do Pergunte ao CREF sobre Estatística e probabilidade, incertezas experimentais

 

COMENTÁRIO DO PROF. Carlos Aguiar (UFRJ): Há uma conexão interessante entre a média e o desvio padrão. O valor mínimo do desvio padrão é encontrado quando os desvios são calculados em relação à média do conjunto de dados dados.
No desvio absoluto médio a situação é diferente: o mínimo ocorre quando os desvios são tomados em relação à mediana.

“Docendo discimus.” (Sêneca)

 

 

 


Um comentário em “Por que preferir o desvio padrão ao desvio médio absoluto?

  1. Carlos Eduardo Aguiar disse:

    Há uma conexão interessante entre a média e o desvio padrão. O valor mínimo do desvio padrão é encontrado quando os desvios são calculados em relação à média do conjunto de dados dados.
    No desvio absoluto médio a situação é diferente: o mínimo ocorre quando os desvios são tomados em relação à mediana.

Deixe um comentário para Carlos Eduardo Aguiar Cancelar resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *