Exemplificações do Teorema Central do Limite na distribuição das médias amostrais
31 de agosto, 2015 às 18:52 | Postado em Estatística e probabilidade, incertezas experimentais, Matemática
Respondido por: Prof. Fernando Lang da Silveira - www.if.ufrgs.br/~lang/Esta é a segunda postagem que decorre de um material que preparei para a disciplina de “Métodos Quantitativos aplicados à Pesquisa em Ensino de Física”, oferecida aos mestrandos e doutorandos do Programa de Pós-Graduação em Ensino de Física do Instituto de Física da UFRGS.
Dedico esta postagem especialmente aos alunos da turma do segundo semestre de 2015.
O objetivo da postagem é exemplificar o Teorema Central do Limite, através da simulação de variáveis aleatórias pelo Método de Monte Carlo, mais especificamente no que diz respeito às distribuições das médias em amostras de populações que NÃO apresentam a variável de interesse distribuída normalmente, portanto em desacordo com a distribuição de Gauss.
As simulações nos mostram que a convergência para a distribuição de Gauss é rápida!
O Teorema Central do Limite (TCL) , aplicado às médias amostrais de uma variável aleatória (X) com qualquer distribuição e variância finita, implica que as médias amostrais apresentam distribuições tendendo à distribuição normal conforme o número de observações nas amostras (n) cresce.
A média das médias amostrais é igual à média de X.
O desvio padrão das médias amostrais é igual ao desvio padrão de X dividido pela raiz quadrada de n.
1 – Exemplificação do TCL para as amostras aleatórias dos resultados de um dado sem vício
Um dado sem vício apresenta uma distribuição uniforme para os seis resultados possíveis (variável discreta). Ou seja, cada um dos seis resultados possíveis possuem a mesma probabilidade de 1/6=0,167=16,7%, média (M) com valor de 3,5 e desvio padrão (DP) com valor 1,71 conforme a figura abaixo. Uma gaussiana ajustada a tal distribuição de probabilidades explicita a não adequação do modelo normal a tal distribuição.
Na figura abaixo são apresentadas as distribuições de frequências para as médias em 10, 20, 50 e 100 lançamentos de um dado não viciado.
Em acordo com o TCL as distribuições das médias amostrais se aproximam da distribuição de Gauss conforme aumentam os tamanhos das amostras. Adicionalmente tais distribuições possuem média igual à média populacional (no caso 3,5) e desvio padrão igual ao desvio padrão populacional (no caso 1,71) dividido para raiz quadrada de n, on de n é o tamanho das amostras.
2 – Exemplificação do Teorema Central do Limite para as amostras aleatórias de uma variável distribuída assimetricamente (assimetria positiva) com média 500 e desvio padrão 100
A variável simulada possui distribuição assimétrica positiva, semelhante às distribuições dos escores em provas de concursos vestibular. A figura abaixo representa a distribuição de probabilidades simulada e sobre ela foi ajustada uma gaussiana a fim de caracterizar a não aderência desta variável a uma distribuição normal.
Na figura abaixo são apresentadas as distribuições de frequências para as médias em amostras em 10, 20, 50 e 100 observações extraídas da população indicada acima.
Em acordo com o TCL as distribuições das médias amostrais se aproximam da distribuição de Gauss conforme aumentam os tamanhos das amostras. Adicionalmente tais distribuições possuem média igual à média populacional (no caso 500 e desvio padrão igual ao desvio padrão populacional (no caso 100) dividido para raiz quadrada de n, on de n é o tamanho das amostras.
3 – Exemplificação do Teorema Central do Limite para as amostras aleatórias de uma variável binomial com probabilidade 30 % para o resultado ZERO e 70% para o resultado UM
Uma moeda com vício ao ser lançada apresenta a probabilidade de 70% de resultar uma face e 30% a outra face. Esta é um distribuição binomial para uma variável aleatória com valores possíveis ZERO e UM. Tal distribuição de probabilidades está representada na figura abaixo, aparesentando média igual a 0,70 e desvio padrão igual a 0,46.
Na figura abaixo são apresentadas as distribuições de frequências para as médias em amostras em 10, 20, 50 e 100 lançamentos desta moeda viciada.
Em acordo com o TCL as distribuições das médias amostrais se aproximam da distribuição de Gauss conforme aumentam os tamanhos das amostras. Adicionalmente tais distribuições possuem média igual à média populacional (no caso 0,70) e desvio padrão igual ao desvio padrão populacional (no caso 0,46) dividido para raiz quadrada de n, on de n é o tamanho das amostras.
Comentários finais
A importância de se realizar tais simulações, além de exemplificar o TLC, está em se perceber quão rapidamente as médias amostrais das diversas distribuições NÃO normais convergem para a distribuição de Gauss. Tal também pode ser notado em outra postagem sobre o tema: Exemplificação do Teorema Central do Limite na soma de 5 variáveis aleatórias.
Uma apresentação contendo todas as simulações se encontra disponível no ResearchGate ou em http://www.if.ufrgs.br/~lang/. Ao final da apresentação também disponibilizo as sintaxes para reproduzir duas das simulações com o pacote SPSS.
Para uma ilustração do TLC com dados reais sobre umidade relativa vide Médias Amostrais de Umidade Relativa.
Vide outras postagens sobre o Teorema Central do Limite.
ADICIONADO em10/02/2022 – Para uma simulação interessante do TCL, por indicação do Prof. Leonardo Heidemann (IF-UFRGS), vide TLC.
“Docendo discimus.” (Sêneca)
Visualizações entre 27 de maio de 2013 e novembro de 2017: 1064.