X

Exemplificação do Teorema Central do Limite na soma de 5 variáveis aleatórias

Esta postagem decorre de um material que preparei para a disciplina de “Métodos Quantitativos aplicados à Pesquisa em Ensino de Física”, oferecida aos mestrandos e doutorandos do Programa de Pós-Graduação em Ensino de Física do Instituto de Física da UFRGS.

Dedico esta postagem especialmente aos alunos da turma do segundo semestre de 2015.

O objetivo da postagem é uma exemplificação do Teorema Central do Limite através da simulação de variáveis aleatórias pelo Método de Monte Carlo.

Respondido por: Prof. Fernando Lang da Silveira - www.if.ufrgs.br/~lang/

Teorema Central do Limite afirma que a soma (S) de N variáveis aleatórias independentes (X), com distribuição e variâncias semelhantes,  é uma variável com distribuição que se aproxima da distribuição de Gauss (distribuição normal) quando N aumenta.

Adicionalmente a média de S é o somatório das médias de X e a variância de S é a soma das variâncias de X.

A seguir são apresentados histogramas para cinco variáveis aleatórias com distribuições NÃO gaussianas (que não obedecem a distribuição de Gauss ou normal) simuladas pelo Método de Monte Carlo. A cada um dos histogramas está ajustada uma curva normal com o objetivo de caracterizar a violação de normalidade para as distribuições das cinco variáveis geradas. A média (M) e o desvio padrão (DP) de cada uma das variáveis também são informados.

var1

var2

var3

var4

var5

A seguir é apresentado o histograma para a variável obtida da soma das cinco variáveis anteriores. A curva normal ajustada a esta última distribuição indica que esta distribuição é com excelente aproximação gaussiana, exemplificando assim o importante  Teorema Central do Limite.

5var

Verifica-se também que a variável SOMA das cinco variáveis apresenta MÉDIA igual a soma das MÉDIAS das cinco variáveis:

M = 176 + 265 + 2474 + 501 + 90 = 3506

Igualmente verifica-se que a variável SOMA das cinco variáveis apresenta VARIÂNCIA igual a soma das VARIÂNCIAS das cinco variáveis:

VAR = 1022 + 952 + 1032 + 1002 + 1002 = 50038

DP = 500381/2 = 224

Vide também Exemplificações do Teorema Central do Limite na distribuição das médias amostrais

Uma apresentação contendo todas as simulações das duas postagens se encontra disponível no ResearchGate. Ao final da apresentação também disponibilizo as sintaxes para reproduzir duas das simulações com o pacote SPSS.

Vide outras postagens sobre o Teorema Central do Limite.

“Docendo discimus.” (Sêneca)

 

COMENTÁRIOS EM 22/05/2018

Ricardo Ivanov – Prof. Lang
Permita-me complementar teu artigo.
O Teorema Central do Limite (TCL), em sua forma usual, é para uma sequência de variáveis aleatórias (X1, X2, …) independentes e identicamente distribuídas, com variância finita (Var[Xi] < infinito). Sob as hipóteses de independência, distribuição idêntica e variância finita, o TCL sempre valerá, tal qual enunciaste.
Todavia, há uma ressalva. O TCL PODE valer para variáveis aleatórias independentes mas NÃO identicamente distribuídas, SE a Condição de Liapunov for satisfeita. (Infelizmente não consigo apresentar a condição de Liapunov nesta caixa de comentários, mas é facilmente encontrada na Internet).
Ou seja, a soma de variáveis aleatórias (ainda que independentes) mas provenientes de distribuições distintas (logo, não identicamente distribuídas) nem sempre convergirá para uma distribuição normal quando n -> infinito.
A condição de Lindeberg-Feller também pode ser utilizada para avaliar a validade do TCL para v.a. não identicamente distribuídas.
Grande abraço!
Fernando Lang da Silveira – A propósito do tema deixo também indicado o texto A Probabilistic Proof of the Lindeberg-Feller Central Limit Theorem.

Visualizações entre 27 de maio de 2013 e novembro de 2017: 957.


Acrescente um Comentário:

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *