Prévia do material em texto
iiii
ÍNDICE
4. DISTRIBUIÇÕES TEÓRICAS................................................................................................63
4.1. INTRODUÇÃO...........................................................................................................................63
4.2. DISTRIBUIÇÕES TEÓRICAS DISCRETAS......................................................................................64
4.2.1 Prova de Bernoulli ..................................................................................................................................64
4.2.2 Distribuição binomial ............................................................................................................................65
4.2.3 Distribuição binomial negativa. ..........................................................................................................65
4.2.4 Distribuição geométrica. .......................................................................................................................66
4.2.5 Distribuição hipergeométrica. ..............................................................................................................67
4.2.6 Distribuição de Poisson. ........................................................................................................................68
4.3 DISTRIBUIÇÕES TEÓRICAS CONTÍNUAS................................................................................69
4.3.1 Distribuição uniforme ............................................................................................................................69
4.3.2 Distribuição exponencial .......................................................................................................................70
4.3.3 Distribuição normal ...............................................................................................................................71
4.4 TEOREMA DO LIMITE CENTRAL............................................................................................74
4.5 APROXIMAÇÕES ENTRE AS DISTRIBUIÇÕES..........................................................................74
D I S T R I B U I Ç Õ E S T E Ó R I C A S
63636363
4. Distribuições Teóricas
4.1. Introdução
Existem variáveis aleatórias que têm uma função de distribuição pertencente a
uma classe de distribuições teóricas. As distribuições teóricas, que como o nome
indica foram sujeitas a um estudo prévio, têm propriedades conhecidas que nos
permitem numa situação em que a distribuição esteja identificada, tirar partido
desse trabalho teórico que já foi efectuado e assim pouparmos tempo na análise
do problema que estivermos a estudar. As distribuições teóricas que nós vamos
estudar são as seguintes:
Caso discreto
• Distribuição binomial
• Distribuição binomial negativa
• Distribuição geométrica
• Distribuição hipergeométrica
• Distribuição de Poisson
Caso contínuo
• Distribuição uniforme
• Distribuição exponencial
• Distribuição normal
Algumas distribuições teóricas contínuas (como a distribuição t de Student, a
distribuição qui-quadrado e a distribuição F de Snedecor) irão ser estudadas no
capítulo 5, onde são aplicadas em contextos muito próprios.
Capítulo
4
D I S T R I B U I Ç Õ E S T E Ó R I C A S
64646464
4.2. Distribuições teóricas discretas
4.2.1 Prova de Bernoulli
A prova de Bernoulli é uma experiência aleatória que serve de base a várias
distribuições teóricas que vamos estudar (a distribuição binomial, a distribuição
binomial negativa e a distribuição geométrica).
Consideremos uma experiência aleatória na qual existem apenas dois
acontecimentos em que estamos interessados: o acontecimento A que
designaremos por sucesso e o acontecimento contrário, A , que designaremos
por insucesso. O sucesso ocorre com probabilidade p , e o insucesso com
probabilidade pq −= 1 .
O espaço de resultados está assim particionado em dois acontecimentos
{ }A,AS = , em que:
A =sucesso;
A =insucesso;
p)A(P = ;
pq)A(P −== 1 .
A uma experiência aleatória com as características anteriores dá-se o nome de
prova de Bernoulli.
Sucessão de provas de Bernoulli:
Vamos definir sucessão de provas de Bernoulli como o processo caracterizado por
repetidas provas que têm lugar nas seguintes condições:
1- Em cada prova só estamos interessados em dois acontecimentos, A ou
A .
2- A probabilidade de sucesso, designada por p , mantém-se constante de
prova para prova. A probabilidade de insucesso designa-se por
pq −= 1 .
3- As provas são independentes, isto é, os resultados obtidos numa
sequência de provas não influenciam os resultados da(s) prova(s)
subsequente(s).
D I S T R I B U I Ç Õ E S T E Ó R I C A S
65656565
4.2.2 Distribuição binomial
Consideremos uma sucessão de n provas de Bernoulli. A variável aleatória que
representa o número de sucessos obtidos nas n provas de Bernoulli tem
distribuição binomial.
X = variável aleatória que representa o número de sucessos obtidos na realização
de uma sucessão de n provas de Bernoulli.
X tem distribuição binomial com parâmetros n e p )p,n(BX ∩⇔ com
{ }n,...,,x 10∈ .
Os parâmetros n e p são dois valores que é necessário conhecer para que a
distribuição da variável aleatória fique completamente definida. Os valores que a
variável pode tomar são representados por x , e pode ser qualquer valor inteiro
desde 0 até n.
A probabilidade da variável aleatória tomar o valor x é dada por:
( ) n...,,,,xqp
x
n
p;n;xb)xX(P xnx 10=⋅⋅
=== − (1)
Demonstra-se que se a variável aleatória X tem distribuição binomial com
parâmetros n e p então:
pn)X(E ⋅= (2)
qpn)X(Var ⋅⋅= (3)
4.2.3 Distribuição binomial negativa.
Consideremos uma sucessão de provas de Bernoulli. A variável aleatória que
representa o número de provas realizadas até obtermos k sucessos tem
distribuição binomial negativa.
X = variável aleatória que representa o número de provas de Bernoulli realizadas
até obtermos k sucessos.
X tem distribuição binomial negativa com parâmetros k e p )p,k(BNX ∩⇔
com { },...k,kx 1+∈ .
Os parâmetros k e p são dois valores que é necessário conhecer para que a
distribuição da variável aleatória fique completamente definida. Os valores que a
variável pode tomar são representados por x , e pode ser qualquer valor inteiro
desde k até ∞+ .
A probabilidade da variável aleatória tomar o valor x é dada por:
D I S T R I B U I Ç Õ E S T E Ó R I C A S
66666666
( )
1
( ) ; ; , 1, ...
1
k x k
x
P X x bn x k p p q x k k
k
−
−
= = = ⋅ ⋅ = + −
(4)
Demonstra-se que se a variável aleatória X tem distribuição binomial negativa
com parâmetros k e p então:
p
k
)X(E = (5)
( )
2p
qk
XVar
⋅
= (6)
4.2.4 Distribuição geométrica.
A distribuição geométrica é um caso particular da distribuição binomial negativa
em que 1=k .
Consideremos uma sucessão de provas de Bernoulli. A variável aleatória que
representa o número de provas realizadas até obtermos 1 sucesso tem
distribuição geométrica.
X = variável aleatória que representa o número de provas de Bernoulli realizadas
até obtermos 1 sucesso.
X tem distribuição geométrica com parâmetro p )p(GX ∩⇔ com
{ },...,x 21∈ .
O parâmetro p é um valor que é necessário conhecer para que a distribuição da
variável aleatória fique completamente definida. Os valores que a variável pode
tomar são representados por x , e pode ser qualquer valor inteiro desde 1 até ∞+ .
A probabilidade da variável aleatória tomar o valor x é dada por:
( ) ...,,xqpp;xg)xX(P x 211 =⋅=== − (7)
Demonstra-se que se a variável aleatória X tem distribuição geométrica com
parâmetro p então:
p
)X(E
1
= (8)
2p
q
)X(Var = (9)
D I S T R I B U I Ç Õ E S T E Ó R I C A S
67676767
4.2.5 Distribuição hipergeométrica.
Suponhamos que temos um conjunto de N elementos e que M destes elementostêm uma certa característica em que estamos interessados (sucesso); logo os
outros N-M elementos não têm essa característica.
Ao retirarmos n elementos do conjunto inicial de N elementos (retirar de forma
aleatória e sem reposição) consideremos X a variável aleatória que representa o
número de elementos que são retirados e que têm a característica em que estamos
interessados.
A variável aleatória definida nas condições anteriores tem distribuição
hipergeométrica com parâmetros N, M e n )n,M,N(HX ∩⇔ .
A probabilidade da variável aleatória tomar o valor x é dada por:
( )
−
−
⋅
===
n
N
xn
MN
x
M
n;M;N;xh)xX(P (10)
com ( ){ } { }M,nmin...,,MNn,máxx −−= 0
Demonstra-se que se a variável aleatória X tem distribuição hipergeométrica com
parâmetros N, M, n então:
N
M
n)X(E ⋅= (11)
−
−
⋅
−
⋅⋅=
1N
nN
N
MN
N
M
n)X(Var (12)
D I S T R I B U I Ç Õ E S T E Ó R I C A S
68686868
4.2.6 Distribuição de Poisson.
A distribuição de Poisson (que deve o seu nome ao físico francês Simon Poisson)
está associada a um grande conjunto de situações práticas cujos alguns exemplos
são os seguintes:
• Número de chamadas telefónicas que chegam num período de uma hora a
uma central telefónica.
• Número de microorganismos numa determinada quadrícula de 1mm2 de
área.
• Número de partículas defeituosas num cm3 de volume de um certo
líquido.
• Número de defeitos num metro de comprimento, dum fio produzido por
uma máquina têxtil.
Todos os exemplos apresentados têm uma característica comum: a variável
aleatória em estudo representa o número de ocorrências de um certo
acontecimento ao longo de um dado espaço contínuo (tempo, comprimento, área
ou volume). Os valores que a variável aleatória pode tomar são valores inteiros
não negativos: ,...n,...,,10 .
Outras características que devem estar presentes para que estejamos na presença
de uma distribuição de Poisson são:
• O número de ocorrências em intervalos não sobrepostos são variáveis
independentes.
• A probabilidade de um certo número de ocorrências se verificar é a mesma
para intervalos da mesma dimensão; isto é, aquela probabilidade depende
apenas da amplitude do intervalo e não da posição em que se situa nesse
intervalo.
• As ocorrências do fenómeno descrito verificam-se uma a uma e nunca em
grupos.
A variável aleatória definida nas condições anteriores tem distribuição de Poisson
com parâmetro λ )(PX λ∩⇔ .
O parâmetro λ representa o número médio de ocorrências no espaço contínuo
em estudo.
A probabilidade da variável aleatória tomar o valor x é dada por:
( ) ...,,,x
!x
e
;xp)xX(P
x
210=
λ⋅
=λ==
λ−
(13)
D I S T R I B U I Ç Õ E S T E Ó R I C A S
69696969
Demonstra-se que se a variável aleatória X tem distribuição de Poisson com
parâmetro λ então:
λ=)X(E (14)
λ=)X(Var (15)
4.3 Distribuições teóricas contínuas
4.3.1 Distribuição uniforme
Consideremos uma variável aleatória contínua, cujos valores podem ocorrer
dentro dum intervalo limitado (aberto ou fechado) ( )b,a . Se quaisquer dois sub--
intervalos de igual amplitude têm a mesma probabilidade, então a variável
aleatória tem distribuição uniforme.
Diz-se que a variável aleatória contínua X tem distribuição uniforme no intervalo
( )b,a e escreve-se )b,a(UX ∩ se a sua função de densidade de probabilidade
for dada por:
1
( )
0 outros valores
a x b
f x b a
⋅λ= λ− x,e)x(f x (20)
onde λ é o parâmetro caracterizador da distribuição, sendo 0>λ .
Demonstra-se que se a variável aleatória X tem distribuição exponencial de
parâmetro λ então:
λ
=
1
)X(E (21)
2
1
λ
=)X(Var (22)
A distribuição exponencial está intimamente ligada com a distribuição de
Poisson. Demonstra-se que se o número de ocorrências de um certo
acontecimento segue uma distribuição de Poisson, a “medida de espaço” entre
duas ocorrências consecutivas ou a “medida de espaço” até à primeira ocorrência
segue uma distribuição exponencial. A distribuição exponencial é também
usualmente utilizada na descrição do tempo de vida de aparelhos, de organismos,
etc – lei de falhas exponencial.
Exemplo 4.1:
Consideremos uma variável aleatória X que representa o número de clientes que
chegam a uma certa agência bancária num período de uma hora. Suponhamos
que )(PX 4∩ . Podemos concluir que em média chegam 4 clientes por hora.
Consideremos agora uma variável Y que representa o tempo entre duas
chegadas consecutivas de clientes à mesma agência bancária. Se em média
chegam 4 clientes por hora podemos concluir que o tempo médio entre chegadas
é de
4
1
da hora, ou seja 15 minutos.
Como vamos ver a seguir existe um teorema que nos garante que a variável
aleatória Y tem distribuição exponencial com parâmetro 4 . A unidade de tempo
considerada para a variável Y é exactamente o comprimento do período de
contagem da variável aleatória X que lhe está associada.
D I S T R I B U I Ç Õ E S T E Ó R I C A S
71717171
Teorema
Consideremos uma variável aleatória X que tem distribuição de Poisson com
parâmetro λ para um certo intervalo de espaço contínuo (tempo, comprimento,
área ou volume). A variável aleatória contínua que representa o comprimento de
espaço entre duas ocorrências consecutivas tem distribuição exponencial com o
mesmo parâmetro λ .
Nota: A unidade de medida da variável Y é o comprimento do intervalo de
contagem da variável X , tornando-se assim importante que este seja do
comprimento de uma unidade do espaço contínuo em que estamos a trabalhar.
4.3.3 Distribuição normal
A distribuição normal é a distribuição mais utilizada na estatística. A grande
maioria das variáveis aleatórias contínuas que descrevem processos físicos ou
características humanas seguem uma distribuição normal. Por vezes, as variáveis
aleatórias não seguem distribuição normal mas aproximam-se muito desta
distribuição. Por outro lado, a distribuição normal desempenha um papel crucial
na inferência estatística (capítulo 6).
Diz-se que uma variável aleatória contínua X tem distribuição normal e escreve-
se ( )σµ∩ ;NX se a sua função densidade de probabilidade for dada por:
2
2
2
2
1
σ⋅
µ−
−
⋅
πσ
=
)x(
e)x(f com +∞de probabilidades na distribuição normal.
Seja ( )σµ∩ ;NX . Calcular o valor de )bXa(P ≤≤ implica calcular o valor
de: ∫ σ⋅
µ−
−
⋅
πσ
b
a
)x(
dxe 2
2
2
2
1
o que não é um cálculo trivial.
Poderíamos construir uma tabela que nos desse o valor da função de distribuição
para diversos pontos da variável mas nesse caso teríamos de ter um infinito
número de tabelas (já que existem infinitas distribuições normais). No entanto,
dado que pelo teorema anterior qualquer distribuição normal pode ser reduzida à
distribuição ( ));NZ 10∩ , existe uma tabela para a função de distribuição da
variável Z que tem distribuição normal com média 0 e desvio padrão 1. Esta
função vamos representar por )zZ(P)z( ≤=Φ .
D I S T R I B U I Ç Õ E S T E Ó R I C A S
73737373
Deste modo para calcular o valor de )( bXaP ≤≤ e dado que este valor é o
mesmo que
σ
µ−
Φ−
σ
µ−
Φ=
σ
µ−
≤≤
σ
µ− ab
)
b
Z
a
(P vamos utilizar a
tabela da função de distribuição da normal reduzida.
Teorema da aditividade da normal
Consideremos n variáveis aleatórias independentes )n,...,,i(X i 21= em que
);(NX iii σµ∩ . A variável ∑
=
=
n
i
iXS
1
tem a seguinte distribuição:
σµ∩= ∑ ∑∑
= ==
n
i
n
i
ii
n
i
i ;NXS
1 1
2
1
(26)
Como resultados do teorema anterior podemos deduzir:
Corolário 1
Se )n,...,,i(X i 21= são variáveis aleatórias independentes em que
);(NX i σµ∩ então :
( )σ⋅µ⋅∩= ∑
=
n;nNXS
n
i
i
1
(27)
Corolário 2
Se );(NX 111 σµ∩ e );(NX 222 σµ∩ e forem independentes então:
( )222
12121 σ+σµ+µ∩+ ;NXX (28)
( )222
12121 σ+σµ−µ∩− ;NXX (29)
Corolário 3
Se );(NX i σµ∩ então
n
X
X
n
i
i∑
== 1 tem distribuição:
σ
µ∩
n
;NX (30)
D I S T R I B U I Ç Õ E S T E Ó R I C A S
74747474
Teorema do limite central
Seja )n,...,,i(X i 21= uma sucessão de n variáveis aleatórias i.i.d.
(independentes e identicamente distribuídas), com ( ) µ=iXE e ( ) 2σ=iXVar ,
quando ∞→n , isto é, para n suficientemente grande (em geral 30≥n ), a
variável ∑
=
=
n
i
iXS
1
tem aproximadamente a seguinte distribuição:
( )n;nNXS
n
i
i σµ∩= ∑
=
o
1
(31)
4.4 Aproximações entre as distribuições
É possível utilizar um conjunto de relações existentes entre as diferentes
distribuições (sob certas condições) para calcular probabilidades de forma
aproximada. As diferentes relações existentes encontram-se esquematizadas na
figura seguinte:
De notar que no caso em que a variável em causa é uma variável discreta
(binomial e/ou Poisson) e se utiliza a distribuição normal (distribuição contínua)
para o cálculo da probabilidade pretendida deveremos utilizar a chamada
correcção de continuidade:
( ) ( )5050 ,kX,kPkXP +>>>−−−−∧∧∧∧>>>>
≤≤≤≤≤≤≤≤
5)1(5
9,01,0
pnnp
p
−−−−====σσσσ
====µµµµ
)1(2
pnp
np
N
M
p ====
n
>>>>∨∨∨∨>>>λλλλ
>>>>λλλλ
λλλλ====σσσσ====µµµµ 2
Poisson
λλλλ