Prévia do material em texto
EESSTTAATTÍÍSSTTIICCAA IINNFFEERREENNCCIIAALL
Prof. Weber Campos
webercampos@gmail.com
www.olaamigos.com.br
Estatística Inferencial www.olaamigos.com.br
Prof. Weber Campos 2
ÍNDICE DA APOSTILA
Probabilidade
Variáveis Aleatórias
Distribuições de Probabilidades
Função Distribuição de Probabilidade
Valor Esperado de uma Variável Aleatória
Variância de uma Variável Aleatória
Distribuições Especiais de Probabilidade
Distribuições Discretas
Distribuição Uniforme Discreta
Distribuição de Bernoulli
Distribuição Binomial
Distribuição Hipergeométrica
Distribuição de Poisson
Distribuições Contínuas
Distribuição Uniforme Contínua
Distribuição Normal
Amostragem
Intervalo de Confiança
Intervalo de Confiança para a Média
Intervalo de Confiança para a Proporção
Determinação do tamanho da amostra
Correlação
Regressão Linear
Teste de Hipóteses
Passo a passo do teste de Hipótese para a Média
Passo a passo do teste de Hipótese para a Proporção
Tipos de erros em um teste de hipóteses
EXERCÍCIOS
Distribuição Binomial
Distribuição Hipergeométrica
Distribuição de Poisson
Distribuição Normal
Variável Aleatória
Regressão Linear
Intervalo de Confiança
Teste de Hipóteses
Teste do Qui-Quadrado
Estatística Inferencial www.olaamigos.com.br
Prof. Weber Campos 3
PROBABILIDADE
1. CONCEITOS INICIAIS
Ocorre que a Teoria da Probabilidade faz uso de uma nomenclatura própria, de modo que há três
conceitos fundamentais que temos que passar imediatamente a conhecer: Experimento Aleatório, Espaço
Amostral e Evento.
# Experimento Aleatório: é o experimento que mesmo repetido diversas vezes sob as mesmas condições,
podem apresentar resultados diferentes.
Exemplos de experimento aleatório:
lançar um dado e observar o resultado;
lançar duas moedas e observar o número de caras obtidas;
selecionar uma carta de um baralho de 52 cartas e observar seu naipe.
# Espaço Amostral: é nada mais, senão o “conjunto dos resultados possíveis” de um Experimento
Aleatório.
Designaremos o Espaço Amostral por “S”. Consideremos os exemplos abaixo, e determinemos os
respectivos espaços amostrais:
a) lançar um dado, e observar a face de cima.
S = {1, 2, 3, 4, 5, 6}
b) lançar duas moedas e observar as faces de cima.
S = { (cara, cara); (cara, coroa); (coroa, cara); (coroa, coroa) }
c) lançar duas moedas e observar o número de caras.
S = {0, 1, 2}
d) Verificar, uma a uma, o número de peças defeituosas em um lote de 15 peças.
S = {0, 1, 2, 3,..., 14, 15}
O terceiro conceito essencial ao estudo da Probabilidade é o conceito de Evento.
# EVENTO: um evento será um subconjunto do Espaço Amostral. Designaremos um evento por uma letra
maiúscula.
Diremos que ocorreu um evento A, quando o resultado do Experimento Aleatório for pertencente ao
subconjunto A.
Entendamos melhor por meio do exemplo abaixo:
Experimento Aleatório: lançar um dado e observar a face para cima.
Espaço Amostral: S={1, 2, 3, 4, 5, 6} n(S) = 6
Evento A: obter um resultado par no lançamento do dado.
A = { 2, 4, 6 } n(A)=3
Evento B: obter um múltiplo de 2 no lançamento do dado.
B = { 2, 4, 6 } n(B)=3
Evento C: obter um resultado maior ou igual a 7 no lançamento do dado.
C = { } (ou seja: vazio!) n(C)=0
Quando isso acontecer, estaremos diante de um “evento impossível”!
Evento D: obter um resultado menor do que 7 no lançamento do dado.
D = {1, 2, 3, 4, 5, 6} (igual ao espaço amostral) n(D)=6
Quando isso acontecer, estaremos diante de um “evento certo”!
Estatística Inferencial www.olaamigos.com.br
Prof. Weber Campos 4
2. FÓRMULA ELEMENTAR DA PROBABILIDADE
Fórmula da Probabilidade: a probabilidade de ocorrência de um evento “X”, dado determinado
experimento aleatório, e considerando que cada elemento do espaço amostral deste experimento tem a
mesma probabilidade, será calculada por:
Prob(X) = n(X) = número de resultados favoráveis ao evento X
n(S) número de resultados possíveis
Onde: n(S) é o número de elementos do espaço amostral do experimento; e
n(X) é o número de elementos do evento X.
Como dissemos, a fórmula acima é aplicável quando os elementos do espaço amostral tiverem a
mesma probabilidade. Por exemplo, num lançamento de uma moeda “honesta” (não viciada), com faces
cara e coroa, essas duas faces têm a mesma chance de serem sorteadas, daí terão a mesma
probabilidade. No entanto, se tivermos uma moeda viciada, a chance de sorteio de uma das faces é maior
que a da outra, daí as probabilidades das faces serão diferentes.
Portanto, podemos usar a fórmula da probabilidade supracitada para o primeiro caso (o da moeda
honesta), mas, para o segundo caso (o da moeda viciada), não é possível.
3. TEOREMAS DA PROBABILIDADE
Destacamos os seguintes teoremas:
1. O menor valor que a probabilidade de um evento pode ter é 0 (indicando que o evento é impossível) e o
maior valor é 1 (indicando que o evento certamente irá ocorrer). Então, em geral:
0 P(X) 1
2. A soma das probabilidades de cada elemento do espaço amostral é igual a 1.
No caso do lançamento de um dado, teremos, então, que:
P(1)+P(2)+P(3)+P(4)+P(5)+P(6) = 1
3. A probabilidade de ocorrência de um evento X somada com a probabilidade de não ocorrência desse
mesmo evento é igual a 1.
Prob(X ocorrer) + Prob(X não ocorrer) = 1
Dizemos que os eventos “X ocorrer” e “X não ocorrer” são eventos complementares. Portanto, a
soma das probabilidades de eventos complementares é igual a 1.
Em termos de conjunto, dois eventos complementares A e B podem ser representados como:
São também exemplos de eventos complementares:
P(ganhar o jogo) + P(não ganhar o jogo) = 1
P(réu inocente) + P(réu culpado) = 1
P(cara) + P(coroa) = 1
P(par no dado) + P(ímpar no dado) = 1
P(a nota é no mínimo 2) + P(a nota é menor do que 2) = 1
P(a nota é no máximo 9) + P(nota igual a 10) = 1
P(nascer pelo menos 1 menina) + P(nascer nenhuma menina) = 1
A
B
Estatística Inferencial www.olaamigos.com.br
Prof. Weber Campos 5
Esta relação será utilizada muitas vezes nas soluções de questões de probabilidade. Através dela,
podemos calcular a probabilidade de um evento ocorrer a partir da probabilidade do evento complementar.
Por exemplo, se uma questão pede a probabilidade de ocorrer pelo menos uma cara no lançamento de
três moedas viciadas. É mais fácil calcular a probabilidade do evento complementar, ou seja, calcular
P(nenhuma cara), pois só temos uma situação favorável, a qual é: (coroa, coroa, coroa). Achada esta
probabilidade, é só lançar na nossa relação para encontrar a probabilidade da ocorrência do evento
desejado na questão. Resolveremos exemplos deste tipo mais adiante.
4. PROBABILIDADEDE EVENTOS INDEPENDENTES
Dois eventos, A e B, são independentes quando a ocorrência, ou não-ocorrência, de um deles não
afeta a probabilidade de ocorrência do outro.
Por exemplo, ao efetuarmos dois lançamentos sucessivos de uma moeda, os eventos “cara no
primeiro lançamento” e “coroa no segundo lançamento” são eventos independentes, uma vez que o
resultado do primeiro lançamento da moeda não afeta a probabilidade de ocorrência do resultado coroa no
segundo lançamento.
Porém, ao retirarmos duas cartas sem reposição de um baralho, os eventos “às na primeira retirada”
e “valete na segunda retirada” são eventos dependentes, porque ao retirarmos a primeira carta, dada a
ocorrência, ou não, do “ás”, o total de cartas do baralho sofrerá uma redução, alterando desta forma a
probabilidade da segunda carta.
E se retirarmos duas cartas com reposição, esses eventos serão independentes? Quando repomos
a carta retirada, o número de cartas de cada tipo (às, valete, dama,...) não se altera e nem, é claro, o total
de cartas. Desta forma, a probabilidade da segunda carta retirada não dependerá da primeira carta, por
conseguinte, os eventos são independentes!
Quando dois eventos, A e B, são independentes a probabilidade do evento B ocorrer dado que A
ocorreu, simbolizada por P(B|A), será sempre igual a P(B), porque, por definição, não existe relação entre a
ocorrência de tais eventos. Logo, temos a igualdade:
Prob(B|A) = Prob(B)
Naturalmente, também teremos:
Prob(A|B) = Prob(A)
5. PROBABILIDADE DE EVENTOS MUTUAMENTE EXCLUSIVOS
Dois eventos, A e B, são mutuamente exclusivos se eles não podem ocorrer simultaneamente. Quer
dizer que se um evento ocorreu, o outro certamente não ocorreu.
Por exemplo, em apenas dois lançamentos de uma moeda, os resultados possíveis são:
S = { (cara, cara); (cara, coroa); (coroa, cara); (coroa, coroa) }
Os eventos “ocorrer duas caras” e “ocorrer duas coroas” são mutuamente exclusivos, pois eles não
podem ocorrer simultaneamente. Se um deles ocorre, o outro não ocorre. Mas os eventos “ocorrer
exatamente 1 cara” e “ocorrer exatamente 1 coroa” não são mutuamente exclusivos, pois se o resultado do
primeiro lançamento for cara e o resultado do segundo lançamento for coroa, já teremos uma situação em
que os dois eventos ocorrem ao mesmo tempo.
Se A e B forem eventos mutuamente exclusivos, ou seja, se eles não podem ocorrer
simultaneamente (ou em termos de conjunto: A B = ), então teremos:
P(A|B) = 0;
P(B|A) = 0;
Prob(A e B) = 0.
Dois eventos mutuamente exclusivos são representados graficamente por dois círculos sem
interseção.
Exemplo: Considere o experimento aleatório do lançamento de um dado, e os seguintes eventos:
Evento A: “resultado no dado menor do que 3”
Evento B: “resultado no dado maior do que 4”
Estatística Inferencial www.olaamigos.com.br
Prof. Weber Campos 6
Evento C: “resultado no dado maior do que 1 e menor do que 6”
Os eventos A e B são mutuamente exclusivos? E A e C? E B e C?
Solução:
O conjunto dos resultados do evento A é: {1, 2}.
O conjunto dos resultados do evento B é: {5, 6}.
O conjunto dos resultados do evento C é: {2, 3, 4, 5}.
Observe que A e B não têm elementos em comum (A B = ). Logo os eventos A e B são
mutuamente exclusivos.
No entanto, temos elementos em comum entre A e C, e entre B e C. Logo “A e C” e “B e C” não
são mutuamente exclusivos.
A representação por diagramas de conjuntos para esses três eventos é:
Vejamos mais alguns exemplos de eventos mutuamente exclusivos:
1) Evento A: “Em uma retirada, resultar um ás”
Evento B: “Em uma retirada, resultar um valete”
2) Evento A: “No nascimento de 2 crianças, nascer 2 meninas”
Evento B: “No nascimento de 2 crianças, nascer 2 meninos”
3) Evento A: “time do Inter ganhar”
Evento B: “time do Inter perder”
4) Evento A: “Em dois lançamentos, obter duas caras”
Evento B: “Em dois lançamentos, obter duas coroas”
5) Evento A: “o atleta brasileiro ganhar medalha de ouro”
Evento B: “o atleta brasileiro não ganhar medalha de ouro”
6) Evento A: “o número sorteado é ímpar”
Evento B: “o número sorteado é par”
7) Evento A: “No nascimento de 2 crianças, nascer pelo menos 1 menina”
Evento B: “No nascimento de 2 crianças, nascer nenhuma menina”
Existe, frequentemente, alguma confusão com respeito à distinção entre eventos mutuamente
exclusivos, eventos independentes e eventos complementares.
Se dois eventos são complementares, então certamente eles são mutuamente exclusivos; mas a
recíproca nem sempre é verdadeira. (Para dois eventos serem complementares, um evento deve ser a
negação do outro!) Na lista acima de eventos mutuamente exclusivos, apenas os três últimos (5, 6 e 7) são
eventos complementares.
Por que os eventos do terceiro exemplo da lista acima não são complementares? Para serem
complementares, a negação do evento A deveria ser o evento B; mas não é, pois a negação do “Inter
ganhar” é o “Inter perder ou empatar”.
B A
C
Estatística Inferencial www.olaamigos.com.br
Prof. Weber Campos 7
E os eventos do segundo exemplo, por que não são complementares? A negação de “nascer 2
meninas” não é “nascer dois meninos”, e sim “nascer no máximo 1 menina” que inclui os resultados:
(menina, menino); (menino, menina); (menino, menino).
Dois eventos complementares ou dois eventos mutuamente exclusivos apresentam a mesma
característica de que não ocorrem simultaneamente, ou seja, a ocorrência de um evento implica na não-
ocorrência do outro; enquanto eventos independentes são aqueles em que a probabilidade de ocorrência de
um, não é afetada pela ocorrência do outro. Portanto, os eventos complementares e os eventos
mutuamente exclusivos são altamente dependentes!
6. PROBABILIDADE DA INTERSECÇÃO DE EVENTOS (Regra do “e”)
Dados dois eventos, A e B, a probabilidade de ocorrência simultânea dos eventos A e B é igual a:
Prob(A e B) = Prob(A) x Prob(B|A)
Onde Prob(B|A) significa a probabilidade de ocorrer B sabendo que A já tenha ocorrido.
Se A e B forem eventos independentes (a ocorrência de um deles não afeta a probabilidade de
ocorrência do outro), então a probabilidade de ocorrência de A e B, ao mesmo tempo, será encontrada pelo
produto das probabilidades individuais! Assim, a regra do “e” fica simplificada para:
Prob(A e B) = Prob(A) x Prob(B)
E ainda, caso os eventos A e B sejam mutuamente exclusivos (eventos que não podem ocorrer
simultaneamente, ou em termos de conjunto: AB=). Assim, no nascimento de uma criança, o evento
“nascer menina” e o evento “nascer menino” são mutuamente exclusivos, uma vez que ao se realizar um
deles, o outro não se realiza. Desta forma, a probabilidade de ocorrência de A e B, ao mesmo tempo, será
igual a zero. Na notação simbólica, teremos:
Prob(A e B) = 0.
7. PROBABILIDADE DA UNIÃO DE EVENTOS (Regra do “ou”)
Prob(A ou B) = Prob(A) + Prob(B) – Prob(A e B)
Reparemos bem na terceira parcela da fórmula acima: Prob(A e B). Esta parcela trata acerca da
probabilidade de ocorrência simultânea dos eventos A e B.
Aprendemos que, caso os eventos A e B sejam eventos independentes, então a probabilidade de
ocorrência de A e B, ao mesmo tempo, será encontrada pelo produto das probabilidades individuais! Certo?
Desta forma, para os eventos independentes, a regra do “ou” fica simplificada para:
Prob(A ou B) = Prob(A) + Prob(B) – Prob(A)xProb(B)
E também sabemos que se os eventos A eB forem mutuamente exclusivos, a probabilidade de
ocorrência desses dois eventos, ao mesmo tempo, será igual a zero. Assim, para eventos mutuamente
exclusivos, a regra do “ou” fica simplificada para:
Prob(A ou B) = Prob(A) + Prob(B)
8. PROBABILIDADE CONDICIONAL
Probabilidade condicional será a probabilidade de ocorrência de um evento “A”, dado que
sabemos que ocorreu um outro evento “B”.
Fórmula de Probabilidade condicional:
)(
)(
)()(
YP
YeXP
YXPYdadoXP
Estatística Inferencial www.olaamigos.com.br
Prof. Weber Campos 8
VARIÁVEIS ALEATÓRIAS
1. VARIÁVEIS ALEATÓRIAS
Sejam E um experimento e S o espaço amostral associado ao experimento. Uma função X, que
associe a cada elemento sS um número real X(s) é denominada Variável Aleatória.
Exemplo: O experimento consiste no lançamento de duas moedas:
X: nº de caras obtidas nas duas moedas.
S: {(cara, cara), (cara, coroa), (coroa, cara), (coroa, coroa)}
Daí, a variável X define uma variável aleatória discreta, que pode assumir os valores 0, 1 e 2.
Exemplo: O um experimento consiste em verificar as alturas de 30 universitários, a função:
X = "Altura de um universitário"
S: [130cm, 220cm}
Daí, a variável X define uma variável aleatória contínua, que pode assumir quaisquer valores entre
130 cm e 220 cm.
Podemos, então, conceituar:
Variável aleatória discreta: assume um número finito de valores.
Variável aleatória contínua: assume qualquer valor dentro de um certo intervalo (quantidade não-
enumerável de valores).
2. DISTRIBUIÇÂO DE PROBABILIDADE
Se uma variável aleatória X pode assumir os valores x1, x2, ... ,xn com probabilidades
respectivamente iguais a P(x1), P(x2), ... , P(xn) , tais que
1)(
1
n
i i
xP
, tem-se definida uma
distribuição de probabilidade.
Se a variável X em questão for discreta, sua distribuição é caracterizada por uma função de
probabilidade P(X=x) ou, simplesmente, P(x), também chamada de função massa de probabilidade,
que associa probabilidades não nulas aos possíveis valores da variável aleatória.
P(x) pode ser expressa por uma tabela, gráfico ou fórmula.
Exemplo: Consideremos a v.a. X = "número de caras em duas jogadas de uma moeda". Daí, teremos a
seguinte distribuição de probabilidades:
xi P(xi)
0 P(0) = 1/4 = 0,25
1 P(1) = 2/4 = 0,50
2 P(2) = 1/4 = 0,25
soma=1
X(s) s
X
S R
Estatística Inferencial www.olaamigos.com.br
Prof. Weber Campos 9
Daí, podemos afirmar que:
- A função massa de probabilidade de X no ponto x=0 é: 0,25.
- A função massa de probabilidade de X no ponto x=1 é: 0,50.
- A função massa de probabilidade de X no ponto x=2 é: 0,25.
Representação Gráfica:
P(x)
Ao contrário de uma variável aleatória discreta, uma variável aleatória contínua pode assumir
qualquer valor fracionário dentro de um intervalo definido de valores. Desta maneira, para distribuições de
probabilidade, não se consegue enumerar todos os possíveis valores de uma variável aleatória contínua
com os valores de probabilidade correspondentes. Em lugar disso, a abordagem mais conveniente é
construir uma FUNÇÃO DE DENSIDADE DE PROBABILIDADE, ou curva de probabilidade.
A função densidade probabilidade (f.d.p.) - f(x) - deverá possuir as seguintes propriedades:
I. f(x) 0, para todo x .
II. A área sob f(x) é igual a 1.
A distribuição de probabilidade de uma variável contínua mais conhecida é a Distribuição Normal
cuja expressão e gráfico da função densidade de probabilidade são mostrados a seguir:
2
2
.2
2
.
..2
1
)(
x
exf
f(x)
x
3. FUNÇÃO DE DISTRIBUIÇÃO ACUMULADA DE PROBABILIDADE OU FUNÇÃO DE
DISTRIBUIÇÃO DE PROBABILIDADE
Definimos esta função como sendo a probabilidade de que X assuma um valor menor ou igual a x,
isto é:
F(x) =
)( xXP
Para uma variável aleatória discreta, teremos:
0,50
0,25
Estatística Inferencial www.olaamigos.com.br
Prof. Weber Campos 10
F(x) =
)( xXP
=
xx
i
i
xP )(
Exemplo:
xi P(xi) xi F(xi)
0 0,25 0 F(0) = P(0) = 0,25
1 0,50 1 F(1) = P(0)+P(1) = 0,25+0,50 = 0,75
2 0,25 2 F(2) = P(0)+P(1)+P(2) = 0,25+0,50+0,25 = 1
Representação Gráfica:
F(x)
Para uma variável aleatória contínua, teremos:
F(x) =
)( xXP
= é igual à área sob f(x) delimitada a direita pelo valor x em questão.
O cálculo da probabilidade por meio da função distribuição:
P(a<X<b) = F(b) – F(a)
4. VALOR ESPERADO DE UMA VARIÁVEL ALEATÓRIA
O valor esperado de uma variável aleatória ou esperança matemática ou expectância ou Média,
simbolizada por E(X) ou , é definida:
- Para uma variável aleatória discreta:
E(X) = =
)( ii xPx
Onde:
)(xP
é a função massa de probabilidade.
- Para uma variável aleatória contínua:
E(X) = =
dxxfx )(
Onde:
)(xf
é a função densidade de probabilidade.
O valor da integral acima equivale à área entre a curva da função
)(xfx
e o eixo X. (No cálculo
da área total lembrar que a área situada acima do eixo X é positiva e, abaixo do eixo X, negativa.)
Exemplo: Para a variável aleatória discreta "número de caras em duas jogadas de uma moeda", tem-se:
xi P(xi) xi . P(xi)
0 0,25 0
1 0,50 0,50
2 0,25 0,50
)( ii xPx
= 1
Ou seja, a média (o valor esperado) é 1 cara!
0,75
0,25
1
1 2 x
Estatística Inferencial www.olaamigos.com.br
Prof. Weber Campos 11
4.1. Propriedades do Valor Esperado
Considerando as variáveis aleatórias X e Y, e a constante k, temos as seguintes propriedades para
o Valor Esperado (Média):
I. O Valor Esperado de uma constante:
E(k) = k
II. O Valor Esperado do produto de uma constante por uma variável:
E(k.X) = k.E(X)
III. O Valor Esperado da soma (ou subtração) de uma variável por uma constante:
E(X ± k) = E(X) ± k
IV. O Valor Esperado da soma (ou subtração) de duas variáveis:
E(X ± Y) = E(X) ± E(Y)
V. O Valor Esperado do produto de duas variáveis independentes:
E(X.Y) = E(X).E(Y), se X e Y forem independentes.
5. VARIÂNCIA DE UMA VARIÁVEL ALEATÓRIA
A Variância é uma medida de dispersão que indica o quão próximos ou quão afastados estão os
elementos, em relação a um determinado referencial - a média aritmética dos elementos.
A fórmula da Variância, numa população, é dada por:
n
XX
V
i
2)( (1) ou
n
X
X
n
V
i
i
2
21 (2)
Sabendo que a média é dada por
n
X
X
i
, podemos também expressar a fórmula da variância
em função de
X
:
2
2
X
n
X
V
i
(3)
A equação acima tem o mesmo significado que:
Variância = média(X
2
) – (média(X))
2
Usando o símbolo E(x) para a média, teremos:
Variância =E(X
2
) - [E(X)]
2
Esta última expressão pode ser aplicada tanto para variável discreta como para variável
contínua.
5.1. Propriedades da Variância:
I. A variância de uma constante k:
V(k) = 0
II. A variância do produto de uma constante por uma variável:
V(k.X) = k
2
.V(X)
III. A variância da soma (ou subtração) de uma variável por uma constante:
V(X ± k) = V(X)
IV. A variância da soma (ou subtração) de duas variáveis independentes:
V(X ± Y) = V(X) + V(Y)
Estatística Inferencial www.olaamigos.com.br
Prof. Weber Campos 12
DISTRIBUIÇÕES ESPECIAIS DE PROBABILIDADE
1. DISTRIBUIÇÕES DISCRETAS
1.1 DISTRIBUIÇÃO UNIFORME DISCRETA
Enquadram-se aqui as distribuições em que os possíveis valores da variável aleatória tenham todos
a mesma probabilidades de ocorrência. Logo, se existem n valores possíveis, cada um terá probabilidade
igual a 1/n.
Ex.: Seja um lançamento de um dado e a variável aleatória X = “valor da face superior do dado”, tem-se
que:
xi pi
1 1/6
2 1/6
3 1/6
4 1/6
5 1/6
6 1/6
soma=1
O gráfico da função massa de probabilidade para o caso do dado é mostrado abaixo.
A média de uma variável aleatória discreta uniforme é a própria média aritmética dos valores
extremos.
EXEMPLO: Joga-se um dado uma única vez. Qual o valor esperado do número obtido? E sua variância?
variável aleatória X = “valor da face superior do dado”
A v.a. X assume: {1, 2, 3, 4, 5, 6} . Cada resultado tem a mesma probabilidade 1/6.
Então, E(X) = 1.(1/6) + 2.(1/6) + 3.(1/6) + 4.(1/6) + 5.(1/6) + 6.(1/6) = 21/6 = 3,5
ou mais fácil: E(X) = (1 + 6)/2 = 3,5
E(X
2
) = 1
2
.(1/6) + 2
2
.(1/6) + 3
2
.(1/6) + 4
2
.(1/6) + 5
2
.(1/6) + 6
2
.(1/6) = 91/6
Var(X) = E(X
2
) – [E(X)]
2
= 91/6 – (21/6)
2
= 2,92
1.2 DISTRIBUIÇÃO DE BERNOULLI
A distribuição de Bernoulli se caracteriza pela existência de apenas dois eventos, mutuamente
exclusivos, que denominaremos de sucesso e fracasso, num experimento que é realizado uma única vez.
Se a probabilidade de sucesso é p, a probabilidade de fracasso é, evidentemente, 1-p.
É uma distribuição deste tipo o lançamento de uma moeda uma única vez. Se apostarmos na cara,
sendo esta, então, a probabilidade de sucesso é p = 1/2. e a probabilidade de fracasso (coroa) é 1-p =
1- 1/2 = 1/2.
Da mesma forma se, num lançamento de um dado, apostamos num número, digamos, o 3, este
será o sucesso, sendo qualquer um dos outros cinco números o fracasso. Nesse caso, a probabilidade de
sucesso é p = 1/6, e a probabilidade de fracasso é 1-p = 1 - 1/6 = 5/6.
Outros exemplos de v.a. de Bernoulli:
- O sexo do primeiro filho de um casal ser masculino ou feminino.
- Uma peça produzida por uma fábrica ser perfeita ou defeituosa.
1 2 3 4 5 6 x
P(x)
1/6
Estatística Inferencial www.olaamigos.com.br
Prof. Weber Campos 13
Associando-se uma variável aleatória X aos possíveis resultados do experimento, de forma que:
X = 1, se o resultado for sucesso e
X = 0, se o resultado for fracasso.
Então, a variável aleatória X tem distribuição de Bernoulli, com p sendo a probabilidade de ocorrer
sucesso e (1-p) a probabilidade de ocorrer fracasso.
P(X=x) = (1-p) para x = 0
p para x = 1
O gráfico da função massa de probabilidade para uma situação genérica é mostrado abaixo.
A média e a variância de uma variável aleatória de Bernoulli são dadas por:
E(X) = p e Var(X) = p(1-p)
EXEMPLO: No caso do dado, em que se aposta em um único número, atribuindo o valor 1 para o sucesso e
0 para o fracasso, determine a média e a variância do resultado após um jogada.
E(X) = 1 . 1/6 + 0 . 5/6 = 1/6 ou E(X) = p = 1/6
Var(X) = p(1-p) = 1/6(1 – 1/6) = 5/36
1.3 DISTRIBUIÇÃO BINOMIAL
Em uma questão de distribuição binomial normalmente não vem explícito no enunciado que se trata
de tal distribuição, então temos que saber reconhecer uma distribuição binomial, e faremos isso verificando
as seguintes características:
1) Ela tratará de um experimento que se repetirá n vezes, sempre mantidas as mesmas condições originais.
2) Cada tentativa é independente da outra.
3) Este experimento só admite dois resultados: sucesso e fracasso.
4) Tais resultados (sucesso e fracasso) são mutuamente excludentes, ou seja, ocorrendo um, o outro está
automaticamente descartado.
5) A cada repetição do experimento, as probabilidades de sucesso p e de fracasso q se mantêm
constantes.
Se todas as características acima forem satisfeitas, então estaremos diante de uma questão de
distribuição binomial.
Se uma variável tem distribuição binomial, diremos que:
X B(n,p)
Essa simbologia significa que os parâmetros n e p definem uma distribuição binomial.
Probabilidade Binomial:
A questão de distribuição binomial fará a seguinte pergunta:
Qual a probabilidade de se obter exatamente S sucessos, em n tentativas?
A resposta será encontrada a partir da seguinte fórmula:
0 1 x
P(x)
1-p
p
Estatística Inferencial www.olaamigos.com.br
Prof. Weber Campos 14
Prob(S sucessos)=Cn,S.(p)
S
.(q)
F
Onde:
Cn,s=
)!(!
!
sns
n
n é o número de repetições do experimento;
p é a probabilidade de ocorrência de sucesso;
q é a probabilidade de ocorrência de fracasso;
S é o número de sucessos desejados;
F é o número de fracassos.
A média e a variância de uma variável aleatória Binomial são dadas por:
E(X) = np e Var(X) = np(1-p)
EXEMPLO: Num determinado processo de fabricação, 10% das peças produzidas são consideradas
defeituosas. As peças são acondicionadas em caixas com 5 unidades cada uma.
a) Qual a probabilidade de haverem quatro ou mais peças defeituosas em uma caixa?
Sol.:
P(X4) = P(X=4) + P(X=5) =
14
4,5 )1,01(1,0 C
+
05
5,5 )1,01(1,0 C
P(X4) = 0,00045 + 0,00001 = 0,00046
b) Qual o valor esperado do número de peças defeituosas em uma caixa que contém 5 unidades?
Sol.:
E(X) = np = 5 . Prob(peça defeituosa) = 5 . 0,1 = 0,5 peça
1.4 DISTRIBUIÇÃO HIPERGEOMÉTRICA
Quando a retirada de itens é feita sem reposição, a probabilidade de sucesso é modificada à
medida que os itens são retirados, desta forma não podemos aplicar a probabilidade Binomial. A
distribuição hipergeométrica é a distribuição discreta de probabilidade apropriada quando existir retiradas
sem reposição.
Fórmula para determinar a probabilidade hipergeométrica:
P(elemento tal ocorra k vezes em n sorteios) = Cm,k.CN-m,n-k / CN,n
Onde: N = quantidade total de elementos do grupo
n = quantidade de elementos a serem sorteados (retirados aleatoriamente)
k = quantidade desejada de repetição do elemento especificado nos n sorteios
m = número de ocorrências do elemento especificado no grupo
1.5 DISTRIBUIÇÃO DE POISSON
A distribuição de Poisson é empregada em experimentos nos quais não se está interessado no
número de sucessos obtidos em n tentativas, como ocorre no caso da distribuição binomial, mas sim no
número de sucessos ocorridos durante um intervalo contínuo, que pode ser um intervalo de tempo, espaço,
etc. Como por exemplo:
- O número de vezes que o telefone toca em um dia.- O número de acidentes automobilísticos ocorridos numa rodovia em um mês.
- O número de defeitos encontrados em um rolo de arame de 500m.
Note que nos exemplos acima, não há interesse em se determinar a probabilidade do telefone tocar,
ou do acidente ocorrer, ou do defeito existir,... mas sim a freqüência de sua ocorrência, como, por exemplo,
o telefone tocar 10 vezes por dia.
Probabilidade de Poisson:
Estatística Inferencial www.olaamigos.com.br
Prof. Weber Campos 15
Uma questão de probabilidade com a distribuição de Poisson fará a seguinte pergunta:
Qual a probabilidade de se obter S ocorrências, neste determinado intervalo (de tempo, de espaço
etc)?
E essa probabilidade é obtida a partir da fórmula:
Prob(S ocorrências) =
!S
eS
Onde: Prob(S) é a probabilidade de S ocorrências no intervalo;
é o valor esperado ou número médio de ocorrências no intervalo;
e = 2,71828...
2. DISTRIBUIÇÕES CONTÍNUAS
2.1 DISTRIBUIÇÃO UNIFORME CONTÍNUA
A função densidade probabilidade da distribuição uniforme contínua é dada por:
Parâmetros característicos:
E(X) =
2
ba
e Var(X) =
12
)( 2ab
2.2 DISTRIBUIÇÃO NORMAL
Se uma variável tem distribuição normal, diremos que:
X N(,2)
A Curva Normal é simétrica em relação à média
(ela divide a distribuição ao meio)! Assim, as três
medidas de posição: média, mediana e moda possuem o mesmo valor.
Porcentagens especiais sob a curva normal
Freqüência
-3
-2
-1
+1
+2
+3 Variável X
68,3%
95,5%
99,7%
a b x
f(x)
1/(b-a)
Estatística Inferencial www.olaamigos.com.br
Prof. Weber Campos 16
A Curva Normal Padronizada apresenta: =0 e 2=1.
A variável normal padronizada será chamada de Z: Z N(0,1)
z=-3 z=-2 z=-1 0 z=1 z=2 z=3 Variável Z
Qualquer distribuição normal particular (X) pode ser transformada na variável normal padronizada (Z), da
seguinte forma:
)(
X
Z
Fazendo essa transformação, encontraremos na tabela a área sob a curva normal padronizada, e que
corresponderá à probabilidade que estamos procurando!
68,3%
95,5%
99,7%
Estatística Inferencial www.olaamigos.com.br
Prof. Weber Campos 17
CORRELAÇÃO
Coeficiente de Correlação Linear (r): O valor de r varia de -1 a +1.
1) Correlação Perfeita Positiva (r=+1) 2) Correlação positiva (0<r<1)
3) Correlação Perfeita Negativa (r= -1) 4) Correlação negativa (-1<r<0)
5) Correlação Nula (r=0)
Mais algumas informações que precisamos conhecer:
1ª) A correlação entre x e x é igual a 1. Ou seja: r(x,x)=1,0. E também temos que:
r(-x, x)=-1,0
r(x, -x)=-1,0
r(-x,-x)=1,0
2ª) A correlação entre x e y é igual à correlação entre y e x. Ou seja:
r(x,y) = r(y,x)
3ª) A correlação não é influenciada nem por operações de soma, nem de subtração, nem de produto, e nem
de divisão, exceto pelo sinal.
r(axb, cyd) = r(x,y)
r(axb, –cyd) = r(x,–y) = –r(x,y)
r(–axb, cyd) = r(–x,y) = –r(x,y)
r(–axb, –cyd) = r(–x,–y) = r(x,y)
Fórmula do Coeficiente de Correlação Linear:
n
Y
Y
n
X
X
n
YX
YX
yxr
i
i
i
i
ii
ii
2
2
2
2
),( (I)
Mas há outra forma de calculá-lo, é através da seguinte fórmula:
22 )()(
))((
),(
YYXX
YYXX
yxr
ii
ii
(II)
x
y y
x
y
y
y
x x
x
Estatística Inferencial www.olaamigos.com.br
Prof. Weber Campos 18
REGRESSÃO LINEAR
Equação de uma reta
A equação de uma reta tem a seguinte cara: y = a + bx.
Esta reta sempre corta o eixo vertical no ponto (x=0, y=a) e o eixo horizontal no ponto (x=
b
a
, y=0).
O valor constante a da expressão (a+bx) é chamado coeficiente linear ou intercepto-y (porque a
reta intercepta o eixo Oy em y=a).
O coeficiente b da expressão (a+bx) é chamado coeficiente angular e está associado ao grau de
inclinação da reta em relação ao eixo horizontal Ox. Quanto maior o módulo (valor absoluto) de b, maior
será a inclinação da reta, tendendo a vertical; e quando b se aproxima de zero a reta diminui a inclinação,
tendendo a horizontal.
Através do sinal de b, podemos saber se a reta é crescente, decrescente ou constante.
Se b>0 a reta será crescente.
Se b<0 a reta será decrescente.
Se b=0 a reta será paralela ao eixo horizontal.
Reta da Regressão Linear:
Cada Y pode ser escrito em função de cada X da seguinte forma:
Yi = + Xi + i
Sendo +X a equação da reta, e o termo do erro. Este último termo tem de ser incluído porque o
valor de Y não será dado exatamente pelo ponto da reta a ser encontrada.
O próximo passo é encontrar ou, melhor dizendo, estimar a reta de regressão, uma vez que sempre
estaremos trabalhando com uma amostra, o que implica que não teremos os valores de e , mas sim de
seus estimadores.
Se a e b são estimativas de e , respectivamente, a reta de regressão estimada é:
ii bXaY
ˆ
onde
iYˆ
é o Yi estimado.
O método a ser utilizado pressupõe que queiramos estimar uma reta que tenha menos erro. O
método mais usado para ajustar uma linha reta a um conjunto de pontos é conhecido como método dos
mínimos quadrados. Por este método, a reta resultante será aquela cuja soma dos quadrados dos erros
for mínima (isto é, nenhuma outra reta daria menor soma dos quadrados de tais erros).
No processo de estimação via o método de mínimos quadrados, em uma amostra de n pares de
valores de X e Y, as estimativas a e b dos parâmetros do modelo linear são apresentadas abaixo.
Estimativa b do parâmetro :
n
X
X
n
YX
YX
b
i
i
ii
ii
2
2
ou
2
XX
YYXX
b
i
ii
Estimativa a do parâmetro :
n
X
b
n
Y
a
ii
Como
n
X
X
i
e
n
Y
Y
i
, então podemos escrever:
XbYa
.
Estatística Inferencial www.olaamigos.com.br
Prof. Weber Campos 19
Relação entre o Coeficiente de Correlação (r) e o Coeficiente Angular da Regressão Linear (b):
X
Y
SS
rb
Onde:
b = coeficiente angular da reta de regressão
r = coeficiente de correlação linear simples
SX = desvio padrão dos dados da variável x (já foi vista a fórmula do desvio padrão)
SY = desvio padrão dos dados da variável y (já foi vista a fórmula do desvio padrão)
Temos outras duas relações entre b e r que nos podem ser úteis:
n
X
X
n
Y
Y
rb
i
i
i
i
2
2
2
2
22
ou
2
2
22
XX
YY
rb
i
i
Nas duas expressões acima aparece o termo 2r . Como bem sabemos, esse é o quadrado do
coeficiente de correlação linear (também chamado de coeficiente de correlação de Pearson). Mas existe um
nome especial para 2r que é: Coeficiente de Determinação (ou Explicação).
Estatística Inferencial www.olaamigos.com.br
Prof. Weber Campos 20
AMOSTRAGEM
A inferência estatística envolve a formulação de certos julgamentos sobre um todo após examinar
apenas uma parte – ou amostra – dele. E em nosso dia-a-dia, muitas vezes nós usamos uma amostra para
julgar um todo, mas nem percebemos que fazemos isso. Quando queremos verificar se certo alimento é
saboroso, comemos apenas um pequeno pedaço; a cozinheira prova a sopa para verificar se precisa de um
pouco mais de sal; quando passamos os olhos sobre um novo livro ou uma revista para ver se vamos
comprar; quando assistimos um programa de TV por uns poucos segundos ou minutos para decidir se
mudamos ou não um canal,...
A amostragem estatística é semelhante a cada um dos exemplos acima, embora seus métodos
sejam mais formais.
Mas, para as inferências serem corretas, é necessário garantir que a amostra seja representativa
da população, isto é, a amostra deve possuir as mesmas características básicas da população, no que diz
respeito ao fenômeno que desejamos pesquisar. E para tanto, ela deve ser retirada segundo determinadas
técnicas de amostragem.
# Técnicas (ou processos) de Amostragem
Ao coletarmos uma amostra podemos fazê-la com reposição ou sem reposição, caso a amostragem
seja realizada com reposição, um mesmo indivíduo tem chance de pertencer mais de uma vez a amostra, o
que não acontece, no caso da amostragem ser sem reposição. Independentemente da maneira como a
amostra é coletada (com ou sem reposição) o importante é que os indivíduos que comporão a amostra
deverão ser selecionados através de uma técnica de amostragem adequada.
Para a escolha do processo de amostragem, o pesquisador deve levar em conta o tipo de pesquisa,
a acessibilidade aos elementos da população, a disponibilidade ou não de ter os elementos da população, a
representatividade desejada ou necessária, a oportunidade apresentada pela ocorrência de fatos ou
eventos, a disponibilidade de tempo, recursos financeiros e humanos etc.
As técnicas de amostragem são divididas em dois grupos: Amostragem Probabilística e
Amostragem Não-Probabilística.
Amostragem Probabilística (ou Aleatória ou Casual): é aquela em que cada elemento da população
tem uma chance conhecida e diferente de zero de ser selecionado para compor a amostra. Em outras
palavras: todas as fases necessárias para a escolha dos elementos que constituirão a amostra são
baseadas em “sorteios”.
As amostragens probabilísticas geram amostras probabilísticas (com distribuição normal, ou
binomial, ...).
Dentre as amostragens probabilísticas se destacam:
- Amostragem Aleatória Simples
- Amostragem Sistemática
- Amostragem Estratificada
- Amostragem por Conglomerado
Amostragem Não-Probabilística (ou Não-Aleatória ou Não-Casual): é aquela em que a seleção dos
elementos da população para compor a amostra depende ao menos em parte do julgamento do
pesquisador ou do entrevistador no campo. Dentre estas se destacam:
- Amostragem por Conveniência
- Amostragem por julgamento
- Amostragem por quotas
Estatística Inferencial www.olaamigos.com.br
Prof. Weber Campos 21
# Detalhamento da Principais Técnicas de Amostragem Probabilística
o Amostragem Aleatória Simples
Este tipo de amostragem é equivalente a um sorteio lotérico.
Na prática, a amostragem aleatória simples pode ser realizada enumerando-se todos os indivíduos
da população (por exemplo, de 1 a n) e sorteando-se, a seguir, por meio de um dispositivo aleatório
qualquer, uma quantidade (digamos k) de números dessa seqüência, os quais corresponderão aos
elementos pertencentes à amostra.
Exemplo: Deseja-se pesquisar a estatura dos 80 alunos que estudam em uma escola, para isso
resolveu-se retirar uma amostra de 10% do total de alunos. Usando a amostragem aleatória simples,
mostre como pode ser feita a seleção da amostra.
Sol.:
A população é formada pelos 80 alunos da escola. E a amostra será formada pelos alunos
sorteados. Sendo o tamanho da amostra de 10% do total de 80 alunos, ou seja, 8 alunos.
1º passo: Numeramos os alunos de 01 a 80. Podemos elaborar uma lista com o número ao lado do
nome do aluno.
2º passo: Escrevemos os números de 01 a 80 em pedaços iguais de um mesmo papel, colocando-
os dentro de uma caixa. Agitamos a caixa para misturar bem os pedaços de papel.
3º passo: Retiramos, um a um, oito números que formarão a amostra.
Pronto! Medindo as alturas dos alunos correspondentes aos números sorteados, obteremos uma
amostra das estaturas dos noventa alunos.
Para evitar o trabalho de escrever os números em pedaços de papel, sobretudo se a população é
muito grande, foi elaborada uma tabela – Tabela de Números Aleatórios – construída de modo que os dez
algarismos (0 a 9) são distribuídos ao acaso nas linhas e colunas. Então, para compor uma amostra de 8
números, só é preciso selecionar 8 números que estejam dispostos em uma coluna ou linha ou diagonal da
tabela. Esse grupo de 8 números selecionados equivale ao sorteio dos 8 papeizinhos.
Não vou expor a tabela de números aleatórios, porque ela não virá na prova. A minha intenção é
somente dar conhecimento da existência dessa tabela.
o Amostragem Sistemática
Quando os elementos da população já se acham ordenados, não há necessidade de construir um
sistema de referência. São exemplos: os prontuários médicos de um hospital, as casas de uma rua, uma
linha de produção etc. Nestes casos, a seleção dos elementos que constituirão a amostra pode ser feita por
um sistema imposto pelo pesquisador. A esse tipo de amostragem denominamos Sistemática.
Ela é uma simplificação do processo anterior. Neste caso, apenas o primeiro elemento da amostra
será sorteado, e os demais serão retirados em uma progressão aritmética, com razão k, em que:
n
N
k
,
Onde: N = tamanho da população e n = tamanho da amostra até se completar o tamanho da
amostra desejado.
Exemplo:
Suponhamos uma rua contendo 600 prédios, dos quais desejamos obter uma amostra formada de 50
prédios. Podemos, neste caso, usar o seguinte procedimento: como 600/50=12, escolhemos por sorteio um
número de 1 a 12 (inclusive), o qual indicaria o primeiro elemento sorteado para a amostra; os demais
elementos seriam periodicamente considerados de 12 em 12. Assim, se o número sorteado fosse o número
10, tomaríamos, pelo lado direito da rua, o 10º prédio, o 22º, o 34º, o 46º etc., e ao terminar o lado direito
voltamos ao início da rua, pelo lado esquerdo, para continuar a contagem, a fim de completar a amostra dos
50 prédios.
Estatística Inferencial www.olaamigos.com.brProf. Weber Campos 22
o Amostragem Estratificada
Muitas vezes a população se divide em subpopulações – estratos. Exemplos: Numa escola
podemos separar os alunos em dois estratos: meninos e meninas; numa pesquisa podemos separar as
pessoas por faixas (estratos) de idade; ou separar as pessoas de acordo com a formação escolar: nível
secundário, nível médio e nível superior; para as propriedades rurais criar estratos de acordo com o
tamanho: 0|--10, 10|--20, 20|--30 hectares.
Como é provável que a variável em estudo apresente, de estrato em estrato, um comportamento
heterogêneo e, dentro de cada estrato, um comportamento homogêneo, convém que o sorteio da amostra
leve em consideração tais estratos.
É exatamente isso que fazemos quando empregamos a amostragem estratificada.
Quanto à forma de retirar os elementos dos estratos para compor a amostra, é classificada em:
Uniforme
Quando é retirado o mesmo número de elementos em cada estrato, independentemente do
tamanho do estrato.
Proporcional
Quando o número de elementos retirado em cada estrato é proporcional ao tamanho do estrato.
Para exemplificar os dois tipos de amostragem estratificada descritos, consideremos o seguinte
exemplo.
Exemplo: Supondo, no exemplo feito na amostragem aleatória simples, que, dos 80 alunos da
escola, 50 são meninas e 30 são meninos, vamos realizar uma amostragem estratificada uniforme e
proporcional para um tamanho de amostra de 10%.
Temos dois estratos na população considerada: meninos e meninas.
Por primeiro, analisaremos a amostragem estratificada uniforme.
Neste tipo, o número de meninos e de meninas que vão compor a amostra deve ser igual. Como a
amostra é de 8 alunos (10% de 80), então vamos selecionar (de forma aleatória) 4 meninos e 4 meninas.
Só isso!
E, agora, a amostragem estratificada proporcional.
A determinação do tamanho de cada estrato é mostrada na tabela abaixo.
Sexo População porcentagem da amostra
(10%)
tamanho da amostra
menina 50 10% de 50 5
menino 30 10% de 30 3
Total 80 10% de 80 8
Ficou definido na tabela que a amostra de 8 alunos será formada por 5 meninas e 3 meninos. E o
processo de seleção dessas crianças deve ser feito de maneira aleatória, por exemplo, através da
amostragem aleatória simples.
o Amostragem por Conglomerados
A amostragem por Conglomerado pressupõe a disposição dos itens de uma população em
subgrupos (conglomerados) representativos da população global. Idealmente, cada conglomerado pode ser
encarado como uma minipopulação. Em geral, os conglomerados são grupos de itens que se acham em
estreito contato físico, como casas, quarteirões, bairros, municípios etc.
A amostragem por conglomerados tem duas vantagens muito distintas sobre a amostragem
aleatória simples. Uma é que se os itens da população se acham muito dispersos, uma amostragem
aleatória simples pode acarretar uma considerável despesa, viagens, estadias etc., para ser bem extraída,
ao passo que os itens de cada conglomerado estão próximos uns dos outros. Suponhamos, por exemplo,
que a população de interesse consistisse dos proprietários de automóveis do estado de Minas Gerais. Sem
Estatística Inferencial www.olaamigos.com.br
Prof. Weber Campos 23
dúvida uma amostragem aleatória simples incluiria proprietários em localidades demasiadamente afastadas
no estado, o que dificultaria a coordenação e a padronização na coleta dos dados. Por outro lado, os
conglomerados de municípios ou cidades conteriam proprietários de carros em áreas concentradas,
reduzindo o custo e facilitando a coordenação. Após selecionar aleatoriamente os conglomerados em todo o
estado de Minas Gerais, dentro de cada conglomerado, a amostragem poderia ser aleatória simples,
estratificada, novamente por conglomerados (por exemplo, bairros de uma cidade), ou ainda ser feito um
censo para o caso do conglomerado selecionado não possua muitos indivíduos.
Uma segunda vantagem da amostragem por conglomerado é que não é necessário uma listagem
dos itens da população. Basta uma lista dos conglomerados. Assim, não é possível obter uma listagem de
todos os proprietários de imóveis do Brasil, mas pode-se obter uma lista de estados, ou municípios, ou
cidades. Ou então os conglomerados podem ser quarteirões. Embora não possamos obter uma listagem
das casas de uma cidade, os quarteirões podem, em geral, ser identificados, fazendo-se a seleção por meio
de mapas. Então os quarteirões escolhidos podem ser visitados, identificando-se as casa que comporão a
amostra.
# Detalhamento das Principais Técnicas de Amostragem Não-Probabilísticas
o Amostragem por Conveniência
A amostragem por conveniência é adequada e freqüentemente utilizada para geração de idéias em
pesquisas exploratórias, principalmente.
A amostra por conveniência é empregada quando se deseja obter informações de maneira rápida e
barata. Uma vez que esse procedimento consiste em simplesmente contatar unidades convenientes da
amostragem, é possível recrutar respondentes tais como estudantes em sala de aula, mulheres no
shopping, alguns amigos e vizinhos, entre outros. Os autores comentam que este método também pode ser
empregado em pré-testes de questionários.
Alguns exemplos de pesquisa com amostras por conveniência:
Solicitar as pessoas que voluntariamente testem um produto e que em seguida respondam a uma
entrevista.
Parar pessoas no supermercado e colher suas opiniões.
Colocar linhas de telefone adaptadas para que durante um programa de televisão os
telespectadores possam dar suas opiniões.
o Amostragem por julgamento
O pesquisador escolhe deliberadamente certos elementos da população para formar a amostra,
baseado num pré-julgamento.
Exemplo: Pesquisa de mercado para lançar uma nova marca de leite longa vida tipo A. O pesquisador
selecionará indivíduos com poder aquisitivo médio/alto, que são os principais consumidores deste produto
(publico alvo), embora toda a população independentemente do poder aquisitivo possa ser consumidora
deste produto.
o Amostragem por quotas
É também baseada em um julgamento e não em um processo aleatório. É freqüentemente usada
em pesquisas de opinião e pesquisa de mercado. Neste método deve-se conhecer as características da
população de antemão e, então, usar uma amostra semelhante à população em termos de composição.
O objetivo é obter-se uma amostra que seja representativa da população. A forma da população
deve ser conhecida, pelo menos aproximadamente, à proporção que aparece uma certa quantidade, por
exemplo, as proporções de pessoas de diferentes idades, sexo e grupos étnicos. A amostragem por quotas
busca repetir esses percentuais na amostra. A amostragem por quotas pode ser comparada a uma
amostragem estratificada. A população é estratificada por variáveis importantes, tais como idade, sexo e
localidade e a quota necessária é obtida de cada estrato. Mas a diferença importante é que a amostragem
por quotas não é selecionada por qualquer base aleatória.
Estatística Inferencial www.olaamigos.com.br
Prof. Weber Campos 24
EXERCÍCIOS RESOLVIDOS
01. Para cada uma das seguintes situações diga qual o tipo de amostragem foi utilizada.
a) Para compor a amostra foram sorteados aleatoriamente 10% de homens e 10% de mulheres de
uma cidade. Tipo de Amostragem:________________
b) Numa escola precisa-se dividir 20 pessoas em dois grupos. Para o primeiro grupo ele selecionaaleatoriamente 10 pessoas, e considera os 10 restantes para o segundo grupo. Tipo de
Amostragem: ___________________________
c) Uma lista numerada contém 200 nomes, numerados consecutivamente a partir do número 1.
Iniciando pelo 10º nome, uma amostra foi composta considerando sorteados os nomes referentes
aos números 20, 30, 40, 50 e assim sucessivamente até que fossem escolhidos 10 nomes. Tipo de
amostragem: Amostragem _______________
02. Complete:
a) Na amostragem ______________ cada elemento da população tem a mesma chance de ser
incluído na amostra.
b) Na amostragem ______________a seleção dos itens da população que farão parte da amostra são
escolhidos seguindo uma seqüência fixa, isto é, são escolhidos os itens r, r+k, r+2k, r+3k, e assim
por diante.
c) A amostragem _______________pressupõe a divisão da população em subgrupos de itens
similares, procedendo-se então a amostragem em cada subgrupo.
d) A amostragem _______________pressupõe a disposição dos itens de uma população em
subgrupos heterogêneos representativos da população global, procedendo-se a amostragem dos
subgrupos.
03. (ESAF/AFPS/2002/Administração Tributária Previdênciária) Assinale a opção correta em referência ao
significado do termo amostragem aleatória simples.
a) Refere-se a um método de classificação da população.
b) Refere-se à representatividade da amostra.
c) É um método de escolha de amostras.
d) Refere-se a amostras sistemáticas de populações infinitas.
e) Refere-se à amostragem por quotas.
04. (Ministério da Integração Nacional 2012 Esaf) Para selecionar uma amostra aleatória de tamanho n de
uma população formada por N unidades, que são numeradas de 1 a N segundo uma certa ordem,
escolhe-se aleatoriamente uma unidade entre as k primeiras unidades da população, onde k = N/n e
seleciona-se cada k-ésima unidade da população em sequência. Esta técnica de amostragem
denomina-se amostragem
a) sistemática.
b) por etapas.
c) estratificada.
d) por conglomerados.
e) por quotas.
05. (AFCE-TCDF-2002/CESPE) Julgue os itens seguintes.
1. Quando aplicada em uma população de pessoas formada pelo mesmo número de homens e de
mulheres, uma amostra aleatória simples também apresenta o mesmo número de homens e de
mulheres.
06. (FTE-Alagoas-2002/CESPE) Julgue os seguintes itens.
1. Quando a escolha dos elementos que farão parte de uma amostra é realizada usando-se um
mecanismo probabilístico, diz-se que se trata de amostra por quotas.
Estatística Inferencial www.olaamigos.com.br
Prof. Weber Campos 25
07. (Auditor Fiscal SEFAZ/RJ 2011 FGV) A respeito das técnicas de amostragem probabilística, NÃO é
correto afirmar que
(A) na amostragem por conglomerado a população é dividida em diferentes grupos, extraindo-se uma
amostra apenas dos conglomerados selecionados.
(B) na amostragem estratificada, se a população pode ser dividida em subgrupos que consistem em
indivíduos bastante semelhantes entre si, pode-se obter uma amostra aleatória em cada grupo.
(C) na amostragem aleatória simples se sorteia um elemento da população, sendo que todos os elementos
têm a mesma probabilidade de serem selecionados.
(D) na amostragem por voluntários a população é selecionada de forma a estratificar aleatoriamente os
grupos selecionados.
(E) na amostragem sistemática os elementos da população se apresentam ordenados, e a retirada dos
elementos da amostra é feita periodicamente.
08. (Agente Fiscal do RS 2006 FAURGS) Analise as seguintes informações sobre Amostragem Aleatória
simples.
I. É o processo de retirada de uma amostra da população no qual cada unidade da população tem a
mesma chance de ser retirada.
II. É o processo de retirada de uma amostra da população no qual se conhecem as chances de
retirada de cada unidade, ainda que não sejam idênticas entre si.
III. Para realizar este processo de amostragem, é necessária a utilização de uma tabela de dígitos
aleatórios ou pseudo-aleatórios.
IV. É o único processo de amostragem que garante que a amostra resultante seja representativa da
população.
Quais estão corretas?
a) Apenas I. c) Apenas III. e) Apenas IV.
b) Apenas II. d) Apenas I e III.
09. (Ministério da Integração Nacional 2012 Esaf) Para selecionar uma amostra aleatória de tamanho n de
uma população formada por N unidades, que são numeradas de 1 a N segundo uma certa ordem,
escolhe-se aleatoriamente uma unidade entre as k primeiras unidades da população, onde k = N / n e
seleciona-se cada k-ésima unidade da população em sequência. Esta técnica de amostragem
denomina-se amostragem
a) sistemática.
b) por etapas.
c) estratificada.
d) por conglomerados.
e) por quotas.
10. (ESAF/AFPS/2002/Administração Tributária Previdênciária) Assinale a opção correta em referência ao
significado do termo amostragem aleatória simples.
a) Refere-se a um método de classificação da população.
b) Refere-se à representatividade da amostra.
c) É um método de escolha de amostras.
d) Refere-se a amostras sistemáticas de populações infinitas.
e) Refere-se à amostragem por quotas.
11. (Ministério da Integração Nacional 2012 Esaf) Para selecionar uma amostra aleatória de tamanho n de
uma população formada por N unidades, que são numeradas de 1 a N segundo uma certa ordem,
escolhe-se aleatoriamente uma unidade entre as k primeiras unidades da população, onde k = N/n e
seleciona-se cada k-ésima unidade da população em sequência. Esta técnica de amostragem
denomina-se amostragem
a) sistemática.
b) por etapas.
c) estratificada.
d) por conglomerados.
e) por quotas.
Estatística Inferencial www.olaamigos.com.br
Prof. Weber Campos 26
GABARITO:
01. a) Estratificada Proporcional
b) Aleatória Simples
c) Sistemática
02. a) aleatória simples
b) sistemática
c) estratificada
d) por Conglomerados
03. c
04. a
05. E
06. E (A amostragem por quotas é uma técnica NÃO-PROBABILISTICA)
07. d
08. a
09. c
10. c
11. a
Estatística Inferencial www.olaamigos.com.br
Prof. Weber Campos 27
INTERVALO DE CONFIANÇA
1. INTERVALO DE CONFIANÇA PARA A MÉDIA
O processo de construção do intervalo de confiança para a média de uma população depende se o
desvio padrão da população () é conhecido ou deve ser estimado com base nos valores amostrais (desvio
padrão amostral
S
), e também se o tamanho da amostra é grande (n30).
Mostramos abaixo o intervalo de confiança de acordo com o tamanho da amostra e do
conhecimento do desvio padrão da população:
n
zX
.
: para amostra grande (n≥30) ou com σ conhecido.
n
tX
.
: para amostra pequena (n<30) e com σ desconhecido.
Obs: Caso o desvio padrão populacional – σ – seja desconhecido (não é fornecido ou não pode ser
calculado), usaremos no seu lugar o desvio padrão amostral – s.
A questão fornecerá um nível de confiança (ou grau de confiança), para podermos definir o nosso
intervalo de confiança!
Faremos uma ilustração do intervalo de confiança (IC) para a média populacional, no caso do
desvio padrão populacional conhecido, que é dada pela seguinte fórmula:
IC =
n
zX
.
Teremos o seguinte desenho:
O centro deste intervalo é o
X
, o limite inferior é
X
–
n
z
.
e o limite superior é
X
+
n
z
.
.
Eo desenho do intervalo de confiança sob a curva normal para determinado grau de confiança:
O desenho acima é visto para a variável X, e o desenho equivalente para a variável padronizada Z é
mostrado a seguir.
X
–
n
z
.
X +
n
z
.
X
grau de
confiança
X
X
–
n
z
.
X
+
n
z
.
X
Z
grau de
confiança
–
z
+
z
0
Estatística Inferencial www.olaamigos.com.br
Prof. Weber Campos 28
2. INTERVALO DE CONFIANÇA PARA A PROPORÇÃO
A estimativa de proporções populacionais é muito semelhante à de médias populacionais, com uma
simplificação: a distribuição t de Student não é usada, e assim evita-se completamente o problema t
versus z.
Fórmula do Intervalo de Confiança
A proporção amostral (p) é utilizada como estimativa pontual da verdadeira proporção. Por exemplo,
se estamos interessados em saber a proporção (ou porcentagem) de peças defeituosas num grande lote, e
selecionando uma amostra de 40 peças, encontramos 5 peças defeituosas, então a proporção p da amostra
é 5/40 ou 12,5%.
A estimativa intervalar (intervalo de confiança) da proporção populacional é simétrica em relação à
proporção amostral (p), tal como ocorre com o intervalo para a média populacional em relação à média
amostral (
X
). E a sua fórmula é a seguinte:
n
pp
zp
)1(
.
3. DETERMINAÇÃO DO TAMANHO DA AMOSTRA
O tamanho de uma amostra pode ser calculada com base na margem de erro (E) do intervalo de
confiança!
Vimos que a margem de erro é o valor que é somado e subtraído a estimativa pontual para formar
os limites do intervalo de confiança. Assim:
Para a Média: o intervalo de confiança é:
n
zX
.
, então: E=
n
z
.
Para a proporção: o intervalo de confiança é:
n
pp
zp
)1(
.
, então: E=
n
pp
z
)1(
.
Nesta última, se o valor da proporção p não puder ser obtido a partir dos dados do enunciado da
questão, então consideraremos p igual a 1/2 ou 0,5. (Entre os valores possíveis para p, o valor 1/2 é o pior
caso, no sentindo de a margem de erro ser máxima).
Para encontrarmos o tamanho da amostra, devemos isolar o valor de n na fórmula da margem de
erro.
Estatística Inferencial www.olaamigos.com.br
Prof. Weber Campos 29
TESTES DE HIPÓTESES
# PASSO A PASSO DO TESTE DE HIPÓTESE PARA MÉDIA
1º Passo) Verificar se o Teste é bilateral ou unilateral (à direita ou à esquerda).
Conforme o sinal de H1, teremos a definição do teste a ser realizado:
- H1 com sinal de , o teste deve ser bilateral;
- H1 com sinal de <, o teste deve ser unilateral esquerdo;
- H1 com sinal de >, o teste deve ser unilateral direito.
2º Passo) Definir, conforme os dados da questão, se será utilizada a Curva Normal (Z) ou a Curva de
Student (t).
Lembraremos que a Curva de Student (t) só será usada em um único caso: se (desvio padrão
populacional) for desconhecido e, ao mesmo tempo, n<30. Nos demais casos, será utilizada a curva
Normal (Z).
3º Passo) Fazer o desenho do teste, definindo na linha horizontal inferior, sob a curva, onde estará
localizado o z tabelado ou o t tabelado.
São as seguintes possibilidades:
Com a Curva Z (Normal Padronizada):
Teste Bilateral Teste Unilateral Direito Teste Unilateral Esquerdo
-ztab ztab ztab -ztab
Com a Curva t (de Student):
Teste Bilateral Teste Unilateral Direito Teste Unilateral Esquerdo
-ttab ttab ttab -ttab
4º Passo) Descobrir, usando a tabela adequada à situação (a da Curva Normal ou a da t de Student), o z
tabelado ou o t tabelado.
Lembrando que para achar o z tabelado usaremos apenas o nível de significância que será
fornecido pela questão.
Já no caso do t tabelado, usaremos, para encontrá-lo, além do nível de significância , também o
número de graus de liberdade da curva: GL=n-1. (Onde n é o número de elementos da amostra)!
Com este passo, definimos no desenho do teste quais são as áreas de aceitação e de rejeição de
Ho. Nos desenhos que vemos acima, no terceiro passo, as áreas de rejeição de Ho, também chamadas de
regiões críticas, estão sempre marcadas com tracinhos horizontais.
/2 /2
/2 /2
Estatística Inferencial www.olaamigos.com.br
Prof. Weber Campos 30
5º Passo) Calcular, usando a fórmula adequada à situação, o z calculado ou o t calculado.
Para tanto, haverá duas possibilidades:
1ª) Se desvio padrão populacional conhecido ou n30:
n
X
zcalc
2ª) Se desvio padrão populacional desconhecido e n<30:
n
X
tcalc
Obs: Caso o desvio padrão populacional – σ – seja desconhecido (não é fornecido ou não pode ser
calculado), usaremos no seu lugar o desvio padrão amostral – s.
6º Passo) Localizar no desenho do teste onde está o z calculado ou o t calculado, se na área de
aceitação ou na área de rejeição de Ho, para, finalmente, decidir.
O critério de decisão será sempre o mesmo:
Se o t calculado ou o z calculado estiver:
na área de aceitação de Ho, diremos que Ho será aceita;
na área de rejeição de Ho, diremos que Ho será rejeitada.
# PASSO A PASSO DO TESTE DE HIPÓTESE PARA A PROPORÇÃO
Quase tudo que foi explicado sobre o teste de hipótese para a Média, também se aplicará ao teste
de hipótese para a Proporção, conforme veremos no passos mostrados a seguir.
1º Passo) Verificar se o Teste é bilateral ou unilateral (à direita ou à esquerda).
Conforme o sinal de H1, teremos a definição do teste a ser realizado:
- H1 com sinal de , o teste deve ser bilateral;
- H1 com sinal de <, o teste deve ser unilateral esquerdo;
- H1 com sinal de >, o teste deve ser unilateral direito.
2º Passo) Lembrar que devemos usar apenas a Curva Normal (Z).
Nas estimativas das proporções populacionais (assunto visto na aula passada) não usávamos a
distribuição t de Student. Aqui faremos o mesmo, utilizaremos apenas a Curva Normal (Z).
3º Passo) Fazer o desenho do teste, definindo na linha horizontal inferior, sob a curva, onde estará
localizado o z tabelado.
São as seguintes possibilidades:
Estatística Inferencial www.olaamigos.com.br
Prof. Weber Campos 31
Com a Curva Z (Normal Padronizada):
Teste Bilateral Teste Unilateral Direito Teste Unilateral Esquerdo
-ztab ztab ztab -ztab
4º Passo) Descobrir, usando a tabela da Curva Normal,o z tabelado.
Lembrando que para achar o z tabelado usaremos apenas o nível de significância que será
fornecido pela questão.
Com este passo, definimos no desenho do teste quais são as áreas de aceitação e de rejeição de
Ho. Nos desenhos que vemos acima, no terceiro passo, as áreas de rejeição de Ho, também chamadas de
regiões críticas, estão sempre marcadas com tracinhos horizontais.
5º Passo) Calcular o z calculado.
Haverá apenas uma possibilidade:
n
PP
Pp
zcalc
)1(
Onde:
p é a proporção amostral;
P
é a proporção presumida para a população (e que está sendo testada na hipótese H0);
n é o número de elementos da amostra.
No assunto de intervalo de confiança da Proporção, usávamos, dentro da raiz do denominador da
fórmula acima, a proporção amostral p (pêzinho). Mas fazíamos isso porque não conhecíamos a proporção
da população, aliás, estávamos atrás dela. Aqui como temos a proporção presumida para a população –
P
(pêzão), então usaremos esta.
6º Passo) Localizar no desenho do teste onde está o z calculado, se na área de aceitação ou na área de
rejeição de Ho, para, finalmente, decidir.
O critério de decisão será sempre o mesmo:
Se o z calculado estiver:
na área de aceitação de Ho, diremos que Ho será aceita;
na área de rejeição de Ho, diremos que Ho será rejeitada.
/2 /2
Estatística Inferencial www.olaamigos.com.br
Prof. Weber Campos 32
# TIPOS DE ERROS EM UM TESTE DE HIPÓTESES
Erro do Tipo I: ocorre quando rejeitamos a hipótese nula quando ela é verdadeira.
Erro do Tipo II: ocorre quando aceitamos a hipótese nula quando ela é falsa.
A probabilidade de cometer o erro do tipo I é a própria significância do teste, portanto, ela é definida
a priori.
Prob(erro do tipo I) = = significância do teste
Chamamos a probabilidade de cometer o erro do tipo II de . Ou seja:
Prob(erro do tipo II) =
Em um teste de hipóteses, espera-se, naturalmente, que a hipótese nula seja aceita quando
verdadeira e rejeitada quando falsa. Logo, há quatro resultados possíveis num teste, conforme mostrado na
tabela abaixo.
Se H0 é Verdadeira Se H0 é Falsa
Aceitamos H0 Decisão correta! Erro Tipo II
Rejeitamos H0 Erro Tipo I Decisão correta!
Estatística Inferencial www.olaamigos.com.br
Prof. Weber Campos 33
EXERCÍCIOS
DISTRIBUIÇÃO BINOMIAL
01. (Analista Técnico de Políticas Sociais 2012 Esaf) Uma moeda é dita não viciada quando a
probabilidade de ocorrer cara for igual à probabilidade de ocorrer coroa. Assim, lançando-se 6
vezes uma moeda não viciada, a probabilidade de se obter exatamente 5 caras é igual a:
a) 3/32
b) 1/64
c) 3/64
d) 1/32
e) 5/32
02. (AFRFB 2012 Esaf) Em uma cidade de colonização alemã, a probabilidade de uma pessoa falar
alemão é de 60%. Selecionando-se ao acaso 4 pessoas desta cidade, a probabilidade de 3 delas
não falarem alemão é, em valores percentuais, igual a
a) 6,4.
b) 12,26. NULA
c) 15,36.
d) 3,84.
e) 24,5.
DISTRIBUIÇÃO HIPERGEOMÉTRICA
03. (Ministério da Integração Nacional 2012 Esaf) Uma turma de uma escola de primeiro grau tem
30 alunos, dos quais 20 são meninas e 10 são meninos. Ao se escolher ao acaso três alunos da
turma, sem reposição, qual a probabilidade de exatamente 2 dos 3 alunos escolhidos serem
meninas?
a) 1/2
b) 12/27
c) 45/91
d) 95/203
e) 2/3
DISTRIBUIÇÃO DE POISSON
04. (Analista Técnico de Políticas Sociais 2012 Esaf) Amanda é médica ginecologista e, durante os
finais de semana, ela recebe, em média, 2 chamadas por hora em seu telefone celular. Assim, a
probabilidade de, no próximo final de semana, Amanda receber exatamente 3 chamadas em 2
horas é igual a:
a) 43 e-3 / 4!
b) 4-3 e4 / 3!
c) 43 e-4 / 3!
d) 4-3 e-4 / 3!
e) 43 e-4 / 4!
Estatística Inferencial www.olaamigos.com.br
Prof. Weber Campos 34
DISTRIBUIÇÃO NORMAL
05. (Analista Técnico de Políticas Sociais 2012 Esaf) Uma variável aleatória possui distribuição
normal com média igual a 10, μ = 10, e variância igual a 4, σ2 = 4. Retirando-se desta população
uma amostra de tamanho n = 100, tem-se que a distribuição amostral das médias, ou distribuição
amostral de x é uma distribuição:
a) não normal com μ =10 e σ = 1/5
b) normal com μ =10 e σ = 1/5
c) normal com μ =100 e σ2 = 4
d) normal com μ =10 e σ2 = 2
e) não normal com μ =100 e σ2 = 4
06. (Analista Técnico de Políticas Sociais 2012 Esaf) A probabilidade de uma variável aleatória z
com distribuição normal padrão estar no intervalo entre -1,96 e 1,96 desvios padrão é igual a 95%,
isto é: P{-1,96 < z < 1,96} = 95%. Sabe-se que uma variável aleatória contínua x tem distribuição
normal com média 10 e variância 4. Assim, pode-se afirmar que P{x < 6,08} é igual a:
a) P(x < 13,92)
b) P(x > 13,92)
c) P(z < 1)
d) P(z = 1)
e) P(x = 13,92)
07. (AFRFB 2012 Esaf) O Sr. Ramoile, professor de Estatística aposentado, vem há muito tempo
acompanhando os dados sobre custos e faturamento do restaurante de sua filha Cecília. O
restaurante funciona todos os dias da semana e o Sr. Ramoile concluiu que: o custo diário do
restaurante segue uma distribuição normal, com média igual a R$ 500,00 e desvio- padrão igual a
R$ 10,00 e que o faturamento diário, também, apresenta uma distribuição normal, com média R$
800 e desvio-padrão R$ 20. Como o Sr. Ramoile conhece muito bem os princípios básicos da
estatística, ele sabe que, se uma variável Z seguir uma distribuição normal padrão, então Z tem
média 0 e variância 1. Ele também sabe que a probabilidade dessa variável Z assumir valores no
intervalo entre 0 < Z < 2 ─ ou seja, entre a média 0 e 2 desvios-padrão ─ é, aproximadamente, igual
a 0,4772. Cecília, muito preocupada com o futuro de seu restaurante, perguntou a seu pai se ele
poderia verificar a probabilidade de, em um dia qualquer, o custo ser maior do que R$ 520,00 e o
faturamente ficar no intervalo entre R$ 760,00 e R$ 840,00. Após alguns minutos, o Sr. Ramoile
disse, acertadamente, que as respectivas probabilidades são, em termos percentuais, iguais a
a) 2,28; 95,44.
b) 52,28; 95,44.
c) 2,28; 98,69.
d) 98,69; 95,44.
e) 98,65; 2,28.
Estatística Inferencial www.olaamigos.com.br
Prof. Weber Campos 35
08. (Ministério da Integração Nacional 2012 Esaf) Em determinadas situações uma variável
aleatória binomial pode ser adequadamente aproximada por uma variável aleatória normal. Seja X
uma variável aleatória binomial com parâmetros n=900 e p=1/2. Usando essa aproximação,
calcule o valor mais próximo de P(868 ≤ X ≤ 932), considerando os seguintes valores para Φ(z),
onde Φ(z) é a função de distribuição de uma variável aleatória normal padrão Z:
Φ(1,96) = 0,975, Φ(2,17) = 0,985, Φ(2,33) = 0,99 e Φ(2,58) = 0,995.
a) 0,95
b) 0,96
c) 0,97
d) 0,98
e) 0,99
VARIÁVEL ALEATÓRIA
09. (Auditor Fiscal de MG 2005 ESAF) Uma variável aleatória X tem função de distribuição de
probabilidades dada por
Assinale a opção correta.
a) X é do tipo (absolutamente) contínuo e Pr (2 < X 4) = 0,461.
b) X é do tipo discreto e Pr (2 < X 4) = 0,658.
c) X é do tipo discreto e Pr (2 < X 4) = 0,506.
d) X é do tipo(absolutamente) contínuo e Pr (2 < X 4) = 0,506.
e) X não é do tipo discreto nem (absolutamente) contínuo e Pr (2 < X 4) = 0,506.
10. (Analista Técnico de Políticas Sociais 2012 Esaf) A expectância de uma variável aleatória z é
igual a 4, ou seja: E(z) = 4. Sabendo-se que a E(z2) = 20, então o coeficiente de variação de z é igual
a:
a) 1/20
b) 1/5
c) 1/2
d) 1
e) 0
11. (Analista MPU 2004 ESAF) O preço de determinada ação fica constante, aumenta ou diminui
R$ 1,00 por dia com probabilidades 0,3, 0,3 e 0,4 respectivamente. Assinale a opção que dá o valor
esperado do preço da ação amanhã se seu preço hoje é R$ 8,00.
a) R$ 7,90
b) R$ 8,00
c) R$ 7,00
d) R$ 9,00
e) R$ 8,50
Estatística Inferencial www.olaamigos.com.br
Prof. Weber Campos 36
12. (AFRFB 2012 Esaf) A função densidade de probabilidade de uma variável aleatória contínua x é
dada por:
Para esta função, a média de x, também denominada expectância de x e denotada por E(x) é igual
a:
a) -4x/3
b) 3/4
c) -3x/4
d) 4/3
e) -3/4
13. (AFC/STN 2013 Esaf) Seja X uma variável aleatória contínua com função densidade
Desse modo, a probabilidade de x estar no intervalo (0 < x < 1) é igual a:
a) 1/3
b) 1/12
c) 2/5
d) 1/6
e) 1/4
14. (Analista Técnico de Políticas Sociais 2012 Esaf) Uma variável aleatória contínua x é uma
variável uniformemente distribuída no intervalo [a, b] se sua função densidade de probabilidade
for dada por f(x) = 0 para todo x que não pertencer ao intervalo [a , b] e f(x) = 1/(b – a) para a≤x≤b.
Sabendo-se que x é uma variável aleatória contínua uniformemente distribuída no intervalo [0, 2],
então a probabilidade de (1 ≤ x ≤ 3/2) é igual a:
a) 0,5
b) 0,75
c) 0,35
d) 0,15
e) 0,25
REGRESSÃO LINEAR
15. (Ministério da Integração Nacional 2012 Esaf) Determine a reta de regressão de Y em X,
considerando que uma amostra aleatória simples (X1,Y1), (X2,Y2),..., (X22,Y22) forneceu as seguintes
estatísticas: médias amostrais = 4,8 e = 15,3, variâncias amostrais
= 8 e
= 40 e
covariância amostral
= 12.
a) Ŷi = 8,1 + 0,3 Xi
b) Ŷi = 8,1 + 1,5 Xi
c) Ŷi = 15,3 + 1,5 Xi
d) Ŷi = 15,3 + 0,3 Xi
e) Ŷi = 15,3 + 2,25 Xi
Estatística Inferencial www.olaamigos.com.br
Prof. Weber Campos 37
16. (Ministério da Integração Nacional 2012 Esaf) Calcule o coeficiente de determinação R2 da reta
de regressão ajustada da questão anterior.
a) 0,45
b) 0,56
c) 0,64
d) 0,72
e) 0,75
17. (MDIC 2012 Esaf) Considere os valores da variável aleatória Y observados para determinados
valores da variável X.
X 1 2 3 4 5 6 7 8 9 10 11
Y 9 9 6 4 16 9 10 8 19 16 26
Obtenha a expressão mais próxima da reta de regressão de Y em X.
a) Yi = 6 + 1,4 Xi
b) Yi = 3,6 + 0,714 Xi
c) Yi = 12 + 0,714 Xi
d) Yi = 12 + 1,4 Xi
e) Yi = 3,6 + 1,4 Xi
18. (MDIC 2012 Esaf) Com os dados da questão anterior, calcule o valor mais próximo da variação
de Y explicada pela regressão.
a) 250,6 d) 424
b) 154 e) 215,6
c) 110
INTERVALO DE CONFIANÇA
19. (ICMS-SP/2013/FCC) A tabela abaixo apresenta a distribuição de frequências de uma amostra
aleatória de tamanho 100 da variável X, que representa os percentuais de aumento do IPTU do
ano de 2013 relativamente ao ano de 2012, num determinado município.
Suponha que X tem distribuição normal com média desconhecida, μ, e desvio padrão conhecido e
igual a 5%. Utilizando para a estimativa pontual de μ a média aritmética dos 100 valores
apresentados (na tabela acima), calculada considerando que todos os valores incluídos num
intervalo de classe são coincidentes com o ponto médio do intervalo, um intervalo de confiança
para μ, com confiança de 95%, é dado por
(A) (15,64% ; 17,64%)
(B) (15,66% ; 17,62%)
(C) (15,60% ; 17,68%)
(D) (15,34% ; 17,94%)
(E) (15,68% ; 17,60%)
Estatística Inferencial www.olaamigos.com.br
Prof. Weber Campos 38
20. (AFC/STN 2013 Esaf) Para estimar a proporção π de fumantes de uma Universidade, foi
retirada uma amostra aleatória de 1600 universitários. Na amostra foi constatado que 20% dos
universitários são fumantes. Sabe-se que, para construir um intervalo de aproximadamente 95%
de confiança para a proporção, no caso de fumantes, o valor tabelado é aproximadamente igual a
2 desvios-padrão. Com essas informações, e considerando o mesmo nível de confiança, o intervalo
de confiança para a proporção de fumantes e o tamanho da amostra necessário para que o erro
de estimação seja, no máximo, igual a 0,01 são, respectivamente, iguais a:
TESTE DE HIPÓTESES
21. Uma amostra de 49 elementos de uma variável X, normalmente distribuída, forneceu: média
igual a 18 e desvio-padrão igual a 5. Testar, no nível de significância de 5%, a hipótese de que =20
versus a hipótese alternativa de que 20.
z P(Z>z)
1,50 0,067
1,64 0,050
1,96 0,025
22. (Ministério da Integração Nacional 2012 Esaf) A especificação técnica de um produto afirma
que a média de sua característica principal é de 200. Para testar esta afirmação, uma amostra
aleatória simples de tamanho 9 forneceu uma característica média de 187 e desvio padrão
amostral de 26. Calcule o valor mais próximo da estatística t para testar a hipótese nula de que a
média da característica principal do produto é 200, admitindo que a distribuição da característica
é normal.
a) -2,17
b) -1,96
c) -1,89
d) -1,67
e) -1,5
Estatística Inferencial www.olaamigos.com.br
Prof. Weber Campos 39
23. (AFC/STN 2013 Esaf) Em um teste de hipóteses, onde Ho é a hipótese nula e Ha é a hipótese
alternativa, pode-se afirmar que:
a) ocorre Erro Tipo I quando aceita-se Ho e Ho é falsa.
b) a estatística F de Snedecor tem por finalidade testar o efeito individual de cada variável
explicativa sobre a variável explicada.
c) a soma das probabilidades dos Erros Tipo I e Tipo II é igual a 1.
d) se o valor-p de um teste de hipóteses for igual 0,015, então a hipótese nula será rejeitada ao
nível de significância de 5%, mas não ao nível de significância de 1%.
e) o nível de confiança é a probabilidade de se cometer Erro Tipo II.
24. (AFRFB 2012 Esaf) Um modelo de regressão linear múltipla foi estimado pelo método de
Mínimos Quadrados, obtendo-se, com um nível de confiança de 95%, os seguintes resultados:
I. Ŷ = 10 + 2,5 x1 + 0,3 x2 + 2 x3
II. o coeficiente de determinação R2 é igual a 0,9532
III. o valor-p = 0,003
Desse modo, pode-se afirmar que:
a) se a variável x1 for acrescida de uma unidade, então Y terá um acréscimo de 2,5 %.
b) 0,003 é o mais baixo nível de significância ao qual a hipótese nula pode ser rejeitada.
c) x3 explica 95,32% das variações de Y em torno de sua média.
d) as probabilidades de se cometer o Erro Tipo I e o Erro Tipo II são, respectivamente, iguais a 5% e
95%.
e) se no teste de hipóteses individual para β2 se rejeitar a hipótese nula (H0), então tem-se fortes
razões para acreditar que x2 não explica Y.
TESTE DO QUI-QUADRADO
25. (Ministério da Integração Nacional 2012 Esaf) Dos 120 candidatos do sexo masculino que se
submeteram a um concurso, 55 foram aprovados, enquanto dos 180 candidatos do sexo feminino
que se submeteram ao mesmo concurso, 95 foram aprovados. Se desejarmos testara hipótese
estatística de que a proporção de aprovação no concurso independe do sexo dos candidatos,
calcule o valor mais próximo da estatística do teste, que tem aproximadamente uma distribuição
Qui quadrado com um grau de liberdade.
a) 1,91
b) 1,74
c) 1,65
d) 1,58
e) 1,39
Estatística Inferencial www.olaamigos.com.br
Prof. Weber Campos 40
GABARITO
01 A 16 A
02 nula 17 E
03 D 18 E
04 C 19
05 B 20 A
06 B 21 Rejeita-se Ho.
07 A 22 E
08 E 23 D
09 B 24 B
10 C 25 E
11 A
12 E
13 E
14 E
15 E