Prévia do material em texto
ESTATÍSTICA BÁSICA
Professor: Narcelio de Araújo Pereira
narcelioap@yahoo.com.br
2015
2
SUMÁRIO
UNIDADE 1: PROBABILIDADE ................................................................ 3
UNIDADE 2: DISTRIBUIÇÃO BINOMIAL E NORMAL ..................... 14
UNIDADE 3: CORRELAÇÃO E REGRESSÃO ...................................... 37
REFERENCIAS ........................................................................................... 52
ANEXOS ....................................................................................................... 53
3
I - PROBABILIDADE
1 - Introdução
Neste capítulo, presumiremos que a população é conhecida e calcularemos as
chances de obter várias amostras desta população. Assim, mostraremos que a
probabilidade é o reverso da estatística: na probabilidade usaremos a
informação da população para inferir a natureza provável da amostra.
Sendo assim, as situações marcadas pela possibilidade de ocorrência de mais
de um resultado possível costumam ser analisadas em estatística com o auxílio
das probabilidades. A probabilidade estuda o risco e o acaso em eventos
futuros, determinando se é provável ou não o seu acontecimento.
O cálculo das probabilidades pertence ao campo da Matemática, entretanto a
maioria dos fenômenos de que trata a Estatística são de natureza aleatória ou
probabilística. O conhecimento dos aspectos fundamentais do cálculo da
probabilidade é uma necessidade essencial para o estudo da Estatística
Indutiva ou Inferencial.
Para estudar probabilidades, é necessário definir alguns conceitos e
terminologias usuais, como os relativos a experimento aleatório, espaço
amostral e eventos.
2 - Experimento Aleatório
Suponha que uma moeda foi jogada uma vez e “deu cara”. O resultado que
vemos e registramos é chamado de observação, ou medição, e o processo de
realizar uma observação é chamado de experimento. Baseado neste exemplo,
enunciamos a definição de experimentos aleatórios:
Como exemplos de experimentos aleatórios, podem ser citados:
E1: Joga-se um dado e observa-se o número mostrado na face de cima.
E2: Joga-se uma moeda três vezes e observa-se o número de caras obtido.
E3: Em uma linha de produção, fabricam-se peças em série e conta-se o
número de peças defeituosas produzidas em um período de 24 horas.
São fenômenos que, mesmo repetidos várias vezes sob condições
semelhantes, apresentam resultados imprevisíveis. O resultado final depende
do acaso.
4
É importante destacar que os experimentos mencionados possuem algumas
características em comum:
a) Cada experimento poderá ser repetido indefinidamente sob
condições essencialmente inalteradas;
b) Muito embora não seja possível afirmar que resultado particular
ocorrerá, pode-se descrever o conjunto de todos os possíveis
resultados do experimento;
c) Quando o experimento for executado repetidamente, os resultados
individuais parecerão ocorrer de forma acidental. Porém, quando o
experimento for repetido um grande número de vezes, uma
configuração definida ou uma regularidade surgirá.
3 - Espaço Amostral
Um conjunto de resultados totais pode ser obtido ao ser realizada uma
experiência aleatória, embora um e somente um resultado possa ser obtido por
vez. Logo, por espaço amostral, entende-se:
Considerando os quatros experimentos aleatórios citados no item anterior, o
espaço amostral para cada um deles pode ser descrito, respectivamente, por:
S1: {1; 2; 3; 4; 5; 6}
S2: {0; 1; 2; 3}
S3: {0; 1; 2; 3; .........; N}
Cada elemento do espaço amostral que corresponde a um resultado recebe o
nome de ponto amostral. No primeiro exemplo: o número 1 pertence ao
espaço amostral {1}.
4 - Eventos
Quando o espaço amostral for finito ou infinito numerável, todo subconjunto
poderá ser considerado um evento. No entanto, se o espaço amostral for
infinito não numerável, surgirá uma dificuldade teórica na identificação e
apresentação de eventos. Logo, podemos definir evento como:
Ao conjunto de resultados possíveis de um experimento aleatório damos o
nome de espaço amostral ou conjunto universo, representado por S.
.
Qualquer subconjunto do espaço amostral S de um experimento aleatório.
5
Em relação aos quatro experimentos aleatórios apresentados inicialmente,
podem ser citados, respectivamente, como os eventos abaixo:
A1: {2; 4; 6}; isto é, um número par ocorre.
A2: {2}; isto é, duas caras ocorrem.
A3: {0}; isto é, todas as peças são perfeitas.
Se considerarmos S como espaço amostral e A como evento, qualquer que
seja A, se A está contido em S, então A é um evento de S. Em particular:
Se A = S, A é chamado de evento certo.
Se A está contido em S e A é um conjunto unitário, A é chamado de
evento elementar.
Se A = Ø, A é chamado de evento impossível.
Nos itens anteriores aprendemos as definições e exemplos de experimento
aleatório, espaço amostral e eventos. No item a seguir, usaremos estas
definições para enunciar o conceito de probabilidade.
5 - Probabilidade
Dado um experimento aleatório, sendo S o seu espaço amostral, vamos
admitir que todos os elementos de S tenham a mesma chance de acontecer, ou
seja, que S é um conjunto equiprovável.
Aplicar probabilidade significa usá-la em situações em que não se pode prever
um resultado futuro. Os resultados são incertos, regidos pelo acaso. Observe
os exemplos a seguir:
1- No lançamento de uma moeda qual a probabilidade de obter “cara” em um
evento A?
S = {ca, co} = 2 A = {ca} = 1 P (A) = 1/2 = 0,5 = 50%
6
2 - No lançamento de um dado qual a probabilidade de obter um “número par”
em um evento A?
S = {1,2,3,4,5,6} = 6 A = {2,4,6} = 3 P (A) = 3/6 = 0,5 = 50%
3 - No lançamento de um dado qual a probabilidade de obter um “número
menor ou igual a 6” em um evento A?
S = {1,2,3,4,5,6} = 6 A = {1,2,3,4,5,6} = 6 P (A) = 6/6 = 1,0 = 100%
Obs.: a probabilidade de todo evento certo é igual a 1 ou 100%.
4 - No lançamento de um dado qual a probabilidade de obter um “número
maior que 6” em um evento A?
S = {1,2,3,4,5,6} = 6 A = { } = 0 P (A) = 0/6 = 0 = 0%
Obs.: a probabilidade de todo evento impossível é igual a 0 ou 0%
6 - Eventos Complementares
Sabemos que um evento pode ocorrer ou não. Sendo p a probabilidade de que
ele ocorra (sucesso) e q a probabilidade de que ele não ocorra (insucesso),
para um mesmo evento existe sempre a relação:
Obs.: Em uma distribuição de probabilidades o somatório das probabilidades
atribuídas a cada evento elementar é igual a 1, logo temos:
p1 + p2 + p3 + ... + pn = 1.
Exemplos:
1 – Qual a probabilidade de não tirar o nº 4 no lançamento de um dado?
Solução: sabemos que a probabilidade de tirar o nº 4 no lançamento aleatório
de um dado é p = 1/6 ou 16,67%. Logo, a probabilidade de não tirar é q = 1 - p
ou q = 1 - 1/6 = 5/6 ou 83,33%.
2 - Calcular a probabilidade de um piloto vencer uma dada corrida, onde as
suas "chances", segundo os especialistas, são de "3 para 2". Calcule também a
probabilidade dele perder.
p + q = 1
7
Solução: O termo "3 para 2" significa: de cada 5 corridas ele ganha 3 e perde
2. Então p = 3/5 ou 60% (ganhar) e q = 2/5 ou 40% (perder).
3 - Qual a probabilidade de tirar um número maior ou igual a dois no
lançamento de um dado?
Solução: sabemos que neste evento só excluímos apossibilidade do resultado
do lançamento ser o nº 1 e a probabilidade de tirá-lo no lançamento de um
dado é p = 1/6. Logo, a probabilidade do resultado obtido neste lançamento
ser maior ou igual a 2 é q = 1 – p, logo q = 1 - 1/6 = 5/6 ou 83,33%.
Aprendemos a distinguir eventos complementares, e que a probabilidade de
um evento acontecer somado à probabilidade deste mesmo evento não
acontecer (complementar) é sempre igual a 1 ou 100%. A seguir vamos definir
eventos independentes e calcular a probabilidade deles acontecerem.
7 - Eventos Independentes
Dizemos que dois eventos são independentes quando a realização ou a não-
realização de um dos eventos não afeta a probabilidade da realização do outro
e vice-versa. Por exemplo, quando lançamos dois dados, o resultado obtido em
um deles independe do resultado obtido no outro.
Se dois eventos são independentes, a probabilidade de que eles se realizem
simultaneamente é igual ao produto das probabilidades de realização dos dois
eventos.
Assim, se p1 é a probabilidade de realização do primeiro evento e p2 a
probabilidade de realização do segundo evento, a probabilidade de que tais
eventos se realizem simultaneamente é dada por:
Esta regra também é conhecida como Teorema do produto, que se aplica nas
operações multiplicativas de probabilidades. Operações multiplicativas
geralmente envolvem a conjunção “e”, e são representadas pelo símbolo de
intersecção “∩”.
Fique atento aos exemplos de eventos independentes abaixo:
p = p1 x p2
8
1 – Ao lançarmos dois dados, qual a probabilidade de obtermos o número 1 no
primeiro e o número 5 no segundo dado?
Solução:
A probabilidade de obtermos 1 no primeiro dado é: p1 = 1/6
A probabilidade de obtermos 5 no segundo dado é: p2 = 1/6
Logo, a probabilidade de obtermos, simultaneamente, 1 no primeiro e 5 no
segundo é:
p = 1/6 x 1/6 = 1/36 ou 2,78%
2 – Qual a probabilidade da extração de uma bola vermelha e uma bola branca
(nesta ordem) de uma urna com 6 bolas vermelhas e 4 bolas brancas, supondo
a reposição da primeira bola extraída antes da extração da segunda bola?
Solução:
A probabilidade de obtermos uma bola de cor vermelha na primeira extração
é: p1 = 6/10
A probabilidade de obtermos uma bola de cor branca na segunda extração é:
p2 = 4/10
Logo, a probabilidade da extração das duas bolas:
p = 6/10 x 4/10 = 24/100 = 0,24 ou 24%
Aprendemos o que são eventos independentes e como calcular a probabilidade
desses eventos acontecerem. A seguir vamos definir eventos mutuamente
exclusivos e calcular a probabilidade deles acontecerem.
8 - Eventos Mutuamente Exclusivos
Dizemos que dois ou mais eventos são mutuamente exclusivos quando a
realização de um dos eventos exclui a realização do(s) outro(s).
Assim, quando lançamos uma moeda, o evento “tirar cara” e o evento “tirar
coroa” são mutuamente exclusivos, já que, ao se realizar um deles, o outro não
se realiza.
Se dois eventos são mutuamente exclusivos, a probabilidade de que um ou
outro se realize é igual à soma das probabilidades de que cada um deles se
realize:
Esta regra também é conhecida como Teorema da soma, que se aplica nas
operações aditivas de probabilidades. Operações aditivas geralmente
envolvem a expressão “ou” e são representadas pelo símbolo de união “U”.
p = p1 + p2
9
Veja os exemplos apresentados a seguir, em que os eventos são classificados
como mutuamente exclusivos ou excludentes.
a) Extrair uma carta vermelha e extrair uma carta de paus de um
baralho. Como paus é um naipe preto, os eventos são mutuamente
excludentes;
b) Extrair uma carta vermelha e extrair uma carta preta de um baralho.
Como não é possível que uma carta seja das duas cores ao mesmo tempo, os
eventos são mutuamente excludentes;
c) Extrair cara e extrair coroa do lance de uma moeda. Como não é
possível que uma face seja cara e coroa ao mesmo tempo, os eventos são
mutuamente excludentes;
d) Extrair face par e extrair o número cinco do lance de um dado. Como
cinco é um número ímpar, os eventos são mutuamente excludentes.
Fique atento ao cálculo da probabilidade de eventos mutuamente excludentes:
1 – Ao lançarmos um dado, qual a probabilidade de obtermos o número 3 ou o
número 5?
Solução:
A probabilidade de obtermos o número 3 é: p1 = 1/6
A probabilidade de obtermos o número 5 é: p2 = 1/6
Logo, a probabilidade de obtermos o número 3 ou o número 5 é:
p = 1/6 + 1/6 = 2/6 = 1/3 ou 33,33%
2 – Ao lançarmos uma moeda, qual a probabilidade de obtermos cara ou
coroa?
Solução:
A probabilidade de obtermos cara é: p1 = 1/2
A probabilidade de obtermos coroa é: p2 = 1/2
Logo, a probabilidade de obtermos cara ou coroa é:
p = 1/2 + 1/2 = 2/2 = 1 ou 100% (evento certo)
3 – Qual a probabilidade da extração de uma bola vermelha ou branca de uma
urna que contém 6 bolas vermelhas, 4 bolas brancas e 5 pretas?
Solução:
A probabilidade de obtermos uma bola vermelha é: p1 = 6/15
10
A probabilidade de obtermos uma bola branca é: p2 = 4/15
Logo, a probabilidade da extração de uma bola vermelha ou branca é:
p = 4/15 + 6/15 = 10/15 ou 66,67%
Exercícios Resolvidos
1 – Qual a probabilidade de sair o ás de ouros quando retirarmos uma carta de
um baralho de 52 cartas?
Resposta: Como só há um ás de ouros, o número de elementos do evento é 1;
logo: p = 1/52 ou 1,92%.
2 – Qual a probabilidade de sair um rei quando retirarmos uma carta de um
baralho de 52 cartas?
Resposta: Como há quatro reis no baralho, o número de elementos do evento
é 4; logo: p = 4/52 = 1/13 ou 7,69%.
3 – Em um lote de 12 peças, 4 são defeituosas. Sendo retirada uma peça ao
acaso, calcule:
a. A probabilidade dessa peça ser defeituosa
Resposta: Temos p = 4/12 = 1/3 ou 33,33%.
b. A probabilidade dessa peça não ser defeituosa
Resposta: Temos p = 1 - 1/3 = 2/3 ou 66,67%.
4 – No lançamento de dois dados, calcule a probabilidade de se obter soma
igual a 5.
Resposta: O evento é formado pelos elementos (1,4), (2,3), (3,2) e (4,1). Como
o número de elementos de S é 36, temos: p = 4/36 = 1/9 ou 11,11%.
5 – De dois baralhos de 52 cartas retiram-se, simultaneamente, uma carta do
primeiro baralho e uma carta do segundo. Qual a probabilidade de a carta do
primeiro baralho ser um rei e a do segundo ser o 5 de paus?
Resposta: Como há quatro reis no baralho, o número de elementos do evento
é 4; logo: p1 = 4/52 = 1/13 e p2 = 1/52. Como esses dois acontecimentos são
independentes e simultâneos, vem: p = 1/13 x 1/52 = 1/676 ou 0,15%.
6 – Uma urna A contém: 3 bolas brancas, 4 pretas, 2 verdes; uma urna B
contém: 5 bolas brancas, 2 pretas, 1 verde; uma urna C contém: 2 bolas
brancas, 3 pretas e 4 verdes. Uma bola é retirada de cada urna. Qual a
11
probabilidade de as bolas retiradas da primeira, segunda e terceira urnas
serem, respectivamente, branca, preta e verde?
Resposta: Temos: p1 = 3/9 = 1/3; p2 = 2/8= 1/4 e p3 = 4/9. Como esses três
acontecimentos são independentes e simultâneos, vem: p = 1/3 x 1/4 x 4/9 =
1/27 ou 3,70%.
7 – De um baralho de 52 cartas retiram-se, ao acaso, duas cartas sem
reposição. Qual a probabilidade de a primeira carta ser o ás de paus e a
segunda ser o rei de paus?
Resposta: A probabilidade de sair o ás de paus na primeira carta é p1 = 1/52.
Após a retirada da primeira carta, restam 51 cartas no baralho, já que a
carta retirada não foi reposta. Assim, a probabilidade de a segunda carta ser
o rei de paus é p2 = 1/51. Como esses dois eventos são independentes, temos:
p = 1/52 x 1/51= 1/2652 ou 0,04%.8 – Qual a probabilidade de sair uma figura quando retiramos uma carta de um
baralho de 52 cartas?
Resposta: Temos pR = 4/52 = 1/13, pD = 1/13 pV = 1/13. Como esses eventos
são mutuamente exclusivos, vem: p = 1/13 + 1/13 + 1/13 = 3/13 ou 23,08%.
9 – Qual a probabilidade de sair uma carta de copas ou de ouros quando
retiramos uma carta de um baralho de 52 cartas?
Resposta: Temos pC = 13/52 = 1/4, pO = 1/4. Como esses eventos são
mutuamente exclusivos, vem: p = 1/4 + 1/4 = 1/2 ou 50%.
10 – No lançamento de um dado, qual a probabilidade de se obter um número
não-inferior a 5?
Resposta: A probabilidade de se ter um número não-inferior a 5 é a
probabilidade de se obter 5 ou 6. Assim, p = 1/6 + 1/6 = 1/3 ou 33,33%.
11 – São dados dois baralhos de 52 cartas. Tiramos, ao mesmo tempo, uma
carta do primeiro baralho e uma carta do segundo. Qual é a probabilidade de
tirarmos uma dama e um rei, não necessariamente nesta ordem?
Resposta: A probabilidade de tirarmos uma dama do primeiro baralho é p =
4/52 = 1/13 e um rei do segundo é p = 4/52 = 1/13, de acordo com o
problema: p1 = 1/13 x 1/13= 1/169.
A probabilidade de tirarmos um rei do primeiro baralho e uma dama do
segundo é: p2 = 1/13 x 1/13= 1/169.
Como esses dois eventos são mutuamente exclusivos, temos: p = 1/169 +
1/169= 2/169 ou 1,18%.
12
12 – Dois dados são lançados conjuntamente. Determine a probabilidade de a
soma ser 10 ou maior que 10.
Resposta: A soma deverá ser então 10, 11 ou 12. Para que a soma seja 10, a
probabilidade é (4,6); (5,5) e (6,4), logo: p = 3/36. Para que a soma seja 11,
a probabilidade é (5,6) e (6,5), logo: p = 2/36. Para que a soma seja 12, a
probabilidade é (6,6), logo: p = 1/36.
Como esses três eventos são mutuamente exclusivos, temos: p = 3/36 + 2/36
+ 1/36 = 6/36 = 1/6 ou 16,67%.
EXERCÍCIOS
1- No lançamento de um dado temos S = {1, 2, 3, 4, 5, 6}. Formule os eventos
definidos pelas sentenças: (a) Obter um número par; (b) Obter um número
menor ou igual a 6; (c) Obter o número 4; (d) Obter um número maior que 6.
2 – Construa o espaço amostral do evento “lance de um dado honesto”. Em
relação ao espaço amostral, calcule: (a) a probabilidade de ocorrer face cinco;
(b) a probabilidade de não ocorrer face três.
3 – Determine o espaço amostral do evento extração de uma carta de um
baralho honesto. Calcule a probabilidade de: (a) extrair uma carta de copas;
(b) extrair um rei; (c) extrair um valete de paus.
4 – Um grupo de 20 pessoas é formado por 12 homens e 8 mulheres. Em
relação ao sorteio de um elemento deste grupo, calcule: (a) a probabilidade de
ser homem; (b) a probabilidade de ser mulher.
5 – Uma bola é retirada ao acaso de uma urna que contém 12 bolas pretas, 16
verdes e 8 rosas. Calcule a probabilidade de: (a) não ser verde; (b) não ser
preta; (c) ser rosa.
6 – Em um lote de 12 peças, quatro são defeituosas. Sendo retiradas
aleatoriamente duas peças, calcule: (a) a probabilidade de ambas serem
defeituosas; (b) a probabilidade de ambas não serem defeituosas; (c) a
probabilidade de ao menos uma ser defeituosa.
7 – Uma moeda é lançada três vezes. Calcule a probabilidade de obtermos: (a)
três caras; (b) duas caras e uma coroa; (c) uma cara somente; (d) nenhuma
cara; (e) pelo menos uma cara; (f) no máximo uma cara.
13
8 – Uma urna contém 50 bolas idênticas. Sendo as bolas numeradas de 1 a 50,
determine a probabilidade de, em uma extração ao acaso: (a) obtermos a bola
de número 27; (b) obtermos uma bola de número par; (c) obtermos uma bola
de número maior que 20; (d) obtermos uma bola de número menor ou igual a
20.
9 – Um par de dados é atirado. Encontre a probabilidade de que a soma seja
10 ou maior que 10 se: (a) um 5 aparece no primeiro dado; (b) um 5 aparece
pelo menos em um dos dados.
10 – Um lote é formado por dez peças boas, quatro com defeitos e duas com
defeitos graves. Uma peça é escolhida ao acaso. Calcule a probabilidade de
que: (a) ela não tenha defeitos graves; (b) ela não tenha defeitos; (c) ela se boa
ou tenha defeitos graves.
11 – Considere o mesmo lote do problema anterior. Retiram-se duas peças ao
acaso. Calcule a probabilidade de que: (a) ambas sejam perfeitas; (b) pelo
menos uma seja perfeita; (c) nenhuma tenha defeitos graves; (d) nenhuma seja
perfeita.
14
II – DISTRIBUIÇÕES BINOMIAL E NORMAL
Neste capítulo apresentaremos dois modelos teóricos de distribuição de
probabilidade, aos quais um experimento aleatório estudado possa ser
adaptado, o que permitirá a solução de grande número de problemas práticos.
1 - Variável Aleatória
Assim, se o espaço amostral relativo ao “lançamento de duas moedas” é S =
{(Ca, Ca), (Ca, Co), (Co, Ca), (Co, Co)} e se X representa “o número de
caras” que aparecem, a cada ponto amostral podemos associar um número
para X, de acordo com a tabela abaixo:
PONTO
AMOSTRAL
X
(Ca, Ca) 2
(Ca, Co) 1
(Co, Ca) 1
(Co, Co) 0
2 – Distribuição de Probabilidade
Consideremos a distribuição de frequências relativa ao número de acidentes
diários em um estacionamento:
Nº DE
ACIDENTES
FREQUENCIAS
0 22
1 5
2 2
3 1
TOTAL 30
Suponhamos um espaço amostral S e que cada ponto amostral seja atribuído
um número. Fica, então, definida uma função chamada variável aleatória,
indicada por uma letra maiúscula, sendo seus valores indicados por letras
minúsculas.
15
Em um dia, a probabilidade de:
- não ocorrer acidente é: p = 22/30 = 0,73 ou 73%
- ocorrer um acidente é: p = 5/30 = 0,17 ou 17%
- ocorrerem dois acidentes é: p = 2/30 = 0,07 ou 7%
- ocorrerem três acidentes é: p = 1/30 = 0,03 ou 3%
Podemos, então, escrever:
Nº DE
ACIDENTES
PROBABILIDADES
0 0,73
1 0,17
2 0,07
3 0,03
TOTAL 1,00
Essa tabela é denominada distribuição de probabilidade.
Assim, voltando a tabela inicial. Temos:
Seja X uma variável aleatória que pode assumir os valores x1, x2, x3, ....., xn. A
cada valor xi correspondem a probabilidade pi de ocorrência de tais pontos no
espaço amostral.
Assim, temos:
∑ pi = 1
Os valores x1, x2, x3, ....., xn e seus correspondentes p1, p2, p3, ....., pn definem
uma distribuição de probabilidade.
16
Logo, podemos escrever:
Nº DE CARAS (X) P(X)
0 1/4
1 2/4
2 1/4
∑ 1
Ao definir a distribuição de probabilidade, estabelecemos uma
correspondência unívoca entre os valores da variável aleatória X e os valores
da variável P. Esta correspondência define uma função; os valores xi (i = 1, 2,
3, ...., n) formam o domínio da função e os valores de pi (i = 1, 2, 3, ...., n), o
seu conjunto imagem.
Essa função, assim definida, é denominada função probabilidade e
representada por:
A função P(X = xi) determina a distribuição de probabilidade de variável
aleatória X.
Assim, ao lançarmos um dado, a variável aleatória X, definida por “pontos de
um dado”, pode tomar os valores 1, 2, 3, ........., 6.
Como a cada um destes valores está associada uma e uma só probabilidade de
realização e ∑ P(xi) = 1, fica definida uma função de probabilidade, da qual
resulta a seguinte distribuição de probabilidade:
X P(X)
1 1/6
2 1/6
3 1/6
4 1/6
5 1/6
6 1/6
∑ 1
f(x) = P(X = xi)
17
3 – Distribuição Binomial
Eventos binomiais são marcados pela existência de duas categorias,
mutuamente excludentes e coletivamente exaustivos. Mutuamente excludentes
significa que uma categoria implica a possibilidade da não-ocorrênciasimultânea da outra categoria. Por coletivamente exaustivas entende-se que a
união de ambos os eventos resulta no espaço amostral.
Exemplos de eventos binomiais podem ser fornecidos por meio de números
pares e ímpares no lançamento de um dado honesto, e por meio da extração de
cartas vermelhas e pretas de um baralho.
Geralmente, em análises estatísticas, os exemplos mais comuns de eventos
binomiais são aqueles que estabelecem situações de sucesso e fracasso.
Situações de sucesso correspondem àquilo que se deseja estudar. Situações de
fracasso correspondem ao complemento. Ou seja, àquilo que não se deseja
estudar.
Vamos, neste item, considerar experimentos que satisfaçam as seguintes
condições:
a. O experimento deve ser repetido, nas mesmas condições, um número
finito de vezes (n).
b. As provas repetidas devem ser independentes, isto é, o resultado de uma
não deve afetar os resultados das sucessivas.
c. Em cada prova deve aparecer um dos dois possíveis resultados: sucesso
e insucesso.
d. No decorrer do experimento, a probabilidade p do sucesso e a
probabilidade q (q = 1 – p) do insucesso manter-se-ão constantes.
Resolveremos problemas do tipo: determinar a probabilidade de se obterem k
sucessos em n tentativas.
O experimento “obtenção de caras em cinco lançamentos sucessivos e
independentes de uma moeda” satisfaz essas condições. Sabemos que, quando
da realização de um experimento qualquer em uma única tentativa, se a
probabilidade de realização de um evento (sucesso) é p, a probabilidade de
não-realização desse mesmo evento (insucesso) é 1 – p = q.
18
Suponhamos, agora, que realizemos a mesma prova n vezes sucessivas e
independentes. A probabilidade de que um evento se realize k vezes nas
provas é dada pela função:
Na qual:
P (X = k) é a probabilidade de que o evento se realize k vezes em n provas;
p é a probabilidade de que o evento se realize em uma só prova – sucesso;
q é a probabilidade de que o evento não se realize no decurso dessa –
insucesso;
Essa função, denominada lei binomial, define a distribuição binomial.
Exercícios Resolvidos
1 – Uma moeda é lançada 5 vezes seguidas e independentes. Calcule a
probabilidade de serem obtidas 3 caras nessas 5 provas.
19
2 – Dois times de futebol, A e B, jogam entre si 6 vezes. Encontre a
probabilidade de o time A ganhar 4 jogos.
3 – Uma moeda honesta, que apresenta a mesma probabilidade de cara ou
coroa, é jogada quatro vezes. Deseja-se calcular a probabilidade de sair cara:
(a) uma vez; (b) três vezes, (c) pelo menos uma vez.
Neste caso, sabe-se que n é igual a 4 (número de lances da moeda); a
probabilidade de sair cara é igual a meio, ou p = 0,50. A probabilidade de sair
coroa também é igual a meio, ou q = 1 – p = 1 – 0,50 = 0,50.
A variável x varia para cada situação:
(a) Para calcular a probabilidade de ocorrer apenas uma cara, x = 1.
P(x = 1) = C4,1(0,50)
1(0,50)4-1 = 0,25 ou 25%
(b) Para calcular a probabilidade de ocorrerem três caras, x = 3.
P(x = 3) = C4,3(0,50)
3(0,50)4-3 = 0,25 ou 25%
(c) Pelo menos uma vez implica na aceitação do número de caras igual a 1,
2, 3 ou 4, ou na probabilidade de x = 1, ou x = 2, ou x = 3, ou x = 4. Ou,
de forma mais fácil, pelo menos uma vez implica na aceitação de
qualquer resultado menos o resultado x = 0.
P(x ≥ 1) = P(x = 1) + P(x = 2) + P(x = 3) + P(x = 4) = 1 - P(x = 0)
P(x ≥ 1) = 1 - C4,0(0,50)0(0,50)4-0 = 1 - 0,0625 = 0,9375 ou 93,75%
20
4 – A probabilidade de uma duplicata ser paga em dia é de 70%. Escolhemos
ao acaso seis duplicatas para uma auditoria. Deseja-se calcular a probabilidade
de: (a) todas serem pagas em atraso; (b) Apenas uma ser paga em dia; (c)
todas serem pagas em dia.
Solução: para resolver este problema podemos considerar como evento
sucesso i) duplicata paga em dia; ii) duplicata paga em atraso. Considerando a
primeira opção temos:
(a) Para calcular a probabilidade de todas serem pagas em atraso, ou
nenhuma ser paga em dia, temos x = 0.
P(x = 0) = C6,0(0,70)
0(0,30)6-0 = 0,0007 ou 0,07%
(b) Para calcular a probabilidade de apenas uma duplicata ser paga em dia,
temos x = 1.
P(x = 1) = C6,1(0,70)
1(0,30)6-1 = 0,01 ou 1%
(c) Para calcular a probabilidade de todas as duplicatas serem pagas em
dia, temos x = 6.
P(x = 6) = C6,6(0,70)
6(0,30)6-6 = 0,118 ou 11,8%
EXERCÍCIOS
1 – Determine a probabilidade de obtermos exatamente 3 caras em 6 lances de
uma moeda.
2- Uma moeda é lançada 20 vezes. Qual a probabilidade de saírem 8 caras?
3 – Jogando-se um dado três vezes, determine a probabilidade de se obter um
múltiplo de 3 duas vezes.
4 – Numa criação de coelhos, 40% são machos. Qual a probabilidade de que
nasçam pelo menos 2 coelhos machos num dia em que nasceram 20 coelhos?
5 – Dois times de futebol, A e B, jogam entre si 6 vezes. Encontre a
probabilidade de o time A:
a. Ganhar dois ou três jogos;
b. Ganhar pelo menos um jogo.
21
6 – A probabilidade de um atirador acertar o alvo em um único tiro é 2/3. Se
ele atirar 5 vezes, qual a probabilidade de acertar exatamente 2 tiros?
7 – Seis parafusos são escolhidos ao acaso da produção de certa máquina, que
apresenta 10% de peças defeituosas. Qual a probabilidade de serem
defeituosos dois deles?
8 – Uma prova tipo teste tem 50 questões independentes. Cada questão tem 5
alternativas. Apenas uma das alternativas é a correta. Se um aluno resolve a
prova respondendo a esmo as questões, qual a probabilidade de tirar nota 5?
9 – Uma urna tem 20 bolas pretas e 30 brancas. Retiram-se 25 bolas com
reposição. Qual a probabilidade de que:
a. 2 sejam pretas?
b. Pelo menos 3 sejam pretas?
c. 10 sejam brancas?
10 – A probabilidade de um arqueiro acertar o alvo com uma única flecha é
0,20. Lança 30 flechas no alvo. Qual a probabilidade de que:
a. Exatamente 4 acertem o alvo?
b. Pelo menos 3 acertem o alvo?
11 – Considere 10 tentativas independentes de um experimento. Cada
tentativa admite sucesso com probabilidade 0,05. Seja X o número de
sucessos, calcular P (1< x ≤ 4).
12 – Uma urna tem 10 bolas brancas e 40 pretas. Qual a probabilidade de que
em 30 bolas retiradas com reposição ocorram no máximo 2 brancas?
13 – A probabilidade de um atirador acertar no alvo num único tiro é 1/4. O
atirador atira 20 vezes no alvo. Qual a probabilidade de acertar:
a. Exatamente 5 vezes?
b. Pelo menos 3 vezes?
c. Nenhuma vez?
d. No máximo 4 vezes?
14 – Uma urna contém 8 bolas brancas e 12 pretas. Retiram-se 10 bolas com
reposição. Qual a probabilidade de que:
a. No máximo 2 sejam brancas?
b. 3 sejam brancas?
22
15 – A probabilidade de uma máquina produzir uma peça defeituosa, num dia,
é de 0,1. Qual a probabilidade de que em 20 peças produzidas pela máquina
num dia, ocorram 3 defeituosas?
16 – Estima-se que cerca de 30% dos frangos congelados contenham
suficiente número de bactérias salmonelas causadoras de doenças, se forem
assados inadequadamente. Um consumidor compra 12 frangos congelados.
Qual é a probabilidade do consumidor ter mais de 6 frangos contaminados?
17 – Acredita-se que 20% dos moradores das proximidades de uma grande
indústria siderúrgica tem alergia aos poluentes lançados ao ar. Admitindo que
este percentual de alérgicos é real (correto), calcule a probabilidade de que
pelo menos 4 moradores tenham alergia entre 13 selecionados ao acaso.
18 - Três em cada quatro alunos de uma universidade fizeram cursinho antes
de prestar vestibular. Se 16 alunos são selecionados ao acaso, qual é a
probabilidade de que:
(a) Pelo menos 12 tenham feito cursinho?
(b) No máximo 13 tenham feito cursinho?
(c) Exatamente 12 tenhamfeito cursinho?
19 - Admita que, respectivamente, 90% e 80% dos indivíduos das populações
A e B sejam alfabetizados. Se 12 pessoas da população A e 10 da população B
forem selecionadas ao acaso, qual é a probabilidade de que pelo menos uma
não seja alfabetizada?
20 – Uma pesquisa, com 420 casais que possuem cinco filhos, constatou que a
probabilidade de nascimento de meninos é de 58%. Nestas 420 famílias com
cinco crianças cada uma, quantas se esperaria que tivessem:
a) Nenhuma menina;
b) Três meninos;
c) Quatro meninos.
21 – As pacientes diagnosticadas com certa doença têm 80% de chance de
serem curadas. Para um grupo de doze pacientes nessas condições, calcule a
probabilidade de:
a) Oito ficarem completamente curadas;
b) Entre três (inclusive) e cinco (inclusive) não serem curadas;
c) Não mais do que duas permanecerem com a doença.
23
22 – Um vendedor de seguros vende apólices a 5 homens, todos da mesma
idade e de boa saúde. De acordo com as tabelas atuariais, a probabilidade de
um homem, dessa idade particular, estar vivo daqui a 30 anos é de 2/3.
Determinar a probabilidade de estarem ainda vivos daqui a 30 anos:
a) Todos os cinco homens;
b) Pelo menos 3;
c) Apenas 2;
d) Pelo menos 1.
23 – Uma recente pesquisa detectou que 90% dos fumantes de uma região
afirmaram desejar parar com seu vício. Em uma amostra formada por dez
pessoas:
a) Qual a probabilidade de a maioria querer parar de fumar?
a) Qual a probabilidade de todos quererem parar de fumar?
24 – Uma empresa comercial calcula que 5% de suas vendas não são
recebidas, em função do recebimento de cheques sem fundos. Ao se analisar
uma amostra formada por oito vendas, qual a probabilidade de: (a) todas
serem pagas normalmente? (b) uma ou duas vendas, apenas, serem pagas? (c)
pelo menos três vendas serem pagas normalmente? (d) todas as vendas não
serem pagas?
25 – Existem treze jogos na Loteria Esportiva. Em cada um dos jogos,
determinado time pode ganhar ou empatar ou perder. Calcule a probabilidade
de um jogador que nada sabe sobre os times: (a) acertar todos os jogos; (b)
acertar pelo menos um jogo; (c) acertar pelo menos doze jogos. Use o maior
número de casas decimais nas respostas.
24
4 – Distribuição Normal
Entre as distribuições teóricas de variável aleatória contínua, uma das mais
empregadas é a distribuição normal. Consiste em uma distribuição contínua
de probabilidades, onde a apresentação da distribuição de frequências f(x) de
uma variável qualitativa x costuma apresentar-se em forma de sino e simétrica
em relação à média.
O estudo da distribuição normal recebeu contribuições de matemáticos
importantes, como De Moivre, Laplace e Gauss. Alguns estudos revelam que
medições repetidas de uma mesma grandeza, como o diâmetro de uma esfera
ou o peso de determinado objeto, nunca forneciam os mesmos valores. Porém,
a apresentação das frequências dos inúmeros números coletados sempre
resultava em uma curiosa curva em forma de sino. Das observações surgiu o
nome curva “normal” dos erros.
Muitas das variáveis analisadas na pesquisa socioeconômica correspondem à
distribuição normal ou dela se aproximam.
O aspecto gráfico da distribuição normal é o da figura abaixo:
Os conceitos associados à distribuição Normal são simples. Em torno da
média, valor central, registra-se alta concentração de frequências ou
probabilidade maior de ocorrência. À medida que nos afastamos da média, as
frequências são reduzidas. A probabilidade de encontrarmos valores mais
distantes da média diminui. Quanto mais longe da média e dos valores
centrais, menores as frequências e as probabilidades.
25
Para uma perfeita compreensão da distribuição normal, observe a figura e
procure visualizar as seguintes propriedades:
Quando temos em mãos uma variável aleatória com distribuição normal,
nosso principal interesse é obter a probabilidade de essa variável aleatória
assumir um valor em um determinado intervalo. Vejamos como proceder, por
meio de um exemplo concreto.
A distribuição Normal de variável aleatória X depende dos parâmetros da
media e do desvio padrão, proveniente da variância. Então, pode ser também
representada desta maneira: X: N ( , S2), ou seja, X segue uma distribuição
Normal de media e variância S2.
Exemplo: Seja X a variável aleatória que representa os diâmetros dos
parafusos produzidos por certa máquina. Vamos supor que essa variável tenha
distribuição normal com média = 2 cm e desvio padrão s = 0,04 cm.
Queremos conhecer a probabilidade de um parafuso tirado ao acaso ter um
diâmetro com valor entre 2 e 2,05 cm.
1ª) A variável aleatória X pode assumir todo e qualquer valor real.
2ª) A representação gráfica da distribuição normal é uma curva em forma de
sino, que recebe o nome de curva normal ou de Gauss ou de Moivre.
3ª) A distribuição é simétrica em torno da média ( )
4ª) A área total limitada pela curva e pelo eixo das abscissas é igual a 1 ou à
percentagem de 100%, já que essa área corresponde à probabilidade de a
variável aleatória X assumir qualquer valor real.
5ª) A curva normal é assintótica em relação ao eixo das abscissas, isto é,
aproxima-se indefinidamente do eixo das abscissas sem, contudo, alcançá-lo.
6ª) Como a curva é simétrica em torno de , a probabilidade de ocorrer valor
maior do que a média é igual à probabilidade de ocorrer valor menor do que a
média, isto é, ambas as probabilidades são iguais a 0,5 ou 50%. Escrevemos:
P(X > ) = P(X < ) = 0,5 ou 50%.
26
É fácil notar que essa probabilidade, indicada por: P(2< X < 2,05) corresponde
à área hachurada na figura:
O cálculo direto dessa probabilidade exige um conhecimento de Matemática
mais avançado do que aquele que dispomos no curso de ensino médio.
Entretanto, podemos contornar facilmente esse problema. Basta aceitar, sem
demonstração, que, se X é uma variável aleatória com distribuição normal de
média e desvio padrão s, e então a variável z dada por:
tem distribuição normal reduzida, isto é, tem distribuição normal de média
0 e desvio padrão 1.
As probabilidades associadas à distribuição normal padronizada são
encontradas em tabelas, não havendo necessidade de serem calculadas.
Em anexo, é apresentada uma tabela de distribuição normal reduzida, que nos
dá a probabilidade de Z tomar qualquer valor entre a média 0 e um dado valor
z, isto é:
P(0 < Z < z)
Temos, então, que se X é uma variável aleatória com distribuição normal de
média e desvio padrão s, podemos escrever:
P( < X < x) = P(0 < Z < z), com
27
Voltemos, então, ao nosso problema.
Queremos calcular P(2< X < 2,05). Para obter essa probabilidade, precisamos,
em primeiro lugar, calcular o valor de z que corresponde a variável x = 2,05,
já que para x = 2 → z = 0, pois = 2. Temos então:
Z = 2,05 – 2 / 0,04 = 1,25
donde:
P(2 < X < 2,05) = P(0 < Z < 1,25)
Procuremos, agora, na tabela Z em anexo, o valor de z = 1,25. Observe a
forma de entrada na tabela:
Na primeira coluna encontramos o valor 1,2 (número inteiro + 1ª casa
decimal). Em seguida, encontramos, na primeira linha, o valor 5 (2ª casa
decimal), que corresponde ao último algarismo do número 1,25. Na
intersecção da linha e coluna correspondentes encontramos o valor 0,3944, o
que nos permite escrever:
P(0 < Z < 1,25) = 0,3944
Assim, a probabilidade de um parafuso fabricado por essa máquina apresentar
um diâmetro entre a média = 2 e o valor x = 2,05 é 0,3944.
Escrevemos, então:
P(2 < X < 2,05) = P(0 < Z < 1,25) = 0,3944 ou 39,44%.28
Exercícios Resolvidos
1 – Com base na tabela Z determine as probabilidades:
a. P(-1,25 < Z < 0)
A probabilidade procurada corresponde à parte hachurada da figura:
Sabemos que: P(0 < Z < 1,25) = 0,3944
Pela simetria da curva, temos:
P(-1,25 < Z < 0) = P(0 < Z < 1,25) = 0,3944ou 39,44%.
b. P(-0,5 < Z < 1,48)
A probabilidade procurada corresponde à parte hachurada da figura:
Temos que:
P(-0,5 < Z < 1,48) = P(-0,5 < Z < 0) + P(0 < Z < 1,48)
Como:
P(-0,5 < Z < 0) = P(0 < Z < 0,5) = 0,1915 e P(0 < Z < 1,48)= 0,4306
Obtemos:
P(-0,5 < Z < 1,48) = 0,1915 + 0,4306 = 0,6221ou 62,21%
29
c. P(0,8 < Z < 1,23)
A probabilidade procurada corresponde à parte hachurada da figura:
Temos que:
P(0,8 < Z < 1,23) = P(0 < Z < 1,23) - P(0 < Z < 0,8)
Como:
P(0 < Z < 1,23)= 0,3907 e P(0 < Z < 0,8)= 0,2881
Obtemos:
P(0,8 < Z < 1,23) = 0,3907 - 0,2881 = 0,1026 ou 10,26%
d. P(Z > 0,6)
A probabilidade procurada corresponde à parte hachurada da figura:
Temos que:
P(Z > 0,6) = P(Z > 0) - P(0 < Z < 0,6)
Como: P(Z > 0)= 0,5 e P(0 < Z < 0,6)= 0,2258
Obtemos:
P(Z > 0,6) = 0,5 - 0,2258 = 0,2742 ou 27,42%
30
e. P(Z < 0,92)
A probabilidade procurada corresponde à parte hachurada da figura:
Temos que:
P(Z < 0,92) = P(Z < 0) + P(0 < Z < 0,92)
Como:
P(Z < 0)= 0,5 e P(0 < Z < 0,92)= 0,3212,
Obtemos:
P(Z < 0,92) = 0,5 + 0,3212 = 0,8212 ou 82,12%.
2 – Os salários semanais dos operários industriais são distribuídos
normalmente, em torno da média de R$ 500,00, com desvio padrão de R$
40,00. Calcule a probabilidade de um operário escolhido ao acaso ter um
salário semanal situado entre R$ 490,00 e R$ 520,00.
Devemos inicialmente, determinar os valores Z1 e Z2 da variável de
distribuição normal reduzida.
Assim,
Z1 = 490 – 500 = - 0,25 e Z2 = 520 – 500 = 0,5
40 40
Como:
P(490 < X < 520) = P(- 0,25 < Z < 0,5) = P(- 0,25 < Z < 0) +
P( 0 < Z < 0,5)= 0,0987 + 0,1915 = 0,2902
É, pois, de se esperar que, em média, 29,02% dos operários tenham
salários entre R$ 490,00 e R$ 520,00, ou seja, a probabilidade de um
operário escolhido ao acaso ter salário entre R$ 490,00 e R$ 520,00 é
de 29,02%.
31
EXERCÍCIOS
1 – Sendo Z uma variável com distribuição normal reduzida, baseado na
tabela Z calcule:
a. P (0 < Z < 1,44)
b. P (-0,85 < Z < 0)
c. P (- 1,48 < Z < 2,05)
d. P (0,72 < Z < 1,89)
e. P (Z > - 2,03)
f. P (Z > 1,08)
g. P (Z < - 0,66)
h. P (Z < 0,60)
2 – Use a tabela Z para encontrar as seguintes probabilidades:
a. P (Z > 0,34)
b. P (Z < 1,85)
c. P (Z < - 1,24)
d. P (1,56 < Z < 2,37)
e. P (-0,37 < Z < 3,4)
f. P (Z > 1,08)
g. P (Z < - 0,66)
h. P (Z < -2,30 ou Z > 1,29)
3 – seja X: N (100,25). Calcular
a. P (100 ≤ X ≤ 106)
b. P (89 ≤ X ≤ 107)
c. P (112 ≤ X ≤ 116)
d. P (X ≥ 108)
e. P (X ≤ 90)
4 – Um teste padronizado de escolaridade tem distribuição normal com média
aritmética de 100 e desvio padrão de 10. Determine a probabilidade de um
indivíduo submetido a esse teste e escolhido ao acaso ter nota:
a. Maior que 120
b. Maior que 80
c. Entre 85 e 115
d. Maior que 100
e. Até qual nota apresenta 83,40% de probabilidade de acontecer
32
5 – No exercício anterior, qual a nota que apresenta 93,70% de probabilidade
de um aluno tirar acima dela?
6 – As alturas de 20000 alunos de um colégio têm distribuição
aproximadamente normal, com media 1,64 m e desvio padrão 0,16 m. Pede-se:
a) Qual o número esperado de alunos com altura superior a 1,52 m?
b) Qual o intervalo simétrico em torno da media, que conterá 78% das
alturas dos alunos?
c) Qual a altura esperada, no qual 15036 alunos estejam abaixo dela?
7 – Os pesos de 600 estudantes são normalmente distribuídos com média
aritmética de 65,3 kg e desvio padrão de 5,5 kg. Determine o número de
estudantes que pesam:
a. Entre 60 e 70 kg
b. Mais que 63,2 kg
c. Menos que 68 kg
8 – A duração de um componente eletrônico tem média de 850 dias e desvio
padrão de 40 dias. Sabendo que a duração é normalmente distribuída, calcule a
probabilidade de um componente escolhido ao acaso durar:
a. Entre 700 e 1.000 dias
b. Mais de 800 dias
c. Menos de 750 dias
9 – Sendo X: N (50,16), determinar Xα, tal que:
a. P (X ≥ Xα) = 0,05
b. P (X ≤ Xα) = 0,99
10 – Um fabricante de baterias sabe, por experiência passada, que as baterias
de sua fabricação têm vida média de 600 dias e desvio padrão de 100 dias,
sendo que a duração tem aproximadamente distribuição Normal. O fabricante
oferece uma garantia de 312 dias, isto é, troca as baterias que apresentarem
falhas nesse período. A fábrica produz mensalmente 10.000 baterias. Quantas
baterias ele deverá trocar mensalmente pelo uso da garantia?
33
11 – Uma fábrica de carros sabe que os motores de sua fabricação têm duração
normal com média de 150.000 km e desvio padrão de 5.000 km. Qual a
probabilidade de que um carro, escolhido ao acaso, dos fabricados por essa
firma, tenha um motor que dure:
a. Menos de 170.000 km?
b. Entre 140.000 e 165.000 km?
c. Se a fábrica substitui o motor que apresenta duração inferior à garantia,
qual deve ser esta garantia para que a porcentagem de motores
substituídos seja inferior a 0,2%?
12 – As pontuações de QI seguem uma distribuição normal com uma
pontuação média de 100 e desvio padrão de 15, isto é, X ~ N (100,225).
Encontre a porcentagem de pessoas que se espera possuir uma pontuação de
QI:
a. De menos de 70?
b. Entre 80 e 120?
c. De mais de 50?
13 – Os salários dos diretores das empresas de São Paulo distribuem-se
normalmente com média de R$ 8.000,00 e desvio padrão de R$ 500,00. Qual
a percentagem de diretores que recebem:
a. Menos de R$ 6.470,00?
b. Entre R$ 8.920,00 e R$ 9.380,00?
14 – A quantidade de óleo contida em cada lata fabricada por uma indústria
tem peso distribuído normalmente, com média de 990 g e desvio padrão igual
a 10 g. Uma lata é rejeitada no comércio se tiver peso menor que 976 g.
a. Qual a probabilidade de que em 10 latas observadas, uma seja rejeitada?
b. Nas condições do item a, qual a probabilidade de que em 20 latas
observadas, 3 sejam rejeitadas?
15 – Foi feito um estudo sobre a altura dos alunos da IFCE. Observou-se que
ela se distribui normalmente com média de 1,72 m e desvio padrão de 5 cm.
Qual a porcentagem dos alunos com altura:
a. Entre 1,57 e 1,87 m?
b. Acima de 1,90 m?
34
16 – Um estudo das modificações dos preços, no atacado, de produtos
industrializados, mostrou que há distribuição normal com média de 50% e
desvio padrão de 10%. Qual a porcentagem dos artigos que:
a. Sofreram aumentos superiores a 75%?
b. Sofreram aumentos entre 30% e 80%?
17 – O volume de correspondência recebido por uma firma quinzenalmente
tem distribuição normal com média de 4000 cartas e desvio padrão de 200
cartas. Qual a percentagem de quinzenas em que a firma recebe:
a. Entre 3600 e 4250 cartas?
b. Mais de 4636 cartas?
c. Menos de 3400 cartas?
18 – Numa fábrica foram instaladas 1000 lâmpadas novas. Sabe-se que a
duração média das lâmpadas é de 800 horas e desvio padrão de 100 horas,
com distribuição normal. Determinar a quantidade de lâmpadas que durarão:
a. Menos de 500 horas?
b. Mais de 700 horas?
c. Entre 516 e 684 horas?
19 – Suponha que o tempo necessário para atendimento de clientes em uma
central de atendimento telefônico siga uma distribuição normal de média de 8
minutos e desvio padrão de 2 minutos.
(a) Qual é a probabilidade de queum atendimento dure menos de 5
minutos?
(b) E mais do que 9,5 minutos?
(c) E entre 7 e 10 minutos?
(d) 75% das chamadas telefônicas requerem pelo menos quanto tempo de
atendimento?
20 - Uma enchedora automática de refrigerantes está regulada para que o
volume médio de líquido em cada garrafa seja de 1000 cm3 e desvio padrão de
10 cm3. Admita que o volume siga uma distribuição normal.
a) Qual é a porcentagem de garrafas em que o volume de líquido é menor
que 990 cm3?
b) Qual é a porcentagem de garrafas em que o volume de líquido não se
desvia da média em mais do que dois desvios padrões?
c) Se 10 garrafas são selecionadas ao acaso, qual é a probabilidade de que,
no máximo, 4 tenham volume de líquido superior a 1002 cm3?
35
21 – Suponha que as notas em certa disciplina estão normalmente distribuídas
com média 5,0 e desvio padrão 1,5:
a) determine o percentual de estudantes com nota superior a 8,0;
b) se a nota mínima para obter aprovação e 3,0, determine o percentual de
estudantes reprovados;
c) explique por que a probabilidade de um estudante dessa população obter
nota acima de 9,8 é praticamente zero.
22 – Um fabricante de máquinas de lavar sabe, por longa experiência, que a
duração tem duração de suas máquinas tem distribuição normal com média de
1000 dias e desvio padrão de 200 dias. O fabricante oferece uma garantia de 1
ano (365 dias) para o produto. Produz mensalmente 2000 máquinas. Quantas
máquinas ele espera trocar mensalmente pelo uso da garantia dada?
23 – Um fabricante de produtos alimentícios vende um de seus produtos em
latas de 900 g de conteúdo líquido. Para embalar o produto, adquiriu uma
máquina que permite obter o peso desejado, com distribuição normal e desvio
padrão de 10 g. O IPM (Instituto de Pesos e Medidas) exige que no máximo
5% das latas contenham menos do que o peso líquido nominal. Responda:
a) Se a máquina for regulada para 910 g, poderá satisfazer esta exigência
do IPM?
b) Qual deverá ser a regulagem da máquina para que a exigência do IPM
seja satisfeita?
c) Feita esta nova regulagem (item b), as latas são remetidas ao comércio.
O IPM examina, então, uma amostra de 20 latas em um supermercado.
Qual a probabilidade de encontrar pelo menos três com o peso inferior ao
especificado na embalagem?
24 – Um teste de aptidão feito por pilotos de elite em treinamento inicial
requer que uma série de operações seja realizada em uma rápida sucessão.
Suponha que o tempo para completar o teste seja distribuído normalmente
com média de 80 minutos e desvio padrão de 30 minutos. Para passar no teste,
o candidato deve completá-lo em menos de 70 minutos. Pede-se:
a) Se 200 candidatos fazem o teste, quantos são esperados passar no teste?
b) Se os 5% melhores candidatos serão alocados para aeronaves maiores,
quão rápido deve ser o candidato para que obtenha essa posição?
36
25 – A distribuição dos pesos de porcos numa suinocultura pode muito bem
ser representada por uma distribuição normal, com média de 128,72 kg e
desvio padrão de 32,46 kg. Um matadouro comprará 5000 porcos e pretende
classificá-los de acordo com o peso, do seguinte modo: 18% dos mais leves
como pequenos, os 50% seguintes como médios, os 22% seguintes como
grandes e os 10% mais pesados como extras. Quais os limites de peso para
cada classificação?
26 – Um pesquisador verificou que em uma cidade do interior de São Paulo o
peso dos homens tem distribuição aproximadamente normal com média de 85
kg e desvio padrão de 20 kg, enquanto o das mulheres também apresenta-se
normalmente distribuído, com média de 60 kg e desvio padrão de 8 kg. Pede-
se: (a) sorteando-se um homem, qual a probabilidade de ele ter peso acima de
75 kg? (b) sorteando-se uma mulher, qual a probabilidade de ela ter peso
acima de 65 kg? (c) qual é a probabilidade de uma pessoa ter peso acima de 65
kg, sendo ela sorteada de um grupo em que o número de mulheres é o triplo
do de homens?
27 – Antes de uma importante prova de Estatística, o professor verificou que o
tempo dedicado aos estudos de revisão dos seus alunos seguia uma
distribuição aproximadamente normal, de media 12 horas e desvio padrão de
1,5 hora. Pede-se:
a) Determinar o tempo de estudo que é superado por 98,5% dos alunos?
b) Determinar a faixa em torno do valor médio que contenha 90% dos
valores do tempo dedicados aos estudos.
28 – Para ser aprovado em um exame de seletivo um candidato deve obter
nota superior a 8,2 em matemática e superior a 9,5 em português. Sabendo que
as notas seguem uma distribuição normal, com media e variância apresentados
na tabela seguinte, calcule quantos alunos de um grupo de 950 devem ser
aprovados neste processo seletivo.
PROVA MEDIA VARIANCIA
PORTUGUES 7,3 7,29
MATEMÁTICA 6,1 3,24
37
III – CORRELAÇÃO E REGRESSÃO
1 - Introdução
Nos capítulos anteriores, nossa preocupação era descrever a distribuição de
valores de uma variável. Com esse objetivo, aprendemos a calcular medidas
de tendência central e variabilidade.
Quando, porém, consideramos observações de duas ou mais variáveis, surge
um novo problema: as relações que podem existir entre as variáveis
estudadas. Nesse caso, as medidas estudadas não são suficientes.
Assim, quando consideramos variáveis como peso e altura de um grupo de
pessoas, uso do cigarro e incidência de câncer, vocabulário e compreensão da
leitura, dominância e submissão, procuramos verificar se existe alguma
relação entre as variáveis de cada um dos pares e qual o grau dessa relação.
Para isso, é necessário o conhecimento de novas medidas.
Sendo a relação entre as variáveis de natureza quantitativa, a correlação é o
instrumento adequado para descobrir e medir essa relação.
Uma vez caracterizada a relação, procuramos descrevê-la através de uma
função matemática. A regressão é o instrumento adequado para a
determinação dos parâmetros dessa função.
2 – Correlação
2.1 – Relação funcional e relação estatística
Como sabemos, o perímetro e o lado de um quadrado estão relacionados. A
relação que os liga é perfeitamente definida e pode ser expressa por meio de
uma sentença matemática:
2p = 4l,
onde 2p é o perímetro e l é o lado do quadrado.
Atribuindo-se, então, um valor qualquer a l, é possível determinar exatamente
o valor de 2p.
Consideremos, agora, a relação que existe entre o peso e a estatura de um
grupo de pessoas. É evidente que essa relação não é do mesmo tipo da
anterior; ela é bem menos precisa. Assim, pode acontecer que a estaturas
diferentes correspondam pesos iguais ou que a estaturas iguais correspondam
pesos diferentes. Porém, em media, quanto maior a estatura, maior o peso.
38
As relações do tipo perímetro-lado são conhecidas como relações funcionais
e as do tipo peso-estatura, como relações estatísticas.
2.2 – Diagrama de dispersão
Consideremos uma amostra aleatória, formada por dez dos 98 alunos de uma
classe da faculdade A e pelas notas obtidas por eles em Matemática e
Estatística:
Tabela 1- Notas de Matemática e Estatística da Faculdade A
Nºs
Notas
Matemática (xi) Estatística (yi)
01 5,0 6,0
08 8,0 9,0
24 7,0 8,0
38 10,0 10,0
44 6,0 5,0
58 7,0 7,0
59 9,0 8,0
72 3,0 4,0
80 8,0 6,0
92 2,0 2,0
Representando, em um sistema coordenado cartesiano ortogonal, os pares
ordenados (xi,yi), obtemos uma nuvem de pontos que denominamos diagrama
de dispersão. Esse diagrama nos fornece uma ideia grosseira, porém útil, da
correlação existente:
Quando duas variáveis estão ligadas por uma relação estatística, dizemosque existe correlação entre elas.
39
2.3 – Correlação linear
Os pontos obtidos, vistos em conjunto, formam uma elipse em diagonal.
Podemos imaginar que, quanto mais fina for a elipse, mais ela se aproximará
de uma reta. Dizemos, então, que a correlação de forma elíptica tem como
“imagem” uma reta, sendo, por isso, denominada correlação linear.
É possível verificar que a cada correlação está associada como “imagem” uma
relação funcional. Por esse motivo, as relações funcionais são chamadas
relações perfeitas.
Como a correlação em estudo tem como “imagem” uma reta ascendente, ela é
chamada correlação linear positiva.
Assim, uma correlação é:
Linear positiva se os pontos do diagrama têm como “imagem” uma
reta ascendente;
Linear negativa se os pontos do diagrama têm como “imagem” uma
reta descendente;
Não-linear se os pontos têm como “imagem” uma curva.
Se os pontos apresentam-se dispersos, não oferecendo uma “imagem”
definida, concluímos que não há relação alguma entre as variáveis em estudo.
40
Temos, então:
2.4 – Coeficiente de correlação linear
O instrumento empregado para a medida da correlação linear é o coeficiente
de correlação. Esse coeficiente deve indicar o grau de intensidade da
correlação entre duas variáveis e, ainda, o sentido dessa correlação (positivo
ou negativo).
Faremos uso do coeficiente de correlação de Pearson, que é dado por:
onde n é o número de observações.
Os valores limites do coeficiente r são -1 e +1, isto é, o valor de r pertence ao
intervalo [-1,+1].
41
Assim:
Se a correlação entre duas variáveis é perfeita e positiva, então r = +1;
Se a correlação é perfeita e negativa, então r = -1;
Se não há correlação entre as variáveis, então r = 0.
Logicamente:
Se r = +1, há uma correlação perfeita e positiva entre as variáveis;
Se r = -1, há uma correlação perfeita e negativa entre as variáveis;
Se r = 0, ou não há correlação entre as variáveis, ou a relação que
porventura exista não é linear.
NOTAS:
Para que uma relação possa ser descrita por meio do coeficiente de
correlação de Pearson é imprescindível que ela se aproxime de uma função
linear. Uma maneira prática de verificarmos a linearidade da relação é a
inspeção do diagrama de dispersão: se a elipse apresenta saliências ou
reentrâncias muito acentuadas, provavelmente trata-se de correlação
curvilínea.
Para podermos tirar algumas conclusões significativas sobre o
comportamento simultâneo das variáveis analisadas, é necessário que:
0,6 ≤ | r | ≤ 1 (forte correlação entre as variáveis).
Se 0,3 ≤ | r | < 0,6, há uma correlação relativamente fraca entre as variáveis.
Se 0 < | r | < 0,3, a correlação é muita fraca e, praticamente, nada podemos
concluir sobre a relação entre as variáveis em estudo.
Vamos, então, calcular o coeficiente de correlação relativo à Tabela 1. O
modo mais prático para obtermos r é abrir, na tabela, colunas correspondentes
aos valores de xiyi, xi
2 e yi
2. Assim, temos a tabela a seguir:
42
Tabela 2 – Cálculo dos valores de xiyi, xi
2 e yi
2 (n = 10)
Matemática
(xi)
Estatística
(yi)
xiyi xi2 yi2
5,0 6,0 30 25 36
8,0 9,0 72 64 81
7,0 8,0 56 49 64
10,0 10,0 100 100 100
6,0 5,0 30 36 25
7,0 7,0 49 49 49
9,0 8,0 72 81 64
3,0 4,0 12 9 16
8,0 6,0 48 64 36
2,0 2,0 4 4 4
Σ = 65 Σ = 65 Σ = 473 Σ = 481 Σ = 475
Logo:
Daí:
r = 0,91.
Resultado que indica uma correlação linear positiva altamente significativa
entre as duas variáveis.
43
Resolva:
1. Complete o esquema de cálculo do coeficiente de correlação para os valores
das variáveis xi e yi:
44
3 – Regressão
3.1 – Ajustamento da reta
Sempre que desejamos estudar determinada variável em função de outra,
fazemos uma análise de regressão.
Podemos dizer que a análise de regressão tem por objetivo descrever, através
de um modelo matemático, a relação entre as duas variáveis, partindo de n
observações das mesmas.
A variável sobre a qual desejamos fazer uma estimativa recebe o nome de
variável dependente e a outra recebe o nome de variável independente.
Assim, supondo X a variável independente e Y a dependente, vamos procurar
determinar o ajustamento de uma reta à relação entre essas variáveis, ou seja,
vamos obter uma função definida por:
Y = aX + b
onde a e b são os parâmetros.
Sejam duas variáveis X e Y, entre as quais exista uma correlação acentuada,
embora não perfeita, como, por exemplo, as que formam a tabela 2.
Daí, temos:
Tabela 3 – Valores das variáveis xi e yi.
xi 5 8 7 10 6 7 9 3 8 2
yi 6 9 8 10 5 7 8 4 6 2
cujo diagrama de dispersão é dado por:
45
Podemos concluir, pela forma do diagrama, que se trata de uma correlação
retilínea, de modo a permitir o ajustamento de uma reta, imagem da função
definida por:
Y = aX + b
Vamos, então, calcular os valores dos parâmetros a e b com a ajuda das
fórmulas:
onde,
NOTA:
Como estamos fazendo uso de uma amostra para obtermos os valores dos
parâmetros, o resultado, na realidade, é uma estimativa da verdadeira equação de
regressão. Sendo assim, escrevemos:
46
Formemos, então, a tabela de valores:
Tabela 4 – Cálculo dos valores de xiyi e xi2 (n = 10).
(xi) (yi) xiyi xi2
5,0 6,0 30 25
8,0 9,0 72 64
7,0 8,0 56 49
10,0 10,0 100 100
6,0 5,0 30 36
7,0 7,0 49 49
9,0 8,0 72 81
3,0 4,0 12 9
8,0 6,0 48 64
2,0 2,0 4 4
Σ = 65 Σ = 65 Σ = 473 Σ = 481
Temos, assim:
a = 10x473 – 65x65 = 4730 – 4225 = 505 = 0,8632
10x481 – (65)2 4810 – 4225 585
47
Assim, temos:
3.2 – Interpolação e extrapolação
Voltando à tabela 1, vemos que 4,0 não figura entre as notas de Matemática.
Entretanto, podemos estimar a nota correspondente em Estatística fazendo X =
4,0 na equação:
O mesmo acontece com a nota 1,0. Repetindo o procedimento, temos:
Como a nota 4,0 pertence ao intervalo [2,10], dizemos que foi feita uma
interpolação; e como a nota 1,0 não pertence ao intervalo [2,10], dizemos que
foi uma extrapolação.
NOTA:
Uma norma fundamental no uso das equações de regressão é a de nunca extrapolar,
exceto quando considerações teóricas ou experimentais demonstrem a possibilidade
de extrapolação.
48
Resolva:
1. Complete o esquema para o ajustamento de uma reta aos dados:
xi 2 4 6 8 10 12 14
yi 30 25 22 18 15 11 10
49
EXERCÍCIOS
1 – Um grupo de pessoas fez uma avaliação do peso aparente de alguns
objetos. Com o peso real e a media dos pesos aparentes, dados pelo grupo,
obteve-se a tabela:
PESO REAL 18 30 42 62 73 97 120
PESO APARENTE 10 23 33 60 91 98 159
Calcule o índice de correlação.
2 – Considere os resultados de dois testes, X e Y, obtidos por um grupo de
alunos da escola A:
xi 11 14 19 19 22 28 30 31 34 37
yi 13 14 18 15 22 17 24 22 24 25
a) Verifique, pelo diagrama, se existe correlação retilínea;
b) Em caso afirmativo, calcule o coeficiente de correlação;
c) Escreva, em poucas linhas, as conclusões a que chegou sobre a relação
entre as variáveis.
3 – A tabela abaixo apresenta a produção de uma indústria:
ANOS 1980 1981 1982 1983 1984 1985 1986 1987 1988
QUANTIDADES (t) 34 36 36 38 41 42 43 44 46
Calcule:
a) O coeficiente de correlação;
Sugestão: para simplificar oscálculos, use para o tempo uma variável
auxiliar, por exemplo:
xi’ = xi - 1984
b) A reta ajustada;
c) A produção estimada para o ano de 1989.
50
4 – A tabela abaixo apresenta valores que mostram como o comprimento de
uma barra de aço varia conforme a temperatura:
TEMPERATURA (ºC) 10 15 20 25 30
COMPRIMENTO (mm) 1003 1005 1010 1011 1014
Determine:
a) O coeficiente de correlação;
b) A reta ajustada a essa correlação;
c) O valor estimado do comprimento da barra para a temperatura de 18ºC;
d) O valor estimado do comprimento da barra para a temperatura de 35ºC;
5 – A variação do valor da Unidade de Preços ao Consumidor - UPC,
relativamente a alguns meses de 2009, deu origem à tabela:
MESES mai jun jul ago Set out nov
VALORES (R$) 10,32 10,32 11,34 11,34 11,34 12,22 12,22
Calcule:
a) O grau de correlação de correlação;
b) Estabeleça a equação de regressão de Y sobre X;
c) Estime o valor da UPC para o mês de dezembro.
Sugestão: substitua os meses, respectivamente, por 1, 2, 3, ....., 7.
6 – A partir da tabela:
xi 1 2 3 4 5 6
yi 70 50 40 30 20 10
a) Calcule o coeficiente de correlação;
b) Determine a reta ajustada;
c) Estime o valor de Y para X = 0.
51
7 – Certa empresa, estudando a variação da demanda de seu produto em
relação à variação de preço de venda, obteve a tabela:
PREÇO (xi) 38 42 50 56 59 63 70 80 95 110
DEMANDA (yi) 350 325 297 270 256 246 238 223 215 208
a) Determine o coeficiente de correlação;
b) Estabeleça a equação da reta ajustada;
c) Estime o valor de Y para X = 60 e X = 120.
8 – Pretendendo-se estudar a relação entre as variáveis “consumo de energia
elétrica” (xi) e “volume de produção nas empresas industriais” (yi), fez-se uma
amostragem que inclui vinte empresas, computando-se os seguintes valores:
Σxi =11,34; Σyi = 20,72; Σ xi2 = 12,16; Σ yi2 =84,96; Σxiyi = 22,13
Determine:
a) O cálculo do coeficiente de correlação;
b) A equação de regressão de Y para X;
c) A equação de regressão de X para Y.
52
REFERENCIAS
Bruni, Adriano Leal. Estatística aplicada à gestão empresarial. 1.ed. São
Paulo: Editora Atlas, 2007.
Crespo, Antonio Arnot. Estatística fácil. 17.ed. São Paulo: Saraiva, 2002.
Hoffmann, Ronaldo; Ovalle, Vieira Sonia. Elementos de estatística. 4.ed.
São Paulo: Editora Atlas, 2003.
Morettin, Pedro A. Estatística básica. 5.ed. São Paulo: Saraiva, 2002.
Pinheiro, João Ismael D. Estatística básica: a arte de trabalhar com dados.
Rio de Janeiro: Elsevier, 2009.
Silva, Ermes Medeiro da; Silva, Elio Medeiro da; Gonçalves; Valter; Murolo,
Afrânio Carlos. Estatística: Para os cursos de economia, Administração e
Ciências Contábeis - 1. 3.ed. São Paulo: Editora Atlas, 1999.
Toledo, Geraldo Luciano; Ovalle, Ivo Izidoro. Estatística básica. 2.ed. São
Paulo: Editora Atlas, 1985.
53
ANEXO:
Tabela de Distribuição Normal.
54