Prévia do material em texto
PROBABILIDADE E ESTATÍSTICA
Jeronimo Flores
SUMÁRIO
Esta é uma obra coletiva organizada por iniciativa e direção do CENTRO SU-
PERIOR DE TECNOLOGIA TECBRASIL LTDA – Faculdades Ftec que, na for-
ma do art. 5º, VIII, h, da Lei nº 9.610/98, a publica sob sua marca e detém os
direitos de exploração comercial e todos os demais previstos em contrato. É
proibida a reprodução parcial ou integral sem autorização expressa e escrita.
CENTRO UNIVERSITÁRIO UNIFTEC
Rua Gustavo Ramos Sehbe n.º 107. Caxias do Sul/ RS
REITOR
Claudino José Meneguzzi Júnior
PRÓ-REITORA ACADÊMICA
Débora Frizzo
PRÓ-REITOR ADMINISTRATIVO
Altair Ruzzarin
DIRETOR DE ENSINO A DISTÂNCIA (EAD)
Rafael Giovanella
Desenvolvido pela equipe de Criações para o Ensino a Distância (CREAD)
Coordenadora e Designer Instrucional
Sabrina Maciel
Diagramação, Ilustração e Alteração de Imagem
Igor Zattera, Thaís Munhoz
Revisora
Simone Marin
INTRODUÇÃO À ESTATÍSTICA 3
NOÇÕES INTRODUTÓRIAS 4
MÉTODOS TABULARES E MÉTODOS GRÁFICOS 7
DISTRIBUIÇÃO DE FREQUÊNCIA 11
SÍNTESE 14
MEDIDAS ESTATÍSTICAS 17
MEDIDAS DE TENDÊNCIA CENTRAL 18
MEDIDAS ESTATÍSTICAS COM PLANILHAS ELETRÔNICAS 29
SÍNTESE 30
PROBABILIDADES 32
CONCEITOS INTRODUTÓRIOS 33
PROBABILIDADE DE UM EVENTO 35
DISTRIBUIÇÕES DE PROBABILIDADE 37
INTERVALO DE CONFIANÇA 41
SÍNTESE 44
ESTATÍSTICA AVANÇADA 47
REGRESSÃO LINEAR SIMPLES 48
A EQUAÇÃO DA RETA 49
VALOR ESPERADO 51
ENCONTRANDO A RETA NA PLANILHA ELETRÔNICA 51
CORRELAÇÃO 52
ANÁLISE DE VARIÂNCIA 55
SÍNTESE 60
GABARITOS 63
3
INTRODUÇÃO À
ESTATÍSTICA
A estatística é um ramo da Matemática que se propõe a coletar,
organizar, sistematizar, descrever, analisar e interpretar dados para o
auxílio no processo de tomada de decisão.
4PROBABILIDADE E ESTATÍSTICA
SUMÁRIO
Iniciamos nosso estudo discorrendo acerca do uso da estatística desde tempos atrás.
Não sendo um conteúdo atual, ela vem sendo utilizada há séculos. Na Bíblia Sagrada já exis-
tiam relatos de contagem de pessoas com finalidades militares e para cobrança de impostos.
A estatística é um ramo da Matemática que se propõe a coletar, organizar, sistemati-
zar, descrever, analisar e interpretar dados para o auxílio no processo de tomada de decisão.
Você se considera uma pessoa azarada? A fila em que você está no supermercado sem-
pre anda mais devagar? Ou sempre chove quando você esquece o guarda-chuva? A maior
parte dos fenômenos que as pessoas atribuem à “sorte” ou ao “azar” podem ser calculados,
medidos e até mesmo previstos por meio de procedimentos estatísticos.
Podemos dividir a estatística em três grandes áreas: a estatística descritiva, a esta-
tística inferencial e a estatística probabilística. Na estatística descritiva os procedimentos
se resumem a descrever os dados, o que exige organização síntese e apresentação. Na esta-
tística inferencial, procuramos generalizar um fenômeno a partir do estudo com uma fração
ou pedaço dele. Já a estatística probabilística mede as tendências de um fenômeno aconte-
cer, partindo de observações preliminares (CORREA, 2003).
NOÇÕES INTRODUTÓRIAS
Para o nosso sucesso, nesta disciplina, precisamos ter em mente alguns conceitos que
irão nos acompanhar no decorrer da maioria dos conteúdos. Procure estar inteirado deles
para minimizar as dificuldades futuras.
• Variável: uma característica que pode assumir distintos valores, de acordo com os su-
jeitos e o contexto (CORREA, 2003), como o crescimento de uma planta, a distância que
o vendedor percorre com o carro da empresa, o desgaste de uma peça etc.
Exemplo: o gerente de um setor de uma determinada empresa está pesquisando al-
guns aspectos socioeconômicos dos colabores da seção. Com informações obtidas no depar-
tamento pessoal ele elaborou a seguinte tabela:
Perceba que algumas variáveis, como sexo, escolaridade e estado civil, por exemplo,
tratam de atributos ou qualidades dos pesquisados, essas são as variáveis qualitativas. Ou-
tras, como salário, idade e número de filhos trazem como possível resposta números passí-
veis de contagem e quantificação, são as variáveis quantitativas.
Variável Representação
Estado Civil x
Escolaridade y
Número de filhos z
Salário w
Idade v
Sexo u
Cidade natal k
5PROBABILIDADE E ESTATÍSTICA
SUMÁRIO
As variáveis quantitativas podem ser classificadas como:
• Variáveis quantitativas contínuas: representam números reais, passíveis de mensura-
ção, tais como a altura e a massa do funcionário. Podem trazer infinitos resultados du-
rante a realização de uma pesquisa, como a medida do desgaste de uma engrenagem de
uma máquina. Perceba que a medida do desgaste pode ser milimétrica, ou seja, assumir
infinitos valores, conforme a temperatura, pressão, condições de uso etc. Assim, não
conseguimos estabelecer um limite claro.
• Variáveis quantitativas discretas: possuem um número finito e enumerável de resul-
tados, passíveis de contagem, como o número de filhos. Temos outro exemplo: o setor
de produção da empresa “ABC” tem 4 motores elétricos em funcionamento. A possibi-
lidade de falha de motores é um dado discreto, pois só podem falhar 1,2,3 ou 4 motores,
logo, existe um limite claro.
• População: é o conjunto formado por elementos que tenham pelo menos uma variável
comum (MORETTIN, 2010).
• Amostra: após a população ser definida, um subconjunto ou “recorte” dessa será a
amostra.
Utiliza-se n para indicar o número que foi amostrado (MORETTIN, 2010).
Exemplo:
Na empresa em que você trabalha, existem 30 funcionários que tem Ensino Funda-
mental, 27 que tem Ensino Médio e 12 com Ensino Superior. Você irá fazer uma pesquisa
com 10% de cada estrato em relação à satisfação profissional. É preciso fazer uma tabela
indicando população e amostra.
Perceba que não podemos entrevistar 2,7 ou 1,2 pessoas. Assim, devemos “arredon-
dar” a amostra encontrando o “número da amostra”, que indica o número efetivo que ire-
mos entrevistar. Quando a dezena for maior que 5, arredonda-se para cima, quando a dezena
for menor que 5, arredonda-se para baixo. Quando for exatamente 5, o Instituto Brasileiro
de Geografia e Estatística (IBGE) recomenda que arredonda-se sempre para cima.
População Amostra
Número da
amostra
Ensino
Fundamental
30 3 3
Ensino Médio 27 2,7 3
Ensino Superior 12 1,2 1
Total 69 6,9 7
6PROBABILIDADE E ESTATÍSTICA
SUMÁRIO
• Amostragem: é o processo utilizado para a composição da amostra (MORETTIN, 2010).
• Dados brutos: são os dados na forma com que foram coletados, sem qualquer tratamento
matemático. (CORREA, 2003).
• Frequência: é o número de vezes que um fenômeno se repete (CORREA, 2003). O conceito de
frequência é muito estudado em estatística.
• Rol: é a organização dos dados brutos na forma crescente ou decrescente (CORREA, 2003).
• Parâmetro: é uma medida utilizada para descrever as características de uma população de
forma numérica. A média e a variância são exemplos de parâmetros (MORETTIN, 2010).
• Censo: é uma pesquisa em que a população é igual à amostra (CORREA, 2003). O IBGE se pro-
põe a fazer um censo da população brasileira, ou seja, entrevistar todos os habitantes do país.
Exemplo:
Você trabalha no restaurante de uma empresa onde almoçam 300 funcionários diariamen-
te. O seu interesse é mudar o cardápio, mas não tem certeza se irão aprovar. Você não tem tempo
nem recursos para fazer um almoço para todos. Dessa forma, você sorteia 30 pessoas, faz um al-
moço teste e pede para que eles atribuam uma nota de zero a dez ao cardápio. Para estimar uma
nota geral, faz-se uma média das notas. Assim, temos:
População: 300 pessoas
Amostra: 30 pessoas
Amostragem: sorteio
Parâmetro: média
7PROBABILIDADE E ESTATÍSTICA
SUMÁRIO
MÉTODOS TABULARES E MÉTODOS GRÁFICOS
Métodos tabulares e métodos gráficos são estudados em um ramo da estatís-
tica chamado estatística descritiva. Tabelas, gráficos e histogramas são os recur-
sos utilizados com o objetivo de apresentar e descreverdados.
TABELAS
Tabelas podem ser muito úteis no processo de organização, sistematização e
apresentação dos dados. A maior parte delas apresenta as variáveis e a sua frequ-
ência. Uma tabela pode ser de entrada simples, quando conter apenas uma variável
ou de entrada dupla quanto conter mais de uma.
Vale a pena lembrar que a estatística descritiva parte de um processo de con-
tagem. Você conta algo para posteriormente seguir com os demais processos. Por
exemplo, verificou-se a distância que o vendedor da empresa onde você trabalha
anda com o carro da empresa.
Considerando unicamente os números 80, 75, 120, 100, 84 e 67, podemos dizer que temos os
dados brutos da distância percorrida. No momento em que eles forem organizados, seguindo um
padrão matemático (67, 75, 80, 84, 100 e 120), temos um rol.
Uma pesquisa científica deve ter os elementos citados
anteriormente muito claros, de forma que o leitor consiga
compreender os procedimentos adotados pelo pesquisador.
Outro conceito importante é o de amplitude total (h).
Amplitude, refere-se ao tamanho, ou seja, o maior valor menos o menor.
Assim, podemos dizer que a amplitude total da distância percorrida pelo
vendedor é dada por h= 120 -67h= 53km
Dia Distância (Km)
Segunda-feira 80
Terça-feira 75
Quarta-feira 120
Quinta-feira 100
Sexta-feira 84
Sábado 67
Interesse em realizar
horas extras
Homens Mulheres Total
Não 16 35 51
Sim 45 5 50
Total 61 40 101
8PROBABILIDADE E ESTATÍSTICA
SUMÁRIO
Quando o nosso processo de contagem exigir a consideração de mais de uma va-
riável significativa, podemos montar uma tabela de entrada dupla. Por exemplo, você
foi responsabilizado para verificar se os funcionários da empresa desejam realizar
horas extras. A sua experiência anterior indica que homens e mulheres tem opiniões
diferentes a respeito desses assunto. Então, a tabela é organizada com as variáveis
“homens” e “mulheres”.
GRÁFICOS
Gráficos além de fornecerem a organização dos dados são excelentes para apre-
sentações e palestras, pois produzem um efeito visual interessante e revelam o com-
portamento do fenômeno. Entretanto, são necessários alguns cuidados na sua elabo-
ração, dentre os quais destacamos: veracidade, clareza e simplicidade. Lembre-se que
os gráficos podem ser apresentados para pessoas que não conhecem a sua pesquisa,
então eles precisam fornecer uma ideia do que aconteceu.
GRÁFICO EM COLUNAS
Exemplo:
O gráfico a seguir indica as vendas dos vendedores da empresa Sul Metais Ltda.
Observe que o gráfico apresentado, apesar de representar o fenômeno, pode conter proble-
mas para uma apresentação. Veja que alguns vendedores não tem a sua venda indicada, levando
o leitor a precisar supor o valor exato da venda. Além disso, seria necessário especificar o período
para termos uma noção de como as vendas aconteceram.
GRÁFICO EM COLUNAS
Assemelha-se ao gráfico em colunas, porém os retângulos são dispostos horizontalmente
(CORREA, 2003, p.25). A escolha do modelo depende exclusivamente do interesse e da preferên-
cia de quem fez o gráfico, pois são representações muito similares.
9PROBABILIDADE E ESTATÍSTICA
SUMÁRIO
Exemplo:
GRÁFICO EM SETORES
É o famoso gráfico em “pizza”. Consiste em repartir um círculo em vá-
rios setores ou fatias. Utilizamos principalmente quando queremos comparar
os valores encontrados com o total (CORRREA, 2005, p.25). Esse gráfico produz
um bom aspecto visual, sendo muito utilizado em apresentações.
Exemplo:
O gráfico que segue revela os gastos com papel em um escritório de uma
determinada empresa.
Esse gráfico, apesar de produzir um bom efeito visual, apresenta algumas limitações. Por exem-
plo, observe a quantia de tons de azul e roxo utilizadas, o que pode confundir o leitor. Apesar de ter-
mos uma legenda, ela não indica exatamente em que local está o mês inicial. Podendo causar uma certa
confusão. Logo, podemos dizer que esse gráfico falha no aspecto clareza. Sobretudo, no que se refere a
apresentações, devemos estar muito atentos ao modo que as pessoas irão entender o nosso gráfico.
GRÁFICO EM LINHAS
Constitui uma aplicação do processo de representação das funções num sistema de coordena-
das cartesianas (CORREA, 2003, p.24). São bastante úteis quando almejamos visualizar a variação de
um fenômeno, por exemplo, as vendas da empresa, subiram, baixaram ou mantiveram-se constantes.
Comparações entre dois fenômenos também são interessantes.
10PROBABILIDADE E ESTATÍSTICA
SUMÁRIO
Exemplo:
O gráfico a seguir indica as vendas de João Carlos durante os primeiros meses
do ano de 2016.
Perceba que com este tipo de gráfico é possível observarmos com clareza os
períodos de queda e de crescimento nas vendas do vendedor.
GRÁFICO DE DISPERSÃO
São representações em que as variáveis x e y são apresentadas em um plano cartesiano. Esse
tipo de gráfico é muito utilizado para a verificação da correlação de variáveis.
Exemplo:
Um biólogo estudou o crescimento de uma planta, chegando ao seguinte resultado:
Existem outros tipos de gráficos que devem ser usados de acordo
com a necessidade do pesquisador, mas, sobretudo, com o uso
do bom senso.
Semana Altura (cm)
1 5
2 12
3 16
4 22
5 34
11PROBABILIDADE E ESTATÍSTICA
SUMÁRIO
DISTRIBUIÇÃO DE FREQUÊNCIA
Podemos entender a frequência como o número de vezes que um fenômeno se repete.
Uma distribuição de frequência é uma tabela na qual os possíveis valores de uma va-
riável se encontram agrupados em classes, registrando-se o número de valores observados
em cada classe (KAZMIER, 1982, p.8). Ela pode ser feita sem agrupar dados ou com o uso de
dados agrupados.
DISTRIBUIÇÃO DE FREQUÊNCIA SEM AGRUPAR DADOS
A distribuição de frequência sem agrupar dados é feita observando-se o número de
acontecimentos em determinados intervalos de uma amostra.
Exemplo:
O departamento pessoal da empresa PL Calçados efetuou um levantamento dos fun-
cionários que estiveram ausentes no decorrer de dois anos.
Podemos organizar esses dados considerando o número de funcionários que faltou e o
número de vezes que isto ocorreu (frequência absoluta).
A tabela apresentada é uma denominada distribuição de frequência, sem agrupar dados.
DISTRIBUIÇÃO DE FREQUÊNCIA COM DADOS AGRUPADOS
Uma distribuição de frequência com dados agrupados consiste em realizar agrupa-
mentos, sendo muito utilizada quando temos muitas informações. No entanto, a constru-
ção desses grupos exige procedimentos matemáticos e o conhecimento de alguns conceitos:
• Classes (k): são os grupos que serão formados;
Jan. Fev. Mar. Abr. Mai. Jun. Jul. Ago. Set. Out. Nov. Dez.
Ano 1 6 7 1 6 9 2 7 9 1 8 10 9
Ano 2 8 8 5 1 7 4 10 9 4 10 6 10
Número de funcionários que
faltaram
Número de meses
(frequência)
1 3
2 1
4 2
5 1
6 3
7 3
8 3
9 4
10 4
Total 52
12PROBABILIDADE E ESTATÍSTICA
SUMÁRIO
• Amplitude do intervalo de classe (h): é o tamanho da classe;
• Intervalo de classe: são os limites da classe. Temos o limite inferior e o superior;
• Ponto médio do intervalo de classe (xi): é o limite superior mais o limite inferior divi-
dido por dois;
• Frequência absoluta (fi): são os números de observações dos elementos de uma deter-
minada classe;
• Frequência relativa (fr): é a proporção que a frequência absoluta da classe ocupa em re-
lação ao total. Ela é obtida a partir da divisão da frequência absoluta pelo total;
• Frequência percentual (fp): indica o percentual que cada classe ocupa em relação ao
todo. É obtida a partir da multiplicação da frequência relativa por cem;
• Frequência acumulada (fa): é a soma da frequência absoluta da classe com a da classe
anterior. É comumente utilizada quando queremos ter uma ideia de muitas classes con-
juntamente;
• Frequência acumulada percentual (fap): é a soma da frequência percentual da clas-
se com a da classe anterior. É comumente utilizada quando queremos ter uma ideia de
muitasclasses conjuntamente.
Veremos como compor cada um desses elementos em uma pesquisa.
Exemplo:
O rol a seguir indica a quilometragem mensal que um vendedor fez com o veículo da
empresa em um determinado período. Faça a distribuição de frequência utilizando dados
agrupados por intervalos de classes.
Passo 1: estimar o número de classe.
550 580 615 630 650
700 780 805 830 850
865 900 925 940 950
955 970 980 1000 1100
1150 1230 1300 1350 1500
2000 2500 2800 2950 3000
Utilizamos a fórmula de Sturges
k=1+3,3logn
Importante:
Explore a sua calculadora! Em algumas basta digitar a fórmula, em outras, você
precisa calcular o log primeiro, multiplicar por 3,3 e, por último, somar um.
13PROBABILIDADE E ESTATÍSTICA
SUMÁRIO
Vamos considerar que a nossa amostra temha 30 elemen-
tos, então n=30.
Logo,
k=1+3,3logn
k=1+3,3log30
k=1+3,3.1,47
k=5,87, aproximadamente, 6 classes.
Passo 2: estimar a amplitude de cada classe.
Passo 3: montar a tabela com a frequência absoluta. Para isso, partimos do primeiro valor do rol (ver tabela 5),
ou seja, 550. Esse será o limite inferior da primeira classe. Para encontrarmos o limite superior somamos 550 com 409,
que é a amplitude do intervalo, resultando em 959. A segunda classe começará com 959, que será somado com 409. O
processo segue até alcançarmos 6 classes, conforme a tabela que segue. Para encontrar a frequência absoluta, voltamos
para a tabela 5 e contamos quantos elementos pertencem a cada classe. Perceba que existem 16 eventos entre 550 e 959.
Passo 4: frequência relativa. Basta dividir cada um dos valores da frequência absoluta pelo total, ou seja, 30.
Importante:
A amplitude de classe é o único caso que devemos
arredondar “para cima”, sempre, pois, caso contrário,
o último valor da tabela pode não se encaixar na
distribuição de frequência. Assim, h = 409.
Distância Frequência absoluta (fi)
550 |–959 16
959 |– 1368 8
1368 |– 1777 1
1777 |– 2186 1
2186 |– 2595 1
2595 |–3004 3
TOTAL 30
Distância fi fr
550 |–959 16 16/30 : 0,53
959 |– 1368 8 8/30: 0,27
1368 |– 1777 1 1/30: 0,033
1777 |– 2186 1 1/30: 0,033
2186 |– 2595 1 1/30: 0,033
2595 |–3004 3 3/30: 0,1
TOTAL 30 Aprox. 1
14PROBABILIDADE E ESTATÍSTICA
SUMÁRIO
Passo 5: frequência percentual. Basta multiplicar a frequência relativa por 100.
Passo 6: frequência acumulada e frequência acumulada percentual.
Passo 7: estimar o ponto médio. Em muitas situações é necessário sabermos o ponto
médio de cada classe. Assim:
Distância fi fr fp
550 |–959 16 16/30 : 0,53 53%
959 |– 1368 8 8/30: 0,27 27%
1368 |– 1777 1 1/30: 0,033 3,3%
1777 |– 2186 1 1/30: 0,033 3,3%
2186 |– 2595 1 1/30: 0,033 3,3%
2595 |–3004 3 3/30: 0,1 10%
TOTAL 30 Aprox. 1 Aprox. 100%
Distância fi fr fp fa fap
550 |–959 16 16/30 : 0,53 53% 16 53%
959 |– 1368 8 8/30: 0,27 27% 16+8: 24 80%
1368 |– 1777 1 1/30: 0,033 3,3% 24+1: 25 83,3%
1777 |– 2186 1 1/30: 0,033 3,3% 25+1: 26 86,6%
2186 |– 2595 1 1/30: 0,033 3,3% 26+1: 27 89,9%
2595 |–3004 3 3/30: 0,1 10% 27+3: 30 99,9%
TOTAL 30 Aprox. 1 Aprox. 100%
Classe 1: (550 + 959) /2 = 754,5
Classe 2: (959+1368) /2 = 1163,5
Classe 3: (1368+1777) /2 = 1572,5
Classe 4: (1777+ 2186) /2 = 1981,5
Classe 5: (2186+2595) /2 = 2390,5
Classe 6: (2595+3004)/ 2 = 2799,5
SÍNTESE
Neste capítulo, compreendemos que:
• A estatística se divide em distintos campos de estudo;
• É necessário considerar as variáveis em um estudo;
• Os tipos/características dos gráficos e suas necessidades de uso.
15PROBABILIDADE E ESTATÍSTICA
EXERCÍCIOS SUMÁRIO
1. Uma franquia de lojas instalou algumas representações em diversas regiões do Rio
Grande do Sul. Com o fim de conferir a satisfação dos clientes, resolveu entrevistar 7%
desses de cada região. Então, vamos completar a tabela a seguir, indicando a amostra
e o número da amostra. OBS: O número da amostra é a amostra, porém arredondada.
2. O número de produtos que os clientes trocam em uma loja foram registrados na tabela
que segue:
Vamos construir uma distribuição de frequência, sem agrupar dados.
Região Clientes Amostra Número de amostra
Metropolitana 690
Serra 380
Campanha 160
Litoral 280
Casacos Camisetas Camisas Meias Sapatos Cintos
8 5 0 5 7 4
7 4 1 4 8 3
6 3 4 2 6 2
16PROBABILIDADE E ESTATÍSTICA
EXERCÍCIOS SUMÁRIO
3. Os funcionários da empresa 123 Testes Informática estavam reclamando do tempo de reuniões. Para
verificar se a reclamação procedia, foi realizado um estudo, no qual se controlou o tempo das reuni-
ões em minutos, que foram organizados na tabela que segue:
Construa uma tabela de distribuição de frequência com dados agrupados por classes. Considere
a frequência absoluta, frequência relativa, frequência percentual, frequência acumulada e frequência
acumulada percentual.
4. Observe um estrato de uma tabela extraída do site do IBGE:
Construa um gráfico de setores, preferencialmente, utilizando planilhas eletrônicas.
Segunda Terça Quarta Quinta
45 52 70 58
50 51 46 63
42 44 59 54
41 40 64 60
Empresas que não apresentaram ações de inovações organizacionais e marketing no Brasil
entre 2006 e 2008.
Segmento Número de empresas
Fabricação de produtos alimentícios 6.839
Fabricação de bebidas 551
Fabricação de produtos do fumo 42
Fabricação de produtos têxteis 2.206
Confecção de artigos do vestuário e acessórios 8 939
5. João Oliveira, o gerente da empresa onde você trabalha, recebeu um e-mail
com o seguinte conteúdo:
Seu João. O Ricardo rodou 344 km e vendeu R$ 456,00, enquanto o Bruno rodou ape-
nas 124 km e vendeu R$540,00. Só não entendi o Gilmar que rodou 1389 km e vendeu ape-
nas R$123,00. Por outro lado, a Marisa, que preferiu ficar na empresa e trabalhar por tele-
fone, conseguiu vender R$560,00. Acho que está na hora de tomarmos algumas decisões.
Att,
Vinicius Araújo
Construa uma tabela de entrada dupla com os dados envolvidos no e-mail
recebido pelo gerente da situação anterior.
17
MEDIDAS
ESTATÍSTICAS
Medidas estatísticas são recursos matemáticos utilizados com a
finalidade de interpretar e compreender as características de um
determinado fenômeno.
18PROBABILIDADE E ESTATÍSTICA
SUMÁRIO
As medidas estatísticas dividem-se em medidas de tendência
central e medidas de variabilidade. Ambas podem ser aplicadas com
dados não agrupados ou agrupados. Preste atenção nessa diferença.
Quando realizamos uma pesquisa quantitativa, o primeiro pas-
so é a coleta de dados. Para isso, precisamos definir a população, a
amostra e a técnica de amostragem que será utilizada. De posse dos
dados, eles precisam ser organizados e sistematizados, sendo grá-
ficos e tabelas os recursos mais comumente utilizados para isso. O
passo seguinte é interpretar e analisar as informações que temos. A
partir daí a pesquisa começa a se tornar relevante para o processo de
tomada de decisão. Assim, para que isso seja possível, é indispen-
sável o uso de medidas estatísticas que usam técnicas matemáticas
para a compreensão dos fenômenos.
MEDIDAS DE TENDÊNCIA CENTRAL
Como vimos anteriormente, os dados obtidos em uma pesqui-
sa podem ser apresentados em gráficos ou tabelas. Entretanto, um
fenômeno pode ser representado por meio de uma única quantia,
denominada medida de tendência central. As principais são a média,
a moda e a mediana. Ambas trazem uma ideia geral do comporta-
mento de um fenômeno.
MÉDIA ARITMÉTICA
É um número que representa um fenômeno. Kazmier (1982, p. 29) define a média aritmética como “a soma
dos valores do grupo de dados divididos pelo número de valores”. Usamos a média aritmética em diversas situ-
ações do nosso cotidiano, quando queremos projetar uma situação intermediária. Por exemplo, se você faz duas
provas valendo 10 pontos cada uma, e tira 6 na primeira e 8 na segunda, qual foi a sua média? Não foi 7? E como
chegamos a esse resultado? Somamos 6 com 8 e dividimos por 2, não é verdade?
19PROBABILIDADE E ESTATÍSTICA
SUMÁRIO
PARA DADOS NÃO AGRUPADOS
A tabelaabaixo indica o lucro da KouroteK calçados. Faça a média:
Média: 120.000/6 = R$ 20.000,00
Observe que basta somar os valores e dividir pelo número
de eventos.
PARA DADOS AGRUPADOS POR INTERVALO DE CLASSE
Quando nossos dados estão agrupados por intervalo de classe, devemos considerar
seus pontos médios e as suas frequências absolutas.
Exemplo:
O estoque de uma loja tem os seus valores organizados por intervalo de classes, se-
gundo a tabela a seguir. Então, encontre a média aritmética:
Perceba que estimamos o ponto médio (xi) e multiplicamos esse pela frequência abso-
luta (fi). Os valores de cada classe devem ser somados e divididos pela soma da frequência
absoluta. A fórmula que resume esse processo é:
Média: 24.340 = R$ 24,34
1.000
Meses Venda (R$)
Janeiro 22.000
Fevereiro 18.000
Março 10.000
Abril 26.000
Maio 14.000
Junho 30.000
Total 120.000
Média aritmética Preço unitário (R$) Quantidade (fi) Ponto médio (xi) Total da classe (xifi)
18,00 |– 20,00 120 19 19.120= 2280
20,00 |– 22,00 150 21 21.150= 3150
22,00 |– 24,00 180 23 23.180= 4140
24,00 |– 26,00 200 25 25.200= 5000
26,00 |– 28,00 190 27 27.190=5130
28,00 |– 30,00 160 29 29.160=4640
n=6 1000 24340
Média com dados agrupados
Média: ∑xi.fi
∑fi
20PROBABILIDADE E ESTATÍSTICA
SUMÁRIO
Observação: sempre que você estiver trabalhando com planilhas eletrônicas, não use
dados agrupados. As planilhas calculam medidas estatísticas sem agrupar dados.
MÉDIA PONDERADA
A média ponderada é uma média aritmética utilizada quando cada elemento tem um
peso distinto em relação ao total. Assim, esse recurso será utilizado quando ocorrer repre-
sentatividade distinta dentro do grupo (KAZMIER, 1982).
Exemplo:
Na empresa em que você trabalha, existe o seguinte quadro funcional:
A primeira coisa que devemos fazer é estimar o valor total do salário de cada um dos
estratos.
Assim:
Desse modo, podemos concluir que o total que a empresa investe em salários é R$
117.600,00. Tal investimento deve ser repartido entre 44 funcionários, ou seja:
Função Número Salário
Gerente 2 R$ 10.000,00
Engenheiros 6 R$ 9.000,00
Operários 20 R$ 1.500,00
Estagiários 16 R$ 850,00
n=4 44
Média ponderada
Gerentes: 2 x 10.000 = R$ 20.000,00
Engenheiros: 6 x 9.000 = R$ 54.000,00
Operários: 20 x 1.500 = R$ 30.000,00
Estagiários: 16 x R$ 850,00 = R$ 13.600,00
OBS: A média aritmética é uma medida que sempre é atraída para
os “outliers”, que são os valores atípicos que se afastam em demasia
do padrão. Assim, olhar um fenômeno somente a partir da média
aritmética pode, de certa forma, “maquiá-lo”. Logo, recomenda-se que
ela seja utilizada, conjuntamente, com as outras medidas que veremos
na sequência.
21PROBABILIDADE E ESTATÍSTICA
SUMÁRIO
MEDIANA
Podemos entender a mediana com o valor que está no centro ou no
meio de um intervalo de dados. Para localizá-la é importante que os dados
estejam no formato de um rol, um seja, organizados de maneira crescente
ou decrescente (KAZMIER, 1982).
Para dados não agrupados:
Basta construir o rol e localizar o valor do meio.
Exemplos:
I. Um vendedor fez a seguinte quilometragem durante a semana, utili-
zando o carro da empresa: 150, 110, 200, 80, 130.
Iniciamos construindo um rol: 80, 110, 130, 150, 200.
A mediana será 130, pois está exatamente no meio do rol.
II. Uma loja vendeu o seguinte número de peças durante a semana: 45, 80,
45, 130, 175, 90.
Rol: 45, 45, 80, 90, 130, 175.
Perceba que não temos um termo que divida o rol ao meio.
Então fazemos a média aritmética dos dois termos centrais:
Para dados agrupados:
A mediana para dados agrupados exige um pouco mais de trabalho manual, por isso precisamos estar
atentos para não perdermos nenhum valor. Devemos seguir a fórmula:
Vamos traduzir a fórmula, ou seja, compreender o que cada letra ou abreviatura significa, para que
possamos identificar os elementos em nossos exercícios.
li = limite inferior
n/2= total da frequência absoluta dividido por 2
facant = frequência acumulada anterior
fi = frequência absoluta da classe
h = amplitude do intervalo de classe
Não se assuste! Se você “traduzir” a fórmula corretamente e montar uma tabela para a
sua organização, não haverá problemas.
22PROBABILIDADE E ESTATÍSTICA
SUMÁRIO
Exemplo: o estoque de uma loja tem os seus valores organizados por intervalo de clas-
ses. De acordo com a tabela a seguir, encontre a mediana:
Passo 1: determinar a classe em que está localizado o valor da mediana. Isso é feito di-
vidindo o número da amostra por 2, e identificando, a partir da frequência acumulada, em
qual classe ele se encontra.
Perceba que na classe destacada em vermelho, quando olhamos para a frequência acu-
mulada, ela vai do 450 ao 650. Ou seja, o número 500 estará entre esses valores.
Passo 2: identificar os demais elementos da fórmula.
li = 24. Perceba que na classe destacada em vermelho o limite inferior é 24.
fi = 200. Perceba na classe destacada em vermelho que a frequência absoluta é 200.
facant = 450. Perceba na classe destacada em vermelho que a frequência acumulada da
classe anterior é 450.
h=2. Perceba que a amplitude de todos intervalos de classe é 2.
Passo 3: Aplicar a fórmula.
Preço unitário (R$) Quantidade (fi) Fa
18,00 |– 20,00 120 120
20,00 |– 22,00 150 270
22,00 |– 24,00 180 450
24,00 |– 26,00 200 650
26,00 |– 28,00 190 840
28,00 |– 30,00 160 1000
N 1000
Mediana
Observe: a mediana sempre depende da frequência acumulada. Caso
você não lembre como ela é feita, volte nessa apostila ou consulte o seu
professor.
23PROBABILIDADE E ESTATÍSTICA
SUMÁRIO
Med: 24 + ((500-450)/200).2
Med: 24 +0, 25.2
Med: 24,5
MODA
Em nosso cotidiano, dizer que alguma coisa está na moda, normalmente se relaciona
com aquilo que a maioria das pessoas estão usando, tem ou querem. Em estatística, o signifi-
cado é similar. Podemos entender a moda como o fenômeno que ocorre com maior frequência.
Para dados não agrupados:
Basta observar o que mais se repete.
Exemplo: Carlos é um representante comercial de uma certa marca de colchões, e ob-
teve os seguintes resultados como vendas:
Qual foi a moda?
A moda foi 8, pois é o número com maior frequência, ou seja, o número que aparece
mais vezes.
Para dados agrupados sem intervalo de classe:
Para fazer um plano preventivo de manutenção, foi realizada uma pesquisa em relação
ao número de peças que quebram em uma empresa em determinado período. Qual é a moda?
Basta olharmos para o valor, que temos a maior frequência absoluta, ou seja, Moda =
3. Com isso, concluímos que o mais comum de acontecer é a quebra de 3 peças no período
considerado.
Para dados agrupados com intervalo de classe:
Março: 5 unidades
Abril: 6 unidades
Maio: 8 unidades
Junho: 2 unidades
Julho: 8 unidades
Agosto: 8 unidades
Setembro: 9 unidades
Outubro: 8 unidades
Número de peças
Número de vezes que
aconteceu (fi)
0 0
1 18
2 25
3 32
4 23
5 13
Moda
24PROBABILIDADE E ESTATÍSTICA
SUMÁRIO
Utilizamos a seguinte fórmula:
Traduzindo a fórmula:
li = fronteira inferior da classe que contem a moda (classe modal).
d1= diferença entre a frequência da classe modal e a frequência da classe anterior.
d2 = diferença entre a frequência da classe modal e a frequência da classe posterior.
i = amplitude do intervalo de classe.
Basta traduzir a fórmula e organizar os dados que não teremos
problemas.
Observe: a classe modal é aquela que apresenta a maior frequência
absoluta.
Exemplo: o estoque de uma loja tem os seus valores organizados por intervalo de clas-
ses, conforme a tabela abaixo. Encontre a moda:
Passo 1: identificar a classe modal. A Classe 24 I- 26 é a classe modal, pois apresenta
maior frequência absoluta.
Passo 2: encontrar o d1 e d2.
d1 : 200 -180 = 20
d2: 200-190 = 10
Passo 3: aplicar a fórmula.
Preço unitário (R$) Quantidade (fi)
18,00 |– 20,00 120
20,00 |– 22,00 150
22,00 |– 24,00 180
24,00 |– 26,00 200
26,00|– 28,00 190
28,00 |– 30,00 160
N 1000
Moda
25PROBABILIDADE E ESTATÍSTICA
SUMÁRIO
MEDIDAS DE VARIABILIDADE
Medidas de variabilidade medem a oscilação de um fenômeno, ou seja, quanto se dis-
persam quando comparadas à média. As principais medidas são a variância e o desvio padrão.
VARIÂNCIA
A variância representa a dispersão de uma variável em relação à sua média.
Para dados não agrupados
Exemplo: na loja “123 Eletrodomésticos” trabalham dois vendedores, Adriano e Daia-
ne, que tiverem os seguintes desempenhos de vendas:
Adriano:
Daiane:
Segunda Terça Quarta Quinta Sexta
10 2 8 3 7
Segunda Terça Quarta Quinta Sexta
6 6 6 6 6
Variância
Variância
Lembre-se que dissemos anteriormente que a média pode maquiar o fenômeno.
Média de Adriano: 30/5 = 6 eletrodomésticos.
Média de Daiane: 30/5 = 6 eletrodomésticos.
Mesmo que ambos os vendedores tenham obtido a mesma média, não podemos dizer
que são vendedores iguais, pois Adriano tende a ter oscilações nas suas vendas, enquanto
Daiane é mais constante. Para medir essas variações podemos utilizar a variância.
Vamos aos passos:
• Passo 1: determinar a média aritmética (µ) da sequência;
• Passo 2: determinar as diferenças entre a média e cada elemento da sequência. (fi-µ);
• Passo 3: elevar ao quadrado e somar os valores encontrados no passo 2. ∑(fi-µ)²;
• Passo 4: dividir o resultado do passo 4 pelo número de eventos do conjunto.
Esses passos podem ser sintetizados com as fórmulas:
a. Para população:
26PROBABILIDADE E ESTATÍSTICA
SUMÁRIO
b. Para a amostra:
Exemplo: Adriano vendeu os seguintes eletrodomésticos durante a semana: 10, 2, 8, 3
e 7. Calcule a variância de suas vendas:
Calculando a média = (10+2+8+3+7)/ 5 = 30/5 = 6
Organizando a tabela:
Observe: desenvolva todos os passos completando uma tabela. Quando
ela estiver completa troque os valores para a fórmula.
fi (fi-µ) (fi-µ)²
10 10 - 6 = 4 4 x 4 = 16
2 2 – 6= - 4 (-4) x (-4) = 16
8 8 - 6 = 2 2 x 2 = 4
3 6 - 3 =- 3 (-3) x (-3) = 9
7 7 - 6 = 1 1x 1 = 1
∑= 46
Variância
Adriano
Lembre-se que estamos trabalhando com todas as vendas
de Adriano, então devemos considerar a fórmula da população:
O numerador da fórmula foi gerado a partir da tabela, e o
denominador n é 5, pois o vendedor fez 5 vendas.
Com dados agrupados por intervalos de classe:
A variância com dados agrupados pode ser um pouco traba-
lhosa. Você vai precisar organizar, muito bem, uma tabela com os
dados e seguir os passos abaixo:
• Passo 1: determinar o ponto médio de cada intervalo de clas-
se (xi);
• Passo 2: elevar cada ponto médio ao quadrado (xi²);
• Passo 3: multiplicar cada xi² pela frequência da classe fi cor-
respondente;
• Passo 4: calcular a média aritmética considerando que os da-
dos estão agrupados.
27PROBABILIDADE E ESTATÍSTICA
SUMÁRIO
Construímos uma tabela e aplicamos os dados em uma das fórmulas:
a. Para população:
b. Para a amostra:
Exemplo: o número de produtos vendidos por uma loja está representado por uma dis-
tribuição de frequência conforme a tabela que segue. Calcule a variância:
A tabela precisa ser ajustada em acordo com os passos descritos anteriormente. Che-
gamos no seguinte resultado:
Vamos nos recordar que a média aritmética para dados agrupados é calculada por:
Assim, a média será Média: 3232/80 = 40, 4. Também vamos considerar que esta-
mos trabalhando com todas as vendas da loja em um dado período, então será utilizada a
fórmula da população:
Produtos fi
2 |− 14 13
14 |− 26 9
26 |− 38 8
38 |− 50 23
50 |− 62 15
62 |− 74 10
78 |− 86 2
Variância
Classe xi fi xifi xi² xi²fi
2 |− 14 8 13 104 64 832
14 |− 26 20 9 180 400 3600
26 |− 38 32 8 256 1024 8192
38 |− 50 44 23 1012 1936 44528
50 |− 62 56 15 840 3136 47040
62 |− 74 68 10 680 4624 46240
74 |− 86 80 2 160 6400 12800
∑ 80 3232 163232
Variância
28PROBABILIDADE E ESTATÍSTICA
SUMÁRIO
DESVIO PADRÃO
A resolução do último exemplo, leva-nos a perceber que a variância é uma medida que
permanece elevada ao quadrado. Em situações práticas pode ser difícil imaginarmos essa
situação. Por isso, normalmente se utiliza o desvio padrão. Segundo Youssef, Soares e Fer-
nandes (2004, p.257) “o desvio padrão pode ser obtido diretamente da variância, extrain-
do-se a raiz quadrada do valor encontrado”. Ele informa a dispersão dos dados em relação
à média, porém parece nos dar suma dimensão mais exata.
Exemplo: pense nos dados do último exemplo. Considerando que a variância foi σ²=
408,24, o desvio padrão será DP: √408,24, ou seja, DP aprox. 20,20.
Isso significa que o fenômeno está se afastando da média 20,20 unidades, seja para
mais, seja para menos.
COEFICIENTE DE VARIAÇÃO (V)
Para Kazmier (1982, p.52), “o coeficiente de variação V, indica a magnitude relativa do
desvio padrão quando comparado com a média da distribuição das medidas”.
V: Coeficiente de variação
σ: Desvio Padrão
µ: Média
Exemplo: o preço médio diário das ações de uma empresa A durante um certo período
do mês foi de R$150,00, com um desvio padrão de R$5,00. A empresa B teve o preço médio
R$ 50,00 no mesmo período, com desvio padrão de R$3,00.
Empresa A:
V= σ/µ V= 5/150= 0,033
Empresa B:
V= σ/µ v= 3/50= 0,060
29PROBABILIDADE E ESTATÍSTICA
SUMÁRIO
Kazmier (1982), esclarece que em termos de comparação absoluta, a empresa A teve
uma maior variação, pois seu desvio padrão é maior. No entanto, quando pensamos em re-
lação ao preço, podemos perceber que o preço das ações da empresa B é quase duas vezes
mais variável quando comparado a empresa A.
MEDIDAS ESTATÍSTICAS COM PLANILHAS ELETRÔNICAS
Planilhas eletrônicas podem ser muito úteis para encontrarmos medidas estatísticas,
especialmente quando trabalhamos com uma quantia excessiva de dados. Também é impor-
tante ter a clareza de que as planilhas fazem diretamente cálculos com dados não agrupados.
Caso contrário, elas terão a finalidade de organizar e ajustar alguns cálculos, não realizando
o algoritmo. É muito importante que você entre em contato com esse tipo de software, visto
que ele pode ser muito relevante para o seu futuro profissional.
Após lançarmos os dados na planilha, observe que temos o link fx, o assistente de
função. Lá, encontramos muitas funções, dentre as quais, algumas destinadas às medidas
estatísticas. Veremos algumas delas:
Média: calcula a média aritmética. Após, escolhemos a função no assistente, abrimos
uma guia similar, a seguinte:
30PROBABILIDADE E ESTATÍSTICA
SUMÁRIO
No espaço Núm1, devemos selecionar as células nas quais os nossos dados se encontram. Basta
clicar no botão OK e teremos o resultado da média.
Os comandos utilizados para as medidas a seguir seguem a mesma lógica utilizada na Média, ou
seja, o comando é acionado após a guia ser aberta, ainda, os dados são selecionados e, clicando em OK,
teremos os resultados.
MED: calcula a mediana.
MODO: calcula a moda.
VAR. A: calcula a variância com base na amostra.
VAR. P: calcula a variância com base na população.
DESVPAD.A: calcula o desvio padrão com base na amostra.
DESVPAD.P: calcula o desvio padrão com base na população.
SÍNTESE
Neste capítulo, compreendemos que:
• Não basta haver acesso à informação. É necessário dar voz aos dados, e uma
das possibilidades é o uso de medidas estatísticas;
• As medidas estatísticas dividem-se em medidas de tendência central e me-
didas de variabilidade;
• É indispensável o uso de medidas estatísticas que usam técnicas matemáti-
cas para a compreensão dos fenômenos;
• As medidas de tendência central (média, moda e mediana) trazem uma ideia
geral do comportamento de um fenômeno.
OBS: Também podemos calcular o desvio padrão tirando a raiz quadrada da variância.
Assim, se você já obteve a variância basta digitar = RAIZ (“valor obtido na variância”).
31PROBABILIDADE E ESTATÍSTICA
EXERCÍCIOS SUMÁRIO
1. O automóvel da empresa rodou as seguintes quilometragens. Encontre a mediana:
2. Na disciplina deestatística, o professor realizou 10 avaliações. Ana teve as seguintes notas: 2, 3, 3,
4, 5, 6, 7, 8, 9 e 10. Encontre a variância.
3. A tabela abaixo traz o tamanho dos bebês em uma determinada maternidade. Encontre a mediana:
4. A tabela a seguir traz os salários de alguns funcionários da empresa X. Analise e responda:
Seg Ter Qua Qui Sex Sáb Seg Ter Qua Qui
126 128 134 135 138 131 139 132 138 136
Tamanho Frequência absoluta
50 I- 54 4
54 I- 58 9
58 I- 62 11
62 I- 66 8
66 I- 70 5
70 I- 74 3
a. Qual é a média de salário?
b. Para responder a questão “a”, você utilizou média aritmética ou ponde-
rada? Justifique sua resposta.
c. Qual a moda?
5. A seguinte tabela representa uma distribuição de dados agrupados por classes
relativas às vendas da Loja Doce Ilusão Ltda. Analise a tabela e responda:
a. Encontre a Média.
b. Encontre a Moda.
c. Encontre a Variância.
d. Encontre o Desvio Padrão.
Salário Funcionário
750 18
800 27
950 10
1100 6
2500 2
Preço do produto (R$) Produtos
18 I- 23 14
23 I- 28 10
28 I- 33 16
33 I- 38 4
38 I- 43 26
43 I- 48 8
32
PROBABILIDADES
O estudo de probabilidades iniciou com Girolamo Cardano, um
inveterado jogador que conseguia seu “suado” dinheiro em partidas de
xadrez e jogos de azar (STEWART, 2013).
33PROBABILIDADE E ESTATÍSTICA
SUMÁRIO
Dessa forma, trabalhamos com chances ou probabilidades de que algo aconteça a
partir da identificação dos padrões de repetições. Mesmo fenômenos humanos ou só-
ciais, tais como o número de suicídios e divórcios, por exemplo, quando considerados
a longo prazo, obedecem uma certa regularidade estatística, sendo passíveis de previ-
são (STEWART, 2013).
CONCEITOS INTRODUTÓRIOS
Evento determinístico: mantidas as mesmas condições apresentam sempre os
mesmos resultados ou com pouca variação (CORREA, 2003). Ex.: tempo de queda de
um corpo, temperatura de ebulição da água.
Evento probabilístico ou aleatório: podem conduzir a diferentes resultados, mesmo
quando mantidas as condições iniciais (CORREA, 2003). Ex.: o número encontrado no lan-
çamento de um dado honesto, os números da loteria, o cavalo vencedor em uma corrida etc.
É importante considerarmos que mesmo os eventos aleatórios acabam adotando
um padrão estatístico.
Os fenômenos que as pessoas atribuem à “sorte” ou ao “azar” podem
ser previstos a partir da probabilidade.
Espaço amostral (S): Youssef, Soares e Fernandes (2004, p. 229) definem o espaço amos-
tral como “o conjunto dos resultados possíveis para aquele experimento”. O espaço amostral é
a totalidade de resultados possíveis.
Exemplos:
I. Lançamento de um dado honesto: S = {1,2,3,4,5,6}
II. No setor X de uma empresa trabalham Gilson, Kléber, Márcia, Bruna e Dener: S = {G,K, M, B, D}
Evento (E): qualquer subconjunto de um espaço amostral (TAVARES, 2007). Um avento
pode ser considerado como uma ocorrência dentro do espaço amostral. Chamamos de evento ou
caso favorável quando temos um interesse naquele acontecimento.
Exemplos:
I. No lançamento de um dado honesto almejamos tirar um número par: temos então três even-
tos E={2,4,6}.
II. No setor X de uma empresa trabalham Gilson, Kléber, Márcia, Bruna e Dener. Tenho uma ta-
refa específica para um homem. Temos então três eventos: E= {Gilson, Kléber e Dener}.
Experimento: é um processo que produz resultados definidos, sendo que, em um experi-
mento ocorrerá apenas um resultado dentre os possíveis (ANDERSON, 2008, p.130).
34PROBABILIDADE E ESTATÍSTICA
SUMÁRIO
PRINCÍPIO FUNDAMENTAL DA CONTAGEM
Quando um evento for composto por duas fases consecutivas e independentes, deve-
mos multiplicar as possibilidades para cada evento ocorrer. Assim, o produto dos números
de possiblidades é válido para qualquer número de tentativas independentes.
Exemplo:
Uma montadora instalou-se num certo país e começou a produzir três tipos de veícu-
los: carros, caminhonetes e utilitários. Esses veículos são fabricados apenas em duas cores:
preto e branco. Ainda saem com duas opções de sonorização: com ou sem rádio. Quantas
configurações diferentes são possíveis? Faça a árvore de possibilidades.
Perceba que o diagrama, chamado de árvore de possiblidades, indica todas as possibli-
dades de como os automóveis podem ser montados. Para facilitar os cálculos, não precisa-
mos fazer a árvore, bastando multiplicar cada uma das possibilidades.
Experimento Resultados Experimental
Lançar de uma moeda Cara, coroa.
Selecionar uma peça
para inspeção
Defeituosa, não defeituosa.
Oferecer um produto Vender, não vender.
Lançar um dado honesto 1,2,3,4,5,6.
Cosntrução Pintura Rádio
3 x 2 x 2
Exemplos:
I. Quero fazer uma senha de três dígitos com os algarismos 1,2,3 e 4. Quantas senhas eu
posso formar?
4x4x4= 64 senhas
35PROBABILIDADE E ESTATÍSTICA
SUMÁRIO
II. Quero fazer uma senha de três dígitos com os algarismos 1,2,3 e 4 não repeti-los. Quan-
tas senhas eu posso formar?
4x3x2= 24 senhas
PROBABILIDADE DE UM EVENTO
Para calcular a probabilidade ou a chance de ocorrência de um evento, utilizamos a se-
guinte fórmula:
O cálculo de probabilidades tem amplas aplicações no processo de tomada de decisão,
pois podemos ter noções preliminares da ocorrência de um evento, podendo, assim, anteci-
par nossas ações.
Exemplos:
I. No setor X de uma empresa trabalham Gilson, Kléber, Márcia, Bruna e Dener. Qual é a
probabilidade de um deles aleatoriamente faltar?
S= {G, K, M, B, D}, ou seja, 5.
n= 1
P(F)=n/S
P(F)= 1/5, ou seja, 0,2 x100 = 20%.
OBS: Utilizamos a terminologia P(F) como “probabilidade de falta”.
II. Considerando a mesma situação do último exemplo, qual é a probabilidade de uma mu-
lher faltar?
S= {G, K, M, B, D}, ou seja, 5.
n={Márcia, Bruna}, ou seja, 2.
P(F) = 2/5
P(F) = 0,4, ou seja, 40%.
III. No lançamento de uma moeda ao acaso, determinar a probabilidade de ocorrer cara.
S : {cara, coroa}
E : {cara}
p(E)=1/2=50%
36PROBABILIDADE E ESTATÍSTICA
SUMÁRIO
IV. Um dado honesto é lançado para cima. Qual é a probabilidade de ocorrer um
divisor de 6?
S:{1,2,3,4,5,6}
E: { 1,2,3,6}
p(E)=4/6=66,66 %
V. Qual é a possibilidade de sair um “dois”, ao retirar, por acaso, uma carta de
um baralho de 52 cartas?
Vamos lembrar que um baralho tem 4 naipes: copas, espadas, paus e ouro.
Cada naipe tem números que vão do 2 ao 10, um valete (11), uma dama (12) , um
rei (13) e um ás (1 ou14).
Assim: S= 52 e= 4
p(E)=4/52 aprox.7,69%
PRINCÍPIO DA PROBABILIDADE COMPOSTA
A probabilidade de um evento composto de um número finito de eventos
simples e independentes é igual ao produto das probabilidades desses eventos.
Exemplos:
I. Temos duas urnas contendo, respectivamente, 10 e 5 bolas. Na primeira existem 6 bolas brancas e
2 na segunda. Qual é a probabilidade de se extrair duas bolas brancas, sendo uma de cada urna?
II.
P1= 6/10=3/5
P2 = 2/5
Probabilidade composta: 3/5 x 2/5=6/25
III. Uma urna contém 10 bolas, sendo 7 brancas e três pretas, qual é a probabilidade de se tirar, suces-
sivamente, 3 bolas brancas sem reposição?
P1= 7/10
P2 = 6/9
P3 = 5/8
P= 7/10 x 6/9 x 5/8=210/720=7/24
37PROBABILIDADE E ESTATÍSTICA
SUMÁRIO
DISTRIBUIÇÕES DE PROBABILIDADE
A aplicação de procedimentos estatísticos na resolução de problemas práticos, muitas
vezes, faz com que verifiquemos características que indicam um modelo teórico assumido
pelos dados. Existem dois tipos: a distribuição discreta (com variáveis discretas) e a distri-
buição contínua (com variáveis contínuas).
DISTRIBUIÇÃO DISCRETA
Esse tipo de distribuição de probabilidade parte de hipóteses definidas e certas. Por
exemplo, ao analisar uma peça um inspetor de qualidade pode classificá-la como própria ou
imprópria. No nascimento de uma criança, existem só duas hipóteses: menino e menina. Os
fenômenos com comportamento similar se enquadrarão neste tipo de distribuição. Existem
diversos tipos de distribuição de probabilidadediscreta, de acordo com o comportamento
do fenômeno, destacando-se: bernoulli, binomial, geométrica, pascal, hipergeométrica e
poisson. Estudaremos apenas as mais usadas:
DISTRIBUIÇÃO BINOMIAL
É uma distribuição adequada para uma sucessão de experimentos aleatórios indepen-
dentes, onde se observa em cada um a probabilidade de “sucesso” ou de “fracasso” de um
determinado evento de probabilidade p com n provas.
Devemos entender o “sucesso” como o objetivo do pesquisador e “fracasso” como o
contrário do “sucesso”.
Exemplo:
Você está analisando um lote de peças e procurando quantas estão defeituosas.
As peças defeituosas serão o sucesso.
As peças boas serão o fracasso.
Fórmula para a distribuição binomial:
Onde:
n: número de testes
k: número de sucessos
p: probabilidade de sucesso
q: probabilidade de fracasso (1-p)
n/k: combinação de n tomado k a k
38PROBABILIDADE E ESTATÍSTICA
SUMÁRIO
Exemplos:
I. Em um campeonato de futebol todas as partidas são desempatadas. Um certo time tem
80% de probabilidade de vitória sempre que joga em casa. Se o time jogar 20 partidas em
casa, qual é a probabilidade que ele tem de ganhar exatamente 15 jogos?
OBS: Se as partidas são desempatadas, temos apenas dois resultados possíveis: vitória
ou derrota. Isso define a situação como uma distribuição binomial.
n: 20 K: 15 p: 0,8 q: 0,2
C(20,15) = 20!/15!5!=15.504 Combinação de 20 elementos tomados 15 a 15.
P= 15504x0,815 x 0,220-15=0,1745 ou 17,54%
II. Na prova de grau C, de estatística, o professor elaborou 10 questões fechadas, cada uma
com 5 alternativas, sendo uma correta. Infelizmente, um aluno não sabe nenhum dos
conteúdos e resolve “chutar”. Qual é a probabilidade dele acertar 6 questões e ser apro-
vado na disciplina?
A probabilidade do aluno acertar uma questão é de 1 em 5, pois cada questão tem 5 al-
ternativas. Assim, p= 1/5 ou seja p= 0,20.
n: 10 k: 6 p: 0,2 q: 0,8
C(10,6) Combinação de 10 elementos tomados 6 a 6.
C(10,6)= 210
P=210x 0,26 x 0,810-6=0,55%
III. Um inspetor de qualidade extrai uma amostra de 10 tubos aleatoriamente de uma carga
muito grande de tubos que se sabe que contém 20% de tubos defeituosos. Qual é a pro-
babilidade de que não mais que 2 tubos sejam defeituosos?
n= 20 p: 0,20 q: 0,80
Zero tubos C10,0 X 0,200 X 0,8010= 0,1074
Um tubo C10,1 X 0,201 X 0,809= 0,2684
Dois tubos C10,2 X 0,202 X 0,808= 0,3019
Probabilidade: 0,1074+ 0,2684+ 0,3019 = 67,77%
39PROBABILIDADE E ESTATÍSTICA
SUMÁRIO
DISTRIBUIÇÃO GEOMÉTRICA
A distribuição geométrica conta o número de falhas até obtermos o sucesso. Assim,
x assume o número de tentativas necessárias ao aparecimento do primeiro sucesso.
Fórmula
P (X=x) = qx-1. p
Exemplos:
I. A probabilidade de se encontrar o sinal de trânsito aberto numa esquina é 0,20.
Qual é a probabilidade necessária para se passar 5 vezes no local e encontrar o sinal
aberto pela primeira vez?
Perceba que só são admitidas duas possibilidades: ou o sinal está aberto ou está
fechado. Logo, a distribuição é discreta. Como estamos considerando o fracasso antes
do sucesso, devemos trabalhar com a distribuição geométrica.
x= 5 p= 0,20 q= 0,80
P(X=x)=qx-1. p
P(X=x)=0,805-1 . 0,20 = 0,08192 = 8,192%
II. Qual a probabilidade de ser lançado 15 vezes para que na 15ª vez ocorra a face 6 pela pri-
meira vez?
X = 15 p=1/6 q= 5/6
P(X=x)=qx-1 . p
P(X = x) = (5/6)15-1 . 1/6 = 0,01298 = 1,2981%
DISTRIBUIÇÕES CONTÍNUA DE PROBABILIDADE
São distribuições em que a variável pode assumir infinitos valores dentro de um intervalo.
DISTRIBUIÇÃO NORMAL
É uma das distribuições mais utiliza-
das, tendo uma ampla importância na mate-
mática. Ela ocorre quando a sua distribuição é
perfeitamente simétrica, e seu gráfico lembra
um sino, também chamado de curva de Gauss.
Logo, observe a figura a seguir:
Propriedade importante
Falta de memória: essa propriedade indica a maneira que a variável
incorpora a informação anterior. Ou seja, a variável “lembra” do presente, mas
“esqueceu” o que ocorreu no passado.
40PROBABILIDADE E ESTATÍSTICA
SUMÁRIO
A média da moda e a mediana correspondem ao mesmo valor, ou seja, a média sempre
ficará no meio do gráfico.
CÁLCULO DA PROBABILIDADE EM UMA DISTRIBUIÇÃO NORMAL
A probabilidade de um evento acontecer é a área abaixo da curva. Podemos calcular
essa área com o teorema fundamental do cálculo (utilizando integrais) ou utilizar a tabela
z, que será o método adotado. Assim, precisamos gerar um parâmetro com o fim de encon-
trá-lo na tabela z (veja anexo no final do ebook).
Onde µ é a média, σ é o desvio padrão e x é o valor que queremos obter.
Exemplos:
Suponha que o tempo de permanência na fila de um banco seja, normalmente, distri-
buído com média de 8 minutos e desvio padrão de 2 minutos. Qual é a probabilidade que o
tempo de permanência seja de 5 e 8 minutos?
Primeiro: gerar o parâmetro para a tabela z aplicando a fórmula:
Agora pegue a tabela z no final do ebook.
Como encontramos, -1,5 considere 1,5, pois a tabela é simétrica. Nas linhas temos a
unidade e a dezena, enquanto na linha temos a unidade. Assim, o valor de 1,5 será dado cru-
zando a linha de 1,5 com a coluna do 0. Veja a figura a seguir:
41PROBABILIDADE E ESTATÍSTICA
SUMÁRIO
Logo o valor encontrado para z = 0,4332, ou seja 43, 32%. Esse valor é
a probabilidade entre a média e x, ou seja, a chance de você ficar na fila en-
tre 5 e 8 minutos.
Exemplo:
Pense nos dados do último problema. Qual é a probabilidade de per-
manecer menos de 5 minutos na fila?
O procedimento será o mesmo, você chegará aos mesmos 43,32%. En-
tretanto, essa é a probabilidade de se permanecer entre 5 e 8 minutos. Con-
sidere que do zero até o 8 será a metade, ou seja 50%. Dessa maneira, basta
fazer 50% - 43,32% = 6,68%.
OBS: É muito importante o desenho da curva para que você tenha no-
ção da área que deseja calcular.
INTERVALO DE CONFIANÇA
O intervalo de confiança é uma faixa de valores onde um fenômeno pode acontecer, com um relativo
risco. Na pesquisa política, o padrão do intervalo de confiança é de 95%, o que isso significa? Isso significa
que o candidato tem 95% de chance de estar dentro da margem de erro e 2,5% de estar acima dela, ainda,
2,5% de estar abaixo dela.
Margem de erro ou erro máximo: pode ser entendido como a quantia que o fenômeno pode oscilar,
para cima ou para baixo. Quando a população (N) for infinita ou não for fornecida.
Em que σ e S são o desvio padrão e n é o número da amostra.
Quando a população for maior ou igual a 30 unidades, utilizamos a tabela z para intervalo de confiança
(ver anexo no final da tabela). Quando for menor que 30 utilizamos a tabela t (ver anexo no final da tabela).
FÓRMULAS
População Amostra
n ≥ 30 média ± margem de erro média ± margem de erro
n < 30 média ± margem de erro média ± margem de erro
42PROBABILIDADE E ESTATÍSTICA
SUMÁRIO
Exemplos:
I. Para estimar o tempo médio em uma consulta, foram amostrados
64 pacientes. Essa amostra indicou um tempo médio de 10 mi-
nutos, com desvio padrão de 3 minutos. Com base nisso, qual é o
tempo médio de atendimento, com um nível de confiança de 90%?
n= 64 Média: 10 S: 3
Perceba que estamos trabalhando com a amostra, e n>30. Então,
usaremos tabela z.
MÉDIA ± MARGEM DE ERRO
Como queremos um nível de confiança de 90%, temos uma mar-
gem de erro de 10%, sendo 5% em cada cauda.
• Passo 1: procuramos na tabela z um parâmetro z, cujo valor resul-
te em 0,05 (5%).
Perceba que não é a mesma tabela da distribuição normal.
Veja que não temos exatamente o valor 0,05. Nesse caso, pega-
mos um dos mais aproximados.
Observe que o valor -1,64 gera a 0,05. Logo, 1,64 será o parâmetro z e não precisamos considerar o sinal.
• Passo 2: encontra a margem de erro.
43PROBABILIDADE E ESTATÍSTICA
SUMÁRIO
Assim:
Média ± margem de erro
10±0,615=
10-0,615 = 9,385
10+0,615 = 10,615
Temos uma estimativa intervalarentre 9,385 e 10,615, ou seja, o tempo médio de aten-
dimento oscila entre 9,385 e 10,615 minutos.
II. Na década de 90, foi realizada uma pesquisa em 17 cinemas de São Paulo, indicando que
o ingresso custava em média R$ 5,50 com desvio padrão de R$ 0,50. Determine um in-
tervalo de confiança para o preço médio com um nível de confiança de 95%:
Fórmula: Média ± margem de erro
N =17
Média= 5,50
S= 0,50
Grau de liberdade= n-1 = 17-1= 16
α=5% (nível de significância ou nível de desconfiança)
OBS: Para o intervalo de confiança o teste será sempre bilateral.
• Passo 1: encontrar o parâmetro t. Devemos usar a tabela t, pois n é menor que 30. Veja
o anexo no final da apostila. Vamos cruzar 5% do teste bilateral com o 16, pois nossa
amostra é 17 com 1 grau de liberdade.
t= 2,1199
• Passo 2: Margem de erro
5,50 ±0,25=[5,25;5,75], ou seja, se entrasse em um cinema, em 95% das vezes você
pagaria entre R$ 5,25 e R$ 5,75.
44PROBABILIDADE E ESTATÍSTICA
SUMÁRIO
Na planilha eletrônica
A função INT.CONFIANÇA (versões mais antigas) ou INT.CONFIANÇA.
NORM nos retorna a margem de erro a partir de uma distribuição
normal. Ainda existe a função INT.CONFIANÇA.T para amostras pequenas.
Os critérios são Alfa, o qual é o nível de significância ou de desconfiança
e deve ser lançado percentualmente. Portanto, precisamos do desvio
padrão e do tamanho da amostra.
SÍNTESE
Neste capítulo, compreendemos que:
• Quando falamos de probabilidade, queremos identificar a chance de ocorrência de um
determinado resultado de interesse, em situações nas quais não é possível calcular com
exatidão o valor real do evento;
• A probabilidade de um evento pode ser calculada, utilizando fórmula;
• Aplicar procedimentos estatísticos para resolver problemas práticos faz com que verifi-
quemos características que indicam um modelo teórico assumido pelos dados;
• Existem dois tipos de distribuições: discreta e a distribuição contínua, subdividindo-se;
• O intervalo de confiança é uma faixa de valores onde um fenômeno pode acontecer, com
um relativo risco.
45PROBABILIDADE E ESTATÍSTICA
EXERCÍCIOS SUMÁRIO
1. Lança-se um dado honesto ao acaso. Determine a probabili-
dade de obter-se na face superior:
a. O número 4
b. Um número menor que 3
c. Um múltiplo de 3
d. Um divisor de 20
2. Um baralho tem 52 cartas, das quais 4 são damas e 4 são reis.
Retira-se uma carta ao acaso. Determine a probabilidade de:
a. Ser retirada uma dama
b. Não ser retirado um rei
3. De um baralho que inicialmente tinha 52 cartas, perderam-se
uma dama, dois reis e um quatro. Se retirarmos ao acaso uma
carta desse baralho, qual é a probabilidade de sair:
a. Outro rei
b. Outro 4
4. Numa caixa há 6 bolas brancas e 4 vermelhas. Qual é a pro-
babilidade de, ao acaso, retirar-se:
a. Uma bola vermelha
b. Uma bola branca
5. Considerando que o peso de determinado artigo produzido por uma
fábrica seja normalmente distribuído com média de 20 gramas e
desvio padrão de 4 gramas, determine a probabilidade de que uma
unidade, selecionada ao acaso, tenha peso:
a. entre 16 e 22 gramas
b. entre 22 e 25 gramas
c. maior que 23 gramas
6. As vendas diárias de um restaurante têm distribuição normal com
média igual a 53 unidades monetárias e desvio padrão igual a 12 U.M.:
a. Qual a probabilidade das vendas excederem 70 U.M. em de-
terminado dia?
b. Esse restaurante deve vender no mínimo 30 U.M. por dia. Para
não ter prejuízo. Qual a probabilidade de que, em certo dia,
exista prejuízo?
7. Suponha que as notas em certa disciplina estão normalmente dis-
tribuídas com média 5,0 e desvio padrão 1,5:
a. determine o percentual de estudantes com nota superior a 8,0
b. se a nota mínima para obter aprovação é 3,0, determine o per-
centual de estudantes reprovados
c. Qual é a probabilidade de obter nota acima de 9,8?
46PROBABILIDADE E ESTATÍSTICA
EXERCÍCIOS SUMÁRIO
8. Suponha que o consumo diário de álcool pelos alcoólatras de certa cidade seja, normal-
mente, distribuído com média 320 ml e desvio padrão 50 ml. Selecionando ao acaso um
alcoólatra desta cidade, determine a probabilidade de que ele tenha consumo diário:
a. maior que 330 ml
b. inferior a 370 ml
c. entre 240 e 330 ml
d. entre 320 e 380 ml
9. Uma moeda é lançada 20 vezes. Qual é a probabilidade de saírem 8 caras?
10. Suponha que a probabilidade de um pai ter um filho com os cabelos loiros seja ¼. Se
houverem 6 crianças na família, qual é a probabilidade de que a metade delas tenha ca-
belos loiros?
11. Uma fábrica que produz papel quer estimar o tempo médio requerido para uma nova
máquina produzir uma resma de papel. Sabe-se que uma amostra de 36 resmas produ-
zidas por essa máquina requer em média de 1,5. Assumindo um desvio padrão de 0,30,
construa um intervalo de confiança de 95%.
12. O dono de um café quer calcular o lucro médio diário por cliente. Numa amostra de 100
clientes, ele verificou que o gasto médio por cliente era de 350 unidades monetárias
(u.m.), sendo o desvio padrão dessa amostra de 75 u.m.. Estime um intervalo de con-
fiança para o verdadeiro gasto médio com 90%de confiança.
47
ESTATÍSTICA
AVANÇADA
Existem técnicas de análise de dados que nos permitem compreender
o fenômeno, fazer inferências e tomar decisões fundamentadas em
parâmetros matemáticos.
48PROBABILIDADE E ESTATÍSTICA
SUMÁRIO
Em diversas situações do nosso cotidiano, seja na nossa vida pessoal, seja na profis-
sional, muitas decisões são complexas e difíceis de serem tomadas. Quando conhecemos o
desempenho de determinado fenômeno, conseguimos identificar o seu padrão de compor-
tamento, podendo, assim, prever como ele irá se comportar, com um certo nível de preci-
são. Decidir fundamentos em argumentos matemáticos será mais racional do que decidir a
partir do senso comum ou da intuição.
REGRESSÃO LINEAR SIMPLES
A regressão linear simples consiste em uma tentativa de estabelecer uma equação ma-
temática linear, ou seja, uma linha que descreva a relação estabelecida entre duas variáveis.
A reta de regressão é utilizada para traçar uma estimativa linear entre duas variáveis e a sua
equação pode ser utilizada para estimar uma variável a partir da outra. Dessa forma, con-
firmando uma relação entre ambas. Então, chamamos o x de variável independente, pois é o
próprio fenômeno e não depende de outros fatos. Já o y é chamado de variável dependente,
pois depende do x.
DIAGRAMA DE DISPERSÃO
Uma das maneiras de estimar a relação entre as variáveis a partir de uma linha é o dia-
grama de dispersão. Esse consiste em representar as variáveis em um plano cartesiano por
pontos com coordenadas (x,y), em que x é a variável observada e y o correspondente (BAR-
BETTA, 2002). Quanto mais os pontos estiverem concentrados em torno de uma reta, mais
correlação existe entre as variáveis. Barbetta (2002) considera que existe uma correlação
direta entre duas variáveis quando elas caminham no mesmo sentido, como peso e altu-
ra podem ser exemplos de correlação direta entre variáveis, pois espera-se que um sujeito
mais alto seja mais pesado. Já a correlação inversa ocorre quando elas caminham em sentido
oposto, como, no Brasil, a renda e o número de filhos por família apresentam uma correla-
ção inversa, pois de um modo geral, quando menor a renda mais o número de filhos.
Exemplos:
I. O gráfico a seguir indica as vendas (em cruzeiros) de uma empresa durante um deter-
minado período:
Observe que o gráfico se aproxima de uma reta, o que indica uma forte correlação entre
as variáveis. A reta crescente indica que a correlação é direta, ou seja, quanto mais aumen-
tam os anos, mais aumentam as vendas da empresa.
49PROBABILIDADE E ESTATÍSTICA
SUMÁRIO
II. O gráfico seguinte demonstra o resultado de uma pesquisa em que foram consideradas
a idade e a massa muscular de um grupo de pessoas:
Perceba que mesmo que não forme uma reta perfeita, os dados se concentram em tor-
no de uma linhaimaginária, indicando que existe correlação. Como a linha é decrescente, a
correlação é inversa, ou seja, quanto mais a idade aumenta, mais a massa muscular diminui.
III. O gráfico seguinte demonstra o resultado de uma pesquisa em que foram considerados
a idade e o tempo de leitura:
Perceba que o fenômeno fica disperso, não se concentrando em torno de uma reta.
Isso significa que não existe correlação entre as variáveis, ou seja, a idade não interfere no
tempo de leitura.
A EQUAÇÃO DA RETA
Perceba nos últimos gráficos que projetamos uma reta e analisamos como o fenôme-
no se comporta em torno dela. Essa reta explica o comportamento das variáveis e a relação
estabelecida entre elas.
ENCONTRANDO A RETA
A reta de regressão linear simples seguirá o seguinte formato:
y=a+bx, sendo:
a=médiay-bmédiax
Considerando:
n: como o número da amostra
εx: somatório de x
εy: somatório de y
50PROBABILIDADE E ESTATÍSTICA
SUMÁRIO
Exemplo:
Um biólogo registrou o crescimento de uma determinada planta, conside-
rando o tempo e a altura em centímetros, chegando aos seguintes resultados:
Encontre a equação da reta e estime a altura com 3,5 semanas:
Perceba que o parâmetro.
exige que seja efetuada a soma das variáveis, logo, eleve elas ao quadrado, além
de multiplicá-las. Assim, precisamos ajustar a tabela, considerando as semanas
como x e a altura como y:
Lembre-se que 5² = 5x5= 25 e que 9²= 9x9= 81
a=médiay-bmédiax
Sendo:
Média y=εy/n
Média de y = 263/9 = 29,22
Média de x = εx/n
Semana Altura (m)
1 5
2 12
3 16
4 22
5 34
6 38
7 41
8 45
9 50
Semana (x) Altura (y) x2 y2 x.y
1 5 1 25 5
2 12 4 144 24
3 16 9 256 48
4 22 16 484 88
5 34 25 1156 170
6 38 36 1444 228
7 41 49 1681 287
8 45 64 2025 360
9 50 81 2500 450
Soma 43 263 285 9715 1660
51PROBABILIDADE E ESTATÍSTICA
SUMÁRIO
Média de x=45/9=5
a = 29,22 – 5,75.5 a= 0,47
Logo, a equação da reta será:
y= 0,47 + 5,75x
VALOR ESPERADO
Quando conhecemos a equação da reta, podemos estimar os valores fu-
turos. Respondendo a pergunta do último exemplo: “estime a altura com 3,5
semanas”. Basta substituir o x por 3,5 e teremos o valor esperado para a al-
tura em 3,5 semanas.
y= 0,47 + 5,75x
y = 0,47 + 5,75.3,5
y = 0,47 + 20,125
y = 20,596 cm
Ou seja, a partir dos valores conhecidos, podemos estimar que com 3,5
semanas a planta tinha 20,596 cm de altura.
ENCONTRANDO A RETA NA PLANILHA ELETRÔNICA
Encontrar a reta de regressão linear na planilha eletrônica é relativamente simples. Vamos fazer o
mesmo exemplo de antes na planilha.
Importante: procure, você também, realizar o exemplo na planilha para se acostumar com o uso
do software.
• Passo 1: lance os dados na planilha.
• Passo 2: faça um gráfico de dispersão.
INSERIR > GRÁFICO > DISPERSÃO
Mesmo que consigamos imaginar a reta, não temos precisão dela. A planilha adiciona a reta.
• Passo 3: projetar a reta.
52PROBABILIDADE E ESTATÍSTICA
SUMÁRIO
Clique com o botão direito em cima de um dos pontos. Então, abrirá uma aba flutuante
e selecione:
Adicionar linha de tendência
Perceba que agora temos uma aba na direita da planilha. Observe a figura:
Escolhemos o ajuste linear (veja a figura) e já temos uma reta que nos leva a perceber
que o fenômeno se concentra em torno dela.
• Passo 4: encontra a equação.
Baixando a guia: Formatar linha de tendência, encontramos um espaço denomi-
nado: Exibir equação no gráfico (veja a figura). Assim, a equação de regressão linear será
exibida junto com o gráfico.
CORRELAÇÃO
Correlação é uma medida que estima a relação entre duas variáveis. Essa medida é
chamada de r (coeficiente de Pearson). Exemplo: quando aumenta a venda de pão, aumenta
a venda de margarina? Existe correlação entre essas variáveis?
53PROBABILIDADE E ESTATÍSTICA
SUMÁRIO
O valor r da correlação ocorre entre -1 e 1 , sendo:
0: nula
Entre 0,10 e 0,29 : pequena
Entre 0,30 e 0,60 : moderada
Entre 0,60 e 0,90: forte
Maior que 0,90: muito forte
R > 0 correlação direta
R=0 correlação nula
R< 0 correlação inversa
X sempre será a variável independente.
Y sempre será a variável dependente.
FÓRMULA
Exemplo:
Em uma certa cidade foi realizado um estudo visando compreender a saúde das
pessoas. Os entrevistados tinham entre 5 e 50 anos de idade. Foram considerados o
nível de HDL (colesterol bom) no sangue e as horas de exercícios semanais. Assim,
chegou-se aos seguintes resultados:
Existe correlação entre as variáveis? Em que nível?
Para saber o nível de correlação não é suficiente fazer o gráfico de correlação. Quando que-
remos encontrar a medida é necessário estimar o coeficiente de Pearson.
• Passo 1: ajustar a tabela montando as colunas x.y, x² e y², pois a fórmula exige tais elementos.
HDL Horas de Exercícios
40 0
50 2
55 3
60 4
65 6
x y x.y x2 y2
40 0 0 1.600 0
50 2 100 2.500 4
55 3 165 3.025 9
60 4 240 3.600 16
65 6 390 4.225 36
Soma 270 15 895 14.950 65
54PROBABILIDADE E ESTATÍSTICA
SUMÁRIO
• Passo 2: aplicar a fórmula.
r: 0,98
O coeficiente de Pearson indicou que existe uma correlação muito forte e dire-
ta entre as duas variáveis, os seja, quanto mais exercícios a pessoa praticar, maior
será o seu “colesterol bom”. Desse modo, você pode tomar a decisão de fazer exer-
cícios para melhorar o seu HDL.
ENCONTRANDO A CORRELAÇÃO NA PLANILHA
Vamos realizar o mesmo exemplo de antes, porém fazendo o cálculo na planilha
eletrônica.
• Passo 1: lançar os dados na planilha.
• Passo 2: selecione o assistente de função fx e escolha o comando PEARSON.
• Matriz 1 são os valores independentes, ou seja, aqueles que não dependem de outros fatores.
No nosso caso, são as semanas (x). Marque a coluna das semanas.
• Matriz 2 são os valores dependentes, ou seja, aqueles que dependem de outros fatores. No
nosso caso é a altura (y) que depende das semanas. Marque a coluna das semanas.
• Clique em OK e teremos o coeficiente de Pearson.
Perceba que temos um valor muito próximo do que havíamos estimado com a fórmula, re-
velando uma correlação muito forte e direta.
55PROBABILIDADE E ESTATÍSTICA
SUMÁRIO
ANÁLISE DE VARIÂNCIA
ANÁLISE DE FATOR ÚNICO (ANOVA FATOR ÚNICO)
ANOVA é uma coleção de modelos estatísticos no qual com-
paramos a variância da amostra com diversos fatores ou variáveis.
Desse modo, podemos identificar a influência das variáveis em uma
determinada característica que temos interesse.
NO EXCEL
Para trabalharmos com ANOVA no Excel, precisamos habilitar
um recurso chamado Análise de Dados. O roteiro a seguir pode mu-
dar de acordo com a versão do programa utilizado.
Clique em:
Arquivo > Opções > Suplementos > Ir
Teremos uma janela similar à seguinte figura:
Escolha os suplementos que você deseja trabalhar, nesse caso, ferramentas de análise, e clique em OK. Clique
na aba Dados para conferir se a ferramenta Análise de Dados está disponível no canto direito de sua planilha.
NO LIBREOFFICE CALC
Caso você prefira trabalhar com o LibreOffice, o suplemento já vem habilitado. Basta clicar em:
56PROBABILIDADE E ESTATÍSTICA
SUMÁRIO
Dados > Estatística > Análise de Variância (Anova) veja a figura adiante:
Exemplo:
Um agricultor está tendo problemas com frutos que estão sendo atacados por pragas.
Ele parte da hipótese de que o local em que a planta está interfere no número de frutos ata-
cados. Também, o agricultor sabe que outros fatores, tais como clima, solo e humidade, por
exemplo, podem interferir nesse processo. Qual é o nível de interferência da localização?
Qual é o nível de interferência de outros fatores?
Para responder a essas questões, amostrou-se as seguintes regiões de um pomar: cen-
tro, 10 m da borda, 3 m da borda e borda.
Vamos trabalhar exclusivamente com planilha eletrônica.
Após termos habilitado ou identificado a ferramenta, seguimos os seguintes passos:
• Passo 1: lançar os valores na tabela.
• Passo 2: escolha ANOVA fator único, pois temos apenas umavariável dependente.
• Passo 3: preenchemos o quadro, completando:
• Intervalo de entrada: são os valores que serão analisados;
• Intervalo de saída: o local em que você quer que o quadro de ANOVA seja colocado;
Borda 3m 10m Centro
11 8 5 4
8 5 7 4
5 2 3 2
8 5 3 0
5 5 7 0
11 8 6 4
Média 8 5,5 5,17 2,33
57PROBABILIDADE E ESTATÍSTICA
SUMÁRIO
• Alfa: o padrão estatístico é 0,05 que se refere ao nível de significância, o que quer
dizer é que temos 95% de confiança em nossos resultados;
• Selecionamos Rótulos Na Primeira Linha para uma melhor organização e entendi-
mento dos resultados.
Veja a figura a seguir:
• Passo 4: analisar os dados;
Após clicar em OK, teremos o seguinte quadro:
O primeiro quadro consiste em um breve resumo estatístico dos dados considerados.
O segundo é que faz o comparativo entre o fator considerado (local) e os outros fatores cha-
mados de resíduo. Consideramos F como a fração do que queremos analisar, nesse caso, o
local, verificando a posição que ela ocupa em relação aos resíduos. Quando F superar F crí-
tico, dizemos que ele afeta as demais variáveis. No nosso exemplo, podemos dizer que sim,
o local interfere nas frutas afetadas pelas pragas.
Como o nosso alfa é 0,05, devemos considerar que o valor-P ficou menor que isso, o
que indica que a pesquisa tem significância e pode ser levada em consideração.
ANOVA FATOR DUPLO SEM REPETIÇÃO
Quando quisermos analisar a variância e tivermos mais de uma variável, podemos uti-
lizar a ANOVA fator duplo. A ANOVA fator duplo sem repetição será utilizada quando os va-
lores não se repetirem.
58PROBABILIDADE E ESTATÍSTICA
SUMÁRIO
Exemplos:
Realizou-se um estudo sobre a quantidade de calorias ingeridas em uma refei-
ção, chegando aos seguintes resultados:
Analise a variação de calorias presente na ingestão de pão e de líquido.
Escolhemos ANOVA fator duplo sem repetição. Fator duplo, pois estamos anali-
sando duas variáveis (pão e líquido), e os dados não se repetem. O processo é semelhan-
te, lançamos os dados na planilha e selecionamos a ANOVA fator duplo sem repetição.
Vamos observar o quadro gerado:
Perceba que temos no primeiro quadro um breve resumo do fenômeno. No segundo, a análi-
se de variância. A Análise é a mesma, quando quisermos analisar os pães observamos “linhas” e,
em relação aos líquidos, as “colunas”. Em ambos os casos, percebemos que F supera o F crítico, o
que significa que existe diferença nos tipos de pães e de líquidos em relação às colorias ingeridas.
Chá Suco Água
Pão de trigo 75 87 60
Pão com sementes 74 82 55
Pão integral 70 79 53
Quantidade de calorias
59PROBABILIDADE E ESTATÍSTICA
SUMÁRIO
ANOVA FATOR DUPLO COM REPETIÇÃO
Quando quisermos analisar a variância e tivermos mais de uma variável podemos uti-
lizar a ANOVA fator duplo. Essa será utilizada quando os valores se repetirem.
Exemplo:
Um professor aplicou três testes em duas turmas diferentes e almeja compreender se
existem diferenças significativas entre os testes e entre as turmas. Os resultados obtidos
estão expressos na tabela seguinte:
Existe diferença significativa entre as notas das turmas? E entre os testes?
O quadro de ANOVA é o que segue:
Nesse caso, as linhas são chamadas de Amostra, ou seja, as turmas são as amostras. Temos
5 linhas por amostra. As colunas são os três testes aplicados pelo professor. Em relação às tur-
mas (amostra), não existem diferenças, pois F não supera o F crítico. Em relação aos testes (co-
lunas) também não existem diferenças significativas, visto que F também não supera o F crítico.
Teste 1 Teste 2 Teste 3
12 8 6
16 8 11
15 9 8
12 12 8
15 16 10
12 20 12
16 3 15
12 10 17
14 10 3
15 8 4
Turma 1
Turma 2
60PROBABILIDADE E ESTATÍSTICA
SUMÁRIO
SÍNTESE
Neste capítulo, compreendemos que:
• Não basta termos acesso à informação, é preciso saber como analisá-la;
• A regressão linear simples é uma tentativa de estabelecer uma equação
matemática linear, ou seja, uma linha que descreva a relação estabele-
cida entre duas variáveis;
• A reta explica o comportamento das variáveis e a relação estabelecida
entre elas e como ela funciona;
• Quando se conhece a equação da reta, pode-se estimar os valores futu-
ros, aplicando-a;
• É possível encontrar a reta de regressão linear na planilha eletrônica;
• Correlação é uma medida que estima a relação entre duas variáveis;
• ANOVA é uma coleção de modelos estatísticos no qual se compara a va-
riância da amostra com diversos fatores ou variáveis.
61PROBABILIDADE E ESTATÍSTICA
EXERCÍCIOS SUMÁRIO
1. Um pesquisador deseja verificar se um instrumento para medir a concen-
tração de determinada substância no sangue está bem calibrado. Para isso,
ele tomou 15 amostras de concentrações conhecidas (X) e determinou a res-
pectiva concentração através do instrumento (Y), obtendo:
Calcule o coeficiente de correlação entre as variáveis X e Y.
2. Estudos na área da saúde indicam que a massa muscular da pessoa ten-
de a diminuir na medida em que a idade aumenta. Um nutricionista fez
uma pesquisa observando um grupo de pessoas, considerando a idade (x)
e a massa muscular (y). Logo, che-
gou aos resultados apresentados na
tabela ao lado:
a. Encontre o coeficiente de cor-
relação
b. Encontre a equação da reta
c. Estime o valor esperado para
80 anos
Idade (x) Massa Muscular (y)
71 82
64 91
43 100
67 68
56 87
73 73
68 78
56 80
76 65
65 84
45 116
58 76
3. Uma revenda de automóveis instalou filiais em 4 regiões do Brasil. Você quer saber se há diferença nas
vendas médias realizadas em cada uma delas. Uma seleção aleatória chegou aos seguintes resultados:
O quadro de ANOVA foi o seguinte:
Existe diferença entre as regiões em relação à venda? Justifique sua resposta.
4. O professor de estatística comparou a nota de uma amostra de alunos na prova de matemática do
vestibular com a obtida no final da disciplina e chegou à seguinte tabela:
Norte Leste Sul Norte
34 47 40 21
28 36 30 30
18 30 41 24
24 38 29 37
Nota no Vestibular (x) Nota na disciplina (y)
39 65
57 92
34 56
40 70
43 78
47 89
42 75
62PROBABILIDADE E ESTATÍSTICA
EXERCÍCIOS SUMÁRIO
a. Faça o gráfico de dispersão.
b. Existe correlação entre as variáveis? Como ela pode ser classificada?
5. O mesmo professor seguiu estudando o comportamento da sua turma. Agora, ele
amostrou 23 alunos, comparando o número de faltas com a nota no final da disci-
plina. Ele encontrou um coeficiente de correlação de Pearson de - 0,66. E os estu-
dantes da turma fizeram os seguintes comentários sobre esse resultado:
I. Isso significa que nenhum aluno com muitas faltas tirou nota alta;
II. Existe uma tendência para que a nota se relacione inversamente com as faltas;
III. O professor não precisa mais fazer provas. Basta fazer a chamada;
IV. De um modo geral, a maior parte dos alunos com boa frequência tende a tirar
boas notas.
Considerando os conceitos estatísticos discutidos em aluno, é correto o que afir-
mamos em:
a. Somente em I
b. Em I e II
c. Em II e IV
d. Em II, III, IV
e. N.d.a.
63PROBABILIDADE E ESTATÍSTICA
GABARITO SUMÁRIO
GABARITOS
CAP. I
1. 0
2. 0
Região Clientes Amostra Número da amostra
Metropolitana 690 48,3 48
Serra 380 26,6 27
Campanha 160 11,2 11
Litoral 280 19,6 20
Peças fi
0 1
1 1
2 2
3 2
4 4
5 2
6 2
7 2
8 2
3. 3
4. 0
5. 0
Classe
Frequência
absoluta (fi)
Frequência
relativa (fr)
Frequência
percentual
(fp)
Frequência
acumulada
(fa)
Frequência
acumulada
percentual (fap)
40 I – 46 5 0,3124 31,24% 5 31,24%
46 I – 52 3 0,1875 18,75% 8 49,99%
52 I – 58 2 0,125 12,5% 10 62,49%
58 I – 64 4 0,25 25% 14 87,49%
64 I - I 70 2 0,125 12,5% 16 99,99%
Total 16 0,9999 99,99%
OBS: as cores, a
disposição da legenda e
o título podem alterar.
Observar a relação entre
a tabela e o gráfico.
Vendedor Km R$
Ricardo 344 456
Bruno 124 540
Gilmar 1389 123
Marisa 0 560
Total 468 1556
64PROBABILIDADEE ESTATÍSTICA
GABARITO SUMÁRIO
CAP. II
1. 134,50
2. 6,81
3. 0
Li = 58
n/2= 40/2 = 20
facant = 13
fi= 11
h=4
4. a. Média = (750.18+800.27+950.10+1100.6 + 2500.2)/ 63
Média = (13500 + 21600 + 9500 + 6600 + 5000)/63
Média = 56200/63
Média = 892,06
b. Deve ser utilizada a média ponderada. A justificativa é porque cada
faixa salarial tem um número diferente de funcionários, dessa for-
ma, tendo uma representatividade ou “peso” diferente.
c. A moda é R$ 800,00, pois é o salário que mais funcionários recebem.
5. Tabela para organização:
a. 0
µ= 2589/78 µ= 33,19
65PROBABILIDADE E ESTATÍSTICA
GABARITO SUMÁRIO
b. Li = 38
D1= 26-4= 22
D2= 26-8= 18
i=5
Moda= li+( d1/(d1+d2))i
Moda= 38+ (22/(22+18 )) x 5
Moda= 38 + 22/40 x 5
Moda= 38 + 0,55 x 5
Moda = 38+ 2,75= 40,75
c. A m
OBS: pode haver uma variação significativa nas casas depois da vírgula.
Quanto mais casas utilizarmos maior será a precisão que obteremos.
d. OBS: lembrem-se, o desvio padrão é a raiz qua-
drada da variância, portanto, existirá diferença
em função das casas decimais utilizadas.
CAP. III
1. a. 1/6
b. 1/3
c. 1/3
d. 2/3
2. a. 1/13
b. 12/13
3. a. 1/24
b. 1/16
4. a. 2/5
b. 3/5
5. a. 53,28%
b. 20,30%
c. 22,66%
6. a. 7,93%
b. 2,87%
7. a. 2,28%
b. 9,18%
c. 0,07%
8. a. 42,07%
b. 84,13%
c. 52,45%
d. 38,49%
9. 0,12013
10. 13,18%
11. [1,402002; 1,597998]
12. [337,6636; 362,3364]
66PROBABILIDADE E ESTATÍSTICA
GABARITO SUMÁRIO
CAP. IV
1. 0,99
2. a. -0,8098
b. y = -1,0898x +150,72
c. 63,536
3. Não existem diferenças significativas, pois o valor de F foi inferior ao de F Crítico.
4. a.
b. A correlação é de 0,93 ou seja, muito forte e direta.
5. c
67PROBABILIDADE E ESTATÍSTICA
REFERÊNCIAS SUMÁRIO
ANDERSON, D. R. Estatística aplicada à administração e economia. 2 ed. São Paulo: Cengage Learning: 2008.
BARBETTA, P. A. Estatística Aplicada às Ciências Sociais. 5.a ed. Florianópolis: Editora da UFSC, 2002.
CLARKE, A. B., DISNEY, R. L. Probabilidade e Processos Estocásticos. Rio de Janeiro: Livros Técnicos e
Científicos Editora, 1979.
CORREA, S.M.B.B. Probabilidade e Estatística. 2.a ed. Belo Horizonte: PUC Minas Virtual, 2003.
KAZMIER, Leonard J. Estatística aplicada à Economia e Administração. São Paulo: Makron Books, 2004.
MORETTIN, L.G. Estatística Básica: Probabilidade e inferência. Volume único. São Paulo: Pearson Prentice
Hall, 2010.
STEWART, Ian. Dezessete equações que mudaram o mundo. Tradução de George Schlesinger. Rio de Ja-
neiro: Zahar, 2013.
TAVARES, M. Estatística aplicada à administração. UAB, 2007. Disponível em<http://www.uapi.edu.br/
conteudo/material_online/disciplinas/estatistica/download/Estatistica_completo_revisado.pdf> Acesso
em: dez. 2016.
YOUSSEF, A. N., SOARES, E. e FERNANDEZ, V. P. Matemática de olho no mundo do trabalho. São Paulo:
Scipione, 1ª ed. 2004.
Introdução à estatística
Noções introdutórias
Métodos tabulares e métodos gráficos
Distribuição de frequência
Síntese
Medidas estatísticas
Medidas de Tendência Central
Medidas Estatísticas com planilhas eletrônicas
Síntese
Probabilidades
Conceitos introdutórios
Probabilidade de um evento
Distribuições de probabilidade
Intervalo de confiança
Síntese
Estatística Avançada
Regressão linear simples
A equação da reta
Valor esperado
Encontrando a reta na planilha eletrônica
Correlação
Análise de Variância
Síntese
GABARITOS