Prévia do material em texto
Estatística E PEsquisa
OPEraciOnal
www.unipar.br
UNIVERSIDADE PARANAENSE
MANTENEDORA
Associação Paranaense de Ensino e Cultura – APEC
REITOR
Carlos Eduardo Garcia
Vice-Reitora Executiva
Neiva Pavan Machado Garcia
Vice-Reitor Chanceler
Candido Garcia
Diretorias Executivas de Gestão
Administrativa
Diretorias Executivas de Gestão
Acadêmica
Diretor Executivo de Gestão dos Assuntos Comunitários
Cássio Eugênio Garcia
Diretora Executiva de Gestão da Cultura e da Divulgação
Institucional
Cláudia Elaine Garcia Custódio
Diretora Executiva de Gestão e Auditoria de Bens Materiais
Permanentes e de Consumo
Rosilamar de Paula Garcia
Diretor Executivo de Gestão dos Recursos Financeiros
Rui de Souza Martins
Diretora Executiva de Gestão do Planejamento Acadêmico
Sônia Regina da Costa Oliveira
Diretor Executivo de Gestão das Relações Trabalhistas
Jânio Tramontin Paganini
Diretor Executivo de Gestão dos Assuntos Jurídicos
Lino Massayuki Ito
Diretora Executiva de Gestão do Ensino Superior
Maria Regina Celi de Oliveira
Diretora Executiva de Gestão da Pesquisa e da Pós-
Graduação
Evellyn Cláudia Wietzikoski
Diretor Executivo de Gestão da Extensão
Universitária
Adriano Augusto Martins
Diretor Executivo de Gestão da Dinâmica
Universitária
José de Oliveira Filho
Diretorias dos Institutos Superiores das
Ciências
Diretora do Instituto Superior de Ciências Exatas,
Agrárias, Tecnológicas e Geociências
Giani Andréa Linde Colauto
Diretora do Núcleo dos Institutos Superiores de Ciências
Humanas, Linguística, Letras e Artes, Ciências Sociais
Aplicadas e Educação
Fernanda Garcia Velásquez
Diretora do Instituto Superior de Ciências Biológicas,
Médicas e da Saúde
Irinéia Paulina Baretta
SEMEAD – SECRETARIA ESPECIAL MULTICAMPI DE
EDUCAçãO A DISTâNCIA
Secretário Executivo
Carlos Eduardo Garcia
Coordenação Geral de EAD
Ana Cristina de Oliveira Cirino Codato
Coordenador dos Cursos Superiores de Licenciatura e de
Graduação Plena (História, Letras, Pedagogia e Filosofia)
Heiji Tanaka
Coordenador dos Cursos Superiores de Tecnologia e Bacharelado do
Eixo Tecnológico de Gestão e Negócios (Gestão Comercial, Logística, Marketing,
Processos Gerenciais e Administração)
Evandro Mendes de Aguiar
Coordenadora dos Cursos Superiores de Tecnologia e Bacharelado do
Eixo Tecnológico de Gestão e Negócios (Gestão Financeira,
Gestão Pública, Recursos Humanos e Ciências Contábeis)
Isabel Cristina Gozer
Ficha catalográfica elaborada pela Biblioteca da UNIPAR
U58e UNIPAR - Universidade Paranaense.
Xxxxxxxx xxxxxxxxxxxxxxxx / Xxxxxx Xxxxxx
Xxxxxxx Xxxx ( Org.). – Xxxxxx : Unipar, 2014.
68 f.
ISBN: ??????????????????
1. Xxxxxxxxxxxx. 2. Xxxxxx x Xxxxxxx - EAD. I.
Xxxxxx x Xxxxxxx. II. Xxxxx.
(?? ed.) CDD: ???.???
Assessoria pedagógica
Daniele Silva Marques e Marcia Dias
Diagramação e Capa
Renata Sguissardi e Fernando Truculo Evangelista
* Material de uso exclusivo da Universidade Paranaense – UNIPAR com todos os direitos da edição a ela reservados.
Sumário
Unidade i - ConstrUção e análise de tabelas
e gráfiCos estatístiCos ................................................................13
tipos de gráficos e séries estatísticas ............................................................14
distribuição de frequência ..................................................................................16
Medidas de posição ................................................................................................25
Média aritmética .....................................................................................................25
Moda .............................................................................................................................32
Mediana .......................................................................................................................35
Medidas de dispersão ...........................................................................................40
amplitude total .......................................................................................................41
desvio em relação à média .................................................................................44
desvio-padrão ..........................................................................................................49
Coeficiente de variação .........................................................................................50
Unidade ii - introdUção à probabilidade ......................59
Considerações iniciais sobre probabilidade ................................................60
probabilidade para eventos independentes e mutuamente exclusivos ......66
distribuição de probabilidade ...........................................................................70
distribuição binomial ...........................................................................................71
distribuição normal ...............................................................................................73
propriedades da distribuição normal ............................................................74
EStatíStica E PESquiSa oPEracional
Unidade iii - teoria eleMentar de aMostrageM
e teoria de estiMação de parâMetros .............................87
teoria elementar de amostragem ....................................................................88
teoria da estimação de parâmetros ................................................................91
teorema do limite central ...................................................................................92
estimação por intervalo .......................................................................................93
estimação por intervalos de confiança da média......................................94
estimação por intervalos de confiança da
proporção populacional .......................................................................................101
Unidade iV - testes e pesqUisa operaCional ................111
teste de hipóteses ..................................................................................................112
Construção de um teste de hipótese para média populacional ..........113
Construção de um teste de hipótese para
proporção populacional .......................................................................................118
atividades para compreensão do conteúdo ................................................121
pesquisa operacional .............................................................................................124
referênCias ..........................................................................................149
apresentação
Diante dos novos desafios trazidos pelo mundo contemporâneo e o surgimento de um
novo paradigma educacional frente às Tecnologias de Informação e Comunicação dis-
poníveis que favorecem a construção do conhecimento, a revolução educacional está
entre os mais pungentes, levando as universidades a assumirem a sua missão como
instituição formadora, com competência e comprometimento, optando por uma gestão
mais aberta e flexível, democratizando o conhecimento científico e tecnológico, atra-
vés da Educação a Distância.
Sendo assim, a Universidade Paranaense - UNIPAR - atenta a este novo cenário e
buscando formar profissionais cada vez mais preparados, autônomos, criativos, res-
ponsáveis, críticos e comprometidos com a formação de uma sociedade mais demo-
crática, vem oferecer-lhe o Ensino a Distância, como uma opção dinâmica e acessível
estimulando o processo de autoaprendizagem.
Como parte deste processo e dos recursos didático-pedagógicos do programa da
Educação a Distância oferecida por esta universidade, este Guia Didático tem como
objetivo oferecer a você, acadêmico(a),meios para que, através do autoestudo, possa
construir o conhecimento e, ao mesmo tempo, refletir sobre a importância dele em sua
formação profissional.
Seja bem-vindo(a) ao Programa de Educação a Distância da UNIPAR.
Carlos Eduardo Garcia
Reitor
Seja bem-vindo caro(a) acadêmico(a),
Os cursos e/ou programas da UNIPAR, ofertados na modalidade de educação a dis-
tância, são compostos de atividades de autoestudo, atividades de tutoria e atividades
presenciais obrigatórias, os quais individualmente e no conjunto são planejados e or-
ganizados de forma a garantir a interatividade e o alcance dos objetivos pedagógicos
estabelecidos em seus respectivos projetos.
As atividades de autoestudo, de caráter individual, compreendem o cumprimento das
atividades propostas pelo professor e pelo tutor mediador, a partir de métodos e práti-
cas de ensino-aprendizagem que incorporem a mediação de recursos didáticos orga-
nizados em diferentes suportes de informação e comunicação.
As atividades de tutoria, também de caráter individual, compreendem atividades de
comunicação pessoal entre você e o tutor mediador, que está apto a: esclarecer as
dúvidas que, no decorrer deste estudo, venham a surgir; trocar informações sobre as-
suntos concernentes à disciplina; auxiliá-lo na execução das atividades propostas no
material didático, conforme calendário estabelecido, enfim, acompanhá-lo e orientá-lo
no que for necessário.
As atividades presenciais, de âmbito coletivo para toda a turma, destinam-se obriga-
toriamente à realização das avaliações oficiais e outras atividades, conforme dispuser
o plano de ensino da disciplina.
Neste contexto, este Guia Didático foi produzido a partir do esforço coletivo de uma
equipe de profissionais multidisciplinares totalmente integrados que se preocupa
com a construção do seu conhecimento, independente da distância geográfica que
você se encontra.
O Programa de Educação a Distância adotado pela UNIPAR prioriza a interatividade,
e respeita a sua autonomia, assegurando que o conhecimento ora disponibilizado seja
construído e apropriado de forma que, progressivamente, novos comportamentos, no-
vas atitudes e novos valores sejam desenvolvidos por você.
A interatividade será vivenciada principalmente no ambiente virtual de aprendizagem
– AVA, nele serão disponibilizados os materiais de autoestudo e as atividades de tuto-
ria que possibilitarão o desenvolvimento de competências necessárias para que você
se aproprie do conhecimento.
Recomendo que durante a realização de seu curso, você explore os textos sugeridos
e as indicações de leituras, resolva às atividades propostas e participe dos fóruns de
discussão, considerando que estas atividades são fundamentais para o sucesso da
sua aprendizagem.
Bons estudos! e-@braços.
Ana Cristina de Oliveira Cirino Codato
Coordenadora Geral da EAD
introdução
Olá, aluno(a), é com prazer que apresento a você o livro de Estatística e Pesquisa
Operacional. Sou o professor Ricardo Cardoso de Oliveira, minha primeira formação
é em Engenharia Química pela Universidade Estadual de Maringá, e com Doutorado
na área de Desenvolvimentos de Processos na Engenharia Química pela Universidade
Estadual de Maringá e University of Waterloo. Minha segunda formação, ainda em an-
damento, é em Licenciatura Matemática.
Este livro tem a finalidade de expor, de forma sucinta, os universos da estatística
e da pesquisa operacional. Esta que, por sua vez, tiveram suas aplicações inten-
sificadas nos últimos anos, tornando-se foco de estudo nas áreas econômicas,
sociais, culturais, de engenharia, de saúde, meio ambiente, e por aí segue. Cabe
a você, aluno(a), aproveitar este material para fazer pesquisas e leituras para se
aprofundar mais no tema.
O livro apresenta os conceitos de estatística e de pesquisa operacional de forma intro-
dutória e tem alguns exercícios para treino, e tem por objetivo apresentar os conceitos
e metodologias de forma simples e de fácil acesso ao entendimento dos estudantes.
Ao final de cada item teórico, poderão ser encontrados alguns exemplos e suges-
tão de alguns exercícios. A primeira parte do livro tratará da estatística descritiva, se-
guido por teoria das probabilidades, em seguida teoria da amostragem e de estima-
ção de parâmetros. Os últimos tópicos abordados serão testes de hipótese e pesquisa
operacional.
Espero que utilize este livro como porta do saber e que ele motive em você a vontade
de ampliar seu conhecimento.
A palavra “Estatística” está associada à palavra latina status que significa estado.
Existem relatos de que desde 3000 anos a.C., já se faziam censos na Babilônia, China
e Egito. Usualmente, estas informações eram utilizadas para a taxação de impos-
tos ou para o alistamento militar. A palavra “censo” é derivada da palavra “censere”,
que em Latim significa “taxar”. A palavra Estatística foi cunhada pelo acadêmico ale-
mão Gottfried Achenwall (1719-1772), que foi um notável continuador dos estudos
de Hermann Conrig (1606-1681). A escola alemã atingiu sua maturidade com A. L.
von Schlozer (1735-1809), mas sempre com ideias diferentes daquelas que funda-
mentaram a Estatística Moderna. Com algum exagero, pode-se dizer que o seu prin-
cipal legado foi o termo “STAATENKUNDE”, que deu origem à designação atual. Na
Enciclopédia Britânica, o verbete “STATISTICS” aparece pela primeira vez em 1797.
Atualmente, a Estatística é definida da seguinte maneira: “Estatística é um conjunto
de métodos e processos que serve para estudar e medir os fenômenos coletivos”. A
Estatística subdivide-se em três áreas: descritiva, probabilística e inferencial. A esta-
tística descritiva, como o próprio nome já diz, se preocupa em descrever os dados. A
estatística inferencial, fundamentada na teoria das probabilidades, se preocupa com a
análise destes dados e sua interpretação.
Por outro lado, a Pesquisa Operacional é uma ciência aplicada voltada para a resolu-
ção de problemas reais. Tendo como foco a tomada de decisões, aplica conceitos e
métodos de várias áreas científicas na concepção, planejamento ou operação de sis-
temas. A Pesquisa Operacional é usada para avaliar linhas de ação alternativas e en-
contrar as soluções que melhor servem aos objetivos dos indivíduos ou organizações.
Convido você a entrar nesse mundo fascinante da estatística e da pesquisa operacional.
Aproveite! Bons estudos!
Unidade i - ConstrUção e análise de
tabelas e gráfiCos estatístiCos
ObjetivOs a serem alcançadOs nesta unidade
Prezado(a) Acadêmico(a), ao terminar os estudos dessa unidade, você deverá ser
capaz de:
• Elaborar, compreender e analisar tabelas e gráficos estatísticos ligados ao
mundo científico.
• Elaborar, compreender e analisar tabelas de distribuição de frequência.
• Reconhecer os conceitos estatísticos básicos de medidas de posição.
• Reconhecer os conceitos estatísticos básicos de medidas de dispersão e
variabilidade.
Para que esses objetivos sejam alcançados, é de extrema importância que você de-
senvolva seus estudos com seriedade e dedicação, lendo as literaturas recomenda-
das e os capítulos dos livros didáticos que forem referenciados neste guia.
Bons estudos!
14 Estatística E PEsquisa OPEraciOnal
tipOs de gráficOs e séries estatísticas
Uma tabela trata-se de um quadro que resume um conjunto de observações ou infor-
mações. A tabela é constituída de:
I. corpo: é o conjunto de linhas e colunas que contêm informações sobre a vari-
ável ou variáveis de estudo.
II. cabeçalho: parte superior da tabela onde está especificado o conteúdo de
cada coluna.
III. coluna indicadora: parte que compõe a tabela que especifica o conteúdo de
cada linha.
IV. célula: espaço destinadoa um só número (ou informação).
V. título: conjunto de informações, localizado no topo da tabela, que responde às
perguntas: O quê?, Quando?, Onde?.
Veja o exemplo 1, abaixo:
Exemplo 1
O BRICS é um bloco de países emergentes, formado por Brasil, Rússia, Índia,
China e África do Sul. A seguir é apresentado um levantamento do crescimento
do PIB, realizado pela consultoria Tendências referente ao segundo trimestre do
ano de 2014.
15Estatística E PEsquisa OPEraciOnal
Quadro: Crescimento do PIB dos países do BRICS, em 2014
país
crescimentO dO pib nO segundO
trimestre de 2014 (%)
previsãO de crescimentO
para 2014 (%)
Brasil - 0,9 0,3
Rússia 0,8 0,3
Índia 5,7 5,4
China 7,5 7,4
África do Sul 1,0 1,7
Fonte: Tendências
Uma série estatística trata-se de toda tabela que apresenta distribuição de um conjun-
to de dados em função da época (denominadas séries históricas), do local (denomina-
das séries geográficas) ou da espécie (denominadas séries específicas).
Um gráfico estatístico é uma maneira de apresentação dos dados, que tem como
objetivo produzir uma impressão mais rápida e viva do fenômeno estudado, uma
vez que os gráficos falam mais rápidos à compreensão da série. Os gráficos de-
vem ser simples, claro e devem expressar a verdade sobre o fenômeno em estudo.
Veja o exemplo 2.
Exemplo 2
Aqui temos a representação gráfica dos dados apresentados no exemplo 1.
16 Estatística E PEsquisa OPEraciOnal
distribuiçãO de frequência
Após a realização de uma pesquisa em que os dados foram coletados, faz-se ne-
cessária a organização e classificação desses. Esse procedimento é, em geral, feito
por meio de tabelas. Essas tabelas são denominadas tabelas de distribuição de
frequência.
Para entender esse conceito e outros que virão, vamos considerar que foram coleta-
dos os dados referentes aos preços de quarenta ações ordinárias em uma determina-
da Bolsa de Valores, como pode ser visto na Tabela 1.
Tabela 1: Preços de quarenta ações ordinárias em uma Bolsa de Valores
33,50 30,38 48,38 31,13 29,63 9,25 32,25 38,00 8,63 29,63
9,00 18,00 18,00 1,25 37,88 10,00 25,24 52,00 9,25 53,38
8,75 34,00 7,63 14,00 43,25 16,50 11,38 25,02 18,50 16,63
9,38 8,00 35,25 21,63 19,38 11,50 28,50 78,38 38,88 33,63
17Estatística E PEsquisa OPEraciOnal
A Tabela 1 é um tipo de tabela em que os dados não estão organizados é denominado
tabela bruta e os dados são chamados de dados brutos. Ao organizar esses dados
brutos, em tabela, em ordem crescente ou decrescente temos o rol, como apresenta-
do na Tabela 2.
Tabela 2: Rol crescente dos preços de quarenta ações ordinárias em uma Bolsa de Valores
1,25 7,63 8,00 8,63 8,75 9,00 9,25 9,25 9,38 10,00
11,38 11,50 14,00 16,50 16,65 16,63 18,00 18,00 18,50 19,38
21,63 25,02 25,24 28,50 29,63 30,38 31,13 32,25 33,50 33,63
34,00 35,25 37,88 38,00 38,88 43,25 48,38 52,00 53,38 78,38
Uma vez organizados os dados em rol, iremos agora resumir esses dados em uma
tabela de tal forma que a leitura dos dados seja facilitada. Para isso definimos:
I. Classe: é a subdivisão dos dados em intervalos ou faixas de valores.
II. Limite de classe: são os valores extremos de cada classe. Para uma classe
temos o limitante inferior que é o menor número que pode pertencer à classe e
ainda, o limitante superior que é o maior número que pode pertencer à classe.
III. Amplitude amostral (AA): é a diferença entre o maior e o menor entre os
dados coletados.
IV. Ponto médio de uma classe : são os valores obtidos somando-se o li-
mitante inferior de classe ao limitante superior e dividindo-se o resultado da
soma por 2.
V. Número de classes (i): para construção de uma tabela de distribuição de fre-
quência, a primeira coisa que devemos nos preocupar é em determinar o nú-
mero de classes. Para tal fazemos uso da regra de Sturges, a qual é dada por:
18 Estatística E PEsquisa OPEraciOnal
Ou ainda, podemos fazer uso da regra da raiz, a qual é dada por:
Para essas regras temos que n é o número de dados coletados.
VI. Amplitude de classe (h): calculado o número de classes a ser usado na
construção da tabela de distribuição de frequência, devemos proceder ao cál-
culo da amplitude da classe, a qual é calculada fazendo-se a razão entre a
amplitude total e o número de classes.
VII. Frequência absoluta : é o número de vezes que determinado elemento
aparece na amostra ou, ainda, o número de vezes que um elemento aparece
em uma classe.
VIII. Frequência relativa : é a razão entre a frequência absoluta da classe em
questão e o número total de elementos na amostra. A frequência relativa é
calculada usando-se a equação:
IX. Frequência relativa percentual : é obtida procedendo-se o produto da
frequência relativa por 100, como mostrado abaixo:
X. Frequência acumulada : é obtida somando-se a frequência absoluta
da classe considerada, às frequências absolutas anteriores a esta classe. A
equação abaixo mostra o procedimento do cálculo da frequência acumulada
de uma classe.
19Estatística E PEsquisa OPEraciOnal
Em que é a frequência absoluta da primeira classe, é frequência absoluta da
segunda classe, e assim por diante até a n-ésima classe. O símbolo denota a
soma das frequências da primeira, segunda e até a n-ésima classe.
XI. Frequência relativa acumulada : é a razão entre a frequência acumu-
lada de uma classe pelo número total de elementos na amostra, como mostra
a equação a seguir:
XII. Frequência relativa acumulada percentual : é o produto da frequên-
cia relativa acumulada de uma classe por 100, como apresentado na seguinte:
Já que definimos tanta coisa, vamos aplicá-las à Tabela 2. Digamos que nosso objeti-
vo seja elaborar um relatório e queremos resumir as informações dos preços dessas
quarenta ações ordinárias em uma tabela de distribuição de frequência. Embora exis-
tam tecnologias para gerar distribuições de frequência automaticamente, os passos
para construí-las manualmente são os seguintes:
1º. passo: determinar o número de classes desejado. Este número deve estar
entre 5 e 20, por questões práticas e ainda deve ser um número inteiro. Como
20 Estatística E PEsquisa OPEraciOnal
temos n = 40 observações, podemos usar o critério de Sturges ou da raiz.
Assim, temos pelo critério de Sturges o número de classes igual a:
2º. passo: calcular a amplitude das classes. Se necessário, faça uso de arre-
dondamentos e/ou mude o número de classes de modo que se use números
convenientes.
3º. Passo: escolha o valor mínimo, ou um valor conveniente que seja um pou-
co menor do que esse valor mínimo para ser o primeiro limitante inferior de
classe. Usando esse limitante inferior e a amplitude da classe, prossiga e liste
os outros limites inferiores de classe, adicionando a amplitude de classe ao
primeiro limite de classe inferior para obter o segundo limite inferior de classe
e assim por diante.
4º. Passo: liste os limites inferiores de cada classe em uma coluna vertical e
prossiga para preencher os limitantes superiores. Feito isso, percorra o con-
junto de dados colocando uma marca apropriada para cada valor dado. Conte
as marcas para encontrar a frequência total para cada classe.
Agora tendo como base a Tabela 2, vamos construir a tabela de distribuição de
frequência.
21Estatística E PEsquisa OPEraciOnal
Tabela 3: Distribuição de frequência dos preços de quarenta ações ordinárias
classe (i)
preçO das ações
(intervalos de classe)
frequência (fi)
1 1 |––– 14 12
2 14 |––– 27 11
3 27 |––– 40 12
4 40 |––– 53 3
5 53 |––– 66 1
6 66 |––– 79 1
Total 40
De posse da tabela de distribuição de frequência podemos calcular as frequências
relativas e acumuladas, como apresentado na Tabela 4.
Tabela4: Preço das ações ordinárias em uma Bolsa de Valores (Distribuição de frequência relativa e acumulada)
classe (i)
preçO das
ações 𝒇i 𝒇r 𝒇r% FAC FRAC FRAC%
1 1 |––– 14 12 0,300 30,0 12 0,300 30,0
2 14 |––– 27 11 0,275 27,5 23 0,575 57,5
3 27 |––– 40 12 0,300 30,0 35 0,875 87,5
4 40 |––– 53 3 0,075 7,50 38 0,950 95,0
5 53 |––– 66 1 0,025 2,50 39 0,975 97,5
6 66 |––– 79 1 0,025 2,50 40 1,000 100,0
Total 40 1,000 100,00 - - -
22 Estatística E PEsquisa OPEraciOnal
O cálculo da frequência relativa da primeira classe foi feito da seguinte maneira:
E esse procedimento foi usado para calcular as demais frequências relativas. As fre-
quências relativas percentuais foram obtidas multiplicando por 100 as frequências
relativas de cada classe.
O cálculo da frequência acumulada foi feito como apresentado abaixo:
E assim por diante até a sexta classe. As frequências relativas acumuladas foram
calculadas como abaixo:
E assim por diante até a sexta classe. Já as frequências relativas percentuais foram
obtidas multiplicando por 100 as frequências relativas acumuladas.
Em muitas situações é mais conveniente representar de forma gráfica uma distribui-
ção de frequência e, isso pode ser feito usando o histograma, o polígono de frequên-
cia ou o polígono de frequência acumulada.
23Estatística E PEsquisa OPEraciOnal
O histograma é a representação gráfica da distribuição de frequência. Trata-se de
um diagrama de colunas em que cada retângulo está associado com uma classe da
distribuição de frequência. O histograma associado à Tabela 4 está representado na
Figura 1.
Fr
eq
uê
nc
ia
s
Preço das ações
16
14
12
10
8
6
4
2
0
1 14 27 40 53 66 79
Figura 1 - Histograma da distribuição de frequência dos preços de 40 ações ordinárias em uma bolsa de valores
O polígono de frequência é o gráfico de configuração linear. Ele é obtido calculando-
se o ponto médio de cada classe, e marca-se esse ponto no lado superior do histo-
grama. O polígono de frequência é obtido ligando-se esses pontos médios. A Figura 2
mostra o polígono de frequência associado aos dados da Tabela 1.4.
24 Estatística E PEsquisa OPEraciOnal
Fr
eq
uê
nc
ia
s
Preço das ações
16
14
12
10
8
6
4
2
0
1 14 27 40 53 66 79
Figura 2 - Polígono de frequência dos preços de 40 ações ordinárias em uma bolsa de valores
O polígono de frequência acumulada ou ogiva de Galton é um gráfico que permite
descrever dados quantitativos por meio da frequência acumulada. A ogiva é um gráfi-
co de linha que une os pontos cujas abscissas são os limites superiores das classes,
e, ordenadas suas respectivas frequências acumuladas. A Figura 3 apresenta o po-
lígono de frequência acumulada para os dados distribuídos em classe da Tabela 4.
25Estatística E PEsquisa OPEraciOnal
Fr
eq
uê
nc
ia
s
40
35
30
25
20
15
10
5
0
1 14 27 40 53 66 79
Preço das ações
Figura 3 - Polígono de frequência acumulada dos preços de 40 ações ordinárias em uma bolsa de valores
medidas de pOsiçãO
O que vimos até agora com a distribuição de frequência permite-nos descrever de
modo geral um conjunto de dados. Precisamos agora encontrar maneiras de ressaltar
as tendências da distribuição estudada. Para tal, vamos estudar as medidas de posi-
ção, que são média, moda e mediana.
média aritmética
A média aritmética é a mais importante de todas as medidas de posição existentes
para descrever dados em geral.
26 Estatística E PEsquisa OPEraciOnal
A média aritmética ( ) é uma medida de tendência central determinada pela adição
de todos os valores e divisão pelo número de valores. Esta definição nos permite es-
crever a equação abaixo:
Em que , , ..., são as variáveis que se está estudando, n é o número de valores
estudados, denota a soma de todos os valores em estudo.
Exemplo 3
O valor da conta de telefone de Sebastião variou muito nos três primeiros meses de
2012. Em janeiro, Sebastião pagou R$ 48,50; em fevereiro, R$ 78,00 e em março, R$
65,20. Qual foi, em reais, o valor mensal médio da conta telefônica de Sebastião no
primeiro trimestre de 2012?
A. 60,60
B. 61,90
C. 62,20
D. 63,90
E. 64,20
Solução
A média aritmética do valor da conta de telefone de Sebastião é:
27Estatística E PEsquisa OPEraciOnal
Acabamos de calcular a média aritmética para o caso em que os dados não estão
agrupados. Agora, vamos aprender a calcular a média aritmética para o caso em que
os dados estão agrupados sem intervalo de classe. Nessa situação, como as frequ-
ências são números indicadores da intensidade de cada valor, elas funcionam como
fatores de ponderação e assim, calculados a média aritmética ponderada, como
apresentado pela equação abaixo:
Exemplo 4
(CESGRANRIO) Uma pesquisa realizada pela Polícia Rodoviária Estadual a res-
peito do número de acidentes automobilístico por dia, em determinado trecho de
uma estrada, utilizando a observação de 200 dias, resultou na seguinte Tabela de
Frequências:
númerO de
acidentes pOr dia
frequência
Observada
0 20
1 40
2 80
3 50
4 10
28 Estatística E PEsquisa OPEraciOnal
O valor esperado do número de acidentes automobilístico por dia, no trecho de estra-
da observado é:
A. 1,00
B. 1,95
C. 2,00
D. 2,50
E. 3,00
Solução
Das informações dispostas na Tabela, montamos outra tabela para auxiliar-nos no
cálculo da média aritmética. Assim,
𝑥i 𝑓i 𝑥i 𝑓i
0 20 0
1 40 40
2 80 160
3 50 150
4 10 40
∑ 𝑓i = 200 ∑ 𝑥i 𝑓i = 390
Daí segue que . Portanto, o valor esperado do número de acidentes
automobilístico por dia, no trecho de estrada observado é igual a 1,95.
29Estatística E PEsquisa OPEraciOnal
Vejamos agora, o caso do cálculo da média aritmética quando os dados estão agrupa-
dos em classe. Nesse caso, convenciona-se que os valores incluídos em um determi-
nado intervalo coincidem com seu ponto médio, e determinamos a média ponderada.
Vejamos o exemplo seguinte.
Exemplo 5
Na Tabela abaixo temos a distribuição de frequência dos preços de quarenta ações
ordinárias negociados em um dia em uma Bolsa de Valores. Determinar o preço médio
dessas ações.
preçO das ações frequência (𝑓i )
1 |––– 14 12
14 |––– 27 11
27 |––– 40 12
40 |––– 53 3
53 |––– 66 1
66 |––– 79 1
Total 40
Solução
Sas informações dispostas na Tabela, montamos outra tabela para auxiliar-nos no
cálculo da média aritmética. Assim,
30 Estatística E PEsquisa OPEraciOnal
preçO das ações 𝑓i 𝑥i 𝑥i 𝑓i
1 |––– 14 12 6,5 78
14 |––– 27 11 20,5 225,5
27 |––– 40 12 33,5 402
40 |––– 53 3 46,5 139,5
53 |––– 66 1 59,5 59,5
66 |––– 79 1 72,5 72,5
Total ∑ 𝑓i = 40 - ∑ 𝑥i 𝑓i = 977
Daí segue que . Portanto, o preço médio das ações negociadas é igual
a R$ 24,43.
Exemplo 6
(CESGRANRIO) A média salarial de 100 pessoas é igual a R$ 500,00. Se o salário de
Mário fosse incluído no cálculo, a média salarial seria igual a R$ 510,00. O salário de
Mário, em reais, é:
A. 510,00
B. 610,00
C. 1.510,00
D. 5.110,00
E. 5.510,00
31Estatística E PEsquisa OPEraciOnal
Solução
Temos que a média salarial, das 100 pessoas pode ser calculada por meio
da equação:
Ou seja, a soma dos salários das 100 pessoas é igual a
(*). Considerando agora a inclusão de Mário, a média salarial é igual a e é
calculada por meio da equação:
Ou seja, a soma dos salários de 101 pessoas é igual a
(**). Assim, subtraindo (*) de (**), segue que o salário de Mário é igual a R$ 1.5010,00.
A média aritmética apresenta as seguintes propriedades:
I. Chamamos de desvio em relação a média a diferença entre cada elemento de
um conjunto de valores e a médiaaritmética. A soma algébrica desses desvios
tomados em relação à média aritmética é nula.
II. Somando ou subtraindo-se uma constante (k) qualquer a todos os valores da
variável, a média aritmética fica aumentada ou diminuída dessa constante.
III. Multiplicando ou dividindo-se uma constante (k) qualquer a todos os valores
da variável, a média aritmética fica multiplicada ou dividida dessa constante.
32 Estatística E PEsquisa OPEraciOnal
moda
Moda (Mo) é o valor que ocorre com maior frequência em um conjunto de dados e
esse(s) valor(es) é(são) denominado(s) “valor modal”. Um conjunto de dados poderá
ser classificado em:
I. amodal – quando não apresentar valor modal;
II. unimodal – quando apresentar único valor modal;
III. bimodal – quando apresentar dois valores modais;
IV. trimodal – quando apresentar três valores modais;
V. polimodal – quando apresentar quatro ou mais valores modais.
Exemplo 7
Os dados abaixo correspondem às quantidades diárias de merendas escolares de-
mandadas em 10 diferentes escolas: 200, 250, 300, 250, 250, 200, 150, 200, 150,
200. Calcule a moda.
Solução
Organizando os dados em rol, obtemos a seguinte distribuição 150 – 150 – 200 – 200
– 200 – 200 – 250 – 250 – 250 – 300. Note que na série há repetição dos valores 150
(2 vezes), 200 (4 vezes) e 250 (3 vezes). O valor modal será 200, pois é o que repete
mais vezes.
Acabamos de calcular a moda para o caso em que os dados não estão agrupados. Ago-
ra, vamos aprender a calcular a moda para o caso em que os dados estão agrupados
sem intervalo de classe. Nessa situação, é muito fácil determinar o valor modal, bastando
determinar a classe que apresenta maior frequência. Vejamos o exemplo abaixo.
33Estatística E PEsquisa OPEraciOnal
Exemplo 8
Determinada carreira profissional, em um órgão público, apresenta 5 níveis de salá-
rios com uma distribuição demonstrada no quadro abaixo.
saláriOs (r$) 1.500,00 2.000,00 2.500,00 3.000,00 3.500,00
quantidade de funciOnáriOs 10 15 25 20 5
Determine o salário modal desse órgão público.
Solução
O salário modal desse compartimento público é R$ 2.500,00, pois esse valor caracte-
riza o maior número de ocorrências (25 vezes).
Vejamos agora, o caso do cálculo da moda quando os dados estão agrupados em clas-
se. Nesse caso, é comum fazer uso da fórmula de Czuber, para o cálculo do valor modal:
Em que é o limite inferior da classe modal; é a diferença entre a frequência da
classe modal e a frequência da classe anterior à classe modal; é a diferença entre
a frequência da classe modal e a frequência da classe posterior à classe modal;
é a amplitude da classe modal. Vejamos o exemplo seguinte.
34 Estatística E PEsquisa OPEraciOnal
Exemplo 9
A tabela abaixo apresenta a distribuição de frequências das notas obtidas em um teste
de Estatística, realizado por 50 estudantes universitários.
nOta frequência
0 |––– 2 4
2 |––– 4 12
4 |––– 6 15
6 |––– 8 13
8 |––– 10 6
Determine a nota modal.
Solução
A classe modal corresponde à classe que apresenta maior frequência. É claro que
essa frequência corresponde à terceira classe. Assim,
Daí,
Portanto, a nota modal é 5,2.
35Estatística E PEsquisa OPEraciOnal
A moda é, em geral, usada para medidas rápidas e aproximações de posição, ou ain-
da, quando a medida de posição deve ser o valor mais frequente da distribuição.
mediana
A mediana (Me) é a medida de posição definida como sendo o número que divide o
conjunto de dados analisado em duas partes iguais, com o número igual de elemen-
tos. Desta maneira, a mediana encontra-se no centro de uma série estatística organi-
zada em rol.
Ao organizar os dados em rol e este apresentar um número de elementos ímpar, a
mediana será o valor central. Caso o rol tenha um número par de elementos, a media-
na será a média aritmética entre os dois termos centrais, nesse caso a mediana será
um valor que não pertence à série de dados.
Exemplo 10
Suponha que certa Agência do Banco XYZ tenha 25 funcionários, cujas idades, em
anos, são as seguintes:
24 − 24 −24 −25 − 25 − 30 − 32 − 32 − 32 − 35 − 36 − 36 − 40 − 40 − 40 − 40− 46 –
48 − 48 − 50 − 54 − 54 − 60 − 60 − 65
Determine a idade mediana dos funcionários do Banco XYZ.
Solução
Note que os dados estão organizados em rol crescente e que temos 25 valores. O 13º
elemento é o que ocupa a posição central e este valor é a mediana do conjunto de
dados. Assim sendo, a mediana das idades dos funcionários do Banco XYZ é 40 anos.
36 Estatística E PEsquisa OPEraciOnal
Exemplo 11
(CESGRANRIO) Uma turma do 2º período de Administração é composta de 20 alunos,
que tiraram as seguintes notas no teste de Estatística:
alunO nOta alunO nOta
1 8,5 11 6,0
2 5,0 12 7,5
3 4,0 13 5,5
4 7,0 14 9,5
5 8,0 15 8,5
6 9,0 16 7,0
7 1,5 17 9,0
8 4,5 18 8,5
9 10,0 19 3,0
10 6,5 20 2,0
Qual é a mediana teórica da turma nesse teste?
A. 6,0
B. 6,5
C. 6,75
D. 7,0
E. 7,25
Solução
Primeiramente vamos organizar as notas em rol crescente. Assim, temos:
1,5 – 2,0 – 3,0 – 4,0 – 4,5 – 5,0 – 5,5 – 6 – 6,5 – 7,0 – 7,0 – 7,5 – 8,0 – 8,5 – 8,5 –
8,5 – 9,0 – 9,0 – 9,5 – 10,0
37Estatística E PEsquisa OPEraciOnal
Note que temos um número par de elementos e os dois termos centrais têm média
aritmética igual a 7,0. Portanto, a mediana da nota desse grupo de alunos é igual
a 7,0 pontos.
Acabamos de calcular a mediana para o caso em que os dados não estão agrupados.
Agora, vamos aprender a calcular a mediana para o caso em que os dados estão agru-
pados sem intervalo de classe. Nessa situação, devemos executar os seguintes passos:
I. calcular a frequência acumulada;
II. determinar um valor tal que divida a distribuição em dois grupos que contenham
o mesmo número de elementos.
Vejamos o exemplo abaixo.
Exemplo 12
Os salários dos 40 funcionários de uma empresa, em 31 de dezembro de 2012, esta-
vam distribuídos conforme a tabela a seguir:
saláriO (r$)
númerO de
funciOnáriOs
800,00 4
1.100,00 8
2.000,00 10
2.800,00 16
3.600,00 2
Total 40
Determine a mediana dos salários dos funcionários dessa empresa.
38 Estatística E PEsquisa OPEraciOnal
Solução
Para determinar o valor da mediana, primeiro vamos determinar a frequência acumu-
lada para o conjunto de dados. Assim,
saláriO (r$) 𝑓i FAC
800,00 4 4
1.100,00 8 12
2.000,00 10 22
2.800,00 16 38
3.600,00 2 40
Total 40 -
Daí, a posição da mediana será , ou seja, o valor pertence a 3º classe e corres-
ponde ao salário de R$ 2.000,00. Portanto, a mediana do salário é igual a R$ 2.000,00.
Vejamos agora, o caso do cálculo da mediana quando os dados estão agrupados em
classe. Nesse caso, usa-se a seguinte equação de interpolação linear:
Em que:
é o limitante inferior da classe mediana;
é o número de elementos coletados na pesquisa;
frequência acumulada da classe anterior à classe mediana;
39Estatística E PEsquisa OPEraciOnal
é a frequência absoluta da classe mediana;
é a amplitude da classe da mediana.
Exemplo 13
A Tabela abaixo apresenta a distribuição de frequência dos preços de quarenta ações
ordinárias negociados em um dia em uma Bolsa de Valores. Determinar a mediana do
preço dessas ações.
preçO das ações frequência (𝑓i)
1 |––– 14 12
14 |––– 27 11
27 |––– 40 12
40 |––– 53 3
53 |––– 66 1
66 |––– 79 1
Total 40
Solução
Vamos primeiramente reescrever a tabela com a coluna de frequência acumulada e
identificar a classe mediana, como mostrado a seguir:
40 Estatística E PEsquisa OPEraciOnal
preçO das ações 𝑓i FAC
1 |––– 14 12 12
14 |––– 27 11 23
27 |––– 40 12 35
40 |––– 53 3 38
53 |––– 66 1 39
66 |––– 79 1 40
Total40 -
Temos que n = 40, , , e . Daí,
Logo, o valor mediano das ações é igual a R$ 23,45.
medidas de dispersãO
Agora vamos discutir a dispersão ou variabilidade dos dados estudados. Essas me-
didas incluem o estudo da amplitude total, da variância, do desvio-padrão e do coe-
ficiente de variação. Nossos objetivos aqui são determinar as medidas de dispersão,
bem como sua interpretação.
41Estatística E PEsquisa OPEraciOnal
Para iniciar nosso estudo, considere os seguintes conjuntos de dados:
A. 17, 17, 17, 17, 17
B. 15, 16, 17, 18, 19
C. - 48, - 38, - 3, 67, 107
A média aritmética de cada conjunto de dados é:
Note que embora as médias aritméticas sejam iguais, existe diferença na dispersão
desses dados em relação à média. Temos que o conjunto de dados A é mais homogê-
neo que o conjunto de dados B que, por sua vez, é mais homogêneo que o conjunto
de dados C. Ou seja, quando comparamos esses conjuntos de dados de A para C,
temos aumento na dispersão dos dados por eles apresentados. Daí surge a necessi-
dade em medir a dispersão ou variabilidade de um conjunto de dados.
amplitude total
A amplitude total (AT) de um conjunto de dados é a diferença entre o maior valor e o
menor valor.
42 Estatística E PEsquisa OPEraciOnal
Trata-se de uma medida de dispersão muito sensível aos valores extremos e não
é tão útil quanto às outras medidas de dispersão que estudaremos. Estudemos os
exemplos abaixo.
Exemplo 14
Na Tabela abaixo estão os valores em rol do preço de quarenta ações negociadas em
um dia por uma Bolsa de Valores.
1,25 7,63 8,00 8,63 8,75 9,00 9,25 9,25 9,38 10,00
11,38 11,50 14,00 16,50 16,65 16,63 18,00 18,00 18,50 19,38
21,63 25,02 25,24 28,50 29,63 30,38 31,13 32,25 33,50 33,63
34,00 35,25 37,88 38,00 38,88 43,25 48,38 52,00 53,38 78,38
Determine a amplitude total dos preços das ações negociadas.
Solução
Antes de calcular a amplitude total, primeiro devemos escrever os dados em rol. As-
sim sendo, temos que:
Logo, a amplitude dos preços das ações é igual a R$ 77,13.
43Estatística E PEsquisa OPEraciOnal
Exemplo 15
No exemplo 4 foi apresentado os resultados de uma pesquisa realizada pela Polícia
Rodoviária Estadual a respeito do número de acidentes automobilístico por dia, em
determinado trecho de uma estrada. A tabela de frequências é apresentada abaixo:
númerO de
acidentes pOr dia
frequência
Observada
0 20
1 40
2 80
3 50
4 10
Determine a amplitude total.
Solução
Nesse caso a amplitude será dada por , ou seja, a amplitude do número
de acidentes por dia é igual a 4.
Exemplo 16
A seguir são apresentados os valores dos preços das quarenta ações negociadas por
uma Bolsa de Valores em tabela de distribuição de frequência com dados agrupados
em classe.
classe (i) preçO das ações 𝑓i
1 1 |––– 14 12
2 14 |––– 27 11
44 Estatística E PEsquisa OPEraciOnal
3 27 |––– 40 12
4 40 |––– 53 3
5 53 |––– 66 1
6 66 |––– 79 1
Total 40
Determine a amplitude do valor dos preços das ações negociadas.
Solução
Nessa situação em que os dados estão organizados por classe, a amplitude é dada
por: . Logo, a amplitude dos preços das ações é igual a R$ 78,00.
desvio em relação à média
A diferença entre cada valor observado e a média é denominada desvio e é dado
por se o conjunto de dados for um universo, ou por se os dados são
amostrais. Ao somar todos os desvios, ou seja, ao somar todas as diferenças de cada
valor observado em relação à média, o resultado é igual à zero. Isto significa que esta
medida não mede a variabilidade dos dados. Para resolver este problema, considera-
mos o quadrado dos desvios em relação à média.
Variância
A variância é uma medida de dispersão estatística, determinando quão longe os valo-
res coletados estão em relação ao valor esperado. A variância é calculada de acordo
com as equações abaixo:
45Estatística E PEsquisa OPEraciOnal
variância pOpulaciOnal variância amOstral
Em que:
é a variância populacional;
é a variância amostral;
é o valor da variável;
é a média aritmética dos elementos da população;
é a média aritmética dos elementos da amostra;
N é o número de elementos da população;
n é o número de elementos da amostra.
Exemplo 17
(CESGRANRIO) Em uma amostra de cinco residências de uma determinada rua re-
gistram-se os seguintes números de moradores em cada uma:
casa a casa b casa c casa d casa e
3 6 2 7 2
A variância amostral é:
A. 5,8
B. 5,5
C. 5,1
D. 4,8
E. 4,4
46 Estatística E PEsquisa OPEraciOnal
Solução
Primeiramente, vamos determinar a média aritmética da amostra. Assim,
. Para obter o quadrado dos desvios, montamos a tabela abaixo:
xi ( xi – x) ( xi – x)2
Casa A 3 (3 – 4) = –1 1
Casa B 6 (6 – 4) = 2 4
Casa C 2 (2 – 4) = –2 4
Casa D 7 (7 – 4) = 3 9
Casa E 2 (2 – 4) = –2 4
∑ ( xi – x) = 0 ∑ ( xi – x)2 = 22
Daí segue que a variância amostra é . Logo, a variância é 5,5 moradores2.
Vejamos agora o cálculo da variância para o caso em que os dados estão agrupados
sem intervalo de classe. Nesse caso, a variância é dada por:
Exemplo 18
Uma pesquisa realizada pela Polícia Rodoviária Estadual a respeito do número de
acidentes automobilístico por dia, em determinado trecho de uma estrada, utilizando a
observação de 200 dias, resultou na seguinte Tabela de Frequências:
47Estatística E PEsquisa OPEraciOnal
númerO de
acidentes pOr dia
frequência
Observada
0 20
1 40
2 80
3 50
4 10
Determine a variância amostral.
Solução
Para o cálculo da variância amostral, montamos a seguinte tabela:
xi 𝑓i xi 𝑓i x2i 𝑓i
0 20 0 0
1 40 40 40
2 80 160 320
3 50 150 350
4 10 40 160
∑ 𝑓i = 200 ∑ xi 𝑓i = 390 ∑ x2i 𝑓i = 870
Assim, a variância amostral é . Logo, a variância amostra é
0,5475 acidentes2.
48 Estatística E PEsquisa OPEraciOnal
Vejamos agora o cálculo da variância para o caso em que os dados estão agrupados
com intervalo de classe. Nesse caso, a equação da variância é dada por:
Em que é o ponto médio da classe considerada.
Exemplo 19
A Tabela abaixo apresenta a distribuição de frequência dos preços de uma amostra de
quarenta ações ordinárias negociados em um dia em uma Bolsa de Valores. Determi-
nar a variância do preço dessas ações.
preçO das ações frequência (𝑓i)
1 |––– 14 12
14 |––– 27 11
27 |––– 40 12
40 |––– 53 3
53 |––– 66 1
66 |––– 79 1
Total 40
Solução
Para o cálculo da variância amostral, montamos a seguinte tabela:
𝑓i xi xi 𝑓i x2i 𝑓i
1 |––– 14 12 6,5 78 507
14 |––– 27 11 20,5 225,5 4.622,75
27 |––– 40 12 33,5 402 13.467
49Estatística E PEsquisa OPEraciOnal
40 |––– 53 3 46,5 139,5 6.486,75
53 |––– 66 1 59,5 59,5 3.540,25
66 |––– 79 1 72,5 72,5 5.256,25
Total ∑ 𝑓i = 40 - ∑ xi 𝑓i = 977 ∑ x2i 𝑓i = 33.880
Assim, a variância amostral é . Logo, a variância é
250,42 reais2.
desvio-padrão
Vimos que a variância é calculada a partir dos quadrados dos desvios em relação à
média e que ela é um número cuja unidade está ao quadrado em relação à variável
estudada, o que sob o aspecto prático é inconveniente. O desvio-padrão é definido
como a raiz quadrada da variância, o que do ponto de vista prático é mais convenien-
te, pois assim a medida de dispersão tem a mesma unidade da média.
desviO-padrãO pOpulaciOnal desviO-padrãO amOstral
O desvio-padrão apresenta as seguintes propriedades, dentre elas:
I. Adicionando (ou subtraindo) uma constante k de todos os valores da variável
em estudo, o desvio-padrão não se altera.
50 Estatística E PEsquisa OPEraciOnal
II. Multiplicando todos os valores da variável em estudo por uma constante k, tal
que , o desvio-padrão fica multiplicado por essa constante.
Exemplo20
No exemplo 17 verificamos que a variância foi . Assim, o desvio-padrão
é moradores. Já no exemplo 18 mostramos que a variância foi
, e, daí, o desvio-padrão é igual a acidentes. Final-
mente, no exemplo 19, verificamos que a variância foi e, daí, o desvio-pa-
drão é igual a reais.
Coeficiente de variação
O coeficiente de variação (CV) é uma medida de dispersão relativa, o qual é definido
como sendo a razão entre o desvio-padrão e a média aritmética. O coeficiente de va-
riação é empregado na comparação do grau de concentração em torno da média para
duas ou mais séries estatísticas distintas. Dizemos que uma série é mais homogênea
que outra, quando apresentar menor coeficiente de variação.
Exemplo 21
Uma administradora de imóveis realizou um estudo sobre todos os imóveis alugados
em duas regiões, A e B, levantando o seguinte quadro:
regiãO valOr médiO dO aluguel desviO-padrãO
A R$ 500,00 R$ 100,00
B R$ 500,00 R$ 150,00
Qual das regiões apresenta mais homogeneidade nos dados?
51ESTATÍSTICA E PESQUISA OPERACIONAL
Solução
Vamos calcular o coefi ciente de variação das regiões A e B.
Como o coefi ciente de variação da região A é menor que o da região B, segue que os
preços dos aluguéis na região A são mais homogêneos que os preços dos aluguéis
na região B.
pré-requisitOs para a cOmpreensãO da unidade
Nessa primeira unidade foi abordada a estatística descritiva, que é aquela que tem por
fi nalidade descrever e sumarizar um conjunto de dados relativos a uma população ou
a uma amostra.
Iniciamos a unidade com a apresentação de dados coletados em tabelas e gráfi cos e,
em seguida, passamos a construir tabelas de distribuição de frequência, com objetivo
de tabular os dados coletados.
Em um segundo momento dessa unidade, aprendemos as medidas de posição –
média, moda, mediana. Essas medidas de posição são importantes, pois descrevem
a posição do conjunto de dados e ainda, possibilitam determinar se um valor está
entre o maior e o menor valor de uma série estatística, ou ainda, se está localizado
no centro do conjunto.
Finalizamos a unidade com as medidas de dispersão (ou variabilidade), onde es-
tudados: amplitude, variância, desvio-padrão, coefi ciente de variação. As medidas
52 ESTATÍSTICA E PESQUISA OPERACIONAL
de dispersão foram importantes no nosso estudo, pois serviram para avaliar o
quanto os dados estavam semelhantes ou o quanto os dados estavam distantes
do valor central.
É muito importante o domínio dessa unidade para seguirmos com nossos estudos.
saiba mais
Muitas análises estatísticas devem considerar características de populações que mu-
dam ao longo do tempo. Eis algumas observações sobre a vida nos Estados Unidos
há 100 anos:
• 8% das casas tinham telefone.
• 14% das casas tinham banheira.
• A expectativa de vida era de 47 anos.
• O salário-hora médio era de 22 centavos.
• Houve aproximadamente 230 assassinatos em todo país.
Essas observações de 100 anos atrás estão em gritantes contrastes com os Estados
Unidos de hoje. A pergunta é: qual a importância, nas análises estatísticas, da atuali-
zação das características estudadas em uma população?
53ESTATÍSTICA E PESQUISA OPERACIONAL
livrOs recOmendadOs
O livro “The Numbers Behind Numb3rs – Solving Crime with Ma-
thematics”, dos autores Kevin Devlin e Gary Lorden, descreve
de uma maneira não técnica algumas das principais técnicas
matemáticas atualmente disponível para a polícia, CIA e FBI. A
maioria das técnicas descritas neste livro foi mencionada no se-
riado Numb3rs e descreve como elas podem ser utilizadas para
fi ns jurídicos.
atividades para cOmpreensãO dO cOnteúdO
1) (CESGRANRIO) Em uma faculdade, uma amostra de 120 alunos foi coletada,
tendo-se verifi cado a idade e o sexo desses alunos. Na amostra, apurou-se que
45 estão na faixa de 16 a 20 anos, 60, na faixa de 21 a 25 anos, e 15 na faixa de
26 a 30 anos. Os resultados obtidos encontram-se na Tabela abaixo.
idade
(em anOs)
númerO de alunOs
sexo feminino sexo masculino
n % n %
16 – 20 ? P 10 20
21 – 25 Q 40 ? R
26 – 30 S ? ? 16
Total 70 100 50 100
Quais são, respectivamente, os valores indicados pelas letras P, Q, R e S?
54 Estatística E PEsquisa OPEraciOnal
a) 40 ; 28 ; 64 e 0.
b) 50 ; 28 ; 64 e 7.
c) 50 ; 40 ; 53,3 e 7.
d) 77,8 ; 28 ; 53,3 e 7.
e) 77,8 ; 40 ; 64 e 0.
2) (CESGRANRIO) Mariana fez sete ligações de seu aparelho celular. Os tempos,
em minutos, de cada ligação, estão relacionados a seguir:
30; 15; 7; 20; 35; 25; 15
Sejam a, b e c, respectivamente, os tempos médio, modal e mediano do rol de
tempos apresentado. É correto afirmar que:
a) a < b < c.
b) a < c < b.
c) b < a < c.
d) b < c < a.
e) c < a < b.
3) (CESGRANRIO) O Departamento de Recursos Humanos de uma empresa reali-
zou um levantamento dos salários dos 120 funcionários do setor administrativo e
obteve o seguinte resultado:
faixa salarial
(em salários mínimos)
frequência
relativa
de 0 a 2 25%
de 2 a 4 40%
de 4 a 6 20%
de 6 a 10 15%
55Estatística E PEsquisa OPEraciOnal
Não existem observações coincidentes com os extremos das classes. A média, a me-
diana e o desvio-padrão dos salários, em salários mínimos, são, aproximadamente:
média mediana desviO-padrãO
a) 3,65 3,00 1,50
b) 4,25 3,00 1,50
c) 4,25 3,25 2,26
d) 3,65 3,00 2,26
e) 3,65 3,25 2,26
4) (FCC) A tabela abaixo corresponde à distribuição dos salários dos 40 empregados
em uma empresa no mês de dezembro de 2013.
saláriOs (r$) 3.000 4.000 6.000 8.000 10.000 Total
númerO de empregadOs 5 15 8 10 2 49
Com relação às medidas de posição e de dispersão desta distribuição:
a) O valor da mediana é superior ao valor da média aritmética e também ao valor
da moda dos respectivos salários dos empregados.
b) O valor da mediana dos salários dos empregados supera o valor da respectiva
moda em R$ 2.000.
c) Concedendo um reajuste de 8% para todos os empregados, o novo desvio-pa-
drão correspondente fica multiplicado por 1,1664.
d) Concedendo um abono fixo de R$ 200 para todos os empregados, a nova va-
riância correspondente fica aumentada de 40.000 (R$)2.
56 ESTATÍSTICA E PESQUISA OPERACIONAL
e) Concedendo um reajuste de 10% para todos os empregados, o novo coefi cien-
te de variação correspondente não se altera.
5) (CESGRANRIO) A média das alturas de 100 pessoas é 175 cm, e o coefi ciente de
variação é 4%. A variância das alturas das pessoas desse grupo, em cm2, é:
a) 2,25.
b) 5,06.
c) 7,0.
d) 43,75.
e) 49,0.
artigOs, sites e LINKS
DOCUMENTÁRiO
O Que é Estatística
O vídeo disponibilizado no YOUTUBE nos apresenta o
conceito de estatística e suas aplicações em diversas
áreas do saber. Ao assistir este vídeo você fi cará fas-
cinado sobre as diversas aplicações da estatística e o
quanto esta disciplina é importando para a humanidade
nos dias atuais.
Disponível em: <https://www.youtube.com/watch?v=-Wm9cxiXUe0>.
57ESTATÍSTICA E PESQUISA OPERACIONAL
O Prazer da Estatística
O documentário “O Prazer da Estatística – The Joy of
Statistics” - leva os espectadores a uma viagem por meio
do maravilhoso mundo da estatística para explorar o no-
tável poder que tem de mudar a nossa compreensão do
mundo. Este documentário é apresentado pelo Professor Hans Rosling, cuja visão
aberta, de expansão da mente e engraçadas palestras on-line têm feito dele uma lenda
internacional da internet. Rosling é um homem que se deleita no glorioso mundo das
estatísticas, e aqui ele explora sua história, como elas funcionam matematicamente e
como elas podem ser usadas atualmente no computador para ver o mundo como ele
realmente é, e não apenas como o imaginamos ser.
Disponívelem: <https://www.youtube.com/watch?v=xLr68J2yDJ8>.
prOpOsta para discussãO ON-LINE
O método científi co, quando aplicado para a solução de um problema científi co, fre-
quentemente gera dado (ou resultados) em grande quantidade e de grande complexi-
dade. Desse modo, a análise da massa de dados individuais na maioria das vezes não
revela a informação subjacente, gerando a necessidade de algum tipo de condensação
ou resumo dos dados. A Estatística Descritiva é a parte da estatística que desenvolve e
disponibiliza métodos para resumo e apresentação dos dados estatísticos por meio de
medidas descritivas, tabelas, gráfi cos, diagramas ou distribuições de frequência, com
o objetivo de facilitar a compreensão e a utilização da informação ali contida.
O resumo da informação contida nos dados é na maioria das vezes feito por resumos
numéricos dos valores de uma ou mais variáveis, denominadas medidas descritivas.
As medidas descritivas são: medidas de posição, medidas de variação, medidas do
formato e medidas de separação.
58 Estatística E PEsquisa OPEraciOnal
O Administrador interage com profissionais de diversas áreas e pode usar ferramen-
tas que dão suporte à tomada de decisão na presença de incerteza. No entanto, a
incerteza leva à má utilização dessas ferramentas, ocasionando interpretações distor-
cidas da realidade. Considere a charge a seguir:
Fonte: <www.flickr.com>. Acesso em: 01 jul. 2015
1) Agora, responda:
a) Do ponto de vista técnico, qual(is) crítica(s) você deve fazer ao analisar a situ-
ação apresentada na charge acima? Explique apresentando argumentos que
sustente sua resposta.
b) Do ponto de vista ético, qual(is) crítica(s) você deve fazer ao analisar a situ-
ação apresentada na charge acima? Explique apresentando argumentos que
sustente sua resposta.
Unidade ii - introdUção à
probabilidade
ObjetivOs a serem alcançadOs nesta unidade
Prezado(a) Acadêmico(a), ao terminar os estudos dessa unidade, você deverá ser
capaz de:
• Compreender o conceito dos fenômenos probabilísticos e a probabilidade.
• Usar a teoria de probabilidade para realizar previsões.
• Aplicar as distribuições normal e binomial para resolver problemas do cotidiano.
60 Estatística E PEsquisa OPEraciOnal
cOnsiderações iniciais sObre prObabilidade
A teoria das probabilidades nos permite construir modelos matemáticos que explicam
um grande número de fenômenos coletivos ou individuais e fornecem informações
para tomada de decisões.
Para melhor entender essa unidade, vamos relembrar alguns conceitos básicos:
A. Experimento - é qualquer processo que permite um pesquisador fazer obser-
vação. Exemplos: o preço das ações em uma bolsa de valores, o número de
funcionários de uma empresa, o preço das taxas de juro no cheque especial,
lançamento de um dado etc.
B. Experimento Aleatório - são fenômenos que, mesmo quando repetidos vá-
rias vezes, sob condições semelhantes, apresentam resultados imprevisíveis.
O resultado final sempre depende do acaso.
C. Evento - é qualquer conjunto de resultados de um experimento. O evento pode
ser simples ou composto. Um evento simples é aquele em que um resultado
não pode ser decomposto em componentes mais simples. Já o evento compos-
to, é aquele que pode ser decomposto em dois ou mais eventos simples. Um
evento estatístico é um conjunto, para o qual definimos as seguintes operações:
I. ;
II. ;
III. ;
IV. .
D. Espaço amostral - consiste de todos os eventos simples possíveis de um
experimento, ou seja, o espaço amostral consiste em todos os resultados
de um experimento que não pode mais ser decomposto. Exemplo: no lança-
mento de um dado, o espaço amostral é formado por seis eventos, a saber,
S = {1, 2, 3, 4, 5, 6}.
61Estatística E PEsquisa OPEraciOnal
Se considerarmos S como espaço amostral e E como evento: assim, qualquer que
seja E, se E S (E está contido em S), então E é um evento de S. Daí,
• Se E = S, E é chamado de evento certo;
• Se E ⊂ S e E é um conjunto unitário, E é chamado de evento elementar;
• Se E = Ø, E é chamado de evento impossível.
Chamamos de probabilidade de um evento E (E ⊂ S) o número real P(E) tal que:
Em que é o número de elementos do evento E e é o número de elementos
do espaço amostral.
Exemplo 1
No lançamento de um dado qual a probabilidade de obter um número par?
Solução
Para a situação do lançamento de dado temos que o espaço amostral é
S = { 1,2,3,4,5,6 }, o qual possui 6 elementos. O evento, que é a ocorrência de núme-
ro par é o conjunto E = { 2,4,6 } que possui 3 elementos. Assim,
62 Estatística E PEsquisa OPEraciOnal
Exemplo 2
(CESGRANRIO) Em uma caixa são colocados vários cartões, alguns amarelos, al-
guns verdes e os restantes pretos. Sabe-se que 50% dos cartões são pretos, e que,
para cada três cartões verdes, há cinco cartões pretos. Retirando-se ao acaso um
desses cartões, a probabilidade de que este seja amarelo é de:
A. 10%
B. 15%
C. 20%
D. 25%
E. 40%
Solução
Digamos que sejam colocados 100 cartões na caixa, logo pretos, que 50% do total, ou
50 cartões, são pretos. Como a relação de pretos e verdes é para cada 3 verdes há
5 pretos, então 50 pretos corresponderão a 30 verdes e, por conseguinte, amarelos
serão 20. Daí,
Exemplo 3
(CESGRANRIO) Dois dados comuns, honestos, foram lançados simultaneamente.
Sabe-se que a diferença entre o maior resultado e o menor é igual a um. Qual é a
probabilidade de que a soma dos resultados seja igual a sete?
A. 1/3
B. 1/4
63Estatística E PEsquisa OPEraciOnal
C. 1/5
D. 1/6
E. 1/7
Solução
No lançamento de dados os possíveis resultados obtidos são {(1,1), (1,2), (1,3), (1,4),
(1,5), (1,6), (2,1), (2,2), (2,3), (2,4), (2,5), (2,6), (3,1), (3,2), (3,3), (3,4), (3,5), (3,6),
(4,1), (4,2), (4,3), (4,4), (4,5), (4,6), (5,1), (5,2), (5,3), (5,4), (5,5), (5,6), (6,1), (6,2),
(6,3), (6,4), (6,5), (6,6)}. Vamos assinalar os resultados cuja diferença seja um. Assim,
teremos 5 resultados favoráveis a diferença um. Daí, a probabilidade de que a soma
dos resultados seja igual a sete é:
Exemplo 4
(CESGRANRIO) Foi observado que uma loja de departamentos recebe, por hora,
cerca de 250 clientes. Destes,
I. 120 se dirigem ao setor de vestuário;
II. 90 ao setor de cosméticos;
III. 80 ao setor cinevídeo;
IV. 50 se dirigem aos setores de vestuário e de cosméticos;
V. 30 aos setores de cosméticos e de cinevídeo; e
VI. 30 aos setores de vestuário e cinevídeo.
Observou-se, ainda, que 50 clientes se dirigem a outros setores que não vestuário
ou cosméticos ou cinevídeo. Observou-se, ainda, que 50 clientes se dirigem a outros
64 Estatística E PEsquisa OPEraciOnal
setores que não vestuário ou cosméticos ou cinevídeo. Qual a probabilidade de um
cliente entrar nessa loja de departamentos e se dirigir aos setores de vestuário, cos-
méticos e cinevídeo?
A. 0,08.
B. 0,20.
C. 0,36.
D. 0,48.
E. 0,80.
Solução
Primeiramente montamos o Diagrama de Venn, como ilustrado abaixo. Assim e, em
seguida, determinamos o valor de x.
Vestuário
80 – (30 – X) – (30 – X) – X
90 – (50 – X) – (30 – X) – X
120 – (50 – X) – (30 – X) – X
30 – X
30 – X50 – X
X
cineVídeo
cosméticos50 ToTal = 250
65Estatística E PEsquisa OPEraciOnal
Daí,
Assim, o diagrama de Venn fica como mostrado abaixo:
Vestuário
40
30
60 10
1030
20
cineVídeo
cosméticos50 ToTal = 250
Se P(A) é a probabilidade de um cliente entrar nessa loja de departamentos e se dirigir
aos setores de vestuário, cosméticos e cinevídeo, então segue que
66 Estatística E PEsquisa OPEraciOnal
prObabilidade para eventOs
independentes e mutuamente exclusivOs
Vejamos agora, como proceder aocálculo da probabilidade para o caso em que
os eventos são independentes. Dizemos que dois eventos são independentes
quando a realização (ou não realização) de um dos eventos não afeta a probabi-
lidade da realização do outro e vice-versa. Por exemplo, quando lançamos dois
dados não viciados, o resultado obtido por um independe do resultado obtido no
outro. No caso de eventos independentes, a probabilidade de que eles se rea-
lizem simultaneamente é igual ao produto das probabilidades de realização de
cada evento.
Exemplo 5
Dois dados comuns, honestos, foram lançados simultaneamente. Qual a probabili-
dade de se obter o número 2 no primeiro dado e o número 5 no segundo dado?
Solução
Note que se trata de eventos independentes. Assim, a probabilidade de
obtermos o número 2 na primeira jogada é e a probabilidade de
se obter o número 5 no segundo dado é igual a . Logo, a probabi-
l idade de obtermos, simultaneamente, 2 na primeira jogada e 5 na segunda
jogada é: .
67Estatística E PEsquisa OPEraciOnal
Exemplo 6
(UFF - RJ) Em um jogo de bingo são sorteadas, sem reposição, bolas numera-
das de 1 a 75 e um participante concorre com a cartela reproduzida abaixo. Qual
é a probabilidade de que os três primeiros números sorteados estejam nessa
cartela?
b i n g O
5 18 33 48 64
12 21 31 51 68
14 30 60 71
13 16 44 46 61
11 27 41 49 73
Solução
Observe que se trata de eventos independentes. Assim,
ou 3%.
68 Estatística E PEsquisa OPEraciOnal
Exemplo 7
(UNIRIO) Leia a tirinha abaixo:
Fonte: <http://meninomaluquinho.educacional.com.br/PaginaTirinha/>.
Lúcio está certo: desde o dia 07/07/2007, existem dois grupos de 7 Maravilhas do
Mundo: as 7 do Mundo Antigo e as 7 do Mundo Moderno e nenhuma pertence a am-
bos os conjuntos. Suponha que se escolham, aleatoriamente, duas entre essas 14
Maravilhas. Determine a probabilidade de ambas estarem em um mesmo grupo.
Solução
Como são eventos independentes, para que as Maravilhas sorteadas estejam em um
dos grupos, teremos a probabilidade igual a para cada um dos
grupos. Porém, como são dois grupos, a resposta será .
Exemplo 8
De dois baralhos de 52 cartas retiram-se, simultaneamente, uma carta do primeiro
baralho e uma carta do segundo. Qual a probabilidade da carta do primeiro baralho
ser um rei e a do segundo ser o 5 de paus?
69Estatística E PEsquisa OPEraciOnal
Solução
Como esses dois acontecimentos são independentes e simultâneos, vem que a proba-
bilidade de obtermos um rei do primeiro baralho é e a probabilidade de se
obter o 5 de paus no segundo baralho é igual a . Logo, a probabilidade de
obtermos um rei do primeiro baralho e um 5 de paus do baralho é: .
Vejamos agora, como proceder ao cálculo da probabilidade para o caso em que os
eventos são mutuamente exclusivos. Dizemos que dois eventos são independen-
tes quando a realização (ou não realização) de um dos eventos excluiu a realização
do outro e vice-versa. Por exemplo, quando lançamos uma moeda, o evento tirar a
cara exclui o evento tirar coroa. No caso de eventos mutuamente exclusivos, a proba-
bilidade de que um ou outro evento se realize é igual à soma das probabilidades de
realização de cada evento.
Exemplo 9
Em um lançamento de um dado não viciado, qual a probabilidade de se obter um nú-
mero não inferior a 5?
Solução
A probabilidade de se obter um número não inferior a 5 é a probabilidade de se obter
5 ou 6. A probabilidade de se obter 5 é e a probabilidade de se obter 6 é
. Assim, a probabilidade de se obter 5 ou 6 é .
70 Estatística E PEsquisa OPEraciOnal
distribuiçãO de prObabilidade
Uma variável aleatória (normalmente representada por X) é uma variável que assume
único valor numérico, determinando pelo acaso, para cada resultado de um experi-
mento, ou seja, é aquela cujos valores são determinados por processos acidentais, ao
acaso, que não estão sob o controle do observador.
Vamos considerar o caso do lançamento simultâneo de duas moedas não viciadas.
Para cada uma podemos obter CARA ou COROA. Assim, o espaço amostral é S =
{(Ca, Ca), (Ca, Co), (Co, Ca), (Co, Co)}. Digamos que X represente o número de co-
roas que aparecem no espaço amostral. Assim, escrevemos a Tabela 5.
Tabela 5: Número de “coroas” que aparece no espaço amostral do
lançamento simultâneo de duas moedas não viciadas
pOntO amOstral x
(Ca, Ca) 0
(Ca, Co) 1
(Co, Ca) 1
(Co, Co) 2
Uma distribuição de probabilidade é uma descrição que dá a probabilidade para cada
valor da variável aleatória. Ela é frequentemente expressa na forma de um gráfico ou
de uma tabela ou de uma equação.
Assim, podemos reescrever a Tabela 5 acrescentando a cada valor que aparece CO-
ROA a um valor de probabilidade. Assim,
71Estatística E PEsquisa OPEraciOnal
Tabela 5 - Distribuição de probabilidade
pOntO
amOstral
x p(x)
(Ca, Ca) 0 0
(Ca, Co) 1 ¼
(Co, Ca) 1 ¼
(Co, Co) 2 ½
-
Ao definir a distribuição de probabilidade, estabelecemos uma correspondência uní-
voca entre os valores da variável aleatória X e os valores da variável P(X) e essa
correspondência define uma função, em que os valores possíveis para a variável
aleatória definem o domínio da função e os valores de P(x) a imagem. Essa função
é denominada função probabilidade da variável aleatória X e é representada por:
distribuição binomial
A distribuição de probabilidade binomial nos permite lidar com circunstâncias nas
quais os resultados pertencem a duas categorias: favorável/desfavorável, certo/erra-
do, aceitável/defeituoso, sucesso/fracasso, sobreviveu/morreu etc. Dizemos que uma
distribuição de probabilidade binomial resulta de um experimento que satisfaz as se-
guintes condições:
I. os experimentos têm um número fixo de tentativas;
II. as tentativas devem ser independentes;
72 Estatística E PEsquisa OPEraciOnal
III. cada tentativa deve ter todos os resultados classificados em duas categorias
(em geral, chamadas de sucesso ou fracasso);
IV. no transcorrer do experimento, a probabilidade p do sucesso e a probabilida-
de do insucesso q manter-se-ão constantes.
Em uma distribuição de probabilidade binomial, a probabilidade pode ser calculada
usando a equação da probabilidade binomial:
Para x = 0, 1, 2, 3, ..., n. Na equação acima, n é o número de tentativas; x é o número
de sucessos entre n tentativas; p a probabilidade de sucesso em qualquer tentativa; q
é a probabilidade de fracasso em qualquer tentativa (q = 1 – p).
Exemplo 10
Uma moeda não viciada é lançada 10 vezes seguida e independente. Determine a
probabilidade de serem obtidas 6 coroas nessas 10 provas.
Solução
Temos que n = 10, x = 6, p = 0,5 (pois a probabilidade de COROA ocorrer é ½) e q =
0,5 (pois a probabilidade de CARA ocorrer é ½). Pela lei binomial, escrevemos:
73Estatística E PEsquisa OPEraciOnal
Exemplo 11
Um teste é composto de sete questões do tipo classificar a sentença como verdadeira
ou falsa. Determine a probabilidade de um candidato que responda todas ao acaso
acertar pelo menos cinco questões.
Solução
Devemos calcular a probabilidade de se acertar 5, 6 ou 7 questões. A probabilidade
de acertar é p = 0,5 e a probabilidade de errar é 0,5. Temos ainda que n = 7 e x = 5.
Assim,
Daí, .
distribuição normal
Se uma variável aleatória contínua apresenta distribuição com gráfico simétrico e em
forma de sino, como mostra a Figura 4 e que pode ser descrito pela equação:
74 Estatística E PEsquisa OPEraciOnal
Dizemos que ela tem distribuição normal.
f(x)
x
σ
µ
Figura 4 - Distribuição normal
propriedades da distribuição normal
I. A variável aleatória X pode assumir todo e qualquer valor real.
II. A representação gráficada distribuição normal é uma curva em forma de sino, si-
métrica em torno da média, que recebe o nome de curva normal ou de Gauss.
III. A área total limitada pela curva e pelo eixo das abscissas é igual a 1, já que
essa área corresponde à probabilidade de a variável aleatória X assumir qual-
quer valor real.
IV. A curva normal é assintótica em relação ao eixo das abscissas, isto é, aproxi-
ma-se indefinidamente do eixo das abscissas sem, contudo, alcançá-lo.
V. Como a curva é simétrica em torno da média, a probabilidade de ocorrer valor
maior que a média é igual à probabilidade de ocorrer valor menor do que a
média, isto é, ambas as probabilidades são iguais a 0,5 ou 50%. Cada metade
da curva representa 50% de probabilidade.
A distribuição normal padrão é uma distribuição de probabilidade normal com média
e desvio-padrão e área sob a curva de densidade igual a 1, como apre-
sentado na Figura 5.
75Estatística E PEsquisa OPEraciOnal
f(x)
x
σ
µ
µ = 0
σ = 1
-3 3-2 2-1 1
Figura 5 - Distribuição normal padrão
Quando temos em mãos uma variável aleatória com distribuição normal, nosso princi-
pal interesse é obter a probabilidade de essa variável aleatória assumir um valor em
um determinado intervalo. Vejamos como proceder, por meio de um exemplo.
Exemplo 12
A concentração de um poluente em água liberada por uma fábrica tem distribuição
normal com média 8 ppm e desvio-padrão 1,25 ppm. Qual a probabilidade, de que em
um dado dia, a concentração do poluente esteja entre 8 e 10 ppm?
Solução
É fácil notar que essa probabilidade, indicada por, P(8 < X < 10), corresponde à área
hachurada na figura abaixo:
8
X
10
76 Estatística E PEsquisa OPEraciOnal
Para o cálculo da probabilidade, primeiro vamos calcular o parâmetro Z. Assim, vamos
assumir que Z tem a distribuição normal reduzida, com média 0 e desvio-padrão 1, ou
seja, P(8 < X < 10) = P(0 < X < 2). Temos que Z é definido como:
Assim,
Agora procuramos Z na Tabela normal reduzida, como ilustrado abaixo.
z 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549
0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852
0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133
0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
77Estatística E PEsquisa OPEraciOnal
Assim, P(8 < X < 10) = P(0 < X < 2) = 0,4452. Logo, a probabilidade de que em um
dado dia, a concentração do poluente esteja entre 8 e 10 ppm é de 0,4452 ou 44,52%.
Exemplo 13
A concentração de um poluente em água liberada por uma fábrica tem distribuição
normal com média 8 ppm e desvio-padrão 1,25 ppm. Qual a probabilidade, de que
em um dado dia, a concentração do poluente exceda o limite regulatório de 10 ppm?
Solução
É fácil notar que essa probabilidade, indicada por, P(X > 10), corresponde à área ha-
churada na figura abaixo:
8
X
10
Ou seja, P(X > 10) = P(X > 8) – P(8 <X<10) = 0,5 – 0,4452 = 0,0548.
Logo, a probabilidade de que em um dado dia, a concentração do poluente esteja
acima de 10 ppm é de 0,0548 ou 5,48%.
78 ESTATÍSTICA E PESQUISA OPERACIONAL
pré-requisitOs para a cOmpreensãO da unidade
Nessa segunda unidade foi abordada introdução à teoria da probabilidade, bem como
as duas principais distribuições de probabilidade: a distribuição normal e a binomial.
Iniciamos a unidade com a apresentação de eventos e espaço amostral. Em segui-
da, procedemos ao estudo do cálculo de probabilidade e, também, procedemos ao
estudo do cálculo da probabilidade para eventos mutuamente exclusivos e eventos
independentes.
Finalizamos a unidade com o cálculo da probabilidade para dados que seguem distri-
buição normal e distribuição binomial.
É muito importante o domínio dessa unidade para seguirmos com nossos estudos.
saiba mais
Probabilidades que desafi am a intuição
Em certos casos, nossas estimativas subjetivas de valores de probabilidades diferem
drasticamente das probabilidades efetivas. Eis um exemplo clássico: se você respira
profundamente, há mais de 99% de chance de inalar uma molécula que tenha sido
exalada no último suspiro de Júlio César. A pergunta é: será possível estimar essa
probabilidade?
79ESTATÍSTICA E PESQUISA OPERACIONAL
livrOs recOmendadOs
O escritor inglês, Aldous Huxley, afi rmou: “A normalidade é tão
somente uma questão de estatística”. A sua obra, “Admirável
Mundo Novo”, narra um hipotético futuro onde as pessoas são
pré-condicionadas biologicamente e condicionadas psicologica-
mente a viverem em harmonia com as leis e regras sociais de
uma sociedade organizada em castas. A sociedade abordada
nesse “futuro” criado por Aldous Huxley não possui ética religio-
sa e valores morais que regem a sociedade contemporânea. Qualquer dúvida e inse-
gurança dos cidadãos são eliminadas com o consumo de droga sem efeitos colateral
aparente, a qual é denominado “soma”. O conceito de família não existe.
atividades para cOmpreensãO dO cOnteúdO
1) (FCC) Suponha que certa Agência do Banco do Brasil tenha 25 funcionários, cujas
idades, em anos, são as seguintes:
24 − 24 − 24 − 25 − 25 − 30 − 32 − 32 – 32 – 35 − 36 − 36 − 40 − 40 − 40 − 40 46
– 48 – 48 – 50 − 54 − 54 − 60 − 60 − 65
A probabilidade de que, ao escolher-se aleatoriamente um desses funcionários, a
sua idade seja superior a 48 anos é de:
a) 28%.
b) 27,4%.
c) 27%.
d) 25,8%.
e) 24%.
80 Estatística E PEsquisa OPEraciOnal
2) (CESGRANRIO) Em certa turma, 40% dos homens e 20% das mulheres falam
inglês fluentemente. 80% das pessoas são homens. A probabilidade de um aluno
fluente na língua inglesa, selecionado ao acaso, ser homem é:
a) 8/9.
b) 1/2.
c) 2/5.
d) 8/25.
e) 4/25.
3) (FGV) Se X tem distribuição normal com média 4 e variância 9, a probabilidade de
X > 6 vale, aproximadamente:
a) 0,25.
b) 0,28.
c) 0,33.
d) 0,37.
e) 0,46.
4) (FGV) Em relação à distribuição normal, assinale a afirmativa incorreta.
a) Função de densidade de probabilidade é simétrica em relação à média.
b) Se X tem distribuição normal com média e variância , então a variável
tem distribuição normal padrão.
c) A probabilidade de que uma variável Z que tenha distribuição normal padrão
seja maior do que 5 é aproximadamente igual a 0.
d) A média de uma variável aleatória que tenha distribuição normal pode ser negativa.
e) O valor da mediana é igual ao valor da média.
81ESTATÍSTICA E PESQUISA OPERACIONAL
5) (CESGRANRIO) Um carta tem de chances de chegar ao destino correto. Se seis
cartassão enviadas de forma independente, a probabilidade de que pelo menos
duas cheguem ao destino correto é:
a)
b)
c)
d)
e)
artigOs, sites e LINKS
A revista SUPERINTERESSANTE publicou, em agosto de 2012,
uma matéria dedicada à sorte. Os autores da reportagem,
Alexandre de Santi e Cristine Kist, afi rmam que “Tudo é uma
questão de probabilidade”. Leia essa reportagem, também
disponível em: <http://super.abril.com.br/cotidiano/sorte-manual-
instrucoes-701027.shtml>.
Consulte no site da Caixa Econômica Federal (disponível em:
<http://www1.caixa.gov.br/loterias/loterias/megasena/probabilidades.asp>) quais são
as probabilidades de você ganhar na Mega Sena, de acordo com o número de núme-
ros que você joga.
82 ESTATÍSTICA E PESQUISA OPERACIONAL
filmes recOmendadOs
Pacto de Sangue (Double Indemnity) é um americano de 1944,
do gênero suspense, dirigido por Billy Wilder, baseado no livro
de James M. Cain. É considerado um dos primeiros e mais bem-
sucedidos fi lm noir.
A história se baseou em um crime real de 1927, em que Ruth
(Brown) Snyder, uma mulher casada do Queens convence seu
amante Judd Gray a matar o marido Albert, após ter comprado
uma apólice de seguro com cláusula de indenização dobrada (double-indemnity clau-
se). Os assassinos foram presos.
Sinopse: Em uma visita de trabalho, o agente de seguros Walter Neff conhece a
atraente (e casada) Phyllis Dietrichson. Eles logo se apaixonam e Phyllis o convence
a elaborar um plano para assassinar seu marido, depois desse fazer um seguro de
acidente pessoal. O objetivo? Ficar com o dinheiro do seguro. Mas nem tudo dá certo,
Barton Keyes calcula algumas probabilidades.
prOpOsta para discussãO ON-LINE
proposta 1 – uma proposta onde os fracos não têm vez
A defi nição histórica da origem do pôquer é considerada difícil de ser precisada. Uma
teoria citada por historiadores do jogo relatam um texto, datado de 1934, de autoria de
Jonathan H. Green, como uma das mais antigas referências escritas sobre o pôquer
já noticiado. Outros historiadores do jogo dizem que sua origem está em uma palavra
francesa, “poque”, que era o nome de um jogo desse país. Independente de sua origem
é considerado como certo de que o jogo foi mudando e evoluindo ao longo do tempo,
83Estatística E PEsquisa OPEraciOnal
passando a incluir 32 cartas e, pouco a pouco, foi chegando à quantidade de cartas do
baralho atual, 52. Ao longo de sua história, o jogo recebeu novas variações, embora os
conceitos básicos de sua estratégia psicológica e a sequência das cartas tenham sido
mantidos presentes ao longo do curso de sua evolução. Atualmente o pôquer é regido
por normas estritas, tanto na internet como em cassinos reais, e seus torneios e diver-
sas competições conferiram-lhe um status de evento esportivo internacional.
A tabela abaixo reúne todas as possibilidades de combinações possíveis no jogo de poker.
jOgada descriçãO cartas
Royal Straight Flush
São 5 cartas seguidas do mes-
mo naipe do 10 até o As.
Straight Flush
São 5 cartas seguidas do
mesmo naipe que não seja do
10 até o As.
Four of a kind
São 4 cartas iguais, caso de
empate ganha o jogador com
a Quadra ou Poker cartas
mais alta.
Full House or Full
Hand
Uma trinca e um par, caso de
empate ganha o jogador com
a trinca mais alta.
Flush
É uma sequência de cinco car-
tas de mesmo naipe.
Straight
São 5 cartas seguidas, sendo
indiferente o naipe, e em caso
de empate ganha aquele com
a maior sequência.
Three of a kind
São 3 cartas iguais, mais duas
cartas diferentes, e em caso de
empate ganha aquele com o
maior trio.
84 Estatística E PEsquisa OPEraciOnal
Two Pairs
São 2 pares de cartas. Nes-
te caso, ganha quem tiver o
par mais alto. Se continuarem
igual, vai-se ao par seguinte.
Ganha quem tiver mais alto.
Mesmo assim se continuarem
empatados, ganha quem tiver
a outra carta mais alta.
One Pair
São 2 cartas iguais e três di-
ferentes. Caso empate ganha
aquele que possuir o maior
par, caso empate ganha aque-
le que possuir a maior carta.
High Card
Ganha quem tiver a carta
mais alta.
O Royal flush é quando se obtém 10, valete, dama, rei e ás de um único naipe. Veja
a figura a seguir:
Figura 5 - Royal flush de copas
85ESTATÍSTICA E PESQUISA OPERACIONAL
Calcular a propabilidade de conseguir um royal fl ush em uma única distribuição de
cartas de um baralho de 52 cartas.
filmes recOmendadOs
Quando terminar essa atividade, sugiro assistir ao fi lme 007 -
Cassino Royale e divirta-se com James Bond jogando pôquer.
proposta 2 – uma proposta com sabor de chocolate
Em grupos de três ou quatro pessoas, use os doces Hershey’s Kisses para estimar a
probabilidade de que, quando caem, eles fi cam com a parte achatada no chão. Quan-
tas tentativas são necessárias para se obter um resultado que pareça razoavelmente
preciso quando arredondado para a primeira casa decimal?
Unidade iii - teoria eleMentar de
aMostrageM e teoria de estiMação
de parâMetros
ObjetivOs a serem alcançadOs nesta unidade
Prezado(a) Acadêmico(a), ao terminar os estudos dessa unidade, você deverá ser
capaz de:
• Diferenciar população de amostra;
• Estudar os tipos de técnicas de amostragem;
• Aplicar a amostragem aleatória simples, sistemática, por estratos e por
conglomerados;
• Usar dados amostrais para efetuar a estimação de um parâmetro populacional.
88 Estatística E PEsquisa OPEraciOnal
teOria elementar de amOstragem
A estatística está interessada nos métodos científicos para coleta, organização, resu-
mo, apresentação e análise dos dados, bem como na tomada de decisões baseadas
em tais análises.
Ao coletar os dados referentes às características de um grupo ou de indivíduos
que possuem ao menos uma característica comum, é muitas vezes ou impossível
ou inviável economicamente ou impraticável, observar todo o grupo, em particular
quando este é muito grande. Assim, ao invés de examinar todo o universo (que
também é denominado população), examina-se uma pequena porção do universo,
denominada amostra.
Para garantir que a amostra represente o universo, ou seja, que a amostra possua
as mesmas características que o universo no que diz respeito à variável estudada, é
necessário que a mesma seja obtida por técnicas adequadas. A seguir, estudaremos
três das principais técnicas de amostragem.
1. Amostragem aleatória simples
Essa técnica de amostragem pode ser realizada numerando os elementos do univer-
so de 1 até n e, em seguida, procede-se um sorteio de k números para representar
a amostra. No caso de a população ser muito grande, o sorteio torna-se inviável e
fazemos o uso da
Tabela de Números Aleatórios (Anexo 2). Vejamos os exemplos 1 e 2.
Exemplo 1
O Banco Felicidade tem 100 funcionários e deseja escolher 15% para realizar exa-
mes de rotina. Assim, para proceder a escolha desses funcionários, primeiramente
89Estatística E PEsquisa OPEraciOnal
numeramos os de 01 a 100 e, em seguida, escrevemos os números de 01 a 100 em
papéis de mesmo tamanho, colocamos dentro de uma caixa, agitamos e retiramos,
um a um, os quinze números que formarão a amostra.
Exemplo 2
Considere agora que o banco Felicidade tenha 10.000 funcionários e que 150 deverão
ser sorteados para realizar exames de rotina. Note que agora, os números de elemen-
tos do universo e da amostra são relativamente grandes. Assim, faz-se necessário
utilizar-se da tabela de número aleatórios. Para obtermos esses 150 elementos da
amostra, sorteamos um algarismo qualquer da tabela, a partir do qual iremos tomar
números dois, três ou mais dígitos, de acordo com a necessidade, percorrendo as
linhas e/ou colunas da tabela de números aleatóriosda esquerda para direita (ou vice-
versa), ou ainda de cima para baixo (ou vice-versa). Os números obtidos irão indicar
os elementos da amostra.
2. Amostragem estratificada
Essa técnica de amostragem é empregada quando tivermos o universo subdividido
em estratos. Assim, para que a amostra represente o universo é interessante que a
mesma leve em consideração cada estrato. Para entender melhor veja o exemplo 3.
Exemplo 3
Considere que, no exemplo 1, dos 100 funcionários, 80 sejam do sexo masculino e
20 do sexo feminino, ou seja, temos dois estratos (sexo masculino e sexo feminino) e
queremos escolher 15% do total de 100.
90 Estatística E PEsquisa OPEraciOnal
Solução
Nesse exemplo queremos respeitar a proporção dos funcionários do sexo masculino
e feminino. Assim, temos:
sexO universO amOstra
Masculino 80
Feminino 20
Total 100
Ou seja, serão sorteados 12 homens e 3 mulheres. A segunda etapa dessa técnica de
amostragem consiste em escolher os 12 homens dentre 80 e as 3 mulheres dentre as
20. Podemos numerar esses funcionários de 1 a 100, sendo que os numerados 1 até
20 correspondem aos funcionários do sexo feminino e dos numerados de 21 até 100
correspondam aos funcionários do sexo masculino e, então, proceder um sorteio ou
usar a tabela de números aleatórios.
3. Amostragem sistemática
Nesta técnica de amostragem os membros do universo que participam da amostra
são determinados a partir de intervalos fixos, e não há a utilização de tabelas de nú-
meros aleatórios.
Exemplo 4
No caso do exemplo 1, do universo dos 100 funcionários do Banco Felicidade, para
obtermos 10 amostras sistemáticas podemos escolher os números 10, 20, 30, e assim
por diante, até completarmos 10 amostras sistematicamente colhidas.
91Estatística E PEsquisa OPEraciOnal
teoria da estimação de parâmetros
Quando estamos interessados em estudar certas características de uma popula-
ção, lançamos mão de uma amostra extraída dessa população e estudamos seus
elementos e procuramos, a partir dessa amostra, estimar o parâmetro populacio-
nal. Lembrando que o parâmetro é uma medida usada para descrever uma ca-
racterística da população e uma estatística é uma combinação dos elementos da
amostra usada para estimar um parâmetro, também chamada de estimador. Aos
valores numéricos assumidos pelos estimadores, denominamos de estimativas,
como mostrado pela Figura 1.
mundo real
(População) Amostra
estimAdores
PARÂMETROS
técnicAs de
AmostrAgem
inFerênciA
(estimação)
µ, σ2
X, s2
Figura 1 - Exemplo de parâmetros e estimadores
O problema da Inferência Estatística é fazermos afirmações sobre parâmetros da po-
pulação por meio da amostra. Suponhamos que tal afirmação deva ser feita sobre
um parâmetro da população (média, variância ou qualquer outra medida). Vamos
supor que escolhemos uma amostra casual simples (Y1, Y2,,...,Yn ), com reposição,
92 Estatística E PEsquisa OPEraciOnal
sorteados na população, com Yi (i=1,...,n), identicamente distribuídos. Faremos nossa
decisão, baseados na estatística T, que será uma função da amostra (Y1, Y2,...,Yn ) e,
portanto, uma variável aleatória. Colhida uma amostra, temos um particular valor de T,
digamos t0, e baseado nesse valor é que a afirmação sobre deve ser feita.
A validade da resposta será mais bem compreendida se soubermos o que acontece
com a estatística T quando retiramos todas as amostras da população, de acordo o
plano amostral adotado, i.e., se soubermos qual a distribuição de probabilidade da
estatística T. Esta distribuição é chamada distribuição amostral da estatística T e de-
sempenha papel fundamental na teoria de Inferência Estatística. Assim, a Distribuição
Amostral é uma distribuição de probabilidade que indica até que ponto uma estatística
amostral tende a variar devido a variações casuais na amostragem aleatória.
Consideremos uma população P com parâmetros e s, como apresentado na Figura 1.
Se tirarmos uma amostra aleatória de tamanho n e calcularmos a sua média temos um
valor . Tirando uma segunda amostra temos uma nova média, , em geral diferente
de , e assim, para cada diferente amostra de tamanho n temos um diferente valor da
média amostral, . Temos, portanto, que a média amostral, é uma variável que muda de
valor, de amostra em amostra. Assim, faz sentido falar da distribuição de médias amos-
trais, uma vez que X é uma variável aleatória e enunciamos os seguintes teoremas.
teorema do limite central
Seja {Xn} uma sucessão de n variáveis aleatórias igualmente distribuídas e indepen-
dentes, com valor médio μ e variância s2 (finita). A variável aleatória tem dis-
tribuição assintoticamente normal, com parâmetros μ e . Ou seja, para um valor de
n suficientemente grande, a distribuição de X é e escreve-se:
93Estatística E PEsquisa OPEraciOnal
estimação por intervalo
A estimação por intervalo consiste em usar a informação amostral com o propósito
de se produzir um intervalo I = (L1, L2) que contenha o valor verdadeiro do parâmetro,
com alguma probabilidade de acerto. Esta probabilidade de acerto, representada por
, é chamada nível de confiança (ou grau de certeza), é pré-estabelecida
pelo pesquisador e significa que, retiradas todas as amostras da população e constru-
ídos todos os intervalos de confiança, podemos dizer que destes intervalos
conterão o parâmetro, ou em outras palavras, cada intervalo tem de proba-
bilidade de conter o parâmetro.
As escolhas mais comuns para o nível de confiança são de 90% (com ), 95%
(com ) e 99% (com ). A escolha de 95% é mais comum, pois resulta
em um bom equilíbrio entre precisão e confiabilidade.
Podemos dizer que para cada intervalo (L1, L2), teremos % de probabilidade de que
o mesmo não contenha o parâmetro. Essa é a probabilidade que temos de errar a
estimativa e é chamada de nível de significância.
A amplitude (tamanho) do intervalo, , nos confere a precisão da estimati-
va. Quanto menor for a amplitude do intervalo melhor (mais precisa) é a estimativa.
Quando o intervalo for centrado no valor amostral, , a metade da amplitude, ,
é chamada de margem de erro ou erro máximo da estimativa e depende do nível de
confiança e do tamanho n da amostra.
É fácil perceber que quanto maior o nível de confiança, maior será a amplitude do
intervalo. Sendo conveniente, o nível de confiança pode ser aumentado até próximo
de 100%, mas isso resultará em intervalos de amplitude cada vez maiores, o que sig-
nifica perda de precisão na estimativa. Para amostras de tamanho n fixo, precisão e
estimativa variam em sentidos opostos. Do exposto acima, vemos que para encontrar
94 Estatística E PEsquisa OPEraciOnal
um intervalo de confiança para um determinado parâmetro , devemos obter um in-
tervalo [a, b] tal que:
Estimação por intervalos de confiança da média
Nessa seção estão apresentados métodos para se estimar a média populacional. A
forma geral de uma estimativa intervalar de uma média populacional é dado por:
Para desenvolvermos uma estimativa intervalar de uma média populacional, o desvio
-padrão populacional ( ) ou o desvio-padrão amostral (s) deve ser usado para o cálcu-
lo da margem de erro. Na maioria das aplicações, o desvio-padrão populacional não
é conhecido, e usa-se o desvio-padrão amostral para calcular a margem de erro. Em
algumas aplicações, entretanto, grandes quantidades de dados históricos relevantes
estão disponíveis e podem ser utilizado para calcular o desvio-padrão populacional
antes de se efetuar a amostragem. Assim,
Objetivo
Construir um intervalo de confiança que contenha a média populacional, ou seja, obter
um intervalo do tipo: em que E é a margem de erro.
Requisitos
I. A amostra é aleatória simples;
II.O desvio-padrão populacional é conhecido;
III. A população segue distribuição normal.
95Estatística E PEsquisa OPEraciOnal
Determinação do intervalo de confiança
Ou:
Ou:
Para a determinação do intervalo de confiança para a média populacional, , usare-
mos o seguinte procedimento:
passO 1 Verifique se os requisitos acima citados são satisfeitos.
passO 2 Determine o valor crítico , que corresponde ao nível de confiança desejado.
Usar a tabela em anexo.
passO 3 Calcular a margem de erro:
passO 4 De posse dos valores da margem de erro (E) e da média amostral, , determine
os limitantes do intervalo de confiança: e .
Exemplo 5
A altura de uma amostra de 49 mulheres segue uma distribuição normal de proba-
bilidade, com média 1,60 m e variância 0,0036 m2. Determine o intervalo de con-
fiança que contém a média da população investigada, a amplitude do intervalo de
confiança de 95%.
96 Estatística E PEsquisa OPEraciOnal
Solução
Segue do enunciado que , ou seja, , e ainda a al-
tura dessas mulheres segue distribuição normal (condições do passo 1 são verificadas).
Passo 2: determinar o valor crítico .
Um nível de confiança de 95% corresponde a ou A figura
abaixo mostra que a área em cada cauda cinza é ou seja, toda a área a
esquerda é igual a
z = 0 Z α/2
α/2 α/2
Recorrendo a tabela XX encontramos
Passo 3: cálculo da margem de erro:
Passo 4: determinar os limites do intervalo de confiança.
Portanto, com 95% de confiança, o intervalo de confiança para a média é .
97Estatística E PEsquisa OPEraciOnal
Exemplo 6
Uma amostra aleatória simples de tamanho n = 81 é selecionada de uma população
de envelopes de carta. A largura dos envelopes dessa amostra apresenta média
15 cm e desvio-padrão populacional s = 0,4 cm. Considerando-se que a largura
dos envelopes na população siga distribuição normal com média, determine a am-
plitude do intervalo de confiança de 90% para (em cm).
Solução
Segue do enunciado que , , e ainda a largura dos envelopes
segue distribuição normal (condições do passo 1 são verificadas). Assim,
Passo 2: determinar o valor crítico .
Um nível de confiança de 90% corresponde a ou A figura
abaixo mostra que a área em cada cauda cinza é ou seja, toda a área a
esquerda é igual a
z = 0 Z α/2
α/2 α/2
Recorrendo a tabela XX encontramos (por interpolação).
98 Estatística E PEsquisa OPEraciOnal
Passo 3: cálculo da margem de erro:
Passo 4: determinar os limites do intervalo de confiança.
Portanto, com 90% de confiança, a amplitude do intervalo de confiança para a média
é .
Até o momento, estudamos situações para estimação da média populacional, em que
o desvio-padrão populacional era conhecido. Porém, na maioria das situações reais,
o desvio-padrão populacional é desconhecido. Para essas situações, faremos uso da
distribuição t de Student (em vez da distribuição Normal).
Quando o desvio-padrão da população não é conhecido, mas os requisitos relevantes
são satisfeitos, usaremos a distribuição t de Student. Essa distribuição foi desenvolvi-
da por Willian Gosset, o qual era empregado de uma cervejaria irlandesa e precisava
de uma distribuição que pudesse ser empregada para pequenas amostras. Proibido
de publicar os resultados de suas pesquisas Gosset usou o pseudônimo de Student e
publicou os resultados de sua pesquisa.
Se uma população tem distribuição normal, então a distribuição de:
É uma distribuição t de Student para todas as amostras de tamanho n.
99Estatística E PEsquisa OPEraciOnal
Para casos em que o desvio-padrão da população é desconhecido, temos:
Objetivo
Construir um intervalo de confiança que contenha a média populacional, ou seja, obter
um intervalo do tipo: em que E é a margem de erro.
Requisitos
I. A amostra é aleatória simples;
II. A população segue distribuição normal.
Determinação do intervalo de confiança
Ou:
Ou:
Para a determinação do intervalo de confiança para a média populacional, , usare-
mos o seguinte procedimento:
passO 1 Verifique se os requisitos acima citados são satisfeitos.
passO 2 Usando (n-1) graus de liberdade, recorremos à tabela XX para determinar
100 ESTATÍSTICA E PESQUISA OPERACIONAL
passO 3 Calcular a margem de erro:
passO 4 De posse dos valores da margem de erro (E) e da média amostral, , determine
os limitantes do intervalo de confi ança: e .
Exemplo 7
Em um processo industrial, a variável a ser controlada segue, por hipótese, distribui-
ção normal. Uma amostra, de tamanho 51, apresentou média igual a 80 e desvio-pa-
drão igual a 10. Determine o intervalo de confi ança que contém a média da população
da variável estudada desse processo industrial. Considere a amplitude do intervalo de
confi ança de 95%.
Solução
Segue do enunciado que , , e ainda a variável estudada no proces-
so industrial segue distribuição normal (condições do passo 1 são verifi cadas). Assim,
Passo 2: determinar o valor .
Um nível de confi ança de 95% corresponde a (para duas caudas). O número de
graus de liberdade é . Recorrendo a tabela XX encontramos
Passo 3: cálculo da margem de erro:
101Estatística E PEsquisa OPEraciOnal
Passo 4: determinar os limites do intervalo de confiança.
Portanto, com 95% de confiança, o intervalo de confiança para a média é
.
Propriedades importantes da distribuição t de Student
I. A distribuição t de Student é diferente para tamanhos de amostras diferentes.
II. A distribuição t de Student tem a mesma forma geral simétrica em sino que a
distribuição normal padrão, mas reflete a maior variabilidade que se espera
com pequenas amostras.
III. A distribuição t de Student tem uma média de t = 0.
IV. O desvio-padrão da distribuição t de Student varia com o tamanho amostral,
mas é maior que 1.
V. À medida que o tamanho amostral se torna maior, a distribuição t de Student
se aproxima da distribuição normal padrão.
Estimação por intervalos de confiança da proporção populacional
Nessa seção serão apresentados métodos para determinação de um intervalo de
confiança para estimar uma proporção populacional. Para melhor compreensão
desta seção, considere a seguinte situação hipotética: uma pesquisa de opinião pú-
blica do True Research Center constatou que 80% dos 2.015 adultos selecionados
aleatoriamente na cidade de Waywards Pines acreditavam no aquecimento global.
Assim, a proporção amostral, , igual a 0,80 é a melhor estimativa pontual para a
proporção populacional. Porém, não temos nenhuma indicação de quão boa é essa
estimativa, ou seja, como a estimativa pontual tem a séria falha de não revelar quão
102 Estatística E PEsquisa OPEraciOnal
boa ela é, os estatísticos desenvolveram outro tipo de estimativa denominado inter-
valo de confiança.
Para casos em que uma proporção amostral conhecida, , temos:
Objetivo
Construir um intervalo de confiança para se estimar uma proporção populacional.
Requisitos
I. A amostra é aleatória simples;
II. A população segue distribuição binomial (aquela que há duas categorias
de resultados);
III. As proporções de “sucesso” e “fracasso” são conhecidas.
Determinação do intervalo de confiança
ou
ou
Para a determinação do intervalo de confiança para a média populacional, , usare-
mos o seguinte procedimento:
103Estatística E PEsquisa OPEraciOnal
passO 1 Verifique se os requisitos acima citados são satisfeitos.
passO 2 Use a tabela XX para determinar
passO 3 Calcular a margem de erro:
passO 4
De posse dos valores da margem de erro (E) e da proporção amostral, ,
determine os limitantes do intervalo de confiança: e .
Exemplo 8
Uma pesquisa realizada pelo True Research Center constatou que 80% dos 2.015
adultos selecionados aleatoriamente na cidadede Waywards Pines acreditavam no
aquecimento global. Com base nessas informações, resolva os itens abaixo:
A. Ache o intervalo de confiança de 95% para a proporção populacional p.
B. Supondo que você seja um repórter de um jornal, escreva uma breve afirma-
tiva que descreva com precisão os resultados e que inclua todas as informa-
ções relevantes.
Solução
A. Segue do enunciado que e ainda a variável estudada se-
gue distribuição normal (condições do passo 1 são verificadas). Assim,
Passo 2: determinar o valor crítico .
Um nível de confiança de 95% corresponde a ou ou
seja, toda a área a esquerda é igual a Recorrendo a tabela XX
encontramos
104 Estatística E PEsquisa OPEraciOnal
Passo 3: cálculo da margem de erro:
Passo 4: determinar os limites do intervalo de confiança.
Portanto, com 95% de confiança, o intervalo de confiança para a proporção é
.
B. Eis uma afirmativa que resume os resultados: 80% dos adultos de Waywards
Pines acreditam que a Terra esteja se tornando mais quente. Essa porcenta-
gem se baseia em uma pesquisa de opinião do True Research Center realiza-
da com 2.015 adultos selecionados aleatoriamente. Essa porcentagem, deve
diferir por não mais que 1,75 pontos percentuais para mais ou para menos.
Exemplo 9
Considere uma população em que a proporção de elementos que possuem certa ca-
racterística é p. Deseja-se determinar o tamanho da amostra com erro amostral e
probabilidade para estimar p, usando a aproximação normal.
Se uma amostra piloto de n = 10, extraída dessa população, revelou o valor
, então o tamanho da amostra com erro amostral máximo de 5% e probabilidade de
95,45% é, aproximadamente, de:
105Estatística E PEsquisa OPEraciOnal
A. 227
B. 303
C. 323
D. 336
E. 370
Solução
Um nível de confiança de 95% corresponde a ou
A figura abaixo mostra que a área em cada cauda cinza é ou seja, toda
a área a esquerda é igual a
z = 0 Z α/2
α/2 α/2
Recorrendo a tabela XX encontramos Reescrevendo a equação
para n, temos Assim,
Portanto, alternativa (D).
106 ESTATÍSTICA E PESQUISA OPERACIONAL
atividades para cOmpreensãO dO cOnteúdO
1) (CESGRANRIO) Uma pesquisa por amostragem domiciliar foi realizada em uma
localidade que possui 30 domicílios. A amostra de 5 domicílios foi obtida de acordo
com os seguintes passos:
Passo 1 - organização dos 30 domicílios em uma lista, numerando-os de 1 a 30.
Passo 2 - seleção aleatória de um domicílio, dentre aqueles numerados de 1 a 6
(o domicílio selecionado no passo 2 foi o de número 4).
Passo 3 - inclui-se na amostra os seguintes domicílios (além do 4, selecionado no pas-
so 2): 10, 16, 22 e 28 (ou seja, a partir do domicílio 4, seleciona-se de 6 em 6 domicílios).
A amostragem adotada foi:
a) Aleatória simples.
b) Estratifi cada simples.
c) Sistemática simples.
d) De conglomerados.
e) Em dois estágios.
2) (FGV) A respeito dos principais tipos de amostragem, é correto afi rmar que:
a) A amostragem sistemática possui um viés sistemático devido ao processo
de seleção.
b) Na amostragem aleatória estratifi cada há a possibilidade de que nenhuma uni-
dade de um ou mais estratos sejam selecionadas.
c) Na amostragem de conglomerados em dois estágios não é possível encontrar a
probabilidade de que duas ou mais unidades de segundo estágio seja incluída
na amostra.
107Estatística E PEsquisa OPEraciOnal
d) Na amostragem de conglomerados todos os conglomerados são sempre
selecionados.
e) A amostragem estratificada é geralmente mais eficiente do que a amostragem
aleatória simples de mesmo tamanho.
3) (FGV) Uma amostra aleatória simples X1, X2, ..., X16, de tamanho 16, de uma dis-
tribuição normal foi observada e indicou as seguintes estatísticas:
O intervalo usual de 95% de confiança para a média populacional, com duas casas
decimais, é:
a) (3,58, 5,22).
b) (3,47, 5,33).
c) (3,33, 5,47).
d) (3,19, 5,61).
e) (3,01, 5,81).
4) (CESGRANRIO) Considere uma amostragem aleatória simples, sem reposição,
de uma população de tamanho muito grande. Qual o tamanho aproximado de
amostra que permite estimar a média de uma variável y, cujo desvio-padrão popu-
lacional é igual a 5, com margem de erro 0,1, a um nível de confiança 95%?
a) 100.
b) 400.
c) 1.000.
d) 4.000.
e) 10.000.
108 ESTATÍSTICA E PESQUISA OPERACIONAL
5) (CESGRANRIO) Para avaliar a taxa de desemprego em uma determinada locali-
dade, selecionou-se uma amostra aleatória de 900 indivíduos em idade produtiva.
O resultado dessa amostra revelou que o número de desempregados era de 36%.
O intervalo de 95% de confi ança para a proporção de desempregados, nessa lo-
calidade, é:
a) 36% ± 0,1%.
b) 36% ± 2,6%.
c) 36% ± 3,1%.
d) 36% ± 3,7%.
e) 36% ± 4,1%.
pré-requisitOs para a cOmpreensãO da unidade
Nessa terceira unidade foram abordadas as técnicas de amostragem e a teoria de
estimação de parâmetros. Vimos como proceder nas diversas técnicas de amostra-
gem e, também, aprendemos a estimar parâmetros a partir das amostras coletadas. O
domínio dessa unidade é de suma importância para seguirmos com nossos estudos.
Bons estudos!
artigOs, sites e LINKS
Nessa unidade estudamos a distribuição t (ou t de Student). Mas de onde ela vem?
Saiba que a distribuição t surgiu da necessidade de um mestre cervejeiro, na Irlanda,
para estimar intervalos de confi ança da média com amostras pequenas. O artigo A
century of t-tests de Stephen Senn conta-nos um pouco da história do teste t.
O artigo está disponível em: <http://onlinelibrary.wiley.com/doi/10.1111/j.1740-9713.
2008.00279.x/pdf>.
109ESTATÍSTICA E PESQUISA OPERACIONAL
O autor desse livro quando terminou de escrever este capítulo foi saborear uma gela-
díssima GUINNESS. Fiquei sabendo que se empolgou ao ler a história do teste-t que
tomou logo duas bem geladas. Bring It To Life.
livrOs recOmendadOs
No século 20, diversas disciplinas científi cas passaram em maior
ou menor grau pela revolução probabilística. Em vez de imagi-
nar que os fenômenos estudados seguem leis determinísticas,
as ciências modernas partem da ideia de que estes seguem dis-
tribuições probabilísticas. Há possibilidade de conhecermos o
mundo, mas nunca temos certeza absoluta sobre os resultados
de nossas investigações. Essa passagem de uma visão deter-
minística do mundo, que caracterizou as ciências até o século 19, para uma visão
probabilística, a partir do século 20, foi possível graças aos avanços e revoluções
ocorridos em uma disciplina: a estatística.
No livro “Uma Senhora Toma Chá” de David Salsburg, o autor conta as histórias de
como alguns cientistas criaram e desenvolveram as diversas facetas do conhecimen-
to estatístico. Além de ser interessante para o pesquisador que usa estatística em
seu trabalho, o livro é uma leitura agradável para qualquer pessoa curiosa que esteja
interessada em conhecer melhor a história das ciências modernas.
prOpOsta para discussãO ON-LINE
Digamos que o coordenado do curso de Administração EAD da UNIPAR esteja in-
teressado em avaliar o perfi l dos alunos matriculados no curso. Para coletar essas
110 Estatística E PEsquisa OPEraciOnal
informações, o coordenador planejou um estudo para poder desenvolver o perfil de
seus alunos. Os resultados do estudo serão utilizados para ajudá-lo na melhoria de
oferta de disciplina do curso. Como atividade prática, foi solicitado que você ajudasse
a analisar os resultados do estudo. Algumas das questões do estudo são as seguintes:
1) Qual é sua idade?
2) Gênero: Masculino ou Feminino.
3) Você tem acesso de banda larga à Internet em casa? Sim ou Não.
4) Indique sua renda total no ano passado.
5) Você tem filhos? Sim ou não.
6) Quantastransações de ações/títulos/fundos de investimento você realizou no
ano passado?
7) Essa é sua primeira graduação? Sim ou não.
Unidade iV - testes e pesqUisa
operaCional
ObjetivOs a serem alcançadOs nesta unidade
Prezado(a) Acadêmico(a), ao terminar os estudos dessa unidade, você deverá ser
capaz de:
• Definir a hipótese nula e a hipótese alternativa;
• Aplicar o teste de hipótese para a média e para a proporção;
• Definir pesquisa operacional;
• Aplicar os conceitos básicos de pesquisa operacional em situações-problemas.
112 Estatística E PEsquisa OPEraciOnal
teste de hipóteses
Frequentemente devemos tomar decisões estatísticas sobre populações com base em
informações amostrais. Para tais decisões, formulamos suposições ou “hipóteses” so-
bre a população. O objetivo do “teste de hipótese” é fornecer ferramentas que permi-
tam “validar” ou “rejeitar” uma hipótese utilizando os resultados da amostra. Assim:
• Teste de Hipóteses: é um processo mediante o qual nos é permitido, rejeitar
ou não determinada hipótese sobre um parâmetro desconhecido da popula-
ção em estudo, por meio de informações da amostra desta população.
• Hipótese Estatística: é uma hipótese formulada sobre os parâmetros desco-
nhecidos da população em estudo.
• Para realização de um teste de hipóteses é necessário especificarmos duas
hipóteses, denominadas de hipótese nula (H0) e hipótese alternativa (H1), e
um critério para a rejeição da hipótese nula. Assim:
• Hipótese nula (H0): sugere um valor 0 para o parâmetro populacional , ou
a igualdade de dois parâmetros 1 e 2.
• Hipótese alternativa (H1): sugere a não igualdade (>, < ou ≠) do valor 0 para
o parâmetro populacional , ou a não igualdade de dois parâmetros 1 e 2 (>,
< ou ≠).
Estatisticamente, a forma correta de se formular tais hipóteses, para um parâmetro é:
teste bilateral teste unilateral à direita teste unilateral à esquerda
Nosso problema consiste em rejeitar ou não a hipótese nula com base em uma amos-
tra aleatória, convenientemente selecionada. Como vamos tomar decisões baseadas
113Estatística E PEsquisa OPEraciOnal
em uma amostra, estaremos sujeitos a cometer dois tipos de erros que, comparados
podem ser mais ou menos graves. Assim:
• Erro tipo I: ocorre se a hipótese nula é rejeitada quando é verdadeira. A probabilida-
de deste tipo de erro é denotada por: = P(erro tipo I) = P(rejeitar H0/H0 é verdadeira).
• Erro tipo II: ocorre se a hipótese nula não é rejeitada quando é falsa. A probabilida-
de deste tipo de erro é denotada por: = P(erro tipo II) = P(não rejeitar H0/H0 é falsa).
A probabilidade de se cometer o erro tipo I, ou seja, de rejeitar a hipótese H0 quando
ela é verdadeira é denominado de nível de significância a do teste. Geralmente,
adota-se o nível de 5%, isto é, =0,05, porém, dependendo das exigências do pes-
quisador, pode-se adotar 1% ou 10% ou outros valores.
A construção de um teste de hipóteses se faz, em geral, na seguinte sequência:
• Etapa 1: Formulação das hipóteses.
• Etapa 2: Escolha da Estatística do teste.
• Etapa 3: Fixando o nível de significância a e usando a distribuição de probabilida-
de da estatística de teste obtemos a Região Crítica (RC: região de rejeição de H0).
• Etapa 4: Tomada de decisão com base no critério:
- Se o valor da estatística do teste pertencer à região crítica RC, rejeitamos
a hipótese H0, ao nível de significância.
- Se o valor da estatística do teste não pertencer à região crítica RC, não
podemos rejeitar a hipótese H0, ao nível de significância.
construção de um teste de hipótese para média populacional
A seguir, está explicado o procedimento para construção do teste de hipótese para
média populacional com desvio-padrão conhecido e desconhecido. Vejamos:
114 Estatística E PEsquisa OPEraciOnal
etapa 1: formulação das hipóteses
Como vimos, as definições das hipóteses podem ser:
teste bilateral teste unilateral à direita teste unilateral à esquerda
Como o teste é feito com base em uma amostra e sabemos que essa amostra vai nos
trazer informações sobre a população, e não o seu comportamento exato, no fundo o
que se quer testar é se há, ou não, uma diferença estatisticamente significativa entre
a informação , que a amostra traz sobre a média da população, e o verdadeiro
valor ( ) dessa média, a ponto de rejeitar, ou não, a hipótese nula H0.
Assim, o critério de decisão consiste em não rejeitar a hipótese H0 se forem esta-
tisticamente não significativas essas diferenças ( ); bem como rejeitar H0 se
essas diferenças forem estatisticamente significativas. Para medir essas diferenças,
usamos a estatística do teste obtida da distribuição de , que é o estimador de .
etapa 2: escolha da estatística do teste
I. Quando o desvio-padrão populacional, , é conhecido: pelo teorema do limite
central sabemos que ~ N( , 2/n), para qualquer tamanho de amostra n se
a população tiver distribuição normal e para n suficientemente grande (n 30)
se a população não tiver distribuição normal. Nestas condições, a estatística
do teste é:
115Estatística E PEsquisa OPEraciOnal
II. Quando o desvio-padrão populacional, , não é conhecido: se o desvio-pa-
drão populacional for desconhecido e supondo população com distribuição
Normal, a estatística do teste é:
Em um teste estatístico admitimos sempre que H0 é verdadeira e, partir daí, desen-
volver o critério de decisão para rejeitar ou não tal hipótese. Assim, sob H0, e com as
informações obtidas na amostra, o valor da estatística do teste é dado por:
ou
etapa 3: região crítica ou região de rejeição
A decisão de rejeitar ou não H0, ou seja, decidir se a diferença ( ) é ou não
significativa, é tomada com base na região crítica RC (ou região de rejeição de H0)
que é construída de modo que P( RC/H0 é verdadeira) = , onde é o nível de sig-
nificância do teste. A construção da RC depende também do tipo de teste que estamos
realizando e está relacionada com a hipótese definida na etapa 1. A figura, a seguir,
apresenta as regiões críticas, que são as áreas hachuradas, para cada tipo de teste.
Os valores de ±E e ±E /2 são obtidos das tabelas das distribuições de probabilidade
da estatística do teste, que pode ser Z ou T, para o nível de significância considerado.
α/2 αα/2α
-Eα/2 -EαEα/2Eα
1 – α 1 – α1 – α
Figura 2 - Regiões críticas para teste de hipótese
116 Estatística E PEsquisa OPEraciOnal
etapa 4: tomada de decisão
Se o valor da estatística do teste zcalculado ou tcalculado pertencer à região crítica RC, rejeita-
mos a hipótese H0 ao nível α de significância. Caso contrário, não podemos rejeitá-la.
Exemplo 1
(CESGRANRIO) Um pesquisador deseja testar se a renda do filho primogênito é maior
que a renda média de seus irmãos. Formula a hipótese nula Ho de que a diferença de
rendas (d) = 0 e a hipótese alternativa H1, d > 0, isto é, a de que a renda do primogê-
nito seja maior que a média das rendas dos irmãos. Desse modo, o(a):
A. Erro do tipo I consiste em aceitar Ho se Ho for falsa.
B. Erro do tipo II consiste em rejeitar Ho se Ho for verdadeira.
C. Poder do teste diminui com o tamanho da amostra.
D. Probabilidade do erro do tipo II é igual a (1 – poder do teste).
E. Probabilidade do erro do tipo II ou do tipo I é chamada de nível de significância
do teste.
Solução
Temos que o erro do tipo I ocorre quando a hipótese nula é rejeitada quando é verda-
deira e, o erro do tipo II ocorre quando a hipótese nula não é rejeitada quando é falsa. A
probabilidade de se cometer o erro tipo I, ou seja, de rejeitar a hipótese H0 quando ela
é verdadeira é denominado de nível de significância a do teste. Temos ainda, que o
poder do teste aumenta com o tamanho da amostra. Assim, resta-nos a alternativa (D).
Exemplo 2
(CESGRANRIO)O rótulo das garrafas de certo refrigerante indica que o seu conteúdo
corresponde ao volume de 290 ml. A variável aleatória que representa o volume de
117Estatística E PEsquisa OPEraciOnal
líquido no interior dessas garrafas é X. A máquina que enche essas garrafas o faz se-
gundo uma distribuição normal, com média e variância igual a 36 mL2, qualquer que
seja o valor de . A máquina foi regulada para = 290 mL. Semanalmente, uma amostra
de 9 garrafas é colhida para verificar se a máquina está ou não desregulada para mais
ou para menos. Para isso, constrói-se um teste de hipótese bilateral no qual:
O nível de significância do teste foi fixado em . A hipótese nula não será rejeitada se a
média apresentada pela amostra estiver entre 285,66 mL e 294,34 mL. Logo, é igual a:
A. 0,5%
B. 1,0%
C. 1,5%
D. 3,0%
E. 4,0%
Solução
Temos as seguintes informações: , ou seja, e n = 9. Observe
que a etapa 1 já está apresentada ao longo do enunciado do exercício. Assim, calcu-
lamos o valor de z, ou seja,
E, ainda,
118 Estatística E PEsquisa OPEraciOnal
Daí, traçamos a seguinte curva normal que mostra a região de aceitação da Ho e a
zona de rejeição da Ho e os valores de Ztestes.
α/2 rr α/2rr
X = 285,66 X = 294,34
Zt = -2,17 Zt = -2,17Z = 0
Ra Ra
1 - α
Na tabela, encontramos z=2,17 para , ou seja, . Assim, o nível de
significância foi igual a 3%. Portanto, alternativa (D).
construção de um teste de hipótese para proporção populacional
Se p é a proporção populacional e é a proporção amostral, sabemos que, se
, podemos aproximar a distribuição amostral de pela distribuição normal, ou seja,
. Isso nos permite realizar testes para a proporção populacional de
forma análoga aos testes para média. Vejamos o procedimento:
etapa 1: formulação das hipóteses
Como vimos, as definições das hipóteses podem ser:
teste bilateral teste unilateral à direita teste unilateral à esquerda
119Estatística E PEsquisa OPEraciOnal
etapa 2: escolha da estatística do teste
Se , podemos aproximar a distribuição amostral de pela distribuição normal,
ou seja, . Nessas condições, a estatística de teste será:
O valor da estatística do teste será dado por:
etapa 3: região crítica ou região de rejeição
Corresponde às áreas hachuradas da Figura 3 para cada tipo de teste:
α/2 αα/2α
-Eα/2 -EαEα/2Eα
1 – α 1 – α1 – α
Figura 3 - Regiões críticas para teste de hipótese
etapa 4: tomada de decisão
Se o valor da estatística do teste pertencer à região crítica RC, rejeitamos a
hipótese H0 ao nível de significância. Caso contrário, não podemos rejeitá-la.
120 Estatística E PEsquisa OPEraciOnal
Exemplo 3
Um produtor afirma que a proporção de pés de laranja contaminados com certa doen-
ça em sua propriedade é de apenas 12%. Em um estudo com uma amostra com 100
elementos, selecionados aleatoriamente, 18 apresentaram a doença. Existe evidência
amostral para contestar a afirmação do produtor, ao nível de significância de 5%?
Solução
Temos que a proporção de plantas doentes na população, p=0,12 e proporção de
plantas doentes na amostra, =0,18. Tamanho da amostra, n=100 e = 5%. Assim:
Etapa 1: hipóteses
Etapa 2: cálculo da estatística
Etapa 3: obtenção da região crítica (RC)
Usamos a tabela N(0,1) com . Daí, temos a figura:
1,64
121ESTATÍSTICA E PESQUISA OPERACIONAL
Etapa 4: decisão
Como pertence à região crítica, rejeitamos a hipótese H0. Logo, pelos
dados amostrais, existe evidência amostral para contestar a afi rmação do produtor, ao
nível de signifi cância de 5%.
atividades para cOmpreensãO dO cOnteúdO
1) (CESGRANRIO) Considere as asserções a seguir:
A região de rejeição de um teste de hipóteses é obtida sob a suposição de que a
hipótese da nulidade (H0) é verdadeira.
PORQUE
Em testes de hipóteses, o erro do tipo I é aquele cometido ao se rejeitar a hipó-
tese da nulidade (H0) quando esta é verdadeira.
Analisando-se as asserções, conclui-se que:
a) As duas asserções são verdadeiras, e a segunda é uma justifi cativa correta
da primeira.
b) As duas asserções são verdadeiras, e a segunda não é uma justifi cativa correta
da primeira.
c) A primeira asserção é verdadeira, e a segunda é falsa.
d) A primeira asserção é falsa, e a segunda é verdadeira.
e) A primeira e a segunda asserções são falsas.
2) (CESGRANRIO) Com relação aos testes de hipótese sobre um parâmetro de uma po-
pulação, baseados em uma amostra de tamanho n dessa população, afi rma-se que:
122 Estatística E PEsquisa OPEraciOnal
I. O poder do teste aumenta com a probabilidade de um erro do tipo I, n
mantido constante.
II. O poder do teste não depende de n.
III. O poder do teste é a probabilidade de o teste rejeitar uma hipótese H0 quan-
do esta é falsa.
IV. O poder do teste é igual a , onde é a probabilidade de um erro do tipo II.
Estão corretas APENAS as afirmações:
a) I e IV.
b) II e III.
c) I, II e III.
d) I, III e IV.
e) II, III e IV.
3) (CESGRANRIO) Uma máquina produz comprimidos de um medicamento. Conforme
indicado no rótulo do produto, cada comprimido deve pesar, em média, 0,5 g. Para
testar se a máquina está regulada corretamente, foi estabelecido um procedimento
para testar a hipótese H0 de que a massa média dos comprimidos produzidos é, de
fato, igual a 0,5 g contra a hipótese alternativa H1 de que tal massa é inferior a 0,5
g. O procedimento de teste consistiu em pesar uma amostra de 100 comprimidos,
obter a média m e o desvio padrão s das massas registradas, em gramas, e rejeitar
H0 quando . O nível de significância do teste (ou seja, a probabili-
dade de se rejeitar a hipótese nula caso ela seja verdadeira) é, aproximadamente:
a) 0,059.
b) 0,067.
c) 0,119.
d) 0,134.
e) 0,150.
123Estatística E PEsquisa OPEraciOnal
4) (CESGRANRIO) Considere o seguinte teste de hipóteses:
H0 : p ≥ 0,6
H1 : p < 0,6
Sendo p a proporção de residências com, pelo menos, um chuveiro elétrico em
uma certa população. Uma amostra aleatória de tamanho 400 foi selecionada e
verificou-se haver 208 residências na amostra com, pelo menos, um chuveiro elé-
trico. Considerando 5% de significância, o p - valor (nível descritivo) do teste,
aproximadamente, e a decisão a ser tomada são:
a) 0,07% e rejeite H0.
b) 1% e rejeite H0.
c) 1,5% e não rejeite H0.
d) 2,5% e não rejeite H0.
e) 5% e rejeite H0.
5) (FCC) A população correspondente aos salários dos empregados de um determi-
nado ramo de atividade é considerada normal, de tamanho infinito e desvio-pa-
drão populacional igual a R$ 400,00. Uma amostra aleatória de tamanho 100 é
extraída desta população obtendo-se uma média igual a R$ 2.050,00. Com base
nesta amostra, deseja-se testar a hipótese se a média μ da população é igual a R$
2.000,00, a um nível de significância de 5%. Foram formuladas as hipóteses Ho: μ
= R$ 2.000,00 (hipótese nula) e H1: μ ≠ R$ 2.000,00 (hipótese alternativa). Para a
tomada de decisão, o valor do escore reduzido, utilizado para comparação com o
valor z da distribuição normal padrão (Z) tal que a probabilidade P (|Z| > z) = 5%, é:
a) 2,50.
b) 2,25.
c) 2,00.
d) 1,75.
e) 1,25.
124 Estatística E PEsquisa OPEraciOnal
pesquisa OperaciOnal
Origens e conceitos básicos em pesquisa operacional
A Pesquisa Operacional lida com problemas de como conduzir e coordenar certas
operações em uma organização, e tem sido aplicada a diversas áreas, tais como finan-
ças, indústria, saúde, operações militares e outros. A Pesquisa Operacional baseia-se
no método científico para tratar seus problemas. A observação inicial e a formulação
do problema estão entre os mais importantes passos da solução de um problema de
Pesquisa Operacional.
A origem da Pesquisa Operacionalse dá durante a Segunda Guerra Mundial, quando
um grupo de cientistas foi convocado na Inglaterra para estudar problemas de estra-
tégia e de tática associados com a defesa do país. O objetivo era decidir sobre a utili-
zação mais eficaz de recursos militares limitados. A convocação deste grupo marcou
a primeira atividade formal de pesquisa operacional. Os resultados positivos conse-
guidos pela equipe de pesquisa operacional inglesa motivaram os Estados Unidos a
iniciarem atividades semelhantes. Apesar de ser creditada à Inglaterra a origem da
Pesquisa Operacional, sua propagação deve-se principalmente à equipe de cientistas
liderada por George B. Dantzig, dos Estados Unidos, convocada durante a Segunda
Guerra Mundial. Ao resultado deste esforço de pesquisa, concluído em 1947, deu-se
o nome de Método Simplex.
Com o fim da guerra, a utilização de técnicas de pesquisa operacional atraiu o inte-
resse de diversas outras áreas. A natureza dos problemas encontrados é bastante
abrangente e complexa, exigindo, portanto, uma abordagem que permita reconhecer
os múltiplos aspectos envolvidos. Uma característica importante da pesquisa ope-
racional e que facilita o processo de análise e de decisão é a utilização de modelos.
Eles permitem a experimentação da solução proposta. Isto significa que uma decisão
pode ser mais bem avaliada e testada antes de ser efetivamente implementada. A
economia obtida e a experiência adquirida pela experimentação justificam a utilização
125ESTATÍSTICA E PESQUISA OPERACIONAL
da Pesquisa Operacional. Com o aumento da velocidade de processamento e quanti-
dade de memória dos computadores atuais, houve um grande progresso na Pesquisa
Operacional. Este progresso é devido também à larga utilização de microcomputa-
dores, que se tornaram unidades isoladas dentro de empresas. Isso faz com que os
modelos desenvolvidos pelos profi ssionais de Pesquisa Operacional sejam mais rá-
pidos e versáteis, além de serem também interativos, possibilitando a participação do
usuário ao longo do processo de cálculo.
Antes de darmos início aos estudos de casos em Pesquisa Operacional, algumas de-
fi nições mais simples ajudarão no seu entendimento. Veja a Tabela 1.
Tabela 1: Conceitos-chave na Pesquisa Operacional
mOdelO
Modelo é a representação simplifi cada do comportamento da realidade
expressa na forma de equações matemáticas que servem para simular a
realidade.
variáveis de
decisãO
São as variáveis utilizadas no modelo que podem ser controladas pelo
tomador de decisão. A solução é encontrada testando-se diversos valores
das variáveis de decisão.
parâmetrOs
São variáveis utilizadas no modelo que não podem ser controladas pelo
tomador de decisão. A solução do problema é encontrada admitindo como
fi xos os valores dos parâmetros.
funçãO
ObjetivO
É uma expressão matemática que representa o principal objetivo do
tomador de decisão. A função objetivo pode ser de dois tipos: minimização
ou de maximização.
restrições
São regras que dizem o que podemos (ou não) fazer e /ou quais são
as limitações dos recursos ou das atividades que estão associadas ao
modelo.
funçãO
linear
Uma função das variáveis é uma função
linear se for escrita como ,
sendo , , ..., constantes.
inequaçãO
linear
Para qualquer número b e uma função linear ,
defi ne-se uma inequação linear como as inequações do tipo:
ou .
algOritmO É uma sequência de instruções que para uma determinada entrada gera
um determinado resultado.
126 Estatística E PEsquisa OPEraciOnal
Para dar início aos estudos de Pesquisa Operacional, considere o seguinte problema
de “Planejamento Social”.
Digamos que você esteja planejando sair com suas namoradas: Ísis Valverde e
Gisele Bündchen.
Se você pudesse, e estou certo disso, planejaria sair com as duas ao mesmo tempo,
e a todo tempo, acertei? Mas sair com as duas ao mesmo tempo não dá! Elas não
aceitariam sair juntas com você. São ciumentas! Convenhamos sair todo dia também
não dá. Você não tem dinheiro (e disposição) para sair todo dia.
• Gisele é chique e gosta de restaurantes caros. O restaurante que ela frequen-
ta custar-te-á R$200,00;
• Ísis é mais simples, gosta de restaurantes mais baratos. O restaurante que ela
gosta custar-te-á R$100,00;
• Mas a sua “semanada” é de apenas R$ 800,00.
127Estatística E PEsquisa OPEraciOnal
As diferenças entre as duas não são apenas no volume de gastos:
• Ísis é muito agitada. Cada vez que você sai com ela, consome, em média, 4
horas do seu precioso tempo.
• Por outro lado, quando sai com Gisele, que é mais sossegada, você gasta
apenas 2 horas.
• Considere que os seus afazeres escolares (Claro! Você tem que estudar Es-
tatística) só te permitem 20 horas de lazer por semana.
Para garantir a sua felicidade, considerando estes problemas desagradáveis, você
precisa decidir quantas vezes na semana sair com cada uma. Para resolver seu pro-
blema, vamos definir como o número de vezes, por semana, que você sairá com a
Gisele e como o número de vezes, por semana, que você sairá com a Ísis.
A primeira restrição que você tem é a financeira, você dispõe de apenas R$ 800,00
para sair com as duas. Assim, se você sai com a Gisele vezes na semana, e cada
vez gasta R$200,00, então você gasta R$ 200 por semana. De modo análogo com
a Ísis, teremos a seguinte inequação:
A segunda restrição que você tem é a de tempo. Afinal, você tem que estudar essa
disciplina. Assim, temos que seus afazeres escolares só te permitem 20 horas de
lazer por semana. Usando a notação anterior, como fazer para garantir que não vai
extrapolar este tempo, obtemos a seguinte inequação:
128 Estatística E PEsquisa OPEraciOnal
Podemos acrescentar, ainda, que o número de vezes que você saíra com cada uma
delas é um número inteiro maior ou igual a zero, ou seja,
Pensando tudo junto, temos o conjunto de restrições:
Podemos tentar determinar uma solução ótima, atribuindo valores para e e veri-
ficando se eles satisfazem as restrições. Vejamos alguns casos:
(x1, x2) (5,5) (3,2) (2,3) (4,2) (2,4)
Restrição de dinheiro
é satisfeita?
Não Sim Sim Não Sim
Restrição de tempo é
satisfeita?
Não Sim Sim Sim Sim
Note que podemos continuar a atribuir valores e verificar se as restrições são satis-
feitas ou não. Porém, esse procedimento é exaustivo e você deseja resolver esse
“planejamento social” com urgência. Ou seja, falta um OBJETIVO. Assim, definimos
um objetivo para a situação, que nesse caso poderá ser:
ObjetivO funçãO ObjetivO
Sair o maior número de vezes possível com
a Gisele e com a Ísis, considerando que
você goste das duas por igual.
maximize Z = x1 + x2
129Estatística E PEsquisa OPEraciOnal
Sair o maior número de vezes possível com
a Gisele e com a Ísis, considerando que você
goste mais da Gisele do que da Ísis. Nesse
caso, foi atribuído um “peso” a variável x1.
maximize Z = 2x1 + x2
Sair o maior número de vezes possível com
a Gisele e com a Ísis, considerando que você
goste mais da Ísis do que da Gisele. Nesse
caso, foi atribuído um “peso” a variável x2.
maximize Z = x1 + 2x2
Situação 1:
maximize Z = x1 + x2 Função Objetivo
Restrições
Condições de não negatividade
Situação 2:
maximize Z = 2x1 + x2 Função Objetivo
Restrições
Condições de não negatividade
Situação 3:
maximize Z = x1 + 2x2 Função Objetivo
Restrições
Condições de não negatividade
130 Estatística E PEsquisa OPEraciOnal
As situações 1, 2 e 3 descritas acima representam problemas de pesquisa operacio-
nal na forma canônica.
Se o problema de Pesquisa operacional tiver apenas duas variáveis de decisão, ele
poderá ser resolvido graficamente, em um primeiro momento. O fato de ter apenas
duas variáveis de decisãopermite representá-las em um par de eixos ortogonais, que
será a base para a colocação gráfica de retas que delimitarão as restrições e o ponto
ótimo pode ser determinado empregando o teorema abaixo.
Teorema
A solução ótima de um problema de pesquisa operacional está em um dos pontos extremos
da região permissível.
Para ilustrar a aplicação do teorema, bem como a resolução de problemas de pesqui-
sa operacional, vamos resolver a situação 1 do planejamento social.
maximize Z = x1 + x2
131Estatística E PEsquisa OPEraciOnal
Solução
Para resolver o problema do planejamento social, vamos definir a região permissível
para o problema. A região permissível é a região, no plano cartesiano, delimitada pela
intersecção das inequações de restrições. Assim, temos:
Região permissivel final
8
x2
x1
6
4
2
0 2 4 6 8 10
De acordo com o teorema acima, a melhor condição ( condição ótima) corresponde a um
dos pontos dos vértices do polígono obtido acima. O polígono tem os seguintes vértices:
8
4
A 4 10
c
d
B
132 Estatística E PEsquisa OPEraciOnal
A (0, 0); B (4, 0); C (2, 4) e D (5, 0). Temos que, a função objetivo é:
Desta forma, obtemos:
Z (0, 0) = 0 + 0 = 0
Z (4, 0) = 4 + 0 = 4
Z (2, 4) = 2 + 4 = 6
Z (5, 0) = 5 + 0 = 5
Portanto, deve-se sair 2 vezes com Gisele e 4 vezes com Ísis, para que a felicidade
seja máxima e atenda as restrições.
Exemplo 4
Certa empresa fabrica dois produtos P1 e P2. O lucro unitário do produto P1 é de
R$ 1.000,00 e o lucro unitário de P2 é de R$ 1.800,00. A empresa precisa de 20
horas para fabricar uma unidade de P1 e de 30 horas para fabricar uma unidade de
P2. O tempo anual de produção disponível para isso é de 1.200 horas. A demanda
esperada para cada produto é de até 40 unidades anuais para P1 e de até 30 unida-
des anuais de P2. Qual é o plano de produção para que a empresa maximize seus
lucros nesses itens?
133Estatística E PEsquisa OPEraciOnal
Solução
Sejam x1 e x2 as quantidades anuais dos produtos P1 e P2 produzidas. A função obje-
tivo é maximizar o lucro e essa função objetivo é dada por:
As restrições do problema são:
I. O tempo de produção disponível de 1.200 horas – a inequação que represen-
ta essa restrição é:
II. A demanda de P1 e P2 – as inequações que representam essas restrições são:
Agora, você deve demarcar a região permissível. Vamos lá, lápis e papel na mão e
esboce no quadriculado abaixo a região permissível.
134 Estatística E PEsquisa OPEraciOnal
Agora, identifique os vértices do polígono da região permissível:
Depois, avalie a função objetivo em cada vértice determinado.
E, por fim, identifique a condição ótima.
Viu só como é fácil!
Considere que a Petróleo Uruguay S.A. esteja avaliando seu processo de produção de
óleo e gasolina a partir do petróleo bruto. A Figura abaixo apresenta o fluxo de proces-
so geral da empresa, desde a entrada da matéria-prima até a saída dos produtos finais.
destilAção
AtmosFéricA
dessulFurAção reFormA
crAking
gAsolinA
gás e óleo
135Estatística E PEsquisa OPEraciOnal
Cada estágio de produção possui uma determinada capacidade, como apresentado
na Tabela abaixo. A Petróleo Uruguay quer definir as produções de cada produto com
intuito de maximizar os lucros totais gerados pela venda de gás, óleos e gasolina.
prOcessO
prOdutO
Gasolina bruta (ton/ano) Gás e óleo (ton/ano)
Destilação 500.000 600.000
Dessulfuração 700.000 500.000
Reforma 400.000 -
Craking 450.000
Lucros unitários ($/ton) 10 7
Solução
Em problemas de processos, a análise recai sobre a capacidade de produção e fluxo,
bem como em relações de conservação de massa. Assim, temos:
X1 – X2 – X3 = 0
X2 – X5 – X4 = 0
X4 – X6 = 0
X3 – X7 = 0
X3 ≤ 600.000
X2 ≤ 500.000
X4 ≤ 700.000
X5 ≤ 400.000
X6 ≤ 400.000
X7 ≤ 450.000
X1 ≥ 0
X2 ≥ 0
X3 ≥ 0
X4 ≥ 0
X5 ≥ 0
X6 ≥ 0
X7 ≥ 0
Função objetivo: max 10x6 + 7(x5 + x7)
136 Estatística E PEsquisa OPEraciOnal
Para resolver o problema no Solver do Microsoft Excel, devemos definir células para
representar as variáveis de decisão, uma célula para representar o valor da função
objetivo e também devemos representar as restrições.
Em seguida, entramos com as informações no Solver. Assim:
137ESTATÍSTICA E PESQUISA OPERACIONAL
E, daí, os valores são:
O link abaixo pode auxiliá-lo(a) no uso do SOLVER do Microsoft Excel:
<https://www.youtube.com/watch?v=wCQQrMT3dKo>.
atividades para cOmpreensãO dO cOnteúdO
1) (CESGRANRIO)
R4R1
R2
R3 B
a
Qualida de
Produto a
400
400 500
300
300
200
200
100
100 Qualida de
Produto B
O gráfi co acima apresenta a solução gráfi ca de um problema de programação linear.
Ele representa as quantidades máximas de produção de dois itens do portfólio de uma
empresa. A linha A representa as restrições operacionais dos dois itens no departa-
mento de montagem e a linha B, as restrições do departamento de embalagem da
empresa. As regiões demarcadas entre as linhas tracejadas com:
a) R1 referem-se à capacidade viável dos dois itens produzidos na montagem e
na embalagem.
138 Estatística E PEsquisa OPEraciOnal
b) R2 referem-se à capacidade viável dos dois itens produzidos na montagem e
na embalagem.
c) R1 e R2 referem-se à capacidade mínima dos dois itens produzidos na embalagem.
d) R2 e R3 referem-se à capacidade mínima dos dois itens produzidos na montagem.
e) R4 referem-se à capacidade viável dos dois itens produzidos na montagem e
na embalagem.
Use as informações abaixo para responder as questões 2, 3 e 4.
Uma refinaria produz dois tipos de combustíveis, X e Y, que precisam ser trabalhados
em duas unidades de processamento. A produção de 1 litro do combustível X necessita
de 4 minutos na Unidade de Processamento 1 (UP1) e 2 minutos na Unidade de Proces-
samento 2 (UP2). Um litro do combustível Y precisa de 3 minutos na UP1 e 1 minuto na
UP2. A UP1 tem uma disponibilidade máxima de 240 minutos, e a UP2 pode ser usada,
no máximo, por 100 minutos por turno de trabalho. Um engenheiro de produção montou
uma representação gráfica das restrições de produção conforme a figura a seguir.
legenda:
Tempo disponível da UP1
Tempo disponível da UP2
Qualida de
combustível
Y (litros/minutos)
Qualida de
combustível
X (litros/minutos)
100
80
50 60
3
4
5 6
2
1
139Estatística E PEsquisa OPEraciOnal
2) (CESGRANRIO) A área demarcada pelos vértices 1, 3 e 5 identifica a restrição de
produção do(s):
a) Combustível X na UP1.
b) Combustível Y na UP2.
c) Combustível X na UP1 e UP2.
d) Combustíveis X e Y na UP1.
e) Combustíveis X e Y na UP2.
3) (CESGRANRIO) A área do gráfico que identifica os limites viáveis de produção
dos dois combustíveis em único turno de trabalho é a área interna demarcada
pelos vértices:
a) 1, 2 e 6.
b) 1, 2, 4 e 5.
c) 1, 3, 4 e 6.
d) 2, 3 e 4.
e) 4, 5 e 6.
4) (CESGRANRIO) Considerando que a empresa obtém uma margem de contribui-
ção de R$ 5,00 por litro com a venda do combustível X e R$ 3,00 por litro com
o combustível Y, qual é a maior margem de contribuição, em reais, obtida com a
produção dos dois combustíveis em um turno de trabalho?
a) 240,00.
b) 250,00.
c) 260,00.
d) 270,00.
e) 280,00.
140 Estatística E PEsquisa OPEraciOnal
5) (CESGRANRIO) Uma empresa planeja produzir dois tipos especiais de óleo que
utilizam três tipos de matéria-prima de alto custo. A Tabela abaixo mostra a quanti-
dade de matéria-prima consumida na produção de cada tipo de óleo e a disponibi-
lidade total de cada matéria-prima na semana prevista para a produção. Conside-
rando que tudo que é produzido é vendido, o lucro unitário por litro de óleopesado
é de R$ 5,00 e o do litro de óleo leve é de R$ 3,50.
matéria-prima
quantidade de matéria-prima utilizada na
prOduçãO de um litrO de óleO (gramas)
matéria-prima
dispOnível na
semana de prOduçãO
(kg)x
1 x2
P 10 8 8
Q 8 16 12
R - 15 10
Considerando o objetivo de maximizar o lucro, o modelo de programação linear
adequado, apresentado na forma canônica, no qual x1 e x2 referem-se, respectiva-
mente, aos óleos leve e pesado, é:
a) max Z = 3,5x1 + 5x2
10x1 + 8x2 ≤ 8000
8x1 + 16x2 ≤ 12000
15x2 ≤ 10000
x1,x2 ≥ 0
b) max Z = 3,5x1 + 5x2
10x1 + 8x2 ≥ 8000
8x1 + 16x2 ≥ 12000
15x2 ≥ 10000
x1,x2 > 0
c) max Z = 3500x1 + 5000x2
10x1 + 8x2 = 8
8x1 + 16x2 = 12
15x2 = 10
x1,x2 > 0
d) max Z = 5x1 + 3,5x2
10x1 + 8x2 = 8
8x1 + 16x2 = 12
15x2 = 10
x1,x2 ≥ 0
e) max Z = 35x1 + 50x2
10x1 + 8x2 ≥ 8
8x1 + 16x2 ≥ 12
15x2 ≥ 10
x1,x2 ≥ 0
141ESTATÍSTICA E PESQUISA OPERACIONAL
pré-requisitOs para a cOmpreensãO da unidade
Nessa quarta unidade dois assuntos: testes de hipóteses e pesquisa operacional. No
primeiro assunto abordado aprendemos como proceder em testes de hipóteses para
população e proporção. No segundo assunto abordado aprendemos um pouco sobre
pesquisa operacional, ou seja, como extrair o melhor resultado de um determinado
problema quando há restrições. O domínio desses dois assuntos é de suma importân-
cia no dia a dia de um administrador. E, assim, chegamos ao fi m do nosso curso. Se
você chegou até aqui já é um vencedor. Agora, vamos providenciar mais uma xícara
de café e estudar mais um pouco.
artigOs, sites e LINKS
A Pesquisa Operacional é uma ciência aplicada voltada para a resolução de pro-
blemas reais. Tendo como foco a tomada de decisões, aplica conceitos e métodos
de várias áreas científi cas na concepção, planejamento ou operação de sistemas. A
Pesquisa Operacional é usada para avaliar linhas de ação alternativas e encontrar as
soluções que melhor servem aos objetivos dos indivíduos ou organizações.
Por meio de desenvolvimentos de base quantitativa, a Pesquisa Operacional visa
também introduzir elementos de objetividade e racionalidade nos processos de toma-
da de decisão, sem descuidar, no entanto, dos elementos subjetivos e de enquadra-
mento organizacional que caracterizam os problemas.
A Pesquisa Operacional surgiu durante a Segunda Guerra Mundial, da necessidade
de lidar com problemas de natureza logística, tática e de estratégia militar de gran-
de dimensão e complexidade. Para apoiar os comandos operacionais na resolução
desses problemas, foram então criados grupos multidisciplinares de matemáticos, fí-
sicos e engenheiros e cientistas sociais. Esses cientistas não fi zeram mais do que
142 Estatística E PEsquisa OPEraciOnal
aplicar o método científico, que tão bem conheciam, aos problemas que lhes fo-
ram sendo colocados. Desenvolveram então a ideia de criar modelos matemáticos,
apoiados em dados e fatos, que lhes permitissem perceber os problemas em estu-
do e simular e avaliar o resultado hipotético de estratégias ou decisões alternativas.
O sucesso e credibilidade ganhos durante a guerra foram tão grandes que, termi-
nado o conflito, esses grupos de cientistas e a sua nova metodologia de aborda-
gem dos problemas se transferiram para as empresas que, com o “boom” econô-
mico que se seguiu, se viram também confrontadas com problemas de decisão de
grande complexidade. Em alguns países, em que prevaleceu a preocupação com
os fundamentos teóricos, a Pesquisa Operacional se desenvolveu sob o nome de
Ciência da Gestão ou Ciência da Decisão e em outros, em que predominou a ênfase
nas aplicações, com o nome de Engenharia Industrial ou Engenharia de Produção.
Seguiram-se então grandes desenvolvimentos técnicos e metodológicos que hoje,
com o apoio de meios computacionais de crescente capacidade e disseminação, nos
permitem trabalhar enormes volumes de dados sobre as atividades, não apenas das
empresas, mas também de instituições do setor público dentro e fora da área econô-
mica. Face ao seu caráter multidisciplinar, a Pesquisa Operacional é uma disciplina
científica de características horizontais com suas contribuições estendendo-se por
praticamente todos os domínios da atividade humana, da Engenharia à Medicina,
passando pela Economia e a Gestão Empresarial.
Fonte: SOBRAPO.
Disponível em: <http://www.sobrapo.org.br/o_que_e_po.php>. Acesso em: 17 jun. 2015.
143ESTATÍSTICA E PESQUISA OPERACIONAL
filmes recOmendadOs
O que é Pesquisa Operacional?
O vídeo, disponível no link abaixo, nos apresenta algu-
mas aplicações da Pesquisa Operacional.
<https://www.youtube.com/watch?v=tX6Rw7KJGjE>.
prOpOsta para discussãO ON-LINE
Proposta 1
A questão, a seguir, é para discussão on-line e foi adaptada de uma questão de con-
curso público realizado pela Fundação Cesgranrio.
Nos próximos cinco anos, a Petrobras pretende investir, anualmente, até 300 mi-
lhões de reais em seu sistema de gasodutos e oleodutos que transportam os diver-
sos derivados entre as suas diferentes unidades produtoras e os seus centros de
refi no e distribuição, dentro do Programa Tecnológico de Dutos - PROTRAN. Os in-
vestimentos podem ser na reabilitação dos dutos já existentes e que estejam perto
do fi nal de sua vida útil (entre 20 e 30 anos) ou na implantação de novos dutos.
O processo de reabilitação de dutos consiste da pintura in situ das partes interna
e externa de cada duto e depende do desenvolvimento, pelo CENPES (Centro de
Pesquisas da PETROBRAS), de uma tinta especial. Sem esse desenvolvimento, o
processo de reabilitação fi ca economicamente inviável e não pode ser executado.
Para todos os projetos foram calculados os Valores Presentes Líquidos (VPL), e
os que se apresentaram economicamente viáveis (VPL positivo) estão sob a aná-
lise do comitê de investimentos da empresa. Esse comitê tem de decidir que pro-
jeto deve ou não ser realizado sujeito às restrições de investimento da empresa,
144 Estatística E PEsquisa OPEraciOnal
maximizando o retorno para a empresa. Os projetos sob análise são os seguintes,
com valores em milhões de reais:
capital requeridO
prOjetO vpl(8%a.a.) anO 1 anO 2 anO 3 anO 4 anO 5
1 100 170 70 70 50 20
2 70 50 30 30 20 10
3 30 60 10 10 10 -
4 120 130 60 50 50 50
Investimento disponível 300 300 300 300 300
Projeto 1 - Construção de novo gasoduto Campinas-Rio de Janeiro que ligará a
Refinaria de Paulínia (Replan) ao terminal de Japeri (RJ).
Projeto 2 - Reabilitação do gasoduto Pilar (AL)/Ipojuca (PE) mediante pintura interna in situ.
Projeto 3 - Desenvolvimento da tinta a ser utilizada na recuperação de gasodutos.
Projeto 3 - Construção de novo gasoduto Campinas-Jacutinga que ligará a Refinaria
de Paulínia (Replan) ao terminal de Jacutinga (MG).
Considere as variáveis de decisão como variáveis binárias designadas por:
Com base nessas informações, resolva em grupo, os itens abaixo:
a) Escreva a função objetivo para o problema.
b) Escreva todas as restrições para o problema.
c) Use o Microsoft Excel e determine a condição ótima.
145ESTATÍSTICA E PESQUISA OPERACIONAL
Proposta 2
A questão, a seguir, é para discussão on-line e foi adaptada de uma questão proposta
pela CESPE da Universidade de Brasília. Para a resolução desta questão, você pode
consultar as referências usadas indicadas ao fi nal desse material.
Um dos conceitos principais da teoria estatística é o chamado teste de hipóteses, que
consiste em testar uma hipótese a respeito de um parâmetro da distribuição de uma
variável de interesse. Nesse contexto, imagine que um pesquisador deseje comparar
a média observada em dois grupos A e B. Considerando essas informações, redija um
texto atendendo, necessariamente, aoque se pede a seguir:
I. Apresente motivos para fazer testes de hipótese em vez de apenas obser-
var as estatísticas descritivas na amostra.
II. Explique o que implica o fato de não se rejeitar a hipótese nula.
livrOs recOmendadOs
Assim como a Pesquisa Operacional revolucionou o mundo mo-
derno, sugiro a leitura do livro “17 Equações Que Mudaram o
Mundo”, de Ian Stewart publicado pela editora Zahar. Leia a si-
nopse do livro: um dos mais famosos e respeitados matemáticos
da atualidade, Ian Stewart explora as conexões vitais entre a ma-
temática e o progresso da humanidade e demonstra como as
equações são parte integrante da nossa vida desde a Antiguida-
de, abrindo novas perspectivas de desenvolvimento - seja com a comunicação global,
GPS, lasers, naves espaciais ou a energia atômica. 17 equações que mudaram o mun-
do é um relato apaixonado e único da história do homem, contado através de dezesse-
te formulações matemáticas cruciais, do teorema de Pitágoras à teoria do caos.
146 ESTATÍSTICA E PESQUISA OPERACIONAL
anexO
Anexo 1: Tabela da Distribuição Normal Padrão P(Z<z)
z 0,0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319
1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767
2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817
2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857
2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890
2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916
2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936
2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952
2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964
2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974
2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981
2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986
3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990
3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993
3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995
3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997
3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998
3,5 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998
3,6 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,7 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,8 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
147Estatística E PEsquisa OPEraciOnal
z 0,0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,4960 0,4920 0,4880 0,4840 0,4801 0,4761 0,4721 0,4681 0,4641
-0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247
-0,2 0,4207 0,4168 0,4129 0,4090 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859
-0,3 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483
-0,4 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121
-0,5 0,3085 0,3050 0,3015 0,2981 0,2946 0,2912 0,2877 0,2843 0,2810 0,2776
-0,6 0,2743 0,2709 0,2676 0,2643 0,2611 0,2578 0,2546 0,2514 0,2483 0,2451
-0,7 0,2420 0,2389 0,2358 0,2327 0,2296 0,2266 0,2236 0,2206 0,2177 0,2148
-0,8 0,2119 0,2090 0,2061 0,2033 0,2005 0,1977 0,1949 0,1922 0,1894 0,1867
-0,9 0,1841 0,1814 0,1788 0,1762 0,1736 0,1711 0,1685 0,1660 0,1635 0,1611
-1,0 0,1587 0,1562 0,1539 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,1379
-1,1 0,1357 0,1335 0,1314 0,1292 0,1271 0,1251 0,1230 0,1210 0,1190 0,1170
-1,2 0,1151 0,1131 0,1112 0,1093 0,1075 0,1056 0,1038 0,1020 0,1003 0,0985
-1,3 0,0968 0,0951 0,0934 0,0918 0,0901 0,0885 0,0869 0,0853 0,0838 0,0823
-1,4 0,0808 0,0793 0,0778 0,0764 0,0749 0,0735 0,0721 0,0708 0,0694 0,0681
-1,5 0,0668 0,0655 0,0643 0,0630 0,0618 0,0606 0,0594 0,0582 0,0571 0,0559
-1,6 0,0548 0,0537 0,0526 0,0516 0,0505 0,0495 0,0485 0,0475 0,0465 0,0455
-1,7 0,0446 0,0436 0,0427 0,0418 0,0409 0,0401 0,0392 0,0384 0,0375 0,0367
-1,8 0,0359 0,0351 0,0344 0,0336 0,0329 0,0322 0,0314 0,0307 0,0301 0,0294
-1,9 0,0287 0,0281 0,0274 0,0268 0,0262 0,0256 0,0250 0,0244 0,0239 0,0233
-2,0 0,0228 0,0222 0,0217 0,0212 0,0207 0,0202 0,0197 0,0192 0,0188 0,0183
-2,1 0,0179 0,0174 0,0170 0,0166 0,0162 0,0158 0,0154 0,0150 0,0146 0,0143
-2,2 0,0139 0,0136 0,0132 0,0129 0,0125 0,0122 0,0119 0,0116 0,0113 0,0110
-2,3 0,0107 0,0104 0,0102 0,0099 0,0096 0,0094 0,0091 0,0089 0,0087 0,0084
-2,4 0,0082 0,0080 0,0078 0,0075 0,0073 0,0071 0,0069 0,0068 0,0066 0,0064
-2,5 0,0062 0,0060 0,0059 0,0057 0,0055 0,0054 0,0052 0,0051 0,0049 0,0048
-2,6 0,0047 0,0045 0,0044 0,0043 0,0041 0,0040 0,0039 0,0038 0,0037 0,0036
-2,7 0,0035 0,0034 0,0033 0,0032 0,0031 0,0030 0,0029 0,0028 0,0027 0,0026
-2,8 0,0026 0,0025 0,0024 0,0023 0,0023 0,0022 0,0021 0,0021 0,0020 0,0019
-2,9 0,0019 0,0018 0,0018 0,0017 0,0016 0,0016 0,0015 0,0015 0,0014 0,0014
-3,0 0,0013 0,0013 0,0013 0,0012 0,0012 0,0011 0,0011 0,0011 0,0010 0,0010
-3,1 0,0010 0,0009 0,0009 0,0009 0,0008 0,0008 0,0008 0,0008 0,0007 0,0007
-3,2 0,0007 0,0007 0,0006 0,0006 0,0006 0,0006 0,0006 0,0005 0,0005 0,0005
-3,3 0,0005 0,0005 0,0005 0,0004 0,0004 0,0004 0,0004 0,0004 0,0004 0,0003
-3,4 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0002
-3,5 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002
-3,6 0,0002 0,0002 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001
-3,7 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001
-3,8 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001
-3,9 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
Fonte: <http://www.pucrs.br/famat/rossana/psicologia/tabela_normal.pdf>
148 ESTATÍSTICA E PESQUISA OPERACIONAL
anexO
Anexo 2: Tabela de números aleatórios
57 72 00 39 84 84 41 79 67 71 40 21 13 97 56 49 86 54 08 93 29 68 74 54 83
28 80 53 51 59 09 93 98 87 58 70 27 71 77 17 06 32 02 78 62 16 74 69 65 17
92 59 18 52 87 30 48 86 97 48 35 25 18 88 74 03 62 98 38 58 65 86 42 41 03
90 38 12 91 74 30 19 75 89 07 50 64 15 59 71 88 13 74 95 30 52 78 30 11 75
80 91 16 94 67 58 60 82 06 66 90 47 56 18 46 45 11 12 35 32 45 50 4113 43
22 01 70 31 32 96 91 92 75 40 16 54 29 72 74 99 00 95 97 61 00 98 24 30 07
56 24 10 04 30 20 46 29 90 53 53 11 05 84 41 21 64 79 19 76 29 51 62 60 66
79 44 92 62 02 96 86 64 30 00 94 56 69 30 20 59 87 87 35 44 22 50 97 78 19
53 99 66 45 08 89 78 50 77 53 37 25 77 41 27 62 38 02 23 57 62 01 41 60 35
18 92 87 35 88 56 05 21 36 51 39 28 50 14 66 85 79 30 19 79 72 66 64 31 45
53 08 58 96 63 05 61 25 70 22 50 41 28 96 62 66 43 63 06 63 01 32 79 85 22
03 58 80 29 28 76 89 51 18 24 88 89 46 47 48 59 19 29 87 03 10 33 99 67 12
27 07 81 88 65 69 49 98 00 28 04 70 51 30 01 47 18 97 33 21 85 82 45 43 24
05 21 08 59 01 06 22 24 98 91 81 17 55 44 66 16 07 73 07 66 10 12 31 78 58
40 36 13 27 84 30 82 33 36 39 69 42 05 58 64 61 12 33 89 27 89 52 66 71 93
54 60 25 28 85 88 20 00 10 59 61 05 36 61 33 72 01 01 19 01 61 10 51 20 91
71 51 63 40 76 71 11 73 73 52 37 31 60 45 88 92 73 43 71 28 04 98 09 02 48
61 02 01 81 73 92 60 66 73 58 53 34 42 68 26 38 34 03 27 44 96 04 46 65 93
82 55 93 13 46 30 95 26 55 06 96 17 65 91 72 39 79 96 12 49 52 80 63 26 99
89 98 54 14 21 74 13 57 68 19 86 28 60 89 47 33 15 26 28 77 45 38 48 08 08
para refletir e filOsOfar
Unidade i
“A estatística é a arte de nunca ter que dizer que você está errado” (Bradfi eld).
Unidade ii
“Até mesmo o acaso não é impenetrável, tem as suas próprias regras” (Friedrich Novalis).
Unidade iii
“A normalidade é tão somente uma questão de estatística” (Aldous Huxley).
Unidade iV
“É sempre sábio levantar questões sobre as suposições mais óbvias e simples”
(Charles West Churchman).
149ESTATÍSTICA E PESQUISA OPERACIONAL
referências
ARENALES, M.; ARMENTANO, V. A.; MORABITO, R.; YANASSE, H. H. Pesquisa
operacional. Rio de Janeiro: Campus/Elsevier, 2007.
CRESPO, A. Estatística fácil. 18. ed. São Paulo: Saraiva, 2006.
FONSECA, J. S. Curso de estatística. 6. ed. São Paulo: Atlas, 2006.
FREUND, J. E. Estatística aplicada: economia, administração e contabilidade, trad.
Claus Ivo Doering. 6. ed. Porto Alegre: Bookman, 2006.
GOLDBARG, M.; LUNA, H. P. L. Otimização Combinatória e Programação Linear.
Rio de Janeiro: Campus, 2000.
MORETTIN, P. A. Estatística básica. 5. ed. São Paulo: Saraiva, 2006.
OLIVEIRA, F. E. M. Estatística e probabilidade: teoria, exercícios resolvidos e exer-
cícios propostos. 2. ed. São Paulo: Atlas, 1999.
TRIOLA, M. Introdução à estatística. 11. ed. Rio de Janeiro: LTC, 2013.