Logo Passei Direto
Buscar
Material
páginas com resultados encontrados.
páginas com resultados encontrados.

Prévia do material em texto

C
M
Y
CM
MY
CY
CMY
K
capa_curvas.pdf 1 19/07/12 10:57
Universidade do Sul de Santa Catarina
Palhoça
UnisulVirtual
2011
Probabilidade e Estatística
Disciplina na modalidade a distância
probabilidade_e_estatistica_1582.indb 1 19/07/12 11:11
Créditos
Universidade do Sul de Santa Catarina | Campus UnisulVirtual | Educação Superior a Distância
Reitor
Ailton Nazareno Soares
Vice-Reitor 
Sebastião Salésio Heerdt
Chefe de Gabinete da Reitoria 
Willian Corrêa Máximo
Pró-Reitor de Ensino e 
Pró-Reitor de Pesquisa, 
Pós-Graduação e Inovação
Mauri Luiz Heerdt
Pró-Reitora de Administração 
Acadêmica
Miriam de Fátima Bora Rosa
Pró-Reitor de Desenvolvimento 
e Inovação Institucional
Valter Alves Schmitz Neto
Diretora do Campus 
Universitário de Tubarão
Milene Pacheco Kindermann
Diretor do Campus Universitário 
da Grande Florianópolis
Hércules Nunes de Araújo
Secretária-Geral de Ensino
Solange Antunes de Souza
Diretora do Campus 
Universitário UnisulVirtual
Jucimara Roesler
Equipe UnisulVirtual 
Diretor Adjunto
Moacir Heerdt 
Secretaria Executiva e Cerimonial
Jackson Schuelter Wiggers (Coord.)
Marcelo Fraiberg Machado
Tenille Catarina
Assessoria de Assuntos 
Internacionais 
Murilo Matos Mendonça
Assessoria de Relação com Poder 
Público e Forças Armadas
Adenir Siqueira Viana
Walter Félix Cardoso Junior
Assessoria DAD - Disciplinas a 
Distância
Patrícia da Silva Meneghel (Coord.)
Carlos Alberto Areias
Cláudia Berh V. da Silva
Conceição Aparecida Kindermann
Luiz Fernando Meneghel
Renata Souza de A. Subtil
Assessoria de Inovação e 
Qualidade de EAD
Denia Falcão de Bittencourt (Coord.)
Andrea Ouriques Balbinot
Carmen Maria Cipriani Pandini
Assessoria de Tecnologia 
Osmar de Oliveira Braz Júnior (Coord.)
Felipe Fernandes
Felipe Jacson de Freitas
Jefferson Amorin Oliveira
Phelipe Luiz Winter da Silva
Priscila da Silva
Rodrigo Battistotti Pimpão
Tamara Bruna Ferreira da Silva
Coordenação Cursos
Coordenadores de UNA
Diva Marília Flemming
Marciel Evangelista Catâneo
Roberto Iunskovski
Auxiliares de Coordenação
Ana Denise Goularte de Souza
Camile Martinelli Silveira
Fabiana Lange Patricio
Tânia Regina Goularte Waltemann
Coordenadores Graduação
Aloísio José Rodrigues
Ana Luísa Mülbert
Ana Paula R.Pacheco
Artur Beck Neto
Bernardino José da Silva
Charles Odair Cesconetto da Silva
Dilsa Mondardo
Diva Marília Flemming
Horácio Dutra Mello
Itamar Pedro Bevilaqua
Jairo Afonso Henkes
Janaína Baeta Neves
Jorge Alexandre Nogared Cardoso
José Carlos da Silva Junior
José Gabriel da Silva
José Humberto Dias de Toledo
Joseane Borges de Miranda
Luiz G. Buchmann Figueiredo
Marciel Evangelista Catâneo
Maria Cristina Schweitzer Veit
Maria da Graça Poyer
Mauro Faccioni Filho
Moacir Fogaça
Nélio Herzmann
Onei Tadeu Dutra
Patrícia Fontanella
Roberto Iunskovski
Rose Clér Estivalete Beche
Vice-Coordenadores Graduação
Adriana Santos Rammê
Bernardino José da Silva
Catia Melissa Silveira Rodrigues
Horácio Dutra Mello
Jardel Mendes Vieira
Joel Irineu Lohn
José Carlos Noronha de Oliveira
José Gabriel da Silva
José Humberto Dias de Toledo
Luciana Manfroi
Rogério Santos da Costa
Rosa Beatriz Madruga Pinheiro
Sergio Sell
Tatiana Lee Marques
Valnei Carlos Denardin
Sâmia Mônica Fortunato (Adjunta)
Coordenadores Pós-Graduação
Aloísio José Rodrigues
Anelise Leal Vieira Cubas
Bernardino José da Silva
Carmen Maria Cipriani Pandini
Daniela Ernani Monteiro Will
Giovani de Paula
Karla Leonora Dayse Nunes
Letícia Cristina Bizarro Barbosa
Luiz Otávio Botelho Lento
Roberto Iunskovski
Rodrigo Nunes Lunardelli
Rogério Santos da Costa
Thiago Coelho Soares
Vera Rejane Niedersberg Schuhmacher
Gerência Administração
Acadêmica
Angelita Marçal Flores (Gerente)
Fernanda Farias
Secretaria de Ensino a Distância
Samara Josten Flores (Secretária de Ensino)
Giane dos Passos (Secretária Acadêmica)
Adenir Soares Júnior
Alessandro Alves da Silva
Andréa Luci Mandira
Cristina Mara Schauffert
Djeime Sammer Bortolotti
Douglas Silveira
Evilym Melo Livramento
Fabiano Silva Michels
Fabricio Botelho Espíndola
Felipe Wronski Henrique
Gisele Terezinha Cardoso Ferreira
Indyanara Ramos
Janaina Conceição
Jorge Luiz Vilhar Malaquias
Juliana Broering Martins
Luana Borges da Silva
Luana Tarsila Hellmann
Luíza Koing  Zumblick
Maria José Rossetti
Marilene de Fátima Capeleto
Patricia A. Pereira de Carvalho
Paulo Lisboa Cordeiro
Paulo Mauricio Silveira Bubalo
Rosângela Mara Siegel
Simone Torres de Oliveira
Vanessa Pereira Santos Metzker
Vanilda Liordina Heerdt
Gestão Documental
Lamuniê Souza (Coord.)
Clair Maria Cardoso
Daniel Lucas de Medeiros
Jaliza Thizon de Bona
Guilherme Henrique Koerich
Josiane Leal
Marília Locks Fernandes
Gerência Administrativa e 
Financeira
Renato André Luz (Gerente)
Ana Luise Wehrle
Anderson Zandré Prudêncio
Daniel Contessa Lisboa
Naiara Jeremias da Rocha
Rafael Bourdot Back 
Thais Helena Bonetti
Valmir Venício Inácio
Gerência de Ensino, Pesquisa e 
Extensão
Janaína Baeta Neves (Gerente)
Aracelli Araldi
Elaboração de Projeto
Carolina Hoeller da Silva Boing
Vanderlei Brasil
Francielle Arruda Rampelotte
Reconhecimento de Curso
Maria de Fátima Martins 
Extensão
Maria Cristina Veit (Coord.)
Pesquisa
Daniela E. M. Will (Coord. PUIP, PUIC, PIBIC)
Mauro Faccioni Filho (Coord. Nuvem)
Pós-Graduação
Anelise Leal Vieira Cubas (Coord.)
Biblioteca
Salete Cecília e Souza (Coord.)
Paula Sanhudo da Silva
Marília Ignacio de Espíndola
Renan Felipe Cascaes
Gestão Docente e Discente
Enzo de Oliveira Moreira (Coord.)
Capacitação e Assessoria ao 
Docente
Alessandra de Oliveira (Assessoria)
Adriana Silveira
Alexandre Wagner da Rocha
Elaine Cristiane Surian (Capacitação)
Elizete De Marco
Fabiana Pereira
Iris de Souza Barros
Juliana Cardoso Esmeraldino
Maria Lina Moratelli Prado
Simone Zigunovas
Tutoria e Suporte
Anderson da Silveira (Núcleo Comunicação)
Claudia N. Nascimento (Núcleo Norte-
Nordeste)
Maria Eugênia F. Celeghin (Núcleo Pólos)
Andreza Talles Cascais
Daniela Cassol Peres
Débora Cristina Silveira
Ednéia Araujo Alberto (Núcleo Sudeste)
Francine Cardoso da Silva
Janaina Conceição (Núcleo Sul)
Joice de Castro Peres
Karla F. Wisniewski Desengrini
Kelin Buss
Liana Ferreira
Luiz Antônio Pires
Maria Aparecida Teixeira
Mayara de Oliveira Bastos
Michael Mattar
Patrícia de Souza Amorim
Poliana Simao
Schenon Souza Preto
Gerência de Desenho e 
Desenvolvimento de Materiais 
Didáticos
Márcia Loch (Gerente)
Desenho Educacional
Cristina Klipp de Oliveira (Coord. Grad./DAD)
Roseli A. Rocha Moterle (Coord. Pós/Ext.)
Aline Cassol Daga
Aline Pimentel
Carmelita Schulze
Daniela Siqueira de Menezes
Delma Cristiane Morari
Eliete de Oliveira Costa
Eloísa Machado Seemann
Flavia Lumi Matuzawa
Geovania Japiassu Martins
Isabel Zoldan da Veiga Rambo
João Marcos de Souza Alves
Leandro Romanó Bamberg
Lygia Pereira
Lis Airê Fogolari
Luiz Henrique Milani Queriquelli
Marcelo Tavares de Souza Campos
Mariana Aparecida dos Santos
Marina Melhado Gomes da Silva
Marina Cabeda Egger Moellwald
Mirian Elizabet Hahmeyer Collares Elpo
Pâmella Rocha Flores da Silva
Rafael da Cunha Lara
Roberta de Fátima Martins
Roseli Aparecida Rocha Moterle
Sabrina Bleicher
Verônica Ribas Cúrcio
Acessibilidade 
Vanessa de Andrade Manoel (Coord.) 
Letícia Regiane Da Silva Tobal
Mariella Gloria Rodrigues
Vanesa Montagna
Avaliação da aprendizagem 
Claudia Gabriela Dreher
Jaqueline Cardozo Polla
Nágila Cristina Hinckel
Sabrina Paula Soares Scaranto
Thayanny Aparecida B. da Conceição
Gerência de Logística
Jeferson Cassiano A. da Costa (Gerente)
Logísitca de Materiais
Carlos Eduardo D. da Silva (Coord.)
Abraao do Nascimento Germano
Bruna Maciel
Fernando Sardão da Silva
Fylippy Margino dos Santos
Guilherme Lentz
Marlon Eliseu Pereira
Pablo Varela da Silveira
Rubens Amorim
Yslann David Melo Cordeiro
Avaliações Presenciais
Graciele M. Lindenmayr (Coord.)
Ana Paula de Andrade
Angelica Cristina Gollo
Cristilaine Medeiros
Daiana Cristina Bortolotti
Delano Pinheiro Gomes
Edson Martins Rosa Junior
Fernando Steimbach
Fernando Oliveira Santos
Lisdeise Nunes Felipe
Marcelo Ramos
Marcio VenturaOsni Jose Seidler Junior
Thais Bortolotti
Gerência de Marketing
Eliza B. Dallanhol Locks (Gerente)
Relacionamento com o Mercado 
Alvaro José Souto
Relacionamento com Polos 
Presenciais
Alex Fabiano Wehrle (Coord.)
Jeferson Pandolfo
Karine Augusta Zanoni
Marcia Luz de Oliveira
Mayara Pereira Rosa
Luciana Tomadão Borguetti
Assuntos Jurídicos
Bruno Lucion Roso
Sheila Cristina Martins
Marketing Estratégico
Rafael Bavaresco Bongiolo
Portal e Comunicação
Catia Melissa Silveira Rodrigues
Andreia Drewes
Luiz Felipe Buchmann Figueiredo
Rafael Pessi
Gerência de Produção
Arthur Emmanuel F. Silveira (Gerente)
Francini Ferreira Dias
Design Visual
Pedro Paulo Alves Teixeira (Coord.)
Alberto Regis Elias
Alex Sandro Xavier
Anne Cristyne Pereira
Cristiano Neri Gonçalves Ribeiro
Daiana Ferreira Cassanego
Davi Pieper
Diogo Rafael da Silva
Edison Rodrigo Valim
Fernanda Fernandes
Frederico Trilha
Jordana Paula Schulka
Marcelo Neri da Silva
Nelson Rosa
Noemia Souza Mesquita
Oberdan Porto Leal Piantino
Multimídia
Sérgio Giron (Coord.)
Dandara Lemos Reynaldo
Cleber Magri
Fernando Gustav Soares Lima
Josué Lange
Conferência (e-OLA)
Carla Fabiana Feltrin Raimundo (Coord.)
Bruno Augusto Zunino 
Gabriel Barbosa
Produção Industrial
Marcelo Bittencourt (Coord.)
Gerência Serviço de Atenção 
Integral ao Acadêmico
Maria Isabel Aragon (Gerente)
Ana Paula Batista Detóni
André Luiz Portes 
Carolina Dias Damasceno
Cleide Inácio Goulart Seeman
Denise Fernandes
Francielle Fernandes
Holdrin Milet Brandão
Jenniffer Camargo
Jessica da Silva Bruchado
Jonatas Collaço de Souza
Juliana Cardoso da Silva
Juliana Elen Tizian
Kamilla Rosa
Mariana Souza
Marilene Fátima Capeleto
Maurício dos Santos Augusto
Maycon de Sousa Candido
Monique Napoli Ribeiro
Priscilla Geovana Pagani
Sabrina Mari Kawano Gonçalves
Scheila Cristina Martins
Taize Muller
Tatiane Crestani Trentin
Avenida dos Lagos, 41 – Cidade Universitária Pedra Branca | Palhoça – SC | 88137-900 | Fone/fax: (48) 3279-1242 e 3279-1271 | E-mail: cursovirtual@unisul.br | Site: www.unisul.br/unisulvirtual
probabilidade_e_estatistica_1582.indb 2 19/07/12 11:11
Palhoça
UnisulVirtual
2011
Revisão e atualização de conteúdo
Gabriel Oscar Cremona Parma 
Design instrucional
Karla Leonora Dahse Nunes
Sabrina Bleicher
2ª edição
Luiz Arthur Dornelles Júnior
Probabilidade e Estatística
Livro didático
probabilidade_e_estatistica_1582.indb 3 19/07/12 11:11
Edição – Livro Didático
Professor Conteudista
Luiz Arthur Dornelles Júnior
Revisão e atualização de conteúdo
Gabriel Oscar Cremona Parma (2ª edição)
Designer Instrucional
Karla Leonora Dahse Nunes
Sabrina Bleicher (2ª edição)
Projeto Gráfico e Capa
Equipe UnisulVirtual
Diagramação
Fernanda Fernandes
Revisão
Contextuar 
ISBN
978-85-7817-336-4
Ficha catalográfica elaborada pela Biblioteca Universitária da Unisul
Copyright © UnisulVirtual 2011
Nenhuma parte desta publicação pode ser reproduzida por qualquer meio sem a prévia autorização desta instituição. 
519.5 
D75 Dornelles Júnior, Luiz Arthur 
Probabilidade e estatística : livro didático / Luiz Arthur Dornelles 
Júnior; revisão e atualização de conteúdo Gabriel Oscar Cremona Parma ; 
design instrucional Karla Leonora Dahse Nunes, Sabrina Bleicher. – 2. ed. – 
Palhoça: UnisulVirtual, 2011.
336 p. : il. ; 28 cm.
Inclui bibliografia.
ISBN 978-85-7817-336-4
1. Estatística. 2. Probabilidades. I. Parma, Gabriel Oscar Cremona. II. 
Nunes, Karla Leonora Dahse. III. Bleicher, Sabrina. IV. Título.
probabilidade_e_estatistica_1582.indb 4 19/07/12 11:11
Sumário
Apresentação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .7
Palavras do professor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .9
Plano de estudo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
UNIDADE 1 - Introdução à Estatística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
UNIDADE 2 - Distribuição de frequências e representação gráfica . . . . . . 43
UNIDADE 3 - Medidas de posição e dispersão . . . . . . . . . . . . . . . . . . . . . . . . . 81
UNIDADE 4 - Cálculo e distribuição de probabilidades . . . . . . . . . . . . . . . . 147
UNIDADE 5 - Amostragem e cálculo de estimativa . . . . . . . . . . . . . . . . . . . . 205
UNIDADE 6 - Regressão linear e gráficos de controle . . . . . . . . . . . . . . . . . . 253
Para concluir o estudo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 285
Referências . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287
Sobre os professores conteudistas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 289
Respostas e comentários das atividades de autoavaliação . . . . . . . . . . . . . 291
Anexos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 333
Biblioteca Virtual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 335
probabilidade_e_estatistica_1582.indb 5 19/07/12 11:11
probabilidade_e_estatistica_1582.indb 6 19/07/12 11:11
7
Apresentação
Este livro didático corresponde à disciplina Probabilidade e 
Estatística.
O material foi elaborado visando a uma aprendizagem autônoma 
e aborda conteúdos especialmente selecionados e relacionados 
à sua área de formação. Ao adotar uma linguagem didática 
e dialógica, objetivamos facilitar seu estudo a distância, 
proporcionando condições favoráveis às múltiplas interações e a 
um aprendizado contextualizado e eficaz.
Lembre-se que sua caminhada, nesta disciplina, será 
acompanhada e monitorada constantemente pelo Sistema 
Tutorial da UnisulVirtual, por isso a “distância” fica 
caracterizada somente na modalidade de ensino que você optou 
para sua formação, pois na relação de aprendizagem professores 
e instituição estarão sempre conectados com você.
Então, sempre que sentir necessidade entre em contato; você tem 
à disposição diversas ferramentas e canais de acesso tais como: 
telefone, e-mail e o Espaço Unisul Virtual de Aprendizagem, 
que é o canal mais recomendado, pois tudo o que for enviado e 
recebido fica registrado para seu maior controle e comodidade. 
Nossa equipe técnica e pedagógica terá o maior prazer em lhe 
atender, pois sua aprendizagem é o nosso principal objetivo.
Bom estudo e sucesso!
Equipe UnisulVirtual.
probabilidade_e_estatistica_1582.indb 7 19/07/12 11:11
probabilidade_e_estatistica_1582.indb 8 19/07/12 11:11
Palavras do professor
Olá! Bem-vindo(a) à disciplina Probabilidade e Estatística.
Dentro desta disciplina você irá estudar o que os profissionais 
e cientistas chamam de probabilidade e estatística.
Tendo como base a matemática, esta disciplina trata da 
aplicação no cotidiano, em pesquisas e avaliações. Trata 
também de técnicas eficientes para organizar e analisar dados 
e tomar decisões.
Não é objetivo desta disciplina formar estatísticos e, sim, 
profissionais com conhecimento técnico para realizar análises 
e interpretação de dados, além de ter condições de argumentar, 
dar suporte e trocar ideias com outros profissionais.
Desta forma, o esperado é que ao final da disciplina você tenha 
em suas mãos uma verdadeira “caixa com várias ferramentas” 
para apoiar suas decisões.
Sinta-se, agora, convidado a estudar para obter todas as 
“ferramentas” que lhe serão apresentadas nesta disciplina, e 
cuide para ordenar as ferramentas na “caixa”, de modo a poder 
fazer uso delas quando for necessário.
Bons estudos!
Professor Luiz Arthur Dornelles Júnior
probabilidade_e_estatistica_1582.indb 9 19/07/12 11:11
probabilidade_e_estatistica_1582.indb 10 19/07/12 11:11
Plano de estudo
O plano de estudos visa a orientá-lo no desenvolvimento da 
disciplina.Ele possui elementos que o ajudarão a conhecer o 
contexto da disciplina e a organizar o seu tempo de estudos. 
O processo de ensino e aprendizagem na UnisulVirtual leva 
em conta instrumentos que se articulam e se complementam, 
portanto, a construção de competências se dá sobre a 
articulação de metodologias e por meio das diversas formas de 
ação/mediação.
São elementos desse processo:
 � o livro didático;
 � o Espaço UnisulVirtual de Aprendizagem (EVA);
 � as atividades de avaliação (a distância, presenciais e de 
autoavaliação); 
 � o Sistema Tutorial.
Ementa
Conceitos gerais de população, amostra, parâmetro, estatística, 
tipos de dados, níveis de mensuração, planejamento de 
experimentos. Histogramas. Medidas de locação e de 
variabilidade. Boxplot. Ramo e folhas. Probabilidade e 
distribuições de probabilidade. Principais distribuições 
discretas. Principais distribuições contínuas. Estatísticas e 
distribuições amostrais. Estimação pontual de parâmetros de 
processos. Inferência estatística para uma amostra. Inferência 
estatística para duas amostras. Análise de variância com um 
único fator. Correlação e regressão linear. Gráficos de controle.
probabilidade_e_estatistica_1582.indb 11 19/07/12 11:11
12
Universidade do Sul de Santa Catarina
Objetivos
Geral
Adquirir competências para pesquisar; coletar dados, organizar 
e analisá-los; e delinear conclusões, testando-as na solução de 
problemas, sob o ponto de vista da estatística e da probabilidade.
Específicos
 � Compreender os conceitos, procedimentos e estratégias 
para uma pesquisa. 
 � Identificar ferramentas que apoiem decisões nas áreas de 
conhecimento inerentes a sua profissão.
 � Analisar e resolver situações que envolvam coleção de 
dados agrupados ou não. 
 � Analisar e resolver situações que envolvam uma ou mais 
variáveis de estudo. 
 � Identificar ferramentas para o cálculo de estimavas para 
uma ou mais variáveis. 
 � Correlacionar duas variáveis.
Carga Horária
A carga horária total da disciplina é 60 horas-aula.
probabilidade_e_estatistica_1582.indb 12 19/07/12 11:11
13
Probabilidade e Estatística
Conteúdo programático/objetivos
Veja, a seguir, as unidades que compõem o livro didático desta 
disciplina e os seus respectivos objetivos. Estes se referem aos 
resultados que você deverá alcançar ao final de uma etapa de 
estudo. Os objetivos de cada unidade definem o conjunto de 
conhecimentos que você deverá possuir para o desenvolvimento 
de habilidades e competências necessárias à sua formação. 
Unidades de estudo: 6 
Unidade 1 – Introdução à Estatística
É muito importante, antes de começar a ter contato com as técnicas 
estatísticas, conhecer bem os conceitos e definições de alguns termos 
que serão usados dentro desta disciplina. Por isso, nesta unidade você 
conhecerá alguns conceitos introdutórios da Estatística. 
Unidade 2 – Distribuição de frequências e representação gráfica
De posse dos dados de forma desorganizada, um primeiro 
passo seria organizá-los em tabelas para que possibilitem a 
primeira análise e uma série de interpretações. Nesta unidade, 
você poderá aprender como se organizam dados brutos e como 
pode ser analisada a distribuição de frequências. Após aprender 
como organizar os dados, você aprenderá como representá-los 
graficamente. Este assunto é importante porque o seu dia a 
dia está impregnado de informações representadas por gráficos 
e, nesta unidade, você poderá conhecer os tipos de gráficos e 
algumas dicas de como interpretá-los.
probabilidade_e_estatistica_1582.indb 13 19/07/12 11:11
14
Universidade do Sul de Santa Catarina
Unidade 3 – Medidas de posição e dispersão
Você conhecerá, nesta unidade, como calcular algumas medidas, 
começando por média, mediana e moda, sendo que a medida 
mais importante dentro da Estatística é a média. Verá também 
outra medida importante, a de dispersão. Muitas vezes as 
medidas de posição por si só não bastam para analisar uma série 
de dados, então, se faz necessário trabalhar com medidas de 
dispersão. Dentre as medidas de dispersão, a mais importante 
delas que é o desvio padrão.
Unidade 4 – Cálculo e distribuição de probabilidades
Esta unidade é um marco que divide a Estatística em duas partes: 
a estatística descritiva e estatística indutiva. Dar-se-á início ao 
estudo sobre probabilidade, estimativas e cálculo do erro de 
estimativa. O estudo de probabilidade é a base fundamental para 
concretizar o conhecimento sobre estimativas. Além disso, você 
conhecerá que o estudo de probabilidades pode ser dividido em 
duas partes: probabilidade de variáveis discretas e probabilidade 
de variáveis contínuas. 
Unidade 5 – Amostragem e cálculo de estimativa
Tendo como base o estudo do cálculo de probabilidades, você 
poderá aprender, nesta unidade, como calcular o tamanho de 
uma amostra necessário para se obter um determinado erro 
de estimativa, bem como, descobrir maneiras de selecionar os 
elementos de uma amostra de forma que eles sejam realmente 
representativos da população objeto de pesquisa. 
Unidade 6 – Regressão linear e gráficos de controle
Nesta unidade, você irá estudar como analisar e comparar duas 
variáveis correlacionando-as; assim como também aprenderá a 
construir e trabalhar com gráfico de controle para verificar os 
erros em processos de controle de qualidade, dentre outros fins.
probabilidade_e_estatistica_1582.indb 14 19/07/12 11:11
15
Probabilidade e Estatística
Agenda de atividades/Cronograma
 � Verifique com atenção o EVA, organize-se para acessar 
periodicamente a sala da disciplina. O sucesso nos seus 
estudos depende da priorização do tempo para a leitura, 
da realização de análises e sínteses do conteúdo e da 
interação com os seus colegas e professor.
 � Não perca os prazos das atividades. Registre no espaço 
a seguir as datas com base no cronograma da disciplina 
disponibilizado no EVA.
 � Use o quadro para agendar e programar as atividades 
relativas ao desenvolvimento da disciplina.
Atividades obrigatórias
Demais atividades (registro pessoal)
probabilidade_e_estatistica_1582.indb 15 19/07/12 11:11
probabilidade_e_estatistica_1582.indb 16 19/07/12 11:11
1UNIDADE 1Introdução à Estatística
Objetivos de aprendizagem
 � Identificar o processo estatístico de pesquisa.
 � Diferenciar censo e estimação.
 � Entender a importância de usar amostra estatística.
 � Identificar variáveis. 
 � Identificar dados absolutos e dados relativos.
 � Classificar séries estatísticas.
Seções de estudo
Seção 1 Conceitos básicos da Estatística
Seção 2 Variáveis 
Seção 3 Dados 
Seção 4 Séries 
probabilidade_e_estatistica_1582.indb 17 19/07/12 11:11
18
Universidade do Sul de Santa Catarina
Para início de estudo
A cada dia, nossa sociedade se torna mais complexa. Convivemos 
com os indicadores econômicos, com a inflação, com a reforma 
da previdência, com o controle de qualidade, enfim, nos 
deparamos com situações e informações sempre mais complexas.
No que se refere à gestão das organizações, a situação não é 
diferente. Para se administrar uma empresa, seja pública ou 
privada, necessitamos de ferramentas para poder acompanhar a 
evolução da sociedade e, assim, analisar situações e informações 
bem como dar suporte às nossas decisões.
Por isso, dizemos que a Estatística é um conjunto de ferramentas 
as quais, quando bem empregadas, podem ser de grande utilidade 
para a gestão de empresas. Hoje em dia, sem a Estatística, não 
seríamos capazes de avaliar a variação de preços, da inflação, de 
consumo, nem fazer controle de qualidade, pesquisa eleitoral etc.
Nesta unidade, você irá conhecer alguns conceitos importantes 
para a Estatística. Assim, conforme a metáfora utilizada, você 
estará apropriando-se de mais algumas “ferramentas para colocar 
na sua caixa”.
Seção 1 – Conceitos básicos da Estatística
Para conhecer Estatística, é importante que você compreenda, 
antes, o significado da palavra e o seu conceito. A palavra 
estatística origina-sedo latim, e o seu radical status, significa 
estado. Sendo assim, a palavra estatística significa “o estudo 
do estado”. Para entender o conceito de “estudo do estado”, 
acompanhe as seguintes definições sobre Estatística:
A Estatística é uma coleção de métodos para planejar 
experimentos, obter dados e organizá-los e, deles, extrair 
conclusões. (TRIOLA, 1999, p. 2).
probabilidade_e_estatistica_1582.indb 18 19/07/12 11:11
19
Probabilidade e Estatística
Unidade 1
A Estatística está interessada nos métodos científicos 
para a coleta, organização, resumo, apresentação e análise 
de dados, bem como na obtenção de conclusões válidas 
e na tomada de decisões razoáveis, baseadas em tais 
análises. (SPIEGEL, 1994, p. 1). 
 
Estatística é um conjunto de métodos e processos 
quantitativos que serve para estudar e medir os 
fenômenos coletivos. (SILVA, 1999, p. 11).
Você percebeu que as definições se assemelham e se completam? 
Então, observe, a seguir, a definição de Estatística adotada neste 
estudo que agora se inicia.
A Estatística corresponde a um conjunto de métodos 
científicos para a coleta, organização, apresentação 
e análise de dados, bem como, para a conclusão e 
tomada de decisões baseadas em tais análises.
Em termos gerais, convém destacar que a Estatística está dividida 
em duas partes:
 � Estatística indutiva: aplicada quando é impossível 
realizar levantamentos com a totalidade dos objetos 
de uma pesquisa seja por tempo, ou por economia 
etc., somente uma parcela destes elementos é utilizada 
para realizar as observações. Partindo, neste caso, de 
uma parcela destes elementos, a Estatística indutiva 
tira conclusões e realiza previsões sobre elementos 
em questão (método que se fundamenta na teoria da 
probabilidade associado a uma margem de incerteza).
 � Estatística descritiva: aplicada quando você se depara 
com uma quantidade muito grande de dados, e é difícil 
tirar conclusões sobre o fenômeno que descrevem. A 
Estatística descritiva é usada para reduzir as informações 
até o ponto em que se possa interpretar tal fenômeno. O 
objetivo da Estatística descritiva é observar fenômenos 
de mesma natureza, coletar, organizar, classificar, 
apresentar, interpretar e analisar dados referentes ao 
fenômeno através de gráficos e tabelas, além de calcular 
medidas que permitam descrever o fenômeno. 
probabilidade_e_estatistica_1582.indb 19 19/07/12 11:11
20
Universidade do Sul de Santa Catarina
Para obtenção de resultados confiáveis, que reflitam a realidade 
dos fatos, é necessário realizar uma pesquisa cuidadosamente 
planejada com métodos adequados. 
O método é um conjunto de meios dispostos 
convenientemente para se chegar a um fim que 
se demarcou. O método estatístico, diante da 
impossibilidade de manter as causas constantes, 
admite as causas presentes, variando-as, registrando 
essas variações e procurando determinar, no resultado 
final, que influências cabem a cada uma delas.
Alguns passos precisam ser seguidos para que seja aplicado o 
método estatístico e, assim, realizada uma boa pesquisa. Para 
você entender quais são estes passos, acompanhe a seguir as 
principais fases.
a) Definição do problema: a primeira fase do trabalho 
estatístico consiste em uma definição ou formulação 
correta do problema a ser estudado. Nesta fase, você 
precisa definir:
 � O que será pesquisado? Definir o tema e os objetivos 
de pesquisa;
 � Em que setor geográfico? O público-alvo a ser 
planejado;
 � Como será a amostra? Incluir o cálculo da amostra e 
as técnicas de coletas de dados.
b) Planejamento: consiste em determinar o procedimento 
necessário para levantar informações sobre o assunto 
objeto do estudo. Você deverá definir como serão 
coletados os dados de pesquisa, já que isto pode ser feito 
de várias formas.
 � Observação direta: caracteriza-se, quando o 
pesquisador somente faz observações para coletar os 
dados necessários para a pesquisa.
probabilidade_e_estatistica_1582.indb 20 19/07/12 11:11
21
Probabilidade e Estatística
Unidade 1
 � Entrevista oral: caracteriza-se por estabelecer 
perguntas orais a um indivíduo ou grupo de 
indivíduos. As entrevistas podem ser classificadas 
em estruturadas e não estruturadas; entrevistas 
estruturadas são aquelas em que o pesquisador 
estabelece um roteiro prévio de perguntas. Nas 
entrevistas não estruturadas, o pesquisador, por meio 
de uma conversa amigável, busca levantar dados 
que possam ser utilizados em análise qualitativa, 
selecionando-se os aspectos mais relevantes do 
problema de pesquisa. (RAUEN, 2006). 
 � Entrevista escrita ou questionário: questionário 
é uma lista de indagações escritas, as quais devem 
ser respondidas pelo informante por escrito. Sua 
vantagem é a possibilidade de se indagarem muitas 
pessoas ao mesmo tempo. Para entrevistar uma sala 
de universitários, basta distribuir as folhas, para que 
todos respondam simultaneamente (entrevista de 
grupo). (RAUEN, 2006). O questionário é uma forma 
muito utilizada na coleta de dados, mas exige ser: 
completo (responder tudo), concreto (perguntas claras 
e objetivas), secreto (sem identificação) e discreto 
(perguntas bem formuladas).
É preciso planejar o trabalho a ser realizado, tendo em 
vista o objetivo que se pretende atingir.
c) Coleta de dados: compreende a coleta das informações 
propriamente ditas. Formalmente, a coleta de dados 
refere-se à obtenção, à reunião e ao registro sistemático 
de dados com um objetivo determinado.
d) Apuração dos dados: consiste em reunir os dados através 
de sua contagem e agrupamento.
e) Apresentação dos dados: os dados estatísticos podem ser 
mais facilmente compreendidos quando apresentados por 
meio de uma representação gráfica, o que permite uma 
visualização instantânea de todos os dados.
probabilidade_e_estatistica_1582.indb 21 19/07/12 11:11
22
Universidade do Sul de Santa Catarina
f) Análise e interpretação de dados: nesta etapa, o 
interesse maior reside em tirar conclusões que auxiliam 
o pesquisador a atingir seu objetivo, ou seja, encontrar a 
resposta para a sua pergunta.
Todas estas fases são realizadas quando se cumpre um processo 
de pesquisa. Veja a representação no esquema a seguir:
População Amostra
Produção
de dados
Estatística
Descritiva
Estatística
Indutiva
Características
populacionais
Estudo da amostra
� tabelas
� grá�cos
� medidas
Características
amostrais
Figura 1.1 – O processo da pesquisa estatística
Fonte: Adaptado de Ação Local de Estatística Aplicada - ALEA (1999-2010).
População e amostra
Quando você prepara um alimento, pode provar (observar) 
uma pequena porção. Neste procedimento, você está fazendo o 
processo de amostragem, ou seja, extraindo do todo (população) 
uma parte (amostra), com o propósito de inferir (avaliar) a 
qualidade de todo o alimento. A partir do exemplo, podemos 
distinguir dois importantes conceitos da Estatística descritiva: 
população e amostra. 
População é o conjunto total de elementos com, 
pelo menos, uma característica em comum, cujo 
comportamento interessa estudar.
probabilidade_e_estatistica_1582.indb 22 19/07/12 11:11
23
Probabilidade e Estatística
Unidade 1
A definição dos elementos que serão estudados está ligada 
diretamente às características levantadas no objetivo da pesquisa, 
ou seja, é este objetivo que auxiliará na definição desta população. 
Estes elementos podem ser:
 � animados: pessoas, animais etc.;
 � inanimados: notas fiscais, produtos industrializados etc.
Em relação ao número de elementos, a população pode ser: 
 � finita: quando tem um número limitado de elementos 
(número de funcionários de um determinado banco etc.);
 � infinita: quando tem um número ilimitado de elementos 
(exemplo: número possível de análises químicos que 
podem ser feitos em um rio poluído etc.).
A representação do tamanho da população é dada por 
N = número de elementos da população.
São exemplos de definição de população:
 � Ao estudar a idade e sexo de funcionários da empresa A: 
para definira população, devemos considerar todos os 
funcionários da empresa. 
 � Ao estudar a qualidade de peças de uma linha de 
produção da empresa A: para definir a população, 
devemos considerar todas as peças produzidas pela 
empresa. 
Amostra é o conjunto de elementos ou observações, 
recolhidos a partir de um subconjunto da população, 
que se estuda com o objetivo de tirar conclusões para a 
população de onde foi recolhida.
A amostra precisa ser representativa, ou seja, possuir as mesmas 
características da população. 
A representação do tamanho da amostra é dada por n = número 
de elementos da amostra.
probabilidade_e_estatistica_1582.indb 23 19/07/12 11:11
24
Universidade do Sul de Santa Catarina
Processos estatísticos de abordagem
Ao estudar um fenômeno coletivo, ou seja, um fenômeno que se 
refere a uma determinada população, compreendendo um grande 
número de elementos, coisas e indivíduos, podemos optar entre 
os seguintes processos estatísticos:
 � Censo: é uma coleção de dados relativos a todos os 
elementos de uma população; uma avaliação direta de 
um parâmetro que utiliza todos os componentes da 
população. No Brasil, por exemplo, o censo é feito de dez 
em dez anos, momento em que são pesquisados todos os 
domicílios brasileiros. 
Principais propriedades do censo:
 » admite erro processual zero e tem confiabilidade 100%;
 » é caro e lento;
 » quase sempre desatualizado;
 » nem sempre é viável.
 � Parâmetro: usado para designar alguma característica 
descritiva dos elementos da população (percentagem, 
média etc.). 
 � Estimação: é uma avaliação indireta de um parâmetro 
com base em um estimador, através do cálculo de 
probabilidades. Nesse caso, utiliza-se uma amostra. 
Principais propriedades da estimação:
 » admite erro processual positivo e tem confiabilidade 
menor que 100%;
 » é barata e rápida;
 » é atualizada;
 » é sempre viável.
O censo era considerado uma 
pesquisa desatualizada pela demora 
da publicação dos dados, mas a 
tecnologia veio para diminuir em 
muito esse tempo de publicação. No 
ano de 2010, constatamos que os 
dados foram publicados com mais 
rapidez que nas décadas anteriores.
Acesse o site do Instituto Brasileiro 
de Geografia e Estatística (IBGE) e 
consulte informações da sua cidade 
e do seu estado.
probabilidade_e_estatistica_1582.indb 24 19/07/12 11:11
25
Probabilidade e Estatística
Unidade 1
 � Estimativa: é o valor assumido por certa estatística 
(exemplo: 60% é o valor de estimativa do referido 
parâmetro).
Amostragem
Como já foi exposto nesta unidade, as pesquisas são realizadas 
por meio de estudo dos elementos que compõem uma amostra 
extraída da população que se pretende analisar. O conceito de 
população é intuitivo. Trata-se do conjunto de indivíduos ou 
objetos que apresentam, em comum, determinadas características 
definidas para o estudo. Amostra é um subconjunto da 
população. O estudo de todos os elementos da população 
possibilita conhecimento preciso das variáveis que estão sendo 
pesquisadas; todavia nem sempre é possível obter as informações 
de todos os elementos da população. 
Limitações de tempo, custo e as vantagens do uso das 
técnicas estatísticas justificam o uso de planos amostrais. A 
representatividade da amostra dependerá do seu tamanho (quanto 
maior, melhor). O investigador procurará acercar-se de cuidados, 
visando à obtenção de uma amostra significativa, ou seja, que 
de fato represente toda a população da melhor maneira possível. 
(FONSECA, 1996).
Observe, a seguir, mais alguns conceitos do processo estatístico, 
relacionados à amostragem:
 � Estatística: característica descritiva dos elementos da 
amostra (percentagem, média etc.).
 � Erro amostral: é a máxima diferença que o investigador/
pesquisador admite entre a média da população e a 
média da amostra. Em pesquisa, admite-se o uso do 
erro amostral entre 2% a 7%. Observe, por exemplo, as 
pesquisas eleitorais, a grande maioria destas pesquisas 
é efetuada com erro amostral de 2%. Isto significa que 
pode variar de −2% a +2%. Quando se diz que dois 
candidatos estão com empate técnico, isso quer dizer que, 
somando ou diminuindo 2%, estão empatados.
probabilidade_e_estatistica_1582.indb 25 19/07/12 11:11
26
Universidade do Sul de Santa Catarina
O candidato A está com 48% da preferência dos votos, 
e o candidato B está com 52% da preferência dos votos. 
O candidato A tem 48%; diminuindo os 2% = 46; com 
48% mais 2% = 50%. Já, o candidato B tem 52% menos 
2% = 50%; com 52% + 2% = 54%. Logo, os candidatos 
estão empatados tecnicamente, com 50% cada.
 � Nível de confiança: é expressa em percentual e representa 
quantas vezes o percentual real da população encontra-se 
dentro do intervalo de confiança. O nível de confiança de 
95% significa que você tem 95% de certeza. A maioria dos 
pesquisadores usa o nível de confiança de 95%. 
Como podemos ver, o uso da amostragem é vantajoso por trazer:
 � economia: é mais econômico o levantamento de somente 
uma parte da população, muitas vezes pelo custo do 
próprio levantamento e também por não ser mais possível 
recuperar elementos da população; 
 � tempo: em pouco tempo, pode-se pesquisar uma 
amostra, ao contrário de uma população; 
 � confiabilidade: quando se pesquisa um número menor 
de elementos, pode-se dar mais atenção, evitando erros 
nas respostas. 
– Até aqui, vimos alguns conceitos básicos de estatística. Mas, entre 
os conceitos fundamentais da Estatística, é importante distinguir 
variáveis estatísticas de dados estatísticos. Estes assuntos serão 
tratados na próxima seção. Vamos adiante... Bons Estudos!
probabilidade_e_estatistica_1582.indb 26 19/07/12 11:11
27
Probabilidade e Estatística
Unidade 1
Seção 2 – Variáveis 
Variáveis são conjuntos de características que podem ser 
observadas e/ou medidas em cada elemento da população ou 
amostra, sob as mesmas condições.
Ao analisar uma determinada experiência, um fato ou um 
elemento, você pode verificar que todos eles assumem diferentes 
características ou valores.
Ao analisar um determinado setor de uma empresa, 
você pode verificar, entre seus funcionários, algumas 
características como sexo, idade, salário, assiduidade etc.
Estas características variam de elemento para elemento, por isto 
são chamadas de variáveis.
As variáveis são classificadas em dois tipos:
 � Qualitativas: representam a informação que identifica 
alguma qualidade, categoria ou característica, 
não suscetível de medida (não numérica), mas de 
classificação, assumindo várias modalidades. 
Estado civil: casado, solteiro, viúvo, divorciado. 
Sexo: masculino e feminino. 
Escolaridade: 1º grau, 2º grau, 3º grau.
As variáveis qualitativas estão divididas em:
 � Nominais: são dados caracterizados por rótulos ou 
categorias. Por exemplo, sexo, estado civil, cor dos olhos etc.;
 � Ordinais: são dados caracterizados por uma ordem, 
mas não podem ser diferenciados por valor numérico. 
Por exemplo: nível de escolaridade (1º, 2º e 3º graus), 
intensidade da luz (muito forte, forte, média, suave, 
muito suave).
probabilidade_e_estatistica_1582.indb 27 19/07/12 11:11
28
Universidade do Sul de Santa Catarina
 � Quantitativas: representam a informação resultante 
de características suscetíveis de serem medidas, 
apresentam-se com diferentes intensidades. 
Idade: 19 anos, 20 anos, 35 anos. 
Número de nascidos vivos: 10, 15, 22, 12, 14. 
Peso: 55 kg, 66 kg, 71 kg.
As variáveis quantitativas estão divididas em:
 � Variáveis discretas: se ela pode assumir um conjunto 
constante discreto, ou seja, enumerável, finito de valores. 
Geralmente são expressas por valores inteiros não 
negativos. Por exemplo: número de pessoas do setor, 
quantidade de notas fiscais (observação: não se pode 
considerar meia nota fiscal ou meia pessoa).
 � Variáveis contínuas: são as variáveis em que não 
conseguimos enumerar seus possíveis resultados, por estes 
formarem um conjunto infinito de valores, num intervalo 
de números reais. Por exemplo:peso, altura, temperatura.
Diferença entre as variáveis discreta e contínua
Você, à noite, ao ir deitar, tem 1,65m e desperta 
pela manhã com 1,70m. Você cresce 5cm de forma 
instantânea? Não, você cresce aos poucos e, entre 
1,65 e 1,70, você tem infinitas alturas. Para a variável 
discreta, observamos que não é possível aumentar o 
número de pessoas de 22 para 22,57. Não podemos 
aumentar em 0,57 pessoa. Só podemos aumentar em 
uma unidade.
probabilidade_e_estatistica_1582.indb 28 19/07/12 11:11
29
Probabilidade e Estatística
Unidade 1
Seção 3 – Dados 
Dados estatísticos são medidas da presença de um determinado 
conjunto de valores de uma variável numa população ou amostra. 
Os tipos de dados estatísticos são:
 � dados primários: quando são observados e/ou 
levantados pelo próprio pesquisador ou organização que 
os tenha recolhido; 
 � dados secundários: quando são observados e/ou 
levantados por outra organização ou pesquisador. 
Além desta classificação, os dados também pode ser absolutos 
e relativos. Nesta seção, vamos aprender a transformar dados 
absolutos em dados relativos, mas, antes disso, vamos conhecer 
suas definições.
 � Dados absolutos são dados estatísticos resultantes da 
coleta direta da fonte, sem outra manipulação a não ser 
a contagem ou medida. A leitura dos dados absolutos é 
sempre enfadonha e inexpressiva. Embora esses dados 
traduzam um resultado exato e fiel, não têm a virtude de 
ressaltar de imediato as suas conclusões numéricas. 
Daí o uso imprescindível que faz a Estatística dos dados 
relativos. O número de vezes que um valor da variável de 
uma pesquisa é citado representa a frequência absoluta 
daquele valor.
 � Dados relativos são o resultado de comparações por 
quociente (razões) que se estabelecem entre dados 
absolutos e têm por finalidade realçar ou facilitar as 
comparações entre quantidades. Traduzem-se os dados 
relativos, em geral, por meio de:
 � percentagens;
 � coeficientes; 
 � taxas;
 � índices.
probabilidade_e_estatistica_1582.indb 29 19/07/12 11:11
30
Universidade do Sul de Santa Catarina
A frequência relativa é o quociente entre a frequência absoluta de 
uma variável e o total de citações de todas as variáveis da pesquisa.
Percentagens e proporções
Permitem padronizar distribuições de frequência quanto ao 
tamanho, ou seja, comparam grupos de diferentes frequências totais. 
Na proporção (P), compara-se o número de sujeitos de uma dada 
categoria (F) com o número total de sujeitos (N).
Num grupo de 20 alunos, 10 gostam de futebol. Assim, 
a proporção será dada por: 
 
 
Logo, a proporção é de 0,50, ou seja, de cada dois 
indivíduos um gosta de futebol.
Em percentagem, entretanto, podemos multiplicar esta 
proporção por 100, obtendo, assim, a porcentagem ou 
percentagem.
Então, de acordo com o exemplo dado, temos:
(Porcentagem) 
Portanto, de cada 100 alunos, 50 gostam de futebol.
No próximo exemplo, consideremos a tabela a seguir:
probabilidade_e_estatistica_1582.indb 30 19/07/12 11:11
31
Probabilidade e Estatística
Unidade 1
Tabela 1.1 – Área territorial brasileira por região – 2010
Região Área territorial em km2
Centro-Oeste 1.606.371
Nordeste 1.554.257
Norte 3.853.327
Sudeste 924.511
Sul 576.409
Total 8.514.875
Fonte: IBGE (2010).
Nesse caso, vamos identificar qual percentual do território 
nacional cada região ocupa em relação ao total. Para isso, 
precisamos dividir a área territorial de cada região pela área total 
e multiplicar por 100.
Calculemos as percentagens de cada região:
Centro-Oeste = 1.606.371 ÷ 8.514.875 = 0,1886 × 100 = 18,87%
Nordeste = 1.554.257 ÷ 8.514.875 = 0,1825 × 100 = 18,25%
Norte = 3.853.327 ÷ 8.514.875 = 0,4525 × 100 = 45,25%
Sudeste = 924.511 ÷ 8514.875 = 0,1086 × 100 = 10,86%
Sul = 576.409 ÷ 8.514.409 = 0,06769 × 100 = 6,77%
Agora, vamos acrescentar na tabela uma coluna com os 
percentuais.
probabilidade_e_estatistica_1582.indb 31 19/07/12 11:11
32
Universidade do Sul de Santa Catarina
Tabela 1.2 – Área territorial brasileira por região – 2010
Região Área territorial em km2 Percentual (%)
Centro-Oeste 1.606.371 18,87
Nordeste 1.554.257 18,25
Norte 3.853.327 45,25
Sudeste 924.511 10,86
Sul 576.409 6,77
Total 8.514.875 100,0
Fonte: IBGE (2010).
Observe que, no resultado do cálculo do percentual, 
foram aplicadas regras de arredondamento. 
Considerando que cada região representa uma 
proporção do todo, o total precisa fechar com 100%.
Nesse exemplo, os dados referentes à área territorial são dados 
secundários e absolutos. Secundários porque não foram pesquisados 
por nós, e sim pelo IBGE; e absolutos porque estão na tabela como 
foram coletados. Já no percentual, os dados são relativos porque 
sofreram transformações: são dados de comparações.
Coeficientes e taxas
São razões que comparam o número de ocorrências de certo evento 
com ele mesmo, acrescido das não ocorrências (mas que poderiam 
ter ocorrido); e a razão entre variáveis da mesma espécie.
Coeficientes
São razões entre o número de ocorrências e o número total (que 
é o número de ocorrências e não ocorrências). Os coeficientes são 
multiplicados por 100, para transformá-los em taxa.
probabilidade_e_estatistica_1582.indb 32 19/07/12 11:11
33
Probabilidade e Estatística
Unidade 1
Coeficiente de natalidade =
Número de nascimentos
População total
Coeficiente de mortalidade infantil =
Número de óbitos
Número de nascimento total
Taxas
São os coeficientes multiplicados por 100 ou 1.000. As taxas de 
mortalidade infantil e de natalidade são multiplicadas por 1.000, 
por serem números muito pequenos. 
A taxa nacional de mortalidade infantil do Brasil, 
segundo o IBGE – dados de 2007 –, é de 19,3 por mil 
nascimentos.
Índices
São métodos que comparam duas grandezas distintas, ou seja, 
uma não inclui a outra.
Densidade demográfica =
População
Superfície
Densidade aluno/professor =
Número de alunos
Número de professores
Densidade aluno/ sala de aula =
Número de alunos
Número de sala de aula
 
probabilidade_e_estatistica_1582.indb 33 19/07/12 11:11
34
Universidade do Sul de Santa Catarina
Índices econômicos
Produção per capita =
Valor total da produção
População
Consumo per capita =
Consumo de bem
População
Renda per capita =
Renda
População
– Você pôde conhecer, nas duas últimas seções, as definições e diferen‑
ças das variáveis e dos dados estatísticos. Na próxima seção, serão 
apresentadas séries estatísticas... Bons estudos!
Seção 4 – Séries 
Série estatística define-se como toda e qualquer coleção de 
dados estatísticos referidos a uma mesma ordem de classificação. 
Quantitativa em seu sentido mais amplo, o termo série refere-se a 
uma sucessão de números referidos a qualquer variável. 
Os resultados estatísticos são apresentados em quadros ou 
tabelas para maior clareza, objetividade e melhor visão do 
conjunto, oferecendo, assim, vantagens para uma análise 
matemática das mesmas.
A série estatística pode ser definida, portanto, como 
qualquer tabela que apresente a distribuição de um 
conjunto de dados estatísticos. 
Tabela é a organização racional 
e prática de apresentação dos 
dados estatísticos e a sintetização 
dos dados no mínimo espaço para 
colocar o máximo de informações.
probabilidade_e_estatistica_1582.indb 34 19/07/12 11:11
35
Probabilidade e Estatística
Unidade 1
Tipos de séries
Para diferenciar uma série estatística de outra, há que levar em 
conta três caracteres presentes na tabela que se apresenta:
 � época: fator temporal ou cronológico a que se refere o 
fenômeno analisado;
 � local: fator geográfico onde o fenômeno acontece;
 � fenômeno: espécie ou fato ou fator específico que é 
descrito.
Conforme a variação dos elementos da série, é possível classificá-
las em temporal, geográfica específica e conjugada.
a) Série temporal: identifica-se por descrever a variável 
no decorrer de um determinado período de tempo. Esta 
série também é chamada de histórica ou evolutiva. 
Observe a tabelaque registra os nascidos vivos 
registrados segundo o ano do registro no Brasil.
Tabela 1.3 – Nascidos vivos registrados segundo o ano do registro no Brasil
Anos Nº de nascidos
1984 2.559.038
1985 2.619.604
1986 2.779.253
Fonte: IBGE (2010).
b) Série geográfica: identifica-se por descrever a variável 
considerando o fator geográfico. Também é chamada de 
espacial, territorial ou de localização. Observe a tabela 
que registra as mulheres de dez anos ou mais de idade, 
total, que tiveram filhos nascidos vivos – Censo de 2000 
– segundo as Mesorregiões:
probabilidade_e_estatistica_1582.indb 35 19/07/12 11:11
36
Universidade do Sul de Santa Catarina
Tabela 1.4 – Mulheres de dez anos ou mais de idade, total, tiveram filhos nascidos vivos – 
Censo de 2000 - segundo as Mesorregiões
Mesorregiões Mulheres de dez anos ou mais de idade que tiveram filhos nascidos vivos
Grande Florianópolis 211.763
Norte Catarinense 267.448
Oeste Catarinense 297.814
Serrana 106.025
Sul Catarinense 224.287
Vale do Itajaí 319.195
Fonte: IBGE (2010).
c) Série específica: o caráter variável é apenas o fato 
ou espécie. Também é chamada de série categórica. 
Observe a tabela que registra as pessoas de dez anos ou 
mais de idade que viviam em companhia de cônjuge 
ou companheiro(a), por natureza da união, segundo as 
Mesorregiões – Santa Catarina – Censo de 2000.
Tabela 1.5 – Pessoas de dez anos ou mais de idade que viviam em companhia de cônjuge 
ou companheiro(a), por natureza da união, segundo as Mesorregiões – Santa Catarina – 
Censo de 2000
Natureza da união Número de pessoas de dez anos ou mais de idade
Casamento civil e religioso 1.666.621
Só casamento civil 189.741
Só casamento religioso 85.543
União consensual 521.001
Fonte: IBGE (2010).
d) Séries conjugadas: também chamadas de tabelas de 
dupla entrada. São apropriadas à apresentação de duas ou 
mais séries de maneira conjugada, havendo duas ordens 
de classificação: uma horizontal e outra vertical. Observe 
a tabela a seguir, que registra a quantidade de mortes por 
acidente de trânsito em São Paulo, nos anos de 1997 e 1998.
probabilidade_e_estatistica_1582.indb 36 19/07/12 11:11
37
Probabilidade e Estatística
Unidade 1
Tabela 1.6 – Quantidade de mortes por acidente de trânsito em São Paulo, nos anos de 
1997 e 1998 (dados fictícios)
Idade 1997 1998
Até 10 anos 69 45
De 10 a 19 anos 212 165
De 20 a 49 anos 868 628
De 50 anos e mais 382 287
Idade Ignorada 51 40
Fonte: Elaboração do autor (2006).
As séries conjugadas ainda podem ser geográfico-
temporal e geográfico-específica.
Síntese
Nesta unidade, você estudou conceitos básicos e introdutórios da 
Estatística. Também conheceu quais são as etapas do processo de 
uma pesquisa para que se possa alcançar um resultado fiel, que 
traduza a realidade. 
Você pôde estudar alguns conceitos importantes como 
população e amostra, variáveis, dados e séries. Todos estes novos 
conhecimentos serão muito importantes para você dar sequência 
ao estudo da Estatística.
probabilidade_e_estatistica_1582.indb 37 19/07/12 11:11
38
Universidade do Sul de Santa Catarina
Atividades de autoavaliação
Ao final de cada unidade, você realizará atividades de autoavaliação. O 
gabarito está disponível no final do livro didático, mas se esforce para 
resolver as atividades sem a ajuda do gabarito, pois, assim, você estará 
promovendo (e estimulando) a sua aprendizagem.
1) Analise os conceitos de censo e estimação e descreva a principal 
diferença entre os termos.
2) Ao escolher os elementos de uma amostra, o que você deve considerar 
para que ela seja representativa? Por quê? 
probabilidade_e_estatistica_1582.indb 38 19/07/12 11:11
39
Probabilidade e Estatística
Unidade 1
3) Como você pôde acompanhar, existem dois tipos de variáveis: a 
qualitativa, que está dividida em nominal e ordinária, e a quantitativa, 
que está dividida em contínua e discreta. Identifique, no seu dia a dia, 
pelo menos um exemplo de cada uma destas variáveis e as escreva no 
quadro a seguir: 
Variável Exemplo
Qualitativa nominal
Qualitativa ordinal
Quantitativa discreta
Quantitativa contínua
4) Ao planejar uma pesquisa sobre uma determinada síndrome, um 
pesquisador tem a intenção de usar um questionário para a coleta de 
dados e, também, planeja fazer levantamento de dados no Ministério 
da Saúde, para que possa realizar comparativos. Como consequência 
disto, ele terá que trabalhar com dois tipos de dados: os resultantes 
dos questionários e os resultantes do levantamento no Ministério. 
Classifique os dois tipos de dados. 
a) Os dados coletados por meio de questionário são: ________________
b) Os dados coletados no Ministério:_____________________________
probabilidade_e_estatistica_1582.indb 39 19/07/12 11:11
40
Universidade do Sul de Santa Catarina
5) Classifique cada uma das variáveis a seguir em qualitativa nominal ou 
ordinal e em quantitativa discreta ou contínua: 
Descrição da variável Classificação
Saldo em conta corrente em R$
Idade do cliente
Sexo do cliente
Classe econômica
Estado civil
Número de defeitos do produto
Consumo de energia em kWh
Grau de instrução
Número de filhos
Hierarquia de uma empresa
Número de filhos de uma família
Diâmetro da peça produzida
Comprimento da peça
Tempo de espera em caixa eletrônico 
em minutos
Nome de país exportador de petróleo
Grau de satisfação no atendimento 
numa loja comercial
Número de ações negociadas na 
bolsa de valores
Número de alunos de uma 
universidade
Altura dos funcionários de uma 
empresa
probabilidade_e_estatistica_1582.indb 40 19/07/12 11:11
41
Probabilidade e Estatística
6) Observe as duas tabelas a seguir e classifique as séries estatísticas de 
cada uma delas.
Tabela A – Pessoas de dez anos ou mais de idade, por estado civil e condição de 
convivência – Santa Catarina – Censo de 2000
Estado civil Casado(a)
Desquitado(a) 
ou separado(a) 
judicialmente
Divorciado(a) Viúvo(a) Solteiro(a)
Mesorregiões
Grande Florianópolis 267.867 18.697 16.779 28.224 333.974
Norte Catarinense 380.222 21.098 13.630 38.037 379.194
Oeste Catarinense 439.967 16.130 9.174 38.856 399.587
Serrana 142.373 6.738 4.814 15.834 150.964
Sul Catarinense 314.348 14.021 12.068 32.261 302.894
Vale do Itajaí 443.839 25.825 20.433 46.595 439.800
Fonte: IBGE (2010).
Tabela B – Metabolismo basal (cal/dia) em adolescentes (dados fictícios)
Metabolismo basal (cal/dia) Número de adolescentes
910 |-- 989 3
989 |-- 1068 5
1068 |-- 1147 9
1147 |-- 1226 5
1226 |-- 1305 8
1305 |-- 1384 3
1384 |-- 1463 2
Fonte: Elaboração do autor (2006). 
probabilidade_e_estatistica_1582.indb 41 19/07/12 11:11
42
Universidade do Sul de Santa Catarina
Saiba mais
Se você desejar, aprofunde os conteúdos estudados nesta unidade 
ao consultar as seguintes referências:
CRESPO, Antônio Arnot. Estatística fácil. 19. ed. São Paulo: 
Saraiva, 2009.
FONSECA, Jairo Simon da; MARTINS, Gilberto de Andrade. 
Curso de estatística. 6. ed. São Paulo: Atlas, 1996.
RAUEN, Fábio. Roteiro de pesquisa. Rio de Sul: Nova Era, 
2006.
SILVA, Ermes Medeiros da. Estatística para os cursos de 
economia, administração e ciências contábeis. 3. ed. São Paulo: 
Atlas, 1996. v. 1.
TRIOLA, Mario F. Introdução à estatística. 7. ed. Rio de 
Janeiro: LTC, 1999.
probabilidade_e_estatistica_1582.indb 42 19/07/12 11:11
2UNIDADE 2Distribuição de frequências e representação gráfica
Objetivos de aprendizagem
 � Organizar dados brutos de acordo com os tipos de 
variáveis.
 � Compreender, organizar e analisar a distribuição de 
frequência.
 � Montar tabelas de distribuição de frequência para 
variáveis qualitativas e quantitativas.
 � Analisar e interpretar gráficos.
Seções de estudo
Seção 1 Representação numérica
Seção 2 Tipos de frequência
Seção 3 Representação gráfica
probabilidade_e_estatistica_1582.indb 43 19/07/12 11:11
44
Universidade do Sul de Santa Catarina
Para início de estudo
Nesta unidade, você vai trabalhar com a organizaçãodos dados 
estatísticos propriamente ditos.
De posse dos dados de forma desorganizada, um primeiro passo 
seria organizá-los em tabelas para que possibilite uma primeira 
análise, além de servir para uma série de interpretações. Você 
poderá aprender como se organizam dados brutos e como pode 
ser analisada a distribuição de frequências. 
Você também terá a oportunidade de adquirir mais uma 
importante ferramenta para utilizar na análise e interpretação de 
dados: a representação gráfica. Você irá conhecer alguns tipos de 
representação gráfica mais utilizados e suas características.
Poderá constatar que os dados representados por meio de 
gráficos, muitas vezes, facilitam a leitura e a compreensão de 
algum fenômeno ou acontecimento.
Seção 1 – Representação numérica
Para iniciar o estudo desta unidade, antes de qualquer coisa, você 
precisa saber o que são dados brutos e dados agrupados.
Dados brutos
Dados brutos são sequências de valores numéricos 
ou não, os quais não sofreram qualquer tratamento 
estatístico, nem foram organizados, obtidos 
diretamente da observação de um fenômeno.
probabilidade_e_estatistica_1582.indb 44 19/07/12 11:11
45Unidade 2
Probabilidade e Estatística
Mais precisamente, dados brutos são os dados apresentados 
da forma como foram coletados na pesquisa ou levantamento, 
desorganizados, sem ordenação.
Acompanhe os exemplos de levantamento de dados de acordo 
com o tipo de variável: qualitativa, quantitativa discreta ou 
quantitativa contínua.
Para uma variável qualitativa
Em um levantamento realizado com 56 clientes de um banco, 
foram obtidos os seguintes dados sobre o tipo de investimento em 
que mais confiavam, conforme legenda:
I M R P I I P R
P R I P P I R I
P P P M I P P P
M P I I I M P R
M R R P M M P R
I R M P P I R P
M P I P P M P I
Quadro 2.1 – Levantamento sobre o tipo de investimento que os clientes do banco mais confiavam 
Fonte: Elaboração do autor (2006). 
 
Legenda do quadro: 
I – Investimentos imobiliários 
M – Investimento em mercado de ações 
P – Investimento em poupança 
R – Investimento em fundos de renda fixa
Repare que, neste caso, foram pesquisados 56 clientes e foram 
anotadas as respostas na ordem das entrevistas.
Para uma variável quantitativa discreta 
O controle de qualidade de uma fábrica de rolamentos vem 
analisando os lotes para detectar defeitos nas peças fabricadas. 
Cada lote contém 56 peças. A seguir, está relacionado o número 
de defeitos por peça, conforme estas são produzidas neste lote:
probabilidade_e_estatistica_1582.indb 45 19/07/12 11:11
46
Universidade do Sul de Santa Catarina
1 1 4 1 0 0 1 6
5 0 0 0 0 0 0 0
0 1 0 0 1 0 3 2
4 2 0 0 2 0 1 0
0 0 3 3 0 0 4 0
0 1 0 2 0 0 1 0
3 0 0 0 3 0 0 0
Quadro 2.2 – Levantamento sobre o número de defeitos por peça de uma fábrica de rolamentos 
Fonte: Elaboração do autor (2006).
Repare que foram analisadas 56 peças e foram anotados os 
números de defeitos por peça, na ordem em que estas foram 
produzidas.
Para uma variável quantitativa contínua
Os valores anotados a seguir representam o volume de vendas 
mensal de 56 representantes de uma empresa que fabrica 
remédios. Os valores estão em milhares de reais:
23,25 27,43 17,76 33,33 33,05 16,08 34,49 23,74
32,63 20,58 18,50 16,69 16,43 20,08 19,00 16,13
21,36 26,60 22,49 22,77 23,05 33,55 22,73 24,89
24,11 34,83 21,73 31,53 35,13 34,36 20,80 16,84
29,55 34,76 31,72 24,89 21,65 22,65 30,43 30,93
17,25 17,05 19,67 22,79 25,30 23,08 25,77 35,03
16,59 15,90 20,30 33,86 17,76 30,93 20,81 29,05
Quadro 2.3 – Levantamento sobre o volume de vendas mensal de 56 representantes de uma 
empresa que fabrica remédios 
Fonte: Elaboração do autor (2006).
Dados agrupados
Dados agrupados são sequências de valores numéricos, ou não, os 
quais se encontram já organizados, ou por semelhança (qualitativas), 
ou por ordenação numérica (quantitativas), em tabelas.
probabilidade_e_estatistica_1582.indb 46 19/07/12 11:11
47
Probabilidade e Estatística
Unidade 2
Tabelas para variável qualitativa
Para montar uma tabela com variável qualitativa, acompanhe o 
exemplo, a seguir, de um levantamento de dados acerca do tipo 
de investimento em que os clientes de um banco mais confiavam.
Veja passo a passo 
1º passo: para começar, você deve organizar os dados por 
semelhança. 
I I I I I I I I
I I I I I I M M
M M M M M M M M
P P P P P P P P
P P P P P P P P
P P P P P P R R
R R R R R R R R
Quadro 2.4 – Levantamento sobre o tipo de investimento que os clientes do banco mais confiavam 
Fonte: Elaboração do autor (2006). 
 
Legenda do quadro: 
I – Investimentos imobiliários 
M – Investimento em mercado de ações 
P – Investimento em poupança 
R – Investimento em fundos de renda fixa
Repare que os dados estão organizados por tipo de investimento.
2º passo: agora você vai escrever, em uma coluna, cada uma das 
opções verificadas. Contar o número de vezes em que cada tipo 
aparece e marcar com traços, ao lado, para representar as aparições. 
Em seguida, conte o número de traços para obter o número de vezes 
que cada opção aparece. Observe, a seguir, a contagem dos dados.
I = 14
M = 10
P = 22
R = 10
probabilidade_e_estatistica_1582.indb 47 19/07/12 11:11
48
Universidade do Sul de Santa Catarina
3º passo: após a contagem e organização dos dados, agora é só 
montar a tabela, sem esquecer nenhum de seus componentes. 
Acompanhe: 
Tabela 2.1 – Tipos de investimento
Tipo de investimento Número de clientes
Imobiliário 14
Mercado de ações 10
Poupança 22
Fundos de renda fixa 10
Total 56
Fonte: Elaboração do autor (2006).
Essas tabelas são denominadas de distribuição de 
frequências.
Tabelas para variável quantitativa discreta 
Nesta seção, vamos verificar como montar uma tabela com 
variável quantitativa discreta. Para saber como são montados 
estes tipos de tabela, acompanhe os passos apresentados a seguir.
Observe que a opção de montar uma tabela sem 
intervalos se deve ao fato de esta série ter um número 
de elementos distintos pequeno.
probabilidade_e_estatistica_1582.indb 48 19/07/12 11:11
49
Probabilidade e Estatística
Unidade 2
Veja passo a passo 
1º passo: para começar organize os dados em ordem crescente. 
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 1 1 1 1 1 1 1
1 1 2 2 2 2 3 3
3 3 3 4 4 4 5 6
Quadro 2.5 – Levantamento sobre o número de defeitos por peça de uma fábrica de rolamentos 
Fonte: Elaboração do autor (2006).
Repare que foram organizados conforme uma ordem numérica 
crescente (de 0 a 6).
2º passo: escreva, em uma coluna, cada um dos valores observados. 
Conte o número de vezes em que cada tipo aparece e marque com 
traços, ao lado, para representar as aparições. Após, conte o número 
de traços para obter o número de vezes em que cada valor aparece. 
Observe, a seguir, a contagem dos dados.
0 33
1 9
2 4
3 5
4 3
5 1
6 1
A organização de dados na 
forma de lista em ordem – 
crescente ou decrescente 
–, é chamada de Rol.
probabilidade_e_estatistica_1582.indb 49 19/07/12 11:11
50
Universidade do Sul de Santa Catarina
3º passo: agora é só montar a tabela, sem esquecer nenhum de seus 
componentes. 
Tabela 2.2 – Número de defeitos por peças analisadas do lote 
Fonte: Elaboração do autor (2006).
Nesta tabela, utilizamos algumas expressões estatísticas para 
representação dos elementos:
 � os valores que a variável pode assumir é representado por xi; 
 � o número de observações de cada linha chama-se de 
frequência simples, denotada por fi; e 
 � o número total de observações chama-se de frequência 
total e pode ser denotada por N (tamanho da população), 
n (tamanho da amostra) ou .
probabilidade_e_estatistica_1582.indb 50 19/07/12 11:11
51
Probabilidade e Estatística
Unidade 2
Tabelas para variável quantitativa contínua
A opção de montar uma tabela com intervalos é preferível porque 
esta série possui um grande número de elementos distintos 
ou, ainda, quando os valores apresentam uma natureza decontinuidade. Vamos acompanhar um exemplo para montagem 
das tabelas para variável quantitativa contínua.
Os valores anotados a seguir representam o volume 
de vendas mensal de 56 representantes de uma 
empresa que fabrica remédios. Os valores estão em 
milhares de reais.
Veja passo a passo 
1º passo: para começar, você deve organizar os dados em ordem 
crescente (Rol). 
15,90 16,08 16,13 16,43 16,59 16,69 16,84 17,05
17,25 17,76 17,76 18,50 19,00 19,67 20,08 20,30
20,58 20,80 20,81 21,36 21,65 21,73 22,49 22,65
22,73 22,77 22,79 23,05 23,08 23,25 23,74 24,11
24,89 24,89 25,30 25,77 26,60 27,43 29,05 29,55
30,43 30,93 30,93 31,53 31,72 32,63 33,05 33,33
33,55 33,86 34,36 34,49 34,76 34,83 35,03 35,13
Quadro 2.6 – Levantamento sobre o volume de vendas mensal de 56 representantes de uma 
empresa que fabrica remédios 
Fonte: Elaboração do autor (2006).
Para a variável 
quantitativa contínua, 
utilizam-se intervalos na 
tabela para representar 
a série de dados. Estes 
intervalos denominam-se 
intervalos de classes.
probabilidade_e_estatistica_1582.indb 51 19/07/12 11:11
52
Universidade do Sul de Santa Catarina
2º passo: você deve calcular o número e o tamanho dos intervalos. 
O número de intervalos (k) é obtido a partir dos seguintes 
critérios:
 � critério da raiz ;
 � fórmula de Sturges k = 1 + 3,3.log n; 
Sendo n = tamanho da amostra (poderá ser usado N, quando for 
com a população).
Observe que:
1. Ainda que existam dois critérios, em geral, o critério 
utilizado é o da raiz: .
2. O número do intervalo (k), em alguns casos, pode ser 
predefinido. 
3. As tabelas devem ter, no mínimo, 5 e, no máximo, 
20 intervalos de classes, para que não haja nem perda, 
nem excesso de informação.
Para este estudo, sendo n o número de elementos da amostra, 
n = 56, e , então , logo k = 7 e o número de 
intervalos utilizados será igual a 7.
Agora, vamos analisar as amplitudes e os limites de classe para 
determinar o tamanho dos intervalos. 
a) Amplitude total da distribuição (AT): é a diferença entre o 
maior valor e o menor valor observado.
AT = L(máx) – l(mín)
L(máx) = Limite máximo (maior valor)
l(min) = Limite mínimo (menor valor)
probabilidade_e_estatistica_1582.indb 52 19/07/12 11:11
53
Probabilidade e Estatística
Unidade 2
No exemplo que você está estudando: 
AT = 35,13 − 15,90 AT = 19,23 19,50
Nesta etapa, é conveniente que o resultado seja 
arredondado para cima, a fim de que não haja perda de 
informação.
b) Amplitude de um intervalo de classe (h): também chamada 
de tamanho do intervalo de classe, é obtida da seguinte forma: 
No exemplo: 
Antes de partir para a construção da tabela, é conveniente testar 
se os cálculos estão corretos. Para que isso aconteça, verifique se:
h.K > AT
Aplique sobre o exemplo dado:
2,80 . 7 = 19,60 > 19,23
Ou seja, ao somar 19,60 ao menor valor observado resulta 35,50, 
que é maior que o valor da maior observação, 35,13.
15,90 + 19,60 = 35,50 > 35,13
Caso não seja satisfeita esta condição, será necessário fazer um 
ajuste, aumentando o tamanho do intervalo. Então, resumindo, 
segundo o exemplo dado, a tabela terá:
probabilidade_e_estatistica_1582.indb 53 19/07/12 11:11
54
Universidade do Sul de Santa Catarina
 � sete intervalos; 
 � cada um com o tamanho de 2,80. 
c) limites de classes: são os extremos de cada classe. O limite 
inferior da classe (Li) é o menor número do intervalo. O limite 
superior (Ls) é o maior número do intervalo.
3º passo: escreva os intervalos da tabela.
Comece pela primeira classe, escreva o menor valor observado. 15,90
A este valor, some o h (2,8) e encontre o limite superior deste intervalo: 
15,9 + 2,8 = 18,7. Você deve escrever na tabela: 15,90 |--- 18,70
Na segunda classe, repita o último valor da classe anterior (18,7), some 
o h (2,8) e encontre o limite superior deste intervalo: 18,7 + 2,8 = 21,5. 
Você pode escrever na tabela:
18,70 |--- 21,50
Na terceira classe, repita o último valor da classe anterior (21,5), some 
o h (2,8) e encontre o limite superior deste intervalo: 21,5 + 2,8 = 24,3. 
Você pode escrever na tabela:
21,50 |--- 24,30
Usando este procedimento para as outras classes, você terá os 
seguintes intervalos a seguir, até a sétima classe:
24,30 |--- 27,10
27,10 |--- 29,90
29,90 |--- 32,70
Observe que os intervalos são escritos dessa forma: 
15,90 |--- 18,70. O que significa? 
A representação indica um intervalo fechado à esquerda e aberto 
à direita Þ [15,90; 18,70), ou seja, os valores deste intervalo 
chegam perto de 18,70, mas o valor 18,70 está no próximo 
intervalo: 18,70 |--- 21,50; o valor 21,50 não está neste intervalo, 
e sim no intervalo: 21,50 |---24,30. E assim por diante.
probabilidade_e_estatistica_1582.indb 54 19/07/12 11:11
55
Probabilidade e Estatística
Unidade 2
4º passo: agora é a vez de partir para a construção da tabela, sem 
se esquecer de seus componentes. Primeiro monte a tabela e 
escreva os intervalos.
Tabela 2.3 – Volume de vendas mensal, em milhares de reais, dos representantes de uma 
empresa que fabrica remédios – outubro/2010
Classe Volume de vendas (em mil reais)
1 15,90 |--- 18,70
2 18,70 |--- 21,50
3 21,50 |--- 24,30
4 24,30 |--- 27,10
5 27,10 |--- 29,90
6 29,90 |--- 32,70
7 32,70 |--- 35,50
Fonte: Elaboração do autor (2006).
5º passo: agora é só contar e marcar o número de valores em cada 
intervalo. É aconselhável marcar os limites dos intervalos no Rol e usar 
os traços para indicar a contagem ou marcar como no quadro a seguir:
15,90 16,08 16,13 16,43 16,59 16,69 16,84 17,05
17,25 17,76 17,76 18,50 19,00 19,67 20,08 20,30
20,58 20,80 20,81 21,36 21,65 21,73 22,49 22,65
22,73 22,77 22,79 23,05 23,08 23,25 23,74 24,11
24,89 24,89 25,30 25,77 26,60 27,43 29,05 29,55
30,43 30,93 30,93 31,53 31,72 32,63 33,05 33,33
33,55 33,86 34,36 34,49 34,76 34,83 35,03 35,13
Quadro 2.7 – Volume de vendas mensais 
Fonte: Elaboração do autor (2006).
probabilidade_e_estatistica_1582.indb 55 19/07/12 11:11
56
Universidade do Sul de Santa Catarina
Tabela 2.4 – Volume de vendas mensal, em milhares de reais, dos representantes de uma 
empresa que fabrica remédios – outubro/2010 
Classe Volume de vendas (em mil reais) Contagem
Nº de 
representantes (fi)
1 15,9 18,7 12
2 18,7 21,5 8
3 21,5 24,3 12
4 24,3 27,1 5
5 27,1 29,9 3
6 29,9 32,7 6
7 32,7 35,5 10
Total ( ) 56
Fonte: Elaboração do autor (2006).
E, no final, a tabela fica como está apresentado a seguir:
Tabela 2.5 – Volume de vendas mensal, em milhares de reais, dos representantes de uma 
empresa que fabrica remédios – outubro/2010
Fonte: Elaboração do autor (2006).
Até aqui, você estudou dois tipos de frequência: a simples e a total, e 
pôde aprender que: o número de observações de cada linha chama‑se 
frequência simples, fi; e o número total de observações chama‑se 
frequência total, . Na seção a seguir, você irá aprender que, 
além destas duas, existem outros tipos de frequência. 
probabilidade_e_estatistica_1582.indb 56 19/07/12 11:11
57
Probabilidade e Estatística
Unidade 2
Seção 2 – Tipos de frequência
A Estatística tem como uma de suas finalidades facilitar a análise 
e a leitura dos dados, e, justamente, para isso, um dos métodos 
utilizados é trabalhar com tipos de frequência. Estes tipos de 
frequência lhe serão apresentados a seguir.
Frequência acumulada 
Na tabela, na coluna da frequência acumulada, você deverá 
escrever o valor acumulado das frequências, ou seja, para 
começar, repita a frequência simples da primeira linha e, 
nas linhas seguintes, some a frequência simples à frequência 
acumulada anterior.
Este processo deverá chegar até a frequência total
fa = fa(ant) + fi
Sendo:
fa: frequência acumulada; 
fa(ant): frequência crescente da classe anterior;
fi: frequência simples da classe;
probabilidade_e_estatistica_1582.indb 57 19/07/12 11:11
58
Universidade do Sul de Santa Catarina
Acompanhe com atenção a tabela:
Tabela 2.6 – Volume de vendas
Fonte: Elaboraçãodo autor (2006).
Para que serve a frequência acumulada? 
Imagine que você está apresentando um relatório de vendas da 
empresa para a diretoria.
Então, um dos diretores lhe pergunta: “Quantos representantes 
tiveram vendas menores que 29,9 mil reais?” Você não necessitará 
fazer contas, é só observar a quinta classe, na coluna da 
frequência acumulada na tabela e dizer: “40 representantes!” 
E se perguntarem: “Quantos representantes venderam abaixo de 
24,3 mil reais?” Você vai encontrar a resposta na terceira classe na 
coluna com a frequência acumulada: “32 representantes”.
Observe que o volume de vendas questionado é sempre do limite 
superior de cada intervalo para baixo. 
probabilidade_e_estatistica_1582.indb 58 19/07/12 11:11
59
Probabilidade e Estatística
Unidade 2
Frequência relativa (fr) 
É o quociente entre a frequência (fi) da classe e o número total de 
observações.
Sendo:
fr: frequência relativa da classe;
fi: frequência simples da classe;
n: número total de observações (pode-se usar n ou ).
Neste caso, deve-se calcular a frequência com quatro 
casas decimais visando ao próximo passo.
Tabela 2.7 – Volume de vendas
Fonte: Elaboração do autor (2006).
probabilidade_e_estatistica_1582.indb 59 19/07/12 11:11
60
Universidade do Sul de Santa Catarina
Lembre-se: use sempre quatro casas decimais para 
arredondar a frequência relativa.
Frequência percentual (fp)
É a frequência relativa multiplicada por 100. É dada em 
porcentagem (%).
fp = fr . 100
Sendo:
fp: frequência percentual;
fr: frequência relativa.
Tabela 2.8 – Volume de vendas
Fonte: Elaboração do autor (2006).
probabilidade_e_estatistica_1582.indb 60 19/07/12 11:11
61
Probabilidade e Estatística
Unidade 2
Observe que, ao usar quatro casas decimais para a frequência 
relativa, o percentual ficou com duas casas decimais.
Para que serve a frequência percentual?
Mais uma vez você está apresentando um relatório de vendas da 
empresa para a diretoria.
E vem aquela pergunta: “O que representa, do total, os 
representantes que venderam de 32,70 a 35,50 mil reais?” Você 
poderia responder diretamente, sem cálculos: “17,86%.” 
E, se perguntarem: “Quantos representantes venderam de 24,3 a 
27,1 mil reais ou mais?” Você responderá: “8,93%.” 
Observe que, neste exemplo, o volume de vendas questionado é 
sempre um intervalo. Antes de acompanhar os outros tipos de 
frequência, entenda o que é ponto médio de uma classe.
Ponto médio de uma classe são os valores da variável 
que se encontram exatamente na metade do intervalo 
de cada classe.
Para calcular o ponto médio, usa-se a média aritmética simples 
dos limites de cada intervalo:
Sendo:
PM: ponto médio;
Ls: limite superior do intervalo;
Li: limite inferior de cada intervalo.
probabilidade_e_estatistica_1582.indb 61 19/07/12 11:11
62
Universidade do Sul de Santa Catarina
A tabela a seguir indica o cálculo do ponto médio para o exemplo 
que estamos estudando.
Tabela 2.9 – Volume de vendas
Fonte: Elaboração do autor (2006).
Lembre-se deste conceito: o ponto médio será usado 
para outros cálculos que você irá realizar mais adiante.
Seção 3 – Representação gráfica
O gráfico constitui outra maneira de se apresentarem os dados 
estatísticos. Eles têm a finalidade de mostrar com clareza, 
veracidade e rapidez os dados que estão sendo estudados. Além 
disso, os gráficos propiciam uma noção muito boa de como 
algum fenômeno se comporta.
Por meio de formas geométricas, os gráficos mostram, por área 
ou volume, as diferenças entre as opções de cada variável.
probabilidade_e_estatistica_1582.indb 62 19/07/12 11:11
63
Probabilidade e Estatística
Unidade 2
Tome cuidado ao interpretar um gráfico. Assim 
como os gráficos podem dar informações rápidas e 
precisas, sua manipulação pode distorcer a realidade, 
provocando tendenciosidade nas informações.
Observe os gráficos a seguir:
Gráfico 2.1 – Censo demográfico Brasil 1890 – 2000
Fonte: IBGE (2010).
Gráfico 2.2 – Censo demográfico Brasil 1890 – 2000
Fonte: IBGE (2010).
probabilidade_e_estatistica_1582.indb 63 19/07/12 11:11
64
Universidade do Sul de Santa Catarina
Observe que, no Gráfico 2.1, a impressão é que a população 
aumenta abruptamente, enquanto que, no Gráfico 2.2, a 
impressão é que a população aumenta lentamente. E a única 
diferença entre os dois gráficos é a largura que se usou para cada 
um deles. Em alguns casos, isso pode ser muito prejudicial.
Os gráficos comunicam as mesmas ideias das tabelas, porém 
produzem uma impressão e compreensão mais rápida, mais viva, 
pois eliminam detalhes desnecessários, visualizando somente as 
características mais importantes dos dados. 
O gráfico estatístico é uma forma de apresentação dos 
dados estatísticos, cujo objetivo é o de produzir, no 
investigador ou no público em geral, uma impressão 
mais rápida e viva do fenômeno em estudo, já que os 
gráficos falam mais rápido à compreensão que as séries. 
A representação gráfica de um fenômeno deve obedecer a certos 
requisitos fundamentais para ser realmente útil:
a) simplicidade: o gráfico deve ser destituído de detalhes 
de importância secundária, assim como de traços 
desnecessários que possam levar o observador a uma 
análise morosa ou com erros;
b) clareza: o gráfico deve possibilitar uma correta 
interpretação dos valores representativos do fenômeno 
em estudo;
c) veracidade: o gráfico deve expressar a verdade sobre o 
fenômeno em estudo.
Para a construção de gráficos, você deverá observar alguns itens 
que se fazem necessários neles:
 � todo gráfico deve ter título e fonte (no rodapé), para que 
o leitor não tenha a necessidade de voltar ao texto para 
saber do que se trata; 
 � a escala do eixo horizontal deve ser escrita abaixo desse 
eixo e deverá crescer da esquerda para a direita; 
probabilidade_e_estatistica_1582.indb 64 19/07/12 11:11
65
Probabilidade e Estatística
Unidade 2
 � a escala do eixo vertical deve ser escrita à esquerda do 
eixo e crescer de baixo para cima; 
 � cada eixo deve ser identificado com o que está sendo 
medido ou representado; 
 � não é necessário colocar linhas de grade (que saem das 
marcas das escalas horizontais e verticais). Estas são 
opcionais. 
Acompanhe, a seguir, um gráfico com todos os detalhes citados.
Gráfico 2.3 – Censo demográfico – Brasil – 1890 – 2000 
Fonte: Adaptado de IBGE (2010).
Antigamente, os gráficos eram feitos a mão, com a ajuda de 
régua, compasso, transferidor, esquadros e canetas ou giz 
coloridos. Hoje, podemos contar com softwares específicos que 
auxiliam e facilitam na construção de gráficos e, muitas vezes, 
propiciam mais precisão e clareza. Além dos softwares específicos 
de Estatística, temos os programas aplicativos de escritório, que 
incluem as chamadas planilhas eletrônicas.
Uma planilha eletrônica utiliza tabelas para a realização de 
cálculos e permite, também, a criação de vários tipos de gráficos, 
o que facilita a representação e análise de dados estatísticos.
Os principais tipos de gráficos são os diagramas, os cartogramas 
e os pictogramas. 
probabilidade_e_estatistica_1582.indb 65 19/07/12 11:11
66
Universidade do Sul de Santa Catarina
Na sequência deste estudo, você conhecerá alguns tipos de gráficos 
relevantes para a apresentação dos dados estatísticos. Vamos identificar 
cada tipo de gráfico, suas características e formas de análise, quando 
for o caso. Dentre os gráficos classificados como diagramas, os mais 
amplamente utilizados (e destacados a seguir) são os gráficos de 
colunas e de barras. Os outros tipos de gráficos classificados como os 
cartogramas e os pictogramas serão apresentados ao final desta seção. 
Diagramas
Os diagramas são gráficos geométricos de, no máximo, duas 
dimensões; para sua construção, em geral, fazemos uso do 
sistema cartesiano (eixo X e Y). Os principais diagramas são os 
gráficos de linhas, colunas, barras, setores ou pizza e o gráfico 
polar. Veja cada um desses tipos.
Gráfico de colunas
É usado paraapresentar séries temporais, geográficas e 
específicas. Formado por retângulos dispostos verticalmente, de 
mesma largura (arbitrária), com altura proporcional às grandezas 
(variáveis) do fenômeno a ser representado. 
Todos os retângulos têm base comum no eixo de x e, no eixo de 
y, os valores das variáveis estudadas. Observe os exemplos na 
tabela 2.10 e nos gráficos 2.4 e 2.5.
Tabela 2.10 – Mortalidade Infantil, na região Sul e Sudeste, 2004
Estado Por mil nascimentos
SC 17,2
RG 14,3
PR 20,0
SP 16,5
RJ 20,9
ES 20,1
MG 21,8
Fonte: Portal Brasil (2004).
probabilidade_e_estatistica_1582.indb 66 19/07/12 11:11
67
Probabilidade e Estatística
Unidade 2
Gráfico 2.4 – Mortalidade Infantil, na região Sul e Sudeste, 2004
Fonte: Portal Brasil (2004).
Gráfico 2.5 – Porcentagem de mulheres, com filhos antes dos 20 anos, 2000
Fonte: Population Reference Bureau (2000).
probabilidade_e_estatistica_1582.indb 67 19/07/12 11:11
68
Universidade do Sul de Santa Catarina
Gráfico de barras
Segue as mesmas normas do gráfico de coluna, porém os 
retângulos ocupam posição horizontal e, por isso, terão 
base comum no eixo y. É também mais indicado para séries 
geográficas e específicas.
Gráfico de linhas 
É comum, para quem trabalha na área de administração e 
negócios, observar o comportamento de uma variável ao longo do 
tempo. Por exemplo, um executivo que acompanha a cotação diária 
das ações da sua empresa, um gerente que acompanha o volume 
semanal de vendas de sua loja ou um engenheiro de produção que 
acompanha características de qualidade do produto que fabrica. 
Gráfico de setores ou de pizza
É usado para mostrar a importância relativa das proporções e é 
construído a partir das coordenadas polares:
 � comparar a parte com o todo;
 � é formado por um círculo, do qual cada parte representa 
um percentual da variável.
Neste caso, utilizamos o mesmo exemplo do gráfico de barras, de 
modo que você possa analisar as proporções no gráfico de setores.
Gráficos em colunas ou em barras múltiplas
Este tipo de gráfico é geralmente empregado quando queremos 
representar, simultaneamente, dois ou mais fenômenos estudados 
com o propósito de comparação.
probabilidade_e_estatistica_1582.indb 68 19/07/12 11:11
69
Probabilidade e Estatística
Unidade 2
Tabela 2.11 – Balança Comercial brasileira (Valores em US$ Milhões), 2005 a 2009
Ano Exportação Importação
2005 118.309 73.545
2006 137.807 91.350
2007 160.649 120.610
2008 197.953 173.148
2009 152.252 127.637
Fonte: Base de dados do Portal Brasil (2010).
Gráfico 2.6 – Balança comercial brasileira (Valores em US$ milhões), 2005 a 2009
Fonte: Portal Brasil (2010).
Análise dos dados: observando o gráfico, podemos 
concluir que o saldo da balança comercial brasileira 
é positivo, pois as colunas em cinza claro, que 
representam as exportações em todos os anos, são 
maiores que as colunas de cor cinza escuro que 
representam as importações.
O ano que representou um maior volume de exportação e 
também de importação foi o de 2008. O menor volume de 
importação foi no ano de 2005.
probabilidade_e_estatistica_1582.indb 69 19/07/12 11:11
70
Universidade do Sul de Santa Catarina
Gráfico Polar 
É o gráfico mais indicado quando temos necessidade de 
representar variações cíclicas, ou seja, que se repetem em períodos 
predeterminados. 
O gráfico polar é mais utilizado em estudos climáticos (para 
séries temporais). 
Cartograma
O cartograma é a representação sobre um mapa. Este gráfico é 
empregado quando o objetivo é o de figurar os dados estatísticos 
diretamente relacionados com áreas geográficas ou políticas.
Pictogramas
Pictogramas são construídos a partir de figuras ou conjunto de 
figuras representativas da intensidade ou das modalidades do 
fenômeno.
São mais utilizados em jornais, revistas, cartazes e propagandas, 
ou seja, quando se deseja dar um efeito mais atrativo ou chamar a 
atenção, sem nenhum rigor científico.
Representação gráfica de uma distribuição
Alguns gráficos em Estatística são usados para interpretações 
de informações, análises de dados e, também, para a dedução 
geométrica de fórmulas de algumas medidas importantes.
Para as distribuições de frequências simples, são utilizados o 
histograma e o polígono de frequências. E, para as frequências 
acumuladas, é utilizado o polígono de frequências acumuladas.
probabilidade_e_estatistica_1582.indb 70 19/07/12 11:11
71
Probabilidade e Estatística
Unidade 2
Histograma
Este gráfico é muito semelhante ao de colunas, ou seja, é formado 
por um conjunto de retângulos justapostos, de maneira que a 
altura de cada retângulo seja proporcional à frequência simples da 
classe por ele representada.
É construído no sistema de eixos cartesianos. No eixo horizontal, 
são marcados os valores ou intervalos das classes assumidos pela 
variável. No eixo vertical, são marcadas as frequências simples, 
que servirão para marcar a altura dos retângulos, indicando, 
assim, o número de observações (ocorrências) de cada valor ou 
classe da variável.
Como a altura de cada retângulo é proporcional à frequência 
simples, a área de cada retângulo também o é. Considerando 
isso, a soma das áreas dos retângulos também é proporcional à 
frequência total.
Como construir um histograma?
Siga os seguintes passos:
 � desenhe os eixos vertical e horizontal; 
 � faça as escalas em cada um dos eixos – no horizontal, os 
intervalos de classe; e, no vertical, a frequência; 
 � desenhe os retângulos que representam cada intervalo 
com a mesma largura de cada intervalo e com a altura 
proporcional às frequências dos intervalos; 
 � não se esqueça de escrever o título e a fonte. 
probabilidade_e_estatistica_1582.indb 71 19/07/12 11:11
72
Universidade do Sul de Santa Catarina
Observe o exemplo na tabela 2.12 e no gráfico 2.7.
Tabela 2.12 – Quantidade de óxido de enxofre
Quantidade de óxido de enxofre Nº de meses (fi)
6,2 |--- 9,9 6
9,9 |--- 13,6 10
13,6 |--- 17,3 11
17,3 |--- 21,0 20
21,0 |--- 24,7 13
24,7 |--- 28,4 7
28,4 |--- 32,1 3
Total 70
Fonte: Elaboração do autor (2006).
Gráfico 2.7 – Emissão de óxido de enxofre nos últimos 70 meses (em toneladas)
Fonte: Elaboração do autor (2006).
Há uma analogia dos histogramas com os gráficos de barras. 
Mas, nos gráficos de barras, não há necessidade de se usar escala 
horizontal contínua, além de não ser necessária a rigidez de 
construção que têm os histogramas.
probabilidade_e_estatistica_1582.indb 72 19/07/12 11:11
73
Probabilidade e Estatística
Unidade 2
Polígono de frequências
Unindo por linhas retas os pontos médios das bases superiores 
dos retângulos do histograma, obtém-se outra representação dos 
dados, denominada polígono de frequências.
Você pode observar que a área do histograma é igual à área 
abaixo do polígono de frequências, ou seja, os retângulos 
que ficam fora são compensados pelos triângulos que estão 
adicionados por dentro.
Gráfico 2.8 – Emissão de óxido de enxofre – em toneladas
Fonte: Elaboração do autor (2006).
probabilidade_e_estatistica_1582.indb 73 19/07/12 11:11
74
Universidade do Sul de Santa Catarina
Síntese
Nesta unidade, você estudou como organizar e agrupar dados, 
como construir tabelas com todos seus elementos e, também, 
como acrescentar informações às tabelas que auxiliem sua 
leitura. Aprendeu a montar tabelas com dados quantitativos, e 
sempre que precisar trabalhar com esses dados, você vai recorrer 
às tabelas de frequências. Este conhecimento será bastante útil 
quando for preciso apresentar algum relatório, e as pessoas para 
quem o apresenta levantarem alguns questionamentos.
Ter conhecimento de como interpretar uma tabela permite que 
você tenha acesso rápido às respostas com a devida precisão. 
Nessa unidade, você estudou, também, como os gráficos 
facilitam a nossa vida. Com eles, temos acesso rápido e claro às 
informações, sem necessidade de grandes cálculos.
Mas um alerta importante que não pode ser esquecido é queapenas a qualidade e a clareza do gráfico dão condição para um 
bom trabalho, afastando toda possibilidade de tendenciosidade.
Nesta unidade, você pôde estudar diferentes tipos de diagramas 
e conhecer o que são os pictogramas e os gráficos representativos 
de distribuição de frequências. Com tudo isso, agora você já tem 
condições de realizar algumas análises rápidas de diversos tipos 
de gráficos. 
probabilidade_e_estatistica_1582.indb 74 19/07/12 11:11
75
Probabilidade e Estatística
Unidade 2
Atividades de autoavaliação
Ao final de cada unidade, você realizará atividades de autoavaliação. O 
gabarito está disponível no final do livro didático, mas se esforce para 
resolver as atividades sem a ajuda do gabarito, pois, assim, você estará 
promovendo (e estimulando) a sua aprendizagem.
1) Um relatório recente distinguiu em seis tipos os principais motivos de 
tensão (estresse). A pesquisa realizada para provar isso resultou nos 
dados a seguir (dados fictícios):
MP MC DO DG MF
DM MF MP DG MC
MC MF MF MC MC
MF MC MP DO MP
MP MP DM MP DO
MP DM DG DM MC
MF MF MF MF MF
DO MP DG MP DG
MF MC MF MP DO
DO DO DM MF MC
MF DM MC MC DG
DO MF DG MF MC
Legenda: tipos de fobias 
MF: Morte de um filho;
MC: Morte do cônjuge;
MP: Morte dos pais ou irmãos;
DO: Divórcio;
DG: Doença grave;
DM: Demissão.
Monte a tabela não esquecendo de todos seus componentes.
probabilidade_e_estatistica_1582.indb 75 19/07/12 11:11
76
Universidade do Sul de Santa Catarina
2) Uma empresa procurou estudar a ocorrência de acidentes com seus 
empregados, tendo, para isso, realizado levantamento abrangendo um 
período de 36 meses. No levantamento, foi observado o número de 
operários acidentados para cada mês. Os dados correspondentes são: 
4 8 6 6 4 5
6 5 8 5 6 5
8 5 7 6 8 7
3 3 4 4 3 3
5 5 4 6 5 5
7 7 6 8 8 7
Levando em consideração os dados apresentados, monte a tabela 
com as variáveis quantitativa discreta. Procure incluir todos os seus 
componentes.
3) Os dados a seguir representam a renda de uma amostra de famílias de 
um bairro de classe baixa de Florianópolis, em reais (dados fictícios). 
Construa a tabela de distribuição de frequências sem esquecer de 
nenhum de seus elementos. Usar k = 6 (número de intervalos). 
Sugestão: ao calcular o h (tamanho de cada intervalo), arredonde para 
um número inteiro. Exemplo: 3,84 4
115 121 117 124 122 116
123 118 123 119 123 126
128 122 112 125 124 126
125 121 129 127 128 129
113 115 116 124 119 118
126 129 116 127 123 121
probabilidade_e_estatistica_1582.indb 76 19/07/12 11:11
77
Probabilidade e Estatística
Unidade 2
4) Os dados abaixo representam a renda de uma amostra de famílias de 
um bairro de classe baixa de Florianópolis, em reais (dados fictícios). 
Renda de famílias de um bairro da classe baixa de Florianópolis
Renda (R$) Nº de famílias f iacd 
“abaixo de”
fiacid 
“acima de”
fr fp (%) PM
112 |--- 115 2
115 |--- 118 6
118 |--- 121 4
121 |--- 124 9
124 |--- 127 8
127 |--- 130 7
Total (Σfi) 36
FONTE: Elaboração do autor (2006). 
Complete a tabela com as frequências acumuladas direta e indireta, a 
frequência relativa, percentual e o ponto médio. Depois responda as 
perguntas:
a) Quantas famílias apresentam renda menor que 124? 
______ (use a coluna da fiacd “abaixo de”)
b) Quantas famílias apresentam renda menor que 127? 
______ (use a coluna da fiacd “abaixo de”)
c) Quantas famílias apresentam renda maior ou igual a 124? 
______ (use a coluna da fiacd “acima de”)
d) Quantas famílias apresentam renda maior ou igual a 127? ______ 
(use a coluna da fiacd “acima de”) 
e) Qual foi o percentual de famílias com renda de 118 a 121 pontos? 
______ (use a coluna da fp)
f) Qual foi o percentual de famílias com renda de 121 a 124 pontos? 
______ (use a coluna da fp) 
probabilidade_e_estatistica_1582.indb 77 19/07/12 11:11
78
Universidade do Sul de Santa Catarina
5) Uma empresa procurou estudar a ocorrência de acidentes com seus 
empregados, tendo, para isso, a CIPA realizado um levantamento 
abrangendo um período de 36 meses, em que foi observado o número de 
operários acidentados para cada mês. A tabela abaixo resume estes dados:
Número de operários acidentados para cada mês
Número de 
acidentados
Número de 
meses
fiacd 
“abaixo de”
fiaci 
“acima de”
fr fp (%)
3 4
4 5
5 9
6 7
7 5
8 6
Total (Σfi) 36
Fonte: Elaboração do autor (2006). 
Complete a tabela com as frequências acumulada direta e indireta, a 
frequência relativa e a percentual. Depois responda as perguntas:
a) Em quantos meses a empresa teve um número de funcionários 
acidentados menor que 6? 
______ (use a coluna da fiacd “abaixo de”) 
(observação: menor que 6 = 5, 4 e 3)
b) Em quantos meses a empresa teve um número de funcionários 
acidentados menor ou igual a 6? 
______ (use a coluna da fiacd “abaixo de”) 
(observação: menor ou igual a 6 = 6, 5, 4 e 3)
c) Em quantos meses a empresa teve um número de funcionários 
acidentados maior que 5? 
______ (use a coluna da fiaci “acima de”) 
(observação: maior que 5 = 6, 7 e 8)
d) Em quantos meses a empresa teve um número de funcionários 
acidentados maior ou igual a 5? 
______ (use a coluna da fiaci “acima de”) 
(observação: maior ou igual a 5 = 5, 6, 7 e 8)
e) Qual foi o percentual de meses em que a empresa verificou 5 
funcionários acidentados? 
______ (use a coluna da fp) 
f) Qual foi o percentual de meses em que a empresa verificou 7 
funcionários acidentados? 
______ (use a coluna da fp)
probabilidade_e_estatistica_1582.indb 78 19/07/12 11:11
79
Probabilidade e Estatística
Unidade 2
6) Procure, em jornais, revistas, cartazes, internet etc., três tipos de gráficos 
diferentes, semelhantes aos que você estudou até agora, e os analise. 
Não esqueça de procurar gráficos cujo tema seja relacionado ao seu 
curso. Faça uma descrição sucinta de cada um deles e trace comentários 
sobre tendências, maior proporção, maior alta, maior baixa etc.
7) A seguir, você tem uma distribuição de frequências e um sistema de 
eixos. Construa o histograma e o polígono de frequências para essa 
distribuição usando o sistema de eixos (não esqueça de todos os 
componentes de um gráfico, inclusive as escalas dos eixos, título e 
fonte): tempo de sono, em minutos, induzido em ratos por injeção de 
um certo químico, na dosagem de 40 mg por quilo.
Tempo de sono (em min.) Número de ratos
7 |--- 12 2
12 |--- 17 6
17 |--- 22 17
22 |--- 27 9
27|--- 32 5
32 |--- 37 2
probabilidade_e_estatistica_1582.indb 79 19/07/12 11:11
80
Universidade do Sul de Santa Catarina
Saiba mais
Você quer aprofundar seus estudos sobre o conteúdo desta 
unidade? A sugestão é que você pesquise em:
COSTA, Sérgio Francisco. Introdução ilustrada à estatística. 3. 
ed. São Paulo: Harbra, 1998.
CRESPO, Antônio Arnot. Estatística fácil. 19. ed. São Paulo: 
Saraiva, 2009.
FLEMMING, Diva Marília. Representações gráficas. São 
José: Saint Germain, 2003.
LEVIN, Jack. Estatística aplicada às ciências humanas. São 
Paulo: Habra, 1987.
NEUFELD, John L. Estatística aplicada à administração 
usando excel. São Paulo: Prentice Hall, 2003.
SILVA, Ermes Medeiros da. Estatística para os cursos de 
economia, administração e ciências contábeis. 3. ed. São Paulo: 
Atlas, 1999. v. 1.
TOLEDO, Geraldo Luciano; OVALLE, Ivo Izidoro. 
Estatística básica. 2. ed. São Paulo: Atlas, 1985.
TRIOLA, Mario F. Introdução à estatística. Rio de Janeiro: 
LTC, 1999.
VIEIRA, Sonia. Princípios de estatística. São Paulo: Pioneira, 
2003.
probabilidade_e_estatistica_1582.indb 80 19/07/12 11:11
3UNIDADE 3Medidas de posição e dispersão
Objetivos de aprendizagem
 � Conhecer os tipos de medidas de posição. 
 � Calcular e interpretar a média, a moda e a mediana 
para dados brutos e agrupados.
 � Compreender e calcular separatrizes.
 � Compreender os tipos de medidas de dispersão.
 � Calcular e interpretar variância e desvio padrão para 
dados brutos e agrupados.
Seções de estudo
Seção 1 Medidas de posição
Seção 2 Gráficos box-plot e ramo efolhas
Seção 3 Medidas de dispersão
Seção 4 Coeficiente de variação
probabilidade_e_estatistica_1582.indb 81 19/07/12 11:11
82
Universidade do Sul de Santa Catarina
Para início de estudo
Nessa unidade, você vai obter mais uma ferramenta para 
auxiliá-lo a compreender e utilizar a Estatística no seu dia a dia 
profissional. O objetivo aqui é estudar medidas importantes e 
bastante utilizadas nos métodos estatísticos.
O cálculo de medidas como a média, a moda e a mediana, e os 
conceitos apresentados nesta unidade, são de grande valia no 
seu cotidiano profissional, pois lhe fornecerão dados que serão 
pertinentes para o entendimento de algum fato ou acontecimento. 
Chamamos essas medidas de medidas de posição.
Mas conhecer as interpretações destas medidas não basta por si só. 
Através delas, podemos chegar a algumas conclusões, mas não são 
suficientes para que possamos avaliar o comportamento dos dados.
Por isso, nesta unidade, você vai estudar, também, medidas que 
irão auxiliá-lo na avaliação do comportamento das séries de 
dados com relação a sua média. Chamamos essas medidas de 
medidas de dispersão.
Está preparado(a)? Então inicie agora a leitura da seção a seguir!
Seção 1 – Medidas de posição
Muitas vezes você irá se deparar com uma massa de dados grande 
o bastante para que a leitura e a análise se tornem muito difíceis. 
E como fazer para tirar informações relevantes e resumir os 
dados de forma eficaz nesses casos? Usando medidas estatísticas! 
Nesta unidade, vamos ver algumas delas.
As medidas de posição, assim chamadas pela posição que 
elas ocupam na série estatística, quando bem utilizadas e 
interpretadas, podem ser úteis, não só por elas mesmas, mas 
também, auxiliando o cálculo de outras medidas.
probabilidade_e_estatistica_1582.indb 82 19/07/12 11:11
83
Probabilidade e Estatística
Unidade 3
Além de tudo, ela facilita o estudo de grandes volumes de dados, 
pois as medidas de posição podem resumir as informações, dando 
a você uma noção do comportamento do todo. As medidas de 
posição estão divididas da seguinte maneira:
a) medidas de tendência central: são valores da variável 
que tendem a estar no centro da série, por isso o nome. 
Refere-se ao valor da variável que está, senão no centro, 
perto dele. Está dividia em três tipos: média, mediana e 
moda.
b) separatrizes: são valores da variável que dividem a 
série ordenada de dados em partes que contém a mesma 
quantidade de observações.
Medidas de Tendência Central – Média
A média é uma das medidas mais importantes dentro da 
Estatística. Ela é o ponto de equilíbrio de uma série de dados. 
Veja a figura a seguir, extraída do livro Introdução à Estatística, 
de Mário F. Triola (1999).
Figura 3.1 – A média como ponto de equilíbrio 
Fonte: Triola (1999, p. 32).
Vários tipos de médias podem ser calculados para uma massa 
de dados. A mais importante é a média aritmética, que você irá 
estudar nessa seção.
probabilidade_e_estatistica_1582.indb 83 19/07/12 11:11
84
Universidade do Sul de Santa Catarina
A média aritmética é a soma de todos os elementos de uma série 
de dados, dividida pelo número de elementos que compõe essa 
série. Veja a seguir como representá-la.
Notação:
 = média dos dados de uma amostra.
μ = média dos dados de uma população (em que μ = 12° letra do 
alfabeto grego, “μ” lê-se como “mi”).
A média aritmética para dados brutos
Agora, você vai calcular a média para dados que não foram 
organizados em tabelas, ou seja, estão conforme foram coletados, 
brutos. 
A soma de todos os valores, dividida pelo número de valores.
Em que:
n = número de valores da série (ou tamanho da amostra).
xi = valores da série.
Veja a seguir um exemplo bem detalhado para compreender 
como realizar os cálculos.
Um exemplo bem típico é calcular a média das notas das provas. 
Digamos que as notas de uma disciplina cursada por você sejam: 
7; 7,8; 6 e 8, então a média será:
probabilidade_e_estatistica_1582.indb 84 19/07/12 11:11
85
Probabilidade e Estatística
Unidade 3
A média aritmética para dados agrupados
Agora, você vai calcular a média para dados que foram 
organizados em tabelas, ou seja, após a coleta, eles foram 
organizados em categorias e escritos em uma tabela.
Dados agrupados sem intervalos (variável discreta)
Para os dados agrupados (em tabela), sem intervalos, utiliza-se a 
fórmula descrita a seguir, em que cada frequência simples pode 
ser considerada como peso. Por isso que se chama, também, de 
média aritmética ponderada (pesos).
A soma de todos os valores multiplicados por sua frequência 
simples, dividida pela soma das frequências (frequência total).
Em que:
n = número de valores da série (ou tamanho da amostra)
xi = valores da série
fi = frequência simples de cada xi
Veja a seguir um exemplo. Calcule a média dos dados 
representados na tabela a seguir:
Tabela 3.1 – Número de filhos por famílias de um bairro de Florianópolis
No de filhos 
(xi)
No de famílias 
(fi)
xi.fi
0 14 0
1 16 16
2 11 22
3 9 27
4 4 16
5 1 5
6 1 6
Total (Σfi) 56 92
Fonte: Elaboração do autor (2006).
0×14 = 0
1×16 = 16
2×11 = 22
3×9 = 27
Σxi.fi = 92
Somar as frequências simples
probabilidade_e_estatistica_1582.indb 85 19/07/12 11:11
86
Universidade do Sul de Santa Catarina
Veja a seguir como calcular passo a passo
Passo 1: some a coluna das frequências simples (fi) para obter Σfi 
(frequência total).
 = 56
Passo 2: multiplique cada xi por sua correspondente fi na coluna xi.fi.
Passo 3: some os valores calculados no passo 2 e escreva a soma no 
final da coluna. Esse resultado é o Σxi.fi. 
xi.fi = 92
Passo 4: divida o resultado do passo 3 (Σxi.fi) pelo resultado do 
passo 1 (Σfi).
Como interpretar estes dados? O valor médio da série é 1,64, 
ou seja, a média de filhos por família é de 1,64 filhos. Analisando 
dessa maneira, pode parecer um absurdo, mas você pode concluir 
que a média de filhos por família é de 1 a 2 filhos.
Dados agrupados com intervalos (variável contínua)
Para os dados agrupados em tabela, com intervalos, você deve 
utilizar a fórmula descrita a seguir, semelhante àquela utilizada 
para dados sem intervalos, entretanto, por estarmos usando 
intervalos, usamos os pontos médios e não xi.
A soma de todos os pontos médios multiplicados por sua 
frequência simples, dividida pela soma das frequências 
(frequência total).
probabilidade_e_estatistica_1582.indb 86 19/07/12 11:11
87
Probabilidade e Estatística
Unidade 3
Em que:
n = número de valores da série (ou tamanho da amostra)
PM = ponto médio do intervalo
fi = frequência simples de cada intervalo
Quando trabalhamos com dados agrupados em intervalos, 
passamos a trabalhar com a perda dos valores individuais, ou 
seja, sabemos a frequência de cada intervalo, mas não sabemos 
exatamente quais são os valores contidos nele (intervalo). Por 
esse motivo, o cálculo da média, nesse caso, é feito com o uso do 
ponto médio. A média, sendo assim, é um valor aproximado.
Veja o exemplo a seguir para compreender. 
Veja a seguir como calcular passo a passo
Passo 1: some a coluna das frequências simples (fi) para obter Σfi 
(frequência total).
 = 56
Passo 2: calcule o ponto médio de cada intervalo. Você lembra?
Passo 3: multiplique cada PM por sua correspondente fi e escrever na 
coluna PM.fi.
probabilidade_e_estatistica_1582.indb 87 19/07/12 11:11
88
Universidade do Sul de Santa Catarina
Passo 4: some os valores calculados no passo 3 e escreva a soma no 
final da coluna; esse resultado é o ΣPM.fi.
ΣPMi.fi = 1386
Passo 5: divida o resultado do passo 4 (ΣPM.fi) pelo resultado do 
passo 1 (Σfi).
Como interpretar o resultado? A quantidade média de óxido de 
enxofre emitida, em 56 meses, foi de 24,75 toneladas.
Calcule a média dos dados representados como na tabela a seguir:
Tabela 3.2 – Quantidade emitida de óxido de enxofre (SO), em toneladas, pelas fábricas 
do distrito industrial de Florianópolis
Qtde. de SO 
(em ton.)
Nº de meses 
(fi)
PM PM.fi
15,9 |--- 18,7 12 17,3 207,618,7 |--- 21,5 8 20,1 160,8
21,5 |--- 24,3 12 22,9 274,8
24,3 |--- 27,1 5 25,7 128,5
27,1 |--- 29,9 3 28,5 85,5
29,9 |--- 32,7 6 31,3 187,8
32,7 |--- 35,5 10 34,1 341
Total (Σfi) 56 1386
Fonte: Elaboração do autor (2006).
17,3×12 = 207,6
20,1×8 = 160,8
22,9×12 = 274,8
25,7×5 = 128,5
Σxi.fi = 92
Somar as 
frequências simples
(15,9 + 18,7)⁄2 = 17,3
probabilidade_e_estatistica_1582.indb 88 19/07/12 11:11
89
Probabilidade e Estatística
Unidade 3
Medidas de Tendência Central – Mediana
A mediana é um valor que divide a série de dados em duas partes 
iguais, ou seja, é o valor observado que está no meio da série.
Notação:
Me = Mediana (também é usado md).
Mediana para dados brutos
Agora, você vai calcular a mediana para dados que não foram 
organizados em tabelas, ou seja, estão conforme foram coletados, 
brutos. Após a ordenação crescente dos dados, determinamos o 
número de elementos (n) do mesmo.
Separamos em dois casos:
a) quando o n (tamanho da amostra) é ímpar: o cálculo da 
posição da mediana deve ser conforme segue:
b) quando o n (tamanho da amostra) é par: o cálculo da 
posição da mediana deve ser realizado com a seguinte 
fórmula:
 e 
probabilidade_e_estatistica_1582.indb 89 19/07/12 11:11
90
Universidade do Sul de Santa Catarina
Veja passo a passo como calcular a mediana para dados brutos quando 
o (n) é ímpar
Calcular a mediana da série X: 5, 30, 27, 9, 15, 19, 24, 20, 31.
Passo 1: ordene os valores de forma crescente → 5, 9, 15, 19, 20, 24, 
27, 30, 31.
Passo 2: o número de elementos é 9 (n = 9, ímpar).
Passo 3: calcule a posição da mediana.
Passo 4: a mediana é o 5º elemento.
Me = 20
1º 2º 3º 4º 5º 6º 7º 8º 9º
5 9 15 19 20 24 27 30 31
Como interpretar estes dados? 50% dos valores da série são 
menores ou iguais a 20, e 50% dos valores da série são maiores ou 
iguais a 20.
probabilidade_e_estatistica_1582.indb 90 19/07/12 11:11
91
Probabilidade e Estatística
Unidade 3
Veja passo a passo como calcular a mediana para dados brutos quando 
o (n) é par 
Para você encontrar a mediana, é preciso calcular o ponto médio 
dos dois valores que ocupam as posições calculadas.
Calcular a mediana da série X: 5, 30, 27, 9, 15, 19, 24, 20.
Passo 1: ordene de forma crescente 5, 9, 15, 19, 20, 24, 27, 30.
Passo 2: o número de elementos é 8 (n = 8, par).
Passo 3: calcule a posição de Pos1 e Pos2.
Passo 4: a mediana está entre o 4º e o 5º elemento. 
1º 2º 3º 4º 5º 6º 7º 8º
5 9 15 19 19,5 20 24 27 30
Como interpretar estes dados? 50% dos valores da série 
são menores que 19,5, e 50% dos valores da série são valores 
maiores que 19,5.
Você viu como se encontra a mediana para dados brutos? 
Assim como você estudou na média, aqui, também para efeito 
de cálculo, você usará diferente tratamento quando se tratar 
de dados agrupados com intervalos (variável discreta) e dados 
agrupados sem intervalos (variável contínua). 
probabilidade_e_estatistica_1582.indb 91 19/07/12 11:11
92
Universidade do Sul de Santa Catarina
Medidas de posição usando o Excel
Mais uma vez, você poderá se deparar com um volume grande 
de dados. O Microsoft Office Excel é muito útil para este tipo 
de situação. Siga o pequeno roteiro para calcular as medidas de 
tendência central no Excel:
Passo 1: Abrir o arquivo que está na midiateca de nome dados.xls, 
usando o Excel;
Passo 2: Clique com o botão esquerdo do mouse no menu 
“Ferramentas” e, se o item “Análise de dados” não estiver ativo no 
menu, clique em “Suplementos”, conforme a imagem a seguir; caso 
contrário, passe para o passo 4.
Figura 3.2 – Interface do programa Microsoft Office Excel 2003
Fonte: Adaptado pelo autor (2006).
Passo 3: Caso tenha clicado em “Suplementos”, a seguinte janela 
abrirá, na qual você deverá marcar as opções “Ferramentas de 
análise” e “Ferramentas de análise – VBA”, em seguida, clique em OK.
probabilidade_e_estatistica_1582.indb 92 19/07/12 11:11
93
Probabilidade e Estatística
Unidade 3
Figura 3.3 – Interface do programa Microsoft Office Excel 2003
Fonte: Adaptado pelo autor (2006).
Passo 4: Voltando ao menu “Ferramentas”, clique no item “Análise de 
dados”, como mostra a Figura a seguir.
Figura 3.4 – Interface do programa Microsoft Office Excel 2003
Fonte: Adaptado pelo autor (2006).
probabilidade_e_estatistica_1582.indb 93 19/07/12 11:11
94
Universidade do Sul de Santa Catarina
Passo 5: Após o clique, irá abrir a seguinte janela, na qual você irá 
selecionar o item “Estatística Descritiva” e clicar em OK.
Figura 3.5 – Interface do programa Microsoft Office Excel 2003
Fonte: Adaptado pelo autor (2006).
Passo 6: Na janela que se abre (mostrada adiante), você deve indicar 
os dados a serem analisados, ou seja, no quadro ao lado do item 
“Intervalo de entrada” devem aparecer as células que contêm os 
dados. Selecione a coluna A (basta clicar com o mouse e arrastar, com 
o botão pressionado, até o último quadrinho – célula) e tecle “Enter”. 
Marque a opção “Resumo estatístico” e, após este procedimento, 
você deve clicar em OK.
Figura 3.6 – Interface do programa Microsoft Office Excel 2003
Fonte: Adaptado pelo autor (2006).
probabilidade_e_estatistica_1582.indb 94 19/07/12 11:11
95
Probabilidade e Estatística
Unidade 3
Passo 7: Uma nova planilha é criada com as informações, conforme a 
seguinte figura. 
Figura 3.7 – Interface do programa Microsoft Office Excel 2003
Fonte: Adaptado pelo autor (2006).
Medidas de Tendência Central – Moda
A moda é um valor que mais se repete em uma série de dados, ou 
seja, de maior frequência.
Notação:
Mo = Moda.
probabilidade_e_estatistica_1582.indb 95 19/07/12 11:11
96
Universidade do Sul de Santa Catarina
Moda para dados brutos
Agora, você vai encontrar a moda para dados que não foram 
organizados em tabelas, ou seja, que estão conforme foram 
coletados, brutos. A moda será o valor que mais se repete no 
conjunto de dados.
Veja os exemplos:
Exemplo 1: X: 15, 16, 19, 20, 20, 22, 22, 22, 25, 26, 28.
O elemento que mais se repete é o 22, então, Mo = 22. Observe 
que o número 20 se repete, mas não mais que o 22. Para esse 
caso, no qual a Mo = 22, afirma-se que a série é unimodal.
Exemplo 2: X: 15, 16, 20, 20, 20, 22, 22, 22, 25, 26, 28.
Os elementos que mais se repetem são o 20 e o 22, então, 
Mo1 = 20 e Mo2 = 22. Para esse caso, no qual temos duas modas 
na série, afirma-se que a série é bimodal. Acima de duas modas, 
é mais comum chamarmos a série de polimodal.
Exemplo 3: X: 20, 20, 22, 22, 25, 25, 28, 28.
Na série anterior, não temos um elemento que mais se repete, 
pois todos têm a mesma frequência. Nesse caso, afirma-se que a 
série é amodal.
Você viu como se encontra a moda para dados brutos. Assim 
como você estudou na média, aqui, também para efeito de 
cálculo, você usará diferente tratamento quando se tratar de 
dados agrupados com intervalos (variável discreta) e dados 
agrupados sem intervalos (variável contínua). Mas, para a 
finalidade deste estudo, não será incluído.
Entre média, mediana ou moda: qual utilizar?
probabilidade_e_estatistica_1582.indb 96 19/07/12 11:11
97
Probabilidade e Estatística
Unidade 3
Não há uma resposta simples e objetiva para determinar a medida 
que seja mais representativa. A seguir, você encontra um resumo 
das vantagens e desvantagens de cada medida de tendência central:
Medida Definição Frequência
Existência Leva em 
conta todos 
os valores?
Afetada 
pelos 
valores 
extremos?
Vantagens e 
desvantagens
Média
Soma de todos os 
valores divididos 
pelo número de 
valores.
Mais usada. Existe sempre. Sim. Sim.
Usada em toda 
Estatística; 
funciona bem 
com muitos 
métodos 
estatísticos.
Mediana Valor que divide a série na metade.
Usada 
comumente. Existe sempre. Não. Não.
Costuma ser 
uma boa 
escolha se há 
alguns valores 
extremos.
Moda
Valor que mais 
se repete (maior 
frequência).
Usada às 
vezes.
Pode não 
existir ou, 
ainda, pode 
haver mais de 
uma.
Não. Não.
Apropriada para 
dados ao nível 
nominal.
Quadro 3.1 – Resumodas vantagens e desvantagens de cada medida de tendência central 
Fonte: Elaboração do autor (2006).
Separatrizes
Na maioria dos casos, o pesquisador tem interesse em conhecer 
outros aspectos relativos ao conjunto de valores, além de um valor 
central ou valor típico. Algumas informações relevantes podem 
ser obtidas através do conjunto de medidas: média, extremos, 
quartís, decís, percentís etc. Veja, a seguir, mais detalhes e 
exemplos de como calcular as separatrizes.
a) Quartís: divide uma série ordenada em quatro partes 
iguais, ou seja, em partes de 25% cada.
Representação: Q1, Q2 e Q3. 
Denominação: 1º quartil, 2º quartil e 3º quartil.
probabilidade_e_estatistica_1582.indb 97 19/07/12 11:11
98
Universidade do Sul de Santa Catarina
b) Decís: divide uma série ordenada em 10 partes iguais, ou 
seja, em partes de 10% cada.
Representação: D1, D2, .... e D9. 
Denominação: 1º decil, 2º decil, ... e 9º decil.
c) Percentil: divide uma série ordenada em 100 partes 
iguais, ou seja, em partes de 1% cada.
Representação: P1, P2, .... e P99. 
Denominação: 1º percentil, 2º percentil, ... e 99º percentil.
Note que a mediana também é uma separatriz. Você saberia dizer 
com quais separatrizes podemos comparar? Veja: 
Q2 = D5 = P50 = Me 
Todas essas medidas dividem a série de dados pela metade.
 » 50% dos valores são maiores que Q2 = D5 = P50 = 
Me; e
 » 50% dos valores são menores que Q2 = D5 = P50 = 
Me.
Separatrizes para dados brutos
O procedimento é bastante semelhante ao da mediana. Preste 
atenção nas explicações a seguir: após a ordenação crescente dos 
dados (rol), determinamos o seu número de elementos (n).
Veja o exemplo passo a passo 
Calcular Q1 para a série de dados X: 22, 15, 20, 22, 28, 20, 20, 
22, 25, 26, 16.
Passo 1: ordene de forma crescente (rol) 15, 16, 20, 20, 20, 22, 22, 
22, 25, 26, 28.
probabilidade_e_estatistica_1582.indb 98 19/07/12 11:11
99
Probabilidade e Estatística
Unidade 3
Passo 2: o número de elementos é 11 (n = 11, número ímpar). Aqui, 
você deve adotar procedimento semelhante ao da mediana e deve 
usar a mesma fórmula para calcular a posição. Lembre-se: a posição! 
Assim, você irá encontrar a mediana, ou seja, o segundo quartil (Q2).
Passo 3: Pos = 6, ou seja, Q2 ocupa a 6ª posição.
1º 2º 3º 4º 5º 6º 7º 8º 9º 10º 11º
15 16 20 20 20 22 22 22 25 26 28
Observe que o Q2 = 22. 
Interpretação para Q2 = 22: 50% dos valores da série são 
menores ou iguais que 22, e 50% dos valores da série são maiores 
ou iguais que 22. Antes do Q2, está formado um novo conjunto 
de dados, mostrado a seguir:
1º 2º 3º 4º 5º
15 16 20 20 20
Neste caso, a mediana (desta nova série de dados) será o primeiro 
quartil. É só repetir o mesmo processo feito nos passos 2 e 3.
Passo 4: o número de elementos é 5 (n = 5, ímpar).
probabilidade_e_estatistica_1582.indb 99 19/07/12 11:11
100
Universidade do Sul de Santa Catarina
Passo 5: Pos = 3, ou seja, Q1 ocupa a 3ª posição. 
1º 2º 3º 4º 5º
15 16 20 20 20
Observe que o elemento que ocupa a terceira posição é o 20, 
então, Q1 = 20.
Como interpretar estes dados? 25% dos dados observados são 
menores ou iguais a 20. 75% dos valores observados são maiores 
ou iguais a 20.
Observe que pode ser usado, também, para calcular a posição 
do primeiro quartil e do terceiro, respectivamente, as seguintes 
fórmulas:
Para o primeiro quartil 
Para o terceiro quartil 
Veja passo a passo como você pode calcular o terceiro quartil 
Passo 1: o número de elementos é 11 (n = 11).
Passo 2: Pos = 9, ou seja, Q3 ocupa a 9ª posição.
1º 2º 3º 4º 5º 6º 7º 8º 9º 10º 11º
15 16 20 20 20 22 22 22 25 26 28
probabilidade_e_estatistica_1582.indb 100 19/07/12 11:11
101
Probabilidade e Estatística
Unidade 3
Observe que o elemento que ocupa a nona posição é o 25, 
então, Q3 = 25.
Percentis
Observação: para calcular a posição dos percentis use a seguinte 
fórmula:
Para o primeiro quartil 
PPi = posição da separatriz.
N ou n = tamanho da população (ou amostra).
i = número da separatriz (ex.: P60 = i = 60).
Continuando com o mesmo exemplo, calcule o sexagésimo percentil.
Passo 1: o número de elementos é 11 (n = 11) e o i = 60.
Passo 2: PP60 = 7,2, ou seja, P60está entre a 7ª e a 8ª posições. 
1º 2º 3º 4º 5º 6º 7º PP60 8º 9º 10º 11º
15 16 20 20 20 22 22 P60 22 25 26 28
probabilidade_e_estatistica_1582.indb 101 19/07/12 11:11
102
Universidade do Sul de Santa Catarina
Passo 3: o Para calcular o sexagésimo percentil, você deve encontrar 
o valor que fica entre os valores que ocupam a 7ª e a 8ª posições.
 � Valor que ocupa a 7ª posição = 22.
 � Valor que ocupa a 8ª posição = 22.
Então, P60 = 22.
Como interpretar estes dados? 60% dos dados observados são 
menores ou iguais a 22. 40% dos valores observados são maiores 
ou iguais a 22.
Decís
Se você notar, poderá comparar os decís com alguns percentis, ou seja:
Decís 1º 2º 3º 4º 5º 6º 7º 8º 9º
Percentis 10º 20º 30º 40º 50º 60º 70º 80º 90º
Isso mesmo, por exemplo, o D1 = P10, o D2 = P20, D3 = P30 e, 
assim, sucessivamente. Note, também, que as interpretações são 
as mesmas:
 � para o primeiro decil: 10% dos valores observados são 
menores e 90% dos valores observados são maiores;
 � para o segundo decil: 20% dos valores observados são 
menores e 80% dos valores observados são maiores;
 � para o terceiro decil: 30% dos valores observados são 
menores e 70% dos valores observados são maiores etc.
Continuando com o mesmo exemplo, calcule o terceiro decil. 
Note que ele é igual ao trigésimo percentil (D3 = P30)! Será a 
mesma coisa que calcular P30.
probabilidade_e_estatistica_1582.indb 102 19/07/12 11:11
103
Probabilidade e Estatística
Unidade 3
Veja passo a passo
Passo 1: o número de elementos é 11 (n = 11) e o i = 30.
Passo 2: PD3 = PP30 = 3,6, ou seja, D3 está entre a 3ª e a 4ª posições.
1º 2º 3º PD3 4º 5º 6º 7º 8º 9º 10º 11º
15 16 20 D3 20 20 22 22 22 25 26 28
Passo 3: para calcular o terceiro decil, você deve encontrar o valor 
que fica entre os valores que ocupam a 3ª e a 4ª posições. 
 � Valor que ocupa a 3ª posição = 20.
 � Valor que ocupa a 4ª posição = 20.
Então, D3 = 20.
Como interpretar estes dados? 30% dos dados observados são 
menores ou iguais a 20. 70% dos valores observados são maiores 
ou iguais a 20. 
Assim como você estudou na média, aqui, também para efeito 
de cálculo, você usará diferente tratamento quando se tratar 
de dados agrupados com intervalos (variável discreta) e dados 
agrupados sem intervalos (variável contínua). Mas para a 
finalidade deste estudo não será incluído.
probabilidade_e_estatistica_1582.indb 103 19/07/12 11:11
104
Universidade do Sul de Santa Catarina
Seção 2 – Gráficos box-plot e ramo e folhas
O gráfico box plot (gráfico de caixa) é uma ferramenta 
exploratória de análise de dados, cujo principal propósito é dar ao 
usuário um método eficiente de examinar um conjunto de dados, 
para se ter uma primeira idéia da distribuição desses dados.
Por sua vez, podemos usar os gráficos ramo e folhas para 
representar as distribuições de frequências e também para 
pequenos conjuntos dados além de possibilitar a visualização 
completa das observações.
Construção de um gráfico ramo e folhas
Na construção, cada observação é dividida em duas partes, o 
ramo e as suas folhas, do mesmo jeito que ocorre numa árvore.
Logo que finalizamos a sua construção, se observarmos os dados 
coletados gerados em um ângulo de noventa graus, veremos um 
diagrama bem semelhante a um histograma, só que feito com 
valores em vez de retângulos.
Esta representação possui duas vantagens em relação ao 
histograma: 
 � seus valores são os valores reais;
 � é simples de construir
probabilidade_e_estatistica_1582.indb 104 19/07/12 11:11
105
Probabilidade e Estatística
Unidade 3
Vejamos um exemplo para aclarar essa visualização!
Exemplo de gráfico ramo e folhas
Imaginemos que desejamos visualizar a distribuição dos valores 
de tempo de antiguidade – em meses – dos funcionários de uma 
determinadaempresa. Coletados esses dados, os 20 valores de 
tempo de antiguidade (em meses) já ordenados são:
8, 9, 11, 17, 17, 19, 20, 44, 45, 53, 57, 57, 57, 58, 70, 81, 82, 83, 
100, 104.
Podemos, para construir nosso gráfico, organizar os dados, 
separando-os pelas dezenas: uma em cada linha do gráfico, da 
seguinte forma:
8, 9 
11, 17, 17, 19 
20 
44, 45 
53, 57, 57, 57, 58 
70 
81, 82, 83 
100, 104
E, assim obtemos uma primeira aproximação do gráfico. Porém, 
como muitos valores, em cada linha, tem as dezenas em comum, 
podemos colocar as dezenas em evidência, separando-as das 
unidades por um traço:
0 8 9 
1 1 7 7 9 
2 0 
3 - 
 4 4 5 
RAMO 5 3 7 7 7 8 FOLHAS 
6 - 
7 0 Legenda: 
8 1 2 3 5 | 3 = 53 meses 
9 - 10| 4 = 104 meses 
10 4 
Figura 3.8 – Construção de um diagrama de ramo e folhas
Fonte: Elaboração do autor (2011).
probabilidade_e_estatistica_1582.indb 105 19/07/12 11:11
106
Universidade do Sul de Santa Catarina
Ao dispor os dados dessa maneira, estamos construindo um 
diagrama de ramo e folhas. O lado esquerdo, com as dezenas, 
é chamado de ramo, no qual estão dependuradas as unidades, 
chamadas folhas, à direita da linha vertical.
Para sabermos o que está sendo representado, 
um ramo de folhas deve ter sempre uma legenda, 
indicando o que significam o ramo e as folhas. Assim, 
se o tempo de empresa dos funcionários estivesse 
medido em dias, por exemplo, usando esse mesmo 
ramo de folhas, poderíamos estabelecer que o ramo 
representaria as centenas e as folhas, as dezenas. Assim, 
0|8 seria igual a 80 dias e 10|4 seria igual a 104 dias.
Como podemos agora interpretar este gráfico? Analisando 
o ramo e folhas para o tempo de empresa dos funcionários, 
percebemos a existência de três grupos:
 � o grupo com os recém-contratados (até 20 meses);
 � o grupo com os que já tem algum tempo de empresa (de 
44 a 58 meses);
 � o grupo com os mais velhos (mais de 70 meses) com 
destaque, aqui, para dois funcionários que já estão na 
empresa à mais de oito anos!
O que mais podemos fazer com este mesmo gráfico do exemplo? 
O ramo e folhas também pode ser usado para comparar duas 
distribuições de valores. Assim, aproveitando o mesmo ramo 
do diagrama do tempo de empresa, podemos fazer o diagrama 
das mulheres que trabalham nesta empresa, utilizando o lado 
esquerdo. Logo após serem coletados os dados, resultou o 
seguinte gráfico:
probabilidade_e_estatistica_1582.indb 106 19/07/12 11:11
107
Probabilidade e Estatística
Unidade 3
9 9 8 0 8 9 
9 9 8 7 6 6 1 0 0 0 1 1 1 7 7 9 
3 1 1 1 2 0 
5 4 4 4 3 2 2 3 - 
5 5 4 4 5 
8 6 5 1 5 3 7 7 7 8 
8 6 - 
0 7 0 
3 1 8 1 2 3 
- 9 - 
- 10 0 4 
5 11 - 
- 12 - 
- 13 - Legenda: 
- 14 - 5 | 5 | = 55 meses para homem 
7 15 - | 5 | 3 = 53 meses para mulher 
Figura 3.9 – Gráfico ramo e folhas
Fonte: Elaboração do autor (2011).
Podemos observar que as folhas das mulheres são dependuradas 
de modo espelhado, assim como explica a legenda, que agora 
deve ser dupla!
Observando a tabela, notamos que as mulheres têm menos tempo de 
empresa do que os homens, embora possuam dois funcionários com 
mais tempo na empresa. Também podemos observar rapidamente 
que a empresa tem mais empregados homens que mulheres.
Construção de um gráfico box-plot
O box‑plot é especialmente útil quando trabalhamos com 
conjuntos limitados de dados para os quais outras ferramentas, 
como histogramas que requerem dados com mais de 30 pontos, 
não permitem auxiliar o estudo pois a quantidade de dados pode 
ser insuficiente para se obter uma conclusão.
Através da disposição dos valores em ordem crescente, tem-se 
uma ideia clara sobre a localização e a dispersão dos dados. Para a 
construção do gráfico box–plot, precisamos calcular:
probabilidade_e_estatistica_1582.indb 107 19/07/12 11:11
108
Universidade do Sul de Santa Catarina
 � limite inferior;
 � limite superior; 
 � primeiro quartil;
 � terceiro quartil;
 � mediana.
Estas cinco medidas são denominadas de estatística de ordem.
Vejamos as partes componentes de um box‑plot:
Figura 3.10 – Componentes de um box-plot
Fonte: Elaboração do autor (2011).
As informações dadas pelo resumo destes cinco números são 
apresentadas na forma de um gráfico de caixa que agrega uma 
série de informações sobre a distribuição, como: 
 � posição;
 � dispersão;
 � assimetria;
 � caudas;
 � dados discrepantes (outliers).
probabilidade_e_estatistica_1582.indb 108 19/07/12 11:11
109
Probabilidade e Estatística
Unidade 3
Figura 3.11 – Componentes de um box-plot: nomes usuais
Fonte: Elaboração do autor (2011).
Assim, a posição central dos valores é dada pela mediana e a 
dispersão, pela amplitude interquartílica; as posições relativas da 
mediana e dos quartis e o formato dos bigodes dão uma noção da 
simetria e do tamanho das caudas da distribuição.
Algumas propriedades dos box-plot para a sua interpretação
Quando a distribuição dos dados é simétrica, a linha da 
mediana estará localizada no centro do retângulo e as duas 
linhas que partem das extremidades do retângulo terão quase os 
mesmos comprimentos.
Quando a distribuição dos dados é assimétrica à direita, a linha 
da mediana estará mais próxima de Q1 do que de Q3; e, por sua 
vez, quando a distribuição é assimétrica à esquerda, a linha da 
mediana estará mais próxima de Q3 do que de Q1.
Assim, podemos observar os seguintes exemplos de assimetrias 
negativas, positivas e dados simétricos, respectivamente, de 
esquerda à direita:
probabilidade_e_estatistica_1582.indb 109 19/07/12 11:11
110
Universidade do Sul de Santa Catarina
Figura 3.12 – Assimetrias
Fonte: Elaboração do autor (2011).
O box plot também pode ser desenhado na posição vertical ou 
na horizontal. Pode ser utilizado na comparação de dois ou mais 
conjuntos de dados e na comparação com outras ferramentas, por 
exemplo, junto com os histogramas.
Dicas para a construção do box-plot
 � colete os n dados referentes à variável de interesse;
 � disponha os dados em ordem crescente. Calcule a 
mediana, Q1 e Q3;
 � identifique o valor (min) e o valor (max) da amostra.
 � trace um eixo e o marque com uma escala adequada e de 
fácil leitura;
 � sobre o eixo, desenhe um retângulo da seguinte forma:
 » posicione a extremidade inferior do retângulo em Q1;
 » posicione a extremidade superior do retângulo em Q3 
e, no interior do retângulo, trace a mediana; 
 » feche o retângulo para obter o box;
probabilidade_e_estatistica_1582.indb 110 19/07/12 11:11
111
Probabilidade e Estatística
Unidade 3
 � desenhe uma linha a partir da extremidade inferior 
do retângulo com distância de até 1,5x(Q3-Q1) para 
construir o bigode inferior;
 � desenhe uma linha a partir da extremidade superior 
do retângulo com uma distância de 1,5x(Q3-Q1) para 
construir o bigode superior;
 � desenhe asteriscos para marcar as observações localizadas 
a uma distância de 1,5x(Q3-Q1) a 3x(Q3-Q1) de cada 
extremidade do retângulo, que são os possíveis outliers.
 � desenhe círculos para marcar as observações localizadas a 
uma distância superior a 3x(Q3-Q1) de cada extremidade 
do retângulo, que são os prováveis outliers.
 � registre as informações importantes que devam constar 
no gráfico, como título, período, coleta de dados, 
tamanho da amostra, identificação dos eixos.
Os valores que estiverem acima do limite superior (haste 
superior) ou abaixo do limite inferior (haste inferior) do box‑plot 
serão considerados outliers.
Estes valores são considerados discrepantes, ou seja, não fazem 
parte do comportamento esperado do grupo em estudo.
probabilidade_e_estatistica_1582.indb 111 19/07/12 11:11
112
Universidade do Sul de Santa Catarina
Assim o box‑plot resulta:
Figura 3.13 – Box-plot
Fonte: Elaboração do autor (2011).
Complicado? Sim, um pouco, mas com a ajuda de um “truque” no 
Excel, podemos fazer, ao menos, um esquema de box‑plot,ainda 
que o melhor seja sempre trabalhar com algum programa de 
estatística que esteja preparado para desenhar estetipo de gráfico.
Dentre os programas grátis de estatísticas que podem 
ser achados na internet, uns dos mais completos 
é o PAST (http://folk.uio.no/ohammer/past/) da 
Universidade de Oslo (Noruega). 
Na internet, podem ser achados vários tutoriais explicando como 
fazer um box‑plot completo no Excel, é só procurar com um site 
de buscas como o Google ou outro semelhante que você esteja 
acostumado a utilizar no seu dia a dia.
probabilidade_e_estatistica_1582.indb 112 19/07/12 11:11
http://folk.uio.no/ohammer/past/
113
Probabilidade e Estatística
Unidade 3
Exemplo de como construir um box-plot no Excel.
Em uma nova planilha, digite os seguintes dados, que são 
os valores necessários para construir o box‑plot e que foram 
calculados a partir de três conjuntos de dados de um certo 
levantamento de campo:
Figura 3.14 – Box-plot em Excel
Fonte: Elaboração do autor (2011).
a) selecionar as células A2:D7; 
b) em seguida, ir ao menu Inserir e clicar em gráfico;
c) Na guia tipos padrão, clique em ações, depois em tipo 
de gráfico e, em seguida, clique no quarto gráfico de 
subtipo:
Figura 3.15 – Box-plot em Excel
Fonte: Elaboração do autor (2011).
probabilidade_e_estatistica_1582.indb 113 19/07/12 11:11
114
Universidade do Sul de Santa Catarina
d) clique em Avançar;
e) na guia Intervalo de dados, clique em linhas, depois em 
sequências em e, em seguida, clique em Avançar;
f) na guia Legenda, clique para desmarcar a caixa de 
seleção Mostrar legenda;
g) na guia Eixos, clique para desmarcar a caixa de seleção 
eixo (Y) em eixo secundário e, em seguida, clique em 
Concluir;
h) clique uma vez em qualquer uma das colunas coloridas 
para selecionar a série. Não clique em uma das colunas 
em branco;
i) no menu Gráfico, clique em Tipo de gráfico;
j) em Tipo de gráfico, clique em Linha e, em seguida, 
clique em OK.
Figura 3.16 – Box-plot em Excel
Fonte: Elaboração do autor (2011).
k) uma linha que conecta as três colunas em branco 
aparecerá no gráfico;
l) clique uma vez na linha e, em seguida, clique com o 
botão direito do mouse em formatar serie de dados para 
indicar nenhuma linha e marcador;
probabilidade_e_estatistica_1582.indb 114 19/07/12 11:11
115
Probabilidade e Estatística
Unidade 3
m) pronto, o esquema do box‑plot já está construído. 
Somente agora você deve botar as informações 
importantes do gráfico.
Figura 3.17 – Box-plot em Excel
Fonte: Elaboração do autor (2011).
Seção 3 – Medidas de dispersão
Para compreender melhor o que são as medidas de dispersão, 
acompanhe o exemplo. A realização de testes em três grupos de 
pessoas resultou nos escores descritos a seguir.
Tabela 3.3 – Escores (em pontos) obtidos por pessoa (10 pessoas) e divididos em grupos
Grupos Escores (em pontos) obtidos por pessoa (10 pessoas) Total
Grupo 1: 6 6 6 6 6 6 6 6 6 6 60
Grupo 2: 1 8 9 2 6 10 5 8 7 4 60
Grupo 3: 5 6 7 7 6 5 6 7 5 6 60
Fonte: Elaboração do autor (2006).
probabilidade_e_estatistica_1582.indb 115 19/07/12 11:11
116
Universidade do Sul de Santa Catarina
Se você calcular a média dos escores para cada grupo, obterá os 
seguintes resultados:
Para o grupo 1:
, ou seja, 6 pontos é o escore médio;
Para o grupo 2:
, ou seja, 6 pontos é o escore médio;
Para o grupo 3:
, ou seja, 6 pontos é o escore médio;
Observe que os escores médios dos três grupos são iguais. E 
agora? Como diferenciar um grupo do outro? Olhando somente 
para os dados você pode tirar algumas conclusões: no grupo 1, 
as pessoas têm o mesmo escore; no grupo 2, os escores são 
diversificados; e, no grupo 3, existe uma pequena diversificação, 
ou seja, os escores estão bem próximos da média.
Pode-se afirmar, quanto à dispersão das séries anteriores, que:
 � grupo 1: não é uma série em que os dados apresentam 
dispersão com relação à média, ou seja, os dados estão 
totalmente concentrados na média;
 � grupo 2: é uma série de dados em que os valores 
observados estão bastante dispersos, ou seja, apresenta 
muitos valores distantes da média. Podemos dizer que é 
uma série dispersa;
 � grupo 3: há uma pequena diferença de alguns dados 
com relação à média, ou seja, apresenta uma pequena 
dispersão com relação à média: os dados estão 
concentrados em torno da média.
Em resumo, nos grupos 1 e 3, a média pode servir como uma 
medida representativa, mas, no grupo 2, a média não resulta 
representativa.
probabilidade_e_estatistica_1582.indb 116 19/07/12 11:11
117
Probabilidade e Estatística
Unidade 3
Para identificar esses tipos de situações é que usamos 
as medidas de dispersão. Essas medidas são a maneira 
mais adequada para quantificar a dispersão dos dados 
e avaliar a representatividade da média.
As principais medidas, denominadas de dispersão absolutas são: 
amplitude total, desvio médio simples, variância e desvio padrão.
O desvio médio simples, não menos importante, não será visto 
neste estudo, pois, para o objetivo que se pretende alcançar, a 
variância e o desvio padrão são mais adequados.
Cálculos da variância e do desvio padrão
Para começar a trabalhar com dispersão, é necessário que você 
conheça as definições e as formas de representação da variância e 
do desvio padrão. 
A variância é a média dos quadrados dos desvios 
de cada valor da série com relação à média. Ficou 
complicado? Não se preocupe, a seguir você vai 
aprender como calcular! 
 
O desvio padrão é a raiz quadrada da variância, pois 
assim fica mais fácil analisar e comparar com a média; 
se usássemos a variância, as unidades seriam ao 
quadrado, enquanto que o desvio padrão apresentaria 
a mesma unidade de medida que a média.
Veja a seguir como representá-las.
População Amostra
σ2 (x) → variância S2(x) → variância
σ (x) → desvio padrão s(x) →desvio padrão
σ = 18ª letra do alfabeto grego, chama-se sigma.
Quadro 3.2 – Representação do desvio padrão 
Fonte: Elaboração do autor (2006).
probabilidade_e_estatistica_1582.indb 117 19/07/12 11:11
118
Universidade do Sul de Santa Catarina
A variância e o desvio padrão para dados brutos
Neste item, você vai aprender como calcular a variância e o 
desvio padrão para dados brutos. Preste atenção! A fórmula para 
população e para amostra são diferentes.
O quadro a seguir apresenta as fórmulas utilizadas para calcular a 
variância e o desvio padrão.
Medidas População Amostra
Variância
Desvio padrão
σ = 18ª letra do alfabeto grego, chama-se sigma.
Quadro 3.3 – Fórmulas para o cálculo de medidas de dispersão com dados brutos 
Fonte: Elaboração do autor (2006).
Observação: A diferença mais importante entre as 
duas fórmulas da variância são os denominadores. Para 
a população, usamos n e, para a amostra, usamos n – 1. 
Como, ao trabalharmos com uma amostra para estimar 
valores de uma população, a variabilidade dos dados é 
maior, então, dessa maneira, é mais indicado usarmos 
n – 1 para que não subestimemos a dispersão. O n – 1 é 
usado, nesse caso, como uma correção para a variância 
da amostra. Para amostras com mais de 30 elementos, 
essa correção torna-se irrelevante.
Para você entender melhor, imagine que a média de depósitos 
diários de uma agência bancária seja de 120.000 reais e a 
variância, de 25.000 reais ao quadrado. Seria difícil comparar 
reais com reais ao quadrado. Para tanto, ao se fazer uso do desvio 
padrão, o qual corresponde à raiz quadrada de 25.000 reais ao 
quadrado, teríamos 5.000 reais. E esta é a mesma unidade de 
medida da média.
Daremos continuidade ao exemplo, para calcular a variância e o 
desvio padrão. 
probabilidade_e_estatistica_1582.indb 118 19/07/12 11:11
119
Probabilidade e Estatística
Unidade 3
Veja passo a passo
Exemplo: Uma vez dadas as notas: 6; 7; 7,8; e 8.
Passo 1: calcular a média: observe que, na média para a população, 
usa-se a letra grega .
0
Passo 2: – agora, calcular os desvios (xi − ).
(x1 − ) = (6 – 7,20) = −1,20
(x2 − ) = (7 – 7,20) = −0,20
(x3 − ) = (7,8 – 7,20) = 0,60
(x4 − ) = (8 – 7,20) = 0,80
Passo 3: elevar ao quadrado cada desvio (xi − )2.
(x1 − )2= (1,20)2 = 1,4400
(x2 − )2 = (−0,20)2 = 0,0400
(x3 − )2 = (0,60)2 = 0,3600
(x4 − )2 = (0,80)2 = 0,6400
probabilidade_e_estatistica_1582.indb 119 19/07/12 11:11
120
Universidade do Sul de Santa Catarina
Passo 4: calcular a média dos quadrados dos desvios, ou seja, a 
variância. Aqui, você vai calcular para a população e para a amostra. 
 � Caso sejam dados de uma população:
Então: σ2(x) = 0,62
 � Caso sejam dados de uma amostra:
Então: s2(x) = 0,83
Passo 5: calcular o desvio padrão, calculando a raiz da variância. 
 � Caso sejam dados de uma população:
 � Caso sejam dados de uma amostra:
Interpretação dos dados – Para dados de uma 
população, a variabilidade das notas é de 0,79 pontos. 
Para dados de uma amostra, a variabilidade das notas é 
de 0,91 pontos.
probabilidade_e_estatistica_1582.indb 120 19/07/12 11:11
121
Probabilidade e Estatística
Unidade 3
A variância e o desvio padrão para dados agrupados sem intervalos 
(variável discreta)
Agora, você vai calcular a variância e o desvio padrão para dados 
que foram organizados em tabelas, ou seja, após a coleta, eles 
foram organizados em categorias e organizados em tabelas onde 
os dados estão agrupados sem intervalos. 
Observe as fórmulas que são utilizadas para calcular este tipo de 
dados, a variância e o desvio padrão.
Medidas População Amostra
Variância
Desvio padrão
Quadro 3.4 – Fórmulas para o cálculo de medidas de dispersão com dados agrupados sem intervalos 
Fonte: Elaboração do autor (2006).
Acompanhe o exemplo a seguir para compreender como realizar 
o cálculo dos dados agrupados sem intervalos.
Exemplo: A tabela apresenta dados referentes à remuneração de 
funcionários de uma empresa. Foram levantados o número de 
funcionários e sua faixa salarial, em número de salários-mínimos.
probabilidade_e_estatistica_1582.indb 121 19/07/12 11:12
122
Universidade do Sul de Santa Catarina
Tabela 3.4 – Remuneração de funcionários
Nº de salários -
mínimos (xi) 
Nº de 
funcionários 
(fi) 
x i . (x i − x ) (x − x )
2 (x − x )2. 
1 29 29 -2,33 5,4 1 157,4381 
2 28 56 -1,33 1,7 7 49,5292 
3 20 60 0,33 0,1 1 2,1780
4 18 72 0,67 0,4 5 8,0820
5 16 80 1,67 2,7 8 44,4560
6 15 90 2,67 7,1 3 106,9335
7 9 63 3,67 13,4 7 121,1607
Σ 135 450 489,7757 
1 − 3,33 = −2,33 
Σ fi Σ x i .f i Σ ix( − )x
2 .fi
(−2,33) 2=5,4289 5,4289.29 = 157,4381 
(fi) (fi)
Fonte: Elaboração do autor (2006).
Quando realizar o passo a passo desses cálculos, 
sugerimos que crie mais quatro colunas à direita para 
auxiliar em seus cálculos.
Agora, acompanhe o cálculo passo a passo
Passo 1: inicie por somar a coluna das frequências simples (fi) para 
obter Σfi (frequência total); Σfi = 135.
Passo 2: calcule a média: multiplique cada xi por sua correspondente 
fi e escreva na coluna xi.fi, some os valores calculados e escreva no 
final da coluna esse resultado, que é:
Σxi.fi; Σxi.fi = 450
probabilidade_e_estatistica_1582.indb 122 19/07/12 11:12
123
Probabilidade e Estatística
Unidade 3
Passo 3: divida o resultado do passo 2 (Σ xi.fi ) pelo resultado do 
passo 1 (Σ fi).
Para facilitar os cálculos, arredondamos a média em duas casas 
decimais.
Passo 4: calcule a quarta coluna, (xi − ), subtraindo o xi de cada linha 
pela média:
1 − 3,33 = −2,33 
2 − 3,33 = −1,33 
3 − 3,33 = −0,33 
4 − 3,33 = 0,67 
5 − 3,33 = 1,67 
6 − 3,33 = 2,67 
7 − 3,33 = 3,67
Passo 5: calcule a quinta coluna, elevando os valores da quarta 
coluna ao quadrado (xi − )2.
(−2,33)2 = 5,4289
(−1,33)2 = 1,7689
(−0,33)2 = 0,1089
(0,67)2 = 0,4489
(1,67)2 = 2,7785
(2,67)2 = 7,1289
(3,67)2 = 13,4689
Neste passo, usa-se quatro casas decimais, deixando para 
arredondar para duas casas somente o resultado.
probabilidade_e_estatistica_1582.indb 123 19/07/12 11:12
124
Universidade do Sul de Santa Catarina
Passo 6: calcule a sexta coluna, multiplicando os valores da quinta 
pela frequência simples de cada linha, (xi − )2.fi: 
5,4289 . 29 = 157,4381 
1,7689 . 28 = 49,5292 
0,1089 . 20 = 2,1780 
0,4489 . 18 = 8,0802 
2,7785 . 16 = 44,4560 
7,1289 . 15 = 106,9335 
13,4689 . 9 = 121,1607 
Passo 7: some os valores obtidos na sexta coluna, Σ(xi − )2.fi.
(Σ(xi − )2.fi = 489,7757
Passo 8: calcule a variância.
 � Caso sejam dados de uma população:
Na variância, serão usadas quatro casas decimais, pois ainda será 
necessário extrair a raiz quadrada para chegar ao desvio padrão.
 � Caso sejam dados de uma amostra:
probabilidade_e_estatistica_1582.indb 124 19/07/12 11:12
125
Probabilidade e Estatística
Unidade 3
Passo 9: calcule o desvio padrão.
 � Caso sejam dados de uma população:
 � Caso sejam dados de uma amostra:
Interpretação dos dados – Para dados de uma 
população, a variabilidade do número de salários 
é de 1,90 salários. Para dados de uma amostra, a 
variabilidade do número de salários é de 1,91 salários.
Dados agrupados com intervalos (variável contínua)
Nesse item, você poderá ver como se calcula a variância e o desvio 
padrão para dados agrupados com intervalos (variável contínua).
Observe as fórmulas que são utilizadas para calcular este tipo de 
dados. Use para:
Medidas População Amostra
Variância
Desvio padrão
Quadro 3.5 – Fórmulas para o cálculo de medidas de dispersão com dados agrupados com intervalos 
Fonte: Elaboração do autor (2006). 
Para o caso de dados agrupados com intervalos, usa-se 
o ponto médio – PM – de cada intervalo, pois não se 
tem um valor específico para usar. O ponto médio 
serve como uma boa aproximação.
probabilidade_e_estatistica_1582.indb 125 19/07/12 11:12
126
Universidade do Sul de Santa Catarina
Agora, vamos analisar um exemplo para realizar os cálculos de 
medidas de dispersão com dados agrupados com intervalos.
Tabela 3.5 – Volume de vendas mensal, em milhares de reais, dos representantes de uma 
empresa que fabrica remédios – outubro/2010
Nº de vendas 
(em mil reais) 
Nº de 
representantes 
(fi ) 
PM PM. PM i − x (PM i − x )
2
 (PM i − x )
2 . 
15,9 | -- 18,7 12 17,3 207,6 7,45 55,5025 666,0300 
18,7 | -- 21,5 8 20,1 160,8 −4,65 21,6225 172,9800 
21,5 | -- 24,3 12 22,9 274,8 −1,85 3,4225 41,0700 
24,3 | -- 27,1 5 25,7 128,5 0,95 0,9025 4,5125 
27,1 | -- 29,9 3 28, 5 85,5 3,75 14,0625 42,1875 
29,9 | -- 32,7 6 31,3 187,8 6,55 42,9025 257,4150 
32,7 | -- 35,5 10 34,1 341,0 9,35 87,4225 874,2250 
Total ( Σ ) 56 1.386 2.058,4200 
17,3 − 24,75 = −7,45 
Σ Σ PMi . Σ ( PM i − )x
2 .fi
(−7,45) 2 = 55,5025 
55,5025.12 = 666,0300 
fi fi
fi
fi fi
−
Fonte: Elaboração do autor (2006).
Ao realizar o passo a passo, crie uma nova tabela com 
mais cinco colunas à direita para auxiliar em seus cálculos.
Acompanhe os cálculos passo a passo
Passo 1: primeiro some a coluna das frequências simples (fi) para 
obter Σ fi (frequência total); Σ fi = 56.
Passo 2: calcule a média; nesse caso, calcule o ponto médio de cada 
intervalo, multiplique cada PM por sua correspondente fi e escreva 
na coluna PM.fi; some os valores calculados nessa coluna e escreva 
o total. Esse resultado é o Σ PM.fi: PMi.fi = 1.386. Agora, divida esse 
resultado (Σ PM.f) pelo resultado do passo 1 (Σ fi). Assim, obtemos:
probabilidade_e_estatistica_1582.indb 126 19/07/12 11:12
127
Probabilidade e Estatística
Unidade 3
Passo 3: calcule a quinta coluna, subtraindo o PMi de cada linha pela 
média PMi − .
17,3 − 24,75 = −7,45 
20,1 − 24,75 = −4,65 
22,9 − 24,75 = −1,85 
25,7 − 24,75 = 0,95 
28,5 − 24,75 = 3,75 
31,3 − 24,75 = 6,55 
34,1 − 24,75 = 9,35
Passo 4: calcule a sexta coluna, elevando os valores da quinta ao 
quadrado, (PMi − )
2.
(−7,45)2 = 55,5025
(−4,65)2 = 21,6225
(−1,85)2 = 3,4225
(0,95)2 = 0,9025
(3,75)2 = 14,0625
(6,55)2 = 42,9025
(9,35)2 = 87,4225
Passo 5: calcule a sétima coluna, multiplicando os valores da sexta 
pela frequência simples de cada linha, (PMi − )
2.fi.
55,5025 . 12 = 666,0300 
21,6225 . 8 = 172,9800 
3,4225 . 12 = 41,0700 
0,9025 . 5 = 4,5125 
14,0625 . 3 = 42,187542,9025 . 6 = 257,4150 
87,4225 . 10 = 874,2250 
Passo 6: some os valores obtidos na sexta coluna, Σ (PMi − )
2.fi. 
Σ (PMi − )2.fi: = 2.058,4200.
probabilidade_e_estatistica_1582.indb 127 19/07/12 11:12
128
Universidade do Sul de Santa Catarina
Passo 7: calcule a variância. 
 � Caso sejam dados de uma população:
 � Caso sejam dados de uma amostra:
Passo 8: calcule o desvio padrão.
 � Caso sejam dados de uma população:
 � Caso sejam dados de uma amostra: 
Interpretação dos dados – Para dados de uma 
população, a variabilidade do volume de vendas 
é de 6,06 mil reais. Para dados de uma amostra, a 
variabilidade do volume de vendas é de 6,12 mil reais.
Interpretação do desvio padrão
O desvio padrão é uma importante medida de dispersão. É com 
ele que você irá quantificar a dispersão dos dados de uma série 
com relação à sua média. Preste atenção:
probabilidade_e_estatistica_1582.indb 128 19/07/12 11:12
129
Probabilidade e Estatística
Unidade 3
 � quanto maior o valor do desvio padrão, mais dispersos 
estão os valores. Pode-se dizer, também, que mais 
distantes estão da média; 
 � quanto menor o valor do desvio padrão, menos dispersos 
estão os valores. Pode-se dizer, também, que mais 
próximos estão da média.
Veja a figura a seguir para compreender melhor o que foi 
colocado.
Figura 3.18 – Quanto mais distantes da média, mais dispersos os dados estão
Fonte: Triola (1999, p. 42).
Outra utilização do desvio padrão
Muitas séries, quando representadas por seu polígono de 
frequências, com certo ajuste nas curvas, apresentam um formato 
semelhante a um sino, uma curva simétrica (observando que a 
média, a moda e a mediana estão posicionadas ao centro), como 
mostra o gráfico a seguir.
Gráfico 3.1 – Gráfico da curva normal
Fonte: Elaboração do autor (2006).
probabilidade_e_estatistica_1582.indb 129 19/07/12 11:12
130
Universidade do Sul de Santa Catarina
Para séries de dados que apresentam esse tipo de representação, 
pode-se trabalhar com a área abaixo do polígono. A área abaixo é 
proporcional à frequência total. Essa curva é chamada de Curva 
Normal ou Curvas de Gauss, e suas principais características são:
 � a curva se caracteriza por ter a forma de um sino;
 � a curva normal é simétrica com relação à média;
 � a área limitada pela curva e pelo eixo das abscissas é 1 
ou 100%;
 � a curva é assintótica, isto é, aproxima-se indefinidamente 
do eixo das abscissas sem tocá-lo;
 � a curva normal é unimodal, isto é, possui um só pico ou 
ponto de frequência máxima, ponto este que coincide 
com a moda, a média e a mediana.
Como relacionar a curva com o desvio padrão? Veja a curva a seguir:
Gráfico 3.2 – Gráfico da curva normal
Fonte: Elaboração do autor (2006).
probabilidade_e_estatistica_1582.indb 130 19/07/12 11:12
131
Probabilidade e Estatística
Unidade 3
Exemplo: Numa série em que μ = 80 e o σ(x)=3, pode-se 
interpretar estes valores da seguinte forma:
 � os valores da série estão concentrados em torno da 
média, que é de 80 unidades;
 � o intervalo [μ − σ(x); μ + σ(x)] contém aproximadamente 
68,26% dos elementos da série, ou seja, o intervalo [77;83];
 � o intervalo [μ − 2σ(x); μ + 2σ(x)] contém 
aproximadamente 95,44% dos elementos da série, ou 
seja, o intervalo [74;86];
 � o intervalo [μ − 3σ(x); μ + 3σ(x)] contém 
aproximadamente 99,74% dos elementos da série, ou seja, 
o intervalo [71;89];
Seção 4 – Coeficiente de variação
Séries de dados com médias iguais
Acompanhe o exemplo: considere dois grupos de pessoas, nos 
quais foram feitos levantamentos de suas rendas. Os resultados 
deste levantamento foram os seguintes:
Tabela 3.6 – Resultado do levantamento de renda
Grupo 1 Grupo 2
Média:
μ = 122 pontos
Média:
μ = 122 pontos
Desvio padrão:
σ(x) = 4,5 pontos
Desvio padrão:
σ(x) = 7,5 pontos
Fonte: Elaboração do autor (2006).
probabilidade_e_estatistica_1582.indb 131 19/07/12 11:12
132
Universidade do Sul de Santa Catarina
Compare a dispersão das duas séries:
 � note que as médias são iguais;
 � o desvio padrão do grupo 1 é 4,5, e o do grupo 2 é 7,5; 
portanto, o grupo que apresenta maior dispersão quanto 
ao nível de renda é o grupo 2;
 � conclusão: os níveis de renda do grupo 2 são mais 
dispersos com relação ao grupo 1 (valores mais distantes 
da média); ou: os integrantes do grupo 1 tem renda mais 
semelhantes entre eles que os integrantes do grupos 2.
Para comparar duas séries de dados usando medidas 
de dispersão absolutas (variância e desvio padrão) é 
necessário que as médias sejam iguais, caso contrário, 
usamos uma medida de dispersão relativa que veremos 
nesta seção.
Séries de dados com médias diferentes
Como você pôde observar no item anterior, para comparar duas 
séries de dados quanto a suas dispersões, pode-se usar valores 
absolutos dos desvios padrão, mas somente quando as médias 
são iguais. 
E quando as médias são diferentes?
Nesse caso, utiliza-se o Coeficiente de Variação (CV), que é 
uma medida de dispersão relativa. Veja a seguir.
probabilidade_e_estatistica_1582.indb 132 19/07/12 11:12
133
Probabilidade e Estatística
Unidade 3
Medida de dispersão relativa – o Coeficiente de Variação
O coeficiente de variação é a relação do desvio com a média. Veja 
a fórmula a seguir: 
Tabela 3.7 – Fórmula do coeficiente de variação
Para a população Para a amostra
Fonte: Elaboração do autor (2006).
A série que apresentar maior coeficiente de variação 
será realmente a série de maior dispersão dos dados. O 
resultado é expresso em percentual (%), ou seja, quanto 
o desvio padrão representa da média.
Acompanhe o exemplo a seguir para compreender como realizar 
o cálculo.
Exemplo: Considere dois grupos de pessoas, nos quais foram 
feitos levantamentos de suas rendas. Os resultados deste 
levantamento foram os seguintes: 
Tabela 3.8 – Resultado do levantamento
Grupo 1 Grupo 2
Desvio padrão:
σ(x) = 9,8 reais
Desvio padrão:
σ(x) = 7,5 reais
Média:
μ = 145 reais
Média:
μ = 95 reais
Fonte: Elaboração do autor (2006).
 � note que as médias são diferentes;
 � o desvio padrão do grupo 1 é 9,8; e o do grupo 2 é 7,5; 
portanto, o grupo que apresenta maior dispersão absoluta 
quanto ao nível de renda é o grupo 1;
probabilidade_e_estatistica_1582.indb 133 19/07/12 11:12
134
Universidade do Sul de Santa Catarina
 � como as médias são diferentes, devemos calcular o 
coeficiente de variação, pois, simplesmente pela dispersão 
absoluta, não podemos afirmar nada (se fossem iguais, 
bastaria a dispersão absoluta).
 » Para o grupo 1:
 » Para o grupo 2:
O grupo que apresenta maior coeficiente de variação é o grupo 2. 
Ou seja, os níveis de renda observados no grupo 2 são mais 
dispersos com relação ao grupo 1 (valores mais distantes da média).
Quais outras conclusões você poderia tirar com relação 
aos dois grupos?
Comparando os dois, você poderia dizer que, no grupo 1, as 
pessoas têm a renda mais próxima da média do grupo que no 
Grupo 2, que, por sua vez, as pessoas apresentam níveis de renda 
mais diferenciado da média do grupo, comparando os dois grupos.
Para comparar a dispersão dos dados de duas séries de 
médias diferentes, usamos o coeficiente de variação. 
Ele compara o desvio padrão com a média (proporção) 
entre o desvio padrão e a média da série, sendo, assim, 
considerado uma forma mais eficaz de comparação e, 
portanto, prevalecendo sobre a absoluta.
probabilidade_e_estatistica_1582.indb 134 19/07/12 11:12
135
Probabilidade e Estatística
Unidade 3
Síntese
Nessa unidade, você pôde estudar e compreender “ferramentas” 
que irão auxiliá-lo na prática de sua profissão. 
Você pôde conhecer os tipos de medidas de posição e calcular 
e interpretar a média, a moda e a mediana e pôde, também, 
compreender e calcular separatrizes. Estudou como se calculam 
as diversas medidas estatísticas, tanto para dados brutos ou 
agrupados, com e sem intervalos.
Também foram vistos os gráficos box‑plot e ramo e folhas como 
ferramentas exploratórias de análise de dadosque são capazes de 
examinar um conjunto de dados para se ter uma primeira ideia da 
distribuição deles.
Nessa unidade, você estudou, ainda, uma medida muito 
importante em Estatística: a medida de dispersão. Sem estudar 
estas medidas, muitas vezes fica difícil de definir se a média 
seria ou não representativa de uma série de dados. Além disso, 
você conheceu o método utilizado para comparar dados com 
médias diferentes, largamente utilizado em estudos de dados e 
tratamentos estatísticos. 
probabilidade_e_estatistica_1582.indb 135 19/07/12 11:12
136
Universidade do Sul de Santa Catarina
Atividades de autoavaliação
Ao final de cada unidade, você realizará atividades de autoavaliação. O 
gabarito está disponível no final do livro didático, mas se esforce para 
resolver as atividades sem a ajuda do gabarito, pois, assim, você estará 
promovendo (e estimulando) a sua aprendizagem.
1) Uma empresa procurou estudar a ocorrência de uso de drogas lícitas – 
bebidas alcoólicas – por seus empregados, tendo, para isso, realizado 
um levantamento sobre o número de dias por semana que cada um 
dos empregados costuma beber. Calcule e interprete a média. Os 
dados correspondentes são:
Consumo de bebidas alcoólicas por semana pelos funcionários
Nº de dias (xi) Nº de func. (fi) xi.fi
0 10
1 16
2 14
3 8
4 5
5 4
6 4
7 3
Total (Σfi) 64
Fonte: Elaboração do autor (2006).
probabilidade_e_estatistica_1582.indb 136 19/07/12 11:12
137
Probabilidade e Estatística
Unidade 3
2) Os dados seguintes representam a renda de uma amostra de famílias 
de um bairro de classe baixa de Florianópolis, em reais (dados fictícios). 
Calcule e interprete a média.
Renda de famílias de um bairro de classe baixa de Florianópolis
Renda (R$) No de famílias (fi) PM PM.fi
112 |---- 115 2
115 |---- 118 6
118 |---- 121 4
121 |---- 124 9
124 |---- 127 8
127 |---- 130 7
Total (Σfi) 36
Fonte: Elaboração do autor (2006).
probabilidade_e_estatistica_1582.indb 137 19/07/12 11:12
138
Universidade do Sul de Santa Catarina
3) Nos itens a seguir, estão dois conjuntos de dados. Calcule a mediana 
para cada um deles e interprete seus resultados.
a) Conjunto 1
15 19 13 21 16 17 15 12 13
Sugestão: use a tabela a seguir para organizar e posicionar os dados.
b) Conjunto 2
17 18 14 14 15 15 16 16
Sugestão: use a tabela abaixo para organizar e posicionar os dados.
probabilidade_e_estatistica_1582.indb 138 19/07/12 11:12
139
Probabilidade e Estatística
Unidade 3
4) Nas opções a seguir, estão três conjuntos de dados. Encontre a moda 
para cada um deles e interprete seus resultados.
a) Conjunto 01
7 6 5 8 2 1 3 2 1
1 7 6 8 5 1 2 2 7
b) Conjunto 02
5 6 8 2 3 5 3 3
2 6 5 8 3 2 5 6
c) Conjunto 03
5 6 3 7 5 3 2 1
1 6 7 2 8 4 8 4
probabilidade_e_estatistica_1582.indb 139 19/07/12 11:12
140
Universidade do Sul de Santa Catarina
5) Em um grupo de pacientes acometidos de fobias, foi levantado o 
tempo em tratamento em anos, conforme tabela abaixo. Calcule o Q3, o 
D9 e o P35 e interprete seus resultados.
Tempo em tratamento de fobias em anos:
4 6 8 2 5 9 4 3 8 9 5 4
Use a tabela abaixo para organizar e posicionar os dados.
6) Os dados a seguir representam o tempo em minutos usados por um 
grupo de seis pessoas na realização de um teste. Calcule a variância e o 
desvio padrão, considerando como uma população.
Tempo (em min.): 25, 22, 36, 20, 29, 38;
probabilidade_e_estatistica_1582.indb 140 19/07/12 11:12
141
Probabilidade e Estatística
Unidade 3
7) Os escores obtidos por cinco pessoas em um teste estão relacionados 
a seguir. Calcule a variância e o desvio padrão, considerando como 
uma amostra.
Tempo: 15, 10, 9, 23, 31. 
8) Uma empresa procurou estudar a ocorrência de uso de drogas 
lícitas – bebidas alcoólicas – por seus empregados, tendo, para isso, 
tem-se realizado um levantamento sobre o número de dias por 
semana que cada um dos empregados costuma beber. Calcule a 
variância e o desvio padrão, considerando que os dados são de uma 
amostra (sugere-se utilizar colunas para facilitar o cálculo). Os dados 
correspondentes são:
Consumo de bebidas alcoólicas por semana pelos funcionários
Nº de dias (xi) Nº de func. (fi) xi.fi (xi – ) (xi – )2 (xi – )2. fi
0 10
1 16
2 14
3 8
4 5
5 4
6 4
7 3
Total (Σfi) 64
Fonte: Elaboração do autor (2006).
probabilidade_e_estatistica_1582.indb 141 19/07/12 11:12
142
Universidade do Sul de Santa Catarina
9) Na tabela a seguir, estão relacionados dados relativos à idade de um 
grupo de 63 estudantes matriculados numa disciplina da Unisul Virtual. 
Calcule a variância e o desvio padrão, considerando que são dados da 
população (sugere-se utilizar colunas para facilitar o cálculo).
Idade dos estudantes da disciplina de Métodos Estatísticos a distância
Idade (xi) Nº de estud. (fi) xi.fi (xi – ) (xi – )2 (xi – )2. fi
17 5
18 20
19 22
20 10
21 6
Total (Σfi) 63
Fonte: Elaboração do autor (2006).
probabilidade_e_estatistica_1582.indb 142 19/07/12 11:12
143
Probabilidade e Estatística
Unidade 3
10) Os dados abaixo representam a renda de uma amostra de famílias de 
um bairro de classe baixa de Florianópolis, em reais. (dados fictícios). 
Calcule a variância e o desvio padrão, considerando como sendo dados 
de uma amostra:
Renda de famílias de um bairro de classe baixa de Florianópolis
Renda (R$) Nº de famílias (fi)
PMi PMi.fi (PMi – ) (PMi – )
2 (PMi – )
2. fi
112 |---- 115 2
115 |---- 118 6
118 |---- 121 4
121 |---- 124 9
124 |---- 127 8
127 |---- 130 7
Total (Σfi)
Fonte: Elaboração do autor (2006).
11) Analise cada caso, comparando quanto à dispersão dos dados e 
responda às perguntas:
a) Qual das séries apresenta maior dispersão absoluta (comparar os 
desvios padrão)?
b) Qual das séries apresenta maior dispersão relativa (comparar os 
coeficientes de variação)?
c) Conclua qual das séries realmente apresenta maior dispersão (não 
esqueça que o coeficiente de variação é mais eficaz para determinar a 
dispersão de uma série).
probabilidade_e_estatistica_1582.indb 143 19/07/12 11:12
144
Universidade do Sul de Santa Catarina
11.1)
Série A Série B
μ = 57; σ(x) = 5,6 μ = 96; σ(x) = 8,2
11.2)
Série A Série B
μ = 64; σ(x) = 12 μ = 96; σ(x) = 18
11.3)
Série A Série B
μ = 195; σ(x) = 12 μ = 125; σ(x) = 12
11.4)
Série A Série B
μ = 869; σ(x) = 201 μ = 625; σ(x) = 198
probabilidade_e_estatistica_1582.indb 144 19/07/12 11:12
145
Probabilidade e Estatística
Unidade 3
12) Durante o processo de fabricação de parafusos, fez-se uma 
amostragem aleatória e, de cada elemento obtido, calculou-se a 
diferença entre o peso (em miligramas) que o parafuso devia ter 
segundo o projeto e o real peso logo de fabricado, obtendo os 
seguintes dados.
Diferença de pesos em miligramas: 
40,208
42,303
43,262
48,914
49,46
52,681
52,764
52,87
57,784
61,411
68,02
71,615
72,471
74,176
75,973
78,769
81,412
81,736
82,756
106,354
Para analisar o comportamento das discrepâncias dos pesos, trace 
o gráfico box-plot do conjunto de dados amostrais da fábrica de 
parafusos.
probabilidade_e_estatistica_1582.indb 145 19/07/12 11:12
146
Universidade do Sul de Santa Catarina
Saiba mais
Se você desejar, aprofunde os conteúdos estudados nesta unidade 
ao consultar as seguintes referências:
BARBETTA, Pedro Alberto. Estatística aplicada às ciências 
sociais. 5. ed. rev. Florianópolis: Ed. UFSC, 2002.
CRESPO, Antônio Arnot. Estatística fácil. São Paulo: Saraiva, 
2001.
LEVIN, Jack. Estatística aplicada às Ciências Humanas. São 
Paulo: Habra, 1987.
SILVA, Ermes Medeiros da. Estatística. v. 1. São Paulo: Atlas, 
1996.
TRIOLA, Mario F. Introdução à Estatística. Rio de Janeiro: 
LTC, 1999.
probabilidade_e_estatistica_1582.indb 146 19/07/12 11:12
4UNIDADE 4Cálculo e distribuição de probabilidades
Objetivos de aprendizagem
 � Calcular e interpretar probabilidades.
 � Compreender variável aleatória e distribuição de 
probabilidades.
 � Compreender o que é variável aleatóriadiscreta e 
contínua.
 � Compreender distribuição discreta e contínua de 
probabilidades.
 � Calcular probabilidade usando distribuição contínua de 
probabilidades.
Seções de estudo
Seção 1 Principais conceitos
Seção 2 Cálculo de probabilidade
Seção 3 Noções sobre variável aleatória e distribuição de 
probabilidades
Seção 4 Os tipos de distribuições de probabilidades
Seção 5 Cálculo de probabilidade usando a distribuição
probabilidade_e_estatistica_1582.indb 147 19/07/12 11:12
148
Universidade do Sul de Santa Catarina
Para início de estudo
Nesta unidade, você iniciará o estudo da Estatística Indutiva, que 
tem como base o estudo de Probabilidades.
Talvez você deva estar se perguntando: Probabilidade? O 
que é? Tenho certeza que muitas vezes você já pensou em 
“possibilidades” de algo acontecer. Será que vai chover? Será 
que serei escolhido para participar de um grupo? Será que vou 
encontrar meu amigo hoje? Etc. 
Muitas vezes, não podemos prever acontecimentos como esses, 
ou seja, podem acontecer ou não. Você até poderia associar isso 
tudo à sorte ou ao azar, enfim, ao acaso. E é aqui que o estudo 
de probabilidade entra. Tentar formular e calcular modelos 
matemáticos que definam essas situações e possibilite a você tomar 
suas decisões e, assim, conduzir sua vida, suas experiências e seus 
caminhos; este é um dos principais objetivos desta unidade.
Nessa unidade, você também conhecerá como é possível 
expressar em números algumas situações com a finalidade de 
possibilitar um melhor tratamento matemático a elas. Serão 
apresentados os tipos de distribuições de probabilidades e como 
se calcula probabilidade usando a distribuição discreta e a 
distribuição contínua de probabilidades.
Você está convidado a conhecer um pouco desse assunto! Vamos lá?! 
Bons Estudos! 
probabilidade_e_estatistica_1582.indb 148 19/07/12 11:12
149
Probabilidade e Estatística
Unidade 4
Seção 1 – Principais conceitos
Você conhecerá, nesta seção, o que são fenômenos, o que é 
um espaço amostral e o que são eventos. Estes são alguns dos 
conceitos mais importantes que são utilizados na Probabilidade. 
O objetivo é que você compreenda como aplicar estes 
conhecimentos no seu dia a dia! 
Fenômenos (ou experimentos)
Você pode entender por fenômeno qualquer acontecimento, seja 
ele natural ou não.Eles podem ser classificados em dois tipos: 
determinísticos ou aleatórios.
 � Fenômenos determinísticos: são fenômenos em que as 
condições iniciais determinam um único resultado.
 � Fenômenos aleatórios: são fenômenos em que as 
condições iniciais não determinam a possibilidade da 
existência de um resultado em particular.
Em resumo, quando você pode determinar o resultado de um 
fenômeno, você irá chamá-lo de determinístico, mas quando os 
resultados do fenômeno não podem ser determinados, você irá 
chamá-lo de aleatório, pois pode apresentar qualquer resultado 
dentro de um grupo de esperados (mais de um).
Veja, a seguir, exemplos de cada um deles.
probabilidade_e_estatistica_1582.indb 149 19/07/12 11:12
150
Universidade do Sul de Santa Catarina
Para ilustrar, considere dois dados diferentes, o dado 1 
tem as faces com o mesmo número de pontos em cada 
face, e o dado 2 é um dado normal, tem as faces com 
números de pontos diferentes. 
� Dado 1: tem as faces com o mesmo número de 
pontos; 
� Dado 2: é um dado normal, tem as faces com 
números de pontos diferentes e não é viciado (observe 
que um dado viciado é aquele que, ao ser jogado, 
sempre sai o mesmo número). 
 
Fenômeno determinístico – se você jogar o dado 
1 várias vezes, sob as mesmas condições, sempre 
irá apresentar o mesmo número de pontos na face 
voltada para cima. Nesse caso, você pode dizer que 
é um fenômeno determinístico, pois não existe outra 
possibilidade de resultado e é possível prever qual será. 
 
Fenômeno aleatório – se você jogar o dado 2 várias 
vezes, sob as mesmas condições, poderá apresentar 
resultados diferentes a cada lançamento. Nesse caso, 
você pode dizer que é um fenômeno aleatório, pois 
existem várias possibilidades de resultado e não é 
possível prever qual será.
A partir do exposto, conclui-se que o estudo de probabilidade 
é baseado nos fenômenos aleatórios. Você pode dizer que o 
estudo de probabilidades está intimamente ligado ao acaso.
Espaço amostral
Observe que quando se trabalha com experimentos que admitem 
mais de um resultado, torna-se interessante definir o conjunto 
de todos esses resultados; nesse caso, você pode chamar esse 
conjunto de espaço amostral.
Espaço amostral é o conjunto de todos os possíveis 
resultados de um experimento (fenômeno) aleatório.
O símbolo para representar o 
conjunto do espaço amostral é S 
(letra maiúscula).
probabilidade_e_estatistica_1582.indb 150 19/07/12 11:12
151
Probabilidade e Estatística
Unidade 4
Veja, a seguir, exemplos sobre o espaço amostral.
Ao verificar os exemplos, lembre-se de que o número 
de elementos do conjunto do espaço amostral é 
representado por n(S): 
n(S) = número de elementos de S.
Exemplo 1: você pode usar o dado 2, citado no exemplo 
anterior, e estudar todas as possibilidades. Pode-se construir o 
seguinte conjunto:
S = {1, 2, 3, 4, 5, 6}: observe que são todas as possibilidades de 
pontos de um dado normal.
Exemplo 2: um médico trabalha com um grupo de pessoas 
com problemas de alcoolismo. O grupo é composto por cinco 
pessoas. Duas delas apresentam cirrose e três não apresentam 
cirrose (veja legenda).
Cn – Pessoa número ‘n’ com cirrose
Pn – Pessoa número ‘n’ sem cirrose
Ex.: C1 – pessoa número 1 com cirrose; 
P1 – pessoa número 1 sem cirrose.
Pode-se construir o seguinte conjunto:
S = {C1, C2, P1, P2, P3}: observe que são todas as possibilidades 
entre as pessoas do grupo.
Exemplo 3: um psicólogo trabalha com um grupo de pessoas 
e estuda os distúrbios do sono. O grupo é composto por 
sete pessoas. Cinco delas apresentam distúrbios e duas não 
apresentam distúrbios (veja legenda).
Dn – Pessoa número ‘n’ com distúrbio
Pn – Pessoa número ‘n’ sem distúrbio
Ex.: D1 – pessoa número 1 com distúrbio; 
P1 – pessoa número 1 sem distúrbio.
probabilidade_e_estatistica_1582.indb 151 19/07/12 11:12
152
Universidade do Sul de Santa Catarina
Pode-se construir o seguinte conjunto:
S = {D1, D2, D3, D4, D5, P1, P2}: observe que são todas as 
possibilidades entre as pessoas do grupo.
Exemplo 4: um grupo de pessoas que apresentam diferenças na 
cor do cabelo (veja legenda). 
Pn – Pessoa número ‘n’ com cabelos pretos
Ln – Pessoa número ‘n’ com cabelos louros
Cn – Pessoa número ‘n’ com cabelos castanhos
Rn – Pessoa número ‘n’ com cabelos ruivos
Ex.: P1 – pessoa número 1 com cabelos pretos;
L1 – pessoa número 1 com cabelos louros.
Sabendo que, nesse grupo, você tem três pessoas com cabelos 
pretos, duas com cabelos louros, três com cabelos castanhos 
e uma com cabelos ruivos, como fica o conjunto do espaço 
amostral? Pense e anote a seguir como você acha que fica o 
conjunto do espaço amostral do exemplo:
S = {______________________________________}
Agora, compare se o seu conjunto do espaço amostral está igual 
ao seguinte conjunto do espaço amostral:
S = {P1, P2, P3, L1, L2, C1, C2, C3, R1}: observe que são todas 
as possibilidades entre as pessoas do grupo.
Qual é o número de elementos dos espaços amostrais citados nos 
exemplos dados? Veja:
No exemplo 1: n(S) = 6; 
No exemplo 2: n(S) = 5; 
No exemplo 3: n(S) = 7; 
No exemplo 4: n(S) = 9.
probabilidade_e_estatistica_1582.indb 152 19/07/12 11:12
153
Probabilidade e Estatística
Unidade 4
Eventos
Quando você tiver que estudar algum experimento aleatório, 
deverá identificar as diferentes variações de resultados possíveis 
dentro do espaço amostral. Você pode chamar de evento 
cada uma dessas variações, ou seja, cada uma dessas partes 
(subconjuntos) do espaço amostral é um evento.
Um evento é qualquer subconjunto do espaço amostral 
determinado pelo experimento (fenômeno) aleatório em estudo.
Ao verificar os exemplos, lembre-sede que o número 
de elementos de evento é representado por n(A): 
n(A) = número de elementos de A.
Usando os exemplos citados anteriormente, você pode observar:
Exemplo 1: você pode usar o dado 2, citado no exemplo anterior, 
e estudar todas as possibilidades. 
Pode-se construir o seguinte evento: 
A: sair um número par na face superior. 
A = {2, 4, 6}: observe que são todas as possibilidades de pontos 
pares de dado normal.
Exemplo 2: um médico trabalha com um grupo de pessoas 
com problemas de alcoolismo. O grupo é composto por cinco 
pessoas. Duas delas apresentam cirrose e três não apresentam 
cirrose (veja legenda).
Cn – Pessoa número ‘n’ com cirrose
Pn – Pessoa número ‘n’ sem cirrose
Ex.: C1 – pessoa número 1 com cirrose; 
P1 – pessoa número 1 sem cirrose.
O símbolo para representar 
o subconjunto de um 
evento é A (letra 
maiúscula).
probabilidade_e_estatistica_1582.indb 153 19/07/12 11:12
154
Universidade do Sul de Santa Catarina
Pode-se construir o seguinte conjunto:
B: ser uma pessoa sem cirrose.
B = {P1, P2, P3}: observe que são todas as possibilidades de 
pessoas sem cirrose.
Exemplo 3: um professor trabalha com um grupo de pessoas 
e estuda os distúrbios do humor. O grupo é composto por 
sete pessoas. Cinco delas apresentam distúrbios e duas não 
apresentam distúrbios (veja legenda).
Dn – Pessoa número ‘n’ com distúrbio
Pn – Pessoa número ‘n’ sem distúrbio
Ex.: D1 – pessoa número 1 com distúrbio; 
P1 – pessoa número 1 sem distúrbio.
Pode-se construir o seguinte evento:
C: ser uma pessoa com distúrbio.
C = {D1, D2, D3, D4, D5}: observe que são todas as 
possibilidades de pessoas com distúrbio.
Exemplo 4: um grupo de pessoas que apresentam diferenças na 
cor do cabelo (veja legenda).
Pn – Pessoa número ‘n’ com cabelos pretos
Ln – Pessoa número ‘n’ com cabelos louros
Cn – Pessoa número ‘n’ com cabelos castanhos
Rn – Pessoa número ‘n’ com cabelos ruivos
Ex.: P1 – pessoa número 1 com cabelos pretos;
L1 – pessoa número 1 com cabelos louros.
Sabendo que nesse grupo você tem três pessoas com cabelos 
pretos, duas com cabelos louros, três com cabelos castanhos e 
uma com cabelos ruivos, como fica o subconjunto do evento 
pessoas com cabelos ruivos? 
probabilidade_e_estatistica_1582.indb 154 19/07/12 11:12
155
Probabilidade e Estatística
Unidade 4
Pode-se construir o seguinte evento:
D: ser uma pessoa com cabelos ruivos.
D = {R1}: observe que é a única possibilidade com cabelos ruivos.
Qual é o número de elementos dos eventos citados nos exemplos 
anteriores?
No exemplo 1: n(A) = 3; 
No exemplo 2: n(B) = 3; 
No exemplo 3: n(C) = 5; 
No exemplo 4: n(D) = 1.
Tipos de eventos
Existem três tipos de eventos, que são:
 � Evento simples: formado por apenas um elemento do 
espaço amostral.
Exemplo: D: ser uma pessoa com cabelos ruivos. (Veja o 
exemplo 4)
D = {R1} ⇒ n(D) = 1. 
 � Evento composto: formado por dois ou mais elementos 
do espaço amostral.
Exemplo: B: ser uma pessoa sem cirrose. (Veja o exemplo 
2)
B = {P1, P2, P3} ⇒ n(B) = 3 
 � Evento impossível: não ocorre, seja qual for a realização 
do experimento aleatório.
Exemplo: F: ser uma pessoa com cabelos verdes naturais. 
(Veja o exemplo 4)
F = { } ⇒ n(F) = 0 
probabilidade_e_estatistica_1582.indb 155 19/07/12 11:12
156
Universidade do Sul de Santa Catarina
 � Evento certo: é quando o evento é o próprio espaço 
amostral.
Exemplo: E: ser uma pessoa com alcoolismo. (Veja o 
exemplo 2)
E={C1, C2, P1, P2, P3} ⇒ n (E)= 5 = n(S) 
Operações com eventos
As operações com eventos são muito semelhantes às operações 
com conjuntos, até porque os eventos nada mais são que 
conjuntos. Veja, a seguir, mais detalhes sobre este assunto.
União de eventos 
Se existem os eventos A e B de um espaço amostral S, a união 
desses eventos existe se pode ocorrer A ou B.
A B 
S 
Figura 4.1 – Representação em diagrama da união entre eventos
Fonte: Elaboração do autor (2006). 
A união de A e B pode ser representada por: A soma B ou A∪B. 
A união corresponde a toda a área colorida. 
Interseção de eventos 
Se existem os eventos A e B de um espaço amostral S, 
a interseção desses eventos existe se pode ocorrer A e B, 
simultaneamente.
probabilidade_e_estatistica_1582.indb 156 19/07/12 11:12
157
Probabilidade e Estatística
Unidade 4
A 
S 
Figura 4.2 – Representação em diagrama da intersecção entre eventos
Fonte: Elaboração do autor (2006). 
A interseção de A e B pode ser representada por: A vezes B ou 
A∩B. A interseção corresponde a toda a área colorida.
Complemento de um evento
É um evento formado por todos os elementos pertencentes a S, 
mas que não pertencem a A.
A 
S 
A’ 
Figura 4.3 – Representação em diagrama do complementar de um evento
Fonte: Elaboração do autor (2006). 
Complementar de A – pode ser representado por: , A’ ou CA. O 
complementar de A corresponde a toda a área colorida.
probabilidade_e_estatistica_1582.indb 157 19/07/12 11:12
158
Universidade do Sul de Santa Catarina
Subtração de eventos
Você pode dizer que A menos B é se, e somente se, ocorre A e 
não ocorre B.
A B 
S 
Figura 4.4 – Representação em diagrama da subtração de eventos
Fonte: Elaboração do autor (2006). 
A subtração de eventos pode ser representada por A − B, que 
corresponde a toda a área colorida.
Eventos excludentes
Dois ou mais eventos são ditos excludentes (mutuamente 
exclusivos) se a realização de um dos eventos excluir a realização 
do outro ou de outros eventos. 
A
B 
S 
C 
Figura 4.5 – Representação em diagrama da subtração de eventos
Fonte: Elaboração do autor (2006). 
Se, quando A ocorrer, exclui ocorrerem os outros, isso quer 
dizer que não há interseção entre eles! A e B são mutuamente 
exclusivos e B e C não são mutuamente exclusivos.
Agora que você já estudou os conceitos mais importantes que são 
utilizados na probabilidade, é hora de conhecer como é feito o 
cálculo de probabilidade. Acompanhe na seção a seguir!
probabilidade_e_estatistica_1582.indb 158 19/07/12 11:12
159
Probabilidade e Estatística
Unidade 4
Seção 2 – Cálculo de probabilidade
Nesta seção, vamos estudar os conceitos de probabilidade e a 
forma de fazer seus cálculos! Acompanhe as duas definições 
mais importantes dentro do estudo de probabilidades. São elas: a 
definição clássica de probabilidade e a frequência relativa. 
Veja, então, separadamente, cada uma dessas definições.
Probabilidade clássica
Antes de conhecer como se calcular a probabilidade clássica, 
saiba como ela é possível.
A probabilidade de ocorrer um determinado resultado 
na realização de um experimento é igual ao quociente 
entre o número de casos favoráveis ao sucesso (número 
de elementos do evento A) e o número de casos 
possíveis (número de elementos do espaço amostral S).
Observe a fórmula a seguir:
Probabilidade de um evento A ocorrer:
= P = sucesso
Observação: A probabilidade de não ocorrência pode ser 
representada por:
= q = fracasso
Observe que, se você quiser o resultado em porcentagem, deve 
multiplicá-lo por 100 ao final. 
probabilidade_e_estatistica_1582.indb 159 19/07/12 11:12
160
Universidade do Sul de Santa Catarina
Veja, a seguir, alguns exemplos do cálculo de probabilidade clássica.
Exemplo 1: em um levantamento feito com oito moradores de um 
condomínio, verificou-se que dois são casados, dois são solteiros, três 
são divorciados e um é viúvo. Qual a probabilidade de, ao escolher 
um morador ao acaso, ele ser casado? E qual a probabilidade de, ao 
escolher um morador ao acaso, ele ser divorciado?
Compreenda passo a passo 
Passo 1: identificar os elementos do espaço amostral e do evento 
solicitado.
S: moradores do condomínio
A: moradores casados
B: moradores divorciados
S = {C1, C2, S1, S2, D1, D2, 
D3, V1}
A = {E1, E2}
B = {F1, F2, F3}
Passo 2: identificar o número de elementos de cada conjunto.
n(S) = 8; 
n(A) = 2; 
n(B) = 3.
Passo 3: usar a fórmula da probabilidade. 
Observação: Após efetuar a divisão é só multiplicar por 100 para 
obter a probabilidadena forma percentual.
Para o evento A: 
Para o evento B: 
P(A) = 0,25 ou 25%
P(A) = 0,375 ou 37,5%
Legenda:
Estado civil: 
C – Casado (dois moradores ) C1, C2 
S – Solteiro (dois moradores) S1, S2 
D – Divorciado (três moradores) D1, 
D2, D3 
V – Viúvo (um morador) V1
probabilidade_e_estatistica_1582.indb 160 19/07/12 11:12
161
Probabilidade e Estatística
Unidade 4
Passo 4: interpretar os dados.
Como interpretar estes dados? A probabilidade de um morador 
casado ser escolhido é de 25%, e a probabilidade de um morador 
divorciado ser escolhido é de 37,5%.
Exemplo 2: em um levantamento realizado com um grupo de 90 
chefes de famílias com diferentes vínculos de trabalho, obteve-se 
os seguintes resultados (dados fictícios):
Pesquisa dos motivos de estresse
Tipos de vínculo Nº de pessoas
M Funcionário público municipal 29
E Funcionário público estadual 24
F Funcionário público federal 20
C Comerciário 17
T Temporário 17
I Comércio informal 11
Total 118
Evento A
Evento C
Evento B
Espaço 
amostral
n(A)
n(C)
n(B)
Tamanho do espaço 
amostral: n(S)
Figura 4.6 – Resultado do levantamento
Fonte: Elaboração do autor (2006). 
Se você escolher ao acaso uma pessoa do grupo pesquisado, qual 
a probabilidade de ela ter vínculo do tipo:
a) funcionário público municipal?
b) comerciário?
c) comércio informal?
probabilidade_e_estatistica_1582.indb 161 19/07/12 11:12
162
Universidade do Sul de Santa Catarina
Compreenda passo a passo 
Passo 1: identificar os elementos do espaço amostral e do evento 
solicitado.
S: todas as pessoas pesquisadas;
A: pessoa com vínculo do tipo funcionário público municipal;
B: pessoa com vínculo do tipo comerciário;
C: pessoa com vínculo do tipo comercio informal.
Passo 2: identificar o número de elementos de cada conjunto.
n(S) = 118 
n(A) = 29 
n(B) = 11 
n(C) = 17
Passo 3: usar a fórmula da probabilidade.
Obs: Após efetuar a divisão, é só multiplicar o resultado por 100 
para obter a probabilidade na forma percentual.
Para o evento A
P(A) = 0,2458 ou 24,58%
Para o evento B
P(B) = 0,0932 ou 9,32%
Para o evento C
P(C) = 0,1441 ou 14,41%
No exemplo anterior, você calculou a probabilidade para 
três eventos. A seguir, você montará uma tabela com as 
probabilidades para todos os eventos calculados. Siga os passos:
probabilidade_e_estatistica_1582.indb 162 19/07/12 11:12
163
Probabilidade e Estatística
Unidade 4
Compreenda passo a passo 
Passo 1: identificar os elementos do espaço amostral e do evento 
solicitado.
S: todas as pessoas pesquisadas (no caso, pessoas acometidas de 
estresse); 
D: pessoa com vínculo do tipo funcionário público estadual;
E: pessoa com vínculo do tipo funcionário público federal;
F: pessoa com vínculo do tipo temporário.
Passo 2: identificar o número de elementos de cada conjunto.
n(S) = 118 
n(D) = 24 
n(E) = 20 
n(F) = 17
Passo 3: usar a fórmula da probabilidade.
Obs: Após efetuar a divisão, é só multiplicar o resultado por 100 
para obter a probabilidade na forma percentual.
Para o evento D
P(D) = 0,2034 ou 20,34%
Para o evento E
P(E) = 0,1695 ou 16,95%
Para o evento F
P(F) = 0,1441 ou 14,41%
probabilidade_e_estatistica_1582.indb 163 19/07/12 11:12
164
Universidade do Sul de Santa Catarina
Passo 4: montar a tabela com as probabilidades correspondentes a 
cada evento.
Tabela 4.1 – Levantamento com 90 chefes de famílias sobre os diferentes vínculos de 
trabalho
Tipos de vínculo Nº de pessoas Probabilidade
M Funcionário público municipal 29 0,2458
E Funcionário público estadual 24 0,2034
F Funcionário público federal 20 0,1695
C Comerciário 17 0,1441
T Temporário 17 0,1441
I Comércio informal 11 0,0932
Total 118 1*
* Repare que a soma é 1 ou 100% 
Fonte: Elaboração do autor (2006).
Agora que você já compreendeu o conceito clássico de 
probabilidade e como realizar os cálculos, é hora de compreender 
o que é frequência relativa e como realizar os cálculos.
Frequência Relativa
A frequência relativa de um evento A é calculada dividindo o 
número de vezes que ocorre o evento A pelo total de observação 
do experimento. É chamada, também, de probabilidade 
avaliada ou probabilidade estimada.
Veja a fórmula abaixo:
Frequência relativa de um evento A:
frA =
número de vezes que ocorreu A
número total de observações
probabilidade_e_estatistica_1582.indb 164 19/07/12 11:12
165
Probabilidade e Estatística
Unidade 4
Na verdade, a frequência relativa é calculada quando você se deparar 
com situações em que o cálculo da probabilidade de um evento não 
é possível. Nesse caso, só é possível o cálculo de uma aproximação, 
a qual, por sua vez, consiste em analisar o experimento e, com os 
resultados obtidos, calcular a frequência relativa.
É importante que você saiba que essa aproximação 
para o cálculo de probabilidade só será considerável 
caso haja um número bastante grande de tentativas 
de execução do experimento. Como fazer isso? Veja os 
exemplos a seguir.
Exemplos do cálculo da frequência relativa
Em um teste feito em laboratório com cobaias, foi analisada uma 
delas e, após inúmeras vezes, sob efeito de estímulos (comida, 
reação a dor etc.), ela executou um comando, que era empurrar 
uma pequena alavanca. Foi observado que, após 3500 estímulos, 
a cobaia executou o comando 875 vezes. Qual é a frequência 
relativa para o evento A: a cobaia executar o comando?
Acompanhe passo a passo 
Passo 1: identificar o numerador e o denominador da fórmula.
Número total de observações: 3500
Número de vezes que ocorre A: 875
probabilidade_e_estatistica_1582.indb 165 19/07/12 11:12
166
Universidade do Sul de Santa Catarina
Passo 2: usar a fórmula da frequência relativa.
Obs: Após efetuar a divisão, é só multiplicar o resultado por 100 
para obter a probabilidade na forma percentual.
frA =
número de vezes que ocorreu A
número total de observações
Passo 3: interpretar os dados. 
A frequência relativa para a cobaia executar a tarefa é de 25%; ou, 
ainda, a probabilidade estimada da cobaia executar a tarefa é de 25%.
Algumas considerações 
Consideremos S um espaço amostral, e A, B, C são eventos 
contidos em S, então:
a) para cada evento A → 0 ≤ P(A) ≤ 1 (a probabilidade de A 
vai de 0 a 1 ou de 0% a 100%);
b) P(S) = 1 ↔ 
c) sejam A, B e C todos os eventos possíveis do espaço 
amostral, então: P(A) + P(B) + P(C) = 1 ou 100%;
d) quando A e B são mutuamente exclusivos: 
P(A∪B) = P(A) + P(B);
e) quando A e B não são mutuamente exclusivos: 
P(A∪B) = P(A) + P(B) – P(A∩B);
f) se A, B, C, ... são uma sequência de eventos mutuamente 
exclusivos, então: 
P(A∪B∪C∪...) = P(A) + P(B) + P(C) + ...
probabilidade_e_estatistica_1582.indb 166 19/07/12 11:12
167
Probabilidade e Estatística
Unidade 4
Seção 3 – Noções sobre variável aleatória e 
distribuição de probabilidades 
A variável aleatória é uma ferramenta na análise estatística que 
possibilita a atribuição de números para resultados de experimentos, 
adequando, assim, o problema para um melhor tratamento 
matemático. Dentro da Estatística, ela é considerada uma função 
que associa números aos eventos de um espaço amostral. Você 
poderá entender melhor se começar analisando um exemplo.
Exemplos de variável aleatória e distribuição de probabilidades
Exemplo 1: se o experimento consistir em dois lançamentos de 
uma moeda, e a variável aleatória (v.a.), definida como o nº de caras 
obtidas em dois lançamentos de uma moeda, então você terá:
v.a. ⇒ X = nº de caras obtidas em dois lançamentos de uma moeda
X definirá uma variável aleatória que poderá assumir os valores 
descritos na tabela a seguir (K = cara e C = coroa). 
Tabela 4.2 – Organização dos resultados e valores
Resultados
1º lançamento
Resultados 
2º lançamento
Resultados possíveis nos dois 
lançamentos Valor VA
K
K
C
C
K
C
K
C
KK
KC
CK
CC
2
1
1
0
Fonte: Elaboração do autor (2006).
Você pode observar que existe apenas uma possibilidade para 
cada situação e o total de possibilidades é 4; entãoo cálculo da 
probabilidade se dá da seguinte forma:
 
probabilidade_e_estatistica_1582.indb 167 19/07/12 11:12
168
Universidade do Sul de Santa Catarina
Escrevendo na tabela, atribuindo a probabilidade de cada linha 
você terá:
Tabela 4.3 – Distribuição de probabilidade
Resultados possíveis 
nos dois lançamentos
Valor VA Probabilidade
KK
KC
CK
CC
2
1
1
0
1/4
1/4
1/4
1/4
Fonte: Elaboração do autor (2006). 
Esta tabela caracteriza a distribuição de 
probabilidade, que é a probabilidade de ocorrência 
de cada um dos valores da variável aleatória.
Note que o valor 1 se repete, não é? Então, você pode agrupar 
e montar uma nova tabela sem as repetições. É claro que se 
agrupam os valores repetidos. Você deve somar as probabilidades, 
não se esqueça disso. Observe:
Tabela 4.4 – Agrupamento de resultados
Nº de caras (Valor v.a.) Probabilidade
2
1
0
1/4
1/2
1/4
Fonte: Elaboração do autor (2006). 
Duas 
possibilidades de 
sair uma cara
 
Ao agrupar os resultados 
da variável aleatória (uma 
cara – 1), você deve somar 
as probabilidades: 
probabilidade_e_estatistica_1582.indb 168 19/07/12 11:12
169
Probabilidade e Estatística
Unidade 4
Seção 4 – Os tipos de distribuições de probabilidades
O estudo de probabilidades é uma ferramenta de apoio à decisão. 
É com base em seu estudo que você terá oportunidade de suporte 
para analisar os experimentos, organizar suas possibilidades e, então, 
partir para a ação, adotando o resultado que julgar mais eficaz. 
A variável aleatória e a distribuição de probabilidades são muito 
utilizadas nesse sentido. Você pode ver que, a cada valor da 
variável, corresponde uma probabilidade de ocorrência. Como a 
variável aleatória possibilita a atribuição de valores aos eventos, 
você pode encontrar dois tipos de situação.
Variáveis aleatórias discretas: ela pode assumir um conjunto 
constante discreto, ou seja, enumerável, finito de valores.
Número de caras resultante de lançamentos de uma 
moeda, quantidade de caminhões de determinado 
modelo, número de defeitos por peça, entre outros, 
são exemplos deste tipo de variáveis. 
Variáveis aleatórias contínuas: é a variável em que não 
conseguimos enumerar seus possíveis resultados, por estes 
formarem um conjunto infinito de valores num intervalo de 
números reais. 
São exemplos desse tipo de variáveis: peso, altura, 
temperatura, tempo de transporte, custo de uma 
operação etc.
Baseado nesses dois conceitos, você pode atribuir a cada um dos 
tipos de variáveis aleatórias uma distribuição de probabilidades de 
acordo com o tipo de variável, veja a figura a seguir:
probabilidade_e_estatistica_1582.indb 169 19/07/12 11:12
170
Universidade do Sul de Santa Catarina
Variável aleatória
discreta
Variável aleatória
contínua
Distribuição discreta
de probabilidade
Distribuição contínua
de probabilidade
Figura 4.7 – Tipos de distribuição de probabilidade
Fonte: Elaboração do autor (2006).
Como você pôde observar, cada tipo de variável gera um tipo 
de distribuição de probabilidade. Em resumo, os tipos de 
distribuição de probabilidades são:
 � Distribuição discreta de probabilidades; e 
 � Distribuição contínua de probabilidades.
Como elas são diferentes, os métodos de cálculos das 
probabilidades também são.
Você vai estudar, na próxima seção, os modelos mais importantes 
e mais aplicados dentro da área de seu curso, que são a 
distribuição binomial, para a variável discreta, e a distribuição 
normal, para a contínua.
Para o bom andamento de seu 
estudo, é importante que você 
entenda bem a diferença entre 
as duas variáveis, a discreta e a 
contínua!
probabilidade_e_estatistica_1582.indb 170 19/07/12 11:12
171
Probabilidade e Estatística
Unidade 4
Seção 5 – Cálculo de probabilidade usando a 
distribuição
Uma distribuição discreta de probabilidade de uma variável 
aleatória atribui probabilidades aos distintos valores 
dessa variável. Observe que essa distribuição não atribui 
probabilidade para intervalos, e sim para cada valor ou para um 
conjunto de valores da variável.
Uma das principais distribuições discretas é a binomial. Veja, a 
seguir, como se calcula probabilidade usando esse método.
Como se calcula a distribuição binomial? 
A distribuição binomial é o método utilizado para cálculo de 
probabilidades de experimentos que se repetem algumas vezes e 
seguem algumas características.
A distribuição binomial é aplicável se: 
1. o experimento que você está observando for repetido n 
vezes independentes;
2. cada tentativa (repetição) admitir somente dois 
resultados:
 � sucesso: denotado por S;
 � fracasso: denotado por F.
A probabilidade de sucesso é denotada por p ⇒ P(S) = p, e a 
probabilidade de fracasso é denotada por q ⇒ P(F) = q.
Importante: A soma da probabilidade de sucesso e fracasso é 
igual a 100%, ou seja, é igual a 1 ⇒ p + q = 1.
A soma é utilizada se você estiver interessado em estudar o número 
de sucessos e fracassos sem importar a ordem em que acontecem.
probabilidade_e_estatistica_1582.indb 171 19/07/12 11:12
172
Universidade do Sul de Santa Catarina
Diante do exposto, é importante salientar que:
 � a distribuição binomial só é aplicável caso ocorram os 
três casos citados anteriormente;
 � os termos sucesso e fracasso são usados se o resultado 
esperado ocorre ou não, ou seja, depende do objetivo de 
seu estudo. 
Veja o exemplo a seguir para compreender como realizar os 
cálculos:
Em um exame, você deseja saber a probabilidade de erro de uma 
determinada questão. Essa questão apresenta cinco alternativas 
(a, b, c, d, e) e somente uma está correta. 
Qual é a probabilidade de sucesso?
Nesse caso, o objetivo é estudar a probabilidade de erro, então, o 
sucesso se refere ao erro. Para calcular a probabilidade de sucesso, 
você deve calcular a probabilidade de erro da questão. 
Veja como se calcula passo a passo
Passo 1: identificar os elementos do espaço amostral e do evento 
solicitado.
A: errar a questão
S: todas as opções (a, b, c, d, e)
Passo 2: identificar o número de elementos do evento e do espaço 
amostral.
n(A) = 4 (se somente uma está correta, sobram quatro incorretas) 
n(S) = 5
probabilidade_e_estatistica_1582.indb 172 19/07/12 11:12
173
Probabilidade e Estatística
Unidade 4
Passo 3: usar a fórmula da probabilidade.
 → a probabilidade de sucesso é, 
então, p = 0,8.
Qual é a probabilidade de fracasso?
Acompanhe passo a passo
Passo 1: identificar os elementos do espaço amostral e do evento 
solicitado.
B: acertar a questão
S: todas as opções (a, b, c, d, e)
Passo 2: identificar o número de elementos do evento e do espaço 
amostral.
n(B) = 1 (se somente uma está correta) 
n(S) = 5
Passo 3: usar a fórmula da probabilidade.
 – a probabilidade de sucesso é, então, 
q = 0,2
Observe: 
p + q = 0,8 + 0,2 = 1 ou 100%
‑ Espero que a diferença tenha sido percebida. Lembre‑se de que o suces‑
so não está ligado a acontecimentos bons e, sim, se ocorrer o resulta‑
do que é objetivo de seu estudo. 
probabilidade_e_estatistica_1582.indb 173 19/07/12 11:12
174
Universidade do Sul de Santa Catarina
Analise o seguinte exemplo: estudar a probabilidade de errar, 
como no exemplo anterior. Ainda citando o exemplo anterior: 
nesse problema, você estudou a probabilidade de errar somente 
uma questão do exame, e para estudar as possibilidades de erro 
ou acerto de questões de um exame inteiro? É aí que entra a 
distribuição binomial.
Você sabe qual o método de cálculo?
No exemplo anterior, você calculou a probabilidade de sucesso 
(errar) para somente uma tentativa (questão). Agora, você 
vai calcular, para n tentativas, a probabilidade de k sucessos. 
Acompanhe: 
Seja X o número de sucessos em n tentativas do experimento.
Então, a fórmula para determinar a probabilidade de um dado 
número k de sucessos é dada por:
P(X = K) = Cn,k . pk . qn‑k
Sendo:
Cn,k = combinação de n elementos organizados em grupos de k 
elementos; 
n = tentativas do experimento;
k = número de sucessos desejados;
p =probabilidade de sucesso (ocorrência do evento);
q = probabilidade de fracasso (não ocorrência do evento).
Notação: n!
n! = n.(n − 1).(n − 2). ... .2.1
k! = k.(k − 1).(k − 2). ... .2.1
Veja, a seguir, exemplos do cálculo de probabilidade usando a 
distribuição binomial.
probabilidade_e_estatistica_1582.indb 174 19/07/12 11:12
175
Probabilidade e Estatística
Unidade 4
Exemplo 1: uma prova com quatro questões, cada uma apresenta 
cinco alternativas (a, b, c, d, e) e somente uma está correta. Qual 
a probabilidade de errar duas questões?
Passo 1: calcular a probabilidade de errar (no caso, sucesso) para 
cada questão.
A: errar a questão
S: todas as opções (a, b, c, d, e) 
n(A) = 4 (se somente uma está correta, sobram quatro incorretas) 
n(S) = 5
 – a probabilidade de sucesso é, 
então, p = 0,8.
Passo 2: calcular a probabilidade de acertar (no caso, fracasso) para 
cada questão.
Você pode calcular de dois modos:
1. Primeiro modo de cálculo:
B: acertar a questão 
S: todas as opções (a, b, c, d, e) 
n(B) = 1 (se somente uma está correta) 
n(S) = 5
 – a probabilidade de fracasso, então 
q = 0,2
2. Segundo modo de cálculo:
p + q = 1 ⇒ 0,8 + q = 1 ⇒ q = 1 – 0,8 ⇒ q = 0,2
Nesse caso, o objetivo é 
estudar a probabilidade 
de erro, então, o sucesso 
se refere ao erro. Veja, 
a seguir como se calcula 
passo a passo.
probabilidade_e_estatistica_1582.indb 175 19/07/12 11:12
176
Universidade do Sul de Santa Catarina
Passo 3: identificar cada um dos componentes da fórmula.
n = 4 (total de repetições – são quatro questões com as mesmas 
características) 
k = 2 (número de sucessos – errar duas questões)
p = 0,8 (probabilidade de sucesso, calculado anteriormente)
q = 0,2 (probabilidade de fracasso, calculado anteriormente)
Passo 4: calcular a probabilidade usando a fórmula apresentada.
P(X = K) = Cn,k . pk . qn‑k ⇒ 
Passo 5: como interpretar estes dados?
A probabilidade de uma pessoa acertar duas questões de um teste 
de quatro questões é de 15,36%. Note que não é 50%, pois você 
deve levar em consideração que cada questão tem sua probabilidade 
e, também, você pôde agrupar as questões de várias maneiras (errar 
a 1ª e a 3ª, ou a 2ª e a 4ª, ou a 1ª e a 4ª, e assim por diante).
Representação gráfica de uma distribuição binomial
Como se trata de uma distribuição, você pode construir um 
gráfico que represente as probabilidades do problema do exemplo 
usado. Claro que, para tanto, você deverá calcular a probabilidade 
para cada possibilidade, ou seja, para k = 0, 1, 2, 3 e 4. Não se 
assuste, pois, a seguir, você poderá acompanhar as probabilidades 
calculadas na tabela e o gráfico desta distribuição.
probabilidade_e_estatistica_1582.indb 176 19/07/12 11:12
177
Probabilidade e Estatística
Unidade 4
Tabela 4.5 – Probabilidade de errar as questões do teste
Número de erros P(X)
0 0,0016
1 0,0256
2 0,1536
3 0,4096
4 0,4096
Total 1
Fonte: Elaboração do autor (2006).
Gráfico 4.1 – Probabilidade de errar as questões no teste
Fonte: Elaboração do autor (2006).
Tudo o que você acabou de estudar, neste tópico, é o método 
de cálculo de probabilidade usando a distribuição binomial. A 
intenção, com esse estudo, é que você tenha uma noção desse 
processo, porém sem maiores aprofundamentos. 
Note que para cada uma 
das possibilidades é 
construída uma coluna.
probabilidade_e_estatistica_1582.indb 177 19/07/12 11:12
178
Universidade do Sul de Santa Catarina
Cálculo de probabilidade usando distribuição contínua de 
probabilidade
Uma distribuição contínua de probabilidade de uma variável 
aleatória atribui probabilidades a intervalos de valores dessa 
variável. Note que essa distribuição atribui probabilidade para 
intervalos, e não para um valor dessa variável.
Uma das principais distribuições contínuas é a normal. 
No decorrer desse tópico, você vai estudar um pouco dessa 
distribuição, além de aprender a calcular probabilidade usando 
esse método.
A distribuição normal
Como você estudou anteriormente, quando se utiliza uma 
variável aleatória contínua, pode-se atribuir probabilidade a 
essa variável. Conforme a seção anterior, os processos definidos 
a partir de contagens conduzem aos modelos que envolvem 
variáveis aleatórias discretas, enquanto que os processos definidos 
a partir de medidas conduzem aos modelos que envolvem 
variáveis aleatórias contínuas.
Variável aleatória
discreta
Variável aleatória
contínua
Contagens
Medidas
Figura 4.8 – Tipos de distribuições de probabilidade
Fonte: Elaboração do autor (2006).
Podemos citar, como exemplos de variáveis contínuas, a altura 
das pessoas, temperatura corporal, peso, escores obtidos em testes 
psicológicos etc.
Antes de começar o estudo do cálculo de probabilidade usando a 
distribuição normal, vamos relembrar alguns conceitos.
Considere a distribuição de frequências e seu histograma a 
seguir:
probabilidade_e_estatistica_1582.indb 178 19/07/12 11:12
179
Probabilidade e Estatística
Unidade 4
Tabela 4.6 – Tempo, em minutos, para as entregas urbanas da empresa X
Tempo (em minutos) Nº de entregas (fi)
15,9 |--- 18,7 2
18,7 |--- 21,5 6
21,5 |--- 24,3 10
24,3 |--- 27,1 14
27,1 |--- 29,9 10
29,9 |--- 32,7 6
32,7 |--- 35,5 2
Total (∑fi) 50
Fonte: Elaboração do autor (2006).
Histograma
Gráfico 4.2 – Tempo, em minutos, para as entregas urbanas da empresa X
Fonte: Elaboração do autor (2006).
probabilidade_e_estatistica_1582.indb 179 19/07/12 11:12
180
Universidade do Sul de Santa Catarina
Observe que o gráfico é construído no sistema de eixos 
cartesianos, não é mesmo? No eixo horizontal, são marcados 
os valores ou intervalos das classes assumidos pela variável. No 
eixo vertical, marcamos as frequências simples, que servirão para 
marcar a altura dos retângulos, indicando, assim, o número de 
observações (ocorrências) de cada valor ou classe da variável.
Como a altura de cada retângulo é proporcional à 
frequência simples, a área de cada retângulo também 
é. Considerando isso, a soma das áreas dos retângulos 
também é proporcional à frequência total.
Continuando com a recordação, veja, agora, o polígono de 
frequências. Para construir um polígono de frequência de dados, 
é só unir, por linhas, os pontos médios das bases superiores dos 
retângulos do histograma.
Acompanhe o exemplo a seguir.
0
2
4
6
8
10
12
14
16
15
,9 
|—
 18
,7
18
,7 
|—
 21
,5
21
,5 
|—
 24
,3
24
,3 
|—
 27
,1
27
,1 
|—
 29
,9
29
,9 
|—
 32
,7
32
,7 
|—
 35
,5
N
o d
e 
en
tr
eg
as
Tempo em minutos
Tempo, em minutos, para as entregas urbanas da empresa X 
Polígono de
Frequência
Estes triângulos
compensam os
que �cam fora
do polígono.
Gráfico 4.3 – Tempo, em minutos, para as entregas urbanas da empresa X
Fonte: Elaboração do autor (2006).
Mantenha essa informação à mão, 
pois, você irá usá-la novamente!
probabilidade_e_estatistica_1582.indb 180 19/07/12 11:12
181
Probabilidade e Estatística
Unidade 4
Você pôde observar que a área do histograma é igual à área 
abaixo do polígono de frequências, ou seja, os triângulos que 
ficam fora são compensados por aqueles que estão adicionados 
por dentro.
O gráfico expressa os tempos que a empresa levou 
para realizar 100% das entregas de um determinado 
período.
Você observou que o polígono de frequências tem um formato 
especial? Sim, ele tem o formato de um sino. Essa curva é chamada 
de curva normal ou curva de Gauss-Laplace e tem algumas 
características bem especiais. Conheça-a no tópico a seguir. 
Características da curva normal
Analisando o polígono de frequências da grande maioria 
das séries, você pode observar, com certo ajuste, que elas se 
aproximam de uma distribuição normal, ou seja, apresentam um 
gráfico semelhante conforme pode ser observado a seguir:
X=Me=Mo
f
x
Gráfico 4.4 – Curva de Gauss-Laplace 
Fonte: Adaptado de Silva (1997, p. 70).
probabilidade_e_estatistica_1582.indb 181 19/07/12 11:12
182
Universidade do Sul de Santa Catarina
Principais características da curvanormal
Dentre as principais, podemos citar algumas tais como:
a) a curva se caracteriza por ter a forma de um sino;
b) a curva tem 2 pontos de inflexão (lugar onde a curva se 
modifica);
c) a curva normal é simétrica com relação à média (é igual 
tanto à esquerda, quanto à direita da média);
d) a área limitada pela curva e pelo eixo das abscissas é 1 ou 
100% (sendo assim, por ser simétrica, tem 50% da área à 
esquerda e 50% da área à direita da média);
e) a curva é assintótica, isto é, se aproxima indefinidamente 
do eixo das abscissas sem tocá-lo;
f) a curva normal é unimodal, isto é, possui um só pico ou 
ponto de frequência máxima, ponto este onde coincidem 
a moda, a média e a mediana;
g) a função que define a curva é: 
A distribuição normal de probabilidade usa como base 
a curva normal.
Sabendo que a área abaixo do polígono (curva) representa 
proporcionalmente a frequência total da série, e com o uso da 
média e do desvio padrão tem-se condições de realizar estudo de 
concentração dos dados em torno da média.
Com relação à área abaixo da curva, analise o gráfico a seguir:
13,59%
34,13%
0,5 ou 50%
2,15%
X
Gráfico 4.5 – Distribuição normal, com percentuais em referência ao desvio padrão
Fonte: Adaptado de Triola (1999, p. 43).
probabilidade_e_estatistica_1582.indb 182 19/07/12 11:12
183
Probabilidade e Estatística
Unidade 4
Veja, a seguir, alguns exemplos para compreender como realizar 
os cálculos do desvio padrão.
Em um teste, a média dos escores de um grupo de pessoas foi de 
 = 80, e o desvio padrão foi de σ(x) = 3. Pode-se interpretar esses 
valores da seguinte forma:
Os valores da série estão concentrados em torno da média:
 � o intervalo ( − σ (x); + σ (x)) contém aproximadamente 
68,26% dos elementos da série, ou seja, o intervalo 
(77; 83) → (80 − 3 = 77 e 80 + 3 = 83);
 � o intervalo ( − 2 σ (x); + 2 σ (x)) contém 
aproximadamente 95,44% dos elementos da série, ou 
seja, o intervalo(74; 86) → (80 − 6 = 74 e 80 + 6 = 86);
 � o intervalo ( − 3 σ (x); + 3 σ (x)) contém 
aproximadamente 99,74% dos elementos da série, ou seja, 
o intervalo (71; 89) → (80 − 9 = 71 e 80 + 9 = 89).
Veja, no gráfico a seguir, a ilustração desse exemplo:
13,59%
34,13% 34,13%
13,59%
2,15% 2,15%
68,26%
95,44%
99,74%
71 74 77 =80 83 86 89
Gráfico 4.6 – Distribuição normal, com percentuais em referência ao desvio padrão
Fonte: Adaptado de Triola (1999, p. 43).
probabilidade_e_estatistica_1582.indb 183 19/07/12 11:12
184
Universidade do Sul de Santa Catarina
Como ler os gráficos? Aí vão algumas sugestões:
 
� O percentual de entregas com tempo entre 77 e 
83 minutos é de 68,26% (ou, ainda, a probabilidade de 
escolher uma entrega que tenha sido feita entre 77 e 
83 minutos é de 68,26%). 
� O percentual de entregas com tempo entre 74 e 
86 minutos é de 95,44% (ou ainda, a probabilidade de 
escolher uma entrega que tenha sido feita entre 74 e 86 
minutos é de 95,44%). 
� O percentual de entregas com tempo entre 71 e 
89 minutos é de 99,74% (ou ainda, a probabilidade de 
escolher uma entrega que tenha sido feita entre 71 e 89 
minutos é de 99,74%).
Como você pôde observar, os percentuais estão ligados à média 
e ao desvio padrão e, por sua vez, determinam os intervalos a 
serem estudados. Esses percentuais são obtidos calculando a área 
entre a curva e o eixo X, entre os extremos do intervalo que você 
está estudando. Exemplo: (77; 83).
Baseado nesse estudo é que você poderá calcular a probabilidade 
de algum evento que resulte em um intervalo. Veja como fazer 
esses cálculos no próximo tópico.
Descrição do método de cálculo
A probabilidade em uma distribuição contínua de probabilidade 
(probabilidade de ocorrência de um intervalo) é obtida calculando 
a área entre a curva e o eixo X, como você já viu em estudos 
anteriores. Essa área é calculada com o uso de uma ferramenta 
matemática chamada de integral definida da função, ou seja, 
dada a função a seguir, a área entre a curva e o eixo X, no 
intervalo (a; b), é calculada da seguinte forma:
probabilidade_e_estatistica_1582.indb 184 19/07/12 11:12
185
Probabilidade e Estatística
Unidade 4
 f
xa b
P(a<x<b)
Gráfico 4.7 – Distribuição normal, com intervalo definido
Fonte: Adaptado de Silva (1997, p. 71).
‑ A determinação desta área usando‑se o cálculo de integral é bastan‑
te complicada e não será usado em seu estudo. Para superar essa 
dificuldade, utiliza‑se outra distribuição, chamada de Distribui‑
ção Normal Padronizada (ou Reduzida). O artifício consiste em 
transformar a variável X, com média e desvio padrão σ, em 
uma variável Z , com média 0 e desvio padrão 1, para que você 
possa fazer utilização da tabela de Z (variável padronizada) com 
os valores das áreas já calculados.
Mas como podemos padronizar? 
Esta padronização é adotada para tornar o cálculo de probabilidade 
da ocorrência de intervalo mais fácil e mais simples. Qualquer 
distribuição X com as características citadas anteriormente pode ser 
transformada na distribuição normal padronizada (ou reduzida) Z, 
para que seja possível o cálculo de áreas.
A transformação da variável aleatória X na variável padronizada 
se dá mediante o uso da fórmula a seguir:
probabilidade_e_estatistica_1582.indb 185 19/07/12 11:12
186
Universidade do Sul de Santa Catarina
Cálculo da variável padronizada:
Em que:
X1 = valor da v.a. (limite do intervalo)
 = média
σ = desvio padrão
Acompanhe os exemplos a seguir para compreender como 
realizar o cálculo.
Exemplo 1: a área a ser calculada está no intervalo que vai da 
média até x1. Nesse caso, só é necessário o cálculo de um limite 
do intervalo.
 
xx1
P( <x<x ) 1
zz1
P(0<z<z )1
0
Gráfico 4.8 e 4.9 – Padronização de uma distribuição normal
Fonte: Adaptado de Silva (1997, p. 71).
Nesse caso, a probabilidade de ocorrer o intervalo da média ate o 
x1 é igual à probabilidade de ocorrer o intervalo de 
0 à z1 ⇒ P(  < x < x1) = P(0 < z < z1)
Exemplo 2: A área a ser calculada está no intervalo que vai de 
x1 até x2. Nesse caso, é necessário o cálculo de dois limites do 
intervalo (z1 e z2). 
probabilidade_e_estatistica_1582.indb 186 19/07/12 11:12
187
Probabilidade e Estatística
Unidade 4
Cálculo da variável padronizada:
 e
 
Onde:
X1 e X2 = valores da v.a. (limites do intervalo)
 = média
σ = desvio padrão
P(z <Z<z )1 2
x1 x2 x
z1 z2 z0
P(x1<x<x2)
Gráfico 4.10 e 4.11 – Padronização de uma distribuição normal
Fonte: Adaptado de Silva (1997, p.71).
Nesse caso, a probabilidade de ocorrer o intervalo entre x1 e x2 é 
igual à probabilidade de ocorrer o intervalo entre 
z1 e z2 ⇒ P(x1 < x < x2) = P(z1 < z < z2).
Até aqui, você conheceu como padronizar os valores da variável 
aleatória X. Agora, você irá aprender como usar a tabela de áreas 
da distribuição padronizada.
As áreas dadas na tabela são sempre de 0 a Z.
Com o valor de Z calculado, 
basta encontrar o valor na 
tabela (ver tabela no final 
desse livro didático).
probabilidade_e_estatistica_1582.indb 187 19/07/12 11:12
188
Universidade do Sul de Santa Catarina
Veja, a seguir, um gráfico com representação da área dada pela 
tabela.
0 z
Área
Gráfico 4.12 – Distribuição normal padronizada
Fonte: Triola (1999).
Observe que, conhecendo a área especificada na tabela, qualquer 
tipo de área poderá ser calculada usando a simetria da curva.
Observe os exemplos a seguir com atenção.
Exemplo 1: Em um levantamento executado por uma empresa de 
entregas, resultou que o tempo médio para a realização das entregas 
era de 21 minutos e o desvio padrão foi de 7 minutos. Ao escolher, 
ao acaso, uma das entregas realizadas, qual a probabilidade de o 
tempo para realizá-la estar entre 21 e 28 minutos? 
Calculando passo a passo
Passo 1: identificar todos os elementos que compõem o problema.
 � média: = 21;
 � desvio padrão: σ(x) = 7;
 � os limites do intervalo: como um dos limites é a própria 
média, você só terá que calcular um Z. O outro limite é 
28 ⇒ X = 28.
probabilidade_e_estatistica_1582.indb188 19/07/12 11:12
189
Probabilidade e Estatística
Unidade 4
Passo 2: calcular a variável padronizada Z.
 ⇒ Z = 1
Passo 3: identificar, no gráfico, qual é a área que você deve encontrar.
 
0 z=1
Área
µ=21 x=28
Área
Gráfico 4.13 e 4.14 – Padronização de uma distribuição normal 
Fonte: Elaboração do autor (2006).
Passo 4: procurar, na tabela, o Z = 1,00 e encontrar sua área 
correspondente.
 � Primeiro, você deve procurar o valor 1,0 na primeira 
coluna.
 � Depois, procurar, na primeira linha, o valor 0,00 (é como 
se separasse o número 1,00 em dois, uma parte seria 1,0 
e a outra seria o 0,00).
 � No cruzamento da coluna em que está o 0,00 e da linha 
em que está o 1,0, você encontrará um número (no caso é 
0,3413). 
 � Esse número é a área entre Z e 0.
Veja que a área está entre 
zero e 1.
probabilidade_e_estatistica_1582.indb 189 19/07/12 11:12
190
Universidade do Sul de Santa Catarina
Z 0,00 0,01 0,02
0,0 0,0000 0,0040 0,0080
0,l 0,0398 0,0438 0,0478
0,2 0,0793 0,0832 0,0871
0,3 0,1179 0,1217 0,1255
0,4 0,1554 0,1591 0,1628
0,5 0,1915 0,1950 0,1985
0,6 0,2257 0,2291 0,2324
0,7 0,2580 0,2611 0,2642
0,8 0,2881 0,2910 0,2939
0,9 0,3159 0,3186 0,3212
1,0 0,3413 0,3438 0,3461
1,1 0,3643 0,3665 0,3686
1,2 0,3849 0,3869 0,3888
1,3 0,4032 0,4049 0,4066
Passo 5: responder e interpretar.
P(21 < x < 28) = 0,3413 ou 34,13%
A probabilidade do tempo para realizar uma entrega estar entre 
21 e 28 minutos é de 34,13%.
Exemplo 2: Em média, a vida útil de um modelo de máquina de 
empacotar é de 24 anos, com um desvio padrão de 6 anos. Levando 
em consideração que a vida útil deste tipo de máquina se distribui 
normalmente, qual a probabilidade de uma máquina, adquirida 
recentemente pela empresa, durar entre 17,52 e 29,7 anos? 
probabilidade_e_estatistica_1582.indb 190 19/07/12 11:12
191
Probabilidade e Estatística
Unidade 4
Calculando passo a passo
Passo 1: identificar todos os elementos que compõem o problema.
 � A média: = 24;
 � desvio padrão: σ(x) = 6;
 � os limites do intervalo: como os limites são diferentes 
da média, você deve calcular Z para os dois valores 
(x1 = 17,52 e x2 = 29,7).
Passo 2: calcular as variáveis padronizadas Z1 e Z2.
Passo 3: identificar, no gráfico, qual é a área que você deseja 
encontrar.
0 z=0,95
µ=24 x1=29,7
Área
x2=17,52
Área
z=-1,08
Gráfico 4.15 e 4.16 – Padronização de uma distribuição normal
Fonte: Adaptado de Silva (1997, p.71).
Veja que a área está entre –1,08 e 0,95.
probabilidade_e_estatistica_1582.indb 191 19/07/12 11:12
192
Universidade do Sul de Santa Catarina
Não se preocupe com o sinal negativo de Z1. Esse 
sinal só serve para indicar que a área está à esquerda 
da média (zero), por isso, o negativo. Como a curva 
é simétrica, a área tanto à esquerda como à direita 
é calculada da mesma maneira, e o uso da tabela 
também é o mesmo.
Passo 4: procurar, na tabela, o Z1 = −1,08 e Z2 = 0,95 e encontrar suas 
áreas correspondentes.
Como usar a tabela?
É possível procurando o Z1. Veja de que forma:
 � primeiro, procurar o valor 1,0 na primeira coluna;
 � depois, procurar, na primeira linha, o valor 0,08 (é como 
se separasse o número 1,08 em dois: uma parte seria 1,0, 
e a outra seria o 0,08);
 � no cruzamento da coluna na qual está o 0,08 e da linha 
na qual está o 1,0, você encontrará um número (no caso é 
0,3599). Esse número é a área entre Z1 e 0.
Tabela 4.7 – Tabela de valores normais Z
Z 0,00 0,01 ... 0,07 0,08 
0,0 0,0000 0,0040 ... 0,0279 0,0319 
0,l 0,0398 0,0438 ... 0,0675 0,0714 
0,2 0,0793 0,0832 ... 0,10 64 0,1103 
... ... ... ... ... ... 
0,8 0,2881 0,2910 ... 0,3078 0,3106 
0,9 0,3159 0,3186 ... 0,3340 0,3365 
1,0 0,3413 0,3438 ... 0,3577 0,3599 
1,1 0,3643 0,3665 ... 0,3790 0,3810 
1,2 0,3849 0,3869 ... 0,3980 0,3997 
Procurar 1,0 
Procurar 0,08 
Cruzando a 
linha com a 
coluna. 
Cruzando a 
linha com a 
coluna. 
Fonte: Elaboração do autor (2006).
probabilidade_e_estatistica_1582.indb 192 19/07/12 11:12
193
Probabilidade e Estatística
Unidade 4
Agora, falta procurar o Z2. Como fazer:
 � primeiro, você deve procurar o valor 0,9 na primeira 
coluna;
 � depois, procurar, na primeira linha, o valor 0,05 (é como 
se separasse o número 0,95 em dois: uma parte seria 0,9, 
e a outra seria o 0,05);
 � no cruzamento da coluna na qual está o 0,05 e da linha 
na qual está o 0,9, você encontrará um número (no caso é 
0,3289). Esse número é a área entre Z2 e 0.
Tabela 4.8 – Tabela de valores normais Z
Z 0,00 ... 0,04 0,05
0,0 0,0000 ... 0,0160 0,0199
0,l 0,0398 ... 0,0557 0,0596
... ... ... ... ...
0,7 0,2580 ... 0,2704 0,2734
0,8 0,2881 ... 0,2995 0,3023
0,9 0,3159 ... 0,3264 0,3289
1,0 0,3413 ... 0,3508 0,3531
1,1 0,3643 ... 0,3729 0,3749
Fonte: Elaboração do autor (2006).
Passo 5: responder e interpretar.
Como você tem duas áreas, o próximo passo é somar, veja o 
gráfico a seguir:
Gráfico 4.17 – Soma das áreas determinadas pela padronização
Fonte: Elaboração do autor (2006).
probabilidade_e_estatistica_1582.indb 193 19/07/12 11:12
194
Universidade do Sul de Santa Catarina
P(17,52 < x < 29,7) = 0,3599 + 0,3289 = 0,6888 ou 68,88%.
A probabilidade de uma máquina, adquirida recentemente pela 
empresa, durar entre 17,52 e 29,7 anos é de 68,88%.
Exemplo 3: Em média, a vida útil de um modelo de máquina 
de empacotar é de 24 anos, com um desvio padrão de 6 anos. 
Levando em consideração que a vida útil deste tipo de máquina 
se distribui normalmente, qual a probabilidade de uma máquina, 
adquirida recentemente pela empresa, durar mais que 29,7 anos?
Calculando passo a passo, temos
Passo 1: identificar todos os elementos que compõem o problema.
 � a média: = 24;
 � o desvio padrão: σ(x) = 6;
 � os limites do intervalo: o intervalo é limitado abaixo por 
x = 29,7 e não tem limite acima. Você deve calcular Z 
somente para esse valor de x.
Passo 2: calcular a variável padronizada Z.
probabilidade_e_estatistica_1582.indb 194 19/07/12 11:12
195
Probabilidade e Estatística
Unidade 4
Passo 3: identificar, no gráfico, qual é a área que você deseja 
encontrar.
z=0,95
µ=24 x1=29,7
Área
0
Área
Gráfico 4.18 e 4.19 – Padronização de uma distribuição normal
Fonte: Elaboração do autor (2006).
Veja que a área está de 0,95 para cima.
Passo 4: Procurar, na tabela, o Z = 0,95 e encontrar sua área 
correspondente.
Como usar a tabela?
 � Primeiro, você deve procurar o valor 0,9 na primeira 
coluna;
 � depois, procurar, na primeira linha, o valor 0,05 (é como 
se separasse o número 0,95 em dois, uma parte seria 0,9 e 
a outra seria o 0,05);
 � no cruzamento da coluna na qual está o 0,05 e da linha 
na qual está o 0,9, você encontrará um número (no caso é 
0,3289). Esse número é a área entre Z2 e 0.
probabilidade_e_estatistica_1582.indb 195 19/07/12 11:12
196
Universidade do Sul de Santa Catarina
Z 0,00 ... 0,04 0,05 
0,0 0,0000 ... 0,0160 0,0199 
0,l 0,0398 ... 0,0557 0 ,0596 
... ... ... ... ... 
0,7 0,2580 ... 0,2704 0,2734 
0,8 0,2881 ... 0,2995 0,3023 
0,9 0,3159 ... 0,3264 0,3289 
1,0 0,3413 ... 0,3508 0,3531 
1,1 0,3643 ... 0,3729 0,3749 
Procurar 0,9 
Procurar 0,05 
Cruzando a 
linha com a 
coluna. 
Cruzando a 
linha com a 
coluna. 
Passo 5: interpretar e responder.
Como a área dada pela tabela é sempre entre zero e Z, 
como calcular a área de Z para cima?
Você lembra que a curva normal é simétrica e que, de cada lado, 
tem 50% da área total? Pois é! Se a metade tem 50% ou 0,5 e 
você diminuir dessa área a área encontrada, restará a que você 
quer encontrar. Veja o gráfico a seguir: 
 
z=0,950
0,3289
0,5-0,3289
Gráfico 4.20 – Determinar a área limitada abaixo pelo valor padronizado e sem limite acima
Fonte: Elaboração do autor (2006).
A área cinza escuro é calculada diminuindo 0,3289 (área entre 
zero e Z – encontrada na tabela) de 0,5.
P(x > 29,7) = 0,5 – 0,3289 = 0,1711 ou 17,11%
probabilidade_e_estatistica_1582.indb196 19/07/12 11:12
197
Probabilidade e Estatística
Unidade 4
Então, a probabilidade de uma máquina, adquirida recentemente 
pela empresa, durar mais que 29,7 anos é de 17,11%.
Além dos casos que você estudou nos exemplos, ainda há outros. 
Um deles pode ser ilustrado a seguir:
0,3413
ou
34,13%
0,5
X
50%
ou
Gráfico 4.21 – Determinar a área limitada abaixo pelo valor padronizado e sem limite acima
Fonte: Elaboração do autor (2006).
Caso o limite inferior do intervalo esteja à esquerda da média, 
o processo é o mesmo, calcular o Z, encontrar a área na tabela 
e, no final, calcular a área final. No caso anterior, note que você 
terá que juntar as duas áreas, a cinza claro com a cinza escuro. 
Lembre-se de que a área, na metade da curva, é de 0,5 ou 50%. 
Somando as duas: 0,5 + 0,3413 = 0,8413 ou 84,13%.
probabilidade_e_estatistica_1582.indb 197 19/07/12 11:12
198
Universidade do Sul de Santa Catarina
Síntese
Nessa unidade, você começou a conhecer a maneira como 
lidar com o acaso. O cálculo de probabilidade nada mais é que 
uma tentativa de entender e organizar o acaso. Você aprendeu 
como calcular a probabilidade de um evento e, além disso, 
compreendeu como calcular a frequência relativa. 
Teve uma noção sobre o que é uma variável aleatória e sua 
distribuição de probabilidades. Essas são ferramentas muito 
importantes dentro das análises estatísticas que você terá que 
fazer ao longo de seu curso e de sua profissão. 
Você estudou, também nesta unidade, dois tipos de distribuições 
de probabilidade. Conheceu as diferenças entre variável aleatória 
discreta e contínua, bem como entre suas distribuições de 
probabilidade. Aprendeu, também, a calcular probabilidade com 
essas distribuições. Não foi tão difícil, não é?
Os conteúdos estudados nessa unidade, além de serem utilizados 
em situações práticas dentro de seu curso, bem como no 
desenvolvimento de sua vida profissional, são, também, base para 
o estudo de amostragem, um assunto importante quando se trata 
de probabilidade. 
probabilidade_e_estatistica_1582.indb 198 19/07/12 11:12
199
Probabilidade e Estatística
Unidade 4
Atividades de autoavaliação
Ao final de cada unidade, você realizará atividades de autoavaliação. O 
gabarito está disponível no final do livro didático, mas se esforce para 
resolver as atividades sem a ajuda do gabarito, pois, assim, você estará 
promovendo (e estimulando) a sua aprendizagem.
1) Em estudo realizado sobre os padrões de indecisão, depressão e 
ansiedade em adolescentes, revelou-se que a relação com os pais era 
fator influenciador dessas reações. Nessa pesquisa, foi pesquisado um 
total de 1500 adolescentes, e em 675 casos, os jovens sofriam com o 
autoritarismo dos pais. Qual a probabilidade de ser escolhido ao acaso, 
um jovem que sofra com o autoritarismo dos pais?
probabilidade_e_estatistica_1582.indb 199 19/07/12 11:12
200
Universidade do Sul de Santa Catarina
2) Segundo o IBGE, na Grande Florianópolis, as pessoas de dez anos ou 
mais de idade, por estado civil foram agrupados na tabela abaixo:
Casado(a)
Desquitado(a) 
ou separado(a) 
judicialmente
Divorciado(a) Viúvo(a) Solteiro(a) Total
267.867 18.697 16.779 28.224 333.974 665.541
Se uma pessoa da Grande Florianópolis for escolhida ao acaso, qual é a 
probabilidade de ela ser:
a) casada?
b) solteira?
c) divorciada?
probabilidade_e_estatistica_1582.indb 200 19/07/12 11:12
201
Probabilidade e Estatística
Unidade 4
3) Em testes feitos em laboratório com cobaias, foram analisadas duas 
delas e, após inúmeras tentativas, a cobaia 1 sofria estímulos com 
reação a dor enquanto a cobaia 2 sofria estímulos com alimentação. A 
pesquisa visava à execução de uma tarefa que era a de empurrar uma 
pequena alavanca, considerada uma reação positiva. Os resultados 
foram apresentados na seguinte tabela:
Cobaia Estímulo Número total de tentativas
Número de reações 
positivas
Cobaia 1 Efeitos de dor 4500 1215
Cobaia 2 Alimentação 3500 1050
a) Qual a frequência relativa (ou probabilidade estimada) para o número 
de reações positivas para cada cobaia?
b) Desafio: qual dos dois estímulos você considera mais eficaz? Por quê?
probabilidade_e_estatistica_1582.indb 201 19/07/12 11:12
202
Universidade do Sul de Santa Catarina
4) O teste chamado Tarefa de Memória Seletiva (TMS) testa alguns 
aspectos da memória verbal. Baseia-se em ouvir, lembrar e aprender 
doze palavras apresentadas à pessoa que está sendo testada. 
Diversos aspectos da memória verbal, tais como lembrança total, 
armazenamento na memória de longa duração etc., são combinados 
para produzir um escore global. Sabendo que, para um grupo 
determinado de pessoas, a média dos escores foi de 126 pontos e que o 
desvio padrão foi de 10 pontos, determine o que é pedido a seguir. 
a) Calcule Z (variável padronizada) para x = 116, para x = 136, para x = 131 
e para x = 141 pontos.
b) Qual a probabilidade de escolher uma pessoa com escore maior que 
136 pontos?
c) Qual a probabilidade de escolher uma pessoa com escore entre 126 e 
131 pontos?
d) Qual a probabilidade de escolher uma pessoa com escore entre 116 e 
141 pontos?
probabilidade_e_estatistica_1582.indb 202 19/07/12 11:12
203
Probabilidade e Estatística
Unidade 4
Saiba mais
Se você desejar, aprofunde os conteúdos estudados nesta unidade 
ao consultar as seguintes referências:
BARBETTA, Pedro Alberto. Estatística aplicada às ciências 
sociais. 5. ed. rev. Florianópolis: Ed. UFSC, 2002. 
MORETTIN, Luiz Gonzaga. Estatística básica. São Paulo: 
Makron Books, 1999.
SILVA, Ermes Medeiros da. et al. Estatística para os cursos de 
Economia, Administração e Ciências Contábeis. São Paulo: 
Ed. Atlas, 1997. v. 1.
TRIOLA, Mario F. Introdução à Estatística. Rio de Janeiro: 
LTC, 1999.
WILD, Christopher J. Encontros com o acaso. Rio de Janeiro: 
LTC, 2004.
probabilidade_e_estatistica_1582.indb 203 19/07/12 11:12
probabilidade_e_estatistica_1582.indb 204 19/07/12 11:12
5UNIDADE 5Amostragem e cálculo de estimativa
Objetivos de aprendizagem
 � Conhecer as vantagens e a importância da 
amostragem.
 � Calcular tamanho de amostra.
 � Conhecer as informações que a amostragem propicia.
 � Aplicar as técnicas de amostragem para a proporção e 
para a média.
 � Calcular as estimativas populacionais para a proporção 
e para a média.
 � Compreender e calcular a análise de variância.
Seções de estudo
Seção 1 Introdução
Seção 2 Conceitos importantes
Seção 3 Estimativas para a proporção populacional
Seção 4 Estimativas para média populacional
Seção 5 Análise de variância – ANOVA
probabilidade_e_estatistica_1582.indb 205 19/07/12 11:12
206
Universidade do Sul de Santa Catarina
Para início de estudo
Nesta unidade, você conhecerá com mais detalhes o que é 
amostra e poderá aumentar seus conhecimentos sobre como 
escolher, calcular e para que usar amostras em pesquisas e 
levantamentos de dados. Você terá a oportunidade de verificar 
como é importante o estudo da amostragem, uma vez que é uma 
das ferramentas essenciais que pode apoiar suas decisões. 
Nesta unidade, você também conhecerá como proceder para 
calcular o erro padrão de uma estimativa.
Você já deve ter visto, nos jornais ou na televisão, quando 
anunciam resultados de uma pesquisa eleitoral, informarem que 
os resultados têm uma margem de erro. Isto ocorre devido ao fato 
do uso da amostragem, ou seja, quando uma pesquisa se baseia 
apenas em uma parcela da população.
Como não é possível executar a pesquisa com a totalidade dessa 
população, os resultados não são exatos, necessitando, assim, do 
cálculo da margem de erro. Nesta unidade, você vai entender 
como se procede para encontrar esse erro. 
Nesta unidade, serão usados alguns termos que são fundamentais 
no entendimento dos cálculos e da interpretação. Sendo assim, 
antes de saber como se calcula o erro de uma estimativa, é muito 
importante que você aprenda alguns conceitos importantes. 
Por isso, como forma a facilitar a compreensãodesta unidade, 
as primeiras seções tratam de conceitos introdutórios e básicos. 
Começaremos por eles, lembrando que são fundamentais para a 
compreensão dos demais assuntos.
Finalmente, enfrentaremos outro desafio: definir se as médias de 
várias populações são mesmo semelhantes ou se existem diferenças 
que superam os próprios problemas do processo de amostragem, 
analisando, para isso, as variâncias obtidas nos processos.
Vamos começar então? Bons estudos! 
probabilidade_e_estatistica_1582.indb 206 19/07/12 11:12
207
Probabilidade e Estatística
Unidade 5
Seção 1 – Introdução
A amostragem está intimamente ligada aos estudos de Estatística 
descritiva e probabilidades. Além de estarem ligados, são 
dependentes uns dos outros. Veja a figura a seguir:
Amostragem
Estatística descritiva Probabilidade
Figura 5.1 – Relações dos estudos estatísticos
Fonte: Elaboração do autor (2006).
Como é feita essa relação entre os três? Com o estudo desta 
unidade, você vai poder compreender melhor. Conheça, a seguir, 
alguns conceitos importantes para o estudo da amostragem. 
População
População é o conjunto total de elementos com, pelo menos, uma 
característica em comum, cujo comportamento interessa estudar.
Notação:
N = número de elementos da população (tamanho da população)
 � Censo: é uma coleção de dados relativos a todos os 
elementos de uma população.
 � Parâmetro: é utilizado para designar alguma 
característica descritiva dos elementos da população 
(percentagem, média etc.).
probabilidade_e_estatistica_1582.indb 207 19/07/12 11:12
208
Universidade do Sul de Santa Catarina
Amostra
Amostra é o conjunto de elementos ou observações, recolhidos 
a partir de um subconjunto da população, que se estuda com o 
objetivo de tirar conclusões para a população de onde foi recolhida.
Notação:
n = número de elementos da amostra (tamanho da amostra)
Mas qual tamanho de amostra usar?
Essa sempre é a dúvida de muitos pesquisadores. O tamanho da 
amostra muitas vezes depende da experiência e do conhecimento 
do pesquisador. Experiência em saber qual o tamanho que 
realmente representará, com fidelidade, a população e o 
conhecimento do pesquisador sobre o tema e sobre a população 
alvo do estudo. Dessa forma, você verá duas formas de calcular o 
tamanho da amostra, que são as seguintes:
 � quando não se têm informações sobre a população: se 
o pesquisador não tem acesso às medidas, como desvio 
padrão, percentuais etc.
 � quando têm informações sobre a população: se o 
pesquisador tem acesso às medidas, como desvio padrão, 
percentuais etc.
Quando não se têm informações sobre a população
Nesse caso, é necessária a especificação do erro amostral 
pretendido pelo pesquisador. Sugeridas por Barbetta (2002), as 
formas de cálculo do tamanho da amostra, quando você não tem 
acesso a informações da população, são as que seguem:
probabilidade_e_estatistica_1582.indb 208 19/07/12 11:12
209
Probabilidade e Estatística
Unidade 5
a) Quando não se conhece o tamanho da população
Tamanho da amostra: 
Em que:
n0 = primeira aproximação para o tamanho da amostra;
E = erro amostral tolerável.
(usar o erro na forma unitária, ex.: 2%, usar 0,02)
b) Quando se conhece o tamanho da população
Tamanho da amostra: 
Em que:
n0 = primeira aproximação para o tamanho da amostra;
N = tamanho da população;
n = tamanho da amostra.
Veja, a seguir, um exemplo de como realizar os cálculos.
Um pesquisador deseja realizar estudo para com estudantes do 
Ensino Fundamental da rede municipal de escolas da cidade de 
Florianópolis. Nessa pesquisa, ele irá tolerar um erro amostral 
de 4% e gostaria de saber qual seria o tamanho da amostra 
necessária para realizar sua pesquisa, nos seguintes casos:
a) O pesquisador não conhece o número total de estudantes do 
Ensino Fundamental da cidade
Calculando passo a passo
Passo 1: identificar os elementos da fórmula.
n0 = tamanho aproximado da amostra;
E = erro amostral tolerável = 4% ou 0,04 (é só dividir por 100).
probabilidade_e_estatistica_1582.indb 209 19/07/12 11:12
210
Universidade do Sul de Santa Catarina
Passo 2: usar a fórmula.
 → n0 = 625 estudantes.
Um tamanho aproximado para a amostra seria de 625 estudantes 
do Ensino Fundamental.
b) O número total de estudantes do Ensino Fundamental da 
cidade é de 27.000 alunos.
Calculando passo a passo
Passo 1: identificar os elementos da fórmula.
n0 = tamanho aproximado da amostra;
E = erro amostral tolerável = 4% ou 0,04 (é só dividir por 100);
N = tamanho da população = 27000.
Passo 2: usar a fórmula.
 → n0 = 625 estudantes.
Um tamanho aproximado para a amostra seria de 625 estudantes 
do Ensino Fundamental. Observe que o pesquisador teve acesso 
à informação de que a população seria de 27.000 estudantes, 
então você deve passar para o passo seguinte:
Passo 3: calcular o tamanho da amostra usando a população com a 
seguinte fórmula. 
Arredondando, seriam 611 estudantes.
probabilidade_e_estatistica_1582.indb 210 19/07/12 11:12
211
Probabilidade e Estatística
Unidade 5
Quando se têm informações sobre a população
Nesse caso, além da margem de erro tolerável, seriam necessárias 
informações como desvio padrão, percentual dos indivíduos que 
apresentam as características estudadas etc. Essas informações 
poderiam ser obtidas de pesquisas anteriores ou, até mesmo, de 
uma pré-pesquisa. Nesse último, seria preciso uma amostragem 
prévia para realizar os levantamentos necessários. Embora não 
seja de nosso interesse aprofundar o estudo sobre este assunto, a 
seguir estão as fórmulas para calcular o tamanho da amostra para 
os dois casos existentes, para estimar a proporção (percentual) e a 
média populacional.
Para a estimativa da média 
populacional
Para a estimativa da proporção 
populacional (percentual)
Para amostragem com reposição 
(população infinita)
Para amostragem sem reposição 
(população finita)
Onde:
n = tamanho da amostra;
N = tamanho da população;
e = erro amostral;
σ = desvio padrão;
Z = limite do intervalo (dist. Normal).
Para amostragem com reposição 
(população infinita)
Para amostragem sem reposição 
(população finita)
Onde:
n = tamanho da amostra;
N = tamanho da população;
e = erro amostral;
p = percentual de elementos 
com a característica estudada;
q = percentual de elementos 
sem a característica estudada;
Z = limite do intervalo (dist. Normal).
Quadro 5.1 – Tamanho da amostra, proporção (percentual) e média populacional 
Fonte: Elaboração do autor (2006).
Embora não seja a intenção de aprofundar esse tipo de cálculo, 
faça a atividade de autoavaliação referente ao assunto e constate 
se compreendeu a maneira de realizar os cálculos.
probabilidade_e_estatistica_1582.indb 211 19/07/12 11:12
212
Universidade do Sul de Santa Catarina
Representatividade da amostra na população
Quando você está cozinhando, após temperar a comida, costuma 
mexer com uma colher, não é? Por que você mexe? Para que o 
tempero fique bem misturado com a comida. Correto? Qual é o 
passo seguinte? Provar! Claro, você pega apenas uma pitada da 
comida para saber como está o gosto. Para tanto, não é necessário 
comer tudo!
Em resumo, o processo de amostragem é bem semelhante. Para 
que a prova de comida seja representativa, você teve, antes, que 
mexer bem, tornando, assim, uma mistura homogênea. Se for bem 
misturada, qualquer amostra que você colha, em qualquer lugar da 
panela, dará uma boa noção de como o todo (a comida) está.
Em pesquisas, o processo é bem semelhante!
Você lembra da pesquisa de intenções de voto? Em época de 
campanha eleitoral, quando um instituto de pesquisa faz uma 
pesquisa, ele tem que selecionar eleitores que representem as mais 
diversas camadas sociais, regiões, raças etc., tornando, assim, a 
amostra representativa da população. 
Seção 2 – Conceitos importantes
Você saberia dizer se os dados levantados com base em alguns 
poucos elementos podem trazer informações precisas acerca de 
uma população inteira?
De certa forma,sim! Você não terá informações exatas da 
população usando uma amostra, mas sim uma aproximação 
bastante precisa. É importante salientar que, por não haver 
pesquisado a totalidade dos elementos, você é levado a concluir 
que os dados nunca representarão um reflexo exato da população.
probabilidade_e_estatistica_1582.indb 212 19/07/12 11:12
213
Probabilidade e Estatística
Unidade 5
Exemplos bem conhecidos são as pesquisas eleitorais divulgadas 
pelos meios de comunicação. Veja: 
Gráfico 5.1 – Exemplo dos dados de uma pesquisa eleitoral
Fonte: Elaboração do autor (2006). 
Como era a notícia que deu origem a esta tabela? 
“A pesquisa de outubro apresentou os seguintes resultados: o 
candidato A tem 39% das intenções de voto, o candidato B tem 26% 
das intenções de voto, o candidato C tem 9% das intenções de votos 
e o candidato D tem 7% das intenções de votos. O erro é de 2%.”
De fato, existe uma margem de erro. Esse erro, relatado na 
notícia, gera um intervalo, ou seja, as intenções de votos para 
o candidato A podem variar de 37% a 41%. Por se tratar de 
uma pesquisa feita por amostragem, você não pode dizer que o 
candidato terá realmente 39% das intenções de votos.
Quais são as informações que a amostragem pode 
fornecer?
probabilidade_e_estatistica_1582.indb 213 19/07/12 11:12
214
Universidade do Sul de Santa Catarina
Como você já viu em estatísticas, esses intervalos são divididos 
em dois tipos, de acordo da variável estudada. Vale relembrar:
Figura 5.2 – Variável aleatória discreta e intervalo de produção; variável aleatória continua e 
intervalo da média 
Fonte: Elaboração do autor (2006). 
 � Intervalos de proporção: como visto no exemplo 
anterior, correspondem aos percentuais das intenções de 
votos. Exemplos: proporção de famílias, percentual de 
pacientes, proporção de cobaias etc.;
 � Intervalos da média: são intervalos baseados em 
medidas. São sempre calculados pela média dessas 
medidas. Exemplo: escore médio, peso médio, altura 
média etc.
Outra informação importante para a definição do erro é o 
conhecimento do que, em Estatística, é chamado de nível de 
confiança.
Nível de confiança
O nível de confiança é a probabilidade de o intervalo conter o 
parâmetro estimado, ou seja, pode-se entender que o valor ou 
percentual da população que você está tentando estimar tem 
a probabilidade de estar em um intervalo que seria o definido 
pelo erro.
probabilidade_e_estatistica_1582.indb 214 19/07/12 11:12
215
Probabilidade e Estatística
Unidade 5
Intervalo de confiança 
Intervalo de confiança é aquele que contém o parâmetro estudado 
com determinada probabilidade (nível de confiança), ou seja, 
citando o exemplo da pesquisa eleitoral, é o intervalo calculado 
com o erro. Veja os valores no exemplo citado nesta seção: “... as 
intenções de votos para o candidato A podem variar de 37% a 
41%”. Esse é o intervalo de confiança.
Curva normal 
Você poderia se perguntar, a partir do que foi apresentado, qual 
relação se pode estabelecer entre o nível de confiança e intervalo 
de confiança. Como o nível de confiança é a probabilidade de 
a estimativa estar correta e essa probabilidade determina um 
intervalo (o intervalo de confiança), é possível usar a curva 
normal para identificar a ambos. Veja a figura a seguir:
 
Figura 5.3 – Curva normal
Fonte: Elaborado pelo autor (2006).
Note que o nível de confiança é um percentual definido pelo 
intervalo de –z a z. Como a curva é simétrica, metade da área vai 
de –z a zero, e a outra metade vai de zero a z, ou seja, ambas são 
iguais. Isso é muito importante na definição do valor de z. Para 
descobri-lo, você deve calcular a metade do nível de confiança e 
usar a tabela da distribuição normal padronizada.
probabilidade_e_estatistica_1582.indb 215 19/07/12 11:12
216
Universidade do Sul de Santa Catarina
Exemplo 1: Nível de confiança: NC = 95%. Encontrar o valor de 
z na tabela.
Calculando passo a passo
Passo 1: dividir o NC por dois. Antes disso, não se esqueça de usar o 
valor do nível de confiança na forma decimal, ou seja, dividido por 100.
Passo 2: procurar esse valor na tabela e encontrar o z 
correspondente. O valor é referente à área entre zero e z, localizado 
na região central da tabela. Veja a seguir:
Tabela 5.1 – Tabela de valores normais
Fonte: Elaboração do autor (2006).
probabilidade_e_estatistica_1582.indb 216 19/07/12 11:12
217
Probabilidade e Estatística
Unidade 5
Localizada a área, é só seguir a coluna onde está o valor até a 
primeira linha, encontrando o número 0,06. Na horizontal, 
basta traçar a linha até a primeira coluna, encontrando o valor 
correspondente a 1,9. Juntando, ou somando os dois valores, você 
encontra o valor 1,96 para z, ou seja, z = 1,96.
Exemplo 2: Nível de Confiança: NC = 90%. Encontrar o valor 
de z na tabela.
Calculando passo a passo
Passo 1: dividir o NC por dois. Para tanto, sempre usar o valor do 
nível de confiança na forma decimal, ou seja, dividido por 100.
Passo 2: procurar esse valor na tabela e encontrar o z 
correspondente. O valor é referente à área entre zero e z, localizado 
na região central da tabela. Veja a seguir:
Tabela 5.2 – Tabela de valores normais
Fonte: Elaboração do autor (2006).
probabilidade_e_estatistica_1582.indb 217 19/07/12 11:12
218
Universidade do Sul de Santa Catarina
Encontrando a área, é só seguir a coluna na qual está o valor até 
a primeira linha. Note que o valor se situa entre 0,4495 e 0,4505 
e, sendo assim, você deve usar o valor compreendido entre 0,04 e 
0,05 como se fosse um ponto médio, ou seja, 0,045. Seguindo a 
linha até a primeira coluna, você encontra o valor 1,6. Efetuando-
se a soma, chega-se ao valor 1,645 para z, ou seja, z = 1,645.
O nível de confiança é muito importante!
Para calcular o erro, é necessário conhecer ou estabelecer 
previamente o nível de confiança. Não existe uma regra específica 
para a determinação do nível de confiança. Ele é determinado 
pelo pesquisador com base em sua experiência e, em geral, os 
mais usados são 90% e 95%.
Na seção seguinte, você aprenderá a usar o nível de confiança 
e saber como se calcula o erro da estimativa e o intervalo 
correspondente.
Seção 3 – Estimativas para a proporção populacional 
Antes de começar a calcular o erro da estimativa, conheça 
algumas notações:
 � = proporção da mostra (percentual) – probabilidade de 
sucesso;
 � p = proporção da população – probabilidade de sucesso;
 � = proporção da mostra (percentual) – probabilidade de 
fracasso;
 � q = proporção da população – probabilidade de fracasso.
Para diferenciar um percentual da amostra do percentual da 
população, tanto de sucesso quanto de fracasso, deve usar o 
acento circunflexo (“chapéu”) para a amostra.
probabilidade_e_estatistica_1582.indb 218 19/07/12 11:12
219
Probabilidade e Estatística
Unidade 5
Veja os exemplos a seguir.
Exemplo 1: Em uma determinada população, foi retirada uma 
amostra antes da eleição e verificou-se que 30% dos eleitores 
votariam no candidato Théo. Após a realização da eleição, 
verificou-se que o total de votantes (da população) para esse 
candidato foi de 33%. Indicar os percentuais de sucesso e fracasso 
tanto para a população quanto para a amostra de votantes e não 
votantes em relação ao candidato em questão.
População Amostra
Percentual de votantes em Théo = 33%; 
p = 33% (percentual de sucesso da população);
Percentual de votantes em Théo = 30%; 
 = 30% (percentual de sucesso da amostra);
Percentual de eleitores que não votam em 
Théo: calcule o percentual de fracasso sempre 
na forma decimal, ou seja, dividindo o 
percentual por 100.
q = 1 – p = 1 – 0,33 = 0,67
No final, multiplique por 100 para encontrar 
novamente o percentual: 
q = 0,67. 100 = 67% (percentual de 
fracasso da população).
Percentual de eleitores que não votam em 
Théo: calcule o percentual de fracasso sempre 
na forma decimal, ou seja, dividindo o 
percentual por 100.
No final, multiplique por 100 para 
encontrarnovamente o percentual: 
 (percentual de fracasso 
da amostra).
Quadro 5.2 – População e amostra 
Fonte: Elaboração do autor (2006).
Observação: note que a diferença, além dos valores, está em 
identificar o percentual da amostra com o acento circunflexo 
(“chapéu”).
A seguir, veja um exemplo mais elaborado.
Exemplo 2: Em uma determinada população, foi retirada uma 
amostra de 200 votantes antes da eleição e verificou-se que 60 
eleitores votariam no candidato Théo. Após a realização da 
eleição, verificou-se que o total de votantes (da população) era de 
3000 eleitores e que 990 votaram no referido candidato. Indicar 
os percentuais de sucesso e fracasso tanto para a população 
quanto para a amostra de votantes e não votantes em relação ao 
candidato mencionado.
probabilidade_e_estatistica_1582.indb 219 19/07/12 11:12
220
Universidade do Sul de Santa Catarina
População Amostra
Passo 1: identificar os valores.
N = 3000 (tamanho da população);
X = 990 (número de votantes no 
candidato).
Passo 2: cálculo do percentual de votantes 
no candidato.
Percentual de votantes em Théo = 33%; 
p = 33%
 (percentual de sucesso da população).
Passo 1: identificar os valores.
N = 200 (tamanho da população);
X = 60 (número de votantes no candidato).
Passo 2: cálculo do percentual de votantes 
no candidato.
Percentual de votantes em Théo = 30%
 (percentual de Sucesso da 
amostra)
Percentual de eleitores que não votam 
em Théo: calcule o percentual de fracasso 
sempre na forma decimal, ou seja, 
dividindo o percentual por 100.
p = 0,33
q = 1 – p = 1 – 0,33 = 0,67
No final, multiplique por 100 para 
encontrar novamente o percentual: 
q = 0,67. 100 = 67%
(percentual de fracasso da população).
Percentual de eleitores que não votam 
em Théo: calcule o percentual de fracasso 
sempre na forma decimal, ou seja, 
dividindo o percentual por 100.
No final, multiplique por 100 para 
encontrar novamente o percentual: 
 
(percentual de fracasso da amostra).
Quadro 5.3 – População e amostra 
Fonte: Elaboração do autor (2006).
E para calcular o erro e o intervalo de uma estimativa?
Para fazer uma estimativa, após ter os resultados e calculados 
os percentuais, você deve calcular o erro da estimativa e o seu 
intervalo (intervalo de confiança). Veja a seguir a fórmula para o 
cálculo do erro:
probabilidade_e_estatistica_1582.indb 220 19/07/12 11:12
221
Probabilidade e Estatística
Unidade 5
Em que:
e = erro da estimativa;
z = limite do intervalo definido pelo nível de confiança;
 = proporção da mostra (percentual) – probabilidade de sucesso 
(ex.: percentual de votantes em relação a um determinado 
candidato);
 = proporção da mostra (percentual) – probabilidade de fracasso (ex.: 
percentual dos eleitores que não votam em determinado candidato);
n = tamanho da amostra.
O intervalo é calculado subtraindo-se o erro do percentual e, 
em seguida, somando-se o erro a esse percentual. Veja abaixo a 
notação usada:
Em que:
P = probabilidade de o valor estimado estar no intervalo 
calculado;
 = proporção da mostra (percentual) – probabilidade de 
sucesso (ex.: percentual da amostra de votantes em relação a um 
determinado candidato);
p = proporção da população (percentual) que se quer estimar 
– probabilidade de sucesso (ex.: percentual da população de 
votantes em relação a um determinado candidato);
NC = nível de confiança.
probabilidade_e_estatistica_1582.indb 221 19/07/12 11:12
222
Universidade do Sul de Santa Catarina
Veja os exemplos a seguir.
Exemplo 1: Uma pesquisa recente, efetuada com uma amostra 
de 300 eleitores de uma pequena cidade, indicou que 35% deles 
votariam no candidato Arthur. Faça uma estimativa para a 
totalidade dos eleitores (população) dessa cidade que votarão no 
referido candidato. Use um nível de confiança de 95%.
Calculando passo a passo
Passo 1: calcular e procurar o z na tabela (ver exemplo 1, ao final da 
seção 1). Dividir o NC por dois. Para tanto, não se esqueça de usar o 
valor do nível de confiança na forma decimal, ou seja, dividido por 100.
Passo 2: procurar na tabela esse valor e encontrar o z 
correspondente. O valor é referente à área entre zero e z, localizado 
na região central da tabela. Veja a seguir:
Tabela 5.3 – Tabela de valores normais
Fonte: Elaboração do autor (2006).
probabilidade_e_estatistica_1582.indb 222 19/07/12 11:12
223
Probabilidade e Estatística
Unidade 5
Localizada a área, é só seguir a coluna na qual está o valor até a 
primeira linha, chegando-se ao número 0,06 e, na horizontal, seguir 
a linha até a primeira coluna, encontrando o valor 1,9. Efetuada a 
soma, você encontra o valor 1,96 para z, ou seja, z = 1,96.
Passo 3: discriminar cada elemento da fórmula de cálculo do erro e 
aplicá-la ao caso em análise.
Em que:
e = erro da estimativa;
z = 1,96 (calculado e encontrado no passo 2); 
 = 35% ou (percentual da amostra de eleitores que 
votam no candidato);
 (percentual da amostra dos eleitores que não 
votam no candidato);
n = 300 (tamanho da amostra).
Cálculo do erro
 = 1,96. 
Ao final de seu cálculo, deve-se multiplicar o resultado por 100, 
para que ele fique em porcentagem. Esse é um erro comum dos 
meios de comunicação (TV, rádio, jornais, etc.), ao informarem 
os resultados de uma pesquisa citam “... com um erro de 5,4% a 
mais ou a menos.”
probabilidade_e_estatistica_1582.indb 223 19/07/12 11:12
224
Universidade do Sul de Santa Catarina
Passo 4: calcular o intervalo da estimativa. Neste passo, o cálculo 
pode ser efetuado na forma percentual ou decimal. Interpretando 
os resultados obtidos, tem-se que as intenções de votos para o 
candidato referido devem ficar entre 29,603% e 40,397%. Segundo as 
notações da Estatística, esse intervalo se escreve da seguinte forma: 
 ou 29,603%
 ou 40,397%
Interpretando os resultados obtidos, tem-se que as intenções de votos 
para o candidato referido devem ficar entre 29,603% e 40,397%.
Segundo as notações da Estatística, esse intervalo se escreve da 
seguinte forma:
P(0,29603 < p < 0,40397) = 0,95 ou
P(29,603% < p < 40,397%) = 95%
Que leitura você pode fazer? O intervalo da 
estimativa para a totalidade dos eleitores que votariam 
no candidato mencionado está compreendido 
entre 29,603% e 40,397%, com base em um nível de 
confiança de 95%.
Veja os exemplos a seguir.
Exemplo 2: Um levantamento de alunos aprovados e reprovados 
feito com base no sistema municipal de educação de um município, 
referente ao Ensino Fundamental, usando uma amostra de 
2500 alunos, indicou que 1500 alunos dentre eles haviam sido 
reprovados. Com um nível de confiança de 90%, faça uma 
estimativa para a população de alunos que foram reprovados no 
Ensino Fundamental do sistema municipal de educação.
probabilidade_e_estatistica_1582.indb 224 19/07/12 11:12
225
Probabilidade e Estatística
Unidade 5
Calculando passo a passo
Passo 1: como não foi indicado o percentual de alunos da amostra 
que foram reprovados, você deve, em primeiro lugar, calcular esse 
percentual (como foi feito no exemplo 2 no início da seção).
n = 2500 (tamanho da amostra);
X = 1500 (número de alunos reprovados).
Cálculo do percentual:
Você pode manter o resultado na forma decimal, pois o cálculo 
do erro também é feito assim.
Passo 2: calcular e procurar o z na tabela (ver exemplo 2, ao final da 
seção 1). Dividir o NC por dois. Para tanto, não se esqueça de usar o 
valor do nível de confiança na forma decimal, ou seja, dividido por 100.
Passo 3: procurar na tabela esse valor e encontrar o z 
correspondente. O valor é referente à área entre zero e z, localizado 
na região central da tabela. Veja a seguir:
probabilidade_e_estatistica_1582.indb 225 19/07/12 11:12
226
Universidade do Sul de Santa Catarina
Tabela 5.4 – Tabela de valores normais 
Fonte: Elaboração do autor (2006).
Localizada a área, é só seguir a coluna na qual está o valor até 
a primeira linha. Note que o valor se encontra entre 0,4495 e 
0,4505 e, sendo assim,.você deve usar o valor compreendidoentre 0,04 e 0,05 como se fosse um ponto médio, ou seja, 0,045. 
Seguindo a linha até a primeira coluna, você encontra o valor 
correspondente a 1,6. Juntando, ou somando os dois valores, você 
chega ao valor 1,645 para z, ou seja, z = 1,645.
Passo 4: discriminar cada elemento da fórmula de cálculo do erro e 
aplicá-la ao caso em exame.
Em que:
e = o que se quer calcular (erro da estimativa);
z = 1,645 (calculado e encontrado no passo 2); 
 = 60% ou (percentual da amostra de alunos 
reprovados)
probabilidade_e_estatistica_1582.indb 226 19/07/12 11:12
227
Probabilidade e Estatística
Unidade 5
 (percentual da amostra de alunos que não foram 
reprovados) 
n = 2500 (tamanho da amostra).
Cálculo do erro
 = 1,645 . 
e = 1,645 . 0,009797959 ou 1,16%
Ao final, não se esqueça de multiplicar o resultado por 100 
para transformá-lo novamente em porcentagem. Esse é um erro 
comum dos meios de comunicação (TV, rádio, jornais etc.), ao 
informarem os resultados de uma pesquisa citam: “... com um 
erro de 1,16% a mais ou a menos”.
Passo 5: calcular o intervalo da estimativa.
Neste passo, o cálculo pode ser feito na forma percentual ou 
decimal.
 ou 58,38%
 ou 61,61%
Interpretando os resultados obtidos, tem-se que de 58,38% a 
61,61% da totalidade dos alunos cursando o Ensino Fundamental 
na rede municipal foram reprovados. 
Segundo as notações de Estatística, esse intervalo se escreve da 
seguinte forma:
P(0,29603 < p < 0,40397) = 0,90 ou
P(29,603 < p < 40,397) = 90%
probabilidade_e_estatistica_1582.indb 227 19/07/12 11:12
228
Universidade do Sul de Santa Catarina
Que leitura você pode fazer? O intervalo da 
estimativa para a totalidade dos eleitores que votariam 
no candidato está compreendido entre 29,603% e 
40,397%, com base em um nível de confiança de 90%.
Nesta seção, você aprendeu como calcular o erro referente à 
estimativa do percentual de uma população. Na próxima, você 
verá como calcular o erro de uma estimativa para a média de 
uma população.
Seção 4 – Estimativas para média populacional
Ao realizar uma pesquisa por amostragem, além de calcular 
percentuais, você pode obter algumas médias, como por exemplo, 
a média das alturas, das idades, dos pesos etc. O processo é 
semelhante, ou seja, calcula-se o erro e o intervalo. O que muda é a 
forma de cálculo do erro. Isso vale para as séries de dados amostrais 
que podem ser aproximados por uma distribuição normal. 
E para calcular o erro e o intervalo de uma estimativa 
da média populacional? 
Para calcular o erro de uma estimativa da média populacional, 
você vai precisar da média de uma amostra e do desvio padrão. 
Este pode ser obtido com base na própria população, se for 
possível, ou na amostra. O desvio padrão da amostra pode ser 
usado como uma aproximação.
probabilidade_e_estatistica_1582.indb 228 19/07/12 11:12
229
Probabilidade e Estatística
Unidade 5
Veja, a seguir, a fórmula para o cálculo do erro:
Em que:
e = erro da estimativa;
z = limite do intervalo definido pelo nível de confiança;
S(x) = desvio padrão da amostra (ou da população, se possível);
n = tamanho da amostra.
O intervalo é calculado subtraindo-se o erro da média da amostra e 
somando-se o erro à referida média. Veja, abaixo, a notação usada:
Em que:
P = probabilidade de o valor estimado estar no intervalo 
calculado;
x = média da amostra;
μ = média da população (o que você vai estimar);
NC = nível de confiança.
Veja os exemplos a seguir
Exemplo 1: Em sondagem realizada com base nos alunos do 
curso de Matemática das quintas séries de uma determinada 
escola, o resultado geral apresentou uma média de 6,7, com um 
desvio padrão de 1,2. Com esse tipo de informação, pode-se 
realizar uma série de análises. A partir desses dados, calcule uma 
estimativa (erro e intervalo), considerando essa série com uma 
distribuição normal para a média populacional a um nível de 
confiança de 95% e que a amostra foi de 35 alunos.
probabilidade_e_estatistica_1582.indb 229 19/07/12 11:12
230
Universidade do Sul de Santa Catarina
Calculando passo a passo
Passo 1: calcular e procurar z na tabela (veja exemplo1, seção 1). 
Dividir o NC por dois. Usar o valor do nível de confiança na forma 
decimal, ou seja, dividido por 100.
Passo 2: procurar esse valor na tabela e encontrar o z 
correspondente. O valor é referente à área entre zero e z, localizado 
na região central da tabela. Veja a seguir:
Tabela 5.5 – Tabela de valores normais
Fonte: Elaboração do autor (2006). 
Localizada a área, é só seguir a coluna na qual está o valor até a 
primeira linha, encontrando o número 0,06. Na horizontal, basta 
traçar a linha até a primeira coluna, chegando ao número 1,9. 
Somando os dois, você encontra o valor correspondente a 1,96 
para z, ou seja, z = 1,96.
probabilidade_e_estatistica_1582.indb 230 19/07/12 11:12
231
Probabilidade e Estatística
Unidade 5
Passo 3: discriminar cada elemento da fórmula de cálculo do erro e 
aplicá-la ao caso em questão.
Em que:
e = o que se quer calcular (erro da estimativa);
z = 1,96 (ver passo 2);
S(x) = 1,2 (desvio padrão da amostra)
n = 35 (tamanho da amostra).
Cálculo do erro:
 = 1,96.
Não é necessário multiplicar por 100, pois este resultado não 
indica um percentual, mas sim pontos (a nota)!
Passo 4: calcular o intervalo da estimativa.
Neste passo, como na estimativa para o percentual, você deve 
subtrair e somar o erro à média:
Interpretando os resultados obtidos, tem-se que a média das 
notas da totalidade dos alunos está compreendida entre 6,3 e 7,1 
pontos, aproximadamente.
probabilidade_e_estatistica_1582.indb 231 19/07/12 11:12
232
Universidade do Sul de Santa Catarina
Segundo as notações de Estatística, esse intervalo se escreve da 
seguinte forma:
P(6,7 – 0,3976 < μ < 6,7 + 0,3976) = 0,95
P(6,3024 < μ < 7,0976) = 0,95
Que leitura você pode fazer? O intervalo da estimativa 
para a média das notas da totalidade dos alunos está 
compreendido entre 6,3 e 7,1 pontos, aproximadamente, 
com um índice de confiança de 95%.
Exemplo 2: Em uma pesquisa realizada com diversas turmas 
de uma escola, os alunos levaram 39 minutos, em média, para 
terminar uma avaliação de matemática. O tamanho da amostra 
era de 100 estudantes. O desvio padrão dessa amostra foi de 18 
minutos. Com base em um nível de confiança de 90%, qual seria a 
estimativa para a média populacional da escola e sua interpretação?
Calculando 
Passo 1: calcular e procurar o z na tabela (ver exemplo 2, no final da 
seção 1). Dividir o NC por dois. Para tanto, usar o valor do nível de 
confiança na forma decimal, ou seja, dividido por 100.
Passo 2: procurar esse valor na tabela e encontrar o z 
correspondente. O valor é referente à área entre zero e z, localizado 
na região central da tabela. Veja a seguir:
probabilidade_e_estatistica_1582.indb 232 19/07/12 11:12
233
Probabilidade e Estatística
Unidade 5
Tabela 5.6 – Tabela de valores normais
Fonte: Elaboração do autor (2006).
Localizada a área, é só seguir a coluna na qual está o valor até a 
primeira linha. Note que o valor se encontra entre 0,4495 e 0,4505 
e, sendo assim, deve-se usar o valor compreendido entre 0,04 e 
0,05 como se fosse um ponto médio, ou seja, 0,045. Traçando a 
linha até a primeira coluna, chega-se ao número 1,6. Somando os 
dois, você encontra o valor 1,645 para z, ou seja, z = 1,645.
probabilidade_e_estatistica_1582.indb 233 19/07/12 11:12
234
Universidade do Sul de Santa Catarina
Passo 3: discriminar cada elemento da fórmula de cálculo do erro e 
aplicá-la ao caso em questão.
Em que:
e = o que se quer calcular (erro da estimativa);
z =1,645 (ver passo 2);
S(x) = 18 (desvio padrão da amostra);
n = 100 (tamanho da amostra).
Cálculo do erro:
 = 1,645. 
Não é necessário multiplicar por 100, pois este resultado não 
indica um percentual, mas sim minutos!
Passo 4: calcular o intervalo da estimativa. Neste passo, como na 
estimativa para o percentual, você deve subtrair e somar o erro à média.Interpretando os resultados obtidos, tem-se que o tempo médio 
para a realização da avaliação está compreendido entre 36,04 e 
41,96 minutos, aproximadamente.
Segundo as notações de Estatística, esse intervalo se escreve da 
seguinte forma:
P(39 – 2,961 < μ < 39 + 2,961) = 0,90
P(36,039 < μ < 41,961) = 0,90
probabilidade_e_estatistica_1582.indb 234 19/07/12 11:12
235
Probabilidade e Estatística
Unidade 5
Que leitura você pode fazer? O intervalo da 
estimativa para a média do tempo de execução da 
avaliação está compreendido entre 36,04 e 41,96 
minutos, com um índice de confiança de 90% 
Seção 5 – Análise de variância – ANOVA 
Como comparar as características de várias amostras
Logo após calcular a estimativa de uma média populacional, 
podemos ter outro desafio: definir se as médias de várias 
populações são mesmo semelhantes ou existem diferenças que 
superam os próprios problemas do processo de amostragem.
Isso porque, muitas vezes, amostras de diferentes populações 
são selecionadas com a finalidade de se avaliarem possíveis 
diferenças entre as distribuições populacionais de alguma 
característica de interesse.
Podemos citar alguns exemplos destas situações:
� Seleção de lotes de parafusos fabricados em 
diferentes empresas com diferentes equipamentos, 
para avaliar se a distribuição (populacional) do 
valor médio do diâmetro da cabeça dos parafusos 
produzidos varia com a marca do equipamento usado 
na fabricação. 
 
� Para curar certa doença, existem quatro tratamentos 
possíveis: A, B, C e D. Pretende-se saber se existem 
diferenças significativas nos tratamentos no que diz 
respeito ao tempo necessário para eliminar a doença. 
 
� Análise de amostras de água de diversos pontos da 
cidade para verificar se existe variação na distribuição 
de alguma característica (nível de ácidos, por exemplo) 
associada à qualidade da água entre bairros.
probabilidade_e_estatistica_1582.indb 235 19/07/12 11:12
236
Universidade do Sul de Santa Catarina
Em muitos casos, uma análise descritiva dos dados indica 
que modelos gaussianos ou normais são compatíveis com suas 
distribuições. Em outras palavras, sob o ponto de vista estatístico, 
podemos considerar as k amostras disponíveis como provenientes 
de populações normais com médias μ1, μ2, ..., μk.
Se não existirem razões contrárias, podemos também supor 
que as amostras são independentes. Adicionalmente, a análise 
descritiva muitas vezes sugere que as k populações têm a mesma 
variância σ2 (desconhecida). 
O problema proposto pode então ser encarado como um teste da 
hipótese de que as médias são iguais: H: μ1 = μ2 = ... =μk. E, nestas 
situações, a técnica para resolver problemas desse tipo (e muitos 
outros semelhantes) é chamada de análise de variância de um fator.
Definição do problema a ser resolvido
Considerando que existem k populações de interesse, nas quais se 
estuda uma característica comum X1, X2, ..., Xk, são as variáveis 
aleatórias que representam tais característica nas populações 1, 2, ..., 
k, respectivamente. Assim, a hipótese a testar é: μ1 = μ2 = ... = μk?
Neste problema, as k populações podem ser vistas como k níveis 
de um mesmo fator. E, assim, a questão é saber se o fator exerce 
alguma influência na variação da característica em estudo (a 
média, neste caso).
Caso o problema apresente somente um fator, 
estaremos trabalhando com análise de variância de um 
fator, conhecido como ANOVA de um único fator. Claro 
que também existe ANOVA de múltiplos fatores, mas 
este tema não será abordado neste estudo.
probabilidade_e_estatistica_1582.indb 236 19/07/12 11:12
237
Probabilidade e Estatística
Unidade 5
Analisando o problema com um exemplo
Exemplo: o Sr. Fernando Fernandes é dono de uma Indústria 
Metal-Mecânica e pretende comprar três fábricas de parafusos 
para suprimentos da sua própria indústria. Para isso, precisa 
analisar o volume de fabricação das fábricas a comprar, já que ele 
precisa que as três tenham produções semelhantes de parafusos 
para prover regularmente à sua industria.
Para isso, o Sr. Fernando Fernandes seleciona aleatoriamente 
cinco semanas do semestre, nas quais observa o volume de 
fabricação semanal para cada fábrica (ou seja, as três amostras 
são independentes).
Os dados amostrais estão registrados na seguinte tabela:
Tabela 5.7 – Dados amostrais
Semanas Fábrica 1 Fábrica 2 Fábrica 3
 Semana 1 47 55 54
 Semana 2 53 54 50
 Semana 3 49 58 51
 Semana 4 50 61 51
 Semana 5 46 52 49
 (médias amostrais) = 49 = 56 = 51 = 52
Fonte: Elaboração do autor (2011).
Representamos por Xi o volume de fabricação semanal na Fábrica 
i (i = 1, 2, 3) e por μi o valor médio de Xi.
Neste exemplo, existe apenas um fator de interesse, o fator “fábrica” 
que apresenta três níveis ou grupos: fábrica 1, fábrica 2 e fábrica 3. 
Assim, cada nível do fator define uma população de média μi.
probabilidade_e_estatistica_1582.indb 237 19/07/12 11:12
238
Universidade do Sul de Santa Catarina
Assim, o que o Sr. Fernando Fernandes pretende saber é se as 
médias dos três níveis, ou populações, são iguais, isto é, pretende-
se saber se a hipótese é certa ou não:
H: µ1 = µ2 = µ3
(Hipótese de igualdade na fabricação média das três fábricas)
Então a questão a responder é:
Serão as médias amostrais =49, = 56, = 51, 
diferentes porque há diferenças entre as médias 
populacionais: µ1 = µ2 = µ3? Ou serão essas diferenças 
atribuídas a flutuações amostrais?
Podemos, então, formular as seguintes hipóteses: 
H: µ1 = µ2 = µ3
Ou, em outras palavras, a hipótese está afirmando que não há 
diferença entre o volume médio de fabricação das três fábricas.
Lembre-se: como toda hipótese, as pesquisas (testes 
em nosso caso) poderão confirmá-la ou negá-la!
Pressupostos para resolver a questão
A aplicação da análise de variância pressupõe a verificação das 
seguintes condições:
 � as amostras devem ser aleatórias e independentes; 
 � as amostras devem ser extraídas de populações normais;
 � as populações devem ter variâncias iguais.
Assim, temos duas situações possíveis demonstradas a seguir.
probabilidade_e_estatistica_1582.indb 238 19/07/12 11:12
239
Probabilidade e Estatística
Unidade 5
A hipótese H é verdadeira 
As diferenças observadas entre as médias amostrais são devidas a 
flutuações amostrais. Ou seja, neste caso, teremos que μ1 = μ2 = 
μ3: todas as amostras provêm de populações com médias iguais.
Como se supôs que todas as populações são normais e têm 
variâncias iguais, isto é o mesmo que extrair todas as amostras de 
uma única população (de uma única fábrica).
Gráfico 5.2 – Distribuição populacional quando µ1 = µ2 = µ3 = µ
Fonte: Elaboração do autor (2011).
A hipótese H é falsa
As diferenças observadas entre as médias amostrais são 
demasiado grandes para serem devidas unicamente a flutuações 
amostrais.
Aqui, as médias das populações não são iguais, ou seja pelo 
menos duas fábricas têm volumes de produção média diferentes. 
As amostras recolhidas provêm de populações diferentes.
Gráfico 5.3 – Distribuição populacional quando µ1 ≠ µ2 ≠ µ3
Fonte: Elaboração do autor (2011).
probabilidade_e_estatistica_1582.indb 239 19/07/12 11:12
240
Universidade do Sul de Santa Catarina
Teste ANOVA
Para testar a hipótese, devemos trabalhar com o valor da 
Estatística de teste F, que é outro valor que surge de outra 
distribuição de probabilidade, que a semelhança da distribuição 
normal tem uma tabela para calcular seu valor, no qual devemos 
entrar com os graus de liberdades (número de dados da amostra 
diminuído um) para obter o valor correspondendo a um certo 
nível de confiança (por exemplo, NC = 95%, ou seja, um nível de 
significância de 5%: α = 5%).
Então, a estatística de teste mede a razão entre a variação entre 
grupos e a variação dentro dos grupos:
F = Variação entre grupos
Variação dentro dos grupos
A hipótese H é, pois, rejeitada para valores grandes da estatística F.
A tabela ANOVA tem a seguinte estrutura:
Tabela 5.8 – Tabela ANOVAFonte: Elaboração do autor (2011).
Por exemplo, para n = 3 (três grupos) e m = 5 (cinco amostras por 
grupo) resultam em:
probabilidade_e_estatistica_1582.indb 240 19/07/12 11:12
241
Probabilidade e Estatística
Unidade 5
 � GLn = 3 – 1 = 2 (graus de liberdade do numerador, 3 = K);
 � GLm = 15 – 3 = 12 (graus de liberdade do denominador, 
15 = 3 x 5 = N).
Ao final da seção, você pode achar a tabela completa para 
determinar o PC (ponto crítico) ou estatística F para um nível de 
confiança de 95%.
Assim, na tabela, procura-se na primeira coluna (GL do 
denominador) a linha do 12 e, na primeira fila, a linha do 2 (GL 
do numerador), resulta num valor do estatístico F: F = 3,89, este 
valor definido pela tabela é conhecido como Ponto Crítico ou PC.
Devemos aclarar que existem diversas tabelas de F, cada uma 
delas calculadas para um grau de significância diferente, a tabela 
de nosso trabalho é a tabela para um grau de significância de 5%.
Agora, temos que calcular o valor de F para nosso experimento, e 
se o valor do F calculado resulta maior que o valor de F tabelado 
(PC), a hipótese deverá ser rejeitada.
Dessa forma, para calcular nosso valor de F amostral, devemos 
utilizar uma tabela de layout já tradicional para organizar 
nossos cálculos.
A tabela, chamada de Tabela ANOVA, tem a seguinte estrutura 
tradicional:
Tabela 5.9 – Tabela ANOVA
Fonte: Elaboração do autor (2011).
probabilidade_e_estatistica_1582.indb 241 19/07/12 11:12
242
Universidade do Sul de Santa Catarina
Nessa tabela, temos:
SST = é a soma de quadrados total e mede a variação total nos 
dados;
SSA = é a soma de quadrados entre os níveis (grupos) do fator 
e mede a variação entre grupos (populações); é designada por 
variação explicada, pois ela é explicada pelo fato de as amostras 
poderem provir de populações diferentes;
SSE = é a soma de quadrados dentro dos níveis (grupos) do fator 
e mede a variação dentro dos grupos (populações); é, por vezes, 
designada por variação não explicada ou residual, pois é atribuída 
a flutuações dentro da mesma população, portanto não pode ser 
explicada pelas possíveis diferenças entre os grupos (populações).
Também temos que:
MSA = que é a soma média de quadrados entre grupos;
MSE = que é a soma média de quadrados dentro dos grupos ou 
residual.
Pode-se provar que:
SST = SSA + SSE;
e, também, que: 
(K − 1) + (N – K) = N – 1 
Isso permite verificar os cálculos da tabela ANOVA.
Assim, sob o pressuposto da hipótese ser verdadeira, tem-se:
probabilidade_e_estatistica_1582.indb 242 19/07/12 11:12
243
Probabilidade e Estatística
Unidade 5
A hipótese deve ser rejeitada se o valor observado de F se situar à 
direita do ponto crítico; isto é, rejeita-se H se Fobs ≥ PC, em que o 
ponto crítico PC é dado por:
Então, para nosso exemplo da compra das fábricas por parte do Sr. 
Fernando Fernandes, vamos ver o que podemos concluir ao nível de 
significância de 0.05, ou seja, a um nível de confiança NC = 95%.
Cálculo de SSE:
Cálculo de SSA:
SSA = 5(49 – 52)2 + 5(56 – 52)2 + 5(51 – 52)2 = 130
Assim, a tabela ANOVA resulta, numericamente para o exemplo, 
nos seguintes valores:
Tabela 5.10 – Tabela ANOVA
Fonte: Elaboração do autor (2011).
E, se a hipótese H é verdadeira, resultará:
probabilidade_e_estatistica_1582.indb 243 19/07/12 11:12
244
Universidade do Sul de Santa Catarina
Da tabela F, a gente já calculou o valor F para os graus de 
liberdade 2 e 12 e 95% de confiança:
F1–a,2,12 = 3.89
E, segundo a tabela ANOVA, o valor observado da estatística F é:
E, como resultando que 8,3 > 3,89, então a hipótese (H: μ1 = 
μ2 = μ3) é rejeitada ao nível de significância de 0,05 ou nível de 
confiança de 95%; isto é, existem diferenças significativas entre 
as médias amostrais das vendas, e há, portanto, evidência de que 
existem pelo menos duas lojas com volumes médios de produção 
diferentes entre elas.
Em outras palavras, o fator fábrica exerce uma influência 
significativa sobre o volume médio da produção de parafusos: 
tem, ao menos, uma fábrica que está produzindo bem menos ou 
bem mais que as outras, desequilibrado o suprimento constante 
de parafusos que a indústria de Fernando Fernandez precisa.
probabilidade_e_estatistica_1582.indb 244 19/07/12 11:12
245
Probabilidade e Estatística
Unidade 5
Síntese
O processo de amostragem é muito importante e eficaz no dia 
a dia de qualquer profissional. Diariamente, você esbarra com 
situações semelhantes às que foram analisadas nesta unidade, 
tanto nos meios de comunicação, como rádio, TV, jornais etc., 
mas também em escolas, empresas e outras instituições.
Nesta unidade, você pôde ver as facilidades e a importância do uso 
de amostragem. Hoje, os processos de amostragem e as estimativas 
estão muito precisos, a ponto de ser mais confiável usar a amostra 
que realizar uma pesquisa com a totalidade da população.
Você teve, também, algumas noções de como funciona todo esse 
processo, mas fique à vontade para aprofundar esse tema tão 
importante e fundamental na realização de uma pesquisa. Muitas 
vezes, você terá que usar ferramentas como as que vimos aqui, 
tanto na sua vida acadêmica quanto na profissional. 
Entender que as pesquisas feitas com base em uma amostra não 
culminam em resultados exatos, e poder definir a margem de erro 
ocasionada por essa amostragem, é um passo muito importante 
na formação profissional e acadêmica, além de possibilitar uma 
leitura mais realista da realidade.
probabilidade_e_estatistica_1582.indb 245 19/07/12 11:12
246
Universidade do Sul de Santa Catarina
Atividades de autoavaliação
Ao final de cada unidade, você realizará atividades de autoavaliação. O 
gabarito está disponível no final do livro didático, mas se esforce para 
resolver as atividades sem a ajuda do gabarito, pois, assim, você estará 
promovendo (e estimulando) a sua aprendizagem.
1) Estão listadas, a seguir, uma série de estudos e a margem de erro que 
o pesquisador irá adotar como tolerável, bem como o tamanho da 
população alvo desse estudo. Calcule o tamanho da amostra necessária 
para realizar as pesquisas considerando que o pesquisador não tem 
acesso ao tamanho da população e que o pesquisador tem acesso ao 
tamanho da população (calcular para os dois casos).
Tipos de estudos, margem de erro e tamanho da população e da amostra
Tema do estudo Erro tolerável
Tamanho 
da 
população
Tamanho 
da amostra 
(preencher)
a) Estudo socioeconômico com 
estudantes da Unisul 0,03 5600
b) Estudo com famílias do bairro Rio 
Vermelho, em Florianópolis 0,04 9400
c) Estudo com adolescentes com Teste 
de Sondagem Intelectual (TSI) 0,05 400
d) Estudo da fecundidade na cidade de 
Florianópolis 0,06 125.000
e) Estudo com usuários de drogas 
adolescentes de uma escola 0,09 250
f ) Estudo sobre analfabetismo no bairro 
Rio Tavares, em Florianópolis 0,09 2.500
g) Estudo de Índice de Massa Corporal 
dos estudantes da Unisul 0,05 4.000
h) Pesquisa de intenções de voto no 
Brasil 0,02 80.000.000*
Fonte: Elaboração do autor (2006).
probabilidade_e_estatistica_1582.indb 246 19/07/12 11:12
247
Probabilidade e Estatística
Unidade 5
2) Leia a notícia da IstoÉ On-Line (2004):
Florianópolis / SC – Caça ao tucano 
Sem contar com o apoio do governador, da prefeita Ângela Amin 
(PP) e de caciques da política catarinense, Dário Berger, candidato 
da coligação PSDB-PMN, é a grande surpresa até o momento nas 
eleições em Florianópolis. Concorrendo pela primeira vez a um 
cargo público de expressão, Berger vem liderando com folga a 
corrida eleitoral em Floripa. Pela pesquisa ISTOÉ/Databrain – feita 
entre os dias 26 e 27 de julho, com 700 entrevistados, margem 
de erro de 2,74 pontos porcentuais e coeficiente de confiança de 
90% – Berger apresenta tranquilos 26,4% das intenções de voto. O 
levantamento foi registrado no TRE-SC com o número 559/2004.
(Dados adaptados de ISTOÈ ONLINE, 2004). 
Com os dados dessa matéria, mostre os cálculos que foram feitos para 
se chegar ao erro de 2,74pontos percentuais, e encontre o intervalo da 
estimativa. 
probabilidade_e_estatistica_1582.indb 247 19/07/12 11:12
248
Universidade do Sul de Santa Catarina
3) A formação dos professores de Matemática da rede pública é 
importante para o ensino e para o aprendizado e é cada vez mais 
valorizado pelas instituições de ensino. Uma amostragem feita com 
300 professores indicou que apenas 240 professores do Ensino 
Fundamental da rede pública têm graduação completa em Matemática. 
Faça uma estimativa para o percentual da população de professores 
que têm graduação completa usando um nível de confiança de 95% 
(de início, não se esqueça de calcular o percentual de professores com 
graduação completa, assim como o intervalo da estimativa).
probabilidade_e_estatistica_1582.indb 248 19/07/12 11:12
249
Probabilidade e Estatística
Unidade 5
4) Uma amostragem com 250 alunos foi feita em escolas, e, entre outras 
perguntas, questionou-se sobre o peso dos alunos da quinta-série. O 
peso médio dos alunos entrevistados foi de 29,3 Kg e apresentou um 
desvio padrão de 3,4 Kg. Usando um nível de confiança de 95%, calcule 
uma estimativa para a totalidade (população) de alunos da quinta-série 
(não esqueça de calcular o erro e o intervalo correspondentes).
probabilidade_e_estatistica_1582.indb 249 19/07/12 11:12
250
Universidade do Sul de Santa Catarina
5) O governo federal instituiu o programa Bolsa Escola, no qual as famílias 
de baixa renda recebem ajuda financeira por cada filho que frequenta a 
escola. Essa ajuda financeira, segundo setor responsável, é em média de 
R$ 150,00 por família e apresenta um desvio padrão de R$ 31,50. Esses 
dados foram obtidos por uma amostragem realizada com 1000 famílias. 
Faça uma estimativa (erro e intervalo) para o valor médio recebido pela 
população das famílias com base em um nível de confiança de 98% 
(não se esqueça de calcular z, dividindo 98 por 100 e, após, dividindo o 
resultado obtido por 2. Procure o resultado na tabela).
6) O diretor de marketing de uma indústria pretende comprar uma nova 
máquina para fabricar parafusos. Você foi designado para estudar 
três marcas de maquinarias semelhantes, cada uma delas combina, 
de modo diferente, fatores como o preço do produto, volume de 
fabricação, condições de consumo de energia etc.
Qualquer um destes equipamentos pode ser utilizada na sua indústria, 
não havendo qualquer tipo de influência no rendimento pela presença 
dos outros equipamentos da indústria.
Para saber se há diferença entre o volume de produção das 
três máquinas visando à sua eficácia, cada uma delas é testada, 
aleatoriamente, funcionando em algumas das lojas dos fabricantes 
durante um período de duração limitada. Note que as lojas de venda 
são selecionadas de modo que as três amostras sejam aleatórias e 
independentes entre si.
probabilidade_e_estatistica_1582.indb 250 19/07/12 11:12
251
Probabilidade e Estatística
Unidade 5
A quantidade de peças produzidas durante este período constam na 
tabela seguinte:
Maquina 1 Máquina 2 Máquina 3
8 10 7 
6 8 5 
5 12 8 
6 7 6 
7 9 7 
10 5
11
Soma 32 67 38
Seja Xi a variável aleatória que representa o volume de produção de cada 
máquina i (i = 1,2,3), também admitamos que X1, X2 e X3 têm distribuição 
normal com iguais variâncias e fixemos o nível de confiança do teste em 
95%, ou seja, trabalhemos com um nível de significância de 5%.
A hipótese a testar é: H: µ1 = µ2 = µ3, ou seja: aceita-se que não há 
diferença entre os níveis de produção relativamente ao volume médio 
de peças que podem fabricar.
No caso que a hipótese H seja rejeitada, estaremos demostrando que pelo 
menos duas máquinas produzem um volume médio de peças diferente.
Assim, para resolver este problema, calcule o ponto crítico pelo médio 
do estatístico F da tabela da distribuição para um nível de significância 
de 5%. Verifique se aceita ou rejeita a hipótese de trabalho e crie a 
tabela ANOVA.
probabilidade_e_estatistica_1582.indb 251 19/07/12 11:12
Saiba mais
Se quiser aprofundar os estudos relativos ao assunto tratado nessa 
unidade, pesquise em:
BARBETTA, Pedro Alberto. Estatística aplicada às ciências 
sociais. 5. ed. rev. Florianópolis: Ed. UFSC, 2002.
MORETTIN, Luiz Gonzaga. Estatística básica. São Paulo: 
Makron Books, 1999.
TRIOLA, Mario F. Introdução à Estatística. Rio de Janeiro: 
LTC, 1999.
VIEIRA, Sônia. Introdução à bioestatística. 6. ed. Rio de 
Janeiro: Campus, 2000.
probabilidade_e_estatistica_1582.indb 252 19/07/12 11:12
6UNIDADE 6Regressão linear e gráficos de controle
Objetivos de aprendizagem
 � Compreender e calcular a correlação entre duas 
variáveis.
 � Analisar a força de correlação entre duas variáveis.
 � Ajustar linearmente as duas variáveis.
 � Calcular previsões usando análise de regressão.
Seções de estudo
Seção 1 Correlação linear simples
Seção 2 Análise de regressão linear
Seção 3 Gráficos de controle
probabilidade_e_estatistica_1582.indb 253 19/07/12 11:12
254
Universidade do Sul de Santa Catarina
Para início de estudo
Pense na seguinte situação: será que existe alguma relação entre 
peso e altura? E entre nota escolar e idade? Sabemos como 
funcionam algumas destas relações por simples experiência de 
vida. Como, por exemplo, você pode dizer que quanto mais alta 
é a pessoa, mais pesada ela é. Claro que existem as exceções, mas 
geralmente, baixinhos são gordinhos, e altos, magrinhos.
Nesta unidade, você irá estudar como se pode analisar e 
comparar duas variáveis. Além disso, você irá aprender a fazer 
previsões utilizando esse método. 
Bons estudos!
Seção 1 – Correlação linear simples
Os métodos que você estudou até o momento são eficazes para 
analisar e interpretar somente uma variável de cada vez. Se eles 
servem para a análise de uma variável, como analisar e comparar 
duas variáveis simultaneamente? Para compreender como solucionar 
tal situação, você irá conhecer a correlação linear simples.
A correlação é uma ferramenta destinada ao estudo 
da relação entre duas variáveis quantitativas, além de 
fornecer a intensidade dessa relação.
Para você estudar como usar a correlação linear simples, é 
importante que você conheça o que é diagrama de dispersão e o 
coeficiente de correlação linear de Pearson. Conheça melhor estes 
assuntos a seguir.
probabilidade_e_estatistica_1582.indb 254 19/07/12 11:12
255
Probabilidade e Estatística
Unidade 6
Diagrama de dispersão
O diagrama de dispersão ajuda a definir a correlação entre duas 
variáveis quantitativas de modo gráfico. Em outras palavras, 
a relação entre duas variáveis, X e Y, pode ser vista em um 
diagrama, no qual são marcados os pontos correspondentes aos 
pares ordenados gerados pela relação X → Y, e (x,y) são esses pares 
ordenados. Dessa forma se constrói um diagrama de dispersão.
Quanto mais esses pontos estão próximos à reta imaginária gerada 
pela nuvem de pontos, mais forte será a correlação. Observe o 
gráfico a seguir e acompanhe os exemplos apresentados. 
No Gráfico 6.1, os pares ordenados são gerados da relação entre a 
altura das pessoas em centímetros e o peso em quilos.
Gráfico 6.1 – Diagrama de dispersão
Fonte: Elaboração do autor (2006).
Coeficiente de correlação linear de Pearson
O coeficiente de correlação permite que você analise a força ou a 
existência da correlação entre duas variáveis. Considerando que 
n é o número de observações (tamanho da amostra), o coeficiente 
será dado pela seguinte fórmula:
 ( )( )[ ]
( )[ ] ( )[ ]2222 .
...
yynxxn
yxyxnrxy
∑−∑∑−∑
∑∑−∑
=
probabilidade_e_estatistica_1582.indb 255 19/07/12 11:12
256
Universidade do Sul de Santa Catarina
Em que:
r = resultado do coeficiente de correlação linear de Pearson;
n = número de observações;
x = valores assumidos pela variável X;
y = valores assumidos pela variável Y.
Obs.: O coeficiente de Pearson pode variar de −1 a +1 → [−1,+1].
Quanto ao resultado de r, você deve considerar cinco situações, 
descritas no quadro a seguir.Valor de r Correlação entre as variáveis
r próximo de 0 Correlação linear pouco significativa
r = 0 Não há correlação linear entre as variáveis
r próximo de –1 Há correlação linear negativa (significativa)
r = –1 Há correlação linear negativa perfeita
r próximo de +1 Há correlação linear positiva (significativa)
r = +1 Há correlação linear positiva perfeita
Quadro 6.1 – Resultados possíveis do valor de x
Fonte: Elaboração do autor (2006).
Tipos de correlações
Então, segundo os resultados de r, as correlações podem assumir 
diferentes tipos, os quais você pode acompanhar detalhadamente 
a seguir:
a) Correlação linear positiva
Neste caso, o coeficiente de Pearson estará entre 0 e 1 → 
intervalo (0,1).
probabilidade_e_estatistica_1582.indb 256 19/07/12 11:12
257
Probabilidade e Estatística
Unidade 6
Gráfico 6.2 – Correlação linear positiva: altura x peso
Fonte: Elaboração do autor (2006).
 � x cresce, y cresce: no exemplo, se a altura cresce, o peso 
cresce;
 � x decresce, y decresce: no exemplo, se a altura decresce, o 
peso decresce.
b) Correlação linear perfeita positiva
Neste caso, o coeficiente de Pearson r será +1: os pontos estão 
perfeitamente alinhados.
Gráfico 6.3 – Correlação linear perfeita positiva: altura x peso
Fonte: Elaboração do autor (2006).
 � x cresce, y cresce: no exemplo, se altura cresce, o peso 
cresce;
 � x decresce, y decresce: no exemplo: se a altura decresce, o 
peso decresce.
probabilidade_e_estatistica_1582.indb 257 19/07/12 11:12
258
Universidade do Sul de Santa Catarina
c) Correlação linear negativa
Neste caso, o coeficiente de Pearson estará entre 0 e −1: 
intervalo [−1,0].
Gráfico 6.4 – Correlação linear negativa: idade x nota
Fonte: Elaboração do autor (2006).
 � x cresce, y decresce: no exemplo, se a idade cresce, a nota 
decresce;
 � x decresce, y cresce: no exemplo, se a idade decresce, a 
nota cresce.
d) Correlação linear perfeita negativa
Neste caso, o coeficiente de Pearson r será −1: os pontos estão 
perfeitamente alinhados.
Gráfico 6.5 – Correlação linear perfeita negativa: idade x nota
Fonte: Elaboração do autor (2006).
probabilidade_e_estatistica_1582.indb 258 19/07/12 11:12
259
Probabilidade e Estatística
Unidade 6
 � x cresce, y decresce: no exemplo, se a idade cresce, a nota 
decresce;
 � x decresce, y cresce: no exemplo, se a idade decresce, a 
nota cresce.
e) Correlação linear nula ou ausência de correlação
A seguir, veja exemplo de quando não há correlação entre as 
variáveis X e Y (coeficiente de Pearson r = 0). 
Gráfico 6.6 – correlação linear nula ou ausência de correlação: altura x nota
Fonte: Elaboração do autor (2006).
Como calcular o coeficiente de correlação?
Para obter esta resposta, acompanhe com atenção o exemplo. 
Exemplo: Calcule o coeficiente de correlação de Pearson e 
construa o diagrama de dispersão para uma turma de alunos, 
correlacionando altura e peso, descritas a seguir:
probabilidade_e_estatistica_1582.indb 259 19/07/12 11:12
260
Universidade do Sul de Santa Catarina
Tabela 6.1 – Tabela de altura e peso dos alunos de uma série
Fonte: Elaboração do autor (2006).
Calculando passo a passo
Passo 1: acrescente, na tabela, mais três colunas para auxiliar nos 
cálculos. Some os elementos da coluna x (altura) e escreva o total na 
última linha, obtendo, assim, o Σx. Some os elementos da coluna y (peso) 
e escreva o total na última linha, obtendo, assim, o Σy (veja tabela).
Passo 2: calcule os elementos da terceira coluna (x.y), multiplicando 
cada um dos elementos da coluna x (altura) por cada um dos 
elementos da coluna y (peso).
160.61 = 9760 
155.56 = 8680 
152.55 = 8360
E, assim, até o último aluno (aluno de número 10: veja os 
resultados na tabela). Em seguida, some todos eles e escreva o 
total na última linha, obtendo, assim, o Σx y.
probabilidade_e_estatistica_1582.indb 260 19/07/12 11:12
261
Probabilidade e Estatística
Unidade 6
Passo 3: calcule os elementos da quarta coluna (x2), elevando ao 
quadrado, cada um dos elementos da coluna x (altura).
(160)2 = 25600
(155)2 = 24025
(152)2 = 23104
E, assim, até o último aluno (veja os resultados na tabela). Em 
seguida, some todos eles e escreva o total na última linha, para 
obter, assim, o Σx2.
Passo 4: calcule os elementos da quinta coluna (y2), elevando ao 
quadrado, cada um dos elementos da coluna y (peso em Kg).
(61)2 = 3721
(56)2 = 3136
(55)2 = 3025
E, assim, até o último aluno (veja os resultados na tabela). Em 
seguida, some todos eles e escreva o total na última linha, para 
obter, assim, o Σy2.
Passo 5: calcule o coeficiente de correlação utilizando a fórmula vista 
anteriormente.
Agora, que tal identificar os elementos da fórmula? 
n = número de observações (10 alunos) → n = 10.
probabilidade_e_estatistica_1582.indb 261 19/07/12 11:12
262
Universidade do Sul de Santa Catarina
Os elementos a seguir foram calculados nos passos anteriores:
Σx = 1723
Σy = 703
Σx.y = 122327
Σx2 = 298537
Σy2 = 50323
Observação: É importante lembrar que: 
Σx.y ≠ Σx . Σy
Σx2 ≠ Σy2
Se você escrever na fórmula, terá:
Passo 6: agora, construa o diagrama de dispersão; para construir o 
diagrama; você deve marcar os pontos de cada par ordenado usando 
os valores da coluna das alturas como x e da coluna dos pesos como 
y, formando (x, y); veja o gráfico a seguir:
probabilidade_e_estatistica_1582.indb 262 19/07/12 11:13
263
Probabilidade e Estatística
Unidade 6
Gráfico 6.7 – Gráfico altura x peso
Fonte: Elaboração do autor (2006). 
Como interpretar? O coeficiente de correlação resultou em 
um número positivo e próximo de 1 (r = 0,98), sendo assim, 
a correlação entre a altura dos alunos e o peso é positiva 
(significativa), ou seja, quanto maior a altura do aluno, maior 
será seu peso, e quanto menor for sua altura menor será seu peso. 
Uma vez que você acompanhou e entendeu bem o exemplo de 
como aplicar o coeficiente de correlação de Pearson, siga para o 
estudo da próxima seção.
Seção 2 – Análise de regressão linear
Para fazer a análise da regressão, nos casos em que é possível 
estabelecer uma correlação entre duas variáveis, você terá de usar essa 
relação para prever valores para uma delas (sempre a variável que for 
adotada como Y), mas isso só será possível quando for conhecido o 
valor da outra variável, no caso, a variável X. E essa previsão só tem 
significado caso a força da correlação seja significativa ou perfeita 
(quando r está próximo ou igual a +1 ou −1). Essa força se dá pela 
proximidade dos pontos do diagrama de dispersão à reta imaginária.
A reta imaginária obtida pela aproximação dos pontos 
do diagrama de dispersão é chamada de reta de 
regressão!
probabilidade_e_estatistica_1582.indb 263 19/07/12 11:13
264
Universidade do Sul de Santa Catarina
Para encontrar uma equação que lhe auxilie a prever valores 
de Y, usa-se o Método dos Mínimos Quadrados, o qual você 
conhecerá a seguir.
A escolha da variável que será o Y está relacionada à 
variável que o pesquisador deseja estimar. No exemplo 
anterior, se a intenção é a de estimar o peso dos alunos, 
então, o Y deve ser a variável peso. Caso a necessidade 
fosse a de estimar a altura dos alunos, a variável Y 
passaria a ser a altura.
Método dos mínimos quadrados
Pode-se representar a reta imaginária pela equação:
Reta de regressão: = b + a.X
Sendo:
 e 
Em que:
 = valor predito de y (a ser estimado);
x = valor da variável x para determinado elemento da amostra;
y = valor da variável y para determinado elemento da amostra;
n = nº total de observações (tamanho da amostra);
b = a intersecção do eixo y (ou coeficiente linear da reta);
a = coeficiente de inclinação da reta (ou coeficiente angular da reta).
probabilidade_e_estatistica_1582.indb 264 19/07/12 11:13
265
Probabilidade e Estatística
Unidade 6
Ao predizer um valor de y com base em determinado 
valor de x, quanto mais significativa a correlação linear, 
mais precisa se torna a previsão. 
� Interpolação: estimativascom valores entre os da série;
� Extrapolação: estimativas com valores fora dos da série;
� Resíduo: é a diferença entre um valor amostral 
observado y, e o valor predito com base na equação de 
regressão.
A tabela a seguir (a mesma do exemplo anterior) descreve as 
alturas e pesos dos alunos de uma turma. Você deverá:
a) construir a equação de uma reta de regressão para prever 
o peso dos alunos;
b) prever o peso ( ) de um aluno com 175 cm (x) de altura.
Tabela 6.2 – Altura e peso dos alunos de uma série
Fonte: Elaboração do autor (2006). 
Calculando passo a passo
 � Para o item a):
Considerando que a tabela é a mesma do exemplo da seção 1 
(cálculo do coeficiente de correlação), não será necessário calcular 
as colunas nem os totais (veja a tabela).
probabilidade_e_estatistica_1582.indb 265 19/07/12 11:13
266
Universidade do Sul de Santa Catarina
Equação da reta de regressão → = b + a.X
Passo 1: você pode começar calculando a inclinação da reta (a).
Inclinação da reta (a) → 
Agora, identifique os elementos da fórmula: 
n = número de observações (10 alunos) → n = 10.
Os elementos a seguir foram calculados nos passos anteriores
Σx = 1723
Σy = 703
Σx.y = 122327
Σx2 = 298537
Se você escrever na fórmula, terá:
Passo 2: calcule a intersecção com o eixo y (b).
Intersecção do eixo y (b) → 
Agora, identifique os elementos da fórmula: 
n = número de observações (10 alunos) → n = 10.
Os elementos a seguir foram calculados nos passos anteriores.
probabilidade_e_estatistica_1582.indb 266 19/07/12 11:13
267
Probabilidade e Estatística
Unidade 6
Σx = 1723
Σy = 703
a = 0,72117
b = –53,95769
Passo 3: construa a equação da reta de regressão.
Após calcular a e b, tem-se:
a = 0,72117
b = − 53,95769
 = b + a.X
 = 0,72117x – 53,95769
 � Para o item b):
Fazer a previsão para um aluno que mede 175 cm. Você deve usar 
175 como X = 175. Substituir o valor de X na equação de regressão.
 = 0,72117 . 175 – 53,95769 = 126,20475 – 53,95769
 = 72,24706
Como interpretar? A previsão para o peso deste aluno que mede 
175 cm é de 72,25 Kg.
probabilidade_e_estatistica_1582.indb 267 19/07/12 11:13
268
Universidade do Sul de Santa Catarina
Seção 3 – Gráficos de controle
Antes de iniciar, vamos a uma questão: você saberia explicar o 
porquê do controle nos processos?
Quando fabricado um produto, bem ou serviço, as características 
deste produto irão apresentar certa variabilidade, devido à variação 
sofrida pelos fatores que compõem o próprio processo produtivo; 
por exemplo, diferença entre máquinas, mudanças nas condições 
ambientais, variação do material utilizado na fabricação, diferença 
entre fornecedores, e outras tantas causas possíveis.
Apesar do esforço direcionado para controlar todas esta 
variabilidade, ela irá sempre existir no produto acabado. 
Portanto, é importante controlar esta variabilidade para que 
possam ser fabricados produtos dentro dos padrões de qualidade 
próprios da empresa.
Também é importante verificar a estabilidade 
do processo de produção, já que de processos 
instáveis irão resultar produtos defeituosos ou 
perdas na produção ou, ainda, baixa na qualidade e, 
consequentemente, perda da confiança do cliente.
A partir do exposto, é possível compreender melhor a necessidade 
dos gráficos de controle. O que nos leva a outra questão: o que 
são os gráficos de controle?
Os gráficos de controle são um método para analisar 
e ajustar as variações de um processo em função do 
tempo. Descrevem o processo considerando duas 
caraterísticas básicas: centralização, definida pela 
média aritmética, e dispersão, verificada pelo desvio 
padrão ou pela amplitude.
Assim, temos dois grandes grupos de gráfico de controle: os 
gráficos para variáveis e os gráficos para atributos. As variáveis 
são os dados que podem ser medidos ou que sofrem variações 
contínuas (por exemplo, resistência à compressão, dureza, 
diâmetros etc.), e os atributos são dados que somente podem ser 
probabilidade_e_estatistica_1582.indb 268 19/07/12 11:13
269
Probabilidade e Estatística
Unidade 6
contados ou classificados (por exemplo, passa/não passa, claro/
escuro, quente/frio etc.), em outras palavras, são aqueles que 
representam variáveis contínuas ou discretas, respectivamente.
Tipos de gráficos de controle
O gráfico para atributos mais usado é o gráfico NP, que 
monitora a variação do número de itens defeituosos em amostras 
de tamanho constante.
O gráfico de variável mais conhecido é o gráfico X-r, que monitora 
a variação da média e amplitude dos dados ao longo do tempo.
E quais são os principais objetivos destes gráficos?
 � Monitorar os dados temporais para uma característica 
particular de qualidade, como exemplo: a cor de um 
produto, o peso ou a temperatura;
 � detectar mudanças no processo ao longo do mesmo;
 � responder a perguntas do tipo:
 » são os lotes de matéria-prima ou a variação de turno 
que causam a variação do processo?
 » são causas especiais do processo ou causas naturais que 
ocasionam a variação no processo?
 » a variação entre os diferentes lotes de produção é 
maior que o esperado?
Acompanhe alguns exemplos de aplicação dos gráficos de 
controles a seguir.
probabilidade_e_estatistica_1582.indb 269 19/07/12 11:13
270
Universidade do Sul de Santa Catarina
Exemplo 1: 
Proposta: verificar se o processo de fabricação está sob 
controle estatístico, ou seja, somente causas comuns de variação 
influenciam processos. 
Problema: a fábrica Peças & Peças deseja realizar um controle de 
qualidade do processo de fabricação de parafusos. 
Dados coletados: em todas as horas, são retiradas cinco peças 
da linha de produção, que são medidas, e os valores, registrados. 
Definimos, neste caso, que o tamanho do subgrupo é igual a 
cinco, destes, 25 subgrupos foram obtidos.
Exemplo 2:
Proposta: verificar se a proporção de pedidos não aceitos está sob 
controle. 
Problema: o Banco de Minas deseja saber o número de pedidos 
não aceitos para a abertura de contas em uma rede bancária. 
Coleta de dados: Foi coletada uma amostra de 20 pedidos.
Exemplo 3:
Proposta: verificar o número de erros nas fichas de 
cadastramento de uma empresa. 
Problema: foi observado um grande número de erros no 
preenchimento dos cadastros dos vendedores de uma empresa. 
Deseja-se analisar o número de erros por cadastro (não 
conformidades).
Coleta de dados: analisa-se uma amostra de 22 conjuntos, 
contendo 15 fichas de cadastro cada.
probabilidade_e_estatistica_1582.indb 270 19/07/12 11:13
271
Probabilidade e Estatística
Unidade 6
Construção de gráficos de controle com ajuda de planilhas de 
cálculo: gráfico NP
A fábrica de Parafusos Fernando Fernandes, no final de cada dia de 
trabalho, inspeciona uma amostra de cem peças para obter o número 
de defeitos e conhecer o grau de qualidade da sua produção.
Pode-se perceber que essa característica de qualidade varia ao 
longo do tempo; e, assim, para facilitar esse estudo, devemos usar 
uma ferramenta que possibilite a visualização do número de peças 
dentro dos padrões predeterminados pela fábrica e aquelas que 
estão fora desses padrões, como são os gráficos de controle.
Os gráficos de controle típicos exibem três linhas paralelas 
ao eixo X: a linha central, que representa o valor médio do 
característico de qualidade exigido pela fábrica; a linha superior, 
que representa o limite superior de controle (LSC); e a linha 
inferior, representando o limite inferior de controle (LIC).
Assim, uma vez apresentado o gráfico, os pontos da amostragem 
devem permanecer dentro do intervalo determinado por LSC e 
LIC. Cada ponto representa uma amostra do processo. 
Para visualizar a evolução do característico de qualidade ao longo 
do tempo, é usual unir os pontos com retas.
Assim, os gráficos de controle apresentam o desempenho do 
processo no tempo e podem indicar que o processo está sob 
controle estatístico quando: 
 � todos os pontos do gráfico estão dentro dos limites de 
controle;
 � a disposiçãodos pontos dentro dos limites é aleatória;
No caso que todos os pontos amostrais estejam sem distribuição 
aleatória, pode acontecer de estar trabalhando com dados visados.
probabilidade_e_estatistica_1582.indb 271 19/07/12 11:13
272
Universidade do Sul de Santa Catarina
Construção do gráfico de controle NP
Logo após de uma semana de amostragem, os resultado são os 
seguintes:
Tabela 6.3 – Resultado da amostragem
Amostra número 1 2 3 4 5 6
Tamanho amostra n 100 100 100 100 100 100
Número de peças defeituosas d 5 2 7 3 6 2
Proporção de peças defeituosas p 0,05 0,02 0,07 0,03 0,06 0,03
Fonte: Elaboração do autor (2011).
Para o cálculo da média das proporções, devemos utilizar a 
seguinte fórmula:
P = (1 / m) Spi
Em que:
P = média das proporções;
m = número de amostras (no exemplo, m = 6);
Spi = somatória das proporções.
Assim sendo: 
P = 1/6 * (B4 + C4 + D4 + E4 + F4 + G4) = 0,04167
Para calcular o número médio, usamos a fórmula:
NP = P x n
Em que:
NP = número médio;
n = tamanho da amostra (no exemplo, n = 100).
probabilidade_e_estatistica_1582.indb 272 19/07/12 11:13
273
Probabilidade e Estatística
Unidade 6
Para o exemplo:
NP = 0,04167 x 100 = 4,167
Para calcular o LSC, usamos a fórmula:
Em que:
LSC = limite superior de controle;
NP = número médio;
P = médias das proporções.
Para o exemplo dado:
LSC = 10,1615
Para o cálculo do LIC, usamos a fórmula:
Em que LIC é o limite inferior de controle, e, usando os dados 
do exemplo, resulta em:
LIC = −1,8281.
Porém, pelo fato de que a fábrica está testando o número de peças 
defeituosas, resulta que o LIC (o mínimo de peças defeituosas 
produzidas) não pode ser um número negativo.
No exemplo, devemos assumir como LIC o menor valor possível, 
ou seja, zero peças defeituosas.
probabilidade_e_estatistica_1582.indb 273 19/07/12 11:13
274
Universidade do Sul de Santa Catarina
Temos, então, todos os parâmetros necessários à construção do 
gráfico NP: 
LIC = 0
LSC = 10,1615
NP = 4,167
Agora, vamos construir o gráfico, com a ajuda de uma tabela em 
Excel, que possuirá quatro colunas:
 � Número de peças defeituosas;
 � Limite superior de controle (LSC);
 � Limite inferior de controle (LIC);
 � Número médio (NP).
Tabela 6.4 – Peças com defeito
Fonte: Elaboração do autor (2011).
Note que os valores de LSC, LIC e NP são iguais para cada 
amostra. Com a tabela pronta, efetua-se o procedimento usual para 
a construção de um gráfico de linhas com os pontos plotados.
Este procedimento será mostrado a seguir:
Marcar o intervalo A1:D7 e, a partir do menu Inserir / 
Gráfico, inserir um gráfico de linhas com marcas para 
os pontos.
probabilidade_e_estatistica_1582.indb 274 19/07/12 11:13
275
Probabilidade e Estatística
Unidade 6
Figura 6.1 – Criação de gráfico de controle em Excel
Fonte: Elaboração do autor (2011).
E, assim, veremos uma janela semelhante à seguinte:
Figura 6.2 – Criação de gráfico de controle em Excel
Fonte: Elaboração do autor (2011).
Nesta caixa, podemos visualizar como ficará o gráfico.
Clique em continuar; na próxima caixa, mostrada na Figura 
3.3, definiremos os detalhes do gráfico NP, tais como título do 
gráfico, legendas e títulos dos eixos X e Y.
Feito isso, finalizaremos o procedimento clicando em finalizar.
probabilidade_e_estatistica_1582.indb 275 19/07/12 11:13
276
Universidade do Sul de Santa Catarina
Figura 6.3 – Criação de gráfico de controle em Excel
Fonte: Elaboração do autor (2011).
Resultando, finalmente, no gráfico de controle NP.
Gráfico 6.8 – Gráfico de controle
Fonte: Elaboração do autor (2011).
Analisando o gráfico, observamos que todos os pontos amostrais 
estão distribuídos aleatoriamente ao redor da média, sem 
apresentar valores fora dos limites máximos e mínimos e sem 
apresentar dados visados; através dessa análise, podemos concluir 
que o processo de fabricação está sob controle estatístico e não 
apresenta falhas de produção que precisem parar a produção para, 
por exemplo, calibrar alguma parte de equipamento.
Dito com outras palavras, conclui-se que o número de peças não 
conformes está sob controle estatístico, já que nenhum ponto 
ultrapassa os limites de controle. 
probabilidade_e_estatistica_1582.indb 276 19/07/12 11:13
277
Probabilidade e Estatística
Unidade 6
Construção de gráficos de controle com ajuda de planilhas de 
cálculo: gráfico X-r
Uma empresa que produz, ensaca e comercializa arroz deve verificar 
a qualidade de seu produto em relação ao peso de cada pacote. 
Para isso, faz-se necessário um gráfico de controle para variáveis; 
neste caso, a variável é o peso dos pacotes.
Por tal motivo, foi feita uma amostragem aleatória de quatro 
pacotes em cada uma das seis amostras. Para cada uma das seis 
amostras, calculou-se a média aritmética e a amplitude dos pesos 
(valor máximo – valor mínimo). 
Na construção do gráfico X-r, são necessários os seguintes 
valores: 
 � média das médias das amostras (X);
 � média das amplitudes das amostras (K);
 � tamanho das amostras (n).
Com estas duas médias, X e K, e com n, pode-se calcular os 
limites de controle (LIC e LSC).
Então, temos que:
Faz-se amostragem dos pesos nas m amostras com n pacotes e 
registram-se estes pesos:
 � número de amostras m = 6;
 � número de pacotes por amostra n = 4.
Com os dados coletados, podemos construir a tabela seguinte e 
calcular a média e amplitude dos pesos de cada amostra.
probabilidade_e_estatistica_1582.indb 277 19/07/12 11:13
278
Universidade do Sul de Santa Catarina
Tabela 6.5 – Amostras
Fonte: Elaboração do autor (2011).
Agora, devemos calcular os valores necessários para a construção 
do gráfico de controle X-r para cada uma das amostras e, no caso 
da amostra 1, resulta:
 � Cálculo da média
X = Σn amostra 1 / n
Em que:
X = média aritmética;
Σn amostra 1 = soma dos pesos da amostra 1;
n = tamanho da amostra. 
X = 250 / 4 = 62,5 
 � Cálculo da amplitude dos pesos
r = valor máximo − valor mínimo
Em que:
r = amplitude 
r = 70 – 55 = 15
probabilidade_e_estatistica_1582.indb 278 19/07/12 11:13
279
Probabilidade e Estatística
Unidade 6
Calculamos, assim, a média e a amplitude de todas as amostras, 
construindo a seguinte tabela:
Tabela 6.6 – Peças com defeito
Fonte: Elaboração do autor (2011).
Continuando, para calcular os limites de controle inferior 
e superior, calculamos a média das médias e a média das 
amplitudes para cada amostra:
 � Média das médias
Média das médias (X) = Soma das médias / m
X = 367,50 / 6 = 61,25
 � Médias das amplitudes
Médias das amplitudes (K) = Soma das amplitudes / m
K = 95 / 6 = 15,83
E, finalmente, construímos uma tabela semelhante à 
seguinte:
probabilidade_e_estatistica_1582.indb 279 19/07/12 11:13
280
Universidade do Sul de Santa Catarina
Tabela 6.7 – Peças com defeito
Fonte: Elaboração do autor (2011).
Todos os valores necessários para calcularmos LIC e LSC estão 
disponíveis:
 � média das médias: X = 61,25;
 � média das amplitudes: K = 15,83;
 � tamanho da amostra: n = 4.
Para calcularmos LIC e LSC:
LIC = X − A2 x K
LSC = X + A2 x K
Observação: o valor de A2 é obtido na tabela no final desta seção.
Para nosso caso, resulta em:
LIC = 61,25 − (0,729 x 15,83) = 49,71
LSC = 61,25 + (0,729 x 15,83) = 72,79
Podemos, para construir o gráfico de controle, construir uma 
tabela semelhante à seguinte: 
probabilidade_e_estatistica_1582.indb 280 19/07/12 11:13
281
Probabilidade e Estatística
Unidade 6
Tabela 6.8 – Média das amostras
Média das 
amostras
LIC LSC Média das 
médias
62,50 49,71 72,79 61,25
60,00 49,71 72,79 61,25
67,50 49,71 72,79 61,25
55,00 49,71 72,79 61,25
60,00 49,71 72,79 61,25
62,50 49,71 72,79 61,25
Fonte: Elaboração do autor (2011).
E, seguindo os mesmos passos do exemplo anterior para 
construir o gráfico, resulta no nosso gráfico de controle X-r:
Gráfico 6.9 – Gráfico de Controle
Fonte: Elaboração do autor (2011).
probabilidade_e_estatistica_1582.indb 281 19/07/12 11:13282
Universidade do Sul de Santa Catarina
Síntese
O processo de amostragem é muito importante e eficaz no dia 
a dia de qualquer profissional. Diariamente, você esbarra com 
situações semelhantes às que foram analisadas nesta unidade, 
tanto nos meios de comunicação, como rádio, TV, jornais etc., 
mas também em escolas, empresas e outras instituições.
É preciso entender que as pesquisas feitas com base em uma 
amostra não culminam com resultados exatos, e poder definir 
a margem de erro ocasionada por essa amostragem é um passo 
muito importante na formação profissional e acadêmica, além de 
possibilitar uma leitura mais realista da realidade.
probabilidade_e_estatistica_1582.indb 282 19/07/12 11:13
283
Probabilidade e Estatística
Unidade 6
Atividades de autoavaliação
1) Uma turma da oitava série realizou avaliação em duas disciplinas, 
Matemática e Biologia; as notas obtidas estão na tabela abaixo. Usando 
estes dados, calcule o que se pede:
Aluno Nota Matemática Nota Biologia X.Y X2 Y2
1 9,5 3,4 32,3 90,3 11,6
2 9,0 5,4 48,6 81,0 29,2
3 8,5 6,0 51,0 72,3 36,0
4 8,0 6,0 48,0 64,0 36,0
5 8,0 5,0 40,0 64,0 25,0
6 7,5 7,0 52,5 56,3 49,0
7 7,5 9,0 67,5 56,3 81,0
8 6,0 7,5 45,0 36,0 56,3
9 5,0 8,0 40,0 25,0 64,0
10 4,0 8,0 32,0 16,0 64,0
Totais 73,0 65,3 456,9 561,0 452,0
a) Calcule o coeficiente de correlação entre as duas variáveis, identifique o 
tipo de correlação e interprete o resultado.
b) Construa uma equação para a relação indicada (a equação da reta de 
regressão) para possibilitar o cálculo de estimativas para a nota de 
Biologia (Y), segundo a nota de Matemática (X).
c) Estime a nota de Biologia considerando que um aluno tenha tirado nota 
6,5 (X) em Matemática. Substitua na equação da reta construída no 
item “b”.
probabilidade_e_estatistica_1582.indb 283 19/07/12 11:13
284
Universidade do Sul de Santa Catarina
Saiba mais
Se quiser aprofundar os estudos relativos ao assunto tratado nessa 
unidade, pesquise em:
BARBETTA, Pedro Alberto. Estatística aplicada às ciências 
sociais. 5. ed. rev. Florianópolis: Ed. UFSC, 2002.
MORETTIN, Luiz Gonzaga. Estatística básica. São Paulo: 
Makron Books, 1999.
TRIOLA, Mario F. Introdução à Estatística. Rio de Janeiro: 
LTC, 1999.
VIEIRA, Sônia. Introdução à bioestatística. 6. ed. Rio de 
Janeiro: Campus, 2000.
probabilidade_e_estatistica_1582.indb 284 19/07/12 11:13
Para concluir o estudo
Muitas vezes nos deparamos com situações em que 
temos que lidar com muitos dados e não sabemos como 
vamos lidar com eles. Esta disciplina é uma tentativa de 
proporcionar ferramentas para os profissionais que lidam 
com esse tipo de situação. 
Desde a apresentação de relatórios e trabalhos científicos 
a pesquisas, controle, testes, projeções e previsões, a 
Estatística está sempre presente. Afinal, no dia a dia, 
lidamos com uma grande quantidade de informações 
e pergunto: De que vale ter tanta informação se não 
sabemos o que fazer com elas? Espera-se que todo o 
conhecimento que você adquiriu nesta disciplina seja 
suporte para as suas análises, opiniões e decisões.
Muito sucesso profissional!
Prof. Luiz Arthur Dornelles Júnior
probabilidade_e_estatistica_1582.indb 285 19/07/12 11:13
probabilidade_e_estatistica_1582.indb 286 19/07/12 11:13
Referências
ACÇÃO LOCAL DE ESTATÍSTICA APLICADA – ALEA. 1999-2010. 
Disponível em: <http://alea-estp.ine.pt>. Acesso em: 15 ago. 2010.
ARANGO, Héctor Gustavo. Bioestatística teórica e 
computacional. Rio de Janeiro: Guanabara, 2001.
ASSOCIAÇÃO NACIONAL DE ENTIDADES PROMOTORAS DE 
EMPREENDIMENTOS INOVADORES - Anprotec. 2008. Disponível 
em: <http://www.anprotec.org.br>. Acesso em: 15 ago. 2010.
BANCO CENTRAL DO BRASIL. 2010. Disponível em: <http://www.
bcb.gov.br/>. Acesso em: 15 ago. 2010.
BARBETTA, Pedro Alberto. Estatística aplicada às ciências 
sociais. 5. ed. rev. Florianópolis: Ed. UFSC, 2002.
COSTA, Sérgio Francisco. Introdução ilustrada à estatística. 3. 
ed. São Paulo: Harbra, 1998.
CRESPO, Antônio Arnot. Estatística fácil. São Paulo: Saraiva, 
2001.
DEPARTAMENTO INTERSINDICAL DE ESTATÍSTICA E ESTUDOS 
SOCIOECONÔMICOS – DIEESE. 2010. Disponível em: <http://www.
dieese.org.br/>. Acesso em: 3 ago. 2010. 
FLEMMING, Diva Marília. Representações gráficas. São José: 
Saint Germain, 2003.
FONSECA, Jairo Simon da; MARTINS, Gilberto de Andrade. Curso 
de estatística. 6. ed. São Paulo: Atlas, 1996.
INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATÍSTICA – IBGE. 
2010. Disponível em: <http://www.ibge.gov.br/>. Acesso em: 3 
set. 2010.
ISTOÈ ONLINE. Florianópolis / SC – Caça ao tucano. 2004. 
Disponível em: <http://www.terra.com.br/istoe/especiais/
eleicoes_2004/1_rodada/florianopolis.htm. Acesso em: 10 ago 
2006.
LEVIN, Jack. Estatística aplicada às ciências humanas. São 
Paulo: Habra, 1987.
MORETTIN, Luiz Gonzaga. Estatística básica. São Paulo: Makron 
Books, 1999
probabilidade_e_estatistica_1582.indb 287 19/07/12 11:13
288
Universidade do Sul de Santa Catarina
NEUFELD, John L. Estatística aplicada à administração usando excel. 
São Paulo: Prentice Hall, 2003.
POPULATION REFERENCE BUREAU. La juventud del mundo 2000. 
Washington DC: Population Reference Bureau, 2000. Disponível em: 
<http://www.prb.org/SpanishContent.aspx>. Acesso em: 3 março 2011.
PORTAL BRASIL. 2010. Disponível em: <http://www.portalbrasil.net/>. 
Acesso em: 3 set. 2010.
RAUEN, Fábio. Roteiro de pesquisa. Rio de Sul: Nova Era, 2006.
SILVA, Ermes Medeiros da. Estatística para os cursos de Economia, 
Administração e Ciências Contábeis. São Paulo: Atlas, 1999.
______. Estatística. São Paulo: Atlas, 1996. v.1.
SINDICATO DA HABITAÇÃO – SECOVI/RS. 2010. Disponível em: <http://
www.secovi-rs.com.br/index.asp>. Acesso em: 10 ago. 2010.
SPIEGEL, M. R. Estatística. São Paulo: Makron Books, 1994.
TOLEDO, Geraldo Luciano; OVALLE, Ivo Izidoro. Estatística básica. 2. ed. 
São Paulo: Atlas, 1985.
TRIBUNAL SUPERIOR ELEITORAL. 2010. Disponível em: <http://www.tse.
gov.br>. Acesso em: 20 set. 2010.
TRIOLA, Mario F. Introdução à Estatística. Rio de Janeiro: LTC, 1999.
VIEIRA, Sônia. Introdução à bioestatística. 6. ed. Rio de Janeiro: Campus, 
2000.
______. Princípios de Estatística. São Paulo: Pioneira, 2003.
WILD, Christopher J. Encontros com o acaso. Rio de Janeiro: LTC, 2004.
probabilidade_e_estatistica_1582.indb 288 19/07/12 11:13
Sobre os professores conteudistas
Luiz Arthur Dornelles Júnior 
Graduado em Matemática pela Fundação Universidade 
do Rio Grande (FURG). É professor da Universidade 
do Sul de Santa Catarina (UNISUL) desde 2000, 
onde leciona as disciplinas de Estatística, Métodos 
Quantitativos e Programação Linear. Atualmente, está 
cursando Especialização em Educação Matemática na 
Unisul Virtual.
Gabriel Cremona Parma (2ª edição) 
Doutor em Engenharia Civil, na área de Gestão 
Territorial pela Universidade Federal de Santa Catarina 
(UFSC). Mestre em Engenharia Civil, na área Cadastro 
Técnico Multifinalitário pela Universidade Federal de 
Santa Catarina (UFSC). Cartógrafo: UNL, Argentina. 
Consultor especializado em Geoprocessamento e 
Controle de Qualidade de Dados Geoespaciais. Atua 
como professor e pesquisador na Universidade do Sul de 
Santa Catarina (UNISUL) nos cursos de Engenharia 
e Arquitetura e Urbanismo, assim como em projetos 
de pesquisa e extensão. Ex-professor na Universidade 
Nacional do Litoral (UNL), na Argentina.
probabilidade_e_estatistica_1582.indb 289 19/07/12 11:13
probabilidade_e_estatistica_1582.indb 290 19/07/12 11:13
Respostas e comentários das 
atividades de autoavaliação
Unidade 1
1) O censo é uma coleção de dados de uma população, 
enquanto que a estimação usa dados de uma amostra para 
avaliar um parâmetro (característica descritiva dos elementos 
da população).
2) Deve-se escolher elementos com as mesmas características 
da população, ou seja, elementos que realmente 
representem a população. Aqui, você pode citar exemplos 
(escolher clientes de níveis sociais diferentes para estudar 
grau de satisfação,escolher amostras de diversos locais 
de um lago para análise etc.). Isso é necessário para que 
você possa realmente refletir a realidade, sem distorcer ou 
conduzir os resultados.
3. Nessa questão, você deve citar exemplos do seu dia a dia, por 
exemplo:
Variável Exemplos
Qualitativa nominal Nacionalidade
Qualitativa ordinal Atendimento (ótimo, muito bom, ... , muito ruim.)
Quantitativa discreta Número de filhos
Quantitativa contínua Escore de teste psicológico
probabilidade_e_estatistica_1582.indb 291 19/07/12 11:13
292
Universidade do Sul de Santa Catarina
4) A classificação que você pode fazer é:
 � os dados coletados por meio de questionário: primários;
 � os dados coletados na Federação: secundários.
5) Observe, no quadro a seguir, a resposta para esta questão.
DESCRIÇÃO DA VARIÁVEL CLASSIFICAÇÃO
Saldo em conta corrente em R$ Quantitativa contínua
Idade do cliente Quantitativa contínua
Sexo do cliente Qualitativa nominal
Classe econômica Qualitativa ordinal
Estado civil Qualitativa nominal
Número de defeitos do produto Quantitativa discreta
Consumo de energia em kWh Quantitativa contínua
Grau de instrução Qualitativa ordinal
Número de filhos Quantitativa discreta
Hierarquia de uma empresa Qualitativa nominal
Número de filhos de uma família Qualitativa nominal
Diâmetro da peça produzida Quantitativa discreta
Comprimento da peça Quantitativa contínua
Tempo de espera em caixa eletrônico em minutos Qualitativa nominal
Nome de país exportador de petróleo Quantitativa contínua
Grau de satisfação no atendimento numa loja comercial Qualitativa nominal
Número de ações negociadas na bolsa de valores Quantitativa contínua
Número de alunos de uma universidade Quantitativa contínua
Altura dos funcionários de uma empresa Qualitativa nominal
6) A classificação que você pode fazer é:
A) série específico-geográfica;
B) série específica.
probabilidade_e_estatistica_1582.indb 292 19/07/12 11:13
293
Probabilidade e Estatística
Unidade 2
1) Montagem da tabela:
Principais motivos de tensão (estresse) Nº de clientes
Morte de um filho 16
Morte do cônjuge 12
Morte dos pais ou irmãos 11
Divórcio 8
Doença grave 7
Demissão 6
2) Montagem da tabela:
Acidentes de trabalho nos últimos 36 meses
Nº de acidentes Número de meses
3 4
4 5
5 9
6 7
7 5
8 6
3) Montagem da tabela:
Renda das famílias de um bairro de classe baixa de Florianópolis
Renda família (R$) Nº de pacientes
112 |---- 115 2
115 |---- 118 6
118 |---- 121 4
121 |---- 124 9
124 |---- 127 8
127 |---- 130 7
probabilidade_e_estatistica_1582.indb 293 19/07/12 11:13
294
Universidade do Sul de Santa Catarina
4) Completando a tabela:
Renda de famílias de um bairro da classe baixa de Florianópolis
Renda 
(R$)
Nº de 
famílias
fiacd 
“abaixo de”
fiaci 
“acima de”
fr fp(%) PM
112 |--- 115 2 2 36 0,0556 5,56 113,5
115 |--- 118 6 8 34 0,1667 16,7 116,5
118 |--- 121 4 12 28 0,1111 11,1 119,5
121 |--- 124 9 21 24 0,25 25 122,5
124 |--- 127 8 29 15 0,2222 22,2 125,5
127 |--- 130 7 36 7 0,1944 19,4 128,5
Total (Σfi) 36 1,0 100,0
Respondendo as perguntas:
a) 21 famílias;
b) 29 famílias;
c) 15 famílias;
d) 7 famílias;
e) 11,1% das famílias;
f) 25% das famílias.
5) Completando a tabela:
Número de operários acidentados para cada mês
Número de 
acidentados
Nº de 
meses
fiacd 
“abaixo de”
fiaci 
“acima de”
fr fp (%)
3 4 4 36 0,1111 11,1
4 5 9 32 0,1389 13,9
5 9 18 27 0,2500 25
6 7 25 18 0,1944 19,4
7 5 30 11 0,1389 13,9
8 6 36 6 0,1667 16,7
Total (Σfi) 36 1,0 100,0
probabilidade_e_estatistica_1582.indb 294 19/07/12 11:13
295
Probabilidade e Estatística
a) 18 meses;
b) 25 meses;
c) 18 meses;
d) 27 meses;
e) 25% dos meses;
f) 13,89% dos meses.
6) Essa atividade vai depender muito do gráfico escolhido e de sua análise. 
Não esqueça de usar as dicas para analisar um gráfico:
 � identificar as variáveis expressas pelo gráfico;
 � identificar os intervalos em que as variáveis atuam;
 � identificar onde a variável que está sendo estudada apresenta 
máximo e mínimo;
 � identificar se a tendência é de crescimento ou de decrescimento. Em 
alguns casos, pode ser bastante difícil realizar essa identificação;
 � analisar o comportamento de uma maneira geral, identificando as 
alterações mais expressivas;
 � outras análises também são possíveis, isso só depende do 
observador e, muitas vezes, da variável que estamos estudando.
7) O histograma e o polígono de frequências deverão ser semelhantes ao 
seguir:
probabilidade_e_estatistica_1582.indb 295 19/07/12 11:13
296
Universidade do Sul de Santa Catarina
Unidade 3
1) Em primeiro lugar, construa a tabela:
Consumo de bebidas alcoólicas por semana pelos funcionários
Número de dias (xi) Número de funcionários (fi) xi.fi
0 10 0
1 16 16
2 14 28
3 8 24
4 5 20
5 4 20
6 4 24
7 3 21
Total (Σfi) 64 153
Em segundo lugar, calcule a média, dividindo a soma da coluna xi.fi, 
pela soma da coluna fi. O resultado é a média:
Interpretação: o número médio de dias de consumo de álcool pelos 
funcionários é de 2,39 dias.
2) Usando um processo semelhante ao anterior, em primeiro lugar, você 
deve calcular o ponto médio. Em seguida, multiplicar o ponto médio 
pela fi de cada linha e escrever o resultado na coluna PM.fi. Some esses 
números no final da coluna, conforme a tabela.
Renda de famílias de um bairro de classe baixa de Florianópolis
Renda (R$) Número de famílias PM PM.fi
112 |---- 115 2 113,5 227
115 |---- 118 6 116,5 699
118 |---- 121 4 119,5 478
121 |---- 124 9 122,5 1102,5
124 |---- 127 8 125,5 1004
127 |---- 130 7 128,5 899,5
Total (Σfi) 36 4410
probabilidade_e_estatistica_1582.indb 296 19/07/12 11:13
297
Probabilidade e Estatística
Em segundo lugar, divida o resultado da soma (ΣPM.fi) pelo soma dos 
números da coluna fi:
Interpretação: o nível da renda familiar é de 122,5 reais
3) 
a) Conjunto 1
Primeiro passo: escrever, na tabela, os dados organizados em ordem 
crescente (Rol) e, na linha de baixo, as posições:
12 13 13 15 15 16 17 19 21
1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª 9ª
Segundo passo: calcular a posição, levando em consideração que a 
série tem 9 elementos, sendo, assim, ímpar:
Terceiro passo: encontrar, na tabela p, o elemento que ocupa a 5ª 
posição:
12 13 13 15 15 16 17 19 21
1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª 9ª
Me = 15 – o tempo de internação mediano é de 15 dias.
Interpretação: 50% dos valores observados são menores ou iguais a 
15, e 50% dos valores observados são maiores ou iguais a 15.
b) Conjunto 2
Primeiro passo: escrever, na tabela, os dados organizados em ordem 
crescente (Rol) e, na linha de baixo, as posições:
14 14 15 15 16 16 17 18
1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª
Segundo passo: calcular a posição, levando em consideração que a 
série tem 8 elementos, sendo, assim, par:
probabilidade_e_estatistica_1582.indb 297 19/07/12 11:13
298
Universidade do Sul de Santa Catarina
A mediana ocupa uma posição entre a 4ª e a 5ª posições.
Terceiro passo: encontrar na tabela os elementos que ocupam as 
posições 4ª e 5ª:
14 14 15 15 Me 16 16 17 18
1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª
Elemento da 4ª posição = 15;
Elemento da 5ª posição = 16.
Quarto passo: calcular a media:
Me = 15,5. 
Interpretação: 50% dos valores observados são menores ou iguais a 
15,5 e 50% dos valores observados são maiores ou iguais a 15,5.
4) 
a) Conjunto 1
 � Organizando os dados:
1 1 1 1 2 2 2 2 3
5 5 6 6 7 7 7 8 8
A série tem duas modas: Mo1 = 1 e Mo2 = 2.
Interpretação moda 1: O valor mais frequente é 1.
Interpretação moda 2: O valor mais frequente é 2.
b) Conjunto 2
 � Organizando os dados:
2 2 2 3 3 3 3 5
5 5 5 6 6 6 8 8
A série tem duas modas: Mo1 = 3 e Mo2 = 5.
Interpretação moda 1: O valor mais frequente é 3.
Interpretação moda 2: O valor mais frequente é 5.
probabilidade_e_estatistica_1582.indb 298 19/07/12 11:13
299
Probabilidade e Estatística
c) Conjunto 3
 � Organizando os dados:
1 1 2 2 3 3 4 4
5 5 6 6 7 7 8 8
A série não tem moda, pois não tem nenhum dado que se repitamais 
que os outros
Interpretação moda: é uma série amodal, ou seja, não tem valor(es) 
mais frequente.
5) Primeiro passo: escrever, na tabela, os dados organizados em ordem 
crescente (Rol) e, na linha de baixo, as posições:
2 3 4 4 4 5 5 6 8 8 9 9
1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª 9ª 10ª 11ª 12ª
 � Para o terceiro quartil
Segundo passo: calcular a posição. Considerando N = 12:
Ou seja, Q3 está entre a 9ª e a 10ª posições.
Terceiro passo: calcular o terceiro quartil.
Valor que ocupa a 9ª posição = 8;
Valor que ocupa a 10ª posição = 8.
Então, calcule da seguinte forma:
Interpretação:
75% dos dados observados são menores ou iguais a 8, e 25% dos dados 
observados são maiores ou iguais a 8.
 � Para o nono decil (note que D9 = P90)
Quarto passo: calcular a posição. Considerando N = 12:
Ou seja, D9 está entre a 11ª e a 12ª posições.
probabilidade_e_estatistica_1582.indb 299 19/07/12 11:13
300
Universidade do Sul de Santa Catarina
Quinto passo: calcular o nono decil.
Valor que ocupa a 11ª posição = 9;
Valor que ocupa a 12ª posição = 9.
Então, calcule da seguinte forma:
Interpretação:
90% dos dados observados são menores ou iguais a 9, e 10% dos dados 
observados são maiores ou iguais a 9.
 � Para o trigésimo quinto percentil
Sexto passo: calcular a posição. Considerando N = 12:
Ou seja, P35 está entre a 4ª e a 5ª posições.
Sétimo passo: calcular o trigésimo quinto percentil.
Valor que ocupa a 4ª posição = 4;
Valor que ocupa a 5ª posição = 4.
Então, calcule da seguinte forma:
Interpretação:
35% dos dados observados são menores ou iguais a 4, e 65% dos dados 
observados são maiores ou iguais a 4.
6) Nessa questão, você pode seguir os seguintes passos:
Passo 1: calcular a média:
Obs.: não esqueça que, na média, usamos a letra grega μ para a 
população.
probabilidade_e_estatistica_1582.indb 300 19/07/12 11:13
301
Probabilidade e Estatística
Passo 2: calcular os desvios (xi – ):
(x1 – ) = (25 − 28,33)= −3,33
(x2 – ) = (22 − 28,33) = −6,33
(x3 – ) = (36 − 28,33) = 7,67
(x4 – ) = (20 − 28,33) = −8,33
(x5 – ) = (29 − 28,33) = 0,67
(x6 – ) = (38 − 28,33) = 9,67
Passo 3: elevar ao quadrado cada desvio (xi – )2:
(x1 – )2 = (−3,33) 2 = 11,0889
(x2 – )2 = (−6,33) 2 = 40,0689
(x3 – )2 = (7,67) 2 = 58,8289
(x4 – )2 = (−8,33) 2 = 69,3889
(x5 – )2 = (0,67) 2 = 0,4489
(x6 – )2 = (9,67) 2 = 93,5089
Somando todos os resultados, temos 273,3334.
Passo 4: calcular a média dos quadrados dos desvios. Aqui, você vai 
calcular para a população (variância):
Variância:
Então σ2(x) = 45,5556
Passo 5: calcular o desvio padrão calculando a raiz da variância:
Desvio padrão:
Interpretação: a variabilidade de tempo de execução do teste é de 
6,7495 minutos.
probabilidade_e_estatistica_1582.indb 301 19/07/12 11:13
302
Universidade do Sul de Santa Catarina
7) O modo de calcular é o mesmo da questão anterior, só muda no final, 
ao calcular a variância, usamos a fórmula para amostra. 
Passo 1: calcular a média:
Obs.: não esqueça que, na média, usamos a xˉ para a amostra.
Passo 2: calcular os desvios (xi – ):
(x1 – ) = (15 – 17,6) = –2,6
(x2 – ) = (10 – 17,6) = –7,6
(x3 – ) = (9 – 17,6) = –8,6
(x4 – ) = (23 – 17,6) = 5,4
(x5 – ) = (31 – 17,6) = 13,4
Passo 3: elevar ao quadrado cada desvio (xi – )2:
(x1 – )2 = (–2,6)2 = 6,76
(x2 – )2 = (–7,6)2 = 57,76
(x3 – )2 = (–8,6) 2 = 73,96
(x4 – )2 = (5,4) 2 = 29,16
(x5 – )2 = (13,4) 2 = 179,56 
Somando todos os resultados, temos 347,2.
Passo 4: calcular a média dos quadrados dos desvios. Aqui, você vai 
calcular para a amostra (variância):
Variância:
Então, s2 (x) = 86,8.
Passo 5: calcular o desvio padrão calculando a raiz da variância:
Desvio padrão:
Interpretação: a variabilidade dos escores é de 9,32 pontos.
probabilidade_e_estatistica_1582.indb 302 19/07/12 11:13
303
Probabilidade e Estatística
8) O primeiro passo é calcular a média:
No de dias
(xi)
No de func.
(fi) xi.fi (xi – x̄) (xi – x̄)
2 (xi – x̄)
2. fi
0 10 0 –2,39 5,71 57,1
1 16 16 –1,39 1,93 30,88
2 14 28 –0,39 0,15 2,1
3 8 24 0,61 0,37 2,96
4 5 20 1,61 2,59 12,95
5 4 20 2,61 6,81 27,24
6 4 24 3,61 13,03 52,12
7 3 21 4,61 21,25 63,75
Σ 64 153 249,1
1–2,39 = –1,39
0–2,39 = –2,39
(–2,39)2 = 5,71
(–1,39)2 = 1,93
5,71×10 = 57,1
1,93×16 = 30,88
Σfi Σxi.fi
Σ(xi – x̄)
2. fi
Vamos calcular passo a passo
Passo 1: devemos somar a coluna das frequências simples (fi) para 
obter Σfi (frequência total):
Σfi = 64
Passo 2: calcular a média: multiplicar cada xi por sua correspondente fi 
e escrever na coluna xi.fi; somar os valores calculados e escrever no final 
da coluna esse resultado, que é o Σxi.fi:
Σxi.fi = 153
Passo 3: dividir o resultado do passo 2 (Σxi.fi) pelo resultado do 
passo 1 (Σfi):
Passo 4: calcular a quarta coluna, (xi – ) subtraindo o xi de cada linha 
pela média:
0 – 2,39 = –2,39
1 – 2,39 = –1,39
2 – 2,39 = –0,39
3 – 2,39 = 0,61
4 – 2,39 = 1,61
5 – 2,39 = 2,61
6 – 2,39 = 3,61
7 – 2,39 = 4,61
probabilidade_e_estatistica_1582.indb 303 19/07/12 11:13
304
Universidade do Sul de Santa Catarina
Passo 5: calcular a quinta coluna elevando os valores da quarta ao 
quadrado, (xi – )2:
(–2,39)2 = 5,71
(–1,39) 2 = 1,93
(–0,39) 2 = 0,15
(0,61) 2 = 0,37
(1,61) 2 = 2,59
(2,61) 2 = 6,81
(3,61) 2 = 13,03
(4,61) 2 = 21,25
Passo 6: calcular a sexta coluna multiplicando os valores da quinta pela 
frequência simples de cada linha, (xi – )2.fi:
5,71×10 = 57,1
1,93×16 = 30,88
0,15×14 = 2,1
0,37×8 = 2,96
2,59×5 = 12,95
6,81×4 = 27,24
13,03×4 = 52,12
21,25×3 = 63,75
Passo 7: somar os valores obtidos na sexta coluna, Σ(xi – )2.fi:
Σ(xi – )2.fi = 249,1
Passo 8: calcular a variância para a amostra:
Passo 9: calcular o desvio padrão:
probabilidade_e_estatistica_1582.indb 304 19/07/12 11:13
305
Probabilidade e Estatística
9) Mais uma vez, vamos calcular passo a passo. Comparando com a anterior, 
a diferença está em que aquela era para amostra, enquanto que essa é 
para a população. Sugestão: use as colunas para facilitar os cálculos.
Idade dos estudantes da disciplina de métodos estatísticos
Idade (xi) N
o de est.
(fi)
xi.fi (xi – μ) (xi – μ)
2 (xi – μ)
2. fi
17 5 85 -1,873 3,508 17,54
18 20 360 -0,873 0,762 15,24
19 22 418 0,127 0,016 0,352
20 10 200 1,127 1,27 12,7
21 6 126 2,127 4,524 27,144
(Σfi) 63 1189 72,976
18 – 18,873 = –0,873
17 – 18,873 = –1,873
(–1,873)2 = 3,508
(–0,873)2 = 0,762
3,508×5 = 17,54
0,762×20 = 15,24
Σfi Σxi.fi
Σ(xi – x̄)
2. fi
Passo 1: devemos somar a coluna das frequências simples (fi) para 
obter Σfi (frequência total):
Σfi = 63
Passo 2: calcular a média: multiplicar cada xi por sua correspondente fi 
e escrever na coluna xi.fi; somar os valores calculados e escrever no final 
da coluna esse resultado, que é o Σxi.fi:
Σxi.fi = 1189
Passo 3: dividir o resultado do passo 2 (Σxi.fi) pelo resultado do 
passo 1 (Σfi):
Passo 4: calcular a quarta coluna, (xi – μ) subtraindo o xi de cada linha 
pela média:
17 – 18,873 = –1,873
18 – 18,873 = –0,873
19 – 18,873 = 0,127
20 – 18,873 = 1,127
21 – 18,873 = 2,127
probabilidade_e_estatistica_1582.indb 305 19/07/12 11:13
306
Universidade do Sul de Santa Catarina
Passo 5: calcular a quinta coluna, elevando os valores da quarta ao 
quadrado, (xi - μ)
2:
(–1,873)2 = 3,508
(–0,873)2 = 0,762
(0,127) 2 = 0,016
(1,127) 2 = 1,27
(2,127) 2 = 4,524
Passo 6: calcular a sexta coluna, multiplicando os valores da quinta 
pela freqüência simples de cada linha, (xi – μ)
2.fi:
3,508×17 = 17,54
0,762×18 = 15,24
0,016×19 = 0,352
1,27×20 = 12,7
4,524×21 = 27,144
Passo 7: somar os valores obtidos na sexta coluna, Σ(xi – μ)
2.fi:
Σ(xi – μ)
2.fi = 72,976
Passo 8: calcular a variância para a amostra:
Passo 9: calcular o desvio padrão:
probabilidade_e_estatistica_1582.indb 306 19/07/12 11:13
307
Probabilidade e Estatística
10) Quando você tiver que calcular o desvio padrão para uma tabela com 
intervalos, usamos o mesmo processo, apenas substituindo o xi pelo 
ponto médio:Renda de família de um bairro de classe baixa de Florianópolis
Renda (R$)
No de 
famílias 
(fi)
PMi PMi.fi (PMi – x̄) (PMi – x̄)
2 (PMi – x̄)
2. fi
112 |---- 115 2 113,5 227 -9 81 162
115 |---- 118 6 116,5 699 -6 36 216
118 |---- 121 4 119,5 478 -3 9 36
121 |---- 124 9 122,5 1102,5 0 0 0
124 |---- 127 8 125,5 1004 3 9 72
127 |---- 130 7 128,5 899,5 6 36 252
Total (Σfi) 36 4410 738
116,5 – 122,5 = –9
113,5 – 122,5 = –6
(–9)2 = 81
(–6)2 = 36
81×2 = 162
36×6 = 216
Σfi ΣPMi.fi
Σ(PMi – x̄)
2. fi
Vamos calcular passo a passo
Passo 1: somar a coluna das frequências simples (fi) para obter Σfi 
(frequência total):
Σfi = 36
Passo 2: cálculo da média: calcular o ponto médio de cada intervalo 
e multiplicar cada PM por sua correspondente fi e escrever na coluna 
PM.fi, somar os valores calculados nessa coluna e escrever o total. Esse 
resultado é o ΣPM.fi:
ΣPM.fi = 4410
Passo 3: dividir o resultado (ΣPM.fi) pelo resultado do Passo 1 (Σfi):
Passo 4: calcular a quinta coluna, (PMi – ¯ ) subtraindo o PMi de cada 
linha pela média:
113,5 – 122,5 = –9
116,5 – 122,5 = –6
119,5 – 122,5 = –3
122,5 – 122,5 = 0
125,5 – 122,5 = 3
128,5 – 122,5 = 6
probabilidade_e_estatistica_1582.indb 307 19/07/12 11:13
308
Universidade do Sul de Santa Catarina
Passo 5: calcular a sexta coluna, elevando os valores da quinta ao 
quadrado, (PMi – )
2:
(–9)2 = 81
(–6)2 = 36
(–3)2 = 9
(0)2 = 0
(3)2 = 9
(6)2 = 36
Passo 6: calcular a sétima coluna, multiplicando os valores da sexta 
pela frequência simples de cada linha, (PMi – )
2.fi:
81×2 = 162
36×6 = 216
9×4 = 36
0×9 = 0
9×8 = 72
36×7 = 252
Passo 7: somar os valores obtidos na sexta coluna, Σ(PMi – )
2.fi:
Σ(PMi – )
2.fi = 738
Passo 8: calcular a variância:
Passo 9: calcular o desvio padrão:
11)
11.1)
a) A mais dispersa em termos absolutos é a série B (maior desvio padrão).
probabilidade_e_estatistica_1582.indb 308 19/07/12 11:13
309
Probabilidade e Estatística
b) Você tem que calcular o coeficiente de variação.
 � Para a série A:
 � Para a série B:
A série com maior dispersão relativa é a série A (maior coeficiente de 
variação).
c) Concluindo, a série mais dispersa é a série A.
11.2)
a) A mais dispersa em termos absolutos é a série B (maior desvio padrão).
b) Você tem que calcular o coeficiente de variação.
 � Para a série A:
 � Para a série B:
As duas séries apresentam o mesmo valor para os coeficientes de 
variação.
c) Concluindo, as duas séries apresentam a mesma dispersão.
11.3)
a) Em termos absolutos, as duas séries apresentam a mesma dispersão 
(desvios iguais).
b) Você tem que calcular o coeficiente de variação.
 � Para a série A:
probabilidade_e_estatistica_1582.indb 309 19/07/12 11:13
310
Universidade do Sul de Santa Catarina
 � Para a série B:
A série com maior dispersão relativa é a série B (maior coeficiente de 
variação).
c) Concluindo, a série mais dispersa é a série B.
11.4)
a) A mais dispersa em termos absolutos é a série A (maior desvio padrão).
b) Você tem que calcular o coeficiente de variação.
 � Para a série A:
 � Para a série B:
A série com maior dispersão relativa é a série B (maior coeficiente de 
variação).
c) Concluindo, a série mais dispersa é a série B.
probabilidade_e_estatistica_1582.indb 310 19/07/12 11:13
311
Probabilidade e Estatística
12) Passo 1: abra uma nova planilha Excel e, na célula A1, escreva: gráfico 
box-plot, digite todos os números dos dados na coluna A de uma nova 
planilha do Excel, a partir da fila 2 e, no intervalo C3:C8, escreva os 
textos indicados na figura seguinte:
Passo 2: agora, vamos calcular a mediana, quartis, máximos e mínimos 
usando as fórmulas do Excel. Para isso, digite as seguintes fórmulas:
 � Em D4: =MED(A2:A21) para calcular a mediana do intervalo de dados 
A2:A21.
 � Em D5: =QUARTIL(A2:A21;1) para calcular o 1° quartil dos dados.
 � Em D6: =MÍNIMO(A2:A21) para calcular o mínimo valor do conjunto 
de dados;
 � Em D7: =MÁXIMO(A2:A21) para calcular o máximo dos dados.
 � Em D8: =QUARTIL(A2:A21;3) para calcular o 3° quartil da 
amostragem.
probabilidade_e_estatistica_1582.indb 311 19/07/12 11:13
312
Universidade do Sul de Santa Catarina
O resultado será:
Passo 3: crie o gráfico, acompanhando o exemplo desenvolvido na 
teoria desta seção, até obter o gráfico box-plot dos dados, semelhante 
ao seguinte:
-
probabilidade_e_estatistica_1582.indb 312 19/07/12 11:13
313
Probabilidade e Estatística
Unidade 4
1) 
Passo 1: para começar, você deve identificar o evento e o espaço 
amostral:
A: jovens sofriam com o autoritarismo dos pais
S: adolescentes
Passo 2: identificar o número de elementos do evento e do espaço 
amostral:
n(A) = 675
n(S) = 1500
Passo 3: calcular usando a fórmula:
 0,45 ou 45%
2)
Passo 1: Para começar, você deve identificar os eventos e o espaço 
amostral:
A: casado(a)
B: solteiro(a)
C: divorciado(a)
S: total pesquisado
Passo 2: identificar o número de elementos dos eventos e do espaço 
amostral:
n(A) = 267.867
n(B) = 333.974
n(C) = 16.779
n(S) = 665.541
Passo 3: calcular usando a fórmula:
 
0,4025 ou 40,25%
probabilidade_e_estatistica_1582.indb 313 19/07/12 11:13
314
Universidade do Sul de Santa Catarina
 
0,5018 ou 50,18%
 0,0252 ou 2,52%
3) 
a) Qual a frequência relativa para o número de reações positivas para cada 
cobaia?
Passo 1: identificar o numerador e o denominador da fórmula, para 
cada experimento.
 � Cobaia 1: 
Número de reações positivas = 1215;
número total de tentativas = 4500.
 � Cobaia 2: 
Número de reações positivas = 1050;
número total de tentativas = 3500.
Passo 2: usar a fórmula da freqüência relativa.
FrA = número de vezes que ocorreu A
número total de observações
FrA =
1215
0,27 ou 27%
4500
FrB = número de vezes que ocorreu B
número total de observações
FrB = 1050 0,3 ou 30%
3500
b) Desafio: qual dos dois estímulos você considera mais eficaz? Por quê?
O estímulo por alimentação, pois a cobaia 2, em termos relativos, 
apresentou melhor resposta. Embora o número de reações da cobaia 
1 tenha sido maior comparando com o total (frequência relativa), a 
reação é menor.
probabilidade_e_estatistica_1582.indb 314 19/07/12 11:13
315
Probabilidade e Estatística
4)
a) Calcule Z (variável padronizada) para x = 116, x = 136, para x = 131 e 
para x = 141 pontos;
Passo 1: identificar todos os elementos que compõe o problema:
a média: μ = 126;
o desvio padrão: σ(x) = 10;
os limites do intervalo: X = 116; X = 136; X = 131; X = 141.
Passo 2: calcular a variável padronizada Z:
 � Para X = 116:
Z = −1
 � Para X = 136:
Z = 1
 � Para X = 131:
Z = 0,5
 � Para X = 141:
Z = 1,5
probabilidade_e_estatistica_1582.indb 315 19/07/12 11:13
316
Universidade do Sul de Santa Catarina
b) Qual a probabilidade de escolher uma pessoa com escore maior que 
136 pontos?
Passo 1: identificar, no gráfico, o intervalo e a área que você deve 
calcular (usar o z calculado no item anterior, para x = 136, o z = 1):
Passo 2: procurar na tabela a área correspondente a z = 1 (não esqueça, 
a área dada na tabela é sempre entre 0 e z):
Z = 1 → Área = 0,3413
Passo 3: calcular a probabilidade.
A área dada na tabela é de 0 a Z (0,3413), mas o intervalo solicitado é de 
136 para cima. Nesse caso, você deve subtrair de 0,5 (total de área de 
um lado da curva) o valor encontrado (0,3413), então:
P(x > 136) = 0,5 – 0,3413 = 0,1587 ou 15,87%
c) Qual a probabilidade de escolher uma pessoa com escore entre 126 e 
131 pontos? Note que 126 é a média. Esse fica mais fácil.
Passo 1: identificar, no gráfico, o intervalo e a área que você deve 
calcular (usar o z calculado no item anterior, para x = 131, o z = 0,5):
probabilidade_e_estatistica_1582.indb 316 19/07/12 11:13
317
Probabilidade e Estatística
Passo 2: procurar na tabela a área correspondente à z = 0,5 (não 
esqueça, a área dada na tabela é sempre entre 0 e z)
Z = 0,5 → Área = 0,1915
Passo 3: calcular a probabilidade.
A área dada na tabela é de 0 a Z (0,1915),e o intervalo solicitado é entre 
0 e Z, então, você já tem o resultado:
P(126 < x < 131) = 0,1915 ou 19,15%
d) Qual a probabilidade de escolher uma pessoa com escore entre 116 e 
141 pontos?
Passo 1: identificar no gráfico o intervalo e a área que você deve 
calcular (usar os valores de z calculados no item anterior, para x=116, o 
z=-1 e para x=141, o z=1,5):
Passo 2: procurar, na tabela, a área correspondente à z1 = –1 e z2 = 1,5 
(não esqueça, a área dada na tabela é sempre entre 0 e z):
Z1 = –1 → Área = 0,3413 (não esqueça que a curva é simétrica, e o sinal 
só indica de que lado está a área).
Z2 = 1,5 → Área = 0, 4332
Passo 3: calcular a probabilidade. 
A área solicitada é a soma das duas áreas, a correspondente à Z1 (0,3413) 
e a correspondente à Z2 (0,4332), então: 
P(116 < x < 141) = 0,3413 + 0,4332 = 0,7745 ou 77,45%
probabilidade_e_estatistica_1582.indb 317 19/07/12 11:13
318
Universidade do Sul de Santa Catarina
Unidade 5
1) 
a) Estudo socioeconômico com estudantes da Unisul.
Passo 1: identificar os elementos da fórmula:
n0 = tamanho aproximado da amostra;
E = erro amostral tolerável = 0,03;
N = tamanho da população = 5600.
Passo 2: usar a fórmula:
n0 = 1111,11 → arredondando, temos 1111 pessoas.
Um tamanho aproximado para a amostra seria de 1111 pessoas. Observe 
que o pesquisador teve acesso à informação de que a população seria de 
5600 pessoas, então você deve passar para o passo seguinte:
Passo 3: calcular o tamanho da amostra usando a população com a 
seguinte fórmula:
Arredondando, seriam 927 pessoas.
b) Estudo com famílias do bairro Rio Vermelho, em Florianópolis.
Passo 1: identificar os elementos da fórmula:
n0 = tamanho aproximado da amostra;
E = erro amostral tolerável = 0,04;
N = tamanho da população = 9400.
Passo 2: usar a fórmula:
n0 = 625 crianças.
Um tamanho aproximado para a amostra seria de 625 crianças. Observe 
que o pesquisador teve acesso à informação de que a população seria 
de 9400 crianças, então você deve passar para o passo seguinte:
probabilidade_e_estatistica_1582.indb 318 19/07/12 11:13
319
Probabilidade e Estatística
Passo 3: calcular o tamanho da amostra usando a população com a 
seguinte fórmula:
Arredondando, seriam 586 crianças.
c) Estudo com adolescentes com Teste de Sondagem Intelectual (TSI).
Passo 1: identificar os elementos da fórmula:
n0 = tamanho aproximado da amostra;
E = erro amostral tolerável = 0,05;
N = tamanho da população = 400.
Passo 2: usar a fórmula:
n0 = 400 adolescentes.
Um tamanho aproximado para a amostra seria de 400 adolescentes. 
Observe que o pesquisador teve acesso à informação de que a 
população seria de 400 adolescentes, então você deve passar para o 
passo seguinte:
Passo 3: calcular o tamanho da amostra usando a população com a 
seguinte fórmula:
Seriam 200 adolescentes.
Você pode resolver os outros itens da mesma maneira que os três já 
calculados, o processo é o mesmo. As respostas estão abaixo:
d) Estudo da fecundidade na cidade de Florianópolis.
n0 = 278.
n = 277.
e) Estudo com usuários de drogas adolescentes de uma escola.
n0 = 123.
n = 83.
f) Estudo sobre analfabetismo no bairro do Rio Tavares, em Florianópolis.
n0 = 123.
probabilidade_e_estatistica_1582.indb 319 19/07/12 11:13
320
Universidade do Sul de Santa Catarina
n = 118.
g) Estudo do índice de massa corporal dos estudantes da Unisul.
n0 = 400.
n = 364.
h) Pesquisa de intenções de voto no Brasil.
n0 = 2500.
n = 2500.
2)
Passo 1: Como já foi indicado o percentual de eleitores que votam no 
candidato, só falta calcular o percentual dos eleitores que não votam no 
candidato ( ).
Você pode deixar na forma decimal, pois, para calcular o erro, é usado 
desta forma.
Passo 2: Calcular e procurar o z na tabela (o z é igual ao encontrado no 
exemplo 2, no final da seção 1).
Dividir o NC por dois. Para isto, sempre usar o valor do nível de 
confiança na forma decimal, ou seja, dividir por 100:
Passo 3: procurar este valor na tabela e encontrar o z correspondente. 
Este valor é referente à área entre zero e z, então ele está localizado na 
região central da tabela. Veja a figura a seguir:
probabilidade_e_estatistica_1582.indb 320 19/07/12 11:13
321
Probabilidade e Estatística
Encontrando a área, é só seguir a coluna na qual o valor se encontra até 
a primeira linha. Note que o valor se encontra entre 0,4495 e 0,4505 e, 
sendo assim, na primeira linha, você deve usar o valor entre 0,04 e 0,05 
como se fosse um ponto médio ficando, assim, 0,045. Seguindo a linha 
até a primeira coluna, você encontra o valor 1,6. Juntando ou somando 
os dois, você encontra o valor 1,645 para z, ou seja, z = 1,645.
Passo 4: discriminar cada elemento da fórmula de cálculo do erro e 
calcular o
Em que:
e = erro da estimativa;
z = 1,645 (calculado e encontrado no passo 2); 
 = 26,4% ou (percentual da amostra de eleitores que 
votam no candidato);
probabilidade_e_estatistica_1582.indb 321 19/07/12 11:13
322
Universidade do Sul de Santa Catarina
 (percentual da amostra dos eleitores que não 
votam no candidato);
n = 700 (tamanho da amostra).
Cálculo do erro:
 = 1,645.
 
Passo 5: calcular o intervalo da estimativa:
Neste passo, o cálculo pode ser na forma percentual ou decimal.
P(0,2366 < p < 0,2914) = 0,90 ou
P(23,66 < p < 29,14) = 90%
3)
Passo 1: como não foi indicado o percentual de professores da amostra 
que tem graduação completa, você deve, em primeiro lugar, calcular 
este percentual:
n = 300 (tamanho da amostra);
X = 240 (número de professores com graduação);
Cálculo do percentual:
 = 1 – 0,8 = 0,2
Você pode deixar na forma decimal, pois, para calcular o erro, é usado 
desta forma.
Passo 2: calcular e procurar o z na tabela.
Dividir o NC por dois. Para isto, sempre usar o valor do nível de 
confiança na forma decimal, ou seja, dividir por 100:
probabilidade_e_estatistica_1582.indb 322 19/07/12 11:13
323
Probabilidade e Estatística
Passo 3: procurar este valor na tabela e encontrar o z correspondente. 
Este valor é referente à área entre zero e z, então ele está localizado na 
região central da tabela. Veja a figura abaixo:
Encontrando a área, é só seguir a coluna na qual o valor se encontra 
até a primeira linha; encontrando o número 0,06 é só seguir a linha até 
a primeira coluna, encontrando o valor 1,9. Juntando ou somando os 
dois, você encontra o valor 1,96 para z, ou seja, z = 1,96.
Passo 4: discriminar cada elemento da fórmula de cálculo do erro e 
calcular o mesmo:
Em que:
e = erro da estimativa;
z = 1,96 (calculado e encontrado no passo 2); 
 = 80% ou (percentual da amostra de eleitores que votam 
no candidato);
 = 1 – 0,8 = 0,2 (percentual da amostra dos eleitores que não votam no 
candidato);
n = 300 (tamanho da amostra).
probabilidade_e_estatistica_1582.indb 323 19/07/12 11:13
324
Universidade do Sul de Santa Catarina
Cálculo do erro:
 
= 1,96.
Passo 5: calcular o intervalo da estimativa:
P(0,7547 < p < 0,8452) = 0,95 ou
P(75,47 < p < 84,52) = 95%
4)
Passo 1: calcular e procurar o z na tabela (o z é igual ao encontrado no 
exemplo 1, no final da seção 1).
Dividir o NC por dois. Para isto, sempre usar o valor do nível de 
confiança na forma decimal, ou seja, dividir por 100:
Passo 2: procurar este valor na tabela e encontrar o z correspondente. 
Este valor é referente à área entre zero e z, então ele está localizado na 
região central da tabela. Veja a figura a seguir:
probabilidade_e_estatistica_1582.indb 324 19/07/12 11:13
325
Probabilidade e Estatística
Encontrando a área, é só seguir a coluna na qual o valor se encontra até 
a primeira linha; encontrando o número 0,06, deve-se seguir a linha até 
a primeira coluna e encontrar o valor 1,9. Juntando ou somando os dois, 
você encontra o valor 1,96 para z, ou seja, z=1,96.
Passo 5: discriminar cada elemento da fórmula de cálculo do erro e 
calculá-lo:
Em que:
e = o que você quer calcular (erro da estimativa);
z = 1,96 (calculado e encontradono passo 2);
S(x) = 3,4 (desvio padrão da amostra); 
n = 250 (tamanho da amostra).
Cálculo do erro:
Observação importante: não é necessário multiplicar por 100, pois 
este resultado não indica percentual, neste caso, ele indica quilos!
Passo 4: calcular o intervalo da estimativa:
probabilidade_e_estatistica_1582.indb 325 19/07/12 11:13
326
Universidade do Sul de Santa Catarina
5) Passo 1: calcular e procurar o z na tabela (o z é igual ao encontrado no 
exemplo 1, no final da seção 1).
Dividir o NC por dois. Para isto, sempre usar o valor do nível de 
confiança na forma decimal, ou seja, dividir por 100:
Passo 2: procurar este valor na tabela e encontrar o z correspondente. 
Este valor é referente à área entre zero e z, então ele está localizado na 
região central da tabela. Veja a seguinte figura:
Encontrando a área, é só seguir a coluna na qual o valor se encontra até 
a primeira linha; encontrando o número 0,06, deve-se seguir a linha até 
a primeira coluna, encontrando o valor 1,9. Juntando ou somando os 
dois, você encontra o valor 1,96 para z, ou seja, z=2,33.
Passo 3: discriminar cada elemento da fórmula de cálculo do erro e 
calculá-lo:
Em que:
e = o que você quer calcular (erro da estimativa);
z = 2,33 (calculado e encontrado no passo 2);
probabilidade_e_estatistica_1582.indb 326 19/07/12 11:13
327
Probabilidade e Estatística
S(x) = 31,4 (desvio padrão da amostra);
n = 1000 (tamanho da amostra).
Cálculo do erro:
Observação importante: não é necessário multiplicar por 100, pois 
este resultado não indica percentual, neste caso indica reais!
Passo 4: calcular o intervalo da estimativa:
P(147,6791 < μ < 152,3209) = 0,98
6) 
Passo 1:
Cálculo dos graus de liberdade para definição do ponto crítico (PC):
GLn = 3 – 1 = 2 (graus de liberdade do numerador, 3 máquinas = K);
GLm = 18 – 3 = 15 (graus de liberdade do denominador, 18 = 5 peças na 
máquina 1 + 7 peças da máquina 2 + 6 peças da máquina 3 = N).
Agora, procurando na tabela de F para 5% de nível de significância, 
entrando na coluna da esquerda com GLm = 15 e na fila superior com 
GLn=4, resulta: F (5%,2,15) = 3,68 = PC
probabilidade_e_estatistica_1582.indb 327 19/07/12 11:13
328
Universidade do Sul de Santa Catarina
E, para as amostras recolhidas, tem-se que:
E o valor observado de F resulta em:
Então, ao nível de significância de 0.05 (95% de nível de confiança), 
rejeita-se a hipótese H de igualdade de médias de produção, pois o valor 
observado da estatística de teste F é maior que o ponto crítico PC = 
10,9174.
probabilidade_e_estatistica_1582.indb 328 19/07/12 11:13
329
Probabilidade e Estatística
Há, portanto, evidência estatística de que as três máquinas não são 
iguais relativamente ao volume médio de produção.
Em outras palavras: a marca da máquina influencia significativamente a 
quantidade de peças fabricada por ela.
A tabela ANOVA resulta nos seguintes valores:
Unidade 6
1)
a) Passo 1: como as colunas já estão calculadas, você pode começar 
identificando os elementos da fórmula:
n =10 (número de alunos);
∑x = 73;
∑y = 65,3;
∑x.y = 456,9;
∑x2 = 561;
∑y2 = 456,9;
probabilidade_e_estatistica_1582.indb 329 19/07/12 11:13
330
Universidade do Sul de Santa Catarina
Passo 2: calcule o coeficiente de correlação utilizando a fórmula vista 
no passo anterior:
rxy = –0,73842
Passo 3: analisando o resultado, você pode classificar e interpretar 
contextualizando-o na situação descrita.
Classificação: a correlação entre as notas de Matemática e Biologia 
pode ser classificada como negativa forte.
Como interpretar?
O coeficiente de correlação resultou em um número negativo e 
próximo de 1 (r = –0,73842), sendo assim, a correlação entre as notas de 
Matemática e Biologia é negativa (significativa), ou seja, quanto maior a 
nota em Matemática, menor será a nota em Biologia, e quanto menor a 
nota em Matemática, maior será a nota em Biologia.
b) Passo 1: para a equação da reta, conforme mostrada abaixo, você pode 
começar calculando a inclinação da reta (a):
Equação da reta de regressão → = b+a.X
Inclinação da reta (a):
Agora, identifique os elementos da fórmula:
n = 10 (número de alunos);
∑x = 73;
∑y = 65,3;
∑x.y = 456,9;
∑x2 = 561;
probabilidade_e_estatistica_1582.indb 330 19/07/12 11:13
331
Probabilidade e Estatística
Se você escrever na fórmula, terá:
a = –0,70427
Passo 2: calcule a intersecção com o eixo y (b):
Intersecção do eixo y (b)
Identifique os elementos da fórmula:
n = 10 (número de alunos);
∑x = 73;
∑y = 65,3;
a = –0,70427.
b = –11,671171.
Passo 3: construa a equação da reta de regressão:
Após calcular a e b, tem-se:
a = –0,70427
b = –11,671171
 = b + a.X
 = 11,671171 – 0,70427.X
probabilidade_e_estatistica_1582.indb 331 19/07/12 11:13
332
Universidade do Sul de Santa Catarina
c) Para calcular a estimativa, você necessita de um valor para X que é dado 
no item c), ou seja, X = 6,5. Para estimar a nota de Biologia, você precisa 
de uma nota de Matemática. Observe o seguinte procedimento:
X = 6,5
 = 11,671171 − 0,70427.X
 = 11,671171 − 0,70427.(6,5)
 = 11,671171 − 4,577755
 = 7,09
Interpretação: se um aluno tirar 6,5 em Matemática, possivelmente ele 
tirará em torno de 7,09 na nota de Biologia.
probabilidade_e_estatistica_1582.indb 332 19/07/12 11:13
Anexos
probabilidade_e_estatistica_1582.indb 333 19/07/12 11:13
probabilidade_e_estatistica_1582.indb 334 19/07/12 11:13
Biblioteca Virtual
Veja a seguir os serviços oferecidos pela Biblioteca Virtual aos 
alunos a distância:
 � Pesquisa a publicações on-line 
<www.unisul.br/textocompleto>
 � Acesso a bases de dados assinadas 
<www.unisul.br/bdassinadas>
 � Acesso a bases de dados gratuitas selecionadas 
<www.unisul.br/bdgratuitas >
 � Acesso a jornais e revistas on-line 
<www.unisul.br/periodicos>
 � Empréstimo de livros 
<www.unisul.br/emprestimos>
 � Escaneamento de parte de obra*
Acesse a página da Biblioteca Virtual da Unisul, disponível no EVA, 
e explore seus recursos digitais.
Qualquer dúvida escreva para: bv@unisul.br
* Se você optar por escaneamento de parte do livro, será lhe enviado o 
sumário da obra para que você possa escolher quais capítulos deseja solicitar 
a reprodução. Lembrando que para não ferir a Lei dos direitos autorais (Lei 
9610/98) pode-se reproduzir até 10% do total de páginas do livro.
probabilidade_e_estatistica_1582.indb 335 19/07/12 11:13
http://www.unisul.br/textocompleto
http://www.unisul.br/textocompleto
http://www. unisul.br/bdassinadas
http://www.unisul.br/bdgratuitas
http://www.unisul.br/bdgratuitas
http://www. unisul.br/periodicos
http://www. unisul.br/periodicos
http://www. unisul.br/emprestimos
http://www. unisul.br/emprestimos
mailto:bv%40unisul.br?subject=
probabilidade_e_estatistica_1582.indb 336 19/07/12 11:13
C
M
Y
CM
MY
CY
CMY
K
capa_curvas.pdf 1 19/07/12 10:57
	Apresentação
	Palavras do professor
	Plano de estudo
	Introdução à Estatística
	Distribuição de frequências e representação gráfica
	Medidas de posição e dispersão
	Cálculo e distribuição de probabilidades
	Amostragem e cálculo de estimativa
	Regressão linear e gráficos de controle
	Para concluir o estudo
	Referências
	Sobre os professores conteudistas
	Respostas e comentários das 
atividades de autoavaliação
	Anexos
	Biblioteca Virtual

Mais conteúdos dessa disciplina