Prévia do material em texto
C
M
Y
CM
MY
CY
CMY
K
capa_curvas.pdf 1 19/07/12 10:57
Universidade do Sul de Santa Catarina
Palhoça
UnisulVirtual
2011
Probabilidade e Estatística
Disciplina na modalidade a distância
probabilidade_e_estatistica_1582.indb 1 19/07/12 11:11
Créditos
Universidade do Sul de Santa Catarina | Campus UnisulVirtual | Educação Superior a Distância
Reitor
Ailton Nazareno Soares
Vice-Reitor
Sebastião Salésio Heerdt
Chefe de Gabinete da Reitoria
Willian Corrêa Máximo
Pró-Reitor de Ensino e
Pró-Reitor de Pesquisa,
Pós-Graduação e Inovação
Mauri Luiz Heerdt
Pró-Reitora de Administração
Acadêmica
Miriam de Fátima Bora Rosa
Pró-Reitor de Desenvolvimento
e Inovação Institucional
Valter Alves Schmitz Neto
Diretora do Campus
Universitário de Tubarão
Milene Pacheco Kindermann
Diretor do Campus Universitário
da Grande Florianópolis
Hércules Nunes de Araújo
Secretária-Geral de Ensino
Solange Antunes de Souza
Diretora do Campus
Universitário UnisulVirtual
Jucimara Roesler
Equipe UnisulVirtual
Diretor Adjunto
Moacir Heerdt
Secretaria Executiva e Cerimonial
Jackson Schuelter Wiggers (Coord.)
Marcelo Fraiberg Machado
Tenille Catarina
Assessoria de Assuntos
Internacionais
Murilo Matos Mendonça
Assessoria de Relação com Poder
Público e Forças Armadas
Adenir Siqueira Viana
Walter Félix Cardoso Junior
Assessoria DAD - Disciplinas a
Distância
Patrícia da Silva Meneghel (Coord.)
Carlos Alberto Areias
Cláudia Berh V. da Silva
Conceição Aparecida Kindermann
Luiz Fernando Meneghel
Renata Souza de A. Subtil
Assessoria de Inovação e
Qualidade de EAD
Denia Falcão de Bittencourt (Coord.)
Andrea Ouriques Balbinot
Carmen Maria Cipriani Pandini
Assessoria de Tecnologia
Osmar de Oliveira Braz Júnior (Coord.)
Felipe Fernandes
Felipe Jacson de Freitas
Jefferson Amorin Oliveira
Phelipe Luiz Winter da Silva
Priscila da Silva
Rodrigo Battistotti Pimpão
Tamara Bruna Ferreira da Silva
Coordenação Cursos
Coordenadores de UNA
Diva Marília Flemming
Marciel Evangelista Catâneo
Roberto Iunskovski
Auxiliares de Coordenação
Ana Denise Goularte de Souza
Camile Martinelli Silveira
Fabiana Lange Patricio
Tânia Regina Goularte Waltemann
Coordenadores Graduação
Aloísio José Rodrigues
Ana Luísa Mülbert
Ana Paula R.Pacheco
Artur Beck Neto
Bernardino José da Silva
Charles Odair Cesconetto da Silva
Dilsa Mondardo
Diva Marília Flemming
Horácio Dutra Mello
Itamar Pedro Bevilaqua
Jairo Afonso Henkes
Janaína Baeta Neves
Jorge Alexandre Nogared Cardoso
José Carlos da Silva Junior
José Gabriel da Silva
José Humberto Dias de Toledo
Joseane Borges de Miranda
Luiz G. Buchmann Figueiredo
Marciel Evangelista Catâneo
Maria Cristina Schweitzer Veit
Maria da Graça Poyer
Mauro Faccioni Filho
Moacir Fogaça
Nélio Herzmann
Onei Tadeu Dutra
Patrícia Fontanella
Roberto Iunskovski
Rose Clér Estivalete Beche
Vice-Coordenadores Graduação
Adriana Santos Rammê
Bernardino José da Silva
Catia Melissa Silveira Rodrigues
Horácio Dutra Mello
Jardel Mendes Vieira
Joel Irineu Lohn
José Carlos Noronha de Oliveira
José Gabriel da Silva
José Humberto Dias de Toledo
Luciana Manfroi
Rogério Santos da Costa
Rosa Beatriz Madruga Pinheiro
Sergio Sell
Tatiana Lee Marques
Valnei Carlos Denardin
Sâmia Mônica Fortunato (Adjunta)
Coordenadores Pós-Graduação
Aloísio José Rodrigues
Anelise Leal Vieira Cubas
Bernardino José da Silva
Carmen Maria Cipriani Pandini
Daniela Ernani Monteiro Will
Giovani de Paula
Karla Leonora Dayse Nunes
Letícia Cristina Bizarro Barbosa
Luiz Otávio Botelho Lento
Roberto Iunskovski
Rodrigo Nunes Lunardelli
Rogério Santos da Costa
Thiago Coelho Soares
Vera Rejane Niedersberg Schuhmacher
Gerência Administração
Acadêmica
Angelita Marçal Flores (Gerente)
Fernanda Farias
Secretaria de Ensino a Distância
Samara Josten Flores (Secretária de Ensino)
Giane dos Passos (Secretária Acadêmica)
Adenir Soares Júnior
Alessandro Alves da Silva
Andréa Luci Mandira
Cristina Mara Schauffert
Djeime Sammer Bortolotti
Douglas Silveira
Evilym Melo Livramento
Fabiano Silva Michels
Fabricio Botelho Espíndola
Felipe Wronski Henrique
Gisele Terezinha Cardoso Ferreira
Indyanara Ramos
Janaina Conceição
Jorge Luiz Vilhar Malaquias
Juliana Broering Martins
Luana Borges da Silva
Luana Tarsila Hellmann
Luíza Koing Zumblick
Maria José Rossetti
Marilene de Fátima Capeleto
Patricia A. Pereira de Carvalho
Paulo Lisboa Cordeiro
Paulo Mauricio Silveira Bubalo
Rosângela Mara Siegel
Simone Torres de Oliveira
Vanessa Pereira Santos Metzker
Vanilda Liordina Heerdt
Gestão Documental
Lamuniê Souza (Coord.)
Clair Maria Cardoso
Daniel Lucas de Medeiros
Jaliza Thizon de Bona
Guilherme Henrique Koerich
Josiane Leal
Marília Locks Fernandes
Gerência Administrativa e
Financeira
Renato André Luz (Gerente)
Ana Luise Wehrle
Anderson Zandré Prudêncio
Daniel Contessa Lisboa
Naiara Jeremias da Rocha
Rafael Bourdot Back
Thais Helena Bonetti
Valmir Venício Inácio
Gerência de Ensino, Pesquisa e
Extensão
Janaína Baeta Neves (Gerente)
Aracelli Araldi
Elaboração de Projeto
Carolina Hoeller da Silva Boing
Vanderlei Brasil
Francielle Arruda Rampelotte
Reconhecimento de Curso
Maria de Fátima Martins
Extensão
Maria Cristina Veit (Coord.)
Pesquisa
Daniela E. M. Will (Coord. PUIP, PUIC, PIBIC)
Mauro Faccioni Filho (Coord. Nuvem)
Pós-Graduação
Anelise Leal Vieira Cubas (Coord.)
Biblioteca
Salete Cecília e Souza (Coord.)
Paula Sanhudo da Silva
Marília Ignacio de Espíndola
Renan Felipe Cascaes
Gestão Docente e Discente
Enzo de Oliveira Moreira (Coord.)
Capacitação e Assessoria ao
Docente
Alessandra de Oliveira (Assessoria)
Adriana Silveira
Alexandre Wagner da Rocha
Elaine Cristiane Surian (Capacitação)
Elizete De Marco
Fabiana Pereira
Iris de Souza Barros
Juliana Cardoso Esmeraldino
Maria Lina Moratelli Prado
Simone Zigunovas
Tutoria e Suporte
Anderson da Silveira (Núcleo Comunicação)
Claudia N. Nascimento (Núcleo Norte-
Nordeste)
Maria Eugênia F. Celeghin (Núcleo Pólos)
Andreza Talles Cascais
Daniela Cassol Peres
Débora Cristina Silveira
Ednéia Araujo Alberto (Núcleo Sudeste)
Francine Cardoso da Silva
Janaina Conceição (Núcleo Sul)
Joice de Castro Peres
Karla F. Wisniewski Desengrini
Kelin Buss
Liana Ferreira
Luiz Antônio Pires
Maria Aparecida Teixeira
Mayara de Oliveira Bastos
Michael Mattar
Patrícia de Souza Amorim
Poliana Simao
Schenon Souza Preto
Gerência de Desenho e
Desenvolvimento de Materiais
Didáticos
Márcia Loch (Gerente)
Desenho Educacional
Cristina Klipp de Oliveira (Coord. Grad./DAD)
Roseli A. Rocha Moterle (Coord. Pós/Ext.)
Aline Cassol Daga
Aline Pimentel
Carmelita Schulze
Daniela Siqueira de Menezes
Delma Cristiane Morari
Eliete de Oliveira Costa
Eloísa Machado Seemann
Flavia Lumi Matuzawa
Geovania Japiassu Martins
Isabel Zoldan da Veiga Rambo
João Marcos de Souza Alves
Leandro Romanó Bamberg
Lygia Pereira
Lis Airê Fogolari
Luiz Henrique Milani Queriquelli
Marcelo Tavares de Souza Campos
Mariana Aparecida dos Santos
Marina Melhado Gomes da Silva
Marina Cabeda Egger Moellwald
Mirian Elizabet Hahmeyer Collares Elpo
Pâmella Rocha Flores da Silva
Rafael da Cunha Lara
Roberta de Fátima Martins
Roseli Aparecida Rocha Moterle
Sabrina Bleicher
Verônica Ribas Cúrcio
Acessibilidade
Vanessa de Andrade Manoel (Coord.)
Letícia Regiane Da Silva Tobal
Mariella Gloria Rodrigues
Vanesa Montagna
Avaliação da aprendizagem
Claudia Gabriela Dreher
Jaqueline Cardozo Polla
Nágila Cristina Hinckel
Sabrina Paula Soares Scaranto
Thayanny Aparecida B. da Conceição
Gerência de Logística
Jeferson Cassiano A. da Costa (Gerente)
Logísitca de Materiais
Carlos Eduardo D. da Silva (Coord.)
Abraao do Nascimento Germano
Bruna Maciel
Fernando Sardão da Silva
Fylippy Margino dos Santos
Guilherme Lentz
Marlon Eliseu Pereira
Pablo Varela da Silveira
Rubens Amorim
Yslann David Melo Cordeiro
Avaliações Presenciais
Graciele M. Lindenmayr (Coord.)
Ana Paula de Andrade
Angelica Cristina Gollo
Cristilaine Medeiros
Daiana Cristina Bortolotti
Delano Pinheiro Gomes
Edson Martins Rosa Junior
Fernando Steimbach
Fernando Oliveira Santos
Lisdeise Nunes Felipe
Marcelo Ramos
Marcio VenturaOsni Jose Seidler Junior
Thais Bortolotti
Gerência de Marketing
Eliza B. Dallanhol Locks (Gerente)
Relacionamento com o Mercado
Alvaro José Souto
Relacionamento com Polos
Presenciais
Alex Fabiano Wehrle (Coord.)
Jeferson Pandolfo
Karine Augusta Zanoni
Marcia Luz de Oliveira
Mayara Pereira Rosa
Luciana Tomadão Borguetti
Assuntos Jurídicos
Bruno Lucion Roso
Sheila Cristina Martins
Marketing Estratégico
Rafael Bavaresco Bongiolo
Portal e Comunicação
Catia Melissa Silveira Rodrigues
Andreia Drewes
Luiz Felipe Buchmann Figueiredo
Rafael Pessi
Gerência de Produção
Arthur Emmanuel F. Silveira (Gerente)
Francini Ferreira Dias
Design Visual
Pedro Paulo Alves Teixeira (Coord.)
Alberto Regis Elias
Alex Sandro Xavier
Anne Cristyne Pereira
Cristiano Neri Gonçalves Ribeiro
Daiana Ferreira Cassanego
Davi Pieper
Diogo Rafael da Silva
Edison Rodrigo Valim
Fernanda Fernandes
Frederico Trilha
Jordana Paula Schulka
Marcelo Neri da Silva
Nelson Rosa
Noemia Souza Mesquita
Oberdan Porto Leal Piantino
Multimídia
Sérgio Giron (Coord.)
Dandara Lemos Reynaldo
Cleber Magri
Fernando Gustav Soares Lima
Josué Lange
Conferência (e-OLA)
Carla Fabiana Feltrin Raimundo (Coord.)
Bruno Augusto Zunino
Gabriel Barbosa
Produção Industrial
Marcelo Bittencourt (Coord.)
Gerência Serviço de Atenção
Integral ao Acadêmico
Maria Isabel Aragon (Gerente)
Ana Paula Batista Detóni
André Luiz Portes
Carolina Dias Damasceno
Cleide Inácio Goulart Seeman
Denise Fernandes
Francielle Fernandes
Holdrin Milet Brandão
Jenniffer Camargo
Jessica da Silva Bruchado
Jonatas Collaço de Souza
Juliana Cardoso da Silva
Juliana Elen Tizian
Kamilla Rosa
Mariana Souza
Marilene Fátima Capeleto
Maurício dos Santos Augusto
Maycon de Sousa Candido
Monique Napoli Ribeiro
Priscilla Geovana Pagani
Sabrina Mari Kawano Gonçalves
Scheila Cristina Martins
Taize Muller
Tatiane Crestani Trentin
Avenida dos Lagos, 41 – Cidade Universitária Pedra Branca | Palhoça – SC | 88137-900 | Fone/fax: (48) 3279-1242 e 3279-1271 | E-mail: cursovirtual@unisul.br | Site: www.unisul.br/unisulvirtual
probabilidade_e_estatistica_1582.indb 2 19/07/12 11:11
Palhoça
UnisulVirtual
2011
Revisão e atualização de conteúdo
Gabriel Oscar Cremona Parma
Design instrucional
Karla Leonora Dahse Nunes
Sabrina Bleicher
2ª edição
Luiz Arthur Dornelles Júnior
Probabilidade e Estatística
Livro didático
probabilidade_e_estatistica_1582.indb 3 19/07/12 11:11
Edição – Livro Didático
Professor Conteudista
Luiz Arthur Dornelles Júnior
Revisão e atualização de conteúdo
Gabriel Oscar Cremona Parma (2ª edição)
Designer Instrucional
Karla Leonora Dahse Nunes
Sabrina Bleicher (2ª edição)
Projeto Gráfico e Capa
Equipe UnisulVirtual
Diagramação
Fernanda Fernandes
Revisão
Contextuar
ISBN
978-85-7817-336-4
Ficha catalográfica elaborada pela Biblioteca Universitária da Unisul
Copyright © UnisulVirtual 2011
Nenhuma parte desta publicação pode ser reproduzida por qualquer meio sem a prévia autorização desta instituição.
519.5
D75 Dornelles Júnior, Luiz Arthur
Probabilidade e estatística : livro didático / Luiz Arthur Dornelles
Júnior; revisão e atualização de conteúdo Gabriel Oscar Cremona Parma ;
design instrucional Karla Leonora Dahse Nunes, Sabrina Bleicher. – 2. ed. –
Palhoça: UnisulVirtual, 2011.
336 p. : il. ; 28 cm.
Inclui bibliografia.
ISBN 978-85-7817-336-4
1. Estatística. 2. Probabilidades. I. Parma, Gabriel Oscar Cremona. II.
Nunes, Karla Leonora Dahse. III. Bleicher, Sabrina. IV. Título.
probabilidade_e_estatistica_1582.indb 4 19/07/12 11:11
Sumário
Apresentação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .7
Palavras do professor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .9
Plano de estudo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
UNIDADE 1 - Introdução à Estatística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
UNIDADE 2 - Distribuição de frequências e representação gráfica . . . . . . 43
UNIDADE 3 - Medidas de posição e dispersão . . . . . . . . . . . . . . . . . . . . . . . . . 81
UNIDADE 4 - Cálculo e distribuição de probabilidades . . . . . . . . . . . . . . . . 147
UNIDADE 5 - Amostragem e cálculo de estimativa . . . . . . . . . . . . . . . . . . . . 205
UNIDADE 6 - Regressão linear e gráficos de controle . . . . . . . . . . . . . . . . . . 253
Para concluir o estudo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 285
Referências . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287
Sobre os professores conteudistas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 289
Respostas e comentários das atividades de autoavaliação . . . . . . . . . . . . . 291
Anexos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 333
Biblioteca Virtual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 335
probabilidade_e_estatistica_1582.indb 5 19/07/12 11:11
probabilidade_e_estatistica_1582.indb 6 19/07/12 11:11
7
Apresentação
Este livro didático corresponde à disciplina Probabilidade e
Estatística.
O material foi elaborado visando a uma aprendizagem autônoma
e aborda conteúdos especialmente selecionados e relacionados
à sua área de formação. Ao adotar uma linguagem didática
e dialógica, objetivamos facilitar seu estudo a distância,
proporcionando condições favoráveis às múltiplas interações e a
um aprendizado contextualizado e eficaz.
Lembre-se que sua caminhada, nesta disciplina, será
acompanhada e monitorada constantemente pelo Sistema
Tutorial da UnisulVirtual, por isso a “distância” fica
caracterizada somente na modalidade de ensino que você optou
para sua formação, pois na relação de aprendizagem professores
e instituição estarão sempre conectados com você.
Então, sempre que sentir necessidade entre em contato; você tem
à disposição diversas ferramentas e canais de acesso tais como:
telefone, e-mail e o Espaço Unisul Virtual de Aprendizagem,
que é o canal mais recomendado, pois tudo o que for enviado e
recebido fica registrado para seu maior controle e comodidade.
Nossa equipe técnica e pedagógica terá o maior prazer em lhe
atender, pois sua aprendizagem é o nosso principal objetivo.
Bom estudo e sucesso!
Equipe UnisulVirtual.
probabilidade_e_estatistica_1582.indb 7 19/07/12 11:11
probabilidade_e_estatistica_1582.indb 8 19/07/12 11:11
Palavras do professor
Olá! Bem-vindo(a) à disciplina Probabilidade e Estatística.
Dentro desta disciplina você irá estudar o que os profissionais
e cientistas chamam de probabilidade e estatística.
Tendo como base a matemática, esta disciplina trata da
aplicação no cotidiano, em pesquisas e avaliações. Trata
também de técnicas eficientes para organizar e analisar dados
e tomar decisões.
Não é objetivo desta disciplina formar estatísticos e, sim,
profissionais com conhecimento técnico para realizar análises
e interpretação de dados, além de ter condições de argumentar,
dar suporte e trocar ideias com outros profissionais.
Desta forma, o esperado é que ao final da disciplina você tenha
em suas mãos uma verdadeira “caixa com várias ferramentas”
para apoiar suas decisões.
Sinta-se, agora, convidado a estudar para obter todas as
“ferramentas” que lhe serão apresentadas nesta disciplina, e
cuide para ordenar as ferramentas na “caixa”, de modo a poder
fazer uso delas quando for necessário.
Bons estudos!
Professor Luiz Arthur Dornelles Júnior
probabilidade_e_estatistica_1582.indb 9 19/07/12 11:11
probabilidade_e_estatistica_1582.indb 10 19/07/12 11:11
Plano de estudo
O plano de estudos visa a orientá-lo no desenvolvimento da
disciplina.Ele possui elementos que o ajudarão a conhecer o
contexto da disciplina e a organizar o seu tempo de estudos.
O processo de ensino e aprendizagem na UnisulVirtual leva
em conta instrumentos que se articulam e se complementam,
portanto, a construção de competências se dá sobre a
articulação de metodologias e por meio das diversas formas de
ação/mediação.
São elementos desse processo:
� o livro didático;
� o Espaço UnisulVirtual de Aprendizagem (EVA);
� as atividades de avaliação (a distância, presenciais e de
autoavaliação);
� o Sistema Tutorial.
Ementa
Conceitos gerais de população, amostra, parâmetro, estatística,
tipos de dados, níveis de mensuração, planejamento de
experimentos. Histogramas. Medidas de locação e de
variabilidade. Boxplot. Ramo e folhas. Probabilidade e
distribuições de probabilidade. Principais distribuições
discretas. Principais distribuições contínuas. Estatísticas e
distribuições amostrais. Estimação pontual de parâmetros de
processos. Inferência estatística para uma amostra. Inferência
estatística para duas amostras. Análise de variância com um
único fator. Correlação e regressão linear. Gráficos de controle.
probabilidade_e_estatistica_1582.indb 11 19/07/12 11:11
12
Universidade do Sul de Santa Catarina
Objetivos
Geral
Adquirir competências para pesquisar; coletar dados, organizar
e analisá-los; e delinear conclusões, testando-as na solução de
problemas, sob o ponto de vista da estatística e da probabilidade.
Específicos
� Compreender os conceitos, procedimentos e estratégias
para uma pesquisa.
� Identificar ferramentas que apoiem decisões nas áreas de
conhecimento inerentes a sua profissão.
� Analisar e resolver situações que envolvam coleção de
dados agrupados ou não.
� Analisar e resolver situações que envolvam uma ou mais
variáveis de estudo.
� Identificar ferramentas para o cálculo de estimavas para
uma ou mais variáveis.
� Correlacionar duas variáveis.
Carga Horária
A carga horária total da disciplina é 60 horas-aula.
probabilidade_e_estatistica_1582.indb 12 19/07/12 11:11
13
Probabilidade e Estatística
Conteúdo programático/objetivos
Veja, a seguir, as unidades que compõem o livro didático desta
disciplina e os seus respectivos objetivos. Estes se referem aos
resultados que você deverá alcançar ao final de uma etapa de
estudo. Os objetivos de cada unidade definem o conjunto de
conhecimentos que você deverá possuir para o desenvolvimento
de habilidades e competências necessárias à sua formação.
Unidades de estudo: 6
Unidade 1 – Introdução à Estatística
É muito importante, antes de começar a ter contato com as técnicas
estatísticas, conhecer bem os conceitos e definições de alguns termos
que serão usados dentro desta disciplina. Por isso, nesta unidade você
conhecerá alguns conceitos introdutórios da Estatística.
Unidade 2 – Distribuição de frequências e representação gráfica
De posse dos dados de forma desorganizada, um primeiro
passo seria organizá-los em tabelas para que possibilitem a
primeira análise e uma série de interpretações. Nesta unidade,
você poderá aprender como se organizam dados brutos e como
pode ser analisada a distribuição de frequências. Após aprender
como organizar os dados, você aprenderá como representá-los
graficamente. Este assunto é importante porque o seu dia a
dia está impregnado de informações representadas por gráficos
e, nesta unidade, você poderá conhecer os tipos de gráficos e
algumas dicas de como interpretá-los.
probabilidade_e_estatistica_1582.indb 13 19/07/12 11:11
14
Universidade do Sul de Santa Catarina
Unidade 3 – Medidas de posição e dispersão
Você conhecerá, nesta unidade, como calcular algumas medidas,
começando por média, mediana e moda, sendo que a medida
mais importante dentro da Estatística é a média. Verá também
outra medida importante, a de dispersão. Muitas vezes as
medidas de posição por si só não bastam para analisar uma série
de dados, então, se faz necessário trabalhar com medidas de
dispersão. Dentre as medidas de dispersão, a mais importante
delas que é o desvio padrão.
Unidade 4 – Cálculo e distribuição de probabilidades
Esta unidade é um marco que divide a Estatística em duas partes:
a estatística descritiva e estatística indutiva. Dar-se-á início ao
estudo sobre probabilidade, estimativas e cálculo do erro de
estimativa. O estudo de probabilidade é a base fundamental para
concretizar o conhecimento sobre estimativas. Além disso, você
conhecerá que o estudo de probabilidades pode ser dividido em
duas partes: probabilidade de variáveis discretas e probabilidade
de variáveis contínuas.
Unidade 5 – Amostragem e cálculo de estimativa
Tendo como base o estudo do cálculo de probabilidades, você
poderá aprender, nesta unidade, como calcular o tamanho de
uma amostra necessário para se obter um determinado erro
de estimativa, bem como, descobrir maneiras de selecionar os
elementos de uma amostra de forma que eles sejam realmente
representativos da população objeto de pesquisa.
Unidade 6 – Regressão linear e gráficos de controle
Nesta unidade, você irá estudar como analisar e comparar duas
variáveis correlacionando-as; assim como também aprenderá a
construir e trabalhar com gráfico de controle para verificar os
erros em processos de controle de qualidade, dentre outros fins.
probabilidade_e_estatistica_1582.indb 14 19/07/12 11:11
15
Probabilidade e Estatística
Agenda de atividades/Cronograma
� Verifique com atenção o EVA, organize-se para acessar
periodicamente a sala da disciplina. O sucesso nos seus
estudos depende da priorização do tempo para a leitura,
da realização de análises e sínteses do conteúdo e da
interação com os seus colegas e professor.
� Não perca os prazos das atividades. Registre no espaço
a seguir as datas com base no cronograma da disciplina
disponibilizado no EVA.
� Use o quadro para agendar e programar as atividades
relativas ao desenvolvimento da disciplina.
Atividades obrigatórias
Demais atividades (registro pessoal)
probabilidade_e_estatistica_1582.indb 15 19/07/12 11:11
probabilidade_e_estatistica_1582.indb 16 19/07/12 11:11
1UNIDADE 1Introdução à Estatística
Objetivos de aprendizagem
� Identificar o processo estatístico de pesquisa.
� Diferenciar censo e estimação.
� Entender a importância de usar amostra estatística.
� Identificar variáveis.
� Identificar dados absolutos e dados relativos.
� Classificar séries estatísticas.
Seções de estudo
Seção 1 Conceitos básicos da Estatística
Seção 2 Variáveis
Seção 3 Dados
Seção 4 Séries
probabilidade_e_estatistica_1582.indb 17 19/07/12 11:11
18
Universidade do Sul de Santa Catarina
Para início de estudo
A cada dia, nossa sociedade se torna mais complexa. Convivemos
com os indicadores econômicos, com a inflação, com a reforma
da previdência, com o controle de qualidade, enfim, nos
deparamos com situações e informações sempre mais complexas.
No que se refere à gestão das organizações, a situação não é
diferente. Para se administrar uma empresa, seja pública ou
privada, necessitamos de ferramentas para poder acompanhar a
evolução da sociedade e, assim, analisar situações e informações
bem como dar suporte às nossas decisões.
Por isso, dizemos que a Estatística é um conjunto de ferramentas
as quais, quando bem empregadas, podem ser de grande utilidade
para a gestão de empresas. Hoje em dia, sem a Estatística, não
seríamos capazes de avaliar a variação de preços, da inflação, de
consumo, nem fazer controle de qualidade, pesquisa eleitoral etc.
Nesta unidade, você irá conhecer alguns conceitos importantes
para a Estatística. Assim, conforme a metáfora utilizada, você
estará apropriando-se de mais algumas “ferramentas para colocar
na sua caixa”.
Seção 1 – Conceitos básicos da Estatística
Para conhecer Estatística, é importante que você compreenda,
antes, o significado da palavra e o seu conceito. A palavra
estatística origina-sedo latim, e o seu radical status, significa
estado. Sendo assim, a palavra estatística significa “o estudo
do estado”. Para entender o conceito de “estudo do estado”,
acompanhe as seguintes definições sobre Estatística:
A Estatística é uma coleção de métodos para planejar
experimentos, obter dados e organizá-los e, deles, extrair
conclusões. (TRIOLA, 1999, p. 2).
probabilidade_e_estatistica_1582.indb 18 19/07/12 11:11
19
Probabilidade e Estatística
Unidade 1
A Estatística está interessada nos métodos científicos
para a coleta, organização, resumo, apresentação e análise
de dados, bem como na obtenção de conclusões válidas
e na tomada de decisões razoáveis, baseadas em tais
análises. (SPIEGEL, 1994, p. 1).
Estatística é um conjunto de métodos e processos
quantitativos que serve para estudar e medir os
fenômenos coletivos. (SILVA, 1999, p. 11).
Você percebeu que as definições se assemelham e se completam?
Então, observe, a seguir, a definição de Estatística adotada neste
estudo que agora se inicia.
A Estatística corresponde a um conjunto de métodos
científicos para a coleta, organização, apresentação
e análise de dados, bem como, para a conclusão e
tomada de decisões baseadas em tais análises.
Em termos gerais, convém destacar que a Estatística está dividida
em duas partes:
� Estatística indutiva: aplicada quando é impossível
realizar levantamentos com a totalidade dos objetos
de uma pesquisa seja por tempo, ou por economia
etc., somente uma parcela destes elementos é utilizada
para realizar as observações. Partindo, neste caso, de
uma parcela destes elementos, a Estatística indutiva
tira conclusões e realiza previsões sobre elementos
em questão (método que se fundamenta na teoria da
probabilidade associado a uma margem de incerteza).
� Estatística descritiva: aplicada quando você se depara
com uma quantidade muito grande de dados, e é difícil
tirar conclusões sobre o fenômeno que descrevem. A
Estatística descritiva é usada para reduzir as informações
até o ponto em que se possa interpretar tal fenômeno. O
objetivo da Estatística descritiva é observar fenômenos
de mesma natureza, coletar, organizar, classificar,
apresentar, interpretar e analisar dados referentes ao
fenômeno através de gráficos e tabelas, além de calcular
medidas que permitam descrever o fenômeno.
probabilidade_e_estatistica_1582.indb 19 19/07/12 11:11
20
Universidade do Sul de Santa Catarina
Para obtenção de resultados confiáveis, que reflitam a realidade
dos fatos, é necessário realizar uma pesquisa cuidadosamente
planejada com métodos adequados.
O método é um conjunto de meios dispostos
convenientemente para se chegar a um fim que
se demarcou. O método estatístico, diante da
impossibilidade de manter as causas constantes,
admite as causas presentes, variando-as, registrando
essas variações e procurando determinar, no resultado
final, que influências cabem a cada uma delas.
Alguns passos precisam ser seguidos para que seja aplicado o
método estatístico e, assim, realizada uma boa pesquisa. Para
você entender quais são estes passos, acompanhe a seguir as
principais fases.
a) Definição do problema: a primeira fase do trabalho
estatístico consiste em uma definição ou formulação
correta do problema a ser estudado. Nesta fase, você
precisa definir:
� O que será pesquisado? Definir o tema e os objetivos
de pesquisa;
� Em que setor geográfico? O público-alvo a ser
planejado;
� Como será a amostra? Incluir o cálculo da amostra e
as técnicas de coletas de dados.
b) Planejamento: consiste em determinar o procedimento
necessário para levantar informações sobre o assunto
objeto do estudo. Você deverá definir como serão
coletados os dados de pesquisa, já que isto pode ser feito
de várias formas.
� Observação direta: caracteriza-se, quando o
pesquisador somente faz observações para coletar os
dados necessários para a pesquisa.
probabilidade_e_estatistica_1582.indb 20 19/07/12 11:11
21
Probabilidade e Estatística
Unidade 1
� Entrevista oral: caracteriza-se por estabelecer
perguntas orais a um indivíduo ou grupo de
indivíduos. As entrevistas podem ser classificadas
em estruturadas e não estruturadas; entrevistas
estruturadas são aquelas em que o pesquisador
estabelece um roteiro prévio de perguntas. Nas
entrevistas não estruturadas, o pesquisador, por meio
de uma conversa amigável, busca levantar dados
que possam ser utilizados em análise qualitativa,
selecionando-se os aspectos mais relevantes do
problema de pesquisa. (RAUEN, 2006).
� Entrevista escrita ou questionário: questionário
é uma lista de indagações escritas, as quais devem
ser respondidas pelo informante por escrito. Sua
vantagem é a possibilidade de se indagarem muitas
pessoas ao mesmo tempo. Para entrevistar uma sala
de universitários, basta distribuir as folhas, para que
todos respondam simultaneamente (entrevista de
grupo). (RAUEN, 2006). O questionário é uma forma
muito utilizada na coleta de dados, mas exige ser:
completo (responder tudo), concreto (perguntas claras
e objetivas), secreto (sem identificação) e discreto
(perguntas bem formuladas).
É preciso planejar o trabalho a ser realizado, tendo em
vista o objetivo que se pretende atingir.
c) Coleta de dados: compreende a coleta das informações
propriamente ditas. Formalmente, a coleta de dados
refere-se à obtenção, à reunião e ao registro sistemático
de dados com um objetivo determinado.
d) Apuração dos dados: consiste em reunir os dados através
de sua contagem e agrupamento.
e) Apresentação dos dados: os dados estatísticos podem ser
mais facilmente compreendidos quando apresentados por
meio de uma representação gráfica, o que permite uma
visualização instantânea de todos os dados.
probabilidade_e_estatistica_1582.indb 21 19/07/12 11:11
22
Universidade do Sul de Santa Catarina
f) Análise e interpretação de dados: nesta etapa, o
interesse maior reside em tirar conclusões que auxiliam
o pesquisador a atingir seu objetivo, ou seja, encontrar a
resposta para a sua pergunta.
Todas estas fases são realizadas quando se cumpre um processo
de pesquisa. Veja a representação no esquema a seguir:
População Amostra
Produção
de dados
Estatística
Descritiva
Estatística
Indutiva
Características
populacionais
Estudo da amostra
� tabelas
� grá�cos
� medidas
Características
amostrais
Figura 1.1 – O processo da pesquisa estatística
Fonte: Adaptado de Ação Local de Estatística Aplicada - ALEA (1999-2010).
População e amostra
Quando você prepara um alimento, pode provar (observar)
uma pequena porção. Neste procedimento, você está fazendo o
processo de amostragem, ou seja, extraindo do todo (população)
uma parte (amostra), com o propósito de inferir (avaliar) a
qualidade de todo o alimento. A partir do exemplo, podemos
distinguir dois importantes conceitos da Estatística descritiva:
população e amostra.
População é o conjunto total de elementos com,
pelo menos, uma característica em comum, cujo
comportamento interessa estudar.
probabilidade_e_estatistica_1582.indb 22 19/07/12 11:11
23
Probabilidade e Estatística
Unidade 1
A definição dos elementos que serão estudados está ligada
diretamente às características levantadas no objetivo da pesquisa,
ou seja, é este objetivo que auxiliará na definição desta população.
Estes elementos podem ser:
� animados: pessoas, animais etc.;
� inanimados: notas fiscais, produtos industrializados etc.
Em relação ao número de elementos, a população pode ser:
� finita: quando tem um número limitado de elementos
(número de funcionários de um determinado banco etc.);
� infinita: quando tem um número ilimitado de elementos
(exemplo: número possível de análises químicos que
podem ser feitos em um rio poluído etc.).
A representação do tamanho da população é dada por
N = número de elementos da população.
São exemplos de definição de população:
� Ao estudar a idade e sexo de funcionários da empresa A:
para definira população, devemos considerar todos os
funcionários da empresa.
� Ao estudar a qualidade de peças de uma linha de
produção da empresa A: para definir a população,
devemos considerar todas as peças produzidas pela
empresa.
Amostra é o conjunto de elementos ou observações,
recolhidos a partir de um subconjunto da população,
que se estuda com o objetivo de tirar conclusões para a
população de onde foi recolhida.
A amostra precisa ser representativa, ou seja, possuir as mesmas
características da população.
A representação do tamanho da amostra é dada por n = número
de elementos da amostra.
probabilidade_e_estatistica_1582.indb 23 19/07/12 11:11
24
Universidade do Sul de Santa Catarina
Processos estatísticos de abordagem
Ao estudar um fenômeno coletivo, ou seja, um fenômeno que se
refere a uma determinada população, compreendendo um grande
número de elementos, coisas e indivíduos, podemos optar entre
os seguintes processos estatísticos:
� Censo: é uma coleção de dados relativos a todos os
elementos de uma população; uma avaliação direta de
um parâmetro que utiliza todos os componentes da
população. No Brasil, por exemplo, o censo é feito de dez
em dez anos, momento em que são pesquisados todos os
domicílios brasileiros.
Principais propriedades do censo:
» admite erro processual zero e tem confiabilidade 100%;
» é caro e lento;
» quase sempre desatualizado;
» nem sempre é viável.
� Parâmetro: usado para designar alguma característica
descritiva dos elementos da população (percentagem,
média etc.).
� Estimação: é uma avaliação indireta de um parâmetro
com base em um estimador, através do cálculo de
probabilidades. Nesse caso, utiliza-se uma amostra.
Principais propriedades da estimação:
» admite erro processual positivo e tem confiabilidade
menor que 100%;
» é barata e rápida;
» é atualizada;
» é sempre viável.
O censo era considerado uma
pesquisa desatualizada pela demora
da publicação dos dados, mas a
tecnologia veio para diminuir em
muito esse tempo de publicação. No
ano de 2010, constatamos que os
dados foram publicados com mais
rapidez que nas décadas anteriores.
Acesse o site do Instituto Brasileiro
de Geografia e Estatística (IBGE) e
consulte informações da sua cidade
e do seu estado.
probabilidade_e_estatistica_1582.indb 24 19/07/12 11:11
25
Probabilidade e Estatística
Unidade 1
� Estimativa: é o valor assumido por certa estatística
(exemplo: 60% é o valor de estimativa do referido
parâmetro).
Amostragem
Como já foi exposto nesta unidade, as pesquisas são realizadas
por meio de estudo dos elementos que compõem uma amostra
extraída da população que se pretende analisar. O conceito de
população é intuitivo. Trata-se do conjunto de indivíduos ou
objetos que apresentam, em comum, determinadas características
definidas para o estudo. Amostra é um subconjunto da
população. O estudo de todos os elementos da população
possibilita conhecimento preciso das variáveis que estão sendo
pesquisadas; todavia nem sempre é possível obter as informações
de todos os elementos da população.
Limitações de tempo, custo e as vantagens do uso das
técnicas estatísticas justificam o uso de planos amostrais. A
representatividade da amostra dependerá do seu tamanho (quanto
maior, melhor). O investigador procurará acercar-se de cuidados,
visando à obtenção de uma amostra significativa, ou seja, que
de fato represente toda a população da melhor maneira possível.
(FONSECA, 1996).
Observe, a seguir, mais alguns conceitos do processo estatístico,
relacionados à amostragem:
� Estatística: característica descritiva dos elementos da
amostra (percentagem, média etc.).
� Erro amostral: é a máxima diferença que o investigador/
pesquisador admite entre a média da população e a
média da amostra. Em pesquisa, admite-se o uso do
erro amostral entre 2% a 7%. Observe, por exemplo, as
pesquisas eleitorais, a grande maioria destas pesquisas
é efetuada com erro amostral de 2%. Isto significa que
pode variar de −2% a +2%. Quando se diz que dois
candidatos estão com empate técnico, isso quer dizer que,
somando ou diminuindo 2%, estão empatados.
probabilidade_e_estatistica_1582.indb 25 19/07/12 11:11
26
Universidade do Sul de Santa Catarina
O candidato A está com 48% da preferência dos votos,
e o candidato B está com 52% da preferência dos votos.
O candidato A tem 48%; diminuindo os 2% = 46; com
48% mais 2% = 50%. Já, o candidato B tem 52% menos
2% = 50%; com 52% + 2% = 54%. Logo, os candidatos
estão empatados tecnicamente, com 50% cada.
� Nível de confiança: é expressa em percentual e representa
quantas vezes o percentual real da população encontra-se
dentro do intervalo de confiança. O nível de confiança de
95% significa que você tem 95% de certeza. A maioria dos
pesquisadores usa o nível de confiança de 95%.
Como podemos ver, o uso da amostragem é vantajoso por trazer:
� economia: é mais econômico o levantamento de somente
uma parte da população, muitas vezes pelo custo do
próprio levantamento e também por não ser mais possível
recuperar elementos da população;
� tempo: em pouco tempo, pode-se pesquisar uma
amostra, ao contrário de uma população;
� confiabilidade: quando se pesquisa um número menor
de elementos, pode-se dar mais atenção, evitando erros
nas respostas.
– Até aqui, vimos alguns conceitos básicos de estatística. Mas, entre
os conceitos fundamentais da Estatística, é importante distinguir
variáveis estatísticas de dados estatísticos. Estes assuntos serão
tratados na próxima seção. Vamos adiante... Bons Estudos!
probabilidade_e_estatistica_1582.indb 26 19/07/12 11:11
27
Probabilidade e Estatística
Unidade 1
Seção 2 – Variáveis
Variáveis são conjuntos de características que podem ser
observadas e/ou medidas em cada elemento da população ou
amostra, sob as mesmas condições.
Ao analisar uma determinada experiência, um fato ou um
elemento, você pode verificar que todos eles assumem diferentes
características ou valores.
Ao analisar um determinado setor de uma empresa,
você pode verificar, entre seus funcionários, algumas
características como sexo, idade, salário, assiduidade etc.
Estas características variam de elemento para elemento, por isto
são chamadas de variáveis.
As variáveis são classificadas em dois tipos:
� Qualitativas: representam a informação que identifica
alguma qualidade, categoria ou característica,
não suscetível de medida (não numérica), mas de
classificação, assumindo várias modalidades.
Estado civil: casado, solteiro, viúvo, divorciado.
Sexo: masculino e feminino.
Escolaridade: 1º grau, 2º grau, 3º grau.
As variáveis qualitativas estão divididas em:
� Nominais: são dados caracterizados por rótulos ou
categorias. Por exemplo, sexo, estado civil, cor dos olhos etc.;
� Ordinais: são dados caracterizados por uma ordem,
mas não podem ser diferenciados por valor numérico.
Por exemplo: nível de escolaridade (1º, 2º e 3º graus),
intensidade da luz (muito forte, forte, média, suave,
muito suave).
probabilidade_e_estatistica_1582.indb 27 19/07/12 11:11
28
Universidade do Sul de Santa Catarina
� Quantitativas: representam a informação resultante
de características suscetíveis de serem medidas,
apresentam-se com diferentes intensidades.
Idade: 19 anos, 20 anos, 35 anos.
Número de nascidos vivos: 10, 15, 22, 12, 14.
Peso: 55 kg, 66 kg, 71 kg.
As variáveis quantitativas estão divididas em:
� Variáveis discretas: se ela pode assumir um conjunto
constante discreto, ou seja, enumerável, finito de valores.
Geralmente são expressas por valores inteiros não
negativos. Por exemplo: número de pessoas do setor,
quantidade de notas fiscais (observação: não se pode
considerar meia nota fiscal ou meia pessoa).
� Variáveis contínuas: são as variáveis em que não
conseguimos enumerar seus possíveis resultados, por estes
formarem um conjunto infinito de valores, num intervalo
de números reais. Por exemplo:peso, altura, temperatura.
Diferença entre as variáveis discreta e contínua
Você, à noite, ao ir deitar, tem 1,65m e desperta
pela manhã com 1,70m. Você cresce 5cm de forma
instantânea? Não, você cresce aos poucos e, entre
1,65 e 1,70, você tem infinitas alturas. Para a variável
discreta, observamos que não é possível aumentar o
número de pessoas de 22 para 22,57. Não podemos
aumentar em 0,57 pessoa. Só podemos aumentar em
uma unidade.
probabilidade_e_estatistica_1582.indb 28 19/07/12 11:11
29
Probabilidade e Estatística
Unidade 1
Seção 3 – Dados
Dados estatísticos são medidas da presença de um determinado
conjunto de valores de uma variável numa população ou amostra.
Os tipos de dados estatísticos são:
� dados primários: quando são observados e/ou
levantados pelo próprio pesquisador ou organização que
os tenha recolhido;
� dados secundários: quando são observados e/ou
levantados por outra organização ou pesquisador.
Além desta classificação, os dados também pode ser absolutos
e relativos. Nesta seção, vamos aprender a transformar dados
absolutos em dados relativos, mas, antes disso, vamos conhecer
suas definições.
� Dados absolutos são dados estatísticos resultantes da
coleta direta da fonte, sem outra manipulação a não ser
a contagem ou medida. A leitura dos dados absolutos é
sempre enfadonha e inexpressiva. Embora esses dados
traduzam um resultado exato e fiel, não têm a virtude de
ressaltar de imediato as suas conclusões numéricas.
Daí o uso imprescindível que faz a Estatística dos dados
relativos. O número de vezes que um valor da variável de
uma pesquisa é citado representa a frequência absoluta
daquele valor.
� Dados relativos são o resultado de comparações por
quociente (razões) que se estabelecem entre dados
absolutos e têm por finalidade realçar ou facilitar as
comparações entre quantidades. Traduzem-se os dados
relativos, em geral, por meio de:
� percentagens;
� coeficientes;
� taxas;
� índices.
probabilidade_e_estatistica_1582.indb 29 19/07/12 11:11
30
Universidade do Sul de Santa Catarina
A frequência relativa é o quociente entre a frequência absoluta de
uma variável e o total de citações de todas as variáveis da pesquisa.
Percentagens e proporções
Permitem padronizar distribuições de frequência quanto ao
tamanho, ou seja, comparam grupos de diferentes frequências totais.
Na proporção (P), compara-se o número de sujeitos de uma dada
categoria (F) com o número total de sujeitos (N).
Num grupo de 20 alunos, 10 gostam de futebol. Assim,
a proporção será dada por:
Logo, a proporção é de 0,50, ou seja, de cada dois
indivíduos um gosta de futebol.
Em percentagem, entretanto, podemos multiplicar esta
proporção por 100, obtendo, assim, a porcentagem ou
percentagem.
Então, de acordo com o exemplo dado, temos:
(Porcentagem)
Portanto, de cada 100 alunos, 50 gostam de futebol.
No próximo exemplo, consideremos a tabela a seguir:
probabilidade_e_estatistica_1582.indb 30 19/07/12 11:11
31
Probabilidade e Estatística
Unidade 1
Tabela 1.1 – Área territorial brasileira por região – 2010
Região Área territorial em km2
Centro-Oeste 1.606.371
Nordeste 1.554.257
Norte 3.853.327
Sudeste 924.511
Sul 576.409
Total 8.514.875
Fonte: IBGE (2010).
Nesse caso, vamos identificar qual percentual do território
nacional cada região ocupa em relação ao total. Para isso,
precisamos dividir a área territorial de cada região pela área total
e multiplicar por 100.
Calculemos as percentagens de cada região:
Centro-Oeste = 1.606.371 ÷ 8.514.875 = 0,1886 × 100 = 18,87%
Nordeste = 1.554.257 ÷ 8.514.875 = 0,1825 × 100 = 18,25%
Norte = 3.853.327 ÷ 8.514.875 = 0,4525 × 100 = 45,25%
Sudeste = 924.511 ÷ 8514.875 = 0,1086 × 100 = 10,86%
Sul = 576.409 ÷ 8.514.409 = 0,06769 × 100 = 6,77%
Agora, vamos acrescentar na tabela uma coluna com os
percentuais.
probabilidade_e_estatistica_1582.indb 31 19/07/12 11:11
32
Universidade do Sul de Santa Catarina
Tabela 1.2 – Área territorial brasileira por região – 2010
Região Área territorial em km2 Percentual (%)
Centro-Oeste 1.606.371 18,87
Nordeste 1.554.257 18,25
Norte 3.853.327 45,25
Sudeste 924.511 10,86
Sul 576.409 6,77
Total 8.514.875 100,0
Fonte: IBGE (2010).
Observe que, no resultado do cálculo do percentual,
foram aplicadas regras de arredondamento.
Considerando que cada região representa uma
proporção do todo, o total precisa fechar com 100%.
Nesse exemplo, os dados referentes à área territorial são dados
secundários e absolutos. Secundários porque não foram pesquisados
por nós, e sim pelo IBGE; e absolutos porque estão na tabela como
foram coletados. Já no percentual, os dados são relativos porque
sofreram transformações: são dados de comparações.
Coeficientes e taxas
São razões que comparam o número de ocorrências de certo evento
com ele mesmo, acrescido das não ocorrências (mas que poderiam
ter ocorrido); e a razão entre variáveis da mesma espécie.
Coeficientes
São razões entre o número de ocorrências e o número total (que
é o número de ocorrências e não ocorrências). Os coeficientes são
multiplicados por 100, para transformá-los em taxa.
probabilidade_e_estatistica_1582.indb 32 19/07/12 11:11
33
Probabilidade e Estatística
Unidade 1
Coeficiente de natalidade =
Número de nascimentos
População total
Coeficiente de mortalidade infantil =
Número de óbitos
Número de nascimento total
Taxas
São os coeficientes multiplicados por 100 ou 1.000. As taxas de
mortalidade infantil e de natalidade são multiplicadas por 1.000,
por serem números muito pequenos.
A taxa nacional de mortalidade infantil do Brasil,
segundo o IBGE – dados de 2007 –, é de 19,3 por mil
nascimentos.
Índices
São métodos que comparam duas grandezas distintas, ou seja,
uma não inclui a outra.
Densidade demográfica =
População
Superfície
Densidade aluno/professor =
Número de alunos
Número de professores
Densidade aluno/ sala de aula =
Número de alunos
Número de sala de aula
probabilidade_e_estatistica_1582.indb 33 19/07/12 11:11
34
Universidade do Sul de Santa Catarina
Índices econômicos
Produção per capita =
Valor total da produção
População
Consumo per capita =
Consumo de bem
População
Renda per capita =
Renda
População
– Você pôde conhecer, nas duas últimas seções, as definições e diferen‑
ças das variáveis e dos dados estatísticos. Na próxima seção, serão
apresentadas séries estatísticas... Bons estudos!
Seção 4 – Séries
Série estatística define-se como toda e qualquer coleção de
dados estatísticos referidos a uma mesma ordem de classificação.
Quantitativa em seu sentido mais amplo, o termo série refere-se a
uma sucessão de números referidos a qualquer variável.
Os resultados estatísticos são apresentados em quadros ou
tabelas para maior clareza, objetividade e melhor visão do
conjunto, oferecendo, assim, vantagens para uma análise
matemática das mesmas.
A série estatística pode ser definida, portanto, como
qualquer tabela que apresente a distribuição de um
conjunto de dados estatísticos.
Tabela é a organização racional
e prática de apresentação dos
dados estatísticos e a sintetização
dos dados no mínimo espaço para
colocar o máximo de informações.
probabilidade_e_estatistica_1582.indb 34 19/07/12 11:11
35
Probabilidade e Estatística
Unidade 1
Tipos de séries
Para diferenciar uma série estatística de outra, há que levar em
conta três caracteres presentes na tabela que se apresenta:
� época: fator temporal ou cronológico a que se refere o
fenômeno analisado;
� local: fator geográfico onde o fenômeno acontece;
� fenômeno: espécie ou fato ou fator específico que é
descrito.
Conforme a variação dos elementos da série, é possível classificá-
las em temporal, geográfica específica e conjugada.
a) Série temporal: identifica-se por descrever a variável
no decorrer de um determinado período de tempo. Esta
série também é chamada de histórica ou evolutiva.
Observe a tabelaque registra os nascidos vivos
registrados segundo o ano do registro no Brasil.
Tabela 1.3 – Nascidos vivos registrados segundo o ano do registro no Brasil
Anos Nº de nascidos
1984 2.559.038
1985 2.619.604
1986 2.779.253
Fonte: IBGE (2010).
b) Série geográfica: identifica-se por descrever a variável
considerando o fator geográfico. Também é chamada de
espacial, territorial ou de localização. Observe a tabela
que registra as mulheres de dez anos ou mais de idade,
total, que tiveram filhos nascidos vivos – Censo de 2000
– segundo as Mesorregiões:
probabilidade_e_estatistica_1582.indb 35 19/07/12 11:11
36
Universidade do Sul de Santa Catarina
Tabela 1.4 – Mulheres de dez anos ou mais de idade, total, tiveram filhos nascidos vivos –
Censo de 2000 - segundo as Mesorregiões
Mesorregiões Mulheres de dez anos ou mais de idade que tiveram filhos nascidos vivos
Grande Florianópolis 211.763
Norte Catarinense 267.448
Oeste Catarinense 297.814
Serrana 106.025
Sul Catarinense 224.287
Vale do Itajaí 319.195
Fonte: IBGE (2010).
c) Série específica: o caráter variável é apenas o fato
ou espécie. Também é chamada de série categórica.
Observe a tabela que registra as pessoas de dez anos ou
mais de idade que viviam em companhia de cônjuge
ou companheiro(a), por natureza da união, segundo as
Mesorregiões – Santa Catarina – Censo de 2000.
Tabela 1.5 – Pessoas de dez anos ou mais de idade que viviam em companhia de cônjuge
ou companheiro(a), por natureza da união, segundo as Mesorregiões – Santa Catarina –
Censo de 2000
Natureza da união Número de pessoas de dez anos ou mais de idade
Casamento civil e religioso 1.666.621
Só casamento civil 189.741
Só casamento religioso 85.543
União consensual 521.001
Fonte: IBGE (2010).
d) Séries conjugadas: também chamadas de tabelas de
dupla entrada. São apropriadas à apresentação de duas ou
mais séries de maneira conjugada, havendo duas ordens
de classificação: uma horizontal e outra vertical. Observe
a tabela a seguir, que registra a quantidade de mortes por
acidente de trânsito em São Paulo, nos anos de 1997 e 1998.
probabilidade_e_estatistica_1582.indb 36 19/07/12 11:11
37
Probabilidade e Estatística
Unidade 1
Tabela 1.6 – Quantidade de mortes por acidente de trânsito em São Paulo, nos anos de
1997 e 1998 (dados fictícios)
Idade 1997 1998
Até 10 anos 69 45
De 10 a 19 anos 212 165
De 20 a 49 anos 868 628
De 50 anos e mais 382 287
Idade Ignorada 51 40
Fonte: Elaboração do autor (2006).
As séries conjugadas ainda podem ser geográfico-
temporal e geográfico-específica.
Síntese
Nesta unidade, você estudou conceitos básicos e introdutórios da
Estatística. Também conheceu quais são as etapas do processo de
uma pesquisa para que se possa alcançar um resultado fiel, que
traduza a realidade.
Você pôde estudar alguns conceitos importantes como
população e amostra, variáveis, dados e séries. Todos estes novos
conhecimentos serão muito importantes para você dar sequência
ao estudo da Estatística.
probabilidade_e_estatistica_1582.indb 37 19/07/12 11:11
38
Universidade do Sul de Santa Catarina
Atividades de autoavaliação
Ao final de cada unidade, você realizará atividades de autoavaliação. O
gabarito está disponível no final do livro didático, mas se esforce para
resolver as atividades sem a ajuda do gabarito, pois, assim, você estará
promovendo (e estimulando) a sua aprendizagem.
1) Analise os conceitos de censo e estimação e descreva a principal
diferença entre os termos.
2) Ao escolher os elementos de uma amostra, o que você deve considerar
para que ela seja representativa? Por quê?
probabilidade_e_estatistica_1582.indb 38 19/07/12 11:11
39
Probabilidade e Estatística
Unidade 1
3) Como você pôde acompanhar, existem dois tipos de variáveis: a
qualitativa, que está dividida em nominal e ordinária, e a quantitativa,
que está dividida em contínua e discreta. Identifique, no seu dia a dia,
pelo menos um exemplo de cada uma destas variáveis e as escreva no
quadro a seguir:
Variável Exemplo
Qualitativa nominal
Qualitativa ordinal
Quantitativa discreta
Quantitativa contínua
4) Ao planejar uma pesquisa sobre uma determinada síndrome, um
pesquisador tem a intenção de usar um questionário para a coleta de
dados e, também, planeja fazer levantamento de dados no Ministério
da Saúde, para que possa realizar comparativos. Como consequência
disto, ele terá que trabalhar com dois tipos de dados: os resultantes
dos questionários e os resultantes do levantamento no Ministério.
Classifique os dois tipos de dados.
a) Os dados coletados por meio de questionário são: ________________
b) Os dados coletados no Ministério:_____________________________
probabilidade_e_estatistica_1582.indb 39 19/07/12 11:11
40
Universidade do Sul de Santa Catarina
5) Classifique cada uma das variáveis a seguir em qualitativa nominal ou
ordinal e em quantitativa discreta ou contínua:
Descrição da variável Classificação
Saldo em conta corrente em R$
Idade do cliente
Sexo do cliente
Classe econômica
Estado civil
Número de defeitos do produto
Consumo de energia em kWh
Grau de instrução
Número de filhos
Hierarquia de uma empresa
Número de filhos de uma família
Diâmetro da peça produzida
Comprimento da peça
Tempo de espera em caixa eletrônico
em minutos
Nome de país exportador de petróleo
Grau de satisfação no atendimento
numa loja comercial
Número de ações negociadas na
bolsa de valores
Número de alunos de uma
universidade
Altura dos funcionários de uma
empresa
probabilidade_e_estatistica_1582.indb 40 19/07/12 11:11
41
Probabilidade e Estatística
6) Observe as duas tabelas a seguir e classifique as séries estatísticas de
cada uma delas.
Tabela A – Pessoas de dez anos ou mais de idade, por estado civil e condição de
convivência – Santa Catarina – Censo de 2000
Estado civil Casado(a)
Desquitado(a)
ou separado(a)
judicialmente
Divorciado(a) Viúvo(a) Solteiro(a)
Mesorregiões
Grande Florianópolis 267.867 18.697 16.779 28.224 333.974
Norte Catarinense 380.222 21.098 13.630 38.037 379.194
Oeste Catarinense 439.967 16.130 9.174 38.856 399.587
Serrana 142.373 6.738 4.814 15.834 150.964
Sul Catarinense 314.348 14.021 12.068 32.261 302.894
Vale do Itajaí 443.839 25.825 20.433 46.595 439.800
Fonte: IBGE (2010).
Tabela B – Metabolismo basal (cal/dia) em adolescentes (dados fictícios)
Metabolismo basal (cal/dia) Número de adolescentes
910 |-- 989 3
989 |-- 1068 5
1068 |-- 1147 9
1147 |-- 1226 5
1226 |-- 1305 8
1305 |-- 1384 3
1384 |-- 1463 2
Fonte: Elaboração do autor (2006).
probabilidade_e_estatistica_1582.indb 41 19/07/12 11:11
42
Universidade do Sul de Santa Catarina
Saiba mais
Se você desejar, aprofunde os conteúdos estudados nesta unidade
ao consultar as seguintes referências:
CRESPO, Antônio Arnot. Estatística fácil. 19. ed. São Paulo:
Saraiva, 2009.
FONSECA, Jairo Simon da; MARTINS, Gilberto de Andrade.
Curso de estatística. 6. ed. São Paulo: Atlas, 1996.
RAUEN, Fábio. Roteiro de pesquisa. Rio de Sul: Nova Era,
2006.
SILVA, Ermes Medeiros da. Estatística para os cursos de
economia, administração e ciências contábeis. 3. ed. São Paulo:
Atlas, 1996. v. 1.
TRIOLA, Mario F. Introdução à estatística. 7. ed. Rio de
Janeiro: LTC, 1999.
probabilidade_e_estatistica_1582.indb 42 19/07/12 11:11
2UNIDADE 2Distribuição de frequências e representação gráfica
Objetivos de aprendizagem
� Organizar dados brutos de acordo com os tipos de
variáveis.
� Compreender, organizar e analisar a distribuição de
frequência.
� Montar tabelas de distribuição de frequência para
variáveis qualitativas e quantitativas.
� Analisar e interpretar gráficos.
Seções de estudo
Seção 1 Representação numérica
Seção 2 Tipos de frequência
Seção 3 Representação gráfica
probabilidade_e_estatistica_1582.indb 43 19/07/12 11:11
44
Universidade do Sul de Santa Catarina
Para início de estudo
Nesta unidade, você vai trabalhar com a organizaçãodos dados
estatísticos propriamente ditos.
De posse dos dados de forma desorganizada, um primeiro passo
seria organizá-los em tabelas para que possibilite uma primeira
análise, além de servir para uma série de interpretações. Você
poderá aprender como se organizam dados brutos e como pode
ser analisada a distribuição de frequências.
Você também terá a oportunidade de adquirir mais uma
importante ferramenta para utilizar na análise e interpretação de
dados: a representação gráfica. Você irá conhecer alguns tipos de
representação gráfica mais utilizados e suas características.
Poderá constatar que os dados representados por meio de
gráficos, muitas vezes, facilitam a leitura e a compreensão de
algum fenômeno ou acontecimento.
Seção 1 – Representação numérica
Para iniciar o estudo desta unidade, antes de qualquer coisa, você
precisa saber o que são dados brutos e dados agrupados.
Dados brutos
Dados brutos são sequências de valores numéricos
ou não, os quais não sofreram qualquer tratamento
estatístico, nem foram organizados, obtidos
diretamente da observação de um fenômeno.
probabilidade_e_estatistica_1582.indb 44 19/07/12 11:11
45Unidade 2
Probabilidade e Estatística
Mais precisamente, dados brutos são os dados apresentados
da forma como foram coletados na pesquisa ou levantamento,
desorganizados, sem ordenação.
Acompanhe os exemplos de levantamento de dados de acordo
com o tipo de variável: qualitativa, quantitativa discreta ou
quantitativa contínua.
Para uma variável qualitativa
Em um levantamento realizado com 56 clientes de um banco,
foram obtidos os seguintes dados sobre o tipo de investimento em
que mais confiavam, conforme legenda:
I M R P I I P R
P R I P P I R I
P P P M I P P P
M P I I I M P R
M R R P M M P R
I R M P P I R P
M P I P P M P I
Quadro 2.1 – Levantamento sobre o tipo de investimento que os clientes do banco mais confiavam
Fonte: Elaboração do autor (2006).
Legenda do quadro:
I – Investimentos imobiliários
M – Investimento em mercado de ações
P – Investimento em poupança
R – Investimento em fundos de renda fixa
Repare que, neste caso, foram pesquisados 56 clientes e foram
anotadas as respostas na ordem das entrevistas.
Para uma variável quantitativa discreta
O controle de qualidade de uma fábrica de rolamentos vem
analisando os lotes para detectar defeitos nas peças fabricadas.
Cada lote contém 56 peças. A seguir, está relacionado o número
de defeitos por peça, conforme estas são produzidas neste lote:
probabilidade_e_estatistica_1582.indb 45 19/07/12 11:11
46
Universidade do Sul de Santa Catarina
1 1 4 1 0 0 1 6
5 0 0 0 0 0 0 0
0 1 0 0 1 0 3 2
4 2 0 0 2 0 1 0
0 0 3 3 0 0 4 0
0 1 0 2 0 0 1 0
3 0 0 0 3 0 0 0
Quadro 2.2 – Levantamento sobre o número de defeitos por peça de uma fábrica de rolamentos
Fonte: Elaboração do autor (2006).
Repare que foram analisadas 56 peças e foram anotados os
números de defeitos por peça, na ordem em que estas foram
produzidas.
Para uma variável quantitativa contínua
Os valores anotados a seguir representam o volume de vendas
mensal de 56 representantes de uma empresa que fabrica
remédios. Os valores estão em milhares de reais:
23,25 27,43 17,76 33,33 33,05 16,08 34,49 23,74
32,63 20,58 18,50 16,69 16,43 20,08 19,00 16,13
21,36 26,60 22,49 22,77 23,05 33,55 22,73 24,89
24,11 34,83 21,73 31,53 35,13 34,36 20,80 16,84
29,55 34,76 31,72 24,89 21,65 22,65 30,43 30,93
17,25 17,05 19,67 22,79 25,30 23,08 25,77 35,03
16,59 15,90 20,30 33,86 17,76 30,93 20,81 29,05
Quadro 2.3 – Levantamento sobre o volume de vendas mensal de 56 representantes de uma
empresa que fabrica remédios
Fonte: Elaboração do autor (2006).
Dados agrupados
Dados agrupados são sequências de valores numéricos, ou não, os
quais se encontram já organizados, ou por semelhança (qualitativas),
ou por ordenação numérica (quantitativas), em tabelas.
probabilidade_e_estatistica_1582.indb 46 19/07/12 11:11
47
Probabilidade e Estatística
Unidade 2
Tabelas para variável qualitativa
Para montar uma tabela com variável qualitativa, acompanhe o
exemplo, a seguir, de um levantamento de dados acerca do tipo
de investimento em que os clientes de um banco mais confiavam.
Veja passo a passo
1º passo: para começar, você deve organizar os dados por
semelhança.
I I I I I I I I
I I I I I I M M
M M M M M M M M
P P P P P P P P
P P P P P P P P
P P P P P P R R
R R R R R R R R
Quadro 2.4 – Levantamento sobre o tipo de investimento que os clientes do banco mais confiavam
Fonte: Elaboração do autor (2006).
Legenda do quadro:
I – Investimentos imobiliários
M – Investimento em mercado de ações
P – Investimento em poupança
R – Investimento em fundos de renda fixa
Repare que os dados estão organizados por tipo de investimento.
2º passo: agora você vai escrever, em uma coluna, cada uma das
opções verificadas. Contar o número de vezes em que cada tipo
aparece e marcar com traços, ao lado, para representar as aparições.
Em seguida, conte o número de traços para obter o número de vezes
que cada opção aparece. Observe, a seguir, a contagem dos dados.
I = 14
M = 10
P = 22
R = 10
probabilidade_e_estatistica_1582.indb 47 19/07/12 11:11
48
Universidade do Sul de Santa Catarina
3º passo: após a contagem e organização dos dados, agora é só
montar a tabela, sem esquecer nenhum de seus componentes.
Acompanhe:
Tabela 2.1 – Tipos de investimento
Tipo de investimento Número de clientes
Imobiliário 14
Mercado de ações 10
Poupança 22
Fundos de renda fixa 10
Total 56
Fonte: Elaboração do autor (2006).
Essas tabelas são denominadas de distribuição de
frequências.
Tabelas para variável quantitativa discreta
Nesta seção, vamos verificar como montar uma tabela com
variável quantitativa discreta. Para saber como são montados
estes tipos de tabela, acompanhe os passos apresentados a seguir.
Observe que a opção de montar uma tabela sem
intervalos se deve ao fato de esta série ter um número
de elementos distintos pequeno.
probabilidade_e_estatistica_1582.indb 48 19/07/12 11:11
49
Probabilidade e Estatística
Unidade 2
Veja passo a passo
1º passo: para começar organize os dados em ordem crescente.
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 1 1 1 1 1 1 1
1 1 2 2 2 2 3 3
3 3 3 4 4 4 5 6
Quadro 2.5 – Levantamento sobre o número de defeitos por peça de uma fábrica de rolamentos
Fonte: Elaboração do autor (2006).
Repare que foram organizados conforme uma ordem numérica
crescente (de 0 a 6).
2º passo: escreva, em uma coluna, cada um dos valores observados.
Conte o número de vezes em que cada tipo aparece e marque com
traços, ao lado, para representar as aparições. Após, conte o número
de traços para obter o número de vezes em que cada valor aparece.
Observe, a seguir, a contagem dos dados.
0 33
1 9
2 4
3 5
4 3
5 1
6 1
A organização de dados na
forma de lista em ordem –
crescente ou decrescente
–, é chamada de Rol.
probabilidade_e_estatistica_1582.indb 49 19/07/12 11:11
50
Universidade do Sul de Santa Catarina
3º passo: agora é só montar a tabela, sem esquecer nenhum de seus
componentes.
Tabela 2.2 – Número de defeitos por peças analisadas do lote
Fonte: Elaboração do autor (2006).
Nesta tabela, utilizamos algumas expressões estatísticas para
representação dos elementos:
� os valores que a variável pode assumir é representado por xi;
� o número de observações de cada linha chama-se de
frequência simples, denotada por fi; e
� o número total de observações chama-se de frequência
total e pode ser denotada por N (tamanho da população),
n (tamanho da amostra) ou .
probabilidade_e_estatistica_1582.indb 50 19/07/12 11:11
51
Probabilidade e Estatística
Unidade 2
Tabelas para variável quantitativa contínua
A opção de montar uma tabela com intervalos é preferível porque
esta série possui um grande número de elementos distintos
ou, ainda, quando os valores apresentam uma natureza decontinuidade. Vamos acompanhar um exemplo para montagem
das tabelas para variável quantitativa contínua.
Os valores anotados a seguir representam o volume
de vendas mensal de 56 representantes de uma
empresa que fabrica remédios. Os valores estão em
milhares de reais.
Veja passo a passo
1º passo: para começar, você deve organizar os dados em ordem
crescente (Rol).
15,90 16,08 16,13 16,43 16,59 16,69 16,84 17,05
17,25 17,76 17,76 18,50 19,00 19,67 20,08 20,30
20,58 20,80 20,81 21,36 21,65 21,73 22,49 22,65
22,73 22,77 22,79 23,05 23,08 23,25 23,74 24,11
24,89 24,89 25,30 25,77 26,60 27,43 29,05 29,55
30,43 30,93 30,93 31,53 31,72 32,63 33,05 33,33
33,55 33,86 34,36 34,49 34,76 34,83 35,03 35,13
Quadro 2.6 – Levantamento sobre o volume de vendas mensal de 56 representantes de uma
empresa que fabrica remédios
Fonte: Elaboração do autor (2006).
Para a variável
quantitativa contínua,
utilizam-se intervalos na
tabela para representar
a série de dados. Estes
intervalos denominam-se
intervalos de classes.
probabilidade_e_estatistica_1582.indb 51 19/07/12 11:11
52
Universidade do Sul de Santa Catarina
2º passo: você deve calcular o número e o tamanho dos intervalos.
O número de intervalos (k) é obtido a partir dos seguintes
critérios:
� critério da raiz ;
� fórmula de Sturges k = 1 + 3,3.log n;
Sendo n = tamanho da amostra (poderá ser usado N, quando for
com a população).
Observe que:
1. Ainda que existam dois critérios, em geral, o critério
utilizado é o da raiz: .
2. O número do intervalo (k), em alguns casos, pode ser
predefinido.
3. As tabelas devem ter, no mínimo, 5 e, no máximo,
20 intervalos de classes, para que não haja nem perda,
nem excesso de informação.
Para este estudo, sendo n o número de elementos da amostra,
n = 56, e , então , logo k = 7 e o número de
intervalos utilizados será igual a 7.
Agora, vamos analisar as amplitudes e os limites de classe para
determinar o tamanho dos intervalos.
a) Amplitude total da distribuição (AT): é a diferença entre o
maior valor e o menor valor observado.
AT = L(máx) – l(mín)
L(máx) = Limite máximo (maior valor)
l(min) = Limite mínimo (menor valor)
probabilidade_e_estatistica_1582.indb 52 19/07/12 11:11
53
Probabilidade e Estatística
Unidade 2
No exemplo que você está estudando:
AT = 35,13 − 15,90 AT = 19,23 19,50
Nesta etapa, é conveniente que o resultado seja
arredondado para cima, a fim de que não haja perda de
informação.
b) Amplitude de um intervalo de classe (h): também chamada
de tamanho do intervalo de classe, é obtida da seguinte forma:
No exemplo:
Antes de partir para a construção da tabela, é conveniente testar
se os cálculos estão corretos. Para que isso aconteça, verifique se:
h.K > AT
Aplique sobre o exemplo dado:
2,80 . 7 = 19,60 > 19,23
Ou seja, ao somar 19,60 ao menor valor observado resulta 35,50,
que é maior que o valor da maior observação, 35,13.
15,90 + 19,60 = 35,50 > 35,13
Caso não seja satisfeita esta condição, será necessário fazer um
ajuste, aumentando o tamanho do intervalo. Então, resumindo,
segundo o exemplo dado, a tabela terá:
probabilidade_e_estatistica_1582.indb 53 19/07/12 11:11
54
Universidade do Sul de Santa Catarina
� sete intervalos;
� cada um com o tamanho de 2,80.
c) limites de classes: são os extremos de cada classe. O limite
inferior da classe (Li) é o menor número do intervalo. O limite
superior (Ls) é o maior número do intervalo.
3º passo: escreva os intervalos da tabela.
Comece pela primeira classe, escreva o menor valor observado. 15,90
A este valor, some o h (2,8) e encontre o limite superior deste intervalo:
15,9 + 2,8 = 18,7. Você deve escrever na tabela: 15,90 |--- 18,70
Na segunda classe, repita o último valor da classe anterior (18,7), some
o h (2,8) e encontre o limite superior deste intervalo: 18,7 + 2,8 = 21,5.
Você pode escrever na tabela:
18,70 |--- 21,50
Na terceira classe, repita o último valor da classe anterior (21,5), some
o h (2,8) e encontre o limite superior deste intervalo: 21,5 + 2,8 = 24,3.
Você pode escrever na tabela:
21,50 |--- 24,30
Usando este procedimento para as outras classes, você terá os
seguintes intervalos a seguir, até a sétima classe:
24,30 |--- 27,10
27,10 |--- 29,90
29,90 |--- 32,70
Observe que os intervalos são escritos dessa forma:
15,90 |--- 18,70. O que significa?
A representação indica um intervalo fechado à esquerda e aberto
à direita Þ [15,90; 18,70), ou seja, os valores deste intervalo
chegam perto de 18,70, mas o valor 18,70 está no próximo
intervalo: 18,70 |--- 21,50; o valor 21,50 não está neste intervalo,
e sim no intervalo: 21,50 |---24,30. E assim por diante.
probabilidade_e_estatistica_1582.indb 54 19/07/12 11:11
55
Probabilidade e Estatística
Unidade 2
4º passo: agora é a vez de partir para a construção da tabela, sem
se esquecer de seus componentes. Primeiro monte a tabela e
escreva os intervalos.
Tabela 2.3 – Volume de vendas mensal, em milhares de reais, dos representantes de uma
empresa que fabrica remédios – outubro/2010
Classe Volume de vendas (em mil reais)
1 15,90 |--- 18,70
2 18,70 |--- 21,50
3 21,50 |--- 24,30
4 24,30 |--- 27,10
5 27,10 |--- 29,90
6 29,90 |--- 32,70
7 32,70 |--- 35,50
Fonte: Elaboração do autor (2006).
5º passo: agora é só contar e marcar o número de valores em cada
intervalo. É aconselhável marcar os limites dos intervalos no Rol e usar
os traços para indicar a contagem ou marcar como no quadro a seguir:
15,90 16,08 16,13 16,43 16,59 16,69 16,84 17,05
17,25 17,76 17,76 18,50 19,00 19,67 20,08 20,30
20,58 20,80 20,81 21,36 21,65 21,73 22,49 22,65
22,73 22,77 22,79 23,05 23,08 23,25 23,74 24,11
24,89 24,89 25,30 25,77 26,60 27,43 29,05 29,55
30,43 30,93 30,93 31,53 31,72 32,63 33,05 33,33
33,55 33,86 34,36 34,49 34,76 34,83 35,03 35,13
Quadro 2.7 – Volume de vendas mensais
Fonte: Elaboração do autor (2006).
probabilidade_e_estatistica_1582.indb 55 19/07/12 11:11
56
Universidade do Sul de Santa Catarina
Tabela 2.4 – Volume de vendas mensal, em milhares de reais, dos representantes de uma
empresa que fabrica remédios – outubro/2010
Classe Volume de vendas (em mil reais) Contagem
Nº de
representantes (fi)
1 15,9 18,7 12
2 18,7 21,5 8
3 21,5 24,3 12
4 24,3 27,1 5
5 27,1 29,9 3
6 29,9 32,7 6
7 32,7 35,5 10
Total ( ) 56
Fonte: Elaboração do autor (2006).
E, no final, a tabela fica como está apresentado a seguir:
Tabela 2.5 – Volume de vendas mensal, em milhares de reais, dos representantes de uma
empresa que fabrica remédios – outubro/2010
Fonte: Elaboração do autor (2006).
Até aqui, você estudou dois tipos de frequência: a simples e a total, e
pôde aprender que: o número de observações de cada linha chama‑se
frequência simples, fi; e o número total de observações chama‑se
frequência total, . Na seção a seguir, você irá aprender que,
além destas duas, existem outros tipos de frequência.
probabilidade_e_estatistica_1582.indb 56 19/07/12 11:11
57
Probabilidade e Estatística
Unidade 2
Seção 2 – Tipos de frequência
A Estatística tem como uma de suas finalidades facilitar a análise
e a leitura dos dados, e, justamente, para isso, um dos métodos
utilizados é trabalhar com tipos de frequência. Estes tipos de
frequência lhe serão apresentados a seguir.
Frequência acumulada
Na tabela, na coluna da frequência acumulada, você deverá
escrever o valor acumulado das frequências, ou seja, para
começar, repita a frequência simples da primeira linha e,
nas linhas seguintes, some a frequência simples à frequência
acumulada anterior.
Este processo deverá chegar até a frequência total
fa = fa(ant) + fi
Sendo:
fa: frequência acumulada;
fa(ant): frequência crescente da classe anterior;
fi: frequência simples da classe;
probabilidade_e_estatistica_1582.indb 57 19/07/12 11:11
58
Universidade do Sul de Santa Catarina
Acompanhe com atenção a tabela:
Tabela 2.6 – Volume de vendas
Fonte: Elaboraçãodo autor (2006).
Para que serve a frequência acumulada?
Imagine que você está apresentando um relatório de vendas da
empresa para a diretoria.
Então, um dos diretores lhe pergunta: “Quantos representantes
tiveram vendas menores que 29,9 mil reais?” Você não necessitará
fazer contas, é só observar a quinta classe, na coluna da
frequência acumulada na tabela e dizer: “40 representantes!”
E se perguntarem: “Quantos representantes venderam abaixo de
24,3 mil reais?” Você vai encontrar a resposta na terceira classe na
coluna com a frequência acumulada: “32 representantes”.
Observe que o volume de vendas questionado é sempre do limite
superior de cada intervalo para baixo.
probabilidade_e_estatistica_1582.indb 58 19/07/12 11:11
59
Probabilidade e Estatística
Unidade 2
Frequência relativa (fr)
É o quociente entre a frequência (fi) da classe e o número total de
observações.
Sendo:
fr: frequência relativa da classe;
fi: frequência simples da classe;
n: número total de observações (pode-se usar n ou ).
Neste caso, deve-se calcular a frequência com quatro
casas decimais visando ao próximo passo.
Tabela 2.7 – Volume de vendas
Fonte: Elaboração do autor (2006).
probabilidade_e_estatistica_1582.indb 59 19/07/12 11:11
60
Universidade do Sul de Santa Catarina
Lembre-se: use sempre quatro casas decimais para
arredondar a frequência relativa.
Frequência percentual (fp)
É a frequência relativa multiplicada por 100. É dada em
porcentagem (%).
fp = fr . 100
Sendo:
fp: frequência percentual;
fr: frequência relativa.
Tabela 2.8 – Volume de vendas
Fonte: Elaboração do autor (2006).
probabilidade_e_estatistica_1582.indb 60 19/07/12 11:11
61
Probabilidade e Estatística
Unidade 2
Observe que, ao usar quatro casas decimais para a frequência
relativa, o percentual ficou com duas casas decimais.
Para que serve a frequência percentual?
Mais uma vez você está apresentando um relatório de vendas da
empresa para a diretoria.
E vem aquela pergunta: “O que representa, do total, os
representantes que venderam de 32,70 a 35,50 mil reais?” Você
poderia responder diretamente, sem cálculos: “17,86%.”
E, se perguntarem: “Quantos representantes venderam de 24,3 a
27,1 mil reais ou mais?” Você responderá: “8,93%.”
Observe que, neste exemplo, o volume de vendas questionado é
sempre um intervalo. Antes de acompanhar os outros tipos de
frequência, entenda o que é ponto médio de uma classe.
Ponto médio de uma classe são os valores da variável
que se encontram exatamente na metade do intervalo
de cada classe.
Para calcular o ponto médio, usa-se a média aritmética simples
dos limites de cada intervalo:
Sendo:
PM: ponto médio;
Ls: limite superior do intervalo;
Li: limite inferior de cada intervalo.
probabilidade_e_estatistica_1582.indb 61 19/07/12 11:11
62
Universidade do Sul de Santa Catarina
A tabela a seguir indica o cálculo do ponto médio para o exemplo
que estamos estudando.
Tabela 2.9 – Volume de vendas
Fonte: Elaboração do autor (2006).
Lembre-se deste conceito: o ponto médio será usado
para outros cálculos que você irá realizar mais adiante.
Seção 3 – Representação gráfica
O gráfico constitui outra maneira de se apresentarem os dados
estatísticos. Eles têm a finalidade de mostrar com clareza,
veracidade e rapidez os dados que estão sendo estudados. Além
disso, os gráficos propiciam uma noção muito boa de como
algum fenômeno se comporta.
Por meio de formas geométricas, os gráficos mostram, por área
ou volume, as diferenças entre as opções de cada variável.
probabilidade_e_estatistica_1582.indb 62 19/07/12 11:11
63
Probabilidade e Estatística
Unidade 2
Tome cuidado ao interpretar um gráfico. Assim
como os gráficos podem dar informações rápidas e
precisas, sua manipulação pode distorcer a realidade,
provocando tendenciosidade nas informações.
Observe os gráficos a seguir:
Gráfico 2.1 – Censo demográfico Brasil 1890 – 2000
Fonte: IBGE (2010).
Gráfico 2.2 – Censo demográfico Brasil 1890 – 2000
Fonte: IBGE (2010).
probabilidade_e_estatistica_1582.indb 63 19/07/12 11:11
64
Universidade do Sul de Santa Catarina
Observe que, no Gráfico 2.1, a impressão é que a população
aumenta abruptamente, enquanto que, no Gráfico 2.2, a
impressão é que a população aumenta lentamente. E a única
diferença entre os dois gráficos é a largura que se usou para cada
um deles. Em alguns casos, isso pode ser muito prejudicial.
Os gráficos comunicam as mesmas ideias das tabelas, porém
produzem uma impressão e compreensão mais rápida, mais viva,
pois eliminam detalhes desnecessários, visualizando somente as
características mais importantes dos dados.
O gráfico estatístico é uma forma de apresentação dos
dados estatísticos, cujo objetivo é o de produzir, no
investigador ou no público em geral, uma impressão
mais rápida e viva do fenômeno em estudo, já que os
gráficos falam mais rápido à compreensão que as séries.
A representação gráfica de um fenômeno deve obedecer a certos
requisitos fundamentais para ser realmente útil:
a) simplicidade: o gráfico deve ser destituído de detalhes
de importância secundária, assim como de traços
desnecessários que possam levar o observador a uma
análise morosa ou com erros;
b) clareza: o gráfico deve possibilitar uma correta
interpretação dos valores representativos do fenômeno
em estudo;
c) veracidade: o gráfico deve expressar a verdade sobre o
fenômeno em estudo.
Para a construção de gráficos, você deverá observar alguns itens
que se fazem necessários neles:
� todo gráfico deve ter título e fonte (no rodapé), para que
o leitor não tenha a necessidade de voltar ao texto para
saber do que se trata;
� a escala do eixo horizontal deve ser escrita abaixo desse
eixo e deverá crescer da esquerda para a direita;
probabilidade_e_estatistica_1582.indb 64 19/07/12 11:11
65
Probabilidade e Estatística
Unidade 2
� a escala do eixo vertical deve ser escrita à esquerda do
eixo e crescer de baixo para cima;
� cada eixo deve ser identificado com o que está sendo
medido ou representado;
� não é necessário colocar linhas de grade (que saem das
marcas das escalas horizontais e verticais). Estas são
opcionais.
Acompanhe, a seguir, um gráfico com todos os detalhes citados.
Gráfico 2.3 – Censo demográfico – Brasil – 1890 – 2000
Fonte: Adaptado de IBGE (2010).
Antigamente, os gráficos eram feitos a mão, com a ajuda de
régua, compasso, transferidor, esquadros e canetas ou giz
coloridos. Hoje, podemos contar com softwares específicos que
auxiliam e facilitam na construção de gráficos e, muitas vezes,
propiciam mais precisão e clareza. Além dos softwares específicos
de Estatística, temos os programas aplicativos de escritório, que
incluem as chamadas planilhas eletrônicas.
Uma planilha eletrônica utiliza tabelas para a realização de
cálculos e permite, também, a criação de vários tipos de gráficos,
o que facilita a representação e análise de dados estatísticos.
Os principais tipos de gráficos são os diagramas, os cartogramas
e os pictogramas.
probabilidade_e_estatistica_1582.indb 65 19/07/12 11:11
66
Universidade do Sul de Santa Catarina
Na sequência deste estudo, você conhecerá alguns tipos de gráficos
relevantes para a apresentação dos dados estatísticos. Vamos identificar
cada tipo de gráfico, suas características e formas de análise, quando
for o caso. Dentre os gráficos classificados como diagramas, os mais
amplamente utilizados (e destacados a seguir) são os gráficos de
colunas e de barras. Os outros tipos de gráficos classificados como os
cartogramas e os pictogramas serão apresentados ao final desta seção.
Diagramas
Os diagramas são gráficos geométricos de, no máximo, duas
dimensões; para sua construção, em geral, fazemos uso do
sistema cartesiano (eixo X e Y). Os principais diagramas são os
gráficos de linhas, colunas, barras, setores ou pizza e o gráfico
polar. Veja cada um desses tipos.
Gráfico de colunas
É usado paraapresentar séries temporais, geográficas e
específicas. Formado por retângulos dispostos verticalmente, de
mesma largura (arbitrária), com altura proporcional às grandezas
(variáveis) do fenômeno a ser representado.
Todos os retângulos têm base comum no eixo de x e, no eixo de
y, os valores das variáveis estudadas. Observe os exemplos na
tabela 2.10 e nos gráficos 2.4 e 2.5.
Tabela 2.10 – Mortalidade Infantil, na região Sul e Sudeste, 2004
Estado Por mil nascimentos
SC 17,2
RG 14,3
PR 20,0
SP 16,5
RJ 20,9
ES 20,1
MG 21,8
Fonte: Portal Brasil (2004).
probabilidade_e_estatistica_1582.indb 66 19/07/12 11:11
67
Probabilidade e Estatística
Unidade 2
Gráfico 2.4 – Mortalidade Infantil, na região Sul e Sudeste, 2004
Fonte: Portal Brasil (2004).
Gráfico 2.5 – Porcentagem de mulheres, com filhos antes dos 20 anos, 2000
Fonte: Population Reference Bureau (2000).
probabilidade_e_estatistica_1582.indb 67 19/07/12 11:11
68
Universidade do Sul de Santa Catarina
Gráfico de barras
Segue as mesmas normas do gráfico de coluna, porém os
retângulos ocupam posição horizontal e, por isso, terão
base comum no eixo y. É também mais indicado para séries
geográficas e específicas.
Gráfico de linhas
É comum, para quem trabalha na área de administração e
negócios, observar o comportamento de uma variável ao longo do
tempo. Por exemplo, um executivo que acompanha a cotação diária
das ações da sua empresa, um gerente que acompanha o volume
semanal de vendas de sua loja ou um engenheiro de produção que
acompanha características de qualidade do produto que fabrica.
Gráfico de setores ou de pizza
É usado para mostrar a importância relativa das proporções e é
construído a partir das coordenadas polares:
� comparar a parte com o todo;
� é formado por um círculo, do qual cada parte representa
um percentual da variável.
Neste caso, utilizamos o mesmo exemplo do gráfico de barras, de
modo que você possa analisar as proporções no gráfico de setores.
Gráficos em colunas ou em barras múltiplas
Este tipo de gráfico é geralmente empregado quando queremos
representar, simultaneamente, dois ou mais fenômenos estudados
com o propósito de comparação.
probabilidade_e_estatistica_1582.indb 68 19/07/12 11:11
69
Probabilidade e Estatística
Unidade 2
Tabela 2.11 – Balança Comercial brasileira (Valores em US$ Milhões), 2005 a 2009
Ano Exportação Importação
2005 118.309 73.545
2006 137.807 91.350
2007 160.649 120.610
2008 197.953 173.148
2009 152.252 127.637
Fonte: Base de dados do Portal Brasil (2010).
Gráfico 2.6 – Balança comercial brasileira (Valores em US$ milhões), 2005 a 2009
Fonte: Portal Brasil (2010).
Análise dos dados: observando o gráfico, podemos
concluir que o saldo da balança comercial brasileira
é positivo, pois as colunas em cinza claro, que
representam as exportações em todos os anos, são
maiores que as colunas de cor cinza escuro que
representam as importações.
O ano que representou um maior volume de exportação e
também de importação foi o de 2008. O menor volume de
importação foi no ano de 2005.
probabilidade_e_estatistica_1582.indb 69 19/07/12 11:11
70
Universidade do Sul de Santa Catarina
Gráfico Polar
É o gráfico mais indicado quando temos necessidade de
representar variações cíclicas, ou seja, que se repetem em períodos
predeterminados.
O gráfico polar é mais utilizado em estudos climáticos (para
séries temporais).
Cartograma
O cartograma é a representação sobre um mapa. Este gráfico é
empregado quando o objetivo é o de figurar os dados estatísticos
diretamente relacionados com áreas geográficas ou políticas.
Pictogramas
Pictogramas são construídos a partir de figuras ou conjunto de
figuras representativas da intensidade ou das modalidades do
fenômeno.
São mais utilizados em jornais, revistas, cartazes e propagandas,
ou seja, quando se deseja dar um efeito mais atrativo ou chamar a
atenção, sem nenhum rigor científico.
Representação gráfica de uma distribuição
Alguns gráficos em Estatística são usados para interpretações
de informações, análises de dados e, também, para a dedução
geométrica de fórmulas de algumas medidas importantes.
Para as distribuições de frequências simples, são utilizados o
histograma e o polígono de frequências. E, para as frequências
acumuladas, é utilizado o polígono de frequências acumuladas.
probabilidade_e_estatistica_1582.indb 70 19/07/12 11:11
71
Probabilidade e Estatística
Unidade 2
Histograma
Este gráfico é muito semelhante ao de colunas, ou seja, é formado
por um conjunto de retângulos justapostos, de maneira que a
altura de cada retângulo seja proporcional à frequência simples da
classe por ele representada.
É construído no sistema de eixos cartesianos. No eixo horizontal,
são marcados os valores ou intervalos das classes assumidos pela
variável. No eixo vertical, são marcadas as frequências simples,
que servirão para marcar a altura dos retângulos, indicando,
assim, o número de observações (ocorrências) de cada valor ou
classe da variável.
Como a altura de cada retângulo é proporcional à frequência
simples, a área de cada retângulo também o é. Considerando
isso, a soma das áreas dos retângulos também é proporcional à
frequência total.
Como construir um histograma?
Siga os seguintes passos:
� desenhe os eixos vertical e horizontal;
� faça as escalas em cada um dos eixos – no horizontal, os
intervalos de classe; e, no vertical, a frequência;
� desenhe os retângulos que representam cada intervalo
com a mesma largura de cada intervalo e com a altura
proporcional às frequências dos intervalos;
� não se esqueça de escrever o título e a fonte.
probabilidade_e_estatistica_1582.indb 71 19/07/12 11:11
72
Universidade do Sul de Santa Catarina
Observe o exemplo na tabela 2.12 e no gráfico 2.7.
Tabela 2.12 – Quantidade de óxido de enxofre
Quantidade de óxido de enxofre Nº de meses (fi)
6,2 |--- 9,9 6
9,9 |--- 13,6 10
13,6 |--- 17,3 11
17,3 |--- 21,0 20
21,0 |--- 24,7 13
24,7 |--- 28,4 7
28,4 |--- 32,1 3
Total 70
Fonte: Elaboração do autor (2006).
Gráfico 2.7 – Emissão de óxido de enxofre nos últimos 70 meses (em toneladas)
Fonte: Elaboração do autor (2006).
Há uma analogia dos histogramas com os gráficos de barras.
Mas, nos gráficos de barras, não há necessidade de se usar escala
horizontal contínua, além de não ser necessária a rigidez de
construção que têm os histogramas.
probabilidade_e_estatistica_1582.indb 72 19/07/12 11:11
73
Probabilidade e Estatística
Unidade 2
Polígono de frequências
Unindo por linhas retas os pontos médios das bases superiores
dos retângulos do histograma, obtém-se outra representação dos
dados, denominada polígono de frequências.
Você pode observar que a área do histograma é igual à área
abaixo do polígono de frequências, ou seja, os retângulos
que ficam fora são compensados pelos triângulos que estão
adicionados por dentro.
Gráfico 2.8 – Emissão de óxido de enxofre – em toneladas
Fonte: Elaboração do autor (2006).
probabilidade_e_estatistica_1582.indb 73 19/07/12 11:11
74
Universidade do Sul de Santa Catarina
Síntese
Nesta unidade, você estudou como organizar e agrupar dados,
como construir tabelas com todos seus elementos e, também,
como acrescentar informações às tabelas que auxiliem sua
leitura. Aprendeu a montar tabelas com dados quantitativos, e
sempre que precisar trabalhar com esses dados, você vai recorrer
às tabelas de frequências. Este conhecimento será bastante útil
quando for preciso apresentar algum relatório, e as pessoas para
quem o apresenta levantarem alguns questionamentos.
Ter conhecimento de como interpretar uma tabela permite que
você tenha acesso rápido às respostas com a devida precisão.
Nessa unidade, você estudou, também, como os gráficos
facilitam a nossa vida. Com eles, temos acesso rápido e claro às
informações, sem necessidade de grandes cálculos.
Mas um alerta importante que não pode ser esquecido é queapenas a qualidade e a clareza do gráfico dão condição para um
bom trabalho, afastando toda possibilidade de tendenciosidade.
Nesta unidade, você pôde estudar diferentes tipos de diagramas
e conhecer o que são os pictogramas e os gráficos representativos
de distribuição de frequências. Com tudo isso, agora você já tem
condições de realizar algumas análises rápidas de diversos tipos
de gráficos.
probabilidade_e_estatistica_1582.indb 74 19/07/12 11:11
75
Probabilidade e Estatística
Unidade 2
Atividades de autoavaliação
Ao final de cada unidade, você realizará atividades de autoavaliação. O
gabarito está disponível no final do livro didático, mas se esforce para
resolver as atividades sem a ajuda do gabarito, pois, assim, você estará
promovendo (e estimulando) a sua aprendizagem.
1) Um relatório recente distinguiu em seis tipos os principais motivos de
tensão (estresse). A pesquisa realizada para provar isso resultou nos
dados a seguir (dados fictícios):
MP MC DO DG MF
DM MF MP DG MC
MC MF MF MC MC
MF MC MP DO MP
MP MP DM MP DO
MP DM DG DM MC
MF MF MF MF MF
DO MP DG MP DG
MF MC MF MP DO
DO DO DM MF MC
MF DM MC MC DG
DO MF DG MF MC
Legenda: tipos de fobias
MF: Morte de um filho;
MC: Morte do cônjuge;
MP: Morte dos pais ou irmãos;
DO: Divórcio;
DG: Doença grave;
DM: Demissão.
Monte a tabela não esquecendo de todos seus componentes.
probabilidade_e_estatistica_1582.indb 75 19/07/12 11:11
76
Universidade do Sul de Santa Catarina
2) Uma empresa procurou estudar a ocorrência de acidentes com seus
empregados, tendo, para isso, realizado levantamento abrangendo um
período de 36 meses. No levantamento, foi observado o número de
operários acidentados para cada mês. Os dados correspondentes são:
4 8 6 6 4 5
6 5 8 5 6 5
8 5 7 6 8 7
3 3 4 4 3 3
5 5 4 6 5 5
7 7 6 8 8 7
Levando em consideração os dados apresentados, monte a tabela
com as variáveis quantitativa discreta. Procure incluir todos os seus
componentes.
3) Os dados a seguir representam a renda de uma amostra de famílias de
um bairro de classe baixa de Florianópolis, em reais (dados fictícios).
Construa a tabela de distribuição de frequências sem esquecer de
nenhum de seus elementos. Usar k = 6 (número de intervalos).
Sugestão: ao calcular o h (tamanho de cada intervalo), arredonde para
um número inteiro. Exemplo: 3,84 4
115 121 117 124 122 116
123 118 123 119 123 126
128 122 112 125 124 126
125 121 129 127 128 129
113 115 116 124 119 118
126 129 116 127 123 121
probabilidade_e_estatistica_1582.indb 76 19/07/12 11:11
77
Probabilidade e Estatística
Unidade 2
4) Os dados abaixo representam a renda de uma amostra de famílias de
um bairro de classe baixa de Florianópolis, em reais (dados fictícios).
Renda de famílias de um bairro da classe baixa de Florianópolis
Renda (R$) Nº de famílias f iacd
“abaixo de”
fiacid
“acima de”
fr fp (%) PM
112 |--- 115 2
115 |--- 118 6
118 |--- 121 4
121 |--- 124 9
124 |--- 127 8
127 |--- 130 7
Total (Σfi) 36
FONTE: Elaboração do autor (2006).
Complete a tabela com as frequências acumuladas direta e indireta, a
frequência relativa, percentual e o ponto médio. Depois responda as
perguntas:
a) Quantas famílias apresentam renda menor que 124?
______ (use a coluna da fiacd “abaixo de”)
b) Quantas famílias apresentam renda menor que 127?
______ (use a coluna da fiacd “abaixo de”)
c) Quantas famílias apresentam renda maior ou igual a 124?
______ (use a coluna da fiacd “acima de”)
d) Quantas famílias apresentam renda maior ou igual a 127? ______
(use a coluna da fiacd “acima de”)
e) Qual foi o percentual de famílias com renda de 118 a 121 pontos?
______ (use a coluna da fp)
f) Qual foi o percentual de famílias com renda de 121 a 124 pontos?
______ (use a coluna da fp)
probabilidade_e_estatistica_1582.indb 77 19/07/12 11:11
78
Universidade do Sul de Santa Catarina
5) Uma empresa procurou estudar a ocorrência de acidentes com seus
empregados, tendo, para isso, a CIPA realizado um levantamento
abrangendo um período de 36 meses, em que foi observado o número de
operários acidentados para cada mês. A tabela abaixo resume estes dados:
Número de operários acidentados para cada mês
Número de
acidentados
Número de
meses
fiacd
“abaixo de”
fiaci
“acima de”
fr fp (%)
3 4
4 5
5 9
6 7
7 5
8 6
Total (Σfi) 36
Fonte: Elaboração do autor (2006).
Complete a tabela com as frequências acumulada direta e indireta, a
frequência relativa e a percentual. Depois responda as perguntas:
a) Em quantos meses a empresa teve um número de funcionários
acidentados menor que 6?
______ (use a coluna da fiacd “abaixo de”)
(observação: menor que 6 = 5, 4 e 3)
b) Em quantos meses a empresa teve um número de funcionários
acidentados menor ou igual a 6?
______ (use a coluna da fiacd “abaixo de”)
(observação: menor ou igual a 6 = 6, 5, 4 e 3)
c) Em quantos meses a empresa teve um número de funcionários
acidentados maior que 5?
______ (use a coluna da fiaci “acima de”)
(observação: maior que 5 = 6, 7 e 8)
d) Em quantos meses a empresa teve um número de funcionários
acidentados maior ou igual a 5?
______ (use a coluna da fiaci “acima de”)
(observação: maior ou igual a 5 = 5, 6, 7 e 8)
e) Qual foi o percentual de meses em que a empresa verificou 5
funcionários acidentados?
______ (use a coluna da fp)
f) Qual foi o percentual de meses em que a empresa verificou 7
funcionários acidentados?
______ (use a coluna da fp)
probabilidade_e_estatistica_1582.indb 78 19/07/12 11:11
79
Probabilidade e Estatística
Unidade 2
6) Procure, em jornais, revistas, cartazes, internet etc., três tipos de gráficos
diferentes, semelhantes aos que você estudou até agora, e os analise.
Não esqueça de procurar gráficos cujo tema seja relacionado ao seu
curso. Faça uma descrição sucinta de cada um deles e trace comentários
sobre tendências, maior proporção, maior alta, maior baixa etc.
7) A seguir, você tem uma distribuição de frequências e um sistema de
eixos. Construa o histograma e o polígono de frequências para essa
distribuição usando o sistema de eixos (não esqueça de todos os
componentes de um gráfico, inclusive as escalas dos eixos, título e
fonte): tempo de sono, em minutos, induzido em ratos por injeção de
um certo químico, na dosagem de 40 mg por quilo.
Tempo de sono (em min.) Número de ratos
7 |--- 12 2
12 |--- 17 6
17 |--- 22 17
22 |--- 27 9
27|--- 32 5
32 |--- 37 2
probabilidade_e_estatistica_1582.indb 79 19/07/12 11:11
80
Universidade do Sul de Santa Catarina
Saiba mais
Você quer aprofundar seus estudos sobre o conteúdo desta
unidade? A sugestão é que você pesquise em:
COSTA, Sérgio Francisco. Introdução ilustrada à estatística. 3.
ed. São Paulo: Harbra, 1998.
CRESPO, Antônio Arnot. Estatística fácil. 19. ed. São Paulo:
Saraiva, 2009.
FLEMMING, Diva Marília. Representações gráficas. São
José: Saint Germain, 2003.
LEVIN, Jack. Estatística aplicada às ciências humanas. São
Paulo: Habra, 1987.
NEUFELD, John L. Estatística aplicada à administração
usando excel. São Paulo: Prentice Hall, 2003.
SILVA, Ermes Medeiros da. Estatística para os cursos de
economia, administração e ciências contábeis. 3. ed. São Paulo:
Atlas, 1999. v. 1.
TOLEDO, Geraldo Luciano; OVALLE, Ivo Izidoro.
Estatística básica. 2. ed. São Paulo: Atlas, 1985.
TRIOLA, Mario F. Introdução à estatística. Rio de Janeiro:
LTC, 1999.
VIEIRA, Sonia. Princípios de estatística. São Paulo: Pioneira,
2003.
probabilidade_e_estatistica_1582.indb 80 19/07/12 11:11
3UNIDADE 3Medidas de posição e dispersão
Objetivos de aprendizagem
� Conhecer os tipos de medidas de posição.
� Calcular e interpretar a média, a moda e a mediana
para dados brutos e agrupados.
� Compreender e calcular separatrizes.
� Compreender os tipos de medidas de dispersão.
� Calcular e interpretar variância e desvio padrão para
dados brutos e agrupados.
Seções de estudo
Seção 1 Medidas de posição
Seção 2 Gráficos box-plot e ramo efolhas
Seção 3 Medidas de dispersão
Seção 4 Coeficiente de variação
probabilidade_e_estatistica_1582.indb 81 19/07/12 11:11
82
Universidade do Sul de Santa Catarina
Para início de estudo
Nessa unidade, você vai obter mais uma ferramenta para
auxiliá-lo a compreender e utilizar a Estatística no seu dia a dia
profissional. O objetivo aqui é estudar medidas importantes e
bastante utilizadas nos métodos estatísticos.
O cálculo de medidas como a média, a moda e a mediana, e os
conceitos apresentados nesta unidade, são de grande valia no
seu cotidiano profissional, pois lhe fornecerão dados que serão
pertinentes para o entendimento de algum fato ou acontecimento.
Chamamos essas medidas de medidas de posição.
Mas conhecer as interpretações destas medidas não basta por si só.
Através delas, podemos chegar a algumas conclusões, mas não são
suficientes para que possamos avaliar o comportamento dos dados.
Por isso, nesta unidade, você vai estudar, também, medidas que
irão auxiliá-lo na avaliação do comportamento das séries de
dados com relação a sua média. Chamamos essas medidas de
medidas de dispersão.
Está preparado(a)? Então inicie agora a leitura da seção a seguir!
Seção 1 – Medidas de posição
Muitas vezes você irá se deparar com uma massa de dados grande
o bastante para que a leitura e a análise se tornem muito difíceis.
E como fazer para tirar informações relevantes e resumir os
dados de forma eficaz nesses casos? Usando medidas estatísticas!
Nesta unidade, vamos ver algumas delas.
As medidas de posição, assim chamadas pela posição que
elas ocupam na série estatística, quando bem utilizadas e
interpretadas, podem ser úteis, não só por elas mesmas, mas
também, auxiliando o cálculo de outras medidas.
probabilidade_e_estatistica_1582.indb 82 19/07/12 11:11
83
Probabilidade e Estatística
Unidade 3
Além de tudo, ela facilita o estudo de grandes volumes de dados,
pois as medidas de posição podem resumir as informações, dando
a você uma noção do comportamento do todo. As medidas de
posição estão divididas da seguinte maneira:
a) medidas de tendência central: são valores da variável
que tendem a estar no centro da série, por isso o nome.
Refere-se ao valor da variável que está, senão no centro,
perto dele. Está dividia em três tipos: média, mediana e
moda.
b) separatrizes: são valores da variável que dividem a
série ordenada de dados em partes que contém a mesma
quantidade de observações.
Medidas de Tendência Central – Média
A média é uma das medidas mais importantes dentro da
Estatística. Ela é o ponto de equilíbrio de uma série de dados.
Veja a figura a seguir, extraída do livro Introdução à Estatística,
de Mário F. Triola (1999).
Figura 3.1 – A média como ponto de equilíbrio
Fonte: Triola (1999, p. 32).
Vários tipos de médias podem ser calculados para uma massa
de dados. A mais importante é a média aritmética, que você irá
estudar nessa seção.
probabilidade_e_estatistica_1582.indb 83 19/07/12 11:11
84
Universidade do Sul de Santa Catarina
A média aritmética é a soma de todos os elementos de uma série
de dados, dividida pelo número de elementos que compõe essa
série. Veja a seguir como representá-la.
Notação:
= média dos dados de uma amostra.
μ = média dos dados de uma população (em que μ = 12° letra do
alfabeto grego, “μ” lê-se como “mi”).
A média aritmética para dados brutos
Agora, você vai calcular a média para dados que não foram
organizados em tabelas, ou seja, estão conforme foram coletados,
brutos.
A soma de todos os valores, dividida pelo número de valores.
Em que:
n = número de valores da série (ou tamanho da amostra).
xi = valores da série.
Veja a seguir um exemplo bem detalhado para compreender
como realizar os cálculos.
Um exemplo bem típico é calcular a média das notas das provas.
Digamos que as notas de uma disciplina cursada por você sejam:
7; 7,8; 6 e 8, então a média será:
probabilidade_e_estatistica_1582.indb 84 19/07/12 11:11
85
Probabilidade e Estatística
Unidade 3
A média aritmética para dados agrupados
Agora, você vai calcular a média para dados que foram
organizados em tabelas, ou seja, após a coleta, eles foram
organizados em categorias e escritos em uma tabela.
Dados agrupados sem intervalos (variável discreta)
Para os dados agrupados (em tabela), sem intervalos, utiliza-se a
fórmula descrita a seguir, em que cada frequência simples pode
ser considerada como peso. Por isso que se chama, também, de
média aritmética ponderada (pesos).
A soma de todos os valores multiplicados por sua frequência
simples, dividida pela soma das frequências (frequência total).
Em que:
n = número de valores da série (ou tamanho da amostra)
xi = valores da série
fi = frequência simples de cada xi
Veja a seguir um exemplo. Calcule a média dos dados
representados na tabela a seguir:
Tabela 3.1 – Número de filhos por famílias de um bairro de Florianópolis
No de filhos
(xi)
No de famílias
(fi)
xi.fi
0 14 0
1 16 16
2 11 22
3 9 27
4 4 16
5 1 5
6 1 6
Total (Σfi) 56 92
Fonte: Elaboração do autor (2006).
0×14 = 0
1×16 = 16
2×11 = 22
3×9 = 27
Σxi.fi = 92
Somar as frequências simples
probabilidade_e_estatistica_1582.indb 85 19/07/12 11:11
86
Universidade do Sul de Santa Catarina
Veja a seguir como calcular passo a passo
Passo 1: some a coluna das frequências simples (fi) para obter Σfi
(frequência total).
= 56
Passo 2: multiplique cada xi por sua correspondente fi na coluna xi.fi.
Passo 3: some os valores calculados no passo 2 e escreva a soma no
final da coluna. Esse resultado é o Σxi.fi.
xi.fi = 92
Passo 4: divida o resultado do passo 3 (Σxi.fi) pelo resultado do
passo 1 (Σfi).
Como interpretar estes dados? O valor médio da série é 1,64,
ou seja, a média de filhos por família é de 1,64 filhos. Analisando
dessa maneira, pode parecer um absurdo, mas você pode concluir
que a média de filhos por família é de 1 a 2 filhos.
Dados agrupados com intervalos (variável contínua)
Para os dados agrupados em tabela, com intervalos, você deve
utilizar a fórmula descrita a seguir, semelhante àquela utilizada
para dados sem intervalos, entretanto, por estarmos usando
intervalos, usamos os pontos médios e não xi.
A soma de todos os pontos médios multiplicados por sua
frequência simples, dividida pela soma das frequências
(frequência total).
probabilidade_e_estatistica_1582.indb 86 19/07/12 11:11
87
Probabilidade e Estatística
Unidade 3
Em que:
n = número de valores da série (ou tamanho da amostra)
PM = ponto médio do intervalo
fi = frequência simples de cada intervalo
Quando trabalhamos com dados agrupados em intervalos,
passamos a trabalhar com a perda dos valores individuais, ou
seja, sabemos a frequência de cada intervalo, mas não sabemos
exatamente quais são os valores contidos nele (intervalo). Por
esse motivo, o cálculo da média, nesse caso, é feito com o uso do
ponto médio. A média, sendo assim, é um valor aproximado.
Veja o exemplo a seguir para compreender.
Veja a seguir como calcular passo a passo
Passo 1: some a coluna das frequências simples (fi) para obter Σfi
(frequência total).
= 56
Passo 2: calcule o ponto médio de cada intervalo. Você lembra?
Passo 3: multiplique cada PM por sua correspondente fi e escrever na
coluna PM.fi.
probabilidade_e_estatistica_1582.indb 87 19/07/12 11:11
88
Universidade do Sul de Santa Catarina
Passo 4: some os valores calculados no passo 3 e escreva a soma no
final da coluna; esse resultado é o ΣPM.fi.
ΣPMi.fi = 1386
Passo 5: divida o resultado do passo 4 (ΣPM.fi) pelo resultado do
passo 1 (Σfi).
Como interpretar o resultado? A quantidade média de óxido de
enxofre emitida, em 56 meses, foi de 24,75 toneladas.
Calcule a média dos dados representados como na tabela a seguir:
Tabela 3.2 – Quantidade emitida de óxido de enxofre (SO), em toneladas, pelas fábricas
do distrito industrial de Florianópolis
Qtde. de SO
(em ton.)
Nº de meses
(fi)
PM PM.fi
15,9 |--- 18,7 12 17,3 207,618,7 |--- 21,5 8 20,1 160,8
21,5 |--- 24,3 12 22,9 274,8
24,3 |--- 27,1 5 25,7 128,5
27,1 |--- 29,9 3 28,5 85,5
29,9 |--- 32,7 6 31,3 187,8
32,7 |--- 35,5 10 34,1 341
Total (Σfi) 56 1386
Fonte: Elaboração do autor (2006).
17,3×12 = 207,6
20,1×8 = 160,8
22,9×12 = 274,8
25,7×5 = 128,5
Σxi.fi = 92
Somar as
frequências simples
(15,9 + 18,7)⁄2 = 17,3
probabilidade_e_estatistica_1582.indb 88 19/07/12 11:11
89
Probabilidade e Estatística
Unidade 3
Medidas de Tendência Central – Mediana
A mediana é um valor que divide a série de dados em duas partes
iguais, ou seja, é o valor observado que está no meio da série.
Notação:
Me = Mediana (também é usado md).
Mediana para dados brutos
Agora, você vai calcular a mediana para dados que não foram
organizados em tabelas, ou seja, estão conforme foram coletados,
brutos. Após a ordenação crescente dos dados, determinamos o
número de elementos (n) do mesmo.
Separamos em dois casos:
a) quando o n (tamanho da amostra) é ímpar: o cálculo da
posição da mediana deve ser conforme segue:
b) quando o n (tamanho da amostra) é par: o cálculo da
posição da mediana deve ser realizado com a seguinte
fórmula:
e
probabilidade_e_estatistica_1582.indb 89 19/07/12 11:11
90
Universidade do Sul de Santa Catarina
Veja passo a passo como calcular a mediana para dados brutos quando
o (n) é ímpar
Calcular a mediana da série X: 5, 30, 27, 9, 15, 19, 24, 20, 31.
Passo 1: ordene os valores de forma crescente → 5, 9, 15, 19, 20, 24,
27, 30, 31.
Passo 2: o número de elementos é 9 (n = 9, ímpar).
Passo 3: calcule a posição da mediana.
Passo 4: a mediana é o 5º elemento.
Me = 20
1º 2º 3º 4º 5º 6º 7º 8º 9º
5 9 15 19 20 24 27 30 31
Como interpretar estes dados? 50% dos valores da série são
menores ou iguais a 20, e 50% dos valores da série são maiores ou
iguais a 20.
probabilidade_e_estatistica_1582.indb 90 19/07/12 11:11
91
Probabilidade e Estatística
Unidade 3
Veja passo a passo como calcular a mediana para dados brutos quando
o (n) é par
Para você encontrar a mediana, é preciso calcular o ponto médio
dos dois valores que ocupam as posições calculadas.
Calcular a mediana da série X: 5, 30, 27, 9, 15, 19, 24, 20.
Passo 1: ordene de forma crescente 5, 9, 15, 19, 20, 24, 27, 30.
Passo 2: o número de elementos é 8 (n = 8, par).
Passo 3: calcule a posição de Pos1 e Pos2.
Passo 4: a mediana está entre o 4º e o 5º elemento.
1º 2º 3º 4º 5º 6º 7º 8º
5 9 15 19 19,5 20 24 27 30
Como interpretar estes dados? 50% dos valores da série
são menores que 19,5, e 50% dos valores da série são valores
maiores que 19,5.
Você viu como se encontra a mediana para dados brutos?
Assim como você estudou na média, aqui, também para efeito
de cálculo, você usará diferente tratamento quando se tratar
de dados agrupados com intervalos (variável discreta) e dados
agrupados sem intervalos (variável contínua).
probabilidade_e_estatistica_1582.indb 91 19/07/12 11:11
92
Universidade do Sul de Santa Catarina
Medidas de posição usando o Excel
Mais uma vez, você poderá se deparar com um volume grande
de dados. O Microsoft Office Excel é muito útil para este tipo
de situação. Siga o pequeno roteiro para calcular as medidas de
tendência central no Excel:
Passo 1: Abrir o arquivo que está na midiateca de nome dados.xls,
usando o Excel;
Passo 2: Clique com o botão esquerdo do mouse no menu
“Ferramentas” e, se o item “Análise de dados” não estiver ativo no
menu, clique em “Suplementos”, conforme a imagem a seguir; caso
contrário, passe para o passo 4.
Figura 3.2 – Interface do programa Microsoft Office Excel 2003
Fonte: Adaptado pelo autor (2006).
Passo 3: Caso tenha clicado em “Suplementos”, a seguinte janela
abrirá, na qual você deverá marcar as opções “Ferramentas de
análise” e “Ferramentas de análise – VBA”, em seguida, clique em OK.
probabilidade_e_estatistica_1582.indb 92 19/07/12 11:11
93
Probabilidade e Estatística
Unidade 3
Figura 3.3 – Interface do programa Microsoft Office Excel 2003
Fonte: Adaptado pelo autor (2006).
Passo 4: Voltando ao menu “Ferramentas”, clique no item “Análise de
dados”, como mostra a Figura a seguir.
Figura 3.4 – Interface do programa Microsoft Office Excel 2003
Fonte: Adaptado pelo autor (2006).
probabilidade_e_estatistica_1582.indb 93 19/07/12 11:11
94
Universidade do Sul de Santa Catarina
Passo 5: Após o clique, irá abrir a seguinte janela, na qual você irá
selecionar o item “Estatística Descritiva” e clicar em OK.
Figura 3.5 – Interface do programa Microsoft Office Excel 2003
Fonte: Adaptado pelo autor (2006).
Passo 6: Na janela que se abre (mostrada adiante), você deve indicar
os dados a serem analisados, ou seja, no quadro ao lado do item
“Intervalo de entrada” devem aparecer as células que contêm os
dados. Selecione a coluna A (basta clicar com o mouse e arrastar, com
o botão pressionado, até o último quadrinho – célula) e tecle “Enter”.
Marque a opção “Resumo estatístico” e, após este procedimento,
você deve clicar em OK.
Figura 3.6 – Interface do programa Microsoft Office Excel 2003
Fonte: Adaptado pelo autor (2006).
probabilidade_e_estatistica_1582.indb 94 19/07/12 11:11
95
Probabilidade e Estatística
Unidade 3
Passo 7: Uma nova planilha é criada com as informações, conforme a
seguinte figura.
Figura 3.7 – Interface do programa Microsoft Office Excel 2003
Fonte: Adaptado pelo autor (2006).
Medidas de Tendência Central – Moda
A moda é um valor que mais se repete em uma série de dados, ou
seja, de maior frequência.
Notação:
Mo = Moda.
probabilidade_e_estatistica_1582.indb 95 19/07/12 11:11
96
Universidade do Sul de Santa Catarina
Moda para dados brutos
Agora, você vai encontrar a moda para dados que não foram
organizados em tabelas, ou seja, que estão conforme foram
coletados, brutos. A moda será o valor que mais se repete no
conjunto de dados.
Veja os exemplos:
Exemplo 1: X: 15, 16, 19, 20, 20, 22, 22, 22, 25, 26, 28.
O elemento que mais se repete é o 22, então, Mo = 22. Observe
que o número 20 se repete, mas não mais que o 22. Para esse
caso, no qual a Mo = 22, afirma-se que a série é unimodal.
Exemplo 2: X: 15, 16, 20, 20, 20, 22, 22, 22, 25, 26, 28.
Os elementos que mais se repetem são o 20 e o 22, então,
Mo1 = 20 e Mo2 = 22. Para esse caso, no qual temos duas modas
na série, afirma-se que a série é bimodal. Acima de duas modas,
é mais comum chamarmos a série de polimodal.
Exemplo 3: X: 20, 20, 22, 22, 25, 25, 28, 28.
Na série anterior, não temos um elemento que mais se repete,
pois todos têm a mesma frequência. Nesse caso, afirma-se que a
série é amodal.
Você viu como se encontra a moda para dados brutos. Assim
como você estudou na média, aqui, também para efeito de
cálculo, você usará diferente tratamento quando se tratar de
dados agrupados com intervalos (variável discreta) e dados
agrupados sem intervalos (variável contínua). Mas, para a
finalidade deste estudo, não será incluído.
Entre média, mediana ou moda: qual utilizar?
probabilidade_e_estatistica_1582.indb 96 19/07/12 11:11
97
Probabilidade e Estatística
Unidade 3
Não há uma resposta simples e objetiva para determinar a medida
que seja mais representativa. A seguir, você encontra um resumo
das vantagens e desvantagens de cada medida de tendência central:
Medida Definição Frequência
Existência Leva em
conta todos
os valores?
Afetada
pelos
valores
extremos?
Vantagens e
desvantagens
Média
Soma de todos os
valores divididos
pelo número de
valores.
Mais usada. Existe sempre. Sim. Sim.
Usada em toda
Estatística;
funciona bem
com muitos
métodos
estatísticos.
Mediana Valor que divide a série na metade.
Usada
comumente. Existe sempre. Não. Não.
Costuma ser
uma boa
escolha se há
alguns valores
extremos.
Moda
Valor que mais
se repete (maior
frequência).
Usada às
vezes.
Pode não
existir ou,
ainda, pode
haver mais de
uma.
Não. Não.
Apropriada para
dados ao nível
nominal.
Quadro 3.1 – Resumodas vantagens e desvantagens de cada medida de tendência central
Fonte: Elaboração do autor (2006).
Separatrizes
Na maioria dos casos, o pesquisador tem interesse em conhecer
outros aspectos relativos ao conjunto de valores, além de um valor
central ou valor típico. Algumas informações relevantes podem
ser obtidas através do conjunto de medidas: média, extremos,
quartís, decís, percentís etc. Veja, a seguir, mais detalhes e
exemplos de como calcular as separatrizes.
a) Quartís: divide uma série ordenada em quatro partes
iguais, ou seja, em partes de 25% cada.
Representação: Q1, Q2 e Q3.
Denominação: 1º quartil, 2º quartil e 3º quartil.
probabilidade_e_estatistica_1582.indb 97 19/07/12 11:11
98
Universidade do Sul de Santa Catarina
b) Decís: divide uma série ordenada em 10 partes iguais, ou
seja, em partes de 10% cada.
Representação: D1, D2, .... e D9.
Denominação: 1º decil, 2º decil, ... e 9º decil.
c) Percentil: divide uma série ordenada em 100 partes
iguais, ou seja, em partes de 1% cada.
Representação: P1, P2, .... e P99.
Denominação: 1º percentil, 2º percentil, ... e 99º percentil.
Note que a mediana também é uma separatriz. Você saberia dizer
com quais separatrizes podemos comparar? Veja:
Q2 = D5 = P50 = Me
Todas essas medidas dividem a série de dados pela metade.
» 50% dos valores são maiores que Q2 = D5 = P50 =
Me; e
» 50% dos valores são menores que Q2 = D5 = P50 =
Me.
Separatrizes para dados brutos
O procedimento é bastante semelhante ao da mediana. Preste
atenção nas explicações a seguir: após a ordenação crescente dos
dados (rol), determinamos o seu número de elementos (n).
Veja o exemplo passo a passo
Calcular Q1 para a série de dados X: 22, 15, 20, 22, 28, 20, 20,
22, 25, 26, 16.
Passo 1: ordene de forma crescente (rol) 15, 16, 20, 20, 20, 22, 22,
22, 25, 26, 28.
probabilidade_e_estatistica_1582.indb 98 19/07/12 11:11
99
Probabilidade e Estatística
Unidade 3
Passo 2: o número de elementos é 11 (n = 11, número ímpar). Aqui,
você deve adotar procedimento semelhante ao da mediana e deve
usar a mesma fórmula para calcular a posição. Lembre-se: a posição!
Assim, você irá encontrar a mediana, ou seja, o segundo quartil (Q2).
Passo 3: Pos = 6, ou seja, Q2 ocupa a 6ª posição.
1º 2º 3º 4º 5º 6º 7º 8º 9º 10º 11º
15 16 20 20 20 22 22 22 25 26 28
Observe que o Q2 = 22.
Interpretação para Q2 = 22: 50% dos valores da série são
menores ou iguais que 22, e 50% dos valores da série são maiores
ou iguais que 22. Antes do Q2, está formado um novo conjunto
de dados, mostrado a seguir:
1º 2º 3º 4º 5º
15 16 20 20 20
Neste caso, a mediana (desta nova série de dados) será o primeiro
quartil. É só repetir o mesmo processo feito nos passos 2 e 3.
Passo 4: o número de elementos é 5 (n = 5, ímpar).
probabilidade_e_estatistica_1582.indb 99 19/07/12 11:11
100
Universidade do Sul de Santa Catarina
Passo 5: Pos = 3, ou seja, Q1 ocupa a 3ª posição.
1º 2º 3º 4º 5º
15 16 20 20 20
Observe que o elemento que ocupa a terceira posição é o 20,
então, Q1 = 20.
Como interpretar estes dados? 25% dos dados observados são
menores ou iguais a 20. 75% dos valores observados são maiores
ou iguais a 20.
Observe que pode ser usado, também, para calcular a posição
do primeiro quartil e do terceiro, respectivamente, as seguintes
fórmulas:
Para o primeiro quartil
Para o terceiro quartil
Veja passo a passo como você pode calcular o terceiro quartil
Passo 1: o número de elementos é 11 (n = 11).
Passo 2: Pos = 9, ou seja, Q3 ocupa a 9ª posição.
1º 2º 3º 4º 5º 6º 7º 8º 9º 10º 11º
15 16 20 20 20 22 22 22 25 26 28
probabilidade_e_estatistica_1582.indb 100 19/07/12 11:11
101
Probabilidade e Estatística
Unidade 3
Observe que o elemento que ocupa a nona posição é o 25,
então, Q3 = 25.
Percentis
Observação: para calcular a posição dos percentis use a seguinte
fórmula:
Para o primeiro quartil
PPi = posição da separatriz.
N ou n = tamanho da população (ou amostra).
i = número da separatriz (ex.: P60 = i = 60).
Continuando com o mesmo exemplo, calcule o sexagésimo percentil.
Passo 1: o número de elementos é 11 (n = 11) e o i = 60.
Passo 2: PP60 = 7,2, ou seja, P60está entre a 7ª e a 8ª posições.
1º 2º 3º 4º 5º 6º 7º PP60 8º 9º 10º 11º
15 16 20 20 20 22 22 P60 22 25 26 28
probabilidade_e_estatistica_1582.indb 101 19/07/12 11:11
102
Universidade do Sul de Santa Catarina
Passo 3: o Para calcular o sexagésimo percentil, você deve encontrar
o valor que fica entre os valores que ocupam a 7ª e a 8ª posições.
� Valor que ocupa a 7ª posição = 22.
� Valor que ocupa a 8ª posição = 22.
Então, P60 = 22.
Como interpretar estes dados? 60% dos dados observados são
menores ou iguais a 22. 40% dos valores observados são maiores
ou iguais a 22.
Decís
Se você notar, poderá comparar os decís com alguns percentis, ou seja:
Decís 1º 2º 3º 4º 5º 6º 7º 8º 9º
Percentis 10º 20º 30º 40º 50º 60º 70º 80º 90º
Isso mesmo, por exemplo, o D1 = P10, o D2 = P20, D3 = P30 e,
assim, sucessivamente. Note, também, que as interpretações são
as mesmas:
� para o primeiro decil: 10% dos valores observados são
menores e 90% dos valores observados são maiores;
� para o segundo decil: 20% dos valores observados são
menores e 80% dos valores observados são maiores;
� para o terceiro decil: 30% dos valores observados são
menores e 70% dos valores observados são maiores etc.
Continuando com o mesmo exemplo, calcule o terceiro decil.
Note que ele é igual ao trigésimo percentil (D3 = P30)! Será a
mesma coisa que calcular P30.
probabilidade_e_estatistica_1582.indb 102 19/07/12 11:11
103
Probabilidade e Estatística
Unidade 3
Veja passo a passo
Passo 1: o número de elementos é 11 (n = 11) e o i = 30.
Passo 2: PD3 = PP30 = 3,6, ou seja, D3 está entre a 3ª e a 4ª posições.
1º 2º 3º PD3 4º 5º 6º 7º 8º 9º 10º 11º
15 16 20 D3 20 20 22 22 22 25 26 28
Passo 3: para calcular o terceiro decil, você deve encontrar o valor
que fica entre os valores que ocupam a 3ª e a 4ª posições.
� Valor que ocupa a 3ª posição = 20.
� Valor que ocupa a 4ª posição = 20.
Então, D3 = 20.
Como interpretar estes dados? 30% dos dados observados são
menores ou iguais a 20. 70% dos valores observados são maiores
ou iguais a 20.
Assim como você estudou na média, aqui, também para efeito
de cálculo, você usará diferente tratamento quando se tratar
de dados agrupados com intervalos (variável discreta) e dados
agrupados sem intervalos (variável contínua). Mas para a
finalidade deste estudo não será incluído.
probabilidade_e_estatistica_1582.indb 103 19/07/12 11:11
104
Universidade do Sul de Santa Catarina
Seção 2 – Gráficos box-plot e ramo e folhas
O gráfico box plot (gráfico de caixa) é uma ferramenta
exploratória de análise de dados, cujo principal propósito é dar ao
usuário um método eficiente de examinar um conjunto de dados,
para se ter uma primeira idéia da distribuição desses dados.
Por sua vez, podemos usar os gráficos ramo e folhas para
representar as distribuições de frequências e também para
pequenos conjuntos dados além de possibilitar a visualização
completa das observações.
Construção de um gráfico ramo e folhas
Na construção, cada observação é dividida em duas partes, o
ramo e as suas folhas, do mesmo jeito que ocorre numa árvore.
Logo que finalizamos a sua construção, se observarmos os dados
coletados gerados em um ângulo de noventa graus, veremos um
diagrama bem semelhante a um histograma, só que feito com
valores em vez de retângulos.
Esta representação possui duas vantagens em relação ao
histograma:
� seus valores são os valores reais;
� é simples de construir
probabilidade_e_estatistica_1582.indb 104 19/07/12 11:11
105
Probabilidade e Estatística
Unidade 3
Vejamos um exemplo para aclarar essa visualização!
Exemplo de gráfico ramo e folhas
Imaginemos que desejamos visualizar a distribuição dos valores
de tempo de antiguidade – em meses – dos funcionários de uma
determinadaempresa. Coletados esses dados, os 20 valores de
tempo de antiguidade (em meses) já ordenados são:
8, 9, 11, 17, 17, 19, 20, 44, 45, 53, 57, 57, 57, 58, 70, 81, 82, 83,
100, 104.
Podemos, para construir nosso gráfico, organizar os dados,
separando-os pelas dezenas: uma em cada linha do gráfico, da
seguinte forma:
8, 9
11, 17, 17, 19
20
44, 45
53, 57, 57, 57, 58
70
81, 82, 83
100, 104
E, assim obtemos uma primeira aproximação do gráfico. Porém,
como muitos valores, em cada linha, tem as dezenas em comum,
podemos colocar as dezenas em evidência, separando-as das
unidades por um traço:
0 8 9
1 1 7 7 9
2 0
3 -
4 4 5
RAMO 5 3 7 7 7 8 FOLHAS
6 -
7 0 Legenda:
8 1 2 3 5 | 3 = 53 meses
9 - 10| 4 = 104 meses
10 4
Figura 3.8 – Construção de um diagrama de ramo e folhas
Fonte: Elaboração do autor (2011).
probabilidade_e_estatistica_1582.indb 105 19/07/12 11:11
106
Universidade do Sul de Santa Catarina
Ao dispor os dados dessa maneira, estamos construindo um
diagrama de ramo e folhas. O lado esquerdo, com as dezenas,
é chamado de ramo, no qual estão dependuradas as unidades,
chamadas folhas, à direita da linha vertical.
Para sabermos o que está sendo representado,
um ramo de folhas deve ter sempre uma legenda,
indicando o que significam o ramo e as folhas. Assim,
se o tempo de empresa dos funcionários estivesse
medido em dias, por exemplo, usando esse mesmo
ramo de folhas, poderíamos estabelecer que o ramo
representaria as centenas e as folhas, as dezenas. Assim,
0|8 seria igual a 80 dias e 10|4 seria igual a 104 dias.
Como podemos agora interpretar este gráfico? Analisando
o ramo e folhas para o tempo de empresa dos funcionários,
percebemos a existência de três grupos:
� o grupo com os recém-contratados (até 20 meses);
� o grupo com os que já tem algum tempo de empresa (de
44 a 58 meses);
� o grupo com os mais velhos (mais de 70 meses) com
destaque, aqui, para dois funcionários que já estão na
empresa à mais de oito anos!
O que mais podemos fazer com este mesmo gráfico do exemplo?
O ramo e folhas também pode ser usado para comparar duas
distribuições de valores. Assim, aproveitando o mesmo ramo
do diagrama do tempo de empresa, podemos fazer o diagrama
das mulheres que trabalham nesta empresa, utilizando o lado
esquerdo. Logo após serem coletados os dados, resultou o
seguinte gráfico:
probabilidade_e_estatistica_1582.indb 106 19/07/12 11:11
107
Probabilidade e Estatística
Unidade 3
9 9 8 0 8 9
9 9 8 7 6 6 1 0 0 0 1 1 1 7 7 9
3 1 1 1 2 0
5 4 4 4 3 2 2 3 -
5 5 4 4 5
8 6 5 1 5 3 7 7 7 8
8 6 -
0 7 0
3 1 8 1 2 3
- 9 -
- 10 0 4
5 11 -
- 12 -
- 13 - Legenda:
- 14 - 5 | 5 | = 55 meses para homem
7 15 - | 5 | 3 = 53 meses para mulher
Figura 3.9 – Gráfico ramo e folhas
Fonte: Elaboração do autor (2011).
Podemos observar que as folhas das mulheres são dependuradas
de modo espelhado, assim como explica a legenda, que agora
deve ser dupla!
Observando a tabela, notamos que as mulheres têm menos tempo de
empresa do que os homens, embora possuam dois funcionários com
mais tempo na empresa. Também podemos observar rapidamente
que a empresa tem mais empregados homens que mulheres.
Construção de um gráfico box-plot
O box‑plot é especialmente útil quando trabalhamos com
conjuntos limitados de dados para os quais outras ferramentas,
como histogramas que requerem dados com mais de 30 pontos,
não permitem auxiliar o estudo pois a quantidade de dados pode
ser insuficiente para se obter uma conclusão.
Através da disposição dos valores em ordem crescente, tem-se
uma ideia clara sobre a localização e a dispersão dos dados. Para a
construção do gráfico box–plot, precisamos calcular:
probabilidade_e_estatistica_1582.indb 107 19/07/12 11:11
108
Universidade do Sul de Santa Catarina
� limite inferior;
� limite superior;
� primeiro quartil;
� terceiro quartil;
� mediana.
Estas cinco medidas são denominadas de estatística de ordem.
Vejamos as partes componentes de um box‑plot:
Figura 3.10 – Componentes de um box-plot
Fonte: Elaboração do autor (2011).
As informações dadas pelo resumo destes cinco números são
apresentadas na forma de um gráfico de caixa que agrega uma
série de informações sobre a distribuição, como:
� posição;
� dispersão;
� assimetria;
� caudas;
� dados discrepantes (outliers).
probabilidade_e_estatistica_1582.indb 108 19/07/12 11:11
109
Probabilidade e Estatística
Unidade 3
Figura 3.11 – Componentes de um box-plot: nomes usuais
Fonte: Elaboração do autor (2011).
Assim, a posição central dos valores é dada pela mediana e a
dispersão, pela amplitude interquartílica; as posições relativas da
mediana e dos quartis e o formato dos bigodes dão uma noção da
simetria e do tamanho das caudas da distribuição.
Algumas propriedades dos box-plot para a sua interpretação
Quando a distribuição dos dados é simétrica, a linha da
mediana estará localizada no centro do retângulo e as duas
linhas que partem das extremidades do retângulo terão quase os
mesmos comprimentos.
Quando a distribuição dos dados é assimétrica à direita, a linha
da mediana estará mais próxima de Q1 do que de Q3; e, por sua
vez, quando a distribuição é assimétrica à esquerda, a linha da
mediana estará mais próxima de Q3 do que de Q1.
Assim, podemos observar os seguintes exemplos de assimetrias
negativas, positivas e dados simétricos, respectivamente, de
esquerda à direita:
probabilidade_e_estatistica_1582.indb 109 19/07/12 11:11
110
Universidade do Sul de Santa Catarina
Figura 3.12 – Assimetrias
Fonte: Elaboração do autor (2011).
O box plot também pode ser desenhado na posição vertical ou
na horizontal. Pode ser utilizado na comparação de dois ou mais
conjuntos de dados e na comparação com outras ferramentas, por
exemplo, junto com os histogramas.
Dicas para a construção do box-plot
� colete os n dados referentes à variável de interesse;
� disponha os dados em ordem crescente. Calcule a
mediana, Q1 e Q3;
� identifique o valor (min) e o valor (max) da amostra.
� trace um eixo e o marque com uma escala adequada e de
fácil leitura;
� sobre o eixo, desenhe um retângulo da seguinte forma:
» posicione a extremidade inferior do retângulo em Q1;
» posicione a extremidade superior do retângulo em Q3
e, no interior do retângulo, trace a mediana;
» feche o retângulo para obter o box;
probabilidade_e_estatistica_1582.indb 110 19/07/12 11:11
111
Probabilidade e Estatística
Unidade 3
� desenhe uma linha a partir da extremidade inferior
do retângulo com distância de até 1,5x(Q3-Q1) para
construir o bigode inferior;
� desenhe uma linha a partir da extremidade superior
do retângulo com uma distância de 1,5x(Q3-Q1) para
construir o bigode superior;
� desenhe asteriscos para marcar as observações localizadas
a uma distância de 1,5x(Q3-Q1) a 3x(Q3-Q1) de cada
extremidade do retângulo, que são os possíveis outliers.
� desenhe círculos para marcar as observações localizadas a
uma distância superior a 3x(Q3-Q1) de cada extremidade
do retângulo, que são os prováveis outliers.
� registre as informações importantes que devam constar
no gráfico, como título, período, coleta de dados,
tamanho da amostra, identificação dos eixos.
Os valores que estiverem acima do limite superior (haste
superior) ou abaixo do limite inferior (haste inferior) do box‑plot
serão considerados outliers.
Estes valores são considerados discrepantes, ou seja, não fazem
parte do comportamento esperado do grupo em estudo.
probabilidade_e_estatistica_1582.indb 111 19/07/12 11:11
112
Universidade do Sul de Santa Catarina
Assim o box‑plot resulta:
Figura 3.13 – Box-plot
Fonte: Elaboração do autor (2011).
Complicado? Sim, um pouco, mas com a ajuda de um “truque” no
Excel, podemos fazer, ao menos, um esquema de box‑plot,ainda
que o melhor seja sempre trabalhar com algum programa de
estatística que esteja preparado para desenhar estetipo de gráfico.
Dentre os programas grátis de estatísticas que podem
ser achados na internet, uns dos mais completos
é o PAST (http://folk.uio.no/ohammer/past/) da
Universidade de Oslo (Noruega).
Na internet, podem ser achados vários tutoriais explicando como
fazer um box‑plot completo no Excel, é só procurar com um site
de buscas como o Google ou outro semelhante que você esteja
acostumado a utilizar no seu dia a dia.
probabilidade_e_estatistica_1582.indb 112 19/07/12 11:11
http://folk.uio.no/ohammer/past/
113
Probabilidade e Estatística
Unidade 3
Exemplo de como construir um box-plot no Excel.
Em uma nova planilha, digite os seguintes dados, que são
os valores necessários para construir o box‑plot e que foram
calculados a partir de três conjuntos de dados de um certo
levantamento de campo:
Figura 3.14 – Box-plot em Excel
Fonte: Elaboração do autor (2011).
a) selecionar as células A2:D7;
b) em seguida, ir ao menu Inserir e clicar em gráfico;
c) Na guia tipos padrão, clique em ações, depois em tipo
de gráfico e, em seguida, clique no quarto gráfico de
subtipo:
Figura 3.15 – Box-plot em Excel
Fonte: Elaboração do autor (2011).
probabilidade_e_estatistica_1582.indb 113 19/07/12 11:11
114
Universidade do Sul de Santa Catarina
d) clique em Avançar;
e) na guia Intervalo de dados, clique em linhas, depois em
sequências em e, em seguida, clique em Avançar;
f) na guia Legenda, clique para desmarcar a caixa de
seleção Mostrar legenda;
g) na guia Eixos, clique para desmarcar a caixa de seleção
eixo (Y) em eixo secundário e, em seguida, clique em
Concluir;
h) clique uma vez em qualquer uma das colunas coloridas
para selecionar a série. Não clique em uma das colunas
em branco;
i) no menu Gráfico, clique em Tipo de gráfico;
j) em Tipo de gráfico, clique em Linha e, em seguida,
clique em OK.
Figura 3.16 – Box-plot em Excel
Fonte: Elaboração do autor (2011).
k) uma linha que conecta as três colunas em branco
aparecerá no gráfico;
l) clique uma vez na linha e, em seguida, clique com o
botão direito do mouse em formatar serie de dados para
indicar nenhuma linha e marcador;
probabilidade_e_estatistica_1582.indb 114 19/07/12 11:11
115
Probabilidade e Estatística
Unidade 3
m) pronto, o esquema do box‑plot já está construído.
Somente agora você deve botar as informações
importantes do gráfico.
Figura 3.17 – Box-plot em Excel
Fonte: Elaboração do autor (2011).
Seção 3 – Medidas de dispersão
Para compreender melhor o que são as medidas de dispersão,
acompanhe o exemplo. A realização de testes em três grupos de
pessoas resultou nos escores descritos a seguir.
Tabela 3.3 – Escores (em pontos) obtidos por pessoa (10 pessoas) e divididos em grupos
Grupos Escores (em pontos) obtidos por pessoa (10 pessoas) Total
Grupo 1: 6 6 6 6 6 6 6 6 6 6 60
Grupo 2: 1 8 9 2 6 10 5 8 7 4 60
Grupo 3: 5 6 7 7 6 5 6 7 5 6 60
Fonte: Elaboração do autor (2006).
probabilidade_e_estatistica_1582.indb 115 19/07/12 11:11
116
Universidade do Sul de Santa Catarina
Se você calcular a média dos escores para cada grupo, obterá os
seguintes resultados:
Para o grupo 1:
, ou seja, 6 pontos é o escore médio;
Para o grupo 2:
, ou seja, 6 pontos é o escore médio;
Para o grupo 3:
, ou seja, 6 pontos é o escore médio;
Observe que os escores médios dos três grupos são iguais. E
agora? Como diferenciar um grupo do outro? Olhando somente
para os dados você pode tirar algumas conclusões: no grupo 1,
as pessoas têm o mesmo escore; no grupo 2, os escores são
diversificados; e, no grupo 3, existe uma pequena diversificação,
ou seja, os escores estão bem próximos da média.
Pode-se afirmar, quanto à dispersão das séries anteriores, que:
� grupo 1: não é uma série em que os dados apresentam
dispersão com relação à média, ou seja, os dados estão
totalmente concentrados na média;
� grupo 2: é uma série de dados em que os valores
observados estão bastante dispersos, ou seja, apresenta
muitos valores distantes da média. Podemos dizer que é
uma série dispersa;
� grupo 3: há uma pequena diferença de alguns dados
com relação à média, ou seja, apresenta uma pequena
dispersão com relação à média: os dados estão
concentrados em torno da média.
Em resumo, nos grupos 1 e 3, a média pode servir como uma
medida representativa, mas, no grupo 2, a média não resulta
representativa.
probabilidade_e_estatistica_1582.indb 116 19/07/12 11:11
117
Probabilidade e Estatística
Unidade 3
Para identificar esses tipos de situações é que usamos
as medidas de dispersão. Essas medidas são a maneira
mais adequada para quantificar a dispersão dos dados
e avaliar a representatividade da média.
As principais medidas, denominadas de dispersão absolutas são:
amplitude total, desvio médio simples, variância e desvio padrão.
O desvio médio simples, não menos importante, não será visto
neste estudo, pois, para o objetivo que se pretende alcançar, a
variância e o desvio padrão são mais adequados.
Cálculos da variância e do desvio padrão
Para começar a trabalhar com dispersão, é necessário que você
conheça as definições e as formas de representação da variância e
do desvio padrão.
A variância é a média dos quadrados dos desvios
de cada valor da série com relação à média. Ficou
complicado? Não se preocupe, a seguir você vai
aprender como calcular!
O desvio padrão é a raiz quadrada da variância, pois
assim fica mais fácil analisar e comparar com a média;
se usássemos a variância, as unidades seriam ao
quadrado, enquanto que o desvio padrão apresentaria
a mesma unidade de medida que a média.
Veja a seguir como representá-las.
População Amostra
σ2 (x) → variância S2(x) → variância
σ (x) → desvio padrão s(x) →desvio padrão
σ = 18ª letra do alfabeto grego, chama-se sigma.
Quadro 3.2 – Representação do desvio padrão
Fonte: Elaboração do autor (2006).
probabilidade_e_estatistica_1582.indb 117 19/07/12 11:11
118
Universidade do Sul de Santa Catarina
A variância e o desvio padrão para dados brutos
Neste item, você vai aprender como calcular a variância e o
desvio padrão para dados brutos. Preste atenção! A fórmula para
população e para amostra são diferentes.
O quadro a seguir apresenta as fórmulas utilizadas para calcular a
variância e o desvio padrão.
Medidas População Amostra
Variância
Desvio padrão
σ = 18ª letra do alfabeto grego, chama-se sigma.
Quadro 3.3 – Fórmulas para o cálculo de medidas de dispersão com dados brutos
Fonte: Elaboração do autor (2006).
Observação: A diferença mais importante entre as
duas fórmulas da variância são os denominadores. Para
a população, usamos n e, para a amostra, usamos n – 1.
Como, ao trabalharmos com uma amostra para estimar
valores de uma população, a variabilidade dos dados é
maior, então, dessa maneira, é mais indicado usarmos
n – 1 para que não subestimemos a dispersão. O n – 1 é
usado, nesse caso, como uma correção para a variância
da amostra. Para amostras com mais de 30 elementos,
essa correção torna-se irrelevante.
Para você entender melhor, imagine que a média de depósitos
diários de uma agência bancária seja de 120.000 reais e a
variância, de 25.000 reais ao quadrado. Seria difícil comparar
reais com reais ao quadrado. Para tanto, ao se fazer uso do desvio
padrão, o qual corresponde à raiz quadrada de 25.000 reais ao
quadrado, teríamos 5.000 reais. E esta é a mesma unidade de
medida da média.
Daremos continuidade ao exemplo, para calcular a variância e o
desvio padrão.
probabilidade_e_estatistica_1582.indb 118 19/07/12 11:11
119
Probabilidade e Estatística
Unidade 3
Veja passo a passo
Exemplo: Uma vez dadas as notas: 6; 7; 7,8; e 8.
Passo 1: calcular a média: observe que, na média para a população,
usa-se a letra grega .
0
Passo 2: – agora, calcular os desvios (xi − ).
(x1 − ) = (6 – 7,20) = −1,20
(x2 − ) = (7 – 7,20) = −0,20
(x3 − ) = (7,8 – 7,20) = 0,60
(x4 − ) = (8 – 7,20) = 0,80
Passo 3: elevar ao quadrado cada desvio (xi − )2.
(x1 − )2= (1,20)2 = 1,4400
(x2 − )2 = (−0,20)2 = 0,0400
(x3 − )2 = (0,60)2 = 0,3600
(x4 − )2 = (0,80)2 = 0,6400
probabilidade_e_estatistica_1582.indb 119 19/07/12 11:11
120
Universidade do Sul de Santa Catarina
Passo 4: calcular a média dos quadrados dos desvios, ou seja, a
variância. Aqui, você vai calcular para a população e para a amostra.
� Caso sejam dados de uma população:
Então: σ2(x) = 0,62
� Caso sejam dados de uma amostra:
Então: s2(x) = 0,83
Passo 5: calcular o desvio padrão, calculando a raiz da variância.
� Caso sejam dados de uma população:
� Caso sejam dados de uma amostra:
Interpretação dos dados – Para dados de uma
população, a variabilidade das notas é de 0,79 pontos.
Para dados de uma amostra, a variabilidade das notas é
de 0,91 pontos.
probabilidade_e_estatistica_1582.indb 120 19/07/12 11:11
121
Probabilidade e Estatística
Unidade 3
A variância e o desvio padrão para dados agrupados sem intervalos
(variável discreta)
Agora, você vai calcular a variância e o desvio padrão para dados
que foram organizados em tabelas, ou seja, após a coleta, eles
foram organizados em categorias e organizados em tabelas onde
os dados estão agrupados sem intervalos.
Observe as fórmulas que são utilizadas para calcular este tipo de
dados, a variância e o desvio padrão.
Medidas População Amostra
Variância
Desvio padrão
Quadro 3.4 – Fórmulas para o cálculo de medidas de dispersão com dados agrupados sem intervalos
Fonte: Elaboração do autor (2006).
Acompanhe o exemplo a seguir para compreender como realizar
o cálculo dos dados agrupados sem intervalos.
Exemplo: A tabela apresenta dados referentes à remuneração de
funcionários de uma empresa. Foram levantados o número de
funcionários e sua faixa salarial, em número de salários-mínimos.
probabilidade_e_estatistica_1582.indb 121 19/07/12 11:12
122
Universidade do Sul de Santa Catarina
Tabela 3.4 – Remuneração de funcionários
Nº de salários -
mínimos (xi)
Nº de
funcionários
(fi)
x i . (x i − x ) (x − x )
2 (x − x )2.
1 29 29 -2,33 5,4 1 157,4381
2 28 56 -1,33 1,7 7 49,5292
3 20 60 0,33 0,1 1 2,1780
4 18 72 0,67 0,4 5 8,0820
5 16 80 1,67 2,7 8 44,4560
6 15 90 2,67 7,1 3 106,9335
7 9 63 3,67 13,4 7 121,1607
Σ 135 450 489,7757
1 − 3,33 = −2,33
Σ fi Σ x i .f i Σ ix( − )x
2 .fi
(−2,33) 2=5,4289 5,4289.29 = 157,4381
(fi) (fi)
Fonte: Elaboração do autor (2006).
Quando realizar o passo a passo desses cálculos,
sugerimos que crie mais quatro colunas à direita para
auxiliar em seus cálculos.
Agora, acompanhe o cálculo passo a passo
Passo 1: inicie por somar a coluna das frequências simples (fi) para
obter Σfi (frequência total); Σfi = 135.
Passo 2: calcule a média: multiplique cada xi por sua correspondente
fi e escreva na coluna xi.fi, some os valores calculados e escreva no
final da coluna esse resultado, que é:
Σxi.fi; Σxi.fi = 450
probabilidade_e_estatistica_1582.indb 122 19/07/12 11:12
123
Probabilidade e Estatística
Unidade 3
Passo 3: divida o resultado do passo 2 (Σ xi.fi ) pelo resultado do
passo 1 (Σ fi).
Para facilitar os cálculos, arredondamos a média em duas casas
decimais.
Passo 4: calcule a quarta coluna, (xi − ), subtraindo o xi de cada linha
pela média:
1 − 3,33 = −2,33
2 − 3,33 = −1,33
3 − 3,33 = −0,33
4 − 3,33 = 0,67
5 − 3,33 = 1,67
6 − 3,33 = 2,67
7 − 3,33 = 3,67
Passo 5: calcule a quinta coluna, elevando os valores da quarta
coluna ao quadrado (xi − )2.
(−2,33)2 = 5,4289
(−1,33)2 = 1,7689
(−0,33)2 = 0,1089
(0,67)2 = 0,4489
(1,67)2 = 2,7785
(2,67)2 = 7,1289
(3,67)2 = 13,4689
Neste passo, usa-se quatro casas decimais, deixando para
arredondar para duas casas somente o resultado.
probabilidade_e_estatistica_1582.indb 123 19/07/12 11:12
124
Universidade do Sul de Santa Catarina
Passo 6: calcule a sexta coluna, multiplicando os valores da quinta
pela frequência simples de cada linha, (xi − )2.fi:
5,4289 . 29 = 157,4381
1,7689 . 28 = 49,5292
0,1089 . 20 = 2,1780
0,4489 . 18 = 8,0802
2,7785 . 16 = 44,4560
7,1289 . 15 = 106,9335
13,4689 . 9 = 121,1607
Passo 7: some os valores obtidos na sexta coluna, Σ(xi − )2.fi.
(Σ(xi − )2.fi = 489,7757
Passo 8: calcule a variância.
� Caso sejam dados de uma população:
Na variância, serão usadas quatro casas decimais, pois ainda será
necessário extrair a raiz quadrada para chegar ao desvio padrão.
� Caso sejam dados de uma amostra:
probabilidade_e_estatistica_1582.indb 124 19/07/12 11:12
125
Probabilidade e Estatística
Unidade 3
Passo 9: calcule o desvio padrão.
� Caso sejam dados de uma população:
� Caso sejam dados de uma amostra:
Interpretação dos dados – Para dados de uma
população, a variabilidade do número de salários
é de 1,90 salários. Para dados de uma amostra, a
variabilidade do número de salários é de 1,91 salários.
Dados agrupados com intervalos (variável contínua)
Nesse item, você poderá ver como se calcula a variância e o desvio
padrão para dados agrupados com intervalos (variável contínua).
Observe as fórmulas que são utilizadas para calcular este tipo de
dados. Use para:
Medidas População Amostra
Variância
Desvio padrão
Quadro 3.5 – Fórmulas para o cálculo de medidas de dispersão com dados agrupados com intervalos
Fonte: Elaboração do autor (2006).
Para o caso de dados agrupados com intervalos, usa-se
o ponto médio – PM – de cada intervalo, pois não se
tem um valor específico para usar. O ponto médio
serve como uma boa aproximação.
probabilidade_e_estatistica_1582.indb 125 19/07/12 11:12
126
Universidade do Sul de Santa Catarina
Agora, vamos analisar um exemplo para realizar os cálculos de
medidas de dispersão com dados agrupados com intervalos.
Tabela 3.5 – Volume de vendas mensal, em milhares de reais, dos representantes de uma
empresa que fabrica remédios – outubro/2010
Nº de vendas
(em mil reais)
Nº de
representantes
(fi )
PM PM. PM i − x (PM i − x )
2
(PM i − x )
2 .
15,9 | -- 18,7 12 17,3 207,6 7,45 55,5025 666,0300
18,7 | -- 21,5 8 20,1 160,8 −4,65 21,6225 172,9800
21,5 | -- 24,3 12 22,9 274,8 −1,85 3,4225 41,0700
24,3 | -- 27,1 5 25,7 128,5 0,95 0,9025 4,5125
27,1 | -- 29,9 3 28, 5 85,5 3,75 14,0625 42,1875
29,9 | -- 32,7 6 31,3 187,8 6,55 42,9025 257,4150
32,7 | -- 35,5 10 34,1 341,0 9,35 87,4225 874,2250
Total ( Σ ) 56 1.386 2.058,4200
17,3 − 24,75 = −7,45
Σ Σ PMi . Σ ( PM i − )x
2 .fi
(−7,45) 2 = 55,5025
55,5025.12 = 666,0300
fi fi
fi
fi fi
−
Fonte: Elaboração do autor (2006).
Ao realizar o passo a passo, crie uma nova tabela com
mais cinco colunas à direita para auxiliar em seus cálculos.
Acompanhe os cálculos passo a passo
Passo 1: primeiro some a coluna das frequências simples (fi) para
obter Σ fi (frequência total); Σ fi = 56.
Passo 2: calcule a média; nesse caso, calcule o ponto médio de cada
intervalo, multiplique cada PM por sua correspondente fi e escreva
na coluna PM.fi; some os valores calculados nessa coluna e escreva
o total. Esse resultado é o Σ PM.fi: PMi.fi = 1.386. Agora, divida esse
resultado (Σ PM.f) pelo resultado do passo 1 (Σ fi). Assim, obtemos:
probabilidade_e_estatistica_1582.indb 126 19/07/12 11:12
127
Probabilidade e Estatística
Unidade 3
Passo 3: calcule a quinta coluna, subtraindo o PMi de cada linha pela
média PMi − .
17,3 − 24,75 = −7,45
20,1 − 24,75 = −4,65
22,9 − 24,75 = −1,85
25,7 − 24,75 = 0,95
28,5 − 24,75 = 3,75
31,3 − 24,75 = 6,55
34,1 − 24,75 = 9,35
Passo 4: calcule a sexta coluna, elevando os valores da quinta ao
quadrado, (PMi − )
2.
(−7,45)2 = 55,5025
(−4,65)2 = 21,6225
(−1,85)2 = 3,4225
(0,95)2 = 0,9025
(3,75)2 = 14,0625
(6,55)2 = 42,9025
(9,35)2 = 87,4225
Passo 5: calcule a sétima coluna, multiplicando os valores da sexta
pela frequência simples de cada linha, (PMi − )
2.fi.
55,5025 . 12 = 666,0300
21,6225 . 8 = 172,9800
3,4225 . 12 = 41,0700
0,9025 . 5 = 4,5125
14,0625 . 3 = 42,187542,9025 . 6 = 257,4150
87,4225 . 10 = 874,2250
Passo 6: some os valores obtidos na sexta coluna, Σ (PMi − )
2.fi.
Σ (PMi − )2.fi: = 2.058,4200.
probabilidade_e_estatistica_1582.indb 127 19/07/12 11:12
128
Universidade do Sul de Santa Catarina
Passo 7: calcule a variância.
� Caso sejam dados de uma população:
� Caso sejam dados de uma amostra:
Passo 8: calcule o desvio padrão.
� Caso sejam dados de uma população:
� Caso sejam dados de uma amostra:
Interpretação dos dados – Para dados de uma
população, a variabilidade do volume de vendas
é de 6,06 mil reais. Para dados de uma amostra, a
variabilidade do volume de vendas é de 6,12 mil reais.
Interpretação do desvio padrão
O desvio padrão é uma importante medida de dispersão. É com
ele que você irá quantificar a dispersão dos dados de uma série
com relação à sua média. Preste atenção:
probabilidade_e_estatistica_1582.indb 128 19/07/12 11:12
129
Probabilidade e Estatística
Unidade 3
� quanto maior o valor do desvio padrão, mais dispersos
estão os valores. Pode-se dizer, também, que mais
distantes estão da média;
� quanto menor o valor do desvio padrão, menos dispersos
estão os valores. Pode-se dizer, também, que mais
próximos estão da média.
Veja a figura a seguir para compreender melhor o que foi
colocado.
Figura 3.18 – Quanto mais distantes da média, mais dispersos os dados estão
Fonte: Triola (1999, p. 42).
Outra utilização do desvio padrão
Muitas séries, quando representadas por seu polígono de
frequências, com certo ajuste nas curvas, apresentam um formato
semelhante a um sino, uma curva simétrica (observando que a
média, a moda e a mediana estão posicionadas ao centro), como
mostra o gráfico a seguir.
Gráfico 3.1 – Gráfico da curva normal
Fonte: Elaboração do autor (2006).
probabilidade_e_estatistica_1582.indb 129 19/07/12 11:12
130
Universidade do Sul de Santa Catarina
Para séries de dados que apresentam esse tipo de representação,
pode-se trabalhar com a área abaixo do polígono. A área abaixo é
proporcional à frequência total. Essa curva é chamada de Curva
Normal ou Curvas de Gauss, e suas principais características são:
� a curva se caracteriza por ter a forma de um sino;
� a curva normal é simétrica com relação à média;
� a área limitada pela curva e pelo eixo das abscissas é 1
ou 100%;
� a curva é assintótica, isto é, aproxima-se indefinidamente
do eixo das abscissas sem tocá-lo;
� a curva normal é unimodal, isto é, possui um só pico ou
ponto de frequência máxima, ponto este que coincide
com a moda, a média e a mediana.
Como relacionar a curva com o desvio padrão? Veja a curva a seguir:
Gráfico 3.2 – Gráfico da curva normal
Fonte: Elaboração do autor (2006).
probabilidade_e_estatistica_1582.indb 130 19/07/12 11:12
131
Probabilidade e Estatística
Unidade 3
Exemplo: Numa série em que μ = 80 e o σ(x)=3, pode-se
interpretar estes valores da seguinte forma:
� os valores da série estão concentrados em torno da
média, que é de 80 unidades;
� o intervalo [μ − σ(x); μ + σ(x)] contém aproximadamente
68,26% dos elementos da série, ou seja, o intervalo [77;83];
� o intervalo [μ − 2σ(x); μ + 2σ(x)] contém
aproximadamente 95,44% dos elementos da série, ou
seja, o intervalo [74;86];
� o intervalo [μ − 3σ(x); μ + 3σ(x)] contém
aproximadamente 99,74% dos elementos da série, ou seja,
o intervalo [71;89];
Seção 4 – Coeficiente de variação
Séries de dados com médias iguais
Acompanhe o exemplo: considere dois grupos de pessoas, nos
quais foram feitos levantamentos de suas rendas. Os resultados
deste levantamento foram os seguintes:
Tabela 3.6 – Resultado do levantamento de renda
Grupo 1 Grupo 2
Média:
μ = 122 pontos
Média:
μ = 122 pontos
Desvio padrão:
σ(x) = 4,5 pontos
Desvio padrão:
σ(x) = 7,5 pontos
Fonte: Elaboração do autor (2006).
probabilidade_e_estatistica_1582.indb 131 19/07/12 11:12
132
Universidade do Sul de Santa Catarina
Compare a dispersão das duas séries:
� note que as médias são iguais;
� o desvio padrão do grupo 1 é 4,5, e o do grupo 2 é 7,5;
portanto, o grupo que apresenta maior dispersão quanto
ao nível de renda é o grupo 2;
� conclusão: os níveis de renda do grupo 2 são mais
dispersos com relação ao grupo 1 (valores mais distantes
da média); ou: os integrantes do grupo 1 tem renda mais
semelhantes entre eles que os integrantes do grupos 2.
Para comparar duas séries de dados usando medidas
de dispersão absolutas (variância e desvio padrão) é
necessário que as médias sejam iguais, caso contrário,
usamos uma medida de dispersão relativa que veremos
nesta seção.
Séries de dados com médias diferentes
Como você pôde observar no item anterior, para comparar duas
séries de dados quanto a suas dispersões, pode-se usar valores
absolutos dos desvios padrão, mas somente quando as médias
são iguais.
E quando as médias são diferentes?
Nesse caso, utiliza-se o Coeficiente de Variação (CV), que é
uma medida de dispersão relativa. Veja a seguir.
probabilidade_e_estatistica_1582.indb 132 19/07/12 11:12
133
Probabilidade e Estatística
Unidade 3
Medida de dispersão relativa – o Coeficiente de Variação
O coeficiente de variação é a relação do desvio com a média. Veja
a fórmula a seguir:
Tabela 3.7 – Fórmula do coeficiente de variação
Para a população Para a amostra
Fonte: Elaboração do autor (2006).
A série que apresentar maior coeficiente de variação
será realmente a série de maior dispersão dos dados. O
resultado é expresso em percentual (%), ou seja, quanto
o desvio padrão representa da média.
Acompanhe o exemplo a seguir para compreender como realizar
o cálculo.
Exemplo: Considere dois grupos de pessoas, nos quais foram
feitos levantamentos de suas rendas. Os resultados deste
levantamento foram os seguintes:
Tabela 3.8 – Resultado do levantamento
Grupo 1 Grupo 2
Desvio padrão:
σ(x) = 9,8 reais
Desvio padrão:
σ(x) = 7,5 reais
Média:
μ = 145 reais
Média:
μ = 95 reais
Fonte: Elaboração do autor (2006).
� note que as médias são diferentes;
� o desvio padrão do grupo 1 é 9,8; e o do grupo 2 é 7,5;
portanto, o grupo que apresenta maior dispersão absoluta
quanto ao nível de renda é o grupo 1;
probabilidade_e_estatistica_1582.indb 133 19/07/12 11:12
134
Universidade do Sul de Santa Catarina
� como as médias são diferentes, devemos calcular o
coeficiente de variação, pois, simplesmente pela dispersão
absoluta, não podemos afirmar nada (se fossem iguais,
bastaria a dispersão absoluta).
» Para o grupo 1:
» Para o grupo 2:
O grupo que apresenta maior coeficiente de variação é o grupo 2.
Ou seja, os níveis de renda observados no grupo 2 são mais
dispersos com relação ao grupo 1 (valores mais distantes da média).
Quais outras conclusões você poderia tirar com relação
aos dois grupos?
Comparando os dois, você poderia dizer que, no grupo 1, as
pessoas têm a renda mais próxima da média do grupo que no
Grupo 2, que, por sua vez, as pessoas apresentam níveis de renda
mais diferenciado da média do grupo, comparando os dois grupos.
Para comparar a dispersão dos dados de duas séries de
médias diferentes, usamos o coeficiente de variação.
Ele compara o desvio padrão com a média (proporção)
entre o desvio padrão e a média da série, sendo, assim,
considerado uma forma mais eficaz de comparação e,
portanto, prevalecendo sobre a absoluta.
probabilidade_e_estatistica_1582.indb 134 19/07/12 11:12
135
Probabilidade e Estatística
Unidade 3
Síntese
Nessa unidade, você pôde estudar e compreender “ferramentas”
que irão auxiliá-lo na prática de sua profissão.
Você pôde conhecer os tipos de medidas de posição e calcular
e interpretar a média, a moda e a mediana e pôde, também,
compreender e calcular separatrizes. Estudou como se calculam
as diversas medidas estatísticas, tanto para dados brutos ou
agrupados, com e sem intervalos.
Também foram vistos os gráficos box‑plot e ramo e folhas como
ferramentas exploratórias de análise de dadosque são capazes de
examinar um conjunto de dados para se ter uma primeira ideia da
distribuição deles.
Nessa unidade, você estudou, ainda, uma medida muito
importante em Estatística: a medida de dispersão. Sem estudar
estas medidas, muitas vezes fica difícil de definir se a média
seria ou não representativa de uma série de dados. Além disso,
você conheceu o método utilizado para comparar dados com
médias diferentes, largamente utilizado em estudos de dados e
tratamentos estatísticos.
probabilidade_e_estatistica_1582.indb 135 19/07/12 11:12
136
Universidade do Sul de Santa Catarina
Atividades de autoavaliação
Ao final de cada unidade, você realizará atividades de autoavaliação. O
gabarito está disponível no final do livro didático, mas se esforce para
resolver as atividades sem a ajuda do gabarito, pois, assim, você estará
promovendo (e estimulando) a sua aprendizagem.
1) Uma empresa procurou estudar a ocorrência de uso de drogas lícitas –
bebidas alcoólicas – por seus empregados, tendo, para isso, realizado
um levantamento sobre o número de dias por semana que cada um
dos empregados costuma beber. Calcule e interprete a média. Os
dados correspondentes são:
Consumo de bebidas alcoólicas por semana pelos funcionários
Nº de dias (xi) Nº de func. (fi) xi.fi
0 10
1 16
2 14
3 8
4 5
5 4
6 4
7 3
Total (Σfi) 64
Fonte: Elaboração do autor (2006).
probabilidade_e_estatistica_1582.indb 136 19/07/12 11:12
137
Probabilidade e Estatística
Unidade 3
2) Os dados seguintes representam a renda de uma amostra de famílias
de um bairro de classe baixa de Florianópolis, em reais (dados fictícios).
Calcule e interprete a média.
Renda de famílias de um bairro de classe baixa de Florianópolis
Renda (R$) No de famílias (fi) PM PM.fi
112 |---- 115 2
115 |---- 118 6
118 |---- 121 4
121 |---- 124 9
124 |---- 127 8
127 |---- 130 7
Total (Σfi) 36
Fonte: Elaboração do autor (2006).
probabilidade_e_estatistica_1582.indb 137 19/07/12 11:12
138
Universidade do Sul de Santa Catarina
3) Nos itens a seguir, estão dois conjuntos de dados. Calcule a mediana
para cada um deles e interprete seus resultados.
a) Conjunto 1
15 19 13 21 16 17 15 12 13
Sugestão: use a tabela a seguir para organizar e posicionar os dados.
b) Conjunto 2
17 18 14 14 15 15 16 16
Sugestão: use a tabela abaixo para organizar e posicionar os dados.
probabilidade_e_estatistica_1582.indb 138 19/07/12 11:12
139
Probabilidade e Estatística
Unidade 3
4) Nas opções a seguir, estão três conjuntos de dados. Encontre a moda
para cada um deles e interprete seus resultados.
a) Conjunto 01
7 6 5 8 2 1 3 2 1
1 7 6 8 5 1 2 2 7
b) Conjunto 02
5 6 8 2 3 5 3 3
2 6 5 8 3 2 5 6
c) Conjunto 03
5 6 3 7 5 3 2 1
1 6 7 2 8 4 8 4
probabilidade_e_estatistica_1582.indb 139 19/07/12 11:12
140
Universidade do Sul de Santa Catarina
5) Em um grupo de pacientes acometidos de fobias, foi levantado o
tempo em tratamento em anos, conforme tabela abaixo. Calcule o Q3, o
D9 e o P35 e interprete seus resultados.
Tempo em tratamento de fobias em anos:
4 6 8 2 5 9 4 3 8 9 5 4
Use a tabela abaixo para organizar e posicionar os dados.
6) Os dados a seguir representam o tempo em minutos usados por um
grupo de seis pessoas na realização de um teste. Calcule a variância e o
desvio padrão, considerando como uma população.
Tempo (em min.): 25, 22, 36, 20, 29, 38;
probabilidade_e_estatistica_1582.indb 140 19/07/12 11:12
141
Probabilidade e Estatística
Unidade 3
7) Os escores obtidos por cinco pessoas em um teste estão relacionados
a seguir. Calcule a variância e o desvio padrão, considerando como
uma amostra.
Tempo: 15, 10, 9, 23, 31.
8) Uma empresa procurou estudar a ocorrência de uso de drogas
lícitas – bebidas alcoólicas – por seus empregados, tendo, para isso,
tem-se realizado um levantamento sobre o número de dias por
semana que cada um dos empregados costuma beber. Calcule a
variância e o desvio padrão, considerando que os dados são de uma
amostra (sugere-se utilizar colunas para facilitar o cálculo). Os dados
correspondentes são:
Consumo de bebidas alcoólicas por semana pelos funcionários
Nº de dias (xi) Nº de func. (fi) xi.fi (xi – ) (xi – )2 (xi – )2. fi
0 10
1 16
2 14
3 8
4 5
5 4
6 4
7 3
Total (Σfi) 64
Fonte: Elaboração do autor (2006).
probabilidade_e_estatistica_1582.indb 141 19/07/12 11:12
142
Universidade do Sul de Santa Catarina
9) Na tabela a seguir, estão relacionados dados relativos à idade de um
grupo de 63 estudantes matriculados numa disciplina da Unisul Virtual.
Calcule a variância e o desvio padrão, considerando que são dados da
população (sugere-se utilizar colunas para facilitar o cálculo).
Idade dos estudantes da disciplina de Métodos Estatísticos a distância
Idade (xi) Nº de estud. (fi) xi.fi (xi – ) (xi – )2 (xi – )2. fi
17 5
18 20
19 22
20 10
21 6
Total (Σfi) 63
Fonte: Elaboração do autor (2006).
probabilidade_e_estatistica_1582.indb 142 19/07/12 11:12
143
Probabilidade e Estatística
Unidade 3
10) Os dados abaixo representam a renda de uma amostra de famílias de
um bairro de classe baixa de Florianópolis, em reais. (dados fictícios).
Calcule a variância e o desvio padrão, considerando como sendo dados
de uma amostra:
Renda de famílias de um bairro de classe baixa de Florianópolis
Renda (R$) Nº de famílias (fi)
PMi PMi.fi (PMi – ) (PMi – )
2 (PMi – )
2. fi
112 |---- 115 2
115 |---- 118 6
118 |---- 121 4
121 |---- 124 9
124 |---- 127 8
127 |---- 130 7
Total (Σfi)
Fonte: Elaboração do autor (2006).
11) Analise cada caso, comparando quanto à dispersão dos dados e
responda às perguntas:
a) Qual das séries apresenta maior dispersão absoluta (comparar os
desvios padrão)?
b) Qual das séries apresenta maior dispersão relativa (comparar os
coeficientes de variação)?
c) Conclua qual das séries realmente apresenta maior dispersão (não
esqueça que o coeficiente de variação é mais eficaz para determinar a
dispersão de uma série).
probabilidade_e_estatistica_1582.indb 143 19/07/12 11:12
144
Universidade do Sul de Santa Catarina
11.1)
Série A Série B
μ = 57; σ(x) = 5,6 μ = 96; σ(x) = 8,2
11.2)
Série A Série B
μ = 64; σ(x) = 12 μ = 96; σ(x) = 18
11.3)
Série A Série B
μ = 195; σ(x) = 12 μ = 125; σ(x) = 12
11.4)
Série A Série B
μ = 869; σ(x) = 201 μ = 625; σ(x) = 198
probabilidade_e_estatistica_1582.indb 144 19/07/12 11:12
145
Probabilidade e Estatística
Unidade 3
12) Durante o processo de fabricação de parafusos, fez-se uma
amostragem aleatória e, de cada elemento obtido, calculou-se a
diferença entre o peso (em miligramas) que o parafuso devia ter
segundo o projeto e o real peso logo de fabricado, obtendo os
seguintes dados.
Diferença de pesos em miligramas:
40,208
42,303
43,262
48,914
49,46
52,681
52,764
52,87
57,784
61,411
68,02
71,615
72,471
74,176
75,973
78,769
81,412
81,736
82,756
106,354
Para analisar o comportamento das discrepâncias dos pesos, trace
o gráfico box-plot do conjunto de dados amostrais da fábrica de
parafusos.
probabilidade_e_estatistica_1582.indb 145 19/07/12 11:12
146
Universidade do Sul de Santa Catarina
Saiba mais
Se você desejar, aprofunde os conteúdos estudados nesta unidade
ao consultar as seguintes referências:
BARBETTA, Pedro Alberto. Estatística aplicada às ciências
sociais. 5. ed. rev. Florianópolis: Ed. UFSC, 2002.
CRESPO, Antônio Arnot. Estatística fácil. São Paulo: Saraiva,
2001.
LEVIN, Jack. Estatística aplicada às Ciências Humanas. São
Paulo: Habra, 1987.
SILVA, Ermes Medeiros da. Estatística. v. 1. São Paulo: Atlas,
1996.
TRIOLA, Mario F. Introdução à Estatística. Rio de Janeiro:
LTC, 1999.
probabilidade_e_estatistica_1582.indb 146 19/07/12 11:12
4UNIDADE 4Cálculo e distribuição de probabilidades
Objetivos de aprendizagem
� Calcular e interpretar probabilidades.
� Compreender variável aleatória e distribuição de
probabilidades.
� Compreender o que é variável aleatóriadiscreta e
contínua.
� Compreender distribuição discreta e contínua de
probabilidades.
� Calcular probabilidade usando distribuição contínua de
probabilidades.
Seções de estudo
Seção 1 Principais conceitos
Seção 2 Cálculo de probabilidade
Seção 3 Noções sobre variável aleatória e distribuição de
probabilidades
Seção 4 Os tipos de distribuições de probabilidades
Seção 5 Cálculo de probabilidade usando a distribuição
probabilidade_e_estatistica_1582.indb 147 19/07/12 11:12
148
Universidade do Sul de Santa Catarina
Para início de estudo
Nesta unidade, você iniciará o estudo da Estatística Indutiva, que
tem como base o estudo de Probabilidades.
Talvez você deva estar se perguntando: Probabilidade? O
que é? Tenho certeza que muitas vezes você já pensou em
“possibilidades” de algo acontecer. Será que vai chover? Será
que serei escolhido para participar de um grupo? Será que vou
encontrar meu amigo hoje? Etc.
Muitas vezes, não podemos prever acontecimentos como esses,
ou seja, podem acontecer ou não. Você até poderia associar isso
tudo à sorte ou ao azar, enfim, ao acaso. E é aqui que o estudo
de probabilidade entra. Tentar formular e calcular modelos
matemáticos que definam essas situações e possibilite a você tomar
suas decisões e, assim, conduzir sua vida, suas experiências e seus
caminhos; este é um dos principais objetivos desta unidade.
Nessa unidade, você também conhecerá como é possível
expressar em números algumas situações com a finalidade de
possibilitar um melhor tratamento matemático a elas. Serão
apresentados os tipos de distribuições de probabilidades e como
se calcula probabilidade usando a distribuição discreta e a
distribuição contínua de probabilidades.
Você está convidado a conhecer um pouco desse assunto! Vamos lá?!
Bons Estudos!
probabilidade_e_estatistica_1582.indb 148 19/07/12 11:12
149
Probabilidade e Estatística
Unidade 4
Seção 1 – Principais conceitos
Você conhecerá, nesta seção, o que são fenômenos, o que é
um espaço amostral e o que são eventos. Estes são alguns dos
conceitos mais importantes que são utilizados na Probabilidade.
O objetivo é que você compreenda como aplicar estes
conhecimentos no seu dia a dia!
Fenômenos (ou experimentos)
Você pode entender por fenômeno qualquer acontecimento, seja
ele natural ou não.Eles podem ser classificados em dois tipos:
determinísticos ou aleatórios.
� Fenômenos determinísticos: são fenômenos em que as
condições iniciais determinam um único resultado.
� Fenômenos aleatórios: são fenômenos em que as
condições iniciais não determinam a possibilidade da
existência de um resultado em particular.
Em resumo, quando você pode determinar o resultado de um
fenômeno, você irá chamá-lo de determinístico, mas quando os
resultados do fenômeno não podem ser determinados, você irá
chamá-lo de aleatório, pois pode apresentar qualquer resultado
dentro de um grupo de esperados (mais de um).
Veja, a seguir, exemplos de cada um deles.
probabilidade_e_estatistica_1582.indb 149 19/07/12 11:12
150
Universidade do Sul de Santa Catarina
Para ilustrar, considere dois dados diferentes, o dado 1
tem as faces com o mesmo número de pontos em cada
face, e o dado 2 é um dado normal, tem as faces com
números de pontos diferentes.
� Dado 1: tem as faces com o mesmo número de
pontos;
� Dado 2: é um dado normal, tem as faces com
números de pontos diferentes e não é viciado (observe
que um dado viciado é aquele que, ao ser jogado,
sempre sai o mesmo número).
Fenômeno determinístico – se você jogar o dado
1 várias vezes, sob as mesmas condições, sempre
irá apresentar o mesmo número de pontos na face
voltada para cima. Nesse caso, você pode dizer que
é um fenômeno determinístico, pois não existe outra
possibilidade de resultado e é possível prever qual será.
Fenômeno aleatório – se você jogar o dado 2 várias
vezes, sob as mesmas condições, poderá apresentar
resultados diferentes a cada lançamento. Nesse caso,
você pode dizer que é um fenômeno aleatório, pois
existem várias possibilidades de resultado e não é
possível prever qual será.
A partir do exposto, conclui-se que o estudo de probabilidade
é baseado nos fenômenos aleatórios. Você pode dizer que o
estudo de probabilidades está intimamente ligado ao acaso.
Espaço amostral
Observe que quando se trabalha com experimentos que admitem
mais de um resultado, torna-se interessante definir o conjunto
de todos esses resultados; nesse caso, você pode chamar esse
conjunto de espaço amostral.
Espaço amostral é o conjunto de todos os possíveis
resultados de um experimento (fenômeno) aleatório.
O símbolo para representar o
conjunto do espaço amostral é S
(letra maiúscula).
probabilidade_e_estatistica_1582.indb 150 19/07/12 11:12
151
Probabilidade e Estatística
Unidade 4
Veja, a seguir, exemplos sobre o espaço amostral.
Ao verificar os exemplos, lembre-se de que o número
de elementos do conjunto do espaço amostral é
representado por n(S):
n(S) = número de elementos de S.
Exemplo 1: você pode usar o dado 2, citado no exemplo
anterior, e estudar todas as possibilidades. Pode-se construir o
seguinte conjunto:
S = {1, 2, 3, 4, 5, 6}: observe que são todas as possibilidades de
pontos de um dado normal.
Exemplo 2: um médico trabalha com um grupo de pessoas
com problemas de alcoolismo. O grupo é composto por cinco
pessoas. Duas delas apresentam cirrose e três não apresentam
cirrose (veja legenda).
Cn – Pessoa número ‘n’ com cirrose
Pn – Pessoa número ‘n’ sem cirrose
Ex.: C1 – pessoa número 1 com cirrose;
P1 – pessoa número 1 sem cirrose.
Pode-se construir o seguinte conjunto:
S = {C1, C2, P1, P2, P3}: observe que são todas as possibilidades
entre as pessoas do grupo.
Exemplo 3: um psicólogo trabalha com um grupo de pessoas
e estuda os distúrbios do sono. O grupo é composto por
sete pessoas. Cinco delas apresentam distúrbios e duas não
apresentam distúrbios (veja legenda).
Dn – Pessoa número ‘n’ com distúrbio
Pn – Pessoa número ‘n’ sem distúrbio
Ex.: D1 – pessoa número 1 com distúrbio;
P1 – pessoa número 1 sem distúrbio.
probabilidade_e_estatistica_1582.indb 151 19/07/12 11:12
152
Universidade do Sul de Santa Catarina
Pode-se construir o seguinte conjunto:
S = {D1, D2, D3, D4, D5, P1, P2}: observe que são todas as
possibilidades entre as pessoas do grupo.
Exemplo 4: um grupo de pessoas que apresentam diferenças na
cor do cabelo (veja legenda).
Pn – Pessoa número ‘n’ com cabelos pretos
Ln – Pessoa número ‘n’ com cabelos louros
Cn – Pessoa número ‘n’ com cabelos castanhos
Rn – Pessoa número ‘n’ com cabelos ruivos
Ex.: P1 – pessoa número 1 com cabelos pretos;
L1 – pessoa número 1 com cabelos louros.
Sabendo que, nesse grupo, você tem três pessoas com cabelos
pretos, duas com cabelos louros, três com cabelos castanhos
e uma com cabelos ruivos, como fica o conjunto do espaço
amostral? Pense e anote a seguir como você acha que fica o
conjunto do espaço amostral do exemplo:
S = {______________________________________}
Agora, compare se o seu conjunto do espaço amostral está igual
ao seguinte conjunto do espaço amostral:
S = {P1, P2, P3, L1, L2, C1, C2, C3, R1}: observe que são todas
as possibilidades entre as pessoas do grupo.
Qual é o número de elementos dos espaços amostrais citados nos
exemplos dados? Veja:
No exemplo 1: n(S) = 6;
No exemplo 2: n(S) = 5;
No exemplo 3: n(S) = 7;
No exemplo 4: n(S) = 9.
probabilidade_e_estatistica_1582.indb 152 19/07/12 11:12
153
Probabilidade e Estatística
Unidade 4
Eventos
Quando você tiver que estudar algum experimento aleatório,
deverá identificar as diferentes variações de resultados possíveis
dentro do espaço amostral. Você pode chamar de evento
cada uma dessas variações, ou seja, cada uma dessas partes
(subconjuntos) do espaço amostral é um evento.
Um evento é qualquer subconjunto do espaço amostral
determinado pelo experimento (fenômeno) aleatório em estudo.
Ao verificar os exemplos, lembre-sede que o número
de elementos de evento é representado por n(A):
n(A) = número de elementos de A.
Usando os exemplos citados anteriormente, você pode observar:
Exemplo 1: você pode usar o dado 2, citado no exemplo anterior,
e estudar todas as possibilidades.
Pode-se construir o seguinte evento:
A: sair um número par na face superior.
A = {2, 4, 6}: observe que são todas as possibilidades de pontos
pares de dado normal.
Exemplo 2: um médico trabalha com um grupo de pessoas
com problemas de alcoolismo. O grupo é composto por cinco
pessoas. Duas delas apresentam cirrose e três não apresentam
cirrose (veja legenda).
Cn – Pessoa número ‘n’ com cirrose
Pn – Pessoa número ‘n’ sem cirrose
Ex.: C1 – pessoa número 1 com cirrose;
P1 – pessoa número 1 sem cirrose.
O símbolo para representar
o subconjunto de um
evento é A (letra
maiúscula).
probabilidade_e_estatistica_1582.indb 153 19/07/12 11:12
154
Universidade do Sul de Santa Catarina
Pode-se construir o seguinte conjunto:
B: ser uma pessoa sem cirrose.
B = {P1, P2, P3}: observe que são todas as possibilidades de
pessoas sem cirrose.
Exemplo 3: um professor trabalha com um grupo de pessoas
e estuda os distúrbios do humor. O grupo é composto por
sete pessoas. Cinco delas apresentam distúrbios e duas não
apresentam distúrbios (veja legenda).
Dn – Pessoa número ‘n’ com distúrbio
Pn – Pessoa número ‘n’ sem distúrbio
Ex.: D1 – pessoa número 1 com distúrbio;
P1 – pessoa número 1 sem distúrbio.
Pode-se construir o seguinte evento:
C: ser uma pessoa com distúrbio.
C = {D1, D2, D3, D4, D5}: observe que são todas as
possibilidades de pessoas com distúrbio.
Exemplo 4: um grupo de pessoas que apresentam diferenças na
cor do cabelo (veja legenda).
Pn – Pessoa número ‘n’ com cabelos pretos
Ln – Pessoa número ‘n’ com cabelos louros
Cn – Pessoa número ‘n’ com cabelos castanhos
Rn – Pessoa número ‘n’ com cabelos ruivos
Ex.: P1 – pessoa número 1 com cabelos pretos;
L1 – pessoa número 1 com cabelos louros.
Sabendo que nesse grupo você tem três pessoas com cabelos
pretos, duas com cabelos louros, três com cabelos castanhos e
uma com cabelos ruivos, como fica o subconjunto do evento
pessoas com cabelos ruivos?
probabilidade_e_estatistica_1582.indb 154 19/07/12 11:12
155
Probabilidade e Estatística
Unidade 4
Pode-se construir o seguinte evento:
D: ser uma pessoa com cabelos ruivos.
D = {R1}: observe que é a única possibilidade com cabelos ruivos.
Qual é o número de elementos dos eventos citados nos exemplos
anteriores?
No exemplo 1: n(A) = 3;
No exemplo 2: n(B) = 3;
No exemplo 3: n(C) = 5;
No exemplo 4: n(D) = 1.
Tipos de eventos
Existem três tipos de eventos, que são:
� Evento simples: formado por apenas um elemento do
espaço amostral.
Exemplo: D: ser uma pessoa com cabelos ruivos. (Veja o
exemplo 4)
D = {R1} ⇒ n(D) = 1.
� Evento composto: formado por dois ou mais elementos
do espaço amostral.
Exemplo: B: ser uma pessoa sem cirrose. (Veja o exemplo
2)
B = {P1, P2, P3} ⇒ n(B) = 3
� Evento impossível: não ocorre, seja qual for a realização
do experimento aleatório.
Exemplo: F: ser uma pessoa com cabelos verdes naturais.
(Veja o exemplo 4)
F = { } ⇒ n(F) = 0
probabilidade_e_estatistica_1582.indb 155 19/07/12 11:12
156
Universidade do Sul de Santa Catarina
� Evento certo: é quando o evento é o próprio espaço
amostral.
Exemplo: E: ser uma pessoa com alcoolismo. (Veja o
exemplo 2)
E={C1, C2, P1, P2, P3} ⇒ n (E)= 5 = n(S)
Operações com eventos
As operações com eventos são muito semelhantes às operações
com conjuntos, até porque os eventos nada mais são que
conjuntos. Veja, a seguir, mais detalhes sobre este assunto.
União de eventos
Se existem os eventos A e B de um espaço amostral S, a união
desses eventos existe se pode ocorrer A ou B.
A B
S
Figura 4.1 – Representação em diagrama da união entre eventos
Fonte: Elaboração do autor (2006).
A união de A e B pode ser representada por: A soma B ou A∪B.
A união corresponde a toda a área colorida.
Interseção de eventos
Se existem os eventos A e B de um espaço amostral S,
a interseção desses eventos existe se pode ocorrer A e B,
simultaneamente.
probabilidade_e_estatistica_1582.indb 156 19/07/12 11:12
157
Probabilidade e Estatística
Unidade 4
A
S
Figura 4.2 – Representação em diagrama da intersecção entre eventos
Fonte: Elaboração do autor (2006).
A interseção de A e B pode ser representada por: A vezes B ou
A∩B. A interseção corresponde a toda a área colorida.
Complemento de um evento
É um evento formado por todos os elementos pertencentes a S,
mas que não pertencem a A.
A
S
A’
Figura 4.3 – Representação em diagrama do complementar de um evento
Fonte: Elaboração do autor (2006).
Complementar de A – pode ser representado por: , A’ ou CA. O
complementar de A corresponde a toda a área colorida.
probabilidade_e_estatistica_1582.indb 157 19/07/12 11:12
158
Universidade do Sul de Santa Catarina
Subtração de eventos
Você pode dizer que A menos B é se, e somente se, ocorre A e
não ocorre B.
A B
S
Figura 4.4 – Representação em diagrama da subtração de eventos
Fonte: Elaboração do autor (2006).
A subtração de eventos pode ser representada por A − B, que
corresponde a toda a área colorida.
Eventos excludentes
Dois ou mais eventos são ditos excludentes (mutuamente
exclusivos) se a realização de um dos eventos excluir a realização
do outro ou de outros eventos.
A
B
S
C
Figura 4.5 – Representação em diagrama da subtração de eventos
Fonte: Elaboração do autor (2006).
Se, quando A ocorrer, exclui ocorrerem os outros, isso quer
dizer que não há interseção entre eles! A e B são mutuamente
exclusivos e B e C não são mutuamente exclusivos.
Agora que você já estudou os conceitos mais importantes que são
utilizados na probabilidade, é hora de conhecer como é feito o
cálculo de probabilidade. Acompanhe na seção a seguir!
probabilidade_e_estatistica_1582.indb 158 19/07/12 11:12
159
Probabilidade e Estatística
Unidade 4
Seção 2 – Cálculo de probabilidade
Nesta seção, vamos estudar os conceitos de probabilidade e a
forma de fazer seus cálculos! Acompanhe as duas definições
mais importantes dentro do estudo de probabilidades. São elas: a
definição clássica de probabilidade e a frequência relativa.
Veja, então, separadamente, cada uma dessas definições.
Probabilidade clássica
Antes de conhecer como se calcular a probabilidade clássica,
saiba como ela é possível.
A probabilidade de ocorrer um determinado resultado
na realização de um experimento é igual ao quociente
entre o número de casos favoráveis ao sucesso (número
de elementos do evento A) e o número de casos
possíveis (número de elementos do espaço amostral S).
Observe a fórmula a seguir:
Probabilidade de um evento A ocorrer:
= P = sucesso
Observação: A probabilidade de não ocorrência pode ser
representada por:
= q = fracasso
Observe que, se você quiser o resultado em porcentagem, deve
multiplicá-lo por 100 ao final.
probabilidade_e_estatistica_1582.indb 159 19/07/12 11:12
160
Universidade do Sul de Santa Catarina
Veja, a seguir, alguns exemplos do cálculo de probabilidade clássica.
Exemplo 1: em um levantamento feito com oito moradores de um
condomínio, verificou-se que dois são casados, dois são solteiros, três
são divorciados e um é viúvo. Qual a probabilidade de, ao escolher
um morador ao acaso, ele ser casado? E qual a probabilidade de, ao
escolher um morador ao acaso, ele ser divorciado?
Compreenda passo a passo
Passo 1: identificar os elementos do espaço amostral e do evento
solicitado.
S: moradores do condomínio
A: moradores casados
B: moradores divorciados
S = {C1, C2, S1, S2, D1, D2,
D3, V1}
A = {E1, E2}
B = {F1, F2, F3}
Passo 2: identificar o número de elementos de cada conjunto.
n(S) = 8;
n(A) = 2;
n(B) = 3.
Passo 3: usar a fórmula da probabilidade.
Observação: Após efetuar a divisão é só multiplicar por 100 para
obter a probabilidadena forma percentual.
Para o evento A:
Para o evento B:
P(A) = 0,25 ou 25%
P(A) = 0,375 ou 37,5%
Legenda:
Estado civil:
C – Casado (dois moradores ) C1, C2
S – Solteiro (dois moradores) S1, S2
D – Divorciado (três moradores) D1,
D2, D3
V – Viúvo (um morador) V1
probabilidade_e_estatistica_1582.indb 160 19/07/12 11:12
161
Probabilidade e Estatística
Unidade 4
Passo 4: interpretar os dados.
Como interpretar estes dados? A probabilidade de um morador
casado ser escolhido é de 25%, e a probabilidade de um morador
divorciado ser escolhido é de 37,5%.
Exemplo 2: em um levantamento realizado com um grupo de 90
chefes de famílias com diferentes vínculos de trabalho, obteve-se
os seguintes resultados (dados fictícios):
Pesquisa dos motivos de estresse
Tipos de vínculo Nº de pessoas
M Funcionário público municipal 29
E Funcionário público estadual 24
F Funcionário público federal 20
C Comerciário 17
T Temporário 17
I Comércio informal 11
Total 118
Evento A
Evento C
Evento B
Espaço
amostral
n(A)
n(C)
n(B)
Tamanho do espaço
amostral: n(S)
Figura 4.6 – Resultado do levantamento
Fonte: Elaboração do autor (2006).
Se você escolher ao acaso uma pessoa do grupo pesquisado, qual
a probabilidade de ela ter vínculo do tipo:
a) funcionário público municipal?
b) comerciário?
c) comércio informal?
probabilidade_e_estatistica_1582.indb 161 19/07/12 11:12
162
Universidade do Sul de Santa Catarina
Compreenda passo a passo
Passo 1: identificar os elementos do espaço amostral e do evento
solicitado.
S: todas as pessoas pesquisadas;
A: pessoa com vínculo do tipo funcionário público municipal;
B: pessoa com vínculo do tipo comerciário;
C: pessoa com vínculo do tipo comercio informal.
Passo 2: identificar o número de elementos de cada conjunto.
n(S) = 118
n(A) = 29
n(B) = 11
n(C) = 17
Passo 3: usar a fórmula da probabilidade.
Obs: Após efetuar a divisão, é só multiplicar o resultado por 100
para obter a probabilidade na forma percentual.
Para o evento A
P(A) = 0,2458 ou 24,58%
Para o evento B
P(B) = 0,0932 ou 9,32%
Para o evento C
P(C) = 0,1441 ou 14,41%
No exemplo anterior, você calculou a probabilidade para
três eventos. A seguir, você montará uma tabela com as
probabilidades para todos os eventos calculados. Siga os passos:
probabilidade_e_estatistica_1582.indb 162 19/07/12 11:12
163
Probabilidade e Estatística
Unidade 4
Compreenda passo a passo
Passo 1: identificar os elementos do espaço amostral e do evento
solicitado.
S: todas as pessoas pesquisadas (no caso, pessoas acometidas de
estresse);
D: pessoa com vínculo do tipo funcionário público estadual;
E: pessoa com vínculo do tipo funcionário público federal;
F: pessoa com vínculo do tipo temporário.
Passo 2: identificar o número de elementos de cada conjunto.
n(S) = 118
n(D) = 24
n(E) = 20
n(F) = 17
Passo 3: usar a fórmula da probabilidade.
Obs: Após efetuar a divisão, é só multiplicar o resultado por 100
para obter a probabilidade na forma percentual.
Para o evento D
P(D) = 0,2034 ou 20,34%
Para o evento E
P(E) = 0,1695 ou 16,95%
Para o evento F
P(F) = 0,1441 ou 14,41%
probabilidade_e_estatistica_1582.indb 163 19/07/12 11:12
164
Universidade do Sul de Santa Catarina
Passo 4: montar a tabela com as probabilidades correspondentes a
cada evento.
Tabela 4.1 – Levantamento com 90 chefes de famílias sobre os diferentes vínculos de
trabalho
Tipos de vínculo Nº de pessoas Probabilidade
M Funcionário público municipal 29 0,2458
E Funcionário público estadual 24 0,2034
F Funcionário público federal 20 0,1695
C Comerciário 17 0,1441
T Temporário 17 0,1441
I Comércio informal 11 0,0932
Total 118 1*
* Repare que a soma é 1 ou 100%
Fonte: Elaboração do autor (2006).
Agora que você já compreendeu o conceito clássico de
probabilidade e como realizar os cálculos, é hora de compreender
o que é frequência relativa e como realizar os cálculos.
Frequência Relativa
A frequência relativa de um evento A é calculada dividindo o
número de vezes que ocorre o evento A pelo total de observação
do experimento. É chamada, também, de probabilidade
avaliada ou probabilidade estimada.
Veja a fórmula abaixo:
Frequência relativa de um evento A:
frA =
número de vezes que ocorreu A
número total de observações
probabilidade_e_estatistica_1582.indb 164 19/07/12 11:12
165
Probabilidade e Estatística
Unidade 4
Na verdade, a frequência relativa é calculada quando você se deparar
com situações em que o cálculo da probabilidade de um evento não
é possível. Nesse caso, só é possível o cálculo de uma aproximação,
a qual, por sua vez, consiste em analisar o experimento e, com os
resultados obtidos, calcular a frequência relativa.
É importante que você saiba que essa aproximação
para o cálculo de probabilidade só será considerável
caso haja um número bastante grande de tentativas
de execução do experimento. Como fazer isso? Veja os
exemplos a seguir.
Exemplos do cálculo da frequência relativa
Em um teste feito em laboratório com cobaias, foi analisada uma
delas e, após inúmeras vezes, sob efeito de estímulos (comida,
reação a dor etc.), ela executou um comando, que era empurrar
uma pequena alavanca. Foi observado que, após 3500 estímulos,
a cobaia executou o comando 875 vezes. Qual é a frequência
relativa para o evento A: a cobaia executar o comando?
Acompanhe passo a passo
Passo 1: identificar o numerador e o denominador da fórmula.
Número total de observações: 3500
Número de vezes que ocorre A: 875
probabilidade_e_estatistica_1582.indb 165 19/07/12 11:12
166
Universidade do Sul de Santa Catarina
Passo 2: usar a fórmula da frequência relativa.
Obs: Após efetuar a divisão, é só multiplicar o resultado por 100
para obter a probabilidade na forma percentual.
frA =
número de vezes que ocorreu A
número total de observações
Passo 3: interpretar os dados.
A frequência relativa para a cobaia executar a tarefa é de 25%; ou,
ainda, a probabilidade estimada da cobaia executar a tarefa é de 25%.
Algumas considerações
Consideremos S um espaço amostral, e A, B, C são eventos
contidos em S, então:
a) para cada evento A → 0 ≤ P(A) ≤ 1 (a probabilidade de A
vai de 0 a 1 ou de 0% a 100%);
b) P(S) = 1 ↔
c) sejam A, B e C todos os eventos possíveis do espaço
amostral, então: P(A) + P(B) + P(C) = 1 ou 100%;
d) quando A e B são mutuamente exclusivos:
P(A∪B) = P(A) + P(B);
e) quando A e B não são mutuamente exclusivos:
P(A∪B) = P(A) + P(B) – P(A∩B);
f) se A, B, C, ... são uma sequência de eventos mutuamente
exclusivos, então:
P(A∪B∪C∪...) = P(A) + P(B) + P(C) + ...
probabilidade_e_estatistica_1582.indb 166 19/07/12 11:12
167
Probabilidade e Estatística
Unidade 4
Seção 3 – Noções sobre variável aleatória e
distribuição de probabilidades
A variável aleatória é uma ferramenta na análise estatística que
possibilita a atribuição de números para resultados de experimentos,
adequando, assim, o problema para um melhor tratamento
matemático. Dentro da Estatística, ela é considerada uma função
que associa números aos eventos de um espaço amostral. Você
poderá entender melhor se começar analisando um exemplo.
Exemplos de variável aleatória e distribuição de probabilidades
Exemplo 1: se o experimento consistir em dois lançamentos de
uma moeda, e a variável aleatória (v.a.), definida como o nº de caras
obtidas em dois lançamentos de uma moeda, então você terá:
v.a. ⇒ X = nº de caras obtidas em dois lançamentos de uma moeda
X definirá uma variável aleatória que poderá assumir os valores
descritos na tabela a seguir (K = cara e C = coroa).
Tabela 4.2 – Organização dos resultados e valores
Resultados
1º lançamento
Resultados
2º lançamento
Resultados possíveis nos dois
lançamentos Valor VA
K
K
C
C
K
C
K
C
KK
KC
CK
CC
2
1
1
0
Fonte: Elaboração do autor (2006).
Você pode observar que existe apenas uma possibilidade para
cada situação e o total de possibilidades é 4; entãoo cálculo da
probabilidade se dá da seguinte forma:
probabilidade_e_estatistica_1582.indb 167 19/07/12 11:12
168
Universidade do Sul de Santa Catarina
Escrevendo na tabela, atribuindo a probabilidade de cada linha
você terá:
Tabela 4.3 – Distribuição de probabilidade
Resultados possíveis
nos dois lançamentos
Valor VA Probabilidade
KK
KC
CK
CC
2
1
1
0
1/4
1/4
1/4
1/4
Fonte: Elaboração do autor (2006).
Esta tabela caracteriza a distribuição de
probabilidade, que é a probabilidade de ocorrência
de cada um dos valores da variável aleatória.
Note que o valor 1 se repete, não é? Então, você pode agrupar
e montar uma nova tabela sem as repetições. É claro que se
agrupam os valores repetidos. Você deve somar as probabilidades,
não se esqueça disso. Observe:
Tabela 4.4 – Agrupamento de resultados
Nº de caras (Valor v.a.) Probabilidade
2
1
0
1/4
1/2
1/4
Fonte: Elaboração do autor (2006).
Duas
possibilidades de
sair uma cara
Ao agrupar os resultados
da variável aleatória (uma
cara – 1), você deve somar
as probabilidades:
probabilidade_e_estatistica_1582.indb 168 19/07/12 11:12
169
Probabilidade e Estatística
Unidade 4
Seção 4 – Os tipos de distribuições de probabilidades
O estudo de probabilidades é uma ferramenta de apoio à decisão.
É com base em seu estudo que você terá oportunidade de suporte
para analisar os experimentos, organizar suas possibilidades e, então,
partir para a ação, adotando o resultado que julgar mais eficaz.
A variável aleatória e a distribuição de probabilidades são muito
utilizadas nesse sentido. Você pode ver que, a cada valor da
variável, corresponde uma probabilidade de ocorrência. Como a
variável aleatória possibilita a atribuição de valores aos eventos,
você pode encontrar dois tipos de situação.
Variáveis aleatórias discretas: ela pode assumir um conjunto
constante discreto, ou seja, enumerável, finito de valores.
Número de caras resultante de lançamentos de uma
moeda, quantidade de caminhões de determinado
modelo, número de defeitos por peça, entre outros,
são exemplos deste tipo de variáveis.
Variáveis aleatórias contínuas: é a variável em que não
conseguimos enumerar seus possíveis resultados, por estes
formarem um conjunto infinito de valores num intervalo de
números reais.
São exemplos desse tipo de variáveis: peso, altura,
temperatura, tempo de transporte, custo de uma
operação etc.
Baseado nesses dois conceitos, você pode atribuir a cada um dos
tipos de variáveis aleatórias uma distribuição de probabilidades de
acordo com o tipo de variável, veja a figura a seguir:
probabilidade_e_estatistica_1582.indb 169 19/07/12 11:12
170
Universidade do Sul de Santa Catarina
Variável aleatória
discreta
Variável aleatória
contínua
Distribuição discreta
de probabilidade
Distribuição contínua
de probabilidade
Figura 4.7 – Tipos de distribuição de probabilidade
Fonte: Elaboração do autor (2006).
Como você pôde observar, cada tipo de variável gera um tipo
de distribuição de probabilidade. Em resumo, os tipos de
distribuição de probabilidades são:
� Distribuição discreta de probabilidades; e
� Distribuição contínua de probabilidades.
Como elas são diferentes, os métodos de cálculos das
probabilidades também são.
Você vai estudar, na próxima seção, os modelos mais importantes
e mais aplicados dentro da área de seu curso, que são a
distribuição binomial, para a variável discreta, e a distribuição
normal, para a contínua.
Para o bom andamento de seu
estudo, é importante que você
entenda bem a diferença entre
as duas variáveis, a discreta e a
contínua!
probabilidade_e_estatistica_1582.indb 170 19/07/12 11:12
171
Probabilidade e Estatística
Unidade 4
Seção 5 – Cálculo de probabilidade usando a
distribuição
Uma distribuição discreta de probabilidade de uma variável
aleatória atribui probabilidades aos distintos valores
dessa variável. Observe que essa distribuição não atribui
probabilidade para intervalos, e sim para cada valor ou para um
conjunto de valores da variável.
Uma das principais distribuições discretas é a binomial. Veja, a
seguir, como se calcula probabilidade usando esse método.
Como se calcula a distribuição binomial?
A distribuição binomial é o método utilizado para cálculo de
probabilidades de experimentos que se repetem algumas vezes e
seguem algumas características.
A distribuição binomial é aplicável se:
1. o experimento que você está observando for repetido n
vezes independentes;
2. cada tentativa (repetição) admitir somente dois
resultados:
� sucesso: denotado por S;
� fracasso: denotado por F.
A probabilidade de sucesso é denotada por p ⇒ P(S) = p, e a
probabilidade de fracasso é denotada por q ⇒ P(F) = q.
Importante: A soma da probabilidade de sucesso e fracasso é
igual a 100%, ou seja, é igual a 1 ⇒ p + q = 1.
A soma é utilizada se você estiver interessado em estudar o número
de sucessos e fracassos sem importar a ordem em que acontecem.
probabilidade_e_estatistica_1582.indb 171 19/07/12 11:12
172
Universidade do Sul de Santa Catarina
Diante do exposto, é importante salientar que:
� a distribuição binomial só é aplicável caso ocorram os
três casos citados anteriormente;
� os termos sucesso e fracasso são usados se o resultado
esperado ocorre ou não, ou seja, depende do objetivo de
seu estudo.
Veja o exemplo a seguir para compreender como realizar os
cálculos:
Em um exame, você deseja saber a probabilidade de erro de uma
determinada questão. Essa questão apresenta cinco alternativas
(a, b, c, d, e) e somente uma está correta.
Qual é a probabilidade de sucesso?
Nesse caso, o objetivo é estudar a probabilidade de erro, então, o
sucesso se refere ao erro. Para calcular a probabilidade de sucesso,
você deve calcular a probabilidade de erro da questão.
Veja como se calcula passo a passo
Passo 1: identificar os elementos do espaço amostral e do evento
solicitado.
A: errar a questão
S: todas as opções (a, b, c, d, e)
Passo 2: identificar o número de elementos do evento e do espaço
amostral.
n(A) = 4 (se somente uma está correta, sobram quatro incorretas)
n(S) = 5
probabilidade_e_estatistica_1582.indb 172 19/07/12 11:12
173
Probabilidade e Estatística
Unidade 4
Passo 3: usar a fórmula da probabilidade.
→ a probabilidade de sucesso é,
então, p = 0,8.
Qual é a probabilidade de fracasso?
Acompanhe passo a passo
Passo 1: identificar os elementos do espaço amostral e do evento
solicitado.
B: acertar a questão
S: todas as opções (a, b, c, d, e)
Passo 2: identificar o número de elementos do evento e do espaço
amostral.
n(B) = 1 (se somente uma está correta)
n(S) = 5
Passo 3: usar a fórmula da probabilidade.
– a probabilidade de sucesso é, então,
q = 0,2
Observe:
p + q = 0,8 + 0,2 = 1 ou 100%
‑ Espero que a diferença tenha sido percebida. Lembre‑se de que o suces‑
so não está ligado a acontecimentos bons e, sim, se ocorrer o resulta‑
do que é objetivo de seu estudo.
probabilidade_e_estatistica_1582.indb 173 19/07/12 11:12
174
Universidade do Sul de Santa Catarina
Analise o seguinte exemplo: estudar a probabilidade de errar,
como no exemplo anterior. Ainda citando o exemplo anterior:
nesse problema, você estudou a probabilidade de errar somente
uma questão do exame, e para estudar as possibilidades de erro
ou acerto de questões de um exame inteiro? É aí que entra a
distribuição binomial.
Você sabe qual o método de cálculo?
No exemplo anterior, você calculou a probabilidade de sucesso
(errar) para somente uma tentativa (questão). Agora, você
vai calcular, para n tentativas, a probabilidade de k sucessos.
Acompanhe:
Seja X o número de sucessos em n tentativas do experimento.
Então, a fórmula para determinar a probabilidade de um dado
número k de sucessos é dada por:
P(X = K) = Cn,k . pk . qn‑k
Sendo:
Cn,k = combinação de n elementos organizados em grupos de k
elementos;
n = tentativas do experimento;
k = número de sucessos desejados;
p =probabilidade de sucesso (ocorrência do evento);
q = probabilidade de fracasso (não ocorrência do evento).
Notação: n!
n! = n.(n − 1).(n − 2). ... .2.1
k! = k.(k − 1).(k − 2). ... .2.1
Veja, a seguir, exemplos do cálculo de probabilidade usando a
distribuição binomial.
probabilidade_e_estatistica_1582.indb 174 19/07/12 11:12
175
Probabilidade e Estatística
Unidade 4
Exemplo 1: uma prova com quatro questões, cada uma apresenta
cinco alternativas (a, b, c, d, e) e somente uma está correta. Qual
a probabilidade de errar duas questões?
Passo 1: calcular a probabilidade de errar (no caso, sucesso) para
cada questão.
A: errar a questão
S: todas as opções (a, b, c, d, e)
n(A) = 4 (se somente uma está correta, sobram quatro incorretas)
n(S) = 5
– a probabilidade de sucesso é,
então, p = 0,8.
Passo 2: calcular a probabilidade de acertar (no caso, fracasso) para
cada questão.
Você pode calcular de dois modos:
1. Primeiro modo de cálculo:
B: acertar a questão
S: todas as opções (a, b, c, d, e)
n(B) = 1 (se somente uma está correta)
n(S) = 5
– a probabilidade de fracasso, então
q = 0,2
2. Segundo modo de cálculo:
p + q = 1 ⇒ 0,8 + q = 1 ⇒ q = 1 – 0,8 ⇒ q = 0,2
Nesse caso, o objetivo é
estudar a probabilidade
de erro, então, o sucesso
se refere ao erro. Veja,
a seguir como se calcula
passo a passo.
probabilidade_e_estatistica_1582.indb 175 19/07/12 11:12
176
Universidade do Sul de Santa Catarina
Passo 3: identificar cada um dos componentes da fórmula.
n = 4 (total de repetições – são quatro questões com as mesmas
características)
k = 2 (número de sucessos – errar duas questões)
p = 0,8 (probabilidade de sucesso, calculado anteriormente)
q = 0,2 (probabilidade de fracasso, calculado anteriormente)
Passo 4: calcular a probabilidade usando a fórmula apresentada.
P(X = K) = Cn,k . pk . qn‑k ⇒
Passo 5: como interpretar estes dados?
A probabilidade de uma pessoa acertar duas questões de um teste
de quatro questões é de 15,36%. Note que não é 50%, pois você
deve levar em consideração que cada questão tem sua probabilidade
e, também, você pôde agrupar as questões de várias maneiras (errar
a 1ª e a 3ª, ou a 2ª e a 4ª, ou a 1ª e a 4ª, e assim por diante).
Representação gráfica de uma distribuição binomial
Como se trata de uma distribuição, você pode construir um
gráfico que represente as probabilidades do problema do exemplo
usado. Claro que, para tanto, você deverá calcular a probabilidade
para cada possibilidade, ou seja, para k = 0, 1, 2, 3 e 4. Não se
assuste, pois, a seguir, você poderá acompanhar as probabilidades
calculadas na tabela e o gráfico desta distribuição.
probabilidade_e_estatistica_1582.indb 176 19/07/12 11:12
177
Probabilidade e Estatística
Unidade 4
Tabela 4.5 – Probabilidade de errar as questões do teste
Número de erros P(X)
0 0,0016
1 0,0256
2 0,1536
3 0,4096
4 0,4096
Total 1
Fonte: Elaboração do autor (2006).
Gráfico 4.1 – Probabilidade de errar as questões no teste
Fonte: Elaboração do autor (2006).
Tudo o que você acabou de estudar, neste tópico, é o método
de cálculo de probabilidade usando a distribuição binomial. A
intenção, com esse estudo, é que você tenha uma noção desse
processo, porém sem maiores aprofundamentos.
Note que para cada uma
das possibilidades é
construída uma coluna.
probabilidade_e_estatistica_1582.indb 177 19/07/12 11:12
178
Universidade do Sul de Santa Catarina
Cálculo de probabilidade usando distribuição contínua de
probabilidade
Uma distribuição contínua de probabilidade de uma variável
aleatória atribui probabilidades a intervalos de valores dessa
variável. Note que essa distribuição atribui probabilidade para
intervalos, e não para um valor dessa variável.
Uma das principais distribuições contínuas é a normal.
No decorrer desse tópico, você vai estudar um pouco dessa
distribuição, além de aprender a calcular probabilidade usando
esse método.
A distribuição normal
Como você estudou anteriormente, quando se utiliza uma
variável aleatória contínua, pode-se atribuir probabilidade a
essa variável. Conforme a seção anterior, os processos definidos
a partir de contagens conduzem aos modelos que envolvem
variáveis aleatórias discretas, enquanto que os processos definidos
a partir de medidas conduzem aos modelos que envolvem
variáveis aleatórias contínuas.
Variável aleatória
discreta
Variável aleatória
contínua
Contagens
Medidas
Figura 4.8 – Tipos de distribuições de probabilidade
Fonte: Elaboração do autor (2006).
Podemos citar, como exemplos de variáveis contínuas, a altura
das pessoas, temperatura corporal, peso, escores obtidos em testes
psicológicos etc.
Antes de começar o estudo do cálculo de probabilidade usando a
distribuição normal, vamos relembrar alguns conceitos.
Considere a distribuição de frequências e seu histograma a
seguir:
probabilidade_e_estatistica_1582.indb 178 19/07/12 11:12
179
Probabilidade e Estatística
Unidade 4
Tabela 4.6 – Tempo, em minutos, para as entregas urbanas da empresa X
Tempo (em minutos) Nº de entregas (fi)
15,9 |--- 18,7 2
18,7 |--- 21,5 6
21,5 |--- 24,3 10
24,3 |--- 27,1 14
27,1 |--- 29,9 10
29,9 |--- 32,7 6
32,7 |--- 35,5 2
Total (∑fi) 50
Fonte: Elaboração do autor (2006).
Histograma
Gráfico 4.2 – Tempo, em minutos, para as entregas urbanas da empresa X
Fonte: Elaboração do autor (2006).
probabilidade_e_estatistica_1582.indb 179 19/07/12 11:12
180
Universidade do Sul de Santa Catarina
Observe que o gráfico é construído no sistema de eixos
cartesianos, não é mesmo? No eixo horizontal, são marcados
os valores ou intervalos das classes assumidos pela variável. No
eixo vertical, marcamos as frequências simples, que servirão para
marcar a altura dos retângulos, indicando, assim, o número de
observações (ocorrências) de cada valor ou classe da variável.
Como a altura de cada retângulo é proporcional à
frequência simples, a área de cada retângulo também
é. Considerando isso, a soma das áreas dos retângulos
também é proporcional à frequência total.
Continuando com a recordação, veja, agora, o polígono de
frequências. Para construir um polígono de frequência de dados,
é só unir, por linhas, os pontos médios das bases superiores dos
retângulos do histograma.
Acompanhe o exemplo a seguir.
0
2
4
6
8
10
12
14
16
15
,9
|—
18
,7
18
,7
|—
21
,5
21
,5
|—
24
,3
24
,3
|—
27
,1
27
,1
|—
29
,9
29
,9
|—
32
,7
32
,7
|—
35
,5
N
o d
e
en
tr
eg
as
Tempo em minutos
Tempo, em minutos, para as entregas urbanas da empresa X
Polígono de
Frequência
Estes triângulos
compensam os
que �cam fora
do polígono.
Gráfico 4.3 – Tempo, em minutos, para as entregas urbanas da empresa X
Fonte: Elaboração do autor (2006).
Mantenha essa informação à mão,
pois, você irá usá-la novamente!
probabilidade_e_estatistica_1582.indb 180 19/07/12 11:12
181
Probabilidade e Estatística
Unidade 4
Você pôde observar que a área do histograma é igual à área
abaixo do polígono de frequências, ou seja, os triângulos que
ficam fora são compensados por aqueles que estão adicionados
por dentro.
O gráfico expressa os tempos que a empresa levou
para realizar 100% das entregas de um determinado
período.
Você observou que o polígono de frequências tem um formato
especial? Sim, ele tem o formato de um sino. Essa curva é chamada
de curva normal ou curva de Gauss-Laplace e tem algumas
características bem especiais. Conheça-a no tópico a seguir.
Características da curva normal
Analisando o polígono de frequências da grande maioria
das séries, você pode observar, com certo ajuste, que elas se
aproximam de uma distribuição normal, ou seja, apresentam um
gráfico semelhante conforme pode ser observado a seguir:
X=Me=Mo
f
x
Gráfico 4.4 – Curva de Gauss-Laplace
Fonte: Adaptado de Silva (1997, p. 70).
probabilidade_e_estatistica_1582.indb 181 19/07/12 11:12
182
Universidade do Sul de Santa Catarina
Principais características da curvanormal
Dentre as principais, podemos citar algumas tais como:
a) a curva se caracteriza por ter a forma de um sino;
b) a curva tem 2 pontos de inflexão (lugar onde a curva se
modifica);
c) a curva normal é simétrica com relação à média (é igual
tanto à esquerda, quanto à direita da média);
d) a área limitada pela curva e pelo eixo das abscissas é 1 ou
100% (sendo assim, por ser simétrica, tem 50% da área à
esquerda e 50% da área à direita da média);
e) a curva é assintótica, isto é, se aproxima indefinidamente
do eixo das abscissas sem tocá-lo;
f) a curva normal é unimodal, isto é, possui um só pico ou
ponto de frequência máxima, ponto este onde coincidem
a moda, a média e a mediana;
g) a função que define a curva é:
A distribuição normal de probabilidade usa como base
a curva normal.
Sabendo que a área abaixo do polígono (curva) representa
proporcionalmente a frequência total da série, e com o uso da
média e do desvio padrão tem-se condições de realizar estudo de
concentração dos dados em torno da média.
Com relação à área abaixo da curva, analise o gráfico a seguir:
13,59%
34,13%
0,5 ou 50%
2,15%
X
Gráfico 4.5 – Distribuição normal, com percentuais em referência ao desvio padrão
Fonte: Adaptado de Triola (1999, p. 43).
probabilidade_e_estatistica_1582.indb 182 19/07/12 11:12
183
Probabilidade e Estatística
Unidade 4
Veja, a seguir, alguns exemplos para compreender como realizar
os cálculos do desvio padrão.
Em um teste, a média dos escores de um grupo de pessoas foi de
= 80, e o desvio padrão foi de σ(x) = 3. Pode-se interpretar esses
valores da seguinte forma:
Os valores da série estão concentrados em torno da média:
� o intervalo ( − σ (x); + σ (x)) contém aproximadamente
68,26% dos elementos da série, ou seja, o intervalo
(77; 83) → (80 − 3 = 77 e 80 + 3 = 83);
� o intervalo ( − 2 σ (x); + 2 σ (x)) contém
aproximadamente 95,44% dos elementos da série, ou
seja, o intervalo(74; 86) → (80 − 6 = 74 e 80 + 6 = 86);
� o intervalo ( − 3 σ (x); + 3 σ (x)) contém
aproximadamente 99,74% dos elementos da série, ou seja,
o intervalo (71; 89) → (80 − 9 = 71 e 80 + 9 = 89).
Veja, no gráfico a seguir, a ilustração desse exemplo:
13,59%
34,13% 34,13%
13,59%
2,15% 2,15%
68,26%
95,44%
99,74%
71 74 77 =80 83 86 89
Gráfico 4.6 – Distribuição normal, com percentuais em referência ao desvio padrão
Fonte: Adaptado de Triola (1999, p. 43).
probabilidade_e_estatistica_1582.indb 183 19/07/12 11:12
184
Universidade do Sul de Santa Catarina
Como ler os gráficos? Aí vão algumas sugestões:
� O percentual de entregas com tempo entre 77 e
83 minutos é de 68,26% (ou, ainda, a probabilidade de
escolher uma entrega que tenha sido feita entre 77 e
83 minutos é de 68,26%).
� O percentual de entregas com tempo entre 74 e
86 minutos é de 95,44% (ou ainda, a probabilidade de
escolher uma entrega que tenha sido feita entre 74 e 86
minutos é de 95,44%).
� O percentual de entregas com tempo entre 71 e
89 minutos é de 99,74% (ou ainda, a probabilidade de
escolher uma entrega que tenha sido feita entre 71 e 89
minutos é de 99,74%).
Como você pôde observar, os percentuais estão ligados à média
e ao desvio padrão e, por sua vez, determinam os intervalos a
serem estudados. Esses percentuais são obtidos calculando a área
entre a curva e o eixo X, entre os extremos do intervalo que você
está estudando. Exemplo: (77; 83).
Baseado nesse estudo é que você poderá calcular a probabilidade
de algum evento que resulte em um intervalo. Veja como fazer
esses cálculos no próximo tópico.
Descrição do método de cálculo
A probabilidade em uma distribuição contínua de probabilidade
(probabilidade de ocorrência de um intervalo) é obtida calculando
a área entre a curva e o eixo X, como você já viu em estudos
anteriores. Essa área é calculada com o uso de uma ferramenta
matemática chamada de integral definida da função, ou seja,
dada a função a seguir, a área entre a curva e o eixo X, no
intervalo (a; b), é calculada da seguinte forma:
probabilidade_e_estatistica_1582.indb 184 19/07/12 11:12
185
Probabilidade e Estatística
Unidade 4
f
xa b
P(a<x<b)
Gráfico 4.7 – Distribuição normal, com intervalo definido
Fonte: Adaptado de Silva (1997, p. 71).
‑ A determinação desta área usando‑se o cálculo de integral é bastan‑
te complicada e não será usado em seu estudo. Para superar essa
dificuldade, utiliza‑se outra distribuição, chamada de Distribui‑
ção Normal Padronizada (ou Reduzida). O artifício consiste em
transformar a variável X, com média e desvio padrão σ, em
uma variável Z , com média 0 e desvio padrão 1, para que você
possa fazer utilização da tabela de Z (variável padronizada) com
os valores das áreas já calculados.
Mas como podemos padronizar?
Esta padronização é adotada para tornar o cálculo de probabilidade
da ocorrência de intervalo mais fácil e mais simples. Qualquer
distribuição X com as características citadas anteriormente pode ser
transformada na distribuição normal padronizada (ou reduzida) Z,
para que seja possível o cálculo de áreas.
A transformação da variável aleatória X na variável padronizada
se dá mediante o uso da fórmula a seguir:
probabilidade_e_estatistica_1582.indb 185 19/07/12 11:12
186
Universidade do Sul de Santa Catarina
Cálculo da variável padronizada:
Em que:
X1 = valor da v.a. (limite do intervalo)
= média
σ = desvio padrão
Acompanhe os exemplos a seguir para compreender como
realizar o cálculo.
Exemplo 1: a área a ser calculada está no intervalo que vai da
média até x1. Nesse caso, só é necessário o cálculo de um limite
do intervalo.
xx1
P( <x<x ) 1
zz1
P(0<z<z )1
0
Gráfico 4.8 e 4.9 – Padronização de uma distribuição normal
Fonte: Adaptado de Silva (1997, p. 71).
Nesse caso, a probabilidade de ocorrer o intervalo da média ate o
x1 é igual à probabilidade de ocorrer o intervalo de
0 à z1 ⇒ P( < x < x1) = P(0 < z < z1)
Exemplo 2: A área a ser calculada está no intervalo que vai de
x1 até x2. Nesse caso, é necessário o cálculo de dois limites do
intervalo (z1 e z2).
probabilidade_e_estatistica_1582.indb 186 19/07/12 11:12
187
Probabilidade e Estatística
Unidade 4
Cálculo da variável padronizada:
e
Onde:
X1 e X2 = valores da v.a. (limites do intervalo)
= média
σ = desvio padrão
P(z <Z<z )1 2
x1 x2 x
z1 z2 z0
P(x1<x<x2)
Gráfico 4.10 e 4.11 – Padronização de uma distribuição normal
Fonte: Adaptado de Silva (1997, p.71).
Nesse caso, a probabilidade de ocorrer o intervalo entre x1 e x2 é
igual à probabilidade de ocorrer o intervalo entre
z1 e z2 ⇒ P(x1 < x < x2) = P(z1 < z < z2).
Até aqui, você conheceu como padronizar os valores da variável
aleatória X. Agora, você irá aprender como usar a tabela de áreas
da distribuição padronizada.
As áreas dadas na tabela são sempre de 0 a Z.
Com o valor de Z calculado,
basta encontrar o valor na
tabela (ver tabela no final
desse livro didático).
probabilidade_e_estatistica_1582.indb 187 19/07/12 11:12
188
Universidade do Sul de Santa Catarina
Veja, a seguir, um gráfico com representação da área dada pela
tabela.
0 z
Área
Gráfico 4.12 – Distribuição normal padronizada
Fonte: Triola (1999).
Observe que, conhecendo a área especificada na tabela, qualquer
tipo de área poderá ser calculada usando a simetria da curva.
Observe os exemplos a seguir com atenção.
Exemplo 1: Em um levantamento executado por uma empresa de
entregas, resultou que o tempo médio para a realização das entregas
era de 21 minutos e o desvio padrão foi de 7 minutos. Ao escolher,
ao acaso, uma das entregas realizadas, qual a probabilidade de o
tempo para realizá-la estar entre 21 e 28 minutos?
Calculando passo a passo
Passo 1: identificar todos os elementos que compõem o problema.
� média: = 21;
� desvio padrão: σ(x) = 7;
� os limites do intervalo: como um dos limites é a própria
média, você só terá que calcular um Z. O outro limite é
28 ⇒ X = 28.
probabilidade_e_estatistica_1582.indb188 19/07/12 11:12
189
Probabilidade e Estatística
Unidade 4
Passo 2: calcular a variável padronizada Z.
⇒ Z = 1
Passo 3: identificar, no gráfico, qual é a área que você deve encontrar.
0 z=1
Área
µ=21 x=28
Área
Gráfico 4.13 e 4.14 – Padronização de uma distribuição normal
Fonte: Elaboração do autor (2006).
Passo 4: procurar, na tabela, o Z = 1,00 e encontrar sua área
correspondente.
� Primeiro, você deve procurar o valor 1,0 na primeira
coluna.
� Depois, procurar, na primeira linha, o valor 0,00 (é como
se separasse o número 1,00 em dois, uma parte seria 1,0
e a outra seria o 0,00).
� No cruzamento da coluna em que está o 0,00 e da linha
em que está o 1,0, você encontrará um número (no caso é
0,3413).
� Esse número é a área entre Z e 0.
Veja que a área está entre
zero e 1.
probabilidade_e_estatistica_1582.indb 189 19/07/12 11:12
190
Universidade do Sul de Santa Catarina
Z 0,00 0,01 0,02
0,0 0,0000 0,0040 0,0080
0,l 0,0398 0,0438 0,0478
0,2 0,0793 0,0832 0,0871
0,3 0,1179 0,1217 0,1255
0,4 0,1554 0,1591 0,1628
0,5 0,1915 0,1950 0,1985
0,6 0,2257 0,2291 0,2324
0,7 0,2580 0,2611 0,2642
0,8 0,2881 0,2910 0,2939
0,9 0,3159 0,3186 0,3212
1,0 0,3413 0,3438 0,3461
1,1 0,3643 0,3665 0,3686
1,2 0,3849 0,3869 0,3888
1,3 0,4032 0,4049 0,4066
Passo 5: responder e interpretar.
P(21 < x < 28) = 0,3413 ou 34,13%
A probabilidade do tempo para realizar uma entrega estar entre
21 e 28 minutos é de 34,13%.
Exemplo 2: Em média, a vida útil de um modelo de máquina de
empacotar é de 24 anos, com um desvio padrão de 6 anos. Levando
em consideração que a vida útil deste tipo de máquina se distribui
normalmente, qual a probabilidade de uma máquina, adquirida
recentemente pela empresa, durar entre 17,52 e 29,7 anos?
probabilidade_e_estatistica_1582.indb 190 19/07/12 11:12
191
Probabilidade e Estatística
Unidade 4
Calculando passo a passo
Passo 1: identificar todos os elementos que compõem o problema.
� A média: = 24;
� desvio padrão: σ(x) = 6;
� os limites do intervalo: como os limites são diferentes
da média, você deve calcular Z para os dois valores
(x1 = 17,52 e x2 = 29,7).
Passo 2: calcular as variáveis padronizadas Z1 e Z2.
Passo 3: identificar, no gráfico, qual é a área que você deseja
encontrar.
0 z=0,95
µ=24 x1=29,7
Área
x2=17,52
Área
z=-1,08
Gráfico 4.15 e 4.16 – Padronização de uma distribuição normal
Fonte: Adaptado de Silva (1997, p.71).
Veja que a área está entre –1,08 e 0,95.
probabilidade_e_estatistica_1582.indb 191 19/07/12 11:12
192
Universidade do Sul de Santa Catarina
Não se preocupe com o sinal negativo de Z1. Esse
sinal só serve para indicar que a área está à esquerda
da média (zero), por isso, o negativo. Como a curva
é simétrica, a área tanto à esquerda como à direita
é calculada da mesma maneira, e o uso da tabela
também é o mesmo.
Passo 4: procurar, na tabela, o Z1 = −1,08 e Z2 = 0,95 e encontrar suas
áreas correspondentes.
Como usar a tabela?
É possível procurando o Z1. Veja de que forma:
� primeiro, procurar o valor 1,0 na primeira coluna;
� depois, procurar, na primeira linha, o valor 0,08 (é como
se separasse o número 1,08 em dois: uma parte seria 1,0,
e a outra seria o 0,08);
� no cruzamento da coluna na qual está o 0,08 e da linha
na qual está o 1,0, você encontrará um número (no caso é
0,3599). Esse número é a área entre Z1 e 0.
Tabela 4.7 – Tabela de valores normais Z
Z 0,00 0,01 ... 0,07 0,08
0,0 0,0000 0,0040 ... 0,0279 0,0319
0,l 0,0398 0,0438 ... 0,0675 0,0714
0,2 0,0793 0,0832 ... 0,10 64 0,1103
... ... ... ... ... ...
0,8 0,2881 0,2910 ... 0,3078 0,3106
0,9 0,3159 0,3186 ... 0,3340 0,3365
1,0 0,3413 0,3438 ... 0,3577 0,3599
1,1 0,3643 0,3665 ... 0,3790 0,3810
1,2 0,3849 0,3869 ... 0,3980 0,3997
Procurar 1,0
Procurar 0,08
Cruzando a
linha com a
coluna.
Cruzando a
linha com a
coluna.
Fonte: Elaboração do autor (2006).
probabilidade_e_estatistica_1582.indb 192 19/07/12 11:12
193
Probabilidade e Estatística
Unidade 4
Agora, falta procurar o Z2. Como fazer:
� primeiro, você deve procurar o valor 0,9 na primeira
coluna;
� depois, procurar, na primeira linha, o valor 0,05 (é como
se separasse o número 0,95 em dois: uma parte seria 0,9,
e a outra seria o 0,05);
� no cruzamento da coluna na qual está o 0,05 e da linha
na qual está o 0,9, você encontrará um número (no caso é
0,3289). Esse número é a área entre Z2 e 0.
Tabela 4.8 – Tabela de valores normais Z
Z 0,00 ... 0,04 0,05
0,0 0,0000 ... 0,0160 0,0199
0,l 0,0398 ... 0,0557 0,0596
... ... ... ... ...
0,7 0,2580 ... 0,2704 0,2734
0,8 0,2881 ... 0,2995 0,3023
0,9 0,3159 ... 0,3264 0,3289
1,0 0,3413 ... 0,3508 0,3531
1,1 0,3643 ... 0,3729 0,3749
Fonte: Elaboração do autor (2006).
Passo 5: responder e interpretar.
Como você tem duas áreas, o próximo passo é somar, veja o
gráfico a seguir:
Gráfico 4.17 – Soma das áreas determinadas pela padronização
Fonte: Elaboração do autor (2006).
probabilidade_e_estatistica_1582.indb 193 19/07/12 11:12
194
Universidade do Sul de Santa Catarina
P(17,52 < x < 29,7) = 0,3599 + 0,3289 = 0,6888 ou 68,88%.
A probabilidade de uma máquina, adquirida recentemente pela
empresa, durar entre 17,52 e 29,7 anos é de 68,88%.
Exemplo 3: Em média, a vida útil de um modelo de máquina
de empacotar é de 24 anos, com um desvio padrão de 6 anos.
Levando em consideração que a vida útil deste tipo de máquina
se distribui normalmente, qual a probabilidade de uma máquina,
adquirida recentemente pela empresa, durar mais que 29,7 anos?
Calculando passo a passo, temos
Passo 1: identificar todos os elementos que compõem o problema.
� a média: = 24;
� o desvio padrão: σ(x) = 6;
� os limites do intervalo: o intervalo é limitado abaixo por
x = 29,7 e não tem limite acima. Você deve calcular Z
somente para esse valor de x.
Passo 2: calcular a variável padronizada Z.
probabilidade_e_estatistica_1582.indb 194 19/07/12 11:12
195
Probabilidade e Estatística
Unidade 4
Passo 3: identificar, no gráfico, qual é a área que você deseja
encontrar.
z=0,95
µ=24 x1=29,7
Área
0
Área
Gráfico 4.18 e 4.19 – Padronização de uma distribuição normal
Fonte: Elaboração do autor (2006).
Veja que a área está de 0,95 para cima.
Passo 4: Procurar, na tabela, o Z = 0,95 e encontrar sua área
correspondente.
Como usar a tabela?
� Primeiro, você deve procurar o valor 0,9 na primeira
coluna;
� depois, procurar, na primeira linha, o valor 0,05 (é como
se separasse o número 0,95 em dois, uma parte seria 0,9 e
a outra seria o 0,05);
� no cruzamento da coluna na qual está o 0,05 e da linha
na qual está o 0,9, você encontrará um número (no caso é
0,3289). Esse número é a área entre Z2 e 0.
probabilidade_e_estatistica_1582.indb 195 19/07/12 11:12
196
Universidade do Sul de Santa Catarina
Z 0,00 ... 0,04 0,05
0,0 0,0000 ... 0,0160 0,0199
0,l 0,0398 ... 0,0557 0 ,0596
... ... ... ... ...
0,7 0,2580 ... 0,2704 0,2734
0,8 0,2881 ... 0,2995 0,3023
0,9 0,3159 ... 0,3264 0,3289
1,0 0,3413 ... 0,3508 0,3531
1,1 0,3643 ... 0,3729 0,3749
Procurar 0,9
Procurar 0,05
Cruzando a
linha com a
coluna.
Cruzando a
linha com a
coluna.
Passo 5: interpretar e responder.
Como a área dada pela tabela é sempre entre zero e Z,
como calcular a área de Z para cima?
Você lembra que a curva normal é simétrica e que, de cada lado,
tem 50% da área total? Pois é! Se a metade tem 50% ou 0,5 e
você diminuir dessa área a área encontrada, restará a que você
quer encontrar. Veja o gráfico a seguir:
z=0,950
0,3289
0,5-0,3289
Gráfico 4.20 – Determinar a área limitada abaixo pelo valor padronizado e sem limite acima
Fonte: Elaboração do autor (2006).
A área cinza escuro é calculada diminuindo 0,3289 (área entre
zero e Z – encontrada na tabela) de 0,5.
P(x > 29,7) = 0,5 – 0,3289 = 0,1711 ou 17,11%
probabilidade_e_estatistica_1582.indb196 19/07/12 11:12
197
Probabilidade e Estatística
Unidade 4
Então, a probabilidade de uma máquina, adquirida recentemente
pela empresa, durar mais que 29,7 anos é de 17,11%.
Além dos casos que você estudou nos exemplos, ainda há outros.
Um deles pode ser ilustrado a seguir:
0,3413
ou
34,13%
0,5
X
50%
ou
Gráfico 4.21 – Determinar a área limitada abaixo pelo valor padronizado e sem limite acima
Fonte: Elaboração do autor (2006).
Caso o limite inferior do intervalo esteja à esquerda da média,
o processo é o mesmo, calcular o Z, encontrar a área na tabela
e, no final, calcular a área final. No caso anterior, note que você
terá que juntar as duas áreas, a cinza claro com a cinza escuro.
Lembre-se de que a área, na metade da curva, é de 0,5 ou 50%.
Somando as duas: 0,5 + 0,3413 = 0,8413 ou 84,13%.
probabilidade_e_estatistica_1582.indb 197 19/07/12 11:12
198
Universidade do Sul de Santa Catarina
Síntese
Nessa unidade, você começou a conhecer a maneira como
lidar com o acaso. O cálculo de probabilidade nada mais é que
uma tentativa de entender e organizar o acaso. Você aprendeu
como calcular a probabilidade de um evento e, além disso,
compreendeu como calcular a frequência relativa.
Teve uma noção sobre o que é uma variável aleatória e sua
distribuição de probabilidades. Essas são ferramentas muito
importantes dentro das análises estatísticas que você terá que
fazer ao longo de seu curso e de sua profissão.
Você estudou, também nesta unidade, dois tipos de distribuições
de probabilidade. Conheceu as diferenças entre variável aleatória
discreta e contínua, bem como entre suas distribuições de
probabilidade. Aprendeu, também, a calcular probabilidade com
essas distribuições. Não foi tão difícil, não é?
Os conteúdos estudados nessa unidade, além de serem utilizados
em situações práticas dentro de seu curso, bem como no
desenvolvimento de sua vida profissional, são, também, base para
o estudo de amostragem, um assunto importante quando se trata
de probabilidade.
probabilidade_e_estatistica_1582.indb 198 19/07/12 11:12
199
Probabilidade e Estatística
Unidade 4
Atividades de autoavaliação
Ao final de cada unidade, você realizará atividades de autoavaliação. O
gabarito está disponível no final do livro didático, mas se esforce para
resolver as atividades sem a ajuda do gabarito, pois, assim, você estará
promovendo (e estimulando) a sua aprendizagem.
1) Em estudo realizado sobre os padrões de indecisão, depressão e
ansiedade em adolescentes, revelou-se que a relação com os pais era
fator influenciador dessas reações. Nessa pesquisa, foi pesquisado um
total de 1500 adolescentes, e em 675 casos, os jovens sofriam com o
autoritarismo dos pais. Qual a probabilidade de ser escolhido ao acaso,
um jovem que sofra com o autoritarismo dos pais?
probabilidade_e_estatistica_1582.indb 199 19/07/12 11:12
200
Universidade do Sul de Santa Catarina
2) Segundo o IBGE, na Grande Florianópolis, as pessoas de dez anos ou
mais de idade, por estado civil foram agrupados na tabela abaixo:
Casado(a)
Desquitado(a)
ou separado(a)
judicialmente
Divorciado(a) Viúvo(a) Solteiro(a) Total
267.867 18.697 16.779 28.224 333.974 665.541
Se uma pessoa da Grande Florianópolis for escolhida ao acaso, qual é a
probabilidade de ela ser:
a) casada?
b) solteira?
c) divorciada?
probabilidade_e_estatistica_1582.indb 200 19/07/12 11:12
201
Probabilidade e Estatística
Unidade 4
3) Em testes feitos em laboratório com cobaias, foram analisadas duas
delas e, após inúmeras tentativas, a cobaia 1 sofria estímulos com
reação a dor enquanto a cobaia 2 sofria estímulos com alimentação. A
pesquisa visava à execução de uma tarefa que era a de empurrar uma
pequena alavanca, considerada uma reação positiva. Os resultados
foram apresentados na seguinte tabela:
Cobaia Estímulo Número total de tentativas
Número de reações
positivas
Cobaia 1 Efeitos de dor 4500 1215
Cobaia 2 Alimentação 3500 1050
a) Qual a frequência relativa (ou probabilidade estimada) para o número
de reações positivas para cada cobaia?
b) Desafio: qual dos dois estímulos você considera mais eficaz? Por quê?
probabilidade_e_estatistica_1582.indb 201 19/07/12 11:12
202
Universidade do Sul de Santa Catarina
4) O teste chamado Tarefa de Memória Seletiva (TMS) testa alguns
aspectos da memória verbal. Baseia-se em ouvir, lembrar e aprender
doze palavras apresentadas à pessoa que está sendo testada.
Diversos aspectos da memória verbal, tais como lembrança total,
armazenamento na memória de longa duração etc., são combinados
para produzir um escore global. Sabendo que, para um grupo
determinado de pessoas, a média dos escores foi de 126 pontos e que o
desvio padrão foi de 10 pontos, determine o que é pedido a seguir.
a) Calcule Z (variável padronizada) para x = 116, para x = 136, para x = 131
e para x = 141 pontos.
b) Qual a probabilidade de escolher uma pessoa com escore maior que
136 pontos?
c) Qual a probabilidade de escolher uma pessoa com escore entre 126 e
131 pontos?
d) Qual a probabilidade de escolher uma pessoa com escore entre 116 e
141 pontos?
probabilidade_e_estatistica_1582.indb 202 19/07/12 11:12
203
Probabilidade e Estatística
Unidade 4
Saiba mais
Se você desejar, aprofunde os conteúdos estudados nesta unidade
ao consultar as seguintes referências:
BARBETTA, Pedro Alberto. Estatística aplicada às ciências
sociais. 5. ed. rev. Florianópolis: Ed. UFSC, 2002.
MORETTIN, Luiz Gonzaga. Estatística básica. São Paulo:
Makron Books, 1999.
SILVA, Ermes Medeiros da. et al. Estatística para os cursos de
Economia, Administração e Ciências Contábeis. São Paulo:
Ed. Atlas, 1997. v. 1.
TRIOLA, Mario F. Introdução à Estatística. Rio de Janeiro:
LTC, 1999.
WILD, Christopher J. Encontros com o acaso. Rio de Janeiro:
LTC, 2004.
probabilidade_e_estatistica_1582.indb 203 19/07/12 11:12
probabilidade_e_estatistica_1582.indb 204 19/07/12 11:12
5UNIDADE 5Amostragem e cálculo de estimativa
Objetivos de aprendizagem
� Conhecer as vantagens e a importância da
amostragem.
� Calcular tamanho de amostra.
� Conhecer as informações que a amostragem propicia.
� Aplicar as técnicas de amostragem para a proporção e
para a média.
� Calcular as estimativas populacionais para a proporção
e para a média.
� Compreender e calcular a análise de variância.
Seções de estudo
Seção 1 Introdução
Seção 2 Conceitos importantes
Seção 3 Estimativas para a proporção populacional
Seção 4 Estimativas para média populacional
Seção 5 Análise de variância – ANOVA
probabilidade_e_estatistica_1582.indb 205 19/07/12 11:12
206
Universidade do Sul de Santa Catarina
Para início de estudo
Nesta unidade, você conhecerá com mais detalhes o que é
amostra e poderá aumentar seus conhecimentos sobre como
escolher, calcular e para que usar amostras em pesquisas e
levantamentos de dados. Você terá a oportunidade de verificar
como é importante o estudo da amostragem, uma vez que é uma
das ferramentas essenciais que pode apoiar suas decisões.
Nesta unidade, você também conhecerá como proceder para
calcular o erro padrão de uma estimativa.
Você já deve ter visto, nos jornais ou na televisão, quando
anunciam resultados de uma pesquisa eleitoral, informarem que
os resultados têm uma margem de erro. Isto ocorre devido ao fato
do uso da amostragem, ou seja, quando uma pesquisa se baseia
apenas em uma parcela da população.
Como não é possível executar a pesquisa com a totalidade dessa
população, os resultados não são exatos, necessitando, assim, do
cálculo da margem de erro. Nesta unidade, você vai entender
como se procede para encontrar esse erro.
Nesta unidade, serão usados alguns termos que são fundamentais
no entendimento dos cálculos e da interpretação. Sendo assim,
antes de saber como se calcula o erro de uma estimativa, é muito
importante que você aprenda alguns conceitos importantes.
Por isso, como forma a facilitar a compreensãodesta unidade,
as primeiras seções tratam de conceitos introdutórios e básicos.
Começaremos por eles, lembrando que são fundamentais para a
compreensão dos demais assuntos.
Finalmente, enfrentaremos outro desafio: definir se as médias de
várias populações são mesmo semelhantes ou se existem diferenças
que superam os próprios problemas do processo de amostragem,
analisando, para isso, as variâncias obtidas nos processos.
Vamos começar então? Bons estudos!
probabilidade_e_estatistica_1582.indb 206 19/07/12 11:12
207
Probabilidade e Estatística
Unidade 5
Seção 1 – Introdução
A amostragem está intimamente ligada aos estudos de Estatística
descritiva e probabilidades. Além de estarem ligados, são
dependentes uns dos outros. Veja a figura a seguir:
Amostragem
Estatística descritiva Probabilidade
Figura 5.1 – Relações dos estudos estatísticos
Fonte: Elaboração do autor (2006).
Como é feita essa relação entre os três? Com o estudo desta
unidade, você vai poder compreender melhor. Conheça, a seguir,
alguns conceitos importantes para o estudo da amostragem.
População
População é o conjunto total de elementos com, pelo menos, uma
característica em comum, cujo comportamento interessa estudar.
Notação:
N = número de elementos da população (tamanho da população)
� Censo: é uma coleção de dados relativos a todos os
elementos de uma população.
� Parâmetro: é utilizado para designar alguma
característica descritiva dos elementos da população
(percentagem, média etc.).
probabilidade_e_estatistica_1582.indb 207 19/07/12 11:12
208
Universidade do Sul de Santa Catarina
Amostra
Amostra é o conjunto de elementos ou observações, recolhidos
a partir de um subconjunto da população, que se estuda com o
objetivo de tirar conclusões para a população de onde foi recolhida.
Notação:
n = número de elementos da amostra (tamanho da amostra)
Mas qual tamanho de amostra usar?
Essa sempre é a dúvida de muitos pesquisadores. O tamanho da
amostra muitas vezes depende da experiência e do conhecimento
do pesquisador. Experiência em saber qual o tamanho que
realmente representará, com fidelidade, a população e o
conhecimento do pesquisador sobre o tema e sobre a população
alvo do estudo. Dessa forma, você verá duas formas de calcular o
tamanho da amostra, que são as seguintes:
� quando não se têm informações sobre a população: se
o pesquisador não tem acesso às medidas, como desvio
padrão, percentuais etc.
� quando têm informações sobre a população: se o
pesquisador tem acesso às medidas, como desvio padrão,
percentuais etc.
Quando não se têm informações sobre a população
Nesse caso, é necessária a especificação do erro amostral
pretendido pelo pesquisador. Sugeridas por Barbetta (2002), as
formas de cálculo do tamanho da amostra, quando você não tem
acesso a informações da população, são as que seguem:
probabilidade_e_estatistica_1582.indb 208 19/07/12 11:12
209
Probabilidade e Estatística
Unidade 5
a) Quando não se conhece o tamanho da população
Tamanho da amostra:
Em que:
n0 = primeira aproximação para o tamanho da amostra;
E = erro amostral tolerável.
(usar o erro na forma unitária, ex.: 2%, usar 0,02)
b) Quando se conhece o tamanho da população
Tamanho da amostra:
Em que:
n0 = primeira aproximação para o tamanho da amostra;
N = tamanho da população;
n = tamanho da amostra.
Veja, a seguir, um exemplo de como realizar os cálculos.
Um pesquisador deseja realizar estudo para com estudantes do
Ensino Fundamental da rede municipal de escolas da cidade de
Florianópolis. Nessa pesquisa, ele irá tolerar um erro amostral
de 4% e gostaria de saber qual seria o tamanho da amostra
necessária para realizar sua pesquisa, nos seguintes casos:
a) O pesquisador não conhece o número total de estudantes do
Ensino Fundamental da cidade
Calculando passo a passo
Passo 1: identificar os elementos da fórmula.
n0 = tamanho aproximado da amostra;
E = erro amostral tolerável = 4% ou 0,04 (é só dividir por 100).
probabilidade_e_estatistica_1582.indb 209 19/07/12 11:12
210
Universidade do Sul de Santa Catarina
Passo 2: usar a fórmula.
→ n0 = 625 estudantes.
Um tamanho aproximado para a amostra seria de 625 estudantes
do Ensino Fundamental.
b) O número total de estudantes do Ensino Fundamental da
cidade é de 27.000 alunos.
Calculando passo a passo
Passo 1: identificar os elementos da fórmula.
n0 = tamanho aproximado da amostra;
E = erro amostral tolerável = 4% ou 0,04 (é só dividir por 100);
N = tamanho da população = 27000.
Passo 2: usar a fórmula.
→ n0 = 625 estudantes.
Um tamanho aproximado para a amostra seria de 625 estudantes
do Ensino Fundamental. Observe que o pesquisador teve acesso
à informação de que a população seria de 27.000 estudantes,
então você deve passar para o passo seguinte:
Passo 3: calcular o tamanho da amostra usando a população com a
seguinte fórmula.
Arredondando, seriam 611 estudantes.
probabilidade_e_estatistica_1582.indb 210 19/07/12 11:12
211
Probabilidade e Estatística
Unidade 5
Quando se têm informações sobre a população
Nesse caso, além da margem de erro tolerável, seriam necessárias
informações como desvio padrão, percentual dos indivíduos que
apresentam as características estudadas etc. Essas informações
poderiam ser obtidas de pesquisas anteriores ou, até mesmo, de
uma pré-pesquisa. Nesse último, seria preciso uma amostragem
prévia para realizar os levantamentos necessários. Embora não
seja de nosso interesse aprofundar o estudo sobre este assunto, a
seguir estão as fórmulas para calcular o tamanho da amostra para
os dois casos existentes, para estimar a proporção (percentual) e a
média populacional.
Para a estimativa da média
populacional
Para a estimativa da proporção
populacional (percentual)
Para amostragem com reposição
(população infinita)
Para amostragem sem reposição
(população finita)
Onde:
n = tamanho da amostra;
N = tamanho da população;
e = erro amostral;
σ = desvio padrão;
Z = limite do intervalo (dist. Normal).
Para amostragem com reposição
(população infinita)
Para amostragem sem reposição
(população finita)
Onde:
n = tamanho da amostra;
N = tamanho da população;
e = erro amostral;
p = percentual de elementos
com a característica estudada;
q = percentual de elementos
sem a característica estudada;
Z = limite do intervalo (dist. Normal).
Quadro 5.1 – Tamanho da amostra, proporção (percentual) e média populacional
Fonte: Elaboração do autor (2006).
Embora não seja a intenção de aprofundar esse tipo de cálculo,
faça a atividade de autoavaliação referente ao assunto e constate
se compreendeu a maneira de realizar os cálculos.
probabilidade_e_estatistica_1582.indb 211 19/07/12 11:12
212
Universidade do Sul de Santa Catarina
Representatividade da amostra na população
Quando você está cozinhando, após temperar a comida, costuma
mexer com uma colher, não é? Por que você mexe? Para que o
tempero fique bem misturado com a comida. Correto? Qual é o
passo seguinte? Provar! Claro, você pega apenas uma pitada da
comida para saber como está o gosto. Para tanto, não é necessário
comer tudo!
Em resumo, o processo de amostragem é bem semelhante. Para
que a prova de comida seja representativa, você teve, antes, que
mexer bem, tornando, assim, uma mistura homogênea. Se for bem
misturada, qualquer amostra que você colha, em qualquer lugar da
panela, dará uma boa noção de como o todo (a comida) está.
Em pesquisas, o processo é bem semelhante!
Você lembra da pesquisa de intenções de voto? Em época de
campanha eleitoral, quando um instituto de pesquisa faz uma
pesquisa, ele tem que selecionar eleitores que representem as mais
diversas camadas sociais, regiões, raças etc., tornando, assim, a
amostra representativa da população.
Seção 2 – Conceitos importantes
Você saberia dizer se os dados levantados com base em alguns
poucos elementos podem trazer informações precisas acerca de
uma população inteira?
De certa forma,sim! Você não terá informações exatas da
população usando uma amostra, mas sim uma aproximação
bastante precisa. É importante salientar que, por não haver
pesquisado a totalidade dos elementos, você é levado a concluir
que os dados nunca representarão um reflexo exato da população.
probabilidade_e_estatistica_1582.indb 212 19/07/12 11:12
213
Probabilidade e Estatística
Unidade 5
Exemplos bem conhecidos são as pesquisas eleitorais divulgadas
pelos meios de comunicação. Veja:
Gráfico 5.1 – Exemplo dos dados de uma pesquisa eleitoral
Fonte: Elaboração do autor (2006).
Como era a notícia que deu origem a esta tabela?
“A pesquisa de outubro apresentou os seguintes resultados: o
candidato A tem 39% das intenções de voto, o candidato B tem 26%
das intenções de voto, o candidato C tem 9% das intenções de votos
e o candidato D tem 7% das intenções de votos. O erro é de 2%.”
De fato, existe uma margem de erro. Esse erro, relatado na
notícia, gera um intervalo, ou seja, as intenções de votos para
o candidato A podem variar de 37% a 41%. Por se tratar de
uma pesquisa feita por amostragem, você não pode dizer que o
candidato terá realmente 39% das intenções de votos.
Quais são as informações que a amostragem pode
fornecer?
probabilidade_e_estatistica_1582.indb 213 19/07/12 11:12
214
Universidade do Sul de Santa Catarina
Como você já viu em estatísticas, esses intervalos são divididos
em dois tipos, de acordo da variável estudada. Vale relembrar:
Figura 5.2 – Variável aleatória discreta e intervalo de produção; variável aleatória continua e
intervalo da média
Fonte: Elaboração do autor (2006).
� Intervalos de proporção: como visto no exemplo
anterior, correspondem aos percentuais das intenções de
votos. Exemplos: proporção de famílias, percentual de
pacientes, proporção de cobaias etc.;
� Intervalos da média: são intervalos baseados em
medidas. São sempre calculados pela média dessas
medidas. Exemplo: escore médio, peso médio, altura
média etc.
Outra informação importante para a definição do erro é o
conhecimento do que, em Estatística, é chamado de nível de
confiança.
Nível de confiança
O nível de confiança é a probabilidade de o intervalo conter o
parâmetro estimado, ou seja, pode-se entender que o valor ou
percentual da população que você está tentando estimar tem
a probabilidade de estar em um intervalo que seria o definido
pelo erro.
probabilidade_e_estatistica_1582.indb 214 19/07/12 11:12
215
Probabilidade e Estatística
Unidade 5
Intervalo de confiança
Intervalo de confiança é aquele que contém o parâmetro estudado
com determinada probabilidade (nível de confiança), ou seja,
citando o exemplo da pesquisa eleitoral, é o intervalo calculado
com o erro. Veja os valores no exemplo citado nesta seção: “... as
intenções de votos para o candidato A podem variar de 37% a
41%”. Esse é o intervalo de confiança.
Curva normal
Você poderia se perguntar, a partir do que foi apresentado, qual
relação se pode estabelecer entre o nível de confiança e intervalo
de confiança. Como o nível de confiança é a probabilidade de
a estimativa estar correta e essa probabilidade determina um
intervalo (o intervalo de confiança), é possível usar a curva
normal para identificar a ambos. Veja a figura a seguir:
Figura 5.3 – Curva normal
Fonte: Elaborado pelo autor (2006).
Note que o nível de confiança é um percentual definido pelo
intervalo de –z a z. Como a curva é simétrica, metade da área vai
de –z a zero, e a outra metade vai de zero a z, ou seja, ambas são
iguais. Isso é muito importante na definição do valor de z. Para
descobri-lo, você deve calcular a metade do nível de confiança e
usar a tabela da distribuição normal padronizada.
probabilidade_e_estatistica_1582.indb 215 19/07/12 11:12
216
Universidade do Sul de Santa Catarina
Exemplo 1: Nível de confiança: NC = 95%. Encontrar o valor de
z na tabela.
Calculando passo a passo
Passo 1: dividir o NC por dois. Antes disso, não se esqueça de usar o
valor do nível de confiança na forma decimal, ou seja, dividido por 100.
Passo 2: procurar esse valor na tabela e encontrar o z
correspondente. O valor é referente à área entre zero e z, localizado
na região central da tabela. Veja a seguir:
Tabela 5.1 – Tabela de valores normais
Fonte: Elaboração do autor (2006).
probabilidade_e_estatistica_1582.indb 216 19/07/12 11:12
217
Probabilidade e Estatística
Unidade 5
Localizada a área, é só seguir a coluna onde está o valor até a
primeira linha, encontrando o número 0,06. Na horizontal,
basta traçar a linha até a primeira coluna, encontrando o valor
correspondente a 1,9. Juntando, ou somando os dois valores, você
encontra o valor 1,96 para z, ou seja, z = 1,96.
Exemplo 2: Nível de Confiança: NC = 90%. Encontrar o valor
de z na tabela.
Calculando passo a passo
Passo 1: dividir o NC por dois. Para tanto, sempre usar o valor do
nível de confiança na forma decimal, ou seja, dividido por 100.
Passo 2: procurar esse valor na tabela e encontrar o z
correspondente. O valor é referente à área entre zero e z, localizado
na região central da tabela. Veja a seguir:
Tabela 5.2 – Tabela de valores normais
Fonte: Elaboração do autor (2006).
probabilidade_e_estatistica_1582.indb 217 19/07/12 11:12
218
Universidade do Sul de Santa Catarina
Encontrando a área, é só seguir a coluna na qual está o valor até
a primeira linha. Note que o valor se situa entre 0,4495 e 0,4505
e, sendo assim, você deve usar o valor compreendido entre 0,04 e
0,05 como se fosse um ponto médio, ou seja, 0,045. Seguindo a
linha até a primeira coluna, você encontra o valor 1,6. Efetuando-
se a soma, chega-se ao valor 1,645 para z, ou seja, z = 1,645.
O nível de confiança é muito importante!
Para calcular o erro, é necessário conhecer ou estabelecer
previamente o nível de confiança. Não existe uma regra específica
para a determinação do nível de confiança. Ele é determinado
pelo pesquisador com base em sua experiência e, em geral, os
mais usados são 90% e 95%.
Na seção seguinte, você aprenderá a usar o nível de confiança
e saber como se calcula o erro da estimativa e o intervalo
correspondente.
Seção 3 – Estimativas para a proporção populacional
Antes de começar a calcular o erro da estimativa, conheça
algumas notações:
� = proporção da mostra (percentual) – probabilidade de
sucesso;
� p = proporção da população – probabilidade de sucesso;
� = proporção da mostra (percentual) – probabilidade de
fracasso;
� q = proporção da população – probabilidade de fracasso.
Para diferenciar um percentual da amostra do percentual da
população, tanto de sucesso quanto de fracasso, deve usar o
acento circunflexo (“chapéu”) para a amostra.
probabilidade_e_estatistica_1582.indb 218 19/07/12 11:12
219
Probabilidade e Estatística
Unidade 5
Veja os exemplos a seguir.
Exemplo 1: Em uma determinada população, foi retirada uma
amostra antes da eleição e verificou-se que 30% dos eleitores
votariam no candidato Théo. Após a realização da eleição,
verificou-se que o total de votantes (da população) para esse
candidato foi de 33%. Indicar os percentuais de sucesso e fracasso
tanto para a população quanto para a amostra de votantes e não
votantes em relação ao candidato em questão.
População Amostra
Percentual de votantes em Théo = 33%;
p = 33% (percentual de sucesso da população);
Percentual de votantes em Théo = 30%;
= 30% (percentual de sucesso da amostra);
Percentual de eleitores que não votam em
Théo: calcule o percentual de fracasso sempre
na forma decimal, ou seja, dividindo o
percentual por 100.
q = 1 – p = 1 – 0,33 = 0,67
No final, multiplique por 100 para encontrar
novamente o percentual:
q = 0,67. 100 = 67% (percentual de
fracasso da população).
Percentual de eleitores que não votam em
Théo: calcule o percentual de fracasso sempre
na forma decimal, ou seja, dividindo o
percentual por 100.
No final, multiplique por 100 para
encontrarnovamente o percentual:
(percentual de fracasso
da amostra).
Quadro 5.2 – População e amostra
Fonte: Elaboração do autor (2006).
Observação: note que a diferença, além dos valores, está em
identificar o percentual da amostra com o acento circunflexo
(“chapéu”).
A seguir, veja um exemplo mais elaborado.
Exemplo 2: Em uma determinada população, foi retirada uma
amostra de 200 votantes antes da eleição e verificou-se que 60
eleitores votariam no candidato Théo. Após a realização da
eleição, verificou-se que o total de votantes (da população) era de
3000 eleitores e que 990 votaram no referido candidato. Indicar
os percentuais de sucesso e fracasso tanto para a população
quanto para a amostra de votantes e não votantes em relação ao
candidato mencionado.
probabilidade_e_estatistica_1582.indb 219 19/07/12 11:12
220
Universidade do Sul de Santa Catarina
População Amostra
Passo 1: identificar os valores.
N = 3000 (tamanho da população);
X = 990 (número de votantes no
candidato).
Passo 2: cálculo do percentual de votantes
no candidato.
Percentual de votantes em Théo = 33%;
p = 33%
(percentual de sucesso da população).
Passo 1: identificar os valores.
N = 200 (tamanho da população);
X = 60 (número de votantes no candidato).
Passo 2: cálculo do percentual de votantes
no candidato.
Percentual de votantes em Théo = 30%
(percentual de Sucesso da
amostra)
Percentual de eleitores que não votam
em Théo: calcule o percentual de fracasso
sempre na forma decimal, ou seja,
dividindo o percentual por 100.
p = 0,33
q = 1 – p = 1 – 0,33 = 0,67
No final, multiplique por 100 para
encontrar novamente o percentual:
q = 0,67. 100 = 67%
(percentual de fracasso da população).
Percentual de eleitores que não votam
em Théo: calcule o percentual de fracasso
sempre na forma decimal, ou seja,
dividindo o percentual por 100.
No final, multiplique por 100 para
encontrar novamente o percentual:
(percentual de fracasso da amostra).
Quadro 5.3 – População e amostra
Fonte: Elaboração do autor (2006).
E para calcular o erro e o intervalo de uma estimativa?
Para fazer uma estimativa, após ter os resultados e calculados
os percentuais, você deve calcular o erro da estimativa e o seu
intervalo (intervalo de confiança). Veja a seguir a fórmula para o
cálculo do erro:
probabilidade_e_estatistica_1582.indb 220 19/07/12 11:12
221
Probabilidade e Estatística
Unidade 5
Em que:
e = erro da estimativa;
z = limite do intervalo definido pelo nível de confiança;
= proporção da mostra (percentual) – probabilidade de sucesso
(ex.: percentual de votantes em relação a um determinado
candidato);
= proporção da mostra (percentual) – probabilidade de fracasso (ex.:
percentual dos eleitores que não votam em determinado candidato);
n = tamanho da amostra.
O intervalo é calculado subtraindo-se o erro do percentual e,
em seguida, somando-se o erro a esse percentual. Veja abaixo a
notação usada:
Em que:
P = probabilidade de o valor estimado estar no intervalo
calculado;
= proporção da mostra (percentual) – probabilidade de
sucesso (ex.: percentual da amostra de votantes em relação a um
determinado candidato);
p = proporção da população (percentual) que se quer estimar
– probabilidade de sucesso (ex.: percentual da população de
votantes em relação a um determinado candidato);
NC = nível de confiança.
probabilidade_e_estatistica_1582.indb 221 19/07/12 11:12
222
Universidade do Sul de Santa Catarina
Veja os exemplos a seguir.
Exemplo 1: Uma pesquisa recente, efetuada com uma amostra
de 300 eleitores de uma pequena cidade, indicou que 35% deles
votariam no candidato Arthur. Faça uma estimativa para a
totalidade dos eleitores (população) dessa cidade que votarão no
referido candidato. Use um nível de confiança de 95%.
Calculando passo a passo
Passo 1: calcular e procurar o z na tabela (ver exemplo 1, ao final da
seção 1). Dividir o NC por dois. Para tanto, não se esqueça de usar o
valor do nível de confiança na forma decimal, ou seja, dividido por 100.
Passo 2: procurar na tabela esse valor e encontrar o z
correspondente. O valor é referente à área entre zero e z, localizado
na região central da tabela. Veja a seguir:
Tabela 5.3 – Tabela de valores normais
Fonte: Elaboração do autor (2006).
probabilidade_e_estatistica_1582.indb 222 19/07/12 11:12
223
Probabilidade e Estatística
Unidade 5
Localizada a área, é só seguir a coluna na qual está o valor até a
primeira linha, chegando-se ao número 0,06 e, na horizontal, seguir
a linha até a primeira coluna, encontrando o valor 1,9. Efetuada a
soma, você encontra o valor 1,96 para z, ou seja, z = 1,96.
Passo 3: discriminar cada elemento da fórmula de cálculo do erro e
aplicá-la ao caso em análise.
Em que:
e = erro da estimativa;
z = 1,96 (calculado e encontrado no passo 2);
= 35% ou (percentual da amostra de eleitores que
votam no candidato);
(percentual da amostra dos eleitores que não
votam no candidato);
n = 300 (tamanho da amostra).
Cálculo do erro
= 1,96.
Ao final de seu cálculo, deve-se multiplicar o resultado por 100,
para que ele fique em porcentagem. Esse é um erro comum dos
meios de comunicação (TV, rádio, jornais, etc.), ao informarem
os resultados de uma pesquisa citam “... com um erro de 5,4% a
mais ou a menos.”
probabilidade_e_estatistica_1582.indb 223 19/07/12 11:12
224
Universidade do Sul de Santa Catarina
Passo 4: calcular o intervalo da estimativa. Neste passo, o cálculo
pode ser efetuado na forma percentual ou decimal. Interpretando
os resultados obtidos, tem-se que as intenções de votos para o
candidato referido devem ficar entre 29,603% e 40,397%. Segundo as
notações da Estatística, esse intervalo se escreve da seguinte forma:
ou 29,603%
ou 40,397%
Interpretando os resultados obtidos, tem-se que as intenções de votos
para o candidato referido devem ficar entre 29,603% e 40,397%.
Segundo as notações da Estatística, esse intervalo se escreve da
seguinte forma:
P(0,29603 < p < 0,40397) = 0,95 ou
P(29,603% < p < 40,397%) = 95%
Que leitura você pode fazer? O intervalo da
estimativa para a totalidade dos eleitores que votariam
no candidato mencionado está compreendido
entre 29,603% e 40,397%, com base em um nível de
confiança de 95%.
Veja os exemplos a seguir.
Exemplo 2: Um levantamento de alunos aprovados e reprovados
feito com base no sistema municipal de educação de um município,
referente ao Ensino Fundamental, usando uma amostra de
2500 alunos, indicou que 1500 alunos dentre eles haviam sido
reprovados. Com um nível de confiança de 90%, faça uma
estimativa para a população de alunos que foram reprovados no
Ensino Fundamental do sistema municipal de educação.
probabilidade_e_estatistica_1582.indb 224 19/07/12 11:12
225
Probabilidade e Estatística
Unidade 5
Calculando passo a passo
Passo 1: como não foi indicado o percentual de alunos da amostra
que foram reprovados, você deve, em primeiro lugar, calcular esse
percentual (como foi feito no exemplo 2 no início da seção).
n = 2500 (tamanho da amostra);
X = 1500 (número de alunos reprovados).
Cálculo do percentual:
Você pode manter o resultado na forma decimal, pois o cálculo
do erro também é feito assim.
Passo 2: calcular e procurar o z na tabela (ver exemplo 2, ao final da
seção 1). Dividir o NC por dois. Para tanto, não se esqueça de usar o
valor do nível de confiança na forma decimal, ou seja, dividido por 100.
Passo 3: procurar na tabela esse valor e encontrar o z
correspondente. O valor é referente à área entre zero e z, localizado
na região central da tabela. Veja a seguir:
probabilidade_e_estatistica_1582.indb 225 19/07/12 11:12
226
Universidade do Sul de Santa Catarina
Tabela 5.4 – Tabela de valores normais
Fonte: Elaboração do autor (2006).
Localizada a área, é só seguir a coluna na qual está o valor até
a primeira linha. Note que o valor se encontra entre 0,4495 e
0,4505 e, sendo assim,.você deve usar o valor compreendidoentre 0,04 e 0,05 como se fosse um ponto médio, ou seja, 0,045.
Seguindo a linha até a primeira coluna, você encontra o valor
correspondente a 1,6. Juntando, ou somando os dois valores, você
chega ao valor 1,645 para z, ou seja, z = 1,645.
Passo 4: discriminar cada elemento da fórmula de cálculo do erro e
aplicá-la ao caso em exame.
Em que:
e = o que se quer calcular (erro da estimativa);
z = 1,645 (calculado e encontrado no passo 2);
= 60% ou (percentual da amostra de alunos
reprovados)
probabilidade_e_estatistica_1582.indb 226 19/07/12 11:12
227
Probabilidade e Estatística
Unidade 5
(percentual da amostra de alunos que não foram
reprovados)
n = 2500 (tamanho da amostra).
Cálculo do erro
= 1,645 .
e = 1,645 . 0,009797959 ou 1,16%
Ao final, não se esqueça de multiplicar o resultado por 100
para transformá-lo novamente em porcentagem. Esse é um erro
comum dos meios de comunicação (TV, rádio, jornais etc.), ao
informarem os resultados de uma pesquisa citam: “... com um
erro de 1,16% a mais ou a menos”.
Passo 5: calcular o intervalo da estimativa.
Neste passo, o cálculo pode ser feito na forma percentual ou
decimal.
ou 58,38%
ou 61,61%
Interpretando os resultados obtidos, tem-se que de 58,38% a
61,61% da totalidade dos alunos cursando o Ensino Fundamental
na rede municipal foram reprovados.
Segundo as notações de Estatística, esse intervalo se escreve da
seguinte forma:
P(0,29603 < p < 0,40397) = 0,90 ou
P(29,603 < p < 40,397) = 90%
probabilidade_e_estatistica_1582.indb 227 19/07/12 11:12
228
Universidade do Sul de Santa Catarina
Que leitura você pode fazer? O intervalo da
estimativa para a totalidade dos eleitores que votariam
no candidato está compreendido entre 29,603% e
40,397%, com base em um nível de confiança de 90%.
Nesta seção, você aprendeu como calcular o erro referente à
estimativa do percentual de uma população. Na próxima, você
verá como calcular o erro de uma estimativa para a média de
uma população.
Seção 4 – Estimativas para média populacional
Ao realizar uma pesquisa por amostragem, além de calcular
percentuais, você pode obter algumas médias, como por exemplo,
a média das alturas, das idades, dos pesos etc. O processo é
semelhante, ou seja, calcula-se o erro e o intervalo. O que muda é a
forma de cálculo do erro. Isso vale para as séries de dados amostrais
que podem ser aproximados por uma distribuição normal.
E para calcular o erro e o intervalo de uma estimativa
da média populacional?
Para calcular o erro de uma estimativa da média populacional,
você vai precisar da média de uma amostra e do desvio padrão.
Este pode ser obtido com base na própria população, se for
possível, ou na amostra. O desvio padrão da amostra pode ser
usado como uma aproximação.
probabilidade_e_estatistica_1582.indb 228 19/07/12 11:12
229
Probabilidade e Estatística
Unidade 5
Veja, a seguir, a fórmula para o cálculo do erro:
Em que:
e = erro da estimativa;
z = limite do intervalo definido pelo nível de confiança;
S(x) = desvio padrão da amostra (ou da população, se possível);
n = tamanho da amostra.
O intervalo é calculado subtraindo-se o erro da média da amostra e
somando-se o erro à referida média. Veja, abaixo, a notação usada:
Em que:
P = probabilidade de o valor estimado estar no intervalo
calculado;
x = média da amostra;
μ = média da população (o que você vai estimar);
NC = nível de confiança.
Veja os exemplos a seguir
Exemplo 1: Em sondagem realizada com base nos alunos do
curso de Matemática das quintas séries de uma determinada
escola, o resultado geral apresentou uma média de 6,7, com um
desvio padrão de 1,2. Com esse tipo de informação, pode-se
realizar uma série de análises. A partir desses dados, calcule uma
estimativa (erro e intervalo), considerando essa série com uma
distribuição normal para a média populacional a um nível de
confiança de 95% e que a amostra foi de 35 alunos.
probabilidade_e_estatistica_1582.indb 229 19/07/12 11:12
230
Universidade do Sul de Santa Catarina
Calculando passo a passo
Passo 1: calcular e procurar z na tabela (veja exemplo1, seção 1).
Dividir o NC por dois. Usar o valor do nível de confiança na forma
decimal, ou seja, dividido por 100.
Passo 2: procurar esse valor na tabela e encontrar o z
correspondente. O valor é referente à área entre zero e z, localizado
na região central da tabela. Veja a seguir:
Tabela 5.5 – Tabela de valores normais
Fonte: Elaboração do autor (2006).
Localizada a área, é só seguir a coluna na qual está o valor até a
primeira linha, encontrando o número 0,06. Na horizontal, basta
traçar a linha até a primeira coluna, chegando ao número 1,9.
Somando os dois, você encontra o valor correspondente a 1,96
para z, ou seja, z = 1,96.
probabilidade_e_estatistica_1582.indb 230 19/07/12 11:12
231
Probabilidade e Estatística
Unidade 5
Passo 3: discriminar cada elemento da fórmula de cálculo do erro e
aplicá-la ao caso em questão.
Em que:
e = o que se quer calcular (erro da estimativa);
z = 1,96 (ver passo 2);
S(x) = 1,2 (desvio padrão da amostra)
n = 35 (tamanho da amostra).
Cálculo do erro:
= 1,96.
Não é necessário multiplicar por 100, pois este resultado não
indica um percentual, mas sim pontos (a nota)!
Passo 4: calcular o intervalo da estimativa.
Neste passo, como na estimativa para o percentual, você deve
subtrair e somar o erro à média:
Interpretando os resultados obtidos, tem-se que a média das
notas da totalidade dos alunos está compreendida entre 6,3 e 7,1
pontos, aproximadamente.
probabilidade_e_estatistica_1582.indb 231 19/07/12 11:12
232
Universidade do Sul de Santa Catarina
Segundo as notações de Estatística, esse intervalo se escreve da
seguinte forma:
P(6,7 – 0,3976 < μ < 6,7 + 0,3976) = 0,95
P(6,3024 < μ < 7,0976) = 0,95
Que leitura você pode fazer? O intervalo da estimativa
para a média das notas da totalidade dos alunos está
compreendido entre 6,3 e 7,1 pontos, aproximadamente,
com um índice de confiança de 95%.
Exemplo 2: Em uma pesquisa realizada com diversas turmas
de uma escola, os alunos levaram 39 minutos, em média, para
terminar uma avaliação de matemática. O tamanho da amostra
era de 100 estudantes. O desvio padrão dessa amostra foi de 18
minutos. Com base em um nível de confiança de 90%, qual seria a
estimativa para a média populacional da escola e sua interpretação?
Calculando
Passo 1: calcular e procurar o z na tabela (ver exemplo 2, no final da
seção 1). Dividir o NC por dois. Para tanto, usar o valor do nível de
confiança na forma decimal, ou seja, dividido por 100.
Passo 2: procurar esse valor na tabela e encontrar o z
correspondente. O valor é referente à área entre zero e z, localizado
na região central da tabela. Veja a seguir:
probabilidade_e_estatistica_1582.indb 232 19/07/12 11:12
233
Probabilidade e Estatística
Unidade 5
Tabela 5.6 – Tabela de valores normais
Fonte: Elaboração do autor (2006).
Localizada a área, é só seguir a coluna na qual está o valor até a
primeira linha. Note que o valor se encontra entre 0,4495 e 0,4505
e, sendo assim, deve-se usar o valor compreendido entre 0,04 e
0,05 como se fosse um ponto médio, ou seja, 0,045. Traçando a
linha até a primeira coluna, chega-se ao número 1,6. Somando os
dois, você encontra o valor 1,645 para z, ou seja, z = 1,645.
probabilidade_e_estatistica_1582.indb 233 19/07/12 11:12
234
Universidade do Sul de Santa Catarina
Passo 3: discriminar cada elemento da fórmula de cálculo do erro e
aplicá-la ao caso em questão.
Em que:
e = o que se quer calcular (erro da estimativa);
z =1,645 (ver passo 2);
S(x) = 18 (desvio padrão da amostra);
n = 100 (tamanho da amostra).
Cálculo do erro:
= 1,645.
Não é necessário multiplicar por 100, pois este resultado não
indica um percentual, mas sim minutos!
Passo 4: calcular o intervalo da estimativa. Neste passo, como na
estimativa para o percentual, você deve subtrair e somar o erro à média.Interpretando os resultados obtidos, tem-se que o tempo médio
para a realização da avaliação está compreendido entre 36,04 e
41,96 minutos, aproximadamente.
Segundo as notações de Estatística, esse intervalo se escreve da
seguinte forma:
P(39 – 2,961 < μ < 39 + 2,961) = 0,90
P(36,039 < μ < 41,961) = 0,90
probabilidade_e_estatistica_1582.indb 234 19/07/12 11:12
235
Probabilidade e Estatística
Unidade 5
Que leitura você pode fazer? O intervalo da
estimativa para a média do tempo de execução da
avaliação está compreendido entre 36,04 e 41,96
minutos, com um índice de confiança de 90%
Seção 5 – Análise de variância – ANOVA
Como comparar as características de várias amostras
Logo após calcular a estimativa de uma média populacional,
podemos ter outro desafio: definir se as médias de várias
populações são mesmo semelhantes ou existem diferenças que
superam os próprios problemas do processo de amostragem.
Isso porque, muitas vezes, amostras de diferentes populações
são selecionadas com a finalidade de se avaliarem possíveis
diferenças entre as distribuições populacionais de alguma
característica de interesse.
Podemos citar alguns exemplos destas situações:
� Seleção de lotes de parafusos fabricados em
diferentes empresas com diferentes equipamentos,
para avaliar se a distribuição (populacional) do
valor médio do diâmetro da cabeça dos parafusos
produzidos varia com a marca do equipamento usado
na fabricação.
� Para curar certa doença, existem quatro tratamentos
possíveis: A, B, C e D. Pretende-se saber se existem
diferenças significativas nos tratamentos no que diz
respeito ao tempo necessário para eliminar a doença.
� Análise de amostras de água de diversos pontos da
cidade para verificar se existe variação na distribuição
de alguma característica (nível de ácidos, por exemplo)
associada à qualidade da água entre bairros.
probabilidade_e_estatistica_1582.indb 235 19/07/12 11:12
236
Universidade do Sul de Santa Catarina
Em muitos casos, uma análise descritiva dos dados indica
que modelos gaussianos ou normais são compatíveis com suas
distribuições. Em outras palavras, sob o ponto de vista estatístico,
podemos considerar as k amostras disponíveis como provenientes
de populações normais com médias μ1, μ2, ..., μk.
Se não existirem razões contrárias, podemos também supor
que as amostras são independentes. Adicionalmente, a análise
descritiva muitas vezes sugere que as k populações têm a mesma
variância σ2 (desconhecida).
O problema proposto pode então ser encarado como um teste da
hipótese de que as médias são iguais: H: μ1 = μ2 = ... =μk. E, nestas
situações, a técnica para resolver problemas desse tipo (e muitos
outros semelhantes) é chamada de análise de variância de um fator.
Definição do problema a ser resolvido
Considerando que existem k populações de interesse, nas quais se
estuda uma característica comum X1, X2, ..., Xk, são as variáveis
aleatórias que representam tais característica nas populações 1, 2, ...,
k, respectivamente. Assim, a hipótese a testar é: μ1 = μ2 = ... = μk?
Neste problema, as k populações podem ser vistas como k níveis
de um mesmo fator. E, assim, a questão é saber se o fator exerce
alguma influência na variação da característica em estudo (a
média, neste caso).
Caso o problema apresente somente um fator,
estaremos trabalhando com análise de variância de um
fator, conhecido como ANOVA de um único fator. Claro
que também existe ANOVA de múltiplos fatores, mas
este tema não será abordado neste estudo.
probabilidade_e_estatistica_1582.indb 236 19/07/12 11:12
237
Probabilidade e Estatística
Unidade 5
Analisando o problema com um exemplo
Exemplo: o Sr. Fernando Fernandes é dono de uma Indústria
Metal-Mecânica e pretende comprar três fábricas de parafusos
para suprimentos da sua própria indústria. Para isso, precisa
analisar o volume de fabricação das fábricas a comprar, já que ele
precisa que as três tenham produções semelhantes de parafusos
para prover regularmente à sua industria.
Para isso, o Sr. Fernando Fernandes seleciona aleatoriamente
cinco semanas do semestre, nas quais observa o volume de
fabricação semanal para cada fábrica (ou seja, as três amostras
são independentes).
Os dados amostrais estão registrados na seguinte tabela:
Tabela 5.7 – Dados amostrais
Semanas Fábrica 1 Fábrica 2 Fábrica 3
Semana 1 47 55 54
Semana 2 53 54 50
Semana 3 49 58 51
Semana 4 50 61 51
Semana 5 46 52 49
(médias amostrais) = 49 = 56 = 51 = 52
Fonte: Elaboração do autor (2011).
Representamos por Xi o volume de fabricação semanal na Fábrica
i (i = 1, 2, 3) e por μi o valor médio de Xi.
Neste exemplo, existe apenas um fator de interesse, o fator “fábrica”
que apresenta três níveis ou grupos: fábrica 1, fábrica 2 e fábrica 3.
Assim, cada nível do fator define uma população de média μi.
probabilidade_e_estatistica_1582.indb 237 19/07/12 11:12
238
Universidade do Sul de Santa Catarina
Assim, o que o Sr. Fernando Fernandes pretende saber é se as
médias dos três níveis, ou populações, são iguais, isto é, pretende-
se saber se a hipótese é certa ou não:
H: µ1 = µ2 = µ3
(Hipótese de igualdade na fabricação média das três fábricas)
Então a questão a responder é:
Serão as médias amostrais =49, = 56, = 51,
diferentes porque há diferenças entre as médias
populacionais: µ1 = µ2 = µ3? Ou serão essas diferenças
atribuídas a flutuações amostrais?
Podemos, então, formular as seguintes hipóteses:
H: µ1 = µ2 = µ3
Ou, em outras palavras, a hipótese está afirmando que não há
diferença entre o volume médio de fabricação das três fábricas.
Lembre-se: como toda hipótese, as pesquisas (testes
em nosso caso) poderão confirmá-la ou negá-la!
Pressupostos para resolver a questão
A aplicação da análise de variância pressupõe a verificação das
seguintes condições:
� as amostras devem ser aleatórias e independentes;
� as amostras devem ser extraídas de populações normais;
� as populações devem ter variâncias iguais.
Assim, temos duas situações possíveis demonstradas a seguir.
probabilidade_e_estatistica_1582.indb 238 19/07/12 11:12
239
Probabilidade e Estatística
Unidade 5
A hipótese H é verdadeira
As diferenças observadas entre as médias amostrais são devidas a
flutuações amostrais. Ou seja, neste caso, teremos que μ1 = μ2 =
μ3: todas as amostras provêm de populações com médias iguais.
Como se supôs que todas as populações são normais e têm
variâncias iguais, isto é o mesmo que extrair todas as amostras de
uma única população (de uma única fábrica).
Gráfico 5.2 – Distribuição populacional quando µ1 = µ2 = µ3 = µ
Fonte: Elaboração do autor (2011).
A hipótese H é falsa
As diferenças observadas entre as médias amostrais são
demasiado grandes para serem devidas unicamente a flutuações
amostrais.
Aqui, as médias das populações não são iguais, ou seja pelo
menos duas fábricas têm volumes de produção média diferentes.
As amostras recolhidas provêm de populações diferentes.
Gráfico 5.3 – Distribuição populacional quando µ1 ≠ µ2 ≠ µ3
Fonte: Elaboração do autor (2011).
probabilidade_e_estatistica_1582.indb 239 19/07/12 11:12
240
Universidade do Sul de Santa Catarina
Teste ANOVA
Para testar a hipótese, devemos trabalhar com o valor da
Estatística de teste F, que é outro valor que surge de outra
distribuição de probabilidade, que a semelhança da distribuição
normal tem uma tabela para calcular seu valor, no qual devemos
entrar com os graus de liberdades (número de dados da amostra
diminuído um) para obter o valor correspondendo a um certo
nível de confiança (por exemplo, NC = 95%, ou seja, um nível de
significância de 5%: α = 5%).
Então, a estatística de teste mede a razão entre a variação entre
grupos e a variação dentro dos grupos:
F = Variação entre grupos
Variação dentro dos grupos
A hipótese H é, pois, rejeitada para valores grandes da estatística F.
A tabela ANOVA tem a seguinte estrutura:
Tabela 5.8 – Tabela ANOVAFonte: Elaboração do autor (2011).
Por exemplo, para n = 3 (três grupos) e m = 5 (cinco amostras por
grupo) resultam em:
probabilidade_e_estatistica_1582.indb 240 19/07/12 11:12
241
Probabilidade e Estatística
Unidade 5
� GLn = 3 – 1 = 2 (graus de liberdade do numerador, 3 = K);
� GLm = 15 – 3 = 12 (graus de liberdade do denominador,
15 = 3 x 5 = N).
Ao final da seção, você pode achar a tabela completa para
determinar o PC (ponto crítico) ou estatística F para um nível de
confiança de 95%.
Assim, na tabela, procura-se na primeira coluna (GL do
denominador) a linha do 12 e, na primeira fila, a linha do 2 (GL
do numerador), resulta num valor do estatístico F: F = 3,89, este
valor definido pela tabela é conhecido como Ponto Crítico ou PC.
Devemos aclarar que existem diversas tabelas de F, cada uma
delas calculadas para um grau de significância diferente, a tabela
de nosso trabalho é a tabela para um grau de significância de 5%.
Agora, temos que calcular o valor de F para nosso experimento, e
se o valor do F calculado resulta maior que o valor de F tabelado
(PC), a hipótese deverá ser rejeitada.
Dessa forma, para calcular nosso valor de F amostral, devemos
utilizar uma tabela de layout já tradicional para organizar
nossos cálculos.
A tabela, chamada de Tabela ANOVA, tem a seguinte estrutura
tradicional:
Tabela 5.9 – Tabela ANOVA
Fonte: Elaboração do autor (2011).
probabilidade_e_estatistica_1582.indb 241 19/07/12 11:12
242
Universidade do Sul de Santa Catarina
Nessa tabela, temos:
SST = é a soma de quadrados total e mede a variação total nos
dados;
SSA = é a soma de quadrados entre os níveis (grupos) do fator
e mede a variação entre grupos (populações); é designada por
variação explicada, pois ela é explicada pelo fato de as amostras
poderem provir de populações diferentes;
SSE = é a soma de quadrados dentro dos níveis (grupos) do fator
e mede a variação dentro dos grupos (populações); é, por vezes,
designada por variação não explicada ou residual, pois é atribuída
a flutuações dentro da mesma população, portanto não pode ser
explicada pelas possíveis diferenças entre os grupos (populações).
Também temos que:
MSA = que é a soma média de quadrados entre grupos;
MSE = que é a soma média de quadrados dentro dos grupos ou
residual.
Pode-se provar que:
SST = SSA + SSE;
e, também, que:
(K − 1) + (N – K) = N – 1
Isso permite verificar os cálculos da tabela ANOVA.
Assim, sob o pressuposto da hipótese ser verdadeira, tem-se:
probabilidade_e_estatistica_1582.indb 242 19/07/12 11:12
243
Probabilidade e Estatística
Unidade 5
A hipótese deve ser rejeitada se o valor observado de F se situar à
direita do ponto crítico; isto é, rejeita-se H se Fobs ≥ PC, em que o
ponto crítico PC é dado por:
Então, para nosso exemplo da compra das fábricas por parte do Sr.
Fernando Fernandes, vamos ver o que podemos concluir ao nível de
significância de 0.05, ou seja, a um nível de confiança NC = 95%.
Cálculo de SSE:
Cálculo de SSA:
SSA = 5(49 – 52)2 + 5(56 – 52)2 + 5(51 – 52)2 = 130
Assim, a tabela ANOVA resulta, numericamente para o exemplo,
nos seguintes valores:
Tabela 5.10 – Tabela ANOVA
Fonte: Elaboração do autor (2011).
E, se a hipótese H é verdadeira, resultará:
probabilidade_e_estatistica_1582.indb 243 19/07/12 11:12
244
Universidade do Sul de Santa Catarina
Da tabela F, a gente já calculou o valor F para os graus de
liberdade 2 e 12 e 95% de confiança:
F1–a,2,12 = 3.89
E, segundo a tabela ANOVA, o valor observado da estatística F é:
E, como resultando que 8,3 > 3,89, então a hipótese (H: μ1 =
μ2 = μ3) é rejeitada ao nível de significância de 0,05 ou nível de
confiança de 95%; isto é, existem diferenças significativas entre
as médias amostrais das vendas, e há, portanto, evidência de que
existem pelo menos duas lojas com volumes médios de produção
diferentes entre elas.
Em outras palavras, o fator fábrica exerce uma influência
significativa sobre o volume médio da produção de parafusos:
tem, ao menos, uma fábrica que está produzindo bem menos ou
bem mais que as outras, desequilibrado o suprimento constante
de parafusos que a indústria de Fernando Fernandez precisa.
probabilidade_e_estatistica_1582.indb 244 19/07/12 11:12
245
Probabilidade e Estatística
Unidade 5
Síntese
O processo de amostragem é muito importante e eficaz no dia
a dia de qualquer profissional. Diariamente, você esbarra com
situações semelhantes às que foram analisadas nesta unidade,
tanto nos meios de comunicação, como rádio, TV, jornais etc.,
mas também em escolas, empresas e outras instituições.
Nesta unidade, você pôde ver as facilidades e a importância do uso
de amostragem. Hoje, os processos de amostragem e as estimativas
estão muito precisos, a ponto de ser mais confiável usar a amostra
que realizar uma pesquisa com a totalidade da população.
Você teve, também, algumas noções de como funciona todo esse
processo, mas fique à vontade para aprofundar esse tema tão
importante e fundamental na realização de uma pesquisa. Muitas
vezes, você terá que usar ferramentas como as que vimos aqui,
tanto na sua vida acadêmica quanto na profissional.
Entender que as pesquisas feitas com base em uma amostra não
culminam em resultados exatos, e poder definir a margem de erro
ocasionada por essa amostragem, é um passo muito importante
na formação profissional e acadêmica, além de possibilitar uma
leitura mais realista da realidade.
probabilidade_e_estatistica_1582.indb 245 19/07/12 11:12
246
Universidade do Sul de Santa Catarina
Atividades de autoavaliação
Ao final de cada unidade, você realizará atividades de autoavaliação. O
gabarito está disponível no final do livro didático, mas se esforce para
resolver as atividades sem a ajuda do gabarito, pois, assim, você estará
promovendo (e estimulando) a sua aprendizagem.
1) Estão listadas, a seguir, uma série de estudos e a margem de erro que
o pesquisador irá adotar como tolerável, bem como o tamanho da
população alvo desse estudo. Calcule o tamanho da amostra necessária
para realizar as pesquisas considerando que o pesquisador não tem
acesso ao tamanho da população e que o pesquisador tem acesso ao
tamanho da população (calcular para os dois casos).
Tipos de estudos, margem de erro e tamanho da população e da amostra
Tema do estudo Erro tolerável
Tamanho
da
população
Tamanho
da amostra
(preencher)
a) Estudo socioeconômico com
estudantes da Unisul 0,03 5600
b) Estudo com famílias do bairro Rio
Vermelho, em Florianópolis 0,04 9400
c) Estudo com adolescentes com Teste
de Sondagem Intelectual (TSI) 0,05 400
d) Estudo da fecundidade na cidade de
Florianópolis 0,06 125.000
e) Estudo com usuários de drogas
adolescentes de uma escola 0,09 250
f ) Estudo sobre analfabetismo no bairro
Rio Tavares, em Florianópolis 0,09 2.500
g) Estudo de Índice de Massa Corporal
dos estudantes da Unisul 0,05 4.000
h) Pesquisa de intenções de voto no
Brasil 0,02 80.000.000*
Fonte: Elaboração do autor (2006).
probabilidade_e_estatistica_1582.indb 246 19/07/12 11:12
247
Probabilidade e Estatística
Unidade 5
2) Leia a notícia da IstoÉ On-Line (2004):
Florianópolis / SC – Caça ao tucano
Sem contar com o apoio do governador, da prefeita Ângela Amin
(PP) e de caciques da política catarinense, Dário Berger, candidato
da coligação PSDB-PMN, é a grande surpresa até o momento nas
eleições em Florianópolis. Concorrendo pela primeira vez a um
cargo público de expressão, Berger vem liderando com folga a
corrida eleitoral em Floripa. Pela pesquisa ISTOÉ/Databrain – feita
entre os dias 26 e 27 de julho, com 700 entrevistados, margem
de erro de 2,74 pontos porcentuais e coeficiente de confiança de
90% – Berger apresenta tranquilos 26,4% das intenções de voto. O
levantamento foi registrado no TRE-SC com o número 559/2004.
(Dados adaptados de ISTOÈ ONLINE, 2004).
Com os dados dessa matéria, mostre os cálculos que foram feitos para
se chegar ao erro de 2,74pontos percentuais, e encontre o intervalo da
estimativa.
probabilidade_e_estatistica_1582.indb 247 19/07/12 11:12
248
Universidade do Sul de Santa Catarina
3) A formação dos professores de Matemática da rede pública é
importante para o ensino e para o aprendizado e é cada vez mais
valorizado pelas instituições de ensino. Uma amostragem feita com
300 professores indicou que apenas 240 professores do Ensino
Fundamental da rede pública têm graduação completa em Matemática.
Faça uma estimativa para o percentual da população de professores
que têm graduação completa usando um nível de confiança de 95%
(de início, não se esqueça de calcular o percentual de professores com
graduação completa, assim como o intervalo da estimativa).
probabilidade_e_estatistica_1582.indb 248 19/07/12 11:12
249
Probabilidade e Estatística
Unidade 5
4) Uma amostragem com 250 alunos foi feita em escolas, e, entre outras
perguntas, questionou-se sobre o peso dos alunos da quinta-série. O
peso médio dos alunos entrevistados foi de 29,3 Kg e apresentou um
desvio padrão de 3,4 Kg. Usando um nível de confiança de 95%, calcule
uma estimativa para a totalidade (população) de alunos da quinta-série
(não esqueça de calcular o erro e o intervalo correspondentes).
probabilidade_e_estatistica_1582.indb 249 19/07/12 11:12
250
Universidade do Sul de Santa Catarina
5) O governo federal instituiu o programa Bolsa Escola, no qual as famílias
de baixa renda recebem ajuda financeira por cada filho que frequenta a
escola. Essa ajuda financeira, segundo setor responsável, é em média de
R$ 150,00 por família e apresenta um desvio padrão de R$ 31,50. Esses
dados foram obtidos por uma amostragem realizada com 1000 famílias.
Faça uma estimativa (erro e intervalo) para o valor médio recebido pela
população das famílias com base em um nível de confiança de 98%
(não se esqueça de calcular z, dividindo 98 por 100 e, após, dividindo o
resultado obtido por 2. Procure o resultado na tabela).
6) O diretor de marketing de uma indústria pretende comprar uma nova
máquina para fabricar parafusos. Você foi designado para estudar
três marcas de maquinarias semelhantes, cada uma delas combina,
de modo diferente, fatores como o preço do produto, volume de
fabricação, condições de consumo de energia etc.
Qualquer um destes equipamentos pode ser utilizada na sua indústria,
não havendo qualquer tipo de influência no rendimento pela presença
dos outros equipamentos da indústria.
Para saber se há diferença entre o volume de produção das
três máquinas visando à sua eficácia, cada uma delas é testada,
aleatoriamente, funcionando em algumas das lojas dos fabricantes
durante um período de duração limitada. Note que as lojas de venda
são selecionadas de modo que as três amostras sejam aleatórias e
independentes entre si.
probabilidade_e_estatistica_1582.indb 250 19/07/12 11:12
251
Probabilidade e Estatística
Unidade 5
A quantidade de peças produzidas durante este período constam na
tabela seguinte:
Maquina 1 Máquina 2 Máquina 3
8 10 7
6 8 5
5 12 8
6 7 6
7 9 7
10 5
11
Soma 32 67 38
Seja Xi a variável aleatória que representa o volume de produção de cada
máquina i (i = 1,2,3), também admitamos que X1, X2 e X3 têm distribuição
normal com iguais variâncias e fixemos o nível de confiança do teste em
95%, ou seja, trabalhemos com um nível de significância de 5%.
A hipótese a testar é: H: µ1 = µ2 = µ3, ou seja: aceita-se que não há
diferença entre os níveis de produção relativamente ao volume médio
de peças que podem fabricar.
No caso que a hipótese H seja rejeitada, estaremos demostrando que pelo
menos duas máquinas produzem um volume médio de peças diferente.
Assim, para resolver este problema, calcule o ponto crítico pelo médio
do estatístico F da tabela da distribuição para um nível de significância
de 5%. Verifique se aceita ou rejeita a hipótese de trabalho e crie a
tabela ANOVA.
probabilidade_e_estatistica_1582.indb 251 19/07/12 11:12
Saiba mais
Se quiser aprofundar os estudos relativos ao assunto tratado nessa
unidade, pesquise em:
BARBETTA, Pedro Alberto. Estatística aplicada às ciências
sociais. 5. ed. rev. Florianópolis: Ed. UFSC, 2002.
MORETTIN, Luiz Gonzaga. Estatística básica. São Paulo:
Makron Books, 1999.
TRIOLA, Mario F. Introdução à Estatística. Rio de Janeiro:
LTC, 1999.
VIEIRA, Sônia. Introdução à bioestatística. 6. ed. Rio de
Janeiro: Campus, 2000.
probabilidade_e_estatistica_1582.indb 252 19/07/12 11:12
6UNIDADE 6Regressão linear e gráficos de controle
Objetivos de aprendizagem
� Compreender e calcular a correlação entre duas
variáveis.
� Analisar a força de correlação entre duas variáveis.
� Ajustar linearmente as duas variáveis.
� Calcular previsões usando análise de regressão.
Seções de estudo
Seção 1 Correlação linear simples
Seção 2 Análise de regressão linear
Seção 3 Gráficos de controle
probabilidade_e_estatistica_1582.indb 253 19/07/12 11:12
254
Universidade do Sul de Santa Catarina
Para início de estudo
Pense na seguinte situação: será que existe alguma relação entre
peso e altura? E entre nota escolar e idade? Sabemos como
funcionam algumas destas relações por simples experiência de
vida. Como, por exemplo, você pode dizer que quanto mais alta
é a pessoa, mais pesada ela é. Claro que existem as exceções, mas
geralmente, baixinhos são gordinhos, e altos, magrinhos.
Nesta unidade, você irá estudar como se pode analisar e
comparar duas variáveis. Além disso, você irá aprender a fazer
previsões utilizando esse método.
Bons estudos!
Seção 1 – Correlação linear simples
Os métodos que você estudou até o momento são eficazes para
analisar e interpretar somente uma variável de cada vez. Se eles
servem para a análise de uma variável, como analisar e comparar
duas variáveis simultaneamente? Para compreender como solucionar
tal situação, você irá conhecer a correlação linear simples.
A correlação é uma ferramenta destinada ao estudo
da relação entre duas variáveis quantitativas, além de
fornecer a intensidade dessa relação.
Para você estudar como usar a correlação linear simples, é
importante que você conheça o que é diagrama de dispersão e o
coeficiente de correlação linear de Pearson. Conheça melhor estes
assuntos a seguir.
probabilidade_e_estatistica_1582.indb 254 19/07/12 11:12
255
Probabilidade e Estatística
Unidade 6
Diagrama de dispersão
O diagrama de dispersão ajuda a definir a correlação entre duas
variáveis quantitativas de modo gráfico. Em outras palavras,
a relação entre duas variáveis, X e Y, pode ser vista em um
diagrama, no qual são marcados os pontos correspondentes aos
pares ordenados gerados pela relação X → Y, e (x,y) são esses pares
ordenados. Dessa forma se constrói um diagrama de dispersão.
Quanto mais esses pontos estão próximos à reta imaginária gerada
pela nuvem de pontos, mais forte será a correlação. Observe o
gráfico a seguir e acompanhe os exemplos apresentados.
No Gráfico 6.1, os pares ordenados são gerados da relação entre a
altura das pessoas em centímetros e o peso em quilos.
Gráfico 6.1 – Diagrama de dispersão
Fonte: Elaboração do autor (2006).
Coeficiente de correlação linear de Pearson
O coeficiente de correlação permite que você analise a força ou a
existência da correlação entre duas variáveis. Considerando que
n é o número de observações (tamanho da amostra), o coeficiente
será dado pela seguinte fórmula:
( )( )[ ]
( )[ ] ( )[ ]2222 .
...
yynxxn
yxyxnrxy
∑−∑∑−∑
∑∑−∑
=
probabilidade_e_estatistica_1582.indb 255 19/07/12 11:12
256
Universidade do Sul de Santa Catarina
Em que:
r = resultado do coeficiente de correlação linear de Pearson;
n = número de observações;
x = valores assumidos pela variável X;
y = valores assumidos pela variável Y.
Obs.: O coeficiente de Pearson pode variar de −1 a +1 → [−1,+1].
Quanto ao resultado de r, você deve considerar cinco situações,
descritas no quadro a seguir.Valor de r Correlação entre as variáveis
r próximo de 0 Correlação linear pouco significativa
r = 0 Não há correlação linear entre as variáveis
r próximo de –1 Há correlação linear negativa (significativa)
r = –1 Há correlação linear negativa perfeita
r próximo de +1 Há correlação linear positiva (significativa)
r = +1 Há correlação linear positiva perfeita
Quadro 6.1 – Resultados possíveis do valor de x
Fonte: Elaboração do autor (2006).
Tipos de correlações
Então, segundo os resultados de r, as correlações podem assumir
diferentes tipos, os quais você pode acompanhar detalhadamente
a seguir:
a) Correlação linear positiva
Neste caso, o coeficiente de Pearson estará entre 0 e 1 →
intervalo (0,1).
probabilidade_e_estatistica_1582.indb 256 19/07/12 11:12
257
Probabilidade e Estatística
Unidade 6
Gráfico 6.2 – Correlação linear positiva: altura x peso
Fonte: Elaboração do autor (2006).
� x cresce, y cresce: no exemplo, se a altura cresce, o peso
cresce;
� x decresce, y decresce: no exemplo, se a altura decresce, o
peso decresce.
b) Correlação linear perfeita positiva
Neste caso, o coeficiente de Pearson r será +1: os pontos estão
perfeitamente alinhados.
Gráfico 6.3 – Correlação linear perfeita positiva: altura x peso
Fonte: Elaboração do autor (2006).
� x cresce, y cresce: no exemplo, se altura cresce, o peso
cresce;
� x decresce, y decresce: no exemplo: se a altura decresce, o
peso decresce.
probabilidade_e_estatistica_1582.indb 257 19/07/12 11:12
258
Universidade do Sul de Santa Catarina
c) Correlação linear negativa
Neste caso, o coeficiente de Pearson estará entre 0 e −1:
intervalo [−1,0].
Gráfico 6.4 – Correlação linear negativa: idade x nota
Fonte: Elaboração do autor (2006).
� x cresce, y decresce: no exemplo, se a idade cresce, a nota
decresce;
� x decresce, y cresce: no exemplo, se a idade decresce, a
nota cresce.
d) Correlação linear perfeita negativa
Neste caso, o coeficiente de Pearson r será −1: os pontos estão
perfeitamente alinhados.
Gráfico 6.5 – Correlação linear perfeita negativa: idade x nota
Fonte: Elaboração do autor (2006).
probabilidade_e_estatistica_1582.indb 258 19/07/12 11:12
259
Probabilidade e Estatística
Unidade 6
� x cresce, y decresce: no exemplo, se a idade cresce, a nota
decresce;
� x decresce, y cresce: no exemplo, se a idade decresce, a
nota cresce.
e) Correlação linear nula ou ausência de correlação
A seguir, veja exemplo de quando não há correlação entre as
variáveis X e Y (coeficiente de Pearson r = 0).
Gráfico 6.6 – correlação linear nula ou ausência de correlação: altura x nota
Fonte: Elaboração do autor (2006).
Como calcular o coeficiente de correlação?
Para obter esta resposta, acompanhe com atenção o exemplo.
Exemplo: Calcule o coeficiente de correlação de Pearson e
construa o diagrama de dispersão para uma turma de alunos,
correlacionando altura e peso, descritas a seguir:
probabilidade_e_estatistica_1582.indb 259 19/07/12 11:12
260
Universidade do Sul de Santa Catarina
Tabela 6.1 – Tabela de altura e peso dos alunos de uma série
Fonte: Elaboração do autor (2006).
Calculando passo a passo
Passo 1: acrescente, na tabela, mais três colunas para auxiliar nos
cálculos. Some os elementos da coluna x (altura) e escreva o total na
última linha, obtendo, assim, o Σx. Some os elementos da coluna y (peso)
e escreva o total na última linha, obtendo, assim, o Σy (veja tabela).
Passo 2: calcule os elementos da terceira coluna (x.y), multiplicando
cada um dos elementos da coluna x (altura) por cada um dos
elementos da coluna y (peso).
160.61 = 9760
155.56 = 8680
152.55 = 8360
E, assim, até o último aluno (aluno de número 10: veja os
resultados na tabela). Em seguida, some todos eles e escreva o
total na última linha, obtendo, assim, o Σx y.
probabilidade_e_estatistica_1582.indb 260 19/07/12 11:12
261
Probabilidade e Estatística
Unidade 6
Passo 3: calcule os elementos da quarta coluna (x2), elevando ao
quadrado, cada um dos elementos da coluna x (altura).
(160)2 = 25600
(155)2 = 24025
(152)2 = 23104
E, assim, até o último aluno (veja os resultados na tabela). Em
seguida, some todos eles e escreva o total na última linha, para
obter, assim, o Σx2.
Passo 4: calcule os elementos da quinta coluna (y2), elevando ao
quadrado, cada um dos elementos da coluna y (peso em Kg).
(61)2 = 3721
(56)2 = 3136
(55)2 = 3025
E, assim, até o último aluno (veja os resultados na tabela). Em
seguida, some todos eles e escreva o total na última linha, para
obter, assim, o Σy2.
Passo 5: calcule o coeficiente de correlação utilizando a fórmula vista
anteriormente.
Agora, que tal identificar os elementos da fórmula?
n = número de observações (10 alunos) → n = 10.
probabilidade_e_estatistica_1582.indb 261 19/07/12 11:12
262
Universidade do Sul de Santa Catarina
Os elementos a seguir foram calculados nos passos anteriores:
Σx = 1723
Σy = 703
Σx.y = 122327
Σx2 = 298537
Σy2 = 50323
Observação: É importante lembrar que:
Σx.y ≠ Σx . Σy
Σx2 ≠ Σy2
Se você escrever na fórmula, terá:
Passo 6: agora, construa o diagrama de dispersão; para construir o
diagrama; você deve marcar os pontos de cada par ordenado usando
os valores da coluna das alturas como x e da coluna dos pesos como
y, formando (x, y); veja o gráfico a seguir:
probabilidade_e_estatistica_1582.indb 262 19/07/12 11:13
263
Probabilidade e Estatística
Unidade 6
Gráfico 6.7 – Gráfico altura x peso
Fonte: Elaboração do autor (2006).
Como interpretar? O coeficiente de correlação resultou em
um número positivo e próximo de 1 (r = 0,98), sendo assim,
a correlação entre a altura dos alunos e o peso é positiva
(significativa), ou seja, quanto maior a altura do aluno, maior
será seu peso, e quanto menor for sua altura menor será seu peso.
Uma vez que você acompanhou e entendeu bem o exemplo de
como aplicar o coeficiente de correlação de Pearson, siga para o
estudo da próxima seção.
Seção 2 – Análise de regressão linear
Para fazer a análise da regressão, nos casos em que é possível
estabelecer uma correlação entre duas variáveis, você terá de usar essa
relação para prever valores para uma delas (sempre a variável que for
adotada como Y), mas isso só será possível quando for conhecido o
valor da outra variável, no caso, a variável X. E essa previsão só tem
significado caso a força da correlação seja significativa ou perfeita
(quando r está próximo ou igual a +1 ou −1). Essa força se dá pela
proximidade dos pontos do diagrama de dispersão à reta imaginária.
A reta imaginária obtida pela aproximação dos pontos
do diagrama de dispersão é chamada de reta de
regressão!
probabilidade_e_estatistica_1582.indb 263 19/07/12 11:13
264
Universidade do Sul de Santa Catarina
Para encontrar uma equação que lhe auxilie a prever valores
de Y, usa-se o Método dos Mínimos Quadrados, o qual você
conhecerá a seguir.
A escolha da variável que será o Y está relacionada à
variável que o pesquisador deseja estimar. No exemplo
anterior, se a intenção é a de estimar o peso dos alunos,
então, o Y deve ser a variável peso. Caso a necessidade
fosse a de estimar a altura dos alunos, a variável Y
passaria a ser a altura.
Método dos mínimos quadrados
Pode-se representar a reta imaginária pela equação:
Reta de regressão: = b + a.X
Sendo:
e
Em que:
= valor predito de y (a ser estimado);
x = valor da variável x para determinado elemento da amostra;
y = valor da variável y para determinado elemento da amostra;
n = nº total de observações (tamanho da amostra);
b = a intersecção do eixo y (ou coeficiente linear da reta);
a = coeficiente de inclinação da reta (ou coeficiente angular da reta).
probabilidade_e_estatistica_1582.indb 264 19/07/12 11:13
265
Probabilidade e Estatística
Unidade 6
Ao predizer um valor de y com base em determinado
valor de x, quanto mais significativa a correlação linear,
mais precisa se torna a previsão.
� Interpolação: estimativascom valores entre os da série;
� Extrapolação: estimativas com valores fora dos da série;
� Resíduo: é a diferença entre um valor amostral
observado y, e o valor predito com base na equação de
regressão.
A tabela a seguir (a mesma do exemplo anterior) descreve as
alturas e pesos dos alunos de uma turma. Você deverá:
a) construir a equação de uma reta de regressão para prever
o peso dos alunos;
b) prever o peso ( ) de um aluno com 175 cm (x) de altura.
Tabela 6.2 – Altura e peso dos alunos de uma série
Fonte: Elaboração do autor (2006).
Calculando passo a passo
� Para o item a):
Considerando que a tabela é a mesma do exemplo da seção 1
(cálculo do coeficiente de correlação), não será necessário calcular
as colunas nem os totais (veja a tabela).
probabilidade_e_estatistica_1582.indb 265 19/07/12 11:13
266
Universidade do Sul de Santa Catarina
Equação da reta de regressão → = b + a.X
Passo 1: você pode começar calculando a inclinação da reta (a).
Inclinação da reta (a) →
Agora, identifique os elementos da fórmula:
n = número de observações (10 alunos) → n = 10.
Os elementos a seguir foram calculados nos passos anteriores
Σx = 1723
Σy = 703
Σx.y = 122327
Σx2 = 298537
Se você escrever na fórmula, terá:
Passo 2: calcule a intersecção com o eixo y (b).
Intersecção do eixo y (b) →
Agora, identifique os elementos da fórmula:
n = número de observações (10 alunos) → n = 10.
Os elementos a seguir foram calculados nos passos anteriores.
probabilidade_e_estatistica_1582.indb 266 19/07/12 11:13
267
Probabilidade e Estatística
Unidade 6
Σx = 1723
Σy = 703
a = 0,72117
b = –53,95769
Passo 3: construa a equação da reta de regressão.
Após calcular a e b, tem-se:
a = 0,72117
b = − 53,95769
= b + a.X
= 0,72117x – 53,95769
� Para o item b):
Fazer a previsão para um aluno que mede 175 cm. Você deve usar
175 como X = 175. Substituir o valor de X na equação de regressão.
= 0,72117 . 175 – 53,95769 = 126,20475 – 53,95769
= 72,24706
Como interpretar? A previsão para o peso deste aluno que mede
175 cm é de 72,25 Kg.
probabilidade_e_estatistica_1582.indb 267 19/07/12 11:13
268
Universidade do Sul de Santa Catarina
Seção 3 – Gráficos de controle
Antes de iniciar, vamos a uma questão: você saberia explicar o
porquê do controle nos processos?
Quando fabricado um produto, bem ou serviço, as características
deste produto irão apresentar certa variabilidade, devido à variação
sofrida pelos fatores que compõem o próprio processo produtivo;
por exemplo, diferença entre máquinas, mudanças nas condições
ambientais, variação do material utilizado na fabricação, diferença
entre fornecedores, e outras tantas causas possíveis.
Apesar do esforço direcionado para controlar todas esta
variabilidade, ela irá sempre existir no produto acabado.
Portanto, é importante controlar esta variabilidade para que
possam ser fabricados produtos dentro dos padrões de qualidade
próprios da empresa.
Também é importante verificar a estabilidade
do processo de produção, já que de processos
instáveis irão resultar produtos defeituosos ou
perdas na produção ou, ainda, baixa na qualidade e,
consequentemente, perda da confiança do cliente.
A partir do exposto, é possível compreender melhor a necessidade
dos gráficos de controle. O que nos leva a outra questão: o que
são os gráficos de controle?
Os gráficos de controle são um método para analisar
e ajustar as variações de um processo em função do
tempo. Descrevem o processo considerando duas
caraterísticas básicas: centralização, definida pela
média aritmética, e dispersão, verificada pelo desvio
padrão ou pela amplitude.
Assim, temos dois grandes grupos de gráfico de controle: os
gráficos para variáveis e os gráficos para atributos. As variáveis
são os dados que podem ser medidos ou que sofrem variações
contínuas (por exemplo, resistência à compressão, dureza,
diâmetros etc.), e os atributos são dados que somente podem ser
probabilidade_e_estatistica_1582.indb 268 19/07/12 11:13
269
Probabilidade e Estatística
Unidade 6
contados ou classificados (por exemplo, passa/não passa, claro/
escuro, quente/frio etc.), em outras palavras, são aqueles que
representam variáveis contínuas ou discretas, respectivamente.
Tipos de gráficos de controle
O gráfico para atributos mais usado é o gráfico NP, que
monitora a variação do número de itens defeituosos em amostras
de tamanho constante.
O gráfico de variável mais conhecido é o gráfico X-r, que monitora
a variação da média e amplitude dos dados ao longo do tempo.
E quais são os principais objetivos destes gráficos?
� Monitorar os dados temporais para uma característica
particular de qualidade, como exemplo: a cor de um
produto, o peso ou a temperatura;
� detectar mudanças no processo ao longo do mesmo;
� responder a perguntas do tipo:
» são os lotes de matéria-prima ou a variação de turno
que causam a variação do processo?
» são causas especiais do processo ou causas naturais que
ocasionam a variação no processo?
» a variação entre os diferentes lotes de produção é
maior que o esperado?
Acompanhe alguns exemplos de aplicação dos gráficos de
controles a seguir.
probabilidade_e_estatistica_1582.indb 269 19/07/12 11:13
270
Universidade do Sul de Santa Catarina
Exemplo 1:
Proposta: verificar se o processo de fabricação está sob
controle estatístico, ou seja, somente causas comuns de variação
influenciam processos.
Problema: a fábrica Peças & Peças deseja realizar um controle de
qualidade do processo de fabricação de parafusos.
Dados coletados: em todas as horas, são retiradas cinco peças
da linha de produção, que são medidas, e os valores, registrados.
Definimos, neste caso, que o tamanho do subgrupo é igual a
cinco, destes, 25 subgrupos foram obtidos.
Exemplo 2:
Proposta: verificar se a proporção de pedidos não aceitos está sob
controle.
Problema: o Banco de Minas deseja saber o número de pedidos
não aceitos para a abertura de contas em uma rede bancária.
Coleta de dados: Foi coletada uma amostra de 20 pedidos.
Exemplo 3:
Proposta: verificar o número de erros nas fichas de
cadastramento de uma empresa.
Problema: foi observado um grande número de erros no
preenchimento dos cadastros dos vendedores de uma empresa.
Deseja-se analisar o número de erros por cadastro (não
conformidades).
Coleta de dados: analisa-se uma amostra de 22 conjuntos,
contendo 15 fichas de cadastro cada.
probabilidade_e_estatistica_1582.indb 270 19/07/12 11:13
271
Probabilidade e Estatística
Unidade 6
Construção de gráficos de controle com ajuda de planilhas de
cálculo: gráfico NP
A fábrica de Parafusos Fernando Fernandes, no final de cada dia de
trabalho, inspeciona uma amostra de cem peças para obter o número
de defeitos e conhecer o grau de qualidade da sua produção.
Pode-se perceber que essa característica de qualidade varia ao
longo do tempo; e, assim, para facilitar esse estudo, devemos usar
uma ferramenta que possibilite a visualização do número de peças
dentro dos padrões predeterminados pela fábrica e aquelas que
estão fora desses padrões, como são os gráficos de controle.
Os gráficos de controle típicos exibem três linhas paralelas
ao eixo X: a linha central, que representa o valor médio do
característico de qualidade exigido pela fábrica; a linha superior,
que representa o limite superior de controle (LSC); e a linha
inferior, representando o limite inferior de controle (LIC).
Assim, uma vez apresentado o gráfico, os pontos da amostragem
devem permanecer dentro do intervalo determinado por LSC e
LIC. Cada ponto representa uma amostra do processo.
Para visualizar a evolução do característico de qualidade ao longo
do tempo, é usual unir os pontos com retas.
Assim, os gráficos de controle apresentam o desempenho do
processo no tempo e podem indicar que o processo está sob
controle estatístico quando:
� todos os pontos do gráfico estão dentro dos limites de
controle;
� a disposiçãodos pontos dentro dos limites é aleatória;
No caso que todos os pontos amostrais estejam sem distribuição
aleatória, pode acontecer de estar trabalhando com dados visados.
probabilidade_e_estatistica_1582.indb 271 19/07/12 11:13
272
Universidade do Sul de Santa Catarina
Construção do gráfico de controle NP
Logo após de uma semana de amostragem, os resultado são os
seguintes:
Tabela 6.3 – Resultado da amostragem
Amostra número 1 2 3 4 5 6
Tamanho amostra n 100 100 100 100 100 100
Número de peças defeituosas d 5 2 7 3 6 2
Proporção de peças defeituosas p 0,05 0,02 0,07 0,03 0,06 0,03
Fonte: Elaboração do autor (2011).
Para o cálculo da média das proporções, devemos utilizar a
seguinte fórmula:
P = (1 / m) Spi
Em que:
P = média das proporções;
m = número de amostras (no exemplo, m = 6);
Spi = somatória das proporções.
Assim sendo:
P = 1/6 * (B4 + C4 + D4 + E4 + F4 + G4) = 0,04167
Para calcular o número médio, usamos a fórmula:
NP = P x n
Em que:
NP = número médio;
n = tamanho da amostra (no exemplo, n = 100).
probabilidade_e_estatistica_1582.indb 272 19/07/12 11:13
273
Probabilidade e Estatística
Unidade 6
Para o exemplo:
NP = 0,04167 x 100 = 4,167
Para calcular o LSC, usamos a fórmula:
Em que:
LSC = limite superior de controle;
NP = número médio;
P = médias das proporções.
Para o exemplo dado:
LSC = 10,1615
Para o cálculo do LIC, usamos a fórmula:
Em que LIC é o limite inferior de controle, e, usando os dados
do exemplo, resulta em:
LIC = −1,8281.
Porém, pelo fato de que a fábrica está testando o número de peças
defeituosas, resulta que o LIC (o mínimo de peças defeituosas
produzidas) não pode ser um número negativo.
No exemplo, devemos assumir como LIC o menor valor possível,
ou seja, zero peças defeituosas.
probabilidade_e_estatistica_1582.indb 273 19/07/12 11:13
274
Universidade do Sul de Santa Catarina
Temos, então, todos os parâmetros necessários à construção do
gráfico NP:
LIC = 0
LSC = 10,1615
NP = 4,167
Agora, vamos construir o gráfico, com a ajuda de uma tabela em
Excel, que possuirá quatro colunas:
� Número de peças defeituosas;
� Limite superior de controle (LSC);
� Limite inferior de controle (LIC);
� Número médio (NP).
Tabela 6.4 – Peças com defeito
Fonte: Elaboração do autor (2011).
Note que os valores de LSC, LIC e NP são iguais para cada
amostra. Com a tabela pronta, efetua-se o procedimento usual para
a construção de um gráfico de linhas com os pontos plotados.
Este procedimento será mostrado a seguir:
Marcar o intervalo A1:D7 e, a partir do menu Inserir /
Gráfico, inserir um gráfico de linhas com marcas para
os pontos.
probabilidade_e_estatistica_1582.indb 274 19/07/12 11:13
275
Probabilidade e Estatística
Unidade 6
Figura 6.1 – Criação de gráfico de controle em Excel
Fonte: Elaboração do autor (2011).
E, assim, veremos uma janela semelhante à seguinte:
Figura 6.2 – Criação de gráfico de controle em Excel
Fonte: Elaboração do autor (2011).
Nesta caixa, podemos visualizar como ficará o gráfico.
Clique em continuar; na próxima caixa, mostrada na Figura
3.3, definiremos os detalhes do gráfico NP, tais como título do
gráfico, legendas e títulos dos eixos X e Y.
Feito isso, finalizaremos o procedimento clicando em finalizar.
probabilidade_e_estatistica_1582.indb 275 19/07/12 11:13
276
Universidade do Sul de Santa Catarina
Figura 6.3 – Criação de gráfico de controle em Excel
Fonte: Elaboração do autor (2011).
Resultando, finalmente, no gráfico de controle NP.
Gráfico 6.8 – Gráfico de controle
Fonte: Elaboração do autor (2011).
Analisando o gráfico, observamos que todos os pontos amostrais
estão distribuídos aleatoriamente ao redor da média, sem
apresentar valores fora dos limites máximos e mínimos e sem
apresentar dados visados; através dessa análise, podemos concluir
que o processo de fabricação está sob controle estatístico e não
apresenta falhas de produção que precisem parar a produção para,
por exemplo, calibrar alguma parte de equipamento.
Dito com outras palavras, conclui-se que o número de peças não
conformes está sob controle estatístico, já que nenhum ponto
ultrapassa os limites de controle.
probabilidade_e_estatistica_1582.indb 276 19/07/12 11:13
277
Probabilidade e Estatística
Unidade 6
Construção de gráficos de controle com ajuda de planilhas de
cálculo: gráfico X-r
Uma empresa que produz, ensaca e comercializa arroz deve verificar
a qualidade de seu produto em relação ao peso de cada pacote.
Para isso, faz-se necessário um gráfico de controle para variáveis;
neste caso, a variável é o peso dos pacotes.
Por tal motivo, foi feita uma amostragem aleatória de quatro
pacotes em cada uma das seis amostras. Para cada uma das seis
amostras, calculou-se a média aritmética e a amplitude dos pesos
(valor máximo – valor mínimo).
Na construção do gráfico X-r, são necessários os seguintes
valores:
� média das médias das amostras (X);
� média das amplitudes das amostras (K);
� tamanho das amostras (n).
Com estas duas médias, X e K, e com n, pode-se calcular os
limites de controle (LIC e LSC).
Então, temos que:
Faz-se amostragem dos pesos nas m amostras com n pacotes e
registram-se estes pesos:
� número de amostras m = 6;
� número de pacotes por amostra n = 4.
Com os dados coletados, podemos construir a tabela seguinte e
calcular a média e amplitude dos pesos de cada amostra.
probabilidade_e_estatistica_1582.indb 277 19/07/12 11:13
278
Universidade do Sul de Santa Catarina
Tabela 6.5 – Amostras
Fonte: Elaboração do autor (2011).
Agora, devemos calcular os valores necessários para a construção
do gráfico de controle X-r para cada uma das amostras e, no caso
da amostra 1, resulta:
� Cálculo da média
X = Σn amostra 1 / n
Em que:
X = média aritmética;
Σn amostra 1 = soma dos pesos da amostra 1;
n = tamanho da amostra.
X = 250 / 4 = 62,5
� Cálculo da amplitude dos pesos
r = valor máximo − valor mínimo
Em que:
r = amplitude
r = 70 – 55 = 15
probabilidade_e_estatistica_1582.indb 278 19/07/12 11:13
279
Probabilidade e Estatística
Unidade 6
Calculamos, assim, a média e a amplitude de todas as amostras,
construindo a seguinte tabela:
Tabela 6.6 – Peças com defeito
Fonte: Elaboração do autor (2011).
Continuando, para calcular os limites de controle inferior
e superior, calculamos a média das médias e a média das
amplitudes para cada amostra:
� Média das médias
Média das médias (X) = Soma das médias / m
X = 367,50 / 6 = 61,25
� Médias das amplitudes
Médias das amplitudes (K) = Soma das amplitudes / m
K = 95 / 6 = 15,83
E, finalmente, construímos uma tabela semelhante à
seguinte:
probabilidade_e_estatistica_1582.indb 279 19/07/12 11:13
280
Universidade do Sul de Santa Catarina
Tabela 6.7 – Peças com defeito
Fonte: Elaboração do autor (2011).
Todos os valores necessários para calcularmos LIC e LSC estão
disponíveis:
� média das médias: X = 61,25;
� média das amplitudes: K = 15,83;
� tamanho da amostra: n = 4.
Para calcularmos LIC e LSC:
LIC = X − A2 x K
LSC = X + A2 x K
Observação: o valor de A2 é obtido na tabela no final desta seção.
Para nosso caso, resulta em:
LIC = 61,25 − (0,729 x 15,83) = 49,71
LSC = 61,25 + (0,729 x 15,83) = 72,79
Podemos, para construir o gráfico de controle, construir uma
tabela semelhante à seguinte:
probabilidade_e_estatistica_1582.indb 280 19/07/12 11:13
281
Probabilidade e Estatística
Unidade 6
Tabela 6.8 – Média das amostras
Média das
amostras
LIC LSC Média das
médias
62,50 49,71 72,79 61,25
60,00 49,71 72,79 61,25
67,50 49,71 72,79 61,25
55,00 49,71 72,79 61,25
60,00 49,71 72,79 61,25
62,50 49,71 72,79 61,25
Fonte: Elaboração do autor (2011).
E, seguindo os mesmos passos do exemplo anterior para
construir o gráfico, resulta no nosso gráfico de controle X-r:
Gráfico 6.9 – Gráfico de Controle
Fonte: Elaboração do autor (2011).
probabilidade_e_estatistica_1582.indb 281 19/07/12 11:13282
Universidade do Sul de Santa Catarina
Síntese
O processo de amostragem é muito importante e eficaz no dia
a dia de qualquer profissional. Diariamente, você esbarra com
situações semelhantes às que foram analisadas nesta unidade,
tanto nos meios de comunicação, como rádio, TV, jornais etc.,
mas também em escolas, empresas e outras instituições.
É preciso entender que as pesquisas feitas com base em uma
amostra não culminam com resultados exatos, e poder definir
a margem de erro ocasionada por essa amostragem é um passo
muito importante na formação profissional e acadêmica, além de
possibilitar uma leitura mais realista da realidade.
probabilidade_e_estatistica_1582.indb 282 19/07/12 11:13
283
Probabilidade e Estatística
Unidade 6
Atividades de autoavaliação
1) Uma turma da oitava série realizou avaliação em duas disciplinas,
Matemática e Biologia; as notas obtidas estão na tabela abaixo. Usando
estes dados, calcule o que se pede:
Aluno Nota Matemática Nota Biologia X.Y X2 Y2
1 9,5 3,4 32,3 90,3 11,6
2 9,0 5,4 48,6 81,0 29,2
3 8,5 6,0 51,0 72,3 36,0
4 8,0 6,0 48,0 64,0 36,0
5 8,0 5,0 40,0 64,0 25,0
6 7,5 7,0 52,5 56,3 49,0
7 7,5 9,0 67,5 56,3 81,0
8 6,0 7,5 45,0 36,0 56,3
9 5,0 8,0 40,0 25,0 64,0
10 4,0 8,0 32,0 16,0 64,0
Totais 73,0 65,3 456,9 561,0 452,0
a) Calcule o coeficiente de correlação entre as duas variáveis, identifique o
tipo de correlação e interprete o resultado.
b) Construa uma equação para a relação indicada (a equação da reta de
regressão) para possibilitar o cálculo de estimativas para a nota de
Biologia (Y), segundo a nota de Matemática (X).
c) Estime a nota de Biologia considerando que um aluno tenha tirado nota
6,5 (X) em Matemática. Substitua na equação da reta construída no
item “b”.
probabilidade_e_estatistica_1582.indb 283 19/07/12 11:13
284
Universidade do Sul de Santa Catarina
Saiba mais
Se quiser aprofundar os estudos relativos ao assunto tratado nessa
unidade, pesquise em:
BARBETTA, Pedro Alberto. Estatística aplicada às ciências
sociais. 5. ed. rev. Florianópolis: Ed. UFSC, 2002.
MORETTIN, Luiz Gonzaga. Estatística básica. São Paulo:
Makron Books, 1999.
TRIOLA, Mario F. Introdução à Estatística. Rio de Janeiro:
LTC, 1999.
VIEIRA, Sônia. Introdução à bioestatística. 6. ed. Rio de
Janeiro: Campus, 2000.
probabilidade_e_estatistica_1582.indb 284 19/07/12 11:13
Para concluir o estudo
Muitas vezes nos deparamos com situações em que
temos que lidar com muitos dados e não sabemos como
vamos lidar com eles. Esta disciplina é uma tentativa de
proporcionar ferramentas para os profissionais que lidam
com esse tipo de situação.
Desde a apresentação de relatórios e trabalhos científicos
a pesquisas, controle, testes, projeções e previsões, a
Estatística está sempre presente. Afinal, no dia a dia,
lidamos com uma grande quantidade de informações
e pergunto: De que vale ter tanta informação se não
sabemos o que fazer com elas? Espera-se que todo o
conhecimento que você adquiriu nesta disciplina seja
suporte para as suas análises, opiniões e decisões.
Muito sucesso profissional!
Prof. Luiz Arthur Dornelles Júnior
probabilidade_e_estatistica_1582.indb 285 19/07/12 11:13
probabilidade_e_estatistica_1582.indb 286 19/07/12 11:13
Referências
ACÇÃO LOCAL DE ESTATÍSTICA APLICADA – ALEA. 1999-2010.
Disponível em: <http://alea-estp.ine.pt>. Acesso em: 15 ago. 2010.
ARANGO, Héctor Gustavo. Bioestatística teórica e
computacional. Rio de Janeiro: Guanabara, 2001.
ASSOCIAÇÃO NACIONAL DE ENTIDADES PROMOTORAS DE
EMPREENDIMENTOS INOVADORES - Anprotec. 2008. Disponível
em: <http://www.anprotec.org.br>. Acesso em: 15 ago. 2010.
BANCO CENTRAL DO BRASIL. 2010. Disponível em: <http://www.
bcb.gov.br/>. Acesso em: 15 ago. 2010.
BARBETTA, Pedro Alberto. Estatística aplicada às ciências
sociais. 5. ed. rev. Florianópolis: Ed. UFSC, 2002.
COSTA, Sérgio Francisco. Introdução ilustrada à estatística. 3.
ed. São Paulo: Harbra, 1998.
CRESPO, Antônio Arnot. Estatística fácil. São Paulo: Saraiva,
2001.
DEPARTAMENTO INTERSINDICAL DE ESTATÍSTICA E ESTUDOS
SOCIOECONÔMICOS – DIEESE. 2010. Disponível em: <http://www.
dieese.org.br/>. Acesso em: 3 ago. 2010.
FLEMMING, Diva Marília. Representações gráficas. São José:
Saint Germain, 2003.
FONSECA, Jairo Simon da; MARTINS, Gilberto de Andrade. Curso
de estatística. 6. ed. São Paulo: Atlas, 1996.
INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATÍSTICA – IBGE.
2010. Disponível em: <http://www.ibge.gov.br/>. Acesso em: 3
set. 2010.
ISTOÈ ONLINE. Florianópolis / SC – Caça ao tucano. 2004.
Disponível em: <http://www.terra.com.br/istoe/especiais/
eleicoes_2004/1_rodada/florianopolis.htm. Acesso em: 10 ago
2006.
LEVIN, Jack. Estatística aplicada às ciências humanas. São
Paulo: Habra, 1987.
MORETTIN, Luiz Gonzaga. Estatística básica. São Paulo: Makron
Books, 1999
probabilidade_e_estatistica_1582.indb 287 19/07/12 11:13
288
Universidade do Sul de Santa Catarina
NEUFELD, John L. Estatística aplicada à administração usando excel.
São Paulo: Prentice Hall, 2003.
POPULATION REFERENCE BUREAU. La juventud del mundo 2000.
Washington DC: Population Reference Bureau, 2000. Disponível em:
<http://www.prb.org/SpanishContent.aspx>. Acesso em: 3 março 2011.
PORTAL BRASIL. 2010. Disponível em: <http://www.portalbrasil.net/>.
Acesso em: 3 set. 2010.
RAUEN, Fábio. Roteiro de pesquisa. Rio de Sul: Nova Era, 2006.
SILVA, Ermes Medeiros da. Estatística para os cursos de Economia,
Administração e Ciências Contábeis. São Paulo: Atlas, 1999.
______. Estatística. São Paulo: Atlas, 1996. v.1.
SINDICATO DA HABITAÇÃO – SECOVI/RS. 2010. Disponível em: <http://
www.secovi-rs.com.br/index.asp>. Acesso em: 10 ago. 2010.
SPIEGEL, M. R. Estatística. São Paulo: Makron Books, 1994.
TOLEDO, Geraldo Luciano; OVALLE, Ivo Izidoro. Estatística básica. 2. ed.
São Paulo: Atlas, 1985.
TRIBUNAL SUPERIOR ELEITORAL. 2010. Disponível em: <http://www.tse.
gov.br>. Acesso em: 20 set. 2010.
TRIOLA, Mario F. Introdução à Estatística. Rio de Janeiro: LTC, 1999.
VIEIRA, Sônia. Introdução à bioestatística. 6. ed. Rio de Janeiro: Campus,
2000.
______. Princípios de Estatística. São Paulo: Pioneira, 2003.
WILD, Christopher J. Encontros com o acaso. Rio de Janeiro: LTC, 2004.
probabilidade_e_estatistica_1582.indb 288 19/07/12 11:13
Sobre os professores conteudistas
Luiz Arthur Dornelles Júnior
Graduado em Matemática pela Fundação Universidade
do Rio Grande (FURG). É professor da Universidade
do Sul de Santa Catarina (UNISUL) desde 2000,
onde leciona as disciplinas de Estatística, Métodos
Quantitativos e Programação Linear. Atualmente, está
cursando Especialização em Educação Matemática na
Unisul Virtual.
Gabriel Cremona Parma (2ª edição)
Doutor em Engenharia Civil, na área de Gestão
Territorial pela Universidade Federal de Santa Catarina
(UFSC). Mestre em Engenharia Civil, na área Cadastro
Técnico Multifinalitário pela Universidade Federal de
Santa Catarina (UFSC). Cartógrafo: UNL, Argentina.
Consultor especializado em Geoprocessamento e
Controle de Qualidade de Dados Geoespaciais. Atua
como professor e pesquisador na Universidade do Sul de
Santa Catarina (UNISUL) nos cursos de Engenharia
e Arquitetura e Urbanismo, assim como em projetos
de pesquisa e extensão. Ex-professor na Universidade
Nacional do Litoral (UNL), na Argentina.
probabilidade_e_estatistica_1582.indb 289 19/07/12 11:13
probabilidade_e_estatistica_1582.indb 290 19/07/12 11:13
Respostas e comentários das
atividades de autoavaliação
Unidade 1
1) O censo é uma coleção de dados de uma população,
enquanto que a estimação usa dados de uma amostra para
avaliar um parâmetro (característica descritiva dos elementos
da população).
2) Deve-se escolher elementos com as mesmas características
da população, ou seja, elementos que realmente
representem a população. Aqui, você pode citar exemplos
(escolher clientes de níveis sociais diferentes para estudar
grau de satisfação,escolher amostras de diversos locais
de um lago para análise etc.). Isso é necessário para que
você possa realmente refletir a realidade, sem distorcer ou
conduzir os resultados.
3. Nessa questão, você deve citar exemplos do seu dia a dia, por
exemplo:
Variável Exemplos
Qualitativa nominal Nacionalidade
Qualitativa ordinal Atendimento (ótimo, muito bom, ... , muito ruim.)
Quantitativa discreta Número de filhos
Quantitativa contínua Escore de teste psicológico
probabilidade_e_estatistica_1582.indb 291 19/07/12 11:13
292
Universidade do Sul de Santa Catarina
4) A classificação que você pode fazer é:
� os dados coletados por meio de questionário: primários;
� os dados coletados na Federação: secundários.
5) Observe, no quadro a seguir, a resposta para esta questão.
DESCRIÇÃO DA VARIÁVEL CLASSIFICAÇÃO
Saldo em conta corrente em R$ Quantitativa contínua
Idade do cliente Quantitativa contínua
Sexo do cliente Qualitativa nominal
Classe econômica Qualitativa ordinal
Estado civil Qualitativa nominal
Número de defeitos do produto Quantitativa discreta
Consumo de energia em kWh Quantitativa contínua
Grau de instrução Qualitativa ordinal
Número de filhos Quantitativa discreta
Hierarquia de uma empresa Qualitativa nominal
Número de filhos de uma família Qualitativa nominal
Diâmetro da peça produzida Quantitativa discreta
Comprimento da peça Quantitativa contínua
Tempo de espera em caixa eletrônico em minutos Qualitativa nominal
Nome de país exportador de petróleo Quantitativa contínua
Grau de satisfação no atendimento numa loja comercial Qualitativa nominal
Número de ações negociadas na bolsa de valores Quantitativa contínua
Número de alunos de uma universidade Quantitativa contínua
Altura dos funcionários de uma empresa Qualitativa nominal
6) A classificação que você pode fazer é:
A) série específico-geográfica;
B) série específica.
probabilidade_e_estatistica_1582.indb 292 19/07/12 11:13
293
Probabilidade e Estatística
Unidade 2
1) Montagem da tabela:
Principais motivos de tensão (estresse) Nº de clientes
Morte de um filho 16
Morte do cônjuge 12
Morte dos pais ou irmãos 11
Divórcio 8
Doença grave 7
Demissão 6
2) Montagem da tabela:
Acidentes de trabalho nos últimos 36 meses
Nº de acidentes Número de meses
3 4
4 5
5 9
6 7
7 5
8 6
3) Montagem da tabela:
Renda das famílias de um bairro de classe baixa de Florianópolis
Renda família (R$) Nº de pacientes
112 |---- 115 2
115 |---- 118 6
118 |---- 121 4
121 |---- 124 9
124 |---- 127 8
127 |---- 130 7
probabilidade_e_estatistica_1582.indb 293 19/07/12 11:13
294
Universidade do Sul de Santa Catarina
4) Completando a tabela:
Renda de famílias de um bairro da classe baixa de Florianópolis
Renda
(R$)
Nº de
famílias
fiacd
“abaixo de”
fiaci
“acima de”
fr fp(%) PM
112 |--- 115 2 2 36 0,0556 5,56 113,5
115 |--- 118 6 8 34 0,1667 16,7 116,5
118 |--- 121 4 12 28 0,1111 11,1 119,5
121 |--- 124 9 21 24 0,25 25 122,5
124 |--- 127 8 29 15 0,2222 22,2 125,5
127 |--- 130 7 36 7 0,1944 19,4 128,5
Total (Σfi) 36 1,0 100,0
Respondendo as perguntas:
a) 21 famílias;
b) 29 famílias;
c) 15 famílias;
d) 7 famílias;
e) 11,1% das famílias;
f) 25% das famílias.
5) Completando a tabela:
Número de operários acidentados para cada mês
Número de
acidentados
Nº de
meses
fiacd
“abaixo de”
fiaci
“acima de”
fr fp (%)
3 4 4 36 0,1111 11,1
4 5 9 32 0,1389 13,9
5 9 18 27 0,2500 25
6 7 25 18 0,1944 19,4
7 5 30 11 0,1389 13,9
8 6 36 6 0,1667 16,7
Total (Σfi) 36 1,0 100,0
probabilidade_e_estatistica_1582.indb 294 19/07/12 11:13
295
Probabilidade e Estatística
a) 18 meses;
b) 25 meses;
c) 18 meses;
d) 27 meses;
e) 25% dos meses;
f) 13,89% dos meses.
6) Essa atividade vai depender muito do gráfico escolhido e de sua análise.
Não esqueça de usar as dicas para analisar um gráfico:
� identificar as variáveis expressas pelo gráfico;
� identificar os intervalos em que as variáveis atuam;
� identificar onde a variável que está sendo estudada apresenta
máximo e mínimo;
� identificar se a tendência é de crescimento ou de decrescimento. Em
alguns casos, pode ser bastante difícil realizar essa identificação;
� analisar o comportamento de uma maneira geral, identificando as
alterações mais expressivas;
� outras análises também são possíveis, isso só depende do
observador e, muitas vezes, da variável que estamos estudando.
7) O histograma e o polígono de frequências deverão ser semelhantes ao
seguir:
probabilidade_e_estatistica_1582.indb 295 19/07/12 11:13
296
Universidade do Sul de Santa Catarina
Unidade 3
1) Em primeiro lugar, construa a tabela:
Consumo de bebidas alcoólicas por semana pelos funcionários
Número de dias (xi) Número de funcionários (fi) xi.fi
0 10 0
1 16 16
2 14 28
3 8 24
4 5 20
5 4 20
6 4 24
7 3 21
Total (Σfi) 64 153
Em segundo lugar, calcule a média, dividindo a soma da coluna xi.fi,
pela soma da coluna fi. O resultado é a média:
Interpretação: o número médio de dias de consumo de álcool pelos
funcionários é de 2,39 dias.
2) Usando um processo semelhante ao anterior, em primeiro lugar, você
deve calcular o ponto médio. Em seguida, multiplicar o ponto médio
pela fi de cada linha e escrever o resultado na coluna PM.fi. Some esses
números no final da coluna, conforme a tabela.
Renda de famílias de um bairro de classe baixa de Florianópolis
Renda (R$) Número de famílias PM PM.fi
112 |---- 115 2 113,5 227
115 |---- 118 6 116,5 699
118 |---- 121 4 119,5 478
121 |---- 124 9 122,5 1102,5
124 |---- 127 8 125,5 1004
127 |---- 130 7 128,5 899,5
Total (Σfi) 36 4410
probabilidade_e_estatistica_1582.indb 296 19/07/12 11:13
297
Probabilidade e Estatística
Em segundo lugar, divida o resultado da soma (ΣPM.fi) pelo soma dos
números da coluna fi:
Interpretação: o nível da renda familiar é de 122,5 reais
3)
a) Conjunto 1
Primeiro passo: escrever, na tabela, os dados organizados em ordem
crescente (Rol) e, na linha de baixo, as posições:
12 13 13 15 15 16 17 19 21
1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª 9ª
Segundo passo: calcular a posição, levando em consideração que a
série tem 9 elementos, sendo, assim, ímpar:
Terceiro passo: encontrar, na tabela p, o elemento que ocupa a 5ª
posição:
12 13 13 15 15 16 17 19 21
1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª 9ª
Me = 15 – o tempo de internação mediano é de 15 dias.
Interpretação: 50% dos valores observados são menores ou iguais a
15, e 50% dos valores observados são maiores ou iguais a 15.
b) Conjunto 2
Primeiro passo: escrever, na tabela, os dados organizados em ordem
crescente (Rol) e, na linha de baixo, as posições:
14 14 15 15 16 16 17 18
1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª
Segundo passo: calcular a posição, levando em consideração que a
série tem 8 elementos, sendo, assim, par:
probabilidade_e_estatistica_1582.indb 297 19/07/12 11:13
298
Universidade do Sul de Santa Catarina
A mediana ocupa uma posição entre a 4ª e a 5ª posições.
Terceiro passo: encontrar na tabela os elementos que ocupam as
posições 4ª e 5ª:
14 14 15 15 Me 16 16 17 18
1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª
Elemento da 4ª posição = 15;
Elemento da 5ª posição = 16.
Quarto passo: calcular a media:
Me = 15,5.
Interpretação: 50% dos valores observados são menores ou iguais a
15,5 e 50% dos valores observados são maiores ou iguais a 15,5.
4)
a) Conjunto 1
� Organizando os dados:
1 1 1 1 2 2 2 2 3
5 5 6 6 7 7 7 8 8
A série tem duas modas: Mo1 = 1 e Mo2 = 2.
Interpretação moda 1: O valor mais frequente é 1.
Interpretação moda 2: O valor mais frequente é 2.
b) Conjunto 2
� Organizando os dados:
2 2 2 3 3 3 3 5
5 5 5 6 6 6 8 8
A série tem duas modas: Mo1 = 3 e Mo2 = 5.
Interpretação moda 1: O valor mais frequente é 3.
Interpretação moda 2: O valor mais frequente é 5.
probabilidade_e_estatistica_1582.indb 298 19/07/12 11:13
299
Probabilidade e Estatística
c) Conjunto 3
� Organizando os dados:
1 1 2 2 3 3 4 4
5 5 6 6 7 7 8 8
A série não tem moda, pois não tem nenhum dado que se repitamais
que os outros
Interpretação moda: é uma série amodal, ou seja, não tem valor(es)
mais frequente.
5) Primeiro passo: escrever, na tabela, os dados organizados em ordem
crescente (Rol) e, na linha de baixo, as posições:
2 3 4 4 4 5 5 6 8 8 9 9
1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª 9ª 10ª 11ª 12ª
� Para o terceiro quartil
Segundo passo: calcular a posição. Considerando N = 12:
Ou seja, Q3 está entre a 9ª e a 10ª posições.
Terceiro passo: calcular o terceiro quartil.
Valor que ocupa a 9ª posição = 8;
Valor que ocupa a 10ª posição = 8.
Então, calcule da seguinte forma:
Interpretação:
75% dos dados observados são menores ou iguais a 8, e 25% dos dados
observados são maiores ou iguais a 8.
� Para o nono decil (note que D9 = P90)
Quarto passo: calcular a posição. Considerando N = 12:
Ou seja, D9 está entre a 11ª e a 12ª posições.
probabilidade_e_estatistica_1582.indb 299 19/07/12 11:13
300
Universidade do Sul de Santa Catarina
Quinto passo: calcular o nono decil.
Valor que ocupa a 11ª posição = 9;
Valor que ocupa a 12ª posição = 9.
Então, calcule da seguinte forma:
Interpretação:
90% dos dados observados são menores ou iguais a 9, e 10% dos dados
observados são maiores ou iguais a 9.
� Para o trigésimo quinto percentil
Sexto passo: calcular a posição. Considerando N = 12:
Ou seja, P35 está entre a 4ª e a 5ª posições.
Sétimo passo: calcular o trigésimo quinto percentil.
Valor que ocupa a 4ª posição = 4;
Valor que ocupa a 5ª posição = 4.
Então, calcule da seguinte forma:
Interpretação:
35% dos dados observados são menores ou iguais a 4, e 65% dos dados
observados são maiores ou iguais a 4.
6) Nessa questão, você pode seguir os seguintes passos:
Passo 1: calcular a média:
Obs.: não esqueça que, na média, usamos a letra grega μ para a
população.
probabilidade_e_estatistica_1582.indb 300 19/07/12 11:13
301
Probabilidade e Estatística
Passo 2: calcular os desvios (xi – ):
(x1 – ) = (25 − 28,33)= −3,33
(x2 – ) = (22 − 28,33) = −6,33
(x3 – ) = (36 − 28,33) = 7,67
(x4 – ) = (20 − 28,33) = −8,33
(x5 – ) = (29 − 28,33) = 0,67
(x6 – ) = (38 − 28,33) = 9,67
Passo 3: elevar ao quadrado cada desvio (xi – )2:
(x1 – )2 = (−3,33) 2 = 11,0889
(x2 – )2 = (−6,33) 2 = 40,0689
(x3 – )2 = (7,67) 2 = 58,8289
(x4 – )2 = (−8,33) 2 = 69,3889
(x5 – )2 = (0,67) 2 = 0,4489
(x6 – )2 = (9,67) 2 = 93,5089
Somando todos os resultados, temos 273,3334.
Passo 4: calcular a média dos quadrados dos desvios. Aqui, você vai
calcular para a população (variância):
Variância:
Então σ2(x) = 45,5556
Passo 5: calcular o desvio padrão calculando a raiz da variância:
Desvio padrão:
Interpretação: a variabilidade de tempo de execução do teste é de
6,7495 minutos.
probabilidade_e_estatistica_1582.indb 301 19/07/12 11:13
302
Universidade do Sul de Santa Catarina
7) O modo de calcular é o mesmo da questão anterior, só muda no final,
ao calcular a variância, usamos a fórmula para amostra.
Passo 1: calcular a média:
Obs.: não esqueça que, na média, usamos a xˉ para a amostra.
Passo 2: calcular os desvios (xi – ):
(x1 – ) = (15 – 17,6) = –2,6
(x2 – ) = (10 – 17,6) = –7,6
(x3 – ) = (9 – 17,6) = –8,6
(x4 – ) = (23 – 17,6) = 5,4
(x5 – ) = (31 – 17,6) = 13,4
Passo 3: elevar ao quadrado cada desvio (xi – )2:
(x1 – )2 = (–2,6)2 = 6,76
(x2 – )2 = (–7,6)2 = 57,76
(x3 – )2 = (–8,6) 2 = 73,96
(x4 – )2 = (5,4) 2 = 29,16
(x5 – )2 = (13,4) 2 = 179,56
Somando todos os resultados, temos 347,2.
Passo 4: calcular a média dos quadrados dos desvios. Aqui, você vai
calcular para a amostra (variância):
Variância:
Então, s2 (x) = 86,8.
Passo 5: calcular o desvio padrão calculando a raiz da variância:
Desvio padrão:
Interpretação: a variabilidade dos escores é de 9,32 pontos.
probabilidade_e_estatistica_1582.indb 302 19/07/12 11:13
303
Probabilidade e Estatística
8) O primeiro passo é calcular a média:
No de dias
(xi)
No de func.
(fi) xi.fi (xi – x̄) (xi – x̄)
2 (xi – x̄)
2. fi
0 10 0 –2,39 5,71 57,1
1 16 16 –1,39 1,93 30,88
2 14 28 –0,39 0,15 2,1
3 8 24 0,61 0,37 2,96
4 5 20 1,61 2,59 12,95
5 4 20 2,61 6,81 27,24
6 4 24 3,61 13,03 52,12
7 3 21 4,61 21,25 63,75
Σ 64 153 249,1
1–2,39 = –1,39
0–2,39 = –2,39
(–2,39)2 = 5,71
(–1,39)2 = 1,93
5,71×10 = 57,1
1,93×16 = 30,88
Σfi Σxi.fi
Σ(xi – x̄)
2. fi
Vamos calcular passo a passo
Passo 1: devemos somar a coluna das frequências simples (fi) para
obter Σfi (frequência total):
Σfi = 64
Passo 2: calcular a média: multiplicar cada xi por sua correspondente fi
e escrever na coluna xi.fi; somar os valores calculados e escrever no final
da coluna esse resultado, que é o Σxi.fi:
Σxi.fi = 153
Passo 3: dividir o resultado do passo 2 (Σxi.fi) pelo resultado do
passo 1 (Σfi):
Passo 4: calcular a quarta coluna, (xi – ) subtraindo o xi de cada linha
pela média:
0 – 2,39 = –2,39
1 – 2,39 = –1,39
2 – 2,39 = –0,39
3 – 2,39 = 0,61
4 – 2,39 = 1,61
5 – 2,39 = 2,61
6 – 2,39 = 3,61
7 – 2,39 = 4,61
probabilidade_e_estatistica_1582.indb 303 19/07/12 11:13
304
Universidade do Sul de Santa Catarina
Passo 5: calcular a quinta coluna elevando os valores da quarta ao
quadrado, (xi – )2:
(–2,39)2 = 5,71
(–1,39) 2 = 1,93
(–0,39) 2 = 0,15
(0,61) 2 = 0,37
(1,61) 2 = 2,59
(2,61) 2 = 6,81
(3,61) 2 = 13,03
(4,61) 2 = 21,25
Passo 6: calcular a sexta coluna multiplicando os valores da quinta pela
frequência simples de cada linha, (xi – )2.fi:
5,71×10 = 57,1
1,93×16 = 30,88
0,15×14 = 2,1
0,37×8 = 2,96
2,59×5 = 12,95
6,81×4 = 27,24
13,03×4 = 52,12
21,25×3 = 63,75
Passo 7: somar os valores obtidos na sexta coluna, Σ(xi – )2.fi:
Σ(xi – )2.fi = 249,1
Passo 8: calcular a variância para a amostra:
Passo 9: calcular o desvio padrão:
probabilidade_e_estatistica_1582.indb 304 19/07/12 11:13
305
Probabilidade e Estatística
9) Mais uma vez, vamos calcular passo a passo. Comparando com a anterior,
a diferença está em que aquela era para amostra, enquanto que essa é
para a população. Sugestão: use as colunas para facilitar os cálculos.
Idade dos estudantes da disciplina de métodos estatísticos
Idade (xi) N
o de est.
(fi)
xi.fi (xi – μ) (xi – μ)
2 (xi – μ)
2. fi
17 5 85 -1,873 3,508 17,54
18 20 360 -0,873 0,762 15,24
19 22 418 0,127 0,016 0,352
20 10 200 1,127 1,27 12,7
21 6 126 2,127 4,524 27,144
(Σfi) 63 1189 72,976
18 – 18,873 = –0,873
17 – 18,873 = –1,873
(–1,873)2 = 3,508
(–0,873)2 = 0,762
3,508×5 = 17,54
0,762×20 = 15,24
Σfi Σxi.fi
Σ(xi – x̄)
2. fi
Passo 1: devemos somar a coluna das frequências simples (fi) para
obter Σfi (frequência total):
Σfi = 63
Passo 2: calcular a média: multiplicar cada xi por sua correspondente fi
e escrever na coluna xi.fi; somar os valores calculados e escrever no final
da coluna esse resultado, que é o Σxi.fi:
Σxi.fi = 1189
Passo 3: dividir o resultado do passo 2 (Σxi.fi) pelo resultado do
passo 1 (Σfi):
Passo 4: calcular a quarta coluna, (xi – μ) subtraindo o xi de cada linha
pela média:
17 – 18,873 = –1,873
18 – 18,873 = –0,873
19 – 18,873 = 0,127
20 – 18,873 = 1,127
21 – 18,873 = 2,127
probabilidade_e_estatistica_1582.indb 305 19/07/12 11:13
306
Universidade do Sul de Santa Catarina
Passo 5: calcular a quinta coluna, elevando os valores da quarta ao
quadrado, (xi - μ)
2:
(–1,873)2 = 3,508
(–0,873)2 = 0,762
(0,127) 2 = 0,016
(1,127) 2 = 1,27
(2,127) 2 = 4,524
Passo 6: calcular a sexta coluna, multiplicando os valores da quinta
pela freqüência simples de cada linha, (xi – μ)
2.fi:
3,508×17 = 17,54
0,762×18 = 15,24
0,016×19 = 0,352
1,27×20 = 12,7
4,524×21 = 27,144
Passo 7: somar os valores obtidos na sexta coluna, Σ(xi – μ)
2.fi:
Σ(xi – μ)
2.fi = 72,976
Passo 8: calcular a variância para a amostra:
Passo 9: calcular o desvio padrão:
probabilidade_e_estatistica_1582.indb 306 19/07/12 11:13
307
Probabilidade e Estatística
10) Quando você tiver que calcular o desvio padrão para uma tabela com
intervalos, usamos o mesmo processo, apenas substituindo o xi pelo
ponto médio:Renda de família de um bairro de classe baixa de Florianópolis
Renda (R$)
No de
famílias
(fi)
PMi PMi.fi (PMi – x̄) (PMi – x̄)
2 (PMi – x̄)
2. fi
112 |---- 115 2 113,5 227 -9 81 162
115 |---- 118 6 116,5 699 -6 36 216
118 |---- 121 4 119,5 478 -3 9 36
121 |---- 124 9 122,5 1102,5 0 0 0
124 |---- 127 8 125,5 1004 3 9 72
127 |---- 130 7 128,5 899,5 6 36 252
Total (Σfi) 36 4410 738
116,5 – 122,5 = –9
113,5 – 122,5 = –6
(–9)2 = 81
(–6)2 = 36
81×2 = 162
36×6 = 216
Σfi ΣPMi.fi
Σ(PMi – x̄)
2. fi
Vamos calcular passo a passo
Passo 1: somar a coluna das frequências simples (fi) para obter Σfi
(frequência total):
Σfi = 36
Passo 2: cálculo da média: calcular o ponto médio de cada intervalo
e multiplicar cada PM por sua correspondente fi e escrever na coluna
PM.fi, somar os valores calculados nessa coluna e escrever o total. Esse
resultado é o ΣPM.fi:
ΣPM.fi = 4410
Passo 3: dividir o resultado (ΣPM.fi) pelo resultado do Passo 1 (Σfi):
Passo 4: calcular a quinta coluna, (PMi – ¯ ) subtraindo o PMi de cada
linha pela média:
113,5 – 122,5 = –9
116,5 – 122,5 = –6
119,5 – 122,5 = –3
122,5 – 122,5 = 0
125,5 – 122,5 = 3
128,5 – 122,5 = 6
probabilidade_e_estatistica_1582.indb 307 19/07/12 11:13
308
Universidade do Sul de Santa Catarina
Passo 5: calcular a sexta coluna, elevando os valores da quinta ao
quadrado, (PMi – )
2:
(–9)2 = 81
(–6)2 = 36
(–3)2 = 9
(0)2 = 0
(3)2 = 9
(6)2 = 36
Passo 6: calcular a sétima coluna, multiplicando os valores da sexta
pela frequência simples de cada linha, (PMi – )
2.fi:
81×2 = 162
36×6 = 216
9×4 = 36
0×9 = 0
9×8 = 72
36×7 = 252
Passo 7: somar os valores obtidos na sexta coluna, Σ(PMi – )
2.fi:
Σ(PMi – )
2.fi = 738
Passo 8: calcular a variância:
Passo 9: calcular o desvio padrão:
11)
11.1)
a) A mais dispersa em termos absolutos é a série B (maior desvio padrão).
probabilidade_e_estatistica_1582.indb 308 19/07/12 11:13
309
Probabilidade e Estatística
b) Você tem que calcular o coeficiente de variação.
� Para a série A:
� Para a série B:
A série com maior dispersão relativa é a série A (maior coeficiente de
variação).
c) Concluindo, a série mais dispersa é a série A.
11.2)
a) A mais dispersa em termos absolutos é a série B (maior desvio padrão).
b) Você tem que calcular o coeficiente de variação.
� Para a série A:
� Para a série B:
As duas séries apresentam o mesmo valor para os coeficientes de
variação.
c) Concluindo, as duas séries apresentam a mesma dispersão.
11.3)
a) Em termos absolutos, as duas séries apresentam a mesma dispersão
(desvios iguais).
b) Você tem que calcular o coeficiente de variação.
� Para a série A:
probabilidade_e_estatistica_1582.indb 309 19/07/12 11:13
310
Universidade do Sul de Santa Catarina
� Para a série B:
A série com maior dispersão relativa é a série B (maior coeficiente de
variação).
c) Concluindo, a série mais dispersa é a série B.
11.4)
a) A mais dispersa em termos absolutos é a série A (maior desvio padrão).
b) Você tem que calcular o coeficiente de variação.
� Para a série A:
� Para a série B:
A série com maior dispersão relativa é a série B (maior coeficiente de
variação).
c) Concluindo, a série mais dispersa é a série B.
probabilidade_e_estatistica_1582.indb 310 19/07/12 11:13
311
Probabilidade e Estatística
12) Passo 1: abra uma nova planilha Excel e, na célula A1, escreva: gráfico
box-plot, digite todos os números dos dados na coluna A de uma nova
planilha do Excel, a partir da fila 2 e, no intervalo C3:C8, escreva os
textos indicados na figura seguinte:
Passo 2: agora, vamos calcular a mediana, quartis, máximos e mínimos
usando as fórmulas do Excel. Para isso, digite as seguintes fórmulas:
� Em D4: =MED(A2:A21) para calcular a mediana do intervalo de dados
A2:A21.
� Em D5: =QUARTIL(A2:A21;1) para calcular o 1° quartil dos dados.
� Em D6: =MÍNIMO(A2:A21) para calcular o mínimo valor do conjunto
de dados;
� Em D7: =MÁXIMO(A2:A21) para calcular o máximo dos dados.
� Em D8: =QUARTIL(A2:A21;3) para calcular o 3° quartil da
amostragem.
probabilidade_e_estatistica_1582.indb 311 19/07/12 11:13
312
Universidade do Sul de Santa Catarina
O resultado será:
Passo 3: crie o gráfico, acompanhando o exemplo desenvolvido na
teoria desta seção, até obter o gráfico box-plot dos dados, semelhante
ao seguinte:
-
probabilidade_e_estatistica_1582.indb 312 19/07/12 11:13
313
Probabilidade e Estatística
Unidade 4
1)
Passo 1: para começar, você deve identificar o evento e o espaço
amostral:
A: jovens sofriam com o autoritarismo dos pais
S: adolescentes
Passo 2: identificar o número de elementos do evento e do espaço
amostral:
n(A) = 675
n(S) = 1500
Passo 3: calcular usando a fórmula:
0,45 ou 45%
2)
Passo 1: Para começar, você deve identificar os eventos e o espaço
amostral:
A: casado(a)
B: solteiro(a)
C: divorciado(a)
S: total pesquisado
Passo 2: identificar o número de elementos dos eventos e do espaço
amostral:
n(A) = 267.867
n(B) = 333.974
n(C) = 16.779
n(S) = 665.541
Passo 3: calcular usando a fórmula:
0,4025 ou 40,25%
probabilidade_e_estatistica_1582.indb 313 19/07/12 11:13
314
Universidade do Sul de Santa Catarina
0,5018 ou 50,18%
0,0252 ou 2,52%
3)
a) Qual a frequência relativa para o número de reações positivas para cada
cobaia?
Passo 1: identificar o numerador e o denominador da fórmula, para
cada experimento.
� Cobaia 1:
Número de reações positivas = 1215;
número total de tentativas = 4500.
� Cobaia 2:
Número de reações positivas = 1050;
número total de tentativas = 3500.
Passo 2: usar a fórmula da freqüência relativa.
FrA = número de vezes que ocorreu A
número total de observações
FrA =
1215
0,27 ou 27%
4500
FrB = número de vezes que ocorreu B
número total de observações
FrB = 1050 0,3 ou 30%
3500
b) Desafio: qual dos dois estímulos você considera mais eficaz? Por quê?
O estímulo por alimentação, pois a cobaia 2, em termos relativos,
apresentou melhor resposta. Embora o número de reações da cobaia
1 tenha sido maior comparando com o total (frequência relativa), a
reação é menor.
probabilidade_e_estatistica_1582.indb 314 19/07/12 11:13
315
Probabilidade e Estatística
4)
a) Calcule Z (variável padronizada) para x = 116, x = 136, para x = 131 e
para x = 141 pontos;
Passo 1: identificar todos os elementos que compõe o problema:
a média: μ = 126;
o desvio padrão: σ(x) = 10;
os limites do intervalo: X = 116; X = 136; X = 131; X = 141.
Passo 2: calcular a variável padronizada Z:
� Para X = 116:
Z = −1
� Para X = 136:
Z = 1
� Para X = 131:
Z = 0,5
� Para X = 141:
Z = 1,5
probabilidade_e_estatistica_1582.indb 315 19/07/12 11:13
316
Universidade do Sul de Santa Catarina
b) Qual a probabilidade de escolher uma pessoa com escore maior que
136 pontos?
Passo 1: identificar, no gráfico, o intervalo e a área que você deve
calcular (usar o z calculado no item anterior, para x = 136, o z = 1):
Passo 2: procurar na tabela a área correspondente a z = 1 (não esqueça,
a área dada na tabela é sempre entre 0 e z):
Z = 1 → Área = 0,3413
Passo 3: calcular a probabilidade.
A área dada na tabela é de 0 a Z (0,3413), mas o intervalo solicitado é de
136 para cima. Nesse caso, você deve subtrair de 0,5 (total de área de
um lado da curva) o valor encontrado (0,3413), então:
P(x > 136) = 0,5 – 0,3413 = 0,1587 ou 15,87%
c) Qual a probabilidade de escolher uma pessoa com escore entre 126 e
131 pontos? Note que 126 é a média. Esse fica mais fácil.
Passo 1: identificar, no gráfico, o intervalo e a área que você deve
calcular (usar o z calculado no item anterior, para x = 131, o z = 0,5):
probabilidade_e_estatistica_1582.indb 316 19/07/12 11:13
317
Probabilidade e Estatística
Passo 2: procurar na tabela a área correspondente à z = 0,5 (não
esqueça, a área dada na tabela é sempre entre 0 e z)
Z = 0,5 → Área = 0,1915
Passo 3: calcular a probabilidade.
A área dada na tabela é de 0 a Z (0,1915),e o intervalo solicitado é entre
0 e Z, então, você já tem o resultado:
P(126 < x < 131) = 0,1915 ou 19,15%
d) Qual a probabilidade de escolher uma pessoa com escore entre 116 e
141 pontos?
Passo 1: identificar no gráfico o intervalo e a área que você deve
calcular (usar os valores de z calculados no item anterior, para x=116, o
z=-1 e para x=141, o z=1,5):
Passo 2: procurar, na tabela, a área correspondente à z1 = –1 e z2 = 1,5
(não esqueça, a área dada na tabela é sempre entre 0 e z):
Z1 = –1 → Área = 0,3413 (não esqueça que a curva é simétrica, e o sinal
só indica de que lado está a área).
Z2 = 1,5 → Área = 0, 4332
Passo 3: calcular a probabilidade.
A área solicitada é a soma das duas áreas, a correspondente à Z1 (0,3413)
e a correspondente à Z2 (0,4332), então:
P(116 < x < 141) = 0,3413 + 0,4332 = 0,7745 ou 77,45%
probabilidade_e_estatistica_1582.indb 317 19/07/12 11:13
318
Universidade do Sul de Santa Catarina
Unidade 5
1)
a) Estudo socioeconômico com estudantes da Unisul.
Passo 1: identificar os elementos da fórmula:
n0 = tamanho aproximado da amostra;
E = erro amostral tolerável = 0,03;
N = tamanho da população = 5600.
Passo 2: usar a fórmula:
n0 = 1111,11 → arredondando, temos 1111 pessoas.
Um tamanho aproximado para a amostra seria de 1111 pessoas. Observe
que o pesquisador teve acesso à informação de que a população seria de
5600 pessoas, então você deve passar para o passo seguinte:
Passo 3: calcular o tamanho da amostra usando a população com a
seguinte fórmula:
Arredondando, seriam 927 pessoas.
b) Estudo com famílias do bairro Rio Vermelho, em Florianópolis.
Passo 1: identificar os elementos da fórmula:
n0 = tamanho aproximado da amostra;
E = erro amostral tolerável = 0,04;
N = tamanho da população = 9400.
Passo 2: usar a fórmula:
n0 = 625 crianças.
Um tamanho aproximado para a amostra seria de 625 crianças. Observe
que o pesquisador teve acesso à informação de que a população seria
de 9400 crianças, então você deve passar para o passo seguinte:
probabilidade_e_estatistica_1582.indb 318 19/07/12 11:13
319
Probabilidade e Estatística
Passo 3: calcular o tamanho da amostra usando a população com a
seguinte fórmula:
Arredondando, seriam 586 crianças.
c) Estudo com adolescentes com Teste de Sondagem Intelectual (TSI).
Passo 1: identificar os elementos da fórmula:
n0 = tamanho aproximado da amostra;
E = erro amostral tolerável = 0,05;
N = tamanho da população = 400.
Passo 2: usar a fórmula:
n0 = 400 adolescentes.
Um tamanho aproximado para a amostra seria de 400 adolescentes.
Observe que o pesquisador teve acesso à informação de que a
população seria de 400 adolescentes, então você deve passar para o
passo seguinte:
Passo 3: calcular o tamanho da amostra usando a população com a
seguinte fórmula:
Seriam 200 adolescentes.
Você pode resolver os outros itens da mesma maneira que os três já
calculados, o processo é o mesmo. As respostas estão abaixo:
d) Estudo da fecundidade na cidade de Florianópolis.
n0 = 278.
n = 277.
e) Estudo com usuários de drogas adolescentes de uma escola.
n0 = 123.
n = 83.
f) Estudo sobre analfabetismo no bairro do Rio Tavares, em Florianópolis.
n0 = 123.
probabilidade_e_estatistica_1582.indb 319 19/07/12 11:13
320
Universidade do Sul de Santa Catarina
n = 118.
g) Estudo do índice de massa corporal dos estudantes da Unisul.
n0 = 400.
n = 364.
h) Pesquisa de intenções de voto no Brasil.
n0 = 2500.
n = 2500.
2)
Passo 1: Como já foi indicado o percentual de eleitores que votam no
candidato, só falta calcular o percentual dos eleitores que não votam no
candidato ( ).
Você pode deixar na forma decimal, pois, para calcular o erro, é usado
desta forma.
Passo 2: Calcular e procurar o z na tabela (o z é igual ao encontrado no
exemplo 2, no final da seção 1).
Dividir o NC por dois. Para isto, sempre usar o valor do nível de
confiança na forma decimal, ou seja, dividir por 100:
Passo 3: procurar este valor na tabela e encontrar o z correspondente.
Este valor é referente à área entre zero e z, então ele está localizado na
região central da tabela. Veja a figura a seguir:
probabilidade_e_estatistica_1582.indb 320 19/07/12 11:13
321
Probabilidade e Estatística
Encontrando a área, é só seguir a coluna na qual o valor se encontra até
a primeira linha. Note que o valor se encontra entre 0,4495 e 0,4505 e,
sendo assim, na primeira linha, você deve usar o valor entre 0,04 e 0,05
como se fosse um ponto médio ficando, assim, 0,045. Seguindo a linha
até a primeira coluna, você encontra o valor 1,6. Juntando ou somando
os dois, você encontra o valor 1,645 para z, ou seja, z = 1,645.
Passo 4: discriminar cada elemento da fórmula de cálculo do erro e
calcular o
Em que:
e = erro da estimativa;
z = 1,645 (calculado e encontrado no passo 2);
= 26,4% ou (percentual da amostra de eleitores que
votam no candidato);
probabilidade_e_estatistica_1582.indb 321 19/07/12 11:13
322
Universidade do Sul de Santa Catarina
(percentual da amostra dos eleitores que não
votam no candidato);
n = 700 (tamanho da amostra).
Cálculo do erro:
= 1,645.
Passo 5: calcular o intervalo da estimativa:
Neste passo, o cálculo pode ser na forma percentual ou decimal.
P(0,2366 < p < 0,2914) = 0,90 ou
P(23,66 < p < 29,14) = 90%
3)
Passo 1: como não foi indicado o percentual de professores da amostra
que tem graduação completa, você deve, em primeiro lugar, calcular
este percentual:
n = 300 (tamanho da amostra);
X = 240 (número de professores com graduação);
Cálculo do percentual:
= 1 – 0,8 = 0,2
Você pode deixar na forma decimal, pois, para calcular o erro, é usado
desta forma.
Passo 2: calcular e procurar o z na tabela.
Dividir o NC por dois. Para isto, sempre usar o valor do nível de
confiança na forma decimal, ou seja, dividir por 100:
probabilidade_e_estatistica_1582.indb 322 19/07/12 11:13
323
Probabilidade e Estatística
Passo 3: procurar este valor na tabela e encontrar o z correspondente.
Este valor é referente à área entre zero e z, então ele está localizado na
região central da tabela. Veja a figura abaixo:
Encontrando a área, é só seguir a coluna na qual o valor se encontra
até a primeira linha; encontrando o número 0,06 é só seguir a linha até
a primeira coluna, encontrando o valor 1,9. Juntando ou somando os
dois, você encontra o valor 1,96 para z, ou seja, z = 1,96.
Passo 4: discriminar cada elemento da fórmula de cálculo do erro e
calcular o mesmo:
Em que:
e = erro da estimativa;
z = 1,96 (calculado e encontrado no passo 2);
= 80% ou (percentual da amostra de eleitores que votam
no candidato);
= 1 – 0,8 = 0,2 (percentual da amostra dos eleitores que não votam no
candidato);
n = 300 (tamanho da amostra).
probabilidade_e_estatistica_1582.indb 323 19/07/12 11:13
324
Universidade do Sul de Santa Catarina
Cálculo do erro:
= 1,96.
Passo 5: calcular o intervalo da estimativa:
P(0,7547 < p < 0,8452) = 0,95 ou
P(75,47 < p < 84,52) = 95%
4)
Passo 1: calcular e procurar o z na tabela (o z é igual ao encontrado no
exemplo 1, no final da seção 1).
Dividir o NC por dois. Para isto, sempre usar o valor do nível de
confiança na forma decimal, ou seja, dividir por 100:
Passo 2: procurar este valor na tabela e encontrar o z correspondente.
Este valor é referente à área entre zero e z, então ele está localizado na
região central da tabela. Veja a figura a seguir:
probabilidade_e_estatistica_1582.indb 324 19/07/12 11:13
325
Probabilidade e Estatística
Encontrando a área, é só seguir a coluna na qual o valor se encontra até
a primeira linha; encontrando o número 0,06, deve-se seguir a linha até
a primeira coluna e encontrar o valor 1,9. Juntando ou somando os dois,
você encontra o valor 1,96 para z, ou seja, z=1,96.
Passo 5: discriminar cada elemento da fórmula de cálculo do erro e
calculá-lo:
Em que:
e = o que você quer calcular (erro da estimativa);
z = 1,96 (calculado e encontradono passo 2);
S(x) = 3,4 (desvio padrão da amostra);
n = 250 (tamanho da amostra).
Cálculo do erro:
Observação importante: não é necessário multiplicar por 100, pois
este resultado não indica percentual, neste caso, ele indica quilos!
Passo 4: calcular o intervalo da estimativa:
probabilidade_e_estatistica_1582.indb 325 19/07/12 11:13
326
Universidade do Sul de Santa Catarina
5) Passo 1: calcular e procurar o z na tabela (o z é igual ao encontrado no
exemplo 1, no final da seção 1).
Dividir o NC por dois. Para isto, sempre usar o valor do nível de
confiança na forma decimal, ou seja, dividir por 100:
Passo 2: procurar este valor na tabela e encontrar o z correspondente.
Este valor é referente à área entre zero e z, então ele está localizado na
região central da tabela. Veja a seguinte figura:
Encontrando a área, é só seguir a coluna na qual o valor se encontra até
a primeira linha; encontrando o número 0,06, deve-se seguir a linha até
a primeira coluna, encontrando o valor 1,9. Juntando ou somando os
dois, você encontra o valor 1,96 para z, ou seja, z=2,33.
Passo 3: discriminar cada elemento da fórmula de cálculo do erro e
calculá-lo:
Em que:
e = o que você quer calcular (erro da estimativa);
z = 2,33 (calculado e encontrado no passo 2);
probabilidade_e_estatistica_1582.indb 326 19/07/12 11:13
327
Probabilidade e Estatística
S(x) = 31,4 (desvio padrão da amostra);
n = 1000 (tamanho da amostra).
Cálculo do erro:
Observação importante: não é necessário multiplicar por 100, pois
este resultado não indica percentual, neste caso indica reais!
Passo 4: calcular o intervalo da estimativa:
P(147,6791 < μ < 152,3209) = 0,98
6)
Passo 1:
Cálculo dos graus de liberdade para definição do ponto crítico (PC):
GLn = 3 – 1 = 2 (graus de liberdade do numerador, 3 máquinas = K);
GLm = 18 – 3 = 15 (graus de liberdade do denominador, 18 = 5 peças na
máquina 1 + 7 peças da máquina 2 + 6 peças da máquina 3 = N).
Agora, procurando na tabela de F para 5% de nível de significância,
entrando na coluna da esquerda com GLm = 15 e na fila superior com
GLn=4, resulta: F (5%,2,15) = 3,68 = PC
probabilidade_e_estatistica_1582.indb 327 19/07/12 11:13
328
Universidade do Sul de Santa Catarina
E, para as amostras recolhidas, tem-se que:
E o valor observado de F resulta em:
Então, ao nível de significância de 0.05 (95% de nível de confiança),
rejeita-se a hipótese H de igualdade de médias de produção, pois o valor
observado da estatística de teste F é maior que o ponto crítico PC =
10,9174.
probabilidade_e_estatistica_1582.indb 328 19/07/12 11:13
329
Probabilidade e Estatística
Há, portanto, evidência estatística de que as três máquinas não são
iguais relativamente ao volume médio de produção.
Em outras palavras: a marca da máquina influencia significativamente a
quantidade de peças fabricada por ela.
A tabela ANOVA resulta nos seguintes valores:
Unidade 6
1)
a) Passo 1: como as colunas já estão calculadas, você pode começar
identificando os elementos da fórmula:
n =10 (número de alunos);
∑x = 73;
∑y = 65,3;
∑x.y = 456,9;
∑x2 = 561;
∑y2 = 456,9;
probabilidade_e_estatistica_1582.indb 329 19/07/12 11:13
330
Universidade do Sul de Santa Catarina
Passo 2: calcule o coeficiente de correlação utilizando a fórmula vista
no passo anterior:
rxy = –0,73842
Passo 3: analisando o resultado, você pode classificar e interpretar
contextualizando-o na situação descrita.
Classificação: a correlação entre as notas de Matemática e Biologia
pode ser classificada como negativa forte.
Como interpretar?
O coeficiente de correlação resultou em um número negativo e
próximo de 1 (r = –0,73842), sendo assim, a correlação entre as notas de
Matemática e Biologia é negativa (significativa), ou seja, quanto maior a
nota em Matemática, menor será a nota em Biologia, e quanto menor a
nota em Matemática, maior será a nota em Biologia.
b) Passo 1: para a equação da reta, conforme mostrada abaixo, você pode
começar calculando a inclinação da reta (a):
Equação da reta de regressão → = b+a.X
Inclinação da reta (a):
Agora, identifique os elementos da fórmula:
n = 10 (número de alunos);
∑x = 73;
∑y = 65,3;
∑x.y = 456,9;
∑x2 = 561;
probabilidade_e_estatistica_1582.indb 330 19/07/12 11:13
331
Probabilidade e Estatística
Se você escrever na fórmula, terá:
a = –0,70427
Passo 2: calcule a intersecção com o eixo y (b):
Intersecção do eixo y (b)
Identifique os elementos da fórmula:
n = 10 (número de alunos);
∑x = 73;
∑y = 65,3;
a = –0,70427.
b = –11,671171.
Passo 3: construa a equação da reta de regressão:
Após calcular a e b, tem-se:
a = –0,70427
b = –11,671171
= b + a.X
= 11,671171 – 0,70427.X
probabilidade_e_estatistica_1582.indb 331 19/07/12 11:13
332
Universidade do Sul de Santa Catarina
c) Para calcular a estimativa, você necessita de um valor para X que é dado
no item c), ou seja, X = 6,5. Para estimar a nota de Biologia, você precisa
de uma nota de Matemática. Observe o seguinte procedimento:
X = 6,5
= 11,671171 − 0,70427.X
= 11,671171 − 0,70427.(6,5)
= 11,671171 − 4,577755
= 7,09
Interpretação: se um aluno tirar 6,5 em Matemática, possivelmente ele
tirará em torno de 7,09 na nota de Biologia.
probabilidade_e_estatistica_1582.indb 332 19/07/12 11:13
Anexos
probabilidade_e_estatistica_1582.indb 333 19/07/12 11:13
probabilidade_e_estatistica_1582.indb 334 19/07/12 11:13
Biblioteca Virtual
Veja a seguir os serviços oferecidos pela Biblioteca Virtual aos
alunos a distância:
� Pesquisa a publicações on-line
<www.unisul.br/textocompleto>
� Acesso a bases de dados assinadas
<www.unisul.br/bdassinadas>
� Acesso a bases de dados gratuitas selecionadas
<www.unisul.br/bdgratuitas >
� Acesso a jornais e revistas on-line
<www.unisul.br/periodicos>
� Empréstimo de livros
<www.unisul.br/emprestimos>
� Escaneamento de parte de obra*
Acesse a página da Biblioteca Virtual da Unisul, disponível no EVA,
e explore seus recursos digitais.
Qualquer dúvida escreva para: bv@unisul.br
* Se você optar por escaneamento de parte do livro, será lhe enviado o
sumário da obra para que você possa escolher quais capítulos deseja solicitar
a reprodução. Lembrando que para não ferir a Lei dos direitos autorais (Lei
9610/98) pode-se reproduzir até 10% do total de páginas do livro.
probabilidade_e_estatistica_1582.indb 335 19/07/12 11:13
http://www.unisul.br/textocompleto
http://www.unisul.br/textocompleto
http://www. unisul.br/bdassinadas
http://www.unisul.br/bdgratuitas
http://www.unisul.br/bdgratuitas
http://www. unisul.br/periodicos
http://www. unisul.br/periodicos
http://www. unisul.br/emprestimos
http://www. unisul.br/emprestimos
mailto:bv%40unisul.br?subject=
probabilidade_e_estatistica_1582.indb 336 19/07/12 11:13
C
M
Y
CM
MY
CY
CMY
K
capa_curvas.pdf 1 19/07/12 10:57
Apresentação
Palavras do professor
Plano de estudo
Introdução à Estatística
Distribuição de frequências e representação gráfica
Medidas de posição e dispersão
Cálculo e distribuição de probabilidades
Amostragem e cálculo de estimativa
Regressão linear e gráficos de controle
Para concluir o estudo
Referências
Sobre os professores conteudistas
Respostas e comentários das
atividades de autoavaliação
Anexos
Biblioteca Virtual