Prévia do material em texto
PROBABILIDADE E ESTATÍSTICA
Me. Eng. Claudio Ferreira de Carvalho
GUIA DA
DISCIPLINA
1 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
1. Interpretações e representações numéricas
1.1. Objetivo
Esta aula tem como objetivo apresentar alguns conceitos básicos de representações
e manipulação numérica que serão necessários para o desenvolvimento deste curso de
estatística.
1.2. Introdução
A interpretação correta dos dados assim como os conceitos de porcentagem1, ordem
de grandeza, aproximação e representação numérica, são de fundamental importância para
o entendimento e análises estatísticas, portando, este primeiro capítulo será dedicado ao
entendimento destes conceitos que serão largamente utilizados nas demais aulas deste
curso.
1.3. Variações percentuais
Valores numéricos para preços de mercadorias, podem variar ao longo do tempo. A
título de introdução, vamos supor que a evolução do preço de um prato em um restaurante
é apresentada a seguir:
Analisando os dados é possível fazer algumas
observações:
Está certo falar que aumentou R$ 6,00 em seis
meses. Sim esta conclusão está correta.
Está certo falar que o aumento foi de R$ 1,00 por
mês? Não, esta conclusão, não está correta.
Estas observações mostram que não podemos
tirar conclusões precipitadas. É possível concluir que: se aumentou R$ 6,00 em seis meses
o aumento médio foi de R$ 1,00 por mês, porém, não está correto afirmar que a cada mês
o valor aumentou de R$ 1,00.
1 Tanto pode ser uti l izado o termo porcentagem como percentagem.
2 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
Este é um excelente exemplo de que “análises numéricas” devem ser feitas
cuidadosamente.
Observando os dados mais atentamente, é possível obter mais algumas conclusões:
O aumento não foi uniforme;
Entre janeiro e fevereiro e entre maio e junho o aumento foi de R$ 2,00;
Entre abril e maio, não houve aumento.
Um gráfico também pode ajudar a visualizar como se comportaram os dados.
Podemos, então acrescentar mais obsecrações tais como:
Entre os meses de janeiro e junho
houve um aumento;
Entre os meses de janeiro e
fevereiro o aumento foi maior que
entre os meses de março e abril;
O preço entre dois meses nunca
diminuiu;
Entre os meses de abril e maio, não
houve aumento.
Outras observações, mesmo que pareçam simples, podem ser feitas. Estas
observações, sem dúvida ajudarão entender o mundo da “análise de dados”.
1.4. Variação Percentual
Um dado que pode nos ajudar a analisar valores é a variação percentual que pode
resultar em um “Aumento Percentual” ou um “Desconto Percentual”.
Um Aumento Percentual acontece quando o valor final é acrescido de uma parte
do valor inicial, portanto, o valor final é maior que o inicial.
Um Desconto Percentual acontece quando o valor final é decrescido de uma parte
do valor inicial, portanto, o valor final é menor que o inicial.
3 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
Para obter a Variação Percentual utiliza-se a seguinte fórmula:
Aplicando-se a equação acima em alguns valores podemos entender os conceitos
de Aumento percentual e Desconto percentual.
1.5. Aumento percentual – Variações positivas
Voltando a tabela apresentada no início desta aula, podemos calcular as variações
percentuais mês a mês, e como os pratos sempre aumentaram, exceto entre os meses de
abril e maio quando não houve aumento, notaremos que sempre tivemos Aumentos
percentuais, consequentemente, os valores forma sempre positivos.
As variações percentuais foram as seguintes:
Janeiro e fevereiro foi 8,0%;
Fevereiro e março foi 3,7%;
Março e abril foi 3,6%;
Abril e maio foi 0;
Maio e junho foi 6,9%
4 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
É importante observar que, todas das variações percentuais apresentadas forma
aumentos percentuais visto que os valores dos “Aumentos percentuais” 8,0%. 3.7%, 3,6%,
6,9% são valores positivos:
Pode-se observar também, que é possível obter a “Variação Percentual” entre dois
valores quaisquer como por exemplo a variação percentual entre os seis meses foi de 24%.
A seguir, algumas observações que podemos fazer sobre os aumentos percentuais
apresentados:
Os mesmos aumentos em moeda, não resultam obrigatoriamente nos mesmos
aumentos percentuais, pois eles dependem não só da diferença entre o valor
final e o valor inicial, mas também do valor inicial que é o denominador da
equação chamado por alguns livros de “valor de base”.
O aumento de R$ 1,00 resultou em 3,7% entre fevereiro e março, mas somente
3,6% entre março e abril.
O aumento de R$ 2,00 resultou em 8,0% entre janeiro e fevereiro, mas somente
6,9% entre maio e junho.
1.6. Desconto percentual – Variações negativas
Os Descontos percentuais são muito comuns em lojas ou outros estabelecimentos
comerciais, quando os valores são oferecidos com descontos. A seguir, são apresentados
dois exemplos de mercadorias em lojas que possuíam um valor, mas estão sendo
colocados em promoção com valores menores.
Analisando os valores podemos observar que como as variações percentuais são
negativas o que está acontecendo é um desconto percentual.
5 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
Podemos também fazer outras observações como: O desconto de R$ 10,00, resultou
em um desconto percentual de -8,3% sobre o valor de (R$120,00) mas em um desconto
percentual de -5,0% sobre o valor (R$ 200,00)
1.7. Estudo do aumento percentual
Nos itens anteriores, foram calculados os aumentos percentuais (e descontos
percentuais) entre dois valores, mas é também comum que se deseje saber, como ficará
um determinado valor, por exemplo o preço da gasolina, o preço de um alimento etc. se ele
sofrer um aumento de um determinado percentual.
Para calcular qual será o valor acrescido de um aumento deve-se utilizar a equação:
Alguns exemplos:
1.8. Estudo do desconto percentual
Pode acontecer também, que um determinado produto, esteja com um
“desconto percentual”. Neste caso, o valor final, que será o valor com desconto, é calculado
pela fórmula.
Veja alguns exemplos:
6 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
1.9. Casas decimais – casas após a vírgula
Existem números inteiros e números fracionários. Números fracionários são aqueles
compostos por uma parte inteira e uma parte decimal.
Um número com casas decimais é interpretado conforme a seguir:
Dependendo do número ou mesmo da grandeza que se está representando, o
número de casas após a vírgula pode variar:
Exemplos:
Valores monetários => duas casas após a vírgula => R$ 3,20
Altura de pessoas em metros => duas casas após a vírgula => 1,70 m
Altura de pessoas em centímetros => sem casas após a vírgula => 170 cm
Temperaturas ambientes => uma casa após a vírgula => 16,5ºC
Quantidade de líquido em garrafas de refrigerante => sem casas após a vírgula
=> 350 ml
1.10. Arredondamento
Caso o número que se deseje representar esteja com mais casas do que é tradicional
este deve ser arredondado:
7 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
As regras de arredondamento são as seguintes:
a) Determine com quantas casas decimais deseja apresentar o número
b) Observe o primeiro número a partir do qual se deseja desprezar.
c) Se o número a ser desprezado for maior ou igual a 5 ao último número que fica
é aumentado uma unidade.
d) Se o número aser desprezado for menor que 5 o último número que fica não é
alterado.
Exemplos: (Arredondando para 2 casas após a virgula:
6,1247 ≈ 6,12
6,1257 ≈ 6,13
6,1287 ≈ 6,13
1.10.1. Quando utilizar arredondamento
Sempre que necessário os números devem ser arredondados, apenas como
exemplo, basta lembrar que no cálculo (29-28).100/28 (variação de um prato apresentado
entre os meses de março e abril no início desta aula), o resultado da conta foi 3,571428...
(e o número continua...).
Como para todos os demais cálculos de aumentos percentuais, estávamos utilizando
somente uma casa após a vírgula (uma casa decimal), para manter o mesmo critério, o
resultado desta conta foi apresentado como 3,6.
Por que 3,6 e não 3,5? Porque o valor apresentado foi arredondado antes de ser
apresentado, usando as regras acima ou seja, como o número que está sendo abandonado
é 7, ao último algarismo que ficou (5), foi acrescentado uma unidade.
Outros exemplos:
6,1247 ≈ 6,12 => Como foi abandonado o 4 o valor 2 foi preservado
6,1257 ≈ 6,13 => Como foi abandonado o 5 o valor 2 foi alterado para 3
6,1287 ≈ 6,13 => Como foi abandonado o 8 o valor 2 foi alterado para 3
8 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
1.10.2. Critério de arredondamento de médias da Universidade
Um caso particular de arredondamento é o utilizado pelo “Sistema de notas da
Universidade”.
Neste sistema, as notas devem ser expressas com uma casa decimal, porém,
esta casa decimal só pode ser 0 ou 5, então são aceitas as notas 0,0 – 0,5 – 1,0 – 1,5 –
2,0 – 2,5 – 3,0 – 3,5 e assim sucessivamente até 9,5 – 10,0.
Portanto os valores entre os decimais 0 e 5 precisam ser arredondados. Para
entender esta regra de arredondamento, que deve ser dar para apenas uma casa
decimal e ela só pode ser 0 ou 5
Antes de efetuar o arredondamento, é sempre importante lembrar que um número
pode possuir partes inteiras partes decimais, centesimais e milésimas, então:
Quando se escreve um número como 4,3 devemos entendê-lo como: 4 inteiros 3
décimos
Quando se escreve um número como 4,32 devemos entendê-lo como 4 inteiros e 32
centésimos.
Quando se escreve um número como 4,324 devemos entendê-lo como 4 inteiros e
324 milésimos.
O arredondamento, feito pelo sistema da Universidade é executado sempre
eliminando a casa centesimal e mantendo a casa decimal, com as seguintes regras:
Frações centesimais entre 0,01 e 0,24 são arredondadas para 0,0
Frações centesimais entre 0,25 e 0,74 são arredondadas para 0,5
Frações centesimais entre 0,75 e 0,99 são arredondadas para 1,0
Exemplo:
Caso uma “Média da Disciplina” esteja entre 6,51 e 6,74, ela será arredondada para
6,5 e caso ela esteja entre 6,75 e 6,99 ela será arredondada para 7,0
9 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
1.11. Notação científica
Imagine que houve um desvio de dinheiro e o valor foi de R$ 1.500.000.000,00.
Olhando somente para o número, fica difícil imaginar o valor, mas se o número for lido
como 1 Bilhão e meio de reais, já fica mais fácil visualizar a quantia. Por outro lado, se
alguém falar que o tamanho de uma molécula de DNA é 0,0024 m você talvez tenha
dificuldades de assimilar, mas se falarem que é 2,4 mm provavelmente seja mais fácil de
imaginar o tamanho da molécula.
Na verdade, o número de zeros após o 1 do valor monetário mostrado (R$
1.500.000.000,00) , assim como o número de zeros antes do 2 do tamanho da molécula de
DNA (0,0024 m) dão ao número o que se convenciona chamar de “Ordem de grandeza” e
os valores 1,5 (no caso do valor monetário) ou 2,4 (no caso do tamanho do DNA) são os
valores.
Para facilitar a escrita e a leitura de números grandes ou pequenos, muitas vezes
eles são escritos na forma de potência de 10 que consiste em representar o número por
dois fatores, sendo eles:
Um número de 1 a 9 (com ou sem casas decimais).
Multiplicado pelo número 10 elevado a um expoente. Conforme a seguir
Esta notação também é chamada de notação em potência de 10 ou notação de
engenharia, por isso é normalmente obtido nas calculadoras a partir da tecla EE.
Quando as calculadoras estão mostrando em seus displays números em potências
de 10, o 10 é representado pela letra E e o expoente é representado por um valor após o
sinal + (para potências positivas, números maiores que 10) ou o sinal – (para potências
negativas, valores menores que 1. Ficando a notação conforme exemplo abaixo:
10 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
160000 = 1,6 . 105 = 1,6 E+5
0,000598 = 0,598 . 10-4 = 0,598 E-4
1.11.1 Como representar um número para Potência de 10
Para representar um número maior que 10 na forma de potência de 10 basta:
Colocar a vírgula após o primeiro algarismo significativo.
Multiplicar o número por 10 elevado ao número de casas que a vírgula foi
movimentada para a esquerda.
Exemplos:
Para representar um número menor que 1 na forma de potência de 10 basta:
Colocar a vírgula após o primeiro algarismo significativo.
Multiplicar o número por 10 elevado a menos o número de casas que a vírgula
foi movimentada para a direita.
Exemplos:
1.11.2. Prefixos e Notações
Para facilitar a leitura e a representações de números muito grandes ou muito
pequenos pode-se utilizar os prefixos conforme tabela a seguir:
11 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
Veja alguns detalhes desta tabela
Quilo (k = 103), que equivale a mil, é um prefixo muito utilizado no nosso dia a dia:
Quilogramo (1000 gramos), Quilometro (1000 m).
Mega (M = 106), que equivale a Milhão, também é muito utilizado: Moeda (R$ 1
milhão de reais), Velocidade de conexão internet (100 Mbps - Megabits por segundo).
Palavras como microcomputador, microprocessador de alimentos são modos
figurativos para indicar coisas pequenas, como pequenos computadores
(microcomputador), microprocessador de alimentos (aparelhos que cortam alimentos em
tamanhos muito pequenos). Estes nomes derivam do símbolo micro, assim como
nanotecnologia que é utilizada para se referir à fabricação de chips de computadores.
12 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
2. Noções de Estatística – Coleta de Dados – Variáveis
2.1. Objetivo:
Apresentar os conceitos de Estatística Descritiva e Estatística Indutiva assim como
as definições básicas necessárias para o desenvolvimento desta e das próximas aulas.
2.2. Introdução:
Sem dúvida, existem diversas definições para Estatística. Uma das que melhor se
enquadra aos objetivos de nosso curso é a seguinte:
Estatística é uma metodologia de análise de números dando a eles significados.
Com a estatística, é possível dar sentido a conjuntos de dados, pois, muitas vezes
diversos valores são observados, mas não se consegue estabelecer uma relação entre eles
ou até, sem uma análise mais detalhada, pode-se vir a interpretar estes números
erroneamente.
Nos dias de hoje, existem diversos algoritmos computacionais que acabam sendo
utilizados indiscriminadamente em técnicas de Ciências de Dados, sendo que, muitos
acabam confiando cegamente nos resultados apresentados por estes algoritmos, sem,
muitas vezes, uma perfeita compreensão do funcionamento e, o que pode ser mais grave,
sem que os critérios para a obtenção dos dados tenham sido corretamente analisados e
implementados.
2.3. Estatística Descritiva x Estatística Indutiva
Dependendo dos elementos aos quais são aplicados os estudos, sendo eles
amostras ou população, conceitos estes que serão apresentados a seguir, a estatística,
pode ser classificada como:
Estatísticadescritiva é empregada para caracterizar a amostra evidenciando
suas principais características e propriedades.
Estatística indutiva, também chamada de inferencial, são métodos e técnicas
utilizados para estudar uma população baseando-se em amostras destas populações.
13 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
Em resumo, podemos dizer que a estatística descritiva descreve dados e a indutiva
toma decisões sobre a população, a partir de estudos em amostras.
2.4. Dados
São informações obtidas a partir de medições de grandezas, resultados de
pesquisas, respostas a questionários, contagens em geral e outros métodos.
2.5. População estatística
São todos os elementos que possuem as características que desejamos
estudar.
2.6. Amostra
É um subconjunto finito de uma população estatística. Em outras palavras,
uma parte da população, escolhida a partir de uma técnica de amostragem.
2.7. Amostra significativa
Uma amostra significativa, deve representar em
escala reduzida, todas as características qualitativas e
quantitativas do universo que se pretende reproduzir.
2.8. Amostragem
Técnica utilizada para recolher amostras que garante, tanto quanto possível, o acaso
na escolha.
Para que uma amostragem seja correta, cada elemento da população deve ter a
mesma chance de ser escolhida, e com isto, a amostra assume a característica de
representatividade, de maneira que as conclusões sobre a amostra possam realmente
representar a população.
14 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
População estatística são todos os elementos que possuem a característica em
estudo, enquanto, uma amostra é uma parte destes elementos da população, mas para que
a amostra seja significativa, todos os elementos precisam ter as mesmas chances de serem
sorteados, para isto, existem as técnicas de amostragem que garantem a
representatividade da amostra.
2.9. Técnicas de amostragem
É sempre importante observar que durante uma amostragem deve-se tomar
cuidados para evitar viés. Um viés pode ser ideológico como muitas vezes observamos por
institutos de pesquisa tendenciosos, mas, pode ser também causado por descuidos ou falta
de critérios no momento da amostragem (escolha da amostra).
Uma amostragem pode ser basicamente:
Aleatória, também chamada de probabilística.
Não Aleatória (também chamada de não probabilística). Dentro destas duas
categorias existem diversas subcategorias. Um estudo estatístico mais
detalhado ficaria a cargo de profissionais da área, entretanto, para este estudo
serão feitas, a seguir, algumas considerações importantes:
2.9.1. Amostragem Aleatória
Neste tipo de amostragem, todos os elementos têm a mesma probabilidade de serem
escolhidos. Exemplos típicos são sorteios entre os candidatos, tal como um bingo onde
cada participante possui um número ou um conjunto de números
2.9.2. Amostragem não aleatória
Neste tipo de amostragem a escolha dos participantes é feita de forma seletiva. Esta
escolha pode ser feita devido a particularidades do grupo em estudo, atendendo aos
interesses do investigador. Este tipo de amostragem pode ser útil em alguns casos. Existem
diversas maneiras de utilizar amostragens não aleatórias, dentre elas:
Amostragem não aleatória voluntária. Este tipo de amostragem é aquele em que
se disponibiliza uma pesquisa (por exemplo com um link em Internet) e se solicita que os
interessados acessem a pesquisa e a respondam. Neste caso corremos o risco de
15 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
resultados com viés, visto que, pode acontecer de interessados em determinados tópicos
da pesquisa se mobilizem e consigam muito mais participantes que outros. Este é o caso
de muitas pesquisas em redes sociais onde um grupo disponibiliza o link para seus
seguidores ou mesmo é facilitado o acesso a estes seguidores e com isto se tem uma
amostra de pessoas que tem afinidade com as ideias de seus mentores. Pesquisas que
aparecem constantemente no Facebook solicitando a concordância ou não com uma
determinada lei ou com a opinião de algum político, são exemplos de pesquisa voluntária.
Amostragem não aleatória por conveniência. Este tipo de amostragem é aquele
que o pesquisador disponibiliza a pesquisa somente para aqueles que ele deseja. Exemplos
típicos são as pesquisas de satisfação criadas por lojas, atendimentos telefônicos etc.
Nestas pesquisas somente os clientes ou alguns dos clientes são escolhidos.
Os diagramas abaixo representam as amostragens citadas
2.10. Coleta de dados
São maneiras escolhidas para adquirir
informações, que pode ser feita através de registros
como: nascimentos; casamentos; etc., ou através
de questionários coletados pelo pesquisador.
16 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
2.11. Crítica de dados
São considerações sobre os dados que devem ser feitas para evitar erros grosseiros.
2.12. Variáveis
São conjuntos de resultados de uma possível ocorrência. Como exemplo
podemos citar a cor de um objeto, que pode possui diversos resultados possíveis.
2.12.1. Variáveis qualitativas
São informações não numéricas, normalmente atributos classificados em
categorias:
Exemplos: Tipos sanguíneos (A, B, AB ou O)
Cor dos olhos (azuis, verdes, castanhos etc.)
Variáveis qualitativas nominais
Quando os valores são classificados em
categorias ou classes, não ordenadas.
Exemplo: Caso em uma pesquisa se deseje saber
o tipo sanguíneo, ela será uma variável nominal, pois não
pode ser ordenada, as respostas poderiam ser: A, B, AB
ou O, e não existe uma ordem para afirmar que sangue
tipo A é maior ou menor que B e assim sucessivamente.
Variáveis qualitativas ordinais
Quando os valores são ou podem ser ordenados.
Exemplo: Caso em uma pesquisa, se deseje saber a escolaridade dos participantes,
as respostas poderiam ser: sem escolaridade, com ensino fundamental, com ensino médio,
com ensino superior ou pós-graduado. É importante observar, que neste caso uma pessoa
com ensino médio tem mais escolaridade que uma com ensino fundamental, uma pessoa
com ensino superior tem mais escolaridade que uma com ensino médio e assim
sucessivamente.
17 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
2.12.2. Variáveis quantitativas
São informações que assumem valores numéricos, obtidos a partir de medições
ou constatações.
Variáveis quantitativas contínuas
Podem assumir valores entre dois limites, normalmente são
números fracionários, mas podem até ser números inteiros.
Exemplos: Pesos, estaturas, renda, distância,
comprimento etc.
Variáveis quantitativas discretas
Só podem assumir valores pertencentes a um conjunto específico de valores, não
são números facionários.
Exemplos: Alunos em uma sala, filhos de uma família, bolsas em um estoque etc.
18 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
3. Distribuição de frequência
3.1. Objetivo:
Apresentar elementos básicos para cálculos estatísticos a partir de elementos
obtidos com as técnicas discutidas nas aulas anteriores.
3.2. Introdução:
Esta aula apresenta inicialmente, classes, intervalo de classes, que são os primeiros
elementos necessários para criar tabelas de distribuição de frequência, em seguida discute
a montagem de tabelas de distribuição de frequência para variáveis contínuas com seus
principais itens. É também apresentado o conceito e a montagem de Histogramas
3.3. Organização de dados
Quando dados são obtidos através das amostragens discutidas anteriormente, eles
não veem organizados poisestão misturados, portanto, não apresentam obrigatoriamente
uma ordem ou sequência, motivo pelo qual, torna-se muito difícil a visualização assim como
a obtenção de conclusões. Estes dados que classificados como dados brutos e se forem
fornecidos em tabelas estas são chamadas de tabelas primitivas.
19 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
3.3.1. Rol
Normalmente para que dados possam ser analisados eles precisam ser ordenados,
esta ordenação, colocando os dados em ordem (crescente, decrescente ou outra
classificação), irá gerar uma tabela que recebe o nome de Rol.
Para entender os conceitos de tabele primitiva e Rol, o exempla a seguir apresenta
as notas obtidas por alunos em uma prova. Esta é uma tabela primitiva
Para facilitar o estudo o professor pode colocar as notas em ordem, obtendo assim
o que chamamos de Rol
3.4. Distribuição de Frequência
O exemplo fornecido anteriormente representa variáveis contínuas, visto que a
diversificação dos valores é grande, e os valores são fornecidos entre dois limites. Para
analisar esta quantidade de valores, adota-se a Distribuição de Frequência que utiliza os
conceitos definidos a seguir neste item. Estes valores normalmente são fracionários, mas
podem também ser inteiros
20 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
3.4.1. Classe
Dados organizados em um Rol analisados através de uma técnica chamada de
“Distribuição de Frequência”, que consiste em agrupar os dados em intervalos:
Os intervalos de agrupamentos dão origem à Classes sendo que estas Classes
possuem “intervalos de valores” (vão de um valor inicial a um final) e estes intervalos são
chamados de Intervalos de Classe
No exemplo da Ron apresentada no item anterior temos 50 valores, portanto n = 50.
3.4.2. Número de Classes
Para determinar o número de classes em uma distribuição utiliza-se a equação:
𝑖 = √𝑛
2
Onde:
𝑖 é o número de classes em um Rol
𝑛 é a quantidade de dados da amostra
No exemplo da Ron anterior o intervalo de classes será:
3.4.3. Amplitude do intervalo de classe
É obtido pela equação:
ℎ =
𝐿𝑚á𝑥 − 𝐿𝑚𝑖𝑛
𝑖
Onde:
ℎ é a amplitude do intervalo de classe
𝐿𝑚á𝑥é o maior valor do Rol
𝐿𝑚𝑖𝑛 é o menor valor do Rol
𝑖 é o número de classes
21 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
No exemplo da Ron anterior o intervalo de classes será:
3.4.4. Frequência de classe
É o número de ocorrências de cada valor em um intervalo de classe. É
representada por Fi
Para obter o valor de Fi normalmente se monta a tabela com os valores do número
de classes (i) e determina-se qual o valor inicial e final de cada uma das classes. Em
seguida, conta-se quantos valores tem cada uma das classes, considerando a cada classe
como iniciando no valor inicial e terminando uma unidade antes do valor final (Em
matemática, esse procedimento é chamado de intervalo fechado no valor inicial e aberto no
valor final). A tabela referente à Rol do item anterior, ficará conforme a seguir:
3.4.5. Ponto médio da classe
É a média entre o valor máximo e o valor mínimo de um intervalo de classe
𝑥𝑖 =
𝐿𝑖 + 𝐿𝑠
2
Onde:
𝑥𝑖 é o ponto médio da classe
𝐿𝑖 é o limite inferior da classe
22 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
𝐿𝑠 é o limite superior da classe
A tabela com os Pontos Médios das classes referente à Rol do item anterior, ficará
conforme a seguir:
O cálculo para obter o ponto médio da primeira classe foi o seguinte:
Os demais pontos médios foram obtidos utilizando a mesma fórmula
23 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
3.4.6. Frequência acumulada
É a frequência total acumulada até determinada classe, na verdade a soma das
frequências de todas as classes anteriores até a classe atual. É representada por Fa
A tabela com as frequências acumuladas das classes referente à Rol do item
anterior, ficará conforme a seguir:
Para a primeira classe, a frequência acumulada é igual a frequência desta classe e
para as demais classes foi obtida conforme apresentado abaixo para a segunda classe:
24 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
3.4.7. Frequência relativa
É o quociente entre a frequência absoluta da classe em estudo e a soma das
frequências absolutas (frequência de todas as classes):
𝐹𝑟 =
𝐹𝑖
∑ 𝐹𝑖
Onde:
𝐹𝑟 é a frequência acumulada
𝐹𝑖 é a frequência da classe em estudo
∑ 𝐹𝑖 é a somatória de todas as frequências
A tabela com as frequências relativas das classes referente à Rol do item anterior,
ficará conforme a seguir:
A frequência relativa para a Rol fornecida no item anterior foi obtida conforme
apresentado abaixo:
25 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
3.4.8. Frequência relativa acumulada
É a soma da frequência relativa da classe em estudo com as frequências
acumuladas das classes anteriores.
Esta frequência pode também ser representada em percentagem, bastando para isto
multiplicar o valor por 100.
As frequências relativas acumuladas, assim como as frequências relativas
acumuladas em percentagem para Rol fornecida anteriormente são representadas na
tabela abaixo:
Aa frequências relativas acumuladas para a Rol fornecida no item anterior foi obtida
conforme apresentado abaixo:
26 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
Para obter as frequências relativas acumuladas, basta multiplicar os valores das
frequências acumuladas relativas por 100 e representar com o símbolo de percentagem.
27 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
4. Gráficos
4.1. Objetivo
Apresentar os principais gráficos utilizados não só em estatística como no dia a dia
de qualquer atividade empresarial, de pesquisa ou mesmo educacional
4.2. Introdução
Nesta aula, será discutido como visualizar e de como os dados são lançados em
diferentes tipos de gráficos, assim como a utilização do gráfico correto para cada uma das
atividades, sendo este tópico de fundamental importância na apresentação correta e clara
dos resultados.
4.3. O que é um gráfico
É uma forma de apresentar dados, que tem dentre os seus objetivos visualizações
alternativas para pesquisadores e para o público em geral.
Muitas vezes, a utilização de gráficos apresenta-se como uma excelente alternativa
a tabelas, ou mesmo à simples visualização de dados, por este motivo, sempre que
possível, deve-se prever a construção de gráficos alternativamente a tabelas tanto em
relatórios como em arquivo de dados.
4.4. Algumas regras gerais
4.4.1. Normas IBGE
Segundo a nova revisão das normas IBGE, tabelas e gráficos devem ser formatados
conforme o texto “Normas Editoriais e de Formatação de Trabalhos”, que podem ser
obtidas em http://www.ibge.gov.br/confest_e_confege/normas.htm (acessado em
21/01/2024), transcrito abaixo.
Tabelas e Gráficos devem ser inseridos no texto como figura e com a seguinte
formatação:
Centralizados na página;
http://www.ibge.gov.br/confest_e_confege/normas.htm
28 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
A fonte de letrana tabela deve ser no mínimo de tamanho 10 pt e no máximo de 12
pt ; divida a tabela em duas ou mais, se não couber na página;
Para títulos, utilize o estilo: Tabela # seguida do título da tabela/gráfico (centralizado
e negrito);
A fonte dos dados deve ser indicada, alinhando o texto descritivo com a margem
esquerda da Tabela/Gráfico;
Procure evitar grades laterais nas células das tabelas.
4.4.2. Normas ABNT
Estas normas também indicam que o título deve estar acima enquanto a fonte e
outras citações devem ficar abaixo.
4.5. Tipos de gráficos mais comuns
Muitos tipos de gráficos podem ser utilizados para representar os mais diversos
conjuntos de dados e principalmente, com o advento de softwares como o Microsoft Excel,
a diversidade destes gráficos é imensa. Neste item serão apresentados os principais e mais
utilizado, portanto, os que devem ser escolhidos na grande maioria das utilizações.
Entretanto, o mais importante das explicações a seguir está no fato de utilizar o
gráfico correto para representar o fenômeno que pretendemos apresentar, portanto, é
importante que seja observado atentamente como escolher o gráfico em cada condição de
29 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
maneira que seu leitor possa aproveitar da melhor maneira possível o gráfico que foi fruto
de seu trabalho.
Os gráficos que serão apresentados são:
Gráfico de linhas.
Gráfico de colunas.
Gráfico de barras.
30 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
Gráfico de dispersão.
Gráfico de setores.
Histograma
4.6. Gráfico de linha ou em curva
São compostos de dois eixos, um eixo vertical (convencionalmente nomeado de y),
também chamado de eixo dos valores e um eixo horizontal (convencionalmente nomeado
de x), também chamado de eixo das categorias.
31 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
Em aplicativos como o Excel, o eixo das categorias apresenta sempre um incremento
constante, portanto, gráficos que cujos valores do eixo x não sofrem sempre o mesmo
incremento, não devem ser construídos no Excel utilizando a opção de “Gráficos de linha”.
Caso se deseje construir gráficos cujos valores do eixo x não tem um acréscimo
uniforme, tais como gráficos de equações matemáticas, deve utilizar no Excel os “Gráficos
de dispersão”.
Os gráficos de linha, são normalmente utilizados para apresentar valores que variam
a longo do tempo, tais como dias da semana, meses do ano, anos etc. Podem ser utilizados
também para apresentar variações de valores entre estágios subsequentes como
representados nas figuras a seguir:
4.6.1. Exemplo
Representar em um gráfico de linhas as estaturas de alunos em uma sala de aula,
com distribuição de frequências conforme tabela:
32 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
Lançando os valores de Fi no eixo y e os valores do ponto médio das classes no eixo
x, teremos a gráfico abaixo.
4.7. Gráfico de colunas
São montados com eixos da mesma maneira que explicados nos gráficos de linha.
A diferença está somente na construção do conteúdo, que ao invés de ser uma linha
contínua ligando os pontos, são colunas traçadas verticalmente desde o eixo x até os
valores máximos determinados.
Sua utilização também é semelhante ao dos gráficos de linha, portanto muito
propícios para representar variações ao longo do tempo ou variações de valores entre
estágios subsequentes, como representados a seguir.
33 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
4.7.1. Exemplo
Representar em um gráfico de colunas a frequência de alunos em um curso de
acordo com os dias da semana:
Lançando os valores de Fi no eixo y e os dias da semana no eixo x, teremos a gráfico
abaixo.
4.8. Gráfico de barras
São compostos de dois eixos, um eixo horizontal (convencionalmente nomeado de
x), também chamado de eixo dos valores e um eixo vertical (convencionalmente nomeado
de y), também chamado de eixo das categorias.
Observe que, as construções dos gráficos de barras são semelhantes às dos gráficos
de colunas, entretanto os eixos x e y tem funções invertidas, ou seja, no gráfico de barras
34 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
o eixo que recebe os valores é o eixo x e o eixo que recebe as categorias é o eixo y. Então,
este tipo de gráfico deve receber no eixo y propriedades de elementos, enquanto que os
valores destas propriedades serão lançados no eixo x.
É importante que este tipo de gráfico não seja utilizado para representar variações
ao longo do tempo.
Em aplicativos como o Excel, o eixo das categorias apresenta sempre um incremento
constante, portanto, gráficos que cujos valores do eixo y não sofrem sempre o mesmo
incremento, não devem ser construídos no Excel utilizando a opção de “Gráficos de barras”.
Os dois exemplos a seguir são gráficos que mostram times de futebol ou graus de
instruções no eixo y, enquanto que seus valores estão no eixo x.
4.8.1. Exemplo
Representar em um gráfico de barras a distribuição de frequências da escolaridade
de funcionários de uma instituição.
35 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
Lançando os valores de Fi no eixo x e os graus de instrução no eixo y, teremos a
gráfico abaixo.
4.9. Gráfico de dispersão
São gráficos utilizados para representar curvas matemáticas. Normalmente
utilizados em ciências como física e química. Estes gráficos diferenciam-se dos gráficos de
linha pelo fato dos valores do eixo x não serem acrescidos de incrementos constante,
motivo pelo qual podem representar curvas ou mesmo outros tipos de equações como
exponenciais, logarítmicas etc. A figura abaixo apresenta o exemplo de uma curva de
espaço em função do tempo para um MRUV
36 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
4.9.1. Exemplo
Elaborar o gráfico do logaritmo a função y = log (x) com x variando de 1 a 15
4.10. Gráfico de setores
São utilizados para representar partes de um todo, ou seja, quando você tem um
todo, por exemplo uma população e sabe que parte dela é formada por crianças, outra parte
por jovens, outra por adultos e uma última por pessoas da terceira idade você pode utilizar
um gráfico de setores para mostrar qual a parcela de cada uma destas categorias no total
da população.
Devido ao seu aspecto, muitos chamam estes gráficos de setores de gráficos de
pizza.
Os dois exemplos a seguir são excelentes para representar gráficos de setores.
37 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
4.10.1. Exemplo
O mesmo exemplo anterior, no caso graus de instruções de uma instituição pode
muito bem ser representado por um gráfico de setores, conforme mostrado neste exemplo.
38 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
4.11. Histograma
Histograma, é um gráfico que tem o mesmo formato e modo de construção que um
gráfico de colunas, a única diferença é que as colunas ficam justapostas.
Histogramas são utilizados para representar diversos tipos de dados, inclusive dados
estatísticos. Existem diversos tipos de histograma, taiscomo “histogramas de frequências”,
“histogramas de frequências acumuladas” dentre outros.
39 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
4.11.1. Construção de Histogramas
Em Histogramas os valores do eixo vertical (eixo y) são as frequências, frequências
acumuladas, frequências relativas etc. enquanto que no eixo horizontal (eixo x), são os
pontos médios das classes quando se utilizam variáveis quantitativas contínuas
(possuem intervalo de classe) ou os valores das classes quando se utiliza variáveis
quantitativas discretas (sem intervalo de classe).
O gráfico a seguir representa um histograma de frequências de alturas de pessoas.
40 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
5. Média Aritmética
5.1. Objetivo
Nesta aula serão apresentados os conceitos de média, com exemplos de aplicações
em dados agrupados e não agrupados.
5.2. Introdução:
Além dos cálculos apresentados no item anterior, é importante também obter valores
de média, (que é o objetivo desta aula), moda e mediana (que serão vistos na próxima
aula), que apresentam dados sobre a amostragem que podem ser utilizados com diversos
objetivos.
É importante observar que os tratamentos e as fórmulas são diferentes para:
Dados não agrupados.
Dados agrupados sem intervalo de classe.
Dados agrupados com intervalo de classe.
5.3. Média Aritmética de dados não agrupados
Quando os dados não são agrupados, a média é o quociente da divisão entre a soma
dos valores das variáreis de uma distribuição, pelo número de variáveis que compõe esta
distribuição. A média aritmética é considerada uma medida de tendência central, visto que,
focaliza valores centrais entre conjuntos de valores.
A média aritmética é obtida pela equação:
Onde:
�̅� =
∑ 𝑥𝑖
𝑛
41 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
A média aritmética é a medida de posição que possui maior estabilidade, deve ser
utilizada quando houver necessidade de um tratamento algébrico ulterior
5.3.1. Exemplo de média aritmética de dados não agrupados
Sabemos que as idades de 7 crianças que no momento estão em um parque são:
10, 14, 13, 15, 16, 18 e 12 anos. Qual a idade média destas crianças?
5.4. Média aritmética de dados agrupados
Quando os dados são agrupados, as frequências de classe são indicadores de
intensidade, ou seja, elas indicam a quantidade de vezes que cada um dos valores da
distribuição acontece, portanto, elas funcionam como fatores de ponderação, então, a
média aritmética é obtida pela equação:
Onde:
Se os dados estiverem agrupados em intervalos de classe, para somatória dos
valores, utiliza-se a somatória dos pontos médios das classes.
�̅� =
∑ 𝑥
𝑖
𝑛
�̅� =
10+14+13+15+16+18+12
7
�̅� =
98
7
�̅� = 14
42 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
5.4.1. Exemplo de dados agrupados sem intervalo de classe
Um professor construiu a tabela abaixo com a distribuição de frequência dos meninos
em grupos de alunos para um trabalho. Qual a média de meninos por grupo?
5.4.2. Exemplo de dados agrupados com intervalo de classe
Um treinador mediu a altura de seus jogadores e montou a tabela abaixo. Qual a
estatura média dos jogadores?
Observando a tabela temos:
A resposta é 2 meninos por grupo
Cálculo da média aritmética:
43 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
Obs: Para obter xi foi considerado o ponto médio de cada intervalo de classe dos
valores das alturas dos alunos.
Observando a tabela temos:
Cálculo da média aritmética:
A resposta é a altura média dos alunos é 161 cm
44 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
6. Moda e Mediana
6.1. Objetivo
Nesta aula serão apresentados os conceitos de moda e mediana, com exemplos de
aplicações em dados agrupados e não agrupados.
6.2. Introdução:
Moda e mediana também são elementos muito importantes nos cálculos estatísticos,
portanto devem ser estudados cuidadosamente. É Importante lembrar que assim como a
média estudada anteriormente, a Moda e a Mediana, são medidas de tendência central.
É importante observar que, assim como nos cálculos da Média, Moda e Mediana
tem diferentes tratamentos e as fórmulas para dados não agrupados e dados
agrupados em intervalões de classe
É importante salientar também que como no caso da média, tanto a Moda como
a Mediana também tem interpretações e cálculos diferentes para:
Dados não agrupados.
Dados agrupados sem intervalo de classe.
Dados agrupados com intervalo de classe.
6.3. Moda de dados não agrupados
Moda é o valor que ocorre com maior frequência em uma série de valores. Se
tomarmos como exemplo notas de uma prova ou de uma disciplina, a moda será a nota
obtida pela maioria dos alunos.
Podem existir grupos de valores nos quais nenhum valor aparece mais de uma vez,
então, podemos afirmar que esta série de valores é amodal, assim como, podem existir
grupos com mais de um valor sendo repetido o mesmo número de vezes, estas distribuições
são chamadas de bimodais (duas modas), trimodais (3 modas) e assim por diante.
45 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
6.3.1. Exemplo de moda de dados não agrupados
Em um jogo de basquete, anotou o número de cestas que cada jogador acertou em
três turmas. Quais as modas de acertos dos alunos em cada uma das turmas.
Turma A: 7, 8, 9, 10, 10, 10, 11, 12, 12, 15.
Turma B: 3, 5, 8, 10, 12, 13, 15.
Turma C: 2, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9.
Respostas:
Turma A: 7, 8, 9, 10, 10, 10, 11, 12, 12, 15 => Moda da Turma A: 10.
Turma B: 3, 5, 8, 10, 12, 13, 15. => Turma B não tem moda é amodal.
Turma C: 2, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9. => Turma C é Bimodal: 4 e 7.
6.4. Moda de dados agrupados
Quando os dados estão agrupados a moda, corresponde ao valor de maior
frequência. Caso os dados estejam agrupados com intervalo de classe, a moda será o
ponto médio da classe de maior frequência.
6.4.1. Exemplo: moda com dados agrupados sem intervalo de classe
Utilizando o mesmo exemplo do professor que construiu uma tabela com a
distribuição de frequência dos meninos em grupos de alunos para um trabalho. Qual a moda
de meninos por grupo?
Solução:
Conforme definição, a moda é o valor da classe de maior frequência. Como a maior
frequência é 12, a moda será 3.
A resposta moda = 3
46 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
6.4.2. Exemplo: moda com dados agrupados com intervalo de classe
No mesmo exemplo anterior, no qual o treinador montou a tabela com a estatura
média dos jogadores, calcular a moda.
Solução:
Conforme definição, a moda será o ponto médio da classe com maior frequência.
Como a classe com maior frequência é a classe 3 (frequência 11), podemos afirmar que a
moda será o ponto central da classe 3 que é:
6.5. Mediana de dados não agrupados
Em um conjunto de valores ordenados, a mediana é o valor situado de tal forma que
os subconjuntos antes e depois do valor da mediana são iguais. Caso a quantidade de
valores do conjunto seja um número ímpar, a mediana será a média entre os dois valores
centrais.
6.5.1. Exemplo com número ímpar de valores
Determine a mediana do seguinte conjunto de valores:2, 5, 6, 9,10,13,15,16,18.
A resposta moda = 166
47 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
Solução: Como existem 9 valores, portanto um número ímpar de valores, basta
separar 4 valores de cada lado e a mediana será o valor central.
6.5.2. Exemplo com número par de valores
Determine a mediana do seguinte conjunto de valores: 2, 6, 7, 10, 12, 13, 18, 19.
Solução: Como existem 8 valores, portanto um número par de valores, basta separar
3 valores de cada lado e a mediana será a média dos dois valores centrais.
A mediana será a média entre 10 e 12, portanto
6.6. Mediana de dados agrupados sem intervalo de classe
Quando os dados são agrupados sem intervalo de classe, o cálculo é feito da
seguinte maneira:
a) Calcula-se a frequência acumulada da distribuição: = ∑ 𝑓𝑖
A resposta a mediana = 166
A resposta a mediana = 11
48 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
b) Divide-se o número total de elementos da distribuição por 2: =
∑ 𝑓𝑖
2
c) Procura-se a menor frequência acumulada que supera o valor obtido anteriormente.
d) A mediana será o valor desta classe:
6.6.1. Exemplo: mediana com dados agrupados sem intervalo de classe
Utilizando o mesmo exemplo do professor que construiu uma tabela com a
distribuição de frequência dos meninos em grupos de alunos para um trabalho. Qual a
mediana de meninos por grupo?
Solução:
Incluir na tabela a coluna de frequência acumulada.
Dividir o número total de elementos por 2
Procurar o menor valor de frequência acumulada que supera 17, que é o valor 18.
A mediana será o valor da classe de frequência acumulada 18 que é 2.
A resposta a mediana = 2
49 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
6.7. Mediana de dados agrupados com intervalo de classe
Quando os dados são agrupados com intervalo de classe, o cálculo é feito de
maneira semelhante ao do item anterior, porém, o valor da mediana é obtido através de
uma equação e não por simples observação de valor. O procedimento é o seguinte:
a) Calcula-se a frequência acumulada da distribuição: = ∑ 𝑓𝑖
b) Divide-se o número total de elementos da distribuição por 2: =
∑ 𝑓𝑖
2
c) Procura-se a menor frequência acumulada que supera o valor obtido
anteriormente.
d) Calcular a mediana pela equação:
onde:
6.7.1. Exemplo: mediana com dados agrupados com intervalo de classe
No mesmo exemplo anterior, no qual o treinador montou a tabela com a estatura
média dos jogadores, calcular a mediana.
50 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
Solução:
Incluir na tabela a coluna de frequência acumulada.
Dividir o número total de elementos por 2
Procurar o menor valor de frequência acumulada que supera 20, que é o valor 24
Calcular a mediana utilizando a equação
51 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
Onde:
Li = Limite inferior da classe mediana =158
Fi = Frequência da classe mediana =11
Fa(ant) = Frequência acumulada anterior à mediana =13
h= Intervalo de classe da classe mediana = 4
Somatória de Fi dividido por 2 (já calculado) =
20
A resposta a mediana = 161
52 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
7. Variância e Desvio Padrão
7.1. Objetivo
Estudar medidas de variância e desvio padrão com objetivo de medir o grau de
concentração ou a dispersão dos dados em torno da média.
7.2. Introdução
Enquanto que os valores de Média, Moda e Mediana, são medidas de tendência
central, ou sejam, medem para onde se concentram os elementos de medidas, a Variância
e o Desvio padrão são medidas que procuram identificar, como que os valores se afastam
ou se dispersam do centro da amostra.
A variância e o desvio padrão são medidas que levam em consideração a totalidade
dos valores da variável em estudo.
7.3. Variância
É a medida que mostra o quão distante está cada um dos elementos de um conjunto
em relação à média que na verdade é o ponto central do conjunto.
A variância é calculada por uma das duas expressões abaixo:
𝜎2 =
∑(𝑥𝑖− �̅� )
2
𝑛
=> se for o valor calculado toda a população (chamada de variância
populacional)
𝜎2 =
∑(𝑥𝑖− �̅� )
2
𝑛−1
=> se for o valor calculado para uma amostra (chamada de variância
amostral)
𝜎2 = é 𝑜 𝑣𝑎𝑙𝑜𝑟 𝑑𝑎 𝑣𝑎𝑟𝑖â𝑛𝑐𝑖𝑎
𝑥𝑖 = é 𝑐𝑎𝑑𝑎 𝑢𝑚 𝑑𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑑𝑎 𝑝𝑜𝑝𝑢𝑙𝑎çã𝑜 𝑜𝑢 𝑑𝑎 𝑎𝑚𝑜𝑠𝑡𝑟𝑎
�̅� = é 𝑜 𝑣𝑎𝑙𝑜𝑟 𝑚é𝑑𝑖𝑜 𝑑𝑎 𝑝𝑜𝑝𝑢𝑙𝑎çã𝑜 𝑜𝑢 𝑑𝑎 𝑎𝑚𝑜𝑠𝑡𝑟𝑎
53 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
Quanto maior a variância, mas distantes estão os elementos da média, portanto a
amostra ou a população será mais irregular
Quanto menor a variância, mas próximo estão os elementos da média, portanto a
amostra ou a população será mais regular
7.3.1. Exemplo
As notas de um aluno nos quatro bimestres foram 8; 5; 6; 10. Qual a variância destas
notas?
Cálculo da média:
�̅� =
9 + 5 + 4 + 10
4
�̅� =
28
4
�̅� = 7
Cálculo de cada um dos desvios (𝑥𝑖 − �̅� )
Nota 9 => (𝑥𝑖 − �̅� ) = 9 − 7 = 2
Nota 5 => (𝑥𝑖 − �̅� ) = 5 − 7 = −2
Nota 4 => (𝑥𝑖 − �̅� ) = 4 − 7 = −3
Nota 10 => (𝑥𝑖 − �̅� ) = 10 − 7 = 3
Como estas notas são todas as notas do aluno é a população e não uma amostra de
notas do aluno, então:
𝜎2 =
∑(𝑥𝑖 − �̅� )
2
𝑛
𝜎2 =
22 + (−2)2 + (−3)2 + 32
4
𝜎2 =
4 + 4 + 9 + 9
4
𝜎2 =
26
4
= 6,5
54 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
7.4. Desvio padrão
Determina a variabilidade dos dados em torno da média.
É definido como a raiz quadrada da variância.
𝜎 = √𝜎2
𝜎 = é 𝑜 𝑣𝑎𝑙𝑜𝑟 𝑑𝑜 𝑑𝑒𝑠𝑣𝑖𝑜 𝑝𝑎𝑑𝑟ã𝑜
𝜎2 = é 𝑜 𝑣𝑎𝑙𝑜𝑟 𝑑𝑎 𝑣𝑎𝑟𝑖â𝑛𝑐𝑖𝑎
Importante: Para expressar o quanto os dados estão variando em relação à média,
é sempre aconselhável utilizar o desvio padrão, visto que para o cálculo da variância, os
desvios são elevados ao quadrado, fazendo com que o resultado esteja em uma escala
diferente das medidas
7.4.1. Exemplo
No exemplo anterior cuja variância é 6,5m qual o valor do desvio padrão?
𝜎 = √𝜎2
𝜎 = √6,5
𝜎 = 2,5
7.5. Variância x Desvio Padrão
Os dois valores permitem calcular a dispersão dos valores de uma população ou
amostra, em relação à média, entretanto, no cálculo da variância, os valores das diferenças
em relação à média são elevados ao quadrada para executar os cálculos. Isto é necessário,
pois, caso não fossem elevados ao quadrado o resultado em um conjunto de dados como
os utilizados no exemplo anterior seria zero visto que os valores são 2, -2, -3 e 3, o que
resultaria em uma variância igual a zero o que não é correto.
Considerando o que foi explicado no parágrafo anterior, os resultados de uma
dispersão são melhores expressos pelo “desvio padrão” do que pela “variância” visto que,
ao extrair a raiz quadrada, os valores voltam a mesma escala que os obtidos com a variação
de cada elemento em relação à média.
Com relação à homogeneidade da amostra ou população, é importante observar
que:
55 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
Quanto maior a variância ou o desvio padrão, maior será a irregularidade dos dados,
ou seja, a amostra ou população é mais heterogênea.Quanto menor a variância ou o desvio padrão, menor será a irregularidade dos
dados, ou seja, a amostra ou população é mais homogêneos
56 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
8. Análise Combinatória
8.1. Objetivo
Apresentar e discutir os conceitos de análise combinatória .
8.2. Introdução
Análise Combinatória, estuda eventos que levam em consideração a contagem da
ocorrência de eventos, sem a necessidade de reproduzir todas as possibilidades.
Para desenvolver estes estudos são necessários conhecimentos básicos de :
Fatorial
Princípio fundamental de contagem (diagrama de árvore)
8.3. Fatorial
Considerando n um número natural, maior que 1.
É definido como fatorial de n o produto entre todos os números naturais desde n até
1.
Representação: n!
Cálculo de n! = n . (n-1) . (n-2) . (n-3)............ 1
Exemplo: 5! = 5.4.3.2.1 = 120
É importante sempre lembrar que:
0! = 1
1! = 1
8.4. Princípio fundamental de contagem
Possibilita a definição de uma regra para determinar o número de possibilidades da
ocorrência de um evento de maneira a não ser necessário reproduzir todas as
possibilidades.
𝑛 = 𝑒. 𝑚
𝑛 = 𝑇𝑜𝑡𝑎𝑙 𝑑𝑒 𝑝𝑜𝑠𝑠𝑖𝑏𝑖𝑙𝑖𝑑𝑎𝑑𝑒𝑠 = (𝑟𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜 𝑑𝑎 𝑐𝑜𝑛𝑡𝑎𝑔𝑒𝑚)
𝑒 = 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠
𝑚 = 𝑚𝑎𝑛𝑒𝑖𝑟𝑎 𝑐𝑜𝑚𝑜 𝑐𝑜𝑚𝑏𝑖𝑛𝑎𝑟
57 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
Quando a quantidade de elementos não é grande é possível a elaboração do
“Diagrama de árvores”, conforme será apresentado a seguir, entretanto quando existem
muitos elementos torna-se necessário realizar a operação pelo produto entre os elementos
e as maneiras como os eventos podem ser realizados conforme expressão acima.
O Diagrama de Árvore representa as possibilidades de combinar elemento. Abaixo
temos o diagrama de árvore para a combinação dos elementos M e N com A, B, C
8.4.1. Exemplo:
Está em promoção em uma concessionária três modelos de carros, Onix, Cobalt e
Plus, todos eles em 3 cores Azul, Vermelho e Preto. Quantas possibilidades de escolha
existem?
58 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
8.5. Permutação simples
Uma permutação simples é um rearranjo de elementos distintos de um conjunto,
onde a ordem dos elementos é importante. Em outras palavras, é uma maneira de
organizar os elementos de um conjunto de forma que cada elemento seja usado
exatamente uma vez e que a ordem em que esses elementos são organizados seja
considerada (ou seja, os mesmos objetos podem ser colocados em ordem diferente).
Como exemplo podemos observar que, se tivermos os elementos {A, B, C}, as
permutações simples são:
ABC
CBA
BCA
ACB
CAB
BAC
Cada uma dessas permutações é única porque a ordem dos elementos é diferente
em cada uma delas.
O resultado de uma permutação simples pode ser obtido pelo fatorial do número de
elementos.
𝑃𝑛 = 𝑛!
𝑃𝑛 = 𝑃𝑒𝑟𝑚𝑢𝑡𝑎çã𝑜 𝑠𝑖𝑚𝑝𝑙𝑒𝑠
𝑛! = 𝐹𝑎𝑡𝑜𝑟𝑖𝑎𝑙 𝑑𝑒 𝑛
No caso:
𝑃𝑛 = 3!
𝑃𝑛 = 3.2.1
𝑃𝑛 = 6
59 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
8.5.1. Exemplo
Em um concurso com 3 pessoas (Claudia, Alessandra, Andressa), quantas
possibilidades existem de resultados. Calcule e apresente todas as possibilidades
𝑃𝑛 = 𝑛!
𝑃3 = 3!
𝑃3 = 3.2.1
𝑃3 = 6
Claudia, Alessandra, Andressa
Claudia, Andressa, Alessandra
Alessandra, Claudia. Andressa
Alessandra, Andressa, Claudia
Andressa, Alessandra, Claudia
Andressa, Claudia, Alessandra
8.6. Permutação com repetição
Uma permutação com repetição é um arranjo de elementos onde alguns elementos
podem aparecer mais de uma vez e a ordem dos elementos ainda é considerada. (ou
seja, os mesmos objetos podem ser colocados em ordem diferente). Em outras palavras, é
uma maneira de organizar os elementos de um conjunto, permitindo que haja elementos
repetidos e levando em consideração a ordem desses elementos.
Por exemplo, se tivermos o conjunto {A, B, B}, uma permutação com repetição desse
conjunto seria:
ABB
BAB
BBA
Neste caso, "B" é repetido duas vezes, e a ordem em que esses elementos são
organizados importa. Cada permutação é única devido à ordem dos elementos.
A permutação com repetição pode ser calculada pela equação
60 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
𝑃𝑛 =
𝑛!
𝑛1! . 𝑛2! . 𝑛3! … . . 𝑛𝑘!
𝑃𝑛! => é 𝑎 𝑝𝑒𝑟𝑚𝑢𝑡𝑎çã𝑜
𝑛 => 𝑛ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠
𝑛1 𝑛2 𝑛3 … .. 𝑛𝑘 => 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 𝑟𝑒𝑝𝑒𝑡𝑖𝑑𝑜𝑠 𝑛𝑜 𝑒𝑣𝑒𝑛𝑡𝑜
Neste caso, 𝑛 = 3; 𝑛1 = 2 𝑒 𝑜𝑠 𝑑𝑒𝑚𝑎𝑖𝑠 𝑣𝑎𝑙𝑒𝑚 0
𝑃𝑛 =
𝑛!
𝑛1! . 𝑛2! . 𝑛3! … . . 𝑛𝑘!
𝑃𝑛 =
3!
2!
𝑃𝑛 =
3.2.1
2.1
𝑃𝑛 =
6
2
= 3
8.6.1. Exemplo
Quantos anagramas existem para apalavra TERRA
𝑛 = 5; 𝑛1 = 2 𝑒 𝑜𝑠 𝑑𝑒𝑚𝑎𝑖𝑠 𝑣𝑎𝑙𝑒𝑚 0
𝑃𝑛 =
𝑛!
𝑛1! . 𝑛2! . 𝑛3! … . . 𝑛𝑘!
𝑃𝑛 =
5!
2!
𝑃𝑛 =
5.4.3.2.1
2.1
𝑃𝑛 =
120
2
= 60
8.7. Arranjo simples
Um arranjo simples, também conhecido como arranjo sem repetição, é uma
combinação ordenada de elementos distintos tomados de um conjunto. Em outras palavras,
é um subconjunto ordenado de um conjunto onde cada elemento é escolhido uma única
vez e a ordem dos elementos não é relevante. (ou seja, os mesmos objetos podem ser
colocados em ordem diferente)
61 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
Um arranjo simples (sem repetição) pode ser calculado pela equação
𝐴𝑛,𝑘 =
𝑛!
(𝑛 − 𝑘)!
𝐴𝑛,𝑘 = 𝐴𝑟𝑟𝑎𝑛𝑗𝑜
n = total de elementos do evento
k => total de agrupamentos ( k precisa ser menor ou igual a n)
Para entender vamos propor arranjar as 3 letras (A, B, C) duas a duas, sem que haja
repetição.
AB
BA
AC
CA
BC
CA
𝑛 = 3
𝑘 = 2
𝐴𝑛,𝑘 =
𝑛!
(𝑛 − 𝑘)!
𝐴𝑛,𝑘 =
3!
(3 − 2)!
𝐴𝑛,𝑘 =
3!
(1)!
𝐴𝑛,𝑘 =
3.2.1
1
= 6
8.7.1. Exemplo
Quantos arranjos de 3 números são possíveis de se obter com o conjunto de
números 1,2,3,4,5 e 6, com cada elemento só podendo aparecer uma vez
n = 6
k = 3
62 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
𝐴𝑛,𝑘 =
𝑛!
(𝑛 − 𝑘)!
𝐴6,3 =
6!
(6 − 3)!
𝐴6,3 =
6.5.4.3.2.1
(3)!
𝐴6,3 =
6.5.4.3.2.1
3.2.1
𝐴6,3 = 120
8.8. Arranjo com repetição
Um arranjo com repetição é uma combinação de elementos onde cada elemento
pode aparecer mais de uma vez na sequência. Isso é diferente de um arranjo sem repetição,
onde cada elemento aparece no máximo uma vez na sequência.
Um arranjo (com repetição) pode ser calculado pela equação.
𝐴𝑛,𝑘 = 𝑛
𝑘
𝐴𝑛,𝑘 = é 𝑢𝑚 𝑎𝑟𝑟𝑎𝑛𝑗𝑜 𝑐𝑜𝑚 𝑟𝑒𝑝𝑒𝑡𝑖çã𝑜
𝑛 = é 𝑢𝑚 𝑎𝑟𝑟𝑎𝑛𝑗𝑜 𝑐𝑜𝑚 𝑟𝑒𝑝𝑒𝑡𝑖çã𝑜
𝑘 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 𝑒𝑠𝑐𝑜𝑙ℎ𝑖𝑑𝑜𝑠 𝑛𝑜 𝑒𝑣𝑒𝑛𝑡𝑜
Como exemplo consideramos o conjunto {A, B, C} e queremos formar arranjos de 2
elementos com repetição permitida. Os arranjos possíveis seriam:
AA
AB
AC
BA
BB
BC
CA
CB
CC
63 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
𝑛 = 3
𝑘 = 2
𝐴𝑛,𝑘 = 𝑛
𝑘
𝐴𝑛,𝑘 = 3
2
𝐴𝑛,𝑘 = 9
8.8.1. Exemplo
Quantos arranjos de 3 números são possíveis de se obter com o conjunto de
números 1,2,3,4,5 e 6, podendo um número aparecer mais que uma vez.
n = 6
k= 3
𝐴𝑛,𝑘 = 𝑛
𝑘
𝐴𝑛,𝑘 = 6
3
𝐴𝑛,𝑘 = 216
8.9. Combinação simples
Uma combinação simples, refere-se a uma seleção de itens onde a ordem dos
elementos não importa. Em combinaçõessimples cada elemento pode ser contado
somente uma vez.
A fórmula para calcular uma combinação simples é:
𝐶𝑛,𝑘 =
𝑛!
𝑘!. (𝑛 − 𝑘)!
𝐶𝑛,𝑘 = é 𝑢𝑚𝑎 𝑐𝑜𝑚𝑏𝑖𝑛𝑎çã𝑜 𝑠𝑖𝑚𝑝𝑙𝑒𝑠
𝑛 = é 𝑜 𝑛ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠
𝑘 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 𝑒𝑠𝑐𝑜𝑙ℎ𝑖𝑑𝑜𝑠 𝑛𝑜 𝑒𝑣𝑒𝑛𝑡𝑜
Selecionar 3 letras no conjunto de A, B, C, D letras sem repetir
𝑛 = 4
𝑘 = 3
64 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
𝐶𝑛,𝑘 =
𝑛!
𝑘!. (𝑛 − 𝑘)!
𝐶𝑛,𝑘 =
4!
3!. (4 − 3)!
𝐶𝑛,𝑘 =
4!
3!. (1)!
𝐶𝑛,𝑘 =
4.3.2.1
3.2.1.1
𝐶𝑛,𝑘 =
24
6
𝐶𝑛,𝑘 = 4
8.9.1. Exemplo
Em um sorteio que irá premiar três pessoas com um SmarthPhone, do qual participam 10
pessoas, Quantos são os resultados possíveis deste sorteio?
𝑛 = 10
𝑘 = 3
𝐶𝑛,𝑘 =
𝑛!
𝑘! (𝑛 − 𝑘)!
𝐶𝑛,𝑘 =
10!
3! (10 − 3)!
𝐶𝑛,𝑘 =
10!
3! (7)!
𝐶𝑛,𝑘 =
10.9.8.7.6.5.4.3.2.1
(3.2.1). (7.6.5.4.3.2.1)
𝐶𝑛,𝑘 =
10.9.8
6
𝐶𝑛,𝑘 =
720
6
𝐶𝑛,𝑘 = 120
65 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
8.10. Combinação com repetição
Uma combinação com repetição, refere-se a uma seleção de itens onde a ordem dos
elementos não importa. Em combinações com repetição os elementos podem ser contados
mais que uma vez.
A fórmula para calcular uma combinação simples é
𝐶𝑛,𝑘 =
(𝑛 + 𝑘 − 1)!
𝑘!. (𝑛 − 1)!
𝐶𝑛,𝑘 = é 𝑢𝑚𝑎 𝑐𝑜𝑚𝑏𝑖𝑛𝑎çã𝑜 𝑐𝑜𝑚 𝑟𝑒𝑝𝑒𝑡𝑖çã𝑜
𝑛 = é 𝑜 𝑛ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠
𝑘 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 𝑒𝑠𝑐𝑜𝑙ℎ𝑖𝑑𝑜𝑠 𝑛𝑜 𝑒𝑣𝑒𝑛𝑡𝑜
Considerando o conjunto (A,B,C) se desejarmos selecionar duas letras com
repetição quantas combinações teremos
AA
AB
AC
BB
BC
CC
𝑛 = 3
𝑘 = 2
𝐶𝑛,𝑘 =
(𝑛 + 𝑘 − 1)!
𝑘!. (𝑛 − 1)!
𝐶𝑛,𝑘 =
(3 + 2 − 1)!
2!. (3 − 1)!
𝐶𝑛,𝑘 =
(4)!
2!. (2)!
𝐶𝑛,𝑘 =
4.3.2.1
. 2.1.2.1
66 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
𝐶𝑛,𝑘 =
24
4
𝐶𝑛,𝑘 =
24
4
8.10.1. Exemplo
Desejamos pintar 3 objetos com 3 cores (azul, verde e amarelo), quantas
combinações são possíveis sabendo que é possível repetir as cores.
𝑛 = 3
𝑘 = 3
𝐶𝑛,𝑘 =
(3 + 3 − 1)!
3!. (3 − 1)!
𝐶𝑛,𝑘 =
(5)!
3!. (2)!
𝐶𝑛,𝑘 =
(5.4.3.2.1)
(3.2.1). (2.1)
𝐶𝑛,𝑘 =
(120)
(6). (2)
𝐶𝑛,𝑘 =
(120)
(12)
𝐶𝑛,𝑘 = 10
67 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
9. Distribuição Normal – Curva de Gauss
9.1. Objetivo
Entender o conceito de distribuição normal e familiarizar-se com a Curva normal ou
Curva de Gauss
9.2. Introdução
Uma distribuição de valores que possui média, (representada por µ) e desvio padrão,
representado por (σ) é considerada normal se ela puder ser descrita pela equação abaixo,
que representa a probabilidade em qualquer um elemento da amostra ou população
𝑃𝑥 =
𝑒
− 1
2
(
𝑧− 𝜇
𝜎
)
2
𝜎√2𝜋
Onde: 𝑃𝑥 é 𝑎 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑𝑒 𝑑𝑒 𝑥
Como a resolução desta equação é demasiadamente complexa, utilizamos a tabela
de Distribuição normal apresentada abaixo, que pode ser obtida em diversos livros ou
mesmo em sites de internet.
68 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
Como exemplo, para obter o valor 1,52m deve-se
Primeira coluna procurar => 1,4
Quarta coluna procurar => 0,02
valor de 𝑃𝑥 = 0,4257
A expressão mencionada no item acima pode ser representada por uma curva
chamada curva normal ou curva de Gauss ou curva de sino (devido ao seu formato), que é
uma curva simétrica em torno de uma média
69 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
Sendo uma distribuição simétrica a curva de Gauss possui sempre o mesmo formato,
entretanto, se os valores da média e do desvio forem alterados a curva terá aspecto e
posicionamento diferente, entretanto, manterá o formato de sino.
A figura abaixo obtida da Wikipedia apresenta alguns exemplos
Fonte Wikipedia: https://pt.wikipedia.org/wiki/Distribui%C3%A7%C3%A3o_normal
9.3. Distribuição Normal padrão
A representação gráfica da distribuição normal, como citado anteriormente, é uma
curva em forma de sino, simétrica em torno da média (�̅� 𝑜𝑢 µ), que recebe o nome de curva
normal ou de Gauss.
https://pt.wikipedia.org/wiki/Distribui%C3%A7%C3%A3o_normal
70 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
A área total limitada pela curva e pelo eixo das abscissas é igual a 1.
Essa área corresponde à probabilidade da variável aleatória x assumir qualquer valor
real.
A curva normal é assintótica em relação ao eixo das abscissas, isto é, aproxima-se
indefinidamente do eixo das abscissas sem, contudo, alcançá-lo, pois considera uma
população infinita.
Como a curva é simétrica em torno de (�̅�), a probabilidade de ocorrer valor maior do
que a média é igual à probabilidade de ocorrer valor menor do que a média, isto é, ambas
as probabilidades são iguais a 0,5. Escrevemos: P(x > (�̅�)) = P(x < (�̅�)) = 0,5.
9.3.1. Exemplo
Uma variável z possui distribuição normal com média 0, (representada por �̅� 𝑜𝑢 𝜇) e
desvio padrão 1 σ sendo, portanto, sua distribuição normal. Qual a probabilidade que o
valor de Z seja menor que 1,82?
Solução
A curva de Gauss desta distribuição é normal visto que 𝜇 = 0 e σ = 1 será a da figura
abaixo, e a probabilidade do valor ser menor que 1,82, é a área pintada.
Considerando que os valores negativos de x representam 50% (em azul na imagem)
precisamos somente calcular a área em vermelho na figura e este cálculo será feito com
auxílio da tabela de probabilidades da distribuição normal para determinar.
71 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
Pegando o valor 1,8 na primeira coluna da tabela e 2 (que corresponde a 0,02) na
primeira linha teremos o valor de
Portando a resposta será que a probabilidade de z ser menor que 1,82 é:
Px = 0,5 + 0,4656 = 0,9656 ou 96,56%
72 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
9.4. Distribuição normal reduzida
A distribuição normal padrão, ou padronizada, admite média 0 e desvio padrão 1, é
indicada pela letra Z Entretanto, pode ser necessário aplicar os conceitos da curva normal
para outros valores cuja média não seja 0 e o desvio padrão não seja 1.
Para que a Curva Normal seja aplicada é preciso reduzir estes valores de acordo
com uma das expressões abaixo:
Para amostras:
𝑧 =
𝑥 − 𝜇
𝜎2
Para população
𝑧 =
𝑥 − 𝜇
𝜎
9.4.1. Exemplo
A distribuição de QI (quociente intelectual) em uma instituição de ensino obteve como
média 100 com um desvio padrão de 10. Qual a probabilidade de um desses alunos
tomados ao acaso, apresentar o QI superior à 120 pontos.
Solução:
Estamos procurando qual a probabilidade de 𝑃𝑥 > 120
Para que possamos utilizar a tabela da distribuição normal (média µ = 0 e desvio
padrão σ = 1) e resolver a distribuição reduzida (média µ = 100 e desvio padrão σ = 10), é
necessário passar os valores para a curva normal e calcular z
𝑧 =
𝑥 − 𝜇
𝜎
𝑧 =
120 − 100
10
𝑧 = 2
73 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
A região da curva que estamos calculando é a indicada na figura.
74 Probabilidade e Estatística
Universidade Santa Cecília - Educaçãoa Distância
Pegando o valor 2,0 linha da tabela e o valor 0 (que corresponde a 0,00) na segunda
coluna da tabela, o valor de 0,4772
Resposta:
A probabilidade do QI de um aluno retirado aleatoriamente é de
𝑃𝑥 > 2 = 0,5 − 0,4772 = 0,023 = 2,3%
Observação: O valor foi subtraído de 0,5 pois a possibilidade de ser maior que a
média (100) é 50% e a possibilidade de ser até 120 é 47,72%, portanto a possibilidade de
ser somente maior que 120% é 50 – 47,7 = 2,28%
75 Probabilidade e Estatística
Universidade Santa Cecília - Educação a Distância
WALPOLE E. R, MYERS, R. H MYERS S. L. YE; K. Probabilidade e Estatística para
Engenharia e Ciências 8ª ed. São Paulo. Pearson, 2008. (BV)
LARSON. R. E. Estatística aplicada: retratando o mundo 8ª ed. São Paulo.
Pearson, 2023. (BV)
MORETTIN, L. G. Estatística Básica: probabilidades e inferência. São Paulo:
Pearson, 2010. (BV)
SILVA, R. S. Estatística Aplicada 1ª ed. São Paulo: Contentus, 2020. (BV)
CASTANHEIRA. N. P. Estatística aplicada a todos os níveis 2ª ed. Curitiba,
InterSaberes 2018. (BV)
BANORA JUNIOR. D. Estatística Básica 1ª ed. São Paulo: Ícone 2019. (BV)
QUINSLER. A. P. Probabilidade e estatística 1ª ed. Curitiba, InterSaberes, 2022.
(BV)
PIANEZZER. G. A. Modelagem Estatística 1ª ed. São Paulo, Contentus, 2020.
(BV)
1. Interpretações e representações numéricas
1.1. Objetivo
1.2. Introdução
1.3. Variações percentuais
1.4. Variação Percentual
1.5. Aumento percentual – Variações positivas
1.6. Desconto percentual – Variações negativas
1.7. Estudo do aumento percentual
1.8. Estudo do desconto percentual
1.9. Casas decimais – casas após a vírgula
1.10. Arredondamento
1.10.1. Quando utilizar arredondamento
1.10.2. Critério de arredondamento de médias da Universidade
1.11. Notação científica
1.11.1 Como representar um número para Potência de 10
1.11.2. Prefixos e Notações
2. Noções de Estatística – Coleta de Dados – Variáveis
2.1. Objetivo:
2.2. Introdução:
2.3. Estatística Descritiva x Estatística Indutiva
2.4. Dados
2.5. População estatística
2.6. Amostra
2.7. Amostra significativa
2.8. Amostragem
2.9. Técnicas de amostragem
2.9.1. Amostragem Aleatória
2.9.2. Amostragem não aleatória
2.10. Coleta de dados
2.11. Crítica de dados
2.12. Variáveis
2.12.1. Variáveis qualitativas
2.12.2. Variáveis quantitativas
3. Distribuição de frequência
3.1. Objetivo:
3.2. Introdução:
3.3. Organização de dados
3.3.1. Rol
3.4. Distribuição de Frequência
3.4.1. Classe
3.4.2. Número de Classes
3.4.3. Amplitude do intervalo de classe
3.4.4. Frequência de classe
3.4.5. Ponto médio da classe
3.4.6. Frequência acumulada
3.4.7. Frequência relativa
3.4.8. Frequência relativa acumulada
4. Gráficos
4.1. Objetivo
4.2. Introdução
4.3. O que é um gráfico
4.4. Algumas regras gerais
4.4.1. Normas IBGE
4.4.2. Normas ABNT
4.5. Tipos de gráficos mais comuns
4.6. Gráfico de linha ou em curva
4.6.1. Exemplo
4.7. Gráfico de colunas
4.7.1. Exemplo
4.8. Gráfico de barras
4.8.1. Exemplo
4.9. Gráfico de dispersão
4.9.1. Exemplo
4.10. Gráfico de setores
4.10.1. Exemplo
4.11. Histograma
4.11.1. Construção de Histogramas
5. Média Aritmética
5.1. Objetivo
5.2. Introdução:
5.3. Média Aritmética de dados não agrupados
5.3.1. Exemplo de média aritmética de dados não agrupados
5.4. Média aritmética de dados agrupados
5.4.1. Exemplo de dados agrupados sem intervalo de classe
5.4.2. Exemplo de dados agrupados com intervalo de classe
6. Moda e Mediana
6.1. Objetivo
6.2. Introdução:
6.3. Moda de dados não agrupados
6.3.1. Exemplo de moda de dados não agrupados
6.4. Moda de dados agrupados
6.4.1. Exemplo: moda com dados agrupados sem intervalo de classe
6.4.2. Exemplo: moda com dados agrupados com intervalo de classe
6.5. Mediana de dados não agrupados
6.5.1. Exemplo com número ímpar de valores
6.5.2. Exemplo com número par de valores
6.6. Mediana de dados agrupados sem intervalo de classe
6.6.1. Exemplo: mediana com dados agrupados sem intervalo de classe
6.7. Mediana de dados agrupados com intervalo de classe
6.7.1. Exemplo: mediana com dados agrupados com intervalo de classe
7. Variância e Desvio Padrão
7.1. Objetivo
7.2. Introdução
7.3. Variância
7.3.1. Exemplo
7.4. Desvio padrão
7.4.1. Exemplo
7.5. Variância x Desvio Padrão
8. Análise Combinatória
8.1. Objetivo
8.2. Introdução
8.3. Fatorial
8.4. Princípio fundamental de contagem
8.4.1. Exemplo:
8.5. Permutação simples
8.5.1. Exemplo
8.6. Permutação com repetição
8.6.1. Exemplo
8.7. Arranjo simples
8.7.1. Exemplo
8.8. Arranjo com repetição
8.8.1. Exemplo
8.9. Combinação simples
8.9.1. Exemplo
8.10. Combinação com repetição
8.10.1. Exemplo
9. Distribuição Normal – Curva de Gauss
9.1. Objetivo
9.2. Introdução
9.3. Distribuição Normal padrão
9.3.1. Exemplo
9.4. Distribuição normal reduzida
9.4.1. Exemplo