Logo Passei Direto
Buscar
Material
páginas com resultados encontrados.
páginas com resultados encontrados.
left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Prévia do material em texto

NOÇÕES DE PROBABILIDADE E 
ESTATÍSTICA 
 
1. Conceitos gerais: variável, tipos de variáveis, população, amostra, frequências: absoluta e relativa, 
frequências acumuladas, representações em gráficos e tabelas (linhas, colunas, setores e histogramas). 
.........................................................................................................................................................................01 
2. Medidas de tendência central (em dados brutos ou agrupados em classes): média aritmética, média 
geométrica, média ponderada, moda e mediana. 
.........................................................................................................................................................................09 
3. Medidas de Posição: quartis e percentis. 
.........................................................................................................................................................................15 
4. Medidas de dispersão (em dados brutos ou agrupados em classes): amplitude, variância, desvio 
padrão e coeficiente de variação. 
.........................................................................................................................................................................18 
5. Probabilidade: experimento aleatório, espaço amostral, evento; espaços equiprováveis; probabilidade 
de Laplace; espaços não equiprováveis; teorema do produto; probabilidade condicional e 
independência; distribuição binomial. 
.........................................................................................................................................................................22 
 
NOÇÕES DE PROBABILIDADE E ESTATÍSTICA EDITAL MASTER 
 
 
www.editalmaster.com.br 1 
 
1. Conceitos gerais: variável, tipos de variáveis, população, amostra, frequências: absoluta 
e relativa, frequências acumuladas, representações em gráficos e tabelas (linhas, colunas, 
setores e histogramas). 
 
CONCEITOS 
 
A estatística é a parte da matemática que se dedica à análise, apresentação e interpretação de dados coletados. 
Esses dados são coletados dentro de uma população, que é o conjunto total dos elementos a serem estudados 
(podem ser pessoas, objetos etc.). Dessa população, podemos coletar os dados de duas maneiras: 
 
Censo: quando são coletados os dados de toda a população; e 
 
Amostra: é um subconjunto da população, da qual são coletados dados para, posteriormente, fazer uma 
inferência sobre a população (inferência estatística). 
 
Ex.: na eleição, todas as pessoas aptas a votar são a população. Quando uma empresa é contratada para fazer 
uma pesquisa de intenção de voto, eles selecionam uma amostra dessa população, fazem as perguntas pré-
determinadas pela pesquisa, e com os dados das respostas fazem uma inferência de como a população toda irá 
votar. 
Um dos ramos da estatística é a estatística descritiva, onde estudaremos 4 tipos de medidas descritivas: 
 
● As medidas de tendência central que são medidas que indicam a posição dos dados, como média, 
mediana, moda e quartis (também chamadas de medidas de posição); 
● As medidas de dispersão que medem o grau de variabilidade dos elementos de um conjunto, como 
desvio-padrão, variância, amplitude; 
● A assimetria da curva; e 
● O achatamento da curva, chamado de curtose. 
 
Importante! 
Essas duas últimas (assimetria e curtose) também são conhecidas como medidas de distribuição. 
 
Os dados de uma amostra podem ser qualitativos, que são aqueles dados não numéricos como sexo, 
nacionalidade, avaliação nominal (bom, regular, ruim) etc., ou quantitativos, que são dados expressos em 
números, que podem ser objeto de contagens, medições como altura, peso etc. 
 
Cuidado, não necessariamente dados expressos em números serão quantitativos, eles podem também ser 
qualitativos, como RG, CPF, CNPJ, CEP, CNAE (classificação nacional de atividades econômicas), 
geralmente esse tipo de código ou classificação é feito em números. Ex: queremos saber a quantidade de 
empresas que atuam em cada setor, podemos usar a CNAE, que é um número, para separar a quantidade 
de mercados, farmácias, postos de combustíveis etc. Os dados qualitativos podem ser: 
 
● Ordinais: são aqueles que podem ser ordenados, como mês, nível de escolaridade, tamanho de roupa 
(P, M, G) entre outros. Ex: o nível de escolaridade pode ser dividido em ensino fundamental, ensino 
médio, ensino superior, pós-graduação. Por mais que seja um dado qualitativo, a gente consegue 
colocar isso em ordem, pois sabemos que primeiro vem o ensino fundamental, depois o ensino 
médio e assim por diante. Da mesma forma o mês, sabemos que primeiro vem janeiro, depois 
NOÇÕES DE PROBABILIDADE E ESTATÍSTICA EDITAL MASTER 
 
 
www.editalmaster.com.br 2 
 
fevereiro até chegar em dezembro; 
 
● Nominais: que são aqueles que não podem ser ordenados, como sexo, estado civil entre outros. Ex: 
podemos dividir os estados civis em casado, união estável, solteiro, viúvo... claramente não temos 
uma ordem entre essas opções. 
 
Os dados quantitativos podem ser: 
 
● Discretos: são aqueles dados que possuem um conjunto finito de valores, como a quantidade de 
acertos em uma prova de múltipla escolha, a quantidade será apenas números inteiros, 0, 1, 2, 3 e 
assim por diante, ou 
 
● Contínuos: que são aqueles que possuem uma escala contínua de valor como tempo, comprimento 
etc. Ex: vamos considerar a variável altura. Entre os dados 1,70m e 1,71m existe uma infinidade de 
números. 
 
NORMAS DE APRESENTAÇÃO TABULAR 
 
Modelo de uma Tabela 
 
Já mostramos algumas tabelas ao longo do material, mas afinal, para que serve, e como montar uma tabela? 
Uma tabela deve ser composta por diversas linhas e colunas, sendo que devemos ter um título (normalmente 
na primeira linha da tabela), e vários dados organizados nas linhas e colunas seguintes. Geralmente, na primeira 
linha, depois do título, teremos as classes que serão retratadas nas linhas, ex.: Estados, Siglas, População, Área 
etc. Nas linhas seguintes teremos os dados da tabela, onde teremos em uma mesma linha o Estado, relacionando 
sua sigla, sua população, sua área etc. Vejamos o exemplo dessa tabela citada. 
 
 
 
 
NOÇÕES DE PROBABILIDADE E ESTATÍSTICA EDITAL MASTER 
 
 
www.editalmaster.com.br 3 
 
Analisando a tabela acima, podemos concluir que Minas Gerais (MG) é o maior estado da Região Sudeste, pois 
tem a maior área, mas que o estado de São Paulo é o mais populoso, por ter uma população maior que os outros. 
O importante é olhar uma tabela e entender quais dados podemos extrair com o que está apresentado nela. 
As tabelas mais utilizadas na estatística são as tabelas de frequência, conforme apresentamos no item de média 
aritmética para dados agrupados. 
 
Tipos de Séries Estatísticas 
 
As séries estatísticas são as diversas maneiras de apresentar os dados desejados em forma de tabela, o objetivo 
das séries estatísticas é organizar os dados observados e mostrá-los de maneira organizada, facilitando sua 
compreensão. 
 
Temos vários tipos séries estatísticas, mas vamos destacar algumas mais importantes: 
 
● Séries Temporais: é um conjunto de observações de uma variável ao longo do tempo, ou seja, uma 
sequência de dados numéricos em ordem sucessiva. Nesse tipo de série o que varia é o tempo, mas 
o fato e o local de observação são fixos; 
 
● Séries Geográficas: é um conjunto de observações de uma variável em diferentes locais. Nesse 
tipo de série o que varia é o local (região) da observação, mas o tempo e o fato observado são fixos. 
Ex.: 
 
 
 
● Séries Específicas: é um conjunto de observações de uma variável com diferentes categorias 
(espécies). Nesse tipo de variável o que varia são as categorias observadas, mas o tempo e o local 
são fixos. Ex.: queremos analisar a quantidade de animais diferentes que habitam uma certa região 
de proteção florestal. Nesse caso atabela será classificada pelas espécies observadas na região de 
interesse em um mesmo intervalo de tempo. 
NOÇÕES DE PROBABILIDADE E ESTATÍSTICA EDITAL MASTER 
 
 
www.editalmaster.com.br 4 
 
 
 
Séries Conjugadas (Mistas): nesse tipo de séries vamos conjugar dois tipos de séries em uma mesma tabela. 
Ex.: vamos conjugar a tabela específica acima, com uma série temporal, mostrando a quantidade de cada espécie 
observada ao longo dos últimos 3 anos. 
 
 
 
Séries Temporais 
 
De todas as séries, uma das mais importantes é a série temporal, que corresponde a um conjunto de observações 
de uma variável ao longo do tempo, ou seja, uma sequência de dados numéricos em ordem sucessiva, que 
geralmente (mas não necessariamente) ocorre em intervalos uniformes. Ex.: uma série que mostra a quantidade 
de picolés vendidos por uma sorveteria mensalmente ao longo de um ano. 
Podemos definir exemplos de séries temporais e de séries não temporais: 
 
NOÇÕES DE PROBABILIDADE E ESTATÍSTICA EDITAL MASTER 
 
 
www.editalmaster.com.br 5 
 
 
 
As séries temporais são importantes para identificar padrões de variáveis no tempo, para que se possa tentar 
prever possíveis danos no futuro. Para descrever séries temporais, são utilizados modelos de processos 
estocásticos, que são processos controlados por leis probabilísticas. 
Uma série temporal pode ser decomposta em três séries temporais: tendência, sazonalidade e uma 
componente aleatória (nível). 
 
● Tendência: é o comportamento de longo prazo na série, podendo ser determinístico (quando os 
valores da série podem ser descritos por uma função matemática) e podendo ser estocástico (aquele 
cujo estado é indeterminado, com origem em eventos aleatórios). Ex.: Quando analisamos a 
população brasileira ao longo dos anos (vamos supor uma série com 100 anos), vemos que a cada 
ano esse valor aumenta, nem sempre em uma mesma proporção, mas podemos notar uma tendência 
de crescimento; 
 
● Sazonalidade: é um padrão regular que ocorre na série temporal. Uma série temporal é sazonal 
quando fenômenos que ocorrem durante o tempo se repetem em um mesmo período de tempo, ou 
seja, ocorrem sempre em uma mesma hora, todos os dias, ou em um mesmo mês, todos os anos. Ex.: 
um aumento nas vendas de uma loja de roupas em dezembro em todos os anos (período do Natal); 
 
● Aleatório: é o que não pode ser explicado pela tendência e sazonalidade, ou seja, é o resíduo, sendo 
que a aleatoriedade não pode ser determinística (descrito por uma função matemática) e será sempre 
estocástico; 
 
● Ciclo: Longas ondas, mais ou menos regulares, em torno de uma linha de tendência. 
 
Outro ponto importante é a estacionariedade da série temporal. 
 
Dizemos que uma série temporal é estacionária quando suas observações no tempo se posicionam 
aleatoriamente ao redor de uma média constante, transparecendo um equilíbrio estável. 
 
 
 
 
NOÇÕES DE PROBABILIDADE E ESTATÍSTICA EDITAL MASTER 
 
 
www.editalmaster.com.br 6 
 
 
 
Podemos notar que uma série estacionária se mantém sempre em torno de uma média, que representamos pela 
linha preta central na figura a seguir. 
 
 
 
Uma série pode ser estacionária por um período curto, ou por um período longo, o modelo ARIMA pode 
descrever séries estacionárias e séries não estacionárias que não apresentam um comportamento totalmente 
aleatório, ou seja, uma não estacionariedade homogênea, que é quando uma série é estacionária, flutuando ao 
redor de um nível, por um certo tempo, depois muda de nível e flutua ao redor desse novo nível, e depois muda 
novamente de nível e assim por diante. 
 
 
 
NOÇÕES DE PROBABILIDADE E ESTATÍSTICA EDITAL MASTER 
 
 
www.editalmaster.com.br 7 
 
GRÁFICOS E DIAGRAMAS 
 
Para representar os dados coletados existem vários tipos de gráficos usados na estatística. Muitos deles são 
conhecidos e sempre aparecem em reportagens, jornais etc. Vamos mostrar alguns dos principais tipos de 
gráficos: 
 
Caixa box-plot 
 
A caixa box-plot (muito cobrado) é um gráfico que nos mostra a distribuição de frequência, e é formado 
pelos quartis e pelos valores extremos. 
 
 
 
Vemos que a caixa é formada pelos 3 quartis, que no caso seriam aproximadamente: 
Q1 = 0, Q2 = 20 e Q3 = 30. 
 
Os dados extremos seriam aproximadamente -15 e 40, portanto amplitude seria: 
 
40 – (–15) = 40 + 15 = 55. 
 
portanto amplitude seria: 40 – (–15) = 40 + 15 = 55. As duas bolinhas significam dados discrepantes 
(outliers), que seriam dados que fogem do padrão do restante dos dados. Os dados discrepantes são aqueles 
que superam em 1,5 vezes o intervalo interquartílico (diferença entre Q3 e Q1). 
 
No nosso exemplo: 
 
Q3 – Q1 = 30 – 0 = 30 
1,5 · 30 = 45 
 
Os dados discrepantes serão aqueles que forem inferiores a 45 unidades de Q1, ou superiores a 45 unidades 
de Q3. 
 
Limite inferior: 0 – 45 = - 45 
 
Limite superior: 30 + 45 = 75 
 
Portanto, serão dados discrepantes os que tiverem valores inferiores a “–45” ou os superiores a 75. 
 
Gráfico de Barras e Colunas 
 
Esses dois tipos de gráficos na verdade são basicamente os mesmos, a diferença é que no gráfico de barras, as 
barras/colunas são horizontais e no gráfico de colunas, as barras/colunas são verticais. 
 
Normalmente esses gráficos são usados para representar dados qualitativos ordinais e quantitativos discretos. 
NOÇÕES DE PROBABILIDADE E ESTATÍSTICA EDITAL MASTER 
 
 
www.editalmaster.com.br 8 
 
 
 
No gráfico de colunas o eixo horizontal traz os dados qualitativos, ou quantitativos discretos, e o eixo vertical 
traz as frequências (quantidades) de cada categoria. Já no gráfico de barras o eixo vertical traz os dados 
qualitativos ou quantitativos discretos, e o eixo horizontal traz as frequências de cada categoria. Vamos supor 
um gráfico de colunas, onde queremos saber a quantidade de pessoas com diferentes graus de escolaridade em 
um determinado concurso. 
 
 
 
Nesse tipo de gráfico vemos que não é possível falar em média ou mediana, mas podemos usar como 
medida de tendência central a moda, que nesse caso seria o Ensino Superior, que é o grau de instrução que 
mais se repete no gráfico. 
 
Gráfico de Dispersão 
 
Estudaremos melhor esse tipo de gráfico quando falarmos de correlação, mas, irei apresentar como ele é 
feito, e quando é usado. 
O gráfico de dispersão, ou diagrama de dispersão, é uma associação entre pares de dados quantitativos, 
normalmente são usados para entender a correlação entre duas variáveis. Nele, vamos verificar as duas 
variáveis e colocar esses pontos em um plano cartesiano. 
Vamos fazer um gráfico de dispersão com as variáveis peso e altura de um grupo de 6 pessoas: 
NOÇÕES DE PROBABILIDADE E ESTATÍSTICA EDITAL MASTER 
 
 
www.editalmaster.com.br 9 
 
 
 
 
Podemos ver que cada ponto representa o par peso/altura de um indivíduo, mas discutiremos isso mais 
profundamente posteriormente. 
 
Gráfico de Setores (Pizza) 
 
O gráfico de setores normalmente é usado para apresentar dados qualitativos como setores de um círculo 
(pedaços de uma pizza). Normalmente os dados são apresentados em percentuais, sendo que o total é 100% 
(360º). 
 
 
 
 
2. Medidas de tendência central (em dados brutos ou agrupados em classes): média 
aritmética, média geométrica, média ponderada, moda e mediana. 
 
Medidas de tendência central 
 
A Estatística trabalha com diversas informações que são apresentadas por meio de gráficos e tabelas e com 
diversos números que representam e caracterizam um determinado conjunto de dados. Dentre todas as 
informações, podemos retirar valores que representem, de algum modo, todo o conjunto. Esses valores são 
denominados “Medidas de Tendência Central ou Medidas de Centralidade”. 
NOÇÕES DE PROBABILIDADE E ESTATÍSTICA EDITAL MASTER 
 
 
www.editalmaster.com.br 10 
 
 
As medidas de centralidade que apresentaremos são a Média Aritmética, a Moda e a Mediana.Vamos mostrar a seguir o que vem a ser cada uma delas. 
 
Média Aritmética 
 
É uma das medidas de tendência central mais utilizadas no cotidiano. 
É determinada pelo resultado da divisão do somatório dos números dados pela quantidade de números somados. 
Por exemplo, vamos determinar a média dos números 3,12,23,15,2 
 
Para isso basta somarmos todos os números e dividirmos pela quantidade de números, ou seja: 
 
 
 
O cálculo da Média Aritmética é frequentemente usado nas escolas para efetuar a média final dos alunos, 
em campeonatos de futebol para se obter a média de gols de uma determinada rodada ou mesmo do 
campeonato; é também utilizado em diversas pesquisas estatísticas, pois determina o direcionamento das 
ideias expressas em determinados estudos. 
 
Média Aritmética Ponderada 
 
É uma Média Aritmética na qual alguns dos números envolvidos possuem “pesos”. 
Por exemplo, digamos que a média de uma etapa é dada pela média ponderada das notas das três primeiras 
provas, tomando peso 1 para a primeira prova, peso 2 para a segunda prova e peso 3 para a terceira prova. 
Neste caso, a Média Aritmética Ponderada é: 
 
 
 
 
Em outras palavras, a Média Aritmética Ponderada é uma Média Aritmética na qual você repete os números 
tantas vezes quantos são seus pesos. 
 
Média geométrica 
 
A média geométrica é uma medida estatística bastante utilizada em situações de aumentos sucessivos, fato 
muito comum em problemas financeiros. A média geométrica é obtida extraindo-se a raiz n-ésima da 
multiplicação dos n termos positivos de um rol. 
 
Fórmula da média geométrica 
 
Considere um rol formado por números reais positivos: x1, x2, x3, …, xn. 
 
A média geométrica desses n termos é dada pela raiz n-ésima do produto dos termos do rol. 
 
 
Veja que o índice n da raiz corresponde à quantidade de elementos do rol. 
NOÇÕES DE PROBABILIDADE E ESTATÍSTICA EDITAL MASTER 
 
 
www.editalmaster.com.br 11 
 
 
Como calcular a média geométrica? 
 
Para determinar a média geométrica, devemos substituir os valores do rol numérico na fórmula. Veja alguns 
exemplos: 
 
Exemplo 1 
Determine a média geométrica dos valores 2, 3, 4, 7. 
 
Aplicando na fórmula, temos: 
 
 
Exemplo 2 
Calcule a média geométrica e aritmética entre os valores 4 e 9. 
 
Sabemos que a média geométrica é calculada com base na raiz do produto dos valores, assim: 
 
 
 
A média aritmética é obtida somando-se os termos e o resultado, dividindo a soma pela quantidade de elementos. 
Assim: 
 
 
 
Diferença entre média aritmética e geométrica 
 
A média geométrica e a média aritmética são medidas de tendências centrais e são utilizadas em casos 
descritivos, isto é, em casos em que os dados são fornecidos em um rol numérico. 
 
A média geométrica é utilizada em casos nos quais os elementos do rol crescem de maneira sucessiva, como foi 
explicado. Já a média aritmética é utilizada em casos nos quais os elementos do rol variam de maneira não 
necessariamente crescente. Quando não apresenta repetição no conjunto de números analisado, utiliza-se a 
média aritmética simples: realizando-se o somatório de todos os elementos do rol e dividindo essa soma pela 
NOÇÕES DE PROBABILIDADE E ESTATÍSTICA EDITAL MASTER 
 
 
www.editalmaster.com.br 12 
 
quantidade de elementos. 
 
Quando há a repetição de valores no conjunto analisado, utiliza-se a média aritmética ponderada, realizando-se 
o cálculo semelhante ao da média aritmética simples: somando os elementos do rol e dividindo a soma pela 
quantidade de elementos. 
 
No entanto, como alguns elementos repetem-se, eles serão escritos em forma de multiplicação. Dessa forma, se 
um elemento X1 repete-se por K1 vezes, X2 repete-se por K2 vezes, X3 repete-se por K3 vezes, xn repete-se por 
kn vezes. Para calcular a média aritmética ponderada, utilizamos a seguinte fórmula. 
 
 
Exercícios 
 
Questão 1 – A média aritmética entre dois números é 20,5, enquanto a média geométrica é 20. Determine 
esses números. 
 
Resolução 
Como os números são desconhecidos, vamos nomeá-los a e b. Assim: 
 
Na primeira equação, podemos elevar ambos os lados ao quadrado, eliminando a raiz. 
a · b = 400 
 
Na segunda equação, podemos multiplicar cruzado, obtendo: 
a + b = 21 
 
Isolando a incógnita na equação anterior e substituindo-a na primeira, temos: 
a = 21 – b 
(21 – b) · b = 400 
– b2 + 21b – 400 = 0 
 
Utilizando-nos da fórmula de Bhaskara, temos: 
 
 
 
Como o valor do descriminante é negativo, podemos concluir que não existem valores de a e b que satisfazem 
a condição. 
 
Questão 2 – Determine o valor de x sabendo que a média geométrica entre x e 9 é 6. 
 
Resolução 
Substituindo as informações do enunciado na fórmula, temos: 
 
NOÇÕES DE PROBABILIDADE E ESTATÍSTICA EDITAL MASTER 
 
 
www.editalmaster.com.br 13 
 
Moda 
 
É a medida de tendência central que consiste no valor observado com mais frequência em um conjunto de 
dados. 
Por exemplo, digamos que o Palmeiras em determinado torneio de futebol fez, em dez partidas, a seguinte 
quantidade de gols: 
 
5, 4, 2, 1, 3, 7, 1, 1, 2 e 1 
 
Para essa sequência de gols marcados, a moda é de 1 gol, pois é o número que aparece mais vezes. 
Outra situação comum seria se dentre 7 pessoas tomássemos suas idades, a saber: 
 
15 anos, 20 anos, 32 anos, 13 anos, 5 anos, 43 anos e 90 anos. 
 
Nesse caso, não há moda, pois nenhuma idade se repetiu mais vezes que a outra. 
Observação: Quando um conjunto de dados não apresenta moda, dizemos que esse conjunto é amodal. Caso 
exista uma moda, denominamos o conjunto de Unimodal. 
 
Existindo duas modas, denominamos o conjunto de bimodal e assim sucessivamente. 
 
Mediana 
 
É a medida de tendência central que indica exatamente o valor central de um conjunto de dados quando 
organizados em ordem crescente ou decrescente. 
Por exemplo, vamos considerar que um aluno tirou as seguintes notas em cinco provas de uma determinada 
matéria: 
5, 8, 7, 4 e 8. 
 
Colocando as cinco notas em ordem crescente, por exemplo, obtemos 
 
4E ESTATÍSTICA EDITAL MASTER 
 
 
www.editalmaster.com.br 15 
 
 
Com a mediana é possível saber se a turma teve ou não um bom desempenho: 
uma mediana alta é sinônimo de bom rendimento da turma; mas se a mesma for baixa, é sinônimo de um 
baixo rendimento da turma. 
 
 
3) Já em relação à Moda, esse conjunto de dados possui Moda 6 pois essa é a nota que mais ocorre: cinco 
vezes. 
 
3. Medidas de Posição: quartis e percentis. 
 
São valores que separam o rol (os dados ordenados) em quatro (quartis), dez (decis) ou em cem (percentis) 
partes iguais. Note que para a sua correta aplicação, exige-se que os dados estejam organizados num rol. 
 
 
 
Quartis (Qi ) 
 
São valores que dividem o conjunto de dados ordenados (rol) em 4(quatro) partes iguais. 
 
Primeiro Quartil ( Q1) - valor situado de tal modo na série de dados que 25% das observações são menores 
que ele e 75% são maiores. 
Segundo Quartil (Q2) - valor situado de tal modo na série de dados que 50% das observações são menores 
que ele e 50% são maiores. 
Terceiro Quartil (Q3) - valor situado de tal modo na série de dados que 75% das observações são menores 
que ele e 25% são maiores. 
 
Decis (Di ) 
 
São valores que dividem o conjunto de dados ordenados (rol) em 10(dez) partes iguais. 
 
Primeiro Decil (D1) - valor situado de tal modo na série de dados que 10% das observações são menores que ele 
e 90% são maiores. 
 
Segundo Decil (D2 ) - valor situado de tal modo na série de dados que 20% das observações são menores que ele 
e 80% são maiores. 
 
Nono Decil ( D9) - valor situado de tal modo na série de dados que 90% das observações são menores que ele e 
10% são maiores. 
NOÇÕES DE PROBABILIDADE E ESTATÍSTICA EDITAL MASTER 
 
 
www.editalmaster.com.br 16 
 
 
 
 
 
 
Percentis ou Centis (Ci ) 
 
São valores que dividem o conjunto de dados ordenados (rol) em 100(cem) partes iguais. 
 
Primeiro Percentil (C1) - valor situado de tal modo na série de dados que 1% das observações são menores que 
ele e 99% são maiores. 
Segundo Percentil (C2) - valor situado de tal modo na série de dados que 2% das observações são menores que 
ele e 98% são maiores. 
Nonagésimo Nono Percentil (C99 ) - valor situado de tal modo na série de dados que 99% das observações são 
menores que ele e 1% são maiores. 
 
Cálculo dos Quartis, Decis e Percentis Roteiro para o cálculo: 
 
1º (Passo) Determinar as freqüências acumuladas (fac) da distribuição. 
2º (Passo) Calcular a posição do Quartil, Decil ou Percentil desejado, por uma das fórmulas. 
 
 
 
3º (Passo) Identificar a que classe que contém o Quartil, Decil ou Percentil desejado por meio da freqüência 
acumulada simples (fac ). 
 
4º (Passo) Calcular o Quartil, Decil ou Percentil desejado por meio de uma das fórmulas: 
 
• Para o Quartil: 
 
 
NOÇÕES DE PROBABILIDADE E ESTATÍSTICA EDITAL MASTER 
 
 
www.editalmaster.com.br 17 
 
• Para o Decil: 
 
 
 
• Para o Percentil 
 
 
Exemplo: os salários (em salário mínimo) de 160 professores de uma escola estão distribuídos conforme a tabela 
a seguir. Calcule o Q1 , D4 e o C85 e interprete os resultados. 
 
 
Solução: 
 
1º (Passo) Determinar as freqüências acumuladas (fac) da distribuição. 
2º (Passo) Calcular a posição do Quartil, Decil ou Percentil desejado, por uma das fórmulas 
 
 
 
3º (Passo) Identificar a que classe que contém o Quartil, Decil ou Percentil desejado por meio da freqüência 
acumulada simples (f ac ). Quartil (segunda classe); Decil (terceira Classe); Percentil (Quarta classe). 
NOÇÕES DE PROBABILIDADE E ESTATÍSTICA EDITAL MASTER 
 
 
www.editalmaster.com.br 18 
 
 
4º (Passo) Calcular o Quartil, Decil ou Percentil desejado por meio de uma das fórmulas: 
 
 
 
 
 
• Interpretação: 25% dos professores da escola ganham até 4 salários mínimos ou 75% dos professores ganham 
mais de 4 salários mínimos. 
 
 • Interpretação: 40% dos professores da escola ganham até 5,13 salários mínimos ou 60% dos professores 
ganham mais de 5,13 salários mínimos. 
 
 • Interpretação: 85% dos professores da escola ganham até 8,07 salários mínimos ou 15% dos professores 
ganham mais de 8,07 salários mínimos. 
 
4. Medidas de dispersão (em dados brutos ou agrupados em classes): amplitude, variância, 
desvio padrão e coeficiente de variação. 
 
Medidas de Dispersão 
 
Medidas de dispersão são parâmetros estatísticos usados para determinar o grau de variabilidade dos dados de 
um conjunto de valores. 
 
A utilização desses parâmetros tornam a análise de uma amostra mais confiável, visto que as variáveis de 
tendência central (média, mediana, moda) muitas vezes encondem a homogeneidade ou não dos dados. 
 
Por exemplo, vamos considerar que um animador de festas infantis selecione as atividades de acordo com a 
média das idades das crianças convidadas para uma festa. 
 
Vamos considerar as idades de dois grupos de crianças que irão participar de duas festas diferentes: 
NOÇÕES DE PROBABILIDADE E ESTATÍSTICA EDITAL MASTER 
 
 
www.editalmaster.com.br 19 
 
 
● Festa A: 1 ano, 2 anos, 2 anos, 12 anos, 12 anos e 13 anos 
● Festa B: 5 anos, 6 anos, 7 anos, 7 anos, 8 anos e 9 anos 
 
Em ambos os casos, a média é igual a 7 anos de idade. Entretanto, ao observar as idades dos participantes 
podemos admitir que as atividades escolhidas sejam iguais? 
 
Portanto, neste exemplo, a média não é uma medida eficiente, pois não indica o grau de dispersão dos dados. 
 
As medidas de dispersão mais usadas são: amplitude, variância, desvio padrão e coeficiente de variação. 
 
Amplitude 
Essa medida de dispersão é definida como a diferença entre a maior e a menor observação de um conjunto de 
dados, isto é: 
 
A = Xmaior – Xmenor 
 
Por ser uma medida que não leva em consideração como os dados estão efetivamente distribuídos, não é muito 
utilizada. 
 
Exemplo 
O setor de controle de qualidade de uma empresa seleciona ao acaso peças de um lote. Quando a amplitude 
das medidas dos diâmetros das peças ultrapassa 0,8 cm o lote é rejeitado. 
 
 
 
Considerando que em um lote foram encontrados os seguintes valores 2,1 cm; 2,0 cm; 2,2 cm; 2,9 cm; 2,4 
cm, esse lote foi aprovado ou rejeitado? 
 
Solução 
Para calcular a amplitude, basta identificar o menor e o maior valores, que neste caso, são 2,0 cm e 2,9 cm. 
Calculando a amplitude, temos: 
 
A = 2,9 - 2 = 0,9 cm 
 
Nesta situação o lote foi rejeitado, pois a amplitude ultrapassou o valor limite. 
 
 
NOÇÕES DE PROBABILIDADE E ESTATÍSTICA EDITAL MASTER 
 
 
www.editalmaster.com.br 20 
 
Variância 
A variância é determinada pela média dos quadrados das diferenças entre cada uma das observações e a 
média aritmética da amostra. O cálculo é feito com base na seguinte fórmula: 
 
 
Sendo, 
 
 
 
Exemplo 
 
Considerando as idades das crianças das duas festas indicadas anteriormente, vamos calcular a variância 
desses conjuntos de dados. 
 
Festa A 
 
 
Festa B 
 
 
Observe que apesar da média ser igual, o valor da variância é bem diferente, ou seja, os dados do primeiro 
conjunto são bem mais heterogêneos. 
 
NOÇÕES DE PROBABILIDADE E ESTATÍSTICA EDITAL MASTER 
 
 
www.editalmaster.com.br 21 
 
Desvio Padrão 
O desvio padrão é definido como a raiz quadrada da variância. Desta forma, a unidade de medida do desvio 
padrão será a mesma da unidade de medida dos dados, o que não acontece com a variância. 
 
Assim, o desvio padrão é encontrado fazendo-se: 
 
 
Quando todos os valores de uma amostra são iguais, o desvio padrão é igual a 0. Sendo que, quanto mais próximo 
de 0, menor é a dispersão dos dados. 
 
Exemplo 
Considerando ainda o exemplo anterior, vamos calcular o desvio padrão para as duas situações: 
 
 
 
Agora, sabemos que a variação das idades do primeiro grupo em relação a média é de aproximadamente 5 
anos, enquanto que a do segundo grupo é de apenas 1 ano. 
 
Coeficiente de Variação 
Para encontraro coeficiente de variação, devemos multiplicar o desvio padrão por 100 e dividir o resultado 
pela média. Essa medida é expressa em porcentagem. 
 
 
 
O coeficiente de variação é utilizado quando precisamos comparar variáveis que apresentam médias 
diferentes. 
 
Como o desvio padrão representa o quanto os dados estão dispersos em relação a uma média, ao comparar 
amostras com médias diferentes, a sua utilização pode gerar erros de interpretação. 
 
Desta forma, ao confrontar dois conjuntos de dados, o mais homogêneo será aquele que apresentar menor 
coeficiente de variação. 
 
Exemplo 
Um professor aplicou uma prova para duas turmas e calculou a média e o desvio padrão das notas obtidas. 
Os valores encontrados estão na tabela abaixo. 
 
 
 
Com base nesses valores, determine o coeficiente de variação de cada turma e indique a turma mais 
https://www.todamateria.com.br/desvio-padrao/
NOÇÕES DE PROBABILIDADE E ESTATÍSTICA EDITAL MASTER 
 
 
www.editalmaster.com.br 22 
 
homogênea. 
Solução 
Calculando o coeficiente de variação de cada turma, temos: 
 
Desta forma, a turma mais homogênea é a turma 2, apesar de apresentar maior desvio padrão. 
 
5. Probabilidade: experimento aleatório, espaço amostral, evento; espaços equiprováveis; 
probabilidade de Laplace; espaços não equiprováveis; teorema do produto; probabilidade 
condicional e independência; distribuição binomial. 
 
Probabilidade 
 
O estudo da probabilidade é de grande importância para a tomada de decisões em nossa sociedade. Conhecemos 
como probabilidade a área da matemática que estuda a chance de um determinado evento acontecer. 
 
A probabilidade conta com conceitos importantes, como experimento aleatório, evento, espaço amostral, e 
eventos equiprováveis. O valor da probabilidade é sempre um número entre 0 e 1 ou uma porcentagem entre 
0% e 100%, e é calculado com base na razão entre os casos favoráveis e os casos possíveis. 
 
O que é probabilidade? 
Perceber o comportamento de eventos aleatórios é de grande importância para a nossa sociedade, e a área de 
estudo conhecida como probabilidade faz a análise desses eventos para entender quais são as chances reais de 
eles ocorrerem. 
 
Há várias aplicações do estudo da probabilidade no cotidiano, um deles ocorre na pandemia de COVID-19, 
assim como pode ocorrer em outras possíveis futuras pandemias, nela ferramentas da estatística e da 
probabilidade são utilizadas para prever-se o comportamento da transmissão da doença nas próximas semanas. 
É também com base na probabilidade que se faz as estimativas para que os governadores e prefeitos tomem 
providências em relação ao afrouxamento ou endurecimento de medidas de isolamento social. 
 
Para compreender o cálculo da probabilidade, antes, precisamos dominar alguns conceitos, como espaço 
amostral, evento e experimento aleatório. 
 
 
https://mundoeducacao.uol.com.br/matematica/porcentagem.htm
https://mundoeducacao.uol.com.br/doencas/covid-19.htm
https://mundoeducacao.uol.com.br/matematica/estatistica.htm
https://mundoeducacao.uol.com.br/sociologia/isolamento-social.htm
NOÇÕES DE PROBABILIDADE E ESTATÍSTICA EDITAL MASTER 
 
 
www.editalmaster.com.br 23 
 
Experimento aleatório 
 
É o experimento que, ao ser realizado várias vezes nas mesmas condições, ainda sim, gera um resultado 
imprevisível. Estamos cercados de experimentos aleatórios no nosso cotidiano, por exemplo, ao 
realizarmos o lançamento de um dado comum, ainda que seja possível calcular a chance de cada um dos 
resultados ocorrer, é impossível termos, com precisão, o resultado do lançamento. Ao lançarmos o dado 
uma vez e obtermos, por exemplo, 1 como resultado, ao realizarmos um novo lançamento, respeitando as 
mesmas condições, o resultado continua sendo imprevisível, ele pode ou não ser 1 novamente. 
 
Há vários outros exemplos de experimentos aleatórios nas outras áreas de conhecimento, como na biologia, 
mais especificamente no estudo da genética. 
 
Espaço amostral 
 
É o conjunto de todos os resultados possíveis de um evento aleatório. Conhecido também como conjunto 
universo, o espaço amostral pode ser representado pelo símbolo grego Ω (lê-se: ômega). 
 
Em um experimento aleatório, conhecer o espaço amostral é essencial para que a gente consiga calcular a 
probabilidade desse evento acontecer. Por exemplo, em um lançamento de um dado normal, o espaço 
amostral será Ω: {1,2,3,4,5,6}, outra possibilidade é escolher uma vogal do alfabeto ao acaso, logo, nesse 
experimento aleatório, o espaço amostral será Ω:{a, e, i, o, u}. 
 
Ponto amostral 
 
É um elemento que pertence ao espaço amostral, ou seja, um entre os vários resultados possíveis do experimento 
aleatório. Por exemplo, ao lançar-se uma moeda para o alto, o resultado coroa é um ponto amostral assim como 
o resultado cara, a depender de qual dos lados aparece após a queda do objeto. Dessa forma, um ponto amostral 
de um experimento aleatório nada mais é do que um dos seus resultados possíveis. 
 
Evento 
 
É qualquer subconjunto do espaço amostral. O evento pode ser representado utilizando-se notação de conjuntos, 
ou seja, por letras maiúscula. Geralmente o evento é o conjunto de resultados satisfatórios, ou seja, é um 
subconjunto do espaço amostral que contém os elementos com os quais se calcula a probabilidade 
 
Exemplo: 
 
Em um experimento aleatório, será sorteado ao acaso um estado brasileiro. Nesse experimento podemos tirar 
vários possíveis eventos, por exemplo, podemos pensar no resultado ser um estado do Sul, logo, meu evento 
pode ser representado pelo conjunto A: {Rio Grande do Sul, Paraná, Santa Catarina}. Outro possível evento é 
o conjunto de estados cujos nomes comecem com a letra s, nesse caso o evento será o conjunto B: {Santa 
Catarina, Sergipe, São Paulo}. 
 
● Evento certo 
 
É o que possui 100% de chance de ocorrer. Exemplo: 
Ao lançarmos um dado e observarmos, após a queda, sua face superior, um evento certo é que encontraremos 
nela um número menor que 7, logo, meu conjunto E será {1,2,3,4,5,6}, pois, ao lançar-se um dado, não existe 
https://mundoeducacao.uol.com.br/matematica/probabilidade-genetica.htm
https://mundoeducacao.uol.com.br/matematica/subconjuntos-relacao-inclusao.htm
NOÇÕES DE PROBABILIDADE E ESTATÍSTICA EDITAL MASTER 
 
 
www.editalmaster.com.br 24 
 
outra opção a não ser um desses resultados, o que torna esse evento certo. 
 
● Evento impossível 
 
É aquele que possui 0% de chance de ocorrer, ou seja, que não ocorrerá. 
 
Exemplo: 
 
Utilizando-se do mesmo experimento de lançamento de um dado comum, um evento impossível será obter-se 
um número maior que 6. 
 
Cálculo da probabilidade 
 
Todos os conceitos vistos são essenciais para compreender-se o cálculo da probabilidade. Dado um 
experimento aleatório, calculamos a chance de um determinado evento ocorrer, essa probabilidade é dada 
pela razão entre o número de elementos do meu conjunto evento, ou seja, o número de casos favoráveis 
sobre o número de elementos no meu espaço amostral, ou seja, o número de casos possíveis. 
 
 
 
Observações: 
 
● A probabilidade pode ser representada como fração, como porcentagem ou como número 
decimal. 
● A probabilidade é sempre um número decimal entre 0 e 1, ou uma porcentagem entre 0% e 
100%. 
● Se P(A) = 0 então A é um evento impossível. 
● Se P(A) = 1 então A é um evento certo. 
 
Exemplo: 
 
Uma urna contém bolas brancas, vermelhas e verdes. Sabendo-se que nela há 12 bolas brancas, 8 vermelhas 
e que as 5 restantes são brancas, se uma bola for retirada ao acaso, qual é a probabilidade de que ela seja: 
 
a) Branca 
 
Nosso evento A é → sair uma bola branca. Sabemos que n(A) = 12, ou seja, há 12 casos favoráveis. 
 
Nosso espaço amostral possui um total de 12 + 8 + 5 
= 25, então n(Ω) = 25. 
 
Dessa forma, a probabilidade de o evento A ocorrer pode ser representada por: 
https://mundoeducacao.uol.com.br/matematica/fracao.htmNOÇÕES DE PROBABILIDADE E ESTATÍSTICA EDITAL MASTER 
 
 
www.editalmaster.com.br 25 
 
 
 
 
b) Não branca 
 
Nosso evento B é → sair uma bola não branca. Sabemos que n(B) = 13. 
 
Como o espaço amostral continua o mesmo, então n(Ω) = 25. 
 
 
Espaços amostrais equiprováveis 
 
Em um espaço amostral, os eventos podem ser equiprováveis ou não, eles são considerados equiprováveis 
quando possuem a mesma chance de ocorrer. 
 
Exemplo: 
 
Considere mais uma vez o experimento do lançamento de um dado, sabemos que a probabilidade do seu lado 
superior ser 1, 2, 3, 4, 5 ou 6 é de 1 em 6, logo, nesse caso, temos um espaço amostral equiprovável, ou seja, 
com pontos amostrais que possuem a mesma chance de ocorrer. 
 
Exemplo: 
 
Agora vamos considerar o seguinte experimento: serão lançados dois dados e a soma das faces superiores será 
anotada. 
 
Vamos construir uma tabela para analisar os possíveis resultados: 
 
 
 
Analisando os resultados possíveis (no espaço amostral há 36 possibilidades), perceba que a probabilidade de 
sair 7 nesse experimento é de 6 em 36 e que a probabilidade de sair 10 é de 3 em 36, logo, nesse caso, o espaço 
amostral não é equiprovável. 
 
NOÇÕES DE PROBABILIDADE E ESTATÍSTICA EDITAL MASTER 
 
 
www.editalmaster.com.br 26 
 
Teorema de Bayes & Probabilidade 
 
Passo a passo de como calcular probabilidades condicionais 
 
Se 2 eventos não forem independente uma das mais famosas maneiras de se calcular a possibilidade de 
ocorrência de um evento é por meio da alteração das probabilidades condicionais. Mas vamos partir desde 
o princípio, revendo os conceitos básicos de probabilidade e probabilidade condicional para por fim 
entendermos o Teorema de Bayes por completo. 
 
Probabilidade: 
 
A probabilidade é uma forma de quantificar a incerteza associada a uma amostra escolhida dentro de um 
conjunto universo. Vamos descrever isso da seguinte forma: 
 
 
Usando a teoria da probabilidade vista acima, é possível construir modelos probabilísticos com aplicações 
muito interessantes no cotidiano. 
 
Dependência e Independência: 
 
Vamos se dizer que existam 2 eventos (A e B), e que se o acontecimento de A nos dar informações sobre a 
ocorrência de B (ou mesmo ao contrário) iremos dizer que esses eventos são dependentes. Mas se a 
ocorrência de um não nos informar nada sobre o outro, podemos considerá-los como independentes. 
 
 
Se 2 eventos não forem independentes, podemos considerá-los como dependentes. Por exemplo, se 
tomarmos que A e B são dependentes, podemos dizer que “o evento A está condicionado ao evento B” e 
descrevemos isso da seguinte forma:: Imagine um jogo de cara ou coroa com uma moeda não viciada, em 
que a moeda vai ser lançada 2 vezes. O resultado de se jogar a moeda na primeira rodada não afeta o 
resultado de se jogar a moeda pela segunda vez. Podemos considerar que o evento de se jogar a primeira 
moeda é independente do evento de se jogar a segunda. Mas o resultado de se jogar a primeira moeda nos 
dá informações sobre o resultado final das duas partidas. (isso mostra que o evento do resultado final das 
partidas é dependente do evento de se jogar a primeira moeda) 
 
Podemos descrever matematicamente a independência entre dois eventos apenas multiplicando a probabilidade 
de cada um deles ocorrer, ou seja: 
 
 
Probabilidade Condicional: 
 
Se 2 eventos não forem independente, podemos considerá-los como dependentes. Por exemplo, se tomarmos 
que A e B são dependentes, podemos dizer que “o evento A está condicionado ao evento B” e descrevemos 
isso da seguinte forma: 
 
 
 
NOÇÕES DE PROBABILIDADE E ESTATÍSTICA EDITAL MASTER 
 
 
www.editalmaster.com.br 27 
 
Se A e B são 2 eventos na mesma amostra, então probabilidade condicional pode ser descrita da forma acima 
SOMENTE SE P(B) FOR DIFERENTE DE 0. 
 
Isso pode ser lido também como “Uma vez que conhecemos o evento A sabemos que B acontece”. 
 
Exemplo: Vamos jogar um dado não viciado. O evento A é jogar o dado e cair um número ímpar {1, 3, 5}. Já o 
evento B é jogar um dado e cair um número menor ou igual a 3 {1, 2, 3}. As perguntas lançadas são:Qual o 
valor de P(A)? 
 
 
E de A dado que B ocorreu, ou seja P(A|B) ? 
 
 
Regras especiais: 
 
● Probabilidade Complementar: 
Em probabilidade, todo evento tem seu complementar. Vamos supor, o evento A é 
complementado pelo evento não A (¬A) em um espaço amostral S. Um bom exemplo é usar os 
números de um dado, onde o conjunto A é representado pelos números pares e o complementar 
de A os números ímpares: 
 
 
NOÇÕES DE PROBABILIDADE E ESTATÍSTICA EDITAL MASTER 
 
 
www.editalmaster.com.br 28 
 
 
● Complementar usando condicional: Usando um axioma (verdade 
inquestionável) da probabilidade, é definido que P(¬A|B) = 1 - P(A|B). Isso acontece pelo 
momento que da fórmula de probabilidade condicionada em que acontece a interseção dos 
conjuntos. Vamos ver isso usando o mesmo exemplo dos dados como 
no tópico anterior: 
 
 
 
● A e B disjuntos: 
Quando 2 eventos são disjuntos, é o mesmo que dizer que eles não podem acontecer ao mesmo 
tempo, logo a interseção entre eles é um conjunto vazio: 
 
 
 
 
 
 
● B é um subconjunto de A. (B ⊂ A): Então qualquer coisa que acontecer em B, também 
aconteceu em A. Sendo assim, se B é um subconjunto de A então P(A|B) tem 100% de chances 
de ocorrer: 
 
NOÇÕES DE PROBABILIDADE E ESTATÍSTICA EDITAL MASTER 
 
 
www.editalmaster.com.br 29 
 
 
 
 
 
● A é um subconjunto de B. (A ⊂ B): se A é um subconjunto de B, então qualquer coisa que 
acontecer em A, também aconteceu em B, logo: 
 
 
 
Exemplo: Uma família com 2 filhos desconhecidos. Presumimos que: 
 
1. É igualmente possível que cada criança seja menino ou menina. 
2. O gênero da segunda criança é independente do gênero da primeira, então o evento “nenhuma 
menina” tem a probabilidade de 1/4, o evento “uma menina e um menino” tem probabilidade de 1/2 
e “duas meninas” tem 1/4. 
 
Agora, qual a probabilidade do evento “duas crianças são meninas” (X) ser condicionada pelo evento (Y) “a 
criança mais velha é uma menina” ? 
 
Note que a probabilidade das 2 crianças serem meninas existe dentro da probabilidade da mais velha ser uma 
menina, isso indica que (X ⊂ Y).E usando a probabilidade condicional descobriremos o resultado: 
NOÇÕES DE PROBABILIDADE E ESTATÍSTICA EDITAL MASTER 
 
 
www.editalmaster.com.br 30 
 
 
 
Também podemos perguntar da probabilidade de “as duas crianças são meninas” (X) ser condicionada ao 
evento “ao menos uma das crianças é menina”(Z). 
 
Se ambas são meninas, é verdade que uma delas é menina, assim vemos que (X⊂ Z). A probabilidade de P(Z) 
é a soma das probabilidades de “um menino e uma menina” e “duas meninas”. E assim temos: 
 
 
Cadeia Codicional de Probabilidade 
 
O último tópico que precisamos saber antes de entender por completo o Teorema de Bayes é a Cadeia 
Condicional de probabilidade, que basicamente é a possibilidade de dividir a probabilidade de um evento 
usando a probabilidade condicional. 
 
A probabilidade de um evento A ocorrer é composto pela soma da sua probabilidade condicionada em B 
e da sua probabilidade condicionada em ¬B. 
 
E por sua vez, a probabilidade total do evento é a soma das probabilidades de A e de ¬A. Vamos descrever 
isso visualmente: 
 
O que o diagrama tenta descrever é que, a probabilidade de um evento acontecer é esse evento condicionado 
a um segundo evento OU condicionado 
ao complementar deste segundo evento, por isso usamos a soma para decompor os valores. 
NOÇÕES DE PROBABILIDADE E ESTATÍSTICA EDITAL MASTER 
 
 
www.editalmaster.com.br 31 
 
 
Vamos ilustrar isso com um problema. Uma moeda não viciada vai ser lançada 2 vezes e vamos acompanhar 
a ocorrência das jogadas usando a cadeia condicionada. Repare que a segunda linha representa a sua 
possibilidade dada a ocorrência da primeira:Teorema de Bayes 
 
A ideia principal do Teorema de Bayes é inverter as probabilidades condicionais. Por exemplo, queremos saber 
a probabilidade P(X|Y) mas conhecemos apenas a probabilidade de P(Y|X). 
 
Antes, vamos reescrever a nossa fórmula da probabilidade condicional para utilizarmos de uma forma melhor. 
Vamos passar o denominador multiplicando para o outro lado da equação: 
 
 
Dado que conhecemos P(A|B), queremos descobrir P(B|A), para isso vamos usar o que aprendemos com a 
variação da regra da probabilidade condicional e montar a tão famosa fórmula do Teorema de Bayes: 
NOÇÕES DE PROBABILIDADE E ESTATÍSTICA EDITAL MASTER 
 
 
www.editalmaster.com.br 32 
 
 
 
 
Exemplo: 
 
Vamos a um típico problema que o Teorema de Bayes é usado: Uma certa doença afeta 1 a cada 10,000 
pessoas. Existe um teste para verificar se a pessoa possui a doença ou não. 
 
Desse problema sabemos que: 
 
 
● A probabilidade do teste dar positivo, dado que a pessoa não tem a doença é de 2%. 
● A probabilidade do teste dar negativo, dado que a pessoa possui a doença é de apenas 1%. 
 
Se uma pessoa aleatória fizer o teste da doença e der positivo, qual é a probabilidade de que a pessoa tenha 
a doença ? 
 
Vamos dizer que D é o evento em que a pessoa tenha a doença, e que T seja o evento em que o teste tenha 
dado positivo. Logo queremos descobrir P(D|T). 
 
Até então conhecemos: 
 
 
● P(D) = 0.0001 
● P(T|¬D) = 0.02 
● P(¬T|D) = 0.01 
 
 
E com apenas essas informações podemos usar o Teorema de Bayes da seguinte forma: 
 
Primeiro vamos decompor os valores que iremos usar com base no que conhecemos, aqui vamos o pôr em 
prática o complementar usando condicional. 
 
 
 
 
NOÇÕES DE PROBABILIDADE E ESTATÍSTICA EDITAL MASTER 
 
 
www.editalmaster.com.br 33 
 
 
 
 
Logo, vamos reescrever P(T) de uma forma que conhecemos os valores. Aqui usaremos a cadeia da 
probabilidade condicionada: 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
NOÇÕES DE PROBABILIDADE E ESTATÍSTICA EDITAL MASTER 
 
 
www.editalmaster.com.br 34 
 
 
Vamos aplicar tudo em cima da fórmula do Teorema de Bayes e descobrir o resultado de P(D|T): 
 
 
 
Solucionando o problema com o Teorema de Bayes 
 
Com isso podemos responder que as pessoas que obtiveram o teste com resultado positivo e possuem a 
doença representam menos de meio por cento. 
 
Uma explicação detalhada que podemos fazer, é que, de uma população com 1,000,000 pessoas, é esperado 
que apenas 100 delas tivessem a doença. E que 99 (0.5% da população) dessas 100 pessoas com a doença, 
tenha obtido o resultado do teste como positivo. 
 
Já olhando para as outras 999,900 pessoas que não tiveram a doença, é esperado que 9,999 de seus testes 
mostrassem resultados positivo. 
 
Ao todo, era esperado que houvesse 10,098 testes positivos, mas que apenas 99 deles fossem realmente de 
pessoas com a doença. 
 
População e amostra 
 
Em pesquisa de mercado, o termo “população” refere-se ao conjunto de elementos que estão sendo 
estudados ou analisados em determinado estudo ou 
pesquisa. É o grupo de interesse sobre o qual se deseja obter informações e conclusões. A população em 
pesquisa de mercado pode ser definida de várias maneiras, dependendo dos objetivos do estudo e do escopo 
da pesquisa. 
Por exemplo, em uma pesquisa de mercado sobre preferências de consumo de café no Brasil, a 
NOÇÕES DE PROBABILIDADE E ESTATÍSTICA EDITAL MASTER 
 
 
www.editalmaster.com.br 35 
 
população pode ser definida como todos os consumidores de café residentes no país. Em uma pesquisa sobre 
opiniões políticas, a população pode ser todos os eleitores registrados em uma determinada região. Em uma 
pesquisa sobre hábitos de compra online, a população pode ser definida como todos os consumidores que 
fizeram compras online nos últimos seis meses. 
 
É importante definir claramente a população em uma pesquisa de mercado, pois é a base para a seleção de uma 
amostra representativa, que é um subconjunto da população que é realmente pesquisado. A partir dos dados 
coletados da amostra, são feitas inferências e generalizações para a população como um todo. A escolha 
cuidadosa da população e da amostra é fundamental para garantir a validade e a confiabilidade dos resultados 
de uma pesquisa de mercado. 
 
O que é uma amostra? 
 
Uma amostra é a menor parte do total, ou seja, um subconjunto de toda a população. Quando são realizadas 
pesquisas, a amostra são os membros da população convidados a participar da pesquisa. Simplificando, uma 
amostra é um subgrupo ou subconjunto da população, que pode ser estudado para investigar as características 
ou o comportamento dos dados da população. 
 
As amostras de dados são criadas usando vários métodos de pesquisa, como amostragem probabilística e 
amostragem não probabilística. Os métodos de amostragem variam de acordo com os tipos de pesquisa e a 
qualidade das informações necessárias. Por exemplo: 
 
Uma empresa de comida para gatos gostaria de conhecer todas as lojas de animais em que pode vender. A 
empresa possui dados da população sobre o número total de lojas de animais em uma cidade específica. Agora, 
esse fabricante de alimentos para animais de estimação pode criar uma amostra de pesquisa on-line 
selecionando apenas lojas de animais que vendem alimentos para gatos. 
 
Os dados podem ser estudados para várias características e os resultados podem ser mostrados em estatísticas 
e relatórios para uma melhor compreensão do negócio. Usando os dados da amostra, a empresa pode descobrir 
maneiras de expandir seus negócios para atingir a população total de lojas de animais. 
 
Diferença entre população e amostra 
 
Geralmente, uma amostra da população é usada na pesquisa, uma vez que é mais fácil e mais lucrativo 
processar um subconjunto menor em vez de todo o grupo População e amostra são conceitos relacionados 
em pesquisas e estudos, mas se diferem em termos de escopo e representatividade. 
 
● População: A população é o conjunto completo de todos os elementos que estão sendo estudados 
ou analisados em uma pesquisa ou estudo. É o grupo de interesse que se deseja investigar e do 
qual se busca obter informações. Por exemplo, em uma pesquisa de mercado sobre hábitos de 
compra de smartphones no Brasil, a população pode ser definida como todos os consumidores de 
smartphones residentes no país. 
● Amostra: A amostra é um subconjunto selecionado da população que é efetivamente estudado 
ou analisado. É uma parcela representativa da população que é usada para coletar dados e fazer 
inferências para o todo. A amostra é uma forma prática e viável de obter informações sobre a 
população em estudos de pesquisa, uma vez que é geralmente mais rápida e econômica do que 
estudar a população inteira. 
 
A principal diferença entre população e amostra é que a população é o conjunto completo de todos os 
elementos que estão sendo estudados, enquanto a amostra é uma porção selecionada dessa população. A 
amostra é escolhida de forma a ser representativa da população em termos de características relevantes 
https://www.questionpro.com/blog/pt-br/melhores-praticas-pesquisa-mercado/
https://www.questionpro.com/blog/pt-br/melhores-praticas-pesquisa-mercado/
https://www.questionpro.com/blog/pt-br/melhores-praticas-pesquisa-mercado/
https://www.questionpro.com/blog/pt-br/amostragem-probabilistica/
https://www.questionpro.com/blog/pt-br/amostragem-probabilistica/
https://www.questionpro.com/blog/pt-br/amostragem-probabilistica/
https://www.questionpro.com/pt-br/mobile-diaries.html
https://www.questionpro.com/pt-br/mobile-diaries.html
https://www.questionpro.com/pt-br/mobile-diaries.html
NOÇÕES DE PROBABILIDADE E ESTATÍSTICA EDITAL MASTER 
 
 
www.editalmaster.com.br 36 
 
para o estudo, como idade, sexo, região geográfica, etc. Através da análise dos dados obtidos na amostra, 
é possível fazer inferências sobre a população como um todo,desde que a amostra seja representativa e o 
tamanho adequado para permitir a generalização dos resultados. 
 
Razões para usar uma amostra de respondentes 
 
Há várias razões para usar uma amostra de respondentes em pesquisas e estudos, em vez de estudar toda a 
população de interesse. Algumas dessas razões incluem: 
 
1. Eficiência e economia: Estudar uma população inteira pode ser impraticável, demorado e 
custoso. A utilização de uma amostra permite coletar dados de uma parcela menor da população, 
o que pode ser mais eficiente em termos de tempo, recursos e custos. 
2. Viabilidade: Em alguns casos, estudar a população inteira pode não ser possível devido a restrições 
logísticas, geográficas, financeiras ou de outra natureza. A amostragem permite contornar essas 
limitações, tornando o estudo viável e possível de ser realizado. 
3. Representatividade: A seleção cuidadosa de uma amostra pode resultar em uma parcela 
representativa da população de interesse. Isso significa que os resultados obtidos a partir da amostra 
podem ser generalizados para a população como um todo, desde que a amostra seja representativa 
em termos das características relevantes para o estudo. 
4. Praticidade: Trabalhar com uma amostra pode ser mais prático em termos de logística, coleta de 
dados e análise de dados. O gerenciamento de uma amostra pode ser mais simples e eficiente em 
comparação com a gestão de uma população inteira. 
5. Redução de viés: A utilização de uma amostra permite controlar e minimizar a introdução de viés 
na coleta e análise dos dados. A seleção aleatória ou estratificada da amostra pode ajudar a reduzir o 
viés de seleção e tornar os resultados mais confiáveis. 
6. Ética: Em alguns casos, estudar toda a população pode levantar questões éticas, como invasão de 
privacidade ou exposição excessiva dos participantes. O uso de uma amostra pode ser uma 
abordagem mais ética, desde que sejam seguidos os princípios éticos de pesquisa e os interesses dos 
participantes sejam protegidos. 
 
Em resumo, o uso de uma amostra de respondentes em pesquisas e estudos pode ser uma abordagem eficiente, 
viável, representativa e ética para coletar dados e obter insights sobre uma população de interesse. A seleção 
cuidadosa da amostra e a aplicação de métodos de amostragem apropriados são fundamentais para garantir a 
validade e a confiabilidade dos resultados obtidos. 
 
Outros bons motivos pelos quais você deve usar uma amostra durante uma investigação de mercado são: 
 
É prática 
 
Na maioria dos casos, uma população pode ser muito grande para o pesquisador coletar dados precisos, 
considerando a limitação de tamanho. As amostras permitem aos pesquisadores coletar dados que podem 
ser analisados para fornecer informações a toda a população. 
 
Oferece dados urgentes entre a população e amostra 
 
Quando se trata de uma investigação, a quantidade de tempo disponível pode ser um fator definitivo para 
um estudo. Uma amostra oferece um conjunto menor que fornece dados que podem ser usados para 
representar toda a população. A aplicação de uma pesquisa a uma amostra menor, diferentemente de toda 
a população, pode economizar um tempo precioso aos pesquisadores. 
 
 
NOÇÕES DE PROBABILIDADE E ESTATÍSTICA EDITAL MASTER 
 
 
www.editalmaster.com.br 37 
 
É rentável 
 
O custo da realização da pesquisa é frequentemente um parâmetro para o estudo. Os pesquisadores devem 
fazer todo o possível com os recursos disponíveis para realizar um estudo e obter uma visão precisa. A 
realização de um estudo em uma amostra representativa de uma população é rentável, pois requer menos 
recursos, como computadores, pesquisadores, entrevistados, servidores e centros de coleta de dados. 
 
É representada com precisão 
 
Dependendo do método de amostragem, a pesquisa realizada em uma amostra pode ser precisa e com menos 
riscos de falta de resposta do que se fosse realizada por meio de um censo. Uma amostra selecionada usando 
o método sem probabilidade é uma representação precisa da população. Os dados coletados podem ser 
usados para obter informações sobre toda a população. 
 
Oferecer estatísticas dedutivas entre a população e amostra 
 
A estatística inferencial é um processo pelo qual dados representativos são usados para inferir ideias sobre 
toda a população. Eles são baseados no conceito de uso de dados coletados de uma amostra para deduzir 
dados que representam toda a população. As estatísticas inferenciais podem ser coletadas apenas usando 
amostras de dados. 
É mais preciso que um censo 
 
Um censo de uma população inteira nem sempre fornece dados precisos devido a erros como inconsistência 
nas respostas ou falta de resposta. No entanto, uma amostra cuidadosamente obtida elimina esse risco e oferece 
dados mais precisos; o que representa adequadamente a população. 
 
É gerenciável 
 
Às vezes, é quase impossível coletar uma população inteira de dados, já que algumas populações são muito 
difíceis de obter. Nesse caso, uma amostra pode ser usada para representar o estudo, uma vez que é viável e 
acessível. Apesar da diferença entre população e amostra, ambos são relacionados entre si, ou seja, são retiradas 
amostras da população. O principal objetivo da amostra é fazer inferências estatísticas sobre a população. Sem 
população, as amostras não podem existir. Quanto melhor a qualidade da amostra, maior o nível de precisão da 
generalização. 
 
Correlação Linear simples 
 
Em pesquisas, freqüentemente, procura-se verificar se existe relação entre duas ou mais variáveis, isto é, saber 
se as alterações sofridas por uma das variáveis são acompanhadas por alterações nas outras. Por exemplo, peso 
vs. idade, consumo vs. renda, altura vs. peso, de um indivíduo. 
 
O termo correlação significa relação em dois sentidos (co + relação), e é usado em estatística para designar a 
força que mantém unidos dois conjuntos de valores. A verificação da existência e do grau de relação entre as 
variáveis é o objeto de estudo da correlação. 
 
Uma vez caracterizada esta relação, procura-se descrevê-la sob forma matemática, através de uma função. A 
estimação dos parâmetros dessa função matemática é o objeto da regressão. 
 
Os pares de valores das duas variáveis poderão ser colocados num diagrama cartesiano chamado “diagrama de 
dispersão”. A vantagem de construir um diagrama de dispersão está em que, muitas vezes sua simples 
observação já nos dá uma idéia bastante boa de como as duas variáveis se relacionam. 
NOÇÕES DE PROBABILIDADE E ESTATÍSTICA EDITAL MASTER 
 
 
www.editalmaster.com.br 38 
 
 
Uma medida do grau e do sinal da correlação é dada pela covariância entre as duas variáveis aleatórias X e Y 
que é uma medida numérica de associação linear existente entre elas, e definida por: 
 
 
 
 
 
 
 
 
 
 
onde: as somas de quadrados são: 
 
 
n = número de pares das observações. 
 
A partir de X e Y são determinadas todas as somas necessárias para este cálculo: 
 
 
 
O coeficiente de correlação rxy linear é um número puro que varia de –1 a +1 e sua interpretação dependerá 
do valor numérico e do sinal, como segue: 
 
 
 
 
 
NOÇÕES DE PROBABILIDADE E ESTATÍSTICA EDITAL MASTER 
 
 
www.editalmaster.com.br 39 
 
 
 
 
 
*possui o mesmo significado para os casos negativos ou positivos. 
 
Análise do Diagrama de Dispersão 
 
O diagrama de dispersão mostrará que a correlação será tanto mais forte quanto mais próximo estiver o 
coeficiente de –1 ou +1, e será tanto mais fraca quanto mais próximo o coeficiente estiver de zero. 
 
Correlação perfeita negativa (rxy = -1): Quando os pontos estiverem perfeitamente alinhados, mas em sentido 
contrário, a correlação é denominada perfeita negativa. 
 
Correlação negativa (-1de X 
associados a valores crescentes de Y 
 
Correlação nula (rxy = 0): Quando não houver relação entre as variáveis X e Y, ou seja, quando os valores de X 
e Y ocorrerem independentemente, não existe correlação entre elas. 
 
Correlação positiva (0

Mais conteúdos dessa disciplina