Prévia do material em texto
ESTATÍSTICA
Resumo para Concurso da
CEBRASPE
CONTEÚDOS:
1 Estatística descritiva e análise exploratória de dados: gráficos, diagramas, tabelas, medidas descritivas
(posição, dispersão, assimetria e curtose). 2 Probabilidade. 2.1 Probabilidade e Probabilidade Condicional.
2.2 Conceitos básicos de probabilidade. 2.3 Cálculo de probabilidades condicionais. 2.4 Definições básicas
e axiomas. 2.5 Probabilidade condicional e independência. 2.6 Variáveis aleatórias discretas e contínuas. 2.7
Distribuição de probabilidades. 2.8 Função de probabilidade. 2.9 Função densidade de probabilidade. 2.10
Esperança e momentos. 2.11 Distribuições especiais. 2.12 Distribuições condicionais e independência. 2.13
Transformação de variáveis. 2.14 Leis dos grandes números. 2.15 Teorema central do limite. 2.16 Amostras
aleatórias. 2.17 Distribuições amostrais. 2.18 Independência de Eventos, Regra de Bayes e Teorema da
Probabilidade Total. 2.19 Conceito de independência. 2.20 Aplicação da regra de Bayes. 2.21 Uso do
teorema da probabilidade total. 2.21 Variáveis Aleatórias e Funções de Probabilidade. 2.21.1 Definição e
exemplos de variáveis aleatórias. 2.21.2 Função de probabilidade (para variáveis discretas) e função
densidade de probabilidade (para variáveis contínuas). 2.22 Principais Distribuições de Probabilidade
Discretas e Contínuas. 2.22.1 Distribuição uniforme. 2.22.2 Distribuição de Bernoulli. 2.22.3 Distribuição
binomial. 2.22.4 Distribuição normal. 2.23 Medidas de Tendência Central. 2.23.1 Média (aritmética,
ponderada, geométrica e harmônica). 2.23.2 Mediana. 2.23.3 Moda. 2.24 Medidas de Dispersão. 2.24.1
Amplitude. 2.24.2 Variância. 2.24.3 Desvio padrão. 2.24.4 Coeficiente de variação. 2.25 Coeficiente de
Correlação de Pearson. 2.25.1 Conceito e cálculo da correlação entre duas variáveis. 2.26 Teorema Central
do Limite. 2.26.1 Importância do teorema para a distribuição amostral da média. 2.27 Regra Empírica
(Regra dos Três Sigma) da Distribuição Normal. 2.27.1 Aproximação da dispersão dos dados na distribuição
normal. 2.28 Técnicas de Amostragem. 2.29 Amostragem aleatória simples, estratificada, sistemática e por
conglomerados. 2.29.1 Conceitos básicos para determinação do tamanho amostral. 3 Inferência estatística.
3.1 Estimação pontual: métodos de estimação, propriedades dos estimadores, suficiência. 3.2 Estimação
intervalar: intervalos de confiança, intervalos de credibilidade. 3.3 Testes de hipóteses: hipóteses simples e
compostas, níveis de significância e potência de um teste, teste t de Student, teste qui0quadrado. 4 Análise
de regressão linear. 4.1 Critérios de mínimos quadrados e de máxima verossimilhança. 4.2 Modelos de
regressão linear. 4.3 Inferência sobre os parâmetros do modelo. 4.4 Análise de variância. 4.5 Análise de
resíduos. 5 Técnicas de amostragem: amostragem aleatória simples, estratificada, sistemática e por
conglomerados. 5.1 Tamanho amostral.
JÚLISON OLIVEIRA
MESTRECONCURSOS.COM.BR 1
Licenciado para - S
abata freire - 34885378893 - P
rotegido por E
duzz.com
Chega de Conteúdos gigantescos.
Estude com inteligência. Seja
Mestre Concursos!
A preparação que respeita seu tempo e entrega resultados.
Conheça nossos cursos:
Nossos Cursos
Conheça nossos resumos:
Nossos Resumos
Nosso Instagram:
Instagram do Mestre
MESTRECONCURSOS.COM.BR 2
Licenciado para - S
abata freire - 34885378893 - P
rotegido por E
duzz.com
https://mestreconcursos.com.br/
https://loja.mestreconcursos.com.br/
https://www.instagram.com/mestre.concursos
Estatística Descritiva e Análise Exploratória de Dados
1
Representações Gráficas
Ferramentas visuais que sintetizam
informações:
Gráficos de barras e colunas:
comparação entre categorias
Gráficos de linhas: evolução
temporal
Gráficos de setores: proporções
ou percentuais
Histogramas: distribuição de
frequências
Box-plot: distribuição, dispersão
e outliers
2
Tabelas
Organização sistemática de dados:
Tabelas de frequência simples
Tabelas de frequência por classe
Tabelas de contingência (ou
cruzada)
Tabelas de distribuição de
frequências
3
Medidas Descritivas
Estatísticas que resumem conjuntos
de dados:
Posição: média, mediana, moda,
quartis, percentis
Dispersão: amplitude, variância,
desvio padrão, coeficiente de
variação
Assimetria: coeficiente de
assimetria (skewness)
Curtose: grau de achatamento
da distribuição
A estatística descritiva fornece métodos para organizar, resumir e apresentar dados de forma clara e objetiva. Compreender
como interpretar essas medidas é fundamental para análise exploratória.
Observação: O CEBRASPE costuma explorar a interpretação de gráficos e tabelas, especialmente a identificação de
medidas como média, mediana e desvio padrão a partir de representações visuais.
Lembre-se que a assimetria pode ser positiva (cauda à direita), negativa (cauda à esquerda) ou nula (distribuição simétrica). Já a
curtose classifica as distribuições em mesocúrtica (normal), leptocúrtica (mais pontiaguda) ou platicúrtica (mais achatada).
Dica: Em questões da CEBRASPE, fique atento à relação entre média, mediana e moda em distribuições assimétricas.
Na assimetria positiva: moda
P(B)
P(A+B)
0
Independência de Eventos
Dois eventos A e B são independentes se e somente se:
P(A+B) = P(A) ç P(B)
Ou equivalentemente: P(A|B) = P(A) ou P(B|A) = P(B)
Teorema da Probabilidade Total
Se B¡, B¢, ..., B¹ formam uma partição do espaço amostral « (eventos mutuamente exclusivos e exaustivos), então para qualquer
evento A:
P(A) = P(A#B )P(B ) +1 1 P(A#B )P(B ) +2 2 ... + P(A#B )P(B )n n
Teorema de Bayes
Permite calcular probabilidades "invertidas":
P(B #A) =i
P(A#B )P(B )3j=1
n
jj
P(A#B )P(B )i i
"O Teorema de Bayes é uma ferramenta poderosa para atualizar probabilidades com base em novas informações ou
evidências."
Observação: O CEBRASPE frequentemente elabora questões envolvendo testes médicos (sensibilidade e
especificidade) ou testes para detecção de drogas, que são aplicações diretas do Teorema de Bayes.
Para verificar se dois eventos são independentes, podemos testar se P(A|B) = P(A). Se essa igualdade for verdadeira, então os
eventos são independentes.
Atenção! Não confunda eventos mutuamente exclusivos com eventos independentes. Eventos mutuamente exclusivos
(A + B = ') não podem ser independentes, a menos que P(A) = 0 ou P(B) = 0.
Uma questão típica da CEBRASPE envolve cenários com informações condicionais, como a probabilidade de uma pessoa ter
uma doença dado que testou positivo em um exame com determinada taxa de falso-positivo e falso-negativo.
MESTRECONCURSOS.COM.BR 5
Licenciado para - S
abata freire - 34885378893 - P
rotegido por E
duzz.com
Variáveis Aleatórias e Funções de Probabilidade
Variáveis Aleatórias
Uma variável aleatória (v.a.) é uma função que associa cada
resultado do espaço amostral a um número real.
Formalmente, é uma função X: « ³ =.
Tipos de Variáveis Aleatórias:
Discretas: assumem valores contáveis (finitos ou infinitos
enumeráveis)
Contínuas: assumem valores em um intervalo contínuo de
números reais
Uma variável aleatória transforma um experimento aleatório
em um modelo matemático que facilita os cálculos de
probabilidades.
Funções de Probabilidade
Para v.a. discretas:
Função de probabilidade (f.p.): f(x) = P(X = x)
f(x) g 0 para todo x
£f(x) = 1 (soma sobre todos os valores possíveis)
Para v.a. contínuas:
Função densidade de probabilidade (f.d.p.): f(x)
f(x) g 0 para todo x
+f(x)dx = 1 (integral sobre todo o domínio)
P(a f X f b) = +°_f(x)dx
Função de Distribuição Acumulada (FDA)
Para qualquer variável aleatória (discreta ou contínua), a função de distribuição acumulada é definida como:
F (x) = P(X f x)
Propriedades da FDA:
F(x) é não decrescente
lim F(x) = 0 quando x ³ ->
lim F(x) = 1 quando x ³ +>
P(a
>
f(x)dx
Onde f(x) é a função densidade de probabilidade.
Propriedades da Esperança
E(c) = c, onde c é uma constante
E(cX) = c·E(X)
E(X + Y) = E(X) + E(Y)
Se X e Y são independentes, E(X·Y) = E(X)·E(Y)
Momentos
Os momentos de uma variável aleatória são valores esperados de potências de X ou de desvios em relação à média.
Momentos Ordinários
O k-ésimo momento ordinário é definido como:
E(X )k
O primeiro momento ordinário (k=1) é a média.
Momentos Centrais
O k-ésimo momento central é definido como:
E[(X 2 ¿) ]k
O segundo momento central (k=2) é a variância.
Variância e Desvio Padrão
A variância de X, denotada por Var(X) ou ò, mede a dispersão dos valores de X em torno da média:
Var(X) = E[(X 2 ¿) ] =2 E(X ) 22 [E(X)]2
O desvio padrão é definido como a raiz quadrada da variância:
à =X Var(X)
Observação: Em questões da CEBRASPE, é comum solicitar o cálculo da variância usando a fórmula alternativa Var(X) =
E(X²) - [E(X)]², que muitas vezes simplifica os cálculos.
Propriedades da variância:
Var(c) = 0, onde c é uma constante
Var(cX) = c²·Var(X)
Var(X + Y) = Var(X) + Var(Y) + 2·Cov(X,Y)
Se X e Y são independentes, Var(X + Y) = Var(X) + Var(Y)
Dica: Nas questões envolvendo soma ou diferença de variáveis aleatórias independentes, lembre-se que a variância da
soma é a soma das variâncias, mas o desvio padrão da soma não é a soma dos desvios padrão.
MESTRECONCURSOS.COM.BR 7
Licenciado para - S
abata freire - 34885378893 - P
rotegido por E
duzz.com
Distribuições Especiais: Variáveis Aleatórias Discretas
Distribuição Uniforme Discreta
Uma v.a. X com distribuição
uniforme discreta em {a, a+1, ..., b}
tem:
f(x) = 1/(b-a+1) para x * {a, a+1,
..., b}
E(X) = (a+b)/2
Var(X) = ((b-a+1)²-1)/12
Exemplo: Lançamento de um dado
equilibrado (a=1, b=6).
Distribuição de Bernoulli
Uma v.a. X com distribuição de
Bernoulli tem:
f(x) = p^x × (1-p)^(1-x) para x *
{0,1}
E(X) = p
Var(X) = p(1-p)
Exemplo: Lançamento de uma
moeda, onde X=1 representa "cara"
com probabilidade p.
Distribuição Binomial
Uma v.a. X ~ Bin(n,p) representa o
número de sucessos em n ensaios
independentes, cada um com
probabilidade p de sucesso:
f(x) = C(n,x) × p^x × (1-p)^(n-x)
para x * {0,1,...,n}
E(X) = np
Var(X) = np(1-p)
Exemplo: Número de caras em 10
lançamentos de uma moeda.
Distribuição de Poisson
Uma v.a. X ~ Poisson(») modela o
número de ocorrências de um
evento em um intervalo fixo:
f(x) = (e^(-») × »^x)/x! para x *
{0,1,2,...}
E(X) = »
Var(X) = »
Exemplo: Número de chamadas
recebidas por uma central em 1
hora.
Distribuição Geométrica
Uma v.a. X ~ Geom(p) representa o
número de ensaios até o primeiro
sucesso:
f(x) = (1-p)^(x-1) × p para x *
{1,2,3,...}
E(X) = 1/p
Var(X) = (1-p)/p²
Exemplo: Número de lançamentos
de um dado até obter um 6.
Distribuição Hipergeométrica
Uma v.a. X ~ Hiper(N,K,n) modela o
número de sucessos em uma
amostra sem reposição:
f(x) = [C(K,x) × C(N-K,n-x)]/C(N,n)
E(X) = n×(K/N)
Var(X) = n×(K/N)×(1-K/N)×(N-
n)/(N-1)
Exemplo: Número de cartas
vermelhas ao retirar 5 cartas de um
baralho.
Atenção! O CEBRASPE frequentemente cobra a identificação da distribuição adequada para modelar um problema
específico. É fundamental saber reconhecer as características de cada distribuição e quando aplicá-las.
Uma questão típica da CEBRASPE envolve o cálculo da probabilidade em um contexto de distribuição binomial, como a
probabilidade de acertar pelo menos 8 questões em uma prova de 10 questões de múltipla escolha com 5 alternativas cada.
Dica: A distribuição de Poisson pode ser usada como aproximação da distribuição binomial quando n é grande e p é
pequeno, com » = n×p. Esta aproximação é útil em questões computacionais complexas.
MESTRECONCURSOS.COM.BR 8
Licenciado para - S
abata freire - 34885378893 - P
rotegido por E
duzz.com
Distribuições Especiais: Variáveis Aleatórias Contínuas
Distribuição Uniforme Contínua
Uma v.a. X ~ U(a,b) tem distribuição uniforme no intervalo [a,b]:
f(x) = 1/(b-a) para a f x f b
F(x) = (x-a)/(b-a) para a f x f b
E(X) = (a+b)/2
Var(X) = (b-a)²/12
Exemplo: Tempo de espera (em minutos) até a chegada do próximo ônibus, sabendo que os
ônibus chegam a cada 10 minutos.
Distribuição Exponencial
Uma v.a. X ~ Exp(») modela o tempo até a ocorrência de um evento:
f(x) = »e^(-»x) para x > 0
F(x) = 1 - e^(-»x) para x > 0
E(X) = 1/»
Var(X) = 1/»²
Exemplo: Tempo de vida (em horas) de uma lâmpada.
Distribuição Normal
Uma v.a. X ~ N(¼,ò) tem distribuição normal com média ¼ e variância ò:
f(x) = e para 2Ã 2Ã
1 2
2Ã2
(x2¿)2
>
Características:
Simétrica em torno da média (¼)
Forma de sino
E(X) = ¼
Var(X) = ò
Aproximadamente 68% dos valores estão no intervalo [¼-Ã, ¼+Ã]
Aproximadamente 95% dos valores estão no intervalo [¼-2Ã, ¼+2Ã]
Aproximadamente 99,7% dos valores estão no intervalo [¼-3Ã, ¼+3Ã]
Distribuição Normal Padrão
Uma v.a. Z ~ N(0,1) tem distribuição normal padrão. Para transformar X ~ N(¼,ò) em Z ~ N(0,1), usamos:
Z =
Ã
X 2 ¿
A função de distribuição acumulada da normal padrão é denotada por §(z), onde:
§(z) = P (Z f z) = e dt+
2>
z
2Ã
1 2 2
t
2
Propriedades importantes:
§(-z) = 1 - §(z)
P(a f Z f b) = §(b) - §(a)
P(Z > z) = 1 - §(z)
Observação: O CEBRASPE frequentemente explora a interpretação da regra empírica (regra dos três sigma) da distribuição normal em suas questões, exigindo cálculos de probabilidades em
intervalos específicos.
Uma questão típica da CEBRASPE envolve o cálculo da probabilidade de uma variável aleatória normal estar dentro de um intervalo específico, exigindo a padronização da variável e o uso da tabela
da normal padrão.
Dica: Para variáveis aleatórias que são soma de muitas variáveis aleatórias independentes (mesmo que não sejam normais), o Teorema Central do Limite permite aproximar sua distribuição
por uma normal, o que é muito útil em questões práticas.
MESTRECONCURSOS.COM.BR 9
Licenciado para - S
abata freire - 34885378893 - P
rotegido por E
duzz.com
Teorema Central do Limite
Enunciado do Teorema
O Teorema Central do Limite (TCL) estabelece que a soma (ou média) de um grande número de variáveis aleatórias
independentes e identicamente distribuídas tende a seguir uma distribuição normal, independentemente da distribuição original
dessas variáveis.
Formalmente, se X¡, X¢, ..., X¹ são variáveis aleatórias independentes e identicamente distribuídas com média ¿ e variância ò
finitas, então a variável aleatória:
Z =n =
à n
X 2 n¿3i=1
n
i
Ã/ n
2 ¿XËn
Converge em distribuição para uma variável aleatória normal padrão Z ~ N(0,1) quando n ³ >.
Implicações Práticas
Para n suficientemente grande (geralmente n g 30):
A média amostral X� tem distribuição aproximadamente normal: X� ~ N(¿, ò/n)
A soma S = X¡ + X¢ + ... + X¹ tem distribuição aproximadamente normal: S ~ N(n¿, nò)
"O Teorema Central do Limite é um dos resultados mais importantes da teoria da probabilidade, pois justifica o uso
generalizado da distribuição normal em aplicações estatísticas."
Aplicações
O TCL permite:
Construir intervalos de confiança para a média populacional
Realizar testes de hipóteses sobre médias
Aproximar distribuições binomiais por normais quando n é grande
Modelar fenômenos que resultam da soma de muitas pequenas influências aleatórias
Atenção! O CEBRASPE frequentemente explora situações onde o TCL permite aproximar uma distribuição binomial por
uma normal. Esta aproximação é adequada quando np > 5 e n(1-p) > 5.
Para aplicar o TCL na aproximação da distribuição binomial por uma normal:
Se X ~ Bin(n,p), então X pode ser aproximado por uma N(np, np(1-p))
Para melhorar a aproximação, usa-se a correção de continuidade: P(X = k) j P(k-0,5 f Y f k+0,5), onde Y ~ N(np, np(1-p))
Uma questão típica da CEBRASPE envolve a aplicação do TCL para calcular a probabilidade de que a média amostral de um
conjunto de observações esteja dentro de um determinado intervalo, especialmente quando a distribuição original não é normal.
Dica: Em questões do CEBRASPE, fique atento à necessidade de correção de continuidade quando se aproxima uma
distribuição discreta (como a binomial) por uma contínua (como a normal).
MESTRECONCURSOS.COM.BR 10
Licenciado para - S
abata freire - 34885378893 - P
rotegido por E
duzz.com
Regra Empírica e Regra dos Três Sigma
Regra Empírica
A Regra Empírica, também conhecida como Regra dos Três
Sigma, descreve a distribuição dos dados em uma distribuição
normal. Especificamente, para uma variável aleatória X com
distribuição normal de média ¿ e desvio padrão Ã:
Aproximadamente 68% dos valores estão no intervalo [¿-Ã,
¿+Ã]
Aproximadamente 95% dos valores estão no intervalo [¿-2Ã,
¿+2Ã]
Aproximadamente 99,7% dos valores estão no intervalo
[¿-3Ã, ¿+3Ã]
Esta regra é extremamente útil para avaliar rapidamente a
probabilidade de valores em uma distribuição normal sem
recorrer a tabelas ou cálculos complexos.
Representação visual da Regra dos Três Sigma, mostrando a
porcentagem de dados dentro de 1, 2 e 3 desvios padrão da
média em uma distribuição normal.
Valores Exatos
Os valores exatos para estas probabilidades são:
Intervalo Probabilidade
[¿-Ã, ¿+Ã] 68,27%
[¿-1,96Ã, ¿+1,96Ã] 95,00%
[¿-2Ã, ¿+2Ã] 95,45%
[¿-3Ã, ¿+3Ã] 99,73%
Aplicações
A Regra Empírica tem diversas aplicações práticas:
Identificação de valores atípicos (outliers): valores além de 3Ã da média são considerados incomuns
Controle de qualidade: especificações baseadas em limites de 2Ã ou 3Ã
Interpretação de escores padronizados em testes e medições
Estimativa rápida de probabilidades em distribuições normais
Observação: O CEBRASPE frequentemente elabora questões que envolvem a interpretação da Regra dos Três Sigma para
calcular probabilidades aproximadas ou identificar valores atípicos em conjuntos de dados.
Uma questão típica da CEBRASPE pode envolver a determinação da probabilidade de uma observação estar a mais de 2 desvios
padrão da média, ou a proporção de valores em uma distribuição normal que estão em um determinado intervalo.
Dica: Em questões da CEBRASPE, utilize a regra dos três sigma para verificar respostas em problemas de probabilidade com
distribuição normal. Se o resultado for muito diferente do esperado pela regra, pode haver um erro no cálculo.
MESTRECONCURSOS.COM.BR 11
Licenciado para - S
abata freire - 34885378893 - P
rotegido por E
duzz.com
Distribuições Amostrais e Amostras Aleatórias
Conceitos Fundamentais
Uma amostra aleatória é um subconjunto de elementos selecionados de uma população de forma que cada elemento tenha a
mesma probabilidade de ser escolhido. Formalmente, as variáveis aleatórias X¡, X¢, ..., X¹ constituem uma amostra aleatória de
tamanho n de uma população com distribuição f(x) se:
Cada X� tem a mesma distribuição f(x)
As variáveis X¡, X¢, ..., X¹ são mutuamente independentes
Estatísticas Amostrais
Uma estatística amostral é qualquer função das observações da amostra. As principais estatísticas amostrais incluem:
Média Amostral
=XË X
n
1
i=1
3
n
i
Se X¡, X¢, ..., X¹ são variáveis aleatórias i.i.d. com média ¿ e
variância ò, então:
E(X� ) = ¿ (estimador não-viesado)
Var(X� ) = ò/n
Variância Amostral
S =2
(X 2
n2 1
1
i=1
3
n
i )XË 2
Se X¡, X¢, ..., X¹ são variáveis aleatórias i.i.d. com média ¿ e
variância ò, então:
E(S²) = ò (estimador não-viesado)
Note o uso de n-1 no denominador (correção de
Bessel)
Distribuições Amostrais
A distribuição amostral de uma estatística é a distribuição de probabilidade dessa estatística considerando todas as possíveis
amostras do mesmo tamanho que podem ser extraídas da população.
Distribuição Amostral da Média
Se a população tem distribuição normal: X� ~ N(¿, ò/n) para qualquer tamanho de amostra
Se a população não tem distribuição normal: pelo TCL, X� ~ N(¿, ò/n) aproximadamente, para n suficientemente grande (n g
30)
Distribuição Amostral da Variância
Se a população tem distribuição normal, então:
>
Ã2
(n2 1)S2
Ç n21
2
Onde Dz¹«¡ é a distribuição qui-quadrado com n-1 graus de liberdade.
Atenção! O CEBRASPE frequentemente explora a distinção entre o estimador da variância populacional (S²) e a
variância da amostra (que usaria n no denominador). O uso de n-1 no denominador de S² garante que o estimador seja
não-viesado.
Uma questão típica da CEBRASPE envolve o cálculo de probabilidades relacionadas à média amostral ou à proporção amostral,
frequentemente exigindo a aplicação do Teorema Central do Limite.
Dica: Nas questões da CEBRASPE, quando a distribuição da populaçãonão é mencionada e o tamanho da amostra é
grande (n g 30), geralmente é seguro assumir que a distribuição amostral da média é aproximadamente normal.
MESTRECONCURSOS.COM.BR 12
Licenciado para - S
abata freire - 34885378893 - P
rotegido por E
duzz.com
Medidas de Tendência Central
Média Aritmética
=xË x
n
1
i=1
3
n
i
Características:
Considera todos os valores do
conjunto
É influenciada por valores
extremos (outliers)
A soma dos desvios em relação
à média é zero
Média Ponderada
=xËp
w 3i=1
n
i
w x 3i=1
n
i i
Características:
Atribui pesos diferentes a cada
valor
Útil quando os valores têm
importâncias distintas
Comum em cálculos de médias
de notas com pesos
Mediana
Valor central que divide o conjunto
em duas partes iguais:
Para n ímpar: valor na posição
(n+1)/2
Para n par: média dos valores
nas posições n/2 e (n/2)+1
Características:
Não é influenciada por valores
extremos
Ideal para distribuições
assimétricas
Outras Médias
Média Geométrica
MG = =n x × x × ... × x 1 2 n x (
i=1
/
n
i)
1/n
Aplicações: taxas de crescimento, retornos de investimentos
Média Harmônica
MH = =
+ + ... +
x 1
1
x 2
1
x n
1
n
3i=1
n
x i
1
n
Aplicações: cálculos de velocidade média, taxas médias
Moda
Valor que ocorre com maior frequência em um conjunto de
dados.
Características:
Pode não existir (quando todos os valores têm a mesma
frequência)
Pode ser múltipla (bimodal, trimodal, etc.)
Não é influenciada por valores extremos
Única medida aplicável a dados qualitativos
Relação entre média, mediana e moda em distribuições:
Simétricas: média = mediana = moda
Assimetria positiva: moda 30% (alta dispersão)
Atenção! O CEBRASPE frequentemente explora a diferença entre a fórmula da variância populacional (divisão por N) e a
variância amostral (divisão por n-1). O uso de n-1 no denominador da variância amostral é necessário para obter um estimador
não-viesado da variância populacional.
Uma questão típica da CEBRASPE pode envolver o cálculo e a interpretação do coeficiente de variação para comparar a dispersão
relativa de diferentes conjuntos de dados, especialmente quando as unidades de medida ou as magnitudes são diferentes.
Dica: Nas questões da CEBRASPE, quando for necessário comparar a dispersão de dois conjuntos com diferentes unidades ou
escalas de medida, o coeficiente de variação é a medida mais adequada, não o desvio padrão.
MESTRECONCURSOS.COM.BR 14
Licenciado para - S
abata freire - 34885378893 - P
rotegido por E
duzz.com
Coeficiente de Correlação de Pearson
Definição
O coeficiente de correlação de Pearson (r) mede o grau de associação linear entre duas variáveis quantitativas X e Y. É calculado
pela fórmula:
r =
(x 2 ) (y 2 )3i=1
n
i xË 2 3i=1
n
i yË 2
(x 2 )(y 2 )3i=1
n
i xË i yË
Alternativamente, pode ser calculado usando a covariância:
r =
s ç sX Y
Cov(X,Y )
Propriedades
Varia entre -1 e 1: -1 f r f 1
r = 1: correlação positiva perfeita (relação linear direta)
r = -1: correlação negativa perfeita (relação linear inversa)
r = 0: ausência de correlação linear
É simétrico: r(X,Y) = r(Y,X)
É invariante a transformações lineares das variáveis
Mede apenas associação linear (pode existir associação não-linear mesmo com r = 0)
Interpretação
Correlação Forte
|r| > 0,7
Forte associação linear entre as
variáveis
Pontos próximos a uma linha
reta no diagrama de dispersão
Correlação Moderada
0,3de erro
Para populações finitas, aplica-se um fator de correção:
n =
1 +
N
n 210
n 0
Onde n é o tamanho calculado para população infinita e N é o tamanho da população.
Atenção! O CEBRASPE frequentemente explora a escolha da técnica de amostragem mais adequada para diferentes contextos, bem
como os cálculos de tamanho amostral considerando diferentes níveis de confiança e margens de erro.
Uma questão típica da CEBRASPE pode envolver a identificação da técnica de amostragem utilizada em um determinado estudo, ou o cálculo
do tamanho amostral necessário para estimar um parâmetro com determinada precisão.
Dica: Nas questões da CEBRASPE sobre amostragem estratificada, fique atento à alocação proporcional (o tamanho da amostra em
cada estrato é proporcional ao tamanho do estrato na população) versus a alocação ótima (que considera também a variabilidade
dentro de cada estrato).
MESTRECONCURSOS.COM.BR 16
Amostragem Aleatória Simples
Cada elemento da população tem a mesma
probabilidade de ser selecionado.
Seleção com ou sem reposição
Utiliza tabela de números aleatórios ou
sorteio
Base para outros métodos de
amostragem
Amostragem Estratificada
População dividida em subgrupos (estratos)
homogêneos e distintos entre si.
Seleção aleatória dentro de cada estrato
Alocação proporcional ou ótima
Reduz a variância do estimador
Amostragem Sistemática
Seleção de elementos em intervalos regulares
a partir de um ponto inicial aleatório.
Fácil implementação
Risco de periodicidade
Útil para populações ordenadas
Amostragem por Conglomerados
População dividida em grupos
(conglomerados) heterogêneos
internamente.
Seleção aleatória de conglomerados
inteiros
Economiza recursos em populações
dispersas
Maior erro amostral que outros métodos
Licenciado para - S
abata freire - 34885378893 - P
rotegido por E
duzz.com
Inferência Estatística: Conceitos Básicos
O Que é Inferência Estatística?
A inferência estatística é o processo de tirar conclusões sobre uma população
com base em informações obtidas de uma amostra. Os dois principais tipos
de inferência são:
Estimação: determinação de valores aproximados para parâmetros
populacionais desconhecidos
Testes de hipóteses: avaliação de afirmações sobre parâmetros
populacionais
Parâmetros e Estatísticas
Parâmetro: valor numérico que descreve uma característica da população
(geralmente desconhecido)
Estatística: valor calculado a partir de dados amostrais (utilizado para
estimar parâmetros)
Estimadores
Um estimador é uma estatística usada para estimar um parâmetro
populacional. Um bom estimador deve ter as seguintes propriedades:
Não-viesado: E(»� ) = » (o valor esperado do estimador é igual ao
parâmetro)
Consistente: converge para o parâmetro à medida que o tamanho da
amostra aumenta
Eficiente: tem menor variância entre todos os estimadores não-viesados
Suficiente: contém toda a informação relevante da amostra sobre o
parâmetro
Tipos de Estimação
Estimação Pontual
Fornece um único valor como estimativa do parâmetro populacional.
Exemplos: média amostral (x� ) para estimar a média populacional (¿)
Variância amostral (s²) para estimar a variância populacional (ò)
Proporção amostral (p� ) para estimar a proporção populacional (p)
Estimação Intervalar
Fornece um intervalo de valores que contém o parâmetro com
determinada confiança.
Intervalos de confiança: [estimador - margem de erro, estimador +
margem de erro]
Nível de confiança: probabilidade de que o intervalo contenha o
verdadeiro valor do parâmetro
Quanto maior o nível de confiança, maior a amplitude do intervalo
Métodos de Estimação
Método dos Momentos: iguala momentos amostrais aos respectivos momentos populacionais
Método da Máxima Verossimilhança: escolhe como estimativa o valor do parâmetro que maximiza a probabilidade de obter a amostra observada
Método dos Mínimos Quadrados: minimiza a soma dos quadrados dos erros (usado em regressão)
Observação: O CEBRASPE frequentemente explora as propriedades dos estimadores, especialmente o conceito de estimador não-viesado, e a
interpretação correta dos intervalos de confiança.
Uma questão típica da CEBRASPE pode envolver a identificação do estimador mais adequado para um determinado parâmetro populacional, ou a interpretação
correta de um intervalo de confiança.
Dica: Nas questões da CEBRASPE, é fundamental entender a interpretação correta de um intervalo de confiança de 95%: em 95% das amostras
possíveis, o intervalo calculado conterá o verdadeiro valor do parâmetro populacional. Não significa que há 95% de chance de que o parâmetro esteja no
intervalo calculado para uma amostra específica.
MESTRECONCURSOS.COM.BR 17
Licenciado para - S
abata freire - 34885378893 - P
rotegido por E
duzz.com
Intervalos de Confiança
Definição e Interpretação
Um intervalo de confiança (IC) é um intervalo de valores calculado a partir de dados amostrais, com uma determinada
probabilidade (nível de confiança) de conter o verdadeiro valor do parâmetro populacional.
Para um nível de confiança de (1-³)×100%, a interpretação correta é: se coletarmos muitas amostras diferentes e construirmos
um intervalo de confiança para cada uma, aproximadamente (1-³)×100% desses intervalos conterão o verdadeiro valor do
parâmetro.
Intervalos de Confiança para Parâmetros Comuns
IC para Média (Ã conhecido)
±xË z ç³/2
n
Ã
Onde:
x� = média amostral
z³/2 = valor crítico da
distribuição normal
à = desvio padrão populacional
(conhecido)
n = tamanho da amostra
IC para Média (Ã desconhecido)
±xË t ç³/2,n21
n
s
Onde:
x� = média amostral
t³/2,n-1 = valor crítico da
distribuição t de Student
s = desvio padrão amostral
n = tamanho da amostra
IC para Proporção
±p̂ z ç³/2
n
(1 2 )p̂ p̂
Onde:
p� = proporção amostral
z³/2 = valor crítico da
distribuição normal
n = tamanho da amostra
Válido para n grande (np� g 5 e n(1-p� )
g 5)
IC para Variância
Para uma população normal:
, [
Ç ³/2,n21
2
(n 2 1)s2
Ç 12³/2,n21
2
(n 2 1)s2 ]
Onde Dz³/2,n-1 e Dz1-³/2,n-1 são os valores críticos da distribuição qui-quadrado.
Fatores que Afetam a Amplitude do IC
Nível de confiança: maior confiança implica maior amplitude
Tamanho da amostra: maior amostra implica menor amplitude
Variabilidade dos dados: maior variabilidade implica maior amplitude
Atenção! O CEBRASPE frequentemente elabora questões sobre a interpretação correta dos intervalos de confiança.
Um erro comum é afirmar que há uma probabilidade de 95% de que o parâmetro esteja no intervalo calculado para
uma amostra específica.
Uma questão típica da CEBRASPE pode envolver o cálculo de um intervalo de confiança para um parâmetro populacional e a
interpretação correta do resultado, ou a determinação do tamanho amostral necessário para obter um intervalo com
determinada amplitude.
Dica: Nas questões da CEBRASPE, é importante identificar corretamente qual distribuição deve ser usada (normal, t de
Student ou qui-quadrado) com base no parâmetro a ser estimado e nas informações disponíveis sobre a população.
MESTRECONCURSOS.COM.BR 18
Licenciado para - S
abata freire - 34885378893 - P
rotegido por E
duzz.com
Testes de Hipóteses
Conceitos Fundamentais
Um teste de hipótese é um procedimento estatístico para decidir se uma afirmação sobre um parâmetro populacional deve ser
rejeitada ou não com base em evidências amostrais.
Hipóteses
Hipótese nula (H ): afirmação inicial que assumimos como
verdadeira até que as evidências indiquem o contrário
Hipótese alternativa (H¡ ou H°): afirmação que contradiz a
hipótese nula
Exemplos de pares de hipóteses:
H : ¿ = ¿ vs. H¡: ¿ b ¿ (teste bilateral)
H : ¿ f ¿ vs. H¡: ¿ > ¿ (teste unilateral à direita)
H : ¿ g ¿ vs. H¡: ¿valor que delimita a região de rejeição de H
Valor-p (p-value): menor nível de significância que levaria à
rejeição de H
Regra de decisão:
Se valor-p f ³: rejeitar H
Se valor-p > ³: não rejeitar H
Potência do Teste
Potência = 1 - ´: probabilidade de rejeitar H quando H é
falsa
Maior potência indica maior capacidade de detectar
diferenças reais
Testes Estatísticos Comuns
1
Teste Z para Média
Utilizado quando à é conhecido:
Z =
Ã/ n
2 ¿ xË 0
Sob H , Z segue distribuição normal
padrão
2
Teste t de Student
Utilizado quando à é desconhecido:
t =
s/ n
2 ¿ xË 0
Sob H , t segue distribuição t com n-
1 graus de liberdade
3
Teste Qui-Quadrado
Para testar variâncias ou aderência:
Ç =2
3
E i
(O 2E )i i
2
Onde O� são frequências observadas
e E� são frequências esperadas
Observação: O CEBRASPE frequentemente explora a interpretação correta do valor-p e a relação entre o nível de
significância e os erros Tipo I e Tipo II.
Uma questão típica da CEBRASPE pode envolver a formulação correta das hipóteses nula e alternativa para um determinado
contexto, ou a interpretação do resultado de um teste de hipótese com base no valor-p.
Dica: Nas questões da CEBRASPE, é fundamental identificar corretamente se o teste deve ser bilateral ou unilateral,
com base no contexto do problema e na hipótese alternativa apropriada.
MESTRECONCURSOS.COM.BR 19
Licenciado para - S
abata freire - 34885378893 - P
rotegido por E
duzz.com
Teste t de Student
Conceito e Aplicações
O teste t de Student é um teste estatístico utilizado quando o desvio padrão populacional é desconhecido e substituído pelo desvio
padrão amostral. É aplicado principalmente em situações com amostras pequenas (nquadrados.
Propriedades dos Estimadores
Não-viesados: E(³� ) = ³ e E(³� ¡) = ³¡
Consistentes: convergem para os verdadeiros valores à medida que o
tamanho da amostra aumenta
Eficientes: têm a menor variância entre todos os estimadores lineares não-
viesados (sob certas condições)
Avaliação do Modelo
Coeficiente de Determinação (R²)
Mede a proporção da variabilidade de Y
explicada pelo modelo:
R =2
=
SQT
SQR
1 2
SQT
SQE
Onde:
SQR = soma dos quadrados da regressão
SQT = soma dos quadrados total
SQE = soma dos quadrados dos erros
Varia de 0 a 1: quanto mais próximo de 1,
melhor o ajuste do modelo.
Teste F para Significância Global
Avalia se o modelo como um todo é
significativo:
F =
SQE/(n2 k 2 1)
SQR/k
Onde:
k = número de variáveis independentes
n = tamanho da amostra
Hipóteses: H : ³¡ = ... = ³¶ = 0 vs. H¡: pelo
menos um ³| b 0
Teste t para Coeficientes Individuais
Avalia a significância de cada coeficiente:
t =
se( )³̂j
³̂j
Hipóteses: H : ³| = 0 vs. H¡: ³| b 0
Onde se(³� |) é o erro padrão do coeficiente.
Análise de Resíduos
A análise de resíduos é fundamental para verificar se os pressupostos do modelo estão sendo atendidos:
Normalidade: os resíduos devem seguir distribuição normal (teste de Shapiro-Wilk, gráfico Q-Q)
Homocedasticidade: a variância dos resíduos deve ser constante (gráfico de resíduos × valores ajustados)
Independência: os resíduos devem ser independentes entre si (teste de Durbin-Watson)
Linearidade: a relação entre X e Y deve ser linear (gráfico de resíduos × X)
Atenção! O CEBRASPE frequentemente explora a interpretação correta dos coeficientes de regressão e do coeficiente de determinação, bem como a
verificação dos pressupostos do modelo através da análise de resíduos.
Uma questão típica da CEBRASPE pode envolver a interpretação do valor de R² ou dos coeficientes estimados em um contexto prático, ou a identificação de
violações dos pressupostos do modelo com base em gráficos de resíduos.
Dica: Nas questões da CEBRASPE sobre regressão linear, é importante diferenciar correlação de causalidade. Um R² alto indica forte associação linear,
mas não prova relação causal entre as variáveis.
MESTRECONCURSOS.COM.BR 22
Licenciado para - S
abata freire - 34885378893 - P
rotegido por E
duzz.com
Análise de Regressão Linear Múltipla
Modelo Geral
A regressão linear múltipla é uma extensão da regressão linear simples para múltiplas variáveis independentes. O modelo é representado por:
Y =i ³ +0 ³ X +1 1i ³ X +2 2i ... + ³ X +k ki · i
Onde:
Y = variável dependente
X¡, X¢, ..., X¶ = variáveis independentes
³ = intercepto
³¡, ³¢, ..., ³¶ = coeficientes parciais de regressão
· = erro aleatório
Estimação dos Parâmetros
Em notação matricial, os estimadores de mínimos quadrados são dados por:
=³̂ (X X) X Y2 21 2
Onde:
X = matriz de variáveis independentes (incluindo uma coluna de 1's para o intercepto)
Y = vetor da variável dependente
³� = vetor de coeficientes estimados
Interpretação dos Coeficientes
Em uma regressão múltipla, cada coeficiente ³� � representa o efeito marginal da variável X� sobre Y, mantendo todas as outras variáveis constantes. Esta é uma diferença
crucial em relação à regressão simples, onde o coeficiente representa o efeito total.
Análise de Variância (ANOVA)
A tabela ANOVA para regressão múltipla decompõe a variabilidade total de Y em:
Fonte SQ gl QM F
Regressão SQR k SQR/k QMR/QME
Erro SQE n-k-1 SQE/(n-k-
1)
Total SQT n-1
Onde:
SQ = soma dos quadrados
gl = graus de liberdade
QM = quadrado médio
Medidas de Ajuste do Modelo
Coeficiente de Determinação (R²)
R =2
=
SQT
SQR
1 2
SQT
SQE
R² Ajustado
R =adj
2 1 2
SQT/(n2 1)
SQE/(n2 k 2 1)
O R² ajustado penaliza a adição de variáveis que não contribuem significativamente
para o modelo.
Erro Padrão da Estimativa
s =e
n2 k 2 1
SQE
Representa o desvio padrão dos resíduos e é uma medida da precisão das
previsões.
Problemas Comuns na Regressão Múltipla
Multicolinearidade
Ocorre quando há correlação alta entre variáveis
independentes.
Sintomas: coeficientes instáveis, erros padrão
elevados
Detecção: VIF (Variance Inflation Factor),
correlações
Soluções: remover variáveis, usar técnicas de
regularização
Heteroscedasticidade
Ocorre quando a variância dos resíduos não é
constante.
Sintomas: padrões em gráficos de resíduos
Detecção: teste de White, Breusch-Pagan
Soluções: transformação de variáveis, erros
padrão robustos
Autocorrelação
Ocorre quando os resíduos são correlacionados ao
longo do tempo.
Sintomas: padrões temporais nos resíduos
Detecção: teste de Durbin-Watson
Soluções: modelos autorregressivos,
diferenciação
Observação: O CEBRASPE frequentemente explora a interpretação correta dos coeficientes em um modelo de regressão múltipla, bem como a identificação e
correção dos problemas comuns como multicolinearidade.
Uma questão típica da CEBRASPE pode envolver a interpretação do coeficiente de determinação ajustado ou a identificação de problemas no modelo com base em
estatísticas diagnósticas ou gráficos de resíduos.
Dica: Nas questões da CEBRASPE sobre regressão múltipla, é importante entender que a inclusão de variáveis irrelevantes não afeta o viés dos estimadores, mas
aumenta sua variância, enquanto a omissão de variáveis relevantes causa viés nos estimadores.
MESTRECONCURSOS.COM.BR 23
Licenciado para - S
abata freire - 34885378893 - P
rotegido por E
duzz.com
Tamanho Amostral em Pesquisas
Importância da Determinação do Tamanho Amostral
A determinação adequada do tamanho amostral é um passo crítico no
planejamento de uma pesquisa estatística por diversos motivos:
Amostras muito pequenas podem não detectar efeitos importantes (baixo
poder estatístico)
Amostras excessivamente grandes representam desperdício de recursos
O tamanho amostral afeta diretamente a precisão das estimativas
Impacta a capacidade de generalização dos resultados
O cálculo do tamanho amostral depende do tipo de estudo, dos parâmetros a
serem estimados e do nível de precisão desejado.
Fatores que Influenciam o Tamanho Amostral
Nível de confiança: maior confiança requer amostras maiores
Margem de erro: menor erro requer amostras maiores
Variabilidade da população: maior variabilidade requer amostras maiores
Tamanho da população: relevante apenas para populações pequenas
Tipo de amostragem: técnicas mais complexas podem requerer amostras
maiores
Fórmulas para Cálculo do Tamanho Amostral
Para Estimar uma Média
População infinita:
n =
e2
z ç Ã
³/2
2 2
População finita:
n =
e ç (N 2 1) + z ç Ã2
³/2
2 2
N ç z ç ó/2
2 2
Onde:
z³/2 = valor crítico da distribuição normal
à = desvio padrão populacional
e = margem de erro
N = tamanho da população
Para Estimar uma Proporção
População infinita:
n =
e2
z ç p ç q
³/2
2
População finita:
n =
e ç (N 2 1) + z ç p ç q2
³/2
2
N ç z ç p ç q³/2
2
Onde:
p = proporção esperada (usar p=0,5 se
desconhecida)
q = 1-p
3
Para Testes de Hipóteses
Comparação de médias:
n =
�2
2(z + z ) ç ó/2 ´
2 2
Onde:
z´ = valor crítico para o poder desejado
� = diferença mínima detectável
Considerações Práticas
Estudos piloto: úteis para estimar a variabilidade quando não há informações prévias
Ajustes para não-resposta: aumentar o tamanho amostral calculado para compensar possíveis perdas
Análises multivariadas: geralmente requerem tamanhos amostrais maiores (regra prática: 10-20 observações por variável)
Efeito do design: em amostragens complexas, multiplicar o tamanho amostral pelo efeito do design (deff)
Atenção! O CEBRASPE frequentemente explora o cálculo do tamanho amostral em diferentes contextos, bem como a relação entre tamanho amostral,
nível de confiança e margem de erro.
Uma questão típica da CEBRASPE pode envolver o cálculo do tamanho amostral necessário para estimar uma proporção com determinada margem de erro e
nível de confiança, ou a determinação da margem de erro associada a um tamanho amostral específico.
Dica: Nas questões da CEBRASPEsobre tamanho amostral, quando não houver informação sobre a proporção esperada (p), use p = 0,5, pois este valor
maximiza o tamanho amostral e garante uma amostra suficiente mesmo no cenário mais desfavorável.
MESTRECONCURSOS.COM.BR 24
Licenciado para - S
abata freire - 34885378893 - P
rotegido por E
duzz.com
Resumo do Mestre
"A estatística não é apenas uma coleção de técnicas, mas uma forma estruturada de pensar sobre dados, incerteza e tomada
de decisões."
Principais Tópicos e Conceitos
1Estatística Descritiva
Técnicas para resumir e visualizar dados: tabelas,
gráficos, medidas de posição (média, mediana,
moda), dispersão (variância, desvio padrão),
assimetria e curtose. Fundamental para a análise
exploratória inicial.
2 Probabilidade
Base teórica da estatística: axiomas, probabilidade
condicional, independência, Teorema de Bayes,
variáveis aleatórias, distribuições (uniforme, Bernoulli,
binomial, Poisson, normal), Teorema Central do
Limite e Regra dos Três Sigma.
3Inferência Estatística
Métodos para tirar conclusões sobre populações a
partir de amostras: estimação pontual e intervalar,
testes de hipóteses (teste z, teste t, qui-quadrado),
propriedades dos estimadores e interpretação de
resultados.
4 Análise de Regressão
Modelagem da relação entre variáveis: regressão
linear simples e múltipla, estimação por mínimos
quadrados, interpretação dos coeficientes, análise de
variância, coeficiente de determinação e análise de
resíduos.
5Amostragem
Técnicas para seleção de amostras: amostragem
aleatória simples, estratificada, sistemática, por
conglomerados, determinação do tamanho amostral
e implicações para a inferência estatística.
Ênfases da CEBRASPE
Nas provas da CEBRASPE para a Polícia Federal, alguns tópicos recebem atenção especial:
Interpretação de resultados estatísticos em contextos práticos
Aplicação do Teorema de Bayes em situações de atualização de probabilidades
Utilização do Teorema Central do Limite para aproximar distribuições
Construção e interpretação de intervalos de confiança
Formulação e teste de hipóteses estatísticas
Análise de correlação e regressão para estabelecer relações entre variáveis
Verificação dos pressupostos em testes estatísticos
Escolha e aplicação da técnica de amostragem mais adequada
A banca valoriza tanto o conhecimento teórico quanto a capacidade de aplicação prática, frequentemente apresentando
situações-problema que exigem a seleção e aplicação da técnica estatística apropriada.
Pontos de Atenção: A CEBRASPE tende a elaborar questões que exigem atenção aos detalhes e precisão conceitual.
Equívocos comuns incluem a confusão entre correlação e causalidade, a interpretação incorreta de intervalos de
confiança e a aplicação inadequada de testes estatísticos quando seus pressupostos não são atendidos.
O domínio dos conceitos fundamentais da estatística, aliado à prática constante com questões anteriores da banca, é a chave
para o sucesso nesta disciplina nos concursos da Polícia Federal organizados pela CEBRASPE.
MESTRECONCURSOS.COM.BR 25
Licenciado para - S
abata freire - 34885378893 - P
rotegido por E
duzz.com
Dicas do Mestre
Estratégias para Questões de Estatística na CEBRASPE
1 Conheça o Formato das Questões
A CEBRASPE geralmente utiliza o formato de "certo ou errado". Isso exige extrema atenção, pois qualquer imprecisão pode tornar o item incorreto. Leia cada
afirmativa cuidadosamente, identificando termos absolutos como "sempre", "nunca", "todos", que frequentemente indicam afirmativas falsas.
2 Domine as Distribuições de Probabilidade
A banca costuma cobrar bastante as distribuições de probabilidade, especialmente a normal, binomial e Poisson. Memorize as fórmulas, propriedades e casos de
aplicação de cada uma. Pratique o reconhecimento de qual distribuição deve ser aplicada em diferentes contextos.
3 Preste Atenção aos Pressupostos
Um erro comum em questões da CEBRASPE é a aplicação de técnicas estatísticas sem verificar se seus pressupostos são atendidos. Por exemplo, a aplicação do
teste t requer normalidade dos dados para amostras pequenas, e testes qui-quadrado exigem frequências esperadas mínimas.
4 Saiba Interpretar Resultados
A CEBRASPE frequentemente explora a interpretação correta de intervalos de confiança, valor-p e coeficientes de regressão. Um erro comum é interpretar um
intervalo de confiança de 95% como tendo 95% de probabilidade de conter o parâmetro populacional.
5 Exercite Interpretação de Gráficos e Tabelas
Questões envolvendo a extração de informações de gráficos e tabelas são comuns. Pratique a leitura de diferentes tipos de gráficos (histogramas, box-plots,
diagramas de dispersão) e tabelas de contingência, identificando tendências, correlações e valores atípicos.
Tópicos Frequentemente Cobrados
Com base na análise de provas anteriores da CEBRASPE para a Polícia Federal, os seguintes tópicos merecem atenção especial:
Teorema de Bayes: Aplicação em problemas de probabilidade condicional, especialmente em contextos de testes diagnósticos (sensibilidade e especificidade)
Teorema Central do Limite: Aproximação de distribuições por normal e implicações para a inferência estatística
Intervalos de Confiança: Construção e interpretação correta, relação entre nível de confiança, tamanho amostral e margem de erro
Testes de Hipóteses: Compreensão dos erros Tipo I e II, interpretação do valor-p, poder do teste
Análise de Regressão: Interpretação dos coeficientes, pressupostos do modelo, análise de resíduos
Técnicas de Amostragem: Vantagens e limitações de cada técnica, cálculo do tamanho amostral
Questões Típicas da CEBRASPE
Exemplos de questões que refletem o estilo da banca:
1. Em um estudo sobre a eficácia de um teste para detecção de uma doença rara que afeta 1% da população, verificou-se que o teste apresenta sensibilidade de 95% e
especificidade de 90%. Com base nessas informações, é correto afirmar que a probabilidade de uma pessoa ter a doença, dado que seu teste foi positivo, é superior a
10%.
2. Considerando uma amostra aleatória de 100 observações de uma população normal com desvio padrão desconhecido, um intervalo de confiança de 95% para a
média populacional significa que, se coletarmos muitas amostras diferentes e construirmos um intervalo de confiança para cada uma, aproximadamente 95% desses
intervalos conterão a verdadeira média populacional.
3. Em um modelo de regressão linear múltipla, um valor de R² ajustado de 0,85 indica que 85% da variabilidade da variável dependente é explicada pelo modelo,
considerando o número de variáveis independentes incluídas.
Fique Atento! A CEBRASPE frequentemente utiliza termos técnicos precisos em suas questões. Confusões entre conceitos como "variância" e "desvio padrão",
"correlação" e "causalidade", "probabilidade" e "odds" são exploradas para induzir ao erro.
Recomendações Finais
Pratique com questões anteriores da banca, identificando padrões e estilos
Revise regularmente as fórmulas e conceitos fundamentais
Desenvolva habilidade em cálculos mentais e aproximações
Domine o uso da tabela da normal padrão e da distribuição t
Exercite a interpretação de resultados estatísticos em contextos práticos
Tenha cuidado com a precisão da linguagem estatística
Ao fazer a prova, leia cada item várias vezes antes de responder
"Na estatística da CEBRASPE, muitas vezes o diabo está nos detalhes. Uma palavra mal interpretada ou um pressuposto ignorado pode ser a diferença entre acertar e
errar a questão."
Mantenha o foco no entendimento conceitual e na aplicação prática dos métodos estatísticos. A compreensão profunda dos conceitos é mais valiosa do que a memorização
mecânica de fórmulas. Boa sorte em sua preparação!
MESTRECONCURSOS.COM.BR 26
Licenciado para - S
abata freire - 34885378893 - P
rotegido por E
duzz.com