Prévia do material em texto
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 1
AULA 02: Medidas de dispersão
1. MEDIDAS DE DISPERSÃO ................................................................................................................ 2
1.1. Amplitude .................................................................................................................................. 3
1.2. Intervalo interquartílico (ou amplitude interquartílica) ............................................................ 4
1.3. Desvio em relação à média aritmética ...................................................................................... 4
1.4. Desvio médio ............................................................................................................................. 6
1.5. Variância .................................................................................................................................. 10
1.6. Propriedades das medidas de posição relacionadas aos desvios ............................................ 12
1.7. Forma alternativa para cálculo da variância ............................................................................ 16
1.8. Desvio padrão. ......................................................................................................................... 23
1.9. Propriedades das medidas de dispersão ................................................................................. 25
1.10. Coeficiente de variação. ........................................................................................................... 34
1.11. Medidas de dispersão para dados em classe........................................................................... 40
1.12. Variância da união de dois conjuntos ...................................................................................... 45
2. BOX PLOT ...................................................................................................................................... 55
3. NOÇÕES DE ASSIMETRIA .............................................................................................................. 61
3.1. Introdução ................................................................................................................................ 61
3.2. Formas da curva de frequência e posicionamento relativo de média, mediana e moda ....... 66
3.3. Outros tipos de posicionamento relativo de média, mediana e moda ................................... 78
3.4. Assimetria e diferença entre os quartis ................................................................................... 85
4. QUESTÕES APRESENTADAS EM AULA .......................................................................................... 89
5. GABARITO ................................................................................................................................... 104
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 2
1. MEDIDAS DE DISPERSÃO
Considere três empresas (A, B e C). Em cada uma destas três empresas, entrevistamos cinco
funcionários, perguntando o salário de cada um deles.
O resultado está abaixo (valores em R$ 1.000,00):
Empresa A: 3, 3, 3, 3, 3
Empresa B: 1, 3, 3, 3, 5
Empresa C: 1, 2, 3, 4, 5
Sugiro que vocês anotem estes dados em um cantinho separado, pois ainda o utilizaremos
muitas vezes ao longo da aula.
Muito bem, vamos prosseguir.
Na empresa “A” todos os cinco funcionários entrevistados ganham R$ 3.000,00. Na empresa
“B” temos uma pessoa que ganha R$ 1.000,00, três que ganham R$ 3.000,00 e uma que
ganha R$ 5.000,00. E na empresa “C” cada funcionário ganha um salário diferente.
Note que o salário médio nas três empresas é o mesmo. A média é de R$ 3.000,00, tanto na
empresa A, quanto nas empresas B e C.
O que significa dizer que a média nas três empresas é a mesma? Significa que os salários,
em cada uma delas, giram em torno de R$ 3.000,00.
Sabemos que na empresa ‘A’ a média descreve muitíssimo bem o conjunto de dados. Por
quê? Porque todos os funcionários ganham exatamente o salário médio. Todos eles ganham
R$ 3.000,00.
Já na empresa ‘C’ a média não descreve o conjunto de dados tão bem quanto o faz na
empresa ‘A’. Na empresa ‘C’ apenas uma pessoa ganha o salário médio.
Analisando apenas a média não conseguimos diferenciar as três empresas. Contudo, tendo
acesso a todos os valores da pesquisa, temos condições de afirmar que os salários em cada
uma delas são diferentes.
O que estou querendo dizer é que a média, isoladamente, não é suficiente para descrever
adequadamente um conjunto de dados. E o intuito da estatística descritiva é justamente
descrever um conjunto de dados.
Na empresa A, os dados não estão nada dispersos. Eles estão bem concentrados. Todos eles
são iguais à média aritmética.
Na empresa C, já há certa dispersão. O salário médio também é de R$ 3.000,00. Só que
nesta terceira empresa os dados estão mais dispersos, assumem valores diferentes.
Para melhor descrever nossos dados (lembrem-se: estamos estudando estatística descritiva,
que visa descrever um conjunto de dados), vamos utilizar as medidas de dispersão. Sua
finalidade é indicar o quanto os dados estão dispersos.
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 3
Questão 1 IRB 2006 [ESAF]
O grau ao qual os dados numéricos tendem a dispersar-se em torno de um valor médio
chama-se
a) média.
b) variação ou dispersão dos dados.
c) mediana.
d) correlação ou dispersão.
e) moda.
Resolução:
As medidas de dispersão que têm esta finalidade: ver o quanto os dados estão dispersos em
torno de um valor médio.
Gabarito: B
1.1. Amplitude
A primeira medida de dispersão é a amplitude. Nós até já vimos o conceito de amplitude
anteriormente.
Quando estudamos dados em classes, vimos que a diferença entre o limite superior e o
limite inferior é igual à amplitude de classe.
A ideia de amplitude é essa mesmo. É a diferença entre o maior e o menor valor. Dentro de
uma classe, o maior valor é o limite superior e o menor valor é o limite inferior.
Vamos calcular a amplitude para cada uma das três empresas do nosso exemplo. Na
empresa A, todos os valores são iguais a 3. A amplitude fica:
Empresa A: 033 =−=A
Na empresa B, o maior valor é 5. O menor valor é 1. A amplitude fica:
Empresa B: 415 =−=A
Na empresa C, o maior valor é 5. O menor valor é 1. A amplitude fica:
Empresa C: 415 =−
A amplitude é uma medida de dispersão. Quanto maior a amplitude, mais dispersos estão
os dados. A amplitude foi capaz de me indicar que, na empresa A, os salários estão bem
concentrados. Foi capaz de demonstrar também que, nas empresas B e C, os salários são
mais dispersos que na empresa A.
Contudo, levando em conta apenas a amplitude, não conseguimos descobrir, dentre as
empresas B e C, qual tem os dados mais dispersos. Ou seja, a amplitude não foi capaz de
diferenciar a dispersão dos dados nas empresas B e C.
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 4
Dizemos que a amplitude é uma medida de dispersão “pobre”. Seu cálculo leva em conta
apenas dois valores. Apenas o maior valor e o menor valor.
Amplitude é igual ao maior valor menos o menor valor.
É uma medida de dispersão pobre por levar em conta apenas dois valores.
1.2. Intervalo interquartílico (ou amplitude interquartílica)
Já estudamos essa medida na aula passada. Trata-se da diferença entre o terceiro e o
primeiro quartil.
Ela é bem semelhante à amplitude. Trata-sede uma diferença entre dois valores, do mesmo
jeito. Só que tais valores são os quartis.
Na aula de hoje, veremos novamente essa medida no tópico de Box Plot.
1.3. Desvio em relação à média aritmética
O desvio em relação à média aritmética não é uma medida de dispersão. É apenas uma
ferramenta que nós usaremos daqui em diante.
À exceção da amplitude, todas as outras medidas de dispersão que nós estudaremos levam
em conta o desvio em relação à média aritmética.
Mas o que é desvio em relação à média aritmética?
Desvio em relação à média aritmética é a diferença entre o valor considerado e a média
aritmética da sequência numérica analisada.
Para melhor entendimento, vamos voltar ao exemplo das três empresas (dado lá na página
2).
Tomemos a empresa C. Os salários dos funcionários desta empresa são:
Empresa C: 1, 2, 3, 4, 5
Vamos calcular os desvios destes valores em relação à média.
A média aritmética dessa sequência de valores é 3.
O primeiro valor é 1 ( 11 =X ). O desvio deste primeiro valor, em relação à 3 (=média
aritmética) é:
XXe −= 11
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 5
2311 −=−=e
Utilizamos a letra ‘e’ para indicar o desvio. É que é muito comum, em vez de falarmos em
“desvios em relação à média”, utilizarmos a expressão “erros em relação à média”. Aí, a
letra “e” lembraria a inicial de “erro”. Mas o significado é o mesmo. Como já estou
utilizando a letra “d” (inicial de desvio) para indicar a variável auxiliar que facilita o cálculo
da média para dados em classes, optei pelo símbolo “e”.
Então o primeiro desvio é 2− . Para obtê-lo, tomamos o primeiro valor (1), tomamos a
média dos dados (3), e fazemos a diferença entre eles.
O segundo desvio ficaria assim:
XXe −= 22
Tomamos o segundo valor (2). Tomamos a média aritmética (3). E fazemos a diferença entre
eles.
A tabela abaixo contém todos os desvios para a empresa C.
Desvios para os salários na empresa C
Valor observado (X) Desvio em relação à média
(e)
Frequência simples (f)
1 -2 1
2 -1 1
3 0 1
4 1 1
5 2 1
Com esse conceito de desvio em relação à média aritmética, uma ideia geralmente vem à
cabeça.
E se calcularmos a média desses desvios?
Se a média dos desvios em relação à média aritmética for alta, então os dados são muito
dispersos. Se a média dos desvios for baixa, os dados estão pouco dispersos.
Com esta ideia, podemos calcular a média dos desvios dos salários na empresa C.
Desvio em relação à média
(e)
Frequência simples (f) fe ×
-2 1 -2
-1 1 -1
0 1 0
1 1 1
2 1 2
Totais 5 0
A média dos desvios fica:
0
5
0
==e
1322 −=−=e
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 6
Por que a média é zero? A média deu zero porque a soma dos desvios é zero (total da
coluna fe × ).
Lá em propriedades da média eu disse que a soma de todos os desvios em relação à média
aritmética é igual a zero. Na hora eu não expliquei. Apenas deixei a informação. Pois bem,
chegou a hora de olhar esta propriedade com mais calma.
Nós vimos que, para a empresa C, a soma de todos os desvios foi zero. Só que isso não
acontece só para os salários dos funcionários da empresa C. Para qualquer sequência
numérica que você montar, a soma dos desvios em relação à média aritmética será zero. É
uma propriedade da média.
Por mais que os dados estejam dispersos, a média dos desvios será sempre nula. Isto
porque, havendo dispersão, teremos valores menores que a média (desvios negativos) e
teremos valores maiores que a média (desvios positivos). Os valores positivos cancelam os
negativos e a soma dá sempre zero.
Portanto, a média dos desvios não pode ser utilizada para comparar a dispersão de duas
sequências numéricas.
1.4. Desvio médio
A idéia do desvio médio é muito parecida com a que trouxemos acima. Calcular os desvios
em relação à média aritmética. Só que utilizamos uma ferramenta para evitarmos o
problema de termos números negativos e positivos, de tal modo que os desvios negativos
cancelem os desvios positivos e a soma dê zero. Esta ferramenta é o módulo.
O módulo tem a propriedade de transformar um número negativo em positivo.
Vamos a alguns exemplos.
Qual o módulo de -2?
O número -2 é negativo. O módulo transforma números negativos em positivos.
22 =−
Representamos o módulo por duas barras verticais. Assim, o módulo de -2 é 2.
Seguindo o mesmo raciocínio, o módulo de -25 é 25.
2525 =−
Quando o número for positivo, o módulo não faz nada. Deixa o número como está. Logo, o
módulo de 8 é o próprio 8.
88 =
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 7
Pois bem, e se em vez de trabalharmos com os desvios utilizarmos seus respectivos
módulos?
Aí acabamos com o problema de termos números negativos. Não tendo mais números
negativos, não há cancelamento de números negativos com positivos e a soma não dá zero.
Vamos ver como ficaria.
Desvios para os salários na empresa C
Valor observado (X) Desvio em relação à média
(e)
Módulo do desvio (|e|)
1 -2 2
2 -1 1
3 0 0
4 1 1
5 2 2
Pronto. Na coluna de módulos dos desvios não temos nenhum número negativo. Se
fizermos a média desses valores, ficamos com:
Módulo do desvio em
relação à média (|e|)
Frequência simples (f) fe ×
2 1 2
1 1 1
0 1 0
1 1 1
2 1 2
Totais 5 6
A média dos módulos dos desvios fica:
2,1
5
6
==DM
Este é o valor do Desvio Médio.
Conclusão:
Desvio médio é a média dos módulos dos desvios (desvios calculados em relação à média
aritmética).
Se fôssemos escrever a fórmula que representa os cálculos feitos na tabela acima,
poderíamos dizer que o desvio médio é dado por:
n
XX
DM
n
i
i∑
=
−
= 1
Ou seja:
Calculamos cada desvio em relação à média aritmética ( XX i − )
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 8
Tiramos o módulo de cada desvio ( XX i − )
Somamos todos os desvios ( XX i −∑ )
Dividimos pelo número de dados, obtendo:
n
XX
DM
n
i
i∑
=
−
= 1
Para treinar um pouco, vamos calcular o desvio médio para os salários dos funcionários da
empresa B.
Desvios para os salários na empresa B
Valor observado (X) Desvio em relação à média
(e)
Módulo do desvio (|e|)
1 -2 2
3 0 0
5 2 2
Módulo do desvio em
relação à média (|e|)
Frequência simples (f) fe ×
2 1 2
0 3 0
2 1 2
Totais 5 4
E o desvio médio da empresa B fica:
8,0
5
4
==DM
Note que o desvio médio foi capaz de me dizer que os salários da empresa C são mais
dispersos que os salários da empresa B.
O desvio médio em C (=1,2) foi maior que em B (=0,8). Portanto, em C os dados são mais
dispersos.
O desvio médio já é uma medida de dispersão mais “rica” que a amplitude. O desvio médio
leva em conta todos os dados, não apenas o maior e o menor.
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 9
Desvio médio:
Calculamos cada desvio em relação à média aritmética: )( XX i −
Tiramos o módulo de cada desvio: )( XX i −
Somamos todos os módulos dos desvios: ∑ − )( XX i
Dividimos pelo número de dados, obtendo:
n
XX
DM
i∑ −
=
)(
.
Questão 2 SEFAZ /BA – 2004 [FCC]
Sabe-se que o valor de uma determinada variável Q é obtida pela expressão definida por
2
32 +
=
i
Q
sendo i um número inteiro positivo. Se i assumir os valores 1, 2, 3, 4 e 5, então, o desvio
médio dessa variável é:
a) 1,8
b) 1,2
c) 0,9
d) 0,75
e) 0,5Resolução:
Vamos ver quais os valores assumidos por Q.
i Q
1 2,5
2 3,5
3 4,5
4 5,5
5 6,5
A média de Q é:
5,4
5
5,65,55,45,35,2
=
++++
=Q
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 10
Vamos calcular o desvio médio de Q:
5
5,45,65,45,55,45,45,45,35,45,2 −+−+−+−+−
=DM
5
21012 +++−+−
=DM
2,1
5
21012
=
++++
=DM
Gabarito: B.
1.5. Variância
A ideia da variância é bem parecida com a ideia do desvio médio. Continuamos trabalhando
com desvios em relação à média. E ainda desejamos eliminar os números negativos.
No desvio médio isto foi feito aplicando o módulo. Só que muitas vezes é difícil trabalhar
com a função módulo. Ela apresenta algumas características “indesejadas”.
Outra forma mais utilizada é, em vez de aplicar o módulo, elevar ao quadrado.
Quando elevamos um número negativo ao quadrado, ele vira positivo. Assim, eliminamos os
números negativos e acabamos com o problema de a soma dos desvios dar zero.
Vamos retomar o exemplo das empresas A, B e C, que vimos lá na fl. 2.
Vamos ver como fica a variância para a empresa C.
Desvios para os salários na empresa C
Valor observado (X) Desvio em relação à média
(e)
Desvio ao quadrado (e2)
1 -2 4
2 -1 1
3 0 0
4 1 1
5 2 4
Pronto: na coluna de desvios ao quadrado só temos valores não negativos.
Podemos fazer a média desses valores que o resultado será diferente de zero.
A variância nada mais é que a média dos quadrados dos desvio.
Desvio ao quadrado (e2) Frequência simples (f) fe ×2
4 1 4
1 1 1
0 1 0
1 1 1
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 11
4 1 4
Totais 5 10
O símbolo de variância é: σ2.
A variância dos salários na empresa C fica:
2
5
102
==σ
A variância tem unidade igual ao quadrado da unidade dos dados. Como os dados estão
expressos em R$ 1.000,00, a variância acima está expressa em (1.000.000 R$2) – um milhão
de reais ao quadrado.
Se fôssemos escrever uma fórmula para a variância, representando todos os cálculos feitos
nas tabelas acima, ficaríamos com:
�� = ∑ ��� − �
����
�
Caso os dados estejam agrupados, cada desvio deve ser multiplicado pela sua frequência. É
exatamente a mesma coisa que estudamos na aula passada, quando comparamos as
fórmulas da média para dados em rol e para dados agrupados.
Ou seja, se os dados estiverem agrupados, a variância fica:
�� = ∑��� − �
� × ��
�
Um comentário importante. Em concurso, é comum se fazer referência à variância
populacional e à variância amostral.
Na variância populacional, consideramos que nós tivemos acesso a todos os dados. Levamos
em conta toda a população, todo o universo de dados. Quando for assim, o procedimento é
exatamente aquele visto acima e a fórmula da variância é:
�� = ∑ ��� − �
����
�
Quando aplicamos esta fórmula, é como se estivéssemos considerando que na empresa C
há apenas 5 funcionários. Como nós conseguimos entrevistar todos eles, levamos em conta
toda a população. Calculamos a variância populacional.
Contudo, há casos em que nós não temos acesso a todos os dados. Se a empresa C tiver
mais funcionários e nós só tivermos entrevistado cinco deles, então nós trabalhamos na
verdade com uma amostra.
Quando temos uma amostra, a fórmula da variância fica um pouco diferente. O símbolo de
variância passa a ser: S2. E a fórmula fica:
( )
1
1
2
2
−
−
=
∑
=
n
XX
S
n
i
i
A única coisa que muda é o denominador. Em vez de “n”, fica “ 1−n ”.
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 12
Vamos supor que na empresa C tinha mais pessoas e aquelas 5 eram apenas uma amostra.
Neste caso, a variância ficaria assim:
5,2
4
10
15
102
==
−
=s
Quando o número de dados for grande (ou seja, quando “n” for grande), praticamente não
há diferença entre as duas fórmulas.
Por que subtrair 1 no denominador?
Não temos condições de entender o porquê disso neste tópico. Peço que apenas decorem.
A explicação depende do estudo do tópico “estimadores”
Mas fica a informação de que a variância da amostra é utilizada para estimar a variância da
população. Quando se deseja que este estimador tenha uma característica chamada de
“não viciado”, deve-se usar o denominador “n – 1”.
Então apenas gravem:
Em concursos:
• Variância amostral → uZlizar “n – 1” no denominador
• Variância populacional → uZlizar “n” no denominador
Variância populacional:
( )
n
XX
n
i
i∑
=
−
= 1
2
2σ
1.6. Propriedades das medidas de posição relacionadas aos desvios
No numerador da fórmula da variância temos a soma de todos os quadrados dos desvios.
Desvios estes calculados em relação à média aritmética. Para a empresa C a soma dos
quadrados dos desvios foi 10.
Vamos fazer um teste. Vamos calcular os quadrados dos desvios novamente. Só que, agora,
em vez de considerar desvios em relação à média aritmética, vamos fazer os desvios em
relação a outro valor qualquer. A título de exemplo, vamos fazer desvios em relação a 1X .
Para não confundir, esses “desvios modificados” eu vou chamar de 'e .
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 13
O primeiro desvio em relação à 1X é:
0' 111 =−= XXe
Tomamos o primeiro valor ( 1X ). Tomamos 1X . Subtraímos um do outro.
O segundo desvio em relação à 1X é:
121' XXe −=
112'1 =−=e
Tomamos o segundo valor (2). Tomamos 1X (1). Subtraímos um do outro.
A tabela abaixo contém todos os desvios em relação à 1X , para a empresa C:
Desvios para os salários na empresa C
Valor observado (X) Desvio em relação à 1X ( )'e Desvio ao quadrado ( )
2
'e
1 0 0
2 1 1
3 2 4
4 3 9
5 4 16
Total 30
Note que a soma dos quadrados dos desvios foi de 30.
Quando os desvios foram calculados em relação à média aritmética, a soma dos quadrados
dos desvios foi 10.
Quando os desvios foram calculados em relação a outro valor, a soma dos quadrados dos
desvios foi maior que 10.
Daí vem a última propriedade da média que tinha ficado sem explicação. Nós vimos lá no
tópico de propriedades das medidas de posição que a média aritmética é o valor em relação
ao qual é mínima a soma dos quadrados dos desvios. Só que a informação ficou apenas
registrada e eu não fiz nenhum comentário.
Esta soma dos quadrados dos desvios será mínima quando os desvios forem em relação à
média aritmética. Se outro valor for utilizado como referência para cálculo dos desvios, a
soma ficará maior.
Mas isto tudo foi só para entendermos melhor esta propriedade da média.
No cálculo de variância: sempre utilize desvios em relação à média aritmética.
Muito bem. Já vimos então que a média é o valor em relação ao qual é mínima a soma dos
quadrados dos desvios. Vimos também que a média dos desvios em relação à média é
sempre igual a zero.
Pois bem, para a mediana existe uma propriedade parecida. A soma dos módulos dos
desvios é mínima quando eles são calculados em relação à mediana.
Como exemplo, considerem o seguinte conjunto:
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 14
1, 2, 2, 2, 2, 6, 6
A média é igual 3 e a mediana é igual a 2. Vamos calcular os desvios em relação a cada uma
dessas grandezas.
valor desvio em relação à
mediana
módulo do desvio
em relação à
mediana
desvio em relação à
média
módulo do desvio
em relação à média
1 -1 1 -2 2
2 0 0 -1 1
2 0 0 -1 1
2 0 0 -1 1
2 0 0 -1 1
6 4 4 3 3
6 4 4 3 3
total 9 12
Notemcomo a soma dos módulos dos desvios em relação à mediana é menor que em
relação à média.
Podemos fazer o seguinte quadro-resumo:
Soma Média Mediana
soma dos desvios é nula quando os desvios são
calculados em relação à
média
soma dos quadrados dos
desvios
é mínima quando os desvios
são calculados em relação à
média
soma dos módulos dos
desvios
é mínima quando os desvios
são calculados em relação à
mediana
Questão 3 MPE RO 2005 [CESGRANRIO]
Analise as afirmativas a seguir, a respeito da média aritmética.
I - a soma dos resíduos em relação à média aritmética é sempre igual a zero;
II - é em relação à média aritmética que a soma dos valores absolutos dos resíduos é
mínima;
III - é em relação à média aritmética que a soma dos quadrados dos resíduos é mínima.
Está(ão) correta(s) a(s) afirmativa(s):
(A) II, somente.
(B) I e II somente.
(C) I e III somente.
(D) II e III somente.
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 15
(E) I, II e III.
Resolução:
Primeiro item.
Verdadeiro. É por esse motivo que, para cálculo da variabilidade dos dados, precisamos
utilizar os módulos do desvio (no caso do desvio médio) ou os quadrados dos desvios (no
caso da variância e do desvio-padrão).
(A) II, somente.
(B) I e II somente.
(C) I e III somente.
(D) II e III somente.
(E) I, II e III.
Segundo item.
A assertiva está errada. É em relação à média aritmética que é mínima a soma dos
quadrados dos desvios.
Só que a questão falou em soma dos valores absolutos. “Valor absoluto” é sinônimo de
módulo.
Quanto aos módulos, essa propriedade não vale para a média, sim para a mediana.
O item está errado.
(A) II, somente.
(B) I e II somente.
(C) I e III somente.
(D) II e III somente.
(E) I, II e III.
Gabarito: C
Apesar de já termos marcado a alternativa correta, vejamos o terceiro item. Ele afirma que
é em relação à média aritmética que a soma dos quadrados dos resíduos é mínima. De fato,
esta informação está de acordo com que estudamos acima. Item correto.
Questão 4 MPU 2004 [ESAF]
A norma euclidiana ( )∑
=
−
n
i
i AX
1
2
é mínima quando A é igual:
a) à média dos valores de iX
b) à mediana dos valores de iX
c) à moda dos valores de iX
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 16
d) ao primeiro quartil dos valores de iX
e) ao desvio padrão dos valores de iX
Resolução:
Norma euclidiana é um nome meio complicado. Mas não precisamos dele.
Observe o valor que se pretende calcular: ( )∑
=
−
n
i
i AX
1
2
.
Dentro da raiz quadrada temos uma soma de desvios ao quadrado. Desvios estes calculados
em relação a “A”. Nós vimos que esta soma é mínima quando “A” é igual à média aritmética
dos valores.
Gabarito: A.
1.7. Forma alternativa para cálculo da variância
Uma dificuldade que costuma aparecer no cálculo da variância são as contas envolvidas.
Dependendo dos valores fornecidos, o cálculo dos quadrados dos desvios pode ser muito
difícil.
Uma forma alternativa de cálculo da variância é a que segue. Para melhor entendimento,
vamos usar o método alternativo para cálculo da variância dos salários na empresa C.
Em vez de calcular os desvios, fazemos assim.
Primeiro passo: calculamos a média dos quadrados dos valores.
X 2X f fX ×2
1 1 1 1
2 4 1 4
3 9 1 9
4 16 1 16
5 25 1 25
total 5 55
A média dos quadrados das observações é dada por:
11
5
552
==X
Em seguida, calculamos o quadrado da média. A média aritmética é igual a 3. Logo, o
quadrado da média é 9.
93
2
2
==X
Terceiro passo: a variância é dada pela diferença entre os dois valores acima.
( )222 XX −=σ
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 17
Ou seja, a variância é a diferença entre a média dos quadrados ( 2X ) e o quadrado da
média (
2
X ).
( )222 XX −=σ
2911
2
=−=σ
Que é o mesmo resultado obtido anteriormente.
Caso estejamos interessados em calcular a variância amostral (S2), aí este método precisa de
um ajuste. Neste método alternativo, o pressuposto é que o denominador da fórmula da
variância é igual a n.
Caso o denominador seja n – 1 , então precisamos ajustar o método.
Mas é bem simples.
Primeiro, multiplicamos por n, para “anular” o denominador da fórmula da variância
populacional.
Em seguida, dividimos por 1−n , que é o denominador da fórmula da variância amostral.
Com isso, corrigimos a variância.
( )222
1
XX
n
n
S −×
−
=
No caso da empresa C, supondo que na verdade nós tivemos acesso a uma amostra de
tamanho 5, a variância amostral ficaria:
( ) 5,2911
15
52
=−×
−
=S
Forma alternativa de cálculo da variância:
Variância populacional: ( )222 XX −=σ
Variância amostral: ( )222
1
XX
n
n
S −×
−
=
Questão 5 Petrobras 2008 [CESGRANRIO]
Do total de funcionários de uma empresa, foi retirada uma amostra de seis indivíduos. A
tabela abaixo apresenta o tempo trabalhado na empresa, em anos completos, por cada um
deles.
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 18
A variância dessa amostra é
(A) 3,7
(B) 4,0
(C) 4,4
(D) 5,0
(E) 5,5
Resolução.
Primeiro, vamos fazer o cálculo a partir da fórmula de definição da variância (média dos
quadrados dos desvios)
3
6
18
6
===
∑ X
X
X f XXe −=
2
e fe ×2
1 1 -2 4 4
2 2 -1 1 2
3 2 0 0 0
7 1 4 16 16
total 22
4,4
16
22
1
2
2
=
−
=
−
×
=
∑
n
ef
S
Gabarito: C
Agora vamos fazer o cálculo alternativo.
Primeiro achamos a média das observações ao quadrado.
X X2 f fX ×2
1 1 1 1
2 4 2 8
3 9 2 18
7 49 1 49
total 6 76
A média dos quadrados das observações é igual a:
6
762
=X
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 19
A variância amostral fica:
( )222
1
XX
n
n
S −×
−
=
−×=
22
3
6
76
5
6
S
4,4
5
54
5
762
=
−=S
Antes de irmos para a próxima questão, vamos revisar rapidamente um tópico da
matemática do segundo grau, que será utilizado na resolução.
Se você eventualmente não precisar desta revisão, sem stress, pode pular diretamente para
o exercício seguinte.
REVISÃO: PRODUTOS NOTÁVEIS
Existem alguns produtos que aparecem de forma corrente nos mais diversos problemas de
matemática. Para evitar que, todas as vezes, a gente precise calculá-los, “na mão”, o que se
faz é gravar o resultado, para ganhar tempo.
Neste momento vamos revisar dois produtos notáveis em particular.
Primeiro:
�� + �
� = �� + �� + 2��
Ou seja, para elevar uma soma ao quadrado, fazemos assim. Elevamos o primeiro termo ao
quadrado. Elevamos o segundo ao quadrado. Depois multiplicamos duas vezes o primeiro
pelo segundo termo. Depois somamos tudo.
Como é que se chega neste resultado?
É simples, é só aplicar a propriedade distributiva. Assim:
�� + �
× �� + �
= � × � + � × � + � × � + � × �
= �� + �� + �� + ��
= �� + �� + 2��
Outro produto notável é o quadrado da diferença. Fica assim:
�� − �
� = �� + �� − 2��
Este resultado também pode ser obtido a partir da propriedade distributiva, de modo muito
semelhante ao que fizemos acima.
Então, os produtos notáveis que utilizaremos agora são:
�� + �
� = �� + �� + 2��
�� − �
� = �� + �� − 2��
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 20
Outro produto notável, que utilizaremosem momento posterior, é o que segue:
�� − �
× �� + �
= �� − ��
Questão 6 FINEP 2009 [CESPE]
Foi realizado um levantamento para comparar estatisticamente o valor de avaliação X de
um bem imóvel com o seu respectivo preço de venda Y. Para cada imóvel i (i = 1, 2, ..., 10),
registrou-se um par de valores (xi, yi), em que xi e yi representam, em R$ 1 milhão,
respectivamente, o valor de avaliação e o preço de venda do imóvel i.
Os seguintes resultados foram encontrados:
Com relação às informações apresentadas no texto e considerando que �� = �� − ��
representa a diferença entre o valor de avaliação e o preço de venda do imóvel i, a variância
amostral da distribuição do conjunto de dados d1,..., d10 foi
A positiva e inferior a 0,10.
B superior a 0,10 e inferior a 0,20.
C superior a 0,20 e inferior a 0,30.
D superior a 0,30 e inferior a 0,40.
E superior a 0,40.
Resolução.
Para “economizar” na escrita, vou omitir os limites do somatório. Mas todos os somatórios
que aparecerem são para i variando de 1 até 10.
Primeiro vamos calcular a média de d.
�̅ = ∑��10 =
∑��� − ��
10
�̅ = ∑�� − ∑��10 =
15 − 18
10 = −0,3
Agora calculamos a média dos valores de d2.
�� = ∑��
�
10
Vamos nos concentrar no numerador da fração.
���� = ���� − ��
� = ����� + ��� − 2����
Notem acima que utilizamos um produto notável. Tivemos um quadrado da diferença.
Continuando:
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 21
���� = �����
+�����
− 2������
���� = 23 + 33 − 2 × 27 = 2
Agora que calculamos o numerador, podemos voltar à fração:
�� = ∑��
�
10 =
2
10 = 0,2
A variância de “d” fica:
�!� = �� − �̅� = 0,2—0,32 = 0,2 − 0,09 = 0,11
Como a questão falou em variância amostral, temos que fazer o ajuste:
$� = 0,11 × �� − 1 = 0,11 ×
10
9 = 0,12222…
Gabarito: B
Questão 7 TCU 2009 [CESPE]
Uma instituição realizou levantamento com vistas a comparar os valores de dez diferentes
tipos de itens de consumo. Para cada item i(i = 1, 2, ..., 10), foi registrado um par de valores
(xi,yi), em que xi representa o valor do item i estabelecido pela empresa A, e yi representa o
valor desse mesmo item fornecido pela empresa B. Os seguintes resultados foram
encontrados:
���� + ��
= 130; ���� − ��
= 10
(
��
(
��
���� + ��
� = 1.790; ���� − ��
� = 26
(
��
(
��
Com base nessas informações, julgue os itens a seguir.
97. A variância da distribuição das diferenças yi - xi é maior que 1,5 e menor que 1,9.
100. Se VA for a variância amostral dos valores x1, x2, ..., x10 e VB for a variância amostral
dos valores y1, y2, ..., y10, então a soma VA + VB será maior do que 7.
Resolução.
Na aula passada, resolvemos outros itens desta mesma prova e vimos que:
�̅ = 7
� = 6
Item 97.
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 22
Seja:
�� = �� − ��
Vamos calcular a média de d.
�̅ = ∑��10 =
∑��� − ��
10 = −
∑��� − ��
10 = −
10
10 = −1
Agora calculamos a média dos valores de d2.
�� = ∑��
�
10
Vamos nos concentrar no numerador da fração.
���� = ���� − ��
�
Calcular ��� − ��
� e ��� − ��
� é exatamente a mesma coisa. Ficamos com:
���� =���� − ��
� =���� − ��
� = 26
Agora que calculamos o numerador, podemos voltar à fração:
�� = ∑��
�
10 =
26
10 = 2,6
A variância de “d” fica:
�!� = �� − �̅� = 2,6 − �−1
� = 1,6
Item certo.
Item 100.
���� + ��
� = ����� + ��� + 2����
Notem que, acima, tivemos um produto notável (quadrado da soma)
1.790 =����� + ��� + 2����
1.790 = ���� +���� + 2����� �equação I
���� − ��
� = ����� + ��� − 2����
Notem que, acima, tivemos um produto notável: o quadrado da diferença.
26 =����� + ��� − 2����
26 = ���� +���� − 2����� �equação II
Somando as duas equações:
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 23
1.790 + 26 = ���� +���� + 2����� +���� +���� − 2�����
1.816 = 2���� + 2����
908 = ���� +����
A variância de x é dada por:
�3� = ∑��
�
10 − �̅�
A variância de y fica:
�4� = ∑��
�
10 − � �
O item pede a soma das duas variâncias:
�3� + �4� = ∑��
�
10 − �̅� +
∑���
10 − � �
= ∑��
� +∑���
10 − �̅� − � �
= 90810 − 7� − 6� = 90,8 − 49 − 36 = 5,8
Item errado.
Gabarito: certo, errado
1.8. Desvio padrão.
O desvio-padrão nada mais é que a raiz quadrada positiva da variância. Se trabalharmos
com uma população, seu símbolo é σ. Se trabalharmos com uma amostra, seu símbolo é s.
Na empresa C (exemplo com que temos trabalhado desde a fl. 2), o desvio-padrão
populacional é:
2=σ
Caso os cinco valores de salários desta empresa sejam uma amostra, o desvio padrão
amostral fica:
5,2=S
Lembram que a variância tinha unidade igual ao quadrado da unidade dos dados?
Como o desvio-padrão é igual à raiz quadrada da variância, então o desvio padrão tem a
mesma unidade dos dados.
Como os dados estão em R$ 1.000,00, o desvio-padrão está também expresso em R$
1.000,00.
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 24
Questão 8 CGU 2008 [ESAF]
Calcule o valor mais próximo do desvio-padrão da amostra representada pela distribuição
de frequências abaixo representada pelos pontos médios das classes x e respectivas
frequências f.
x F
5 5
15 10
25 31
35 10
45 5
a) 1.
b) 2,44.
c) 5,57.
d) 7,056.
e) 10.
Resolução:
Para calcular o desvio-padrão, precisamos dos desvios em relação à média aritmética.
Portanto, o primeiro passo é encontrar a média aritmética.
Para tanto, criamos a coluna adicional:
x f fx ×
5 5 25
15 10 150
25 31 775
35 10 350
45 5 225
TOTAL 61 1525
A média fica:
25
61
1525
==X
Um detalhe. Para esta série de dados, especificamente, não era necessário fazer o cálculo
para chegar à média. Temos uma sequência simétrica. A média é simplesmente o termo do
meio. Em outro tópico, falaremos sobre simetria e assimetria com mais calma.
Agora podemos calcular os desvios em relação à média:
x e Memória de cálculo
5 -20 =5-25
15 -10 =15-25
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 25
25 0 =25-25
35 10 =35-25
45 20 =45-25
Podemos agora calcular a média dos desvios ao quadrado:
x
2
e f fe ×
2
5 400 5 2000
15 100 10 1000
25 0 31 0
35 100 10 1000
45 400 5 2000
TOTAL 61 6000
A média dos desvios ao quadrado é a variância:
61
60002
=σ
Agora um detalhe. Estamos trabalhando com uma amostra.
Sempre que trabalhamos com uma amostra, a variância é dita “variância amostral”.
Estamos, na verdade, a partir de uma amostra, estimando a variância da população.
Para que este estimador possua uma característica importante, de modo que possamos
classifica-lo como não viciado, é necessário que o denominador da variância seja trocado.
Em vez de dividirmos por ‘n’, dividimos por 1−n . Nestes casos, o símbolo geralmente
utilizado para a variância é s2.
100
161
60002
=
−
=s
E o desvio padrão é igual à raiz quadrada da variância:
10100 ==s
Gabarito: E
1.9. Propriedades das medidas de dispersão
Exemplo 1:
Considere a seguinte sequência de dados:
1, 1, 7, 7.
Calcule:
a) a amplitude
b) o desvio médio
c) a variância
d) o desvio padrão.
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 26
Resolução:
a) A amplitude é dada pela diferença entre o maior e o menor valor.617 =−=A
Para calculamos as demais medidas de dispersão, precisamos do valor da média aritmética.
4
4
7711
=
+++
=X
b) agora podemos calcular a média dos módulos dos desvios, que é o que chamamos de
desvio médio.
X 4−= Xe e f e f×
1 -3 3 2 6
7 3 3 2 6
TOTAL 4 12
O desvio médio fica:
3
4
12
==DM
c) A variância é a média dos quadrados dos desvios.
X 4−= Xe
2
e f fe ×2
1 -3 9 2 18
7 3 9 2 18
TOTAL 4 36
E a variância fica:
9
4
362
==σ
d) O desvio padrão é igual à raiz quadrada da variância.
39 ==σ
Exemplo 2:
Considere a seguinte sequência de dados:
3, 3, 15, 15.
Calcule:
a) a amplitude
b) o desvio médio
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 27
c) a variância
d) o desvio-padrão.
Resolução.
Vamos chamar esta sequência de dados de Y.
ROL (Y): 3, 3, 15, 15.
Vamos chamar a sequência de dados do exercício anterior de X.
ROL (X): 1, 1, 7, 7.
Repare que cada valor de Y pode ser calculado a partir do correspondente valor de X da
seguinte maneira.
12 +×= XY
A título de exemplo, tomemos o primeiro valor de Y.
31 =Y
Tomemos o primeiro valor de X.
11 =X
Note que 1211 +×= XY
O mesmo se aplica aos demais valores de Y e X.
Deste modo, podemos usar os resultados do exercício anterior para responder a este
exercício.
Temos que:
12 +×= XY
Agora, usamos as medidas propriedades das medidas de dispersão.
Para as medidas de dispersão absolutas (são todas as medidas que estudamos até agora),
vale o seguinte:
• somas e subtrações não interferem nas medidas de dispersão
• multiplicações e divisões interferem nas medidas de dispersão. Se multiplicarmos as
observações por uma constante, as medidas de dispersão também serão
multiplicadas por esta constante. Se dividirmos as observações por uma constante,
as medidas de dispersão também serão divididas por esta constante.
Exceção: variância.
Na variância, o efeito é sempre ao quadrado. Ou seja, se multiplicarmos as observações por
k, a variância será multiplicado por k2.
Para entender o porquê disso, basta pensar assim.
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 28
• No caso da amplitude, se somarmos uma constante a todos os dados, o maior valor
e o menor valor serão aumentados de forma igual, de modo que a diferença entre
ambos se mantém. Por isso a amplitude não se altera.
• No caso da variância, do desvio padrão e do desvio médio, temos o seguinte. Se
somarmos uma constante a todos os dados, todas as observações serão
aumentadas. A média também será aumentada. E os desvios ficam inalterados.
Evidentemente, para a subtração o raciocínio é análogo.
Vamos agora tratar da multiplicação.
No caso da amplitude, se multiplicarmos todo os valores por uma constante k, a maior e a
menor observação serão multiplicadas por k. A nova amplitude fica:
�6�� − 6�
Podemos colocar k em evidência:
6 × ��� − �
Ou seja, a nova amplitude é igual à amplitude anterior multiplicada por k.
No caso do desvio padrão e do desvio médio, se multiplicarmos todos os valores por uma
constante k, a média será multiplicada por k, assim como todas as observações. Com isso,
um determinado desvio passa a ser representado assim:
�6�� − 6�
Podemos colocar k em evidência:
6��� − �
Todos os desvios são multiplicados por k. Isto faz com que desvio médio e desvio padrão,
que dependem dos desvios, também sejam multiplicados por k.
Na variância, como os desvios são elevados ao quadrado, colocamos k2 em evidência. Por
isso a variância sofre a alteração ao quadrado.
Visto isso, vamos calcular cada medida de dispersão:
a) A amplitude fica:
12315 =−=A
Vamos testar a propriedade da amplitude?
Somas e subtrações não interferem na amplitude.
Multiplicações e divisões interferem sim na amplitude.
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 29
Com isso, temos:
1262 =×=YA
Observe que, quando usamos as propriedades da amplitude, obtivemos exatamente o
mesmo resultado acima, quando aplicamos a fórmula (subtração entre o maior valor e o
menor valor).
b) Aplicando as propriedades do desvio médio, temos:
Com isso:
632 =×=YD
c) Podemos usar a variância de X ( 2Xσ ) para calcular a variância de Y (
2
Yσ ).
Somas e subtrações não interferem na variância. Já a multiplicação e a divisão interferem
sim.
Quando multiplicamos os dados por uma constante, a variância é multiplicada pelo
quadrado desta constante. Analogamente, quando dividimos os dados por uma constante, a
variância é dividida pelo quadrado da constante.
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 30
A variância de Y é quatro vezes a variância de X.
3694
2
=×=Yσ
d) O desvio padrão é igual à raiz quadrada da variância.
636 ==Yσ
Note que, pelas propriedades do desvio padrão, o desvio padrão de Y é igual ao dobro do
desvio padrão de X.
Somas e subtrações não interferem nas medidas de dispersão absolutas (amplitude, desvio
médio, variância e desvio padrão).
Se multiplicarmos ou dividirmos cada valor da sequência de dados por uma constante
positiva, o desvio-padrão, o desvio médio e a amplitude sofrem a mesma alteração.
A variância sofre a alteração ao quadrado.
Questão 9 TJ PI 2009 [FCC]
A média aritmética dos salários dos empregados de uma empresa é igual a R$ 1.200,00 com
uma variância igual a 400,00 (R$)2. Caso seja concedido para todos os salários um reajuste
de 10% e, a seguir, um adicional fixo de R$ 200,00, é correto afirmar, com relação aos novos
valores da média, da variância e do desvio padrão, que
(A) o desvio padrão fica igual ao anterior multiplicado por 1,21.
(B) o novo coeficiente de variação fica igual ao anterior multiplicado por 1,10.
(C) a variância fica inalterada.
(D) a média fica igual a R$ 1.520,00 e o desvio padrão igual a R$ 22,00.
(E) a variância fica igual a 440,00 (R$)2.
Resolução:
12 +×= XY Não interfere na variância
12 +×= XY
222
2 XY σσ ×=
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 31
Inicialmente a média é de R$ 1.200,00. Em seguida, todos os valores são aumentados em
10%, ou seja, são multiplicados por 1,1.
A média sofre a mesma alteração. A nova média fica:
1,1 × 1.200 = 1.320
Depois, os salários recebem um adicional de R$ 200,00. Ou seja, os salários são aumentados
em 200,00. A média sofre a mesma alteração. A nova média será de:
1.320 + 200 = 1.520
Quanto às medidas de dispersão, elas são afetadas apenas pela multiplicação por 1,1.
O desvio padrão, o desvio médio e a amplitude são multiplicados por 1,1. Já a variância
sofre o efeito ao quadrado. A variância é multiplicada por 1,21 (=1,12).
A variância inicial era de 400,00. A nova variância fica:
400 × 1,1� = 484
O desvio padrão é a raiz quadrada da variância. Inicialmente, o desvio padrão era:
√400 = 20
Depois, todos os dados são multiplicados por 1,1. O desvio padrão também é multiplicado
por 1,1. O novo desvio padrão fica:
20 × 1,1 = 22
Gabarito: D
Questão 10 SEFAZ SP – 2006 [FCC]
Considerando as respectivas definições e propriedades relacionadas às medidas de posição
e de variabilidade, é correto afirmar:
a) concedendo um reajuste de 10% em todos os salários dos empregados de uma empresa,
tem-se que a respectiva variância fica multiplicada por 1,10.
b) definindo o coeficiente de variação (CV) como sendo o quociente da divisão dodesvio
padrão pela respectiva média aritmética (diferente de zero) de uma sequência de valores,
tem-se então que CV também poderá ser obtido dividindo a correspondente variância pelo
quadrado da média aritmética.
c) subtraindo um valor fixo de cada salário dos funcionários de uma empresa, tem-se que o
respectivo desvio padrão dos novos valores e igual ao valor do desvio padrão dos valores
anteriores.
d) dividindo todos os valores de uma sequência de números estritamente positivos por 4,
tem-se que o respectivo desvio padrão fica dividido por 2.
e) em qualquer distribuição de valores em estudo, a diferença entre a mediana e a moda é
sempre diferente de zero.
Resolução:
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 32
Letra A.
Dar um reajuste de 10% é o mesmo que multiplicar todos os salários por 1,1.
Se todos os salários são multiplicados por 1,1, a variância fica multiplicada por 1,12.
Alternativa errada.
Letra B.
Nós ainda vamos falar sobre o coeficiente de variação.
Mas já adianto que o coeficiente de variação é igual ao desvio padrão dividido pela média.
89 = ��
Se elevarmos o coeficiente de variação ao quadrado, obtemos:
89� = �
�
��
Assim, o que a alternativa deu foi o quadrado do coeficiente de variação (e não o coeficiente
de variação propriamente dito)
Alternativa errada.
Letra C.
Somar ou subtrair uma constante em cada um dos dados não interfere nas medidas de
dispersão. Alternativa correta.
Letra D.
Se dividirmos todos os dados por 4, o desvio padrão também será dividido por 4. Alternativa
errada.
Letra E.
Alternativa errada. Basta pensar numa sequência simétrica.
Exemplo: 1, 2, 2, 3.
A mediana, a média e a moda são iguais a 2. A diferença entre a mediana e a moda é igual a
zero.
Posteriormente, falaremos mais detalhadamente sobre assimetria.
Gabarito: C
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 33
Questão 11 Ministério da Integração Nacional 2012 [ESAF]
A distribuição de frequências em classes do salário mensal x, medido em número de salários
mínimos, de uma amostra aleatória de 50 funcionários de uma empresa, é apresentado a
seguir.
� �
Mais de 0 a 10 22
Mais de 10 a 20 13
Mais de 20 a 30 10
Mais de 30 a 40 3
Mais de 40 a 50 2
Usando os dados acima, obtenha o valor mais próximo da variância amostral do salário
mensal.
a) 121,5
b) 124
c) 126,5
d) 129
e) 131,5
Resolução:
Seja “X” o ponto médio de cada classe.
Classe � �
Mais de 0 a 10 5 22
Mais de 10 a 20 15 13
Mais de 20 a 30 25 10
Mais de 30 a 40 35 3
Mais de 40 a 50 45 2
Vamos criar a variável auxiliar “d”, dada por:
� = � − 2510
Fazemos assim: subtraímos da variável "X" a constante 25 (ponto médio da classe central) e
dividimos por 10 (amplitude de classe). O resultado fica:
Classe � � = � − 2510
� � × �
Mais de 0 a 10 5 -2 22 -44
Mais de 10 a 20 15 -1 13 -13
Mais de 20 a 30 25 0 10 0
Mais de 30 a 40 35 1 3 3
Mais de 40 a 50 45 2 2 4
Total 50 -50
A média de “d” fica:
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 34
�̅ = −5050 = −1
Com o mesmo raciocínio, calculamos a média de ��
� � �� � �� × �
5 -2 4 22 88
15 -1 1 13 13
25 0 0 10 0
35 1 1 3 3
45 2 4 2 8
50 112
O que resulta em:
�� = 11250 = 2,24
A variância populacional é igual à diferença entre a média dos quadrados e o quadrado da
média:
�� = �� − �̅�
= 2,24 − �−1
� = 1,24
Na variância populacional, o denominador é “n”(= número de dados na amostra).
Mas nós queremos a variância amostral, com denominador “n – 1”. Então multiplicamos o
resultado acima por “n”, para cancelar a divisão feita, e dividimos por “n – 1”, para
chegarmos ao denominador desejado.
$� = 1,24 × 5049 = 1,26
Essa é a variância amostral para “d”.
$!� = 1,26
Agora calculamos a variância amostral para X. Assim:
� = � − 2510
� = 10� + 25
Quando multiplicamos os dados por uma constante (10), a variância fica multiplicada pela
constante ao quadrado (102). Quando somamos uma constante aos dados (25), a variância
não se altera.
$3� = 10� × $!�
$3� = 100 × 1,26 = 126
Gabarito: C
1.10. Coeficiente de variação.
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 35
Trata-se de mais uma medida de dispersão.
O coeficiente de variação é igual ao desvio padrão dividido pela média.
No caso da empresa C (exemplo lá da fl. 2), temos:
3=X
2=σ
E o coeficiente de variação fica:
3
2
=CV
O coeficiente de variação é adimensional. Não tem unidade de medida. Isto porque tanto o
numerador quanto o denominador têm a mesma unidade, que acabam se cancelando.
Em matemática, a palavra “relação” é sinônimo de divisão. Por isso, o coeficiente de
variação é comumente chamado de medida de dispersão relativa (pois envolve uma
divisão).
A utilidade do coeficiente de variação é permitir a comparação da dispersão entre conjuntos
de dados que possuem médias diferentes Assim, por exemplo, imagine as vendas diárias de
um vendedor ambulante e de uma grande empresa, ao longo de uma dada semana (em
reais):
• vendedor ambulante: 10; 11; 12; 9; 8
• grande empresa: 1.000.000; 1.000.001; 1.000.002; 999.999; 999.998
Se você calcular a variância para os dois conjuntos, ela será igual a 2. Mas será mesmo
correto dizer que ambos os conjuntos apresentam mesma dispersão?
A variância é uma medida de dispersão absoluta. Para ela, interessam apenas os valores
absolutos dos quadrados dos desvios. Apenas isso.
Já no coeficiente de variação nós temos uma referência quanto à grandeza relativa dos
desvios. Um desvio de R$ 1,00 num conjunto em que a média é de R$ 10,00 é um desvio de
10%. É um desvio relativamente grande. O desvio de R$ 1,00 num conjunto em que a média
é de R$ 1.000.000,00 é irrisório, desprezível.
O coeficiente de variação nos diz que, tomando a média como denominador, as vendas da
grande empresa são mais concentradas.
Questão 12 SEFAZ BA – 2004 [FCC]
Com relação às medidas de tendência central e de dispersão, é correto afirmar que:
a) multiplicando-se todos os valores de uma determinada sequência de números positivos
por um mesmo número, maior que um, o seu respectivo coeficiente de variação aumenta
de valor.
b) a diferença entre a média aritmética e a mediana de uma sequência de números positivos
é sempre maior que a diferença entre a média aritmética e a moda dessa mesma sequência.
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 36
c) a média harmônica de uma sequência de números positivos é igual à média aritmética
dos respectivos inversos destes números.
d) em uma sequência de números positivos, o produto da média aritmética pelo respectivo
coeficiente de variação é igual ao valor do desvio padrão correspondente.
e) a média geométrica de uma sequência de números positivos é sempre maior ou igual à
média aritmética destes números.
Resolução:
Vamos à alternativa A.
A alternativa seria sobre as propriedades do coeficiente de variação. Só que nós não
estudamos nenhuma propriedade do coeficiente de variação. Como o coeficiente de
variação é resultado da divisão do desvio padrão pela média, podemos utilizar as
propriedades dessas duas grandezas para concluirmos o que acontece com o coeficiente de
variação.
Vamos a um exemplo para ficar mais fácil.
Considere o seguinte conjunto de dados: 1, 2, 3, 4, 5.
Sabemos que sua média e seu desvio padrão são:3=X
2=σ
E o coeficiente de variação é:
3
2
=CV
Agora multiplicamos todos esses valores por uma constante maior que 1. Vamos multiplicar
por 3.
Os dados ficam assim: 3, 6, 9, 12, 15.
Vimos propriedades da média. Sempre que multiplicamos uma sequência de valores por
uma constante, a média sofre a mesma variação.
A nova média fica:
933' =×=X
Vimos propriedades do desvio padrão. Sempre que multiplicamos uma sequência de valores
por uma constante, o desvio padrão sofre a mesma variação.
O novo desvio padrão fica:
23' ×=σ
Logo, o novo coeficiente de variação fica:
3
2
33
23
' =
×
×
=CV
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 37
Conclusão: o coeficiente de variação não é alterado por uma multiplicação dos dados. Isto
porque tanto a média quanto o desvio padrão são multiplicados pela mesma constante.
Assim, na hora de dividir um pelo outro, essa constante é “cortada”.
A alternativa está errada.
A alternativa B diz que a diferença entre a média e a mediana é sempre maior que a
diferença entre a média e a moda.
Isto é incorreto. Basta pensar na seguinte sequência de dados: 1, 2, 2, 2, 3.
A média, a mediana e a moda são todas iguais a 2 (é uma sequência simétrica, assunto que
ainda estudaremos).
Ou seja, a diferença entre a média e a mediana é zero. A diferença entre a média e a moda é
zero. As duas diferenças são iguais. A alternativa está errada.
A alternativa C diz que a média harmônica de uma sequência de números positivos é igual à
média aritmética dos respectivos inversos desses números.
A questão está errada. Nós vimos na aula de medidas de posição que a média harmônica é o
inverso da média aritmética dos inversos dos números considerados.
Na alternativa D, afirma-se que o produto da média pelo coeficiente de variação é igual ao
desvio padrão.
Esta alternativa está correta.
σ
σ
=×=×
X
XCVX
A alternativa E diz que a média geométrica é sempre maior ou igual à média aritmética. Nós
vimos na aula de medidas de posição que é justamente o contrário. Para um conjunto de
números positivos, a média aritmética é sempre maior ou igual à média geométrica.
Gabarito: D.
Questão 13 TCE RN 2009 [CESPE]
Em um estudo estatístico censitário, foi considerado um indicador X que assume os três
seguintes valores possíveis: –1, 0 ou 1. A média e a variância populacionais desse indicador
X são, respectivamente, 1/2 e 3/4. Nesse caso, é correto afirmar que
56. a moda de X foi igual a -1.
57. o coeficiente de variação de X foi inferior a 1,6.
58. a frequência relativa dos casos em que o indicador assume o valor zero foi inferior a
0,01.
59. a mediana do indicador X foi igual a 1/2
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 38
Resolução
Não sabemos as frequências relativas de cada possível valor de X. Genericamente, vamos
designá-las por a, b, c.
� �� frequência relativa � × � � × ��
-1 1 a -a a
0 0 b 0 0
1 1 c c c
total 1 −� + : � + :
A média de X é igual a 0,5. Logo:
� = −� + :
0,5 = −� + :
−� + : = 0,5�I
A média de X2 fica:
�� = � + :
A variância de X é dada por:
�� = �� − � �
O exercício disse que a variância é igual a 0,75:
0,75 = � + : − 0,5�
� + : = 1 �II
Somando as duas equações:
�−� + :
+ �� + :
= 0,5 + 1
2: = 1,5
: = 0,75
Voltando na equação II:
� + : = 1
� = 1 − :
� = 1 − 0,75
� = 0,25
Por fim, como a soma de todas as frequências relativas é sempre igual a 1, temos:
� + � + : = 1
� = 1 − � − : = 1 − 1 = 0
Portanto, a distribuição de frequencias é dada por:
� frequência relativa
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 39
-1 0,25
0 0
1 0,75
Item 56.
A moda é igual a 1 (termo de maior frequência). Item errado.
Item 57.
O coeficiente de variação é igual à divisão entre o desvio padrão e a média.
89 = �� =
;34
0,5 =
√3/2
0,5 = √3 ×
2
2 = √3 ≅ 1,73
Item errado.
Item 58.
A frequência relativa para � = 0 é de 0%. Item certo.
Item 59.
A mediana corresponde à frequência acumulada 0,5.
� frequência relativa
simples
frequência relativa
acumulada
-1 25% 25%
0 0% 25%
1 75% 100%
Na coluna de frequências acumuladas não temos o valor 50%. Neste caso, tomamos o valor
imediatamente superior (100%).
Isto significa que as observações correspondentes às frequencias relativas 26%, 27%, ...,
100%, incluindo a de 50%, todas elas se referem ao valor X = 1.
Concluindo:
> = 1
Item errado.
Gabarito: errado, errado, certo, errado.
Questão 14 Senado 2008 [FGV]
O coeficiente de variação amostral (em porcentagem) de um conjunto de salários é 110%.
Se os salários desse conjunto forem reajustados em 20%, o novo coeficiente de variação
amostral será:
(A) 110%.
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 40
(B) 112,2%.
(C) 114,2%.
(D) 122%.
(E) 130%.
Resolução:
Inicialmente, a média era X e o desvio-padrão era σ .
O coeficiente de variação é dado por:
1,1==
X
CV
σ
Posteriormente, os salários são reajustados em 20%. Isto equivale a multiplicar os salários
antigos por 1,2.
Quando multiplicamos todas as observações por uma constante, a média sofre a mesma
modificação.
Logo, a nova média será:
XX ×= 2,1'
Quando multiplicamos todas as observações por uma constante, o desvio-padrão sofre a
mesma alteração.
Logo, o novo desvio-padrão será:
σσ ×= 2,1'
Com isso, o novo coeficiente de variação fica:
XX
CV
×
×
==
2,1
2,1
'
'
'
σσ
Tanto a média quanto o desvio-padrão são multiplicados por 1,2. Com isso, há uma
simplificação. O 1,2 é anulado, de modo que o coeficiente de variação não se altera.
1,1
2,1
2,1
' ==
×
×
=
XX
CV
σσ
Conclusão: multiplicar todas as observações por uma dada constante não altera o
coeficiente de variação.
Gabarito: A
1.11. Medidas de dispersão para dados em classe
Se os dados estiverem em classes, não temos acesso a todos os valores observados. Para
calcular as medidas de dispersão, precisamos fazer algumas considerações.
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 41
No caso da amplitude, não há maiores problemas. Tomamos o maior limite superior.
Tomamos o menor limite inferior. E subtraímos um do outro.
Para as demais medidas de dispersão (variância, desvio padrão, desvio médio e coeficiente
de variação), a consideração que se faz é a mesma do cálculo da média para dados em
classes. Consideramos que todos os valores de frequência se referem ao ponto médio de
cada classe.
Na sequência, trago alguns exemplos para vermos como fica.
Exemplo 3:
Considere a seguinte tabela, referente às idades das crianças de uma turma (não existem
observações coincidentes com os extremos das classes):
Idades Frequência absoluta simples
6 – 8 25
8 – 10 50
10 – 12 25
Calcule:
a) a amplitude
b) o desvio médio
c) a variância
d) o desvio padrão
e) o coeficiente de variação.
Resolução:
Letra A.
Para calcular a amplitude, precisamos pegar o maior valor de idade, o menor valor, e
subtrair um do outro.
Só que não temos acesso a todos os valores. Por exemplo, não sabemos qual a idade de
cada uma das 25 crianças da primeira classe. Só sabemos que elas têm idades entre 6 e 8
anos. O mesmo ocorre para as demais classes.
Nestes casos, para calcular a amplitude fazemos o seguinte:
Tomamos o maior limite superior (=12)
Tomamos o menor limite inferior (=6)
Subtraímosum do outro. Esta é a amplitude.
6612 =−=A
Letra B
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 42
Para calcular o desvio médio, precisamos pegar cada valor observado, encontrar o desvio
em relação à média aritmética. Feito isto, tiramos os módulos dos desvios. Por fim, o desvio
médio é igual à média dos módulos dos desvios.
Só que não sabemos quais os valores observados. Só sabemos as frequências das classes.
Assim, não temos nem como calcular a média aritmética nem os desvios. Por consequência,
não temos como calcular o desvio médio.
O que faremos?
Vamos ‘chutar’. Vamos supor que todas as observações correspondem ao ponto médio das
classes. É exatamente a mesma consideração que fizemos para calcular a média aritmética
para dados em classes.
Com esta ideia, primeiro calculemos a média aritmética.
Idades
Pontos médios
das classes ( X )
Frequência absoluta
Simples ( f )
fX ×
6 – 8 7 25 175
8 – 10 9 50 450
10 – 12 11 25 275
TOTAL 100 900
9
100
900
==X
Na verdade, nem precisava dessas contas. O conjunto acima é simétrico. A média, portanto,
é igual ao ponto médio da classe central (ainda falaremos sobre simetria).
Tendo a média aritmética, vamos considerar que todas as observações ocorrem justamente
nos pontos médios das classes. Assim, vamos calcular os desvios em relação a X .
Pontos médios
das classes ( X )
Desvios em relação
à média aritmética
( e )
Memória de cálculo
7 -2 = 7 - 9
9 0 = 9 - 9
11 2 = 11 - 9
Agora basta encontrar os módulos dos desvios e fazer a média destes valores.
Ptos médios
das classes ( X )
Desvios em relação à
média aritmética
( e )
Módulo dos
Desvios
e
Frequência absoluta
Simples ( f )
fe ×
7 -2 2 25 50
9 0 0 50 0
11 2 2 25 50
TOTAL 100 100
1
100
100
==DM
O desvio médio é igual a 1.
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 43
Letra C.
Para o cálculo da variância, também consideramos que as observações correspondem ao
ponto médio de cada classe. A variância nada mais é que a média dos quadrados dos
desvios.
Ptos médios
das classes ( X )
Desvios em relação à
média aritmética
( e )
Desvios ao
quadrado
2
e
Frequência absoluta
Simples ( f )
fe ×
2
7 -2 4 25 100
9 0 0 50 0
11 2 4 25 100
TOTAL 100 200
2
100
2002
==σ
Letra D
O desvio padrão é igual à raiz quadrada da variância.
2=σ
Letra E.
O coeficiente de variação é igual ao desvio padrão dividido pela média.
9
2
==
X
CV
σ
Questão 15 BNDES 2008 2 [CESGRANRIO]
Para um estudo sobre a distribuição de salário mensal dos empregados de uma empresa
foram coletados os salários de uma amostra aleatória de 50 empregados. Os resultados
amostrais levaram à construção da distribuição de frequência abaixo. Não existem
observações coincidentes com os extremos das classes.
A média aritmética e a variância amostral da distribuição valem, aproximadamente,
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 44
Resolução.
Vamos começar com o cálculo da média.
classe ponto médio (X) frequência simples (f)
1 – 3 2 40
3 – 5 4 30
5 – 7 6 20
7 – 11 9 10
Podemos adaptar as frequencias, dividindo todas por 10.
classe ponto médio (X) frequência simples adpatada (f’) 'fX ×
1 – 3 2 4 8
3 – 5 4 3 12
5 – 7 6 2 12
7 – 11 9 1 9
total 10 41
A média é igual a:
1,4
10
41
==X
Ficamos entre as alternativas C e D.
Para cálculo da variância, vamos achar a média dos valores de X ao quadrado.
ponto médio
(X)
2X frequência simples
adpatada (f’)
'
2
fX ×
2 4 4 16
4 16 3 48
6 36 2 72
9 81 1 81
10 217
7,21
10
2172
==X
Finalmente, a variância de X é dada por:
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 45
)1,47,21(
49
50
)(
1
2
2
22
−×=−×
−
= XX
n
n
s
99,4)81,167,21(
49
502
=−×=s
Gabarito: D
Como o valor de n é grande, a variância populacional é praticamente igual à amostral. Nesse
caso, você poderia fugir do denominador 49. Ficaria assim:
36,481,167,21
2
=−=σ
Novamente, daria para marcar letra D.
1.12. Variância da união de dois conjuntos
Questão 16 SEFAZ BA – 2004 [FCC]
Sabe-se que a altura média dos 5.000 habitantes de uma cidade X é igual à altura média de
uma outra cidade Y com 10.000 habitantes, ou seja, igual a 1,70m. O desvio-padrão
correspondente encontrado para a população da cidade X é 2 cm e para a população da
cidade Y é 5 cm. Então, a variância das alturas da população das duas cidades reunidas é:
a) 12,25 cm2
b) 16,00 cm2
c) 18,00 cm2
d) 24,50 cm2
e) 29,00 cm2
Resolução:
Primeira solução: usando a fórmula de definição da variância
O exercício deu o desvio padrão da cidade X. Para achar a variância, basta elevar ao
quadrado. A variância da cidade X é igual a 4 cm2 (=2 ao quadrado). E como se chega na
variância? Basta fazer a média dos desvios ao quadrado (média esta calculada em relação a
170 cm, que é a altura média da cidade).
Ou seja:
( )∑ −×= 22 170
000.5
1
XXσ
( )∑ −×= 2170
000.5
1
4 X
Multiplicando cruzado:
( ) 000.54170 2 ×=−∑ X
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 46
A variância das alturas na cidade Y é igual a 25 cm2. Basta elevar o desvio padrão fornecido
ao quadrado. Como é obtida esta variância? Esta variância é igual à média dos desvios ao
quadrado (desvios esses calculados em relação a 170 cm, que é a altura média na cidade).
( )∑ −×= 22 170
000.10
1
YYσ
( )∑ −×= 2170
000.10
1
25 X
Multiplicando cruzado:
( ) 000.1025170 2 ×=−∑ X
Pois bem. Agora juntamos as pessoas das duas cidades. A altura média continua sendo de
170 (já que as duas cidades tinham médias iguais). E a variância? Fica em quanto?
Para achar a variância, vamos somar todos os quadrados dos desvios (desvios estes
calculados em relação a 170).
Depois disso, dividimos o resultado por 15.000 (pois essa nova população tem 15.000
habitantes, resultado da soma dos habitantes de X e Y). Com esse procedimento, obtemos
justamente a variância da nova população.
( )∑∑ −+−×= 222 )170()170(
000.15
1
YXσ
Substituindo os valores dos somatórios:
( )000.1025000.54
000.15
12
×+××=σ
18000.270
000.15
12
=×=σ
A nova variância é de 18 cm2.
Gabarito: C
Um detalhe.
Note bem na fórmula a que chegamos:
( )000.1025000.54
000.15
12
×+××=σ
Na fórmula acima temos as variâncias das duas cidades, multiplicadas pelos números de
habitantes.
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 47
A variância das duas cidades reunidas é uma média ponderada das variâncias de cada
cidade. E os pesos de ponderação são os números de habitantes (ou número de elementos
de cada conjunto).
Destaque-se que esta fórmula só vale se as médias das duas cidades forem iguais. Certo?
Se as médias das cidades forem diferentes uma da outra, aí o procedimento é um pouco
mais complicado.
Segunda solução: usando a fórmula alternativa da variância
Para a cidade X, temos:
( )222 XXX −=σ
41701704
2222
+=⇒−= XX
Analogamente, para a cidade Y, temos:
( )222 YYY −=σ
2517017025
2222
+=⇒−= YY
Seja Z o conjunto correspondente à união de X e Y.
A média de Z é a média ponderada entre as médias de X e Y.
=
×+×
=
000.15
000.10000.5 YX
Z 170 (cm)
A média de Z2 é a média ponderada entre as médiasde X2 e Y2.
=
+×++×
=
×+×
=
000.15
)25170(000.10)4170(000.5
000.15
000.10000.5
2222
2 YX
Z
+=
×+×
+=
22
170
000.15
25000.104000.5
170 18
E a variância de Z fica:
=−=
2
22 ZZZσ 18)170()18170(
22
=−+
( )000.1025000.54
000.15
12
×+××=σ
variância da cidade X variância da cidade Y
peso da variância da
cidade X: número de
habitantes da cidade
peso da variância da
cidade Y: número de
habitantes da cidade
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 48
Esta segunda solução tem a vantagem de valer sempre, mesmo que as médias de X e Y não
sejam iguais.
Questão 17 ARCE/2006 [FCC]
Uma administradora de imóveis realizou um estudo sobre todos os imóveis alugados em
duas regiões, A e B, levantando o seguinte quadro:
Região Qdade de
imóveis alugados
Valor médio
dos aluguéis
Coeficiente de variação
A 1.000 R$ 500,00 20%
B 4.000 R$ 500,00 30%
(Observação: no enunciado original, é dada a definição de coeficiente de variação.)
A variância conjunta de A e B, isto é, a variância dos valores dos aluguéis das regiões A e B
reunidas é, em R$2, igual a:
a) 20.000
b) 25.000
c) 32.500
d) 40.000
e) 62.500
Resolução:
Como as duas médias são iguais a 500,00, a média das duas regiões reunidas também será
igual a 500,00. Portanto, a variância conjunta (ou seja, das duas regiões tomadas
conjuntamente) será a média ponderada das variâncias individuais. Os pesos de ponderação
são os números de elementos de cada conjunto.
Precisamos achar as variâncias das duas regiões.
Multiplicando o coeficiente de variação pela média, temos justamente o valor do desvio
padrão.
000.101002,0500
2
=⇒=×=×= AAA CVA σσ
500.221503,0500
2
=⇒=×=×= BBB CVB σσ
E agora podemos calcular a variância conjunta:
( )000.4500.22000.1000.10
000.5
12
×+××=σ
Simplificando:
( )8,0500.22000.122 ×+×=σ
( ) 000.20000.18000.22 =+=σ
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 49
Gabarito: A.
Questão 18 TRT 7ª REGIAO 2009 [FCC]
Um levantamento realizado em duas empresas X e Y proporcionou os resultados
apresentados na tabela abaixo.
A variância dos salários das duas empresas reunidas é, em (R$)2, igual a
(A) 112.500.
(B) 87.750.
(C) 75.375.
(D) 63.000.
(E) 57.600.
Resolução:
Para achar o desvio padrão, basta multiplicar o coeficiente de variação pela média.
Em seguida, elevamos o desvio padrão ao quadrado, encontrando a variância.
�3 = 893 × � = 0,1 × 1.500 = 150
�3� = 150� = 22.500
Para a empresa Y os cálculos são semelhantes:
�4 = 894 × ? = 0,2 × 1.500 = 300
�4� = 300� = 90.000
Seja Z o conjunto correspondente à união entre X e Y.
Como as médias de X e Y coincidem (ambas iguais a 1.500), a média de Z também será igual
a 1.500.
@̅ = 1.500
Quando isso acontece, ou seja, quando X e Y têm a mesma média, a variância da união é a
média ponderada das variâncias de cada conjunto:
�A� = 100 × �3
� + 150 × �4�
100 + 150
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 50
�A� = 100 × 22.500 + 150 × 90.000250
Vamos multiplicar o numerador e o denominador por 4. Com isso, surgirá uma divisão por
1.000. Dividir por 1.000 é mais fácil, basta cortar zeros, ou andar com a vírgula.
�A� = 100 × 22.500 × 4 + 150 × 90.000 × 41.000
�A� = 2.250 × 4 + 150 × 90 × 4 = 63.000
Gabarito: D
Quando os conjuntos X e Y não tiverem mesma média, o cálculo da variância da união fica
bem mais complicado. Vejam este exemplo:
Questão 19 BACEN/2006 [FCC]
A média aritmética dos valores das vendas diárias realizadas pelas 50 empresas do Setor A é
de R$ 1.000,00, com desvio padrão de R$ 100,00. Sabe-se ainda que a média aritmética dos
valores das vendas diárias realizadas pelas 200 empresas do Setor B é de R$ 2.000,00, com
desvio padrão de R$ 200,00. A variância, em R$2, dos valores das vendas diárias realizadas
pelos dois setores reunidos é:
a) 34.000
b) 50.000
c) 194.000
d) 207.500
e) 288.000
Resolução:
Primeira solução: usando a fórmula de definição da variância, combinada com a
manipulação do somatório.
Na minha opinião, esta solução deve ser evitada, por ser bem trabalhosa.
Vamos chamar de A o conjunto das vendas do setor A, de B o conjunto das vendas do setor
B.
Antes de começarmos a resolução, vamos fazer o seguinte. Vamos criar as variáveis
auxiliares C e D, de forma que:
100
A
C = ;
100
B
D =
Com isso diminuímos o número de “zeros”, o que vai facilitar as coisas pra gente.
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 51
Então o conjunto C representa as vendas do setor A, modificadas. O conjunto D representa
as vendas do setor B, modificadas.
Usando as propriedades da média e do desvio-padrão, temos:
10=C ; 1=Cσ
20=D ; 2=Dσ
A média de C é dada pela soma de todos os valores de C, dividida por 50 (pois são 50
empresas no setor A).
500105050
50
=×=⇒×=⇒= ∑∑
∑
CCC
C
C
A média de D é dada pela soma de todos os valores de D, dividida por 200 (pois são 200
empresas no setor B).
000.420200200
200
=×=⇒×=⇒= ∑∑
∑
DDD
D
D
Seja X o conjunto que representa a união de C e D. Para achar a média de X, somamos todos
os valores de C e D e dividimos por 250 (pois são 250 empresas ao todo).
18
250
000.4500
250
=
+
=⇒
+
=
∑∑
X
DC
X
A média das “vendas modificadas” dos dois setores juntos é de R$ 18,00.
A variância de C é igual a 1 (=1 ao quadrado). Isso significa que:
( )
( ) 5010
50
10
1
2
2
=−⇒
−
= ∑
∑
C
C
Para o conjunto D, as contas são análogas.
( )
( ) 80020
200
20
4
2
2
=−⇒
−
= ∑
∑
D
D
E como fazemos para achar a variância de X? Precisamos pegar cada valor de venda
modificada, de cada uma das 250 empresas, e calcular o desvio em relação a 18,00 (que é a
média geral). Depois disso, elevamos o desvio ao quadrado e dividimos por 250, achando a
média dos quadrados dos desvios, que é a variância.
250
)18()18(
200
1
2
50
1
2
2
∑∑
==
−+−
= i
i
i
i
X
DC
σ
−+−×= ∑∑
==
200
1
2
50
1
22
)18()18(
250
1
i
i
i
iX DCσ
E agora vem o problema. Não sabemos quanto vale a soma dos quadrados dos desvios do
conjunto C em relação a 18. Ou seja, não sabemos quanto vale a seguinte expressão:
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 52
−∑
=
50
1
2
)18(
i
iC
Para o conjunto C, o que nós sabemos é o valor de:
( ) 5010 2 =−∑ C
Bom, então vamos “forçar a barra”. Vamos tentar fazer com que apareça o termo que já
conhecemos. Fica assim:
∑∑
==
−−=−
50
1
2
50
1
2
)810()18(
i
i
i
i CC
Pronto. Agora apareceu a quantia que já conhecemos. Vamos desenvolver o quadrado da
diferença:
( ) ( ){ }∑∑
==
+×−×−−=−
50
1
22
50
1
2
8810210)18(
i
i
i
i CCC
Separando o somatório da soma em soma de somatórios:
( ) ( ) ∑∑∑∑
====
+−×−−=−
50
1
50
1
50
1
2
50
1
2
64101610)18(
iii
i
i
i CCC
E aqui devemos lembrar da propriedade da média. A soma dos desvios em relação à média
aritmética é igual a zero.
( ) ∑∑∑
===
+×−−=−
50
1
50
1
2
50
1
2
6401610)18(
ii
i
i
i CC
( ) 645010)18(
50
1
2
50
1
2
×+−=− ∑∑
== i
i
i
i CC
250.3645050)18(
50
1
2
=×+=−∑
=i
iC
Para o conjunto D a idéia é a mesma:
∑∑
==
+−=−
200
1
2
200
1
2
)220()18(
i
i
i
i DD
( ){ }∑∑
==
+×−×+−=−
200
1
22
200
1
2
22)20(220)18(
i
ii
i
i DDD
( ) ( ) ∑∑∑∑
====
+−×+−=−
200
1
2
200
1
2
200
1
2
200
1
2
220420)18(ii
i
i
i
i
i DDD
600.18000800)18(
200
1
2
=++=−∑
=i
iD
Agora podemos finalmente calcular a variância da união de C e D:
−+−×= ∑∑
==
200
1
2
50
1
22
)18()18(
250
1
i
i
i
iX DCσ
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 53
( ) 4,19600.1250.3
250
12
=+×=Xσ
Como nós dividimos todos os valores das vendas por 100, nós obtivemos uma variância
menor que a que seria obtida sem esta modificação. A variância foi dividida por 100 ao
quadrado.
Desfazendo a modificação, precisamos multiplicar a variância acima por 100 ao quadrado.
000.194000.104,19 =×
Gabarito: C.
Segunda solução: usando forma alternativa de cálculo da variância.
Esta já é uma forma bem mais simples que a anterior, embora ainda sim um tanto quanto
trabalhosa.
A variância de C é igual a 1. A média de C é 10. Logo:
2
22
CCC −=σ
101101
222
=⇒−= CC
A variância de D é igual a 4. A média de D é 20. Portanto:
2
22 DDD −=σ
404204
222
=⇒−= CD
Seja X o conjunto correspondente à união entre C e.D A média de X é a média ponderada
entre as médias de C e D:
=
×+×
=
250
20050 DC
X =
×+×
250
202001050
18
A média de X2 será a média ponderada entre as médias de C2 e D2.
=
×+×
=
250
20050
22
2 DC
X =
×+×
=
250
40420010150
250
850.85
=343,4
A variância de X será:
2
22 XXX −=σ
=−=−= 3244,343184,343
22
Xσ 19,4
Como dividimos os dados por 100, a variância foi dividida por 1002. Precisamos multiplicar o
valor acima por 1002, para desfazer a transformação.
A variância real é dada por:
000.1944,19100100 =××
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 54
Questão 20 BACEN 2006 [FCC]
Em uma instituição bancária, o salário médio dos 100 empregados do sexo masculino é de
R$ 1.500,00, com desvio padrão de R$ 100,00. O salário médio dos 150 empregados do sexo
feminino é de R$ 1.000,00, com desvio padrão de R$ 200,00. A variância, em R$2, dos dois
grupos reunidos é:
a) 25.600,00
b) 28.000,00
c) 50.000,00
d) 62.500,00
e) 88.000,00
Resolução:
Vamos direto para a fórmula alternativa de cálculo da variância.
Vou chamar de X o conjunto dos salários dos homens, dividido por 100 (para diminuir a
quantidade de zeros).
Vou chamar de Y o conjunto dos salários das mulheres, dividido por 100.
Vou chamar de Z a união entre X e Y.
A média da união dos dois conjuntos é a média ponderada das médias de X e Y.
@̅ = 100 × � + 150 × ? 100 + 150 =
100 × 15 + 150 × 10
250
Vamos multiplicar o numerador e o denominador por 4. Assim surgirá uma divisão por
1.000, que é simples de ser feita (basta “cortar” os zeros).
@̅ = 4 × �100 × 15 + 150 × 10
1.000 = 4 × �1,5 + 1,5
= 12
O desvio padrão de X é 1. Logo, a variância de X é 12.
�3� = �� − � �
1� = �� − 15�
�� = 15� + 1� = 226
O desvio padrão de Y é 2. Logo, a variância de Y é 22.
�4� = ?� − ? �
2� = ?� − 10�
?� = 10� + 2� = 104
A média de Z2 é igual à média ponderada entre as médias de X2 e Y2.
@� = 100 × �� + 150 × ?� 100 + 150
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 55
Vamos multiplicar o numerador e o denominador por 4. Assim surgirá uma divisão por
1.000, que é simples de ser feita (basta “cortar” os zeros).
@� = 4 × 100 × �� + 150 × ?� 1.000
@� = 4 × �0,1 × �� + 0,15 × ?�
@� = 4 × B0,1 × 226 + 0,15 × 104C = 152,8
Por fim, a variância de Z é dada por:
�A� = @� − @̅�
�A� = 152,8 − 12� = 8,8
Como dividimos todos os dados por 100, a variância foi dividida por 1002.
Para achar a variância dos dados originais, precisamos multiplicar este valor por 1002.
8,8 × 10.000 = 88.000
Gabarito: E
2. BOX PLOT
Vamos ver do que se trata direto nos exercícios.
Questão 21 Petrobras 2005 [CESGRANRIO]
O gráfico a seguir é o box-plot da distribuição de renda, em mil reais, da população de um
determinado município.
Qual é a probabilidade de um habitante desse município ter renda superior a 6 mil reais?
(A) 0,15
(B) 0,20
(C) 0,25
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 56
(D) 0,50
(E) 0,75
Resolução.
Para entender melhor, vamos considerar o seguinte conjunto numérico, que poderia
perfeitamente ser representado pelo box-plot acima:
5; 5; 5,6; 5,8; 6,2; 6,5; 6,6; 7; 7; 8; 9; 10; 10; 11; 12; 22
Não é possível, a partir do Box-plot, determinarmos o conjunto de números que lhe deu
origem. Eu apenas inventei o conjunto acima. Eu criei um caso que poderia ser
representado pelo Box-plot dado na questão.
O box-plot é formado por um retângulo e duas “perninhas”, uma em cima e outra embaixo.
O retângulo indica os quartis. Assim, da figura acima, temos que os quartis são:
61 =Q ; 72 =Q ; 103 =Q
De fato, se você observar o conjunto acima, verá que os quartis são exatamente esses que
indicamos.
A amplitude interquartílica, dada pela diferença entre o primeiro e o terceiro quartil, fica:
4610
13
=−=−= QQd
Agora vejamos as “perninhas” (as linhas que saem do retângulo).
A linha de cima vai até a observação mais alta existente. Só que tem um detalhe. Esta linha
não pode ultrapassar o limite estabelecido por:
dQ 5,1
3
+
Ou seja, o tamanho máximo da linha é igual a 1,5 vezes a amplitude interquartílica.
Como a amplitude interquartílica é igual a 4, o tamanho máximo da linha é igual a 6. Logo, a
linha pode ir, no máximo, até:
166105,1
3
=+=+ dQ
A linha pode ir até 16. Logo, a linha não vai poder indicar o maior valor de todos (=22). O
efeito disso é que o valor 22 é considerado atípico, ou ainda, um “outlier”. Todas as
observações que ficarem fora do limite das linhas são consideradas atípicas.
Bom, excluindo-se os valores atípicos, a maior observação que sobra é o 12. Por isso a linha
de cima vai até 12.
Para a linha de baixo é a mesma coisa. Ela começa no primeiro quartil e desce. Mas ela tem
um limite de tamanho. Seu tamanho máximo é de d5,1 . Assim, ela vai até:
0665,11 =−=− dQ
Todos os valores abaixo de zero são tidos como atípicos. No caso, não há nenhum valor
abaixo de zero que possa ser considerado outlier.
Deste modo, a linha de baixo pode ir até 5, que é a menor observação.
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 57
Bom, visto o tal do diagrama de box-plot, vamos resolver a questão.
Escolhe-se um habitante aleatoriamente. Pergunta-se a probabilidade de esse habitante ter
renda maior que 6 mil reais.
Como 6 é o primeiro quartil, nós concluímos que 25% das observações são menores que 6 e
75% são maiores que 6.
A probabilidade procurada é 75%.
Gabarito: E
Questão 22 CEB 2009 [UNIVERSA]
Considere o gráfico Boxplot seguinte:
O valor marcado com um asterisco (*) representa
(A) o menor valor;
(B) 1,5 × �DE − D
(C) D
− 1,5 × �DE − D
(D) �DE − D
(E) um outlier.
Resolução.
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 58
Asteriscos são usados para indicar a existência de outliers. Eles são alocados fora dos limites
definidos por D
− 1,5� e DE + 1,5�.
Gabarito: E
Questão 23 INMETRO 2010 [CESPE]
Nos últimos cinco meses, uma família apresentou o seguinte quadro de despesas:
1.º mês: R$ 1.000,00;
2.º mês: R$ 1.200,00;
3.º mês: R$ 900,00;
4.º mês: R$ 1.100,00;
5.º mês: R$ 800,00.
Em relação a esse conjunto de dados, assinalea opção correta.
A O desvio padrão amostral é superior a R$ 200,00.
B O primeiro quartil é igual a R$ 1.100,00.
C O terceiro quartil é igual a R$ 1.200,00.
D Ao se construir um Box plot para esse conjunto de dados, os limites inferior e superior
estarão contidos no intervalo [R$ 400,00, R$ 1.600,00].
E A média é maior que a mediana dos dados.
Resolução.
Vamos direto para a alternativa que trata de Box-plot.
Rol:
800, 900, 1.000, 1.100, 1.200
A mediana é o termo do meio:
> = 1.000
A mediana divide o conjunto de dados em duas partes com 2 elementos cada.
800, 900 1.100, 1.200
D
= 900 + 8002 = 850
DE = 1.200 + 1.1002 = 1.150
O intervalo interquartílico é igual a:
� = DE − D� = 1.150 − 850 = 300
Os limites do Box plot são:
- Limite inferior: D
− 1,5� = 850 − 1,5 × 300 = 400
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 59
- Limite superior: DE + 1,5� = 1.150 + 1,5 × 300 = 1.600
Os limites do Box-plot são 400 e 1.600. A alternativa D está correta.
Gabarito: D
Agora vejamos as demais alternativas.
A letra “a” é a de verificação mais demorada, pois depende de uma maior quantidade de
cálculos. Na hora da prova, o ideal é marcá-la “por exclusão”.
Letra B:
Já vimos que o primeiro quartil é 850. Alternativa errada.
Letra C:
Já vimos que o terceiro quartil é 1.150. Alternativa errada.
Letra E:
� = 800 + 900 + 1.000 + 1.100 + 1.2005 = 1.000
A média é igual à mediana. Alternativa errada.
Finalmente, para analisar a letra “a”, vamos criar a variável auxiliar:
� = � − 1.000100
Os valores de “d” são:
-2, -1, 0, 1, 2
Logo:
�̅ = −2 − 1 + 0 + 1 + 25 = 0
�� = 4 + 1 + 0 + 1 + 45 = 2
�!� = 2 − 0 = 2 ⟶ �! = √2
�G = 100�! = 100√2
E o desvio padrão amostral fica:
$G = 100√2 × 54 ≅ 100 × 1,4 × 1,25 = 175
O desvio padrão amostral não é superior a 200.
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 60
Questão 24 MS ADM 2009 [CESPE]
A figura acima apresenta os totais anuais de casos de febre hemorrágica da dengue, de 1988
a 2008, em Fortaleza, cidade em que a doença foi confirmada pela primeira vez em 1994. A
partir de 1998, verifica-se a ocorrência anual da enfermidade, iniciando em um patamar de
baixa incidência (1998 a 2000) e seguindo para um patamar elevado que varia de 44 a 254
casos, com exceção de 2004.
Secretaria Municipal da Saúde de Fortaleza. Plano de contingência para o controle da
dengue no município de Fortaleza em 2009, (com adaptações).
Com base nas informações acima, considerando que a variável X representa o total anual de
casos de febre hemorrágica da dengue em Fortaleza, julgue os itens a seguir.
54 Construindo-se o diagrama Box-plot usual, com relação à variável X e com os dados do
ano 2001 em diante, é correto afirmar que a exceção observada em 2004 não deve ser
considerada como um valor atípico.
Resolução.
Dados:
60, 44, 166, 6, 119, 123, 118, 254.
Rol:
6, 44, 60, 118, 119, 123, 166, 254
Temos:
> = 118 + 1192 = 118,5
D
= 44 + 602 = 52
DE = 166 + 1232 = 144,5
Intervalo interquartílico:
� = 144,5 − 52 = 92,5
O limite inferior do Box-plot é igual a:
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 61
D
− 1,5� = 52 − 1,5 × 92,5 = −86,75
Como o valor 6 é maior que o limite inferior, então não é considerado valor atípico.
Gabarito: certo
3. NOÇÕES DE ASSIMETRIA
3.1. Introdução
Em vez de definir assimetria, vamos a alguns exemplos.
Considere a seguinte sequência de dados, que representam as idades de 16 pessoas.
ROL: 2, 4, 4, 5, 5, 5, 6, 6, 6, 6, 7, 7, 7, 8, 8, 10
Vamos colocar estes dados em uma tabela:
Idade Frequência
2 1
4 2
5 3
6 4
7 3
8 2
10 1
TOTAL 16
Esta sequência acima é simétrica. Temos sete valores diferentes (2, 4, 5, 6, 7, 8, 10).
Por enquanto, vamos esquecer a coluna de frequências. Vamos considerar apenas a coluna
das idades. O valor do meio é o 6.
Analisemos agora os termos vizinhos ao seis. Temos o 5 e o 7. Os dois estão igualmente
distantes de 6.
Idade Freqüência
2 1
4 2
5 3
6 4
7 3
8 2
10 1
TOTAL 16
considerando apenas
a coluna de idades, este é o
termo do meio
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 62
Na sequência, afastando-nos do 6, temos o 4 e o 8. E ambos estão igualmente espaçados
em relação a 6.
Na sequência, afastando-nos ainda mais de 6, temos o 2 e o 10. E ambos estão igualmente
espaçados em relação a 6.
Pronto, vimos que, à medida que nos afastamos de 6, os valores estão, aos pares, à mesma
distância do centro.
Analisemos agora as frequências.
A frequência que corresponde ao 6 é 4.
A partir da frequência 4, analisemos as demais frequências.
As frequências imediatamente vizinhas são 3 e 3.
Idade Freqüência
2 1
4 2
5 3
6 4
7 3
8 2
10 1
TOTAL 16
6-1=5
6+1=7
estão a uma distância de1
em relação a 6
Idade Freqüência
2 1
4 2
5 3
6 4
7 3
8 2
10 1
TOTAL 16
6-2=4
6+2=8
estão a uma distância de 2
em relação a 6
Idade Freqüência
2 1
3 0
4 2
5 3
6 4
7 3
8 2
9 0
10 1
TOTAL 16
6-4=2
6+4=10
Estão a uma distância de
4 em relação a 6
Idade Freqüência
2 1
4 2
5 3
6 4
7 3
8 2
10 1
TOTAL 16
frequencia correspondente
ao 6
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 63
Afastando-nos mais do 4, as próximas frequências também são iguais entre si (2 e 2).
E, afastando-nos ainda mais da frequência 4, as frequências continuam iguais.
Quando isto acontece, ou seja, quando os valores estão igualmente espaçados em relação
ao valor central, e quando as frequências igualmente espaçadas em relação à frequência
central são iguais entre si, dizemos que a sequência de dados é simétrica.
Quando uma sequência é simétrica, a média e a mediana são iguais ao termo do meio.
Neste caso, a média, a mediana (e a moda) são iguais a 6.
A visualização de uma sequência simétrica é mais fácil por meio de gráficos.
Idade Freqüência
2 1
4 2
5 3
6 4
7 3
8 2
10 1
TOTAL 16
frequencias iguais
Idade Freqüência
2 1
4 2
5 3
6 4
7 3
8 2
10 1
TOTAL 16
frequencias iguais
Idade Freqüência
2 1
4 2
5 3
6 4
7 3
8 2
10 1
TOTAL 16
frequencias iguais
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 64
Observe o gráfico de colunas correspondente à nossa série de dados. Se você colocar um
espelho bem em cima da coluna correspondente à idade 6, as duas partes vão se sobrepor
perfeitamente.
Quando os dados estão em classes, o raciocínio é análogo.
Vamos criar um outro exemplo, bem parecido:
Classes de idade Frequência
2 – 3 1
3 – 4 2
4 – 5 3
5 – 6 4
6 – 7 3
7 – 8 2
8 – 9 1
TOTAL 16
Agora, em vez de fazer um gráfico de colunas, vamos fazer um histograma.
Novamente, observe que, se colocássemos um espelho bem no meio da classe central
(classe de 5 a 6), a parte esquerda se sobreporia com perfeição à parte direita.
Esta sequência de dados é simétrica.
0
1
2
3
4
5
2 3 4 5 6 7 8 9 10
Idades
F
re
q
u
e
n
c
ia
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 65
A visualização também fica facilitada por meio do polígono de frequência:
Nestes casos, a média e a mediana são justamente iguais ao ponto médio da classe central.
Ou seja, são iguais ao ponto médioda classe 5 – 6. Portanto, a média e a mediana são iguais
a 5,5.
Ainda em relação às sequências simétricas, em geral, a moda também coincidirá com a
média e a mediana.
Usei a expressão “em geral” porque seria perfeitamente possível a seguinte situação:
Numa situação assim, a sequência continua simétrica. A média e a mediana continuam
sendo iguais a 5,5 (o ponto médio da classe central).
Mas a moda não é 5,5. Pelo contrário. A classe central é a classe com menor frequência. As
classes modais são as classes extremas. Nesta situação, talvez nem seja adequado falar em
moda, pois os valores com maior frequência não dão mais indicação de centro. O autor
Gilberto de Andrade Martins fala que se trata de um conjunto antimodal.
Mas esta situação, embora possível, não é usual. O mais “normal” é que, em sequências
simétricas, a moda seja igual à média e à mediana.
0
1
2
3
4
5
2 3 4 5 6 7 8 9
Idades
F
re
q
u
e
n
c
ia
s
0
1
2
3
4
5
2 3 4 5 6 7 8 9
Idades
F
re
q
u
e
n
c
ia
s
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 66
Pois bem, sempre que um conjunto de dados não for simétrico, dizemos que ele é
assimétrico. Nesses casos, não será possível construir um gráfico de colunas (ou um
histograma, se tivermos dados em classes) de tal forma que existam duas partes que se
sobreponham com perfeição.
3.2. Formas da curva de frequência e posicionamento relativo de média,
mediana e moda
As curvas de frequência (ou os polígonos de frequência) podem ter vários formatos. Um, em
especial, é algumas vezes perguntado em provas. É o que tem formato de sino:
As maiores frequências correspondem aos valores do meio. Um exemplo deste tipo de
gráfico poderia ser as notas dos alunos em uma dada prova.
A grande maioria das notas girou em torno de 7.
Algumas poucas pessoas tiraram notas baixa. E tivemos algumas poucas notas altas. Note
que, se colocarmos um espelho sobre o valor 7, as duas partes se sobrepõem com perfeição.
0
1
2
3
4
5
6
4 5 6 7 8 9 10
Notas
fr
e
q
u
e
n
c
ia
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 67
A sequência é simétrica. A média é igual à mediana que é igual à moda, e todas elas são
iguais a 7.
A partir deste gráfico simétrico, podemos imaginar outras curvas, assimétricas.
A primeira é a que segue:
Este gráfico já representa uma prova mais difícil, em que não houve muitas notas altas.
Observe que há uma “cauda” mais alongada na parte esquerda do gráfico. Dizemos que a
curva é assimétrica negativa, ou desviada à esquerda.
0
1
2
3
4
5
6
4 5 6 7 8 9 10
Notas
fr
e
q
u
e
n
c
ia
média = moda = mediana = 7
0
1
2
3
4
5
6
4 5 6 7 8 9 10
Notas
fr
e
q
u
e
n
c
ia
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 68
Como lembrar desses nomes?
Bom, lembre sempre da cauda. A cauda está à esquerda, então a curva é desviada à
esquerda. E como a cauda está mais próxima dos números negativos da reta real, então a
curva é assimétrica negativa.
Para encontrar a moda não tem erro. A moda corresponde ao termo de maior frequência
que, no caso, é o 7.
A média sempre estará do lado da cauda. E a mediana estará entre a média e a moda.
Assim, se tivéssemos que apontar, “mais ou menos”, onde se encontram cada uma destas
medidas, ficaria assim:
A moda seria igual a 7. A média estaria a esquerda de 7 (portanto, do lado da cauda). E a
mediana estaria entre a média e a moda.
Agora imagine uma outra prova, em que as questões foram bem fáceis. A curva de
frequências das notas seria:
0
1
2
3
4
5
6
4 5 6 7 8 9 10
Notas
fr
e
q
u
e
n
c
ia
cauda
0
1
2
3
4
5
6
4 5 6 7 8 9 10
Notas
fr
e
q
u
e
n
c
ia
média: está em
algum lugar à esquerda do 7
(portanto, do lado da cauda)
moda = 7
mediana: entre a média e a moda
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 69
Observe que, agora, as notas são bem altas. Há uma cauda mais alongada do lado direito.
Dizemos que a curva é desviada à direita ou assimétrica positiva.
Como lembrar desses nomes?
É só lembrar da cauda. Se a cauda está do lado direito, a curva é assimétrica à direita. Como
a cauda está do lado dos números positivos, a assimetria é positiva.
Vamos localizar as medidas de tendência central? A moda é fácil. A moda é igual a 7.
A média, novamente, estará do lado da cauda. Será, portanto, um pouco maior que 7. E a
mediana estará entre a média e a moda.
0
1
2
3
4
5
6
4 5 6 7 8 9 10
Notas
fr
e
q
u
e
n
c
ia
0
1
2
3
4
5
6
4 5 6 7 8 9 10
Notas
fr
e
q
u
e
n
c
ia
cauda
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 70
Questão 25 MPE PE/2006 [FCC]
Considere a tabela a seguir:
A tabela acima apresenta a distribuição de frequências relativas do valor do salário pago aos
funcionários da fábrica Y no mês de abril de 2006. A média e a mediana do valor do salário
pago pela fábrica Y no mês de abril de 2006 são, respectivamente,
a) R$ 200,00 e R$ 400,00
b) R$900,00 e R$1.000,00
c) R$1.050,00 e R$1.000,00
d) R$800,00 e R$800,00
e) R$900,00 e R$900,00
Resolução:
Repare que a distribuição fornecida é simétrica.
Nesse caso, a média coincide com a mediana. Portanto, já descartamos as letras A, B e C.
0
1
2
3
4
5
6
4 5 6 7 8 9 10
Notas
fr
e
q
u
e
n
c
ia
média: está em
algum lugar à direita do 7
(portanto, do lado da cauda)
moda = 7
mediana: entre a média e a moda
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 71
Ficamos entre as letras “D” e “E”. E para achar a média (ou a mediana), não precisa de muita
conta. Simplesmente adotamos o ponto médio da classe central.
900
2
1000800
=
+
== MedianaMedia
Gabarito: E.
Questão 26 GDF SEJUS 2010 [UNIVERSA]
Considere a posição relativa da média, da moda e da mediana. É correto afirmar que nas
distribuições assimétricas
(A) positivas Mo ≤ Me ≤ � e a cauda da direita é mais comprida que a da esquerda.
(B) positivas Me ≤ Mo ≤ � e a cauda da direita é mais comprida que a da esquerda.
(C) positivas Mo ≤ Me ≤ � e a cauda da esquerda é mais comprida que a da direita.
(D) negativas � ≤ Mo ≤ Me e a cauda da direita é mais comprida que a da esquerda.
(E) � ≤ Me ≤ Mo e a cauda da esquerda é mais comprida que a da direita.
Resolução.
Observe que a questão não define qual símbolo usa para se referir à mediana e à moda.
Usando o bom senso, temos que “Me” se refere à mediana e “Mo” se refere à moda.
Nas distribuições assimétricas positivas, a média é maior que a mediana, que é maior que a
moda. Nesta situação, temos uma cauda do lado direito.
Gabarito: A
Questão 27 INMETRO 2010 [CESPE]
Considere que, no estudo de um processo de fabricação de rebites para uso industrial,
tenham sido analisadas 36 peças, tomadas da linha de produção, ao longo de um dia,
estando as medidas relacionadas ao diâmetro da cabeça dos rebites sumarizadas nas
estatísticas e no gráfico seguintes.
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 72
Considere, ainda, que �̅, �� , � representam, respectivamente, a média amostral, o valor da i-
ésima medida e o tamanho da amostra, e que as unidades dos valores apresentados estão
de acordo comas unidades utilizadas na obtenção dos valores da tabela e do gráfico.
Com relação à média e à mediana, citadas na tabela do texto, assinale a opção correta.
A Como interpretação da média, é correto concluir que 50% dos diâmetros dos rebites estão
abaixo de 6,7261 e 50% das medidas estão acima desse valor.
B Tanto média quanto mediana medem o grau de assimetria de uma distribuição de
frequência.
C A mediana é corretamente calculada por
���
�
��
÷ �
D Para o cálculo da média, é necessário que os dados estejam ordenados.
E Para distribuições simétricas, a média e a mediana são coincidentes.
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 73
Resolução.
Letra A: não é a média quem divide os dados em duas partes com o mesmo número de
elementos. É a mediana quem faz isso. Alternativa errada.
Letra B: média e mediana são medidas de posição (e não de dispersão). Alternativa errada.
Letra C: A fórmula fornecida é para o cálculo da média, e não da mediana. Alternativa
errada.
Letra D: A média não depende de ordenação entre as observações. Precisamos somar todos
os dados, independente da ordem em que estejam apresentados. Isto ocorre porque a
ordem das parcelas não altera a soma.
Feita a soma, dividimos pelo número de observações.
Letra E: de fato, para distribuições simétricas, a média é igual à mediana.
Gabarito: E
Questão 28 INEP 2008 [CESGRANRIO]
Analise as afirmações a seguir.
Numa distribuição simétrica, a média e a mediana coincidem.
PORQUE
Numa distribuição simétrica a moda nem sempre existe.
Quanto às afirmações acima, pode-se concluir que
(A) as duas asserções são verdadeiras e a segunda é uma justificativa correta da primeira.
(B) as duas asserções são verdadeiras e a segunda não é uma justificativa correta da
primeira.
(C) a primeira asserção é uma proposição verdadeira e a segunda, uma proposição falsa.
(D) a primeira asserção é uma proposição falsa e a segunda, uma proposição verdadeira.
(E) tanto a primeira como a segunda são proposições falsas.
Resolução.
A primeira frase está certa. Numa distribuição simétrica, média e mediana sempre
coincidem.
A segunda frase também está certa. Numa distribuição simétrica, a moda pode não existir.
Isso ocorre num gráfico em forma de “U” ou de “V”. Exemplo:
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 74
A classe central tem a menor frequência. Nesta situação, as classes com maior frequência
estão nas extremidades. Não seria muito apropriado falar em moda, dado que perde-se a
noção de centro. Há autores que classificam estas sequências como antimodais.
E ainda teria o caso de um gráfico totalmente horizontal. Nesse caso, a curva seria amodal.
Exemplo:
1, 1, 1, 2, 2, 2, 3, 3, 3.
A curva correspondente seria horizontal. Média e mediana coincidiriam (seriam iguais a 2). E
a moda não existiria, pois todos os valores possuem a mesma frequência.
Entre as duas assertivas não há qualquer nexo de causalidade.
Gabarito: B
Questão 29 PM Manaus 2004 [CESGRANRIO]
A tabela apresenta uma distribuição hipotética de frequência do número de anos
trabalhados, em uma amostra de 100 aposentados.
Essa distribuição:
(A) tem moda igual à média.
(B) tem moda menor que a média.
(C) é simétrica.
(D) é assimétrica à direita.
(E) é assimétrica à esquerda
0
1
2
3
4
5
2 3 4 5 6 7 8 9
Idades
F
re
q
u
e
n
c
ia
s
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 75
Resolução.
Repare que as maiores frequências se concentram nas últimas classes. Isso faz com que a
moda esteja na classe 30 – 40. Note que as frequências menores (correspondentes à cauda)
são pertencentes às primeiras classes. A cauda ficaria do lado esquerdo do gráfico. Seria
uma curva assimétrica à esquerda. A média é menor que a mediana, que é menor que a
moda.
Gabarito: E
Questão 30 TCE RO [CESGRANRIO]
A distribuição de frequência está representada no histograma a seguir.
Essa distribuição:
(A) é simétrica.
(B) apresenta assimetria à esquerda.
(C) apresenta assimetria à direita.
(D) tem média igual à mediana.
(E) tem histograma de frequência em forma de J.
Resolução.
A cauda está do lado esquerdo. A assimetria é negativa, ou “à esquerda”.
Gabarito: B
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 76
Questão 31 Capes 2008 [CESGRANRIO]
A tabela a seguir apresenta algumas estatísticas das notas dos alunos de determinada área,
que participaram do ENADE 2006.
Analisando-se os dados da tabela conclui-se que
(A) a distribuição das notas é assimétrica à esquerda nos dois grupos de estudantes.
(B) a distribuição das notas dos concluintes apresenta-se mais homogênea do que a dos
ingressantes.
(C) pelo menos metade dos alunos ingressantes não alcançou a média de 1,9.
(D) mais de 90,0% dos alunos dessa área compareceram ao ENADE 2006.
(E) mais alunos ingressantes do que concluintes dessa área compareceram ao ENADE 2006.
Resolução.
Notem que a média é maior que a mediana, o que indica que a cauda está do lado direito da
curva. Seria uma distribuição assimétrica à direita. A letra “A” está errada.
Na letra “B”, temos uma afirmação sobre qual distribuição é mais homogênea. Uma
distribuição é dita homogênea quando apresenta baixa dispersão relativa (isto é, seu
coeficiente de variação é baixo).
A alternativa “B” pretende comparar os ingressantes com os concluintes, segundo a
homogeneidade da distribuição. Em resumo, temos que ver qual apresenta menor
coeficiente de variação.
26,2
9,1
3,4
_ ==esingressantCV ; 27,2
6,3
2,8
int_ ==esconcluCV
Temos que o menor CV é o dos ingressantes. Portanto, estes apresentam uma distribuição
mais homogênea. A alternativa está errada.
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 77
Na verdade, os dois coeficientes foram muito altos, e praticamente iguais. Isto indica que as
duas distribuições são bastante heterogêneas.
O livro “Princípios de Estatística” de Gilberto de Andrade Martins e Denis Donaire, apesar de
não usar a expressão “homogêneo”, indica que:
“Para efeitos práticos, costuma-se considerar que CV superior a 50% indica alto grau de dispersão e,
consequentemente, pequena representatividade da média. Enquanto que para valores inferiores a
50%, a média será tanto mais representativa do fato quanto menor for o valor de seu CV”
A letra “C” está correta. Se a mediana dos ingressantes é igual a zero é porque metade dos
alunos tirou nota menor ou igual a zero. Esses mesmos alunos, portanto, não alcançaram a
média de 1,9.
Gabarito: C
Questão 32 Petrobras 2005 [CESGRANRIO]
A tabela apresenta uma distribuição hipotética de frequência do número de anos
trabalhados, em uma amostra de 100 aposentados.
A distribuição:
(A) é simétrica.
(B) é assimétrica à esquerda.
(C) é assimétrica à direita.
(D) tem moda menor que a média.
(E) tem moda igual à média.
Resolução.
A cauda está do lado esquerdo do gráfico de frequências. É uma curva assimétrica à
esquerda.
Gabarito: B
Questão 33 TRT 3ª REGIAO 2009 [FCC]
Considere uma curva de uma distribuição estatística unimodal apresentando o valor da
mediana superior ao valor da moda e o valor da média aritmética superior ao valor da
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br78
mediana. Então, com relação às medidas de assimetria e curtose é correto afirmar que se
trata de uma curva apresentando uma distribuição
(A) leptocúrtica.
(B) platicúrtica.
(C) assimétrica à esquerda.
(D) assimétrica à direita.
(E) com coeficiente de curtose igual ao da curva normal.
Resolução:
Quando a média é maior que a mediana, que é maior que a moda, temos uma curva
positivamente assimétrica, ou assimétrica à direita.
Gabarito: D
As alternativas “a”, “b” e “e” se referem à curtose, que não estudaremos.
3.3. Outros tipos de posicionamento relativo de média, mediana e moda
Agora vamos ver um assunto pouquíssimo cobrado. Na verdade, encontrei uma única
questão sobre ele. De todo modo, como está relacionado com o posicionamento relativo de
média, mediana e moda, vamos vê-lo.
O posicionamento relativo de média, mediana e moda que estudamos vale para conjuntos
de dados “bem comportados”.
Assim, na distribuição positivamente assimétrica, a média é maior que a mediana, que é
maior que a moda.
No conjunto negativamente assimétrico, a média é menor que a mediana, que é menor que
a moda.
Pois bem. Existem conjuntos de dados que não se enquadram em nenhuma destas
configurações. Para entender melhor o porquê disso, vamos fazer uma analogia com a física.
Se imaginarmos que o histograma (se os dados estiverem em classes) ou o gráfico de
colunas (se os dados estiverem agrupados por valor) corresponde a um conjunto de
“pesinhos” (ou de “barrinhas”) dispostos ao longo de uma haste inflexível, que equivale à
reta real, o ponto de apoio em que o sistema fica em equilíbrio corresponde justamente à
média.
Como exemplo, considerem o seguinte conjunto de dados, representado por um gráfico de
colunas.
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 79
A média desse conjunto é igual a 3,38 (aproximadamente). Se considerarmos que cada
coluna corresponde a uma barra e que todas elas são feitas de material homogêneo, então
seus pesos são diretamente proporcionais às suas alturas. Como todas elas têm a mesma
base, as barras com maior altura serão mais pesadas.
Caso o eixo das abscissas seja uma haste em que se pretendem equilibrar as barras, o ponto
de apoio de tal forma que o equilíbrio se mantenha é justamente 3,38, indicado, na figura
abaixo, pela seta vermelha.
Não vou colocar a demonstração disso aqui, mas, para quem tiver curiosidade, é
basicamente a mesma coisa que aprendemos lá no ensino médio, quando estudamos física.
Basta considerar que as forças são proporcionais às alturas das barras e fazer a condição de
que a soma dos produtos força×distância é nula. Você encontrará que o ponto de apoio em
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 80
relação ao qual devem ser calculadas as distâncias para que isso aconteça é justamente a
média aritmética.
Reparem que as barrinhas à direita da seta são mais leves. A soma de suas alturas é 48.
As barrinhas à esquerda da seta são mais pesadas (a soma de suas alturas é 85).
Acontece que as barrinhas mais leves estão mais distantes do ponto de apoio, o que
compensa o seu peso menor e faz com que a soma de momentos total seja nula. Em
resumo, os torques que atuam no sentido horário compensam os que atuam no sentido
anti-horário e o sistema fica em equilíbrio.
A analogia da média com os braços de alavanca lá da física ajuda a entender porque, numa
distribuição positivamente assimétrica, a média é maior que a mediana.
Caso o ponto de apoio seja fixado junto à mediana, a soma dos pesos das barras à sua
direita seria igual à soma dos pesos das barras à sua esquerda. Contudo, as barras da direita,
mais afastadas do ponto de apoio, ganhariam a “batalha”, fazendo um braço de alavanca
maior, fazendo com que a haste (representada pela reta real) tombasse para a direita.
Logo, o ponto de apoio deve estar um pouco à direita da mediana, tendo um efeito duplo:
diminuir a distância das barras da direita até o ponto de apoio; diminuir o peso total das
barras da direita. Esses dois efeitos permitem o equilíbrio do sistema, que ocorrerá
justamente quando o apoio for colocado sobre a média aritmética.
É claro que, numa distribuição negativamente assimétrica, o raciocínio é análogo.
Então, neste gráfico padrão, bem representativo de uma distribuição positivamente
assimétrica, temos:
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 81
O problema surge quando o conjunto de dados não é “bem comportado”.
Se fizermos qualquer alteração neste padrão, pode ser que o posicionamento relativo de
média, mediana e moda fique prejudicado.
Exemplo: se tivermos uma barra grande afastada da média, ou se tivermos uma barra
pequena muito próxima da média, ou se tivermos barras grandes tanto do lado direito
quanto do lado esquerdo, ou se tivermos barras pequenas tanto do lado esquerdo, quanto
do lado direito.
Enfim, há várias formas de fugirmos do padrão.
A título de exemplo, considere a seguinte sequência:
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 82
É uma sequência positivamente assimétrica, com média 4,2. Há uma cauda do lado direito.
As barrinhas menores estão mais afastadas da média do que as barras grandes.
A média (=4,2) é maior que a mediana (=4), que é maior que a moda (=3).
A partir do gráfico acima, vamos construir outro conjunto, “criando buracos”. Serão as
mesmas barras, mas, entre elas, haverá alguns espaços vazios:
O que é que acabamos de fazer?
Fizemos com que uma barra grande ficasse afastada da média, o que antes só acontecia
para barras pequenas.
Isso altera tudo.
Agora a média é 6,81, a mediana é 7 e a moda é 6.
O posicionamento relativo de média, mediana e moda “já era”. Agora a média está entre a
mediana e a moda, o que não é característico nem de uma curva assimétrica positiva, nem
de uma assimétrica negativa. E por que é que isso aconteceu? Porque, para uma das barras
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 83
mais pesadas, nós criamos uma distância grande em relação ao ponto de apoio, o que,
antes, só acontecia com as barras leves.
Questão 34 TRE PI 2009 [FCC]
Numa pesquisa realizada em 160 domicílios de uma cidade obteve-se o seguinte gráfico em
que o eixo y representa a quantidade de domicílios e o eixo horizontal representa o número
de eleitores verificado por domicílio.
Com relação à média aritmética (Me), número de eleitores por domicílio, a mediana (Md) e
a moda (Mo) correspondentes tem-se que:
(A) Me = Md e Md < Mo
(B) Me < Md < Mo
(C) Me < Md e Md > Mo
(D) Me < Md e Md = Mo
(E) Me > Md e Md = Mo
Resolução
As menores barras, de longe, são as que têm altura 5.
No gráfico, há uma barra pequena do lado direito, outra do lado esquerdo. Ou seja, uma de
cada lado da média. Isso pode atrapalhar o posicionamento “padrão” de média, mediana e
moda.
A moda é fácil de identificar. A moda é igual a 2, que é o termo de maior frequência.
I = 2
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 84
Vamos à mediana. São 160 termos. A mediana é igual à média dos termos centrais (X80 e
X81).
X Frequência simples Frequência acumulada
0 5 5
1 20 25
2 50 75
3 40 115
4 30 145
5 10 155
6 5 160
Concluímos que �JK = �JJ = �JL = �JM = �L(= �L
= ⋯ = �
O = 3
A mediana vale 3.
> = 3
Falta a média. Vamos determinar onde se encontra a média, sem efetivamente calculá-la,
para ganhar tempo.
Para tanto, vamos lembrar do paralelo com a física. A média corresponde ao ponto de apoio
em que o sistema fica em equilíbrio.
Se o ponto de apoio ficasse sob o 3, a haste penderia para a esquerda. Vejam:
Logo, para que a haste não penda para a esquerda, o ponto de apoio deve ficar um pouco a
esquerda de 3. Ou seja, a média é menor que 3.
Disto concluímos que a média é menor que a mediana.
Juntando tudo, a moda é menor que a média, que é menor que a mediana.
Este posicionamento não é característico nem de uma distribuições positivamente
assimétrica, nem de uma negativamente assimétrica.
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 85
Gabarito: C
3.4. Assimetria e diferença entre os quartis
As diferenças entre os quartis ajudam a identificar se a curva é positivamente assimétrica ou
negativamente assimétrica.
Vejamos alguns exercícios sobre isso.
Questão 35 PM Manaus 2004 [CESGRANRIO]
Os quartis de uma distribuição são Q1 = 4, Q2 = 6 e Q3 = 10. Essa distribuição:
(A) é simétrica.
(B) é assimétrica à direita.
(C) é assimétrica à esquerda.
(D) tem moda maior que a média.
(E) tem moda igual à média
Resolução.
As diferenças entre os quartis podem nos indicar a assimetria da curva.
Considere os seguintes conjuntos:
A: 1, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 5
B: 1, 2, 2, 2, 2, 3, 3, 3, 4, 4, 5, 5, 6, 7, 8, 9
C: 1, 2, 3, 4, 5, 5, 6, 6, 7, 7, 7, 8, 8, 8, 8, 9
O conjunto “A” é simétrico. Se você fizer um gráfico de colunas, perceberá isso.
Os quartis do conjunto A são:
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 86
5,21 =Q ; 32 =Q ; 5,33 =Q
Observe que:
5,0
1223
=−=− QQQQ
Quando o conjunto é simétrico, a diferença entre o terceiro e o segundo quartil é igual à
diferença entre o segundo e o primeiro quartil. Logo:
0)()(
1223
=−−− QQQQ
Vamos para o conjunto B. Se você fizer seu gráfico de colunas, verá que ele é assimétrico à
direita (positivamente assimétrico).
Observe a cauda do lado direito.
Vamos calcular seus quartis.
21 =Q ; 5,32 =Q ; 5,53 =Q
Observe que:
1223
QQQQ −>−
Ou ainda:
0)()(
1223
>−−− QQQQ
Por fim, o conjunto C é assimétrico à esquerda. Observe o gráfico.
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 87
Agora temos:
5,41 =Q ; 5,62 =Q ; 83 =Q
Observe que:
1223
QQQQ −<−
Ou ainda:
0)()(
1223
<−−− QQQQ
Podemos montar o seguinte quadro resumo:
)()(
1223
QQQQ −−−
Resultado
= 0 indicativo de que o conjunto é simétrico
< 0 indicativo de que o conjunto é negativamente
assimétrico
> 0 indicativo de que o conjunto é positivamente assimétrico
Aplicando esse resultado à questão da Cesgranrio, temos:
)()(
1223
QQQQ −−− = )46()610( −−−
)()(
1223
QQQQ −−− = 224 =−
A distribuição é positivamente assimétrica (ou assimétrica à direita).
Gabarito: B
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 88
Questão 36 ABIN 2010 [CESPE]
A figura acima apresenta esquematicamente as distribuições das alturas (em cm) dos
estudantes das três turmas de uma escola. As linhas verticais de cada box-plot se estendem
até os valores extremos da distribuição. Com base nessas informações, julgue os itens
consecutivos.
86 A turma 3 tem a maior amplitude de alturas.
87 As distribuições das alturas referentes às turmas 2 e 3 são simétricas.
88 Entre os estudantes da turma 1, 75% possuem alturas iguais ou superiores a 160 cm,
enquanto metade dos estudantes da turma 3 tem altura igual ou inferior a 160 cm.
Resolução.
Item 86.
As amplitudes são:
- Turma 1: 180 – 120 = 60
- Turma 2: 180 – 110 = 70
- Turma 3: 190 – 110 = 80
A maior amplitude é a da Tuma 3.
Item certo.
Item 87.
Para a turma 2, temos:
�DE − D�
− �D� − D
= �160 − 140
− �140 − 130
= 20 − 10 = 10
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 89
Isto indica assimetria positiva.
Já podemos afirmar que o item está errado.
Item 88.
Para os estudantes da turma 1, o terceiro quartil é 160 cm. Logo, 75% dos estudantes têm
altura menor que 160 cm. O item está errado.
Gabarito: certo, errado, errado
4. QUESTÕES APRESENTADAS EM AULA
Questão 1 IRB 2006 [ESAF]
O grau ao qual os dados numéricos tendem a dispersar-se em torno de um valor médio
chama-se
a) média.
b) variação ou dispersão dos dados.
c) mediana.
d) correlação ou dispersão.
e) moda.
Questão 2 SEFAZ /BA – 2004 [FCC]
Sabe-se que o valor de uma determinada variável Q é obtida pela expressão definida por
2
32 +
=
i
Q
sendo i um número inteiro positivo. Se i assumir os valores 1, 2, 3, 4 e 5, então, o desvio
médio dessa variável é:
a) 1,8
b) 1,2
c) 0,9
d) 0,75
e) 0,5
Questão 3 MPE RO 2005 [CESGRANRIO]
Analise as afirmativas a seguir, a respeito da média aritmética.
I - a soma dos resíduos em relação à média aritmética é sempre igual a zero;
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 90
II - é em relação à média aritmética que a soma dos valores absolutos dos resíduos é
mínima;
III - é em relação à média aritmética que a soma dos quadrados dos resíduos é mínima.
Está(ão) correta(s) a(s) afirmativa(s):
(A) II, somente.
(B) I e II somente.
(C) I e III somente.
(D) II e III somente.
(E) I, II e III.
Questão 4 MPU 2004 [ESAF]
A norma euclidiana ( )∑
=
−
n
i
i AX
1
2
é mínima quando A é igual:
a) à média dos valores de iX
b) à mediana dos valores de iX
c) à moda dos valores de iX
d) ao primeiro quartil dos valores de iX
e) ao desvio padrão dos valores de iX
Questão 5 Petrobras 2008 [CESGRANRIO]
Do total de funcionários de uma empresa, foi retirada uma amostra de seis indivíduos. A
tabela abaixo apresenta o tempo trabalhado na empresa, em anos completos, por cada um
deles.
A variância dessa amostra é
(A) 3,7
(B) 4,0
(C) 4,4
(D) 5,0
(E) 5,5
Questão 6 FINEP 2009 [CESPE]
Foi realizado um levantamento para comparar estatisticamente o valor de avaliação X de
um bem imóvel com o seu respectivo preço de venda Y. Para cada imóvel i (i = 1, 2, ..., 10),
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 91
registrou-se um par de valores (xi, yi), em que xi e yi representam, em R$ 1 milhão,
respectivamente, o valor de avaliação e o preço de venda do imóvel i.
Os seguintes resultados foram encontrados:
Com relação às informações apresentadas no texto e considerando que �� = �� − ��
representa a diferença entre o valor de avaliação e o preço de venda do imóvel i, a variância
amostral da distribuição do conjunto de dados d1,..., d10 foi
A positiva e inferior a 0,10.
B superior a 0,10 e inferior a 0,20.
C superior a 0,20 e inferior a 0,30.
D superior a 0,30 e inferior a 0,40.
E superior a 0,40.
Questão 7 TCU 2009 [CESPE]
Uma instituição realizou levantamento com vistas a comparar os valores de dez diferentes
tipos de itens de consumo. Para cada item i(i = 1, 2, ..., 10), foi registrado um par de valores
(xi,yi), em que xi representa o valor do item i estabelecido pela empresaA, e yi representa o
valor desse mesmo item fornecido pela empresa B. Os seguintes resultados foram
encontrados:
���� + ��
= 130; ���� − ��
= 10
(
��
(
��
���� + ��
� = 1.790; ���� − ��
� = 26
(
��
(
��
Com base nessas informações, julgue os itens a seguir.
97. A variância da distribuição das diferenças yi - xi é maior que 1,5 e menor que 1,9.
100. Se VA for a variância amostral dos valores x1, x2, ..., x10 e VB for a variância amostral
dos valores y1, y2, ..., y10, então a soma VA + VB será maior do que 7.
Questão 8 CGU 2008 [ESAF]
Calcule o valor mais próximo do desvio-padrão da amostra representada pela distribuição
de frequências abaixo representada pelos pontos médios das classes x e respectivas
frequências f.
x F
5 5
15 10
25 31
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 92
35 10
45 5
a) 1.
b) 2,44.
c) 5,57.
d) 7,056.
e) 10.
Questão 9 TJ PI 2009 [FCC]
A média aritmética dos salários dos empregados de uma empresa é igual a R$ 1.200,00 com
uma variância igual a 400,00 (R$)2. Caso seja concedido para todos os salários um reajuste
de 10% e, a seguir, um adicional fixo de R$ 200,00, é correto afirmar, com relação aos novos
valores da média, da variância e do desvio padrão, que
(A) o desvio padrão fica igual ao anterior multiplicado por 1,21.
(B) o novo coeficiente de variação fica igual ao anterior multiplicado por 1,10.
(C) a variância fica inalterada.
(D) a média fica igual a R$ 1.520,00 e o desvio padrão igual a R$ 22,00.
(E) a variância fica igual a 440,00 (R$)2.
Questão 10 SEFAZ SP – 2006 [FCC]
Considerando as respectivas definições e propriedades relacionadas às medidas de posição
e de variabilidade, é correto afirmar:
a) concedendo um reajuste de 10% em todos os salários dos empregados de uma empresa,
tem-se que a respectiva variância fica multiplicada por 1,10.
b) definindo o coeficiente de variação (CV) como sendo o quociente da divisão do desvio
padrão pela respectiva média aritmética (diferente de zero) de uma sequência de valores,
tem-se então que CV também poderá ser obtido dividindo a correspondente variância pelo
quadrado da média aritmética.
c) subtraindo um valor fixo de cada salário dos funcionários de uma empresa, tem-se que o
respectivo desvio padrão dos novos valores e igual ao valor do desvio padrão dos valores
anteriores.
d) dividindo todos os valores de uma sequência de números estritamente positivos por 4,
tem-se que o respectivo desvio padrão fica dividido por 2.
e) em qualquer distribuição de valores em estudo, a diferença entre a mediana e a moda é
sempre diferente de zero.
Questão 11 Ministério da Integração Nacional 2012 [ESAF]
A distribuição de frequências em classes do salário mensal x, medido em número de salários
mínimos, de uma amostra aleatória de 50 funcionários de uma empresa, é apresentado a
seguir.
� �
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 93
Mais de 0 a 10 22
Mais de 10 a 20 13
Mais de 20 a 30 10
Mais de 30 a 40 3
Mais de 40 a 50 2
Usando os dados acima, obtenha o valor mais próximo da variância amostral do salário
mensal.
a) 121,5
b) 124
c) 126,5
d) 129
e) 131,5
Questão 12 SEFAZ BA – 2004 [FCC]
Com relação às medidas de tendência central e de dispersão, é correto afirmar que:
a) multiplicando-se todos os valores de uma determinada sequência de números positivos
por um mesmo número, maior que um, o seu respectivo coeficiente de variação aumenta
de valor.
b) a diferença entre a média aritmética e a mediana de uma sequência de números positivos
é sempre maior que a diferença entre a média aritmética e a moda dessa mesma sequência.
c) a média harmônica de uma sequência de números positivos é igual à média aritmética
dos respectivos inversos destes números.
d) em uma sequência de números positivos, o produto da média aritmética pelo respectivo
coeficiente de variação é igual ao valor do desvio padrão correspondente.
e) a média geométrica de uma sequência de números positivos é sempre maior ou igual à
média aritmética destes números.
Questão 13 TCE RN 2009 [CESPE]
Em um estudo estatístico censitário, foi considerado um indicador X que assume os três
seguintes valores possíveis: –1, 0 ou 1. A média e a variância populacionais desse indicador
X são, respectivamente, 1/2 e 3/4. Nesse caso, é correto afirmar que
56. a moda de X foi igual a -1.
57. o coeficiente de variação de X foi inferior a 1,6.
58. a frequência relativa dos casos em que o indicador assume o valor zero foi inferior a
0,01.
59. a mediana do indicador X foi igual a 1/2
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 94
Questão 14 Senado 2008 [FGV]
O coeficiente de variação amostral (em porcentagem) de um conjunto de salários é 110%.
Se os salários desse conjunto forem reajustados em 20%, o novo coeficiente de variação
amostral será:
(A) 110%.
(B) 112,2%.
(C) 114,2%.
(D) 122%.
(E) 130%.
Questão 15 BNDES 2008 2 [CESGRANRIO]
Para um estudo sobre a distribuição de salário mensal dos empregados de uma empresa
foram coletados os salários de uma amostra aleatória de 50 empregados. Os resultados
amostrais levaram à construção da distribuição de frequência abaixo. Não existem
observações coincidentes com os extremos das classes.
A média aritmética e a variância amostral da distribuição valem, aproximadamente,
Questão 16 SEFAZ BA – 2004 [FCC]
Sabe-se que a altura média dos 5.000 habitantes de uma cidade X é igual à altura média de
uma outra cidade Y com 10.000 habitantes, ou seja, igual a 1,70m. O desvio-padrão
correspondente encontrado para a população da cidade X é 2 cm e para a população da
cidade Y é 5 cm. Então, a variância das alturas da população das duas cidades reunidas é:
a) 12,25 cm2
b) 16,00 cm2
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 95
c) 18,00 cm2
d) 24,50 cm2
e) 29,00 cm2
Questão 17 ARCE/2006 [FCC]
Uma administradora de imóveis realizou um estudo sobre todos os imóveis alugados em
duas regiões, A e B, levantando o seguinte quadro:
Região Qdade de
imóveis alugados
Valor médio
dos aluguéis
Coeficiente de variação
A 1.000 R$ 500,00 20%
B 4.000 R$ 500,00 30%
(Observação: no enunciado original, é dada a definição de coeficiente de variação.)
A variância conjunta de A e B, isto é, a variância dos valores dos aluguéis das regiões A e B
reunidas é, em R$2, igual a:
a) 20.000
b) 25.000
c) 32.500
d) 40.000
e) 62.500
Questão 18 TRT 7ª REGIAO 2009 [FCC]
Um levantamento realizado em duas empresas X e Y proporcionou os resultados
apresentados na tabela abaixo.
A variância dos salários das duas empresas reunidas é, em (R$)2, igual a
(A) 112.500.
(B) 87.750.
(C) 75.375.
(D) 63.000.
(E) 57.600.
Questão 19 BACEN/2006 [FCC]
A média aritmética dos valores das vendas diárias realizadas pelas 50 empresas do Setor A é
de R$ 1.000,00, com desvio padrão de R$ 100,00. Sabe-se ainda que a média aritmética dos
valores das vendas diárias realizadas pelas 200 empresas do Setor B é de R$ 2.000,00, com
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 96
desvio padrão de R$ 200,00. A variância, em R$2, dos valores das vendas diárias realizadas
pelos dois setores reunidos é:
a) 34.000
b) 50.000
c) 194.000
d) 207.500
e) 288.000
Questão 20 BACEN 2006 [FCC]
Em uma instituição bancária, o salário médio dos100 empregados do sexo masculino é de
R$ 1.500,00, com desvio padrão de R$ 100,00. O salário médio dos 150 empregados do sexo
feminino é de R$ 1.000,00, com desvio padrão de R$ 200,00. A variância, em R$2, dos dois
grupos reunidos é:
a) 25.600,00
b) 28.000,00
c) 50.000,00
d) 62.500,00
e) 88.000,00
Questão 21 Petrobras 2005 [CESGRANRIO]
O gráfico a seguir é o box-plot da distribuição de renda, em mil reais, da população de um
determinado município.
Qual é a probabilidade de um habitante desse município ter renda superior a 6 mil reais?
(A) 0,15
(B) 0,20
(C) 0,25
(D) 0,50
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 97
(E) 0,75
Questão 22 CEB 2009 [UNIVERSA]
Considere o gráfico Boxplot seguinte:
O valor marcado com um asterisco (*) representa
(A) o menor valor;
(B) 1,5 × �DE − D
(C) D
− 1,5 × �DE − D
(D) �DE − D
(E) um outlier.
Questão 23 INMETRO 2010 [CESPE]
Nos últimos cinco meses, uma família apresentou o seguinte quadro de despesas:
1.º mês: R$ 1.000,00;
2.º mês: R$ 1.200,00;
3.º mês: R$ 900,00;
4.º mês: R$ 1.100,00;
5.º mês: R$ 800,00.
Em relação a esse conjunto de dados, assinale a opção correta.
A O desvio padrão amostral é superior a R$ 200,00.
B O primeiro quartil é igual a R$ 1.100,00.
C O terceiro quartil é igual a R$ 1.200,00.
D Ao se construir um Box plot para esse conjunto de dados, os limites inferior e superior
estarão contidos no intervalo [R$ 400,00, R$ 1.600,00].
E A média é maior que a mediana dos dados.
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 98
Questão 24 MS ADM 2009 [CESPE]
A figura acima apresenta os totais anuais de casos de febre hemorrágica da dengue, de 1988
a 2008, em Fortaleza, cidade em que a doença foi confirmada pela primeira vez em 1994. A
partir de 1998, verifica-se a ocorrência anual da enfermidade, iniciando em um patamar de
baixa incidência (1998 a 2000) e seguindo para um patamar elevado que varia de 44 a 254
casos, com exceção de 2004.
Secretaria Municipal da Saúde de Fortaleza. Plano de contingência para o controle da
dengue no município de Fortaleza em 2009, (com adaptações).
Com base nas informações acima, considerando que a variável X representa o total anual de
casos de febre hemorrágica da dengue em Fortaleza, julgue os itens a seguir.
54 Construindo-se o diagrama Box-plot usual, com relação à variável X e com os dados do
ano 2001 em diante, é correto afirmar que a exceção observada em 2004 não deve ser
considerada como um valor atípico.
Questão 25 MPE PE/2006 [FCC]
Considere a tabela a seguir:
A tabela acima apresenta a distribuição de frequências relativas do valor do salário pago aos
funcionários da fábrica Y no mês de abril de 2006. A média e a mediana do valor do salário
pago pela fábrica Y no mês de abril de 2006 são, respectivamente,
a) R$ 200,00 e R$ 400,00
b) R$900,00 e R$1.000,00
c) R$1.050,00 e R$1.000,00
d) R$800,00 e R$800,00
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 99
e) R$900,00 e R$900,00
Questão 26 GDF SEJUS 2010 [UNIVERSA]
Considere a posição relativa da média, da moda e da mediana. É correto afirmar que nas
distribuições assimétricas
(A) positivas Mo ≤ Me ≤ � e a cauda da direita é mais comprida que a da esquerda.
(B) positivas Me ≤ Mo ≤ � e a cauda da direita é mais comprida que a da esquerda.
(C) positivas Mo ≤ Me ≤ � e a cauda da esquerda é mais comprida que a da direita.
(D) negativas � ≤ Mo ≤ Me e a cauda da direita é mais comprida que a da esquerda.
(E) � ≤ Me ≤ Mo e a cauda da esquerda é mais comprida que a da direita.
Questão 27 INMETRO 2010 [CESPE]
Considere que, no estudo de um processo de fabricação de rebites para uso industrial,
tenham sido analisadas 36 peças, tomadas da linha de produção, ao longo de um dia,
estando as medidas relacionadas ao diâmetro da cabeça dos rebites sumarizadas nas
estatísticas e no gráfico seguintes.
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 100
Considere, ainda, que �̅, �� , � representam, respectivamente, a média amostral, o valor da i-
ésima medida e o tamanho da amostra, e que as unidades dos valores apresentados estão
de acordo com as unidades utilizadas na obtenção dos valores da tabela e do gráfico.
Com relação à média e à mediana, citadas na tabela do texto, assinale a opção correta.
A Como interpretação da média, é correto concluir que 50% dos diâmetros dos rebites estão
abaixo de 6,7261 e 50% das medidas estão acima desse valor.
B Tanto média quanto mediana medem o grau de assimetria de uma distribuição de
frequência.
C A mediana é corretamente calculada por
���
�
��
÷ �
D Para o cálculo da média, é necessário que os dados estejam ordenados.
E Para distribuições simétricas, a média e a mediana são coincidentes.
Questão 28 INEP 2008 [CESGRANRIO]
Analise as afirmações a seguir.
Numa distribuição simétrica, a média e a mediana coincidem.
PORQUE
Numa distribuição simétrica a moda nem sempre existe.
Quanto às afirmações acima, pode-se concluir que
(A) as duas asserções são verdadeiras e a segunda é uma justificativa correta da primeira.
(B) as duas asserções são verdadeiras e a segunda não é uma justificativa correta da
primeira.
(C) a primeira asserção é uma proposição verdadeira e a segunda, uma proposição falsa.
(D) a primeira asserção é uma proposição falsa e a segunda, uma proposição verdadeira.
(E) tanto a primeira como a segunda são proposições falsas.
Questão 29 PM Manaus 2004 [CESGRANRIO]
A tabela apresenta uma distribuição hipotética de frequência do número de anos
trabalhados, em uma amostra de 100 aposentados.
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 101
Essa distribuição:
(A) tem moda igual à média.
(B) tem moda menor que a média.
(C) é simétrica.
(D) é assimétrica à direita.
(E) é assimétrica à esquerda
Questão 30 TCE RO [CESGRANRIO]
A distribuição de frequência está representada no histograma a seguir.
Essa distribuição:
(A) é simétrica.
(B) apresenta assimetria à esquerda.
(C) apresenta assimetria à direita.
(D) tem média igual à mediana.
(E) tem histograma de frequência em forma de J.
Questão 31 Capes 2008 [CESGRANRIO]
A tabela a seguir apresenta algumas estatísticas das notas dos alunos de determinada área,
que participaram do ENADE 2006.
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 102
Analisando-se os dados da tabela conclui-se que
(A) a distribuição das notas é assimétrica à esquerda nos dois grupos de estudantes.
(B) a distribuição das notas dos concluintes apresenta-se mais homogênea do que a dos
ingressantes.
(C) pelo menos metade dos alunos ingressantes não alcançou a média de 1,9.
(D) mais de 90,0% dos alunos dessa área compareceram ao ENADE 2006.
(E) mais alunos ingressantes do que concluintes dessa área compareceram ao ENADE 2006.
Questão 32 Petrobras 2005 [CESGRANRIO]
A tabela apresenta uma distribuição hipotética de frequência do número de anos
trabalhados, em uma amostra de 100 aposentados.
A distribuição:
(A) é simétrica.
(B) é assimétrica à esquerda.
(C) é assimétrica à direita.
(D) tem moda menor que a média.
(E) tem moda igual à média.
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezeswww.estrategiaconcursos.com.br 103
Questão 33 TRT 3ª REGIAO 2009 [FCC]
Considere uma curva de uma distribuição estatística unimodal apresentando o valor da
mediana superior ao valor da moda e o valor da média aritmética superior ao valor da
mediana. Então, com relação às medidas de assimetria e curtose é correto afirmar que se
trata de uma curva apresentando uma distribuição
(A) leptocúrtica.
(B) platicúrtica.
(C) assimétrica à esquerda.
(D) assimétrica à direita.
(E) com coeficiente de curtose igual ao da curva normal.
Questão 34 TRE PI 2009 [FCC]
Numa pesquisa realizada em 160 domicílios de uma cidade obteve-se o seguinte gráfico em
que o eixo y representa a quantidade de domicílios e o eixo horizontal representa o número
de eleitores verificado por domicílio.
Com relação à média aritmética (Me), número de eleitores por domicílio, a mediana (Md) e
a moda (Mo) correspondentes tem-se que:
(A) Me = Md e Md < Mo
(B) Me < Md < Mo
(C) Me < Md e Md > Mo
(D) Me < Md e Md = Mo
(E) Me > Md e Md = Mo
Questão 35 PM Manaus 2004 [CESGRANRIO]
Os quartis de uma distribuição são Q1 = 4, Q2 = 6 e Q3 = 10. Essa distribuição:
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 104
(A) é simétrica.
(B) é assimétrica à direita.
(C) é assimétrica à esquerda.
(D) tem moda maior que a média.
(E) tem moda igual à média
Questão 36 ABIN 2010 [CESPE]
A figura acima apresenta esquematicamente as distribuições das alturas (em cm) dos
estudantes das três turmas de uma escola. As linhas verticais de cada box-plot se estendem
até os valores extremos da distribuição. Com base nessas informações, julgue os itens
consecutivos.
86 A turma 3 tem a maior amplitude de alturas.
87 As distribuições das alturas referentes às turmas 2 e 3 são simétricas.
88 Entre os estudantes da turma 1, 75% possuem alturas iguais ou superiores a 160 cm,
enquanto metade dos estudantes da turma 3 tem altura igual ou inferior a 160 cm.
5. GABARITO
1 B
2 B
3 C
4 A
5 C
Estatística para Bacen (Área 4)
Prof Vítor Menezes – Aula 02
Prof. Vítor Menezes www.estrategiaconcursos.com.br 105
6 B
7 CERTO ERRADO
8 E
9 D
10 C
11 C
12 D
13 ERRADO ERRADO CERTO ERRADO
14 A
15 D
16 C
17 A
18 D
19 C
20 E
21 E
22 E
23 D
24 CERTO
25 E
26 A
27 E
28 B
29 E
30 B
31 C
32 B
33 D
34 C
35 B
36 CERTO ERRADO ERRADO