Logo Passei Direto
Buscar
Material
páginas com resultados encontrados.
páginas com resultados encontrados.

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Prévia do material em texto

<p>Índice</p><p>..............................................................................................................................................................................................1) Mediana 3</p><p>..............................................................................................................................................................................................2) Quartil, Decil e Percentill 33</p><p>..............................................................................................................................................................................................3) Box Plot 67</p><p>..............................................................................................................................................................................................4) Questões Comentadas - Mediana - Cesgranrio 87</p><p>..............................................................................................................................................................................................5) Questões Comentadas - Box Plot - Cesgranrio 96</p><p>..............................................................................................................................................................................................6) Aviso importante - Orientação de estudo 100</p><p>..............................................................................................................................................................................................7) Questões Comentadas - Quartil, Decil e Percentil - Inéditas 101</p><p>..............................................................................................................................................................................................8) Questões Comentadas - Box Plot - Inéditas 114</p><p>..............................................................................................................................................................................................9) Lista de Questões - Mediana - Cesgranrio 122</p><p>..............................................................................................................................................................................................10) Lista de Questões - Box Plot - Cesgranrio 127</p><p>..............................................................................................................................................................................................11) Lista de Questões - Quartil, Decil e Percentil - Inéditas 130</p><p>..............................................................................................................................................................................................12) Lista de Questões - Box Plot - Inéditas 136</p><p>2</p><p>142</p><p>MEDIDAS SEPARATRIZES</p><p>As separatrizes são medidas que dividem (ou separam) uma série ordenada em duas ou mais partes, cada</p><p>uma contendo a mesma quantidade de elementos. Nesse caso, o nome da medida separatriz é definido de</p><p>acordo com a quantidade de partes em que a série é dividida:</p><p>• mediana: divide uma série ordenada em duas partes iguais, cada uma contendo 50% dos valores</p><p>da sequência;</p><p>• quartis: dividem uma série ordenada em quatro partes iguais, cada uma contendo 25% dos</p><p>valores da sequência;</p><p>• quintis: dividem uma série ordenada em cinco partes iguais, cada uma contendo 20% dos valores</p><p>da sequência;</p><p>• decis: dividem uma série ordenada em dez partes iguais, cada uma contendo 10% dos valores da</p><p>sequência; e</p><p>• percentis: dividem uma série ordenada em cem partes iguais, cada uma contendo 1% dos valores</p><p>da sequência.</p><p>Ao longo da aula, vamos estudar a mediana, os quartis, os decis e os percentis. Os quintis, por não serem tão</p><p>explorados em provas de concurso, não serão abordados.</p><p>MEDIANA</p><p>A mediana é, simultaneamente, uma MEDIDA DE POSIÇÃO, de TENDÊNCIA CENTRAL e SEPARATRIZ. Ela</p><p>caracteriza a posição central de uma série de valores. Além disso, também separa uma série de valores em</p><p>duas partes de tamanhos iguais, cada uma contendo o mesmo número de elementos. Muitas vezes, a</p><p>mediana é designada como valor mediano, sendo representada pelos símbolos 𝑴𝒅 ou, em menor</p><p>frequência, �̃�.</p><p>Mediana para dados não-agrupados.</p><p>O método para determinação da mediana envolve a realização de uma etapa anterior, que consiste na</p><p>ordenação do conjunto de dados. Feito isso, a mediana é o elemento que ocupa a POSIÇÃO CENTRAL de</p><p>uma série de observações ORDENADA segundo suas grandezas (isto é, dados brutos organizados em rol</p><p>crescente ou decrescente).</p><p>Por exemplo, vamos determinar a mediana da seguinte série de valores: {𝟑, 𝟏𝟕, 𝟏𝟑, 𝟏𝟗, 𝟐, 𝟓, 𝟕, 𝟏, 𝟖, 𝟐𝟏, 𝟗}.</p><p>Em conformidade com a definição da mediana, a primeira etapa consiste na ordenação (crescente ou</p><p>decrescente) da série de valores. Desse modo, obtemos: {𝟏, 𝟐, 𝟑, 𝟓, 𝟕, 𝟖, 𝟗, 𝟏𝟑, 𝟏𝟕, 𝟏𝟗, 𝟐𝟏}.</p><p>Agora, determinaremos o elemento que ocupa a posição central desse conjunto de dados. Para isso,</p><p>devemos encontrar o termo que possui o mesmo número de elementos tanto à sua esquerda quanto à sua</p><p>direita. Em nosso exemplo, esse valor é o 8, pois existem cinco elementos antes dele e cinco após ele. 𝟏, 𝟐, 𝟑, 𝟓, 𝟕,⏟ 𝟓 𝒆𝒍𝒆𝒎𝒆𝒏𝒕𝒐𝒔 𝒂𝒏𝒕𝒆𝒔 𝟖,⏟𝒆𝒍𝒆𝒎𝒆𝒏𝒕𝒐 𝒄𝒆𝒏𝒕𝒓𝒂𝒍 𝟗, 𝟏𝟑, 𝟏𝟕, 𝟏𝟗, 𝟐𝟏⏟ 𝟓 𝒆𝒍𝒆𝒎𝒆𝒏𝒕𝒐𝒔 𝒅𝒆𝒑𝒐𝒊𝒔 .</p><p>É importante notarmos que essa série possui um número ímpar de elementos. Quando isso acontece, isto</p><p>é, quando uma série possui um NÚMERO ÍMPAR de elementos, a MEDIANA SEMPRE COINCIDE com o</p><p>ELEMENTO CENTRAL do conjunto de dados. Portanto, temos: 𝑀𝑑 = 8</p><p>Contudo, se porventura a série tivesse um número par de elementos, POR CONVENÇÃO, a MEDIANA seria</p><p>a MÉDIA ARITMÉTICA dos dois termos centrais. Assim, caso adicionássemos o número 23 ao conjunto de</p><p>dados apresentado anteriormente, teríamos a seguinte situação: 𝟏, 𝟐, 𝟑, 𝟓, 𝟕,⏟ 𝟓 𝒆𝒍𝒆𝒎𝒆𝒏𝒕𝒐𝒔 𝒂𝒏𝒕𝒆𝒔 𝟖, 𝟗,⏟𝒆𝒍𝒆𝒎𝒆𝒏𝒕𝒐𝒔 𝒄𝒆𝒏𝒕𝒓𝒂𝒊𝒔 𝟏𝟑, 𝟏𝟕, 𝟏𝟗, 𝟐𝟏, 𝟐𝟑⏟ 𝟓 𝒆𝒍𝒆𝒎𝒆𝒏𝒕𝒐𝒔 𝒅𝒆𝒑𝒐𝒊𝒔 .</p><p>Nesse caso, em que temos um número par de elementos, a mediana é definida como a média aritmética dos</p><p>termos centrais, que são os números 8 e 9. Assim, temos:</p><p>𝑀𝑑 = 8 + 92 = 172 = 8,5</p><p>Note que, quando o número é ímpar, o termo central sempre ocupa a posição</p><p>𝒏+𝟏𝟐 . Por outro lado, quando</p><p>o número de termos é par, existem dois termos centrais, sendo que o primeiro ocupa a posição</p><p>𝒏𝟐; e o</p><p>segundo ocupa a posição imediatamente seguinte, ou seja,</p><p>𝒏𝟐 + 𝟏.</p><p>Essas relações são importantes porque nem sempre conseguiremos identificar a posição central tão</p><p>facilmente. Por exemplo, se tivermos uma série composta por 501 elementos, podemos afirmar que o termo</p><p>central será o elemento ocupando a posição</p><p>𝑛+12 = 501+12 = 251, sem precisar recorrer a qualquer outro</p><p>método. Logo, a mediana terá o mesmo valor do termo central: 𝑀𝑑 = 𝑥251.</p><p>Vejamos a disposição do termo central em relação aos demais elementos da série: 𝒙𝟏, 𝒙𝟐, ⋯ , 𝒙𝟐𝟓𝟎,⏟ 𝟐𝟓𝟎 𝒆𝒍𝒆𝒎𝒆𝒏𝒕𝒐𝒔 𝒂𝒏𝒕𝒆𝒔 𝒙𝟐𝟓𝟏,⏟𝒕𝒆𝒓𝒎𝒐 𝒄𝒆𝒏𝒕𝒓𝒂𝒍 𝒙𝟐𝟓𝟐, 𝒙𝟐𝟓𝟑, ⋯ , 𝒙𝟓𝟎𝟏⏟ 𝟐𝟓𝟎 𝒆𝒍𝒆𝒎𝒆𝒏𝒕𝒐𝒔 𝒅𝒆𝒑𝒐𝒊𝒔 .</p><p>Agora, se tivermos uma série composta por 500 elementos, os termos centrais serão os elementos ocupando</p><p>as posições: 𝑛2 = 5002 = 250 e</p><p>𝑛2 + 1 = 5002 + 1 = 251.</p><p>Vejamos a disposição dos termos centrais em relação aos demais elementos da série: 𝒙𝟏, 𝒙𝟐, ⋯ , 𝒙𝟐𝟒𝟗,⏟ 𝟐𝟓𝟎 𝒆𝒍𝒆𝒎𝒆𝒏𝒕𝒐𝒔 𝒂𝒏𝒕𝒆𝒔 𝒙𝟐𝟓𝟎, 𝒙𝟐𝟓𝟏,⏟ 𝒕𝒆𝒓𝒎𝒐𝒔 𝒄𝒆𝒏𝒕𝒓𝒂𝒊𝒔 𝒙𝟐𝟓𝟐, 𝒙𝟐𝟓𝟑, ⋯ , 𝒙𝟓𝟎𝟎⏟ 𝟐𝟓𝟎 𝒆𝒍𝒆𝒎𝒆𝒏𝒕𝒐𝒔 𝒅𝒆𝒑𝒐𝒊𝒔 .</p><p>Nessa situação, por convenção, a mediana será a média aritmética entre os termos centrais, 𝑀𝑑 = 𝑥250+𝑥2512 .</p><p>Portanto, podemos estabelecer que a mediana de um conjunto composto por 𝑛 elementos ordenados de</p><p>forma crescente ou decrescente será:</p><p>DISCREPANTES (OUTLIERS) e representados por PONTOS ou ASTERISCOS.</p><p>É importante salientarmos que a fórmula da distância interquartílica se parece muito com a do</p><p>desvio quartílico (ou amplitude semi-interquartílica), podendo ser facilmente confundida. O desvio</p><p>quartílico é calculado pela expressão apresentada a seguir: 𝑫𝒒 = 𝑸𝟑 − 𝑸𝟏𝟐</p><p>Essa medida será abordada de forma mais detalhada na aula de medidas de dispersão.</p><p>Vamos ver como representar um conjunto de dados em forma de box plot. Considere a seguinte</p><p>série, que elenca os pesos de um grupo de 40 alunos do Estratégia Concursos:</p><p>{58, 65, 66, 67, 68, 68, 68, 69, 69, 69, 69, 70, 70, 70, 70, 70, 70, 70, 70, 71, 71, 72, 72, 73, 73, 74, 75,</p><p>75, 75, 75, 75, 76, 76, 77, 77, 78, 79, 79, 80, 87}.</p><p>Primeiro, vamos identificar as medidas descritivas desse conjunto:</p><p>a) valor mínimo: 𝑚í𝑛 = 58</p><p>b) primeiro quartil:</p><p>Determinando a posição de 𝑄1: 𝑃𝑄1 = 1 × 404 = 10</p><p>Em seguida, verificamos o valor que está ocupando essa posição 𝑄1 = 69</p><p>c) mediana:</p><p>Como o conjunto é formado por um número par de elementos, o segundo quartil (mediana) será</p><p>calculado como a média aritmética dos termos centrais. Os termos centrais ocupam as posições 20</p><p>e 21, então, calculando a média aritmética, descobrimos que o segundo quartil vale:</p><p>𝑄2 = 𝑥𝑛2 + 𝑥𝑛2+12 = 𝑥402 + 𝑥402 +12 = 𝑥20 + 𝑥212 = 71 + 712 = 71</p><p>d) terceiro quartil:</p><p>Determinando a posição de 𝑄3:</p><p>𝑃𝑄3 = 3 × 404 = 30</p><p>Em seguida, verificamos o valor que está ocupando essa posição 𝑄3 = 75</p><p>e) valor máximo: 𝑚á𝑥 = 87</p><p>f) distância interquartílica: 𝐷𝐼𝑄 = 𝑄3 − 𝑄1 = 75 − 69 = 6</p><p>g) limite inferior para detecção de outliers: 𝑄1 − 1,5 × 𝐷𝐼𝑄 = 69 − 1,5 × 6 = 60</p><p>h) limite superior para detecção de outliers: 𝑄3 + 1,5 × 𝐷𝐼𝑄 = 75 + 1,5 × 6 = 82</p><p>Agora, podemos reunir essas informações em um gráfico de box plot. Reparem que o valor mínimo</p><p>está localizado em 65, porque esse é o MENOR VALOR do conjunto de dados IGUAL OU SUPERIOR</p><p>ao limite inferior para detecção de outliers (60). De igual modo, notem que o valor máximo está</p><p>localizado em 80, porque esse é o MAIOR VALOR do conjunto de dados IGUAL OU INFERIOR ao</p><p>limite superior para detecção de outliers (82). Vejam também que os valores abaixo de 60 e acima</p><p>de 82 são considerados discrepantes, sendo sinalizados por pontos.</p><p>Agora, vamos analisar uma segunda série de dados, que representa os pesos de um grupo de 40</p><p>alunas do Estratégia Concursos.</p><p>{59, 60, 61, 62, 62, 63, 64, 64, 64, 65, 65, 65, 65, 65, 65, 65, 65, 65, 65, 66, 66, 66, 66, 66, 66, 66, 67,</p><p>67, 67, 67, 67, 67, 67, 68, 68, 68, 68, 68, 69, 69}</p><p>Vamos identificar as medidas descritivas desse conjunto:</p><p>a) valor mínimo: 𝑚í𝑛 = 59</p><p>b) primeiro quartil:</p><p>Determinando a posição de 𝑄1: 𝑃𝑄1 = 1 × 404 = 10</p><p>Em seguida, verificamos o valor que está ocupando essa posição 𝑄1 = 65</p><p>c) mediana:</p><p>Como o conjunto é formado por um número par de elementos, o segundo quartil (mediana) será</p><p>calculado como a média aritmética dos termos centrais. Os termos centrais ocupam as posições 20</p><p>e 21, então, calculando a média aritmética, descobrimos que o segundo quartil vale:</p><p>𝑄2 = 𝑥𝑛2 + 𝑥𝑛2+12 = 𝑥402 + 𝑥402 +12 = 𝑥20 + 𝑥212 = 66 + 662 = 66</p><p>d) terceiro quartil:</p><p>Determinando a posição de 𝑄3: 𝑃𝑄3 = 3 × 404 = 30</p><p>Em seguida, verificamos o valor que está ocupando essa posição 𝑄3 = 67</p><p>e) valor máximo: 𝑚á𝑥 = 69</p><p>f) distância interquartílica: 𝐷𝐼𝑄 = 𝑄3 − 𝑄1 = 67 − 65 = 2</p><p>g) limite inferior para detecção de outliers: 𝑄1 − 1,5 × 𝐷𝐼𝑄 = 65 − 1,5 × 2 = 62</p><p>h) limite superior para detecção de outliers: 𝑄3 + 1,5 × 𝐷𝐼𝑄 = 67 + 1,5 × 2 = 70</p><p>Nesse ponto, podemos reunir essas informações em um segundo gráfico de box plot. Reparem que</p><p>o valor mínimo está localizado em 62, porque esse é o MENOR VALOR do conjunto de dados IGUAL</p><p>OU SUPERIOR ao limite inferior para detecção de outliers (62). De igual modo, notem que o valor</p><p>máximo está localizado em 69, porque esse é o MAIOR VALOR do conjunto de dados IGUAL OU</p><p>INFERIOR ao limite superior para detecção de outliers (70). Vejam também que os valores abaixo</p><p>de 62 são considerados discrepantes, sendo sinalizados por pontos.</p><p>Podemos, também, construir um único gráfico de box plot reunindo duas ou mais distribuições, o</p><p>que torna o processo de comparação mais simples e visual.</p><p>Por fim, gostaria de chamar atenção para um detalhe importante. A depender do conjunto de dados,</p><p>teremos valores iguais para máximos, mínimos, primeiro quartil, mediana e terceiro quartil. Nesse</p><p>caso, o aspecto visual do box plot sofrerá alterações.</p><p>Por exemplo, considere a distribuição a seguir, em que a mediana e o terceiro quartil são iguais:</p><p>a) valor mínimo: 1;</p><p>b) primeiro quartil: 𝑃𝑜𝑠𝑖çã𝑜: 1 × (11/4) = 2,75 ⟶ 𝑉𝑎𝑙𝑜𝑟 𝑚𝑎𝑖𝑠 𝑝𝑟ó𝑥𝑖𝑚𝑜: 𝑥3 = 1</p><p>c) segundo quartil (mediana):</p><p>Como o número de elementos do conjunto é ímpar, o segundo quartil (mediana) coincidirá com o</p><p>termo central da série. Assim, calculando a posição da mediana teremos: 𝑄2 = 𝑥𝑛+12 = 𝑥11+12 = 𝑥122 = 𝑥6</p><p>Portanto, o segundo quartil (mediana) é igual a 𝑥6 = 6</p><p>d) terceiro quartil: 𝑃𝑜𝑠𝑖çã𝑜: 3 × (11/4) = 8,25 ⟶ 𝑉𝑎𝑙𝑜𝑟 𝑚𝑎𝑖𝑠 𝑝𝑟ó𝑥𝑖𝑚𝑜: 𝑥8 = 6</p><p>e) valor máximo: 8</p><p>Nessa situação, a caixa retangular não exibirá três linhas em seu interior, pois a linha da mediana irá</p><p>se sobrepor a do quartil superior. Além disso, também não haverá um traço ligando o valor mínimo</p><p>ao quartil inferior, vez que ambos terão a mesma magnitude. O gráfico ficará assim:</p><p>𝒙𝟏 𝒙𝟐 𝒙𝟑 𝒙𝟒 𝒙𝟓 𝒙𝟔 𝒙𝟕 𝒙𝟖 𝒙𝟗 𝒙𝟏𝟎 𝒙𝟏𝟏</p><p>1 1 1 1 6 6 6 6 6 6 8</p><p>(CESPE/TJ-PA/2020)</p><p>Considerando que o desenho esquemático (boxplot) antecedente se refere a uma variável quantitativa X,</p><p>assinale a opção correta.</p><p>a) O intervalo interquartil é igual a 65.</p><p>b) Metade da distribuição da variável X se encontra entre os valores 20 e 40.</p><p>c) Os valores da variável X que se encontram no intervalo [5;10] representam 5% da distribuição de X.</p><p>d) A mediana de X é igual a 25.</p><p>e) O primeiro quartil da distribuição de X é igual a 10.</p><p>Comentários:</p><p>Analisando cada uma das alternativas:</p><p>• Letra A: Errada. O intervalo interquartil vale 𝐷𝐼𝑄 = 𝑄3 − 𝑄1 = 40 − 10 = 30.</p><p>• Letra B: Errada. O diagrama mostra que a mediana ocorre em 20, logo, a metade da distribuição está</p><p>entre 20 e 70.</p><p>• Letra C: Errada. O diagrama é distribuído em 4 quartis, 4 partes com a mesma quantidade de valores,</p><p>cada quartil representando 25% das observações, sendo o primeiro quartil representado pelo intervalo</p><p>[5;10].</p><p>• Letra D: Errada. O diagrama mostra que a mediana vale 20.</p><p>• Letra E: Correta. O diagrama mostra que o primeiro quartil vale 10, ocupando o intervalo [5;10].</p><p>Gabarito: E.</p><p>(CESPE/IPHAN/2018) Julgue o item subsequente, referente à análise exploratória de dados.</p><p>O BOXPLOT representa os dados em um retângulo construído com o primeiro e o segundo quartil,</p><p>fornecendo informação sobre valores médios.</p><p>Comentários:</p><p>O boxplot oferece informações sobre os quartis (1.º, 2.º e 3.º), o limite mínimo, o limite máximo e os outliers</p><p>(valores discrepantes). O 2.º quartil coincide com o valor da mediana. Portanto, a questão erra ao afirmar</p><p>que as informações são sobre os valores médios.</p><p>Gabarito: Errado.</p><p>(FGV/MPE-BA/2017) Em uma amostra desconfia-se de que três valores sejam, na verdade, “ outliers” e</p><p>que deveriam ser descartados. Para tal avaliação o estatístico dispõe apenas dos valores dos 1º e 3º quartil</p><p>da distribuição. Os números são os seguintes: 𝑸𝟏(𝑿) = 𝟐𝟏, 𝑸𝟑(𝑿) = 𝟑𝟑, 𝑿𝟏 = 𝟓𝟖, 𝑿𝟐 = 𝟐 e 𝑿𝟑 = 𝟒𝟑</p><p>Onde 𝑸𝒊𝒔 são os quartis e os 𝑿𝒊𝒔 os valores em análise.</p><p>Assim, é correto afirmar que:</p><p>a) Todos os valores são “outliers”;</p><p>b) Os valores 𝑋1 e 𝑋3 são “outliers”;</p><p>c) Nenhum dos valores é “outliers”;</p><p>d) Apenas o valor</p><p>𝑋2 é “outlier”;</p><p>e) Os valores 𝑋1 e 𝑋2 são “outliers”.</p><p>Comentários:</p><p>Para resolvermos a questão, precisamos calcular os limites inferior e superior da amostra. Assim: 𝑙𝑖𝑛𝑓 = 𝑄1 − 1,5 × (𝑄3 − 𝑄1) 𝑙𝑖𝑛𝑓 = 21 − 1,5 × (33 − 21) 𝑙𝑖𝑛𝑓 = 21 − 18 = 3</p><p>𝑙𝑠𝑢𝑝 = 𝑄3 + 1,5 × (𝑄3 − 𝑄1) 𝑙𝑠𝑢𝑝 = 33 + 1,5 × (33 − 21) 𝑙𝑠𝑢𝑝 = 33 + 18 = 51</p><p>Como 2 < 3 e 58 > 51, então podemos afirmar que os valores 𝑋1 e 𝑋2 são outliers.</p><p>Gabarito: E.</p><p>(FCC/TRT 3ª Região/2015) Seja uma representação gráfica de dados de acordo com o desenho</p><p>esquemático abaixo (box-plot) que foi preparado para comparar todos os salários dos funcionários do sexo</p><p>masculino (Grupo I) com todos os salários dos funcionários do sexo feminino (Grupo II) lotados em um</p><p>órgão público.</p><p>Neste desenho esquemático</p><p>a) O número de elementos do Grupo I é superior ao número de elementos do Grupo II.</p><p>b) O módulo da diferença entre as medianas dos 2 grupos é igual a 25% do menor salário deste órgão público.</p><p>c) Mais da metade dos elementos do Grupo I possui um salário inferior a R$ 5.000,00 ou superior a R$</p><p>10.000,00.</p><p>d) O valor do menor salário do Grupo II corresponde a 37,5% do valor da mediana do Grupo I.</p><p>e) A diferença interquartil do Grupo I é superior à diferença interquartil do Grupo II.</p><p>Comentários:</p><p>Vamos analisar cada uma das alternativas:</p><p>• Letra A: Errada. O diagrama não mostra a quantidade de elementos de cada grupo, portanto, não</p><p>podemos afirmar que o Grupo I tem mais elementos que o Grupo II.</p><p>• Letra B: Errada. O diagrama mostra que as medianas valem 8 e 7 para cada grupo, portanto, a</p><p>diferença entre elas é igual a 1. Podemos observar também que o menor salário é 2. Logo, a diferença entre</p><p>as medianas corresponde a 50% do menor salário.</p><p>• Letra C: Errada. Se separarmos o Grupo I em quartis, cada quartil corresponderá a 25% do total de</p><p>elementos. Somando o último e o primeiro quartil teremos 50%, exatamente a metade, dos elementos.</p><p>Portanto, não podemos afirmar que mais da metade dos elementos do Grupo I possui um salário inferior a</p><p>R$ 5.000,00 ou superior a R$ 10.000,00.</p><p>• Letra D: Correta. O menor salário do Grupo II vale 3. A mediana do Grupo I vale 8. Então,</p><p>38 = 0,375 =37,5%.</p><p>• Letra E: Errada. Para o primeiro grupo 𝑄3 = 10, 𝑄1 = 5 → 𝑄3 − 𝑄1 = 10 − 5 = 5 para o segundo</p><p>grupo 𝑄3 = 9 , 𝑄1 = 4 → 𝑄3 − 𝑄1 = 9 − 4 = 5. Portanto, as distâncias são iguais.</p><p>Gabarito: D.</p><p>RESUMO DA AULA</p><p>MEDIDAS SEPARATRIZES</p><p>As separatrizes são medidas que dividem (ou separam) uma série ordenada em duas ou mais partes, cada</p><p>uma contendo a mesma quantidade de elementos. Nesse caso, o nome da medida separatriz é definido de</p><p>acordo com a quantidade de partes em que a série é dividida:</p><p>MEDIANA</p><p>A mediana é, simultaneamente, uma MEDIDA DE POSIÇÃO, de TENDÊNCIA CENTRAL e SEPARATRIZ. Ela</p><p>separa uma série de valores em duas partes de tamanhos iguais, cada uma contendo o mesmo número de</p><p>elementos. Sendo representada pelos símbolos 𝑴𝒅 ou, em menor frequência, �̃�.</p><p>Mediana para dados não-agrupados.</p><p>A mediana é o elemento que ocupa a POSIÇÃO CENTRAL de uma série de observações ordenada</p><p>segundo suas grandezas. Para estabelecer que a mediana de um conjunto composto por 𝑛</p><p>elementos ordenados de forma crescente ou decrescente temos:</p><p>a) se 𝑛 for ímpar: 𝑴𝒅 = 𝒙𝒏+𝟏</p><p>𝟐</p><p>b) se 𝑛 for par: 𝑴𝒅 =</p><p>𝒙𝒏</p><p>𝟐</p><p>+ 𝒙𝒏</p><p>𝟐</p><p>+𝟏</p><p>𝟐</p><p>Divide uma série ordenada em duas</p><p>partes iguais, cada uma contendo</p><p>50% dos valores da sequência</p><p>Dividem uma série ordenada em</p><p>cinco partes iguais, cada uma</p><p>contendo 20% dos valores da</p><p>sequência</p><p>Dividem uma série ordenada em</p><p>quatro partes iguais, cada uma</p><p>contendo 25% dos valores da</p><p>sequência.</p><p>Dividem uma série ordenada em dez</p><p>partes iguais, cada uma contendo</p><p>10% dos valores da sequência.</p><p>Dividem uma série ordenada em</p><p>cem partes iguais, cada uma</p><p>contendo 1% dos valores da</p><p>sequência.</p><p>79</p><p>142</p><p>Mediana para dados agrupados sem intervalos de classe</p><p>A mediana é um valor que dividirá a distribuição de frequências em duas partes contendo o mesmo</p><p>número de elementos. Para estabelecer que a mediana de uma tabela de frequências composta por</p><p>um total de 𝑛 elementos:</p><p>a) se 𝑛 for ímpar: 𝑴𝒅 = 𝒙𝒏+𝟏</p><p>𝟐</p><p>b) se 𝑛 for par: 𝑴𝒅 =</p><p>𝒙𝒏</p><p>𝟐</p><p>+ 𝒙𝒏</p><p>𝟐</p><p>+𝟏</p><p>𝟐</p><p>Mediana para dados agrupados em classes</p><p>I - Para calcular a mediana de dados que estão agrupados por intervalo de classes, identificamos a</p><p>classe mediana, que corresponde à frequência acumulada imediatamente igual ou superior à</p><p>metade da frequência total, ou seja, metade da soma das frequências simples, ∑ 𝒇𝒊 𝟐⁄ .</p><p>II - Conhecendo a classe mediana, podemos aplicar a fórmula da mediana:</p><p>𝑴𝒅 = 𝒍𝒊𝒏𝒇 + [</p><p>(</p><p>∑ 𝒇𝒊</p><p>𝟐 ) − 𝒇𝒂𝒄𝒂𝒏𝒕</p><p>𝒇𝒊</p><p>] × 𝒉</p><p>III - método de interpolação linear consiste em utilizar valores conhecidos para estimar valores</p><p>desconhecidos de forma linear, isto é, por meio de uma reta.</p><p>Propriedades da Mediana</p><p>• Somando-se (ou subtraindo-se) uma constante 𝒄 a todos os valores de uma variável, a</p><p>mediana do conjunto fica aumentada (ou diminuída) dessa constante.</p><p>1º Propriedade</p><p>• Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante</p><p>𝒄, a mediana do conjunto fica multiplicada (ou dividida) por esta constante.</p><p>2º Propriedade</p><p>80</p><p>142</p><p>QUARTIL, DECIL E PERCENTIL</p><p>O nome da medida separatriz é atribuído de acordo com a quantidade de partes em que a série é dividida:</p><p>Quartis</p><p>Quartil para dados não-agrupados</p><p>O cálculo do quartil para dados não-agrupados será realizado por meio de três etapas:</p><p>• 1.a etapa: determinar a posição do quartil, por meio da expressão:</p><p>𝑷𝑸𝒌</p><p>=</p><p>𝒌 × 𝒏</p><p>𝟒</p><p>(𝒌 = 𝟏, 𝟐, 𝟑);</p><p>• 2.a etapa: identificar a posição mais próxima do rol;</p><p>• 3.a etapa: verificar o valor que está ocupando essa posição.</p><p>Quartil para dados agrupados sem intervalos de classe</p><p>O cálculo do quartil para dados agrupados sem intervalos de classe será realizado por meio de três etapas:</p><p>• A soma dos desvios absolutos de uma sequência de números, em relação a um número</p><p>𝒂, é mínima quando 𝒂 é a mediana dos números.</p><p>3º Propriedade</p><p>Valores de uma série que a dividem em QUATRO</p><p>PARTES IGUAIS, isto é, quatro partes contendo o</p><p>mesmo número de elementos (25%).</p><p>𝑸𝟏: o primeiro quartil corresponde à separação dos</p><p>primeiros 25% de elementos da série.</p><p>𝑸𝟐: o segundo quartil corresponde à separação de</p><p>metade dos elementos da série, coincidindo com a</p><p>mediana (𝑸𝟐 = 𝑴𝒅)</p><p>𝑸𝟑: o terceiro quartil corresponde à separação dos</p><p>primeiros 75% de elementos da série, ou dos últimos</p><p>25% de elementos da série</p><p>81</p><p>142</p><p>• 1.a etapa: determinar a posição do quartil, por meio da expressão:</p><p>𝑷𝑸𝒌</p><p>=</p><p>𝒌 × ∑ 𝒇𝒊</p><p>𝟒</p><p>(𝒌 = 𝟏, 𝟐, 𝟑)</p><p>• 2.a etapa: identificar a posição do quartil na coluna de frequências acumuladas, isto é, a frequência</p><p>acumulada imediatamente igual ou superior à posição do quartil;</p><p>• 3.a etapa: verificar o valor da variável que corresponde a essa posição.</p><p>Quartil para dados agrupados em classes</p><p>O cálculo do quartil para dados agrupados em classes será realizado por meio das seguintes etapas:</p><p>• 1.a etapa: determinar a posição do quartil, por meio da expressão:</p><p>𝑷𝑸𝒌</p><p>=</p><p>𝒌 × ∑ 𝒇𝒊</p><p>𝟒</p><p>(𝒌 = 𝟏, 𝟐, 𝟑)</p><p>• 2.a etapa: identificar a posição do quartil na coluna de frequências acumuladas, isto é, a frequência</p><p>acumulada imediatamente igual ou superior à posição do quartil;</p><p>• 3.a etapa: verificar as informações referentes à classe correspondente a essa posição; e</p><p>• 4.ª etapa: calcular o valor do quartil por meio da fórmula apresentada a seguir, que consiste em</p><p>uma variação da fórmula da mediana para dados agrupados em classes:</p><p>𝑸𝒌 = 𝒍𝒊𝒏𝒇𝑸𝒌</p><p>+ [</p><p>𝒌 × ∑ 𝒇𝒊</p><p>𝟒</p><p>− 𝒇𝒂𝒄𝒂𝒏𝒕</p><p>𝒇𝑸𝒌</p><p>] × 𝒉𝑸𝒌</p><p>Decis</p><p>Valores de uma série que a dividem em DEZ PARTES</p><p>IGUAIS, isto é, dez partes contendo o mesmo número</p><p>de elementos (10%).</p><p>𝑫𝟏: o primeiro</p><p>decil corresponde à separação dos</p><p>primeiros 10% de elementos da série;</p><p>𝑫𝟓: o quinto decil corresponde à separação de</p><p>metade dos elementos da série, coincidindo com</p><p>a mediana (𝑫𝟓 = 𝑴𝒅);</p><p>𝑫𝟗: o nono decil corresponde à separação dos</p><p>primeiros 90% de elementos da série, ou dos</p><p>últimos 10% de elementos da série.</p><p>82</p><p>142</p><p>Decil para dados não-agrupados</p><p>O cálculo do decil para dados não-agrupados será realizado por meio de três etapas:</p><p>• 1.a etapa: determinar a posição do decil, por meio da expressão:</p><p>𝑷𝑫𝒌</p><p>=</p><p>𝒌 × 𝒏</p><p>𝟏𝟎</p><p>(𝒌 = 𝟏, 𝟐, ⋯ , 𝟗);</p><p>• 2.a etapa: identificar a posição mais próxima do rol;</p><p>• 3.a etapa: verificar o valor que está ocupando essa posição.</p><p>Decil para dados agrupados sem intervalos de classe.</p><p>O cálculo do decil para dados agrupados sem intervalos de classe será realizado por meio das seguintes</p><p>etapas:</p><p>• 1.a etapa: determinamos a posição do decil, por meio da expressão:</p><p>𝑷𝑫𝒌</p><p>=</p><p>𝒌 × ∑ 𝒇𝒊</p><p>𝟏𝟎</p><p>(𝒌 = 𝟏, 𝟐, ⋯ , 𝟗)</p><p>• 2.a etapa: identificamos a posição do decil na coluna de frequências acumuladas, isto é, a</p><p>frequência acumulada imediatamente igual ou superior à posição do decil;</p><p>• 3.a etapa: verificamos o valor da variável que corresponde a essa posição.</p><p>Decil para dados agrupados em classes</p><p>O cálculo do decil para dados agrupados em classes será realizado por meio das seguintes etapas:</p><p>• 1.a etapa: determinamos a posição do decil, por meio da expressão:</p><p>𝑷𝑫𝒌</p><p>=</p><p>𝒌 × ∑ 𝒇𝒊</p><p>𝟏𝟎</p><p>(𝒌 = 𝟏, 𝟐, ⋯ , 𝟗)</p><p>• 2.a etapa: identificamos a posição do decil na coluna de frequências acumuladas, isto é, a</p><p>frequência acumulada imediatamente igual ou superior à posição do decil;</p><p>• 3.a etapa: verificamos as informações referentes à classe correspondente a essa posição; e</p><p>• 4.ª etapa: calculamos o valor do decil por meio da fórmula apresentada a seguir, que consiste em</p><p>uma variação da fórmula da mediana para dados agrupados em classes:</p><p>83</p><p>142</p><p>𝑫𝒌 = 𝒍𝒊𝒏𝒇𝑫𝒌</p><p>+ [</p><p>𝒌 × ∑ 𝒇𝒊</p><p>𝟏𝟎</p><p>− 𝒇𝒂𝒄𝒂𝒏𝒕</p><p>𝒇𝑫𝒌</p><p>] × 𝒉𝑫𝒌</p><p>Percentis</p><p>Percentil para dados não-agrupados</p><p>O cálculo do Percentil para dados não-agrupados será realizado por meio de três etapas:</p><p>• 1.a etapa: determinar a posição do percentil, por meio da expressão:</p><p>𝑷𝑷𝒌</p><p>=</p><p>𝒌 × 𝒏</p><p>𝟏𝟎𝟎</p><p>(𝒌 = 𝟏, 𝟐, ⋯ , 𝟗𝟗);</p><p>• 2.a etapa: identificar a posição mais próxima do rol;</p><p>• 3.a etapa: verificar o valor que está ocupando essa posição.</p><p>Percentil para dados agrupados sem intervalos de classe</p><p>O cálculo do percentil para dados agrupados sem intervalos de classe será realizado por meio das</p><p>seguintes etapas:</p><p>• 1.a etapa: determinar a posição do percentil, por meio da expressão:</p><p>𝑷𝑷𝒌</p><p>=</p><p>𝒌 × ∑ 𝒇𝒊</p><p>𝟏𝟎𝟎</p><p>(𝒌 = 𝟏, 𝟐, ⋯ , 𝟗𝟗)</p><p>Valores de uma série que a dividem em CEM PARTES</p><p>IGUAIS, isto é, cem partes contendo o mesmo número</p><p>de elementos (1%)</p><p>𝑷𝟏: o primeiro percentil corresponde à separação do</p><p>primeiro 1% de elementos da série;</p><p>𝑷𝟓𝟎: o quinquagésimo percentil corresponde à</p><p>separação de metade dos elementos da série,</p><p>coincidindo com a mediana (𝑷𝟓𝟎 = 𝑴𝒅);</p><p>𝑷𝟗𝟗: o nonagésimo nono percentil corresponde à</p><p>separação dos primeiros 99% de elementos da série,</p><p>ou do último 1% de elementos da série.</p><p>84</p><p>142</p><p>• 2.a etapa: identificar a posição do percentil na coluna de frequências acumuladas, isto é, a</p><p>frequência acumulada imediatamente igual ou superior à posição do percentil;</p><p>• 3.a etapa: verificar o valor da variável que corresponde a essa posição.</p><p>Percentil para dados agrupados em classes</p><p>O cálculo do percentil para dados agrupados em classes será realizado por meio das seguintes etapas:</p><p>• 1.a etapa: determinar a posição do percentil, por meio da expressão:</p><p>𝑷𝑷𝒌</p><p>=</p><p>𝒌 × ∑ 𝒇𝒊</p><p>𝟏𝟎𝟎</p><p>(𝒌 = 𝟏, 𝟐, ⋯ , 𝟗𝟗)</p><p>• 2.a etapa: identificar a posição do percentil na coluna de frequências acumuladas, isto é, a</p><p>frequência acumulada imediatamente igual ou superior à posição do percentil;</p><p>• 3.a etapa: verificar as informações referentes à classe correspondente a essa posição; e</p><p>• 4.ª etapa: calculamos o valor do percentil por meio da fórmula apresentada a seguir, que consiste</p><p>em uma variação da fórmula da mediana para dados agrupados em classes:</p><p>𝑷𝒌 = 𝒍𝒊𝒏𝒇𝑷𝒌</p><p>+ [</p><p>𝒌 × ∑ 𝒇𝒊</p><p>𝟏𝟎𝟎</p><p>− 𝒇𝒂𝒄𝒂𝒏𝒕</p><p>𝒇𝑷𝒌</p><p>] × 𝒉𝑷𝒌</p><p>85</p><p>142</p><p>BOX PLOT</p><p>Um boxplot ou box-and-whisker plot é uma ferramenta gráfica frequentemente utilizada na análise</p><p>exploratória de dados que permite visualizar a distribuição dos dados e os valores discrepantes (outliers).</p><p>Essa ferramenta resume cinco medidas descritivas de um conjunto de dados, incluindo: o valor mínimo, o</p><p>primeiro quartil, a mediana, o terceiro quartil e o valor máximo.</p><p>A distância interquartílica (ou amplitude interquartílica, ou intervalo interquartílico) é calculada pela</p><p>fórmula:</p><p>𝑫𝑰𝑸 = 𝑸𝟑 − 𝑸𝟏</p><p>86</p><p>142</p><p>QUESTÕES COMENTADAS – CESGRANRIO</p><p>Mediana</p><p>1. (CESGRANRIO/ELETRONUCLEAR/2022) A Tabela a seguir indica a frequência de acidentes de</p><p>trabalhadores de uma empresa do setor sucroalcooleiro, em faixas etárias, durante um período de 7 anos.</p><p>Idade 18 ⊢ 26 26 ⊢ 34 34 ⊢ 42 42 ⊢ 50 50 ⊢ 58 58 ⊢ 64</p><p>No de acidentes 300 1280 380 180 48 8</p><p>Observando-se os dados presentes na Tabela e usando-se o método de interpolação linear, qual a idade</p><p>mediana dos trabalhadores acidentados?</p><p>a) 30,79</p><p>b) 31,30</p><p>c) 31,84</p><p>d) 32,70</p><p>e) 33,25</p><p>Comentários:</p><p>Podemos estimar a mediana de uma distribuição de dados agrupados usando a fórmula:</p><p>𝑀𝑑 = 𝑙𝑖𝑛𝑓 + (</p><p>(</p><p>∑ 𝑓𝑖</p><p>𝑛</p><p>𝑖=1</p><p>2</p><p>) − 𝑓𝑎𝑐𝑎𝑛𝑡</p><p>𝑓𝑖</p><p>) × ℎ</p><p>em que 𝑙𝑖𝑛𝑓 é o limite inferior da classe mediana,</p><p>∑ 𝒇𝒊</p><p>𝒏</p><p>𝒊=𝟏</p><p>𝟐</p><p>corresponde à posição na qual a mediana está</p><p>localizada, 𝑓𝑎𝑐𝑎𝑛𝑡 é a frequência acumulada da classe anterior a que contém a mediana, 𝑓𝑖 é a frequência da</p><p>classe que contém a mediana e ℎ é a amplitude do intervalo no qual a mediana está contida.</p><p>Sendo assim, reescrever a tabela apresentada no enunciado, acrescentando uma coluna para as frequências</p><p>acumuladas:</p><p>87</p><p>142</p><p>Idade N° de Acidentes</p><p>(Freq.)</p><p>Freq. Acumulada</p><p>18 Ⱶ 26 300 300</p><p>26 Ⱶ 34 1280 1580 (≥ 1098)</p><p>34 Ⱶ 42 380 1960</p><p>42 Ⱶ 50 180 2140</p><p>50 Ⱶ 58 48 2188</p><p>58 Ⱶ 64 8 2196</p><p>Agora, podemos aplicar a fórmula anterior:</p><p>𝑀𝑑 = 𝑙𝑖𝑛𝑓 + (</p><p>(</p><p>∑ 𝑓𝑖</p><p>𝑛</p><p>𝑖=1</p><p>2</p><p>) − 𝑓𝑎𝑐𝑎𝑛𝑡</p><p>𝑓𝑖</p><p>) × ℎ</p><p>𝑀𝑑 = 26 + (</p><p>(</p><p>2196</p><p>2 ) − 300</p><p>1280</p><p>) × 8</p><p>𝑀𝑑 = 26 + (</p><p>1098 − 300</p><p>1280</p><p>) × 8</p><p>𝑀𝑑 = 26 + (</p><p>798</p><p>1280</p><p>) × 8</p><p>𝑀𝑑 = 26 +</p><p>798</p><p>160</p><p>= 30,98</p><p>Sendo assim, a mediana dessa distribuição é igual a 30,98, não havendo nenhuma alternativa correta dentre</p><p>as indicadas pela banca organizadora do concurso. A banca equivocou-se ao atribuir a Alternativa B como</p><p>gabarito desta questão.</p><p>Gabarito: B.</p><p>2. (CESGRANRIO/BB/2021) Um funcionário de um banco foi incumbido de acompanhar o perfil dos clientes</p><p>de um determinado produto por meio da Análise de Dados, de forma a aprimorar as atividades de</p><p>marketing relativas a esse produto. Para isso, ele utilizou a variável classe social desses clientes, coletada</p><p>pelo banco, que tem os valores A, B, C, D e E, sem referência a valores contínuos. Sabendo-se que essa é</p><p>uma escala ordinal, qual é a medida de tendência central adequada para analisar essa variável?</p><p>88</p><p>142</p><p>a) média aritmética</p><p>b) média geométrica</p><p>c) mediana</p><p>d) quartis</p><p>e) variância</p><p>Comentários:</p><p>Vamos analisar cada alternativa:</p><p>a) média aritmética e b) média geométrica</p><p>As operações aritméticas básicas não podem ser utilizadas com dados categóricos, não sendo possível</p><p>empregar a média aritmética ou a média geométrica para a escala ordinal em questão. Por exemplo, se nosso</p><p>conjunto de dados fosse formado por apenas dois elementos A e B, a média aritmética seria (A+B)/2, que</p><p>não representaria absolutamente nada.</p><p>c) mediana</p><p>Como os dados podem ser ordenados, devido a escala utilizada ser ordinal, podemos encontrar o elemento</p><p>que ocupa a posição central do conjunto de dados, sendo viável o emprego da mediana.</p><p>d) quartis</p><p>Salvo o segundo, os demais quartis não podem ser considerados medidas de tendência central, mas sim</p><p>medidas separatrizes.</p><p>e) variância</p><p>Também não é uma medida de tendência central.</p><p>Gabarito: C.</p><p>3. (CESGRANRIO/CEF/2021) Seis candidatos, aprovados para a penúltima etapa de um processo seletivo,</p><p>foram submetidos a um teste de conhecimentos gerais com 10 itens do tipo “verdadeiro/falso”. Os dois</p><p>primeiros candidatos acertaram 8 itens cada, o terceiro acertou 9, o quarto acertou 7, e os dois últimos, 5</p><p>cada. Pelas regras do concurso, passariam, para a etapa final da seleção, os candidatos cujo número de</p><p>acertos fosse maior ou igual à mediana do número de acertos dos seis participantes.</p><p>Quantos candidatos passaram para a etapa final?</p><p>a) 2</p><p>b) 3</p><p>c) 4</p><p>d) 5</p><p>89</p><p>142</p><p>==8b9==</p><p>e) 6</p><p>Comentários:</p><p>Primeiro vamos encontrar o valor da mediana das notas obtidas pelos candidatos. Para isso, temos que</p><p>ordenar os valores das notas:</p><p>5, 5, 7, 8⏟</p><p>𝑡𝑒𝑟𝑚𝑜𝑠 𝑐𝑒𝑛𝑡𝑟𝑎𝑖𝑠</p><p>, 8, 9</p><p>Como o número de termos é par, a mediana será dada pela média dos dois termos centrais:</p><p>𝑀𝑑 =</p><p>7 + 8</p><p>2</p><p>=</p><p>15</p><p>2</p><p>= 7,5</p><p>Logo, vão para a etapa final os candidatos com notas maiores ou iguais a 7,5.</p><p>Dessa forma, passaram apenas 3 candidatos: os dois primeiros com nota 8, e o terceiro com nota 9.</p><p>Gabarito: B.</p><p>4. (CESGRANRIO/BB/2018) A Tabela a seguir mostra a distribuição de pontos obtidos por um cliente em</p><p>um programa de fidelidade oferecido por uma empresa.</p><p>Pontos 0 2 3 4 6 8 9</p><p>Frequência 1 2 4 1 1 5 1</p><p>A mediana da pontuação desse cliente é o valor mínimo para que ele pertença à classe de clientes</p><p>“especiais”. Qual a redução máxima que o valor da maior pontuação desse cliente pode sofrer sem que</p><p>ele perca a classificação de cliente “especial”, se todas as demais pontuações forem mantidas?</p><p>a) cinco unidades</p><p>b) quatro unidades</p><p>c) uma unidade</p><p>d) duas unidades</p><p>e) três unidades</p><p>Comentários:</p><p>A mediana é o valor que separa a metade superior da metade inferior de uma amostra ou conjunto de</p><p>valores. Quando o conjunto apresenta um número ímpar de elementos, a mediana é representada pelo</p><p>termo central. Quando o conjunto possui um número par de elementos, a mediana é definida como a média</p><p>aritmética dos termos centrais.</p><p>90</p><p>142</p><p>A distribuição de pontos obtidos por um cliente em um programa de fidelidade pode ser representada da</p><p>seguinte maneira:</p><p>{0, 2, 2, 3, 3, 3, 3, 4, 6, 8, 8, 8, 8, 8, 9}</p><p>Como a mediana é o termo central, a mediana do conjunto de pontos é igual a 4. Ou seja, para que um cliente</p><p>pertença à classe de clientes especiais, esse cliente deve obter no mínimo 4 pontos.</p><p>A questão quer saber qual a redução máxima que o valor da maior pontuação (9) pode sofrer sem que ele</p><p>perca a classificação de cliente especial. Se esse valor sofrer uma redução de 1 unidade, ficaremos com o</p><p>seguinte conjunto:</p><p>{0, 2, 2, 3, 3, 3, 3, 4, 6, 8, 8, 8, 8, 8, 8}</p><p>Se a redução for de 2 unidades, ficaremos com o seguinte conjunto:</p><p>{0, 2, 2, 3, 3, 3, 3, 4, 6, 7, 8, 8, 8, 8, 8}</p><p>Se a redução for de 3 unidades, ficaremos com o seguinte conjunto:</p><p>{0, 2, 2, 3, 3, 3, 3, 4, 6, 6, 8, 8, 8, 8, 8}</p><p>Se a redução for de 4 unidades, ficaremos com o seguinte conjunto:</p><p>{0, 2, 2, 3, 3, 3, 3, 4, 5, 6, 8, 8, 8, 8, 8}</p><p>Se a redução for de 5 unidades, ficaremos com o seguinte conjunto:</p><p>{0, 2, 2, 3, 3, 3, 3, 4, 4, 6, 8, 8, 8, 8, 8}</p><p>Se a redução for de 6 unidades, ficaremos com o seguinte conjunto:</p><p>{0, 2, 2, 3, 3, 3, 3, 3, 4, 6, 8, 8, 8, 8, 8}</p><p>Logo, a maior redução que o cliente poderá sofrer é de 5 unidades.</p><p>Gabarito: A.</p><p>5. (CESGRANRIO/PETROBRAS/2018) Para não comprometer o sigilo das informações, um periódico</p><p>técnico-científico divulgou os dados básicos que utilizou em um modelo estatístico, na seguinte</p><p>distribuição de frequência por classes:</p><p>Faixas de X Frequência Relativa</p><p>-3 Ⱶ -1 0,25</p><p>-1 Ⱶ 1 0,40</p><p>1 Ⱶ 3 0,25</p><p>3 Ⱶ 5 0,10</p><p>A melhor estimativa para a mediana da distribuição de X é:</p><p>91</p><p>142</p><p>a) - 0,75</p><p>b) 0</p><p>c) 0,25</p><p>d) 0,50</p><p>e) 1</p><p>Comentários:</p><p>Podemos estimar a mediana de uma distribuição de dados agrupados usando a fórmula:</p><p>𝑀𝑑 = 𝑙𝑖𝑛𝑓 + (</p><p>(</p><p>∑ 𝐹𝑖</p><p>𝑛</p><p>𝑖=1</p><p>2</p><p>) − 𝐹𝑎𝑐𝑎𝑛𝑡</p><p>𝐹𝑖</p><p>) × ℎ</p><p>em que 𝑙𝑖𝑛𝑓 é o limite inferior da classe mediana,</p><p>∑ 𝐹𝑖</p><p>𝑛</p><p>𝑖=1</p><p>2</p><p>corresponde à posição na qual a mediana está</p><p>localizada, 𝐹𝑎𝑐𝑎𝑛𝑡 é a frequência relativa acumulada da classe anterior a que contém a mediana, 𝐹𝑖 é a</p><p>frequência relativa da classe que contém a mediana e ℎ é a amplitude do intervalo no qual a mediana está</p><p>contida.</p><p>Sendo assim, reescrever a tabela apresentada no enunciado, acrescentando uma coluna para as frequências</p><p>acumuladas:</p><p>Faixas de X Freq. Relativa Freq. Acumulada</p><p>-3 Ⱶ -1 0,25 0,25</p><p>-1 Ⱶ 1 0,40 0,65 (≥ 0,50)</p><p>1 Ⱶ 3 0,25 0,90</p><p>3 Ⱶ 5 0,10 1,00</p><p>Agora, podemos aplicar a fórmula anterior:</p><p>𝑀𝑑 = 𝑙𝑖𝑛𝑓 + (</p><p>(</p><p>∑ 𝐹𝑖</p><p>𝑛</p><p>𝑖=1</p><p>2</p><p>) − 𝐹𝑎𝑐𝑎𝑛𝑡</p><p>𝐹𝑖</p><p>) × ℎ</p><p>𝑀𝑑 = −1 + (</p><p>0,50 − 0,25</p><p>0,40</p><p>) × 2</p><p>𝑀𝑑 = −1 + (</p><p>0,25</p><p>0,40</p><p>) × 2</p><p>𝑀𝑑 = −1 + (</p><p>5</p><p>8</p><p>) × 2</p><p>𝑀𝑑 = −1 +</p><p>5</p><p>4</p><p>=</p><p>1</p><p>4</p><p>= 0,25</p><p>Sendo assim, a mediana dessa distribuição é igual a 0,25.</p><p>Gabarito: C.</p><p>92</p><p>142</p><p>6. (CESGRANRIO/TRANSPETRO/2018) Foi realizado um experimento com uma perfuradora hidráulica com</p><p>o objetivo de conhecer sua capacidade de perfuração em estruturas rochosas. Para isso foi observada a</p><p>profundidade, em polegadas, de perfuração em 10 locais, cujos dados estão apresentados na Tabela a</p><p>seguir.</p><p>Locais Profundidade em polegadas</p><p>1 10,4</p><p>2 10,7</p><p>3 9,4</p><p>4 10,9</p><p>5 10,8</p><p>6 11,0</p><p>7 10,5</p><p>8 10,6</p><p>9 10,9</p><p>10 9,8</p><p>A média e a mediana são, respectivamente:</p><p>a) 10,0 e 10,6</p><p>b) 10,5 e 10,65</p><p>c) 10,5 e 10,6</p><p>d) 10,6 e 10,6</p><p>e) 10,6 e 10,65</p><p>Comentários:</p><p>Para encontrarmos a média, basta somarmos todos os valores de profundidade e dividirmos pela quantidade</p><p>de locais, no caso, 10:</p><p>�̅� =</p><p>10,4 + 10,7 + 9,4 + 10,9 + 10,8 + 11,0 + 10,5 + 10,6 + 10,9 + 9,8</p><p>10</p><p>�̅� =</p><p>105</p><p>10</p><p>= 10,5</p><p>Agora, para a mediana, precisamos organizar os valores e identificar os termos centrais:</p><p>9,4 9,8 10,4 10,5 𝟏𝟎, 𝟔 𝟏𝟎, 𝟕 10,8 10,9 10,9 11,0</p><p>Os termos centrais são 10,6 e 10,7. Logo, a mediana será a média aritmética entre esses dois valores:</p><p>𝑀𝑑 =</p><p>10,6 + 10,7</p><p>2</p><p>= 10,65</p><p>Gabarito: B.</p><p>93</p><p>142</p><p>7. (CESGRANRIO/TRANSPETRO/2018) Os dados divulgados pela Agência Nacional de Telecomunicações</p><p>mostram que o Brasil registrou 236,2 milhões de linhas móveis em operação, em janeiro de 2018. Isso</p><p>representa uma diminuição de 258,7 mil linhas em operação (-0,11%), em relação a dezembro de 2017. As</p><p>Tabelas abaixo apresentam a evolução dos acessos em operação nas modalidades de cobrança pré-paga e</p><p>pós-paga nos últimos 7 meses.</p><p>Acessos em Operação por Forma de Cobrança em milhões</p><p>Cobrança</p><p>Julho</p><p>(2017)</p><p>Agosto</p><p>(2017)</p><p>Setembro</p><p>(2017)</p><p>Outubro</p><p>(2017)</p><p>Novembro</p><p>(2017)</p><p>Dezembro</p><p>(2017)</p><p>Janeiro</p><p>(2018)</p><p>Pré-paga</p><p>Pós-paga</p><p>159,2</p><p>82,8</p><p>158,5</p><p>83,6</p><p>156,3</p><p>84,7</p><p>155,0</p><p>85,8</p><p>152,0</p><p>87,0</p><p>148,5</p><p>87,9</p><p>147,4</p><p>88,8</p><p>Total 242,0 242,1 241,0 240,8 239,0 236,4 236,2</p><p>Taxa de variação mensal (aproximada.)</p><p>Cobrança</p><p>Agosto</p><p>(2017)</p><p>Setembro</p><p>(2017)</p><p>Outubro</p><p>(2017)</p><p>Novembro</p><p>(2017)</p><p>Dezembro</p><p>(2017)</p><p>Janeiro</p><p>(2018)</p><p>Pré-paga</p><p>Pós-paga</p><p>-0,44%</p><p>0,97%</p><p>-1,39%</p><p>1,32%</p><p>-0,83%</p><p>1,30%</p><p>-1,94%</p><p>1,40%</p><p>-2,30%</p><p>1,03%</p><p>-0,74%</p><p>1,02%</p><p>Analisando as Tabelas e considerando os 7 meses, conclui-se que</p><p>a) a mediana do número de linhas na cobrança pré-paga é 155,0 milhões.</p><p>b) a média e a mediana do número de linhas na cobrança pós-paga são, respectivamente, 85,8 milhões e</p><p>87,0 milhões.</p><p>c) a redução ocorrida foi de 2,3% no número de linhas, em janeiro de 2018, em comparação a dezembro de</p><p>2017 na cobrança pré-paga.</p><p>d) o aumento ocorrido foi de 30% no número de linhas pós-pagas, no mês de outubro de 2017, em</p><p>comparação a setembro de 2017.</p><p>e) ao longo dos 7 meses, há um aumento no número de linhas pré-paga</p><p>e pós-paga.</p><p>Comentários:</p><p>Analisando cada alternativa, temos:</p><p>a) a mediana do número de linhas na cobrança pré-paga é 155,0 milhões.</p><p>Correta. Os dados já estão ordenados em ordem descendente. Podemos perceber que 155 ocupa a posição</p><p>central do número de linhas na cobrança pré-paga, sendo, portanto, o valor que representa a nossa mediana.</p><p>b) a média e a mediana do número de linhas na cobrança pós-paga são, respectivamente, 85,8 milhões e</p><p>87,0 milhões.</p><p>Incorreta. Os dados também já estão ordenados, dessa vez em ordem ascendente. Podemos perceber que</p><p>85,8 ocupa a posição central do número de linhas na cobrança pós-paga, sendo, portanto, o valor que</p><p>representa a nossa mediana.</p><p>Para calcular a média, basta somarmos todos os valores e dividirmos por sete:</p><p>94</p><p>142</p><p>𝑥 =</p><p>82,8 + 83,6 + 84,7 + 85,8 + 87,0 + 87,9 + 88,8</p><p>7</p><p>𝑥 =</p><p>600,6</p><p>7</p><p>= 85,8</p><p>Portanto, a média também é igual a 85,8 milhões.</p><p>c) a redução ocorrida foi de 2,3% no número de linhas, em janeiro de 2018, em comparação a dezembro de</p><p>2017 na cobrança pré-paga.</p><p>Incorreta. A redução ocorrida foi de 2,3% no número de linhas, em dezembro de 2017, em comparação a</p><p>novembro de 2017 na cobrança pré-paga.</p><p>d) o aumento ocorrido foi de 30% no número de linhas pós-pagas, no mês de outubro de 2017, em</p><p>comparação a setembro de 2017.</p><p>Incorreta. O aumento ocorrido foi de 1,30% no número de linhas pós-pagas, no mês de outubro de 2017, em</p><p>comparação a setembro de 2017.</p><p>e) ao longo dos 7 meses, há um aumento no número de linhas pré-paga e pós-paga.</p><p>Incorreta. Ao longo dos 7 meses, há um aumento no número de linhas pós-paga, e redução no número de</p><p>linhas pré-paga.</p><p>Gabarito: A.</p><p>95</p><p>142</p><p>QUESTÕES COMENTADAS – CESGRANRIO</p><p>Box Plot</p><p>1. (CESGRANRIO/PETROBRAS/2018) Você dispõe de um montante para investir em ações e precisa decidir</p><p>em que empresa(s) vai alocar esse montante. Três empresas lhe parecem interessantes, e você resolve</p><p>consultar o desempenho delas nos últimos sessenta meses para minimizar possíveis riscos da sazonalidade</p><p>no movimento da Bolsa de Valores. Os dados revelaram a seguinte distribuição, em %, das rentabilidades</p><p>mensais das ações:</p><p>Medidas Estatísticas Empresa A Empresa B Empresa C</p><p>Rentabilidade Média Mensal 0,50 0,60 0,40</p><p>Desvio Padrão 1,00 1,20 0,80</p><p>Rentabilidade Mínima -1,80 -2,20 -1,20</p><p>Rentabilidade Máxima 2,20 2,30 1,80</p><p>1º Quartil -0,20 -0,30 -0,10</p><p>3º Quartil 0,80 0,90 0,0</p><p>A alocação dos recursos vai ser feita de acordo com a atitude conservadora de não investir em empresa</p><p>com rentabilidade considerada outlier, entendendo como tal aquela que apresentar valor além de 1,5</p><p>desvio quartílico abaixo ou acima dos quartis 1 e 3.</p><p>Com base nesse critério, a escolha do investimento deve recair sobre a(s)</p><p>a) empresa A, apenas</p><p>b) empresa B, apenas</p><p>c) empresa C, apenas</p><p>d) empresas A e C, apenas</p><p>e) três empresas</p><p>Comentários:</p><p>Um outlier (valor discrepante) é uma observação que apresenta um grande afastamento dos demais valores</p><p>da série. Para verificar a existência de outliers, precisamos determinar os limites inferior e superior para</p><p>detecção de outliers. As observações fora destes limites são consideradas valores discrepantes. Os limites</p><p>são calculados da seguinte forma:</p><p>𝐿𝑖𝑚𝑖𝑛𝑓= 𝑚á𝑥{𝑚í𝑛(𝑜𝑏𝑠𝑒𝑟𝑣𝑎çõ𝑒𝑠); 𝑄1 − 1,5(𝑄3 − 𝑄1)}.</p><p>𝐿𝑖𝑚𝑠𝑢𝑝= 𝑚í𝑛{𝑚á𝑥(𝑜𝑏𝑠𝑒𝑟𝑣𝑎çõ𝑒𝑠); 𝑄3 + 1,5(𝑄3 − 𝑄1)},</p><p>em que 𝑄1 e 𝑄3 representam, respectivamente, o 1° e 3°quartil.</p><p>96</p><p>142</p><p>Assim, para a empresa A, temos:</p><p>𝐷𝐼𝑄 = 𝑄3 − 𝑄1 = 0,8 − (−0,20) = 1,00</p><p>𝐿𝑖𝑛𝑓 = 𝑄1 − 1,5 × 𝐷𝐼𝑄 = −0,2 − 1,5 × 1,0 = −1,7</p><p>𝐿𝑠𝑢𝑝 = 𝑄3 + 1,5 × 𝐷𝐼𝑄 = 0,8 + 1,5 × 1,0 = 2,3</p><p>Como a rentabilidade mínima da empresa A é menor que o limite inferior para detecção de outliers, -1,8 < -</p><p>1,7, pode ser considerada outlier.</p><p>Para a empresa B, temos:</p><p>𝐷𝐼𝑄 = 𝑄3 − 𝑄1 = 0,9 − (−0,30) = 1,20</p><p>𝐿𝑖𝑛𝑓 = 𝑄1 − 1,5 × 𝐷𝐼𝑄 = −0,3 − 1,5 × 1,2 = −1,5</p><p>𝐿𝑠𝑢𝑝 = 𝑄3 + 1,5 × 𝐷𝐼𝑄 = 0,9 + 1,5 × 1,2 = 2,7</p><p>Como a rentabilidade máxima da empresa B é maior que o limite superior para detecção de outliers, 2,7 <</p><p>2,3, pode ser considerada outlier.</p><p>Para a empresa C, temos:</p><p>𝐷𝐼𝑄 = 𝑄3 − 𝑄1 = 0,7 − (−0,10) = 0,80</p><p>𝐿𝑖𝑛𝑓 = 𝑄1 − 1,5 × 𝐷𝐼𝑄 = −0,1 − 1,5 × 0,8 = −1,3</p><p>𝐿𝑠𝑢𝑝 = 𝑄3 + 1,5 × 𝐷𝐼𝑄 = 0,7 + 1,5 × 0,8 = 1,9</p><p>Nesse caso, tanto a rentabilidade mínima quanto a máxima são inferiores aos limites para detecção de</p><p>outliers. Logo, essa será nossa escolha de investimento.</p><p>Gabarito: C.</p><p>2. (CESGRANRIO/BB/2018) Define-se como desvio interquartílico a distância entre o 1º e o 3º Quartis. É</p><p>usado para avaliar a existência de possíveis valores atípicos em um conjunto de dados. Valores aquém ou</p><p>além de limites estabelecidos com base nessa medida devem ser investigados quanto à sua tipicidade em</p><p>relação à distribuição. Geralmente o limite inferior é estabelecido como 1 vez e meia o valor desse desvio,</p><p>abaixo do primeiro Quartil, enquanto o limite superior, como 1 vez e meia acima do terceiro Quartil.</p><p>Considere os resumos estatísticos das três distribuições de consumo de energia elétrica, em kW, dos 50</p><p>apartamentos com mesma planta, de um edifício, em três períodos diferentes ao longo de um ano,</p><p>conforme abaixo:</p><p>Períodos</p><p>Consumo de</p><p>Energia (kW)</p><p>Janeiro - Abril Maio - Agosto</p><p>Setembro -</p><p>Dezembro</p><p>Média 87 70 80</p><p>Mediana 85 75 80</p><p>97</p><p>142</p><p>==8b9==</p><p>Moda 83 77 80</p><p>1º Quartil 80 68 75</p><p>3º Quartil 90 80 85</p><p>Menor Valor 75 49 62</p><p>Maior Valor 102 92 99</p><p>Número de</p><p>Apartamentos</p><p>50 50 50</p><p>Conclui-se, a partir desses resumos, que</p><p>a) um período apresenta pelo menos um apartamento com consumo abaixo, e dois períodos apresentam</p><p>pelo menos um apartamento com consumo acima da tipicidade estabelecida.</p><p>b) um período apresenta pelo menos um apartamento com consumo abaixo, e um período apresenta pelo</p><p>menos um apartamento com consumo acima da tipicidade estabelecida.</p><p>c) em nenhum período foram observados possíveis consumos atípicos.</p><p>d) apenas um período apresenta pelo menos um apartamento com consumo abaixo da tipicidade</p><p>estabelecida.</p><p>e) apenas um período apresenta pelo menos um apartamento com consumo acima da tipicidade</p><p>estabelecida.</p><p>Comentários:</p><p>Um outlier (valor discrepante) é uma observação que apresenta um grande afastamento dos demais valores</p><p>da série. Para verificar a existência de outliers, precisamos determinar os limites inferior e superior para</p><p>detecção de outliers. As observações fora destes limites são consideradas valores discrepantes. Os limites</p><p>são calculados da seguinte forma:</p><p>Agora, vamos calcular os limites para o período de Janeiro a Abril:</p><p>𝐿𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟: 80 − 1,5(90 − 80) = 65.</p><p>𝐿𝑖𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟: 90 + 1,5(90 − 80) = 105</p><p>Tanto o menor valor quanto o maior valor (representados por 75 e 102) pertencem aos limites estabelecidos.</p><p>Logo, são valores típicos.</p><p>Para o período de Maio a Agosto:</p><p>𝐿𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟: 68 − 1,5(80 − 68) = 50.</p><p>𝐿𝑖𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟: 80 + 1,5(80 − 68) = 98.</p><p>O menor valor (49) é atípico pois está fora do intervalo, enquanto o maior valor (92) pertence ao</p><p>limite estabelecido.</p><p>98</p><p>142</p><p>Para o período de Setembro a Dezembro:</p><p>𝐿𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟: 75 − 1,5(85 − 75) = 60.</p><p>𝐿𝑖𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟: 85 + 1,5(85 − 75) = 100.</p><p>Tanto o menor valor quanto o maior valor (representados por 62 e 99) pertencem aos limites estabelecidos.</p><p>Logo, são valores típicos.</p><p>Portanto, apenas um período apresenta pelo menos um apartamento com consumo abaixo da tipicidade</p><p>estabelecida.</p><p>Gabarito: D.</p><p>99</p><p>142</p><p>AVISO IMPORTANTE!</p><p>Olá, alunos (as)!</p><p>Informamos que não temos mais questões da banca, referente ao assunto tratado na aula de hoje, em</p><p>virtude de baixa cobrança deste tópico ao longo dos anos. No entanto, para complementar o estudo e deixar</p><p>sua preparação em alto nível, preparamos um caderno de questões inéditas que servirá como treino e</p><p>aprimoramento</p><p>do conteúdo.</p><p>Em caso de dúvidas, não deixe de nos chamar no Fórum de dúvidas!</p><p>Bons estudos!</p><p>Estratégia Concursos</p><p>100</p><p>142</p><p>==8b9==</p><p>QUESTÕES COMENTADAS – INÉDITAS</p><p>Quartil, Decil e Percentil</p><p>1. (INÉDITA/2022) Em uma empresa, os salários de 100 funcionários estão distribuídos de</p><p>acordo com a tabela de frequências abaixo:</p><p>Salários em</p><p>mil R$ (x)</p><p>Nº de funcionários</p><p>2 ⊢ 4 30</p><p>4 ⊢ 6 10</p><p>6 ⊢ 8 20</p><p>8 ⊢ 10 30</p><p>10 ⊢ 12 10</p><p>Total 100</p><p>Com base nas medidas de separatrizes a amplitude interquartil dos salários dos funcionários é:</p><p>a) 5,666</p><p>b) 3,666</p><p>c) 9</p><p>d) 5,334</p><p>e) 4,336</p><p>Comentários:</p><p>Vamos iniciar o cálculo reescrevendo a tabela de frequências e acrescentando uma coluna para</p><p>frequências acumuladas:</p><p>Classes (x) Frequências Freq. acumulada</p><p>2 ⊢ 4 30 30</p><p>4 ⊢ 6 10 40</p><p>101</p><p>142</p><p>6 ⊢ 8 20 60</p><p>8 ⊢ 10 30 90</p><p>10 ⊢ 12 10 100</p><p>Total 100</p><p>Calculando a posição do primeiro quartil, temos:</p><p>𝑃𝑄𝑘</p><p>=</p><p>𝑘 × ∑ 𝑓𝑖</p><p>4</p><p>𝑃𝑄1</p><p>=</p><p>1 × 100</p><p>4</p><p>= 25</p><p>Logo, o primeiro quartil está na posição 25, o que corresponde a 1ª classe 2 ⊢ 4.</p><p>Agora, podemos aplicar a fórmula:</p><p>𝑄𝑘 = 𝑙𝑖𝑛𝑓𝑄𝑘</p><p>+ [</p><p>𝑘 × ∑ 𝑓𝑖</p><p>4 − 𝑓𝑎𝑐𝑎𝑛𝑡</p><p>𝑓𝑄𝑘</p><p>] × ℎ𝑄𝑘</p><p>em que:</p><p>𝑙𝑖𝑛𝑓𝑄𝑘</p><p>→ Limite inferior à classe quartílica</p><p>𝑓𝑎𝑐𝑎𝑛𝑡 → frequência acumulada da classe anterior à classe quartílica</p><p>ℎ𝑄𝑘</p><p>→ amplitude da classe</p><p>𝑓𝑄𝑘</p><p>→ frequência da classe</p><p>𝑄1 = 2 + [</p><p>25 − 0</p><p>30</p><p>] × 2</p><p>𝑄1 = 2 + 0,833 × 2</p><p>𝑄1 = 2 + 1,666</p><p>𝑄1 = 3,666</p><p>Calculando a posição do terceiro quartil:</p><p>𝑃𝑄𝑘</p><p>=</p><p>𝑘 × ∑ 𝑓𝑖</p><p>4</p><p>𝑃𝑄3</p><p>=</p><p>3 × 100</p><p>4</p><p>= 75</p><p>102</p><p>142</p><p>Logo, o terceiro quartil está na posição 75, o que corresponde a 4 ª classe 8 ⊢ 10.</p><p>Calculando o terceiro quartil:</p><p>𝑄𝑘 = 𝑙𝑖𝑛𝑓𝑄𝑘</p><p>+ [</p><p>𝑘 × ∑ 𝑓𝑖</p><p>4 − 𝑓𝑎𝑐𝑎𝑛𝑡</p><p>𝑓𝑄𝑘</p><p>] × ℎ𝑄𝑘</p><p>𝑄3 = 8 + [</p><p>75 − 60</p><p>30</p><p>] × 2</p><p>𝑄3 = 8 + 0,5 × 2</p><p>𝑄3 = 8 + 1</p><p>𝑄3 = 9</p><p>Agora, podemos calcular a amplitude do intervalo que é dada pela diferença entre o terceiro quartil e o</p><p>primeiro quartil:</p><p>𝐴 = 9 − 3,666 = 5,334</p><p>Gabarito: D.</p><p>2. (INÉDITA/2022) As distâncias percorridas em quilômetros por 7 carros em uma corrida</p><p>automobilística foram:</p><p>12,20,18,14,22,15,19</p><p>A mediana dessas distâncias é igual:</p><p>a) 19</p><p>b) 20</p><p>c) 15</p><p>d) 22</p><p>e) 18</p><p>Comentários:</p><p>A mediana é o termo central da amostra, que divide uma série ordenada de dados em duas partes iguais,</p><p>separando os valores inferiores à mediana dos valores superiores à mediana. Assim, ordenando os</p><p>dados, temos:</p><p>12,20,18,14,22,15,19</p><p>Portanto, a mediana é:</p><p>12,14,15, 18⏟</p><p>𝑚𝑒𝑑𝑖𝑎𝑛𝑎</p><p>, 19,20,22</p><p>Gabarito: E.</p><p>103</p><p>142</p><p>3. (INÉDITA/2022) O histograma abaixo apresenta uma distribuição de uma variável x por meio</p><p>de frequências absolutas.</p><p>Considerando as informações do histograma, o sexto decil dessa distribuição é:</p><p>a) 47,33</p><p>b) 38, 77</p><p>c) 50</p><p>d) 53,8</p><p>e) 39,25</p><p>Comentários:</p><p>Primeiramente, vamos reescrever os dados do histograma em uma tabela e acrescentarmos as</p><p>frequências acumuladas:</p><p>Classes (x) Frequências Freq. acumulada</p><p>10 ⊢ 20 50 50</p><p>20 ⊢ 30 300 350</p><p>30 ⊢ 40 200 550</p><p>40 ⊢ 50 150 700</p><p>50 ⊢ 60 400 1100</p><p>Total 1100</p><p>104</p><p>142</p><p>Para calcular o decil de dados agrupados em classe, primeiro precisamos calcular a posição do decil.</p><p>Faremos isso por meio da seguinte fórmula:</p><p>𝑃𝐷𝑘</p><p>=</p><p>𝑘 × ∑ 𝑓𝑖</p><p>10</p><p>Queremos encontrar a posição do 6º decil:</p><p>𝑃𝐷6</p><p>=</p><p>6 × 1100</p><p>10</p><p>= 660</p><p>Logo, o sexto decil está na posição 660.</p><p>Observando as frequências acumuladas na tabela, descobrimos que ele pertence à quarta classe, de 40</p><p>a 50.</p><p>Agora, podemos aplicar a fórmula para o cálculo do decil:</p><p>𝐷𝑘 = 𝑙𝑖𝑛𝑓𝐷𝑘</p><p>+ [</p><p>𝑘 × ∑ 𝑓𝑖</p><p>10 − 𝑓𝑎𝑐𝑎𝑛𝑡</p><p>𝑓𝐷𝑘</p><p>] × ℎ𝐷𝑘</p><p>em que:</p><p>𝑙𝑖𝑛𝑓𝐷𝑘</p><p>→ limite inferior à classe do decil;</p><p>𝑓𝑎𝑐𝑎𝑛𝑡 → frequência acumulada da classe anterior ao decil;</p><p>ℎ𝐷𝑘</p><p>→ amplitude da classe;</p><p>𝑓𝐷𝑘</p><p>→ frequência da classe.</p><p>Perceba que já calculamos a posição do decil, então, basta substituirmos em</p><p>𝑘×∑ 𝑓𝑖</p><p>10</p><p>:</p><p>𝐷6 = 40 + [</p><p>660 − 550</p><p>150</p><p>] × 10</p><p>𝐷6 = 40 + [</p><p>110</p><p>150</p><p>] × 10</p><p>𝐷6 = 40 + 0,733 × 10</p><p>𝐷6 = 40 + 7,33</p><p>𝐷6 = 47,33</p><p>Portanto, o sexto decil da distribuição é 47,33.</p><p>Gabarito: A.</p><p>4. (INÉDITA/2022) Considere o seguinte conjunto: 2,5,y,9,15 Sabe-se que y é menor que 9,e que</p><p>y não é a mediana. A diferença entre a média e a mediana é igual a 2. O valor de y é:</p><p>a) 3</p><p>b) 4</p><p>105</p><p>142</p><p>c) 9</p><p>d) 8</p><p>e) 6</p><p>Comentários:</p><p>Sabemos que a mediana é o termo central da amostra. A questão nos diz que y é menor que 9, porém, y</p><p>não é a mediana. Consequentemente, y será menor que 5.</p><p>Ordenando os dados do conjunto temos que a mediana será:</p><p>2, y, 5</p><p>𝑚𝑒𝑑𝑖𝑎𝑛𝑎</p><p>, 9,15</p><p>Agora, vamos calcular a média do conjunto:</p><p>�̅� =</p><p>2 + 𝑦 + 5 + 9 + 15</p><p>5</p><p>�̅� =</p><p>31 + 𝑦</p><p>5</p><p>A questão diz que a diferença entre a média e a mediana é igual a 2, assim:</p><p>�̅� − 𝑀𝑑 = 2</p><p>31 + 𝑦</p><p>5</p><p>− 5 = 2</p><p>31 + 𝑦</p><p>5</p><p>= 2 + 5</p><p>31 + 𝑦</p><p>5</p><p>= 7</p><p>31 + 𝑦 = 35</p><p>𝑦 = 35 − 31</p><p>𝑦 = 4</p><p>Gabarito: B.</p><p>5. (INÉDITA/2022) Em um supermercado os preços de alguns produtos foram agrupados em</p><p>classes a fim de se determinar a frequência de saída dos produtos de acordo com o valor. Assim</p><p>a distribuição de frequências absolutas foi dada conforme a tabela a seguir:</p><p>Classes de preços Frequência de saída</p><p>3 ⊢ 6 7</p><p>6 ⊢ 9 8</p><p>106</p><p>142</p><p>9 ⊢ 12 10</p><p>12 ⊢ 15 4</p><p>15 ⊢ 18 11</p><p>O percentil 43 da amostra é:</p><p>a) 8,25</p><p>b) 10,5</p><p>c) 6,99</p><p>d) 8,7</p><p>e) 9,66</p><p>Comentários:</p><p>Para calcularmos o percentil, dividimos a amostra em cem partes iguais. Assim, precisamos determinar</p><p>a posição do percentil que queremos encontrar.</p><p>Para isso, identificamos a posição do percentil na coluna de frequências acumuladas, isto é, a frequência</p><p>acumulada imediatamente igual ou superior à posição do percentil.</p><p>Reescrevendo a tabela com as informações de frequências acumuladas, temos:</p><p>Classes Frequência</p><p>freq.</p><p>acumulada</p><p>3 ⊢ 6 7 7</p><p>6 ⊢ 9 8 15</p><p>9 ⊢ 12 10 25</p><p>12 ⊢ 15 4 29</p><p>15 ⊢ 18 11 40</p><p>Assim, temos que:</p><p>𝑃𝑃𝑘</p><p>=</p><p>𝐾 × ∑ 𝑓𝑖</p><p>100</p><p>= 𝑃𝑃43</p><p>=</p><p>43 × 40</p><p>100</p><p>= 17,2</p><p>Logo, a posição do 43º percentil está na frequência acumulada 17,2. Portanto, o 43º percentil está</p><p>contido na terceira classe.</p><p>O percentil é calculado por meio da fórmula apresentada a seguir:</p><p>107</p><p>142</p><p>==8b9==</p><p>𝑃43 = 𝑙𝑖𝑛𝑓𝑃43</p><p>+ [</p><p>43 × ∑ 𝑓𝑖</p><p>100 − 𝑓𝑎𝑐𝑎𝑛𝑡</p><p>𝑓𝑃43</p><p>] × ℎ𝑃43</p><p>𝑃43 = 9 + [</p><p>43 × 40</p><p>100 − 15</p><p>10</p><p>] × 3</p><p>𝑃43 = 9 + [</p><p>17,2 − 15</p><p>10</p><p>] × 3</p><p>𝑃43 = 9 + 0,22 × 3</p><p>𝑃43 = 9,66</p><p>Gabarito: E.</p><p>6. (INÉDITA/2022) O gráfico a seguir demonstra o número de acidentes registrados em uma</p><p>rodovia durante 7 dias. Utilize as informações para responder à questão.</p><p>Considere que o primeiro dia da semana é domingo e o sétimo dia da semana é sábado. O</p><p>primeiro quartil é observado no dia:</p><p>a) segunda</p><p>b) sábado</p><p>c) domingo</p><p>d) sexta</p><p>e) terça</p><p>Comentários:</p><p>Para resolvermos a questão, vamos criar uma tabela de frequências para melhor visualizarmos a</p><p>resolução:</p><p>0</p><p>2</p><p>4</p><p>6</p><p>8</p><p>10</p><p>1 2 3 4 5 6 7N</p><p>º</p><p>d</p><p>e</p><p>ac</p><p>id</p><p>en</p><p>te</p><p>s</p><p>Dia da semana</p><p>108</p><p>142</p><p>Dias da</p><p>semana</p><p>(x)</p><p>Frequência</p><p>Freq.</p><p>acumulada</p><p>1 8 8</p><p>2 4 12</p><p>3 2 14</p><p>4 2 16</p><p>5 6 22</p><p>6 8 30</p><p>7 10 40</p><p>Total 40</p><p>Sabemos que os quartis dividem a amostra em quatro partes e que o primeiro quartil corresponde a</p><p>25% da amostra. Portanto, o primeiro quartil está localizado na posição:</p><p>𝑃𝑄𝑘</p><p>=</p><p>𝑘 × 𝑛</p><p>4</p><p>(𝑘 = 1, 2, 3)</p><p>em que 𝑛 é a soma das frequências simples;</p><p>Para o primeiro quartil, temos:</p><p>𝑃𝑄1</p><p>=</p><p>1 × 40</p><p>4</p><p>= 10</p><p>Assim, 25% dos acidentes correspondem a 10 acumulados na semana e são observados no segundo dia</p><p>da semana, de acordo com a tabela de frequências acumuladas. De domingo a segunda feira são</p><p>acumulados 12 acidentes. Portanto, temos que 25% dos acidentes ocorrem até segunda feira.</p><p>Gabarito: A.</p><p>7. (INÉDITA/2022) No histograma abaixo estão apresentadas informações sobre os salários em</p><p>R$ dos 50 funcionários de determinada empresa.</p><p>109</p><p>142</p><p>Considerando as informações do histograma,</p><p>o quarto decil dessa distribuição é:</p><p>a) 5</p><p>b) 4</p><p>c) 3</p><p>d) 4,5</p><p>e) 3,5</p><p>Comentários:</p><p>Reescrevendo os dados do histograma em uma tabela e acrescentando as frequências acumuladas:</p><p>Classes (x) Frequências Freq. acumulada</p><p>2 ⊢ 3 20 20</p><p>3 ⊢ 4 10 30</p><p>4 ⊢ 5 15 45</p><p>5 ⊢ 6 5 50</p><p>Total 50</p><p>Para calcularmos o decil de dados agrupados em classe, primeiro precisamos calcular a posição do decil.</p><p>Podemos calcular o decil por meio da seguinte fórmula:</p><p>𝑃𝐷𝑘</p><p>=</p><p>𝑘 × ∑ 𝑓𝑖</p><p>10</p><p>Queremos encontrar a posição do 4º decil:</p><p>110</p><p>142</p><p>𝑃𝐷4</p><p>=</p><p>4 × 50</p><p>10</p><p>= 20</p><p>Logo, o quarto decil está na posição 20. Observando as frequências acumuladas na tabela, podemos</p><p>perceber que ele pertence à primeira classe, de 2 a 3.</p><p>Agora, podemos aplicar a fórmula para o cálculo do decil:</p><p>𝐷𝑘 = 𝑙𝑖𝑛𝑓𝐷𝑘</p><p>+ [</p><p>𝑘 × ∑ 𝑓𝑖</p><p>10 − 𝑓𝑎𝑐𝑎𝑛𝑡</p><p>𝑓𝐷𝑘</p><p>] × ℎ𝐷𝑘</p><p>em que:</p><p>𝑙𝑖𝑛𝑓𝐷𝑘</p><p>→ Limite inferior à classe do decil;</p><p>𝑓𝑎𝑐𝑎𝑛𝑡 → frequência acumulada da classe anterior ao decil;</p><p>ℎ𝐷𝑘</p><p>→ amplitude da classe;</p><p>𝑓𝐷𝑘</p><p>→ frequência da classe</p><p>Perceba que já calculamos a posição do decil, então basta substituirmos em</p><p>𝑘×∑ 𝑓𝑖</p><p>10</p><p>𝐷4 = 2 + [</p><p>20 − 0</p><p>20</p><p>] × 1</p><p>𝐷4 = 2 + [</p><p>20</p><p>20</p><p>] × 1</p><p>𝐷4 = 2 + 1 × 1</p><p>𝐷4 = 2 + 1</p><p>𝐷4 = 3</p><p>Portanto, o quarto decil da distribuição é 3.</p><p>Gabarito: C.</p><p>8. (INÉDITA/2022) Dado o seguinte conjunto de valores: (5,7,9,13,2,8,24,14,6,15)</p><p>O percentil 80 (𝑷𝟖𝟎) do conjunto é:</p><p>a) 13</p><p>b) 9</p><p>c) 14</p><p>d) 24</p><p>e) 15</p><p>Comentários:</p><p>111</p><p>142</p><p>Primeiro, precisamos ordenar os valores do conjunto:</p><p>(𝟐, 𝟓, 𝟔, 𝟕, 𝟖, 𝟗, 𝟏𝟑, 𝟏𝟒, 𝟏𝟓, 𝟐𝟒)</p><p>Agora, temos que determinar a posição de 𝑷𝟖𝟎. Para isso, vamos usar a fórmula:</p><p>𝑃𝑃𝑘</p><p>=</p><p>𝑘 × 𝑛</p><p>100</p><p>(𝑘 = 1,2, ⋯ ,99)</p><p>𝑃𝑃80</p><p>=</p><p>80 × 10</p><p>100</p><p>= 8</p><p>Verificando o valor que ocupa a posição 8:</p><p>𝒙𝟏 𝒙𝟐 𝒙𝟑 𝒙𝟒 𝒙𝟓 𝒙𝟔 𝒙𝟕 𝒙𝟖 𝒙𝟗 𝒙𝟏𝟎</p><p>2 5 6 7 8 9 13 14 15 24</p><p>Portanto, o valor que corresponde à oitava posição é 14. Portanto, 14 corresponde a 80% do rol.</p><p>Gabarito: C.</p><p>9. (INÉDITA/2022) A média de cinco números 13,8,2,1,y é 5.</p><p>A mediana desse conjunto é:</p><p>a) 8</p><p>b) 2</p><p>c) 5</p><p>d) 13</p><p>e) 1</p><p>Comentários:</p><p>Como a média do conjunto vale 5, podemos utilizar a fórmula da média para determinarmos o valor de</p><p>y:</p><p>�̅� =</p><p>𝑠𝑜𝑚𝑎</p><p>𝑛</p><p>5 =</p><p>13 + 8 + 2 + 1 + 𝑦</p><p>5</p><p>24 + 𝑦 = 25</p><p>𝑦 = 25 − 24</p><p>𝑦 = 1</p><p>Agora, para determinarmos a mediana do conjunto, os dados devem estar ordenados, da seguinte forma:</p><p>112</p><p>142</p><p>1,1, 2⏟</p><p>𝑚𝑒𝑑𝑖𝑎𝑛𝑎</p><p>, 8,13</p><p>Portanto, a mediana vale 2.</p><p>Gabarito: B.</p><p>10. (INÉDITA/2022) Considere o seguinte conjunto de números reais: (3,6,14,26,32,21,5,8).</p><p>O terceiro quartil do conjunto é igual a:</p><p>a) 26</p><p>b) 14</p><p>c) 8</p><p>d) 32</p><p>e) 21</p><p>Comentários:</p><p>Ordenando os valores do conjunto, temos:</p><p>(𝟑, 𝟓, 𝟔, 𝟖, 𝟏𝟒, 𝟐𝟏, 𝟐𝟔, 𝟑𝟐)</p><p>Os quartis dividem uma série ordenada em quatro partes iguais, cada uma contendo 25% dos valores</p><p>da sequência. Para encontrarmos o terceiro quartil, podemos usar a fórmula:</p><p>𝑃𝑄𝑘</p><p>=</p><p>𝑘 × 𝑛</p><p>4</p><p>(𝑘 = 1,2,3)</p><p>em que n é igual ao número de termos.</p><p>𝑃𝑄𝑘</p><p>=</p><p>3 × 8</p><p>4</p><p>=</p><p>24</p><p>4</p><p>= 6</p><p>Assim, a posição do terceiro quartil é 6.</p><p>Agora, basta verificarmos o valor que ocupa a posição 6:</p><p>𝒙𝟏 𝒙𝟐 𝒙𝟑 𝒙𝟒 𝒙𝟓 𝒙𝟔 𝒙𝟕 𝒙𝟖</p><p>3 5 6 8 14 21 26 32</p><p>Portanto, o valor que corresponde à sexta posição é 21, sendo esse o valor que corresponde a 75% do</p><p>rol.</p><p>Gabarito: E.</p><p>113</p><p>142</p><p>QUESTÕES COMENTADAS – INÉDITAS</p><p>Box Plot</p><p>1. (INÉDITA/2022) De uma determinada amostra, foram obtidas as seguintes estatísticas:</p><p>; , para o primeiro quartil e terceiro quartil respectivamente. Acerca dos valores𝑄</p><p>1</p><p>= 23 𝑄</p><p>3</p><p>= 38</p><p>; ; e , podemos afirmar que:𝑋</p><p>1</p><p>= 7 𝑋</p><p>2</p><p>= 12 𝑋</p><p>3</p><p>= 52</p><p>a) X1 e X3 são outliers.</p><p>b) Nenhum pode ser considerado outlier.</p><p>c) Apenas X1 é outlier.</p><p>d) Apenas X2 é outlier.</p><p>e) Todos são outliers.</p><p>Comentários:</p><p>Para resolvermos a questão, precisamos calcular os limites inferior e superior para detecção de</p><p>outliers. Assim:</p><p>𝑙</p><p>𝑖𝑛𝑓</p><p>= 𝑄</p><p>1</p><p>− 1, 5× 𝑄</p><p>3</p><p>− 𝑄</p><p>1( )</p><p>𝑙</p><p>𝑖𝑛𝑓</p><p>= 23 − 1, 5× 38 − 23( )</p><p>𝑙</p><p>𝑖𝑛𝑓</p><p>= 23 − 22, 5 = 0, 5</p><p>𝑙</p><p>𝑠𝑢𝑝</p><p>= 𝑄</p><p>3</p><p>+ 1, 5× 𝑄</p><p>3</p><p>− 𝑄</p><p>1( )</p><p>𝑙</p><p>𝑠𝑢𝑝</p><p>= 38 + 1, 5× 38 − 23( )</p><p>𝑙</p><p>𝑠𝑢𝑝</p><p>= 38 + 22, 5 = 60, 5</p><p>Assim, tudo o que estiver entre 0,5 e 60,5 é considerado normal na amostra e tudo o que estiver</p><p>abaixo de 0,5 e acima de 60,5 é considerado outlier.</p><p>Portanto os valores de X1, X2 e X3 são normais.</p><p>Gabarito: B.</p><p>2. (INÉDITA/2022) Seja uma amostra para a qual foram calculadas as seguintes estatísticas:</p><p>Q1=25 e Q3=38. Sobre os seguintes valores: X1=18; X2=3 e X3=59, podemos afirmar que:</p><p>114</p><p>142</p><p>a) Nenhum dos valores é outlier.</p><p>b) Os valores de X1 e X3 são outliers.</p><p>c) Apenas X2 é outlier.</p><p>d) Os valores de X2 e X3 são outliers.</p><p>e) Apenas X3 é outlier.</p><p>Comentários:</p><p>Para resolvermos a questão, precisamos calcular os limites inferior e superior para detecção de</p><p>outliers. Assim:</p><p>𝑙</p><p>𝑖𝑛𝑓</p><p>= 𝑄</p><p>1</p><p>− 1, 5× 𝑄</p><p>3</p><p>− 𝑄</p><p>1( )</p><p>𝑙</p><p>𝑖𝑛𝑓</p><p>= 25 − 1, 5× 38 − 25( )</p><p>𝑙</p><p>𝑖𝑛𝑓</p><p>= 25 − 19, 5 = 5, 5</p><p>𝑙</p><p>𝑠𝑢𝑝</p><p>= 𝑄</p><p>3</p><p>+ 1, 5× 𝑄</p><p>3</p><p>− 𝑄</p><p>1( )</p><p>𝑙</p><p>𝑠𝑢𝑝</p><p>= 38 + 1, 5× 38 − 25( )</p><p>𝑙</p><p>𝑠𝑢𝑝</p><p>= 38 + 19, 5 = 57, 5</p><p>Assim, tudo o que estiver entre 5,5 e 57,5 é considerado normal; e tudo o que estiver abaixo de</p><p>5,5 e acima de 57,5 é considerado outlier.</p><p>Portanto, os valores de X2 e X3 são outliers.</p><p>Gabarito: C.</p><p>3. (INÉDITA/2022) Considere o gráfico abaixo que representa o desempenho escolar de duas</p><p>turmas do 3º ano:</p><p>115</p><p>142</p><p>De acordo com o gráfico, é correto afirmar que</p><p>a) A quantidade de alunos da turma A é superior à da turma B</p><p>b) A distância interquartil da turma A é superior ao da turma B</p><p>c) A mediana da turma A é superior à mediana da turma B</p><p>d) O menor desempenho verificado na turma B foi 5</p><p>e) O maior desempenho da turma A é superior ao verificado na turma B</p><p>Comentários:</p><p>Vamos analisar cada uma das assertivas:</p><p>A - O diagrama não informa a quantidade de elementos de cada turma.</p><p>B - A distância interquartil corresponde à diferença entre o terceiro quartil e o primeiro quartil.</p><p>Para a turma A, temos: Q3-Q1= 9,5-6,5=3.</p><p>Para a turma B, temos: Q3-Q1=9-7=2</p><p>Portanto, a alternativa está correta.</p><p>C - Observando o gráfico, percebemos que a mediana para A=8 e para B=8. Portanto ambas as</p><p>turmas têm mediana iguais.</p><p>D - No gráfico, o limite inferior da turma B é 6. Portanto, o menor desempenho nessa turma é 6.</p><p>E - Os limites superiores de ambas as turmas são iguais a 10. Portanto, ambas têm desempenho</p><p>superior iguais.</p><p>Gabarito: B.</p><p>116</p><p>142</p><p>==8b9==</p><p>4. (INÉDITA/2022) A distribuição dos salários de analistas e assistentes de determinado órgão</p><p>público está representada conforme o gráfico boxplot abaixo:</p><p>Com relação aos diagramas, pode-se afirmar que</p><p>a) A amplitude interquartil dos salários dos assistentes é superior à amplitude interquartil dos</p><p>salários dos analistas.</p><p>b) Ambas as distribuições são simétricas.</p><p>c) O maior salário observado para os assistentes corresponde à mediana dos analistas.</p><p>d) A mediana dos salários dos analistas equivale ao terceiro quartil dos salários dos assistentes.</p><p>e) O maior salário dos ocupantes do cargo de analista é de R$ 10.000,00.</p><p>Comentários:</p><p>Analisando as alternativas, temos:</p><p>A - A distância interquartil corresponde à diferença entre o terceiro quartil e o primeiro quartil.</p><p>Para os analistas, temos: Q3-Q1= 9-4=5.</p><p>Para os assistentes, temos: Q3-Q1=7-3=4</p><p>Portanto, a distância interquartil dos analistas é superior à dos assistentes.</p><p>B - Para que haja simetria na distribuição, é necessário que as duas partes do retângulo sejam</p><p>iguais. Observem que a distribuição dos assistentes é simétrica, mas na distribuição dos analistas</p><p>a parte superior do retângulo é menor que a parte inferior. Logo, a distribuição não é simétrica.</p><p>C - O maior salário para os assistentes é R$ 8.000,00. Já a mediana dos analistas, de acordo com</p><p>o gráfico, é de R$ 7.000,00. Portanto, a alternativa está errada.</p><p>D - A mediana dos salários dos analistas é de R$ 7.000,00 e o terceiro quartil dos salários dos</p><p>assistentes é observada pela linha superior</p><p>da caixa boxplot e corresponde ao valor de R$</p><p>7.000,00. Portanto, a alternativa está correta.</p><p>E - No gráfico, percebemos que o limite superior dos analistas supera o valor de 10 mil reais.</p><p>Logo, a alternativa está errada.</p><p>117</p><p>142</p><p>Gabarito: D.</p><p>5. (INÉDITA/2022) A figura abaixo representa a distribuição de consumo de açúcar por um grupo</p><p>de amigos:</p><p>De acordo com o gráfico é correto afirmar que 75% do consumo corresponde à:</p><p>a) 30g</p><p>b) 25g</p><p>c) 40g</p><p>d) 50g</p><p>e) 10g</p><p>Comentários:</p><p>Um percentual de 75% dos dados corresponde ao terceiro quartil da amostra. No gráfico</p><p>boxplot, a linha à direita da caixa equivale ao terceiro quartil, a linha no meio da caixa equivale à</p><p>mediana (50% dos dados) e a linha à esquerda da caixa equivale ao primeiro quartil (25% dos</p><p>dados).</p><p>Portanto, para o gráfico em questão, temos que 75% dos dados correspondem a um consumo de</p><p>40g de açúcar.</p><p>Gabarito: C.</p><p>6. (INÉDITA/2022) O boxplot é uma ferramenta gráfica frequentemente utilizada na análise</p><p>exploratória de dados. Essa ferramenta resume cinco medidas descritivas de um conjunto de</p><p>dados. São elas:</p><p>a) média, mediana, moda, amplitude e variância.</p><p>b) média, mediana, moda, valor mínimo e valor máximo.</p><p>c) valor mínimo, média, mediana, valor máximo e outliers.</p><p>d) valor mínimo, moda, primeiro quartil, mediana e terceiro quartil.</p><p>e) valor mínimo, primeiro quartil, mediana, terceiro quartil e valor máximo.</p><p>118</p><p>142</p><p>Comentários:</p><p>O boxplot resume cinco medidas descritivas de um conjunto de dados, incluindo: o valor mínimo,</p><p>o primeiro quartil, a mediana, o terceiro quartil e o valor máximo.</p><p>Gabarito: E.</p><p>7. (INÉDITA/2022) Nos gráficos boxplot é comum encontrarmos pontos ou asteriscos nas</p><p>extremidades do gráfico. A essas representações chamamos de:</p><p>a) outliers.</p><p>b) quartil inferior.</p><p>c) quartil superior.</p><p>d) distância interquartílica.</p><p>e) desvio quartílico.</p><p>Comentários:</p><p>Os outliers são valores discrepantes marcados com pontos ou asteriscos nos gráficos boxplot.</p><p>Nesse caso, os valores discrepantes são menores que ou maiores que𝑄</p><p>1</p><p>− 1, 5×𝐷𝐼𝑄</p><p>.𝑄</p><p>3</p><p>+ 1, 5×𝐷𝐼𝑄</p><p>Gabarito: A.</p><p>8. (INÉDITA/2022) Abaixo temos uma representação gráfica da quantidade de processos</p><p>analisados por um servidor.</p><p>Com base no diagrama boxplot apresentado, podemos afirmar que 50% dos processos</p><p>analisados equivale a uma quantidade de processos igual a:</p><p>a) 4</p><p>b) 5</p><p>119</p><p>142</p><p>c) 6</p><p>d) 8</p><p>e) 12</p><p>Comentários:</p><p>Sabemos que a representação gráfica boxplot informa os valores do 1º quartil, mediana e 3º</p><p>quartil, além dos valores máximo e mínimo. Assim, a linha do meio da caixa, equivale ao segundo</p><p>quartil, ou seja, a mediana. Também sabemos que a mediana corresponde a 50% da amostra.</p><p>Portanto, de acordo com o gráfico, a mediana equivale a 6 processos.</p><p>Gabarito: C.</p><p>9. (INÉDITA/2022) Considere o gráfico</p><p>A distância interquartílica da amostra é igual a</p><p>a) 20</p><p>b) 16</p><p>c) 18</p><p>d) 4</p><p>e) 6</p><p>Comentários:</p><p>A distância interquartílica corresponde à diferença entre o terceiro quartil e o primeiro quartil.</p><p>Assim, temos:</p><p>120</p><p>142</p><p>𝑄</p><p>3</p><p>− 𝑄</p><p>1</p><p>= 20 − 16 = 4.</p><p>Gabarito: D.</p><p>10. (INÉDITA/2022) Seja uma amostra com as seguintes estatísticas: 1º quartil Q1=34; e 3º quartil</p><p>Q3=42. Com base nesses dados, podemos afirmar que os valores A1= 8, A2=16 e A3=58:</p><p>a) Nenhum dos valores pode ser considerado outliers</p><p>b) Todos os valores são outliers</p><p>c) Apenas A2 é outlier</p><p>d) Os valores de A2 e A3 são outliers</p><p>e) Apenas A3 faz parte da amostra normal</p><p>Comentários:</p><p>Para resolvermos a questão, precisamos calcular os limites inferior e superior da amostra. Assim:</p><p>𝑙</p><p>𝑖𝑛𝑓</p><p>= 𝑄</p><p>1</p><p>− 1, 5× 𝑄</p><p>3</p><p>− 𝑄</p><p>1( )</p><p>𝑙</p><p>𝑖𝑛𝑓</p><p>= 34 − 1, 5× 42 − 34( )</p><p>𝑙</p><p>𝑖𝑛𝑓</p><p>= 34 − 12 = 22</p><p>𝑙</p><p>𝑠𝑢𝑝</p><p>= 𝑄</p><p>3</p><p>+ 1, 5× 𝑄</p><p>3</p><p>− 𝑄</p><p>1( )</p><p>𝑙</p><p>𝑠𝑢𝑝</p><p>= 42 + 1, 5× 42 − 34( )</p><p>𝑙</p><p>𝑠𝑢𝑝</p><p>= 42 + 12 = 54</p><p>Assim, tudo o que estiver entre 22 e 54 é considerado normal na amostra e tudo o que estiver</p><p>abaixo de 22 e acima de 54 é considerado outlier.</p><p>Portanto, todos os valores são outliers.</p><p>Gabarito: B.</p><p>121</p><p>142</p><p>LISTA DE QUESTÕES – CESGRANRIO</p><p>Mediana</p><p>1. (CESGRANRIO/ELETRONUCLEAR/2022) A Tabela a seguir indica a frequência de acidentes de</p><p>trabalhadores de uma empresa do setor sucroalcooleiro, em faixas etárias, durante um período de 7 anos.</p><p>Idade 18 ⊢ 26 26 ⊢ 34 34 ⊢ 42 42 ⊢ 50 50 ⊢ 58 58 ⊢ 64</p><p>No de acidentes 300 1280 380 180 48 8</p><p>Observando-se os dados presentes na Tabela e usando-se o método de interpolação linear, qual a idade</p><p>mediana dos trabalhadores acidentados?</p><p>a) 30,79</p><p>b) 31,30</p><p>c) 31,84</p><p>d) 32,70</p><p>e) 33,25</p><p>2. (CESGRANRIO/BB/2021) Um funcionário de um banco foi incumbido de acompanhar o perfil dos clientes</p><p>de um determinado produto por meio da Análise de Dados, de forma a aprimorar as atividades de</p><p>marketing relativas a esse produto. Para isso, ele utilizou a variável classe social desses clientes, coletada</p><p>pelo banco, que tem os valores A, B, C, D e E, sem referência a valores contínuos. Sabendo-se que essa é</p><p>uma escala ordinal, qual é a medida de tendência central adequada para analisar essa variável?</p><p>a) média aritmética</p><p>b) média geométrica</p><p>c) mediana</p><p>d) quartis</p><p>e) variância</p><p>3. (CESGRANRIO/CEF/2021) Seis candidatos, aprovados para a penúltima etapa de um processo seletivo,</p><p>foram submetidos a um teste de conhecimentos gerais com 10 itens do tipo “verdadeiro/falso”. Os dois</p><p>primeiros candidatos acertaram 8 itens cada, o terceiro acertou 9, o quarto acertou 7, e os dois últimos, 5</p><p>cada. Pelas regras do concurso, passariam, para a etapa final da seleção, os candidatos cujo número de</p><p>acertos fosse maior ou igual à mediana do número de acertos dos seis participantes.</p><p>122</p><p>142</p><p>Quantos candidatos passaram para a etapa final?</p><p>a) 2</p><p>b) 3</p><p>c) 4</p><p>d) 5</p><p>e) 6</p><p>4. (CESGRANRIO/BB/2018) A Tabela a seguir mostra a distribuição de pontos obtidos por um cliente em</p><p>um programa de fidelidade oferecido por uma empresa.</p><p>Pontos 0 2 3 4 6 8 9</p><p>Frequência 1 2 4 1 1 5 1</p><p>A mediana da pontuação desse cliente é o valor mínimo para que ele pertença à classe de clientes</p><p>“especiais”. Qual a redução máxima que o valor da maior pontuação desse cliente pode sofrer sem que</p><p>ele perca a classificação de cliente “especial”, se todas as demais pontuações forem mantidas?</p><p>a) cinco unidades</p><p>b) quatro unidades</p><p>c) uma unidade</p><p>d) duas unidades</p><p>e) três unidades</p><p>5. (CESGRANRIO/PETROBRAS/2018) Para não comprometer o sigilo das informações, um periódico</p><p>técnico-científico divulgou os dados básicos que utilizou em um modelo estatístico, na seguinte</p><p>distribuição de frequência por classes:</p><p>Faixas de X Frequência Relativa</p><p>-3 Ⱶ -1 0,25</p><p>-1 Ⱶ 1 0,40</p><p>1 Ⱶ 3 0,25</p><p>3 Ⱶ 5 0,10</p><p>A melhor estimativa para a mediana da distribuição de X é:</p><p>a) - 0,75</p><p>123</p><p>142</p><p>b) 0</p><p>c) 0,25</p><p>d) 0,50</p><p>e) 1</p><p>6. (CESGRANRIO/TRANSPETRO/2018) Foi realizado um experimento com uma perfuradora hidráulica com</p><p>o objetivo de conhecer sua capacidade de perfuração em estruturas rochosas. Para isso foi observada a</p><p>profundidade, em polegadas, de perfuração em 10 locais, cujos dados estão apresentados na Tabela a</p><p>seguir.</p><p>Locais Profundidade em polegadas</p><p>1 10,4</p><p>2 10,7</p><p>3 9,4</p><p>4 10,9</p><p>5 10,8</p><p>6 11,0</p><p>7 10,5</p><p>8 10,6</p><p>9 10,9</p><p>10 9,8</p><p>A média e a mediana são, respectivamente:</p><p>a) 10,0 e 10,6</p><p>b) 10,5 e 10,65</p><p>c) 10,5 e 10,6</p><p>d) 10,6 e 10,6</p><p>e) 10,6 e 10,65</p><p>7. (CESGRANRIO/TRANSPETRO/2018) Os dados divulgados pela Agência Nacional de Telecomunicações</p><p>mostram que o Brasil registrou 236,2 milhões de linhas móveis em operação, em janeiro de 2018. Isso</p><p>representa uma diminuição de 258,7 mil linhas em operação (-0,11%), em relação a dezembro de 2017. As</p><p>Tabelas abaixo apresentam a evolução dos acessos em operação nas modalidades de cobrança pré-paga e</p><p>pós-paga nos últimos 7 meses.</p><p>Acessos em Operação por Forma de Cobrança em milhões</p><p>124</p><p>142</p><p>Cobrança</p><p>Julho</p><p>(2017)</p><p>Agosto</p><p>(2017)</p><p>Setembro</p><p>(2017)</p><p>Outubro</p><p>(2017)</p><p>Novembro</p><p>(2017)</p><p>Dezembro</p><p>(2017)</p><p>Janeiro</p><p>(2018)</p><p>Pré-paga</p><p>Pós-paga</p><p>159,2</p><p>82,8</p><p>158,5</p><p>o desempenho escolar de duas</p><p>turmas do 3º ano:</p><p>136</p><p>142</p><p>De acordo com o gráfico, é correto afirmar que</p><p>a) A quantidade de alunos da turma A é superior à da turma B</p><p>b) A distância interquartil da turma A é superior ao da turma B</p><p>c) A mediana da turma A é superior à mediana da turma B</p><p>d) O menor desempenho verificado na turma B foi 5</p><p>e) O maior desempenho da turma A é superior ao verificado na turma B</p><p>4. (INÉDITA/2022) A distribuição dos salários de analistas e assistentes de determinado órgão</p><p>público está representada conforme o gráfico boxplot abaixo:</p><p>Com relação aos diagramas, pode-se afirmar que</p><p>a) A amplitude interquartil dos salários dos assistentes é superior à amplitude interquartil dos</p><p>salários dos analistas.</p><p>b) Ambas as distribuições são simétricas.</p><p>c) O maior salário observado para os assistentes corresponde à mediana dos analistas.</p><p>d) A mediana dos salários dos analistas equivale ao terceiro quartil dos salários dos assistentes.</p><p>e) O maior salário dos ocupantes do cargo de analista é de R$ 10.000,00.</p><p>5. (INÉDITA/2022) A figura abaixo representa a distribuição de consumo de açúcar por um grupo</p><p>de amigos:</p><p>De acordo com o gráfico é correto afirmar que 75% do consumo corresponde à:</p><p>137</p><p>142</p><p>a) 30g</p><p>b) 25g</p><p>c) 40g</p><p>d) 50g</p><p>e) 10g</p><p>6. (INÉDITA/2022) O boxplot é uma ferramenta gráfica frequentemente utilizada na análise</p><p>exploratória de dados. Essa ferramenta resume cinco medidas descritivas de um conjunto de</p><p>dados. São elas:</p><p>a) média, mediana, moda, amplitude e variância.</p><p>b) média, mediana, moda, valor mínimo e valor máximo.</p><p>c) valor mínimo, média, mediana, valor máximo e outliers.</p><p>d) valor mínimo, moda, primeiro quartil, mediana e terceiro quartil.</p><p>e) valor mínimo, primeiro quartil, mediana, terceiro quartil e valor máximo.</p><p>7. (INÉDITA/2022) Nos gráficos boxplot é comum encontrarmos pontos ou asteriscos nas</p><p>extremidades do gráfico. A essas representações chamamos de:</p><p>a) outliers.</p><p>b) quartil inferior.</p><p>c) quartil superior.</p><p>d) distância interquartílica.</p><p>e) desvio quartílico.</p><p>8. (INÉDITA/2022) Abaixo temos uma representação gráfica da quantidade de processos</p><p>analisados por um servidor.</p><p>138</p><p>142</p><p>==8b9==</p><p>Com base no diagrama boxplot apresentado, podemos afirmar que 50% dos processos</p><p>analisados equivale a uma quantidade de processos igual a:</p><p>a) 4</p><p>b) 5</p><p>c) 6</p><p>d) 8</p><p>e) 12</p><p>9. (INÉDITA/2022) Considere o gráfico</p><p>A distância interquartílica da amostra é igual a</p><p>a) 20</p><p>b) 16</p><p>c) 18</p><p>d) 4</p><p>e) 6</p><p>10. (INÉDITA/2022) Seja uma amostra com as seguintes estatísticas: 1º quartil Q1=34; e 3º quartil</p><p>Q3=42. Com base nesses dados, podemos afirmar que os valores A1= 8, A2=16 e A3=58:</p><p>a) Nenhum dos valores pode ser considerado outliers</p><p>b) Todos os valores são outliers</p><p>c) Apenas A2 é outlier</p><p>d) Os valores de A2 e A3 são outliers</p><p>139</p><p>142</p><p>e) Apenas A3 faz parte da amostra normal</p><p>140</p><p>142</p><p>GABARITO – INÉDITAS</p><p>Box Plot</p><p>1. LETRA B</p><p>2. LETRA C</p><p>3. LETRA B</p><p>4. LETRA D</p><p>5. LETRA C</p><p>6. LETRA E</p><p>7. LETRA A</p><p>8. LETRA C</p><p>9. LETRA D</p><p>10.LETRA B</p><p>141</p><p>142</p><p>a) se 𝑛 for ímpar, o termo de ordem</p><p>𝑛+12 , isto é,</p><p>𝑴𝒅 = 𝒙𝒏+𝟏𝟐</p><p>b) se 𝑛 for par, a média aritmética dos termos de ordem</p><p>𝑛2 e</p><p>𝑛2 + 1, isto é,</p><p>𝑴𝒅 = 𝒙𝒏𝟐 + 𝒙𝒏𝟐+𝟏𝟐</p><p>A mediana nem sempre coincidirá com um elemento da série de dados. Isso somente acontecerá</p><p>quando o número de elementos da série de dados for ímpar, pois haverá coincidência entre os</p><p>valores da mediana e do termo que ocupa a posição central. Contudo, quando número de elementos</p><p>for par, não existirá essa coincidência.</p><p>Quando o número de elementos do conjunto é ÍMPAR, o valor da mediana é único e igual ao termo</p><p>central. Porém, quando o número de elementos é PAR, a mediana pode ser QUALQUER VALOR</p><p>ENTRE OS TERMOS CENTRAIS, havendo infinitos valores possíveis para a mediana. Para</p><p>exemplificar, imaginemos os números 1 e 2 como termos centrais. Entre esses dois números temos</p><p>infinitas possibilidades de escolha, a exemplo de 1,01; 1,2; 1,673; etc. A mediana poderia ser</p><p>qualquer desses valores, contudo, POR CONVENÇÃO, adotamos a média aritmética dos valores</p><p>centrais.</p><p>Seja {𝑥𝑛} uma série de dados estatísticos composta por n elementos ordenados de forma crescente</p><p>ou decrescente, isto é, {𝑥𝑛} = {𝑥1, 𝑥2, 𝑥3, ⋯ , 𝑥𝑛}. A mediana desse conjunto de dados será:</p><p>a) se 𝑛 for ímpar, o termo de ordem</p><p>𝑛+12 , isto é, 𝑀𝑑 = 𝑥𝑛+12</p><p>b) se 𝑛 for par, a média aritmética dos termos de ordem</p><p>𝑛2 e</p><p>𝑛2 + 1, isto é, 𝑀𝑑 = 𝑥𝑛2 + 𝑥𝑛2+12</p><p>Calcular a mediana dos seguintes conjuntos:</p><p>a) seja {𝑥𝑛} uma série de dados composta pelos seguintes valores: {𝑥𝑛} = {1, 3, 5, 6, 7, 9, 11, 13, 17, 18, 20}</p><p>Como o número de elementos é ímpar, 𝑛 = 11, temos:</p><p>𝑀𝑑 = 𝑥11+12 = 𝑥122 = 𝑥6</p><p>Logo, a mediana é o sexto elemento da série, isto é: 𝑀𝑑 = 𝑥6 ⇒ 𝑀𝑑 = 9</p><p>b) seja {𝑦𝑛} uma série de dados composta pelos seguintes elementos: {𝑦𝑛} = {11, 14, 15, 16, 18, 19, 21, 23}</p><p>Como o número de elementos é par, 𝑛 = 8, temos:</p><p>𝑀𝑑 = 𝑦𝑛2 + 𝑦𝑛2+12 = 𝑦82 + 𝑦82+12 = 𝑦4 + 𝑦4+12 = 𝑦4 + 𝑦52</p><p>Logo, a mediana será a média aritmética entre o quarto e o quinto elementos da série, isto é:</p><p>𝑀𝑑 = 𝑦4 + 𝑦52 = 16 + 182 = 342 = 17 ⇒ 𝑀𝑑 = 17</p><p>Como vimos, a mediana depende apenas do termo que ocupa a posição central em um conjunto de dados,</p><p>e não dos valores de todos os elementos que compõem a série. Por isso, dizemos que a mediana não sofre</p><p>tanta influência pela presença de valores extremos/discrepantes quanto à média. Essa é, inclusive, uma</p><p>das principais diferenças entre essas duas medidas.</p><p>Podemos constatar essa propriedade da mediana por meio de um exemplo. Considere que tenhamos</p><p>inicialmente a seguinte série: {1, 2, 4, 6, 7, 9, 10, 11, 13}</p><p>A média aritmética desses valores é:</p><p>𝑥 = 1 + 2 + 4 + 6 + 7 + 9 + 10 + 11 + 139 = 639 = 7</p><p>Como o número de elementos é ímpar, 𝑛 = 9, a mediana será o elemento que ocupa a posição: 𝑛 + 12 = 9 + 12 = 102 = 5.</p><p>O quinto termo é 7, portanto: 𝑀𝑑 = 𝑥5 ⇒ 𝑀𝑑 = 7.</p><p>Agora, considere que o elemento de valor 13 tenha sido alterado para 130.000. Veja o que acontece com a</p><p>média aritmética desse conjunto:</p><p>𝑥 = 1 + 2 + 4 + 6 + 7 + 9 + 10 + 11 + 130.0009 = 14.450 ⇒ 𝑥 = 14.450</p><p>Como o número de elementos permanece inalterado, 𝑛 = 9, a mediana continua sendo o elemento que</p><p>ocupa a posição: 𝑛 + 12 = 9 + 12 = 102 = 5.</p><p>Logo, a mediana ainda é representada pelo quinto termo da série: 𝑀𝑑 = 𝑥5 ⇒ 𝑀𝑑 = 7.</p><p>Portanto, a alteração no valor de um único elemento do conjunto de dados causou um impacto significativo</p><p>na média, ao passo que a mediana permaneceu inalterada. Por isso, dizemos que a média é mais</p><p>influenciada pela presença de valores extremos que a mediana.</p><p>A mediana depende da apenas posição e não dos valores dos elementos de uma série ordenada.</p><p>Essa é uma das principais diferenças entre a média e a mediana, pois a primeira é muito impactada</p><p>pela presença de valores extremos enquanto a última não.</p><p>Em geral, os valores da média aritmética e da mediana são diferentes. Por exemplo, a média da série {𝑥𝑛} = {1, 2, 4, 6, 7, 9, 10, 11, 13} é: 𝑥 = 1 + 2 + 4 + 6 + 7 + 9 + 10 + 11 + 130.0009 = 14.450,</p><p>enquanto sua mediana é: 𝑀𝑑 = 7.</p><p>(CESPE/IPHAN/2018) Define-se estatística descritiva como a etapa inicial da análise utilizada para</p><p>descrever e resumir dados. Em relação às medidas descritivas, julgue o item a seguir.</p><p>A mediana é o valor que ocupa a posição central da série de observações de uma variável, dividindo-se o</p><p>conjunto de valores ordenados em partes assimétricas desiguais.</p><p>Comentários:</p><p>A mediana é o valor que ocupa a posição central da série de observações de uma variável, dividindo o</p><p>conjunto em duas partes com a mesma quantidade de valores. As partes não serão necessariamente</p><p>assimétricas desiguais. Se tivéssemos um conjunto formado apenas por elementos repetidos, por exemplo,</p><p>a mediana dividiria os valores em partes simétricas.</p><p>Gabarito: Errado.</p><p>(CESPE/IPHAN/2018) Uma pesquisa a respeito das quantidades de teatros em cada uma de 11 cidades</p><p>brasileiras selecionadas apresentou o seguinte resultado: {1, 2, 2, 3, 3, 3, 4, 4, 4, 4, 4}. Com referência a</p><p>esses dados, julgue o item seguinte.</p><p>A mediana do conjunto é igual a 3.</p><p>Comentários:</p><p>A mediana divide um conjunto ao meio e ocupa a posição central. Temos 11 elementos na amostra. Então,</p><p>a mediana ocupará a posição: 𝑛 + 12 = 11 + 12 = 122 = 6</p><p>Vejamos: {1, 2, 2, 3, 3, 𝟑⏟𝟔º 𝒕𝒆𝒓𝒎𝒐 = 𝒕𝒆𝒓𝒎𝒐 𝒄𝒆𝒏𝒕𝒓𝒂𝒍 , 4, 4, 4, 4, 4}</p><p>Portanto, a mediana corresponde ao sexto termo da série de observações. Logo: 𝑀𝑑 = 3.</p><p>Gabarito: Certo.</p><p>(CESPE/FUB/2018) A tabela seguinte mostra as quantidades de livros de uma biblioteca que foram</p><p>emprestados em cada um dos seis primeiros meses de 2017.</p><p>A partir dessa tabela, julgue o próximo item.</p><p>A mediana dos números correspondentes às quantidades de livros emprestados no primeiro semestre de</p><p>2017 é igual a 200.</p><p>Comentários:</p><p>A mediana é o termo central de uma amostra ou população. Se temos 6 meses, então a mediana poderá ser</p><p>encontrada pela média dos termos que ocupam as posições 3 e 4, pois, nesse caso, não há apenas um termo</p><p>central. Organizando os dados da tabela em ordem crescente (isto é, em rol crescente), temos: 50 150 200 250⏟ 𝑡𝑒𝑟𝑚𝑜𝑠 𝑐𝑒𝑛𝑡𝑟𝑎𝑖𝑠 250 300</p><p>Encontrando a média dos termos nas posições 3 e 4: 𝑀𝑑 = 200 + 2502 = 225</p><p>Gabarito: Errado.</p><p>Mês</p><p>1 2 3 4 5 6</p><p>Quantidade 50 150 250 250 300 200</p><p>Mediana para dados agrupados sem intervalos de classe</p><p>O raciocínio adotado no cálculo da mediana para dados agrupados por valor (sem intervalos de classe) é</p><p>similar ao empregado no caso dos dados não-agrupados. Basicamente, teremos que encontrar um valor que</p><p>dividirá a distribuição de frequências em duas partes contendo o mesmo número de elementos.</p><p>Considere a seguinte situação hipotética: uma empresa realizou uma pesquisa para medir o nível de</p><p>satisfação dos clientes com relação ao seu atendimento. Os clientes puderam atribuir notas de 0 a 5 no que</p><p>diz respeito ao nível de satisfação, resultando na seguinte distribuição de frequências:</p><p>Nível de</p><p>Satisfação (𝑿𝒊) Frequência (𝒇𝒊)</p><p>0 3</p><p>1 5</p><p>2 8</p><p>3 10</p><p>4 13</p><p>5 10</p><p>O total de clientes entrevistados foi de: 3 + 5 + 8 + 10 + 13 + 10 = 49.</p><p>Como o número de entrevistados é ímpar, 𝑛 = 49, a mediana será o termo que ocupa a posição de ordem: 𝑛 + 12 = 49 + 12 = 502 = 25</p><p>Em outros termos, a mediana será o elemento que ocupa a vigésima quinta posição. Para chegarmos a esse</p><p>elemento, precisamos percorrer cada um dos níveis de satisfação. Reparem que três clientes atribuíram a</p><p>nota 0 (zero); cinco atribuíram a nota 1 (um); e oito atribuíram a nota 2 (dois). Portanto, até esse ponto,</p><p>temos um total de 16 avaliações: 3 + 5 + 8 = 16</p><p>Vejam que ainda não chegamos na posição desejada, isto é, na vigésima quinta. Contudo, sabemos que o</p><p>próximo nível de satisfação, referente à nota 3 (três),</p><p>teve frequência absoluta igual a 10. Se somarmos essas</p><p>dez novas avaliações com o total obtido anteriormente, chegaremos a um valor que ultrapassa a posição</p><p>procurada (16 + 10 = 26). Assim, descobrimos que a mediana está localizada nessa faixa de avaliação.</p><p>Portanto, 𝑀𝑑 = 𝑥25 = 3</p><p>Esse procedimento pode ser simplificado com a introdução de uma coluna adicional para armazenar as</p><p>frequências acumuladas. Já vimos que, para calcularmos a frequência acumulada, devemos repetir a</p><p>primeira frequência e somar as frequências subsequentes, exibindo os resultados a cada linha. Observem:</p><p>Nível de</p><p>Satisfação</p><p>(𝑿𝒊) Frequência</p><p>(𝒇𝒊) Frequência</p><p>Acumulada</p><p>(𝒇𝒂𝒄) Memória</p><p>de cálculo</p><p>0 3 3 = 3</p><p>1 5 8 = 3+5 = 8</p><p>2 8 16 = 8 + 8 = 16</p><p>3 10 26 = 16 + 10 = 26</p><p>4 13 39 = 26 + 13 = 39</p><p>5 10 49 = 39 + 10 = 49</p><p>Vamos remover a memória de cálculo para simplificar a tabela:</p><p>Nível de</p><p>Satisfação</p><p>(𝑿𝒊) Frequência</p><p>(𝒇𝒊) Frequência</p><p>Acumulada</p><p>(𝒇𝒂𝒄)</p><p>0 3 3</p><p>1 5 8</p><p>2 8 16</p><p>3 10 26</p><p>4 13 39</p><p>5 10 49</p><p>Reparem que o número 16, na terceira linha da coluna de frequências acumuladas, representa a soma das</p><p>frequências absolutas simples das três primeiras linhas, isto é, 3 + 5 + 8. Assim, concluímos que 16 clientes</p><p>avaliaram o atendimento da empresa com nota igual ou inferior a 2. De forma análoga, como 49 clientes</p><p>participaram da pesquisa, podemos afirmar que 33 avaliaram o atendimento com nota igual ou superior a 3.</p><p>Observem que a introdução da coluna de frequências acumuladas torna possível calcularmos a mediana de</p><p>forma praticamente imediata. Nesse sentido, se n for ímpar, basta identificarmos o valor da variável</p><p>correspondente à primeira frequência acumulada imediatamente igual ou superior à posição de ordem</p><p>𝒏+𝟏𝟐 ; e, se n for par, basta identificarmos os dois valores correspondentes às frequências acumuladas</p><p>imediatamente iguais ou superiores às posições de ordens</p><p>𝒏𝟐 e</p><p>𝒏𝟐 + 𝟏, respectivamente, e tirarmos a média</p><p>aritmética desses dois valores.</p><p>Em nosso exemplo, como a frequência total é ímpar, teremos que buscar pela posição</p><p>𝑛+12 = 49+12 = 25. A</p><p>mediana será o valor da variável correspondente à primeira frequência acumulada maior ou igual a essa</p><p>posição, portanto, 𝑀𝑑 = 3. Vejamos:</p><p>Nível de</p><p>Satisfação</p><p>(𝑿𝒊) Frequência</p><p>(𝒇𝒊) Frequência</p><p>Acumulada</p><p>(𝒇𝒂𝒄)</p><p>0 3 3</p><p>1 5 8</p><p>2 8 16</p><p>3 10 26 (> 25)</p><p>4 13 39</p><p>5 10 49</p><p>Assim, podemos estabelecer que a mediana de uma tabela de frequências composta por um total de 𝑛</p><p>elementos será:</p><p>a) se 𝑛 for ímpar, o valor identificado na tabela correspondente à frequência acumulada imediatamente</p><p>igual ou superior à posição de ordem</p><p>𝑛+12 , isto é, 𝑴𝒅 = 𝑿𝒏+𝟏𝟐</p><p>b) se 𝑛 for par, a média aritmética dos valores identificados na tabela correspondentes às frequências</p><p>acumuladas imediatamente iguais ou superiores às posições de ordens</p><p>𝑛2 e</p><p>𝑛2 + 1, isto é,</p><p>𝑴𝒅 = 𝑿𝒏𝟐 + 𝑿𝒏𝟐+𝟏𝟐</p><p>Calcular a mediana da seguinte tabela de frequências:</p><p>Vamos construir a coluna da frequência acumulada para calcular a mediana.</p><p>Como o número de elementos é par, 𝑛 = 40, temos dois termos ocupando as posições centrais. O</p><p>primeiro termo ocupa a posição</p><p>𝑛2 = 402 = 20; o segundo, a posição</p><p>𝑛2 + 1 = 21. Assim, a mediana</p><p>será a média aritmética dos termos que ocupam essas duas posições.</p><p>A frequência acumulada indica que 20 elementos foram contados até a segunda linha. Portanto, 𝑥20 = 7</p><p>Logo, o termo de posição 21 está na linha seguinte: 𝑥21 = 8</p><p>Assim, a mediana é: 𝑀𝑑 = 𝑥20 + 𝑥212 = 7 + 82 = 7,5</p><p>Nota</p><p>(𝑿𝒊) Frequência</p><p>(𝒇𝒊)</p><p>6 5</p><p>7 15</p><p>8 10</p><p>9 7</p><p>10 3</p><p>Nota</p><p>(𝑿𝒊) Frequência</p><p>(𝒇𝒊) Frequência</p><p>Acumulada</p><p>(𝒇𝒂𝒄)</p><p>6 5 5</p><p>7 15 20</p><p>8 10 30</p><p>9 7 37</p><p>10 3 40</p><p>TOTAL 40</p><p>(CESPE/Pref. SL/2017)</p><p>Texto 11A2CCC</p><p>A tabela a seguir apresenta uma comparação entre a evolução populacional ocorrida na cidade de São</p><p>Luís, no estado do Maranhão e no Brasil, a cada cinco anos, de 1985 a 2010.</p><p>IBGE (com adaptações).</p><p>Com base na tabela do texto 11A2CCC, considerando-se a sequência dos seis valores correspondentes à</p><p>população de São Luís, infere-se que a mediana desses valores é igual a</p><p>a) 725.000.</p><p>b) 775.000.</p><p>c) 825.000.</p><p>d) 875.000.</p><p>e) 700.000.</p><p>Comentários:</p><p>A mediana é o termo central de uma amostra ou população. Se temos 6 observações representadas na</p><p>tabela, então a mediana poderá ser encontrada pela média dos termos que ocupam as posições 3 e 4 pois</p><p>nesse caso não há apenas um termo central. Os dados já estão ordenados em ordem crescente. Então: 𝑀𝑑 = 780 + 8702 = 16502 𝑀𝑑 = 825</p><p>Gabarito: C.</p><p>Ano</p><p>São Luís</p><p>(em milhares)</p><p>Maranhão</p><p>(em milhões)</p><p>Brasil</p><p>(em milhões)</p><p>1985 640 4,3 137</p><p>1990 700 4,9 146</p><p>1995 780 5,2 156</p><p>2000 870 5,6 171</p><p>2005 960 6,1 183</p><p>2010 1.000 6,6 192</p><p>(CESPE/TCE-PA/2016)</p><p>A tabela precedente apresenta a distribuição de frequências relativas da variável X, que representa o</p><p>número diário de denúncias registradas na ouvidoria de determinada instituição pública. A partir das</p><p>informações dessa tabela, julgue o item seguinte.</p><p>A mediana do número diário de denúncias registradas é igual a 2.</p><p>Comentários:</p><p>A mediana é o valor associado a uma frequência relativa acumulada de 50%, ou seja, que separa os 50%</p><p>menores dos 50% maiores. Vamos calcular a frequência relativa acumulada.</p><p>Número diário de</p><p>denúncias registradas</p><p>(X)</p><p>Frequência</p><p>Relativa</p><p>0 0,3</p><p>1 0,1</p><p>2 0,2</p><p>3 0,1</p><p>4 0,3</p><p>Total 1,0</p><p>Número de</p><p>denúncias</p><p>(𝑿𝒊)</p><p>Frequência</p><p>Relativa</p><p>(𝒇𝒓)</p><p>Frequência</p><p>Relativa</p><p>Acumulada</p><p>(𝒇𝒓𝒂𝒄)</p><p>0 0,3 = 30% 30%</p><p>1 0,1 = 10% 40%</p><p>2 0,2 = 20% 60% (> 50%)</p><p>3 0,1 = 10% 70%</p><p>4 0,3 = 30% 100%</p><p>A primeira linha apresenta uma frequência acumulada de 30%, indicando que 30% dos valores são iguais a</p><p>zero.</p><p>A segunda linha apresenta uma frequência acumulada de 40%, indicando que 40% dos valores são menores</p><p>ou iguais a 1.</p><p>A terceira linha apresenta uma frequência acumulada de 60%, indicando que 60% dos valores são menores</p><p>ou iguais a 2.</p><p>Observe que o patamar de 50% foi ultrapassado na terceira linha. Portanto, a mediana é igual a 2.</p><p>Gabarito: Certo.</p><p>Mediana para dados agrupados em classes</p><p>O raciocínio adotado no cálculo da mediana para dados agrupados em classes é muito similar ao empregado</p><p>no tópico anterior. Agora, contudo, não nos importaremos com o número de elementos da série.</p><p>Adotaremos um único procedimento de cálculo, independentemente de termos um número par ou ímpar</p><p>de elementos.</p><p>Considere a distribuição de frequências descrita a seguir, que resume as idades de um grupo de 50 alunos</p><p>do Estratégia Concursos:</p><p>Idades</p><p>Frequência</p><p>(𝒇𝒊)</p><p>23 ⊢ 26 3</p><p>26 ⊢ 29 4</p><p>29 ⊢ 32 10</p><p>32 ⊢ 35 13</p><p>35 ⊢ 38 10</p><p>38 ⊢ 41 6</p><p>41 ⊢ 44 4</p><p>TOTAL 50</p><p>A etapa inicial do cálculo da mediana consiste na construção da coluna de frequências acumuladas:</p><p>Idades</p><p>Frequência</p><p>(𝒇𝒊) Frequência</p><p>Acumulada</p><p>(𝒇𝒂𝒄)</p><p>23 ⊢ 26 3 3</p><p>26 ⊢ 29 4 7</p><p>29 ⊢ 32 10 17</p><p>32 ⊢ 35 13 30</p><p>35 ⊢ 38 10 40</p><p>38 ⊢ 41 6 46</p><p>41 ⊢ 44 4 50</p><p>TOTAL 50</p><p>Para calcular a mediana de dados que estão agrupados por intervalo de classes, precisamos identificar a</p><p>classe em que se encontra a mediana, a chamada classe mediana, que corresponde à frequência acumulada</p><p>imediatamente igual ou superior à metade da frequência total, ou seja, metade da soma das frequências</p><p>simples, ∑𝒇𝒊 𝟐⁄ . Em nosso exemplo, temos: ∑𝑓𝑖2 = 502 = 25</p><p>Agora, devemos comparar o valor encontrado com os valores presentes na coluna de frequências</p><p>acumuladas, percorrendo-os de cima para baixo. A classe mediana será a primeira classe em que a frequência</p><p>acumulada for igual ou superior a 25. Assim, teremos que analisar o seguinte:</p><p>• a primeira frequência acumulada (3) é maior ou igual a 25? Não;</p><p>• a segunda frequência acumulada (7) é maior ou igual a 25? Não;</p><p>• a terceira frequência acumulada (17) é maior ou igual a 25? Não;</p><p>• a quarta frequência</p><p>acumulada (30) é maior ou igual a 25? Sim.</p><p>Pronto, encontramos a classe mediana. Nesse ponto, paramos a comparação e verificamos que a mediana</p><p>se encontra na quarta classe, isto é, no intervalo entre 32 e 35.</p><p>Conhecendo a classe mediana, podemos aplicar a fórmula da mediana, a seguir:</p><p>𝑴𝒅 = 𝒍𝒊𝒏𝒇 + [(∑𝒇𝒊𝟐 ) − 𝒇𝒂𝒄𝒂𝒏𝒕𝒇𝒊 ] × 𝒉</p><p>em que: 𝑙𝑖𝑛𝑓 é o limite inferior da classe mediana; 𝑓𝑎𝑐𝑎𝑛𝑡 é a frequência acumulada da classe anterior à classe mediana; 𝑓𝑖 é a frequência simples da classe mediana; e ℎ é a amplitude do intervalo da classe mediana.</p><p>Já sabemos que a amplitude é a diferença entre os limites da classe. Assim, temos: ℎ = 35 − 32 = 3.</p><p>Os demais elementos da fórmula são ilustrados a seguir:</p><p>Após identificarmos os elementos, precisamos aplicá-los na fórmula mostrada anteriormente:</p><p>𝑀𝑑 = 𝑙𝑖𝑛𝑓 + [(∑𝑓𝑖2 ) − 𝑓𝑎𝑐𝑎𝑛𝑡𝑓𝑖 ] × ℎ</p><p>𝑀𝑑 = 32 + [(502 ) − 1713 ] × 3</p><p>𝑀𝑑 = 32 + (25 − 1713 ) × 3</p><p>𝑀𝑑 = 32 + ( 813) × 3 ≅ 33,85</p><p>Sendo assim, podemos afirmar que:</p><p>a) 50% dos valores estão entre 23 e 33,85;</p><p>b) 50% dos valores estão entre 33,85 e 44.</p><p>Com a memorização da fórmula da mediana para dados agrupados em classes, você conseguirá</p><p>compreender, com mais facilidade, a aplicação dos quartis, decis e percentis. As fórmulas dessas</p><p>medidas sofrem poucas alterações em relação à fórmula da mediana, como veremos nos próximos</p><p>tópicos. Por isso, recomendo fortemente que internalizem a expressão:</p><p>𝑀𝑑 = 𝑙𝑖𝑛𝑓 + [(∑𝑓𝑖2 ) − 𝑓𝑎𝑐𝑎𝑛𝑡𝑓𝑖 ] × ℎ</p><p>A fórmula apresentada anteriormente é obtida pelo método de interpolação linear. Esse método</p><p>consiste, basicamente, em utilizar valores conhecidos para estimar valores desconhecidos de forma</p><p>linear, isto é, por meio de uma reta. No caso da mediana, a reta se inicia no ponto (𝑙𝑖𝑚𝑖𝑛𝑓,𝑓𝑎𝑐𝑎𝑛𝑡);</p><p>passa pelo ponto (𝑀𝑑 , ∑𝑓𝑖 2⁄ ) e termina no ponto (𝑙𝑖𝑚𝑖𝑛𝑓 + ℎ,𝑓𝑎𝑐𝑎𝑛𝑡 + 𝑓𝑖). Vejamos:</p><p>Em virtude da semelhança entre os triângulos 𝐴𝐵𝐶 e 𝐴𝐷𝐸, podemos estabelecer a seguinte relação</p><p>de proporcionalidade: 𝑀𝑑 − 𝑙𝑖𝑛𝑓(∑𝑓𝑖2 )− 𝑓𝑎𝑐𝑎𝑛𝑡 = (𝑙𝑖𝑛𝑓 + ℎ)− 𝑙𝑖𝑛𝑓(𝑓𝑎𝑐𝑎𝑛𝑡 + 𝑓𝑖)− 𝑓𝑎𝑐𝑎𝑛𝑡 𝑀𝑑 − 𝑙𝑖𝑛𝑓(∑𝑓𝑖2 )− 𝑓𝑎𝑐𝑎𝑛𝑡 = ℎ𝑓𝑖</p><p>𝑀𝑑 − 𝑙𝑖𝑛𝑓 = [</p><p>(∑𝑓𝑖2 )− 𝑓𝑎𝑐𝑎𝑛𝑡𝑓𝑖 ]</p><p>× ℎ</p><p>Assim, chegamos à fórmula mostrada anteriormente:</p><p>𝑀𝑑 = 𝑙𝑖𝑛𝑓 + [</p><p>(∑𝑓𝑖2 )− 𝑓𝑎𝑐𝑎𝑛𝑡𝑓𝑖 ]</p><p>× ℎ</p><p>Calcular a mediana da distribuição de frequências apresentada a seguir, referente às estaturas de</p><p>um grupo de 40 alunos:</p><p>Como sabemos, o primeiro passo é construir a coluna de frequências acumuladas:</p><p>Agora, precisamos identificar a classe mediana. Para tanto, vamos calcular sua posição por meio da</p><p>expressão: ∑𝑓𝑖2 = 402 = 20</p><p>Estaturas</p><p>Frequência</p><p>(𝒇𝒊)</p><p>150 ⊢ 154 4</p><p>154 ⊢ 158 9</p><p>158 ⊢ 162 11</p><p>162 ⊢ 166 8</p><p>166 ⊢ 170 5</p><p>170 ⊢ 174 3</p><p>TOTAL 40</p><p>Estaturas</p><p>Frequência</p><p>(𝒇𝒊) Frequência</p><p>Acumulada</p><p>(𝒇𝒂𝒄)</p><p>150 ⊢ 154 4 4</p><p>154 ⊢ 158 9 13</p><p>158 ⊢ 162 11 24</p><p>162 ⊢ 166 8 32</p><p>166 ⊢ 170 5 37</p><p>170 ⊢ 174 3 40</p><p>TOTAL 40</p><p>Devemos comparar esse valor com os existentes na coluna de frequências acumuladas, da mesma</p><p>maneira que fizemos anteriormente. A classe mediana será a primeira classe em que a frequência</p><p>acumulada for igual ou superior a 20.</p><p>Assim, teremos:</p><p>• a primeira frequência acumulada (4) é maior ou igual a 20? Não;</p><p>• a segunda frequência acumulada (13) é maior ou igual a 20? Não;</p><p>• a terceira frequência acumulada (24) é maior ou igual a 20? Sim.</p><p>Nesse ponto, paramos a comparação e verificamos que a mediana se encontra na terceira classe,</p><p>isto é, no intervalo entre 158 e 162.</p><p>Conhecendo a classe mediana, podemos identificar os termos empregados na fórmula da mediana:</p><p>• ∑𝑓𝑖 = 40;</p><p>• 𝑙𝑖𝑛𝑓 = 158;</p><p>• 𝑓𝑎𝑐𝑎𝑛𝑡 = 13;</p><p>• 𝑓𝑖 = 11; e</p><p>• ℎ = 162 − 158 = 4.</p><p>Finalmente, vamos aplicar a fórmula da mediana:</p><p>𝑀𝑑 = 𝑙𝑖𝑛𝑓 + [(∑𝑓𝑖2 ) − 𝑓𝑎𝑐𝑎𝑛𝑡𝑓𝑖 ] × ℎ</p><p>𝑀𝑑 = 158 + [(402 ) − 1311 ] × 4</p><p>𝑀𝑑 = 158 + (20 − 1311 ) × 4</p><p>𝑀𝑑 = 158 + ( 711) × 4 ≅ 160,54</p><p>Portanto, podemos concluir que:</p><p>a) metade dos valores estão entre 150 e 160,54;</p><p>b) metade dos valores estão entre 160,54 e 174.</p><p>(CESPE/DEPEN/2015)</p><p>Felipe M. Monteiro, Gabriela R. Cardoso e Rafael da Silva. A seletividade do sistema prisional brasileiro e as políticas de segurança pública. In: XV</p><p>Congresso Brasileiro de Sociologia, 26 a 29 de julho de 2011. Curitiba (PR). Grupo de Trabalhos - Violência e Sociedade (com adaptações).</p><p>Com base nos dados dessa tabela, julgue o item a seguir.</p><p>A mediana da distribuição mostrada é igual ou superior a 30 anos, pois as idades mínima e máxima na</p><p>população prisional brasileira em 2010 foram, respectivamente, 18 e 60 anos.</p><p>Comentários:</p><p>Nessa questão, podemos afirmar que o item está errado, pois os valores mínimo e máximo não são</p><p>suficientes para determinarmos o valor da mediana. Assim, ainda que o valor da mediana estivesse correto,</p><p>o item estaria errado.</p><p>De todo modo, vamos calcular o valor da mediana para treinar. Primeiro, construiremos a coluna da</p><p>frequência acumulada e descobriremos a classe mediana.</p><p>Idade (𝒙) Percentual</p><p>18 ≤ 𝑥 < 25 30%</p><p>25 ≤ 𝑥 < 30 25%</p><p>30 ≤ 𝑥 < 35 20%</p><p>35 ≤ 𝑥 < 45 15%</p><p>45 ≤ 𝑥 < 60 10%</p><p>Total 100%</p><p>A classe mediana é a primeira classe com frequência acumulada maior ou igual a 50%. Dessa forma, a classe</p><p>mediana é a segunda, pois 55% ≥ 50%. Assim, a mediana é um número entre 25 e 30.</p><p>Sabendo disso, vamos calcular o valor da mediana pelo método da interpolação:</p><p>𝑀𝑑 = 𝑙𝑖𝑛𝑓 + [(∑𝑓𝑖2 ) − 𝑓𝑎𝑐𝑎𝑛𝑡𝑓𝑖 ] × ℎ</p><p>em que:</p><p>• o somatório das frequências é ∑𝑓𝑖 = 100%.</p><p>• o limite inferior da classe é 𝑙𝑖𝑛𝑓 = 25.</p><p>• a frequência acumulada da classe anterior é 𝑓𝑎𝑐𝑎𝑛𝑡 = 30%.</p><p>• a frequência da própria classe é 𝑓𝑖 = 25%.</p><p>• a amplitude da classe é ℎ = 30 − 25 = 5.</p><p>Agora podemos aplicar a fórmula:</p><p>𝑀𝑑 = 𝑙𝑖𝑛𝑓 + [(∑𝑓𝑖2 ) − 𝑓𝑎𝑐𝑎𝑛𝑡𝑓𝑖 ] × ℎ</p><p>𝑀𝑑 = 25 + [50% − 30%25% ] × 5 𝑀𝑑 = 29</p><p>Gabarito: Errado.</p><p>Idade (𝑿𝒊) Frequência (𝒇𝒊) Frequência</p><p>Acumulada</p><p>(𝒇𝒂𝒄)</p><p>18 - 25 30% 30%</p><p>25 - 30 25% 55%</p><p>30 - 35 20% 75%</p><p>35 - 45 15% 90%</p><p>45 - 60 10% 100%</p><p>Total 100%</p><p>(FCC/CNMP/2015) A tabela de frequências absolutas abaixo corresponde à distribuição dos valores dos</p><p>salários dos funcionários de nível médio lotados em um órgão público no mês de dezembro de 2014.</p><p>Observação: 𝒇𝒊 = −𝒊𝟐 + 𝟏𝟎𝒊 + 𝟏, 𝟏 ≤ 𝒊 ≤ 𝟔 .</p><p>O valor da mediana destes salários, obtido pelo método da interpolação linear, é, em R$, igual a</p><p>a) 5.320,00.</p><p>b) 5.040,00.</p><p>c) 5.260,00.</p><p>d) 4.900,00.</p><p>e) 5.400,00.</p><p>Comentários:</p><p>Nosso primeiro passo será calcular as frequências absolutas por meio da equação apresentada (𝑓𝑖 = −𝑖2 +10𝑖 + 1) no problema. Em seguida, completamos a tabela com as novas informações e calculamos as</p><p>frequências acumuladas. Assim:</p><p>Somando as frequências acumuladas chegamos a um total de 125 observações. A mediana é o termo central</p><p>do conjunto. Portanto, temos: 1252 = 62,5.</p><p>Classe de Salários</p><p>(R$)</p><p>Frequências</p><p>Absolutas</p><p>1.500 ⊢ 2.500 𝑓1</p><p>2.500 ⊢ 3.500 𝑓2</p><p>3.500 ⊢ 4.500 𝑓3</p><p>4.500 ⊢ 5.500 𝑓4</p><p>5.500 ⊢ 6.500 𝑓5</p><p>6.500 ⊢ 7.500 𝑓6</p><p>Classe de Salários (R$) Frequências Absolutas</p><p>Frequências</p><p>Acumuladas</p><p>1.500 ⊢ 2.500 𝑓1 = −12 + 10 + 1 = 10 𝟎+ 10 = 𝟏𝟎</p><p>2.500 ⊢ 3.500 𝑓2 = −22 + 10 × 2 + 2 = 17 𝟏𝟎+ 17 = 𝟐𝟕</p><p>3.500 ⊢ 4.500 𝑓3 = −32 + 10 × 3 + 3 = 22 𝟐𝟕+ 22 = 𝟒𝟗</p><p>4.500 ⊢ 5.500 𝑓4 = −42 + 10 × 4 + 4 = 25 𝟒𝟗+ 25 = 𝟕𝟒</p><p>5.500 ⊢ 6.500 𝑓5 = −52 + 10 × 5 + 5 = 26 𝟕𝟒+ 26 = 𝟏𝟎𝟎</p><p>6.500 ⊢ 7.500 𝑓6 = −62 + 10 × 6 + 6 = 25 𝟏𝟎𝟎+ 25 = 𝟏𝟐𝟓</p><p>Total 125 125</p><p>A quarta classe é a primeira a superar esse valor em termos de frequências acumuladas, portanto, ela será</p><p>nossa classe mediana. Vejamos:</p><p>Sabendo disso, podemos calcular a mediana por meio do método de interpolação linear. Temos:</p><p>𝑀𝑑 = 𝑙𝑖𝑛𝑓 + [(∑𝑓𝑖2 ) − 𝑓𝑎𝑐𝑎𝑛𝑡𝑓𝑖 ] × ℎ</p><p>em que:</p><p>o limite inferior da classe é 𝑙𝑖𝑛𝑓 = 4.500.</p><p>a frequência acumulada da classe anterior é 𝑓𝑎𝑐𝑎𝑛𝑡 = 49.</p><p>a frequência da própria classe é 𝑓𝑖 = 25.</p><p>a amplitude da classe é ℎ = 5.500 − 4.500 = 1.000.</p><p>Aplicando a fórmula, temos:</p><p>𝑀𝑑 = 4.500 + [(1252 ) − 4925 ] × 1.000</p><p>𝑀𝑑 = 4.500 + (13,525 ) × 1.000 𝑀𝑑 = 4.500 + 13,5 × 40 𝑀𝑑 = 4.500 + 540 𝑀𝑑 = 5040</p><p>Gabarito: B.</p><p>Classe de Salários (R$) Frequências Absolutas Frequências Acumuladas</p><p>1.500 ⊢ 2.500 10 10</p><p>2.500 ⊢ 3.500 17 27</p><p>3.500 ⊢ 4.500 22 49 𝟒.𝟓𝟎𝟎 ⊢ 𝟓.𝟓𝟎𝟎 𝟐𝟓 𝟕𝟒 (> 𝟔𝟐,𝟓)</p><p>5.500 ⊢ 6.500 26 100</p><p>6.500 ⊢ 7.500 25 125</p><p>Total 125 125</p><p>Propriedades da Mediana</p><p>A seguir, estudaremos algumas propriedades importantes sobre a mediana.</p><p>Para explicar essa propriedade, vamos tomar como exemplo a sequência {𝒙𝒏} = {3, 6, 8, 9, 10}, cuja</p><p>mediana é: 𝑀𝑑𝑥 = 𝑥𝑛+12 = 𝑥5+12 = 𝑥62 = 𝑥3 = 8 𝑀𝑑𝑥 = 8</p><p>Se adicionarmos o número 5 a cada um dos termos da sequência, iremos obter uma nova lista {𝑦𝑛} ={𝑥𝑛 + 5} = {8, 11, 13, 14, 15}, cuja mediana é: 𝑀𝑑𝑦 = 𝑦𝑛+12 = 𝑦5+12 = 𝑦62 = 𝑦3 = 13 𝑀𝑑𝑦 = 13</p><p>Veja que a adição do número 5 a cada um dos termos da sequência fez com que a mediana também</p><p>aumentasse em 5 unidades, indo de 8 para 13.</p><p>• Somando-se (ou subtraindo-se) uma constante 𝒄 a todos os valores de uma variável, a</p><p>mediana do conjunto fica aumentada (ou diminuída) dessa constante.</p><p>1º Propriedade</p><p>Para explicar essa propriedade, vamos tomar como exemplo a sequência {𝒙𝒏} = {3, 6, 8, 9, 10}, cuja</p><p>mediana é: 𝑀𝑑𝑥 = 𝑥𝑛+12 = 𝑥5+12 = 𝑥62 = 𝑥3 = 8 𝑀𝑑𝑥 = 8</p><p>Se multiplicarmos cada um dos termos da sequência por 5, iremos obter uma nova lista {𝑦𝑛} ={𝑥𝑛 × 5} = {15, 30, 40, 45, 50}, cuja mediana é: 𝑀𝑑𝑦 = 𝑦𝑛+12 = 𝑦5+12 = 𝑦62 = 𝑦3 = 40 𝑀𝑑𝑦 = 40</p><p>Veja que a multiplicação de cada um dos termos da sequência por 5 fez com que a mediana também</p><p>fosse multiplicada por 5, aumentando de 8 para 40.</p><p>• Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante 𝒄, a mediana do conjunto fica multiplicada (ou dividida) por esta constante.</p><p>2º Propriedade</p><p>Para explicar essa propriedade, vamos tomar como exemplo a série {𝑥𝑛} = {1, 2, 3, 4, 6, 7, 8, 9}.</p><p>Como o número de termos é par, a mediana será, por convenção, a média aritmética dos dois termos</p><p>centrais: 𝑀𝑑 = 4+62 = 5.</p><p>O desvio em relação à mediana corresponde à diferença entre cada elemento da sequência e a</p><p>mediana. Como são 8 números, teremos a mesma quantidade de desvios para calcular. Logo, basta</p><p>encontrarmos a diferença entre cada número e a mediana: 𝑑1 = 𝑥1 −𝑀𝑑 = 1 − 5 = −4 𝑑2 = 𝑥2 −𝑀𝑑 = 2 − 5 = −3 𝑑3 = 𝑥3 −𝑀𝑑 = 3 − 5 = −2 𝑑4 = 𝑥4 −𝑀𝑑 = 4 − 5 = −1 𝑑5 = 𝑥5 −𝑀𝑑 = 6 − 5 = 1 𝑑6 = 𝑥6 −𝑀𝑑 = 7 − 5 = 2 𝑑7 = 𝑥7 −𝑀𝑑 = 8 − 5 = 3 𝑑8 = 𝑥8 −𝑀𝑑 = 9 − 5 = 4</p><p>Agora, precisamos somar os valores absolutos (valores positivos) desses desvios:</p><p>∑|𝑑𝑖|8</p><p>𝑖=1 = |𝑑1| + |𝑑2| + |𝑑3| + |𝑑4| + |𝑑5| + |𝑑6| + |𝑑7| + |𝑑8|</p><p>• A soma dos desvios absolutos de uma sequência de números, em relação a um número 𝒂, é mínima quando 𝒂 é a mediana dos números.</p><p>3º Propriedade</p><p>∑|𝑑𝑖|8</p><p>𝑖=1 = |−4| + |−3| + |−2| + |−1| + |1| + |2| + |3| + |4|</p><p>∑|𝑑𝑖|8</p><p>𝑖=1 = 4 + 3 + 2 + 1 + 1 + 2 + 3 + 4 = 20</p><p>A propriedade garante que, ao calcularmos a soma dos desvios absolutos em relação à mediana, o</p><p>menor valor que encontraremos para essa sequência será 20.</p><p>Há um detalhe importante que precisamos esclarecer. Como vimos anteriormente, quando o</p><p>número de elementos do conjunto é ímpar, o valor da mediana é único e igual ao termo central.</p><p>Porém, quando o número de elementos é par, a mediana pode ser qualquer valor entre os termos</p><p>centrais, havendo infinitos valores possíveis para a mediana. Por convenção, contudo, adotamos</p><p>a média aritmética dos valores centrais.</p><p>Certo, o que isso tem a ver com a propriedade que estamos estudando? Significa dizer que, se</p><p>calcularmos a soma dos desvios absolutos para qualquer valor entre 4 e 6, que são os termos</p><p>centrais, o valor dos desvios absolutos em relação a mediana também será mínimo. A título</p><p>exemplificativo, vamos calcular os desvios em relação ao valor 4,5: 𝑑1 = 𝑥1 − 4,5 = 1 − 4,5 = −3,5 𝑑2 = 𝑥2 − 4,5 = 2 − 4,5 = −2,5 𝑑3 = 𝑥3 − 4,5 = 3 − 4,5 = −1,5 𝑑4 = 𝑥4 − 4,5 = 4 − 4,5 = −0,5 𝑑5 = 𝑥5 − 4,5 = 6 − 4,5 = 1,5 𝑑6 = 𝑥6 − 4,5 = 7 − 4,5 = 2,5 𝑑7 = 𝑥7 − 4,5 = 8 − 4,5 = 3,5 𝑑8 = 𝑥8 − 4,5 = 9 − 4,5 = 4,5</p><p>Somando os valores absolutos desses desvios:</p><p>∑|𝑑𝑖|8</p><p>𝑖=1 = |𝑑1| + |𝑑2| + |𝑑3| + |𝑑4| + |𝑑5| + |𝑑6| + |𝑑7| + |𝑑8|</p><p>∑|𝑑𝑖|8</p><p>𝑖=1 = |−3,5| + |−2,5| + |−1,5| + |−0,5| + |1,5| + |2,5| + |3,5| + |4,5|</p><p>∑|𝑑𝑖|8</p><p>𝑖=1 = 3,5 + 2,5 + 1,5 + 0,5 + 1,5 + 2,5 + 3,5 + 4,5 = 20</p><p>Como havíamos previsto, o valor também foi igual ao valor mínimo, 20.</p><p>Por último, a propriedade também garante que, para qualquer valor fora do intervalo entre 4 e 6,</p><p>encontraremos um valor maior que o mínimo. Por exemplo, vamos calcular os desvios em relação</p><p>ao valor 7: 𝑑1 = 𝑥1 − 7 = 1 − 7 = −6 𝑑2 = 𝑥2 − 7 = 2 − 7 = −5 𝑑3 = 𝑥3 − 7 = 3 − 7 = −4 𝑑4 = 𝑥4 − 7 = 4 − 7 = −3 𝑑5 = 𝑥5 − 7 = 6 − 7 = −1 𝑑6 = 𝑥6 − 7 = 7 − 7 = 0 𝑑7 = 𝑥7 − 7 = 8 − 7 = 1 𝑑8 = 𝑥8 − 7 = 9 − 7 = 2</p><p>Somando os valores absolutos desses desvios:</p><p>∑|𝑑𝑖|8</p><p>𝑖=1 = |𝑑1| + |𝑑2| + |𝑑3| + |𝑑4| + |𝑑5| + |𝑑6| + |𝑑7| + |𝑑8|</p><p>∑|𝑑𝑖|8</p><p>𝑖=1 = |−6| + |−5| + |−4| + |−3| + |−1| + |0| + |1| + |2|</p><p>∑|𝑑𝑖|8</p><p>𝑖=1 = 6 + 5 + 4 + 3 + 1 + 0 + 1 + 2 = 22</p><p>Portanto, como havíamos previsto anteriormente, o valor foi maior que o mínimo.</p><p>QUARTIL, DECIL E PERCENTIL</p><p>Já vimos que a mediana separa uma série em duas partes iguais, cada uma contendo o mesmo número de</p><p>elementos. Contudo, uma série também pode ser dividida em um número maior de partes, todas compostas</p><p>por quantidades iguais de elementos. Nesse caso, o nome da medida separatriz é atribuído de acordo com</p><p>a quantidade de partes em que a série é dividida:</p><p>• quartil: divide uma série em quatro partes iguais (𝑄1 , 𝑄2 , 𝑄3);</p><p>• quintil: divide uma série em cinco partes iguais (𝑄𝑡1 , 𝑄𝑡2 , ⋯, 𝑄𝑡5);</p><p>• decil: divide uma série em dez partes iguais (𝐷1 , 𝐷2 , ⋯, 𝐷9);</p><p>• percentil: divide uma série em cem partes iguais (𝑃1 , 𝑃2 , ⋯, 𝑃99).</p><p>Nessa seção, vamos detalhar algumas medidas separatrizes que também são muito exploradas em provas</p><p>de concursos: os quartis, os decis e os percentis.</p><p>Quartis</p><p>Denominamos de quartis os valores de uma série que a dividem em quatro partes iguais, isto é, quatro</p><p>partes contendo o mesmo número de elementos (25%). A imagem a seguir mostra os quartis de uma</p><p>distribuição hipotética:</p><p>Temos, então, 3 quartis (𝑄1 , 𝑄2 e 𝑄3) para dividir uma série em quatro partes iguais:</p><p>• 𝑄1: o primeiro quartil corresponde à separação dos primeiros 25% de elementos da série;</p><p>• 𝑄2: o segundo quartil corresponde à separação de metade dos elementos da série, coincidindo com</p><p>a mediana (𝑸𝟐 = 𝑴𝒅);</p><p>• 𝑄3: o terceiro quartil corresponde à separação dos primeiros 75% de elementos da série, ou dos</p><p>últimos 25% de elementos da série.</p><p>Para o cálculo dos quartis, empregaremos a mesma fórmula adotada no cálculo da mediana, apenas</p><p>substituindo a expressão</p><p>∑ 𝑓𝑖2 por</p><p>𝑘×∑ 𝑓𝑖4 , em que 𝑘 indica a ordem do quartil e assume valores inteiros no</p><p>intervalo de 1 a 3.</p><p>Quartil para dados não-agrupados</p><p>O cálculo do quartil para dados não-agrupados é realizado, de forma aproximada, por meio das etapas</p><p>descritas a seguir:</p><p>• 1.a etapa: determinamos a posição do quartil, por meio da expressão: 𝑷𝑸𝒌 = 𝒌 × 𝒏𝟒 (𝒌 = 𝟏, 𝟐, 𝟑);</p><p>• 2.a etapa: identificamos a posição mais próxima do rol;</p><p>• 3.a etapa: verificamos o valor que está ocupando essa posição.</p><p>Sempre que houver necessidade, teremos que organizar o conjunto de valores por ordem de magnitude.</p><p>Embora fórmula anterior possa ser utilizada para o cálculo da posição de 𝑄2, por depender de uma</p><p>aproximação, nem sempre o valor do segundo quartil resultará no valor convencionado para a</p><p>mediana. Por isso, para o cálculo de 𝑄2, vamos adotar o procedimento utilizado para encontrar a</p><p>mediana. Isto é, se o número de elementos for ímpar, 𝑄2 será representado pelo elemento que</p><p>ocupar a posição central,</p><p>𝑛+12 . Se o número de elementos do conjunto for par, 𝑄2 será representado</p><p>pela média aritmética entre os elementos que ocuparem as posições centrais,</p><p>𝑛2 e</p><p>𝑛2 + 1.</p><p>Calcular os quartis 𝑄1 , 𝑄2 e 𝑄3 para o seguinte conjunto de valores: {11, 15, 18, 12, 19, 25, 26, 16, 15, 21, 22, 27, 14, 18, 20, 24}</p><p>Reparem que os valores não estão organizados, portanto, nossa primeira tarefa será colocá-los em</p><p>ordem de magnitude (rol). Assim, teremos: {11, 12, 14, 15, 15, 16, 18, 18, 19, 20, 21, 22, 24, 25, 26, 27}</p><p>a) Cálculo de 𝑸𝟏:</p><p>Começamos determinando a posição de 𝑄1: 𝑃𝑄1 = 1 × 164 = 4</p><p>Depois, identificamos a posição mais próxima no rol. Como o resultado foi um número inteiro, a</p><p>posição mais próxima coincidirá com o valor encontrado, não havendo necessidade de aproximação.</p><p>Em seguida, verificamos o valor que está ocupando a posição identificada:</p><p>Portanto, o valor 15 corresponde a 25% do rol.</p><p>b) Cálculo de 𝑸𝟐:</p><p>Para o cálculo de 𝑄2, precisamos verificar o número de elementos do conjunto. Se o número de</p><p>elementos for ímpar, 𝑄2 será representado pelo elemento que ocupar a posição</p><p>𝑛+12 . Se o número</p><p>de elementos do conjunto for par, 𝑄2 será representado pela média aritmética entre os elementos</p><p>que ocuparem as posições</p><p>𝑛2 e</p><p>𝑛2 + 1.</p><p>No nosso exemplo, como o conjunto é formado por um número par de observações, 𝑄2 será</p><p>calculado como a média aritmética dos valores que ocupam as posições 8 e 9.</p><p>𝑄2 = 𝑋𝑛2 + 𝑋𝑛2+12 = 𝑋162 + 𝑋162 +12 = 𝑋8 + 𝑋92 = 18 + 192 = 18,5</p><p>Portanto, o valor 18,5 corresponde a 50% do rol.</p><p>𝒙𝟏 𝒙𝟐 𝒙𝟑 𝒙𝟒 𝒙𝟓 𝒙𝟔 𝒙𝟕 𝒙𝟖 𝒙𝟗 𝒙𝟏𝟎 𝒙𝟏𝟏 𝒙𝟏𝟐 𝒙𝟏𝟑 𝒙𝟏𝟒 𝒙𝟏𝟓 𝒙𝟏𝟔</p><p>11 12 14 15 15 16 18 18 19 20 21 22 24 25 26 27</p><p>c) Cálculo de 𝑸𝟑:</p><p>Começamos determinando a posição de 𝑄3: 𝑃𝑄3 = 3 × 164 = 12</p><p>Depois, identificamos a posição mais próxima no rol. Como o resultado foi um número inteiro, a</p><p>posição mais próxima coincidirá com o valor encontrado, não havendo necessidade de aproximação.</p><p>Em seguida, verificamos o valor que está ocupando a posição identificada:</p><p>Portanto, o valor 22 corresponde a 75% do rol.</p><p>Quartil para dados agrupados sem intervalos de classe</p><p>O cálculo do quartil para dados agrupados sem intervalos de classe é realizado, de forma aproximada, por</p><p>meio das etapas descritas a seguir:</p><p>• 1.a etapa: determinamos a posição do quartil, por meio da expressão: 𝑷𝑸𝒌 = 𝒌 × ∑ 𝒇𝒊𝟒 (𝒌 = 𝟏, 𝟐, 𝟑)</p><p>em que∑ 𝑓𝑖 é a soma das frequências simples;</p><p>• 2.a etapa: identificamos a posição do quartil na coluna de frequências acumuladas, isto é, a</p><p>frequência acumulada imediatamente igual ou superior à posição do quartil;</p><p>• 3.a etapa: verificamos o valor da variável que corresponde a essa posição.</p><p>Sempre que houver necessidade, teremos que incluir uma coluna de frequências acumuladas.</p><p>𝒙𝟏 𝒙𝟐 𝒙𝟑 𝒙𝟒 𝒙𝟓 𝒙𝟔 𝒙𝟕 𝒙𝟖 𝒙𝟗 𝒙𝟏𝟎 𝒙𝟏𝟏 𝒙𝟏𝟐 𝒙𝟏𝟑 𝒙𝟏𝟒 𝒙𝟏𝟓 𝒙𝟏𝟔</p><p>11 12 14 15 15 16 18 18 19 20 21 22 24 25 26 27</p><p>Embora fórmula anterior possa ser utilizada para o cálculo da posição de 𝑄2, por depender de uma</p><p>aproximação, nem sempre o valor do segundo quartil resultará no valor convencionado para a</p><p>mediana. Por isso, para o cálculo de 𝑄2, vamos adotar o procedimento utilizado para encontrar a</p><p>mediana. Isto é, se o número de elementos for ímpar, 𝑄2 será representado pelo elemento que</p><p>ocupar a posição central,</p><p>𝑛+12 . Se o número de elementos do conjunto for par, 𝑄2 será representado</p><p>pela média aritmética entre os elementos que ocuparem as posições centrais,</p><p>𝑛2 e</p><p>𝑛2 + 1.</p><p>Calcular 𝑄1, 𝑄2 e 𝑄3 da tabela de frequências a seguir, que representa a quantidade de filhos dos</p><p>professores do Estratégia Concursos:</p><p>a) Cálculo de 𝑸𝟏:</p><p>Começamos determinando a posição de 𝑄1: 𝑃𝑄1 = 1 × 284 = 7</p><p>Filhos</p><p>Frequência</p><p>(𝒇𝒊)</p><p>Frequência</p><p>Acumulada</p><p>(𝒇𝒂𝒄)</p><p>0 4 4</p><p>1 6 10</p><p>2 9 19</p><p>3 5 24</p><p>4 4 28</p><p>TOTAL 28</p><p>Depois disso, identificamos a posição na coluna de frequências acumuladas. Em seguida, verificamos</p><p>a variável que corresponde a essa posição:</p><p>Portanto, a quantidade de 1 filho corresponde a 25% do rol.</p><p>b) Cálculo de 𝑸𝟐:</p><p>Para o cálculo de 𝑄2, precisamos verificar o número de elementos do conjunto. Se o número de</p><p>elementos for ímpar, 𝑄2 será representado pelo elemento que ocupar a posição</p><p>𝑛+12 . Se o número</p><p>de elementos do conjunto for par, 𝑄2 será representado pela média aritmética entre os elementos</p><p>que ocuparem as posições</p><p>𝑛2 e</p><p>𝑛2 + 1.</p><p>No nosso exemplo, como o conjunto é formado por um número par de observações, 𝑄2 será</p><p>calculado como a média aritmética dos valores que ocupam as posições 14 e 15.</p><p>𝑄2 = 𝑋𝑛2 + 𝑋𝑛2+12 = 𝑋282 + 𝑋282 +12 = 𝑋14 + 𝑋152 = 2 + 22 = 2</p><p>Portanto, a quantidade de 2 filhos corresponde a 50% do rol.</p><p>c) Cálculo de 𝑸𝟑:</p><p>Começamos determinando a posição de 𝑄3: 𝑃𝑄3 = 3 × 284 = 21</p><p>Filhos</p><p>Frequência</p><p>(𝒇𝒊)</p><p>Frequência</p><p>Acumulada</p><p>(𝒇𝒂𝒄)</p><p>0 4 4</p><p>1 6 10 (≥ 𝟕)</p><p>2 9 19</p><p>3 5 24</p><p>4 4 28</p><p>TOTAL 28</p><p>Depois disso, identificamos a posição na coluna de frequências acumuladas. Em seguida, verificamos</p><p>a variável que corresponde a essa posição:</p><p>Portanto, a quantidade de 3 filhos corresponde a 75% do rol.</p><p>Filhos</p><p>Frequência</p><p>(𝒇𝒊)</p><p>Frequência</p><p>Acumulada</p><p>(𝒇𝒂𝒄)</p><p>0 4 4</p><p>1 6 10</p><p>2 9 19</p><p>3 5 24 (≥ 𝟐𝟏)</p><p>4 4 28</p><p>TOTAL 28</p><p>Quartil para dados agrupados em classes</p><p>O cálculo do quartil para dados agrupados em classes será realizado por meio das seguintes etapas:</p><p>• 1.a etapa: determinamos a posição do quartil, por meio da expressão:</p><p>𝑃𝑄𝑘 = 𝑘 × ∑ 𝑓𝑖4 (𝑘 = 1, 2, 3);</p><p>em que: 𝑘 = índice do quartil; ∑ 𝑓𝑖 = somatório das frequências simples.</p><p>• 2.a etapa: identificamos a posição do quartil na coluna de frequências acumuladas, isto é, a</p><p>frequência acumulada imediatamente igual ou superior à posição do quartil;</p><p>• 3.a etapa: verificamos as informações referentes à classe correspondente a essa posição; e</p><p>• 4.ª etapa: calculamos o valor do quartil por meio da fórmula apresentada a seguir, que consiste em</p><p>uma variação da fórmula da mediana para dados agrupados em classes, mudando-se apenas o 𝑘×∑ 𝑓𝑖4 :</p><p>𝑸𝒌 = 𝒍𝒊𝒏𝒇𝑸𝒌 + [𝒌 × ∑ 𝒇𝒊𝟒 − 𝒇𝒂𝒄𝒂𝒏𝒕𝒇𝑸𝒌 ] × 𝒉𝑸𝒌</p><p>em que: 𝑙𝑖𝑛𝑓𝑄𝑘 = limite inferior da classe do quartil considerado; 𝑓𝑎𝑐𝑎𝑛𝑡 = frequência acumulada da classe anterior à classe do quartil considerado; ℎ𝑄𝑘 = amplitude do intervalo de classe do quartil considerado; 𝑓𝑄𝑘 = frequência simples da classe do quartil considerado.</p><p>Sempre que houver necessidade, teremos que incluir uma coluna de frequências acumuladas.</p><p>Calcular 𝑄1, 𝑄2 e 𝑄3 da distribuição de frequências dos pesos de um grupo de 180 alunos do</p><p>Estratégia Concursos:</p><p>a) Cálculo de 𝑸𝟏:</p><p>Começamos determinando a posição de 𝑄1: 𝑃𝑄1 = 1 × ∑ 𝑓𝑖4 = 1804 = 45</p><p>Depois, identificamos a classe que representa essa posição na coluna de frequências acumuladas:</p><p>i Pesos (kg)</p><p>Frequência</p><p>(𝒇𝒊)</p><p>Frequência</p><p>Acumulada</p><p>(𝒇𝒂𝒄)</p><p>1 10 ⊢ 30 10 10</p><p>2 30 ⊢ 50 24 34</p><p>3 50 ⊢ 70 57 91</p><p>4 70 ⊢ 90 44 135</p><p>5 90 ⊢ 110 29 164</p><p>6 110 ⊢ 130 16 180</p><p>TOTAL 180</p><p>Em seguida, encontramos o valor numérico de 𝑄1 utilizando a expressão:</p><p>𝑄1 = 𝑙𝑖𝑛𝑓𝑄1 + [1 × ∑ 𝑓𝑖4 − 𝑓𝑎𝑐𝑎𝑛𝑡𝑓𝑄1 ] × ℎ𝑄1</p><p>𝑄1 = 50 + [45 − 3457 ] × 20 ≅ 53,9 𝐾𝑔</p><p>b) Cálculo de 𝑸𝟐:</p><p>Começamos determinando a posição de 𝑄2: 𝑃𝑄2 = 2 × ∑ 𝑓𝑖4 = 2 × 1804 = 90</p><p>Depois, identificamos a classe que representa essa posição na coluna de frequências acumuladas:</p><p>Em seguida, encontramos o valor numérico de 𝑄2 utilizando a expressão:</p><p>𝑄2 = 𝑙𝑖𝑛𝑓𝑄2 + [2 × ∑ 𝑓𝑖4 − 𝑓𝑎𝑐𝑎𝑛𝑡𝑓𝑄2 ] × ℎ𝑄2</p><p>𝑄2 = 50 + [90 − 3457 ] × 20 ≅ 69,7 𝐾𝑔</p><p>c) Cálculo de 𝑸𝟑:</p><p>Começamos determinando a posição de 𝑄3: 𝑃𝑄3 = 3 × ∑ 𝑓𝑖4 = 3 × 1804 = 135</p><p>Depois, identificamos a classe que representa essa posição na coluna de frequências acumuladas:</p><p>Em seguida, encontramos o valor numérico de 𝑄3 utilizando a expressão:</p><p>𝑄3 = 𝑙𝑖𝑛𝑓𝑄3 + [3 × ∑ 𝑓𝑖4 − 𝑓𝑎𝑐𝑎𝑛𝑡𝑓𝑄3 ] × ℎ𝑄3</p><p>𝑄3 = 70 + [135 − 9144 ] × 20 = 90 𝐾𝑔</p><p>Decis</p><p>Denominamos de decis os valores de uma série que a dividem em dez partes iguais, isto é, dez partes</p><p>contendo o mesmo número de elementos (10%). A imagem a seguir mostra os decis de uma distribuição</p><p>hipotética:</p><p>Temos, então, 9 decis (𝐷1 , 𝐷2, ⋯, 𝐷9) para dividir uma série em dez partes iguais:</p><p>• 𝐷1: o primeiro decil corresponde à separação dos primeiros 10% de elementos da série;</p><p>• 𝐷5: o quinto decil corresponde à separação de metade dos elementos da série, coincidindo com a</p><p>mediana (𝑫𝟓 = 𝑴𝒅);</p><p>• 𝐷𝟗: o nono decil corresponde à separação dos primeiros 90% de elementos da série, ou dos últimos</p><p>10% de elementos da série.</p><p>Para o cálculo dos decis, empregaremos a mesma fórmula adotada no cálculo da mediana, apenas</p><p>substituindo a expressão</p><p>∑ 𝑓𝑖2 por</p><p>𝑘×∑ 𝑓𝑖10 , em que 𝑘 indica a ordem do decil e assume valores inteiros no</p><p>intervalo de 1 a 9.</p><p>Decil para dados não-agrupados</p><p>O cálculo do decil segue o mesmo raciocínio empregado no cálculo do quartil para dados não-agrupados. A</p><p>primeira tarefa que devemos realizar, se houver necessidade, é organizar o conjunto de valores por ordem</p><p>de magnitude. Depois disso, procedemos conforme as seguintes etapas:</p><p>• 1.a etapa: determinamos a posição do decil, por meio da expressão: 𝑷𝑫𝒌 = 𝒌 × 𝒏𝟏𝟎 (𝒌 = 𝟏, 𝟐, ⋯ , 𝟗);</p><p>• 2.a etapa: identificamos a posição mais próxima do rol;</p><p>• 3.a etapa: verificamos o valor que está ocupando essa posição.</p><p>Calcularemos os quartis 𝐷1 e 𝐷8 para o seguinte conjunto de valores: {5, 12, 15, 20, 2, 3, 4, 18, 10, 22}</p><p>Reparem que os valores não estão organizados. Portanto, nossa primeira tarefa será colocá-los em</p><p>ordem de magnitude (rol): {2, 3, 4, 5, 10, 12, 15, 18, 20, 22}</p><p>a) Cálculo de 𝑫𝟏:</p><p>Começamos determinando a posição de 𝐷1: 𝑃𝐷1 = 1 × 1010 = 1</p><p>Depois, identificamos a posição mais próxima no rol. Como o resultado foi um número inteiro, a</p><p>posição mais próxima coincidirá com o valor encontrado, não havendo necessidade de aproximação.</p><p>Portanto, o valor 2 corresponde a 10% do rol.</p><p>b) Cálculo de 𝑫𝟖:</p><p>Começamos determinando a posição de 𝐷8: 𝑃𝐷8 = 8 × 1010 = 8</p><p>Depois, identificamos a posição mais próxima no rol. Como o resultado foi um número inteiro, a</p><p>posição mais próxima coincidirá com o valor encontrado, não havendo necessidade de aproximação.</p><p>Portanto, o valor 18 corresponde a 80% do rol.</p><p>𝒙𝟏 𝒙𝟐 𝒙𝟑 𝒙𝟒 𝒙𝟓 𝒙𝟔 𝒙𝟕 𝒙𝟖 𝒙𝟗 𝒙𝟏𝟎</p><p>2 3 4 5 10 12 15 18 20 22</p><p>𝒙𝟏 𝒙𝟐 𝒙𝟑 𝒙𝟒 𝒙𝟓 𝒙𝟔 𝒙𝟕 𝒙𝟖 𝒙𝟗 𝒙𝟏𝟎</p><p>2 3 4 5 10 12 15 18 20 22</p><p>Decil para dados agrupados sem intervalos de classe.</p><p>O cálculo do decil para dados agrupados sem intervalos de classe será realizado por meio das etapas</p><p>descritas a seguir:</p><p>• 1.a etapa: determinamos a posição do decil, por meio da expressão: 𝑷𝑫𝒌 = 𝒌 × ∑ 𝒇𝒊𝟏𝟎 (𝒌 = 𝟏, 𝟐, ⋯ , 𝟗)</p><p>em que∑ 𝑓𝑖 é a soma das frequências simples;</p><p>• 2.a etapa: identificamos a posição do decil na coluna de frequências acumuladas, isto é, a frequência</p><p>acumulada imediatamente igual ou superior à posição do decil;</p><p>• 3.a etapa: verificamos o valor da variável que corresponde a essa posição.</p><p>Sempre que houver necessidade, teremos que incluir uma coluna de frequências acumuladas.</p><p>Vamos calcular 𝐷3 e 𝐷8 da tabela de frequências a seguir, que representa a quantidade de filhos dos</p><p>professores do Estratégia Concursos:</p><p>Filhos</p><p>Frequência</p><p>(𝒇𝒊)</p><p>Frequência</p><p>Acumulada</p><p>(𝒇𝒂𝒄)</p><p>0 18 18</p><p>1 35 53</p><p>2 46 99</p><p>3 28 127</p><p>4 25 152</p><p>5 10 162</p><p>6 5 167</p><p>7 3 170</p><p>TOTAL 170</p><p>a) Cálculo de 𝑫𝟑:</p><p>Começamos determinando a posição de 𝐷3: 𝑃𝐷3 = 3 × 17010 = 51</p><p>Depois disso, identificamos a posição na coluna de frequências acumuladas. Em seguida, verificamos</p><p>a variável que corresponde a essa posição:</p><p>Portanto, a quantidade de 1 filho corresponde a 30% do rol.</p><p>b) Cálculo de 𝑫𝟖:</p><p>Começamos determinando a posição de 𝐷8: 𝑃𝐷8 = 8 × 17010 = 136</p><p>Depois disso, identificamos a posição na coluna de frequências acumuladas. Em seguida, verificamos</p><p>a variável que corresponde a essa posição:</p><p>Filhos</p><p>Frequência</p><p>(𝒇𝒊)</p><p>Frequência</p><p>Acumulada</p><p>(𝒇𝒂𝒄)</p><p>0 18 18</p><p>1 35 53 (≥ 𝟓𝟏)</p><p>2 46 99</p><p>3 28 127</p><p>4 25 152</p><p>5 10 162</p><p>6 5 167</p><p>7 3 170</p><p>TOTAL 170</p><p>Portanto, a quantidade de 4 filhos corresponde a 80% do rol.</p><p>Filhos</p><p>Frequência</p><p>(𝒇𝒊)</p><p>Frequência</p><p>Acumulada</p><p>(𝒇𝒂𝒄)</p><p>0 18 18</p><p>1 35 53</p><p>2 46 99</p><p>3 28 127</p><p>4 25 152 (≥ 𝟏𝟑𝟔)</p><p>5 10 162</p><p>6 5 167</p><p>7 3 170</p><p>TOTAL 170</p><p>Decil para dados agrupados em classes</p><p>O cálculo do decil para dados agrupados em classes será realizado por meio das seguintes etapas:</p><p>• 1.a etapa: determinamos a posição do decil, por meio da expressão:</p><p>𝑃𝐷𝑘 = 𝑘 × ∑ 𝑓𝑖10 (𝑘 = 1, 2, 3, ⋯ , 9);</p><p>em que: 𝑘 = índice do decil; ∑ 𝑓𝑖 = somatório das frequências simples.</p><p>• 2.a etapa: identificamos a posição do decil na coluna de frequências acumuladas, isto é, a frequência</p><p>acumulada imediatamente igual ou superior à posição do decil;</p><p>• 3.a etapa: verificamos as informações referentes à classe correspondente a essa posição; e</p><p>• 4.ª etapa: calculamos o valor do decil por meio da fórmula apresentada a seguir, que consiste em</p><p>uma variação da fórmula da mediana para dados agrupados em classes, mudando-se apenas o 𝑘×∑ 𝑓𝑖10 :</p><p>𝑫𝒌 = 𝒍𝒊𝒏𝒇𝑫𝒌 + [𝒌 × ∑ 𝒇𝒊𝟏𝟎 − 𝒇𝒂𝒄𝒂𝒏𝒕𝒇𝑫𝒌 ] × 𝒉𝑫𝒌</p><p>em que: 𝑙𝑖𝑛𝑓𝐷𝑘 = limite inferior da classe do decil considerado; 𝑓𝑎𝑐𝑎𝑛𝑡 = frequência acumulada da classe anterior à classe do decil considerado; ℎ𝐷𝑘 = amplitude do intervalo de classe do decil considerado; 𝑓𝐷𝑘 = frequência simples da classe do decil considerado.</p><p>Sempre que houver necessidade, teremos que incluir uma coluna de frequências acumuladas.</p><p>Calcular 𝐷1, 𝐷2 e 𝐷7 da distribuição de frequências das estaturas de um grupo de 54 alunos do</p><p>Estratégia Concursos:</p><p>a) Cálculo de 𝑫𝟏:</p><p>Começamos determinando a posição de 𝐷1: 𝑃𝐷1 = 1 × ∑ 𝑓𝑖10 = 5410 = 5,4</p><p>Depois disso, identificamos a posição na coluna de frequências acumuladas.</p><p>i Estaturas (cm)</p><p>Frequência</p><p>(𝒇𝒊)</p><p>Frequência</p><p>Acumulada</p><p>(𝒇𝒂𝒄)</p><p>1 120 ⊢ 128 6 6</p><p>2 128 ⊢ 136 12 18</p><p>3 136 ⊢ 144 16 34</p><p>4 144 ⊢ 152 13 47</p><p>5 152 ⊢ 160 7 54</p><p>TOTAL 54</p><p>Em seguida, encontramos o valor numérico de 𝐷1 utilizando a expressão:</p><p>𝐷1 = 𝑙𝑖𝑛𝑓𝐷1 + [1 × ∑ 𝑓𝑖10 − 𝑓𝑎𝑐𝑎𝑛𝑡𝑓𝐷1 ] × ℎ𝐷1</p><p>𝐷1 = 120 + [5,4 − 06 ] × 8 = 127,5 𝑐𝑚</p><p>b) Cálculo de 𝑫𝟐:</p><p>Começamos determinando a posição de 𝐷2: 𝑃𝐷2 = 2 × ∑ 𝑓𝑖10 = 2 × 5410 = 10,8</p><p>Depois, identificamos a classe que representa essa posição na coluna de frequências acumuladas:</p><p>Em seguida, encontramos o valor numérico de 𝐷2 utilizando a expressão:</p><p>𝐷2 = 𝑙𝑖𝑛𝑓𝐷2 + [2 × ∑ 𝑓𝑖10 − 𝑓𝑎𝑐𝑎𝑛𝑡𝑓𝐷2 ] × ℎ𝐷2</p><p>𝐷2 = 128 + [10,8 − 612 ] × 8 = 131,2 𝑐𝑚</p><p>c) Cálculo de 𝑫𝟕:</p><p>Começamos determinando a posição de 𝐷7: 𝑃𝐷7 = 7 × ∑ 𝑓𝑖10 = 7 × 5410 = 37,8</p><p>Depois, identificamos a classe que representa essa posição na coluna de frequências acumuladas:</p><p>Em seguida, encontramos o valor numérico de 𝐷7 utilizando a expressão:</p><p>𝐷7 = 𝑙𝑖𝑛𝑓𝐷7 + [7 × ∑ 𝑓𝑖10 − 𝑓𝑎𝑐𝑎𝑛𝑡𝑓𝐷7 ] × ℎ𝐷7</p><p>𝐷7 = 144 + [37,8 − 3413 ] × 8 = 146,3 𝑐𝑚</p><p>Percentis</p><p>Denominamos de percentis os valores de uma série que a dividem em cem partes iguais, isto é, cem partes</p><p>contendo o mesmo número de elementos (1%). A imagem a seguir mostra os percentis de uma distribuição</p><p>hipotética:</p><p>Temos, então, 99 percentis (𝑃1 , 𝑃2, ⋯, 𝑃99) para dividir uma série em cem partes iguais:</p><p>• 𝑃1: o primeiro percentil corresponde à separação do primeiro 1% de elementos da série;</p><p>• 𝑃50: o quinquagésimo percentil corresponde à separação de metade dos elementos da série,</p><p>coincidindo com a mediana (𝑷𝟓𝟎 = 𝑴𝒅);</p><p>• 𝑃99: o nonagésimo nono percentil corresponde à separação dos primeiros 99% de elementos da</p><p>série, ou do último 1% de elementos da série.</p><p>Para o cálculo dos percentis, empregaremos a mesma fórmula adotada no cálculo da mediana, apenas</p><p>substituindo a expressão</p><p>∑ 𝑓𝑖2 por</p><p>𝑘×∑ 𝑓𝑖100 , em que 𝑘 indica a ordem do percentil e assume valores inteiros no</p><p>intervalo de 1 a 99.</p><p>Percentil para dados não-agrupados</p><p>O cálculo do percentil segue o mesmo raciocínio empregado nos cálculos do quartil e do decil para dados</p><p>não-agrupados. A primeira tarefa que devemos realizar, se houver necessidade, é organizar o conjunto de</p><p>valores por ordem de magnitude. Depois disso, colocamos em prática as seguintes etapas:</p><p>• 1.a etapa: determinamos a posição do percentil, por meio da expressão: 𝑷𝑷𝒌 = 𝒌 × 𝒏𝟏𝟎𝟎 (𝒌 = 𝟏, 𝟐, ⋯ , 𝟗𝟗);</p><p>• 2.a etapa: identificamos a posição mais próxima do rol;</p><p>• 3.a etapa: verificamos o valor que está ocupando essa posição.</p><p>Calcularemos os percentis 𝑃27 e 𝑃83 para o seguinte conjunto de valores: {15, 2, 4, 6, 10, 12, 13, 7, 21, 18, 20}</p><p>Reparem que os valores não estão organizados. Portanto, nossa primeira tarefa será colocá-los em</p><p>ordem de magnitude (rol): {2, 4, 6, 7, 10, 12, 13, 15, 18, 20, 21}</p><p>a) Cálculo de 𝑷𝟐𝟕:</p><p>Começamos determinando a posição de 𝑃27: 𝑃𝑃27 = 27 × 11100 = 2,97</p><p>Depois, identificamos a posição mais próxima no rol: 𝑃𝑃27 = 3</p><p>Em seguida, verificamos o valor que está ocupando essa posição.</p><p>Portanto, o valor 6 corresponde a 27% do rol.</p><p>b) Cálculo de 𝑷𝟖𝟑:</p><p>Começamos determinando a posição de 𝑃83: 𝑃𝑃83 = 83 × 11100 = 9,13</p><p>Depois, identificamos a posição mais próxima no rol: 𝑃𝑃27 = 9</p><p>Em seguida, verificamos o valor que está ocupando essa posição.</p><p>𝒙𝟏 𝒙𝟐 𝒙𝟑 𝒙𝟒 𝒙𝟓 𝒙𝟔 𝒙𝟕 𝒙𝟖 𝒙𝟗 𝒙𝟏𝟎 𝒙𝟏𝟏</p><p>2 4 6 7 10 12 13 15 18 20 21</p><p>Portanto, o valor 18 corresponde a 83% do rol.</p><p>Percentil para dados agrupados sem intervalos de classe</p><p>O cálculo do percentil para dados agrupados sem intervalos de classe será realizado por meio das etapas</p><p>descritas a seguir:</p><p>• 1.a etapa: determinamos a posição do percentil, por meio da expressão: 𝑷𝑷𝒌 = 𝒌 × ∑ 𝒇𝒊𝟏𝟎𝟎 (𝒌 = 𝟏, 𝟐, ⋯ , 𝟗𝟗)</p><p>em que∑ 𝑓𝑖 é a soma das frequências simples;</p><p>• 2.a etapa: identificamos a posição do percentil na coluna de frequências acumuladas, isto é, a</p><p>frequência acumulada imediatamente igual ou superior à posição do percentil;</p><p>• 3.a etapa: verificamos o valor da variável que corresponde a essa posição.</p><p>Sempre que houver necessidade, teremos que incluir uma coluna de frequências acumuladas.</p><p>Vamos calcular 𝑃45 e 𝑃93 da tabela de frequências a seguir, que representa a quantidade de filhos</p><p>dos professores do Estratégia Concursos:</p><p>𝒙𝟏 𝒙𝟐 𝒙𝟑 𝒙𝟒 𝒙𝟓 𝒙𝟔 𝒙𝟕 𝒙𝟖 𝒙𝟗 𝒙𝟏𝟎 𝒙𝟏𝟏</p><p>2 4 6 7 10 12 13 15 18 20 21</p><p>a) Cálculo de 𝑷𝟒𝟓:</p><p>Começamos determinando a posição de 𝑃45: 𝑃𝑃45 = 45 × 95100 = 42,75</p><p>Depois disso, identificamos a posição na coluna de frequências acumuladas. Em seguida, verificamos</p><p>a variável que corresponde a essa posição:</p><p>Portanto, a quantidade de 2 filhos corresponde a 45% do rol.</p><p>Filhos</p><p>Frequência</p><p>(𝒇𝒊)</p><p>Frequência</p><p>Acumulada</p><p>(𝒇𝒂𝒄)</p><p>1 15 15</p><p>2 30 45</p><p>3 20 65</p><p>4 12 77</p><p>5 10 87</p><p>6 8 95</p><p>TOTAL 95</p><p>Filhos</p><p>Frequência</p><p>(𝒇𝒊)</p><p>Frequência</p><p>Acumulada</p><p>(𝒇𝒂𝒄)</p><p>1 15 15</p><p>2 30 45 (≥ 𝟒𝟑)</p><p>3 20 65</p><p>4 12 77</p><p>5 10 87</p><p>6 8 95</p><p>TOTAL 95</p><p>b) Cálculo de 𝑷𝟗𝟑:</p><p>Começamos determinando a posição de 𝑃93: 𝑃𝑃93 = 93 × 95100 = 88,35</p><p>Depois disso, identificamos a posição na coluna de frequências acumuladas. Em seguida, verificamos</p><p>a variável que corresponde a essa posição:</p><p>Portanto, a quantidade de 6 filhos corresponde a 93% do rol.</p><p>Filhos</p><p>Frequência</p><p>(𝒇𝒊)</p><p>Frequência</p><p>Acumulada</p><p>(𝒇𝒂𝒄)</p><p>1 15 15</p><p>2 30 45</p><p>3 20 65</p><p>4 12 77</p><p>5 10 87</p><p>6 8 95 (≥ 𝟖𝟖)</p><p>TOTAL 95</p><p>Percentil para dados agrupados em classes</p><p>O cálculo do percentil para dados agrupados em classes será realizado por meio das seguintes etapas:</p><p>• 1.a etapa: determinamos a posição do percentil, por meio da expressão:</p><p>𝑃𝑃𝑘 = 𝑘 × ∑ 𝑓𝑖100 (𝑘 = 1, 2, 3, ⋯ , 99);</p><p>em que: 𝑘 = índice do percentil; ∑ 𝑓𝑖 = somatório das frequências simples.</p><p>• 2.a etapa: identificamos a posição do percentil na coluna de frequências acumuladas, isto é, a</p><p>frequência acumulada imediatamente igual ou superior à posição do percentil;</p><p>• 3.a etapa: verificamos as informações referentes à classe correspondente a essa posição; e</p><p>• 4.ª etapa: calculamos o valor do percentil por meio da fórmula apresentada a seguir, que consiste</p><p>em uma variação da fórmula da mediana para dados agrupados em classes, mudando-se apenas o 𝑘×∑ 𝑓𝑖100 :</p><p>𝑷𝒌 = 𝒍𝒊𝒏𝒇𝑷𝒌 + [𝒌 × ∑ 𝒇𝒊𝟏𝟎𝟎 − 𝒇𝒂𝒄𝒂𝒏𝒕𝒇𝑷𝒌 ] × 𝒉𝑷𝒌</p><p>em que: 𝑙𝑖𝑛𝑓𝑃𝑘 = limite inferior da classe do percentil considerado; 𝑓𝑎𝑐𝑎𝑛𝑡 = frequência acumulada da classe anterior à classe do percentil considerado; ℎ𝑃𝑘 = amplitude do intervalo de classe do percentil considerado; 𝑓𝑃𝑘 = frequência simples da classe do percentil considerado.</p><p>Sempre que houver necessidade, teremos que incluir uma coluna de frequências acumuladas.</p><p>Calcular 𝑃45 e 𝑃77 da distribuição de frequências das estaturas de um grupo de 54 alunos do</p><p>Estratégia Concursos:</p><p>a) Cálculo de 𝑷𝟒𝟓:</p><p>Começamos determinando a posição de 𝑃45: 𝑃𝑃45 = 45 × ∑ 𝑓𝑖100 = 45 × 54100 = 24,30</p><p>Depois, identificamos a classe que representa essa posição na coluna de frequências acumuladas:</p><p>Em seguida, encontramos o valor numérico de 𝑃45 utilizando a expressão:</p><p>i Estaturas (cm)</p><p>Frequência</p><p>(𝒇𝒊)</p><p>Frequência</p><p>Acumulada</p><p>(𝒇𝒂𝒄)</p><p>1 120 ⊢ 128 5 5</p><p>2 128 ⊢ 136 13 18</p><p>3 136 ⊢ 144 16 34</p><p>4 144 ⊢ 152 13 47</p><p>5 152 ⊢ 160 7 54</p><p>TOTAL 54</p><p>𝑃45 = 𝑙𝑖𝑛𝑓𝑃45 + [45 × ∑ 𝑓𝑖100 − 𝑓𝑎𝑐𝑎𝑛𝑡𝑓𝑃45 ] × ℎ𝑃45</p><p>𝑃45 = 136 + [24,30 − 1816 ] × 8 = 139,15 𝑐𝑚</p><p>b) Cálculo de 𝑷𝟕𝟕:</p><p>Começamos determinando a posição de 𝑃77: 𝑃𝑃77 = 77 × ∑ 𝑓𝑖100 = 77 × 54100 = 41,04</p><p>Depois, identificamos a classe que representa essa posição na coluna de frequências acumuladas:</p><p>Em seguida, encontramos o valor numérico de 𝑃77 utilizando a expressão:</p><p>𝑃77 = 𝑙𝑖𝑛𝑓𝑃77 + [77 × ∑ 𝑓𝑖100 − 𝑓𝑎𝑐𝑎𝑛𝑡𝑓𝑃77 ] × ℎ𝑃77</p><p>𝑃77 = 144 + [41,58 − 3413 ] × 8 = 148,66 𝑐𝑚</p><p>(FCC/BANRISUL/2019) As idades dos 120 funcionários lotados em uma repartição pública estão</p><p>distribuídas conforme a tabela de frequências absolutas abaixo.</p><p>Utilizando o método da interpolação linear, obteve-se o primeiro quartil (𝑸𝟏) e a mediana (𝑴𝒅) desta</p><p>distribuição em anos. A amplitude do intervalo [𝑸𝟏,𝑴𝒅] é então igual a</p><p>a) 4,0.</p><p>b) 6,5.</p><p>c) 10,0.</p><p>d) 3,5.</p><p>e) 7,5.</p><p>Comentários:</p><p>Para calcularmos o primeiro quartil, precisamos encontrar a posição: 1𝑛4 = 1 × 1204 = 30</p><p>Agora, vamos determinar a classe em que se encontra o primeiro quartil. Devemos procurar a primeira</p><p>frequência acumulada que é maior do que ou igual a 30. Vejam que a primeira frequência acumulada já é</p><p>maior do que 30. Portanto, o primeiro quartil está na primeira classe.</p><p>Idade (x) em anos Número de funcionários 𝟐𝟎 < 𝒙 ≤ 𝟑𝟎 40 𝟑𝟎 < 𝒙 ≤ 𝟒𝟎 50 𝟒𝟎 < 𝒙 ≤ 𝟓𝟎 20 𝟓𝟎 < 𝒙 ≤ 𝟔𝟎 10</p><p>Total 120</p><p>Agora é só aplicar a fórmula do 𝑄1:</p><p>𝑄1 = 𝑙𝑖𝑛𝑓 + [1𝑛4 − 𝑓𝑎𝑐𝑎𝑛𝑡𝑓𝑖 ] × ℎ</p><p>• o limite inferior da classe é 𝑙𝑖𝑛𝑓 = 20.</p><p>• a frequência acumulada da classe anterior é 𝑓𝑎𝑐𝑎𝑛𝑡 = 0, pois não há classe anterior.</p><p>• a frequência da própria classe é 𝑓𝑖 = 40.</p><p>• a amplitude da classe é ℎ = 30 − 20 = 10.</p><p>Jogando esses valores</p><p>na fórmula, teremos: 𝑄1 = 20 + [30 − 040 ] × 10 𝑄1 = 27,5</p><p>Pronto, agora vamos calcular a mediana. Para tanto, precisamos descobrir a posição: 𝑛2 = 1202 = 60</p><p>De posse dessa informação, podemos determinar a classe em que se encontra a mediana. Devemos procurar</p><p>a primeira frequência acumulada que é maior do que ou igual a 60. A segunda frequência acumulada é maior</p><p>que 60. Portanto, a mediana está na segunda classe.</p><p>Idade em anos Número de funcionários Frequência acumulada</p><p>20 - 30 40 40 (> 30)</p><p>30 - 40 50 90</p><p>40 - 50 20 110</p><p>50 - 60 10 120</p><p>Total 120</p><p>Idade em anos Número de funcionários Frequência acumulada</p><p>20 - 30 40 40</p><p>30 - 40 50 90 (> 60)</p><p>40 - 50 20 110</p><p>50 - 60 10 120</p><p>Total 120</p><p>Agora é só aplicar a fórmula da 𝑀𝑑:</p><p>𝑀𝑑 = 𝑙𝑖𝑛𝑓 + [𝑛2 − 𝑓𝑎𝑐𝑎𝑛𝑡𝑓𝑖 ] × ℎ</p><p>• o limite inferior da classe é 𝑙𝑖𝑛𝑓 = 30.</p><p>• a frequência acumulada da classe anterior é 𝑓𝑎𝑐𝑎𝑛𝑡 = 40.</p><p>• a frequência da própria classe é 𝑓𝑖 = 50.</p><p>• a amplitude da classe é ℎ = 40 − 30 = 10.</p><p>Jogando esses valores na fórmula, teremos: 𝑀𝑑 = 30 + [60 − 4050 ] × 10 𝑀𝑑 = 34</p><p>A amplitude do intervalo [𝑄1, 𝑀𝑑] é dada pela diferença entre os extremos. 𝑀𝑑 − 𝑄1 = 34 − 27, 50 = 6, 50</p><p>Gabarito: B.</p><p>(CESPE/IPHAN/2018) Uma pesquisa a respeito das quantidades de teatros em cada uma de 11 cidades</p><p>brasileiras selecionadas apresentou o seguinte resultado: {1, 2, 2, 3, 3, 3, 4, 4, 4, 4, 4}.</p><p>Com referência a esses dados, julgue o item seguinte.</p><p>O valor do primeiro quartil do conjunto de dados (Q1/4) é igual a 3.</p><p>Comentários:</p><p>Podemos usar a seguinte fórmula para encontrar a posição do primeiro quartil: 𝑃𝑄1 = 1 × 𝑛4</p><p>Assim, temos: 1 × 114 = 2,75</p><p>Logo, o primeiro quartil está entre as posições 2 e 3. De acordo com o conjunto, o valor do primeiro quartil</p><p>é 2.</p><p>Gabarito: Errado.</p><p>(CESPE/IPHAN/2018) Uma pesquisa a respeito das quantidades de teatros em cada uma de 11 cidades</p><p>brasileiras selecionadas apresentou o seguinte resultado: {1, 2, 2, 3, 3, 3, 4, 4, 4, 4, 4}.</p><p>Com referência a esses dados, julgue o item seguinte.</p><p>O valor do terceiro quartil do conjunto de dados (Q3/4) é igual a 4.</p><p>Comentários:</p><p>Podemos usar a seguinte fórmula para encontrar a posição do terceiro quartil: 𝑃𝑄3 = 3 × 𝑛4</p><p>Assim, temos: 3 × 114 = 8,25</p><p>Logo, o terceiro quartil está entre as posições 8 e 9. De acordo com o conjunto, o valor do terceiro quartil é</p><p>4.</p><p>Gabarito: Certo.</p><p>(FGV/DPE-RJ/2014) Um levantamento sobre o local de residência das pessoas que recorrem à Defensoria</p><p>Pública indicou que 30% moram a menos de 10 quilômetros distância de um dos pontos de atendimento,</p><p>70% a menos de 20 quilômetros, 90% a menos de 30 quilômetros e que nenhuma delas mora a mais de 40</p><p>quilômetros de distância. Supondo ainda que a distribuição das distâncias, dentro das faixas especificadas</p><p>(10 Km), é uniforme pode-se afirmar que</p><p>a) A distância mediana é de 15 quilômetros e o percentil 75 é 22,5 quilômetros.</p><p>b) A distância mediana é de 20 quilômetros e o desvio-padrão é de 8 quilômetros.</p><p>c) A distância mediana é de 20 quilômetros a moda é de 18 quilômetros.</p><p>d) A distância mediana é de 15 quilômetros e o decil 9 é de 35 quilômetros.</p><p>e) A distância mediana é de 15 quilômetros e a média é de 15 quilômetros.</p><p>Comentários:</p><p>Para entendermos a questão vamos montar uma tabela com os dados fornecidos pelo enunciado.</p><p>Para identificar a mediana, precisamos encontrar o termo central da amostra. Como temos uma frequência</p><p>acumulada total de 100%, a mediana ocupará a posição representada por 50%. Dessa forma, nossa classe</p><p>mediana será o intervalo entre 10 e 20 quilômetros, pois é o primeiro a superar a marca de 50%.</p><p>Distância (𝒙)</p><p>Freq. Relativa</p><p>Acumulada</p><p>0 ≤ 𝑥 < 10 30% 𝟏𝟎 ≤ 𝒙 < 𝟐𝟎 70% (> 50%)</p><p>20 ≤ 𝑥 < 30 90%</p><p>30 ≤ 𝑥 < 40 100%</p><p>Sabendo disso, podemos aplicar a fórmula da mediana:</p><p>𝑀𝑑 = 𝑙𝑖𝑛𝑓 + [𝑛2 − 𝑓𝑎𝑐𝑎𝑛𝑡𝑓𝑖 ] × ℎ</p><p>• o limite inferior da classe é 𝑙𝑖𝑛𝑓 = 10.</p><p>• a frequência acumulada da classe anterior é 𝑓𝑎𝑐𝑎𝑛𝑡 = 30%.</p><p>• a frequência da própria classe é 𝑓𝑖 = 40%.</p><p>• a amplitude da classe é ℎ = 20 − 10 = 10.</p><p>Jogando esses valores na fórmula, teremos: 𝑀𝑑 = 10 + (50% − 30%40% ) × 10</p><p>𝑀𝑑 = 10 + (20%40%) × 10</p><p>𝑀𝑑 = 10 + (12) × 10 𝑀𝑑 = 10 + 5 = 15</p><p>Portanto, eliminamos as alternativas B e C, pois a mediana é 15 e não 20 quilômetros.</p><p>Agora, vamos calcular o septuagésimo quinto percentil (𝑃75). Para isso, precisamos identificar a classe que</p><p>corresponde à frequência acumulada de 75%. Vejamos:</p><p>Pronto, agora podemos aplicar a fórmula do percentil:</p><p>𝑃75 = 𝑙𝑖𝑛𝑓 + [75 × ∑ 𝑓𝑖100 − 𝑓𝑎𝑐𝑎𝑛𝑡𝑓𝑖 ] × ℎ</p><p>• o limite inferior da classe é 𝑙𝑖𝑛𝑓 = 20.</p><p>• a frequência acumulada da classe anterior é 𝑓𝑎𝑐𝑎𝑛𝑡 = 70%.</p><p>Distância (𝒙)</p><p>Freq. Relativa</p><p>Acumulada</p><p>0 ≤ 𝑥 < 10 30%</p><p>10 ≤ 𝑥 < 20 70% 𝟐𝟎 ≤ 𝒙 < 𝟑𝟎 90% (> 75%)</p><p>30 ≤ 𝑥 < 40 100%</p><p>• a frequência da própria classe é 𝑓𝑖 = 20%.</p><p>• a amplitude da classe é ℎ = 30 − 20 = 10.</p><p>Jogando esses valores na fórmula, teremos: 𝑃75 = 20 + [75% − 70%20% ] × 10</p><p>𝑃75 = 20 + [ 5%20%] × 10</p><p>𝑃75 = 20 + (14) × 10 𝑃75 = 20 + 2,5 = 22,5</p><p>Analisando as alternativas, observamos que a letra A está correta.</p><p>Para não restar dúvidas, vamos analisar as alternativas D e E:</p><p>• Letra D: Errada. A alternativa se refere ao nono decil, que é o valor cuja frequência relativa acumulada</p><p>vale 90%. A tabela nos mostra que esse valor corresponde a 30 km, e não a 35 km.</p><p>• Letra E: Errada. Precisamos calcular as frequências relativas simples para sabermos a média. Para isso</p><p>tomamos a diferença entre duas frequências acumuladas seguidas para termos a frequência simples.</p><p>Montando a tabela, temos:</p><p>Então, a média vale 16 km.</p><p>Gabarito: A.</p><p>Distância Ponto Médio (𝑿) Frequência Simples (𝒇) 𝑿 × 𝒇</p><p>0 ≤ 𝑥 < 10 5 0,30 1,5</p><p>10 ≤ 𝑥 < 20 15 0,40 6</p><p>20 ≤ 𝑥 < 30 25 0,20 5</p><p>30 ≤ 𝑥 < 40 35 0,10 3,5</p><p>Total 𝟏 𝟏𝟔</p><p>BOX PLOT</p><p>Um boxplot (também chamado de box-and-whisker plot) é uma ferramenta gráfica frequentemente</p><p>utilizada na análise exploratória de dados que permite visualizar a distribuição dos dados e os valores</p><p>discrepantes (outliers), assim como a distância dos valores extremos em relação à maioria dos dados. Essa</p><p>ferramenta resume cinco medidas descritivas de um conjunto de dados, incluindo: o valor mínimo, o</p><p>primeiro quartil, a mediana, o terceiro quartil e o valor máximo.</p><p>Para construir um gráfico de boxplot, usamos uma haste horizontal ou vertical e uma caixa retangular</p><p>(box). O local em que a haste começa (da esquerda para a direita) indica o valor mínimo e o ponto em que</p><p>a haste termina indica o valor máximo.</p><p>A caixa retangular, localizada no meio da haste, em geral, possui três linhas. A primeira linha, na</p><p>extremidade esquerda da caixa, indica o primeiro quartil. A terceira linha, na extremidade direita, indica</p><p>o terceiro quartil. A linha do meio, no interior da caixa, indica o segundo quartil ou a mediana. O segundo</p><p>quartil pode estar entre o primeiro e o terceiro quartis, ou pode coincidir com um, ou outro, ou ambos.</p><p>Além disso, há dois traços, chamados de whiskers (ou bigodes), ligando o valor mínimo à extremidade</p><p>esquerda da caixa e o valor máximo à extremidade direita da caixa. Cada um desses traços comporta,</p><p>aproximadamente, 25% dos dados. O restante, cerca de 50%, está distribuído no interior da caixa.</p><p>Também podemos encontrar gráficos de box plot com pontos ou asteriscos marcando valores discrepantes</p><p>(outliers). Nesses casos, os whiskers não se estendem aos valores mínimo e máximo do conjunto de dados,</p><p>mas ficam limitados a um comprimento máximo de 1,5 × 𝐷𝐼𝑄, em que 𝑫𝑰𝑸 é a distância interquartílica.</p><p>A distância interquartílica (ou amplitude interquartílica, ou intervalo interquartílico) é calculada pela</p><p>fórmula:</p><p>𝑫𝑰𝑸 = 𝑸𝟑 − 𝑸𝟏</p><p>Dessa forma, valores menores que 𝑸𝟏 − 𝟏, 𝟓 × 𝑫𝑰𝑸 ou maiores que 𝑸𝟑 + 𝟏, 𝟓 × 𝑫𝑰𝑸 são considerados</p><p>VALORES</p>o desempenho escolar de duas
turmas do 3º ano:
136
142
De acordo com o gráfico, é correto afirmar que
a) A quantidade de alunos da turma A é superior à da turma B
b) A distância interquartil da turma A é superior ao da turma B
c) A mediana da turma A é superior à mediana da turma B
d) O menor desempenho verificado na turma B foi 5
e) O maior desempenho da turma A é superior ao verificado na turma B
4. (INÉDITA/2022) A distribuição dos salários de analistas e assistentes de determinado órgão
público está representada conforme o gráfico boxplot abaixo:
Com relação aos diagramas, pode-se afirmar que
a) A amplitude interquartil dos salários dos assistentes é superior à amplitude interquartil dos
salários dos analistas.
b) Ambas as distribuições são simétricas.
c) O maior salário observado para os assistentes corresponde à mediana dos analistas.
d) A mediana dos salários dos analistas equivale ao terceiro quartil dos salários dos assistentes.
e) O maior salário dos ocupantes do cargo de analista é de R$ 10.000,00.
5. (INÉDITA/2022) A figura abaixo representa a distribuição de consumo de açúcar por um grupo
de amigos:
De acordo com o gráfico é correto afirmar que 75% do consumo corresponde à:
137
142
a) 30g
b) 25g
c) 40g
d) 50g
e) 10g
6. (INÉDITA/2022) O boxplot é uma ferramenta gráfica frequentemente utilizada na análise
exploratória de dados. Essa ferramenta resume cinco medidas descritivas de um conjunto de
dados. São elas:
a) média, mediana, moda, amplitude e variância.
b) média, mediana, moda, valor mínimo e valor máximo.
c) valor mínimo, média, mediana, valor máximo e outliers.
d) valor mínimo, moda, primeiro quartil, mediana e terceiro quartil.
e) valor mínimo, primeiro quartil, mediana, terceiro quartil e valor máximo.
7. (INÉDITA/2022) Nos gráficos boxplot é comum encontrarmos pontos ou asteriscos nas
extremidades do gráfico. A essas representações chamamos de:
a) outliers.
b) quartil inferior.
c) quartil superior.
d) distância interquartílica.
e) desvio quartílico.
8. (INÉDITA/2022) Abaixo temos uma representação gráfica da quantidade de processos
analisados por um servidor.
138
142
==8b9==
Com base no diagrama boxplot apresentado, podemos afirmar que 50% dos processos
analisados equivale a uma quantidade de processos igual a:
a) 4
b) 5
c) 6
d) 8
e) 12
9. (INÉDITA/2022) Considere o gráfico
A distância interquartílica da amostra é igual a
a) 20
b) 16
c) 18
d) 4
e) 6
10. (INÉDITA/2022) Seja uma amostra com as seguintes estatísticas: 1º quartil Q1=34; e 3º quartil
Q3=42. Com base nesses dados, podemos afirmar que os valores A1= 8, A2=16 e A3=58:
a) Nenhum dos valores pode ser considerado outliers
b) Todos os valores são outliers
c) Apenas A2 é outlier
d) Os valores de A2 e A3 são outliers
139
142
e) Apenas A3 faz parte da amostra normal
140
142
GABARITO – INÉDITAS
Box Plot
1. LETRA B
2. LETRA C
3. LETRA B
4. LETRA D
5. LETRA C
6. LETRA E
7. LETRA A
8. LETRA C
9. LETRA D
10.LETRA B
141
142

Mais conteúdos dessa disciplina