Prévia do material em texto
<p>1</p><p>Centro Universitário Ítalo Brasileiro</p><p>ESTATÍSTICA</p><p>Profa Liana Maria Ferezim Guimarães</p><p>Profa Emilia Satoshi Miyamaru Seo</p><p>2023</p><p>2</p><p>ESTATÍSTICA DESCRITIVA</p><p>CAPÍTULO 1 - DISTRIBUIÇÃO DE FREQUÊNCIAS</p><p>BIBLIOGRAFIA CONSULTADA:</p><p>1. ANDERSON, D. R.; SWEENEY, D. J.; WILLIAMS, T. A. Estatística Aplicada à Administração e</p><p>Economia. 2.ed. São Paulo: Cengage Learning, 2007.</p><p>2. BUSSAB, W. O.; MORETIN, P. Métodos Quantitativos: Estatística Básica. 5.ed. São Paulo:</p><p>Saraiva, 2002.</p><p>3. MARTINS, G. A. Estatística Geral e Aplicada. 2.ed. São Paulo: Atlas, 2002.</p><p>4. MARTINS, G. A.; DONAIRE, D. Princípios de Estatística. 4.ed. São Paulo: Atlas, 1995.</p><p>5. MEDEIROS, E. S. et al. Estatística para os Cursos de Economia, Administração e Ciências</p><p>Contábeis. vol. 1 e 2. 3.ed. São Paulo: Atlas, 1999.</p><p>6. STEVENSON, W. J. Estatística Aplicada à Administração. 3.ed. São Paulo: Harbra, 2001.</p><p>7. TRIOLA, M. F. Introdução à Estatística. 10.ed. Rio de Janeiro: LTC, 2008.</p><p>1. INTRODUÇÃO</p><p>Estatística é a ciência que fornece métodos e processos quantitativos para planejamento, coleta,</p><p>organização, descrição, análise e interpretação de dados. Dados são fatos ou números com base nos</p><p>quais podemos tirar conclusões.</p><p>A estatística realmente se constitui em usar o método científico para responder questões feitas</p><p>pelo mundo cotidiano, científico, empresarial. Os métodos estatísticos estão envolvidos em todos os</p><p>passos de um bom estudo, desde o planejamento da pesquisa, na coleta de dados, na organização e</p><p>no resumo da informação para se fazer uma análise até sua conclusão, na discussão das limitações e,</p><p>finalmente, no planejamento de novos estudos para responder às novas perguntas que surgiram. A</p><p>estatística é muito mais do que números, ela é um processo.</p><p>Particularmente em administração, economia e ciências contábeis, uma grande razão para</p><p>entender estatística é dar aos tomadores de decisão um melhor entendimento/controle do ambiente</p><p>administrativo, possibilitando decisões objetivas, previsões precisas e transmissão da mensagem</p><p>desejada de forma eficaz.</p><p>Essencialmente, toda área de pesquisa científica séria pode beneficiar-se da análise estatística.</p><p>Decisões em relação à taxa de juros, programas sociais, gastos com defesa e segurança, podem ser</p><p>feitos com inteligência somente com a ajuda da análise estatística. Profissionais da área de negócios,</p><p>em sua busca eterna por lucros, acham a estatística essencial em seus processos de tomada de</p><p>decisões. Esforços em controle de qualidade, minimização de custos, produção e estoque, e outros</p><p>tantos assuntos ligados aos negócios, podem ser administrados eficientemente usando procedimentos</p><p>estatísticos já comprovados. Para aqueles que atuam em pesquisa de mercado, a estatística é de uma</p><p>utilidade inestimável para determinar se um novo produto será um sucesso. A Estatística também é</p><p>muito útil na avaliação de oportunidades de investimento para consultores financeiros. Mesmo a</p><p>pesquisa médica, para verificar a eficiência de uma nova droga, encontra na estatística uma ótima</p><p>aliada.</p><p>3</p><p>1.1 PARTE DA NOMENCLATURA UTILIZADA EM ESTATÍSTICA</p><p>Todo ramo da pesquisa científica tem seu vocabulário próprio. Estatística não é exceção. Assim,</p><p>vamos a ele:</p><p>• População é o conjunto de todos os elementos sob investigação em determinado estudo.</p><p>Exemplos: Se a renda de todos os assalariados brasileiros for interessante para o estudo</p><p>de um economista que está ajudando o Congresso Nacional a formular um plano nacional</p><p>de impostos, então, as rendas de todos os assalariados brasileiros constituem a população.</p><p>Se o proprietário de uma indústria fabricante de pasta de dente estiver interessado na</p><p>porcentagem exata de tubos que são enchidos de acordo com as especificações, então,</p><p>todos os tubos de pasta de dente constituem a população.</p><p>Censo é um estudo ou pesquisa que envolve a população inteira e, por isso, no caso do</p><p>economista, ele está conduzindo um censo da população de assalariados brasileiros; o</p><p>proprietário da indústria de pastas de dente está conduzindo um censo da sua população</p><p>de tubos de pasta de dente. Outro exemplo muito conhecido é o censo demográfico da</p><p>população brasileira realizado pelo IBGE a cada 10 anos.</p><p>• Amostra é uma parte da população que é selecionada para estudo. Num dos exemplos acima, o</p><p>economista quer descobrir a renda média dos assalariados brasileiros, mas, não tem tempo nem</p><p>recursos suficientes para coletar esses dados. Assim, ele seleciona um pequeno número de</p><p>indivíduos da população, estuda a renda desses indivíduos e utiliza essa informação para</p><p>chegar a conclusões sobre toda a população. Essa pequena parte da população mais fácil de</p><p>trabalhar é chamada amostra. Entretanto, uma amostra deve representar efetivamente a</p><p>população.</p><p>• Uma estatística é qualquer medida que descreve a amostra. A renda média dos assalariados</p><p>brasileiros, por exemplo, é uma estatística. A porcentagem de tubos de pasta de dente da</p><p>indústria é, também, uma estatística.</p><p>• Variável é a característica da população que está sendo analisada no estudo estatístico.</p><p>• Dados estatísticos são fatos ou números que são coletados, organizados em tabelas e/ou</p><p>gráficos, analisados e interpretados tornando-se informações.</p><p>Aqui cabe um parêntesis: Dados se referem a fatos e números puros que foram</p><p>coletados, o que é diferente de informação. Informações são dados que possuem</p><p>algum tipo de significado adicional. Como exemplo, tome os números 5, 6 e 7.</p><p>Sozinhos, eles são simplesmente números. Não se sabe o que significam ou</p><p>representam. Eles são dados. Se associarmos a esses números a idade de três</p><p>crianças, passamos a ter informação, pois os números 5, 6 e 7 anos passam a ter</p><p>um significado.</p><p>• Dados brutos são uma sequência de dados estatísticos não organizados, obtidos diretamente</p><p>da observação de um fenômeno.</p><p>• Rol é a sequência ordenada de dados brutos.</p><p>4</p><p>1.2 A IMPORTÂNCIA DA AMOSTRA</p><p>Como mencionado anteriormente, muito do trabalho do estatístico é feito com amostras.</p><p>Amostras são necessárias, pois frequentemente a população é demasiadamente grande para ser</p><p>estudada. Isso levaria muito tempo e também seria muito caro, então, devemos escolher uma amostra</p><p>da população, calcular a estatística da amostra e usá-la para estimar o valor correspondente para a</p><p>população.</p><p>Essa análise da amostra determina dois ramos distintos da Estatística: a estatística descritiva e a</p><p>estatística inferencial. A Estatística Descritiva é o processo de coletar, organizar e apresentar os</p><p>dados de maneira que seja rápido e fácil interpretá-los. A Estatística Inferencial utiliza-se de uma</p><p>amostra para tirar alguma conclusão sobre a população da qual a amostra foi selecionada.</p><p>A exatidão de qualquer estimativa é de extrema importância. Ela depende, em grande parte, da</p><p>maneira com que a amostra foi escolhida e quão cuidadosa foi essa escolha para se certificar que essa</p><p>amostra é um retrato fiel da população.</p><p>Contudo, não é raro que a amostra não represente exatamente a população e que ocorra um</p><p>erro amostral. Existe pelo menos duas possíveis causas para esse erro. A primeira fonte de erro</p><p>amostral nasce do processo de escolha da amostra. Devido ao fator aleatório na seleção dos elementos</p><p>da amostra é possível, sem conhecimento, escolher elementos que são atípicos e que, portanto, não</p><p>representam a população. Para estimar a característica da população, é possível, por exemplo, escolher</p><p>um elemento na amostra que está extremamente anormal, o que produzirá uma estimativa que não</p><p>representa a população. Por outro lado, a aleatoriedade na escolha pode produzir um grande número</p><p>de elementos da amostra que são valores extremamente baixos causando subestimação do parâmetro</p><p>desejado. Nos dois casos houve um erro amostral. Uma amostra viciada é outro erro amostral porém</p><p>mais grave. A amostra é considerada</p><p>A moda também é pouco afetada por algumas observações atípicas e, continua sendo 6, mesmo</p><p>se o último valor fosse 80. De qualquer maneira, se não há moda ou se o conjunto de dados for</p><p>bimodal, seu uso pode ser confuso.</p><p>Isso não significa que uma medida é melhor que a outra. A medida escolhida depende da</p><p>natureza dos dados ou da maneira como os dados são usados. Por exemplo, uma loja de equipamentos</p><p>para camping, fará pouco uso da informação de que o tamanho médio das botas para escaladas</p><p>vendidas é 41,8. Muito mais útil, para decisões nos negócios, seria conhecer a moda do tamanho das</p><p>botas, pois saberia que o tamanho mais vendido é o 40.</p><p>Entretanto, suponha que essa loja deseja colocar no mercado uma nova barraca. As dimensões</p><p>da barraca dependem, dentre outras coisas, da estatura média dos adultos.</p><p>A experiência tem mostrado que a média serve muito bem como uma medida de tendência</p><p>central quando se trata de produtos confeccionados para uso de pessoas. O tamanho das portas, a</p><p>altura do pé-direito em casas, os balcões em lojas e muitas mobílias produzidas têm como base a</p><p>estatura média dos adultos.</p><p>39</p><p>B) VARIÁVEIS DISCRETAS</p><p>B.1 Média x de uma distribuição de frequências</p><p>Se os dados são provenientes de uma variável discreta, deve-se utilizar a média aritmética</p><p>ponderada, considerando as frequências absolutas fi como sendo as ponderações dos elementos xi</p><p>correspondentes.</p><p>Deve-se, portanto, utilizar a fórmula da média ponderada para determinar a média de uma</p><p>distribuição de frequências:</p><p>n</p><p>f.x</p><p>f</p><p>f.x</p><p>x</p><p>n</p><p>1i</p><p>ii</p><p>n</p><p>1i</p><p>i</p><p>n</p><p>1i</p><p>ii </p><p>=</p><p></p><p></p><p>= =</p><p>=</p><p>=</p><p>com fi sendo a frequência da i-ésima classe e nf</p><p>n</p><p>1i</p><p>i =</p><p>=</p><p>, onde n é o número total de observações.</p><p>Exemplo 6: Sem perda de informação. O departamento de trânsito da cidade de São Paulo coletou o</p><p>número de acidentes ocorridos em certo cruzamento de ruas na zona oeste, por 25 dias úteis do mês</p><p>de março, com o objetivo de estudar a possibilidade de colocação de um semáforo no citado</p><p>cruzamento. A seguir, foi determinado o número médio de acidentes, com os dados apresentados na</p><p>tabela abaixo:</p><p>No de acidentes</p><p>xi</p><p>No de dias</p><p>fi</p><p>xi. fi</p><p>0 2 0</p><p>5 4 20</p><p>10 5 50</p><p>15 10 150</p><p>20 2 40</p><p>25 1 25</p><p>30 1 30</p><p>Total n = 25 315</p><p>Solução:</p><p>136,12</p><p>25</p><p>315</p><p>n</p><p>f.x</p><p>x</p><p>n</p><p>1i</p><p>ii</p><p>==</p><p></p><p>= = acidentes/dia</p><p>B.2 Mediana x~ de uma distribuição de frequências</p><p>Se os dados, provenientes de uma variável discreta, estão apresentados em tabelas, eles já</p><p>estão naturalmente ordenados. Como a mediana é o elemento que ocupa a posição central do conjunto</p><p>ordenado de dados, basta verificar se o número de elementos da série é ímpar ou par.</p><p>40</p><p>• n = ímpar a mediana será o elemento central, ordem =</p><p>2</p><p>1n +</p><p>• n = par a mediana será a média aritmética entre os elementos centrais, ordem =</p><p>2</p><p>n</p><p>e 1</p><p>2</p><p>n</p><p>+</p><p>Exemplo 7: Determinando a mediana do conjunto de dados do Exemplo 6.</p><p>No de acidentes</p><p>xi</p><p>No de dias</p><p>fi</p><p>Frequência Acumulada</p><p>Fac</p><p>0 2 2</p><p>5 4 6</p><p>10 5 11</p><p>15 10 21 (13o elemento)</p><p>20 2 23</p><p>25 1 24</p><p>30 1 25</p><p>Total n = 25 --------------------------------</p><p>Solução:</p><p>Como n = 25 (ímpar), o elemento central é 13</p><p>2</p><p>125</p><p>2</p><p>1n</p><p>=</p><p>+</p><p>=</p><p>+</p><p>(13o elemento).</p><p>Após calcular a posição da mediana, abre-se a coluna de Fac e, pelas frequências acumuladas,</p><p>encontra-se a posição da mediana. O valor xi que é o elemento central corresponde à mediana.</p><p>Neste exemplo, portanto:</p><p>15x~ = acidentes/dia</p><p>Exemplo 8: Uma indústria metalúrgica embala peças em caixas com 100 unidades. O controle de</p><p>qualidade selecionou 50 caixas na linha de produção e anotou em cada caixa o número de peças</p><p>defeituosas. A seguir, obteve a seguinte distribuição de frequências:</p><p>No de peças defeituosas</p><p>xi</p><p>No de caixas</p><p>fi</p><p>Frequência Acumulada</p><p>Fac</p><p>0 15 15</p><p>1 10 25 (25o elemento)</p><p>2 12 37 (26o elemento)</p><p>3 8 45</p><p>4 5 50</p><p>Total n = 50 --------------------------------</p><p>Solução:</p><p>Observando a coluna das frequências acumuladas, sendo n = 50 (par), os elementos centrais são:</p><p>25</p><p>2</p><p>50</p><p>2</p><p>n</p><p>== (25o elemento) 1 peça defeituosa/caixa</p><p>261</p><p>2</p><p>50</p><p>1</p><p>2</p><p>n</p><p>=+=+ (26o elemento) 2 peças defeituosas/caixa</p><p>A mediana é, nesse caso, a média aritmética desses dois elementos:</p><p>5,1</p><p>2</p><p>21</p><p>x~ =</p><p>+</p><p>= peças defeituosas/caixa</p><p>41</p><p>B.3 Moda x* de uma distribuição de frequências</p><p>É o valor que ocorre com maior frequência na distribuição. Para distribuições sem agrupamento</p><p>de classes, a identificação da moda é facilitada pela simples observação do elemento que se apresenta</p><p>com maior frequência.</p><p>Exemplo 9: Determinando a moda do conjunto de dados do Exemplo 6.</p><p>No de acidentes</p><p>xi</p><p>No de dias</p><p>fi</p><p>0 2</p><p>5 4</p><p>10 5</p><p>15 10</p><p>20 2</p><p>25 1</p><p>30 1</p><p>Total n = 25</p><p>Solução:</p><p>Por observação, a moda é 15, ou seja, x* = 15, pois esse valor aparece com maior frequência nesta</p><p>distribuição (10 vezes).</p><p>C) VARIÁVEL CONTÍNUA</p><p>C.1 Média x de uma distribuição de frequências</p><p>Se os dados apresentados são classificados como variável contínua, deve-se utilizar para o</p><p>cálculo da média, a média aritmética ponderada. Nesse caso, consideram-se as frequências absolutas</p><p>das classes como sendo as ponderações dos pontos médios destas classes.</p><p>Exemplo 10: Com perda de informação. Os salários (em R$) de 25 funcionários selecionados em uma</p><p>empresa estão representados na tabela abaixo. Determinando o salário médio dessa distribuição,</p><p>obtem-se:</p><p>Classe Salários (em R$)</p><p>Ponto médio da classe</p><p>xi</p><p>No de funcionários</p><p>f i</p><p>xi.fi</p><p>1 1.000,00 1.200,00 1.100,00 2 2.200,00</p><p>2 1.200,00 1.400,00 1.300,00 6 7.800,00</p><p>3 1.400,00 1.600,00 1.500,00 10 15.000,00</p><p>4 1.600,00 1.800,00 1.700,00 5 8.500,00</p><p>5 1.800,00 2.000,00 1.900,00 2 3.800,00</p><p>Total n = 25 37.300,00</p><p>Obs.: Os pontos médios das classes (xi) são determinados tomando-se a média aritmética entre o</p><p>extremo inferior e superior de cada classe.</p><p>Solução:</p><p>00,492.1</p><p>25</p><p>300.37</p><p>n</p><p>f.x</p><p>x</p><p>n</p><p>1i</p><p>ii</p><p>==</p><p></p><p>= = reais/funcionário</p><p>42</p><p>C.2 Mediana x~ de uma distribuição de frequências</p><p>Se os dados apresentados são classificados como variável contínua, deve-se utilizar para o</p><p>cálculo da mediana, o procedimento a seguir.</p><p>1. Calcula-se a ordem</p><p>2</p><p>n</p><p>(como a variável é contínua, não se preocupe se n é par ou ímpar);</p><p>2. Pela frequência acumulada Fac, identifica-se a classe que contém a mediana (classe da x~ );</p><p>3. Então, utiliza-se a fórmula:</p><p>x~</p><p>Md</p><p>ant,ac</p><p>Md</p><p>f</p><p>h.F</p><p>2</p><p>n</p><p>I</p><p></p><p></p><p></p><p></p><p></p><p></p><p>−</p><p>+=</p><p>onde: IMd = limite inferior da classe da mediana;</p><p>n = número total de elementos;</p><p>Fac,ant = soma das frequências absolutas anteriores à classe da mediana;</p><p>h = amplitude da classe da mediana;</p><p>fMd = frequência absoluta da classe da mediana.</p><p>Exemplo 11: Determinando a mediana da situação apresentada no Exemplo 10.</p><p>Classe Salários (em R$)</p><p>No de funcionários</p><p>f i</p><p>Fac</p><p>1 1.000,00 1.200,00 2 2</p><p>2 1.200,00 1.400,00 6 8</p><p>3 1.400,00 1.600,00 10 18 (classe da x~ )</p><p>4 1.600,00 1.800,00 5 23</p><p>5 1.800,00 2.000,00 2 25</p><p>Total 25 --------------------------</p><p>Solução:</p><p>1o passo: Calcula-se</p><p>2</p><p>n</p><p>. Como n = 25, têm-se 135,12</p><p>2</p><p>25</p><p>= (13a posição);</p><p>2o passo: Identifica-se a classe da mediana pela Fac. Neste caso, a classe da mediana é a 3a classe, ou</p><p>seja, 1.400,00 1.600,00;</p><p>3o passo: Aplica-se a fórmula:</p><p>x~</p><p>Md</p><p>ant,ac</p><p>Md</p><p>f</p><p>h.F</p><p>2</p><p>n</p><p>I</p><p></p><p></p><p></p><p></p><p></p><p></p><p>−</p><p>+=</p><p>Neste caso: IMd = limite inferior da classe da mediana = 1.400,00</p><p>n = número total de elementos = 25</p><p>Fac,ant = soma das frequências absolutas anteriores à classe da mediana = 8</p><p>h = amplitude da classe da mediana = 200,00</p><p>fMd = frequência absoluta da classe da mediana = 10</p><p>43</p><p>Ou seja: x~ 00,490.1</p><p>10</p><p>00,200.8</p><p>2</p><p>25</p><p>00,1400 =</p><p></p><p></p><p></p><p></p><p></p><p></p><p>−</p><p>+= reais/funcionário</p><p>C.3 Moda x* de uma distribuição de frequências</p><p>Se os dados apresentados são classificados como variável contínua,</p><p>pode-se optar por vários</p><p>procedimentos, como moda de Pearson, moda de King, moda de Czuber, entre outros, para se</p><p>determinar a moda. Será dado destaque à moda de Czuber.</p><p>MODA DE CZUBER</p><p>CZUBER levou em consideração, em sua fórmula, a frequência absoluta da classe anterior, a</p><p>frequência absoluta da classe posterior, além da frequência absoluta da classe modal, o que leva a um</p><p>valor mais preciso para a moda de uma variável contínua. A fórmula de Czuber é a seguinte:</p><p>x*</p><p>( )</p><p>)ff(f2</p><p>h.ff</p><p>I</p><p>postantMo</p><p>antMo</p><p>Mo</p><p>+−</p><p>−</p><p>+=</p><p>onde: IMo = limite inferior da classe modal;</p><p>fMo = frequência absoluta da classe modal;</p><p>fant = frequência absoluta da classe anterior à classe modal;</p><p>fpost = frequência absoluta da classe posterior à classe modal;</p><p>h = amplitude do intervalo de classe.</p><p>Exemplo 12: Determinando a moda de Czuber para a situação apresentada no Exemplo 10.</p><p>Classe Salários (em R$)</p><p>No de funcionários</p><p>fi</p><p>1 1.000,00 1.200,00 2</p><p>2 1.200,00 1.400,00 6</p><p>3 1.400,00 1.600,00 10</p><p>4 1.600,00 1.800,00 5</p><p>5 1.800,00 2.000,00 2</p><p>Total 25</p><p>Solução:</p><p>Por observação, a classe modal é a terceira classe, já que esta é a classe de maior frequência. Neste</p><p>caso,</p><p>IMo = limite inferior da classe modal = 1.400,00</p><p>fMo = frequência absoluta da classe modal = 10</p><p>fant = frequência absoluta da classe anterior à classe modal = 6</p><p>fpost = frequência absoluta da classe posterior à classe modal = 5</p><p>h = amplitude do intervalo de classe = 200,00</p><p>Ou seja: x*</p><p>( )</p><p>89,488.1</p><p>)56(10.2</p><p>00,200.610</p><p>00,400.1 =</p><p>+−</p><p>−</p><p>+= reais/funcionário</p><p>Observação Importante: Ocorrem, algumas vezes, dois ou mais picos distintos de igual frequência nos</p><p>dados. Nesses casos, a distribuição é bimodal (duas modas) ou de modas múltiplas, respectivamente.</p><p>44</p><p>1.2 MEDIDAS DE DISPERSÃO</p><p>Em nosso esforço para descrever um conjunto de números, vimos que é útil localizar o centro do</p><p>conjunto de dados. Mas identificar a medida de tendência central raramente é suficiente. Uma descrição</p><p>completa de dados pode ser obtida se medirmos o quanto os dados estão dispersos ao redor do ponto</p><p>central. É exatamente o que as medidas de dispersão fazem. Elas mostram o quanto as observações</p><p>desviam-se de sua média.</p><p>Considere, por exemplo, os três pequenos conjuntos de dados:</p><p>X : 10, 10, 10, 10, 10, 10, 10, 10, 10, 10</p><p>Y : 7, 8, 9, 9, 10, 10, 11, 11, 12, 13</p><p>Z : 3, 4, 5, 6, 10, 10, 14, 15, 16, 17</p><p>Os três conjuntos têm uma característica comum, que é o valor da média. Essa média é 10 para</p><p>as três séries. Entretanto, elas diferem entre si com relação ao agrupamento dos dados em torno dessa</p><p>média. Na série X todos os dados são iguais a 10 e, portanto, a média representa muito bem essa</p><p>série. Na sequência Y vê-se que vários dados diferem da média, mas estão próximos dela, ou seja,</p><p>apresentam grande concentração em torno de 10: a média 10 representa razoavelmente bem a série.</p><p>Na sequência Z existem muitos valores muito afastados do valor 10 e, portanto, a média 10 não</p><p>representa muito bem a série.</p><p>Chamando de dispersão ou variabilidade a maior ou menor diversificação dos valores de uma</p><p>variável em torno de um valor de tendência central tomado como ponto de comparação, pode-se dizer</p><p>que o conjunto X apresenta uma dispersão ou variabilidade nula e que o conjunto Y apresenta uma</p><p>dispersão ou variabilidade menor que o conjunto Z.</p><p>Em resumo, em X os dados estão totalmente concentrados na média 10 e, portanto, não há</p><p>dispersão de dados. Em Y existe forte concentração de dados em torno da média e fraca dispersão.</p><p>Em Z há fraca concentração de valores em torno da média e grande dispersão de dados.</p><p>Portanto, para qualificar os valores de uma dada variável, ressaltando a maior ou menor</p><p>dispersão entre esses valores e sua medida de posição, a Estatística recorre às medidas de dispersão.</p><p>Dessas medidas, serão estudadas a amplitude total, a variância, o desvio padrão e o coeficiente</p><p>de variação.</p><p>D.1 AMPLITUDE TOTAL</p><p>A amplitude total é a diferença entre o maior e o menor valor observado:</p><p>mínmáxT xxA −=</p><p>A amplitude total tem o inconveniente de só levar em conta os dois valores extremos da série,</p><p>descuidando do conjunto de valores intermediários, o que quase sempre invalida a idoneidade do</p><p>resultado. Ela é apenas uma indicação aproximada da dispersão.</p><p>Exemplo 13: Determinando a amplitude total para a variável discreta (no de acidentes) descrita no</p><p>Exemplo 6.</p><p>Solução:</p><p>30030AT =−= acidentes</p><p>Exemplo 14: Determinando a amplitude total para a variável contínua (salários) descrita no Exemplo 10.</p><p>Solução:</p><p>100010002000AT =−= reais</p><p>45</p><p>D.2 VARIÂNCIA E DESVIO PADRÃO</p><p>Como comentado, a amplitude total é instável por ser influenciada por valores extremos, que</p><p>são, na sua maioria, devidos ao acaso.</p><p>A variância e o desvio padrão são medidas que não possuem essa falha, pois levam em</p><p>consideração a totalidade dos valores da variável em estudo, o que faz dessas medidas, índices de</p><p>dispersão bastante estáveis, e por isso mesmo, os mais empregados.</p><p>A variância baseia-se nos desvios em torno da média, determinando, porém, a média dos</p><p>quadrados dos desvios das observações em relação à média.</p><p>Assim, para o cálculo da variância é mais interessante o uso das fórmulas:</p><p>n</p><p>f.)x(</p><p>)x( i</p><p>2</p><p>i2 −</p><p>= Variância populacional</p><p>onde = ifn</p><p>1n</p><p>f.)xx(</p><p>)x(s i</p><p>2</p><p>i2</p><p>−</p><p>−</p><p>=</p><p></p><p>Variância amostral</p><p>Sendo a variância calculada a partir dos quadrados dos desvios, ela é um número em unidade</p><p>quadrada em relação à variável em questão, o que, sob o ponto de vista prático é um inconveniente.</p><p>Por isso mesmo, imaginou-se uma medida que tem utilidade e interpretação práticas,</p><p>denominada desvio padrão, definido como a raiz quadrada do valor da variância, ou seja:</p><p>= 2)x( Desvio padrão populacional</p><p>s</p><p>2)x(s = Desvio padrão amostral</p><p>Exemplo 15: O Sr. Bonani é o gerente da empresa "Investimentos Ninho Seguro". Recentemente,</p><p>Bonani estava interessado nas taxas de retorno de dois fundos de investimentos durante os últimos</p><p>cinco anos. Megainvest Inc. apresentou taxas de rendimentos de 12%, 10%, 13%, 9% e 11% nesse</p><p>período, enquanto as taxas da Dinâmica Empresarial foram de 13%, 12%, 14%, 10% e 6%. Um cliente</p><p>procurou Bonani e mostrou-se interessado em investir em fundos. Qual deles Bonani deve escolher</p><p>para seu cliente?</p><p>Solução:</p><p>Os dois fundos oferecem taxa média de retorno de 11% (calcule!). O investimento mais seguro é aquele</p><p>que tem o menor grau de risco, ou seja, o menor desvio padrão.</p><p>Para a Megainvest, Bonani encontra variância e desvio padrão, respectivamente, iguais a:</p><p>1n</p><p>f.)xx(</p><p>)x(s i</p><p>2</p><p>i2</p><p>−</p><p>−</p><p>=</p><p></p><p>5,2</p><p>15</p><p>)1111()119()1113()1110()1112( 22222</p><p>=</p><p>−</p><p>−+−+−+−+−</p><p>=</p><p>s</p><p>2)x(s = 58,15,2 == %</p><p>Para Dinâmica Empresarial:</p><p>1n</p><p>f.)xx(</p><p>)x(s i</p><p>2</p><p>i2</p><p>−</p><p>−</p><p>=</p><p></p><p>10</p><p>15</p><p>)116()1110()1114()1112()1113( 22222</p><p>=</p><p>−</p><p>−+−+−+−+−</p><p>=</p><p>s</p><p>2)x(s = 16,310 == %</p><p>Portanto, como Megainvest e Dinâmica têm as mesmas taxas médias de retorno de investimentos,</p><p>observamos, pelo desvio padrão, que a primeira apresenta menor risco e deve ser a aplicação</p><p>escolhida.</p><p>46</p><p>Exemplo 16: Determinando a variância amostral e o respectivo desvio padrão para a variável discreta</p><p>descrita no Exemplo 6.</p><p>Solução:</p><p>Para facilitar o cálculo da variância e do desvio padrão, monta-se a tabela abaixo, usando</p><p>60,12x = acidentes/dia:</p><p>No de acidentes</p><p>xi</p><p>No de dias</p><p>fi</p><p>if.</p><p>2)xix( −</p><p>0 2 317,52</p><p>5 4 231,04</p><p>10 5 33,80</p><p>15 10 57,60</p><p>20 2 109,52</p><p>25 1 153,76</p><p>30 1 302,76</p><p>Total 25 1206,00</p><p>1n</p><p>f.)xx(</p><p>)x(s i</p><p>2</p><p>i2</p><p>−</p><p>−</p><p>=</p><p></p><p>= 25,50</p><p>125</p><p>206.1</p><p>=</p><p>−</p><p>s</p><p>2s = , logo 09,725,50s ==</p><p>Portanto, o desvio padrão amostral é, aproximadamente, 7 acidentes/dia. Assim, o departamento de</p><p>trânsito pode decidir se é necessária a colocação de um semáforo nesse cruzamento, baseando-se no</p><p>desvio padrão, ou seja, na flutuação do número de acidentes diários que varia</p><p>de 5 a 19 acidentes.</p><p>Exemplo 17: O diretor de vôos da TAL requer informações relativas à dispersão do número de</p><p>passageiros. Decisões relativas à escala de horários, ao tamanho mais eficiente dos aviões para serem</p><p>usados, dependem da variação do número de passageiros. Se essa variação em número de</p><p>passageiros for grande, aviões maiores serão necessários para que se evite super lotação em dias</p><p>determinados. É necessário, portanto, calcular a variância e o respectivo desvio padrão. A tabela de</p><p>frequências para a TAL é a seguinte (foi considerado aqui dados agrupados em classes):</p><p>Classe</p><p>(passageiros)</p><p>Ponto médio</p><p>da classe</p><p>xi</p><p>No de dias</p><p>f i</p><p>xi.fi</p><p>if.</p><p>2)xix( −</p><p>50 60 55 3 165 1756,92</p><p>60 70 65 7 455 1411,48</p><p>70 80 75 18 1350 317,52</p><p>80 90 85 12 1020 403,68</p><p>90 100 95 8 760 1997,12</p><p>100 110 105 2 210 1331,28</p><p>Total ----- 50 3960 7218,00</p><p>Solução:</p><p>Para facilitar o cálculo da variância e do desvio padrão, montou-se a tabela acima. Calcula-se a média</p><p>como:</p><p>20,79</p><p>50</p><p>3960</p><p>n</p><p>f.x</p><p>x</p><p>n</p><p>1i</p><p>ii</p><p>===</p><p></p><p>= passageiros</p><p>A variância e do desvio padrão, são, portanto:</p><p>47</p><p>1n</p><p>f.)xx(</p><p>)x(s i</p><p>2</p><p>i2</p><p>−</p><p>−</p><p>=</p><p></p><p>= 31,147</p><p>150</p><p>7218</p><p>=</p><p>−</p><p>s</p><p>2s = , logo 14,1231,147s == passageiros</p><p>Portanto, o diretor de vôos pode decidir se os atuais aviões acomodam as flutuações do número de</p><p>passageiros baseando-se no desvio padrão de 12,14. Caso não acomodem, talvez aviões maiores</p><p>sejam usados nos dias com maior número de passageiros.</p><p>D.3 FORMAS USUAIS DE UTILIZAÇÃO DO DESVIO PADRÃO</p><p>D.3.1 O TEOREMA DE CHEBYSHEV</p><p>O Teorema de Chebyshev foi formulado pelo matemático russo Pafnuty Chebyshev (1821-1894).</p><p>Ele enuncia que, em qualquer conjunto de dados, pelo menos</p><p>2K</p><p>1</p><p>1− por cento das observações</p><p>encontra-se a uma distância de K desvios padrão da média, onde K é qualquer número maior que 1.</p><p>O Teorema de Chebyshev é expresso como:</p><p></p><p></p><p></p><p></p><p></p><p></p><p>−</p><p>2K</p><p>1</p><p>1</p><p>Por exemplo, se construirmos um intervalo cujo limite superior é a média mais três (K = 3)</p><p>desvios padrão e o inferior é a média menos três desvios padrão, então, pelo menos</p><p>%89,888889,0</p><p>3</p><p>1</p><p>1</p><p>2</p><p>=</p><p></p><p></p><p></p><p></p><p></p><p>− de todas as observações estão dentro desse intervalo.</p><p>Exemplo 18: No nosso exemplo anterior, os dados agrupados da viação aérea TAL revelaram uma</p><p>média de 79,20 passageiros por dia, com desvio padrão de 12,14. Para montar a escala de horários</p><p>para uma nova rota, o gestor quer saber quão frequente o número de passageiros está no intervalo de</p><p>K = 2 desvios padrão em relação à média e qual é esse intervalo.</p><p>Solução:</p><p>Se movermos dois desvios padrão (2 x 12,14 =) 24,28 acima ou abaixo da média de 79,20, obtemos o</p><p>intervalo de (79,20 - 24,28 =) 54,92 a (79,20 + 24,28 =) 103,48 passageiros. Termos, então, que pelo</p><p>menos:</p><p>%7575,0</p><p>2</p><p>1</p><p>1</p><p>2</p><p>=</p><p></p><p></p><p></p><p></p><p></p><p>− dos dias, o número de passageiros foi entre 55 e 103 passageiros.</p><p>Portanto, em pelo menos, 75% dos dias, isto é, 37 dias (75% de 50 dias), o número de passageiros</p><p>esteve entre 55 e 103. Isso fornece à gestão da TAL uma valiosa informação em relação ao número de</p><p>passageiros podendo preparar-se melhor para as operações de vôo.</p><p>D.3.2 COEFICIENTE DE VARIAÇÃO</p><p>O desvio padrão por si só não representa muita coisa. Assim, um desvio padrão de 2 unidades</p><p>pode ser considerado pequeno para uma série de valores cuja média é 200, mas, se a média for 20, o</p><p>mesmo não pode ser dito.</p><p>48</p><p>Para contornar essa limitação, deve-se calcular o coeficiente de variação, que serve como uma</p><p>medida relativa de dispersão. O coeficiente de variação indica o grau de dispersão do conjunto de</p><p>dados em relação a sua média. Ele é calculado dividindo-se o desvio padrão pela respectiva média e</p><p>multiplicando o resultado por 100.</p><p>100.</p><p>x</p><p>CV</p><p></p><p>= ou 100.</p><p>x</p><p>s</p><p>CV =</p><p>Exemplo 19: Os dados agrupados da TAL (exemplo 20) registram uma média de 79,20 passageiros por</p><p>dia, com um desvio padrão de 12,14 passageiros. Suponha que a TAL também coletou dados, durante</p><p>o mesmo período, para o número de milhas voadas pela companhia e que a média diária e o desvio</p><p>padrão são, respectivamente, 1267,5 e 152,7 milhas. O alto desvio padrão para as milhas voadas pode</p><p>sugerir que esses dados exibem uma variação maior que para o número de passageiros. Contudo, se</p><p>calcularmos o coeficiente de variação para o número de passageiros, encontraremos:</p><p>%33,15100.</p><p>20,79</p><p>14,12</p><p>CV ==</p><p>enquanto que para milhas, encontraremos:</p><p>%05,12100.</p><p>5,1267</p><p>7,152</p><p>CV ==</p><p>Está claro, portanto, que comparando-se a variação nos dois conjuntos de dados, percebemos que é</p><p>melhor usar, também, o coeficiente de variação e não apenas o desvio padrão.</p><p>D.3.3 A DISTRIBUIÇÃO NORMAL</p><p>O desvio padrão pode ser usado para concluir se os dados em questão estão normalmente</p><p>distribuídos. O conceito de distribuição normal é de considerável importância. Um estudo detalhado da</p><p>distribuição normal será realizado em capítulos posteriores. Entretanto, uma introdução desse</p><p>importante conceito permitirá demonstrarmos um uso prático do desvio padrão. A distribuição normal é</p><p>uma distribuição para dados contínuos que produzem uma curva simétrica na forma de sino, conforme a</p><p>figura abaixo.</p><p>0 1 2 3 4 6 7 8 9 10</p><p>5</p><p>10</p><p>15</p><p>20</p><p>25</p><p></p><p>X</p><p>Suponha que temos um grande número de observações, em minutos, dos tempos que atletas</p><p>levam para completar determinada corrida. Se os dados são distribuídos normalmente, um gráfico das</p><p>frequências com que cada observação ocorre ficará com a forma da figura acima. As observações de</p><p>cada extremo não ocorrem frequentemente, mas as observações próximas ao centro vão aumentando,</p><p>produzindo assim a curva em forma de sino. A observação modal, 5 nesse caso, é a que ocorre com</p><p>maior frequência e, assim, é o ponto de máximo dessa curva. Numa distribuição normal, a média, a</p><p>mediana e a moda são iguais.</p><p>49</p><p>A metade das observações está acima da média e a outra metade está abaixo. Isso significa que</p><p>metade da área sob a curva está à esquerda da média e a outra metade está à direita.</p><p>Para ilustrar como o desvio padrão aplica-se na distribuição normal, suponha que 1000 atletas</p><p>completaram determinada corrida. Os tempos de todos os corredores são distribuídos normalmente,</p><p>com uma média de µ = 5 minutos e um desvio padrão de 1 minuto. A distribuição empírica diz que, se</p><p>considerarmos as observações localizadas no intervalo formado pela média menos um desvio padrão e</p><p>pela média mais um desvio padrão, teremos 68,3% de todas as observações. Isto é, não importa qual é</p><p>a média, nem o desvio padrão, 68,3% das observações caem no intervalo de amplitude de dois desvios</p><p>padrão e com ponto médio dado pela média das observações.</p><p>Como os atletas levaram em média 5 minutos para completar a corrida, tomando um desvio</p><p>padrão de 1 minuto acima e abaixo da média, produzimos o intervalo 4 a 6 minutos. Assim, de acordo</p><p>com a distribuição empírica 683 (68,3% de 1000) atletas levaram de 4 a 6 minutos para completar a</p><p>corrida.</p><p>Claro que, se tomarmos mais de um desvio padrão acima ou abaixo da média, vamos incluir</p><p>uma maior porcentagem das observações. A distribuição empírica especifica que:</p><p>Dados os tempos dos atletas com um desvio padrão de 1 minuto acima e abaixo da média de 5</p><p>minutos, construímos o intervalo de 4 a 6 minutos. Com dois desvios padrão acima e abaixo da média</p><p>de 5 minutos, construímos o intervalo de 3 a 7 minutos. Com três desvios padrão acima e abaixo da</p><p>média de 5 minutos, construímos o intervalo de 2 a 8 minutos. Portanto, de acordo com a distribuição</p><p>empírica, 997 dos 1000 atletas gastaram de 2 a 8 minutos para completar a corrida. Apenas 3 dos 1000</p><p>atletas são muito bons e levaram menos de 2 minutos ou são péssimos corredores levando mais de 8</p><p>minutos para completar a corrida. Uma observação afastada da média mais de três desvios padrão é</p><p>uma raridade e acontece em 0,3% dos casos</p><p>se os dados obedecem a distribuição normal.</p><p>Intervalo Porcentagem de</p><p>observações</p><p> 1 68,3%</p><p> 2 95,5%</p><p> 3 99,7%</p><p>50</p><p>1.3 MEDIDAS SEPARATRIZES</p><p>São números reais que dividem a sequência ordenada de dados em partes que contêm a</p><p>mesma quantidade de elementos da série.</p><p>A mediana, por exemplo, que divide a sequência ordenada em dois grupos, cada um deles</p><p>contendo 50% dos valores da sequência, é também uma medida separatriz.</p><p>Além da mediana, neste capítulo, serão destacadas outras medidas separatrizes, ou seja,</p><p>quartis, decis e percentis.</p><p>E.1 Quartis</p><p>Os quartis dividem um conjunto de dados em quatro partes iguais, como pode ser visto</p><p>esquematicamente:</p><p>0% 25% 50% 75% 100%</p><p>Q1 Q2 = x~ Q3</p><p>Q1 = 1o quartil, composto por 25% dos elementos.</p><p>Q2 = 2o quartil, coincide com a mediana, composto por 50% dos elementos.</p><p>Q3 = 3o quartil, composto por 75% dos elementos.</p><p>Os quartis serão utilizados, apenas, para dados agrupados em classes. As fórmulas para a</p><p>determinação dos quartis Q1 e Q3 são semelhantes àquelas usadas para o cálculo da mediana.</p><p>Determinação de Q1: Determinação de Q3:</p><p>1o Passo: Calcula-se a posição</p><p>4</p><p>n</p><p>1o Passo: Calcula-se a posição</p><p>4</p><p>n3</p><p>2o Passo: Identifica-se a classe de Q1 pela Fac 2o Passo: Identifica-se a classe de Q3 pela Fac</p><p>3o Passo: Aplica-se a fórmula: 3o Passo: Aplica-se a fórmula:</p><p>1Q</p><p>ant,ac</p><p>1Q1</p><p>f</p><p>h.F</p><p>4</p><p>n</p><p>IQ</p><p></p><p></p><p></p><p></p><p></p><p></p><p>−</p><p>+=</p><p>3Q</p><p>ant,ac</p><p>3Q3</p><p>f</p><p>h.F</p><p>4</p><p>n3</p><p>IQ</p><p></p><p></p><p></p><p></p><p></p><p></p><p>−</p><p>+=</p><p>onde: lQi = limite inferior da classe Qi</p><p>n = número total de elementos</p><p>h = amplitude de classe</p><p>fQi = frequência absoluta da classe Qi</p><p>Fac,ant = soma das frequências absolutas anteriores à classe Qi.</p><p>51</p><p>Exemplo 20: Em conjunto com uma auditoria anual, uma empresa de contabilidade pública anota o</p><p>tempo necessário para realizar a auditoria de 52 balanços contábeis, tal como indicado na tabela</p><p>abaixo. Determinando os valores do 1o e 3o quartis (Q1 e Q3):</p><p>Classe Tempo de auditoria</p><p>(em minutos)</p><p>No de balanços</p><p>fi</p><p>Fac</p><p>1 9 19 3 3</p><p>2 19 29 5 8</p><p>3 29 39 10 18 (classe de Q1)</p><p>4 39 49 14 32</p><p>5 49 59 20 52 (classe de Q3)</p><p>Total 52 ----------</p><p>Solução:</p><p>Q1 = ? Q3 = ?</p><p>1o Passo: 13</p><p>4</p><p>52</p><p>4</p><p>n</p><p>== (13a posição) 39</p><p>4</p><p>52.3</p><p>4</p><p>n3</p><p>== (39a posição)</p><p>2o Passo: Pela Fac, identifica-se as classes de Q1 e Q3</p><p>3o Passo: Uso das fórmulas:</p><p>1Q</p><p>ant,ac</p><p>1Q1</p><p>f</p><p>h.F</p><p>4</p><p>n</p><p>IQ</p><p></p><p></p><p></p><p></p><p></p><p></p><p>−</p><p>+= 34</p><p>10</p><p>10.8</p><p>4</p><p>52</p><p>29Q1 =</p><p></p><p></p><p></p><p></p><p></p><p></p><p>−</p><p>+= minutos/balanço</p><p>3Q</p><p>ant,ac</p><p>3Q3</p><p>f</p><p>h.F</p><p>4</p><p>n3</p><p>IQ</p><p></p><p></p><p></p><p></p><p></p><p></p><p>−</p><p>+= 5,52</p><p>20</p><p>10.32</p><p>4</p><p>52.3</p><p>49Q3 =</p><p></p><p></p><p></p><p></p><p></p><p></p><p>−</p><p>+= minutos/balanço</p><p>0% 25% 50% 75% 100%</p><p>10 34 x~ 52,5 59</p><p>Interpretação: 25% dos balanços são realizados em até 34 minutos e 75% dos balanços são realizados</p><p>em até 52,5 minutos.</p><p>52</p><p>E.2 DECIS</p><p>Os decis dividem um conjunto de dados em dez partes iguais. Os decis serão utilizados, apenas,</p><p>para dados agrupados em classes. O procedimento para a determinação dos decis é semelhante</p><p>àquele usados para o cálculo dos quartis.</p><p>1o Passo: Calcula-se a posição</p><p>10</p><p>n.i</p><p>, onde i = 1, 2, 3, 4, 5, 6, 7, 8, 9</p><p>2o Passo: Identifica-se a classe de Di pela Fac</p><p>3o Passo: Aplica-se a fórmula:</p><p>f</p><p>h.F</p><p>10</p><p>n.i</p><p>ID</p><p>Di</p><p>ant,ac</p><p>iDi</p><p></p><p></p><p></p><p></p><p></p><p></p><p>−</p><p>+=</p><p>onde: lDi = limite inferior da classe Di</p><p>n = número total de elementos</p><p>h = amplitude de classe</p><p>fDi = frequência absoluta da classe Di</p><p>Fac,ant = soma das frequências absolutas anteriores à classe Di</p><p>Exemplo 21: Determinando o valor do 4o decil (D4) para a situação apresentada no Exemplo 20.</p><p>Classe Tempo de auditoria</p><p>(em minutos)</p><p>No de balanços</p><p>fi</p><p>Fac</p><p>1 9 19 3 3</p><p>2 19 29 5 8</p><p>3 29 39 10 18</p><p>4 39 49 14 32 (classe de D4)</p><p>5 49 59 20 52</p><p>Total 52 ----------</p><p>Solução:</p><p>1o Passo: Calcula-se a posição 2180,20</p><p>10</p><p>52.4</p><p>= (21a posição)</p><p>2o Passo: Identifica-se a classe de D4 pela Fac</p><p>3o Passo: Aplica-se a fórmula:</p><p>f</p><p>h.F</p><p>10</p><p>n.4</p><p>ID</p><p>4D</p><p>ant,ac</p><p>4D4</p><p></p><p></p><p></p><p></p><p></p><p></p><p>−</p><p>+= 41</p><p>14</p><p>10.18</p><p>10</p><p>52.4</p><p>39D4 =</p><p></p><p></p><p></p><p></p><p></p><p></p><p>−</p><p>+= minutos/balanço</p><p>Interpretação: 40% dos balanços são realizados em até 41 minutos e 60% dos balanços, portanto, são</p><p>realizados em tempos acima de 41 minutos.</p><p>53</p><p>E.3 PERCENTIS</p><p>Os percentis dividem um conjunto de dados em cem partes iguais. Os percentis serão utilizados,</p><p>apenas, para dados agrupados em classes. O procedimento para a determinação dos percentis é</p><p>semelhante àquele usados para o cálculo dos quartis e dos decis.</p><p>1o Passo: Calcula-se a posição</p><p>100</p><p>n.i</p><p>, onde i = 1, 2, 3, 4, 5, ..., 97, 98, 99</p><p>2o Passo: Identifica-se a classe Pi pela Fac</p><p>3o Passo: Aplica-se a fórmula:</p><p>f</p><p>h.F</p><p>100</p><p>n.i</p><p>IP</p><p>Pi</p><p>ant,ac</p><p>iPi</p><p></p><p></p><p></p><p></p><p></p><p></p><p>−</p><p>+=</p><p>onde: lPi = limite inferior da classe Pi</p><p>n = número total de elementos</p><p>h = amplitude de classe</p><p>fPi = frequência absoluta da classe Pi</p><p>Fac,ant = soma das frequências absolutas anteriores à classe Pi</p><p>Exemplo 22: Determinando o valor do 82o percentil (P82) para a situação apresentada no Exemplo 20.</p><p>Classe Tempo de auditoria</p><p>(em minutos)</p><p>No de balanços</p><p>fi</p><p>Fac</p><p>1 9 19 3 3</p><p>2 19 29 5 8</p><p>3 29 39 10 18</p><p>4 39 49 14 32</p><p>5 49 59 20 52 (classe de P82)</p><p>Total 52 ----------</p><p>Solução:</p><p>1o Passo: Calcula-se a posição 4364,42</p><p>100</p><p>52.82</p><p>= (43a posição)</p><p>2o Passo: Identifica-se a classe de P82 pela Fac</p><p>3o Passo: Aplica-se a fórmula:</p><p>f</p><p>h.F</p><p>100</p><p>n.82</p><p>IP</p><p>82P</p><p>ant,ac</p><p>82P82</p><p></p><p></p><p></p><p></p><p></p><p></p><p>−</p><p>+= 32,54</p><p>20</p><p>10.32</p><p>100</p><p>52.82</p><p>49P82 =</p><p></p><p></p><p></p><p></p><p></p><p></p><p>−</p><p>+= minutos/balanço</p><p>Interpretação: 82% dos balanços são realizados em até 54,32 minutos e 18% dos balanços, portanto,</p><p>são realizados em tempos acima de 54,32 minutos.</p><p>54</p><p>LISTA 3 – Exercícios para fixação</p><p>1. O diretor de análise estatística de uma pequena empresa de aviação deseja calcular a média, a</p><p>mediana e a moda do número de passageiros que escolheram voar pela companhia durante o mês de</p><p>janeiro. Assim, pediu a seu estagiário para coletar essas informações. O estagiário coletou os seguintes</p><p>dados: 68, 72, 50, 70, 65, 83, 77, 78, 84, 93, 71, 74, 60, 84, 72, 84, 73, 81, 84, 92, 77, 57, 70, 59, 85, 74,</p><p>78, 79, 91, 102 e 84. Qual foi a média, a mediana e a moda do número de passageiros que voaram por</p><p>essa companhia aérea em janeiro? Interprete os resultados obtidos.</p><p>2. As notas de um candidato, em dez provas de um concurso, foram: 9,2; 7,5; 6,7; 7,2; 8,4; 9,1; 7,2;</p><p>6,8; 8,7 e 7,2. Calcule a nota média, a nota mediana e a nota modal.</p><p>3. Para uma amostra de 17 clientes de um pequeno mercado, foram observados os seguintes</p><p>montantes de vendas, ordenados em ordem crescente: R$ 5,10; 5,10; 6,25; 6,25; 6,25; 7,45; 7,83;</p><p>8,40; 8,53; 9,90; 10,25; 10,35, 11,50; 12,55; 12,71; 13,09 e 14,10. Determinar a média, a mediana</p><p>e a moda para esses valores de vendas.</p><p>4. Uma amostra de 20 operários de uma companhia apresentou os seguintes salários recebidos durante</p><p>certa semana, arredondados para o valor do real inteiro mais próximo e apresentados em ordem</p><p>crescente: R$ 140; 140; 140; 140; 140; 140; 140; 140; 155; 155; 165; 165; 180; 180; 190; 200; 205; 225;</p><p>230; 240. Calcular a média, a mediana e a moda para esse grupo de salários.</p><p>5. As taxas</p><p>de juros recebidas por 15 ações escolhidas ao acaso na BOVESPA durante um trimestre</p><p>foram (em %): 2,65; 2,01; 1,98; 1,85; 2,71; 2,59; 2,06; 2,60; 2,62; 2,61; 2,50; 2,63; 2,64; 2,55; 2,57.</p><p>Calcule a taxa de juros média, a taxa de juros mediana e a taxa de juros modal.</p><p>6. Numa turma com 20 moças e 50 rapazes foi aplicada uma prova de Estatística. A média aritmética</p><p>das moças foi 9,2 e a dos rapazes foi 7,8. Qual foi a média de toda a turma nessa prova?</p><p>7. Um grupo de 64 pessoas, que trabalha em uma empresa, é formado por sub-grupos que tem salários</p><p>diários com as seguintes características: 12 pessoas ganham R$ 50,00; 10 ganham R$ 60,00;</p><p>20 ganham R$ 25,00; 15 ganham R$ 90,00 e 7 ganham R$ 120,00. Qual é a média salarial diária de</p><p>todo o grupo?</p><p>8. Uma empresa vende 4 tipos de cerca. A grade A custa R$ 5,00 por metro instalado, a grade B custa</p><p>R$ 3,50 por metro instalado, a grade C custa R$ 2,50 por metro instalado e a grade D custa R$ 2,00 por</p><p>metro instalado. Ontem foram instalados 100 metros de A, 150 metros de B, 75 metros de C e 200</p><p>metros de D. Qual foi o custo médio por metro instalado?</p><p>9. Para se estimar o número de peças defeituosas de um veículo, escolheu-se uma amostra de 51</p><p>veículos, encontrando-se o seguinte número de peças defeituosas por veículo:</p><p>No de peças defeituosas No de veículos (fi)</p><p>0 20</p><p>1 15</p><p>2 8</p><p>3 5</p><p>4 3</p><p>Calcule o número médio de peças defeituosas por veículo, o número mediano e o número modal.</p><p>55</p><p>10. Para se estimar o número de acidentes diários em um grande estacionamento durante um período</p><p>de um mês, escolheu-se o mês de setembro, encontrando-se os seguintes números:</p><p>No de acidentes No de dias (fi)</p><p>0 5</p><p>1 9</p><p>2 12</p><p>3 3</p><p>4 1</p><p>Calcule o número médio diário de acidentes em setembro, o número mediano e o número modal.</p><p>11. Em um levantamento entre os assinantes da revista Fortune 500, foi feita a seguinte pergunta:</p><p>"Quantas das últimas quatro edições você leu ou folheou?" A seguinte distribuição de frequências</p><p>sintetiza uma amostra de 500 respostas:</p><p>No de edições lidas No de assinantes (fi)</p><p>0 15</p><p>1 10</p><p>2 40</p><p>3 85</p><p>4 350</p><p>a) Qual é o número médio de edições lidas por um assinante da revista "Fortune"?</p><p>b) Qual é o número mediano?</p><p>c) Qual é o número modal?</p><p>d) Compare os três valores obtidos nos itens anteriores e discuta esses resultados.</p><p>12. Os DJs da rádio "Balada" relatam que tocam mais músicas por hora do que sua rival "Rock</p><p>Pauleira". Nas últimas 24 horas, os dados em relação ao número de músicas tocadas por cada uma das</p><p>estações de rádio foram coletados e tabulados. Use os dados para calcular as medidas de tendência</p><p>central e para preparar um relatório comparando as duas estações.</p><p>No de músicas por hora BALADA (h) ROCK PAULEIRA (h)</p><p>8 2 4</p><p>14 4 5</p><p>19 6 7</p><p>25 8 5</p><p>31 2 2</p><p>38 2 1</p><p>13. Na tabela abaixo estão apresentados os resultados da análise de uma substância química (em %)</p><p>presente em 30 amostras de água coletadas num rio de São Paulo.</p><p>Quantidade da substância química (%) No de amostras (fi)</p><p>0 16 3</p><p>16 32 5</p><p>32 48 7</p><p>48 64 9</p><p>64 80 4</p><p>80 96 2</p><p>Calcule a média, a mediana e a moda de Czuber para esse conjunto de dados e interprete os</p><p>resultados obtidos.</p><p>56</p><p>14. Calcule a média, a mediana e a moda para uma amostra das alturas de 73 alunos de uma escola.</p><p>Interprete os resultados obtidos.</p><p>Alturas (cm) No de alunos ( f i )</p><p>150 160 2</p><p>160 170 15</p><p>170 180 18</p><p>180 190 18</p><p>190 200 16</p><p>200 210 4</p><p>15. Uma pesquisa para determinar a eficiência de uma nova ração para animais, em termos de ganho</p><p>de peso, mostrou que após um mês em que a ração normal foi substituída pela nova ração, os animais</p><p>apresentaram um aumento de peso, segundo a distribuição, dada na tabela abaixo:</p><p>Aumento de peso (em kg) N o de animais (fi)</p><p>0 2 5</p><p>2 4 7</p><p>4 6 20</p><p>6 8 16</p><p>8 10 7</p><p>10 12 5</p><p>Calcule o aumento médio de peso por animal, o aumento mediano e o aumento modal. Interprete os</p><p>resultados obtidos.</p><p>16. Estudando-se o consumo diário de leite em certa região, verificou-se que 20% das famílias</p><p>consomem até 1 litro de leite por dia; 50% das famílias consomem entre 1 e 2 litros; 20% consomem</p><p>entre 2 e 3 litros e o restante das famílias consome entre 3 e 4 litros. Para uma amostra de 100 famílias:</p><p>a) Escreva estas informações na forma de uma distribuição de frequências.</p><p>b) Construa o histograma para essa situação.</p><p>c) Qual o consumo médio diário de leite por família?</p><p>d) Qual o desvio padrão? Interprete o resultado obtido em relação à média.</p><p>17. O departamento de recursos humanos de uma empresa fez um levantamento dos salários de uma</p><p>amostra de 121 funcionários do setor de logística, obtendo os seguintes resultados:</p><p>Salários (R$) No de funcionários (fi)</p><p>400,00 500,00 12</p><p>500,00 600,00 30</p><p>600,00 700,00 42</p><p>700,00 800,00 24</p><p>800,00 900,00 7</p><p>900,00 1.000,00 6</p><p>a) Calcule o salário médio dos funcionários do setor de logística.</p><p>b) Calcule o salário mediano.</p><p>c) Calcule a moda de Czuber.</p><p>d) Calcule a variância dos salários do setor de logística e o desvio padrão correspondente,</p><p>interpretando os resultados obtidos em termos de coeficiente de variação.</p><p>18. A variável x, que representa uma amostra das notas de Estatística dos alunos de uma classe de</p><p>certa universidade, tem distribuição dada pela tabela abaixo:</p><p>57</p><p>Notas de</p><p>Estatística</p><p>No de</p><p>alunos</p><p>xi</p><p>(ponto médio)</p><p>xi.fi 2</p><p>i )xx( −</p><p>i</p><p>2</p><p>i f.)xx( −</p><p>Fac</p><p>0 2 3</p><p>2 4 12</p><p>4 6 18</p><p>6 8 12</p><p>8 10 3</p><p>Total</p><p>a) Complete a tabela.</p><p>b) Calcule a média, a mediana, a moda e o desvio padrão de x. Interprete os resultados obtidos.</p><p>19. Um conjunto de dados dos pesos de 1000 sacos de comida para cachorro "Lulu Feliz" tem uma</p><p>média de 23 kg e um desvio padrão de 1,04 kg. Os produtores da "Lulu Feliz" esperam que pelo menos</p><p>750 sacos pesem entre 20,92 kg e 25,08 kg. Usando o Teorema de Chebyshev, o que você pode</p><p>afirmar para os produtores?</p><p>20. Dadas as idades dos 100 maiores executivos das empresas citadas na Fortune 500, revelou-se que</p><p>a média é de 56,2 anos de idade e o desvio padrão 12,7 anos. A renda média desses executivos é</p><p>89.432 dólares com desvio padrão de 16.090 dólares. Qual das variáveis tem maior variação: idade ou</p><p>renda?</p><p>21. Um posto de gasolina registrou a seguinte distribuição de frequências para o número de litros de</p><p>gasolina vendido por carro em uma amostra de 680 carros.</p><p>Gasolina (em litros) No de carros (fi)</p><p>0 8 74</p><p>8 16 192</p><p>16 24 279</p><p>24 32 106</p><p>32 40 23</p><p>40 48 6</p><p>TOTAL 680</p><p>a) Calcule a média e o desvio padrão para esses dados agrupados. Interprete o resultado obtido.</p><p>b) Se o posto de gasolina espera atender cerca de 120 carros em determinado dia, qual é a estimativa</p><p>do número total de litros de gasolina que serão vendidos?</p><p>c) Calcule a mediana e a moda.</p><p>d) Se o proprietário do posto de gasolina deseja oferecer um brinde para 5% dos clientes que colocarem</p><p>o maior número de litros de gasolina em seu tanque, a partir de que número de litros o cliente será</p><p>premiado?</p><p>22. A tabela abaixo apresenta a distribuição das exportações de empresas de equipamentos eletrônicos</p><p>em 2004.</p><p>Volume Exportado (em US$ milhões) No de empresas (fi)</p><p>50.000 60.000 5</p><p>60.000 70.000 10</p><p>70.000 80.000 20</p><p>80.000 90.000 10</p><p>90.000 100.000 5</p><p>Para essa distribuição de frequências, analise e responda:</p><p>58</p><p>a) Se o governo, para incrementar as exportações, der incentivos fiscais à metade das empresas que</p><p>tenham melhor desempenho em relação ao volume exportado, a partir de que valor exportado as</p><p>empresas terão esses incentivos?</p><p>b) Se o governo, para incrementar as exportações, der isenção fiscal às empresas que estejam entre as</p><p>7% com melhor desempenho em relação ao volume exportado, a partir de que valor exportado as</p><p>empresas terão isenção?</p><p>23. Um banco decidiu diminuir as taxas bancárias para 10% de seus correntistas (pessoas físicas) que</p><p>tenham os maiores saldos em uma de suas agências bancárias no interior do Paraná. Para isto, fez um</p><p>levantamento desses saldos, por correntista, obtendo a tabela:</p><p>Saldos (R$) No de contas correntes ( f i )</p><p>0 10.000 50</p><p>10.000 20.000 100</p><p>20.000 30.000 80</p><p>30.000 40.000 10</p><p>40.000 50.000 10</p><p>Pergunta-se: A partir de que saldo o correntista terá redução de taxas bancárias?</p><p>24. Uma amostra do tempo de vida útil de uma peça automotiva forneceu a seguinte distribuição:</p><p>Vida útil (horas) No de peças ( f i )</p><p>0 1.000 6</p><p>1.000 2.000 42</p><p>2.000 3.000 86</p><p>3.000 4.000 127</p><p>4.000 5.000 74</p><p>5.000 6.000 15</p><p>Se o fabricante deseja estabelecer uma garantia mínima para o número de horas de vida útil dessa</p><p>peça, trocando a peça que não apresentar este número mínimo de horas, qual é a garantia, se ele está</p><p>disposto a trocar 4% das peças?</p><p>25. O relatório Nielsen de Tecnologia Doméstica (20/02/2003) relatou o uso de tecnologia doméstica por</p><p>pessoas com 12 anos ou mais. Os dados abaixo são as horas de uso do computador pessoal durante</p><p>uma semana para uma amostra de 50 pessoas.</p><p>8,2 3,0 20,8 11,8 6,8 11,4 3,2 12,2 6,0 7,5</p><p>6,2 9,6 4,0 27,9 10,8 8,4 7,9 8,3 22,3 7,0</p><p>8,2 8,2 17,6 11,2 8,6 6,6 14,1 20,5 12,4 15,3</p><p>21,6 5,6 19,0 25,8 24,2 0,8 8,1 18,5 8,8 11,4</p><p>14,4 12,2 11,4 11,8 9,4 7,9 7,4 6,2 12,2 6,2</p><p>a) Sintetize os dados construindo uma tabela de distribuição de frequências – frequência absoluta,</p><p>frequência relativa (%), frequência acumulada e frequência acumulada relativa (%) – Calcule a</p><p>amplitude de classe ideal para responder às próximas questões iniciando de 0,0.</p><p>b) Responda:</p><p>b1) Qual a % de pessoas que utilizam o computador pessoal por menos de 12,0 horas?</p><p>b2) Qual o número de pessoas que utilizam o computador pessoal pelo menos por 20,0 horas?</p><p>b3) Qual a % de pessoas que utilizam o computador pessoal no máximo por 24,0 horas</p><p>(exclusive)?</p><p>b4) Qual o número de pessoas que utilizam o computador pessoal por mais de 8,0 horas (inclusive)?</p><p>c) Construa um histograma de frequências absolutas para esta distribuição.</p><p>d) Qual é o tempo médio de utilização do computador pessoal?</p><p>e) Qual é o desvio padrão? Interprete o resultado obtido em termos de coeficiente de variação.</p><p>59</p><p>f) Qual é o tempo mediano de utilização do computador pessoal? Interprete o resultado obtido.</p><p>g) Qual é o tempo modal de utilização do computador pessoal?</p><p>h) Se determinado site der um prêmio a 2% dos usuários que o visitarem por mais vezes, a partir de</p><p>quantas horas esses usuários serão premiados?</p><p>26. Em uma fila de banco, doze pessoas esperaram, em minutos, os seguintes tempos para serem</p><p>atendidas: 8, 11, 5, 4, 5, 14, 11, 12, 16, 11, 8 e 11. O tempo mediano de espera, em minutos, é:</p><p>A) 11</p><p>B) 11,5</p><p>C) 12</p><p>D) 12,5</p><p>E) 13</p><p>27. Uma empresa possui dois técnicos em informática recebendo salários mensais de R$ 3.400,00 cada</p><p>um, quatro economistas recebendo R$ 4.500,00 cada um por mês, um diretor de recursos humanos</p><p>com salário mensal de R$ 7.000,00 e três outros profissionais recebendo R$ 5.500,00 cada um por</p><p>mês. A média mensal destes salários é:</p><p>A) R$ 5.830,00</p><p>B) R$ 6.830,00</p><p>C) R$ 2.830,00</p><p>D) R$ 3.830,00</p><p>E) R$ 4.830,00</p><p>28. Um pesquisador calculou a média amostral de 25 observações e obteve 12,80. Mais tarde,</p><p>percebeu que havia se enganado em relação a uma das observações, cujo valor correto era 18,60 em</p><p>vez de 22,60. Portanto, o valor correto da média amostral é:</p><p>A) 9,98</p><p>B) 10,06</p><p>C) 10,28</p><p>D) 11,36</p><p>E) 12,64</p><p>29. A média aritmética dos salários dos 100 empregados em uma empresa era de R$ 1.500,00. Por</p><p>conta da crise econômica, em 2008, foram demitidos 20 empregados, que ganhavam cada um o salário</p><p>de R$ 2.500,00. No início de 2010, após o fim da crise, foi concedido um aumento de 10% em todos os</p><p>salários dos empregados remanescentes. Então, a nova média aritmética dos salários é:</p><p>A) R$ 1.375,00</p><p>B) R$ 1.350,00</p><p>C) R$ 1.345,00</p><p>D) R$ 1.320,00</p><p>E) R$ 1.300,00</p><p>30. Em 2001, uma universidade pagou a cada um de seus instrutores salários mensais de R$ 1.500,00;</p><p>a cada um de seus 67 assistentes, R$ 2.000,00; a cada um dos 58 adjuntos , R$ 2.600,00 e a cada um</p><p>de seus 32 titulares, R$ 3.100,00. O salário mensal mediano dos 202 docentes dessa universidade é:</p><p>A) R$ 2.300,00</p><p>B) R$ 2.600,00</p><p>C) R$ 2.000,00</p><p>D) R$ 2.400,00</p><p>E) R$ 3.100,00</p><p>31. Os preços do pacote de café (500g) cobrados em diferentes supermercados locais são: R$ 3,50,</p><p>R$ 2,00, R$ 1,50 e R$ 1,00. Com base nesses dados, é correto afirmar que:</p><p>A) o preço médio do pacote de 500g de café é de R$ 1,80;</p><p>B) se todos os preços tiverem uma redução de 50%, o novo preço médio será de R$ 1,00;</p><p>C) a variância dos preços é igual a 0,625;</p><p>D) o desvio padrão dos preços é igual a 0,791;</p><p>60</p><p>E) o coeficiente de variação dos preços é igual aproximadamente a 44%.</p><p>32. Na tabela abaixo, têm-se a distribuição do valor dos aluguéis (em reais) pagos por 200 pessoas em</p><p>residências situadas na zona urbana de uma cidade de médio porte.</p><p>Aluguel (R$) No de pessoas</p><p>fi</p><p>Fac</p><p>200 300 10 10</p><p>300 400 40 50</p><p>400 500 80 130</p><p>500 600 50 180</p><p>600 700 20 200</p><p>Total 200 --------</p><p>Se fosse concedido um desconto no valor do aluguel para 50% das pessoas que pagam os aluguéis</p><p>mais altos, elas teriam o desconto a partir de:</p><p>A) R$ 462,50</p><p>B) R$ 428,00</p><p>C) R$ 328,80</p><p>D) R$ 318,00</p><p>E) R$ 300,00</p><p>33. Uma amostra aleatória de 250 residências de famílias, classe média com dois filhos, revelou a</p><p>seguinte distribuição do consumo mensal de energia elétrica:</p><p>Consumo</p><p>mensal</p><p>(KWh)</p><p>No de famílias</p><p>fi</p><p>fri (%) xi.fi</p><p>i</p><p>2</p><p>i f.)xx( −</p><p>Fac</p><p>0 50 2 0,80 50 74.343,68 2</p><p>50 100 15 6,00 1.125 305.877,60 17</p><p>100 150 32 12,80 4.000 275.578,88 49</p><p>150 200 47 18,80 8.225 86.096,48 96</p><p>200 250 50 20,00 11.250 2.592,00 146</p><p>250 300 80 32,00 22.000 261.747,20 226</p><p>300 350 24 9,60 7.800 275.804,16 250</p><p>Total 250 100,00 54.450 1.282.040,00 _____</p><p>Nesta distribuição, em relação ao desvio padrão, pode-se dizer que:</p><p>A) representa, aproximadamente, 32,95% da média (coeficiente de variação);</p><p>B) é igual a 71,61 KWh;</p><p>C) é aproximadamente igual a 72 KWh e representa o valor mais freqüente no conjunto de dados;</p><p>D) é igual a 5.148,76 KWh e é calculado como raiz quadrada da variância;</p><p>E) 50% das famílias gastam até 217,44 KWh e 50% das famílias gastam mais que 217,44 KWh.</p><p>61</p><p>CAPÍTULO 4 - REGRESSÃO LINEAR E CORRELAÇÃO</p><p>BIBLIOGRAFIA CONSULTADA:</p><p>1. ANDERSON, D. R.; SWEENEY, D. J.; WILLIAMS, T. A. Estatística Aplicada à Administração e</p><p>Economia. 2.ed. São Paulo: Cengage Learning, 2007.</p><p>2. DOWNING, D.; CLARK, J. Estatística Aplicada. São Paulo: Saraiva, 2002.</p><p>3. MARTINS, G. A.; DONAIRE, D. Princípios de Estatística. 4.ed. São Paulo: Atlas, 1995.</p><p>4. NOBRE, J. S. M. Apostila de Estatística. São Paulo: Universidade Paulista, 2007.</p><p>5. STEVENSON, W. J. Estatística Aplicada à Administração. 3.ed. São Paulo: Harbra, 2001.</p><p>REGRESSÃO LINEAR E CORRELAÇÃO</p><p>REGRESSÃO LINEAR SIMPLES: Método de análise da relação entre uma variável independente e</p><p>uma variável dependente. É uma equação que descreve a relação em termos matemáticos.</p><p>CORRELAÇÃO: Mede o grau de relação entre as duas variáveis.</p><p>Na REGRESSÃO a variável y é chamada de variável dependente e a variável x de variável</p><p>independente.</p><p>Seja y uma variável de interesse e cujo comportamento futuro deseja-se prever. É fácil identificar</p><p>uma série de variáveis xi (x1, x2, x3,..., xn) que influenciam o comportamento de y, a variável dependente</p><p>do modelo. A Estatística oferece meios de se chegar à relação entre a variável dependente (y) e as</p><p>variáveis independentes (x1, x2, x3,..., xn) através da análise de regressão.</p><p>Será estudado o modelo: y = ax +b (ajuste de uma reta).</p><p>DIAGRAMA DE DISPERSÃO</p><p>Exemplo 1: Suponha que um analista toma uma amostra aleatória de 10 carregamentos por caminhão</p><p>feitos por uma companhia e anota a distância em quilômetros e o tempo de entrega em dias</p><p>(arredondado para o meio dia mais próximo), conforme a tabela abaixo.</p><p>Carregamento Distância Rodoviária (km)</p><p>x</p><p>Tempo de entrega (dias)</p><p>y</p><p>1 825 3,5</p><p>2 215 1,0</p><p>3 1070 4,0</p><p>4 550 2,0</p><p>5 480 1,0</p><p>6 920 3,0</p><p>7 1350 4,5</p><p>8 325 1,5</p><p>9 670 3,0</p><p>10 1215 5,0</p><p>Uma boa maneira de determinar se há relação entre a distância rodoviária percorrida e o tempo</p><p>de entrega do carregamento é traçar um gráfico. É interessante plotar um diagrama, no qual cada ponto</p><p>plotado representa um par observado de valores para as variáveis dependente e independente. O valor</p><p>da variável independente, x, no caso a distância rodoviária, é plotado no eixo horizontal, enquanto que,</p><p>62</p><p>o valor da variável dependente, y, no caso o tempo de entrega, é plotado no eixo vertical. Para cada</p><p>observação será marcado um ponto. Este tipo de gráfico é chamado diagrama de dispersão (ver figura</p><p>abaixo).</p><p>0</p><p>1</p><p>2</p><p>3</p><p>4</p><p>5</p><p>6</p><p>0 200 400 600 800 1000 1200 1400 1600</p><p>Distância Rodoviária (km)</p><p>T</p><p>e</p><p>m</p><p>p</p><p>o</p><p>d</p><p>e</p><p>E</p><p>n</p><p>tr</p><p>e</p><p>g</p><p>a</p><p>(</p><p>d</p><p>ia</p><p>s</p><p>)</p><p>Pelo diagrama acima, parece que os pontos seguem uma relação linear. Assim, é apropriado ao caso, a</p><p>análise de regressão linear.</p><p>AJUSTE DE UMA RETA - MÉTODO DOS MÍNIMOS QUADRADOS</p><p>Estabelecido o modelo y = a.x + b, é necessário calcular-se os valores de a e b de forma que a</p><p>reta passe, tão próxima quanto possível, dos pontos assinalados no diagrama de dispersão. Isto é,</p><p>deseja-se minimizar a discrepância total entre os pontos marcados e a reta, cujos coeficientes, a e b,</p><p>serão determinados. O melhor método para a determinação dos parâmetros a e b é o Método dos</p><p>Mínimos Quadrados. Segundo esse método, é possível calcular os parâmetros a e b pela aplicação</p><p>das seguintes fórmulas:</p><p> −</p><p> −</p><p>=</p><p>22 )x(xn</p><p>y.xxyn</p><p>a</p><p>x.ayb −= , onde n = número de observações;</p><p>n</p><p>x</p><p>x</p><p></p><p>= = média dos xi;</p><p>n</p><p>y</p><p>y</p><p></p><p>= = média dos yi</p><p>Portanto,</p><p>n</p><p>x</p><p>.a</p><p>n</p><p>y</p><p>b</p><p></p><p>−</p><p></p><p>=</p><p>A equação ajustada y = a.x + b permite predizer o valor de y a partir de um determinado valor de x.</p><p>Exemplo 2: Determinando a equação de regressão de mínimos quadrados para os dados apresentados</p><p>no Exemplo 1.</p><p>63</p><p>Neste caso, é necessário calcular a e b. Para isso, é conveniente a construção da tabela:</p><p>Carregamento</p><p>amostrado</p><p>Distância</p><p>(km)</p><p>x</p><p>Tempo de entrega</p><p>(dias)</p><p>y</p><p>x.y</p><p>x2</p><p>1 825 3,5 2.887,5 680.625</p><p>2 215 1,0 215,0 46.225</p><p>3 1070 4,0 4.280,0 1.144.900</p><p>4 550 2,0 1.100,0 302.500</p><p>5 480 1,0 480,0 230.400</p><p>6 920 3,0 2.760,0 846.400</p><p>7 1350 4,5 6.075,0 1.822.500</p><p>8 325 1,5 487,5 105.625</p><p>9 670 3,0 2.010,0 448.900</p><p>10 1215 5,0 6.075,0 1.476.225</p><p>Total 7.620 28,5 26.370,0 7.104.300</p><p>Solução: n = 10</p><p> = 0,26370y.x 7620x =</p><p>5,28y = 7104300x</p><p>2 =</p><p> −</p><p> −</p><p>=</p><p>22 )x(x.n</p><p>y.xxy.n</p><p>a = 0035851,0</p><p>)7620(710430010</p><p>5,2876200,2637010</p><p>2</p><p>=</p><p>−</p><p>−</p><p>0,762</p><p>10</p><p>7620</p><p>n</p><p>x</p><p>x ==</p><p></p><p>=</p><p>85,2</p><p>10</p><p>5,28</p><p>n</p><p>y</p><p>y ==</p><p></p><p>=</p><p>x.ayb −= , logo 12,01182,00,7620035851,085,2b =−=</p><p>Portanto, 12,0x.0036,0ybx.ay +=+= é a reta ajustada, que está traçada no diagrama de</p><p>dispersão do Exemplo 1, conforme a figura abaixo.</p><p>0</p><p>1</p><p>2</p><p>3</p><p>4</p><p>5</p><p>6</p><p>0 200 400 600 800 1000 1200 1400 1600</p><p>Distância Rodoviária (km)</p><p>T</p><p>e</p><p>m</p><p>p</p><p>o</p><p>d</p><p>e</p><p>E</p><p>n</p><p>tr</p><p>e</p><p>g</p><p>a</p><p>(</p><p>d</p><p>ia</p><p>s</p><p>)</p><p>64</p><p>Usando a equação de regressão desenvolvida acima, pode-se estimar o tempo de entrega de</p><p>um carregamento para qualquer distância, desde que as viagens não ultrapassem 1.350 km, que é a</p><p>distância máxima para a qual essa equação de regressão foi estimada. Para a distância de 1.000 km,</p><p>por exemplo, o cálculo é o seguinte:</p><p>72,312,01000.0036,012,0x.0036,0y =+=+= dias</p><p>Logo, o tempo de entrega para um carregamento pela distância rodoviária de 1.000 km é igual a</p><p>3,72 dias.</p><p>COEFICIENTE DE CORRELAÇÃO</p><p>É a medida que descreve o grau da associação linear entre duas variáveis aleatórias contínuas,</p><p>por exemplo, x e y.</p><p>Para avaliar o coeficiente de correlação linear entre duas variáveis, ou seja, medir o grau de</p><p>ajuste dos valores em torno de uma reta, é utilizado o coeficiente de correlação de Pearson. Este</p><p>coeficiente de correlação é dado por:</p><p>− −</p><p> −</p><p>=</p><p>])y(yn][)x(xn[</p><p>)y)(x(xyn</p><p>r</p><p>2222</p><p>, onde n é o número de observações.</p><p>Os valores do coeficiente de correlação r estão sempre entre –1 e +1. Um valor +1 indica</p><p>que as duas variáveis x e y estão perfeitamente relacionadas de forma linear positiva. Isto é, todos os</p><p>pontos dados estão numa linha reta que tem inclinação positiva (função linear crescente). Um valor -1</p><p>indica que as duas variáveis x e y estão perfeitamente relacionadas de forma linear negativa. Isto é,</p><p>todos os pontos dados estão numa linha reta que tem inclinação negativa (função linear decrescente).</p><p>Valores do coeficiente de correlação próximos a zero indicam que x e y não estão linearmente</p><p>relacionados.</p><p>Estas afirmações podem ser observadas abaixo, pelas configurações dos diagramas de</p><p>dispersão para diferentes valores de r.</p><p>0 5 10 15 20 25 30 35 40</p><p>0</p><p>10</p><p>20</p><p>30</p><p>40</p><p>50</p><p>60</p><p>70</p><p>80</p><p>y</p><p>x</p><p>r = +1,00 → Relacionamento linear positivo, perfeito.</p><p>65</p><p>0 5 10 15 20 25 30 35</p><p>-10</p><p>0</p><p>10</p><p>20</p><p>30</p><p>40</p><p>50</p><p>60</p><p>70</p><p>80</p><p>y</p><p>x</p><p>70,0r → Relacionamento linear positivo, moderado.</p><p>0 5 10 15 20 25 30 35 40</p><p>0</p><p>20</p><p>40</p><p>60</p><p>80</p><p>100</p><p>y</p><p>x</p><p>r = 0 → Ausência de relacionamento linear</p><p>0 5 10 15 20 25 30 35 40</p><p>-30</p><p>-20</p><p>-10</p><p>0</p><p>10</p><p>20</p><p>30</p><p>40</p><p>50</p><p>y</p><p>x</p><p>r = -1,00 → Relacionamento linear negativo, perfeito</p><p>66</p><p>Exemplo 3: Determinando o coeficiente de correlação linear de Pearson para os dados apresentados</p><p>no Exemplo 1.</p><p>Reapresentando a tabela com o cálculo de y2, necessário neste caso, para o cálculo de r:</p><p>Carregamento</p><p>amostrado</p><p>Distância</p><p>(km)</p><p>x</p><p>Tempo de entrega</p><p>(dias)</p><p>y</p><p>x.y</p><p>x2</p><p>y2</p><p>1 825 3,5 2.887,5 680.625 12,25</p><p>2 215 1,0 215,0 46.225 1,0</p><p>3 1070 4,0 4.280,0 1.144.900 16,00</p><p>4 550 2,0 1.100,0 302.500 4,00</p><p>5 480 1,0 480,0 230.400 1,00</p><p>6 920 3,0 2.760,0 846.400 9,00</p><p>7 1350 4,5 6.075,0 1.822.500 20,25</p><p>8 325 1,5 487,5 105.625 2,25</p><p>9 670 3,0 2.010,0 448.900 9,00</p><p>10 1215 5,0 6.075,0 1.476.225 25,00</p><p>Total 7.620 28,5 26.370,0 7.104.300 99,75</p><p>Solução: n = 10</p><p> = 0,26370y.x 7620x = 7104300x</p><p>2 =</p><p>5,28y = 75,99y</p><p>2</p><p>=</p><p>( ) ])5,28(75,9910[])7620(710430010[</p><p>5,2876200,2637010</p><p>]yyn].[)x(xn[</p><p>)y)(x(xyn</p><p>r</p><p>222222 −−</p><p>−</p><p>=</p><p>− −</p><p> −</p><p>=</p><p>95,09489,0</p><p>67,49033</p><p>46530</p><p>r == ou %95r =</p><p>A equação da reta ajustada, como visto no Exemplo 2, é 12,0x.0036,0y += , com coeficiente de</p><p>correlação igual a 95%, o que representa uma excelente relação linear entre as variáveis x e y.</p><p>Lembrete: HP-12C (Regressão Linear):</p><p>y enter x +</p><p>g ŷ ,r y ajustado x >< y r (coeficiente de correlação linear)</p><p>RCL 1 n RCL 4 y</p><p>RCL 2 x RCL 5 y2</p><p>RCL 3 x2 RCL 6 x.y</p><p>67</p><p>LISTA 4 – Exercícios para fixação</p><p>1. Na tabela abaixo estão indicados o valor y do aluguel (em mil reais) e a idade x (em anos, desde a</p><p>construção) de cinco casas.</p><p>Tempo após construção (anos) x 5 7 10 13 20</p><p>Valor do aluguel (mil reais) y 6 5 4 3 2</p><p>a) Para esse conjunto de dados, faça o diagrama de dispersão.</p><p>b) Se uma reta parecer apropriada, determine os coeficientes a e b da</p><p>reta pelo método dos mínimos</p><p>quadrados e escreva a equação da reta.</p><p>c) Represente graficamente a reta obtida no diagrama de dispersão.</p><p>d) Calcule o coeficiente de correlação e interprete seu significado.</p><p>e) Qual será o valor do aluguel para uma casa com 16 anos de idade?</p><p>f) Qual será a idade de uma casa cujo aluguel é 4,52 mil reais?</p><p>2. Na tabela abaixo são apresentados os custos de manutenção por hora classificados pela idade da</p><p>máquina em meses.</p><p>Idade x (meses) 6 15 24 33 42</p><p>Custos y ($) 9,70 16,50 19,30 19,20 26,90</p><p>a) Determinar a reta de regressão;</p><p>b) Calcular o coeficiente de correlação e interpretar seu significado;</p><p>c) Fazer uma previsão de custo para uma máquina de 20 meses.</p><p>3. Numa amostra de cinco operários de uma dada empresa, foram observadas duas variáveis: X: anos</p><p>de experiência em um dado cargo e Y: tempo gasto na execução de certa tarefa relacionada com esse</p><p>cargo. Discuta a correlação dessas variáveis se:</p><p>a) O coeficiente de correlação linear determinado foi de 0,9865.</p><p>b) O coeficiente de correlação linear determinado foi de 0,5734.</p><p>4. Na tabela abaixo está representado o valor total de vendas (em milhões de reais) de uma companhia</p><p>por 10 meses consecutivos.</p><p>x 1 2 3 4 5 6 7 8 9 10</p><p>y 5,0 6,7 6,0 8,7 6,2 8,6 11,0 11,9 10,6 10,8</p><p>a) Faça o diagrama de dispersão. Se uma reta parecer apropriada, determine a equação da reta pelo</p><p>método dos mínimos quadrados e plote-a no diagrama de dispersão.</p><p>b) Qual a previsão de vendas dessa companhia para o 11o mês?</p><p>5. O diretor de vendas de uma rede de varejo com vendas a nível nacional, está querendo analisar a</p><p>relação que existe entre o investimento em propaganda e o valor das vendas da empresa. O objetivo é</p><p>ter uma equação matemática que permita realizar projeções e estimativas de vendas entre a variável</p><p>dependente vendas e a variável independente investimento em propaganda. O departamento de vendas</p><p>da rede relacionou os dados levantados na tabela abaixo:</p><p>Investimento anual (milhões de reais) 32 21 37 12 17 24</p><p>Vendas anuais (milhões de reais) 430 330 470 190 270 480</p><p>a) Construa o diagrama de dispersão;</p><p>b) Determine a equação da reta;</p><p>c) Determine o coeficiente de correlação e interprete o seu significado.</p><p>d) Faça uma projeção dos valores de vendas para investimento de 600 milhões de reais.</p><p>68</p><p>6. Na tabela abaixo é apresentada a produção de aço de uma indústria no período de 2000 a 2004:</p><p>Ano (x) 2000 2001 2002 2003 2004</p><p>Produção de Aço (y) (toneladas) 17,5 19,0 23,3 28,7 35,0</p><p>a) Ajustar uma reta aos dados (atenção: modificar a variável x para x = 0, 1, 2,...).</p><p>b) Calcular o coeficiente de correlação.</p><p>c) Estimar a produção de aço para 2005.</p><p>7. Os dados abaixo correspondem às variáveis renda familiar (em salários mínimos) e gasto com</p><p>alimentação (em salários mínimos) em amostra de 10 famílias.</p><p>Renda familiar</p><p>(salários mínimos)</p><p>Gasto com alimentação</p><p>(salários mínimos)</p><p>3 1,5</p><p>5 2,0</p><p>10 6,0</p><p>20 10,0</p><p>30 15,0</p><p>50 20,0</p><p>70 25,0</p><p>100 40,0</p><p>150 60,0</p><p>200 80,0</p><p>a) Construa o diagrama de dispersão. O que ele sugere?</p><p>b) Calcule o coeficiente de correlação e interprete seu significado.</p><p>c) Ajuste a reta de regressão e interprete o significado dos coeficientes.</p><p>d) Qual a previsão do gasto com alimentação para uma família com renda de 17 salários mínimos?</p><p>e) Qual a previsão do gasto com alimentação para uma família com excepcional renda, como por</p><p>exemplo, 1.000 salários mínimos? Você acha este valor razoável? Por quê?</p><p>8. Um jornal quer verificar a eficácia de seus anúncios na venda de carros usados. Na tabela abaixo</p><p>estão apresentados o número de anúncios publicados e o correspondente número de carros vendidos</p><p>por 6 companhias, que usaram apenas este jornal como veículo de propaganda.</p><p>Companhia A B C D E F</p><p>Anúncios 74 45 48 36 27 16</p><p>Vendas 139 108 98 76 62 57</p><p>a) Construa o diagrama de dispersão. O que ele sugere?</p><p>b) Calcule o coeficiente de correlação e interprete seu significado.</p><p>c) Ajuste a reta de regressão e interprete o significado dos coeficientes.</p><p>d) Com base nos resultados anteriores, como você argumentaria com a Companhia F para que ela</p><p>aumentasse o número de anúncios, aumentando, portanto, suas vendas?</p><p>9. Na tabela seguinte estão indicadas as porcentagens de mulheres que trabalham em cada companhia</p><p>e as porcentagens de cargos de gerência ocupados por mulheres nessas companhias.</p><p>69</p><p>Companhia Porcentagem</p><p>de mulheres</p><p>Porcentagem de</p><p>mulheres gerentes</p><p>Federated Department Stores 72 61</p><p>Kroger 47 16</p><p>Marriot 51 32</p><p>McDonald's 57 46</p><p>Sears 55 36</p><p>a) Construa o diagrama de dispersão.</p><p>b) Calcule o coeficiente de correlação e interprete seu significado.</p><p>c) Ajuste uma reta aos dados pelo método dos mínimos quadrados e trace a reta no diagrama de</p><p>dispersão.</p><p>d) Faça uma previsão da porcentagem de cargos de gerência ocupados por mulheres em uma</p><p>companhia que tem 60% de funcionários do sexo feminino.</p><p>e) Faça uma previsão da porcentagem de cargos de gerência ocupados por mulheres em uma</p><p>companhia onde 55% são mulheres. Como esse valor previsto se compara aos 36% da Sears, uma</p><p>companhia onde 55% dos funcionários são mulheres?</p><p>10. Os dados abaixo se referem às variáveis gastos com publicidade (em mil reais) e faturamento (em</p><p>mil reais) para o Hotel Alpino na cidade de Monte Verde, MG.</p><p>Gastos com publicidade</p><p>(mil reais)</p><p>Faturamento</p><p>(mil reais)</p><p>1 20</p><p>2 32</p><p>4 40</p><p>6 44</p><p>10 52</p><p>14 54</p><p>a) Ajuste uma reta aos dados pelo método dos mínimos quadrados.</p><p>b) Qual a previsão de faturamento do hotel se forem gastos R$ 8 mil em publicidade?</p><p>c) Qual a previsão de gastos com publicidade no caso de se pretender um faturamento de R$ 50 mil?</p><p>d) Calcule o coeficiente de correlação e interprete seu significado.</p><p>11. A tabela abaixo indica a quantidade de bolas de futebol de salão produzidas mensalmente e os</p><p>respectivos custos totais de produção.</p><p>Quantidade produzida 10 11 12 13 14 15</p><p>Custo Total (R$) 100 112 119 130 139 142</p><p>a) Construir o diagrama de dispersão;</p><p>b) Analisando o gráfico obtido, é possível afirmar que o sistema se comporta de forma</p><p>aproximadamente linear?</p><p>c) Os pontos apresentam um comportamento crescente ou decrescente?</p><p>d) Determine a equação da reta que melhor se ajusta a esses dados, utilizando Análise de Regressão;</p><p>e) Determine o valor mais provável dos custos fixos;</p><p>f) Determine o custo estimado para a produção de 16 bolas.</p><p>12. Na tabela a seguir estão indicadas as quantidades produzidas mensalmente de televisores da</p><p>marca SHAWN e os respectivos custos totais de produção.</p><p>Quantidade produzida 1 2 3 4 5 6 7 8 9 10</p><p>Custo Total (R$) 100 120 130 140 150 160 170 180 190 200</p><p>70</p><p>Pede-se estabelecer pela Análise de Regressão:</p><p>a) A reta que melhor se ajusta a esses dados;</p><p>b) O valor mais provável dos custos fixos;</p><p>c) O valor do custo estimado para a produção de 12 televisores.</p><p>13. Uma pesquisa sobre a demanda de mercado de um produto X levou à seguinte escala de demanda:</p><p>Preço p (R$/unidade) 20 30 40 50 60</p><p>Quantidade demandada q (unidades) 3.550 2.600 1.800 1.000 500</p><p>a) representar graficamente os dados apresentados;</p><p>b) identificar o modelo linear (ou seja, determinar a equação da reta) que melhor se ajusta à escala de</p><p>demanda do produto X.</p><p>c) representar graficamente a reta de regressão no mesmo sistema de coordenadas do item a.</p><p>14. Uma pesquisa sobre a oferta de mercado de um produto Y levou à seguinte escala de demanda:</p><p>Preço p (R$/unidade) 47 65 80 100 120</p><p>Quantidade ofertada q (unidades) 34 75 120 130 170</p><p>a) Representar graficamente os dados apresentados;</p><p>b) identificar o modelo linear (ou seja, determinar a equação da reta) que melhor se ajusta à escala de</p><p>oferta do produto Y.</p><p>c) representar graficamente a reta de regressão no mesmo sistema de coordenadas do item a.</p><p>15. O coeficiente de correlação, como medida da relação entre séries de números que representam</p><p>qualquer tipo de dados, pode</p><p>ser utilizada também para medir a diversificação de uma carteira de</p><p>ativos. O risco de uma carteira de ativos pode ser reduzido pela combinação de ativos negativamente</p><p>correlacionados ou de baixa correlação positiva. Considere uma carteira AB, composta de 50% de</p><p>ativos A e 50% de ativos B. Um levantamento das taxas de retorno desses ativos nos últimos quatro</p><p>meses é apresentado na tabela abaixo:</p><p>Ativo Taxa de Retorno (%)</p><p>Janeiro Fevereiro Março Abril</p><p>A 2,4% 3,7% 1,8% 2,0%</p><p>B 1,5% 1,1% 2,1% 1,9%</p><p>Determine o coeficiente de correlação linear. O que pode ser comentado a respeito do risco dessa</p><p>carteira de ativos?</p><p>16. Considere a carteira XY, composta de 50% dos ativos X e 50% dos ativos Y. Um levantamento das</p><p>taxas de retorno desses ativos nos últimos quatro meses é apresentado na tabela abaixo:</p><p>Ativo Taxa de Retorno (%)</p><p>Janeiro Fevereiro Março Abril</p><p>X 6,4% 4,7% 3,8% 5,5%</p><p>Y 4,6% 3,1% 2,8% 3,6%</p><p>Com base no coeficiente de correlação linear, faça um comentário a respeito do risco dessa carteira de</p><p>ativos.</p><p>17. Se o coeficiente de correlação entre duas variáveis é igual a -0,95, então podemos afirmar que a</p><p>intensidade da correlação entre essas duas variáveis apresenta:</p><p>71</p><p>A) correlação perfeita negativa;</p><p>B) forte correlação negativa;</p><p>C) fraca correlação negativa;</p><p>D) correlação nula;</p><p>E) fraca correlação positiva.</p><p>18. Propaganda versus Vendas: Existe relação?</p><p>Um administrador na área de marketing conduz um estudo para determinar se existe uma relação linear</p><p>entre o dinheiro gasto em propaganda e as vendas de uma empresa. Os dados estão dispostos na</p><p>tabela a seguir:</p><p>Gastos com propaganda</p><p>(milhares de dólares) (x)</p><p>Vendas da empresa</p><p>(milhares de dólares) (y)</p><p>2,4 225</p><p>1,6 184</p><p>2,0 220</p><p>2,6 240</p><p>1,4 180</p><p>1,6 184</p><p>2,0 186</p><p>2,2 215</p><p>Ao representar graficamente os dados em um gráfico de dispersão, obtêm-se:</p><p>A partir destes dados, afirmou-se:</p><p>I. Verificamos, com base no mapa de dispersão, que parece existir uma correlação linear positiva entre</p><p>as variáveis, pois lendo da esquerda para a direita, à medida que os gastos em propaganda crescem,</p><p>as vendas tendem a aumentar.</p><p>II. A correlação positiva indica que à medida que aumenta a quantia gasta em propaganda, crescem</p><p>também as vendas da companhia.</p><p>III. Não existe correlação entre as variáveis propaganda e vendas.</p><p>Podemos dizer que:</p><p>72</p><p>A) Todas as afirmações são verdadeiras.</p><p>B) Somente I é falsa.</p><p>C) Somente II é falsa.</p><p>D) Somente III é falsa.</p><p>E) As afirmações I e III são falsas.</p><p>viciada quando para escolhê-la existiu uma tendência maior de</p><p>selecionar certos tipos de elementos do que outros. Por exemplo, se o processo de amostragem</p><p>favorecer a seleção de homens em detrimento das mulheres ou favorecer a escolha de pessoas</p><p>casadas excluindo os solteiros.</p><p>1.3 AS TAREFAS DA ESTATÍSTICA</p><p>Embora o primeiro passo em um estudo estatístico seja a coleta dos dados, é prática comum</p><p>começar um curso de estatística supondo que os dados já foram coletados e estão à disposição. Assim,</p><p>nosso trabalho começa organizando e apresentando esses dados de uma maneira significativa e</p><p>descritiva. Os dados devem ser organizados de tal forma que com uma rápida olhada revelem a real</p><p>informação contida neles. Este procedimento consiste da análise descritiva e será estudado nos</p><p>próximos capítulos. Depois dos dados serem organizados e apresentados para serem examinados, o</p><p>estatístico deve analisá-los e interpretá-los. Esses procedimentos fazem parte da inferência estatística e</p><p>constituem grande vantagem da análise estatística na tomada de decisões e no processo da resolução</p><p>de problemas.</p><p>Pela aplicação precisa de um procedimento estatístico é até possível realizar previsões com</p><p>algum grau de exatidão. Qualquer empreendimento que encare a pressão da competição pode tirar</p><p>vantagem da habilidade de antecipar futuras situações antes que essas aconteçam. Se uma empresa</p><p>sabe qual o valor de suas vendas num futuro próximo, administradores podem direcionar precisamente</p><p>e com maior eficiência os planos operacionais. Se as vendas futuras são estimadas com exatidão e</p><p>confiabilidade, administradores podem, facilmente, tomar importantes decisões relativas aos estoques,</p><p>materiais para a produção, atender requisições dos funcionários ou resolver qualquer outro aspecto do</p><p>gerenciamento operacional.</p><p>5</p><p>1.4 VARIÁVEIS</p><p>A análise estatística apropriada de uma determinada variável depende de sua natureza. É</p><p>importante conhecer a natureza da variável, pois para cada tipo de variável, há uma técnica mais</p><p>apropriada para se resumir as informações e otimizar a análise. As variáveis são classificadas como</p><p>Variáveis Qualitativas e Variáveis Quantitativas.</p><p>• Variáveis Qualitativas: apresentam características de um elemento, podendo ser não-</p><p>numéricos ou numéricos sem significado específico.</p><p>Exemplos: sexo (masculino, feminino), estado civil (solteiro, casado, divorciado, separado</p><p>judicialmente, viúvo), grau de escolaridade (fundamental, médio, superior, pós-graduação, etc).</p><p>Essas características podem ser, também, representadas por números que não tem significado</p><p>numérico ("1" indica sexo feminino e "2" indica sexo masculino). As variáveis qualitativas são</p><p>sub-divididas em: nominais variáveis sem ordenação (estado civil: solteiro, casado,</p><p>divorciado, separado judicialmente, viúvo) e ordinais variáveis que devem respeitar ordem</p><p>estabelecida (grau de escolaridade: fundamental, médio, superior, pós-graduação, etc).</p><p>• Variáveis Quantitativas: apresentam números resultantes de contagem ou de medida.</p><p>Exemplos: número de filhos, salário de trabalhadores, idade, etc. As variáveis quantitativas</p><p>podem ser: discretas quando os valores são provenientes de uma contagem, portanto, seus</p><p>valores são expressos por números inteiros (número de filhos, número de funcionários de uma</p><p>empresa, número de defeitos em um veículo produzido, número de livros em uma biblioteca, etc)</p><p>e contínuas quando os valores são provenientes de uma medida, portanto, essa variável</p><p>pode assumir qualquer valor em determinado intervalo, ou seja, números inteiros e decimais</p><p>(peso, altura, temperatura, idade, custos, lucros, etc).</p><p>Referindo-se ao conjunto de dados na Tabela 1, abaixo, como mais um exemplo, os dados</p><p>relativos à variável Bolsa de Valores (NYSE, AMEX e OTC) são rótulos usados para identificar onde as</p><p>ações são comercializadas. Assim, os dados são qualitativos e a Bolsa de Valores é uma variável</p><p>qualitativa. O Símbolo no Painel Eletrônico é também uma variável qualitativa e os valores de dados</p><p>AWRD, CHK, CRG, etc. são os rótulos usados para identificar a empresa correspondente. A variável</p><p>Número de Negócios Realizados Anualmente é uma variável quantitativa discreta, pois essa variável</p><p>só pode assumir valores inteiros. As variáveis Vendas Anuais, Preço da Ação e Relação Preço/Ganhos</p><p>são variáveis quantitativas contínuas já que podem assumir qualquer valor num determinado</p><p>intervalo de valores.</p><p>Para propósitos de análise estatística, a diferença importante e relevante entre dados</p><p>qualitativos e quantitativos é que as operações aritméticas comuns só tem significado com dados</p><p>quantitativos. Por exemplo, com dados quantitativos, os valores de dados podem ser adicionados e</p><p>divididos pelo número total de dados para calcular seu valor médio. Essa média tem significado e, em</p><p>geral, é facilmente interpretada. No entanto, quando dados qualitativos são registrados como valores</p><p>numéricos, tais operações aritméticas fornecem resultados sem nenhum significado.</p><p>6</p><p>Tabela 1 – Conjunto de dados contendo informações financeiras referentes a 25 empresas.</p><p>Empresa</p><p>Bolsa</p><p>de</p><p>Valores</p><p>Símbolo</p><p>do Painel</p><p>Eletrônico</p><p>No de Negócios</p><p>Realizados</p><p>Anualmente</p><p>Vendas</p><p>Anuais</p><p>(US$ milhões)</p><p>Preço</p><p>da Ação</p><p>(US$)</p><p>Relação</p><p>Preço/Ganhos</p><p>Award Software OTC AWRD 63.334 15,7 11,500 22,5</p><p>Chesapeak Energy NYSE CHK 1.123.401 255,3 7,880 12,7</p><p>Craig Corporation NYSE CRG 121.237 29,4 17,000 7,5</p><p>Edisto Resources AMEX EDT 1.115.678 254,6 9,688 6,0</p><p>Franklin Elect. Pbls NYSE FEP 378.990 88,7 12,880 15,7</p><p>Gentia Software OTC GNTIY 118.365 27,7 5,750 27,4</p><p>Giant Group NYSE GPO 30.002 7,2 6,563 2,1</p><p>Hot Topic OTC HOTT 200.458 48,3 15,750 27,2</p><p>Hudson General AMEX HGC 123.877 30,2 39,750 11,2</p><p>ICU Medical OTC ICUI 115.432 26,5 8,500 15,7</p><p>Jackpot Enterprises NYSE J 499.456 90,6 10,875 17,0</p><p>Kentek Information OTC KNTK 246.367 60,5 9,500 11,4</p><p>Larscom, Inc. OTC LARS 310.998 71,1 10,313 24,6</p><p>Lumisys, Inc. OTC LUMI 109.211 23,7 7,375 14,2</p><p>Maynard Oil OTC MOIL 147.954 38,2 10,750 4,8</p><p>Mechanical Dynamics OTC MDII 114.981 26,0 6,688 17,1</p><p>Metrika Systems AMEX MKA 261.934 67,2 15,250 15,7</p><p>National Home Health OTC NHHC 130.870 34,9 5,130 7,7</p><p>National Tech Team OTC TEAM 345.698 78,1 10,875 32,0</p><p>OrCad OTC OCAD 85.384 21,9 11,375 18,3</p><p>OroAmerica OTC OROA 689.004 164,8 5,125 16,0</p><p>Overland Data OTC OVRL 256.156 66,5 7,000 13,5</p><p>PIA Merchandising OTC PIAM 545.890 123,1 7,500 28,8</p><p>Plenum Publishing OTC PLEN 229.786 52,5 44,000 10,7</p><p>Premier Research OTC PRWW 64.489 16,5 8,250 28,4</p><p>Fonte: Stock Investor Pro, American Association of Individual Investors.</p><p>7</p><p>2. TABELA DE DISTRIBUIÇÃO DE FREQUÊNCIAS</p><p>Uma distribuição de frequência é um sumário tabular de dados que mostra a frequência (ou o</p><p>número) de observações em cada uma das diversas classes não sobrepostas. O objetivo da distribuição</p><p>de frequências é reduzir a quantidade de dados.</p><p>2.1. A DISTRIBUIÇÃO DE FREQUÊNCIAS</p><p>• Frequência Absoluta (fi) número de vezes em que cada resultado aparece no conjunto de dados.</p><p>• Total de observações (n) a soma das frequências absolutas.</p><p>=</p><p>i</p><p>ifn</p><p>• Frequência Relativa (ou proporção) (fri) proporção de cada realização em relação ao total.</p><p>n</p><p>f</p><p>f i</p><p>ri =</p><p>É mais usual exprimir a frequência relativa em porcentagem (frequência relativa percentual):</p><p>100</p><p>n</p><p>f</p><p>f i</p><p>ri =</p><p>❖ A frequência absoluta não é comparativa, pois um mesmo valor pode apresentar diferentes</p><p>significados dependendo do número total de observações.</p><p>Exemplo para a variável qualitativa grau de escolaridade: Na empresa ALFA, metade dos</p><p>funcionários, ou seja 20, possui o 1o grau. Na empresa BETA, a totalidade de seus 20 funcionários</p><p>tem o 1o grau. Apesar de a frequência absoluta ser a mesma nas duas empresas, o significado</p><p>desse número é bem diferente.</p><p>❖ Para</p><p>tornar os dados comparativos utiliza-se a proporção (frequência relativa) ou a frequência</p><p>relativa percentual.</p><p>Exemplos:</p><p>Tabela 2 – Frequência absoluta e frequência relativa percentual de 36 funcionários do departamento</p><p>de recursos humanos da empresa GAMA, segundo o grau de escolaridade.</p><p>Grau de</p><p>escolaridade</p><p>Frequência</p><p>Absoluta fi</p><p>Frequência relativa</p><p>percentual fri (%)</p><p>1o grau</p><p>2o grau</p><p>3o grau</p><p>12</p><p>18</p><p>6</p><p>33,33</p><p>50,00</p><p>16,67</p><p>Total 36 100,00</p><p>8</p><p>Tabela 3 – Frequência absoluta e frequência relativa percentual dos 2000 funcionários da empresa</p><p>GAMA, segundo o grau de escolaridade.</p><p>Grau de</p><p>escolaridade</p><p>Frequência</p><p>Absoluta fi</p><p>Frequência relativa</p><p>percentual fri (%)</p><p>1o grau</p><p>2o grau</p><p>3o grau</p><p>650</p><p>1020</p><p>330</p><p>32,50</p><p>51,00</p><p>16,50</p><p>Total 2000 100,00</p><p>Não podemos comparar diretamente as colunas das frequências absolutas das tabelas 2 e</p><p>3, pois os totais de empregados são diferentes nos dois casos. Mas, as colunas de porcentagens</p><p>são comparáveis, pois reduzimos as frequências a um mesmo total (no caso 100).</p><p>Além das frequências absoluta e relativa pode-se tabular a frequência acumulada.</p><p>• Frequência acumulada (Fac) soma da frequência absoluta de um elemento com as</p><p>frequências absolutas dos elementos que o antecedem.</p><p>i21ac f...ffF +++=</p><p>• Frequência acumulada relativa (FRi) soma da frequência relativa percentual de um elemento</p><p>com as frequências relativas percentuais dos elementos que o antecedem.</p><p>ri2r1rRi f...ffF +++=</p><p>Com esses dados a Tabela 2 se torna:</p><p>Tabela 4 – Frequência absoluta, frequência relativa percentual, frequência acumulada e frequência</p><p>acumulada percentual dos 36 funcionários do departamento de recursos humanos da empresa</p><p>GAMA, segundo a variável qualitativa Grau de Escolaridade.</p><p>Grau de</p><p>escolaridade</p><p>Frequência</p><p>Absoluta fi</p><p>Frequência relativa</p><p>percentual fri (%)</p><p>Frequência</p><p>Acumulada Fac</p><p>Frequência Acumulada</p><p>Relativa FRi (%)</p><p>1o grau</p><p>2o grau</p><p>3o grau</p><p>12</p><p>18</p><p>6</p><p>33,33</p><p>50,00</p><p>16,67</p><p>12</p><p>30</p><p>36</p><p>33,33</p><p>83,33</p><p>100,00</p><p>Total 36 100,00 ----- -----</p><p>Análise de alguns valores da distribuição de frequências apresentados na Tabela 4:</p><p>12 funcionários não possuem 2o e 3o graus;</p><p>50,00% dos funcionários possuem 2o grau;</p><p>16,67% dos funcionários possuem 3o grau;</p><p>30 funcionários possuem até 2o grau;</p><p>33,33% dos funcionários possuem somente o 1o grau;</p><p>83,33% dos funcionários não possuem 3o grau.</p><p>2.2. DISTRIBUIÇÃO DE FREQUÊNCIAS – VARIÁVEL QUANTITATIVA DISCRETA</p><p>Um conjunto de dados, frequentemente, é difícil de interpretar diretamente na forma em que é</p><p>reunido. Para sintetizar dados, utiliza-se a distribuição de frequências. No caso das variáveis</p><p>quantitativas discretas, a representação em tabelas é muito útil, pois fornece meios de organizar e</p><p>resumir os dados de modo que padrões sejam revelados e os dados sejam mais facilmente</p><p>interpretados.</p><p>9</p><p>Observe na Tabela 5, abaixo, na qual além de outras informações, é apresentada a variável</p><p>quantitativa discreta Número de Filhos de 36 funcionários do departamento de recursos humanos da</p><p>empresa GAMA.</p><p>Tabela 5 – Informações sobre estado civil, grau de escolaridade, no de filhos, salário, idade e</p><p>procedência de 36 funcionários do departamento de recursos humanos da empresa GAMA,</p><p>localizada na cidade de São Paulo.</p><p>No Estado</p><p>Civil</p><p>Grau de</p><p>escolaridade</p><p>No de</p><p>filhos</p><p>Salário</p><p>(x Sal. Min.)</p><p>Idade</p><p>(anos)</p><p>Região de</p><p>Procedência</p><p>1 Solteiro 1º Grau 0 4,00 26 Interior</p><p>2 Casado 1º Grau 1 4,56 32 Capital</p><p>3 Casado 1º Grau 2 5,25 36 Capital</p><p>4 Solteiro 2º Grau 0 5,73 20 Outro Estado</p><p>5 Solteiro 1º Grau 0 6,26 40 Outro Estado</p><p>6 Casado 1º Grau 0 6,66 28 Interior</p><p>7 Solteiro 1º Grau 0 6,86 41 Interior</p><p>8 Solteiro 1º Grau 0 7,39 43 Capital</p><p>9 Casado 2º Grau 1 7,59 34 Capital</p><p>10 Solteiro 2º Grau 0 7,44 23 Outro Estado</p><p>11 Casado 2º Grau 2 8,12 33 Interior</p><p>12 Solteiro 1º Grau 0 8,46 27 Capital</p><p>13 Solteiro 2º Grau 0 8,74 37 Outro Estado</p><p>14 Casado 1º Grau 3 8,95 44 Outro Estado</p><p>15 Casado 2º Grau 0 9,13 30 Interior</p><p>16 Solteiro 2º Grau 0 9,35 38 Outro Estado</p><p>17 Casado 2º Grau 1 9,77 31 Capital</p><p>18 Casado 1º Grau 2 9,80 39 Outro Estado</p><p>19 Solteiro Superior 0 10,53 25 Interior</p><p>20 Solteiro 2º Grau 0 10,76 37 Interior</p><p>21 Casado 2º Grau 0 11,06 30 Outro Estado</p><p>22 Solteiro 2º Grau 2 11,59 34 Capital</p><p>23 Solteiro 1º Grau 2 12,00 41 Outro Estado</p><p>24 Casado Superior 0 12,79 26 Outro Estado</p><p>25 Casado 2º Grau 2 13,23 32 Interior</p><p>26 Casado 2º Grau 2 13,60 35 Outro Estado</p><p>27 Solteiro 1º Grau 0 13,85 46 Outro Estado</p><p>28 Casado 2º Grau 0 14,69 29 Interior</p><p>29 Casado 2º Grau 5 14,71 40 Interior</p><p>30 Casado 2º Grau 2 15,99 35 Capital</p><p>31 Solteiro Superior 0 16,22 31 Outro Estado</p><p>32 Casado 2º Grau 1 16,61 36 Interior</p><p>33 Casado Superior 3 17,26 43 Capital</p><p>34 Solteiro Superior 0 18,75 33 Capital</p><p>35 Casado 2º Grau 2 19,40 48 Capital</p><p>36 Casado Superior 3 21,90 42 Interior</p><p>Para agrupar os dados da variável quantitativa discreta Número de Filhos basta proceder à</p><p>contagem para cada um dos valores diferentes da variável em estudo e construir a tabela de</p><p>distribuição de frequências.</p><p>10</p><p>Tabela 6 – Frequência absoluta, frequência relativa percentual, frequência acumulada e frequência</p><p>acumulada percentual dos 36 funcionários do departamento de recursos humanos da empresa</p><p>GAMA, segundo a variável quantitativa discreta Número de Filhos.</p><p>No de</p><p>filhos</p><p>Frequência</p><p>Absoluta fi</p><p>Frequência relativa</p><p>percentual fri (%)</p><p>Frequência</p><p>Acumulada Fac</p><p>Frequência Acumulada</p><p>Relativa FRi (%)</p><p>0</p><p>1</p><p>2</p><p>3</p><p>5</p><p>19</p><p>4</p><p>9</p><p>3</p><p>1</p><p>52,78</p><p>11,11</p><p>25,00</p><p>8,33</p><p>2,78</p><p>19</p><p>23</p><p>32</p><p>35</p><p>36</p><p>52,78</p><p>63,89</p><p>88,89</p><p>97,22</p><p>100,00</p><p>Total 36 100,00 ----- -----</p><p>2.3. DISTRIBUIÇÃO DE FREQUÊNCIAS – VARIÁVEL CONTÍNUA (COM INTERVALOS DE</p><p>CLASSE)</p><p>Um dos objetivos de se construir a distribuição de frequências é resumir o conjunto de dados. No</p><p>caso de variáveis contínuas, não se pode construir a distribuição de frequências listando os resultados</p><p>um a um, pois não havendo observações iguais, não há redução dos dados em uma tabela. Desta</p><p>forma, é interessante agrupar os resultados em classes não sobrepostas, calculadas de forma mais</p><p>elaborada.</p><p>Para agrupar os dados de uma variável contínua em classes, é necessário adotar classes de</p><p>mesma amplitude, sempre que possível, e:</p><p>1. Determinar a extensão (amplitude) total dos dados a tabelar;</p><p>2. Determinar o número de classes não sobrepostas;</p><p>3. Determinar a extensão (amplitude) de cada classe;</p><p>4. Determinar os limites de classe.</p><p>• Amplitude total de uma sequência (At) diferença entre o maior e o menor elemento de uma</p><p>sequência. Representa o comprimento total da sequência.</p><p>minmaxt xxA −=</p><p>• Número de Classes (k) existem vários critérios para se calcular o número de classes k. O</p><p>mais utilizado é a fórmula empírica:</p><p>nk = , onde n é o número de elementos observados.</p><p>• Amplitude de classe (h) é determinada por:</p><p>k</p><p>A</p><p>h t=</p><p>Neste ponto é importante observar que o número de classes deve ser determinado</p><p>adequadamente. Quando se adota um grande número de classes não há redução dos dados, enquanto</p><p>que para um número pequeno de classes as informações podem ser perdidas. Sugere-se o uso de 5 a</p><p>15 classes com a mesma amplitude.</p><p>11</p><p>Exemplo: A partir da Tabela 5, computando as frequências absolutas de cada classe para a variável</p><p>quantitativa contínua salários, é possível construir a tabela de frequências. Pode-se observar que estão</p><p>tabelados 36 salários que vão de 4,00 até 21,90 salários mínimos. Portanto, calcula-se:</p><p>Número de classes: nk = = 36 = 6</p><p>Amplitude total: minmaxt xxA −= = 21,90 – 4,00 = 17,90</p><p>Amplitude de cada classe:</p><p>k</p><p>A</p><p>h t= =</p><p>6</p><p>90,17</p><p>= 2,98 3</p><p>Tabela 7 – Frequência absoluta, frequência relativa percentual, frequência acumulada e frequência</p><p>acumulada percentual dos 36 funcionários</p><p>do departamento de recursos humanos da empresa</p><p>GAMA, segundo a variável quantitativa contínua Salário.</p><p>Classes de salário</p><p>(em salários mínimos)</p><p>Frequência</p><p>Absoluta fi</p><p>Frequência relativa</p><p>percentual fri (%)</p><p>Frequência</p><p>Acumulada Fac</p><p>Frequência Acumulada</p><p>Relativa FRi (%)</p><p>4,00 7,00</p><p>7,00 10,00</p><p>10,00 13,00</p><p>13,00 16,00</p><p>16,00 19,00</p><p>19,00 22,00</p><p>7</p><p>11</p><p>6</p><p>6</p><p>4</p><p>2</p><p>19,44</p><p>30,56</p><p>16,67</p><p>16,67</p><p>11,11</p><p>5,55</p><p>7</p><p>18</p><p>24</p><p>30</p><p>34</p><p>36</p><p>19,44</p><p>50,00</p><p>66,67</p><p>83,34</p><p>94,45</p><p>100,00</p><p>Total 36 100,00 -------- --------</p><p>Análise de alguns valores da distribuição de frequências apresentados na Tabela 7:</p><p>11 funcionários recebem salários entre 7,00 e 10,00 s.m.</p><p>16,67% dos funcionários, o que equivale a 6 funcionários, recebem salários entre 10,00 e 13,00 s.m.</p><p>5,55% dos funcionários, o que equivale a 2 funcionários apenas, recebem os maiores salários, que</p><p>situam-se entre 19,00 e 22,00 s.m.</p><p>11,11% dos funcionários recebem salários entre 16,00 e 19,00 s.m.</p><p>30 funcionários recebem menos que 16,00 s.m. ou salários entre 4,00 e 16,00 s.m.</p><p>6 funcionários recebem pelo menos 16,00 s.m.</p><p>66,67% dos funcionários recebem menos que 13,00 s.m.</p><p>33,33% dos funcionários recebem pelo menos 13,00 s.m.</p><p>12</p><p>LISTA 1 - Exercícios para fixação</p><p>1. Declare se cada uma das seguintes variáveis é qualitativa (nominal ou ordinal) ou quantitativa</p><p>(discreta ou contínua):</p><p>a) Idade</p><p>b) Idade completa</p><p>c) Gênero</p><p>d) Marca de jeans</p><p>e) Número de pessoas favoráveis à reforma tributária</p><p>f) Valor das vendas anuais de uma empresa brasileira</p><p>g) Tamanho de camisetas</p><p>h) Lucro por ação de uma empresa</p><p>i) Método de pagamento de um bem</p><p>j) Vida útil de lâmpadas</p><p>k) Produção anual de automóveis marca FORD em uma capital</p><p>l) Número de ações negociadas na BOVESPA</p><p>m) Renda familiar dos alunos de uma universidade</p><p>n) Índice de liquidez das indústrias da cidade de Bauru</p><p>o) Classe social dos habitantes de um município</p><p>p) Produção anual de café do Estado de São Paulo</p><p>q) Raça de animais</p><p>r) Peso de lutadores de boxe na categoria “Peso Pena”</p><p>s) Número de livros existentes na biblioteca de uma universidade</p><p>t) Altura de jovens selecionados para se tornarem jogadores de vôlei</p><p>u) Consumo mensal de energia elétrica em um condomínio</p><p>v) Patente militar</p><p>w) Ocupação profissional</p><p>x) Cargos hierárquicos em uma empresa</p><p>y) Espessura de folhas de papel</p><p>z) Número de acidentes de trânsito</p><p>2. A revista Fortune fornece dados sobre a classificação das 500 maiores corporações industriais dos</p><p>Estados Unidos em termos de vendas e de lucros. Os dados para uma amostra de empresas da</p><p>Fortune 500 estão na tabela abaixo.</p><p>Empresa Vendas</p><p>(US$ milhões)</p><p>Lucros</p><p>(US$ milhões)</p><p>Código do Setor</p><p>Banc One 10.272 1.427,0 8</p><p>CPC Intl. 9.844 580,0 19</p><p>Tyson Foods 6.454 87,0 19</p><p>Hewlett-Packard 38.420 2.586,0 12</p><p>Intel 20.847 5.157,0 15</p><p>Northrup 8.071 234,0 2</p><p>Seagate Tech. 8.588 213,3 11</p><p>Unisys 6.371 49,7 10</p><p>Westvaco 3.075 212,2 22</p><p>Woolworth 8.092 168,7 48</p><p>a) Quantos elementos existem nesse conjunto de dados?</p><p>b) Qual é a população?</p><p>c) Quantas variáveis existem no conjunto de dados?</p><p>d) Quais variáveis são qualitativas e quais são quantitativas?</p><p>e) Que porcentagem de empresas teve um lucro acima de US$ 100 milhões?</p><p>f) Que porcentagem de empresas tem código de setor 8?</p><p>13</p><p>3. Complete as tabelas:</p><p>a) b)</p><p>xi fi fri (%) xi fi fri (%)</p><p>0 1 20 5</p><p>1 15 25 45</p><p>2 4 30</p><p>3 25 35 30</p><p>4 3 15 40 60</p><p>5 2 45 30</p><p>6 50 10</p><p>7 1 Total 300</p><p>Total</p><p>4. Contou-se o número de erros de impressão de um jornal durante 40 dias, obtendo-se os seguintes</p><p>resultados:</p><p>8 10 10 5 12 11 14 12 12 10 12 6 8 7 7 5 14 12 16 15</p><p>7 10 12 18 15 6 12 8 9 11 16 15 5 12 6 7 14 10 12 8</p><p>a) Classifique o tipo de variável que se quer analisar estatisticamente.</p><p>b) Elabore o rol.</p><p>c) Resuma os dados em uma tabela de frequências.</p><p>d) Qual a porcentagem de dias em que ocorreram menos que 10 erros?</p><p>e) Qual a porcentagem de dias em que ocorreram pelo menos 15 erros?</p><p>f) Qual a porcentagem de dias em que ocorreram mais que 12 erros?</p><p>g) Qual o número de dias em que ocorreram 11 erros?</p><p>h) Qual o número de dias em que ocorreram menos que 7 erros?</p><p>i) Qual o número de dias em que ocorreram pelo menos 7 erros?</p><p>5. Uma indústria embala peças em caixas com 100 unidades. O controle de qualidade selecionou 50</p><p>caixas na linha de produção e anotou em cada caixa o número de peças defeituosas. Obteve os</p><p>seguintes dados:</p><p>2 0 0 4 3 0 0 1 0 0</p><p>1 1 2 1 1 1 1 1 1 0</p><p>0 0 3 0 0 0 2 0 0 1</p><p>1 2 0 2 0 0 0 0 0 0</p><p>0 0 0 0 0 0 1 4 1 2</p><p>Agrupe estes dados por frequência, construa a distribuição de frequências para variável discreta e</p><p>responda:</p><p>a) Qual a porcentagem de caixas com 2 peças defeituosas?</p><p>b) Qual a porcentagem de caixas com menos que 2 peças defeituosas?</p><p>c) Qual a porcentagem de caixas com pelo menos 2 peças defeituosas?</p><p>d) Qual a porcentagem de caixas com mais que 2 peças defeituosas?</p><p>e) Qual o número de caixas com 3 peças defeituosas?</p><p>f) Qual o número de caixas com pelo menos 3 peças defeituosas?</p><p>g) Qual o número de caixas com menos que 3 peças defeituosas?</p><p>h) Qual o número de caixas em que não há peças defeituosas?</p><p>6. A tabela abaixo apresenta as vendas diárias de um determinado aparelho elétrico, durante um mês,</p><p>por uma empresa comercial:</p><p>14 12 11 13 14 13</p><p>12 14 13 14 11 12</p><p>12 14 10 13 15 11</p><p>15 13 16 17 14 14</p><p>14</p><p>a) Construa a distribuição de frequências para a variável discreta.</p><p>b) Em quantos dias as vendas foram superiores a 13 unidades?</p><p>c) Qual a porcentagem de dias com vendas inferiores a 12 unidades?</p><p>d) Em quantos dias as vendas foram inferiores a 15 unidades?</p><p>e) Qual a porcentagem de dias com vendas de no mínimo 10 unidades?</p><p>7. Complete os dados que faltam na distribuição de frequências:</p><p>a) b)</p><p>Classes fi fri (%) Classes fi fri (%)</p><p>0 8 10 0 2 2 4</p><p>8 16 10 2 4 8</p><p>16 24 14 4 6 9</p><p>24 32 9 13</p><p>32 40 8 10 16</p><p>Total 40 10 12 12</p><p>14 16 3</p><p>Total</p><p>8. A SP Transportes Aéreos aceita reservas de vôo por telefone. Os seguintes dados mostram a</p><p>duração das chamadas (em minutos) para uma amostra de 30 reservas feitas por telefone.</p><p>2,1 4,8 5,5 10,4 7,5 8,9 3,3 3,5 5,8 4,8</p><p>9,5 4,6 5,3 5,5 2,8 3,6 2,4 10,9 5,9 6,6</p><p>7,8 10,5 11,0 4,7 7,5 6,0 4,5 4,8 11,2 4,3</p><p>Determinar:</p><p>a) A amplitude total At, o número de classes k e a amplitude de cada classe h;</p><p>b) A distribuição de frequências para a variável contínua;</p><p>c) A porcentagem de ligações com duração menor que 8,0 minutos.</p><p>d) O número de ligações com pelo menos 4,0 minutos de duração.</p><p>e) A porcentagem de ligações com duração entre 4,0 (inclusive) e 8,0 (exclusive) minutos.</p><p>f) O número de ligações com duração maior ou igual a 8,0 minutos.</p><p>9. As notas de 32 estudantes de uma classe são dadas abaixo:</p><p>6,0 0,0 2,0 6,5 5,0 3,5 4,0 7,0</p><p>8,0 7,0 8,5 6,0 4,5 0,0 6,5 6,0</p><p>2,0 5,0 5,5 5,0 7,0 1,5 5,0 5,0</p><p>4,0 4,5 4,0 1,0 5,5 3,5 2,5 4,5</p><p>Determinar:</p><p>a) A amplitude total At, o número de classes k e a amplitude de cada classe h;</p><p>b) A distribuição de frequências para a variável contínua;</p><p>c) A porcentagem de alunos que tiraram nota menor que 4,5;</p><p>d) O número de alunos que tiraram nota menor que 7,5;</p><p>e) O número de alunos que tiraram nota maior ou igual a 6,0;</p><p>f) A porcentagem de alunos que tiraram nota entre 4,5 (inclusive) e 7,5 (exclusive);</p><p>g) O limite superior da 2a classe;</p><p>h) O limite inferior da 4a classe;</p><p>i) O ponto médio da 3a classe.</p><p>15</p><p>10. Os dados abaixo referem-se ao consumo mensal de energia elétrica (kWh) em um condomínio</p><p>residencial:</p><p>9520 8720 7760 8720 7840 8560 8480</p><p>9360 12480</p><p>7440 7920 7200 8880 8880 7920 10320 9360 11200</p><p>6880 7520 7200 7760 8480 8320 8560 9600 11360</p><p>7680 7680 7440 7760 8480 9440 8560 12960 12960</p><p>8880 8240 8240 7840 8880 8480 8800 13280 14560</p><p>6640 6960 8480 8880 8880 8320 8560 13200 13200</p><p>6720 7760 6880 7760 8320 8560 8560 12800 12480</p><p>7120 7120 7360 9360 8240 8480 13840 8960 14000</p><p>Construa a distribuição de frequências para esses dados e responda:</p><p>a) Qual a porcentagem de meses em que o consumo foi pelo menos 10.000 kWh?</p><p>b) Qual a porcentagem de meses em que o consumo ficou entre 9.000 e 11.000 kWh (exclusive)?</p><p>c) Qual a porcentagem de meses em que o consumo foi inferior a 13.000 kWh?</p><p>d) Qual o número de meses em que o consumo foi igual ou superior a 8.000 kWh?</p><p>e) Qual o número de meses em que o consumo foi inferior a 10.000 kWh?</p><p>11. O departamento de pessoal de certa empresa fez um levantamento dos salários dos 80 funcionários</p><p>do setor administrativo, obtendo os resultados da tabela de distribuição de frequências dada abaixo:</p><p>Faixa salarial (em no de salários mínimos) Frequência absoluta - fi</p><p>0 2 25</p><p>2 4 30</p><p>4 6 13</p><p>6 8 12</p><p>TOTAL 80</p><p>Determinar:</p><p>a) A porcentagem de funcionários que ganham menos que 4 salários mínimos.</p><p>b) A porcentagem de funcionários que ganham pelo menos 4 salários mínimos.</p><p>c) A porcentagem de funcionários que ganham 2 ou mais salários mínimos.</p><p>d) A porcentagem de funcionários que ganham entre 2 (inclusive) e 6 (exclusive) salários mínimos.</p><p>e) A amplitude da 4ª classe.</p><p>f) O limite superior da 2ª classe.</p><p>g) O limite inferior da 4ª classe.</p><p>12. Construa a distribuição de frequências para a série abaixo, que representa uma amostra dos</p><p>salários (em R$) de 25 funcionários selecionados em uma empresa.</p><p>Salários (R$)</p><p>xi</p><p>No de funcionários</p><p>fi</p><p>fr i (%) Fac FR i (%)</p><p>1.000,00 1.200,00</p><p>1.200,00 1.400,00</p><p>1.400,00 1.600,00</p><p>1.600,00 1.800,00</p><p>1.800,00 2.000,00</p><p>2</p><p>6</p><p>10</p><p>5</p><p>2</p><p>a) Determine o salário médio de cada uma das 5 classes.</p><p>b) Calcule a porcentagem de funcionários que ganham salários pelo menos de R$1.600,00.</p><p>c) Determine o número de funcionários que recebem salários inferiores a R$ 1.400,00.</p><p>d) Determine o número de funcionários que recebem salários iguais ou superiores a R$ 1.800,00.</p><p>e) Calcule a porcentagem de funcionários que recebem salário no mínimo de R$ 1.200,00.</p><p>16</p><p>13. A tabela abaixo representa a distribuição das espessuras (em mm) de 100 folhas de tabaco:</p><p>2,01 2,08 1,96 3,04 2,01 3,18 1,94 2,19 2,24 2,18</p><p>2,59 1,96 2,29 3,18 2,09 1,96 2,06 2,18 2,05 2,04</p><p>2,43 1,56 1,94 3,15 2,35 2,08 2,56 2,17 1,96 1,59</p><p>2,22 2,34 2,24 1,95 2,01 3,12 3,03 3,12 2,04 1,66</p><p>1,87 2,49 3,12 2,24 1,76 3,20 2,38 1,58 1,89 1,98</p><p>1,89 1,71 2,42 1,62 1,97 2,18 1,69 3,14 2,18 3,06</p><p>2,40 1,96 3,01 2,19 2,25 1,45 1,93 2,06 1,83 1,84</p><p>1,91 2,11 1,78 2,36 2,33 3,17 2,03 1,87 3,11 2,17</p><p>1,72 1,62 1,99 1,64 1,54 2,26 1,86 2,09 1,74 1,92</p><p>2,36 1,82 2,02 2,25 1,75 3,15 3,18 1,99 1,76 2,51</p><p>Pede-se: A amplitude total, o número recomendado de classes, a amplitude das classes, a frequência</p><p>absoluta das classes, a frequência relativa das classes e a frequência acumulada das classes. Depois,</p><p>calcule:</p><p>a) Qual a porcentagem de folhas com espessuras iguais ou superiores a 2,00 mm?</p><p>b) Qual o número de folhas com espessuras inferiores a 2,00 mm?</p><p>c) Qual o número de folhas com espessuras entre 1,80 mm (inclusive) e 2,20 mm (exclusive)?</p><p>d) Qual a porcentagem de folhas com espessuras inferiores a 2,60 mm?</p><p>14. Julgue os seguintes itens:</p><p>I. Em Estatística entende-se por população um conjunto de pessoas.</p><p>II. A variável é quantitativa contínua quando pode assumir qualquer valor dentro de determinado</p><p>intervalo.</p><p>III. Frequência relativa de uma variável aleatória é o número de repetições dessa variável.</p><p>IV. Amplitude total é a diferença entre dois valores quaisquer do atributo.</p><p>Está correto, apenas, o que se afirma em:</p><p>A) I e II</p><p>B) II</p><p>C) III</p><p>D) II e IV</p><p>E) I e III</p><p>15. Ouvindo-se 300 pessoas sobre o tema "Reforma da Previdência, contra ou a favor?", foram obtidas</p><p>123 respostas a favor, 72 contra, 51 pessoas não quiseram opinar e, o restante, não tinha opinião</p><p>formada sobre o assunto. Distribuindo-se esses dados em uma tabela, obtém-se:</p><p>OPINIÃO FREQUÊNCIA FREQUÊNCIA RELATIVA</p><p>Favorável 123 X</p><p>Contra 72 Y</p><p>Omissos 51 0,17</p><p>Sem opinião 54 0,18</p><p>TOTAL 300 1,00</p><p>Na coluna frequência relativa, os valores de X e Y são, respectivamente:</p><p>A) 0,41 e 0,24</p><p>B) 0,38 e 0,27</p><p>C) 0,37 e 0,28</p><p>D) 0,35 e 0,30</p><p>E) 0,30 e 0,35</p><p>17</p><p>16. A tabela abaixo apresenta a distribuição de frequências relativas da variável tempo, em segundos,</p><p>requerido para completar uma operação de montagem.</p><p>Tempo (segundos) fri (%)</p><p>a b 25</p><p>b c 25</p><p>c d 25</p><p>d 36,0 25</p><p>Total 100</p><p>Sabendo-se que nessa tabela todas as classes têm a mesma amplitude e que 24,0 segundos é o tempo</p><p>que é excedido por 75% das montagens, o valor de a é:</p><p>A) 20,0</p><p>B) 22,5</p><p>C) 21,8</p><p>D) 21,2</p><p>E) 16,0</p><p>Responda às questões 17 e 18 com base na seguinte situação: a distribuição a seguir indica o</p><p>número de acidentes ocorridos com 80 motoristas de uma empresa de ônibus interestadual.</p><p>No de acidentes 0 1 2 3 4 5 6</p><p>No de motoristas 26 14 19 8 7 5 1</p><p>17. O número de motoristas que sofreram pelo menos 4 acidentes é:</p><p>A) 6</p><p>B) 13</p><p>C) 74</p><p>D) 67</p><p>E) 7</p><p>18. A porcentagem de motoristas que sofreram no máximo 2 acidentes é:</p><p>A) 72,25%</p><p>B) 57,50%</p><p>C) 50,00%</p><p>D) 26,25%</p><p>E) 73,75%</p><p>19. A tabela abaixo mostra o resultado de uma pesquisa sobre o tipo de alojamento utilizado por alguns</p><p>turistas que estiveram na cidade de São Paulo, em determinado ano:</p><p>Nacionalidade Hotéis Casa de parentes/amigos Total</p><p>Portugueses 2.435 21.352 23.787</p><p>Alemães 4.134 13.835 17.969</p><p>Italianos 30.248 9.551 39.799</p><p>Total 36.817 44.738 81.555</p><p>Julgue os itens a seguir e depois assinale a alternativa correta:</p><p>I. A porcentagem da população que ficou em hotéis é de aproximadamente 45%.</p><p>II. A porcentagem de alemães que ficaram na casa de parentes e amigos é de aproximadamente 17%.</p><p>III. A porcentagem de portugueses que ficaram em hotéis é de aproximadamente 2%.</p><p>18</p><p>A) Somente I é falsa.</p><p>B) Somente II é verdadeira.</p><p>C) Somente III é verdadeira.</p><p>D) Somente I e II são verdadeiras</p><p>E) Somente I e III são verdadeiras.</p><p>20. "O estudo "Morte no Trânsito: Tragédia Rodoviária", realizado pelo SOS Estradas, programa de</p><p>redução de acidentes do www.estradas.com.br, maior portal de rodovias do Brasil, traz revelações</p><p>surpreendentes. Todos os dias ocorrem, em média, 723 acidentes nas rodovias pavimentadas</p><p>brasileiras, provocando a morte de 35 pessoas por dia, e deixando 417 feridos, dos quais mais 30</p><p>morrem, por dia, em decorrência do acidente. A maior parte das mortes no trânsito ocorre nas rodovias</p><p>e não nas vias urbanas. Embora, em número menor, os acidentes nas estradas são muito violentos,</p><p>provocando mais mortes e ferimentos graves. Na avaliação do estudo, a melhoria das condições das</p><p>rodovias não significa que teremos uma redução dos acidentes, pois 90% são provocados por falha</p><p>humana. Na avaliação do Coordenador do SOS Estradas, Rodolfo Alberto Rizzotto, é preciso aplicar</p><p>rigorosamente a lei. "Não temos uma indústria de multas, mas uma fábrica de motoristas infratores, cuja</p><p>produção está aumentando, estimulada pela impunidade. Milhares de pessoas morrem sem nenhuma</p><p>justificativa. Não podemos esperar que os infratores contumazes sejam conscientizados, pois estamos</p><p>vivendo uma epidemia", afirma Rizzotto".</p><p>Fonte:<http://www.estradas.com.br/sosestradas/estudos.asp></p><p>Baseado no texto acima, a frequência relativa de mortos por dia em acidentes nas rodovias</p><p>pavimentadas brasileiras é, aproximadamente, igual a:</p><p>A) 4%</p><p>B) 58%</p><p>C) 67%</p><p>D) 10%</p><p>E) 9%</p><p>21. Os brasileiros tiveram, em junho, o maior tempo de navegação residencial na internet entre onze</p><p>países monitorados pelo Ibope/NetRatings:</p><p>média mensal de 16 horas e 54 minutos por pessoa. O país</p><p>ficou à frente de nações como a França, Japão, Estados Unidos e Espanha. (Adaptado: Folha de São Paulo,</p><p>2005).</p><p>0</p><p>5 -</p><p>Com base na tabela e no texto acima, analise os possíveis motivos para a liderança do Brasil no tempo</p><p>de uso da internet.</p><p>I - O país tem uma estrutura populacional com maior percentual de jovens do que os países da Europa</p><p>e os EUA.</p><p>II - O uso de internet em casa se distribui igualmente entre as classes A, B e C, o que demonstra</p><p>iniciativas de inclusão digital.</p><p>III - A adesão ao sistema de internet por banda larga ocorre, porque essa tecnologia promove a</p><p>mudança de comportamento dos usuários.</p><p>Está correto, apenas, o que se afirma em:</p><p>A) I B) II C) III D) I e II E) II e III</p><p>http://www.estradas.com.br/</p><p>19</p><p>22. Um dos índices de qualidade do ar diz respeito à concentração de monóxido de carbono (CO), pois</p><p>esse gás pode causar vários danos à saúde. A tabela abaixo mostra a relação entre a qualidade do ar e</p><p>a concentração de CO.</p><p>Qualidade do ar Concentração de CO (ppm)* em 8 horas</p><p>Inadequada 15 a 30</p><p>Péssima 30 a 40</p><p>Crítica Acima de 40</p><p>*ppm = parte por milhão</p><p>Para analisar os efeitos do CO nos seres humanos, dispõe-se dos seguintes dados:</p><p>Concentração de CO (ppm) Sintomas em seres humanos</p><p>10 Nenhum</p><p>15 Diminuição da capacidade visual</p><p>60 Dores de cabeça</p><p>100 Tonturas, fraqueza muscular</p><p>270 Inconsciência</p><p>800 Morte</p><p>Fonte: <www.cetesb.sp.gov.br/aspectos/aspectos_toxicologia_efeitos.asp></p><p>Suponha que você tenha lido em um jornal que na cidade de São Paulo o nível de qualidade do ar está</p><p>péssimo. Uma pessoa que estivesse nessa área poderia:</p><p>A) não apresentar nenhum sintoma.</p><p>B) ter sua capacidade visual diminuída.</p><p>C) ter dores de cabeça.</p><p>D) apresentar fraqueza muscular e tontura.</p><p>E) ficar inconsciente.</p><p>20</p><p>CAPÍTULO 2 - REPRESENTAÇÃO GRÁFICA DE DADOS</p><p>ESTATÍSTICOS</p><p>BIBLIOGRAFIA CONSULTADA:</p><p>1. ANDERSON, D. R.; SWEENEY, D. J.; WILLIAMS, T. A. Estatística Aplicada à Administração e</p><p>Economia. 2.ed. São Paulo: Cengage Learning, 2007.</p><p>2. LAPPONI, J. C. Estatística usando o Excel. 4.ed. São Paulo: Campus, 2005.</p><p>3. MARTINS, G. A. Estatística Geral e Aplicada. 2.ed. São Paulo: Atlas, 2002.</p><p>4. MARTINS, G. A.; DONAIRE, D. Princípios de Estatística. 4.ed. São Paulo: Atlas, 1995.</p><p>5. MEDEIROS, E. S. et al. Estatística para os Cursos de Economia, Administração e Ciências</p><p>Contábeis. vol. 1 e 2. 3.ed. São Paulo: Atlas, 1999.</p><p>6. TRIOLA, M. F. Introdução à Estatística. 10.ed. Rio de Janeiro: LTC, 2008.</p><p>INTRODUÇÃO</p><p>No capítulo anterior mostrou-se a utilidade das tabelas como instrumento de apresentação e</p><p>análise de dados estatísticos.</p><p>A apresentação gráfica é um complemento importante da apresentação tabular. Uma das</p><p>maneiras mais concisas de se apresentar os dados estatísticos de uma tabela é através de gráficos. A</p><p>principal vantagem de um gráfico sobre uma tabela é que ele permite conseguir uma visualização</p><p>imediata da distribuição dos valores observados. Os gráficos propiciam uma idéia preliminar mais</p><p>satisfatória da concentração e dispersão de valores, uma vez que através deles, os dados estatísticos</p><p>se apresentam em termos de grandezas visualmente interpretáveis. Além disso, os fatos essenciais e</p><p>as relações que poderiam ser difíceis de reconhecer em massas de dados estatísticos podem ser</p><p>observados mais claramente através dos gráficos.</p><p>Entretanto, é preciso ter cuidado, pois até mesmo os gráficos mais simples podem ser usados</p><p>para sutilmente enganar e confundir.</p><p>Como exemplo, vejamos os lucros obtidos por uma empresa no último semestre do ano</p><p>passado.</p><p>MÊS Julho Agosto Setembro Outubro Novembro Dezembro</p><p>LUCRO (milhões de reais) 2,0 2,1 2,2 2,1 2,3 2,4</p><p>Agora, vamos construir dois gráficos para essa situação.</p><p>21</p><p>Esses gráficos são baseados nas mesmas informações, mas por que parecem diferentes? No</p><p>gráfico da esquerda, parece que o lucro da empresa foi praticamente o mesmo a cada mês. Já no</p><p>gráfico da direita o lucro da empresa parece que cresceu muito de julho para dezembro. O que está</p><p>acontecendo? Eles apresentam versões drasticamente diferentes das mesmas informações.</p><p>Observemos com atenção como os eixos verticais são diferentes em cada gráfico.</p><p>No gráfico da esquerda observa-se que o lucro é quase constante. Isso é obtido com o eixo</p><p>vertical começando em zero, escolhendo-se uma escala de 0,5 em 0,5 e, em seguida, marcando-se o</p><p>lucro para cada mês em função disso.</p><p>No gráfico da direita, o eixo vertical começa em 2,0 e foi escolhida uma escala de 0,1 em 0,1. À</p><p>primeira vista, os lucros parecem estar aumentando drasticamente a cada mês. Só quando se observa</p><p>mais de perto é que se consegue ver o que está realmente acontecendo.</p><p>Portanto, aí está o papel importantíssimo da ESCALA.</p><p>DIFERENTES TIPOS DE REPRESENTAÇÕES GRÁFICAS DE DADOS ESTATÍSTICOS</p><p>A distribuição de frequências, tanto de variáveis discretas como de variáveis contínuas, pode ser</p><p>interpretada mais facilmente quando os valores dessas variáveis são apresentados em forma de</p><p>gráficos.</p><p>A estatística utiliza vários tipos de gráficos: de barras, de colunas, de linhas, de setores ou pizza,</p><p>histogramas e polígonos de frequência.</p><p>Mas, por que nos preocuparmos com os gráficos? Os softwares gráficos resolvem tudo</p><p>rapidamente e geram gráficos eficientes... Na verdade, os softwares gráficos não podem pensar por</p><p>nós! Softwares podem traduzir dados em gráficos mas não podem garantir que o gráfico esteja correto e</p><p>nem que esteja transmitindo a mensagem desejada (basta lembrarmos do exemplo acima sobre o lucro</p><p>da empresa!).</p><p>22</p><p>A) GRÁFICO DE COLUNAS SIMPLES</p><p>Um gráfico de colunas é uma representação que serve para retratar os dados qualitativos ou</p><p>quantitativos discretos que foram sintetizados em uma distribuição de frequências absolutas,</p><p>frequências relativas ou frequências relativas percentuais. No eixo horizontal do gráfico são</p><p>especificadas as categorias. A escala de frequências é colocada no eixo vertical.</p><p>Exemplo: Na tabela abaixo, são apresentados o número de pacotes de férias vendidos por uma</p><p>operadora de turismo para alguns dos principais destinos em julho desse ano.</p><p>Destino No de pacotes de férias</p><p>vendidos</p><p>(frequência absoluta fi)</p><p>FRANÇA 12</p><p>ITÁLIA 8</p><p>PORTUGAL 6</p><p>EUA 13</p><p>EGITO 5</p><p>GRÉCIA 8</p><p>CARIBE 15</p><p>Importante: Os dados aqui apresentados são fictícios, não existindo nenhuma conexão com a</p><p>realidade. O gráfico em questão foi criado com o objetivo pedagógico de oferecer um melhor</p><p>entendimento de como um gráfico pode ser utilizado.</p><p>Representando-se, graficamente, com colunas simples a situação descrita acima, têm-se:</p><p>23</p><p>B) GRÁFICO DE BARRAS SIMPLES</p><p>Um gráfico de barras simples serve para retratar o mesmo tipo de variável que o gráfico de</p><p>colunas simples, ou seja, variáveis qualitativas ou quantitativas discretas. A diferença entre o gráfico de</p><p>colunas e de barras é que no eixo vertical do gráfico de barras são especificadas as categorias e a</p><p>escala de frequências é colocada no eixo horizontal.</p><p>Exemplo: Na tabela abaixo é apresentada a classificação (em porcentagem) das entidades sem fins</p><p>lucrativos (ONGs) por setor de atividade existentes no Brasil.</p><p>Setor de Atividade Percentual de ONGs</p><p>(frequência relativa fri)</p><p>Religião 24,8</p><p>Desenvolvimento e defesa de direitos 17,8</p><p>Associações patronais e profissionais 17,4</p><p>Cultura e recreação 13,9</p><p>Assistência social, saúde, meio ambiente e proteção animal 13,7</p><p>Educação e pesquisa 5,9</p><p>Outras 6,5</p><p>Importante: Os dados aqui apresentados são fictícios, não existindo nenhuma conexão com a</p><p>realidade. O gráfico em questão foi criado com o objetivo pedagógico de oferecer um melhor</p><p>entendimento de como um gráfico pode ser utilizado.</p><p>Representando-se, graficamente, com barras simples, a situação descrita acima, têm-se:</p><p>24</p><p>C) GRÁFICO DE COLUNAS OU BARRAS MÚLTIPLAS</p><p>É a representação gráfica em que os retângulos referentes a determinado dado são dispostos</p><p>um ao lado do outro, evidenciando suas diferenças, para facilitar a comparação entre eles. Serve para</p><p>retratar os dados qualitativos ou quantitativos discretos.</p><p>Exemplo: Na tabela abaixo está indicada a formação em cursos superiores por área de conhecimento</p><p>no Brasil e na Coréia do Sul em 2010 (em porcentagem).</p><p>Formação em Cursos Superiores (%)</p><p>(frequência relativa fri)</p><p>Área do Conhecimento Coréia do Sul Brasil</p><p>Saúde e bem-estar,</p><p>ciências físicas e biológicas 22 4</p><p>Matemática, ciência da</p><p>computação e engenharias 31 23</p><p>Artes, humanidades e</p><p>educação 22 4</p><p>Ciências sociais e direito 25 69</p><p>Importante: Os dados aqui apresentados são fictícios, não existindo nenhuma conexão com a</p><p>realidade. O gráfico em questão foi criado com o objetivo pedagógico de oferecer um melhor</p><p>entendimento de como um gráfico pode ser utilizado.</p><p>Representando-se, graficamente, com colunas duplas, a situação descrita acima, têm-se:</p><p>25</p><p>D) GRÁFICO DE SETORES</p><p>O gráfico de setores ou pizza é um dispositivo gráfico comumente usado para apresentar as</p><p>distribuições de frequência relativa. Sua construção é feita com base em um círculo que é dividido em</p><p>setores com áreas proporcionais às frequências das diversas categorias. Este gráfico serve para</p><p>retratar, principalmente, dados qualitativos.</p><p>Exemplo: Um informativo financeiro relatou que, no último ano, pessoas investiram em fundos coletivos</p><p>no Brasil, segundo a distribuição de frequências relativas abaixo:</p><p>Tipo de fundo coletivo Percentual de pessoas</p><p>(frequência relativa fri)</p><p>Ângulo (graus)</p><p>Fundos de desenvolvimento 19 68,40</p><p>Fundos de renda fixa 14 50,40</p><p>Fundos de renda variável 33 118,80</p><p>Fundos internacionais 18 64,80</p><p>Outros 16 57,60</p><p>Total 100% 360,00</p><p>Importante: Os dados aqui apresentados são fictícios, não existindo nenhuma conexão com a</p><p>realidade. O gráfico em questão foi criado com o objetivo pedagógico de oferecer um melhor</p><p>entendimento de como um gráfico pode ser utilizado.</p><p>Para que o ângulo correspondente a cada setor seja determinado, utiliza-se regra de três simples:</p><p>100% -------- 3600</p><p>19% -------- x == 4,68</p><p>100</p><p>840.6</p><p>x</p><p>Determina-se, analogamente, os ângulos dos outros setores.</p><p>Representando-se, graficamente, com um gráfico de setores, a situação descrita acima, têm-se:</p><p>FUNDOS DE</p><p>DESENVOLVIMENTO</p><p>19%</p><p>FUNDOS DE RENDA</p><p>FIXA</p><p>14%</p><p>FUNDOS DE RENDA</p><p>VARIÁVEL</p><p>33%</p><p>FUNDOS</p><p>INTERNACIONAIS</p><p>18%</p><p>OUTROS</p><p>16%</p><p>Investimentos de pessoa física</p><p>em fundos coletivos no último ano</p><p>26</p><p>E) GRÁFICO DE LINHA</p><p>É uma aplicação do processo de representação das funções num sistema de coordenadas</p><p>cartesianas. Neste tipo de gráfico se utiliza uma linha poligonal para representar a série estatística. É</p><p>útil para se visualizar a variação de uma grandeza em relação à outra. Este gráfico serve para retratar</p><p>dados quantitativos.</p><p>Exemplo: Na tabela abaixo, está indicada a Produção Brasileira de Petróleo de 1997 a 2005.</p><p>Anos Produção Brasileira de Petróleo (milhões de litros)</p><p>(frequência absoluta fi)</p><p>1997 65920</p><p>1998 66845</p><p>1999 69738</p><p>2000 71844</p><p>2001 75014</p><p>2002 84434</p><p>2003 87024</p><p>2004 86197</p><p>2005 89587</p><p>Importante: Os dados aqui apresentados são fictícios, não existindo nenhuma conexão com a</p><p>realidade. O gráfico em questão foi criado com o objetivo pedagógico de oferecer um melhor</p><p>entendimento de como um gráfico pode ser utilizado.</p><p>Determinados, graficamente, todos os pontos da série usando os pares ordenados, o ano no</p><p>eixo horizontal e as quantidades no eixo vertical, ligam-se esses pontos, dois a dois, por segmentos de</p><p>reta, o que gera uma linha poligonal, que é o gráfico em linha correspondente à série em estudo.</p><p>1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006</p><p>64</p><p>68</p><p>72</p><p>76</p><p>80</p><p>84</p><p>88</p><p>92</p><p>P</p><p>R</p><p>O</p><p>D</p><p>U</p><p>Ç</p><p>Ã</p><p>O</p><p>D</p><p>E</p><p>P</p><p>E</p><p>T</p><p>R</p><p>Ó</p><p>L</p><p>E</p><p>O</p><p>N</p><p>O</p><p>B</p><p>R</p><p>A</p><p>S</p><p>IL</p><p>(b</p><p>il</p><p>h</p><p>õ</p><p>e</p><p>s</p><p>d</p><p>e</p><p>l</p><p>it</p><p>ro</p><p>s</p><p>)</p><p>ANO</p><p>27</p><p>F) GRÁFICO DE LINHAS MÚLTIPLAS</p><p>É uma aplicação do processo de representação das funções num sistema de coordenadas</p><p>cartesianas. Neste tipo de gráfico se utiliza linhas poligonais para representar as séries estatísticas. É</p><p>útil para comparar a variação de uma grandeza em relação à outra. Este gráfico serve para retratar</p><p>dados quantitativos.</p><p>Exemplo: Na tabela abaixo, estão indicadas as variáveis Oferta e Demanda de Etanol no Brasil de</p><p>1997 a 2005.</p><p>Anos Oferta e Demanda de Etanol no Brasil (bilhões de litros)</p><p>(frequência absoluta fi)</p><p>Oferta Demanda</p><p>1997 15,49 7,51</p><p>1998 14,12 3,38</p><p>1999 12,98 3,02</p><p>2000 10,61 2,81</p><p>2001 11,50 5,56</p><p>2002 12,62 8,75</p><p>2003 14,73 12,23</p><p>2004 15,10 13,53</p><p>2005 16,05 15,02</p><p>Importante: Os dados aqui apresentados são fictícios, não existindo nenhuma conexão com a</p><p>realidade. O gráfico em questão foi criado com o objetivo pedagógico de oferecer um melhor</p><p>entendimento de como um gráfico pode ser utilizado.</p><p>Determinados, graficamente, todos os pontos das séries usando os pares ordenados, o ano no</p><p>eixo horizontal e as quantidades no eixo vertical, ligam-se esses pontos, dois a dois, por segmentos de</p><p>reta, para cada uma das variáveis, gerando, nesse caso, duas linhas poligonais (podem ser múltiplas),</p><p>que é o gráfico em linhas correspondente às séries em estudo.</p><p>1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006</p><p>0</p><p>2</p><p>4</p><p>6</p><p>8</p><p>10</p><p>12</p><p>14</p><p>16</p><p>OFERTA</p><p>DEMANDA</p><p>O</p><p>F</p><p>E</p><p>R</p><p>T</p><p>A</p><p>e</p><p>D</p><p>E</p><p>M</p><p>A</p><p>N</p><p>D</p><p>A</p><p>D</p><p>E</p><p>E</p><p>T</p><p>A</p><p>N</p><p>O</p><p>L</p><p>N</p><p>O</p><p>B</p><p>R</p><p>A</p><p>S</p><p>IL</p><p>(b</p><p>il</p><p>h</p><p>õ</p><p>e</p><p>s</p><p>d</p><p>e</p><p>l</p><p>it</p><p>ro</p><p>s</p><p>)</p><p>ANO</p><p>28</p><p>G) HISTOGRAMAS</p><p>Representação gráfica da distribuição de frequências somente de variável contínua.</p><p>Os dados agrupados em intervalos de classe podem ser representados graficamente por meio</p><p>de um histograma. O histograma é uma representação gráfica formada por retângulos justapostos,</p><p>cujas bases se apóiam no eixo horizontal. A altura de cada retângulo deve ser proporcional à frequência</p><p>correspondente a cada classe e o ponto médio da base de cada retângulo deve coincidir com o ponto</p><p>médio do respectivo intervalo de classe.</p><p>Exemplo: Na tabela abaixo está indicado o número de famílias brasileiras de acordo com o número de</p><p>salários mínimos que cada uma delas tem como renda familiar mensal.</p><p>Renda Familiar Mensal</p><p>(Salários Mínimos)</p><p>Número de Famílias (milhões)</p><p>(frequência absoluta fi)</p><p>10 13200</p><p>21 15000</p><p>32 6900</p><p>43 3800</p><p>54 4000</p><p>65 3250</p><p>76 1560</p><p>87 1300</p><p>98 900</p><p>109 500</p><p>Importante: Os dados aqui apresentados são fictícios, não existindo nenhuma conexão com a</p><p>realidade. O gráfico em questão foi criado com o objetivo pedagógico de oferecer um melhor</p><p>entendimento de como um gráfico pode ser utilizado.</p><p>Representando-se, graficamente, por meio de um histograma, a variável quantitativa contínua</p><p>Renda Familiar Mensal no país, têm-se:</p><p>0</p><p>2000</p><p>4000</p><p>6000</p><p>8000</p><p>10000</p><p>12000</p><p>14000</p><p>16000</p><p>1 2 3 4 5 6 7 8 9 10</p><p>RENDA FAMILIAR MENSAL (SALÁRIOS MÍNIMOS)</p><p>N</p><p>Ú</p><p>M</p><p>E</p><p>R</p><p>O</p><p>D</p><p>E</p><p>F</p><p>A</p><p>M</p><p>ÍL</p><p>IA</p><p>S</p><p>(</p><p>M</p><p>IL</p><p>H</p><p>Õ</p><p>E</p><p>S</p><p>)</p><p>29</p><p>LISTA 2 - Exercícios para fixação</p><p>1. Estes quatro gráficos, na ordem em que são apresentados (1, 2, 3, 4), denominam-se:</p><p>GRÁFICO 1 GRÁFICO 2</p><p>0</p><p>2000</p><p>4000</p><p>6000</p><p>8000</p><p>10000</p><p>12000</p><p>14000</p><p>16000</p><p>1 2 3 4 5 6 7 8 9 10</p><p>RENDA FAMILIAR MENSAL (SALÁRIOS MÍNIMOS)</p><p>N</p><p>Ú</p><p>M</p><p>E</p><p>R</p><p>O</p><p>D</p><p>E</p><p>F</p><p>A</p><p>M</p><p>ÍL</p><p>IA</p><p>S</p><p>(</p><p>M</p><p>IL</p><p>H</p><p>Õ</p><p>E</p><p>S</p><p>)</p><p>Serviços</p><p>Burocráticos</p><p>Gerencial</p><p>Trabalho Não</p><p>Qualificado</p><p>Artesanato</p><p>0</p><p>10</p><p>20</p><p>30</p><p>40</p><p>50</p><p>60</p><p>70</p><p>80</p><p>F</p><p>R</p><p>E</p><p>Q</p><p>Ü</p><p>Ê</p><p>N</p><p>C</p><p>IA</p><p>A</p><p>B</p><p>S</p><p>O</p><p>L</p><p>U</p><p>T</p><p>A</p><p>OCUPAÇÃO</p><p>GRÁFICO 3 GRÁFICO 4</p><p>0</p><p>20000</p><p>40000</p><p>60000</p><p>80000</p><p>100000</p><p>2000 2001 2002 2003 2004</p><p>ANO</p><p>P</p><p>R</p><p>O</p><p>D</p><p>U</p><p>Ç</p><p>Ã</p><p>O</p><p>D</p><p>E</p><p>P</p><p>E</p><p>T</p><p>R</p><p>Ó</p><p>L</p><p>E</p><p>O</p><p>(</p><p>m</p><p>il</p><p>m</p><p>3</p><p>)</p><p>0 10 20 30 40 50 60 70 80</p><p>SUDESTE</p><p>CENTRO-OESTE</p><p>NORTE</p><p>SUL</p><p>PRODUÇÃO DE MADEIRA</p><p>Freqüência Relativa (%)</p><p>R</p><p>E</p><p>G</p><p>IÃ</p><p>O</p><p>B</p><p>R</p><p>A</p><p>S</p><p>IL</p><p>E</p><p>IR</p><p>A</p><p>A) Colunas simples, colunas simples, polígono de frequência, barras simples.</p><p>B) Colunas múltiplas, histograma, linha, barras múltiplas.</p><p>C) Histograma, colunas simples, linha, barras simples.</p><p>D) Histograma, colunas simples, polígono de frequência, barras simples.</p><p>E) Colunas múltiplas, colunas simples, diagrama de dispersão, barras simples.</p><p>2. Representar graficamente a distribuição de frequências da empresa Delta, segundo o número de</p><p>faltas mensais, como um gráfico de colunas simples para variável discreta.</p><p>No de faltas do mês 0 1 2 3 4 5 6</p><p>No de operários</p><p>(frequência absoluta)</p><p>160</p><p>120</p><p>90</p><p>70</p><p>40</p><p>20</p><p>10</p><p>3. Construir um gráfico de colunas simples segundo os dados abaixo:</p><p>Número aproximado de alunos matriculados de 5a a 8a séries em 2010 por região brasileira</p><p>Região No de Alunos</p><p>Norte 1.300.000</p><p>Nordeste 5.400.000</p><p>Centro-Oeste 1.500.000</p><p>Sudeste 6.200.000</p><p>Sul 2.250.000</p><p>30</p><p>4. Construir um gráfico de barras simples segundo os dados abaixo:</p><p>Turistas estrangeiros no Brasil - Cidades mais visitadas em 2010</p><p>Cidade Porcentagem</p><p>(frequência relativa)</p><p>Rio de Janeiro 24</p><p>São Paulo 4</p><p>Salvador 18</p><p>Fortaleza 44</p><p>Recife 8</p><p>Outras 2</p><p>5. Construir um gráfico de setores para os dados tabelados em cada um dos itens abaixo.</p><p>A)</p><p>Estimativa da safra de grãos em 2011 por região brasileira</p><p>Região Porcentagem</p><p>(frequência relativa)</p><p>Norte 3</p><p>Nordeste 8</p><p>Sudeste 15</p><p>Centro-Oeste 33</p><p>Sul 41</p><p>B)</p><p>Número de veículos motorizados registrados em Santa Vitória/MG</p><p>Tipo de Veículo Número de veículos</p><p>(frequência absoluta)</p><p>Carro de passageiro 585</p><p>Minivan 75</p><p>Caminhão de 2 eixos 60</p><p>Caminhão de Multieixo 30</p><p>Moto 315</p><p>Barco a motor 15</p><p>6. Construir um gráfico de barras múltiplas para representar a evolução ao longo das décadas da</p><p>população urbana e rural brasileira.</p><p>População (%)</p><p>Anos Urbana Rural</p><p>1950 36,16 63,84</p><p>1960 45,08 54,92</p><p>1970 55,94 44,06</p><p>1980 67,59 32,41</p><p>1990 75,59 24,41</p><p>2000 81,25 18,75</p><p>2005 83,01 16,99</p><p>Fonte: www.ibge.gov.br</p><p>31</p><p>7. Construir um gráfico de linha segundo os dados abaixo:</p><p>Anos Produção de Feijão</p><p>(milhões de toneladas)</p><p>2000 4,3</p><p>2001 3,9</p><p>2002 4,3</p><p>2003 4,4</p><p>2004 4,3</p><p>2005 3,9</p><p>Fonte: www.conab.gov.br</p><p>8. Construir um gráfico de linhas duplas segundo os dados abaixo:</p><p>Participação de homens e mulheres no mercado de trabalho (%)</p><p>Anos Homens Mulheres</p><p>1975 71,2 28,8</p><p>1985 66,5 33,5</p><p>1995 59,6 40,4</p><p>2005 57,6 42,4</p><p>Fonte: www.fcc.org.br</p><p>9. Os dados abaixo representam a massa, em quilogramas, de uma amostra de 50 bebês nascidos na</p><p>Maternidade São Bento no período de 30 dias. Construa o histograma que represente os valores da</p><p>frequência relativa.</p><p>Massa (kg) No de bebês % de bebês</p><p>1,0 1,5 2 4</p><p>1,5 2,0 2 4</p><p>2,0 2,5 4 8</p><p>2,5 3,0 14 28</p><p>3,0 3,5 23 46</p><p>3,5 4,0 5 10</p><p>Total 50 100</p><p>10. Os dados abaixo representam a vida útil, em horas, de 260 lâmpadas de certa indústria na cidade</p><p>de Jacareí. Construir o histograma correspondente a essa distribuição.</p><p>Duração (horas) No de lâmpadas</p><p>300 400 12</p><p>400 500 28</p><p>500 600 36</p><p>600 700 48</p><p>700 800 60</p><p>800 900 50</p><p>900 1000 26</p><p>Total 260</p><p>32</p><p>11. Do lixo produzido no Brasil, diariamente, 60.000 toneladas são de papel, 7.200 toneladas de</p><p>plástico, 19.200 toneladas de metais, 4.800 toneladas de vidro e 148.800 toneladas são provenientes de</p><p>outros materiais, totalizando 240.000 toneladas de lixo por dia (www.cempre.org.br). Observe os gráficos</p><p>de setores abaixo e indique qual é o mais adequado para representar essas informações.</p><p>A B C D</p><p>12. Um grupo de estudantes de enfermagem fez uma pesquisa sobre o tipo de sangue contido nos 540</p><p>frascos de um banco de sangue de certo hospital. Para resumirem os dados encontrados, os</p><p>estudantes construíram um gráfico de setores e, no lugar das porcentagens, indicaram os ângulos de</p><p>alguns desses setores circulares, como é mostrado na figura abaixo). Calcule o número de frascos que</p><p>contém sangue tipo B.</p><p>Tipo O</p><p>162</p><p>o</p><p>Tipo AB</p><p>36</p><p>o</p><p>Tipo B</p><p>X</p><p>o</p><p>Tipo A</p><p>108</p><p>o</p><p>13. O gráfico abaixo representa, em milhares de toneladas, a produção de soja do estado de São Paulo</p><p>entre os anos de 1997 e 2005 (Brasil Pesquisas, 2006). Calcule o decréscimo percentual entre os anos de</p><p>2000 e 2001 e o acréscimo percentual entre os anos de 2001 e 2002.</p><p>1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006</p><p>20</p><p>30</p><p>40</p><p>50</p><p>60</p><p>70</p><p>P</p><p>ro</p><p>d</p><p>u</p><p>çã</p><p>o</p><p>d</p><p>e</p><p>S</p><p>o</p><p>ja</p><p>n</p><p>o</p><p>E</p><p>st</p><p>a</p><p>d</p><p>o</p><p>d</p><p>e</p><p>S</p><p>ã</p><p>o</p><p>P</p><p>a</p><p>u</p><p>lo</p><p>(m</p><p>il</p><p>t</p><p>o</p><p>n</p><p>el</p><p>a</p><p>d</p><p>a</p><p>s)</p><p>ANO</p><p>http://www.cempre.org.br/</p><p>33</p><p>14. A escolaridade dos jogadores de futebol nos grandes centros é maior do que se imagina, como</p><p>mostra a pesquisa abaixo, realizada com os jogadores profissionais dos quatro principais clubes de</p><p>futebol do Rio de Janeiro.</p><p>De acordo com esses dados, o percentual dos jogadores dos quatro clubes que concluíram o Ensino</p><p>Médio é de aproximadamente:</p><p>A) 14% B) 48% C) 54% D) 60% E) 68%</p><p>15. Um estudo caracterizou cinco ambientes aquáticos, nomeados de A a E, em uma região, medindo</p><p>parâmetros físico-químicos de cada um deles, incluindo o pH nos ambientes. O Gráfico I representa os</p><p>valores de pH dos cinco ambientes.</p><p>Gráfico I Gráfico II</p><p>Utilizando o Gráfico II, que representa a distribuição estatística de espécies em diferentes faixas de pH,</p><p>pode-se esperar um maior número de espécies no ambiente:</p><p>A) A B) B C) C D) D E) E</p><p>16. No gráfico abaixo pode-se observar como são divididos os 188 bilhões de reais do orçamento da</p><p>União entre os setores de saúde, educação, previdência e outros.</p><p>34</p><p>Se os 46 bilhões gastos com a previdência fossem totalmente repassados aos demais setores de modo</p><p>que 50% fossem destinados à saúde, 40% à educação e 10% aos outros setores, o aumento percentual</p><p>para o setor de saúde seria igual, aproximadamente, a:</p><p>A) 121% B) 69% C) 65% D) 61% E) 50%</p><p>17. No gráfico de colunas abaixo, está representado o número de rádio emissoras por região brasileira</p><p>no ano 2000. Analisando-o, classifique em V ou F cada sentença seguinte:</p><p>A) Se esse conjunto de dados fosse representado em um gráfico de setores, o ângulo correspondente à</p><p>região Sul seria menor que 90º. ( )</p><p>B) Na região Centro-Oeste há 2,27% das rádios emissoras brasileiras. ( )</p><p>C) O número de rádio emissoras na região Sudeste é 60,24% maior que na região Nordeste. ( )</p><p>D) Na região Norte há, apenas, 5,73% das rádio emissoras de todo o país. ( )</p><p>E) Nas regiões Sul e Sudeste estão mais de 60% das rádio emissoras de todo o país. ( )</p><p>18. O gráfico abaixo mostra uma triste realidade brasileira: a desigualdade racial associada à renda do</p><p>trabalhador.</p><p>De acordo com o gráfico, julgue as sentenças abaixo como verdadeiras (V) ou falsas (F):</p><p>A) Além da desigualdade racial, há uma desigualdade salarial entre os sexos. ( )</p><p>B) A desigualdade salarial entre os sexos é maior entre os negros. ( )</p><p>C) Em média, o salário dos negros é metade do salário dos não-negros, independentemente do</p><p>sexo. ( )</p><p>D) Para que</p><p>um homem negro recebesse, por hora, o mesmo valor que uma mulher não-negra, seu</p><p>rendimento por hora deveria aumentar 50%. ( )</p><p>E) Para que uma mulher negra recebesse, por hora, o mesmo valor que uma mulher não-negra, seu</p><p>rendimento por hora deveria aumentar aproximadamente 100%. ( )</p><p>35</p><p>19. Em um estudo feito pelo Instituto Florestal, foi possível acompanhar a evolução de ecossistemas</p><p>paulistas desde 1962. Desse estudo publicou-se o Inventário Florestal de São Paulo, que mostrou</p><p>resultados de décadas de transformações da Mata Atlântica.</p><p>Examinando o gráfico da área de vegetação natural remanescente (em mil km2) pode-se inferir que:</p><p>A) a Mata Atlântica teve sua área devastada em 50% entre 1963 e 1973.</p><p>B) a vegetação natural da Mata Atlântica aumentou antes da década de 60, mas reduziu nas décadas</p><p>posteriores.</p><p>C) a devastação da Mata Atlântica remanescente vem sendo contida desde a década de 60.</p><p>D) nos anos 2000-2001, a área de Mata Atlântica preservada em relação ao período de 1990-1992 foi</p><p>de 34,6%.</p><p>E) nos anos 2000-2001, a área preservada da Mata Atlântica é maior do que a registrada no período de</p><p>1990-1992.</p><p>20. O analfabetismo é um problema social que atinge parte da população brasileira. Observe o gráfico</p><p>de colunas abaixo, obtido pelo IBGE em 2003, que mostra o número de pessoas com 5 anos ou mais</p><p>de idade não-alfabetizadas nas cinco regiões do Brasil.</p><p>Considerando que, segundo o último censo, a população brasileira era de, aproximadamente,</p><p>180.762.400 habitantes, a porcentagem de pessoas não-alfabetizadas no Brasil é igual a:</p><p>A) 88% B) 78 % C) 68% D) 12% E) 10%</p><p>36</p><p>CAPÍTULO 3 - MEDIDAS QUANTITATIVAS</p><p>BIBLIOGRAFIA CONSULTADA:</p><p>1. ANDERSON, D. R.; SWEENEY, D. J.; WILLIAMS, T. A. Estatística Aplicada à Administração e</p><p>Economia. 2.ed. São Paulo: Cengage Learning, 2007.</p><p>2. BUSSAB, W. O.; MORETIN, P. Métodos Quantitativos: Estatística Básica. 5.ed. São Paulo:</p><p>Saraiva, 2002.</p><p>3. DOWNING, D.; CLARK, J. Estatística Aplicada. 3.ed. São Paulo: Saraiva, 2011.</p><p>4. MARTINS, G. A. Estatística Geral e Aplicada. 2.ed. São Paulo: Atlas, 2002.</p><p>5. MEDEIROS, E. S. et al. Estatística para os Cursos de Economia, Administração e Ciências</p><p>Contábeis. vol. 1 e 2. 3.ed. São Paulo: Atlas, 1999.</p><p>6. STEVENSON, W. J. Estatística Aplicada à Administração. 3.ed. São Paulo: Harbra, 2001.</p><p>7. TRIOLA, M. F. Introdução à Estatística. 10.ed. Rio de Janeiro: LTC, 2008.</p><p>8. WEBSTER, A. L. Estatística Aplicada à Administração e Economia. 3.ed. São Paulo: McGraw Hill,</p><p>2006.</p><p>INTRODUÇÃO</p><p>Os métodos estatísticos envolvem a análise e a interpretação de dados numéricos. Para</p><p>interpretar os dados corretamente é necessário, primeiramente, organizar e sumarizar os números. Um</p><p>conjunto de números pode reduzir-se a uma ou a algumas medidas numéricas que resumem todo o</p><p>conjunto. Usualmente, empregam-se as seguintes medidas:</p><p>1.1 Medidas de posição (ou tendência central) = média, mediana e moda.</p><p>1.2 Medidas de dispersão = amplitude total, variância e desvio padrão.</p><p>1.3 Medidas separatrizes = quartis, decis e percentis.</p><p>1.1 MEDIDAS DE POSIÇÃO (TENDÊNCIA CENTRAL)</p><p>A) DADOS BRUTOS OU ROL</p><p>A.1 Média Aritmética Notação: x</p><p>Calcula-se a média aritmética efetuando-se a soma das observações dividida pelo número total</p><p>de observações.</p><p>n</p><p>x</p><p>x</p><p>n</p><p>1i</p><p>i</p><p>= =</p><p>Exemplo 1: Durante um determinado mês de verão, os quinze vendedores de uma empresa de</p><p>calefação central e ar condicionado venderam os seguintes números de ar condicionado central: 8, 11,</p><p>12, 5, 14, 12, 8, 11, 16, 12, 12, 17, 7, 9, 11. Considerando este mês como uma população estatística de</p><p>interesse, o número médio de unidades vendidas é:</p><p>11</p><p>15</p><p>1197171212161181214512118</p><p>x =</p><p>++++++++++++++</p><p>=</p><p>37</p><p>A.2 Média Aritmética Ponderada Notação: x</p><p>O cálculo da média ponderada deve levar em conta os pesos desiguais dos bimestres. A fórmula</p><p>para o cálculo é:</p><p></p><p></p><p>=</p><p>=</p><p>=</p><p>n</p><p>1i</p><p>i</p><p>n</p><p>1i</p><p>ii</p><p>f</p><p>f.x</p><p>x</p><p>onde xi é a observação de ordem i e fi é o peso da observação de ordem i.</p><p>Exemplo 2: Considere a situação em que um professor informe que os pesos das notas bimestrais,</p><p>são: 1o bimestre - peso 2; 2o bimestre - peso 2; 3o bimestre - peso 3; 4o bimestre - peso 3. O aluno</p><p>obteve as seguintes notas em Estatística: 6,0; 8,0; 9,0 e 5,0, em cada bimestre, respectivamente.</p><p>Portanto:</p><p>0,7</p><p>10</p><p>70</p><p>3322</p><p>0,530,930,820,62</p><p>x ==</p><p>+++</p><p>+++</p><p>=</p><p>A.3 Mediana Notação: x~</p><p>Colocados os dados brutos em ordem crescente ou decrescente (ROL), a mediana é o elemento</p><p>que ocupa a posição central. Sua característica principal é dividir um conjunto ordenado de dados em</p><p>dois grupos iguais; a metade terá valores inferiores à mediana e a outra metade terá valores superiores</p><p>à mediana.</p><p>Para se calcular a mediana, determina-se o número n de elementos do rol, utilizando o seguinte</p><p>critério:</p><p>Se n é ímpar – O rol admite um termo central que ocupa a posição</p><p>2</p><p>1n +</p><p>.</p><p>Exemplo 3: Os quinze vendedores citados no Exemplo 1 venderam as seguintes quantidades de</p><p>aparelhos de ar condicionado, colocadas em ordem crescente (rol): 5, 7, 8, 8, 9, 11, 11, 11, 12, 12, 12,</p><p>12, 14, 16, 17. O elemento central desse conjunto de dados ocupa a posição 8</p><p>2</p><p>115</p><p>2</p><p>1n</p><p>=</p><p>+</p><p>=</p><p>+</p><p>, ou</p><p>seja, a 8a posição. Portanto, a mediana desse conjunto de dados é igual a 11.</p><p>11x~ =</p><p>Se n é par – Utiliza-se como mediana, a média aritmética das duas observações centrais, ou seja, a</p><p>média dos elementos que ocupam no rol as posições</p><p>2</p><p>n</p><p>e 1</p><p>2</p><p>n</p><p>+ .</p><p>Exemplo 4: O gerente de uma pizzaria mantém o controle das vendas dos diversos tipos de pizza.</p><p>Suponha que ele tenha observado os seguintes valores de vendas diárias em ordem crescente (rol) do</p><p>tipo calabresa durante o período de quatorze dias: 37, 38, 38, 39, 40, 43, 44, 46, 48, 51, 56, 59, 61, 64.</p><p>As posições centrais desse conjunto de dados são: 7</p><p>2</p><p>14</p><p>2</p><p>n</p><p>== (7a posição) 44 e</p><p>81</p><p>2</p><p>14</p><p>1</p><p>2</p><p>n</p><p>=+=+ (8a posição) 46. A mediana é, portanto, a média aritmética desses 2 elementos:</p><p>38</p><p>45</p><p>2</p><p>4644</p><p>x~ =</p><p>+</p><p>=</p><p>Portanto, o procedimento para se determinar a mediana é o seguinte:</p><p>1. Ordenar os valores (Rol);</p><p>2. Verificar se há um número ímpar ou par de observações;</p><p>3. a) Para um número ímpar n de observações, a mediana é o valor central.</p><p>b) Para um número par n de observações, a mediana é a média aritmética das duas</p><p>observações centrais.</p><p>A.4 Moda Notação: x*.</p><p>É o valor (observação) que ocorre com maior frequência num conjunto de dados.</p><p>Exemplo 5: Os quinze vendedores citados no Exemplo 1 venderam as seguintes quantidades de</p><p>aparelhos de ar condicionado: 8, 11, 12, 5, 14, 12, 8, 11, 16, 12, 12, 17, 7, 9, 11. A moda para esse</p><p>conjunto de dados é o valor que ocorre com maior frequência, ou seja, x* = 12.</p><p>OBSERVAÇÕES:</p><p>• Se mais de um valor ocorre com maior, mas igual, frequência, todos eles são chamados de moda.</p><p>• Muitas distribuições que surgem na prática são razoavelmente simétricas com a maioria dos valores</p><p>concentrada próximo ao centro. Em tal caso, média, moda e mediana estão muito próximas umas</p><p>das outras ou são até coincidentes.</p><p>• Uma distribuição com duas modas é chamada de distribuição bimodal.</p><p>COMPARANDO A MÉDIA, A MEDIANA E A MODA</p><p>A média é a medida de tendência central mais usada. Ela é fácil de calcular e interpretar.</p><p>Infelizmente, a média é afetada por valores extremos ou atípicos e, diferente da mediana, pode ser</p><p>drasticamente desviada por observações que ficam extremamente acima ou abaixo da maioria das</p><p>observações.</p><p>Por exemplo, para os dados 4, 5, 6, 6, 7, 8, a média e a mediana são 6 e representam uma</p><p>medida excelente do ponto central do conjunto de dados. Se a última observação fosse 80 e não 8, a</p><p>média não seria 6, seria 18, mas a mediana ainda seria 6. Como a mediana não é afetada pelo valor</p><p>extremo, ela representa melhor as seis observações.</p>