Prévia do material em texto
MÉTODOS QUANTITATIVOS FLÁVIA CRISTINA FRANCO DE LIMA ROSA JEFFERSON TADEU DE GODOI PEREIRA 1 UNIDADE 5 MEDIDAS DE DISPERSÃO 1. VARIABILIDADE As medidas de dispersão (MD) ou de variabilidade podem ser entendidas como a dife- rença observada no conjunto de dados a serem analisados. Podemos dizer que, quanto maior for esta diferença, maior será a variabilidade ou a dispersão dos dados do grupo avaliado. E quanto menor a diferença, menor a dispersão dos dados. Por exemplo: poderia ser solicitado a um encarregado de uma empresa um relatório para avaliar o desempenho de seus funcionários, ou seja, quais funcionários se mantêm mais cons- tantes na quantidade de peças produzidas diariamente. As principais medidas de variabilidade que serão abordadas nesta unidade são ampli- tude, variância, desvio padrão e coeficiente de variação. Da mesma forma como ocorre com as medidas de posição (já estudadas anteriormen- te), para as medidas de variabilidade ou dispersão, o processo de cálculo para dados brutos e dados agrupados (tabela com nível intervalar) apresenta diferenças, por isso serão tratados separadamente. 2. AMPLITUDE A amplitude total é uma medida de dispersão de fácil obtenção e é calculada pela di- ferença entre o maior e o menor valor do conjunto de dados a ser analisado, ou seja: max minR x x= − Onde: R → Amplitude. maxx → valor máximo do conjunto de dados. min x → valor mínimo do conjunto de dados. Observe o exemplo a seguir. Encontre a amplitude para o conjunto de dados. 3 5 6 2 5 4 max minR x x= − 6 2 4R R= − → = U5 2Métodos Quantitativos Medidas de Dispersão Pode-se afirmar que a amplitude para este conjunto de dados é 4. Observação: é importante destacar que, embora a amplitude de um conjunto de dados ajude a caracterizar a dispersão observada, esta medida de dispersão não utiliza todos os dados do conjunto, apenas os extremos. Dessa forma, se faz necessária a utilização de outras medidas para uma caracterização mais precisa. 3. VARIÂNCIA E DESVIO PADRÃO Para produzir uma descrição mais detalhada da dispersão de um conjunto de dados, deve-se fazer uso da variância e do desvio padrão. I. Dados brutos – não agrupados Caso se esteja calculando variância e desvio padrão para dados que caracterizem uma população, deve-se utilizar as seguintes fórmulas para variância populacional e desvio padrão populacional, respectivamente: ( )2 2 1 n ii x x n σ = − = ∑ ( )2 1 n ii x x n σ = − = ∑ Onde: 2 σ → variância populacional. σ → desvio padrão populacional. ix → cada elemento do conjunto de dados. x → média aritmética do conjunto de dados. n → número de elementos do conjunto de dados. Observação: o desvio padrão populacional nada mais é do que a raiz quadrada da variância populacional. Já para dados provenientes de uma amostra, devem-se utilizar as fórmulas a seguir para calcular a variância amostral e o desvio padrão amostral, respectivamente: ( )2 2 1 1 n ii x x s n = − = − ∑ ( )2 1 1 n ii x x s n = − = − ∑ 3 Métodos Quantitativos U5 Medidas de Dispersão Onde: 2 s → variância populacional. s → desvio padrão populacional. ix → cada elemento do conjunto de dados. x → média aritmética do conjunto de dados. n → número de elementos do conjunto de dados. Exercício resolvido 1 Os dados a seguir representam as vendas mensais (em milhares de reais) concluídas por uma amostra de vendedores de uma rede de varejo. Calcule a variância amostral e o desvio padrão amostral para este conjunto de dados. 12,7 10,7 9,8 13,9 14,7 11,5 10,3 9,6 Resolução Para calcular a variância amostral, deve-se utilizar a seguinte fórmula: ( )2 2 1 1 n ii x x s n = − = − ∑ Primeiramente, necessita-se calcular a média aritmética ( )x para os dados apresentados. 11,65x = A partir dessa média, para calcular a variância amostral, se fará uso do seguinte quadro, composto pelas colunas: ix → elementos do conjunto de dados. ix x− → o desvio de cada elemento em relação à média. ( )2 ix x− → o quadro de cada desvio. U5 4Métodos Quantitativos Medidas de Dispersão ix ix x− ( )2 ix x− 12,7 1,05 1,1025 10,7 -0,95 0,9025 9,8 -1,85 3,4225 13,9 2,25 5,0625 14,7 3,05 9,3025 11,5 -0,15 0,0225 10,3 -1,35 1,8225 9,6 -2,05 4,2025 Necessita-se do somatório da coluna ( )2 ix x− . ( )2 1 25,84 n i i x x = − =∑ Substituindo este valor na fórmula da variância amostral, sabendo que 8n = , temos: 2 225,84 25,84 8 1 7 s s= → = − 2 3,691s ≅ Observação: para o arredondamento do resultado da variância e desvio padrão, deve- -se utilizar um algarismo a mais do que a média. Para calcular o desvio padrão amostral, deve-se utilizar a seguinte fórmula: ( )2 1 1 n ii x x s n = − = − ∑ Como já se sabe, o desvio padrão nada mais é do que a raiz quadrada da variância. Dessa forma: 3,691 1,921s = = Portanto, pode-se concluir que a variância amostral é 3,691 e o desvio padrão é 1,921. Observação: pode-se utilizar o desvio padrão para comparar a dispersão de dois con- juntos de dados. Quando maior for o desvio padrão, maior será a dispersão dos dados, ou seja, mais “espalhados” estarão os valores. 5 Métodos Quantitativos U5 Medidas de Dispersão II. Dados agrupados – tabela de nível intervalar Para dados agrupados por meio de uma tabela de nível intervalar, calcula-se a variância amostral e o desvio padrão amostral utilizando as seguintes fórmulas, respectivamente: ( )2 2 1 . 1 n ii m x f s n = − = − ∑ ( )2 1 . 1 n ii m x f s n = − = − ∑ Onde: 2 s → variância populacional. s → desvio padrão populacional. im → ponto médio de cada classe da tabela com nível intervalar. f → frequência de cada classe da tabela com nível intervalar. x → média aritmética do conjunto de dados. n → número de elementos do conjunto de dados. Exercício resolvido 2 A tabela abaixo indica as idades de um grupo de funcionários de uma determinada empresa. Tabela 01. Idade (em anos) de uma amostra dos funcionários de uma empresa IDADE (ANOS) FREQUÊNCIA f 18 24 7 24 30 6 30 36 5 36 42 2 Total 20 Fonte: elaborada pelos autores. U5 6Métodos Quantitativos Medidas de Dispersão Resolução Para iniciar o cálculo da variância, recomenda-se incluir na tabela dos dados uma nova coluna destinada aos valores dos pontos médios de cada classe. Para se obter os pon- tos médios, deve-se calcular a média entre o limite inferior e superior de cada classe. Dessa forma, teremos a coluna im (pontos médios). Tabela 02. Incluindo coluna pontos médios IDADE (ANOS) im FREQUÊNCIA f 18 24 21 7 24 30 27 6 30 36 33 5 36 42 39 2 Total 20 Fonte: elaborada pelos autores. Para dar continuidade na elaboração da variância amostral, necessita-se do valor da média (vide unidade 4, média aritmética para dados agrupados). Assim, se obterá: 27,6x = De forma análoga ao que foi realizado para a variância para dados brutos, cria-se um quadro suporte para este cálculo com as seguintes colunas: desvio de cada ponto mé- dio em relação à média ( )im x− ; quadrado de cada desvio ( )2 im x− e multiplicação de cada quadrado do desvio pela frequência ( )2 .im x f− . O objetivo é utilizar a se- guinte fórmula: ( )2 2 1 . 1 n ii m x f s n = − = − ∑ IDADE (ANOS) im f im x− ( )2 im x− ( )2 .im x f− 18 24 21 7 -6,6 43,6 304,92 24 30 27 6 -0,6 0,4 2,16 30 36 33 5 5,4 29,2 145,8 36 42 39 2 11,4 130,0 259,92 7 Métodos Quantitativos U5 Medidas de Dispersão Necessita-se do somatório da coluna ( )2 .im x f− ( )2 1 . 712,8 n i i m x f = − =∑ Substituindo os valores na fórmula, teremos: ( )2 2 1 . 1 n ii m x f s n = − = − ∑ 2 712,8 712,8 20 1 19 s = = − 2 37,52s ≅ Para calcular o valor do desvio padrão amostral para dados agrupados, deve-se aplicar: ( )2 1 . 1 n ii m x f s n = − = − ∑ 37,52 6,13s = ≅ Pode-se afirmar que a variância amostral para o conjunto de dados apresentado é 37,52 e o desvio padrão amostral é 6,13. Observação: a partir dos valores da média aritmética e dodesvio padrão, pode-se cal- cular o que se denomina coeficiente de variação, medida que combina as relações de posição e dispersão em um único parâmetro (porcentual). .100sCV x = ou .100CV x σ = Aplicando no exercício resolvido, teremos: 6,13 .100 22,19% 27,6 CV = ≅ 4. SOFTWARE PARA DETERMINAÇÃO DAS MEDIDAS Para o cálculo do desvio padrão a partir do Microsoft Excel, deve-se utilizar as seguintes fórmulas: =DESVPAD.A(selecione_os_dados) =DESVPAD.P(selecione_os_dados) U5 8Métodos Quantitativos Medidas de Dispersão O mesmo se dá para desvio padrão amostral e desvio padrão populacional. Exercício resolvido 3 Uma amostra dos vendedores de uma grande importadora de suprimentos para escri- tório foi dividida em duas equipes: x e y. Abaixo encontram-se as vendas mensais (em milhares de reais) destes vendedores, observadas em jan/2021. Quadro 01. Vendas (em milhares de reais) das equipes x e y em jan/2021 xi 2868,5 3804,2 3645,5 2021,7 2956,6 3615,4 2467,8 3154,7 2784,1 3904,8 2590,2 2377,6 yi 2543,8 2345,0 2322,5 2321,3 2017,4 2649,3 4903,3 4810,7 2854,0 2415,1 2866,7 1550,8 Fonte: elaborado pelos autores. Calcule o desvio padrão amostral para cada uma das equipes e aponte qual destas possui maior dispersão nas vendas. Resolução Para iniciar, deve-se digitar todos os valores da equipe x em uma coluna da planilha e todos os valores da equipe y em outra coluna. Figura 01. Inserindo dados para o cálculo do desvio padrão com o auxílio do Excel Fonte: elaborada pelos autores, com o auxílio do Excel. 9 Métodos Quantitativos U5 Medidas de Dispersão Utilize a seguinte fórmula: =DESVPAD.A(selecione_os_dados) Para cada conjunto de dados: =DESVPAD.A(A2:A13) =DESVPAD.A(B2:B13) Obtém-se os seguintes valores: Figura 02. Cálculo do desvio padrão amostral no Excel Fonte: elaborada pelos autores, com o auxílio do Excel. Observa-se que a equipe y possui maior dispersão em relação à equipe x. EXERCÍCIOS PROPOSTOS Nos dados expressos abaixo encontram-se a produtividade (em milhares de unidade/ dia) de duas linhas de produção de uma determinada indústria. Linha A 4,6 5,1 7,3 5,3 5,4 5,3 2,2 5,3 5,2 Linha B 5,5 5,4 5,3 5,2 2,1 2,3 5,4 5,5 5,6 Calcule a amplitude para as duas linhas de produção. Exercício 1. U5 10Métodos Quantitativos Medidas de Dispersão A partir dos dados fornecidos pelo exercício 1, calcule a variância amostral e o desvio padrão amostral. Utilizando os valores calculados, aponte qual das linhas de produção possui a maior dispersão. Exercício 2. Em uma prova foi coletada uma amostra de 35 notas, as quais encontram-se represen- tadas na tabela a seguir. Tabela 05. Notas de uma amostra de provas NOTAS f ( )%Fr fa ( )%Fra 3,1 4,2 2 5,7 2 5,7 4,2 5,3 4 11,4 6 17,1 5,3 6,4 5 14,3 11 31,4 6,4 7,5 10 28,6 21 60,0 7,5 8,6 11 31,4 32 91,4 8,6 9,7 3 8,6 35 100,0 Total 35 100,0 Fonte: elaborado pelos autores. Calcule o desvio padrão amostral para estes dados. Exercício 3. EDUCANDO PARA A PAZ