Prévia do material em texto
UFG-IME Profª Renata Disciplina: Introdução à Estatística Curso: Relações Públicas _________________________________________________________________________________________ 1. Vinte pacientes de uma clínica de ortopedia foram entrevistados quanto ao número de meses previstos de fisioterapia, se haverá sequelas, sim (S) ou não (N), após o tratamento e o grau de complexidade da cirurgia realizada: alta (A), médio (M) ou baixa (B). Os dados são apresentados na tabela abaixo: Pacientes 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Fisioterapia 7 8 5 6 4 5 7 7 6 8 6 5 5 4 5 3 4 6 8 5 Sequelas S S N N N S S S N S S N S N N N N S S N Cirurgia A M A M M B A M B M B B M M A B B A A M a. Classifique cada uma das variáveis do estudo. b. Para cada variável, construa a tabela de freqüência e faça uma representação gráfica. c. Divida os pacientes em dois grupos: com (S) e sem (N) seqüelas. i. Faça um gráfico para a variável Fisioterapia considerando apenas o grupo de pacientes que não ficaram com seqüelas e outro gráfico para a variável Fisioterapia considerando apenas o grupo de pacientes que ficaram com seqüelas. Você acha que essa variável se comporta de modo diferente nestes grupos? Comente. ii. Compare os grupos em relação ao tempo previsto médio e mediano de Fisioterapia. iii. Calcule o desvio padrão e o coeficiente de variação do tempo previsto de fisioterapia para os dois grupos. Qual dos dois grupos é mais homogêneo (apresenta maior dispersão)? d. A clínica deseja oferecer um desconto para 25% dos pacientes com maior tempo previsto de fisioterapia. Qual é o tempo previsto mínimo de fisioterapia para que o paciente receba o desconto? Que medida descritiva fornece essa informação? 2. Considere a seguinte distribuição de freqüências correspondente aos diferentes preços de um determinado produto em vinte lojas pesquisadas. Preços Nº de lojas fi fi % Fi Fi % 50 2 51 5 52 6 53 6 54 1 Total 20 a. Responda: i. Quantas lojas apresentaram um preço de R$ 52,00? ii. Quantas lojas apresentam um preço de até R$ 52,00 (inclusive)? iii. Qual a porcentagem de lojas com o preço de até R$ 53,00 (inclusive)? iv. Qual a porcentagem de lojas como preço maior do que R$ 51,00 e menor do que R$ 54,00? b. Complete o quadro abaixo referente à variável preços e interprete os resultados. Preços Mínimo(x(1)) 1º Quartil(Q1) Mediana(x) Média(x) Desvio-padrão (s) 3º Quartil(Q3) Máximo(x(n)) Interquartílico(dq) c. Construa um Box-plot para a variável preços e comente com relação a: dispersão, outliers, assimetria/simetria, dispersão com relação a mediana. 3. A distribuição de freqüências do salário anual dos moradores do bairro A que tem alguma forma de rendimento é apresentada na tabela abaixo: Faixa salarial (x 10 salários mínimos) Frequência 0 |- 2 10.000 2 |- 4 3.900 4 |- 6 2.000 6 |- 8 1.100 Atividade Extra – Estatística Descritiva Entregar: nos 1, 6, 8, 12, 15 e 17 Grupos de no máximo: 3 discentes 8 |- 10 800 10 |- 12 700 12 |- 14 2.000 Total 20.500 a. Cosntrua um histograma da distribuição. b. Qual a média e o desvio padrão da variável salário? c. O bairro B apresenta, para a mesma variável, uma média de 7,2 e um desvio padrão de 15,1. Em qual dos bairros a população é mais homogênea quanto à renda? d. Construa a função de distribuição acumulada e determine qual a faixa salarial dos 10% mais ricos da população do bairro. e. Qual a “riqueza total” dos moradores do bairro? 4. Dado o histograma abaixo, calcular a média, a variância, a moda, a mediana e o 1º quartil. 5. Em uma granja foi observada a distribuição dos frangos em relação ao peso, que era a seguinte: Peso (gramas) fi 960 |- 980 60 980 |- 1.000 160 1.000 |- 1.020 280 1.020 |- 1.040 260 1.040 |- 1.060 160 1.060 |- 1.080 80 Total a. Qual a média da distribuição? b. Qual a variância da distribuição? c. Construa o histograma. d. Queremos dividir os frangos em quatro categorias, em relação ao peso, de modo que: i. Os 20% mais leves sejam da categoria D; ii. Os 30% seguintes sejam da categoria C; iii. Os 30% seguintes sejam da categoria B; iv. Os 20% seguintes (ou seja, os 20% mais pesados) sejam da categoria A; Quais dos limites de peso entre as categorias A, B, C e D? e. O granjeiro decide separar desse lote os animais com peso inferior a dois desvios padrões abaixo da média para receberem ração reforçada, e também separar os animais com peso superior a um e meio desvio padrão acima da média para usá-los como reprodutores. 6. A idade dos 22 ingressantes num certo ano no curso de pós-graduação em nutrição de uma universidade foi o seguinte: 21 22 22 22 23 23 24 24 24 24 24 25 25 26 26 26 26 27 28 30 40 48 a. Apresente os dados em uma tabela de freqüência simples, incluindo a freqüência relativa, freqüência absoluta e freqüência absoluta relativa. b. Obtenha as medidas resumo: média e desvio padrão, moda, mediana, quartis e intervalo interquartílico. c. Considerando o intervalo [�̅� − 2𝑠 ; �̅� + 2𝑠] , verifique se o conjunto de dados apresenta outliers (idades atípicas). d. Considerando o intervalo [Q1 – 1,5dQ , Q3 + 1,5dQ], verifique se o conjunto de dados apresenta outliers. Caso apresente algum(ns), exclua-o(s) e refaça todos os cálculos das medidas-resumo. Comente as diferenças encontradas. 7. Os valores abaixo referem-se ao tempo (em dias) de cicatrização de cortes provenientes de cirurgia de 30 pacientes. 15 17 16 15 17 14 17 16 16 17 15 18 14 17 15 14 15 16 17 18 18 17 15 16 14 18 18 16 15 14 a. Construa o diagrama de pontos para os tempos (em dias) e comente-os. b. Construa o gráfico de ramos e folhas. c. Calcule os percentis de ordem 22, 38 e 76. 8. Os dados da tabela abaixo são relativos ao Peso (em kg) de 507 indivíduos fisicamente ativos divididos considerando a variável Sexo. Tabela – Distribuição de frequência do peso (em Kg) dos indivíduos ativos segundo a variável Sexo. Sexo Frequência Absoluta Frequência Relativa (%) Frequência Relativa Acumulada (%) Peso Homens Mulheres Homens Mulheres Homens Mulheres 42|- 52 0 38 52 |- 62 13 122 62|- 72 56 67 72|- 82 85 26 82 |- 92 71 5 92 |- 102 17 0 102 |- 112 4 2 > 112 1 0 Total 247 260 a. Calcule a Freqüência Relativa e a Freqüência Relativa Acumulada. b. Construa uma Ogiva das Freqüências Acumulada segundo a variável sexo. 9. Considere a Ogiva da taxa de hemoglobina no sangue (gramas/cm3) de alguns operários da construção civil: Com base na ogiva (Figura 2.3), estime a mediana, o primeiro e terceiro quartis. Interprete estes valores. 10. O Departamento Pessoal de uma certa firma fez um levantamento dos salários dos 120 funcionários do setor administrativo, obtendo os resultados (em salários mínimos) da tabela abaixo. Faixa salarial Frequência relativa 0 |- 2 0,25 2 |- 4 0,40 4 |- 6 0,20 6 |- 10 0,15 Total a. Esboce o histograma correspondente. b. Calcule a média, a variância e o desvio padrão. c. Calcule o 1º quartil e a mediana. d. Se for concedido um aumento de 100% para todos os 120 funcionários, haverá alteração na média? E na variância? Justifique a sua resposta. e. Se for concedido um abono de dois salários mínimos para todos os 120 funcionários, haverá alteração na média? E na variância? E na mediana? Justifique sua resposta. 11. Na companhia A, a média dos salários é 10.000 unidades e o 3º quartil é 5.000. a. Se você se apresentasse como candidato a funcionário nessa firma e se o seu salário fosse escolhido ao acaso entre todos os possíveis salários, o que seria mais provável: ganhar mais ou menos que 5.000 unidades? b. Suponha que, na companhia B, a média dos salários seja 7.000 unidades, a variância praticamente zero e o salário tambémseja escolhido ao acaso. Em qual companhia você se apresentaria para procurar emprego? 12. Considere as informações nutricionais de 16 marcas de chocolates. Energia 1970 2003 2057 1920 2250 2186 1930 1980 1890 2030 2180 1623 1640 2210 1980 1970 Proteína 3,1 4,6 9,9 5,1 7,2 7,0 3,5 10,2 4,7 5,6 5,5 2,2 3,7 8,2 8,5 5,0 Gordura 27,2 26,5 23,0 18,4 30,1 28,4 24,5 22,9 19,5 20,4 26,8 9,2 12,0 29,8 20,6 20,0 Carboidrato 53,2 59,0 60,9 67,5 59,4 59,7 56,4 59,9 67,9 67,4 67,3 73,3 77,9 57,0 63,3 69,0 Sódio 75 115 116 220 110 93 40 190 160 250 160 90 220 110 130 148 Figura: Box-plot da gordura, do carboidrato e do sódio de algumas marcas de chocolates a. Calcule as medidas de tendência central, o primeiro e terceiro quartil das variáveis Energia (kj/100g), Proteína (%), Gordura (%), Carboidrato(%) e Sódio (mg). b. Calcule o coeficiente de variação para as mesmas variáveis do item (a). c. Construa um Box-plot da variável Gordura e comente-o. d. Observe a Figura 2.3 e compare os Box-plot das variáveis Proteína, Gordura e Carboidrato. 13. Coletaram-se os pesos, em Kg, de 40 alunos - 20 rapazes e 20 moças, obtendo-se os dados abaixo. Trace um Box-Plot simultâneo para cada sexo e interprete-o. Moças 32 40 47 57 33 40 48 58 35 42 50 60 36 43 52 63 38 45 53 65 Rapazes 40 49 55 70 40 50 57 75 43 50 60 83 45 52 65 92 47 55 67 105 14. Admitamos que uma amostra relativa às Kcal ingeridos diariamente de um grupo de 60 sujeitos que apresente distribuição normal. Foram calculados: o DP= 300,2 Kcal e a média= 2 ingerido 2800 Kcal e discuta o resultado. 15. A MB Indústria e Comércio, desejando melhorar o nível de seus funcionários em cargos de chefia, montaram experimental e indicou 25 funcionários para a obtidos no curso estão na Tabela 15. Como havia dúvidas quanto à adoção de um único critério de avaliação, cada instrutor adotou seu próprio sistema de aferição. Usando o a. Após observar atentamente cada variável, e com o intuito de dados) cada uma das 9 variáveis listadas? b. Compare e indique as diferenças existentes entre as distribuições das variáveis Direito, Política e Estatística. c. Construa o histograma para as notas da variável Redação. d. Construa a distribuição de freqüências e. Sorteado ao acaso um dos 25 funcionários, qual a probabilidade de que ele tenha obtido grau A em Metodologia? f. Se, em vez de um, sorteássemos dois, a probabilidade de q menor do que a resposta dada em (e)? g. Como é o aproveitamento dos funcionários na disciplina Estatística, segundo a seção a que eles pertencem? h. Sabe-se agora que os critérios adotados em cada exame não são desempenho relativo em cada exame. Essa medida será obtida do seguinte modo: Dê o que se pede: i. Interprete o significado de Z. ii. Calcule as notas padronizadas dos funcionários para o exame de Estatística. iii. Com os resultados obtidos em (ii), calcule iv. Se algumas das notas padronizadas estiver acima de ser considerado um caso atípico. Existe algum nessa situação? v. O funcionário 1 obteve relativo foi melhor? 16. Os escores padronizados são amplamente utilizados em teste de aptidão física. Mathews (1980) compara testes de aptidão física e conhecimento desportivo. Maria apresentou um desempenho muito acima da média em força abdominal (dois desvio padrão acima da média); sua capacidade aeróbica (corrida/caminhada) está acima da média mas não é notável e ela tem u bom comparado com o grupo. No salto de extensão e na suspensão com flexão do braço sobre antebraço, Maria obteve escores abaixo das respectivas médias do grupo, sendo que o desempenho de Maria para sal Descreva o desempenho de Joana. 17. Admitamos que uma amostra relativa às Kcal ingeridos diariamente de um grupo de 60 sujeitos que apresente distribuição normal. Foram calculados: o DP= 300,2 Kcal e a média= 2531, 5 Kcal. Calcule o Z scor ingerido 2800 Kcal e discuta o resultado. Teste abdominais em 2 min salto em extensão (cm) suspensão braços flexionados (seg) correr/andar em 12 min (m) conhecimento desportivo Admitamos que uma amostra relativa às Kcal ingeridos diariamente de um grupo de 60 sujeitos que apresente distribuição normal. Foram calculados: o DP= 300,2 Kcal e a média= 2531, 5 Kcal. Calcule o Z score para um sujeito que tenha ingerido 2800 Kcal e discuta o resultado. A MB Indústria e Comércio, desejando melhorar o nível de seus funcionários em cargos de chefia, montaram ou 25 funcionários para a primeira turma. Os dados referentes à seção a que pertencem, notas e graus . Como havia dúvidas quanto à adoção de um único critério de avaliação, cada instrutor adotou seu próprio sistema de aferição. Usando os dados da Tabela 15, responda as questões: Após observar atentamente cada variável, e com o intuito de resumi-las, como você ide dados) cada uma das 9 variáveis listadas? mpare e indique as diferenças existentes entre as distribuições das variáveis Direito, Política e Estatística. ograma para as notas da variável Redação. freqüências da variável Metodologia e faça um gráfico para indicar essa distribuição. Sorteado ao acaso um dos 25 funcionários, qual a probabilidade de que ele tenha obtido grau A em Metodologia? Se, em vez de um, sorteássemos dois, a probabilidade de que ambos tivessem tido A em Metodologia é maior ou menor do que a resposta dada em (e)? Como é o aproveitamento dos funcionários na disciplina Estatística, segundo a seção a que eles pertencem? se agora que os critérios adotados em cada exame não são comparáveis. Por isso, decidiu desempenho relativo em cada exame. Essa medida será obtida do seguinte modo: Interprete o significado de Z. Calcule as notas padronizadas dos funcionários para o exame de Estatística. Com os resultados obtidos em (ii), calcule 𝑧 ̅e dp(Z). Se algumas das notas padronizadas estiver acima de 2dp(Z) ou abaixo de ser considerado um caso atípico. Existe algum nessa situação? obteve 9,0 em Direito, em Estatística e em Política. Em que di relativo foi melhor? Os escores padronizados são amplamente utilizados em teste de aptidão física. Mathews (1980) compara testes de aptidão Maria apresentou um desempenho muito acima da média em força abdominal (dois desvio padrão acima da média); sua capacidade aeróbica (corrida/caminhada) está acima da média mas não é notável e ela tem um conhecimento desportivo bastante No salto de extensão e na suspensão com flexão do braço sobre antebraço, Maria obteve escores abaixo das respectivas médias do grupo, sendo que o desempenho de Maria para salto em extensão é bastante ruim Admitamos que uma amostra relativa às Kcal ingeridos diariamente de um grupo de 60 sujeitos que apresente distribuição normal. Foram calculados: o DP= 300,2 Kcal e a média= 2531, 5 Kcal. Calcule o Z scor ingerido 2800 Kcal e discuta o resultado. x Maria Joana Maria abdominais em 2 min 30 6 42 38 2,00 salto em extensão (cm) 155 23 102 173 -2.33 suspensão braços flexionados (seg) 50 8 38 71 -1.50 correr/andar em 12 min (m) 1829 274 2149 1554 1,17 ecimento desportivo 75 12 97 70 1,83 Admitamos que uma amostra relativa às Kcal ingeridos diariamente de um grupo de 60 sujeitos que apresente distribuição 531, 5 Kcal. Calcule o Z score para um sujeito que tenha A MB Indústria e Comércio, desejando melhorar o nível de seus funcionários em cargos de chefia, montaram um curso ferentes à seção a que pertencem, notas e graus . Como havia dúvidas quanto à adoção de um único critério de avaliação, cada instrutor , responda as questões: las, como você identificaria (natureza dos mpare e indique as diferenças existentes entre as distribuições das variáveis Direito, Política e Estatística. da variável Metodologia e faça um gráfico para indicar essa distribuição. Sorteado ao acaso um dos 25 funcionários, qual a probabilidade de que ele tenha obtido grau A em Metodologia? ue ambos tivessem tido A em Metodologiaé maior ou Como é o aproveitamento dos funcionários na disciplina Estatística, segundo a seção a que eles pertencem? comparáveis. Por isso, decidiu-se usar o desempenho relativo em cada exame. Essa medida será obtida do seguinte modo: 𝑍 = ( ) nota padronizada. Calcule as notas padronizadas dos funcionários para o exame de Estatística. ou abaixo de -2dp(Z), esse funcionário deve em Direito, em Estatística e em Política. Em que disciplina o seu desempenho Os escores padronizados são amplamente utilizados em teste de aptidão física. Mathews (1980) compara testes de aptidão Maria apresentou um desempenho muito acima da média em força abdominal (dois desvio padrão acima da média); sua m conhecimento desportivo bastante No salto de extensão e na suspensão com flexão do braço sobre antebraço, Maria obteve escores abaixo das respectivas Admitamos que uma amostra relativa às Kcal ingeridos diariamente de um grupo de 60 sujeitos que apresente distribuição normal. Foram calculados: o DP= 300,2 Kcal e a média= 2531, 5 Kcal. Calcule o Z score para um sujeito que tenha z Maria Joana 1,33 0,78 2,63 -1,00 -0,42 Tabela 15 – Dados MB Indústria e Comércio