Prévia do material em texto
Aluno(a): Data: Disciplina: Probabilidade e estatística Profª: Gabriella Amorim M. Falcão 1. Classifique as variáveis (qualitativa nominal, qualitativa ordinal, quantitativa discreta, quantitativa contínua): a) Vitamina (A, B1, B2, B6, B12) b) Quantidade de caloria na batata frita. c) Desfecho de uma doença (curado, não curado) d) Classificação de uma lesão (lesão fatal; severa; moderada; pequena). e) Grupo sangüíneo (A,B,AB,O) f) Paridade (primeira gestação, segunda gestação, terceira ...) g) Número de nascidos vivos em certo hospital em junho/99 2. Os dados abaixo referem-se ao número de pessoas que residem em uma amostra de 35 domicílios em Boa viagem: 2 3 4 4 5 3 4 5 6 5 3 1 5 5 1 3 4 5 5 5 3 2 2 5 4 4 2 3 5 4 5 4 2 4 9 Construa uma distribuição de frequência em classes, frequência relativa, absoluta normal e em percentual e acumulada. 3. Os dados seguintes são referentes ao nível de glicose de 60 crianças: 56 61 57 77 62 75 63 55 64 60 60 57 61 57 67 62 69 67 68 59 65 72 65 61 68 73 65 62 75 80 66 61 69 76 72 57 75 68 83 64 69 64 66 74 65 76 65 58 65 64 65 60 65 80 66 80 68 55 66 71 a) Construa uma distribuição de frequência b) Determine as frequências simples acumuladas de cada classe. c) Determine as frequências relativas de cada classe. d) Determine as frequências relativas acumuladas de cada classe. e) Encontre os quartis ( Q1, Q2 e Q3) 4. Os dados a seguir referem-se ao tempo, em horas, que 80 pacientes hospitalizados dormiram durante a administração de certo anestésico: a) Encontre a freqüência relativa de cada classe. b) Determine a freqüência acumulada de cada classe. c) Determine o ponto médio de cada classe. d) Dê a interpretação para a freqüência relativa de 3a classe. e) Qual o percentual de pacientes que dormiram menos de 12 horas? 5. Uma amostra de gaúchos foi investigada em relação ao consumo de sal diário, obtendo-se o seguinte: Determine e interprete o consumo médio, o consumo modal e o consumo mediano. Calcule também a variância e o desvio padrão das amostras. 6. Os resultados baseados em uma escala de ansiedade para uma amostra de nove sujeitos são: 67 75 63 72 77 78 81 77 80 Determine as medidas de tendência central (média, moda, mediana) e interprete cada uma. 7. A incidência de doenças infecto-contagiosas no Est.de S.Paulo, é apresentado a seguir. Que medida estatística (média, moda, mediana) você usaria para descrever esta tabela? Justifique adequadamente sua resposta, levando em conta a classificação da variável. 8. As crianças vacinadas pela vacina Sabin em certo ambulatório foram registradas na tabela abaixo de acordo com a idade. Determine as medidas de tendência central (média, moda e mediana) e dê as interpretações respectivas: 9. Um grupo de adolescentes foi entrevistado sobre o número de vezes que utilizaram droga injetável. Os resultados foram: a) Qual o valor da moda desta informação? O que ela nos informa? b) Qual é a mediana? O que ela significa? c) Determine a média. Interprete. d) Calcule a variância e o desvio padrão. 10. Maiores exportadores de carne suína (mil t), em 2001: a) A tabela é identificada como dados agrupados ou não agrupados? b) Utilize as medidas de tendência central para descrever os dados. 11. Um levantamento realizado em uma amostra de pessoas normais, segundo a quantidade de hemoglobina ( g/ 100 ml) existente no sangue forneceu os seguintes resultados: 13,5 12,5 10,6 15,1 11,7 12,9 12,8 9,4 14,9 12,0 Calcule o desvio padrão e o coeficiente de variação. 12. Os dados seguintes são referentes a uma amostra de diâmetros de coração de adultos normais, em mm (medidas em radiografias 36 x 43 cm): 146 125 139 132 121 135 114 114 130 169 114 130 169 125 103 a) Determine a média, a moda e a mediana. b) Calcule a variância e o desvio padrão. 13. A tabela abaixo indica a idade de uma amostra de pacientes com hipertensão arterial: a) Determine e interprete a idade média. b) Determine interprete a idade modal. c) Calcule o desvio padrão da idade. d) Qual o percentual de pacientes hipertensos com no mínimo 50 anos? e) Qual o percentual de pacientes hipertensos com menos de 40 anos? 14. O gráfico a seguir apresenta a taxa de desemprego em % da população economicamente ativa no período de 1982 a 1997: a) Classifique a variável de interesse. b) Qual a moda da variável? c) Determine e interprete a média. d) Determine e interprete a mediana. 15. Foram obtidos os tempos (em segundos) decorridos entre a formulação de um pedido e a entrega de um determinado sanduíche em uma lanchonete McDonalds. 135 90 85 121 83 69 159 177 120 133 90 80 70 93 80 110 Calcule média, mediana, moda, desvio padrão e coeficiente de variação. Interprete os resultados e comente sobre como está sendo o atendimento nesta loja. 16. O gráfico a seguir apresenta, hipoteticamente, a evolução do número de absenteísmo no departamento de operações da empresa que cuida da manutenção das rodovias no litoral do Estado. Como forma de resumir todas as características apresentadas por estes dados, utiliza- se as medidas de tendência central, portanto, a média, a moda e a mediana. Encontre-as. PROBABILIDADE E ESTATÍSTICA LISTA DE EXERCÍCIOS: 1) As variáveis quantitativas são aquelas em que podemos atribuir um valor numérico. Elas podem ser discretas: quando admitem apenas um número inteiro. Ou contínuas quando admitem também números fracionários. As variáveis qualitativas são aquelas em que não podemos atribuir um valor numérico. Em vez disso, são atribuídas categorias para classifica-las. São divididas em ordinais: quando precisam ser organizadas em uma ordem específica ou nominais: quando não existe uma ordem que precise ser seguida. Com base nessas informações: a) Qualitativa ordinal b) Quantitativa contínua c) Qualitativa nominal d) Qualitativa ordinal e) Qualitativa nominal f) Qualitativa ordinal g) Quantitativa discreta 2) Utilizando a fórmula de Sturges para obter a quantidade de classes, temos: 𝑘 = 1 + 3,3 log𝑛 𝑒𝑛𝑡ã𝑜 → 𝑘 = 1 + 3,3 log35 𝑡𝑒𝑚𝑜𝑠 ⇒ 𝑛 = 6,13 𝑐𝑜𝑛𝑠𝑖𝑑𝑒𝑟𝑎𝑚𝑜𝑠 𝑛 = 6 Então utilizando-se 6 classes, temos: Valores em ROL: 1 1 2 2 2 2 2 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 5 5 5 5 5 5 5 5 5 5 5 6 9 Range = 10– 1 = 9 𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑠𝑒 = 𝑅𝑎𝑛𝑔𝑒 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑠𝑒𝑠 = 9 6 = 1,5 Portanto: DISTRIBUIÇÃO DE FREQUÊNCIA EM CLASSES Intervalo de Classes Freq. Abs. Norm. Freq. Absoluta Percentual Freq. Absoluta Acumulada 1,0 - 2,5 7 20% 7 2,5 - 4,0 6 17% 13 4,0 - 5,5 20 57% 33 5,5 - 7,0 1 3% 34 7,0 - 8,5 0 0% 34 8,5 - 10,0 1 3% 35 3) Utilizando a regra da potência de 2 para obter a quantidade de classes, temos: 𝑘 = 𝑚𝑒𝑛𝑜𝑟 𝑣𝑎𝑙𝑜𝑟 𝑖𝑛𝑒𝑖𝑟𝑜 𝑡𝑎𝑙 𝑞𝑢𝑒 2𝑘 ≥ 𝑛, 𝑙𝑜𝑔𝑜 2𝑘 ≥ 60 𝑒𝑛𝑡ã𝑜 𝑡𝑒𝑚𝑜𝑠 𝑘 = 8 Então utilizando-se 8 classes, temos: Valores em ROL: 55 55 56 57 57 57 57 58 59 60 60 60 61 61 61 61 62 62 62 63 64 64 64 64 65 65 65 65 65 65 65 65 66 66 66 66 67 67 68 68 68 68 69 69 69 71 72 72 73 74 75 75 75 76 76 77 80 80 80 83 Range = 83– 55 = 28 𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑠𝑒 = 𝑅𝑎𝑛𝑔𝑒 𝑁ú𝑚𝑒𝑟𝑜𝑑𝑒 𝑐𝑙𝑎𝑠𝑠𝑒𝑠 = 28 8 = 3,5 Os resultados para as letras a, b, c e d são exibidos na tabela abaixo: DISTRIBUIÇÃO DE FREQUÊNCIA EM CLASSES Intervalo de Classes Frequência Simples Frequência Relativa Percentual Frequência Simples Acumulada Frequência Relativa Acumulada 55,0 - 58,5 8 13% 8 13% 58,5 - 62,0 11 18% 19 32% 62,0 - 65,5 13 22% 32 53% 65,5 - 69,0 13 22% 45 75% 69,0 - 72,5 3 5% 48 80% 72,5 - 76,0 7 12% 55 92% 76,0 - 79,5 1 2% 56 93% 79,5 - 83,0 4 7% 60 100% e) cálculo dos quartis Q1, Q2 e Q3: 55 55 56 57 57 57 57 58 59 60 60 60 61 61 61 61 62 62 62 63 64 64 64 64 65 65 65 65 65 65 65 65 66 66 66 66 67 67 68 68 68 68 69 69 69 71 72 72 73 74 75 75 75 76 76 77 80 80 80 83 𝑄2 = 𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = 65 + 65 2 = 65 Para o cálculo de Q1 temos: 55 55 56 57 57 57 57 58 59 60 60 60 61 61 61 61 62 62 62 63 64 64 64 64 65 65 65 65 65 𝑄1 = 𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = 61 + 61 2 = 61 Para o cálculo de Q3, temos: 65 66 66 66 66 67 67 68 68 68 68 69 69 69 71 72 72 73 74 75 75 75 76 76 77 80 80 80 83 𝑄3 = 𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = 71 + 72 2 = 71,5 4) Os valores obtidos como resposta para as letras a, b e c são exibidos na tabela: 𝐹𝑟𝑒𝑞𝑢𝑒𝑛𝑐𝑖𝑎 𝑟𝑒𝑙𝑎𝑡𝑖𝑣𝑎 = 𝐹𝑟𝑒𝑞. 𝐴𝑏𝑠𝑜𝑙𝑢𝑡𝑎 𝑡𝑜𝑡𝑎𝑙 ∗ 100% 𝑃𝑜𝑛𝑡𝑜 𝑀é𝑑𝑖𝑜 = 𝐿𝑖𝑚. 𝑆𝑢𝑝𝑒𝑟𝑖𝑜𝑟 + 𝐿𝑖𝑚. 𝐼𝑛𝑓𝑒𝑟𝑖𝑜𝑟 2 Tempo(H) N. de Pacientes Frequência Relativa a) Frequência Acumulada b) Ponto Médio c) 0 - 4 8 10% 8 2 4 - 8 15 19% 23 6 8 - 12 24 30% 47 10 12 - 16 20 25% 67 14 16 - 20 13 16% 80 18 d) Segundo a frequência relativa da 3° classe 30% dos pacientes dormiram um total de horas que está no intervalo entre 8h e 12h. e) 𝐷𝑜𝑟𝑚𝑖𝑢 𝑚𝑒𝑛𝑜𝑠 𝑑𝑒 12ℎ = 8+15+24 80 ∗ 100% = 58,75% 5) 𝐶𝑜𝑛𝑠𝑢𝑚𝑜 𝑀é𝑑𝑖𝑜 = ∑𝐶𝑜𝑛𝑠𝑢𝑚𝑜 𝐴𝑚𝑜𝑠𝑡𝑟𝑎 = 10+13+17+9+8+11+13+7 8 = 11 𝐶𝑜𝑛𝑠𝑢𝑚𝑜 𝑚𝑜𝑑𝑎𝑙 = 𝑉𝑎𝑙𝑜𝑟 𝑞𝑢𝑒 𝑚𝑎𝑖𝑠 𝑠𝑒 𝑟𝑒𝑝𝑒𝑡𝑒 = 13 Colocando os valores em ROL: 7 8 9 10 11 13 13 17 𝐶𝑜𝑛𝑠𝑢𝑚𝑜 𝑀𝑒𝑑𝑖𝑎𝑛𝑜 = 10 + 11 2 = 10,5 Cálculo da Variância (S): 𝑆 =∑ (𝑥𝑖 − �̅�) 2 𝑛 − 1 = (10 − 11)2 + (13 − 11)2 + (17 − 11)2 + (9 − 11)2 + (8 − 11)2 + (11 − 11)2 + (13 − 11)2 + (7 − 11)² 8 − 1 𝑆 = 10,57143 𝐷𝑒𝑠𝑣𝑖𝑜 𝑃𝑎𝑑𝑟ã𝑜 𝐷𝑎𝑑𝑜 𝑝𝑜𝑟 ⇒ 𝜎 = √𝑆 = √10,57143 = 3,251373556 6) Colocando os valores em ROL: 63 67 72 75 77 77 78 80 81 𝑀é𝑑𝑖𝑎 = 63 + 67 + 72 + 75 + 77 + 77 + 78 + 80 + 81 9 = 74,44 𝑀𝑜𝑑𝑎 = 77, 𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = 77 De acordo com os cálculos obtemos que os nove sujeitos tiveram um valor médio de 74,44 na escala de ansiedade, o valor que mais se repetiu foi 77 que foi também o valor central da amostra quando colocada em ROL. 7) A medida estatística que melhor permitiria analisar os dados é a mediana. Por se tratar do valor central da amostra a mediana nos informa que no estado de São Paulo 19 mil pessoas tem ou já tiveram a tuberculose, sendo cerca de 20% das pessoas que já apresentaram uma das cinco doenças, mostrando uma alta incidência desta doença. 8) Colocando os valores em ROL: 10 12 13 22 22 31 50 𝑀é𝑑𝑖𝑎: �̅� = 10 + 12 + 13 + 22 + 22 + 31 + 50 6 = 22,857 Moda é o valor que mais se repete, logo: 𝑀𝑜𝑑𝑎: 𝑀𝑜 = 22 Mediana: 𝑀𝑒𝑑𝑖𝑎𝑛𝑎: 𝑀𝑒 = 22 A mediana por se tratar do valor central da amostra quer dizer que uma quantidade alta de crianças se encontra naquele faixa etária. A moda permite saber que idade é mais frequente as crianças serem vacinadas. E a média nos dá a possibilidade de comparar a idade uma criança qualquer com a faixa mais adequada para a vacinação. 9) Colocando os valores em ROL: 8 13 29 47 a) Nesse caso não há moda porque nenhum valor se repete. b) 𝑀𝑒 = (13+29) 2 = 21, por se tratar de um valor central a mediana indica que é alto o índice de adolescentes que já usaram ao menos uma droga. c) �̅� = 8+13+29+47 4 = 24,25. Uma média de 24,25 adolescentes por categoria indica um número elevado de adolescentes que usaram drogas mais de uma vez. d) 𝑉𝑎𝑟𝑖â𝑛𝑐𝑖𝑎: 𝑆 = ∑ (𝑥𝑖− �̅�) 2 𝑛−1 = (47−24,25)2+(29−24,25)2+(13−24,25)2+(8−24,25)² 4−1 = 310,25 𝐷𝑒𝑠𝑣𝑖𝑜 𝑃𝑎𝑑𝑟ã𝑜 𝐷𝑎𝑑𝑜 𝑝𝑜𝑟 ⇒ 𝜎 = √𝑆 = √310,25 = 17,61391495 10) Colocando os valores em ROL: 110 265 539 699 710 1220 a) Os dados da tabela são dados agrupados. b) �̅� = 1220+710+699+265+110+539 6 = 590,50 𝑀𝑒 = (539+699) 2 = 619 Como não há valores que se repete, não há uma MODA. A média nos mostra que 590,50 mil toneladas de carne suína foram exportadas em média ao longo do ano de 2001. A mediana de 619 mil toneladas exportadas como valor central da amostra demonstra que houve um bom volume de carne exportada. 11) Primeiro passo é calcular a média aritmética dos valores: �̅� = 5 + 13 + 12 + 5 + 10 + 6 + 15 + 1 + 11 + 7 + 12 + 9 + 12 + 8 + 9 + 4 + 14 + 9 + 12 + 0 20 �̅� = 8,7 𝑉𝑎𝑟𝑖â𝑛𝑐𝑖𝑎: 𝑆 =∑ (𝑥𝑖 − �̅�) 2 𝑛 − 1 = 17,48421 𝐷𝑒𝑠𝑣𝑖𝑜 𝑃𝑎𝑑𝑟ã𝑜 𝐷𝑎𝑑𝑜 𝑝𝑜𝑟 ⇒ 𝜎 = √𝑆 = √17,48421 = 4,181412441 𝐶𝑜𝑒𝑓𝑖𝑐𝑒𝑛𝑡𝑒 𝑑𝑒 𝑉𝑎𝑟𝑖𝑎çã𝑜: 𝐶𝑣 = 𝜎 �̅� = 4,181412441 8,7 = 0,4806 12) Colocando os valores em ROL: 103 114 114 114 121 125 125 130 130 132 135 139 146 169 169 a) Média: �̅� = 103+114+114+114+121+125+125+130+130+132+135+139+146+169+169 15 =131,07 Moda: 𝑀𝑜 = 114 Mediana: 𝑀𝑒 =130 b) 𝑉𝑎𝑟𝑖â𝑛𝑐𝑖𝑎: 𝑆 =∑ (𝑥𝑖 − �̅�) 2 𝑛 − 1 = 358,4952 𝐷𝑒𝑠𝑣𝑖𝑜 𝑃𝑎𝑑𝑟ã𝑜 𝐷𝑎𝑑𝑜 𝑝𝑜𝑟 ⇒ 𝜎 = √𝑆 = √358,4952 = 18,93396947 13) a) �̅� = 2+11+10+9+8 5 = 8 b) Idade Modal é entre 30 e 40 anos período que mais se repete. c) 𝜎 = √ (11−8)2+(2−8)2+(10−8)2+(9−8)2+(8−8)² 5−1 = 3,535534 d) 𝑃𝑒𝑟𝑐. 𝑑𝑒 𝐻𝑖𝑝𝑒𝑟𝑡. 𝑐𝑜𝑚 𝑛𝑜 𝑚í𝑛𝑖𝑚𝑜 50 𝑎𝑛𝑜𝑠 = ( 17 40 ) ∗ 100% = 42,5% e) 𝑃𝑒𝑟𝑐. 𝑑𝑒 𝐻𝑖𝑝𝑒𝑟𝑡. 𝑐𝑜𝑚 𝑚𝑒𝑛𝑜𝑠 𝑑𝑒 40 𝑎𝑛𝑜𝑠 = ( 13 40 ) ∗ 100% = 32,5% 14) a) Variável Quantitativa Contínua b) Moda: 𝑀𝑜 = 4,4 c) �̅� = 2,3+3,9+4,1+4,5+4,4+3,4+4,4+3,8+4,8 9 = 3,95 A taxa média de desemprego entre 1989 e 1997 foi de 3,95%, uma taxa relativamente pequena indicando que em média praticamente 4 a cada 100 pessoas ficaram sem emprego ao longo desse período d) Mediana = 4,1% Por ser o valor central das medidas da amostra, indica que houve um pequeno índice de desemprego ao longo desse período, em torno de 4% como já demonstrou a média. 15) Colocando os valores em ROL: 69 70 80 80 83 85 90 90 93 110 120 121 133 135 159 177 �̅� = 69 + 70 + 80 + 80 + 83 + 85 + 90 + 90 + 93 + 110 + 120 + 121 + 133 + 159 + 177 16 �̅� = 105,93 𝑀𝑒𝑑𝑖𝑎𝑛𝑎: 𝑀𝑒 = (90 + 93) 2 = 136,5 Moda: 𝑀𝑜 = 80 𝑒 90 𝑉𝑎𝑟𝑖â𝑛𝑐𝑖𝑎: 𝑆 =∑ (𝑥𝑖 − �̅�) 2 𝑛 − 1 = 1034,996 𝐷𝑒𝑠𝑣𝑖𝑜 𝑃𝑎𝑑𝑟ã𝑜 𝐷𝑎𝑑𝑜 𝑝𝑜𝑟 ⇒ 𝜎 = √𝑆 = √1034,996 = 32,171355372 𝐶𝑜𝑒𝑓𝑖𝑐𝑒𝑛𝑡𝑒 𝑑𝑒 𝑉𝑎𝑟𝑖𝑎çã𝑜: 𝐶𝑣 = 𝜎 �̅� = 32,171355372 105,93 = 0,3037 Com uma duração média de aproximadamente 106 segundos com 80 e 90 segundo sendo os valores que mais se repetem podemos afirmar que o atendimento da loja é eficiente. 16) Colocando os valores em ROL: 2 2 4 5 5 57 8 9 10 12 15 Média: �̅� = 2+2+4+5+5+5+7+8+9+10+12+15 12 = 7 Moda: 𝑀𝑜 = 5 𝑀𝑒𝑑𝑖𝑎𝑛𝑎: 𝑀𝑒 = (5 + 7) 2 = 6