Prévia do material em texto
Universidade Federal de Mato Grosso (UFMT) Instituto de Ciências Exatas e da Terra Departamento de Estatística Medidas de Tendência Central Medidas de Tendência Central ■ São valores calculados com o objetivo de representar os dados de uma forma condensada/resumida, as principais medidas são: □ Média □ Mediana □ Moda Notações: X → variável N → tamanho da população n → tamanho da amostra xi → medida de cada indivíduo x → média amostral (estimativa) n = ∑ xi +... + xnx = i=1 = x1 + x2 n n N → média populacional (parâmetro) ∑ xi = i=1 N Média x1 , x2 , x3 , x4 ,...., xn x Generalização dos Resultados Média ■ Definição: é a soma dos valores de uma variável, dividida pelo número de valores. ■ É o número que representa uma série de valores. ■ Representa o valor mais provável de uma variável. ■ Também chamado de esperança matemática ou valor esperado. ■ Existe apenas para variáveis quantitativas (discretas ou contínuas). ■ Seu valor é único. ■ Mesma natureza da variável considerada (unidade de medida). ■ Sofre influência dos valores extremos. Média Média aritmética ■ Pode ser calculada de maneiras diferentes: □ Valores individuais □ Valores em distribuição de frequências □ Valores em intervalos de classe Média aritmética ■ Valores individuais: n ∑ xi 1 2 3 n = i=1 n n x + x + x +...+ x x = Média aritmética ■ Exemplo: valores individuais: x = 3 + 5 + 8 +12 +12 = 40 = 8 5 5 Média = 8 anos Média aritmética ■ Valores em distribuição de frequências: k ∑ xi . ni x = i=1 n ❑ ni – frequência de indivíduos no intervalo i ❑ k – número de intervalos Média aritmética ■ Exemplo: Idade dos 50 alunos de um curso. ■ Valores em distribuição de frequências: Idade dos Alunos Frequência 17 9 18 22 19 7 20 4 21 3 22 0 23 2 24 1 25 2 k x = i=1 n ∑ xi . ni Média aritmética ■ Exemplo: Idade dos alunos do curso. ■ Valores em distribuição de frequências: k x = i=1 n ∑ xi . ni Idade dos Alunos (xi) Frequência (ni) (xi) . (ni) 17 9 153 18 22 396 19 7 133 20 4 80 21 3 63 22 0 0 23 2 46 24 1 24 25 2 50 Somatório 50 945 50 x = 945 = 18,9 anos Média aritmética ■ Valores em intervalos de classe: k ∑ xi pm . ni x = i=1 n □ xi pm – ponto médio do intervalo □ ni – frequência de indivíduos no intervalo i □ k – número de intervalos □ n – número de observações Média aritmética ■ Exemplo – Nível de colesterol dos funcionários do Depto. Estatística da UFMT: ■ Valores em intervalos de classe: k x = i=1 n ∑ xi pm . ni ni Média aritmética k x = i=1 n ∑ xi pm . ni Nível de Colesterol Frequência (fi) xi pm xi pm . fi 180 |--200 2 190 380 200 |--250 10 225 2250 250 |--300 6 275 1650 300 |--350 2 325 650 Total 20 1015 4930 ■ Exemplo – Nível de colesterol dos funcionários do Depto. Estatística da UFMT: ■ Valores em intervalos de classe: x = 4930 = 20 x = 246,5 mg/100ml (ni) ni Média aritmética ponderada ■ Pesos diferentes são atribuídos à determinados valores: ■ Valores individuais: k k x = i=1 ∑ wi . xi ∑ wi i=1 ❑ wi – fatores de ponderação i ❑ k – número de intervalos Média aritmética ponderada ■ Pesos diferentes são atribuídos à determinados valores: □ Exemplo: Cálculo para obtenção da média final no curso de Estatística para Medicina Veterinária: Média aritmética ponderada □ Cálculo para obtenção da média final no curso: □ P1 = 7,5 □ P2 = 8,0 □ P3 = 6,0 □ S = 5,5 (2.7,5)+ (2.8,0)+ (2,5.6,0)+ (1,5 .5,5) = 6,78125 8 54,25 2 + 2 + 2,5 +1,5 = k k ∑ wi i=1 ∑ wi . xi x = i=1 = Atividade 6 Filhos Frequência simples (ni) 1 28 2 14 3 6 4 1 7 1 Total 50 Fonte: Fictícia Tabela 1 - Distribuição de frequência da variável Número de filhos na família. a) Calcule o valor esperado da tabela a seguir: Fonte: Fictícia Tabela 2 - Distribuição de frequência da variável Peso dos alunos. Peso Frequência simples (ni) 44,0 Ⱶ 51,3 10 51,3 Ⱶ 58,6 19 58,6 Ⱶ 65,9 7 65,9 Ⱶ 73,2 7 73,2 Ⱶ 80,5 1 80,5 Ⱶ 87,8 5 87,8 Ⱶ 95,1 1 Total 50 Atividade 6 Fonte: Fictícia b) Calcule o valor esperado da tabela a seguir: Tabela 2 - Distribuição de frequência da variável Peso dos alunos. Peso Frequência simples (ni) 44,0 Ⱶ 51,3 10 51,3 Ⱶ 58,6 19 58,6 Ⱶ 65,9 7 65,9 Ⱶ 73,2 7 73,2 Ⱶ 80,5 1 80,5 Ⱶ 87,8 5 87,8 Ⱶ 95,1 1 Total 50 Atividade 6 c) Calcule a média salarial da empresa Y. Cargo Quantidade Salário(R$) Auxiliar administrativo 5 1100,00 Atendente 16 2000,00 Gerente 3 5500,00 Diretor 1 12500,00 Mediana ■ Definição: é o valor que ocupa a posição central de uma série de observações, quando os dados estão ordenados de forma crescente ou decrescente. ■ Divide o conjunto de dados em duas partes. ■ Existe apenas para variáveis quantitativas (discretas ou contínuas). ■ Seu valor é único. ■ Mesma natureza da variável considerada. ■ Torna-se inadequada quando há muitos valores repetidos. ■ Principal vantagem em relação à média: NÃO recebe influência dos valores aberrantes. Mediana ■ Procedimento para o cálculo: □ 1) Ordenar o conjunto de dados (n valores): □ Quando o número de observações (n) for impar: Mediana A mediana é o valor que ocupa o posto: 2 n +1 ■ Postos (rank) □ é o valor da posição do indivíduo na amostra, quando a mesma está ordenada Considere o seguinte conjunto de idades: Mediana Posto 1 0, 3, 4, 7, 14, 22, 23, 25, 30, 40, 41, 48, 50 Posto 5 Posto 13 Ainda considerando o conjunto de dados: □ n=13 (impar) □ Mediana = Posto Mediana n +1 → 13 +1 = 14 = 7 2 2 2 0, 3, 4, 7, 14, 22, 23, 25, 30, 40, 41, 48, 50 Posto 7 Mediana = 23 anos □ IMPORTANTE: A mediana é o valor correspondente ao posto nº 7 (valor 23 anos) e não o valor 7. Mediana ■ Quando o número de observações (n) for par: □ Procedimento para o cálculo: A mediana é a média aritmética entre os valores que ocupam os postos: 2 n 2 n + 2 Considerando outro conjunto de dados: 7, 14, 22, 23, 25, 30, 40, 41, 48, 500 □ n=10 (par), então Mediana 2 n 2 n + 2 2 10 2 10 + 2 Então obtemos os postos 5 e 6, agora precisamos calcular a média aritmética dos valores referentes a esses dois postos. Mediana Considerando outro conjunto de dados: 7, 14, 22, 23, 25, 30, 40, 41, 48, 500 Posto 5 Posto 6 □ n=10 (par) Mediana = Posto nº5 + Posto nº6 = 2 2 Mediana = 25 + 30 = 27,5 anos Mediana ■ Procedimento para o cálculo: □ Quando os valores estiverem um uma tabela de frequências: Idade dos Alunos Frequênci (xi) (ni) a Freq. Acumulada 17 9 9 18 22 31 19 7 38 20 4 42 21 3 45 22 0 45 23 2 47 24 1 48 25 2 50 Somatório 50 - n 50 2 2 = = Posto nº25 n + 2 = 52 = Posto nº26 2 2 Mediana = 18 anos Mediana ■ Procedimento para o cálculo: □ Quando os valores estiverem um uma tabela com intervalos de classe: (ni) Mediana ■ Procedimento para o cálculo: □ Quando os valores estiverem um uma tabela com intervalos de classe: % acumulada 19,5 52,8 75,0 (ni) Mediana ■ Utiliza-se a seguinte fórmula: Mediana ■ Procedimento para o cálculo: □ Quando os valores estiverem um uma tabela com intervalos de classe: % acumulada 19,5 52,8 75,0 Mediana ■ Atividade 7 □ Calcule a mediana dos pesos (em kg) de 40 pessoas: Fac 3 8 17 29 40 Mediana ■ Exercício □ Calcule a mediana dos pesos (em kg) de 40 pessoas: Fac 3 8 17 29 40 Moda ■ Definição: é o valor que ocorre com mais frequência (o que mais se repete). ■ Mesma natureza da variável considerada. ■ Pode ser calculada também para variável qualitativa ■ Pode haver nenhuma, uma ou mais modas □ Nenhuma moda (amodal) □ 2 modas (bimodal) □ 3 modas (trimodal) Moda Considere os seguintes conjunto de idades: 0, 3, 4, 4, 4, 22, 23, 23, 30, 40, 41, 48, 50 Moda = 4 anos 0, 3, 4, 4, 4, 22, 23, 23, 30, 36, 36, 36, 40, 48, 50 Moda = 4 anos Moda = 36 anos Conjunto bimodal Moda Idade dos Alunos Frequência (xi) (fi)17 9 18 22 19 7 Idade dos Alunos (xi) Frequência (ni) 20 4 21 3 22 0 23 2 24 1 25 2 Somatório 50 17 18 19 20 21 22 23 24 25 9 22 7 4 3 0 2 1 2 Somatório 50 Moda = 18 anos Intervalo modal: 69,4 |-- 73,2 (ni) Moda de Czuber: ■ Para dados em intervalos de classe utiliza-se a seguinte fórmula: Moda ■ Procedimento para o cálculo: □ Quando os valores estiverem um uma tabela com intervalos de classe: Moda de Czuber Moda de Czuber: ■ Utiliza-se a seguinte fórmula: □ Pelo exemplo anterior: Separatrizes ■ São as medidas que separam um conjunto de dados ordenados em partes iguais. □ Quartis (divide em 4 partes iguais) □ Decis (divide em 10 partes iguais) □ Percentis (divide em 100 partes iguais) Separatrizes Quartis ■ Definição: os quartis dividem um conjunto de dados ordenados em 4 partes iguais: □ 25% - Primeiro quartil □ 50% - Segundo quartil = Mediana □ 75% - Terceiro quartil 25% 50% 75% Quartis ■ Distância interquartílica: diferença entre o terceiro e o primeiro quartil 25% 50% 75% 50% dos dados estão nessa faixa Quartis ■ Cálculo: ■ 1º quartil: ■ 3º quartil: 4 Q1 = p1 (n+1) (n+1) Q 3 = p3 4 Quartis ■ 🡪 11 valores de idades 3, 4, 7, 14, 22, 23, 25, 30, 40, 41, 48 ■ 1º quartil: ■ 3º quartil: Q1 = p1 = p1 = p12 = p3 (n+1) (11+1) 4 4 4 = p36 = p9 4 Q 3 = p3 = p3 4 4 (11+1)(n+1) Quartis ■ 🡪 13 valores de idades 0, 3, 4, 7, 14, 22, 23, 25, 30, 40, 41, 48, 50 = p14 4 = p1 4 ■ 1º quartil: Q1 = p1 4 (13+1)(n+1) = p42 4 ■ 3º quartil: Q 3 = p3 = p3 4 4 (13+1)(n+1) Quartis ■ 1º quartil: = p3,5Q1 = p14 = p7 4 2 0, 3, 4, 7, 14, 22, 23, 25, 30, 40, 41, 48, 50 Posto 3 Posto 4 Q1 = p3,5 = p3 + 0,5.( p4 − p3 ) Q1 = 4 + 0,5.(7 − 4) = 4 +1,5 = 5,5 Q1 = 5,5 anos Quartis ■ 3º quartil: 0, 3, 4, 7, 14, 22, 23, 25, 30, 40, 41, 48, 50 Posto 10 Posto 11 Q 3 = p10,5 = p10 + 0,5.( p11 − p10 ) Q3 = 40 + 0,5.(41− 40) = 40 + 0,5 = 40,5 Q3 = 40,5 anos = p21 = p10,5 2 Q 3 = p42 4 Quartis ■ 🡪 Exercício: 8 valores de renda (mil R$) R$ 1, R$ 3, R$ 4, R$ 7, R$ 14, R$ 22, R$ 24, R$ 35 Q1 = p1 (n+1) 4 Q 3 = p3 (n+1) 4 ■ 1º quartil: = p2,25 Q1 = p1 = p1 = p9 (n+1) (8+1) 4 4 4 Q1 = p2,25 = p2 + 0,25.( p3 − p2 ) Q1 = 3 + 0,25.(4 − 3) = 3 + 0,25 = 3,25 1º quartil = 3,25 mil reais Quartis ■ 🡪 Exemplo: 8 valores de renda (mil R$) R$ 1, R$ 3, R$ 4, R$ 7, R$ 14, R$ 22, R$ 24, R$ 35 Q 3 = p3 (n+1) 4 ■ 3º quartil: = p6,75 Q 3 = p3 = p3 = p27 (n+1) (8+1) 4 4 4 Q 3 = p6,75 = p6 + 0,75.( p7 − p6 ) Q3 = 22 + 0,75.(24 − 22) = 22 +1,5 = 23,5 3º quartil = 23,5 mil reais Decis e Percentis ■ Decis dividem um conjunto de dados em 10 partes iguais. , i = 1,...,9 ■ Percentis dividem um conjunto de dados em 100 partes iguais. □ 10 10 (n+1) (n+1) □ D1 = p 1 Di = p i 100 1 (n+1) 100 , i = 1,...,99P1 = p Pi = p (n+1) i Bibliografia ■ Arango HG. Bioestatística Teórica e Computacional. Guanabara Koogan. 2ª ed. Rio de Janeiro, 2005. ■ Bergamaschi DP. Bioestatística (Apostila Graduação) FSP/USP, 2010. ■ Callegari-Jacques SM. Bioestatística – Princípios e Aplicações. Artmed. Porto Alegre, 2003. ■ ENCE – Escola Nacional de Ciências Estatísticas www.ence.ibge.gov.br ■ Latorre MRDO. Bioestatística (Apostila graduação) FSP/USP, 2009. ■ Magalhães MN; Lima ACP. Noções de Probabilidade e Estatística. EDUSP. São Paulo, 2002. ■ Salsa IS; Moreira JA; Pereira MG. O emprego das separatrizes na análise dos dados estatísticos. EDUFRN, 2005. ■ Vieira S. Introdução à Bioestatística. ELSEVIER. 4ª ed. Rio de Janeiro, 2010. http://www.ence.ibge.gov.br/