Prévia do material em texto
Instituto de Ciências da Saúde 14 _________________________________________________________________________ Tópico 05 5 – Medidas de posição ou Tendência central _________________________________________________________________________ As medidas de tendência central (ou locação ou também de posição) são valores calculados com o objetivo de representar os dados de uma forma ainda mais condensada do que se usando uma tabela. Há várias medidas de tendência central. As mais utilizadas em análise estatística são a média aritmética simples e ponderada, a mediana e a moda. Pode-se considerar como sendo: - um valor intermediário da série. - um valor em torno do que os elementos da série estão distribuídos. 5.1 Média Aritmética Simples A média aritmética é a medida de tendência central mais utilizada. Ela representa o valor "provável" de uma variável, por isso, é muitas vezes chamada de valor esperado ou, ainda esperança matemática, quando calculada para a população. Costuma-se indicar a média pela letra identificadora da variável, x, acrescida de um traço na parte superior x . Dado uma sequência numérica de tamanho n representada por x: x1, x2, x3,..., xn . A média será dada por: n x x n i i 1 Instituto de Ciências da Saúde 15 Exemplo: Um sonífero foi administrado em dois grupos de 5 pacientes determinados aleatoriamente (Grupo A e Grupo B). A característica ou variável de interesse (x) é o tempo (em minutos) até o início do efeito do medicamento e os resultados são mostrados na seguinte tabela. Tempo (minutos) até o início do efeito do sonífero administrado aos pacientes do Grupo A e do Grupo B. Grupo A (x) Grupo B (y) 5,75 5,85 6,05 6,10 6,60 5,75 5,85 6,05 6,10 25,90 Fonte: Dados do pesquisador. Encontre a média para os grupos A e B. Interprete os resultados. Vantagens e Desvantagens da Média Aritmética 1) É uma medida de tendência central que, por uniformizar os valores da série, não representa bem os conjuntos que revelam tendências extremas. Deste modo é grandemente influenciada pelos valores extremos da série. 2) Nem sempre é um elemento que faz parte do conjunto. 3) É facilmente calculável. Instituto de Ciências da Saúde 16 5.2 Mediana Seja x: x1, x2,...,xn, um conjunto ordenado de dados estatísticos. Define-se Mediana de x, denotado por Md, como sendo o elemento que ocupa posição central no rol, se existir. Equivalentemente a Mediana é o elemento que separa o rol em dois subconjuntos com igual número de elementos. Logo a Mediana será dada por O cálculo da mediana exige a disposição ordenada dos dados, o que pode representar trabalho considerável se o n for grande. Exemplos: 1) Para o conjunto de idades (anos) 9, 40, 42, 80, 81, 100, calcule a mediana. 2) Um sonífero foi administrado em dois grupos de 5 pacientes determinados aleatoriamente (Grupo A e Grupo B). A característica ou variável de interesse (x) é o tempo (em minutos) até o início do efeito do medicamento e os resultados são mostrados na seguinte tabela. Tempo (minutos) até o início do efeito do sonífero administrado aos pacientes do Grupo A e do Grupo B. Grupo A (x) Grupo B (y) 5,75 5,85 6,05 6,10 6,60 5,75 5,85 6,05 6,10 25,90 Fonte: Dados do pesquisador. par én se , 2 ímpar én se , 1 22 2 1 nn n d xx x M Instituto de Ciências da Saúde 17 Vantagens e Desvantagens da Mediana 1) Não depende de todos os valores da série, podendo mesmo não se alterar com a modificação de alguns deles. 2) Não é influenciada pelos valores extremos da série. 5.3 Moda Seja x: x1, x2,...,xn, um conjunto de dados. Define-se Moda, denotada por Mo, como sendo o elemento mais frequente de uma série de valores. A moda está definida para qualquer tipo de variável, ou seja, qualquer que seja a escala de medida utilizada. No entanto, ela é mais utilizada no caso de variáveis nominais, para as quais a média e a mediana não estão definidas. Nas representações gráficas a Moda aparece como um pico de frequência. Um conjunto de dados pode ter: nenhuma moda (amodal) uma moda (unimodal) duas ou mais modas (multimodal) Exemplo: A gravidade de uma fratura (da bacia, por exemplo) não pode ser quantificada, mas é usual adotar uma variável ordinal definida pelas categorias “1 - fratura leve”, “2 - fratura moderada” e “3 - fratura severa”. Um grupo de 7 pacientes com fratura na bacia foi classificado de acordo com este critério, tendo sido observados os seguintes níveis ou graus de severidade da fratura: leve, leve, moderada, moderada, severa, severa, severa. Determine a moda e interprete-a. Exercício: Os seguintes dados representam o nível de Colesterol Sérico (em mg%) de 10 pacientes cardíacos: 199 267 272 166 239 189 238 223 279 190. Calcule e interprete média, mediana e moda para estes dados. Instituto de Ciências da Saúde 18 ___________________________________________________________________ Tópico 06 6 – Medidas de Dispersão ou de Variabilidade ___________________________________________________________________ Frequentemente não é suficiente usar apenas uma medida de posição para interpretar adequadamente um conjunto de dados. Assim, juntamente com uma medida de tendência central é desejável dispor de uma medida de dispersão dos dados, através do qual é possível quantificar a variabilidade em relação ao centro da distribuição. 6.1 Desvio Padrão (S ou ) É a mais importante medida de variabilidade. O desvio padrão mede a dispersão considerando quão afastadas da média estão as observações. Dados Listados: Dada uma série com n termos, o desvio padrão será a média quadrática dos desvios calculados em relação a média aritmética da série. Exemplo: Tomando os dados dos grupos A, B e C encontre 𝜎. A: 7, 7, 7, 7, e 7 B: 5,6,7,8 e 9 C: 0,5,10,10 e 10 população. de caso no e amostra uma de caso no , 1 )( n 1i 2 1 2 n xx n xx S i n i i Instituto de Ciências da Saúde 19 Exercício: Um sonífero foi administrado em dois grupos de 5 pacientes determinados aleatoriamente (Grupo A e Grupo B). A característica ou variável de interesse (x) é o tempo (em minutos) até o início do efeito do medicamento e os resultados são mostrados na seguinte tabela. Tempo (minutos) até o início do efeito do sonífero administrado aos pacientes do Grupo A e do Grupo B. Grupo A (x) Grupo B (y) 5,75 5,85 6,05 6,10 6,60 5,75 5,85 6,05 6,10 25,90 Fonte: Dados do pesquisador. Encontre o desvio padrão S para os grupos A e B. 6.2 Variância (S2 ou 2)É o quadrado do desvio padrão, isto é, é a média dos quadrados dos desvios das observações em relação à média, ou seja: ou Os passos para o cálculo da variância são: 1. Calcular a média. 2. Subtrair a média de cada elemento do conjunto. 3. Elevar ao quadrado cada desvio. 4. Somar os quadrados dos desvios. 5. Dividir a soma por n-1. 1 1 2 2 n xx S n i i n xx n i i 1 2 2 Instituto de Ciências da Saúde 20 Exemplo: Com a amostra do exercício anterior (Tempo em minutos até o início do efeito do sonífero administrado aos pacientes do Grupo A e do Grupo B). Calcule a variância. 6.3 Coeficiente de Variação (CV) Sejam as distribuições de pesos e estaturas com as seguintes características: Pesos: x = 57,7 kg e = 7,5kg Estaturas: x = 170,0 cm e = 7,1 cm Como não há muito sentido no fato de compararmos unidades diferentes, como por exemplo, kg com cm, definimos o coeficiente de variação (CV), que é uma medida relativa de dispersão. O coeficiente de variação mede percentualmente a relação entre o desvio padrão e a média aritmética, sendo uma medida adimensional. Poderemos fazer então, uma comparação entre: Distribuição de Pesos: x = 57,7 kg e = 7,5kg Distribuição de Estaturas: x = 170,0 cm e = 7,1cm x .V 100