Prévia do material em texto
Introdução à Bioestatística Sônia Vieira – 4ª Ed- Capítulo 6 NOÇÕES SOBRE CORRELAÇÃO Programa de Pós-graduação em Nutrição e Saúde(PPGNS) Tópicos Especiais em Nutrição (Princípios de Bioestatística) Profº Drº Luiz Carlos de Abreu e Profº Drº Jorge de O. Echeimberg Discente: Patrícia Sthel Caiado Ventorim Noções sobre correlação Sumário Diagrama de Dispersão Coeficiente de Correlação Pressuposições Cuidados na Interpretação dos coeficientes de correlação Diagrama de dispersão Torna mais visível relação entre duas variáveis Existe relação entre variáveis X e Y? Que tipo de relação? Qual grau da relação ? Diagrama de dispersão Correlação positiva Correlação negativa conjunto A x y 1 2 2 0 3 6 4 3 5 9 6 4 7 10 8 8 9 12 10 8 conjunto B x y 1 8 2 12 3 8 4 10 5 4 6 9 7 3 8 6 9 0 10 2 AMBAS CORRELAÇÕES LINEARES 1- mesmo sentido 2- correlação positiva + 1- variam em sentidos contrários 2 – correlação negativa - Conjunto A Valores Y 1 2 3 4 5 6 7 8 9 10 2 0 6 3 9 4 10 8 12 8 Variável X Variável y Conjunto B Valores Y 1 2 3 4 5 6 7 8 9 10 8 12 8 10 4 9 3 6 0 2 Variável X Variável y Forte Perfeita Fraca conjunto A x y 1 6 2 3 3 5 4 7 5 2 6 11 7 9 8 3 9 6 10 8 conjunto B x y 1 2 2 6 3 5 4 8 5 6 6 9 7 10 8 8 9 12 10 10 conjunto C x y 1 3 2 4 3 5 4 6 5 7 6 8 7 9 8 10 9 11 10 12 DISPERSÃO CORRELAÇÃO Conjunto A Valores Y 1 2 3 4 5 6 7 8 9 10 6 3 5 7 2 11 9 3 6 8 Variável X Variável Y Conjunto B Valores Y 1 2 3 4 5 6 7 8 9 10 2 6 5 8 6 9 10 8 12 10 Variável X Variável Y Conjunto C Valores Y 1 2 3 4 5 6 7 8 9 10 3 4 5 6 7 8 9 10 11 12 Variável X Variável Y RELAÇÃO NÃO-LINEAR conjunto A x y 1,5 1,0 2,O 2,0 3,0 3,0 4,0 3,5 5,O 3,0 6,0 2,0 6,5 1,0 OBSERVA-SE CORRELAÇÃO, PORÉM NÃO DISPERSOS EM TORNO DE UMA RETA CONJUNTO A Valores Y 1,5 2 3 4 5,O 6 6,5 1 2 3 3.5 3 2 1 Variável X Variável Y CORRELAÇÃO NULA Quando não existe qualquer tipo de relação conjunto A x y 1 3 2 1 3 6 4 4 5 3 6 2 7 6 8 4 9 3 10 2 acaso Conjunto A Valores Y 1 2 3 4 5 6 7 8 9 10 3 1 6 4 3 2 6 4 3 2 Variável X Variável Y Coeficiente de Correlação de Pearson Medida para o grau de correlação linear entre duas Variáveis. r=1: Correlação perfeita positiva r= -1 : correlação perfeita negativa r=0 : correlação nula 0< r < 1 : correlação positiva -1< r < 0: correlação negativa 0 < r < 0,25 ou -0,25 < r < 0: correlação pequena ou nula 0,25 < r < 0,50 ou - 0,50 < r < - 0,25: correlação fraca 0,50 < r < 0,75 ou -0,75 < r < -0,50: correlação moderada 0,75 < r< 1,00 ou -1< r < -0,75: correlação forte r=-1 ou r= 1 : perfeita SE Fraca Forte Perfeita CONJUNTO A X Y XY X² Y² 1 2 2 1 4 2 0 0 4 0 3 6 18 9 36 4 3 12 16 9 5 9 45 25 81 6 4 24 36 16 7 10 70 49 100 8 8 64 64 64 9 12 108 81 144 10 8 80 100 64 ∑X=55 ∑Y=62 ∑XY=423 ∑X²=385 ∑Y²=518 CONJUNTO B X Y XY X² Y² 1 8 8 1 64 2 12 24 4 144 3 8 24 9 64 4 10 40 16 100 5 4 20 25 16 6 9 54 36 81 7 3 21 49 8 8 6 48 64 36 9 0 0 81 0 10 2 20 100 4 ∑X=55 ∑Y=62 ∑XY=259 ∑X²=385 ∑Y²=518 0,75 < r< 1,00: correlação positiva forte -1< r < -0,75: correlação negativa forte Tabela 1: Altura, em metros, e peso, em quilogramas, de 22 homens. Número Altura Peso Número Altura Peso 1 1,70 60 12 1,80 75 2 1,68 68 13 1,79 71 3 1,75 85 14 1,75 70 4 1,68 67 15 1,78 87 5 1,65 68 16 1,77 96 6 1,80 102 17 1,80 80 7 1,75 60 18 1,85 85 8 1,70 60 19 1,78 70 9 1,60 50 20 1,80 80 10 1,82 85 21 1,75 82 11 1,64 43 22 1,70 50 r= 0,747 Valores Y 1.7 1.68 1.75 1.68 1.65 1.8 1.75 1.7 1.6 1.82 1.64 1.8 1.79 1.75 1.78 1.77 1.8 1.85 1.78 1.8 1.75 1.7 60 68 85 67 68 102 60 60 50 85 43 75 71 70 87 96 80 85 70 80 82 50 ALTURA PESO Coeficiente de Correlação de Pearson Medida para o grau de correlação linear entre duas Variáveis. r=1: Correlação perfeita positiva r= -1 : correlação perfeita negativa r=0 : correlação nula 0< r < 1 : correlação positiva -1< r < 0: correlação negativa 0 < r < 0,25 ou -0,25 < r < 0: correlação pequena ou nula 0,25 < r < 0,50 ou - 0,50 < r < - 0,25: correlação fraca 0,50 < r < 0,75 ou -0,75 < r < -0,50: correlação moderada 0,75 < r< 1,00 ou -1< r < -0,75: correlação forte r=-1 ou r= 1 : perfeita SE 0,747 Correlação positiva forte Antes é preciso checar: As unidades medidas foram selecionadas ao acaso ou pelo menos são representativas de uma grande população Cada Unidade deve fornecer tanto valores de X quanto de Y As variáveis X e Y devem ser medidas independente . Se os valores de Y foram obtidos por uma fórmula que inclui X, o coeficiente nunca dará zero. Cuidados na Interpretação Logo!! O primeiro passo tem que ser o desenho do diagrama ! Caso contrário r não mede a relação entre as variáveis. Então !!!! Para que o valor “r” tenha significado , no diagrama os pontos estejam espalhados em torno de uma linha reta (relação linear). O coeficiente de correlação de Pearson (“r”) mede apenas a relação linear entre duas variáveis numéricas O diagrama de dispersão da a ideia de relação entre duas variáveis. “Correlação não implica causa” Um estatístico que mostrou que havia correlação positiva entre o número de recém nascidos e o número de cegonhas em uma pequena cidade da Dinamarca , no decorrer dos anos 30 3ª variável Relação causal ATENÇÃO!!!! OBRIGADA !!!!