Prévia do material em texto
Medidas de Dispersão/Variabilidade Medidas de Tendência Central são importantes, mas sozinhas são incompletas. Medidas de dispersão (variação) são medidas estatísticas que informam sobre o grau de variabilidade de um conjunto de dados. Amplitude Total (AT) É a diferença entre o maior e o menor valor observados na amostra. Desvio (d) É a distância (diferença) de cada valor em relação a média. Observação: A soma dos desvios de uma amostra é sempre igual a zero. Só quando a média é a melhor medida de tendência central que pode usar o desvio. Desvio é uma medida individual; Para juntar todos os desvios, criou-se o desvio padrão. Desvio-Padrão () Pode ser interpretado como a média dos desvios individuais. O desvio-padrão está na mesma unidade de medida da variável em análise No caso de Dados Agrupados, multiplica-se cada desvio individual pelo número de vezes que ele ocorre (fi) Variância (2) É o desvio-padrão ao quadrado, ou seja, a variância é a média dos quadrados dos desvios individuais. Esta medida é bastante citada na literatura e também usada para cálculo de outras medidas estatísticas. Faixas de Referência Propriedade: Desvio-Padrão Quando os dados de uma variável X possuem distribuição normal (simétrica em torno da média), vale a seguinte regra: Coeficiente de Variação Grau de variação dos dados em relação à média. Medida usada para comparar a Variabilidade de conjuntos de dados distintos Testes de Hipóteses Testes de Hipóteses são métodos analíticos destinados a verificação científica de uma hipótese a cerca de um parâmetro da população. Comparações ou decisões tomadas com base em pesquisas amostrais estão sempre sujeitas a erro que podem ocorrer ao acaso independentemente da qualidade técnica e primazia do planejamento da pesquisa Os salários, de médicos recém-formados, são iguais entre homens e mulheres? Suponha uma pesquisa realizada com 50 médicos e 50 médicas, obteve os seguintes resultados: Sabemos que R$12.000 é diferente de R$12.500, entretanto queremos saber se esta diferença é apenas um acaso amostral ou se, de fato, há diferença significativa entre os grupos comparados Definição das Hipóteses H0: Hipótese Nula → Hipótese conservadora (assume igualdade entre os grupos comparados). H1: Hipótese Alternativa → Hipótese que necessita de maiores evidências para ser considerada verdadeira (será sempre a hipótese de diferença entre os grupos comparados). Erro de decisão Erro Tipo I: Probabilidade de errar ao afirmar ≠ significativa O nível de aceitação deve ser definido antes da realização dos testes. Níveis usados na pesquisa médica: Erro Tipo II: Probabilidade de errar ao afirmar = entre grupos Nem sempre controlado, é definido na etapa de cálculo do tamanho amostral. Níveis usados na pesquisa médica: Escolha do Teste Para cada tipo de comparação que se deseja realizar, em uma investigação científica, há uma coleção de testes estatísticos disponíveis e em desenvolvimento. Na Teoria de Estatística Clássica, há dois grandes grupos de testes estatísticos: Testes Paramétricos X Testes Não Paramétricos • Testes Paramétricos: Possuem pressupostos (em geral, acerca da forma de distribuição dos dados)/ São mais eficientes (capacidade de perceber diferenças entre grupos). • Testes Não Paramétricos: Têm maior aplicabilidade (não possuem pressupostos)/ Têm menor eficiência que seus correspondentes Paramétricos Decisão p-valor p-valor: Probabilidade de Significância: P(Erro I) Probabilidade de errar ao rejeitar H0 Probabilidade de errar ao afirmar ≠ Não é um valor fixo, mas depende da amostra. Probabilidade de errar ao afirmar que existe diferença significativa deve ser no máximo de 5%. p-valor : Probabilidade de errar ao afirmar ≠ A decisão de um Teste de Hipóteses é tomada a partir do p-valor encontrado: Condução de Testes de Hipóteses: 1º passo → Definir as Hipóteses do teste 2º passo → Definir o Nível de Confiança 3º passo → Escolha do Teste adequado 4º passo → Cálculo do p-valor 5º passo → Conclusão do Teste Risco Relativo e Razão das Chances Proporção Medida de frequência relativa. É dada pela frequência absoluta de casos do fenômeno de interesse sobre o total avaliado. Porcentagem Mais frequentemente utilizada para divulgação dos resultados de pesquisas Proporção - Exemplo: Foi realizado um estudo com 1400 habitantes do município de Jaboticatubas. Os participantes do estudo fizeram exames de fezes para determinação de infecção por esquistossomose. Os resultados estão apresentados na tabela a seguir. Exemplo de Aplicação Razão Quociente entre duas medidas relacionadas entre si (o denominador não inclui o numerador). Mede a força da associação entre um determinado fator de exposição e a ocorrência da doença. Quantas vezes a ocorrência da doença é maior em relação aos indivíduos sem a doença. Medidas de Efeito Resultados de pesquisas epidemiológicas são frequentemente expressos por meio de medidas de efeito, tais como risco relativo (relative risk) ou razão de chances (Odds Ratio). O uso dessas medidas ajudam a identificar fatores associados a doenças, condições ou comportamentos. Embora amplamente utilizadas na pesquisas epidemiológicas os conceitos e métodos podem ser aplicados nas diversas áreas do conhecimento. Medidas de Efeito O aparecimento e/ou desenvolvimento de uma determinada doença (ou desfecho de interesse) pode ocorrer com maior frequência na presença de alguns fatores, os quais são usualmente chamados de fatores de risco. Entretanto, ainda existe certa confusão quanto à decisão de qual medida de efeito deve ser usada e como se faz a interpretação de tal medida. Risco ou Chance? Risco Relativo (RR) O Risco Relativo (RR) é calculado pela divisão da probabilidade dos expostos terem o desfecho pela probabilidade dos não- expostos terem o desfecho. Razão das Chances A Razão de Chances (RC) pode ser calculada pela divisão da chance dos expostos terem o desfecho pela chance dos não expostos terem o desfecho. RR ou RC? Estimativas de RR só podem ser feitas quando partimos da exposição e observamos o evento, o que ocorre em Estudos de Coorte (longitudinal). -> Estudos de acompanhamento Entretanto, a forma mais frequente de estudos comparativos são os Estudos transversais de Caso-Controle, nestes casos utilizamos a RC. RP A Razão de Prevalências (RP) é usada em estudos transversais de cálculo de prevalências. A forma de cálculo de RP é semelhante ao RR: Exemplo de Aplicação Razão de Prevalências (RP) = 1,25 Interpretação: A prevalência de esquistossomose em homens é 1,25 vezes maior que em mulheres. Risco Relativo (RR) = 17,7 Interpretação: O risco de morte perinatal de um recém-nascido de baixo peso é 17,7 vezes maior que o risco de morte perinatal de um recém-nascido com peso ≥2.500 g. Risco Relativo (RR) = 2,13 Interpretação: O risco de morte por Covid- 19 em pacientes hipertensos é 2,13 vezes maior que o risco de morte por Covid-19 em pacientes sem hipertensão Interpretação de RR, RC e RP Sabe-se que o RR (ou RC, ou RP), por se tratar da razão entre duas quantidades, será igual a 1 quando o risco for igual entre expostos e não-expostos. Se RR (ou RC, ou RP) for maior que 1, temos um fator de risco; Se RR (ou RC, ou RP) for menor que 1, temos um fator de proteção. Se RR (ou RC, ou RP) for menor que 1, temos um fator de proteção. Nestes casos calculamos a razão: Interpretação do resultado: O grupo exposto terá (1/RC) vezes menos chance de ocorrênciaem relação ao grupo não exposto. Intervalo de Confiança (IC) para RR, RC e RP Assim, definimos se o fator avaliado é significativo para o desfecho de interesse baseado no IC (Intervalo de Confiança) para o RR (RC ou RP). • Se o IC obtido contiver o valor 1, o fator não é significativo nem para risco nem para proteção • Se o IC for todo maior que 1 temos um fator significativo de risco. • Se o IC for todo menor que 1 temos um fator significativo de proteção. Exemplo de Aplicação Razão das Chances (1/RC) = 1,92 Interpretação: A chance de morte por Covid-19 em um paciente do grupo controle é 1,92 vezes menor que em um paciente tratado com cloroquina. Correlação Linear Duas Variáveis quantitativas (X e Y) estão associadas? Para avaliar a existência de associação linear entre duas variáveis quantitativas, primeiramente recorremos à construção de um gráfico de dispersão. Escolhemos para o eixo Y do gráfico a variável resposta, ou seja, aquela que possivelmente é afetada pelo valor observado na variável posicionada no eixo X, denominada variável explicativa (covariável). Cálculo do Coeficiente de Correlação de Pearson O coeficiente de correlação, r (ou ), procura mensurar a força e o sentido (+ ou -) da associação entre duas variáveis quantitativas