Prévia do material em texto
Curso de Revisão de Tópicos de Epidemiologia, Bioestatística e Bioética Regente Dr. Mário B. Wagner, MD PhD DLSHTM Prof. FAMED/UFRGS e PUCRS 2016 Porto Alegre, RS MW Consultoria Científica A diferença significativa Informações • Professores Mário B. Wagner, MD PhD DLSHTM Bruna P. Genro, Biol PhD • Contato Fone: (51) 3330-8560 email: mariobwagner@gmail.com • Sites de referência para este curso www.mwc.com.br/biblioteca www.mwc.com.br/rebb2016 www.bioetica.ufrgs.br mailto:mariobwagner@gmail.com http://www.mwc.com.br/biblioteca http://www.mwc.com.br/rebb2016 http://www.bioetica.ufrgs.br/ Objetivos do curso • Revisar os princípios fundamentais da Epidemiologia, da Bioestatística e da Bioética • Auxiliar no desenvolvimento de um raciocínio crítico apontando os campos de atuação dessas disciplinas na área biomédica. • Apresentar de forma resumida tópicos frequentemente abordados no Exame Fundação Médica Método de trabalho • Aulas expositivas • Exercícios aplicados com correção • Discussão em grande grupo Espera-se que os alunos leiam o material solicitado Leitura recomendada Callegari-Jacques, SM. Bioestatística: Princípios e Aplicações. Porto Alegre: ArtMed, 2003. Fletcher R et al. Epidemiologia Clínica. 5a. Ed. Porto Alegre: ArtMed, 2014. Veja sites e links disponibilizados Haynes RB et al. Epidemiologia Clínica: Como realizar pesquisa clínica na prática. 3ª Ed. Porto Alegre: ArtMed, 2008. Hulley SW et al. Delineando a Pesquisa Clínica: Uma Abordagem Epidemiológica. 4ª Ed. Porto Alegre: ArtMed, 2015. Tópicos • Definição e aplicações da Epidemiologia e da Bioestatística na clínica, pesquisa e saúde pública • Medidas descritivas e de associação • Delineamentos de pesquisa • Vieses mais comuns em estudos epidemiológicos • Medidas de desempenho de testes diagnósticos • Fundamentos de Bioestatística (distribuição Normal, DAM, significância, teste t, proporções, qui-quadrado, correlação e regressão) • Elementos de Bioética Conceitos Básicos em Epidemiologia e Bioestatística Bioestatística Estatística: Ramo do conhecimento que consta de processos que tem por objeto a observação, a classificação e a análise de fenômenos coletivos com a finalidade de obter inferências indutivas a partir dos dados. Bioestatística: Aplicação da Estatística nas ciências biológicas e da saúde. A Bioestatística é essencial nas pesquisas epidemiológicas uma vez que possibilita a avaliação da probabilidade e do papel do acaso nas observações que são feitas nos estudos. Epidemiologia A Epidemiologia representa o braço da Metodologia Científica aplicada à área da saúde e com a qual é possível avaliar a credibilidade das pesquisas médicas. Quem não sabe Epidemiologia e Bioestatística não tem condições de adquirir novos conhecimentos por conta própria e nem de avaliar a qualidade da informação que recebe. Ciência da saúde que estuda a distribuição, os determinantes e o controle das doenças nas populações. Epidemiologia • Descrever a ocorrência por estatísticas descritivas • Tentar a explicação com estatísticas de associação e método científico • Para poder prevenir … Como assim, prevenir a gravidez?! Nós nem sequer sabemos qual é sua causa. Conhecimento Artigos científicos publicados nas áreas das ciências biológicas e da saúde freqüentemente apresentam termos do domínio da Epidemiologia e da Bioestatística. O papel da Epidemiologia e da Bioestatística Para entender adequadamente artigos científicos desta área o leitor deve estar familiarizado com os princípios fundamentais da Epidemiologia e da Bioestatística. Na grande maioria dos casos este conhecimento não é de nível profundo e nem envolve cálculos complicados. Para o usuário comum é mais importante conhecer as indicações e as limitações dos procedimentos utilizados em Epidemiologia e Bioestatística do que saber exatamente como executá-los. Medidas de Sumário (Estatísticas Descritivas) Objetivos • Entender os conceitos de variável, nível de medida, amostra e população. • Apresentar medidas descritivas • Média e mediana • DP e AIQ • Prevalência e incidência Bioestatística: Princípios Fundamentais • Resumir a informação (p.e., média, %) • Resumir as relações (p.e., ES, RR) • Estimar a magnitude das relações (p.e., IC95%) Relações Tanto a Epidemiologia como a Bioestatística essencialmente estudam as relações entre as variáveis. Ex: Relação entre fumo e câncer, idade e PA. Assim, se busca • Verificar se há ou não relação • Estimar a magnitude da relação (estimar o tamanho do efeito e seu IC) Variáveis e seus níveis de medida • Qualitativas ou categóricas - Nominal (grupo sangüíneo, gênero) - Ordinal (grau de dor, escores) • Quantitativas - Discretas (número de filhos) - Contínuas (colesterol total) Vantagens da variável quantitativa • Nível de informação é superior • Pode ser transformada em qualquer outro tipo de variável • Aceita transformações matemáticas (log, raiz quadrada, inversão, etc.) • Estudos com este tipo de variável necessitam tamanhos amostrais menores População e Amostra Média () = ? X Inferência Parâmetro: valor que resume, em uma população, a informação relativa a uma variável. Ex: média, porcentagem Estatística: quantidade que descreve a informação estatística obtida em um conjunto de dados amostrais. Ex: média, porcentagem calculadas em uma amostra As estatísticas estimam os parâmetros. Duas variáveis importantes • Desfecho: Aquilo que se supõe ser o resultado, ou seja, acontecerá durante uma investigação na mensuração da condição de saúde-doença. Sinônimo: variável dependente. (Ex: câncer de pulmão) • Exposição: O fator que precede o desfecho, suposta causa. Sinônimos: fator em estudo, v. preditora, v. independente. (Ex: fumo) Procedimentos Descritivos • Distribuição de freqüências (tabelas e gráficos) • Medidas-resumo ou medidas descritivas – de tendência central (média, mediana e moda) – de dispersão (amplitude, variância/desvio padrão, amplitude interquartil, CV) – de freqüência (prevalência, incidência) PAS (mm Hg) nº % 55 59 3 3,1 59 63 5 5,2 63 67 40 41,7 67 71 24 25,0 71 75 15 15,6 75 79 8 8,3 79 83 1 1,0 Total 96 100,0 Pressão arterial sistólica em 96 recém-nascidos ( primeiras 24 horas de vida) Pressão arterial sistólica (PAS) em mm Hg nas primeiras 24 horas de vida em 96 recém-nascidos Histograma Características da distribuição de freqüências • A forma da distribuição determina - o tipo de medida descritiva mais adequada - a técnica estatística correta para as inferências • Uma distribuição de freqüências é muitas vezes descrita apenas por: tendência central (média) dispersão (desvio padrão) Distribuição de freqüências • Toda variável (seja ela qualitativa ou quantitativa) quando avaliada em um grupo de indivíduos apresenta uma distribuição de freqüências. • Sempre que possível os dados devem ser examinados graficamente para que possamos identificar valores extremos e a forma da distribuição. Medidas de Tendência Central • Média: Indicação de uso em distribuições simétricas. Possui o maior poder matemático e é a medida descritiva mais utilizada (e preferida). No entanto, é afetada por valores extremos e em distribuições Curva de distribuição de freqüências com representação pictórica da nuvem de dispersão de pontos. n x x assimétricas pode apresentar uma informação distorcida. • Mediana: Medida de posicionamento repre- sentando o valor que ocupa o meio da série, ou seja, em tese 50% dos valores estão abaixo e 50% acima da mediana. Não é afetada por valo-res extremos, daí ser preferida em séries com distribuição assimétrica. • Moda: medida mais frequente Distribuição de freqüências com assimetria positiva Medidas de Dispersão • Amplitude: Máximo - Mínimo, simples e pouco informativa, pois refere-se a apenas doisvalores. Além disso, é sensível a valores extremos. • Variância: Promédio dos desvios quadrados em relação à média. Como a unidade é expressa ao quadrado, é comum utilizar-se o desvio padrão (DP), pois este é a raiz quadrada da variância. • Desvio padrão: Em palavras simples, o desvio padrão (DP) representa o padrão de oscilações que os valores da série apresentam em relação à média. É fundamental em Estatística, sendo um importante marcador de variação. É freqüentemente usado em conjunto com a média e, como esta, também é afetado por valores extremos. 1 )( 2 2 n n x x DP 1 )( 2 n xx DP • Coeficiente de variação: Representa qual o tamanho do DP em relação à média 100 x DP CV Curva de distribuição de freqüências com representação pictórica da nuvem de dispersão de pontos. Amplitude interquartil: A distância entre o percentil 75 e o percentil 25. É geralmente apresentada junto com a mediana na descrição de séries assimétricas. Há outros percentis... Distribuição de freqüências com assimetria positiva Medidas de freqüência: Conceitos Básicos • Razão: Relação (divisão) entre duas quantidades quaisquer (ratio em Inglês). • Proporção: Tipo de razão onde o numerador é de mesma natureza e esta contido no denominador (proportion em Inglês). • Odds: razão de eventos/não-eventos • Taxa: Termo que refere-se a razões especiais nas quais necessariamente temos no denominador uma unidade de tempo (rate em Inglês). A distorção do termo “taxa” Infelizmente o termo taxa (rate) ao longo do tempo (e do mau uso) foi perdendo seu verdadeiro sentido, sendo freqüentemente utilizado em proporções e razões. Assim alguns epidemiologistas quando querem referir-se a taxa original apelam para a expressão “taxa verdadeira” ou “true rate”. Prevalência e Incidência • A ocorrência da doença (desfecho) é freqüentemente categorizada como presente/ausente. • Variável categórica (nível de medida nominal): descrita com razões, proporções e taxas. • Em Epidemiologia as razões, proporções e taxas (verdadeiras) recebem nomes especiais Prevalência • Definição: Proporção de indivíduos que apresentam o desfecho em um determinado momento no tempo. • Apesar de ser uma medida com lógica de instantâneo, a coleta de dados pode levar dias ou até meses. Prevalência • Medida estática análoga ao momento capturado por uma fotografia. estudados indivíduos de total número tempo no momento odeterminad um em desfecho o com indivíduos de número revalênciaP Incidência • Refere-se ao número de casos novos (do desfecho) em um grupo em risco durante um período específico de tempo (período de observação). • Pode ser expressa de duas formas Incidência cumulativa (proporção) Densidade de incidência (taxa verdadeira) Incidência cumulativa (IC) • Definição: IC é a proporção de pessoas em um grupo definido (em risco) que desenvolveram o desfecho durante o período de observação. O período sempre deve ser referido nos relatórios (p.e. semanal, mensal, anual). • A IC é usada para medir/estimar o risco (probabilidade) de um indivíduo sem o desfecho vir a desenvolvê-lo durante o período de observação. Incidência cumulativa (IC) • Para o cálculo da IC é assumido que todos os indivíduos são seguidos até manifestarem o desfecho ou até o final do período de observação. observação de período do início no risco em indivíduos de total número observação de período o durante novos casos de número IC Prevalência/Incidência cumulativa: Representação esquemática caso 1 caso 2 caso 3 caso 5caso 6 caso 7 caso 8 caso 9 caso 10 caso 4 1º Jan n=100 31 Dez Densidade de Incidência (ID) • Definição: Refere-se a taxa de surgimento de novos casos de doença por unidade de tempo. • O termo “densidade” é utilizado pois a ocorrência dos casos depende do número de indivíduos em risco e o tempo de observação de cada um. • Apresenta relação com o conceito de velocidade. Densidade de Incidência (ID) • Os indivíduos estudados são acompanhados por períodos de tempo variáveis, de modo semelhante às condições da vida real. • Para considerar os tempos de seguimento variáveis, o denominador da ID é pessoa- tempo em risco, ou seja, o tempo total que cada pessoa ficou no estudo sem apresentar o desfecho (tempo livre de desfecho). Densidade de Incidência (ID) • Pessoa-tempo é freqüentemente denominado paciente-tempo e pode ser expresso em diversas unidades de tempo (paciente-dia, paciente-mês, paciente-ano, etc) risco em tempo-pessoas de total número observação de período o durante novos casos de número ID Escolhendo a medida descritiva • Nominal: usar freqüências e proporções (P/I). • Ordinal: freqüências e proporções, mediana e amplitude interquartil. A média e o desvio padrão também podem ser utilizados. • Quantitativa: Depende da distribuição de freqüências. – D. simétrica: média e desvio padrão – D. assimétrica: mediana e amplitude interquartil. Com n pequeno (n 1 indica risco aumentado de desfecho entre expostos e quanto maior o RR mais forte é a associação entre a exposição e o desfecho. • RR próximo de 1 indica que não há associação da exposição com o desfecho. • RRo odds é também uma medida de ocorrência de desfecho. • O odds é bastante utilizado nos EUA e no Reino Unido, para expressar a possibilidade de ocorrência de um evento, principalmente em jogos e corridas. • Em português já foi sugerida a palavra “chance” ou “chances” no lugar de odds, mas há controvérsias na tradução. Odds ratio • O que é odds? Ainda pode-se dizer que a expressão matemática para o odds é desfecho) (não eventos não (desfecho) eventos odds Odds ratio • Definição: É a razão de odds, ou seja, compara o odds de ocorrência do desfecho entre os expostos com o odds de ocorrência nos não- expostos. • Com o mesmo resultado numérico o odds ratio (OR) expressa também o odds de exposição entre os que tem o desfecho (casos) pelo odds de ocorrência nos livres de desfecho (controles). • Sua interpretação indica que o odds de desfecho entre expostos é OR vezes o odds de desfecho entre os não-expostos. • Conseqüentemente pode-se também dizer que o odds de exposição entre casos é OR vezes o odds de exposição entre os controles. dc ba odds odds OR EXPOSTOS EXPOSTOS / / Tabela de contingência 2 x 2 Desfecho Exposição Presente Ausente Total Presente a b a + b Ausente c d c + d Total a + c b + d n cb da db ca controles os entre exposição de odds casos os entre exposição de odds OR / / 50,3 60/30 40/70 EXPOSTOS EXPOSTOS odds odds OR Tabela de contingência 2 x 2 Desfecho Exposição Presente Ausente Total Presente 70 40 110 Ausente 30 60 90 Total 100 100 200 50,3 4030 6070 60/40 30/70 controles os entre exposição de odds casos os entre exposição de odds OR • OR > 1 indica odds aumentado de desfecho entre expostos e quanto maior o OR mais forte é a associação entre a exposição e o desfecho. • OR próximo de 1 indica que não há associação da exposição com o desfecho. • ORde confusão – definir desfecho e sua medida – análise e interpretação (I e RR) Estudo de coorte • Vantagens – adequado para exposições raras – bom poder para testar hipóteses – importante em estudos etiológicos e prognósticos – salienta os múltiplos desfechos de uma exposição • Desvantagens – inadequado em desfechos raros – perdas no seguimento levam a viés de seleção – demorado/elevado custo Estudo de caso-controle Comparam a freqüência de um fator de risco (ou exposição) em um grupo de casos (com determinado desfecho) com a de um grupo de controles (sem o desfecho). Ex.: pessoas com e sem câncer de pulmão e sua exposição ao fumo (controlando outras variáveis). População em risco Grupo COM desfecho (CASOS) Grupo SEM desfecho (CONTROLES) pesquisa tempo Exposição ao fator de risco Sim/Não Sim/Não Estudo de caso-controle • Envolve a comparação das características de um grupo de indivíduos com o desfecho (casos) e outro sem desfecho (controles). • O objetivo da comparação é identificar fatores que são mais (ou menos) comuns entre os casos do que entre os controles. Associação. Estudo de caso-controle Os elementos básicos são: – propósito claro – definir casos (prevalente/incidentes) – definir exposição (início, tempo, intensidade) – medir potenciais confundidores – seleção controles (hosp: div diags/com: friends) – mensuração (quest/registros/met. objetivos/blind) – análise via OR como estimador de RR Estudo de caso-controle • Vantagens – útil em doenças raras – mais barato que estudo de coorte – poder moderado para testar hipóteses – importante em estudos etiológicos – investiga os múltiplos FRs para um desfecho • Desvantagens – potencial a viés de seleção/aferição (recall) – inadequado em exposições raras – não estima incidência nem prevalência • Delineamento no qual o investigador determina a exposição, ao contrário de ocorrer naturalmente. A exposição em experimentos (ensaios clínicos) é chamada de tratamento. • Geralmente o propósito é comparar um grupo tratado e um de controles. Experimentos (seres humanos) Experimentos (seres humanos) Os elementos básicos são: – definir sujeitos (critérios i/o; consentimento) – alocação (ant/dep; controles: hist; nrand; rand) – condução/avaliação (temp seg; perdas; adesão; co-intervenções; mascaramento) – análise: preferir intenção de tratar RRR = 1-RR e NNT=1/RA Experimento Controlado Randomizado – Explanatório x “de manejo” – Eficácia x Efetividade – Condições ideais x Condições usuais – per protocol x intenção de tratar Ensaio clínico - Fases • I: voluntários para determinar a segurança e o perfil farmacocinético (n10). • II: Estudo terapêutico piloto - para demonstrar atividade e segurança em curto prazo (n20 a 40). • III: Estudo terapêutico ampliado - Avaliar risco/benefício a curto e longo prazo. Reações adversas, interções e fatores modificadores. Estudos controlados (n grande segundo hipótese). Ensaio clínico - Fases • IV: Após a comercialização, usando as características primárias da droga – vigilância pós-comercialização – explorar outras aplicações Experimento • Vantagens – grande poder para testar hipóteses (ECR) – importante em estudos terapêuticos • Desvantagens – demorado/elevado custo – perdas no seguimento levam a viés na avaliação da terapia Experimento Controlado Randomizado População definida MELHORA SEM MELHORA MELHORA SEM MELHORA RANDOMIZAÇÃO NOVO TRATAMENTO TRATAMENTO ATUAL Revisão Sistemática/Metanálise • Delineamento secundário no qual o investigador realiza uma revisão sistemática quantitativa dos achados de estudos semelhantes. Geralmente é realizado em ECR, mas pode também ser feita em estudos observacionais. • Geralmente o propósito é obter uma melhor estimativa do tamanho do efeito. Forest Plot Quando as coisas podem dar errado... Viés de publicação e publicação seletiva Viés de publicação e publicação seletiva a favor do placebo Gráfico de funil para detectar viés de publicação Gráfico de funil para detectar viés de publicação sem viés Es tu d o s m ai o re s 0 a favor da droga Lod odds ratio 1 2-2 -1 Viés de publicação e publicação seletiva a favor do placebo Gráfico de funil para detectar viés de publicação Gráfico de funil para detectar viés de publicação sem viés Es tu d o s m ai o re s 0 a favor da droga Lod odds ratio 1 2-2 -1 Metanálise • Vantagens – grande poder para resumir informação de diversos estudos – aumenta a precisão de estimativas • Desvantagem – poder sofrer de viés de publicação (publication bias) A hierarquia dos delineamentos de pesquisa • metanálise • ensaio clínico randomizado • coorte contemporânea (est. incidência) • coorte histórica • ca-co (c. incidentes - aninhado) • ca-co (c. prevalentes - aninhado) • estudo transversal/est. prevalência/est. ecológico • estudo de casos; série de casos Cross- sectional studies Erro aleatório e vieses nos estudos epidemiológicos Objetivos • Conhecer os erros mais comuns que ocorrem em estudos epidemiológicos – Erro aleatório – Erros sistemáticos: Seleção, aferição – Confusão Erros aleatórios e sistemáticos • Em estudos epidemiológicos as medidas descritivas (média, prevalência, incidência) e as medidas de associação (TEP, r, RR, OR) podem diferir de seus valores verdadeiros (parâmetros) por dois tipos de erro • aleatório • sistemático Erro aleatório • Ocorre sempre que trabalhamos com amostras. Não pode ser eliminado, mas com o delineamento de pesquisa apropriado e o tamanho amostral adequado pode ser reduzido a níveis aceitáveis dentro dos recursos disponíveis. Erro aleatório • No teste de hipótese pode-se rejeitar Ho quando esta é verdadeira (I/a) ou não rejeitá-la quando falsa (II/b). • Em estimação podemos obter valores errôneos ou imprecisos do parâmetro. Erro aleatório • O modo mais comum de reduzir o erro amostral é aumentando o tamanho amostral. • Existem fórmulas disponíveis para o tamanho amostral mínimo segundo margens de erro toleráveis, efeito a testar, nível a e b (poder estatístico do estudo) desejados. Erros sistemáticos (vieses) • Estão relacionados com a própria validade do estudo. Esta depende do delineamento utilizado e da quantidade e intensidade dos viéses. • Viéses são geralmente induzidos pelo pesquisador de forma não intencional (em algumas ocasiões o viés é altamente intencional). • Tipos: seleção, aferição e confusão Viés de seleção • Distorção no processo de inclusão (seleção) ou manutenção dos grupos a serem comparados • Problemático na montagem de estudos de caso- controle, mas pode ocorrer em estudos de coorte/ECR devido às perdas no seguimento. • Variantes: viés de referência, viés de migração, viés de seguimento (perda) Viés de seleção (exemplo) • Estudo de ca-co para avaliar o papel do fumo no Ca de pulmão. Casos: todos carcinomas de pulmão, s/exclusões Controles: pacientes do serviço de pneumologia que sofrem de afecções pulmonares não malignas Como o fumo é um fator fortemente associado com bronquite, enfisema, etc, os controles superestimam o hábito tabágico. Assim, a força da associação fica prejudicada, ou seja, subestimada. Viés de aferição • Distorção da aferição/avaliação tanto da exposição como do desfecho nos grupos a serem comparados • Ca-co: viés de re-lembrança (recall bias) • Coorte: mudança não percebida no status de exposição (migração), avaliações diferenciadas (detection bias) • ECR avaliação não cega dos desfechos Confusão • Envolve a possibilidade de uma terceira variável (fator de confusão) explicar em parte ou totalmente a relação entre um fator de risco e um desfecho. • Exemplo: Ao comparar a ocorrência de Ca de pulmão entre trabalhadores de plataformas prerolíferas de alto mar e a população em geral (já ajustado para idade) esta ocupação mostrou-se associada com o D. Entretanto, isto pode ser devido em parte (ou totalmente)a um maior consumo de cigarros entre pessoas que trabalham em plataformas. Confusão • A confusão pode ser evitada durante o delineamento do estudo ou durante a análise de dados. • Delineamento: – restrição – emparelhamento – randomização • Análise: – análise estratificada – análise multivariável (r. logística, Cox e outras). Vieses de seleção e aferição x confusão • Vieses de seleção e aferição, depois de introduzidos não podem ser remediados. O melhor a fazer é julgar de forma subjetiva o impacto na validade interna do estudo. • A confusão, uma vez identificada, pode ser manejada. O que significam e quais são os critérios de causalidade? • A busca para identificação das etiologias das doenças depende de considerações sobre – Pressupostos teórico-conceituais – Unicausalidade – Multicausalidade: combinação de fatores (biológicos, genéticos, socioeconômicos, ambientais, etc.) que interagem entre si e acabam desempenhando importante papel na gênese das doenças Consumo de chocolate e Conquista de Prêmios Nobel Chocolate Consumption, Cognitive Function, and Nobel Laureates N Engl J Med 2012; 367:1562-1564 Critérios de Hill (1965) Austin Bradford Hill (1897 – 1991) Bioestatístico/Epidemiologista e professor da famosa London School of Hygiene & Tropical Medicine. - Descobriu a relação entre fumo e Ca de Pulmão; - Participou do planejamento e condução dos primeiros estudos clínicos randomizados em medicina; - Descobriu a relação entre Rubéola na gravidez e malformação congênita; - Propôs 9 critérios (em 1965) usados até hoje para reforçar a hipótese de uma relação causa-efeito; Critérios de Hill (1965) 1. Força de Associação 2. Consistência (repetição) 3. Especificidade (introdução: causa; remoção: não ocorrência) 4. Temporalidade 5. Gradiente 6. Plausibilidade 7. Coerência (epidemiologia e lab concordam) 8. Experimentãção (ECR) 9. Analogia (mesmo efeito em fatores semelhantes) Critérios de Hill (1965) • À exceção do critério de temporalidade, nenhum outro critério de evidência epidemiológica de Hill deve ser exigido como condição sine qua non para julgar se uma associação é causal. • Quando estão presentes, servem para reforçar a hipótese de causalidade; quando isto não ocorre, não se pode descartá-la. • O uso de critérios para inferir causalidade deve ser visto como uma estratégia subjetiva para facilitar a abordagem de um problema altamente complexo. Critérios de Hill (1965) Erro aleatório e Vieses Resumo • O erro aleatório não pode ser evitado, mas pode ser exatamente quantificado. • Vieses (seleção, aferição) e confusão podem ser evitados e manejados segundo sua natureza. Testes Diagnósticos Processo diagnóstico • Incerteza da presença da doença: processo diagnóstico é imperfeito • Essa incerteza pode ser expressa em termos probabilísticos • Deve-se buscar apoio na literatura para tomada de decisões Raciocínio Probabilístico 0 100 0 100 TratarTestar NãoTratar Nem Testar Raciocínio Probabilístico 0 100 Raciocínio Probabilístico +- Critérios para avaliação de um teste diagnóstico 1) Validade 2) Resultados (utilidade) 3) Aspectos práticos 1) Validade • Houve comparação independente e mascarada (cega) em relação a um padrão-ouro? • A amostra de pacientes representa o espectro de indivíduos que serão submetidos ao teste na prática clínica? 2) Resultados • Quais as medidas de desempenho obtidas (S/E/LR...) 3) Aspectos Práticos • Custo • Funcionamento (acurácia e precisão) • Mudança no manejo (alteração probabilística) Acurácia e Precisão Acurácia • Capacidade de identificar corretamente a presença ou ausência da doença • Padrão-ouro – Indicador fiel da verdade – Melhor marcador da doença – Geralmente caro/arriscado Precisão (Reprodutibilidade) • Variabilidade Intra e Inter-observador – Coeficientes de concordância – Coeficiente de variação – Estatística Kappa • Todo teste diagnóstico é baseado na pressuposição de que indivíduos doentes e normais podem ser diferenciados pelo teste. • Existem testes baseados em escalas dicotômicas e testes baseados em escalas semi-quantitativas (p.e. escores psiquiátricos) ou quantitativas. Base teórica O desempenho diagnóstico • Para que possamos avaliar o desempenho diagnóstico de um teste primeiramente deve-se estabelecer um critério de positividade. • Em seguida é necessário que tenhamos dois grupos de pacientes: (a) um que sabidamente tenha a doença (b) um grupo sem a doença O desempenho diagnóstico • A diferenciação entre o grupo doente e o grupo controle é, geralmente, determinada por um teste ou procedimento de referência conhecido como padrão-ouro (gold standard). – limitações do padrão-ouro: técnica complexa, inviabilidade, alto custo – padrão-ouro imperfeito (p.e. cultura x PCR) Representação tabular do desempenho de um teste diagnóstico FP VP LR )( Tabela de contingência 2 x 2 Desfecho (Padrão Ouro) Teste Presente Ausente Total Positivo a b a + b Negativo c d c + d Total a + c b + d n [S] [E] VP VNFN FP )()( )( ca a D T S )()( )( db d D T E S1FN E1FP )()( )( )( ba a T D VP )()( )( )( dc d T D VP Medidas Fixas Medidas Dependentes de Prevalência VN FN LR )( Definições • S(VP) = a/(a + c), entre quem tem a doença quem tem teste positivo • E(VN) = d/(b + d), entre quem não tem a doença quem tem teste negativo • LR(+) = VP/FP, likelihood ratio(+) ou razão de verossimilhança(+): proporção de testes positivos em doentes dividida pela proporção de testes positivos em não doentes • LR() = FN/VN, likelihood ratio() ou razão de verossimilhança(): proporção de testes negativos em doentes dividida pela proporção de testes negativos em não doentes Definições • probabilidade pré-teste (ppre) = dado pela prevalência ou impressão diagnóstica • odds pré-teste (opre) = ppre / (1 ppre) • odds pós-teste (opos) = opre × LR • probabilidade pós-teste (Valor preditivo) = opos / (opos + 1) Definições Regras gerais sobre as medidas de desempenho • S (VP) – bom para rastreamento – FN – VP(-) (dep. prev.) • E (VN) – bom para confirmação – FP – VP(+) (dep. prev.) Apresentação de estimativas das medidas de desempenho • sensibilidade • especificidade • VP(+) no grupo estudado: este achado depende de prevalência Likelihood ratio Como obter estimativas dos valores preditivos em diferentes prevalências • simulação em tabelas 2 x 2 • teorema de Bayes • Nomograma (Fagan) Exemplo de simulação de tabela 2 x 2 na estimativa de valores preditivos Investigar a habilidade preditiva do teste BCPF (B cell proliferation factor) em uma população com prevalência de Ca de mama de 5%, com sensibilidade = 95% e especificidadde = 85%. Tabela de contingência 2 x 2 Câncer de mama BCPF Presente Ausente Total Positivo 304 Negativo 1296 Total 80 1520 1600 76 12924 228 Qual a probabilidade de D em uma mulher com T(+)? VP(+) = 76/304 =0,25 ou 25% Qual a probabilidade de D em uma mulher com T(-)? 1 VP(-) = 4/1296 = 0,003 ou 0,3% Teorema de Bayes • No teorema de Bayes o que se faz é multiplicar a probabilidade pré (expressa em odds) pelo LR, obtendo-se assim a probabilidade pós (odds probabilidade). Esta probabilidade pós chama-se também valor preditivo. O maior problema para o uso prático são os cálculos envolvidos e a transformação de odds em proporção e vice-versa. FP VP LR )( VN FN LR )( LRodds(pré)odds(pós) p p odds 11 odds odds p Thomas Bayes 1702 - 1761 Atualmente o teorema de Bayes é de longe o método mais utilizado para o cálculo de valores preditivos, mas com o auxílio de computadores. http://www-history.mcs.st-andrews.ac.uk/PictDisplay/Bayes.html Qual a probabilidade de D em uma mulher com T(+)? ppre = 0,05 opre = ppre / (1 ppre) = 0,05 / 0,95 = 0,0526 opos = opre × LR(+) = 0,0526 × (0,95/0,15)= 0,3331 ppos = opos / (opos + 1) = 0,3331 / (0,3331 + 1) = 0,2499 O ppos é o VP(+) = 0,2499 ou 25% Qual a probabilidade de D em uma mulher com T()? ppre = 0,05 opre = ppre / (1 ppre) = 0,05 / 0,95 = 0,0526 opos = opre × LR() = 0,0526 × (0,05/0,85) = 0,0031 ppos = opos / (opos + 1) = 0,0031 / (0,0031 + 1) 0,0031 O ppos é o 1 VP() = 0,0031 ou 0,3% Resolução do exemplo de BCPF pelo teorema de Bayes LR(+) = 6,33 LR() = 0,0588 Nomograma • Há uma maneira mais fácil de manipular todos esses cálculos, utilizando-se um nomograma. • Cálculo da probabilidade pós-teste com o nomograma Fagan TJ. Nomogram for Bayes' theorem. NEJM 1975; 293(5): 257 Bcpf Bcpf + 1 VP(+) = 0,3% VP(+) = 25% Resolução do exemplo de BCPF com o nomograma Qual a probabilidade de D em uma mulher com T(+)? Qual a probabilidade de D em uma mulher com T()? Força relativa dos LRs LR + Interpretação 10 1,5) indica afastamento e, conseqüentemente, observação pouco comum. x z Escore z x z Qual a proporção de indivíduos com altura acima de 175 cm? 50 10 170175 z , h(z=0,5)=0,1915 (na tabela de z) prop.(x>175)=0,5-0,1915=0,3085 ou 30,9% 175cm 0,3085 0,1915 Distribuição Amostral de Médias • É uma distribuição normal formada por todas as médias de amostras de tamanho “n” possíveis de serem extraídas de uma população • cada média é uma estimativa de • a média de todas as médias amostrais é • o desvio padrão da DAM (chamado de erro padrão) é uma medida de o quanto as médias são precisas ao estimarem x erro padrão média n x • O teorema do limite central forma a base teórica para a DAM Avaliação de desvio • A avaliação da distância (desvio) de uma média de amostra em relação à média de uma população é um procedimento clássico no arsenal estatístico e forma a base do procedimento conhecido como teste de hipótese Avaliação de desvio • a=0,05 • za=1,96 • Hipótese nula • Hipótese alternativa • valor P O teste de hipótese • É o procedimento clássico nas comparações em estatística. Quando dois grupos ou mais de indivíduos serão comparados geralmente realiza- se um teste de hipótese. O teste de hipótese • Hipótese nula (Ho): parte da igualdade (p.e. a=b) • fixa-se o a (geralmente 0,05 ou 5%) • busca-se o valor crítico segundo o teste a ser utilizado (p.e. za=1,96) • realiza-se o teste estatístico (p.e. zcalc) • pode-se obter o valor P referente ao teste executado • compara-se o valor calculado com o valor crítico e rejeita-se ou não a Ho. Os elementos básicos do teste de hipótese são: Teste de hipótese Dados populacionais PAS: = 128mmHg e = 24mmHg • Ho: o = m • Ha: o m • a = 0,05; za = 1,96 x x z 262 13 07 60 24 128135 z , , , Como |zcalc| = 2,26 > zcalc = 1,96, rejeita-se Ho. A média amostral difere siginificativamente do parâmetro de referência (P=0,024). Amostra (usando M) média = 135mmHg; n = 60. Erros de decisão do tipo I e II (e respectivas probabilidades) Verdade Ho Falsa Ho Verdadeira Rejeita Ho Correto (P = 1- ) poder do teste Erro tipo II (P = ) Ñ Rejeita Ho Correto (P = 1 - a) Erro tipo I (P = a) Poder deum teste • Poder de um teste (1): probabilidade de detectar uma diferença (ou um efeito) que realmente existe. • Utilizado para calcular que tamanho devem ter as amostras para se encontrar um efeito estatisticamente significante, caso exista este efeito. • Quanto maior o poder desejado, maior deve ser o tamanho da amostra. Obtendo-se o valor P zcalc = 2,26 Procurando-se na tabela de valor críticos de z obtém-se que para este valor a área central é 0,4881. 0,4881 área caudal = 0,5 - 0,4881= 0,0119 P = 0,0119 x 2 = 0,0238 0,024zcalc = 2,26 Resumo • Parâmetro população • Estimativa amostra • Curva normal modelo fundamental • Ao apresentar resultados de estudos (amostras) devemos sempre que possível expressar a incerteza dos achados (p.e., IC95%) Resumo • Quanto maior o escore z de um evento, maior o desvio e menor a probabilidade de sua ocorrência na população de referência. • Teste de hipótese: avalia a Ho. O valor P representa a probabilidade de observarmos um dado/evento quando a hipótese nula é verdadeira Resumo • Um achado estatisticamente significativo não representa obrigatoriamente algo importante, mas simplesmente que foi rejeitada a existência de um efeito zero. Elementos básicos de inferência estatística Comparação de grupos e intervalos de confiança Objetivos • Apresentar os testes estatísticos mais corriqueiros – t de Student – r de Pearson – b, regressão – análise de proporções (IC) – 2 Teste t de Student • Como o s é desconhecido, este é substituído pelo DP amostral ficando o erro padrão expresso por n DP EP Teste t de Student • A confiabilidade de DP como um bom estimador de s depende essencialmente do n (usa-se o gl=n-1) • Ao usarmos o t de Student o valor crítico za é substituído por um valor ajustável e que muda não só pelo a, mas também pelo tamanho amostral: ta;gl Teste t de Student • Caso de uma média amostral – teste contra uma média populacional – intervalo de confiança para m EP x t EPtxμIC α;gl W.S. Gosset era formado em química e trabalhou como pesquisador da cervejaria Guinness (Dublin, Irlanda) durante quase toda sua vida. Com o auxílio do notável Prof. Karl Pearson, Student escreveu sobre “o provável erro da média” e inventou o famoso teste t, o qual é utilizado até hoje para analisar amostras com n pequeno. William Sealey Gosset (Student) 1876, Canterbury, Inglaterra 1937, Beaconsfield, Inglaterra O pai do teste t A distribuição t • Tem forma de sino como a normal, mas é mais achatada. • Quanto maior a amostra, mais próxima da curva normal é a curva t, porque quanto maior a amostra, melhor s estima . • Valores críticos: obtidos da tabela conforme a e o tamanho da amostra (gl = n – 1). Valor tabelado: t a ; gl Teste de hipóteses com desconhecido: teste t Pessoas saudáveis Dados populacionais = 6,1 = ?? • Ho: pac = saudáveis = 6,1 • Ha: pac saudáveis • a = 0,05 • ta;gl = t0,05;14 = 2,145 EP x t n s EP Pacientes com a doença D: Amostra: n = 15; média = 6,5; s = 0,5 Título de anticorpos anti-A em pacientes com a doença D: difere do título nos indivíduos saudáveis? 083 130 40 15 50 1656 , , , , ,, n s x t Como |tcalc| = 3,08 > t0,05;14 = 2,145, rejeita-se Ho. A média amostral (média = 6,5) difere significativamente do parâmetro de referência ( = 6,1). Os pacientes com a doença D apresentam título de anti-A mais alto do que os indivíduos saudáveis. Teste de hipóteses com desconhecido 2,145 3,08t0,05;14 m = ? s = ? média= 6,5 n = 15 s = 0,5 Estimando a média populacional desconhecida: intervalo de confiança para a média População de pacientes com D: qual o título verdadeiro de anti-A? Amostra de 15 pacientes Estimação: - por ponto - por intervalo EPtx gl a; ˆ Li = 6,5 ( 2,145 0,13) = 6,22 Intervalo de 95% confiança para a média Ls = 6,5 + (2,145 0,13) = 6,78 então, IC 95% (): 6,2 a 6,8 t 0,05;14 = 2,145 EP = 0,13 ME = 0,28 Margem de erro ou erro de estimação Teste t para duas amostras independentes Dados de PAS (mmHg) 1(obesos): 150,611,1; n=13 0(não obesos): 140,910,1; n=14 • Ho: A = B • Ha: A B • a = 0,05; • gl=nA+nB-2=25 • ta;gl = t0,05;25 = 2,060 Para avaliar a relação entre obesidade e PAS foram estudados 27 indivíduos: 13 obesos (IMC ≥ 30 Kg/m2) 14 não obesos (IMC t0,05;25 = 2,060, rejeita-se Ho. As médias das duas amostras diferem significativamente entre si, sendo maior a PAS entre os obesos (P=0,025). Esta conclusão é só o resultado de um teste de significância estatística (contra zero). Não se refere à importância clínica, magnitude do efeito ou se o mesmo é válido (questionar métodos do estudo e potenciais fatores de confusão). difglBA EPtxx a; ˆ Li = 9,76 2,060 4,08 = 1,36 Intervalo de confiança da diferença de médias Ls = 9,76 + 2,060 4,08 = 18,17 IC95%(): 1,4 a 18,3 mm(Hg) Pressupostos para o teste t entre duas amostras • x normal ou aproximada. Na falha desse pressuposto é possível lançar mão de transformações matemáticas que ajudam a diminuir a assimetria e melhoram o desempenho do teste. Transformações: log é a mais usada (outras: 1/x, quadrado e raiz quadrada). A transformação rank quando usada faz com que os testes paramétricos tenham um desempenho semelhante aos não-paramétricos. • variâncias homogêneas (Levene; t de Welch – “not pooled variances”) Teste t de Student • Caso de duas médias emparelhadas – mesmo procedimento do caso de uma média EP x t EPtxμIC α;gl Efeito de variáveis externas na comparação de grupos • Ao compararmos as médias de dois grupos outras variáveis podem influenciar os resultados. • As variáveis que comprometem as comparações são freqüentemente denominadas variáveis de confusão. Exemplo de efeito de confusão PAS Obesidade Idade Controle de confusão no delineamento do estudo • Randomização • Restrição: critérios de inclusão/exclusão • Emparelhamento média DP t de Student: amostras emparelhadas P idade: 0,44 P PAS (empar): 0,59 n = 9 pares PAS (mmHg) Teste de t em amostras emparelhadas Amostra dif média = 0,7 DP = 3,6 GL = n - 1 • Ho: o = 0 • Ha: o 0 • a = 0,05; • ta;gl = t0,05;8 = 2,306 EP x t n s EP EP x t 56,0 202,1 67,0 9 61,3 67,0 t Como |tcalc| = 0,56quantitativas Correlação e Regressão • No caso de duas variáveis quantitativas as estatísticas mais usadas são o coeficiente de correlação de Pearson (r) e a técnica de regressão linear simples. Correlação linear Karl Pearson 1857, Londres, Inglaterra 1936, Londres, Inglaterra O desenvolvimento da correlação linear recebeu uma importante contribuição a partir de 1893 com os estudos de Karl Pearson. Pearson formou-se em matemática em Cambridge, 1879 e atuou como professor de Matemática Aplicada no University College, London durante a maior parte do tempo de sua carreira acadêmica. Correlação linear n y y n x x n yx xy r 2 2 2 2 0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 0.0 0.2 0.4 0.6 0.8 1.0 1.2 Gráficos de dispersão de pontos r = 0,76 r = 0,42 r = - 0,82r = 0 relação não linear Teste t de Student para o coeficiente de correlação Dados da amostra r = 0,58 e n=8 • Ho: r = 0 • Ha: r 0 • a = 0,05 • gl=nº de pares-2=6 • ta;gl = t0,05;6 = 2,447 Estudo (horas) 0 1 2 3 4 5 6 7 8 9 N o ta n a p ro va 0 1 2 3 4 5 6 7 8 9 10 2n r1 r EP r t 2 r Como |tcalc| = 1,74 t0,05;11 = 2,201, o “b” é significativamente diferente de zero, havendo regressão do peso sobre a altura. * É possível obter-se o IC para o b. C oeffic ientsa -69.52719.070-3.646.004 .809.111.9107.301.000 (C onstant) ALTU R A M odel 1 BStd. Error U nstandard ized C oefficients Beta Standard ized C oefficients tS ig . D ependent Variab le: PESOa. SPSS output Análise de proporções • Caso de uma proporção amostral – teste contra uma proporção populacional (via z/2) – intervalo de confiança para p Análise de proporções • Caso de uma proporção amostral – teste contra uma proporção populacional (via z/2) n PQ n Pp z 2 1 0 Análise de proporções • Caso de uma proporção amostral – intervalo de confiança para p n qp PE p )( (p)α EPzpπIC Exemplo para intervalo de confiança de proporção Dados da amostra Produção de b-lactamase em isolados de H. influenzae x(eventos)=75; n=300 p=x/n, p=75/300=0,25 Li = 0,25 1,96 0,025 = 0,30 Ls = 0,25 + 1,96 0,025 = 0,20 IC95%(): 0,2 a 0,3 ou 25% (IC95%: 20 a 30) Exemplo para intervalo de confiança de proporção )( pEPzpIC a Análise de proporções • Caso de duas proporções – teste de uma proporção contra a outra (via z, 2, RR,OR). ba ba nn qp Cpp z 11 00 nbna C 11 5,0 ba ba nn xx p 0 A estatística qui-quadrado (2) foi criada por Karl Pearson para: • Verificar se uma distribuição observada de dados se ajusta a uma distribuição teórica. • Comparar as proporções de duas ou mais populações. • Verificar se existe associação entre variáveis categóricas. Qui-Quadrado • 2 calculado: mede discrepância entre freqüências observadas (O) e freqüências esperadas segundo determinada lei (E). • 2: valor entre 0 e infinito. • Como saber se diferenças entre O e E podem ser aleatórias? • Compara-se 2 calculado com valor tabelado, conforme a e gl. A distribuição 2 Principais usos • Adequação de ajuste (Goodness of fit) • Associação entre variáveis categóricas Procedimento do 2 • Depende da aplicação da fórmula • GL é determinado por categorias E EO 2 2 Valor calculado é comparado com valor de tabela segundo a distribuição e o GL 2 0,05;2 = 5,99 Não se rejeita H0 Rejeita-se H0 Valor calculado = 2,25 0 Teste de associação Tipo de Pneumopatia Eosinófilos no escarro T1 T2 T3 T4 Total Sim 142 26 32 28 228(59%) Não 55 19 41 41 156(41%) Total 197 45 73 69 384 Existe associação entre presença de eosinófilos no escarro e tipo de pneumopatia? Teste de associação • Não existe lei anterior que determine o número esperado em cada classe. • Então, supõe-se que não há diferença entre os grupos e os E são calculados por “regra de três”, o que leva a GeralTotal LinhaTotalColunaTotal E Teste de associação • Ho: O = E (supondo independência) HA: O E E )EO( 2 2 • 2 calculado = 30,44 • gl = (Linhas - 1)(Colunas -1) 2 a;gl = 2 0,001;3 = 16,27 • 2 calculado = 30,44 > 2 0,001;3 = 16,27, rej. Ho. • Freq. observadas diferem significativamente das esperadas. Existe associação entre presença de eosinófilos no escarro e tipo de pneumopatia. GeralTotal LinhaTotalColunaTotal E Teste de associação Eosinófilos Tipo de Pneumopatia no escarro T1 T2 T3 T4 Total Sim 142 26 32 28 228 Não 55 19 41 41 156 Total 197 45 73 69 384 % com eosin. 72% 58% 44% 41% 59% no escarro Exemplo Investigar se existe associação entre artropatia e história familiar positiva para essa condição. Foram estudados 114 pacientes com artropatia Casos Após entrevista 54 relataram ter parentes em 1º grau que também apresentavam queixas de artropatia Foram estudados 334 pacientes sem nenhum sintoma de artropatia Controles Após a mesma entrevista 89 relataram ter parentes em 1º grau que apresentavam queixas de artropatia Tabela de contingência 2 x 2 Artropatia História familiar Presente Ausente Total Positiva 54 (47,4) 89 (26,6) 143 Negativa 60 245 305 Total 114 334 448 Exemplo Investigar se existe associação entre artropatia e história familiar positiva para essa condição. Exemplo Investigar se existe associação entre artropatia e história familiar positiva para essa condição. 482 24589 6054 OR , / / IC95%: 1,56 a 3,94 Tabelas 2 X 2: correção de Yates Retinopatia Pacientes Sim Não C/proteinúria 33 4 S/proteinúria 23 13 E EO 2 2 )5,0( Correção de Yates: Exigências para aplicação do 2 1. gl=1: Correção de Yates 2. E