Prévia do material em texto
BIOESTATÍSTICA E EPIDEMIOLOGIA AUTOR: MARCELO WERNER C A D E R N O ESTUDO Ficha catalográfica elaborada na fonte pela Biblioteca da Faculdade Avantis Aline M. d’Oliveira CRB 14 – 1063 CDD 21ª ed. 570.151 - Bioestatística Werner, Marcelo W492b Bioestatística e epidemiologia [caderno de estudo eletrônico] / Marcelo Werner. Balneário Camboriú: Faculdade Avantis, 2017. 110 p. il. Inclui Índice ISBN: 978-85-66237-81-8 [recurso eletrônico] 1.Bioestatística. 2. Epidemiologia. I. Faculdade Avantis. II. Título. CADERNO DE ESTUDO AUTOR: MARCELO WERNER PROJETO GRÁFICO E DIAGRAMAÇÃO ANA LÚCIA DAL PIZZOL - anadiagrama@gmail.com BIOESTATÍSTICA E EPIDEMIOLOGIA SUMÁRIO AUTOR ........................................................................................ 9 APRESENTAÇÃO ..........................................................................10 UNIDADE 1 .................................................................................12 BIOESTATÍSTICA CAPÍTULO 1 1 – CONCEITOS BÁSICOS DE BIOESTATÍSTICA ...............................................................12 1.1 TIPOS DE DADOS COMUNS NAS CIÊNCIAS DA SAÚDE ..................................................................13 1.2 ERRO, ACURÁCIA, PRECISÃO E ARREDONDAMENTO ....................................................................14 1.3 COLETA DE DADOS EM POPULAÇÕES E AMOSTRAS .....................................................................15 1.4 PROBABILIDADE .........................................................................................................................18 1.4.1 Probabilidade de um evento .................................................................................................19 1.4.2 Contando os resultados possíveis ........................................................................................20 1.4.3 Multiplicando e adicionando probabilidades .........................................................................22 1.4.4 Modelos probabilísticos .......................................................................................................23 1.4.4.1 Modelos para variáveis aleatórias discretas ......................................................................24 1.4.4.2 Modelo para variáveis aleatórias contínuas .......................................................................25 1.5 CONSIDERAÇÕES FINAIS DO CAPÍTULO 1 ....................................................................................26 SUMÁRIO CAPÍTULO 2 2 BIOESTATÍSTICA DESCRITIVA ..................................................................................27 2.1 MEDIDAS DE TENDÊNCIA CENTRAL .............................................................................................27 2.1.1 Média aritmética simples ....................................................................................................28 2.1.2 Mediana ..............................................................................................................................29 2.1.3 Moda ...................................................................................................................................31 2.1.4 Ponto médio ........................................................................................................................31 2.2 MEDIDAS DE VARIAÇÃO E DISPERSÃO .........................................................................................32 2.2.1 Amplitude ............................................................................................................................33 2.2.2 Variância ..............................................................................................................................33 2.2.3 Desvio-padrão ......................................................................................................................35 2.2.4 Coeficiente de variação ........................................................................................................36 2.3 DISTRIBUIÇÃO DE FREQUÊNCIAS ...............................................................................................38 2.3.1 Representações gráficas da distribuição de frequência ........................................................40 2.4 RELAÇÕES ENTRE DUAS VARIÁVEIS .............................................................................................40 2.4.1 Regressão linear simples .....................................................................................................41 2.4.2 Correlação linear simples ....................................................................................................45 2.5 CONSIDERAÇÕES FINAIS DO CAPÍTULO 2 ....................................................................................47 CAPÍTULO 3 3 BIOESTATÍSTICA INFERENCIAL ................................................................................49 3.1 NOÇÕES DE TESTES DE HIPÓTESE ..............................................................................................49 3.2 O ESCORE PADRÃO E A ESTATÍSTICA “Z” .....................................................................................50 SUMÁRIO 3.3 TESTE “T” DE STUDENT PARA UMA AMOSTRA .............................................................................54 3.4 ANÁLISE DE VARIÂNCIA (ANOVA)..................................................................................................56 3.5 TESTE NÃO-PARAMÉTRICO PARA DUAS AMOSTRAS: MANN-WHITNEY (“U”)..................................57 3.6 TESTE NÃO-PARAMÉTRICO PARA 3 OU MAIS AMOSTRAS: KRUSKAL-WALLIS (“H”) ........................60 3.7 CONSIDERAÇÕES FINAIS DO CAPÍTULO 3 ....................................................................................62 UNIDADE 2 .................................................................................64 EPIDEMIOLOGIA CAPÍTULO 4 4 – CONCEITOS BÁSICOS DE EPIDEMIOLOGIA ...............................................................64 4.1 PERSPECTIVAS HISTÓRICAS ........................................................................................................65 4.2 EVOLUÇÃO CONCEITUAL ..............................................................................................................66 4.3 DEFINIÇÕES BÁSICAS .................................................................................................................67 4.4 CONSIDERAÇÕES FINAIS DO CAPÍTULO 4 ....................................................................................68 CAPÍTULO 5 5 PROCESSO SAÚDE-DOENÇA ...................................................................................70 5.1 MODELOS EXPLICATIVOS DO PROCESSO SAÚDE-DOENÇA ..........................................................70 5.1.1 Modelo biomédico ou de medicina científica ocidental ........................................................71 5.1.2 Modelo de História Natural da Doença (HND) e prevenção ...................................................71 5.1.3 Modelo sistêmico ................................................................................................................74 5.2 CONSIDERAÇÕES FINAIS DO CAPÍTULO 5 ....................................................................................75 7BIOESTATÍSTICA E EPIDEMIOLOGIA CAPÍTULO 6 6 EPIDEMIOLOGIA DESCRITIVA ...................................................................................77 6.1 – INDICADORES DE SAÚDE COLETIVA ..........................................................................................77 6.1.1 Morbidade ...........................................................................................................................78 6.1.2 Mortalidade .........................................................................................................................82 6.2 – MEDIDAS DE ASSOCIAÇÃO .......................................................................................................84de quatro pessoas (valores supostos). Fonte: o autor. Apresentado dessa forma, podemos ver claramente que a pressão arterial sistólica aumenta com o aumento da idade. Contudo, precisamos quantificar essa relação (afinal, estamos estudando Bioestatística). Sendo assim, vamos à equação da reta da regressão linear simples: no eixo Y do gráfico (vertical) e os dados da variável independente no eixo X (horizontal). Sendo assim, Figura 4. Gráfico de dispersão de valores de pressão arterial sistólica em função da idade de quatro pessoas (valores supostos). 110 120 130 140 150 160 170 18 23 28 33 38 43 48 53 58 63 68 Pr es sã o ar te ria l s is tó lic a (e m m m H g) Idade (em anos) Pressão arterial 43BIOESTATÍSTICA E EPIDEMIOLOGIA Relembrando, “y” é a variável dependente e “x” é a variável independente. Já “a” e “b”, são calculados através das seguintes fórmulas: Concordo que o cálculo parece ser muito trabalhoso, mas vamos direto a um exemplo, que será muito esclarecedor. Vamos supor que uma fisioterapeuta acredite que haja uma relação de dependência entre as variáveis a seguir e pretenda relacionar a angulação da escoliose de três adolescentes com as horas que eles permanecem sentados por dia em frente ao computador. As medições revelaram que o adolescente Paulo fica 2 horas por dia em frente ao computador e apresentou 4º de angulação; o adolescente José fica 4 horas e apresentou 5º; por fim, o adolescente João fica 6 horas e apresentou angulação de 6º. Para começar, é ideal calcular os somatórios (lembra do símbolo ∑, não é mesmo?) antes de colocar na fórmula. A forma mais fácil de fazer isso, é preenchendo uma tabela com os dados e realizar os cálculos simples: Tabela 4. Valores supostos de horas em frente ao computador e angulação de escoliose de 3 adolescentes. Adolescentes x (horas por dia) y (angulação) x.y x2 Paulo 2 4 8 4 José 4 5 20 16 João 6 6 36 36 ∑ (soma) 12 15 64 56 Fonte: o autor. Sendo assim, já sabemos que o tamanho da amostra (n) é igual a 3 e temos os somatórios de “x” (12), “y” (15), “x.y” (64) e “x2” (56). Agora é só substituir na fórmula para calcular o “b”: 44BIOESTATÍSTICA E EPIDEMIOLOGIA Para calcularmos o “a”, precisamos, além do valor de “b”, calculado acima, os valores das médias de “y” e “x”, representados por . Para isso, vamos incluir mais uma linha na nossa tabela: Tabela 5. Valores supostos de horas em frente ao computador, angulação de escoliose e médias de 3 adolescentes. Adolescentes x (horas por dia) y (angulação) x.y x2 Paulo 2 4 8 4 José 4 5 20 16 João 6 6 36 36 ∑ (soma) 12 15 64 56 Média 4 (12/3) 5 (15/3) - - Fonte: o autor. E substituir os termos para calcular o valor de “a”: Por fim, vamos substituir os valores de “b” e “a” na equação da reta: Essa equação descreve a relação entre as variáveis independentes (horas em frente ao computador por dia) e as variáveis dependentes (angulações de escoliose em adolescentes). Além disso, é possível fazer estimações e interpolações de dados que não foram coletados. Por exemplo, quanto você esperaria que fosse a angulação da escoliose de um paciente adolescente que permanece 5 horas por dia em frente ao computador (perceba que não há esse dado na tabela)? Sabendo que essa variável é representada por “x” (pois é a variável independente), é só substituirmos na equação da reta, para encontrarmos a variável “y” (grau de angulação da escoliose): 45BIOESTATÍSTICA E EPIDEMIOLOGIA 2.4.2 Correlação linear simples Na correlação linear simples também consideramos a relação entre duas variáveis, mas nenhuma dessas variáveis apresenta dependência funcional sobre a outra. Se a relação entre variáveis não é considerada de dependência, não há variável independente ou variável dependente e devemos utilizar técnicas de correlação. O coeficiente de correlação (r) descreve a relação entre duas variáveis que estão sendo examinadas e sua fórmula é: Diferentemente da regressão, na correlação não há a necessidade de se determinar qual variável é representada por “x” ou por “y”. Da mesma forma da regressão, é bastante útil preencher a tabela, que agora deve ter uma coluna a mais em relação à tabela anterior (y2). Vamos utilizar o mesmo conjunto de dados sobre a escoliose, aplicado à regressão (dessa vez, a fisioterapeuta não considera que o tempo que os adolescentes ficam em frente ao computador influencie o grau de escoliose): Tabela 6. Valores supostos de horas em frente ao computador e angulação de escoliose de 3 adolescentes. Adolescentes x (horas por dia) y (angulação) x.y x2 y2 Paulo 2 4 8 4 16 José 4 5 20 16 25 João 6 6 36 36 36 ∑ (soma) 12 15 64 56 77 Fonte: o autor. 46BIOESTATÍSTICA E EPIDEMIOLOGIA Substituindo os termos na fórmula, temos: O coeficiente de correlação pode assumir qualquer valor entre 1 e – 1, sendo que os valores positivos indicam relação diretamente proporcional entre as variáveis, ou seja, quando o valor de uma variável aumenta, a outra também aumenta ou quando o valor de uma diminui, o valor da outra também diminui. Já os valores negativos indicam que a relação é inversamente proporcional, ou seja, quando o valor de uma variável aumenta, a outra diminui e vice-versa. Além disso, a magnitude do coeficiente reflete o grau de correlação entre duas variáveis. Podemos aplicar uma regra prática para estabelecer que: “r” entre 0 e 0,25 ou entre – 0,25 e 0, temos uma correlação pequena; “r” entre 0,25 e 0,50 ou entre – 0,50 e – 0,25, temos uma correlação fraca; “r” entre 0,50 e 0,75 ou entre – 0,75 e – 0,50, temos uma correlação moderada; “r” entre 0,75 e 0,99 ou entre – 0,99 e – 0,75, temos uma correlação forte; “r” igual a 1, temos uma correlação positiva perfeita e “r” igual a – 1, temos uma correlação negativa perfeita. Outra medida que pode descrever a relação entre duas variáveis é o coeficiente de determinação, simplesmente representado pelo quadrado do coeficiente de correlação, ou r2. Essa medida descreve quanto do total da variabilidade encontrada em uma das variáveis (“x” ou “y”) pode ser atribuída à outra variável. Você encontrará exercícios e mais exemplos no Ambiente Virtual de Aprendizagem. 47BIOESTATÍSTICA E EPIDEMIOLOGIA 2.5 CONSIDERAÇÕES FINAIS DO CAPÍTULO 2 A descrição, o resumo e a apresentação dos dados são os objetos da Bioestatística descritiva. Neste capítulo, aprendemos a calcular diversas medidas de tendência central (MTC), que indicam como nossas variáveis se distribuem ao redor do centro. A medida mais utilizada, como vimos, é a média aritmética simples. Contudo, em determinadas situações, outras MTC podem ser mais adequadas, como, por exemplo, quando não conseguimos registrar uma variável porque o instrumento de medição não possui escala suficiente; nesse caso, a mediana é a única maneira de descrevermos um conjunto de dados. Também há a possibilidade de nos depararmos com uma dificuldade para utilizar algum valor intermediário do nosso conjunto de dados; quando isso ocorrer, devemos utilizar o ponto médio, que é a média aritmética simples entre o maior e o menor valor do conjunto. Em outras situações mais restritas, a moda, que representa o valor mais frequente obtido, pode ser útil. Além de descrever a centralidade dos dados, é recomendável informar o quanto esses dados variam. Por isso, calculamos outras medidas que representam essa informação, tais como a amplitude (diferença entre o maior e o menor valor das variáveis), a variância (soma dos desvios em relação à média ao quadrado, dividido por “n” ou “n-1”; populacional e amostral, respectivamente) e o desvio-padrão (raiz quadrada da variância). Essas três medidas de dispersão (MD) são dependentes da escala dos dados que serão descritos; por isso, quando houver necessidade de comparar dispersões entre grupos de variáveis que têm escalas diferentes, devemos utilizar uma MD que seja relativa. Nesse caso, dispomos do coeficientede variação, que representa a porcentagem de dispersão e é calculado simplesmente dividindo-se o desvio-padrão pela média do conjunto de dados. Ainda estudamos uma forma bastante prática de descrever ou apresentar grandes conjuntos de dados: a distribuição de frequências, que é corresponde à divisão do conjunto em classes (cujo número é calculado através do arredondamento para cima da raiz de “n”), a determinação do intervalo de cada classe (calculado através da divisão da amplitude do conjunto de dados pelo número de classes) e a contagem de observações em cada classe. A apresentação gráfica de uma distribuição de frequências é feita através de histograma (gráfico de coluna) ou polígono de frequências (gráfico de linha). Além da apresentação de grandes conjuntos de dados e das medidas de tendência central e dispersão, também estudamos formas de descrever e quantificar a relação entre grupos de variáveis, como a regressão e a correlação linear simples. Se for possível identificar uma relação funcional entre esses grupos de dados (e.g. ingestão calórica e IMC), podemos estimar 48BIOESTATÍSTICA E EPIDEMIOLOGIA ou interpolar uma variável dependente (que sofre influência) em função da magnitude de uma variável independente (que causa influência) através da regressão. Já quando não houver essa relação e a variação dos grupos for causada por um terceiro fator (e.g. número de homicídios e quantidade de café ingerido; ambos devem aumentar devido a um terceiro fator, que é o crescimento populacional), podemos utilizar o coeficiente de correlação para determinar o grau de relação entre dois grupos de variáveis. Importante ressaltar que, tanto a distribuição de frequências, quanto a regressão e correlação, além de permitirem a descrição dos dados (motivo pelo qual se encontram no capítulo intitulado Bioestatística descritiva), também podem ser ferramentas para inferência dos dados, que será objeto do próximo capítulo. Contudo, não utilizaremos esses recursos, pois extrapolam os objetivos do nosso curso. 49BIOESTATÍSTICA E EPIDEMIOLOGIA 3 BIOESTATÍSTICA INFERENCIAL A Bioestatística inferencial representa a parte da disciplina que estuda os testes estatísticos. Esses testes possibilitam que os pesquisadores calculem estatísticas adequadas para suas amostras e façam inferências ou generalizem conclusões para a população à qual as amostras pertencem. Neste capítulo, estudaremos os principais testes estatísticos e algumas de suas aplicações. Mas antes, precisamos trabalhar alguns conceitos. 3.1 NOÇÕES DE TESTES DE HIPÓTESE O principal objetivo da análise estatística é inferir, ou tirar conclusões, sobre uma população, através do exame de uma amostra, uma vez que é quase sempre impossível medir toda a população. Para isso, convencionou-se estabelecer hipóteses estatísticas (de preferência antes da coleta dos dados, para evitar influência dos pesquisadores) e testá-las. De forma geral, temos duas hipóteses antagônicas: a hipótese nula, representada por H 0 , e a hipótese alternativa, representada por H 1 (você poderá encontrar também as notações H null e H a para descrever as hipóteses nula e alternativa, respectivamente). A hipótese nula contém a afirmação de que não há diferença estatisticamente significante entre um valor alegado para a média populacional. Por exemplo, retomando o exemplo do peso dos alunos da Faculdade, podemos estabelecer a hipótese nula de que a média é igual a 70 kg. Já a hipótese alternativa, contém a afirmação de que há diferença estatisticamente significante entre o valor a ser testado através de uma amostra e a média real da população. Nesse caso, a hipótese alternativa para o exemplo seria de que a população possui um média de peso maior, menor ou simplesmente diferente de 70 kg, o que seria testado a partir de uma ou mais amostras. Os testes estatísticos nos fornecem um valor de probabilidade, chamado “valor p” (ou, mais CAPÍTULO 3 50BIOESTATÍSTICA E EPIDEMIOLOGIA comumente, p-value), que proporciona ao pesquisador o poder de decidir se há ou não evidência para rejeitar a hipótese nula. Se a hipótese nula for rejeitada, assume-se de a hipótese alternativa é verdadeira. Nos exemplos que seguirão às explicações sobre os testes estatísticos serão incluídas hipóteses nulas e alternativa, o que facilitará a compreensão. A regra geral é: sempre que o valor calculado da estatística ultrapassar o valor crítico tabelado, a hipótese nula será rejeitada. Consequentemente, se o valor crítico for maior que o valor calculado, a hipótese nula será aceita. O AVA contém os valores críticos tabelados para todas as estatísticas utilizadas em nosso curso. Essas tabelas são dependentes do nível de confiança, que sempre será de 95% nas avaliações, exemplos e exercícios. Esse nível significa que em 95% das vezes, o pesquisador concluirá corretamente sobre a escolha da hipótese; significa também que em 5% das vezes, cometerá erro. A propósito, nas avaliações, esse valor será necessariamente informado no enunciado da questão. Importante ressaltar que, apesar de 95% ser o nível de confiança mais utilizado em estudos científicos, você pode decidir realizar na vida acadêmica ou profissional estudos mais restritivos (como, por exemplo, quando houver risco para a saúde dos envolvidos, pois não é admissível que 5% dos usuários do produto da pesquisa tenham prejuízos à saúde) ou menos restritivos. Se for o caso, não se preocupe, pois é muito fácil encontrar tabelas com outros níveis de significância em livros de estatística ou na internet. 3.2 O ESCORE PADRÃO E A ESTATÍSTICA “Z” No item 1.4.4.2, iniciamos a explicação sobre curva normal com o auxílio de um exemplo sobre o peso dos alunos desta Faculdade; vamos ser mais específicos agora. Suponha que você tenha pesado todos os alunos (vamos imaginar n = 4000), calculado a média (µ = 70 kg) e o desvio- padrão dessa população (digamos σ = 10 kg). O escore padrão, ou “Z” nos permite calcular quantos desvios-padrão a partir da média uma determinada medição se encontra. Sua fórmula é (já sabemos o significado de todos os símbolos, mas se ainda tiver dúvida, verifique no AVA): Agora vamos pegar dois alunos quaisquer que pesam 90 kg e 40 kg e calcular seus escores 51BIOESTATÍSTICA E EPIDEMIOLOGIA padrões (relembrando que µ = 70 kg e σ = 10 kg). Esses resultados nos informam que o aluno mais pesado está 2 desvios-padrão acima da média, enquanto o aluno mais leve está a 3 desvios-padrão abaixo da média. Mas o que isso significa? Vejamos algumas das proporções da Curva de Gauss (no AVA, você encontra a tabela com muitas outras proporções): o intervalo entre µ ± 1� contém 68,27% das medições; o intervalo entre µ ± 2� contém 95,44% das medições e o intervalo entre µ ± 3� contém 99,73% das medições. Figura 5. Proporções da Distribuição de Gauss. Fonte: Zar, 2010. No nosso exemplo, significa que 68,27% dos 4000 alunos têm entre 60 kg e 80 kg (µ, que é 70 kg, ± 1σ, que é 10 kg); 95,44% têm entre 50 kg e 90 kg; e 99,73% têm entre 40 kg e 100 kg. Interessante, não é? Veja como ficaria a curva normal, com a anotação do nosso aluno mais pesado: 52BIOESTATÍSTICA E EPIDEMIOLOGIA Figura 6. Proporções de uma Distribuição normal com média igual a 70 e desvio-padrão 10. Fonte: o autor. Toda a parte clara sob a curva normal representa os alunos que têm menos que 90 kg, enquanto a parte rosa representa alunos que têm mais que esse peso. Já o teste “Z” apresenta outra informação, além de quantos desvios-padrão uma determinada medição está além ou aquém da média, como ocorre com o escore padrão. Mas antes de continuarmos, precisamos compreender outro conceito: o erro padrão da média, que é a estimativa do desvio-padrão de todas as médias de tamanho “n” eventualmente retiradas de uma população. Sua fórmula é: Já a fórmula do teste “Z” é: 53BIOESTATÍSTICA E EPIDEMIOLOGIA Além disso, é importante frisarque as estatísticas “Z” e “t” (que será visto na sequência) apresentam distribuições simétricas. Sabendo disso, cabe ressaltar que o teste pode ser unilateral ou bilateral. Se optarmos por um teste unilateral, estaremos indicando que estamos verificando se a média amostral é maior ou menor que a média populacional (somente uma das duas opções). Já se optarmos pelo teste bilateral, estaremos indicando que desejamos verificar se a média amostral é diferente (pode ser maior ou menor) da média populacional. Na maioria das vezes, é preferível optar pelo teste bilateral, pois eventualmente os tratamentos podem ter efeito inesperado (e.g. aumento de flúor na água aumentar a incidência de cárie dental). Além disso, considerando a simetria dessas distribuições, qualquer valor positivo será correspondente ao mesmo valor negativo, como veremos no exemplo abaixo. Vamos ao exemplo. Imagine que o secretário de saúde do seu município afirme ter todos os dados e informe que a idade média das gestantes atendidas através do SUS é igual a 25 anos, com um desvio-padrão de 5 anos. Contudo, você deseja conduzir um estudo, pois percebe uma predominância de jovens adultas e adolescentes nos atendimentos em postos de saúde. Para isso, você determina as hipóteses nula, ou seja, a média informada pelo secretário é igual a média real da população, e alternativa, ou seja, a média informada é diferente. Em seguida, você realiza uma amostragem probabilística (conforme vimos no item 1.3) e verifica a idade de 25 gestantes. Realiza o cálculo da idade média da sua amostra, que revela o resultado de 22 anos. Agora você já tem os dados para realizar um teste estatístico, cujo resultado será: Como já vimos no item 3.1, os resultados de todos os testes estatísticos devem ser confrontados com os valores críticos, que estão nas tabelas para consulta no AVA. Para esse caso, verifica-se que o valor crítico para o nível de confiança é de –1,96. Esse valor (assim como o valor positivo 1,96) proporciona exatamente a porcentagem de 5% de ocorrer aleatoriamente no conjunto de dados. Sendo assim, qualquer valor que o ultrapasse tem probabilidade, ou p-value, menor que 5%. Considerando que nossos exemplos, avaliações e exercícios levam em conta o nível de 95%, deve-se rejeitar a hipótese nula, pois o valor calculado ultrapassa o valor crítico. 54BIOESTATÍSTICA E EPIDEMIOLOGIA 3.3 TESTE “T” DE STUDENT PARA UMA AMOSTRA O teste “t” deve ser utilizado quando não possuirmos os parâmetros populacionais (desvio- padrão “�”, por exemplo) e/ou quando o “n” amostral for muito menor que a população. Raramente um pesquisador possui os parâmetros da população, como no caso do secretário que afirmava tê-los (pelo resultado do item anterior, parece que na realidade não tinha). Isso acontece porque muitas vezes é inviável medir o conjunto completo de variáveis, seja por falta de tempo, verba para a pesquisa ou simplesmente impossibilidade prática. Por essa razão, o teste “t” é muito mais utilizado na Bioestatística que o teste “Z”. Felizmente, tudo o que aprendemos sobre o teste “Z” servirá para o teste “t”. A única diferença será o valor crítico, que pertence à tabela própria desta estatística (que, como todas as outras, encontra-se no AVA). Confira a fórmula para o cálculo de “t” para uma amostra: Vamos ao exemplo, dessa vez realizando o passo a passo de uma pesquisa quantitativa. Destaco que em nossos exemplos e avaliações, o valor da estatística crítica sempre será dado. Contudo, as tabelas estão disponíveis no AVA e, se você for procurá-los para conduzir estudos ou realizar exercícios, saiba que o tamanho da amostra influencia no seu valor. Você precisa procurar na linha indicada pelos graus de liberdade (referenciado como GL ou v), que nada mais é que o número de dados menos 1 (n – 1). Suponha que você queira descobrir se o uso de um anticoncepcional com estrógeno causa alterações de peso em mulheres, tanto para mais, quanto para menos (teste bilateral). Para isso, você mediu o peso de 4 mulheres antes e depois de dois anos de uso contínuo. As diferenças foram 6, 6, – 6 e 6 (valores positivos indicam ganho de peso; o valor negativo indica perda de peso). O valor crítico de “t” para “n” = 4 é 3,18 (conforme tabela no AVA) e, como sempre, o nível de significância é de 95%. O primeiro passo é formular as hipóteses nula e alternativa. Como já vimos, a hipótese nula é a hipótese da igualdade e a hipótese alternativa é a da diferença. Portanto, para esse caso, H o : µ = 0, ou seja, a média da população de onde esta amostra foi retirada (pesos de todas as mulheres que tomam esse tipo de anticoncepcional) é igual a zero e 55BIOESTATÍSTICA E EPIDEMIOLOGIA H 1 : µ ≠ 0, ou seja, a média pode ser maior ou menor que zero (houve alteração de peso para mais ou para menos). O próximo passo é realizar o cálculo do teste: O último passo consiste em interpretar o resultado. Considerando que o valor calculado foi igual a 1 e não ultrapassou o valor crítico, que é igual a 3,18, devemos aceitar a hipótese nula, ou seja, o anticoncepcional não altera o peso das usuárias (ainda que o peso médio daquela amostra tenha sido 3 kg maior, não significa que a população de mulheres que tomam esse anticoncepcional terá peso maior). VAMOS REFLETIR: Se a amostra fosse de 64 mulheres, como acha que seria o resultado? Pesquise e descubra a importância de amostras grandes. VOCÊ SABIA? O teste “t” também pode ser utilizado para comparar médias, mas para o propósito do nosso curso, o teste para uma amostra (que acabamos de discutir) será mais do que suficiente. 56BIOESTATÍSTICA E EPIDEMIOLOGIA 3.4 ANÁLISE DE VARIÂNCIA (ANOVA) Quando for necessária a comparação entre mais de dois grupos paramétricos (que aprendemos a realizar com os testes “t” e “Z”), a probabilidade de rejeitar incorretamente a hipótese nula aumenta. Para evitar esse aumento na probabilidade de erro, quando houver mais de dois tratamentos para serem comparados, deve-se optar pela análise de variância, ou ANOVA. Em nossos exemplos, exercícios e avaliações isso não será necessário. Além disso, o estudo da ANOVA está além dos objetivos desse nosso curso. Contudo, é importante ressaltar que situações como a descrita aqui podem ocorrer na pesquisa real. Para os propósitos dessa disciplina, será suficiente saber a característica principal da análise de variância. Este teste compara a variação entre os grupos, com a variação de ocorre dentro dos grupos. Sua fórmula resumida é: ou seja, quanto maior a proporção da variação entre um grupo, maior será o valor de F, enquanto que uma grande variação dentro de um grupo, reduzirá o valor de F. Como em qualquer teste estatístico, o aumento da estatística calculada aumenta as chances de se rejeitar a hipótese nula (pois quando comparamos com as estatísticas críticas tabeladas, há maior chance de ultrapassá- las). Veja um exemplo simples. Suponha que você seja um odontólogo tentando determinar se há diferença estatisticamente significante no escurecimento da dentina que transparece através do esmalte em indivíduos que ingerem água, suco de uva ou café. Como de praxe, a hipótese nula será a de que não há diferença no escurecimento da dentina em relação à ingestão das três bebidas, enquanto a hipótese alternativa será a de que pelo menos uma bebida causa mais escurecimento que outra. Perceba que há três grupos (água, café e suco de uva) e suponha que haja 3 medições em cada grupo. Se houver uma grande variação dentro de cada grupo, ou seja, cada medição for muito diferente de outras, é mais provável que a bebida não causa tanta diferença, mas sim outras características dos participantes do experimento. Já se for observada uma grande variação entre os três tratamentos, é mais provável que as bebidas causem o escurecimento. É essa relação, entre a variação entre grupos com a variação dentro dos grupos que a ANOVA nos fornece.57BIOESTATÍSTICA E EPIDEMIOLOGIA 3.5 TESTE NÃO-PARAMÉTRICO PARA DUAS AMOSTRAS: MANN-WHITNEY (“U”) Todos os testes estatísticos que estudamos até agora podem ser agrupados em uma categoria chamada de testes paramétricos, pois são baseados em parâmetros populacionais, tais como média, desvio-padrão etc. Porém, alguns métodos estatísticos não requerem a estimação dos parâmetros e, portanto, podem ser usados para análise de variáveis cujas distribuições não são conhecidas (por exemplo, quando não podemos verificar se os dados têm uma distribuição normal). Além disso, a maioria dos testes não-paramétrios utiliza técnicas que convertem os dados observados em posições relativas (ou rankings), o que traz a vantagem de diminuir a influência de outliers (se você esqueceu o que significa, reveja o item 1.3). Por outro lado, alguma informação sobre os dados é perdida na conversão e, quando comparado aos testes paramétricos, os testes não-paramétricos têm uma probabilidade de cometer erro ligeiramente superior). Outra consideração bastante importante: é necessária alguma experiência em análise de dados e o conhecimento de outros métodos de verificação de distribuições (que extrapola os objetivos do nosso curso) para identificar a necessidade de se utilizar um teste não-paramétrico. Mas não se preocupe; nossos exercícios, exemplos e avaliações indicarão claramente essa necessidade. Agora que já temos uma noção de estatística não-paramétrica, vamos ser mais específicos. A comparação de conjuntos de variáveis não-paramétricas é necessária para verificarmos se esses conjuntos apresentam diferença estatisticamente significante entre eles, ou a variação percebida foi apenas aleatória. Imagine, por exemplo, que você pretende descobrir se os alunos da sua sala têm alturas diferentes das alunas. Antes de mais nada, você formula as hipóteses, sendo: H0: alunos e alunas têm alturas iguais e H1: alunos e alunas têm alturas diferentes. Em seguida você realiza uma das 4 amostragens probabilísticas que você aprendeu e mede 7 alunos selecionados (cujos resultados, em centímetros, são: 190, 187, 184, 181, 180, 174 e 169) e 5 alunas selecionadas (resultados: 164, 165, 168, 173 e 178). Se você desejasse utilizar alguma técnica de estatística descritiva, poderia informar que a média dos alunos é maior que a média das alunas ou alguma informação sobre o desvio-padrão, coeficiente de variação etc. Contudo, como já dissemos, a Bioestatística inferencial (tema deste capítulo) vai além. O que queremos determinar é se, dado o nível de significância (como sempre, 95%), essas duas amostras, que chamamos genericamente de Grupo 1 e Grupo 2, vêm de populações com alturas médias diferentes ou iguais. Sendo assim, vamos às fórmulas do teste “U” (Mann-Whitney): 58BIOESTATÍSTICA E EPIDEMIOLOGIA onde n 1 é o número de dados do grupo 1 (alunos, neste caso); n 2 é o número de dados do grupo 2 (alunas) e R 1 é a soma dos rankings das variáveis do grupo 1. Para facilitar a compreensão, vamos dispor os dados em duas colunas e determinar suas quantidades de dados ou tamanhos amostrais (n): Tabela 7. Altura suposta, em centímetros, de 7 alunos e 5 alunas. Fonte: o autor. Agora falta somente a soma dos rankings do grupo 1 (R 1 ). Para isso, basta colocar o número ordinal em cada uma das medições, independentemente da amostra, começando pelo menor (se for começar pelo maior, o resultado será o mesmo). Sendo assim, o menor número de todas as 12 medições será o número 1; o segundo menor, o número 2 e assim por diante. Após colocar todos os ordinais, basta somar os que pertencem ao grupo 1 para obter o R 1 que precisamos para completar a fórmula. Vejamos como fica: 59BIOESTATÍSTICA E EPIDEMIOLOGIA Tabela 8. Altura suposta, em centímetros, de 7 alunos e 5 alunas e suas posições relativas (entre parênteses). Fonte: o autor. Finalmente, vamos calcular o U 1 e U 2 e comparar o maior deles com o U crítico, fornecido pela tabela do AVA, que é igual a 30 para esse conjunto de dados (com n 1 = 7 e n 2 = 5). Como sempre, se o valor da estatística calculada for maior que o crítico, rejeitamos a hipótese nula (há igualdade) e aceitamos a hipótese alternativa (há diferença). Vamos aos cálculos: Considerando que o maior número entre U 1 e U 2 é 32, devemos compará-lo com o valor de U crítico tabelado, que é 30. Sendo o U calculado maior que o crítico tabelado, rejeitamos H 0 e aceitamos H 1 , ou seja, os alunos e as alunas não têm a mesma altura, pois a diferença é estatisticamente significante. 60BIOESTATÍSTICA E EPIDEMIOLOGIA 3.6 TESTE NÃO-PARAMÉTRICO PARA 3 OU MAIS AMOSTRAS: KRUSKAL-WALLIS (“H”) O princípio do teste de Kruskal-Wallis é o mesmo da estatística “U”, pois também utilizaremos o tamanho de cada amostra, além da soma do ranking ou posições relativas. Apesar de apresentar uma fórmula diferente, todas as considerações a respeito das características de um conjunto de dados não-paramétricos feitas no item anterior, continuam válidas (inclusive a informação nos exercícios, exemplos e avaliações sobre a necessidade de se utilizar um teste não-paramétrico). O teste “H” deve ser usado quando precisarmos identificar se há diferença significante entre 3 ou mais amostras, pois o teste “U” permite a comparação apenas entre 2 amostras. A fórmula do teste de Krusal-Wallis é: A fórmula parece ser uma pouco mais complicada que a anterior, mas se calcularmos o termo separadamente, facilitará muito o processo. Lembre-se que o “i” sobescrito em “R” e “n” representa o número de grupos que devem ser comparados. Vamos supor que desejamos comparar três ou quatro grupos. Nesses casos, os termos ficariam assim, respectivamente: Mais fácil, não é mesmo? Agora vamos a um exemplo. Imagine que você queira determinar se há diferença estatisticamente significante entre o índice de massa corporal (IMC) de três grupos de 5 mulheres cada, selecionadas aleatoriamente nas cidades de Balneário Camboriú, Itajaí e Camboriú. Como você já deve saber, vamos iniciar formulando as hipóteses. H 0 : mulheres têm o mesmo IMC nas três cidades e H 1 : em pelo menos uma das três cidades as mulheres têm IMC diferente. Agora, apresentamos os dados, juntamente com seus tamanhos amostrais (n) e rankings em parênteses, assim como fizemos no item anterior: 61BIOESTATÍSTICA E EPIDEMIOLOGIA Tabela 9. IMC suposto de 15 mulheres e suas posições relativas (entre parênteses). Fonte: o autor. Antes de realizarmos o cálculo final, valor calcular separadamente a expressão : Finalmente, podemos substituir na fórmula: Considerando que o valor crítico de “H” para 3 grupos de 5 variáveis cada é igual 5,78 (tabela no AVA), rejeitamos a hipótese nula, pois o “H” calculado ultrapassou o “H” crítico. Portanto, pelo menos em uma das 3 cidades, as mulheres apresentam um IMC maior e a diferença não foi aleatória. Sempre que isso acontece, cabe ao pesquisador explicar essa diferença na conclusão ou considerações finais do seu trabalho. Agora que já conhecemos os procedimentos para o cálculo de dois testes estatísticos não- paramétricos, gostaria de acrescentar uma informação que não será necessária em nossas avaliações (para evitar o aumento da complexidade em assuntos tão pouco discutidos ao longo da nossa educação formal), mas que pode aparecer em sua pesquisa na prática. Trata-se da possibilidade de nos depararmos com valores iguais entre as variáveis. Quando isso ocorrer, para calcularmos o ranking, devemos fazer a média aritmética simples das posições e atribuir o valor aos valores repetidos. Por exemplo, se tivermos os valores 13, 15, 15 e 17, os rankings, entre parênteses, ficariam: 13 (1); 15 (2,5 – que é a média entre as posições 2 e 3); 15 (2,5); 17 (4). 62BIOESTATÍSTICA E EPIDEMIOLOGIA Você encontrará exercícios e mais exemplos no Ambiente Virtual de Aprendizagem. 3.7 CONSIDERAÇÕES FINAIS DO CAPÍTULO 3 A Bioestatísticainferencial é representada por diversos testes estatísticos que possibilitam ao pesquisador confirmar ou refutar hipóteses sobre populações, a partir de amostras. Neste capítulo, entramos em contato com os testes de hipótese e agora já podemos usá-los para aceitar ou rejeitar hipóteses, que devem ser formuladas preferencialmente antes da coleta dos dados. Aprendemos que a hipótese nula (H 0 ) representa a igualdade (e.g. a altura média de um grupo não é diferente da altura média do outro grupo), enquanto a hipótese alternativa (H 1 ) representa a diferença (e.g. a altura média de um grupo é maior/menor que a altura média do outro). Já os cálculos dos testes estatísticos com os quais nos deparamos neste capítulo fornecerão os valores que serão comparados com os valores críticos (tabelados) e sempre que esses valores calculados forem maiores que os valores críticos, devemos rejeitar a hipótese nula (e aceitar a hipótese alternativa), ou seja, podemos afirmar que há diferença estatisticamente significante entre os grupos ou parâmetros comparados. Dividimos os testes em paramétricos (quando temos a possibilidade de comparar uma estatística amostral com um parâmetro populacional) e não-paramétricos. Entre os paramétricos, aprendemos a calcular o teste “z” e “t” de Student para uma amostra (há outras possibilidades, mas essas formas são suficientes para alcançarmos nossos objetivos), cujos resultados representam distâncias padronizadas em relação à média populacional ou média alegada. Na prática, a única diferença entre esses dois testes consiste no valor das estatísticas tabeladas. Importante frisar que só poderemos utilizar o teste “z” quando os parâmetros populacionais (e.g. desvio-padrão) forem conhecidos ou quando o “n” for grande (maior que 30). Como raramente isso ocorre, quase sempre se utilizará o teste “t” na pesquisa real. Outra observação necessária refere-se ao aumento na probabilidade de se rejeitar incorretamente a hipótese nula quando houver a necessidade de comparação entre 3 ou mais tratamentos. Para esses casos, é indicado o uso da análise de variância (ANOVA), ou estatística “F”, que compara a variação entre os tratamentos, com a variação que ocorre dentro dos tratamentos. Os 3 testes paramétricos descritos no parágrafo anterior são prioritários quando um 63BIOESTATÍSTICA E EPIDEMIOLOGIA pesquisador for escolher a estatística adequada, pois apresentam menores probabilidades de incorrer em erros em relação aos testes não-paramétricos. Contudo, algumas vezes é necessário utilizar estes últimos, pois as distribuições não são conhecidas. Em geral, os testes não- paramétricos utilizam a posição relativa das variáveis para o cálculo e, por isso, não é necessário a estimação dos parâmetros populacionais. Neste capítulo 3, aprendemos a calcular o teste não- paramétrico de Mann-Whitney, ou estatística “U”, que permite a comparação entre dois grupos, e o teste não-paramétrico de Kruskal-Wallis, para comparação entre 3 ou mais grupos. Gostaria de lembrar que em qualquer teste estatístico, sempre que o valor calculado for maior que o valor crítico (tabelado), deve-se rejeitar a hipótese nula. Além disso, como já foi citado, os valores críticos dependem da quantidade de dados e do nível de confiança escolhido para o estudo específico. Em nossos exercícios e avaliações esse nível será de 95% para todos os casos e os valores críticos sempre serão fornecidos. Chegamos ao fim da Bioestatística e nos próximos 4 capítulos, estudaremos temas relacionados à Epidemiologia. 64BIOESTATÍSTICA E EPIDEMIOLOGIA EPIDEMIOLOGIA 4 – CONCEITOS BÁSICOS DE EPIDEMIOLOGIA A Epidemiologia é a ciência básica da saúde pública, que utiliza os métodos da Bioestatística, que aprendemos na Unidade 1, para quantificar os fenômenos dos processos de saúde e doença. Por isso, cada vez mais a Epidemiologia tem se tornado uma importante fonte de informação para as Ciências da Saúde. Quanto à etimologia, a palavra deriva do grego: epi (sobre) + demos (povo) + logos (ciência), ou seja, Epidemiologia pode ser entendida como a ciência que estuda o que acontece com uma população. Agora que sabemos a origem da palavra e a utilidade de ciência, vamos a uma definição mais completa. A Associação Internacional de Epidemiologia (IEA), em seu Guia de Métodos de Ensino, define essa ciência como sendo “o estudo dos fatores que determinam a frequência e a distribuição das doenças nas coletividades humanas” (ALMEIDA FILHO; ROUQUAYROL, 2013, p. 4). A definição pode ser ampliada, diferenciando a atenção individual da coletiva: “... enquanto a clínica dedica-se ao estudo da doença no indivíduo, analisando caso a caso, a epidemiologia debruça-se sobre os problemas de saúde em grupos de pessoas, às vezes grupos pequenos, na maioria das vezes envolvendo populações numerosas” (RODRIGUES et al., 2014, p. 9). UNIDADE 2 CAPÍTULO 4 65BIOESTATÍSTICA E EPIDEMIOLOGIA Ainda de acordo com o IEA, são três os principais objetivos da epidemiologia: I. Descrever a distribuição e a magnitude dos problemas de saúde das populações humanas. II. Proporcionar dados essenciais para o planejamento, execução e avaliação das ações de prevenção, controle e tratamento das doenças, bem como para estabelecer prioridades. III. Identificar fatores etiológicos na gênese das enfermidades. 4.1 PERSPECTIVAS HISTÓRICAS Hipócrates (460 a.C - 377 a.C), considerado o pai da medicina científica, foi o primeiro a sugerir que as causas das doenças não eram intrínsecas à pessoa nem aos desígnios divinos, mas que estava relacionada a certas características ambientais. Embora as causas relatadas por Hipócrates tenham sido superadas, ele lançou as bases para a procura da causalidade das doenças e agravos à saúde, norte principal da epidemiologia até hoje. Hipócrates, em Tratado dos ares, das águas e dos lugares (século V a.C.), coloca os termos epidêmico e endêmico, derivados de epidemion (verbo que significa visitar, referindo-se às enfermidades que visitam) e endemion (residir, referindo-se às enfermidades que permanecem na comunidade). Ele sugeriu neste trabalho que condições, tais como o clima de uma região, a água ou sua situação num lugar em que os ventos sejam favoráveis são elementos que podem ajudar o médico a avaliar a saúde geral de seus habitantes. Em outra obra, Tratado do prognóstico e aforismos, ele trouxe a ideia, então revolucionária, de que o médico poderia predizer a evolução de uma doença mediante a observação de um número suficiente de casos. Essa também é, até hoje, uma das principais características da epidemiologia e da demografia. Infelizmente, os herdeiros de Hipócrates deixaram de lado o espírito coletivo de sua medicina. Além disso, na Idade Média, houve o declínio científico nas Ciências da Saúde, que se preocupavam mais com as práticas religiosas e de magia, revelando a ideologia da época medieval (salvar a alma, mesmo que o corpo material pereça). Nos séculos dominados por essa vertente, a preocupação coletiva era revivida em momentos críticos, como as explosões de peste, pragas e outras epidemias. Ainda que tenha havido algumas manifestações de preocupação com a saúde coletiva da população, principalmente no mundo árabe (por exemplo, em Bagdá e Córdoba, no século X), 66BIOESTATÍSTICA E EPIDEMIOLOGIA somente no século XVII teremos contato com uma publicação que tratou de assuntos tipicamente epidemiológicos. Trata-se de um trabalho do inglês John Graunt, em 1662, publicado em Londres, sobre as observações a respeito das estatísticas de mortalidade, no qual analisou nascimentos e óbitos semanais, quantificou o padrão de doença na população londrina e apontou características importantes nesses eventos, tais como: diferenças entre homens e mulheres, entre população urbana e rural, elevada mortalidade infantil e variações sazonais. Graunt também é considerado um dos precursores da epidemiologiae da demografia como disciplinas, já que criou as bases para a observação da distribuição de frequência de dados populacionais de mortalidade coletados rotineiramente (a propósito, como vimos na Unidade 1, é uma forma adequada de descrever grandes quantidades de dados, lembra?) Outro inglês, John Snow, é pioneiro na procura sistemática dos determinantes das epidemias. Seu ensaio sobre a maneira de transmissão da cólera, publicado em 1855, apresenta estudos a respeito das epidemias da doença ocorridas em Londres em 1849 e 1854. Suas anotações sistemáticas sobre os casos levaram a desenvolver a ideia de que a epidemia da cólera era ocasionada por parasitas invisíveis e não por miasmas, como se pensava na época. Ele elaborou hipóteses sobre a qualidade da água como meio principal de contágio. 4.2 EVOLUÇÃO CONCEITUAL A partir das primeiras décadas do século XX, com a melhoria do nível de vida nos países desenvolvidos e com o consequente declínio na incidência das doenças infecciosas, outras enfermidades de caráter não-transmissível (doenças cardiovasculares, câncer e outras) passaram a ser incluídas entre os objetos de estudos epidemiológicos. Além disso, pesquisas mais recentes, sobretudo as que utilizam o método de estratificação social, enriqueceram esse campo da ciência, ensejando novos debates. No entanto, é a partir do final da Segunda Guerra Mundial que assistimos ao intenso desenvolvimento da metodologia epidemiológica, com a ampla incorporação da estatística, propiciada em boa parte pelo aparecimento dos computadores. A aplicação da epidemiologia passa a cobrir um largo espectro de agravos à saúde. Os estudos de Doll e Hill (1954), estabelecendo associação entre o tabagismo e o câncer de pulmão, e os estudos de doenças cardiovasculares desenvolvidas na população da cidade de Framingham, Estados Unidos, são dois exemplos Miasmas: supostos gases de animais e dejetos em decomposição que transmitem doenças 67BIOESTATÍSTICA E EPIDEMIOLOGIA da aplicação do método epidemiológico em doenças crônicas que são importantes marcos na Epidemiologia. Hoje a Epidemiologia constitui importante instrumento para a pesquisa na área da saúde, seja no campo da clínica, seja no da saúde pública. No Brasil, a organização dos serviços do Sistema Único de Saúde (SUS) baseia-se na descentralização sendo, portanto, indispensável o conhecimento da epidemiologia nos serviços locais de saúde. Essas novas metodologias e concepções ampliaram ainda mais o espectro de atuação da ciência epidemiológica, que inclui além dos agravos à saúde, as condições que promovem a prevenção. Também passaram a ser objeto de estudo epidemiológico causas externas, como acidentes de trânsito e outras doenças difusas, tais como obesidade e cárie. 4.3 DEFINIÇÕES BÁSICAS Algumas definições, com as quais não estamos familiarizados no dia a dia, são essenciais para a compreensão da lógica epidemiológica. Por isso, trabalharemos nesse item alguns conceitos que serão úteis no estudo da Epidemiologia, principalmente quando for necessário descrever eventos de morbidade e mortalidade. Primeiramente, vamos conceituar saúde e doença. Pode parecer óbvio a você o que significa saúde. Contudo, quando é preciso expressar em palavras, algumas pessoas têm dificuldade em definir adequadamente esse termo. A Organização Mundial da Saúde (OMS) define saúde como sendo “um estado de completo bem-estar físico, mental e social, e não apenas a ausência de doença ou enfermidade” (RODRIGUES et al., p. 10). Já doença, sob essa mesma perspectiva pode ser descrita como desajuste ou falha nos mecanismos de adaptação do organismo ou uma ausência de reação aos estímulos a cuja ação está exposto, desencadeando um processo que conduz a uma perturbação da estrutura ou da função de um órgão, de um sistema ou de todo um organismo ou de suas funções vitais. Essas abordagens são bastante simplistas, pois a percepção de saúde ou doença é subjetiva e varia de acordo com as características do indivíduo. No âmbito do Sistema Único de Saúde (SUS), uma definição mais abrangente, defendida por muitos autores, inclui os planos biológicos (alteração de função orgânica), individual (condição geral de saúde) e coletivo (fenômeno clínico e social dependente de vários fatores, inclusive extrínsecos ao indivíduo como, por exemplo, local de moradia). Por outro lado, doença é a falta ou perturbação da saúde, moléstia, mal ou enfermidade e pode Morbidade: relativo a doenças Mortalidade: relativo a mortes 68BIOESTATÍSTICA E EPIDEMIOLOGIA ser classificada de várias maneiras. Quanto à forma, as doenças podem ser manifestas ou clínicas (apresentam sinais e/ou sintomas), subclínica (aquela em que o indivíduo que não apresenta nenhum sinal ou sintoma e somente é revelada através de exames complementares), abortiva (desaparece rapidamente após poucos sinais ou sintomas) e fulminante (leva rapidamente a óbito). Quanto à transmissibilidade, podem ser transmissíveis ou infecciosas (causada por transmissão de um agente patogênico para um hospedeiro suscetível) ou não-transmissíveis (todas as que não resultam de infecção, como por exemplo, diabetes). Por fim, quando à duração, as doenças podem ser agudas (curta duração) ou crônicas (longa duração). Outro conceito importante em Epidemiologia é aquele relacionado à delimitação da distribuição das doenças ou mortes em intervalos definidos. Para compreendermos melhor como os agravos à saúde se distribuem, precisamos saber diferenciar prevalência de incidência. Prevalência é a medida que descreve a quantidade de doença verificada em determinado momento, ou seja, o número de casos totais dessa doença em uma população. Já incidência representa a quantidade de casos de uma doença em um intervalo de tempo, ou seja, o número de casos novos em uma população. Por exemplo, suponha que em nossa cidade, o número total de pessoas com câncer de boca, no último dia 31 de dezembro seja igual a 80; destes, 20 foram diagnosticados no ano passado. Sendo assim, a prevalência de câncer de boca em Balneário Camboriú é de 80, enquanto a incidência no ano passado foi de 20. 4.4 CONSIDERAÇÕES FINAIS DO CAPÍTULO 4 Após o estudo desse capítulo, estamos aptos a conceituar Epidemiologia, que é a ciência básica da saúde pública, e cujos objetivos são: determinar a distribuição espacial e temporal das doenças entre as populações, identificar as causas dessas doenças e proporcionar informação para ações de promoção, prevenção e recuperação da saúde. Sob a perspectiva histórica, vimos que Hipócrates (cinco séculos antes de Cristo) iniciou a tradição científica na medicina ao procurar causas para os agravos à saúde da população. Já no século XVII, o inglês John Graunt lançou um tratado que relacionava variáveis (como sexo, idade etc.) ao número de mortos, viabilizando os estudos de distribuição de frequências de dados populacionais, utilizados até hoje. Dois séculos mais tarde, John Snow utilizou a procura sistemática dos determinantes das epidemias (formulando a hipótese de contaminação da água para a disseminação da cólera em Londres), usada em estudos epidemiológicos na atualidade. Prevalência – nº total de casos totais Incidência – nº de casos novos 69BIOESTATÍSTICA E EPIDEMIOLOGIA Outra constatação interessante foi a de que, na época dos pioneiros da Epidemiologia, as doenças transmissíveis constituíam o único objeto de estudo dessa ciência. Contudo, principalmente após a Segunda Guerra Mundial, a evolução da tecnologia permitiu a ampliação da investigação epidemiológica, ao mesmo tempo em que a prevalência de doenças infecciosas diminuiu drasticamente, em função da disseminação de antibióticos e vacinação. Esses fatores fizeram com que doenças não-transmissíveis e crônicas, tais com câncer e diabetes, fossem introduzidas no estudo epidemiológico. Dessa forma, a Epidemiologia se tornou um instrumentomais completo e essencial para a pesquisa na área da saúde pública e na clínica médica. Neste capítulo também entramos em contato com alguns termos utilizados com frequência na Epidemiologia, tais como medidas de mortalidade (relativas a mortes) e morbidade (relativas a doenças), além de definirmos os conceitos de saúde e doença de forma ampla, conforme entendido pela Organização Mundial da Saúde. Outra importante informação trazida pelo capítulo 4 se refere às maneiras de descrever medidas de saúde/doença em função do número de casos totais em uma população em dado momento (prevalência) e em função do número de novos casos em determinado período, em uma dada população (incidência). Conhecendo esses conceitos, podemos seguir para o estudo do processo que leva uma pessoa saudável a se tornar doente; isso será feito no próximo capítulo, no qual explicaremos o processo saúde-doença através de 3 modelos explicativos. 70BIOESTATÍSTICA E EPIDEMIOLOGIA 5 PROCESSO SAÚDE-DOENÇA Agora que já podemos definir saúde e doença, vamos estudar o caminho que leva uma pessoa saudável a se transformar em uma pessoa doente, ou vice-versa. Esse caminho será referido, a partir de agora, como sendo o processo saúde-doença, que representa o conjunto de relações e variáveis que produzem e condicionam o estado de saúde-doença de uma população, e que varia em diversos momentos históricos do desenvolvimento científico da humanidade. A Epidemiologia fornece informações e conceitos específicos para a aplicação prática do conhecimento. Essa aplicação é realizada através de modelos explicativos do processo saúde-doença, que são construções teóricas que procuram entender a realidade desse complexo processo. 5.1 MODELOS EXPLICATIVOS DO PROCESSO SAÚDE-DOENÇA Os modelos descritos a seguir constituem visões diferentes de abordar o processo de saúde e doença e não têm hierarquia entre si, ou seja, não há um melhor do que outros em todas as ocasiões. Cabe ao profissional de saúde compreender a realidade da prática cotidiana para utilizar o modelo mais adequado. Além disso, é importante frisar que iremos discutir apenas os principais modelos e não incluiremos algumas abordagens que já não se aplicam (e servem apenas à história, brevemente citada no capítulo 1), como o modelo mágico-religioso ou o empírico-racional (de Hipócrates). Por outro lado, novos modelos poderão surgir e serem mais adequados às Ciências da Saúde, dado seu estágio de desenvolvimento científico. CAPÍTULO 5 71BIOESTATÍSTICA E EPIDEMIOLOGIA 5.1.1 Modelo biomédico ou de medicina científica ocidental Os princípios teóricos do modelo biomédico atual baseiam-se na orientação científica do século XVII, da qual incorporou uma visão mecanicista e reducionista do ser humano e da natureza. Essa orientação surgiu quando filósofos como Galileu, Descartes, Newton, Bacon, entre outros, conceberam a realidade do mundo como uma máquina. Neste modelo, o conceito de doença deve ser analisado em termos estritamente biológicos. Assim, doença pode ser definida como uma falha nos mecanismos de adaptação do organismo ou ainda como sendo uma ausência de reação aos estímulos causados pela exposição. Esse processo conduz a uma perturbação da estrutura ou função de um órgão, de um sistema, organismo ou de suas funções vitais. O conceito de doença no modelo biomédico é abordado a partir de duas perspectivas. A primeira é do ponto de vista clínico, em que os problemas de saúde são classificados de acordo com a duração das alterações, disfunções e sintomas em agudos (curta duração) e crônicos (longa duração). A segunda perspectiva do modelo biomédico leva em consideração o caráter etiopatogênico do processo de adoecimento; nesse caso, as doenças são classificadas em infecciosas e não-infecciosas. A tabela a seguir resume a classificação das doenças de acordo com o modelo biomédico e traz alguns exemplos: Tabela 10. Classificação e exemplos de doenças com base na etiologia e duração Etiologia Duração Aguda Crônica Infecciosas Tétano, gripe, sarampo Tuberculose, Chagas Não-infecciosas Envenenamento, acidentes Diabetes, obesidade Fonte: o autor. 5.1.2 Modelo de História Natural da Doença (HND) e prevenção O modelo de HND, também chamado de processual, define doença como sendo um conjunto de processos ativos que criam o estímulo patológico, seguida da resposta do ser humano a Etiopatogenia: análise especializada das causas que ocasionam o desenvolvimento de certas doenças. 72BIOESTATÍSTICA E EPIDEMIOLOGIA esse estímulo e finalizando em alterações que levam ao defeito, à invalidez, à recuperação ou à morte. Esse modelo considera que a determinação do estado patológico se dá em dois domínios complementares e consecutivos: o meio externo e o meio interno. No meio externo, os fatores que contribuem para o surgimento do processo de enfermidade podem ser físicos, biológicos, sociais, políticos e culturais. Já no meio interno, ocorrem uma série de modificações progressivas de natureza fisiológica, bioquímica ou histológica, próprias de cada doença. Outra consideração importante do modelo processual (ou de HND) é a divisão da evolução do processo patológico em duas fases consecutivas, começando pelo período de pré-patogênese e continuando no período de patogênese. No primeiro, os sintomas ou manifestações patológicas ainda não apresentam sinais, enquanto no segundo essas manifestações já se encontram ativas. Os agentes que atuam no período pré-patogênico e que levam os estímulos do meio externo até o meio interno podem ser de diversas naturezas e podem estar associados, aumentando a probabilidade de que o processo resulte em doença. Seguem alguns exemplos: lagentes físicos ou químicos, como radiação ultravioleta ou mercúrio em um rio; lbiopatógenos, como parasitas, bactérias e vírus; lagentes nutricionais, como carência de vitaminas ou excesso de açúcar; lagentes genéticos, como na doença celíaca ou mutações genéticas; Além dos agentes patogênicos, há fatores que são determinantes parciais ou fatores contribuintes que aumentam ainda mais o risco do desenvolvimento da doença. São os determinantes econômicos (grande parte das doenças são mais comuns em classes mais baixas, enquanto outras são mais comuns em classes mais altas), culturais (tais como hábitos de higiene e alimentação, preconceitos e crendices), ecológicos (como desastres naturais e poluição atmosférica) e psicossociais (por exemplo, quando o sistema imunológico é suprimido devido à episódios de depressão). Já no período patogênico, o modelo de HND define que se iniciam as primeiras alterações visíveis no sujeito afetado. Essas perturbações começam no nível celular e são de origem bioquímica, que continuam e se transformam em distúrbios na forma e função de órgãos e sistemas. Apesar de já estar instalada a doença, as primeiras alterações são subclínicas, pois somente exames clínicos ou laboratoriais orientados podem detectá-las. Esses distúrbios podem evoluir para incapacitação, cronicidade, convalescença (período de recuperação), morte ou cura. A linha imaginária que divide as alterações subclínicas das alterações clínicas (quando já se pode perceber a doença diretamente) é chamado de horizonte clínico. Vamos utilizar o modelo processual para investigar uma doença específica como, por 73BIOESTATÍSTICA E EPIDEMIOLOGIA exemplo, a cárie dentária. Podemos identificar no período pré-patogênico um desequilíbrio entre ambiente (ph da saliva), hospedeiro (má higienização e alimentação) e agente (maior atividade do S.mutans). As repercussões desse desequilíbrio podem passar para o período patogênico ao originar uma mancha branca não cavitada (horizonte clínico ultrapassado, pois já é possível observar a alteração diretamente), evoluindo para uma cárie que atinge a dentina e a polpa, causando uma incapacitação. O esquema a seguir resume as fases e os possíveis desdobramentosde uma doença qualquer, de acordo com o modelo processual ou de HND. Figura 7. Fases do modelo de HND e seus possíveis desdobramentos. Fonte: LEAVELL; CLARK, 1976 (adaptado). Esse modelo tem a vantagem de considerar todo o processo de saúde-doença, promovendo atitudes e práticas em saúde que apresentam uma dimensão qualitativa, pois procura explicar e fazer valer os mais diversificados métodos de controle e prevenção das doenças e seus consequentes problemas. A partir dessa perspectiva, os níveis de prevenção e promoção de saúde tornam-se barreiras que podem ser interpostas nas diversas etapas do ciclo evolutivo da doença. O modelo de HND propõe três níveis de prevenção, a saber: prevenção primária, secundária e terciária. Na prevenção primária, que ocorre no período pré-patogênico, são trabalhadas a promoção da saúde, como a melhoria das condições sanitárias e educação e vigilância em saúde, e a proteção específica, como por exemplo o uso de flúor na água para evitar cárie ou campanhas de imunização. Na prevenção secundária, que ocorre no horizonte clínico das doenças, são preconizados o diagnóstico precoce 74BIOESTATÍSTICA E EPIDEMIOLOGIA e tratamento imediato das patologias que não foram evitadas, além da limitação do dano; como exemplo, podemos citar a remineralização do esmalte para mancha branca não cavitada, restaurações ou tratamento em fase inicial de câncer. Por fim, a prevenção terciária, que ocorre quando é necessária a reabilitação devido às sequelas, como por exemplo, quando um paciente recebe uma prótese dentária. 5.1.3 Modelo sistêmico Busca conhecer o conjunto de motivos que provoca a doença, ou seja, faz o papel de investigação, buscando amplos conhecimentos e hipóteses para o problema, além de desenvolver o conhecimento científico das doenças buscando relacionar as mais diversas razões que possam causar o problema. Para a compreensão desse modelo explicativo do processo saúde-doença, é necessário estar familiarizado com o conceito de ecossistema. Nesse sentido, ecossistema é um conjunto de sistemas de seres vivos e inanimados, onde a mudança no estado de qualquer elemento provoca mudança no estado dos demais elementos. Na concepção do modelo sistêmico, as epidemias são descritas como sendo consequência da quebra no equilíbrio do ecossistema Como esse modelo é mais abrangente, o conceito de agente é diferente daquele que estudamos no modelo biomédico. No modelo sistêmico, o conceito de agente extrapola as divisões e tanto pode ser um agente físico, químico, um gene ou biológico (nesse caso, chamamos de bioagente). Já o hospedeiro ou suscetível é aquele em que a doença se desenvolverá e terá oportunidade de se manifestar clinicamente. Segundo o modelo sistêmico, as relações entre hospedeiro e bioagente patogênico são conduzidas através de três categorias: G a resistência, que é o sistema de defesa que tenta impedir a difusão dos agentes infecciosos; pode estar associada ao estado nutricional, emocional ou genético do hospedeiro e é resultado de fatores permanentes ou temporários; G a suscetibilidade, considerada no nível da espécie; por exemplo, a espécie humana é suscetível à penetração de larvas de ancilostomídeos, mas há indivíduos que são resistentes (nesse caso, principalmente negros); G a imunidade, que é um tipo específico de resistência associada a anticorpos que possuem ação específica sobre determinados micro-organismos. Além do agente e do suscetível, o modelo sistêmico também inclui o ambiente, considerado 75BIOESTATÍSTICA E EPIDEMIOLOGIA de forma ampla, onde a situação geográfica, a temperatura, os poluentes, o aspecto social, entre tantas outras variáveis confluem para determinar a ocorrência da enfermidade ou a manutenção da saúde. Esses três elementos formam o sistema epidemiológico em equilíbrio dinâmico, que define a estrutura geral de um problema de saúde. Um sistema epidemiológico formado por agente, suscetível e ambiente é dotado de organização interna que regula as interações determinantes da produção da doença. 5.2 CONSIDERAÇÕES FINAIS DO CAPÍTULO 5 Neste capítulo, estudamos as inter-relações e as variáveis que dirigem o processo de saúde e doença em uma população através de modelos, que são teorias utilizadas para explicar a complexa transformação de um indivíduo saudável em doente. Essas construções teóricas representam diferentes interpretações, que podem ser alteradas em função do desenvolvimento da ciência, da época, da cultura etc., sem que sejam necessariamente hierárquicas entre si. O modelo biomédico foi primeiro visto neste capítulo e é baseado na compreensão de que a doença deve ser analisada em termos estritamente biológicos. Sob essa perspectiva, pode- se dividir os agravos à saúde de acordo com a duração das alterações, disfunções ou sintomas em agudos e crônicos, representando respectivamente curta e longa duração. Além disso, as doenças também são diferenciadas em relação às causas (etiologia) e classificados em infecciosas e não-infecciosas. As doenças infecciosas são causadas por organismos patogênicos, vetores ou veículos que o carregam ou que podem ser transmitidas por outros indivíduos contaminados, através de contato. Já não-infecciosas compõem um variado grupo de doenças derivadas de problemas genéticos, estilos de vida, traumas e acidentes, entre outros, que não envolvem agentes patogênicos. Outro modelo estudado neste capítulo foi o da história natural das doenças, que considera o estímulo patológico físico, químico, social, cultural ou biológico do meio externo como o início da doença, caracterizada pelo seu período pré-patogênico. Em seguida, ocorre a continuidade no meio interno, onde o estímulo provoca alterações histológicas, bioquímicas ou fisiológicas que resultam em defeito, invalidez, morte ou recuperação, sintomas que são visíveis e caracterizam o período patogênico da doença (limite entre as alterações subclínicas e clínicas é chamado de horizonte clínico). O modelo de história natural da doença prevê três níveis de prevenção do agravo: primário, que ocorre no período pré-patogênico, secundário, que ocorre no horizonte clínico da doença (primeiros sintomas), e terciário, que ocorre na reabilitação. 76BIOESTATÍSTICA E EPIDEMIOLOGIA Por fim, estudamos o modelo sistêmico, para o qual um desequilíbrio entre os fatores que compõem o sistema epidemiológico, composto por agente causador (ou bioagente, se for biológico), hospedeiro suscetível e ambiente, provoca alterações que podem levar à doença. Para esse modelo, as relações entre o hospedeiro e o bioagente são conduzidas através da resistência (tentativa de impedir a difusão dos agentes causadores), suscetibilidade (característica de cada espécie) e imunidade (relação dependente de anticorpos de ação específica contra determinados micro-organismos). No próximo capítulo, aprenderemos formas de descrever as condições de saúde e doença em populações através de indicadores, medidas de risco, diagnósticos e sistemas de vigilância epidemiológica. 77BIOESTATÍSTICA E EPIDEMIOLOGIA 6 EPIDEMIOLOGIA DESCRITIVA Como já vimos, a Bioestatística é uma ciência que se relaciona intimamente com a Epidemiologia, pois através de seus métodos é possível identificar padrões e diferenças significantes entre pessoas, grupos ou populações. Além das medições já estudas, dispomos de outros indicadores e medidas que são típicos da Epidemiologia, que discutiremos nesse capítulo. 6.1 – INDICADORES DE SAÚDE COLETIVA O conhecimento das condições de morbidade e mortalidade na população é essencial para a promoção de ações de prevenção e o delineamento das políticas de saúde pública. Para ter acesso a esse conhecimento é necessário medir a Saúde Coletiva, através indicadores de saúde. Esses indicadores podem ser descritos a partir de valores absolutos ou relativos. Os valores absolutos descrevem o número total de ocorrênciasde morbidade ou mortalidade. Apresentados dessa forma, esses indicadores têm a desvantagem de reduzirem a capacidade de comparação ao longo do tempo (pois o tamanho das populações oscila), bem como inviabilizam a comparação entre populações diferentes (pois podem apresentar uma quantidade muito diferente). Por outro lado, os valores absolutos são úteis para a administração dos recursos da saúde pública como, por exemplo, para a definição do número total de leitos ou de comprimidos de um medicamento para uma determinada população. Já os valores relativos são construídos a partir da relação entre dois fatores, como por exemplo, número de mortes em relação a uma quantidade de pessoas. Dessa forma, os valores relativos permitem comparar a realidade atual com algum ponto no passado ou comparar a realidade entre as diversas populações. Contudo, para viabilizar essa comparação, é necessário seguir uma padronização em relação à quantidade de pessoas. Por exemplo, suponha que você queira CAPÍTULO 6 Valores absolutos – número total de ocorrências 78BIOESTATÍSTICA E EPIDEMIOLOGIA descrever a mortalidade em sua cidade, para depois compará-la com a mortalidade medida para o Brasil inteiro em números relativos. Apenas para facilitar os cálculos, vamos considerar que nossa cidade possui 100.000 habitantes e que 300 morreram no último ano. Você poderia decidir descrever o coeficiente de mortalidade com base em grupos de 1.000 habitantes. Nesse caso, você pode dizer que o coeficiente ou taxa de mortalidade (alguns autores diferenciam taxa e coeficiente, mas essa discussão ultrapassa o objetivo da nossa disciplina) para a sua cidade é igual 3 mortes por 1.000 habitantes. Para comparar com a taxa do Brasil inteiro, será necessário descrever o número de mortes a cada grupo de 1.000 habitantes também. Para seu conhecimento, ocorrem no Brasil pouco mais de 1 milhão e 200 mil mortes por ano, o que significa aproximadamente 6 mortes a cada grupo de mil habitantes. Os indicadores de saúde coletiva podem ser muito abrangentes, assim como o próprio conceito de saúde. Entre outros, podemos nos deparar com indicadores de saúde ambiental, tais como os que descrevem as condições de saneamento básico, qualidade do ar e acesso à água tratada, e indicadores de serviços de saúde, tais como taxas de profissionais de saúde ou leitos hospitalares por grupos de população e acesso aos serviços de saúde básica. Contudo, os indicadores mais importantes e que estão de acordo com nossos objetivos nesse curso de Bioestatística e Epidemiologia são aqueles que se referem diretamente às condições de saúde e doença de indivíduos ou populações como, por exemplo, taxas de mortalidade e morbidade. Vejamos a seguir algumas características específicas dessas taxas para as populações de interesse. 6.1.1 Morbidade Morbidade, que como já vimos expressa a condição de doença, pode ser descrita através de coeficientes ou taxas que medem o risco de uma pessoa adoecer. Os coeficientes de prevalência e de incidência (se ainda tiver dúvida sobre esses termos, revise o item 4.3) são expressos de acordo com as equações a seguir: Valores relativos – proporção de ocorrências 79BIOESTATÍSTICA E EPIDEMIOLOGIA Vamos a um exemplo: imagine que você queira descrever a prevalência e a incidência de anemia numa população, digamos entre os moradores da sua rua (vamos considerar, para facilitação dos cálculos, 100 pessoas). Para isso, você descobriu que hoje há 3 moradores com anemia e que no mês passado, 5 moradores foram diagnosticados com a doença (é possível que a prevalência seja menor que a incidência porque a condição de anemia é facilmente reversível com alimentação e suplementação adequadas). Com esses dados, já é possível calcular as taxas de prevalência e incidência da anemia na sua rua. Geralmente os valores são frações bem pequenas (como de fato aconteceu no nosso exemplo), pois os indicadores representam uma parcela da população que tem a condição expressa. Se toda a população fosse acometida pela anemia, por exemplo, teríamos como taxa de prevalência ou incidência um valor igual a 1, significando que 100% da população de interesse está acometida pela condição. Por esse motivo, os valores de incidência e prevalência, tanto nas apresentações de morbidade quanto nas apresentações de mortalidade, são multiplicados por uma potência de 10 adequada à descrição (essa potência representa o tamanho do grupo que pretendemos descrever). No exemplo acima, poderíamos multiplicar por 102 (ou seja, 100) para termos um valor mais facilmente compreensível. Veja como ficaria a taxa de prevalência (o exemplo pode ser aplicado igualmente à taxa de incidência): Ou seja, temos 3 pessoas anêmicas para cada grupo de 100 moradores. Contudo, você pode querer comparar com uma cidade que apresentou 25 pessoas anêmicas a cada 1.000 moradores. Nesse caso, você deverá multiplicar pela potência de 10 adequada (ou seja, 103 = 1.000). Sendo assim, 80BIOESTATÍSTICA E EPIDEMIOLOGIA Sua rua poderia ser descrita como tendo 30 pessoas anêmicas a cada grupo de 1.000 moradores (e descobrir que a taxa de prevalência de anemia na sua rua é maior que na cidade). As fórmulas gerais para o cálculo de taxas de prevalência e incidência são: onde “n” é a potência adequada à descrição dos dados de acordo com sua escala. Para informação, o Instituto Brasileiro de Geografia e Estatística (IBGE) utiliza 10 elevado à potência 3 para descrever a taxa de mortalidade geral no Brasil (ou seja, multiplicado por 1.000, como vimos no item 6.1). Considerando que as condições de doença são variadas, podemos descrever as taxas ou coeficientes em diversos níveis, conforme a gravidade ou infecção, por exemplo. Para determinada população de possíveis hospedeiros suscetíveis, alguns serão expostos ao agente causador da doença (pode ser um patógeno ou um agente físico, entre outros). Desses indivíduos que foram expostos, nem todos serão infectados devido a uma série de fatores, como a duração da exposição ou quantidade e eficiência do agente causador. Mesmo entre os infectados, somente uma fração ficará efetivamente doente, pois uma parte conseguirá superar o desequilíbrio entre fatores, através do sistema imunológico, por exemplo. Já entre os doentes, alguns serão considerados graves e, por fim, entre os doentes graves, alguns morrerão. Para facilitar o entendimento, analise a figura a seguir. 81BIOESTATÍSTICA E EPIDEMIOLOGIA Figura 8. Esquema representativo das proporções da população em relação aos diversos estágios da doença. Fonte: ALMEIDA FILHO; ROUQUAYROL, 2013. A partir dessas variadas condições, podemos descrever diversos coeficientes (muitos autores têm a tendência de se referir a coeficientes quando tratam de indicadores mais restritos e taxas quando tratam de indicadores mais gerais). Nesse contexto, o coeficiente de uma doença numa dada população é igual ao número de doentes sobre essa população, multiplicado pela potência de 10 adequada ao número de indivíduos, como já vimos. Outros indicadores mais específicos, sejam de prevalência ou incidência (você já sabe a diferença, não é?), são: ou seja, o coeficiente de incidência ou de prevalência de infecção representa a proporção de pessoas infectadas (e não somente as doentes) na população de interesse. 82BIOESTATÍSTICA E EPIDEMIOLOGIA ou seja, a patogenicidade (incidência ou de prevalência) representa a proporção de pessoas efetivamente doentes entre as infectadas (e não mais somente sobre a população). ou seja, a virulência representa a proporção de doentes graves entre todos os doentes. ou seja, a letalidade da doença representa a proporção de óbitos entre os doentes (e não sobre toda a população de interesse; se fosse assim, seria a taxa de mortalidade, como veremos a seguir). 6.1.2 Mortalidade Assim como a morbidade mede a proporção de doentes numa população, as taxas demortalidade medem os óbitos na população. A taxa mais abrangente é a mortalidade geral (independente da causa, idade ou outras condições) sobre a população geral. Tipicamente, o valor resultante é multiplicado por 103, como podemos observar no caso desse indicador para o Brasil, que apresentou uma taxa de mortalidade geral próxima de 6 mortes a cada grupo de mil pessoas em 2016: VAMOS REFLETIR: Você consegue identificar a diferença entre taxa de mortalidade geral e taxa de letalidade, estudada no item anterior? 83BIOESTATÍSTICA E EPIDEMIOLOGIA Esta taxa apresenta variações de acordo com a composição da população por idade. Por esta razão, alguns países subdesenvolvidos apresentam valores próximos aos valores observados em países desenvolvidos, onde há uma grande proporção de pessoas idosas (que apresentam uma taxa de mortalidade específica maior que a dos jovens). Para resolver esse problema, é possível determinar um cálculo de mortalidade mais específico por faixas etárias (por exemplo, de 0 a 10 anos, de 10 a 20 anos, e assim por diante) e calcular a média entre esses indicadores. Em nossos exercícios e avalições não será necessário chegar a esse nível de detalhamento, razão pela qual não haverá uma taxa de mortalidade ajustada pela idade em nossos exemplos. Algumas taxas específicas de mortalidade são utilizadas largamente e, por isso, seu entendimento é muito importante para a compreensão da ciência epidemiológica. Entre eles, destaca-se a taxa de mortalidade infantil geral, que pode ser desmembrada em taxa de mortalidade infantil precoce ou neonatal (quando ocorre a morte do recém-nascido em até 28 dias) e taxa de mortalidade infantil tardia ou pós-neonatal (óbitos entre 28 dias e um ano de vida). As taxas de mortalidade infantil são mais adequadas para representar a qualidade de saúde de uma população, como se verifica no gráfico a seguir (todas são taxas de mortalidade infantil geral, com base no ano de 2014): Figura 9. Taxas de mortalidade infantil geral de 3 países de baixa renda, 3 países de alta renda e o Brasil (renda média- -baixa), 2014. Fonte: o autor. Taxa de mortalidade infantil neonatal – óbito em até 28 dias de vida Taxa de mortalidade infantil pós- neonatal – óbito entre 28 e 365 dias de vida 0 20 40 60 80 100 120 Mônaco Japão Noruega Brasil Zâmbia Somália Afeganistão Taxa de mortalidade infantil geral óbitos (entre 0 e 1 ano) *103 nascidos vivos TMI geral (2014) nascido em até 28 dias) e taxa de mortalidade um ano de vida). As taxas de mortalidade infantil geral, com base no ano de 2014): baixa) 84BIOESTATÍSTICA E EPIDEMIOLOGIA Além das taxas de mortalidade infantil neonatal e pós-neonatal, há outras taxas ou coeficientes menos utilizados, mas que podem ser úteis em casos específicos. Por exemplo, se você deseja investigar as condições de assistência pré-natal ou de saúde e nutrição materna, pode utilizar o coeficiente de mortalidade perinatal, que calcula o número óbitos fetais a partir de 22 semanas completas de gestação, acrescidos dos óbitos neonatais precoces (de 0 a 6 dias) sobre os nascimentos totais. Ou ainda se você deseja identificar a incidência ou prevalência de anomalias fetais, pode utilizar o coeficiente de natimortalidade, que representa a proporção de nascidos mortos sobre o total de nascidos (mortos e vivos). Na realidade, dependendo do seu objeto de estudo, você pode utilizar o indicador que melhor descrever seus dados. O importante é que você já está familiarizado com as taxas de mortalidade, assim como com as de morbidade, e apto a utilizá-las, pois todas têm o mesmo princípio: calcular proporções de mortes ou doenças sobre grupos de pessoas. 6.2 – MEDIDAS DE ASSOCIAÇÃO As medidas de associação permitem que o pesquisador em Epidemiologia identifique fatores de risco ou fatores de proteção a partir das ocorrências proporcionais de saúde ou doença em grupos de indivíduos expostos a um fator e em grupos de indivíduos não-expostos ao mesmo fator. Por exemplo, você pode querer descobrir se fumar é fator de risco ou de proteção para câncer de boca. Para isso, poderia utilizar os dados para calcular uma medida de associação. Mas antes de tudo, será necessário definirmos o tipo de estudo feito, pois isso definirá a medida adequada. Entre os principais estudos relacionados à Epidemiologia, podemos citar o estudo de coorte e o estudo de caso-controle (observacionais). Resumidamente, um estudo de coorte é aquele em que o pesquisador acompanha um grupo que possui características, experiências ou condições semelhantes. No exemplo da determinação do cigarro como fator de risco ou de proteção para câncer de boca, um estudo de coorte típico envolveria o acompanhamento de dois grupos semelhantes, com exceção da condição de fumante ou não-fumante. Perceba que no estudo de coorte, a doença ainda não está presente. Após um determinado período, digamos cinco anos, o pesquisador contabiliza o número de pessoas do grupo fumante que adquiriram câncer de boca, assim como o número de pessoas do grupo não-fumante que adquiriram câncer de boca. Apesar de ser muito útil, nem sempre é possível realizar um estudo de coorte, devido ao 85BIOESTATÍSTICA E EPIDEMIOLOGIA tempo de espera ser tipicamente longo. Uma solução seria conduzir um estudo de caso-controle, quando a doença já está presente e o pesquisador procura um grupo que possui a condição a ser testada (no nosso exemplo, ser fumante) e compara com um grupo (que será chamado de controle) que não possui a condição a ser testada (não-fumante, no nosso exemplo). Perceba que nesse caso, não é necessário aguardar o adoecimento dos participantes, sendo necessário apenas comparar a incidência dos expostos ao fator, com a incidência dos não-expostos ao fator. 6.2.1 – Risco relativo e risco atribuível Quando trabalharmos com estudos de coorte, devemos utilizar o risco relativo e o risco atribuível para indicar se o fator a ser testado é de risco ou de proteção. O risco relativo (RR) indica a probabilidade de um indivíduo ser acometido de uma doença ser for exposto a um fator e é calculado dividindo-se a proporção de doentes expostos pela proporção de doentes que não foram expostos ao fator, ou seja, Para se descobrir a incidência de expostos, basta dividir o número de doentes do grupo exposto pelo número total do grupo exposto. Da mesma forma, para se descobrir a incidência de não-expostos, basta dividir o número de doentes do grupo não-exposto pelo número total do grupo não-exposto. Sendo assim, podemos desenvolver melhor a fórmula, que ficaria Se você achar complicado calcular o risco relativo dessa forma, há uma maneira alternativa que poderá lhe ajudar. Para trabalhar com a nova maneira, será necessário construirmos uma tabela 2 X 2, muito útil ao estudo de Epidemiologia. 86BIOESTATÍSTICA E EPIDEMIOLOGIA Tabela 11. Esquema geral de uma tabela para dois grupos e duas condições. Exposto Não-exposto Total Doente a b a + b Não doente c d c + d Total a + c b + d a + b + c + d Fonte: o autor. Na Tabela 11 podemos perceber que o total de expostos (a + c) é composto por alguns indivíduos que ficaram doentes (a) durante a pesquisa (lembre-se que se trata de um estudo de coorte) e que não ficaram doentes (c), assim como ocorre com os não-expostos. Também podemos perceber que o total de doentes (a + b) é composto por indivíduos do grupo exposto (a) e do grupo não- exposto (b). Sendo assim, podemos reescrever a fórmula do risco relativo da seguinte maneira Vamos utilizar essa última maneira para calcular um exemplo. Suponha que você acompanhou 50 fumantes e após 5 anos, contabilizou 2 pessoas com câncer de boca. No outro grupo, era composto por 200 pessoas que não fumam, você contabilizou no final do mesmo período 4 pessoas com câncer de boca. Dessa maneira, antes de calcular o risco relativo do cigarro para câncer6.2.1 – Risco relativo e risco atribuível.........................................................................................85 6.2.2 – Razão de chances ou Odds Ratio ......................................................................................88 6.3 – TESTES DIAGNÓSTICOS ...........................................................................................................89 6.4 – VIGILÂNCIA À SAÚDE ...............................................................................................................92 6.4.1 - Sistemas de Informação em Saúde (SIS) ...........................................................................93 6.5 CONSIDERAÇÕES FINAIS DO CAPÍTULO 6 ....................................................................................94 CAPÍTULO 7 7 PROCESSO EPIDÊMICO ...........................................................................................97 7.1 FREQUÊNCIA E DISTRIBUIÇÃO DAS DOENÇAS: EPIDEMIA E ENDEMIA ..........................................97 7.2 EPIDEMIOLOGIA DAS DOENÇAS INFECCIOSAS ...........................................................................100 7.2.1 Reservatórios de agentes infecciosos ................................................................................100 7.2.2 Saída do agente infeccioso e modos de transmissão .........................................................101 7.2.3 Entrada do agente no hospedeiro .......................................................................................103 7.2.4 Hospedeiro suscetível ........................................................................................................103 SUMÁRIO 8BIOESTATÍSTICA E EPIDEMIOLOGIA 7.2.5 Implicações para a saúde pública ......................................................................................104 7.3 – EPIDEMIOLOGIA DAS DOENÇAS NÃO-INFECCIOSAS ................................................................105 7.3.1 Características das doenças não-infecciosas .....................................................................105 7.3.2 Doenças cardiovasculares ..................................................................................................106 7.3.3 Câncer ...............................................................................................................................106 7.3.4 Causas externas ................................................................................................................107 7.4 CONSIDERAÇÕES FINAIS DO CAPÍTULO 7 ..................................................................................108 REFERÊNCIAS BIBLIOGRÁFICAS .................................................. 110 SUMÁRIO 9BIOESTATÍSTICA E EPIDEMIOLOGIA MARCELO WERNER O autor é Biólogo e Economista, mestre em Ciência e Tecnologia Ambiental e especialista em Ensino de Ciências e Ensino Virtual. É professor na Faculdade Avantis desde 2014, tutor da Secretaria Nacional de Segurança Pública desde 2015 e servidor do Ministério da Justiça desde 2004. AUTOR 10BIOESTATÍSTICA E EPIDEMIOLOGIA O caderno de estudos de Bioestatística e Epidemiologia acompanhará sua aprendizagem nessa disciplina e será fonte suficiente para você alcançar um ótimo aproveitamento ao final do semestre. Apesar disso, inúmeros exemplos e exercícios estarão disponíveis em nosso ambiente de virtual de aprendizagem (AVA). Lá também encontraremos material complementar, como vídeos e tabelas. Além disso, uma breve revisão de matemática básica, auxiliará aqueles que, porventura, tenham dificuldade com a aritmética e a álgebra necessárias para o bom desenvolvimento do nosso processo de ensino e aprendizagem. Este caderno está dividido em duas unidades: Bioestatística e Epidemiologia. É verdade que há um forte relacionamento entre as duas ciências, pois a Epidemiologia representa o estudo da medicina preventiva e da saúde pública, enquanto a Bioestatística é seu fundamento científico e quantitativo. Contudo, muitas ferramentas bioestatísticas podem (e devem) ser usadas, mesmo fora do contexto epidemiológico, em seus trabalhos na faculdade, em seu trabalho de conclusão de curso e em sua vida profissional. Devo ressaltar que, ao utilizarmos dados reais, os cálculos manuais não são adequados devido ao grande número de medições e à variedade de escalas numéricas. Para isso, programas de computador (muitos gratuitos) são eficazes em realizar os cálculos, para que você formule conclusões. No AVA também teremos uma série de sugestões a respeito. Porém, é imprescindível que você execute os primeiros procedimentos estatísticos passo a passo, de forma manual, para que possa executá-los posteriormente nos programas de computador com mais confiança. A boa notícia é que em nossas avaliações e exercícios, sempre que possível, os números serão fáceis de calcular, seja pela quantidade, seja pela complexidade. Por isso, apesar de ser altamente recomendável, não é imprescindível o uso de calculadora durante a avaliação (isso mesmo, os cálculos não serão complexos); importante ressaltar que não é possível usar a calculadora do seu celular. A primeira unidade está dividida em 3 capítulos. O capítulo 1 traz os conceitos básicos de Bioestatística. Ao final do capítulo você será capaz de identificar os principais tipos de dados biológicos, bem como os princípios necessários para coletar dados cientificamente; também compreenderá a importância da probabilidade para a tomada de decisões baseadas em dados. O capítulo 2 introduz as medidas que permitem descrever o conjunto de dados com o qual você APRESENTAÇÃO 11BIOESTATÍSTICA E EPIDEMIOLOGIA conduzirá uma pesquisa, além de proporcionar métodos para apresentar grande quantidade de dados e descrever relações entre variáveis. As conclusões, previsões e inferências a partir do seu conjunto de dados poderão ser feitas ao final do capítulo 3, no qual estudaremos os principais testes estatísticos. A segunda unidade está dividida em 4 capítulos. É possível encontrar uma grande variedade de classificações dos assuntos em Epidemiologia. Optamos por uma divisão que prioriza o conhecimento sintético e objetivo dessa ciência básica da Saúde Pública. Assim, você encontrará os conceitos básicos no capítulo 4, além de ser capaz, ao final do estudo, de descrever o desenvolvimento da ciência epidemiológica ao longo do tempo e estabelecer padrões para seu futuro. No capítulo 5, o processo saúde-doença será abordado a partir de 3 modelos; ao final, você será capaz de reconhecer como os serviços de saúde com os quais você tem contato transitam entre esses modelos. O capítulo 6 apresenta técnicas que permitirão que você descreva indicadores de saúde de populações, bem como quantifique fatores de risco para os mais diversos agravos à saúde; além disso, nesse capítulo entraremos em contato com os sistemas que alimentam os serviços de saúde, permitindo-os promover a prevenção e a recuperação da saúde da população. Por fim, no capitulo 7, estudaremos o processo epidêmico através da distribuição espacial e temporal das doenças e de características das doenças transmissíveis e não- transmissíveis importantes na disseminação das enfermidades. Finalizando cada capítulo, você encontrará considerações finais que representam um breve resumo do que foi estudado. Os conceitos e técnicas com os quais entraremos em contato a partir de agora, apesar de extensos e nem sempre simples, correspondem a uma introdução. Uma introdução bastante robusta, que será mais do que suficiente para um bom aproveitamento nas avaliações, como já foi dito, mas também em eventuais concursos dos quais você participe, exames do Ministério da Educação (como o ENADE e outros que possam vir) e, principalmente, para a sua prática acadêmica e profissional. Não obstante, você poderá se deparar com situações na vida real em que outras técnicas serão necessárias. Se for o caso, saiba que sempre poderá contar com auxílioVocê encontrará exercícios e mais exemplos no Ambiente Virtual de Aprendizagem. Considerando os resultados, você acha que é válido utilizar o teste alternativo para diagnosticar cárie nas crianças do seu município? Os valores calculados foram altos e, considerando a impossibilidade de alocar dentistas e exames de imagem para todas as crianças, fica claro que professores e professoras podem substituir o teste padrão-ouro. Porém, não há uma regra geral para determinar a validade de um teste diagnóstico, pois cada doença tem uma repercussão específica. O que deve ser observado, entretanto, é que devemos escolher uma alta sensibilidade quando a doença é grave e tratável, mas não pode passar despercebida. Já quando a doença é incurável ou de difícil tratamento, deve-se optar por uma alta especificidade. Por fim, quando uma doença grave for curável e houver consequências graves se forem identificados falsos positivos e falsos negativos, deve-se priorizar uma alta acurácia. 6.4 – VIGILÂNCIA À SAÚDE Vigilância é a observação contínua da distribuição de doenças. Isso é feito através da coleta sistemática, consolidação e avaliação das informações de morbidade e mortalidade, entre outros dados relevantes. A divulgação dessas informações viabiliza as ações governamentais e permite que todos os interessados (pesquisadores, agentes públicos, imprensa, organismos internacionais etc.) tenham acesso aos dados. Todo sistema de vigilância à saúde deve ser permanentemente atualizado para ser efetivo. As inovações científicas e tecnológicas, como banco de dados e sistemas informatizados, permitem aumentar a abrangência e qualidade da informação, especialmente aquelas que têm importância epidemiológica. A partir dessas informações, o SUS efetiva ações de promoção e proteção da saúde, de natureza preventiva, cujo objetivo é reduzir fatores de risco que constituem ameaça à saúde das pessoas, podendo provocar-lhes incapacidades e doenças. Entre as ações de promoção da saúde, encontram-se a educação, a disseminação de bons padrões de alimentação e nutrição, a adoção de estilos de vida saudáveis, o uso adequado e desenvolvimento de aptidões e capacidades, os aconselhamentos específicos, como os de cunho genético e sexual, entre outras. Já as ações de 93BIOESTATÍSTICA E EPIDEMIOLOGIA proteção incluem vigilância epidemiológica, vacinações, saneamento básico, vigilância sanitária, exames médicos e odontológicos periódicos. Nem sempre a ação preventiva é capaz de mitigar o surgimento de enfermidades. Quando isso acontece, as informações de vigilância à saúde também subsidiam ações de recuperação, que envolvem o diagnóstico e o tratamento de doenças, acidentes e danos de toda natureza, além da invalidez e a reabilitação. Alguns exemplos de ações de recuperação: consultas médicas e odontológicas, vacinação, atendimento de enfermagem, exames diagnósticos e tratamento, inclusive em regime de internação. Todas essas ações têm que ser planejadas a partir de estudos epidemiológicos para que sejam definidas as prioridades de prevenção (priorizando grupos de risco, por exemplo), cobertura e concentração de ambulatórios e hospitais etc. Por sua vez, esses estudos dependem de dados de todo o sistema de saúde, obtidos principalmente através de sistemas de informação em saúde. 6.4.1 - Sistemas de Informação em Saúde (SIS) SIS são conjuntos de unidades de produção, análise e divulgação de dados de saúde em geral, com atuação integrada e articulada, para que sejam atendidas as demandas de serviços de saúde pela população, bem como para que sirva de auxiliar no gerenciamento dos recursos, com a finalidade de maior aproveitamento e melhores resultados. O mais importante SIS é o Sistema de informação de agravos de notificação (Sinan), que é alimentado pela notificação e investigação de casos de doenças e agravos que constam da lista nacional de doenças de notificação compulsória. Entre essas doenças, estão incluídas suspeitas ou confirmações de botulismo, cólera, raiva humana, febre amarela, poliomielite e sarampo. Também são incluídos surtos ou casos com muitas ocorrências associadas de difteria, influenza humana ou agravos inusitados. Também é possível que os municípios incluam outros problemas de saúde que sejam importantes no nível local. Por esse motivo, o número de doenças e agravos contemplados pelo Sinan vem aumentando progressivamente e ajudando a expressar as diferenças regionais de perfis de morbidade. A entrada de dados no Sinan é feita mediante a utilização de três formulários: a Ficha individual de notificação, preenchida para cada ocorrência, a Ficha individual de investigação (identificação da fonte de infecção e dos mecanismos de transmissão) e a Notificação negativa (indica que, apesar de não haver a ocorrência da doença, a equipe de vigilância epidemiológica está alerta). 94BIOESTATÍSTICA E EPIDEMIOLOGIA Outra fonte importante de dados epidemiológicos e o Sistema de informação sobre mortalidade (SIM), que é alimentado pelas declarações de óbito expedidas pelos médicos. As informações contidas nessas declarações possibilitam o delineamento do perfil de morbidade de uma área, no que diz respeito às doenças mais letais e às doenças crônicas não sujeitas à notificação compulsória, representando, na prática, a única fonte regular de dados. Para as doenças de notificação compulsória que levaram a óbito, a utilização eficiente dessa fonte de dados depende da verificação da presença desses agravos no banco de dados do Sinan. Também é possível calcular a mortalidade proporcional por causas, faixa etária, sexo, local de ocorrência e residência, letalidade de agravos dos quais se conheça a incidência, bem como taxas de mortalidade geral, infantil, materna ou por qualquer outra variável contida na declaração de óbito, pois são disponibilizadas várias formas de cruzamento dos dados. Entretanto, em muitas áreas, o uso dessa rica fonte de dados é prejudicado pelo não preenchimento correto das declarações. Por isso, é necessário realizar uma análise crítica dos dados, para evitar registro excessivo de causas mal definidas, causas perinatais em adultos, causas exclusivas de um sexo sendo registrada em outro etc. Diversos outros sistemas de informação específica estão disponíveis e podem ser acessados por gestores ou pesquisadores. Entre eles podemos citar o Sistema de informações sobre nascidos vivos (Sinasc), que fornece dados para riscos à saúde materna e infantil; o Sistema de informações hospitalares (SIH/SUS), que reúne aproximadamente 70% dos internamentos no país; o Sistema de informações de vigilância alimentar e nutricional (Sisvan), que monitora o estado nutricional dos diversos grupos populacionais; entre tantos outros. 6.5 CONSIDERAÇÕES FINAIS DO CAPÍTULO 6 A distribuição de agravos à saúde, bem como a identificação de diferentes padrões de morbimortalidade entre indivíduos ou populações é o objeto principal da Epidemiologia descritiva, pois seu conhecimento permite a promoção de ações de prevenção e orienta as políticas públicas de saúde. Os indicadores de saúde coletiva, que podem ser apresentados em valores absolutos (úteis para a administração dos recursos da saúde) ou relativos (úteis para comparações temporais e geográficas), são os principais instrumentos utilizados para descrever os padrões de saúde e doença em populações. Existem uma grande diversidade de indicadores, que podem ser usados 95BIOESTATÍSTICA E EPIDEMIOLOGIA em situações específicas, de acordo com a pesquisa ou divulgação que você pretende fazer. Em geral, podemos dividi-los em indicadores de morbidade (e.g. patogenicidade, infecção, virulência, letalidade etc.) e de mortalidade (e.g. infantil neonatal e pós-neonatal, materna, geral etc.). Já as medidas de associação, são instrumentos que descrevem o risco em grupos de indivíduos que estão expostos ou não a fatores físicos, químicos,qual sugere que, se uma proporção suficientemente alta de indivíduos em uma população é 105BIOESTATÍSTICA E EPIDEMIOLOGIA resistente a um agente, então os poucos suscetíveis serão protegidos pela maioria resistente, uma vez que o patógeno dificilmente encontrará um hospedeiro suscetível. A porcentagem da população necessária para adquirir a imunidade de rebanho com a finalidade de prevenir ou interromper um surto ou epidemia varia de acordo com a doença. Um perigo associado a esse conceito é que, em populações altamente imunizadas, as poucas pessoas suscetíveis são frequentemente agrupadas em subgrupos definidos por fatores socioeconômicos ou culturais. Se o patógeno for introduzido em um desses subgrupos, pode ocorrer um surto ou epidemia. Na prática, a imunidade de rebanho não impediu surtos de sarampo e rubéola em populações com níveis de imunização tão elevados como 85% e 90% nos Estados Unidos nas últimas décadas. 7.3 – EPIDEMIOLOGIA DAS DOENÇAS NÃO-INFECCIOSAS No início da Epidemiologia, o único foco de investigação eram as doenças infecciosas, que eram a causa de elevadas taxas de morbidade e mortalidade. Contudo, após a revolução científica nas Ciências da Saúde, ocorreu o controle desse tipo de doença. Essa revolução inclui o uso generalizado de antibióticos e vacinas, o controle eficiente de vetores, a descontaminação eficiente de veículos, entre outras medidas que promoveram o aumento da expectativa de vida no mundo inteiro. Por outro lado, houve um incremento na incidência e prevalência de doenças não-infecciosas, tais como diabetes, obesidade e traumas, a ponto de transformar essas doenças em causa principal de mortalidade em quase todos os países, com raras exceções na África subsaariana. No Brasil, o aumento da violência e de acidentes de trânsito contribuiu ainda mais para que houvesse a transição epidemiológica, que é a substituição da principal causa de mortalidade, que antes era relacionada às doenças infecciosas, para doenças não-infecciosas. Para termos uma ideia da dimensão dessa alteração, em 1930, 45,6% das mortes nas capitais dos estados brasileiros foram em decorrência de doenças infecciosas e parasitárias; em 2010, esse número foi de apenas 4,6%. 7.3.1 Características das doenças não-infecciosas Como vimos, as doenças e agravos não-transmissíveis (DANT) ou não-infecciosas Transição epidemiológica: mudança no perfil de morbi- mortalidade 106BIOESTATÍSTICA E EPIDEMIOLOGIA compreendem todas aquelas que não são adquiridas por contato com um agente infeccioso causador de doenças, nem por vetores ou veículos que o carregam, tampouco por contato com pessoas infectadas. Esse grupo inclui uma variedade de agravos à saúde e tem grande repercussão nos índices de saúde de qualquer país, inclusive no Brasil. Entre as características das DANT, podemos citar um longo período de latência, com poucos ou nenhum sintoma. Além disso, a evolução da doença é lenta, prolongada e permanente, com manifestações clínicas acontecendo nos períodos de exacerbação e remissão. Em geral, as lesões celulares são irreversíveis, com evolução para variados graus de incapacidade e morte. A seguir, vamos abordar alguns preceitos básicos das principais DANT. 7.3.2 Doenças cardiovasculares As doenças cardiovasculares, tais como infarto agudo do miocárdio (1º lugar) e acidente vascular cerebral (2º lugar) são, de longe, a principal causa de morte nos países ocidentais, incluindo o Brasil. Para esse grupo de doenças, o gênero é um fator preditivo bastante importante, pois as taxas de mortalidade são maiores em homens do que em mulheres em todas as faixas etárias. Os principais fatores de risco para essas doenças são relacionados ao estilo de vida e incluem a pressão arterial e o colesterol elevados, uso de tabaco e obesidade. Indivíduos que apresentam em conjunto os três fatores, têm uma probabilidade 20 vezes maior de ser acometido por uma doença cardiovascular. 7.3.3 Câncer O que comumente chamamos de câncer, é representado por um conjunto de mais de 50 doenças relacionadas, que são responsáveis pela segunda causa de morte no planeta. A difusão do teste de Papanicolau, aliado à redução no uso de cigarro e à vacinação contra o vírus do papiloma humano (HPV) são fatores responsáveis pela redução do número de diagnósticos de câncer no mundo todo. Contudo, o aumento da idade tem contribuído para uma maior 107BIOESTATÍSTICA E EPIDEMIOLOGIA prevalência, principalmente entre os indivíduos mais idosos. Aproximadamente metade dos homens e um terço das mulheres terão câncer ao longo da vida. Outro aspecto epidemiológico importante é a redução de mortalidade para alguns tipos de doença, como o câncer de estômago (- 35%) e o câncer cervical (- 29%); alguns tipos, como o câncer de pulmão em mulheres, não tem apresentado nenhuma redução. Já os tipos que mais causam mortes são, em ordem decrescente: câncer de pulmão, de estômago e de fígado. Os fatores de risco para a doença são evitáveis, o que torna a prevenção uma ótima estratégia para redução dos danos relacionados. Entre esses fatores estão o uso de cigarro e álcool, prática sexual sem proteção, poluição, dieta (assim como obesidade) e infecções. Em relação às infecções, 18% dos cânceres no mundo são decorrentes da exposição a vírus, como o HPV, a bactérias, como o H. pylori, e a parasitas. 7.3.4 Causas externas Um grupo de ameaças à saúde da população tem se destacado, principalmente em países em desenvolvimento, como o Brasil. Entre causas externas estão incluídas aquelas relacionadas à violência e aos acidentes de trânsito (ambos os fatores são endêmicos no Brasil). Enquanto agravos à saúde desse tipo têm diminuído sua prevalência em países desenvolvidos, como a Suécia e o Japão, países em desenvolvimento sofrem com epidemias de violência. No Brasil, aproximadamente 100.000 pessoas por ano morrem em decorrência apenas de acidentes de trânsito e crimes violentos (valor que provavelmente está subvalorizado devido à falta de estatísticas adequadas). Os fatores de risco para crimes violentos não são específicos e, às vezes, difíceis de serem identificados. Em geral, são considerados fatores de risco a desigualdade social, a baixa escolaridade e a cultura (das 100 cidades mais violentas do mundo, aproximadamente 90 estão na América Latina). Já para os agravos decorrentes de acidentes de trânsito, os fatores de risco são: infraestrutura de trânsito deficiente, baixa tecnologia dos veículos mais vendidos (populares), excesso de velocidade, uso de celulares e ingestão de álcool e outras drogas antes de dirigir. 108BIOESTATÍSTICA E EPIDEMIOLOGIA 7.4 CONSIDERAÇÕES FINAIS DO CAPÍTULO 7 Neste último capítulo do nosso caderno estudamos o processo epidêmico que ocorre a partir da interação entre os fatores que causam a doença e determina, entre outras coisas, a distribuição e a frequência dos agravos à saúde. Em relação a essa distribuição, vimos que uma enfermidade constantemente presente em uma determinada prevalência e região caracteriza uma endemia. Já o início de uma doença em uma população, é chamado de surto. Quando a enfermidade atinge um número maior que o esperado ao acaso para uma população específica, temos a epidemia (que, quando se espalha para vários países ou continentes, torna-se uma pandemia). Outro fator que determina a dinâmica do processo epidêmico é o tipo de agente causador da doença. Por isso, também estudamos no capítulo 7 as características das doenças infecciosas e não-infecciosas. Em relação às doenças infecciosas, aprendemos que a transmissão ocorre quando o agente causador deixa o reservatório por meio de uma via de saída, é transportado através de um meio de transmissão e entra no hospedeiro suscetível para infectá-lo. Os reservatórios incluem animais não humanos (zoonoses), o meio ambiente (plantas, solo e água) ou portadores humanos (que podem ser assintomáticos,de incubação, convalescentes ou crônicos). A transmissão do agente infeccioso a partir do reservatório pode ser direta (contato direto ou propagação de gotículas) ou indireta (vetores mecânicos ou biológicos, transportados pelo ar ou outros veículos). Ao alcançar o hospedeiro suscetível, o patógeno pode entrar por uma via que o possibilite acessar tecidos onde ele irá se multiplicar ou agir e provocar a doença, dependo das condições de imunidade, genética e estrutural do indivíduo. O conhecimento da cadeia de infecção é a base para a adoção de medidas de controle, que podem ser direcionadas para controlar ou eliminar o agente na fonte de transmissão (e.g. descontaminação de solo, uso de antibióticos), proteger vias de entrada (e.g. uso de máscaras e luvas) ou aumentar as defesas do hospedeiro (e.g. uso de vacinas). Nas últimas décadas, quase todos os países experimentaram uma transição epidemiológica pois, com algumas raras exceções na África subsaariana, todos os países têm doenças não- infecciosas como causas principais de mortalidade, ao contrário do que ocorria no início da Epidemiologia. Essas doenças têm como características longos períodos de latência, com poucos sintomas e evolução lenta, em geral. Contudo, as doenças não-infecciosas representam um grupo variado de agravos à saúde e, por esta razão, decidimos abordar algumas características específicas das principais enfermidades desse tipo. Isoladamente, a primeira causa de morte na maior parte das populações, incluindo a brasileira, é a doença cardiovascular (infarto agudo do miocárdio, acidente vascular cerebral, entre outras), que acomete mais os homens do que as mulheres e tem como fatores de risco colesterol e pressão arterial elevados, uso de tabaco e 109BIOESTATÍSTICA E EPIDEMIOLOGIA obesidade. Os cânceres também estão entre as principais causas de morte no mundo inteiro e acometem mais idosos do que jovens e têm como fatores de risco o uso do tabaco e do álcool, infecções (parasitas, HPV, H. pylori e outras bactérias), prática sexual sem proteção, poluição e má alimentação. Por fim, discutimos um grupo de agravos à saúde que tem acometido principalmente países em desenvolvimento, consumindo uma parcela significativa dos recursos da saúde, que são as causas externas, representadas por acidentes (como os de trânsito, cujos fatores de risco são infraestrutura ineficiente, excesso de velocidade, entre outros) e violência (como homicídios, cujos fatores de risco podem ser desigualdade social, baixa escolaridade e cultura). Chegamos ao final do nosso caderno de estudos e eu gostaria de parabenizar sua dedicação, que é um atributo essencial para que seja alcançada uma aprendizagem significativa. Essa aprendizagem certamente contribuirá para que você se torne um profissional de Saúde apto a ser um agente transformador da nossa sociedade. 110BIOESTATÍSTICA E EPIDEMIOLOGIA ALMEIDA FILHO, N.; ROUQUAYROL, M.Z. Introdução à epidemiologia. 4.ed.,rev. e ampliada. Rio de Janeiro: Guanabara Koogan, 2013. BEAGLEHOLE, R. et al. Epidemiologia básica. São Paulo: Santos, 2010. BUSSAB, W.O.; MORETTIN, P.A. Métodos quantitativos: estatística básica. São Paulo: Editora Atual, 1987. CALLEGARI-JACQUES, S.M. Bioestatística: princípios e aplicações. Porto Alegre: Artemed, 2003. GREENLAND, S.; LASH, T.L.; ROTHMAN, K.J. Epidemiologia moderna. Porto Alegre: Artmed, 2011. KATZ, D.L.; ELMORE, J.G.; JEKEL, J.F. Epidemiologia, bioestatística e medicina. Porto Alegre: Artmed, 2005. LEAVELL, H.; CLARK, E.G. Medicina preventiva. São Paulo: McGraw–Hill do Brasil, 1976. RODRIGUES, V.P. et al. Conceitos e ferramentas de epidemiologia. São Luís: UFMA – UNASUS, 2014. Disponível em , acesso em: 02 fev 2017. ZAR, J.H. Biostatistical analysis. 5 ed. New Jersey: Prentice Hall, 2010. REFERÊNCIAS BIBLIOGRÁFICAS 111BIOESTATÍSTICA E EPIDEMIOLOGIA IPCC. Climate Change 2001: The Scientific Basis. Contribution of Working Group I to the Third Assessment Report of the Intergovernmental Panel on Climate Change. Cambridge, United Kingdom, and New York, United States, Cambridge University Press ISDR (1999), 2001. I PCC. Future Work of the IPCC: Chairman’s Vision Paper on the Future of the IPCC. IPCC, 2015. LIMA, G. F. C. Educação ambiental e mudança climática: convivendo em contextos de incerteza e complexidade. Ambiente & Educação . v. 18, 2013. LOURENÇO-DE-OLIVEIRA R.; et al. Aedes aegypti in Brazil: Genetically differentiated populations with high susceptibility to dengue and yellow fever viruses. Trans R Soc Trop Med Hyg. v. 98, n.1, p.43–54, 2004. MARCELINO, E. V. Desastres naturais e geotecnologias: conceitos básicos. Santa Maria, RS: INPE, 2007. MARENGO, J. A. Mudanças climáticas globais e seus efeitos sobre a biodiversidade: caracterização do clima atual e definição das alterações climáticas para o território brasileiro ao longo do século XXI. Brasília: MMA, 2006. MELLO, L. L. Charges e cartuns sobre aquecimento global. 2014. Disponível em: Acesso em: 09, jan. 2017. MENDONÇA, F. Aspectos da interação clima-ambiente-saúde humana: da relação sociedade-natureza à (in) sustentabilidade ambiental. RA’E GA–O espaço geográfico em análise, v.4, n.4, p.85-100, 2000. MILLER, B R.; BALLINGER, M. E. Aedes albopictus mosquitoes introduced into Brazil: vector competence for yellow fever and dengue viruses. Trans R Soc Trop Med Hyg. v.82, n.3, p. 476–7, 1988. 112BIOESTATÍSTICA E EPIDEMIOLOGIA MONTEIRO, A. L.; BERTAGNI, R. F. S. Acidentes do Trabalho e Doenças Ocupacionais. Saraiva: São Paulo, ed. 7, 2012. MONTERO, R. 2007. Poluição, Cubatão - SP. Disponível em: Acesso em: 09, jan. 2017. MORAIS, C. R. Dicionário de Saúde e Segurança no trabalho e Meio Ambiente. São Caetano do Sul: Yendis, 2011. MOUSINHO, P. Glossário. In: Trigueiro, A. (Coord.) Meio ambiente no século 21. Rio de Janeiro: Sextante. 2003. NARDOCCI, A. C.; et al. Poluição do ar e doenças respiratórias e cardiovasculares: estudo de séries temporais em Cubatão, São Paulo, Brasil. Cadernos de Saúde Pública, v. 29, n. 9, p. 1867-1876, 2013. NICOLUSSI, F. H.; et al. Poluição do ar e doenças respiratórias alérgicas em escolares. Revista de Saúde Pública, v. 48, n. 2, p. 326-330, 2014. NOGUEIRA, D. P. Incorporação da saúde ocupacional à rede primária de saúde. Revista de saúde pública, v. 18, n. 6, p. 495-509, 1984. NUNES, T. Como a dengue é transmitida. 2016. Disponível em: Acesso em: 09 jan. 2017. O DIA. Polipílula combate hipertensão e colesterol. 2011. Disponível em: Acesso em: 09 jan. 2017. O GLOBO. Entenda o acidente. 2015. Disponível em: Acesso em: 09, jan. 2017. 113BIOESTATÍSTICA E EPIDEMIOLOGIA ODUM, E. P. Ecologia. Rio de Janeiro: Editora Guanabara, 1986. OLIVEIRA, M. V. C.� CARVALHO, A. R. Princípios Básicos do Saneamento do Meio. São Paulo: SENAC, 2010. ORGANIZAÇÃO MUNDIAL DA SAÚDE. Constituição da Organização Mundial da Saúde. Nova Iorque, 1946. Disponível em: Acesso em: 09 jan. 2017. ORGANIZAÇÃO MUNDIAL DA SAÚDE. Dengue hemorrágica: diagnóstico, tratamento, prevenção e controle. ed. 2, São Paulo; 2001. ORGANIZAÇÃO MUNDIAL DA SAÚDE. Substâncias químicas perigosas à saúde e ao ambiente. São Paulo: Cultura Acadêmica, 2008. ORGANIZACIÓN PANAMERICANA DE LA SALUD. Dengue y dengue hemorrágico em las Américas, guias para su prevención y controle.Publicacion Científica nº 548, Washington; 2002. PATZ, J. A., et al. Impact of regional climate change on human health. Nature, v. 438, n.7066, p. 310-317, 2005. PEGORIM, J. O que é El Niño? 2016. Disponível em: Acesso em: 09 jan. 2017. PEREIRA, S. D. Conceitos e definições da Saúde e Epidemiologia usados na Vigilância Sanitária. Governo do estado de São Paulo, março de 2007. RAU, K. (2012). Ocorrência de Equilíbrio Sustentável. Disponível em: Acesso em: 08, jan. 2017. RENGIFO CUELLER H. Conceptualización de la saludambiental: teoría y práctica (parte 1). Rev Perú MedExp Salud Publica, v. 25, n.4, p.403-409, 2008. RENGIFO CUELLER H. Conceptualización de la saludambiental: teoría y práctica (parte 2). Rev Perú MedExp Salud Publica, v.26, n.1, p.66-73, 2009. RIBAS, P. P., MATSUMURA, A. T. S. A química dos agrotóxicos: impacto sobre a saúde e meio ambiente. Revista Liberato, v. 10, n. 14, p. 149-158, 2009. RIBEIRO, M. D., et al. Estudo descritivo da ocorrência de dengue e suas relações com o clima e a ação da vigilância em saúde no município de Franca, São Paulo, Brasil, 2007 a 2011. Investigação, v.14, n. 1, 2015. RICKLEFS, R. E. A Economia da Natureza. Rio de Janeiro: Guanabara-Koogan, 5 ed., 2003. ROCHA, H. Natal inicia Campanha de Vacinação contra raiva em cães e gatos. 2016. Disponível em: Acesso em: 09 jan.,2017. ROUQUAYROL, Maria Zélia; ALMEIDA FILHO, Naomar de. Epidemiologia e Saúde. 7. ed. Rio de Janeiro: MedBook, 2013. SCHLICKMANN, F. Fotos antigas de Balneário Camboriú. 2011. Disponível em: Acesso em: 08 jan. 2017. 115BIOESTATÍSTICA E EPIDEMIOLOGIA SEMA. Secretaria do Meio Ambiente. O que são políticas públicas. Disponível em: . Acesso em: 07 jan. 2017. SILVA JÚNIOR, J. L. R.; et al. Efeito da sazonalidade climática na ocorrência de sintomas respiratórios em uma cidade de clima tropical. Jornal Brasileiro de Pneumologia, v. 37, n.6, p. 759-767, 2011. SILVA, I. Fenômeno La Niña pode trazer chuvas ao sertão do Nordeste. 2016. Disponível em: Acesso em: 09 jan. 2017. SULEIDE. Governo de Goiás. Goiânia, Césio, 137. 2012. Disponível em: Acesso em: 09 jan. 2017. SUPERINTERESSANTE. As grandes epidemias ao longo da história. 2004. Disponível em: Acesso em: 09 jan. 2017. TAUIL, P. L. Urbanização e ecologia da dengue. Cadernos de Saúde Pública, n.17, p.99- 102, 2001. TEIXEIRA, J. C., et al. Estudo do impacto das deficiências de saneamento básico sobre a saúde publica no Brasil no período de 2001 a 2009. Eng. sanit. ambient, v. 19, n. 1, p. 87-96, 2014. 116BIOESTATÍSTICA E EPIDEMIOLOGIA TOLEDO, K. Quinto relatório do IPCC mostra intensificação das mudanças climáticas. Agência FAPESP. 2013. Disponível em: Acesso em: 09 jan. 2017. UNITED NATIONS DEPARTMENT OF ECONOMIC SOCIAL AFFAIRS/POPULATION DIVISION. World Urbanization Prospects: The 2007 revision. New York: UN; 2008. VOGES, M. O clima está louco?. 2012. Disponível em: Acesso em: 09 jan. 2017. WEIHS, M.; MERTENS, F. Os desafios da geração do conhecimento em saúde ambiental: uma perspectiva ecossistêmica. Cien Saude Colet, v. 18, n. 5, p. 1501-1510, 2013. XAVIER, M. P.; ARAÚJO, J. S. O conceito de saúde e os modelos de assistência: considerações e perspectivas em mudança / the concept of health and models of assistance: considerations and prospects in change. Revista Saúde em Foco, Teresina, v. 1, n. 1, 2014. 117BIOESTATÍSTICA E EPIDEMIOLOGIA DUARTE, A.� SANTOS, T.R.� CASTRO, A. G. O Ambiente e a Saúde. Porto Alegre: Instituto Piaget, 2003. EZZATI M.; et al. Comparative Risk Assessment Collaborating Group. Selected major risk factors and global and regional burden of disease. Lancet. v. 360, n. 9343, p.1347-60, 2002. FIALA, N. Efeito Estufa do Hambúrguer. Scientific American Brasil. 2009. Disponível em: http://www2. uol.com.br/sciam/noticias/efeito_estufa_dos_hamburgueres.html>Acesso em: 3 jan. 2017. FIOCRUZ. Glossário de Doenças da Fiocruz. 2013. Disponível em: . Acesso em: 9 jan. 2017. FOGAÇA, J. R. V. Tipos de tratamento de efluentes. Brasil Escola. Disponível em: . Acesso em: 28 dez. 2016. GAZETA RURAL. Agricultores obrigados a ter formação para usarem pesticidas. 2016. Disponível em: Acesso em: 10, jan. 2017. GECOM-TJAC. TJAC oferece atividades de ginástica laboral aos servidores. 2015. Disponível em: Acesso em: 10, jan. 2017. GIODA, A., DE AQUINO NETO, F. R. Comments on studies of industrial and non-industrial environments in Brazil: a comparative. Cad Saude Pública. v. 19, n. 5, p.1389-97, 2003. GLOBAL PARTNERSHIP TO ROLL BACK MALARIA. Using climate to predict infectious disease outbreaks: a review. Geneva: World Health Organization; 2004. HERZLICH, C. Health and illness on the eve of 21st century: from private experience to the public sphere and back. Physis: Revista de Saúde Coletiva, v. 14, n. 2, p. 383-394, 2004. Av. Marginal Leste, n. 3.600, Bairro dos Estados | CEP: 88.339-125 - Balneário Camboriú (SC) Telefone: (47) 3363-0631 | avantis@avantis.edu.br | www.avantis.edu,br autor APRESENTAÇÃO 1 – CONCEITOS BÁSICOS DE BIOESTATÍSTICA 3.2 O escore padrão e a estatística “Z” 3.3 Teste “t” de Student para uma amostra 3.4 Análise de Variância (ANOVA) 3.5 Teste Não-Paramétrico para Duas Amostras: Mann-Whitney (“U”) 3.6 Teste Não-Paramétrico para 3 ou mais Amostras: Kruskal-Wallis (“H”) 3.7 Considerações Finais do Capítulo 3 3 BIOESTATÍSTICA INFERENCIAL 3.1 Noções de Testes de Hipótese 2.1.1 Média aritmética simples 2.1.2 Mediana 2.1.3 Moda 2.1.4 Ponto médio 2.2 Medidas de Variação e Dispersão 2.2.1 Amplitude 2.2.2 Variância 2.2.3 Desvio-padrão 2.2.4 Coeficiente de variação 2.3 Distribuição de Frequências 2.3.1 Representações gráficas da distribuição de frequência 2.4 Relações entre Duas Variáveis 2.4.1 Regressão linear simples 2.4.2 Correlação linear simples 2.5 Considerações Finais do Capítulo 2 2 BIOESTATÍSTICA DESCRITIVA 2.1 Medidas de Tendência Central 1.1 Tipos de Dados Comuns nas Ciências da Saúde 1.2 Erro, Acurácia, Precisão e Arredondamento 1.3 Coleta de Dados em Populações e Amostras 1.4 Probabilidade 1.4.1 Probabilidade de um evento 1.4.2 Contando os resultados possíveis 1.4.3 Multiplicando e adicionando probabilidades 1.4.4 Modelos probabilísticos 1.4.4.1 Modelos para variáveis aleatórias discretas 1.4.4.2 Modelo para variáveis aleatórias contínuas 1.5 Considerações Finais do Capítulo 1 EPIDEMIOLOGIA 4 – CONCEITOS BÁSICOS DE EPIDEMIOLOGIA 7.2 Epidemiologia das Doenças Infecciosas 7.2.1 Reservatórios de agentes infecciosos 7.2.2 Saída do agente infeccioso e modos de transmissão 7.2.3 Entrada do agente no hospedeiro 7.2.4 Hospedeiro suscetível 7.2.5 Implicações para a saúde pública 7.3 – Epidemiologia das Doenças Não-Infecciosas 7.3.1 Características das doenças não-infecciosasextra, através do AVA. Também se houver dificuldade para a incorporação de definições necessárias ao desenvolvimento das atividades, nosso canal de comunicação está sempre aberto. Por fim, lembre-se que o ensino semipresencial traz grandes vantagens, como a possibilidade de você gerenciar seu tempo, mas também requer responsabilidade e dedicação. Sendo o principal interessado no ensino, você experimentará um aprendizado muito mais significativo. Boa sorte e até breve. 12BIOESTATÍSTICA E EPIDEMIOLOGIA BIOESTATÍSTICA 1 – CONCEITOS BÁSICOS DE BIOESTATÍSTICA O termo ‘estatística’ tem origem latina e deriva da palavra ‘estado’. Essa associação se deve à importância histórica da coleta de dados para os governos, em ações referentes a censos demográficos, recrutamentos militares e coleta de impostos. Em 1749, o professor alemão Gottfried Achenwall (1719 – 1772) utilizou pela primeira vez a palavra Statistik e somente 42 anos depois, registrou-se a primeira publicação do termo em inglês. Agora que sabemos a origem, precisamos entender o que significa realmente a palavra estatística. É muito comum encontrarmos o termo como sinônimo de dados. Por exemplo, ouvimos um narrador de futebol comentar sobre as estatísticas do jogo (referindo-se ao número de faltas, porcentagem de posse de bola etc.), o Ministério do Trabalho divulgar as estatísticas da mão-de-obra (tais como taxas de desemprego ou remuneração média do trabalhador), as Secretarias de Educação publicarem estatísticas do ensino médio (referindo-se à criação de novas vagas, à relação entre o número de professores e alunos, às taxas de evasão etc.). Ainda que seja possível encontrar essa definição em alguns dicionários, neste caderno de estudos utilizaremos o sentido científico de Estatística, que pode ser compreendido como a coleta ordenada, análise e interpretação de dados como o objetivo de apresentar e avaliar as conclusões baseadas nesses dados. Além disso, há outro significado – menos amplo – que aparecerá neste livro: refere-se à estimativa de um parâmetro populacional, a partir de uma amostra (veremos mais detalhadamente no item 1.3); nesse caso, a palavra deve ser escrita com a letra inicial minúscula. UNIDADE 1 CAPÍTULO 1 13BIOESTATÍSTICA E EPIDEMIOLOGIA Quando a estatística é aplicada a informações biológicas, chamamos de Bioestatística. Essa ciência tem se desenvolvido principalmente a partir do final do século XIX e é responsável pelo aumento da expectativa de vida ocorrida em todos os países do mundo e pela melhora nas condições de saúde das populações. Neste caderno, os termos Estatística e Bioestatística serão utilizados como sinônimos, uma vez que sempre trataremos de informações biológicas. 1.1 TIPOS DE DADOS COMUNS NAS CIÊNCIAS DA SAÚDE As características que podem se diferenciar entre uma entidade biológica e outra, tais como tamanho, cor, composição química etc., são os principais dados utilizados em Bioestatística. Esses dados (também chamados de variáveis) podem ser divididos de diversas formas, dependendo do objetivo e tipo de Estatística a ser utilizada. Em nosso curso utilizaremos uma classificação bastante simples, mas que é suficiente para alcançarmos os objetivos propostos. As variáveis qualitativas são representadas pelos dados que se encontram em categorias ou atributos. Podemos citar como exemplos a manifestação da cor dos olhos em mamíferos, classificação em macho ou fêmea, entre outras (é muito comum encontramos fenótipos genéticos nesse tipo de variável). As variáveis qualitativas podem ser divididas em nominais e ordinais. Os dados qualitativos nominais referem-se a atributos que não guardam entre si hierarquia, tais como homem e mulher, preto ou branco, tipo sanguíneo A, B, AB ou O etc. Já as variáveis qualitativas ordinais são atributos que têm relação de hierarquia entre si, tais como baixo peso, eutrófico, sobrepeso, obesidade. As variáveis quantitativas são mais comuns em Bioestatística, possibilitam resultados mais robustos, são representadas por valores numéricos e podem ser divididas em dois tipos. As variáveis quantitativas discretas representam (em geral) valores consecutivos e inteiros, tais como o número de dentes extraídos de um paciente, o número de consultas de um fisioterapeuta na semana etc. Já as variáveis quantitativas contínuas representam apenas aproximações dentro de um intervalo observado, como por exemplo, o peso inicial de um paciente submetido a uma dieta restritiva de calorias. Para ficar mais claro, suponha que o referido paciente tenha medido seu peso antes do tratamento em uma balança que informa apenas o número de quilogramas, sem decimais, e o valor foi 87 kg. Em seguida, ele utilizou uma balança que registra, além dos quilogramas, também seus decimais; nesse caso, seu peso foi igual a 86,8 kg. O mesmo indivíduo poderia ter seu peso medido em balanças cada vez mais precisas, apresentando pesos iguais Variáveis qualitativas: nominais (e.g. fator Rh positivo ou negativo) ordinais (e.g. primeira ou segunda dentição) 14BIOESTATÍSTICA E EPIDEMIOLOGIA a 86,83 kg, 86,825 kg e assim por diante. Perceba que as medições menos precisas são apenas arredondamentos que permitem definirmos um intervalo de valores contínuos; por isso, esse tipo de variável se chama quantitativa contínua. 1.2 ERRO, ACURÁCIA, PRECISÃO E ARREDONDAMENTO Acurácia representa a proximidade das medições coletadas em relação ao valor real da variável medida, enquanto precisão refere-se à proximidade dos valores de cada medição repetida em relação à mesma variável. A Figura 1 ilustra a diferença entre acurácia e precisão: Figura 1. Modelo ilustrativo de acurácia e precisão. Fonte: BUSSAB; MORETTIN, 1987 (adaptado). Todo pesquisador deve almejar grande acurácia e precisão. Contudo, erros acontecem e devemos estar preparados para representá-los. Para isso, é importante relembrar regras simples de arredondamento, que nos indicam que os números menores que 5 (cinco) devem ser rebaixados, enquanto números iguais ou maiores que 5 (cinco) devem ser aumentados, quando formos reduzir as casas decimais. Relembrando o exemplo do paciente submetido à dieta restritiva, perceba que seu peso na balança mais precisa, igual a 86,825 kg, foi arredondado para 86,83 kg, que, por sua vez, foi arredondado para 86,8 kg e, por fim, arredondado para 87 kg, na balança menos precisa. Nesse caso, o peso indicado nesta última balança representa um intervalo entre uma continuidade de valores entre 86,5 kg e 87,4 kg (pois ambos representam extremos de valores que seriam arredondados para 87 kg). Note que, mesmo na balança mais precisa, 86,825 Variáveis quantitativas: discretas (e.g. número de animais infectados) contínuas (e.g. altura de pacientes) 15BIOESTATÍSTICA E EPIDEMIOLOGIA kg representa apenas um intervalo entre 86,8245 kg e 86,8254 kg. Agora que você está familiarizado com as regras de arredondamento, podemos introduzir o conceito de acurácia representada pela indicação numérica da medição. Suponha que você tenha percebido uma lesão no pescoço de um paciente e a mediu, obtendo o resultado igual a 3 cm. A apresentação dessa informação, indicará que a referida lesão tem entre 2,5 cm e 3,4 cm (pois ambos os valores representam os valores extremos que devem ser arredondados para 3 cm, caso ocorram). Caso você apresente a mesma informação com uma casa decimal a mais, ou seja, 3,0 cm, qualquer observador treinado em Bioestatística saberá que se trata de uma lesão cujo tamanho tem entre 2,95 cm e 3,04 cm. Se ainda há dúvidas, podemos continuar aprofundando o mesmo exemplo. A representação da lesão como tendo 3,00 cm indica que seu verdadeiro valor está em uma continuidade de valores entre 2,995 cm e 3,004 cm; já 3,000 cm representa o intervalo entre 2,9995 e 3,0004 e assim por diante. 1.3 COLETA DE DADOS EM POPULAÇÕES E AMOSTRAS O objetivo principal da análisebioestatística consiste em inferir (i.e. deduzir) características de um grupo de variáveis através da generalização da análise de uma amostra desse grupo. Essa generalização pressupõe o conhecimento de importantes conceitos, tais como população e amostra, parâmetros e estatísticas, amostragens aleatórias e outliers. Em Bioestatística, o termo população tem um significado ligeiramente diferente do que se emprega no cotidiano. Biólogos e profissionais da saúde podem ser referir a populações como sendo um grupo de seres humanos ou outras espécies de animais. Contudo, para os bioestatísticos, população significa um grupo completo de variáveis sobre as quais se deseja tirar conclusões. Por exemplo, se uma pesquisadora pretende definir a altura média dos calouros do curso de Fisioterapia da Faculdade Avantis, a população será composta pelos valores que representam as alturas de todos os calouros do referido curso. Vale ressaltar que é de extrema importância delimitar a população de acordo com o objetivo da pesquisa, a fim de evitar extrapolações que introduzam vieses nos resultados das análises. Imagine se, por conveniência, a mesma pesquisadora coletasse as alturas de todos os alunos que estivessem na terceira aula de anatomia do primeiro período, sem se preocupar em identificar os alunos que são repetentes (e, portanto, não são calouros) ou os calouros que faltaram naquele dia. Se isso ocorresse, o objetivo passaria a ser a definição da altura média dos alunos daquela aula de anatomia. População: conjunto completo das variáveis de interesse Amostra: uma parte idealmente representativa da população Viés (pl. vieses): tendenciosidade ou erro sistemático 16BIOESTATÍSTICA E EPIDEMIOLOGIA Na realidade da pesquisa científica, quase nunca é possível obter dados da população inteira por diversos motivos, como recursos financeiros e humanos limitados, tempo reduzido e dinâmica populacional (morte, nascimento, ausências temporárias, mudança de categorias, entre outros motivos). Por isso, é muito comum utilizarmos amostras para inferir informações sobre a população. Amostras são partes da população que, de preferência, a represente bem. A qualidade da amostra depende do seu tamanho em relação à população (quanto maior a amostra, menor será o erro amostral) e da aleatoriedade da coleta das variáveis (é ideal que cada membro da população tenha a mesma probabilidade de ser escolhido para ser medido). Você certamente já participou de uma coleta de dados em que toda a população foi medida: aqui mesmo, na Faculdade Avantis, todos os alunos têm que preencher um formulário com sua data de nascimento; nesse caso, a instituição fez um censo (quando toda a população é medida). Lembra quando dissemos que, quanto maior a amostra, menor será o erro amostral? Pois é, no censo, o erro amostral é igual a zero, pois trata-se da maior amostra possível; essa amostra é a própria população. Importante ressaltar que, quando se mede variáveis de uma população (todos os membros que interessam para a pesquisa), temos um parâmetro; por exemplo, se medirmos a quantidade de calorias ingeridas por cada um dos ratos de um determinado biotério e dividirmos pelo número total de ratos, teremos um parâmetro populacional (a ingestão média de calorias). Já quando se mede variáveis de uma amostra (parte da população), temos uma estatística; retomando o exemplo, se escolhermos alguns ratos para realizar a medição e dividirmos o total de calorias medido pelo número de animais escolhidos, teremos uma estatística. Já comentamos que o tamanho da amostra é importante para a qualidade do resultado da pesquisa; agora vamos nos dedicar um pouco a discutir a aleatoriedade da coleta das variáveis. Imagine que um pesquisador esteja tentado comprovar que os alunos do curso de Enfermagem têm um IMC (índice de massa corporal) maior que os alunos de Nutrição, pois estes têm melhor conhecimento em dietética (ou qualquer outra hipótese). Para isso, ele decide medir o peso e a altura (necessários para calcular o IMC) de 10% dos alunos de cada curso, pois seria inviável medir todos. No momento da medição dos alunos de Enfermagem, ele escolhe os maiores, enquanto no curso de Nutrição, ele escolhe os menores alunos para garantir a confirmação da sua hipótese. É claro que isso não seria justo, tampouco teria relevância científica. Para evitar distorções desse tipo, que nem sempre são assim tão evidentes (às vezes ocorre sem intenção), há técnicas de amostragem probabilística que servem para garantir a aleatoriedade da amostra, permitindo que esta seja mais representativa da população. A seguir, serão apresentadas as quatro técnicas de amostragem probabilística mais importantes: Amostragem aleatória simples – todos os membros da população são computados e têm a mesma chance de ser escolhidos através de um sorteio. Apesar de ser a amostragem ideal, muitas vezes torna-se inviável; imagine que você pretenda identificar a porcentagem de pessoas com 17BIOESTATÍSTICA E EPIDEMIOLOGIA depressão na cidade e, para isso, queira utilizar a amostragem aleatória simples. Para início de conversa, você teria que ter o nome de todas as pessoas da cidade para realizar o sorteio, em uma grande urna, por exemplo (difícil, né?). Amostragem sistemática – os membros de uma população devem estar ordenados e, sem que o pesquisador saiba previamente a ordem, deve escolher o nésimo membro da população, sendo “n” um número escolhido de acordo com o tamanho da população. Suponha que você queira conhecer o número de pessoas deprimidas na sua sala de aula, sem perguntar para todo mundo; para isso, sem saber aonde estão localizados seus colegas de sala, você determina um número – 5, por exemplo – e pergunta ao quinto aluno da fila, depois ao 10º, depois ao 15º, ao 20º e assim por diante (a cada cinco colegas). Novamente perceba que, no caso de populações grandes, essa técnica se torna bastante difícil. Amostragem estratificada – a população é dividida em subpopulações relevantes para o estudo e uma porcentagem dessa subpopulação é medida. Voltando ao exemplo da determinação da porcentagem de depressão, você poderia decidir dividir a cidade em bairros e entrevistar uma porcentagem de cada bairro (1%, digamos). Dessa forma, cada bairro estaria representado de acordo com sua população. Amostragem por conglomerado – assim como na amostragem estratificada, a população também é dividida em subpopulações relevantes, mas desta vez, o pesquisador sorteia uma subpopulação e entrevista ou mede todos os seus membros. Dependendo do objetivo do estudo, esse tipo de amostragem pode introduzir muito viés e, por isso, deve ser utilizada com cautela. Imagine que você queira determinar a força média dos alunos de Educação Física e, para isso, divida a turma em homens e mulheres; ao sortear um grupo para ser medido, você estará privilegiando alunos que têm uma intensidade de força muito diferente do outro grupo, em média. Contudo, algumas vezes esse tipo de amostragem pode se revelar eficiente. Suponha que você trabalhe na Secretaria de Educação de Santa Catarina e decida determinar a qualidade do ensino através de visitas às escolas da rede estadual (isso realmente ocorre). Para isso, sortear algumas entre todas as escolas do estado (aleatória simples), escolher algumas em determinada ordem (sistemática) ou escolher uma porcentagem de cada cidade ou região (estratificada) tornaria o trabalho praticamente inviável, pois representantes teriam que se descolar para várias cidades. Nesse caso, a amostragem por conglomerado se mostra mais eficaz: você poderia dividir em grupos (cidades, por exemplo) e sortear duas ou três a cada ano, para que os representantes visitassem todas as unidades daquelas cidades. Outra consideração importante a fazer sobre variáveis coletadas de populações é que, ocasionalmente, conjuntos de dados têm variáveis que sãomuito discrepantes em relação ao restante da amostra; são os outliers. Suponha que você esteja tentando determinar o tamanho 18BIOESTATÍSTICA E EPIDEMIOLOGIA médio dos recém-nascidos em uma maternidade e, para isso, sorteou aleatoriamente 5 bebês; seus tamanhos em centímetros foram 41, 42, 45, 47 e 71. Perceba que o último membro da amostra apresenta um tamanho muito diferente do restante, sendo considerado um outlier. Sempre que um pesquisador se deparar com essa situação, a primeira providência é checar o registro, pois pode ter havido um erro de medição ou de marcação. Nessa pesquisa específica, você poderia verificar se o tamanho correto não seria 41 cm mas, por erro de digitação, foi computado 71. Se não for o caso, você poderia verificar se o indivíduo realmente é um recém-nascido ou é mais velho. Após todas as verificações, você pode concluir que realmente se trata de um valor correto e que dados muito diferentes da média podem ocorrer (realmente houve um recém-nascido norte-americano com essa estatura). Nesse caso, cabe ao pesquisador a decisão de acomodar a variável discrepante através de procedimentos estatísticos (que não serão discutidos aqui, pois extrapolam os objetivos do nosso curso), repetir o experimento com um novo conjunto de dados ou, até mesmo, excluí-la. 1.4 PROBABILIDADE A probabilidade é uma parte tão extensa da Matemática, que poderíamos ter um curso inteiro sobre ela. Contudo, para os propósitos dessa disciplina, poderemos resumi-la a apenas alguns tópicos que serão de interesse da Biologia e que também servirão para melhor aplicação dos conceitos da estatística inferencial, a qual será introduzida mais adiante. Em muitos casos, a probabilidade é intuitiva. Prova disso, é que quase qualquer pessoa deve responder corretamente se perguntada sobre a chance de se obter uma cara, ao jogarmos uma moeda que não seja viciada e que possua dois lados diferentes (cara e coroa). Infelizmente, nem sempre é possível identificar de pronto o resultado de um experimento que envolva probabilidade e, por isso, será necessário um maior aprofundamento no tema. Outliers: valores muito discrepantes em um conjunto de variáveis 19BIOESTATÍSTICA E EPIDEMIOLOGIA 1.4.1 Probabilidade de um evento Quando nos depararmos com probabilidade, uma fórmula básica poderá resolver a maior parte dos problemas: P(a) = probabilidade de ocorrer o evento “a”; a = número de vezes que ocorre o evento “a”; S = nº total de possíveis resultados para aquele experimento ou espaço amostral. Voltando ao exemplo da moeda não viciada, vamos utilizar a fórmula para calcular a probabilidade de se obter uma CARA ao jogarmos uma moeda. Fácil: a probabilidade do evento CARA, ou seja, P(CARA), é igual ao número de vezes que ocorre CARA, dividido pelo número total de possíveis resultados de uma moeda (espaço amostral) ou simplesmente: Isso significa que, ao jogarmos uma moeda não viciada, a probabilidade de se obter uma CARA é igual a 0,5 ou, se quisermos nos referir à porcentagem, basta multiplicar por 100; nesse caso, 50% (0,5 x 100). Agora que você já sabe o básico sobre o assunto, vamos a um exemplo mais adequado. Suponha que você seja uma fisioterapeuta que participa de um programa de residência, juntamente com outros 3 colegas e, num determinado dia, 4 pacientes precisam de atendimento urgente, sendo que três deles têm a necessidade de ventilação mecânica. Sabendo que cada profissional terá que atender um dos 4 pacientes, qual a probabilidade de você ter que realizar o procedimento de ventilação mecânica? Usando novamente a fórmula, temos: 20BIOESTATÍSTICA E EPIDEMIOLOGIA Você encontrará exercícios e mais exemplos no Ambiente Virtual de Aprendizagem. 1.4.2 Contando os resultados possíveis Nem sempre o espaço amostral (S) está claro. Sendo assim, muitas vezes será preciso calculá-lo antes de utilizar a fórmula básica. A condição mais frequente é quando um evento é composto por sucessivas fases. Nesse caso, o número de resultados possíveis de cada fase deve ser multiplicado, para chegarmos ao espaço amostral (S). Se cada fase possuir o mesmo número de resultados possíveis, podemos representar matematicamente por: k = número de resultados possíveis de cada fase; n = número de fases. Com isso em mente, vamos relembrar as aulas de genética. Uma série de três nucleotídeos é chamada de códon, que codifica um aminoácido. Lembrando que um nucleotídeo pode conter qualquer uma de 4 bases (adenina, citosina, guanina e timina), calcule o espaço amostral (S). Primeiramente, identificaremos o número de resultados possíveis de cada fase (k = 4). Em seguida, o número de fases (n = 3). Sendo assim, 21BIOESTATÍSTICA E EPIDEMIOLOGIA Agora que já sabemos contar resultados possíveis (espaço amostral) que não estejam evidentes, podemos calcular suas probabilidades. Desta vez, vamos usar um jogo para o exemplo. Suponha que você tenha jogado um par dados e queira saber a probabilidade de obter o número 12 na soma dos dois dados, supondo que estes não sejam viciados (esse jogo se chama craps e é muito comum em cassinos dos EUA e da UE). Primeiramente, relembre as fórmulas: Agora, vamos determinar o número de vezes que ocorre o evento escolhido. Para isso, pense como podemos obter a soma igual a 12 em dois dados. Há apenas 1 possibilidade: 6 no primeiro dado e 6 no segundo. Em seguida, devemos nos dedicar a encontrar o espaço amostral. Para isso, devemos saber qual é o número de resultados possíveis de cada fase (dado), ou seja 6 (1, 2, 3, 4, 5 ou 6), para, em seguida, elevarmos ao número de fases. Portanto, Você encontrará exercícios e mais exemplos no Ambiente Virtual de Aprendizagem. VAMOS REFLETIR: Se nosso mecanismo de “montagem” de aminoácidos permite 64 variedades diferentes, por que temos apenas 20 tipos? VAMOS REFLETIR: A probabilidade de se obter a soma dos dois dados igual a 7 seria maior, menor ou igual à probabilidade de se obter 12? 22BIOESTATÍSTICA E EPIDEMIOLOGIA 1.4.3 Multiplicando e adicionando probabilidades Outro recurso bastante útil para a Bioestatística refere-se às operações com probabilidades. Sempre que dois ou mais eventos forem condições obrigatórias para o resultado final, as probabilidades individuais devem ser multiplicadas. Já quando, em dois ou mais eventos mutuamente exclusivos, qualquer deles for condição para o resultado final, as probabilidades individuais devem ser somadas. Em resumo, quando for necessário determinar a probabilidade de uma condição E de outra (E de tantas quantas forem), deve-se multiplicar as probabilidades individuais; quando for necessário determinar a probabilidade de uma condição OU de outra (OU de tantas quantas forem), deve-se somar as probabilidades individuais. Por exemplo, suponha que na espécie humana, homens (♂) e mulheres (♀) nasçam na mesma proporção (na realidade, homens têm uma prevalência ligeiramente superior no nascimento). Sendo assim, podemos calcular a probabilidade de uma gestante qualquer ter uma menina (que será a mesma para um menino), Agora, se uma gestante qualquer, que pretenda ter dois filhos, nos perguntar sobre a probabilidade de ambos serem meninas ou ambos meninos ou um menino e uma menina, precisamos realizar operações com probabilidade: 1ª gravidez 2ª gravidez P(♀) = 0,5 P(♀) = 0,5 P(♂) = 0,5 P(♂) = 0,5 23BIOESTATÍSTICA E EPIDEMIOLOGIA Vamos começar respondendo qual é a probabilidade de a gestante ter duas meninas. Para isso, é necessário que a primeira gravidez gere uma menina E a segunda também. Assim, devemos multiplicar as probabilidades individuais: O mesmo pode ser feito para determinar a probabilidade de dois meninos: Já para uma menina e um menino, devemos levar em consideração duas possibilidades: um menino nascer na primeira e uma menina nascer na segunda gestação OU uma menina nascer na primeira e um menino nascer na segunda gestação. Para esse cálculo:Você encontrará exercícios e mais exemplos no Ambiente Virtual de Aprendizagem. 1.4.4 Modelos probabilísticos Modelos probabilísticos são ferramentas utilizadas para simplificar a realidade dos dados, sem que o pesquisador perca as principais características do conjunto das variáveis. Se soubermos a distribuição de um conjunto de variáveis aleatórias, podemos obter suas medidas de localização 24BIOESTATÍSTICA E EPIDEMIOLOGIA e variação (as quais discutiremos mais adiante). 1.4.4.1 Modelos para variáveis aleatórias discretas Você lembra o que são variáveis quantitativas discretas (se tiver dúvida, revise o item 1.1)? Para esse tipo de variável, dois modelos são muito utilizados. O primeiro é o modelo de distribuição binomial, utilizado para descrever situações em que a variável aleatória pode ser agrupada em apenas dois resultados possíveis (e.g. probabilidade de duas gestações gerar meninas ou não). Nesse tipo de modelo, a probabilidade de sucesso ou fracasso não muda de ensaio para ensaio e os eventos são idênticos e independentes. No exemplo da gestação, mesmo que uma mulher já seja mãe de cinco meninas, a próxima gravidez terá a mesma probabilidade da primeira, ou seja, aproximadamente 50% de nascer uma menina. Através do modelo binomial, podemos responder questões do tipo: qual a probabilidade de, em duas gravidezes, nascer 2 meninas, 1 menina ou nenhuma menina. Foi o que fizemos no exemplo do item 1.4.3, para exemplificar o cálculo de multiplicações e adições de probabilidade; o resultado, colocado em forma de modelo binomial foi: 0 menina 25% 1 menina 50% ou graficamente: 2 meninas 25% Outro modelo para descrever variáveis discretas é a distribuição de Poisson, que é muito útil quando se pretende descrever situações que ocorrem em um campo ou intervalo definido (geralmente área ou tempo), como, por exemplo, o número de infectados por H1N1 nos últimos dois meses ou o número de bactérias em uma placa de Petri. 0 ♀ 1 ♀ 2 ♀ 25BIOESTATÍSTICA E EPIDEMIOLOGIA 1.4.4.2 Modelo para variáveis aleatórias contínuas A mais importante distribuição contínua de probabilidade é a Distribuição Normal ou Gaussiana (também chamada Curva de Gauss). A maior parte dos dados biológicos tem essa distribuição. Alguns exemplos são alturas, pesos e outras características físicas, erros de medida em experimentos científicos, medidas de inteligência e aptidão, pontuações em testes variados e numerosas medidas e indicadores de saúde. Todo gráfico da distribuição normal é simétrico em torno da média da distribuição e tem forma de sino. Mais adiante veremos que diversas propriedades úteis para a confirmação ou refutação de hipóteses científicas nas Ciências da Saúde são derivadas da Curva de Gauss. Por enquanto, vamos nos concentrar nas suas características básicas. Um exemplo simples pode ajudar muito na compreensão. Suponha que você pese todos os alunos da faculdade e obtenha a média igual a 70 kg (esse será o centro da distribuição, ou seja, a coluna mais alta na Figura 2). Muitos alunos estarão próximos desse peso, enquanto poucos estarão muito abaixo ou muito acima desse peso (colunas à esquerda e à direita, que são mais baixas, representando menor frequência). Curva de Gauss Figura 2. Modelo de distribuição normal, com média igual a 70 kg e desvio-padrão igual a 10 kg. Fonte: o autor. Uma propriedade importante da curva normal é sua distribuição, que pode determinar a proporção dos valores que se encontram em qualquer amplitude específica. Por exemplo: 68,3% dos valores estarão a 1 desvio-padrão da média (estudaremos melhor essas medidas no capítulo seguinte), enquanto 95,4% dos valores devem estar a 2 desvios-padrão da média. 40 kg 50 kg 60 kg 70 kg 80 kg 90 kg 100 kg 26BIOESTATÍSTICA E EPIDEMIOLOGIA 1.5 CONSIDERAÇÕES FINAIS DO CAPÍTULO 1 Neste capítulo aprendemos que Bioestatística compreende a coleta ordenada, a análise e a interpretação de variáveis biológicas. Através desses procedimentos, o pesquisador que utiliza a Bioestatística pode apresentar e avaliar as conclusões baseadas nas variáveis coletadas. Essas variáveis, ou dados, podem ser classificados em qualitativos (que, por sua vez podem ser divididos em nominais e ordinais) e quantitativos (divididos em discretos e contínuos). Como vimos, alguns dados quantitativos podem apresentar valores muito diferentes do conjunto de variáveis (outliers); quando forem identificados devem ser conferidos, ajustados ou, até mesmo, excluídos, desde que haja justificativa. A partir do estudo do capítulo 1, você já é capaz de definir acurácia, que é representada pela proximidade das medições em relação aos valores reais, e precisão, que é representada pela proximidade das medições entre si (mesmo que não sejam próximas do valor real). Além disso, podemos diferenciar populações (conjunto completo de variáveis de interesse) de amostras (subconjuntos da população) e perceber a importância do tamanho amostral para a determinação do erro (quanto maior a amostra, menor será o erro amostral). Outra consideração importante sobre coleta de variáveis é a técnica de amostragem utilizada; neste capítulo, vimos 4 técnicas de amostragem probabilística que podem ser usadas em estudos científicos: aleatória simples, sistemática, estratificada e por conglomerado. Neste primeiro capítulo você também trilhou os primeiros passos na probabilidade e já consegue calcular as chances de um evento qualquer ocorrer simplesmente dividindo o número de vezes que esse evento ocorre pelo número total de ocorrências possíveis, também chamado de espaço amostral (ou P (a) =a/S). Mesmo quando não está claro o tamanho do espaço amostral, como, por exemplo, quando um experimento é composto por mais de uma fase, você consegue defini-lo através da multiplicação dos espaços amostrais individuais (ou, quando todos os espaços amostrais forem iguais, através da fórmula S=kn). Também vimos como realizar operações, adicionando (quando uma condição OU outra for exigida para o resultado final) e multiplicando (quando uma condição E outra for exigida) probabilidades individuais em eventos mutuamente exclusivos. Por fim, fomos apresentados aos modelos probabilísticos mais importantes para variáveis discretas (binomial e Poisson) e para variáveis contínuas (Curva de Gauss ou normal). No próximo capítulo aprenderemos as principais técnicas para apresentação de dados biológicos: a Bioestatística descritiva. 27BIOESTATÍSTICA E EPIDEMIOLOGIA 2 BIOESTATÍSTICA DESCRITIVA Agora que estamos mais familiarizados com alguns conceitos da Bioestatística, podemos iniciar alguns cálculos. A partir de agora, um pouco de conhecimento de matemática básica será bastante útil. Se tiver dificuldade, experimente o nivelamento no Ambiente Virtual de Aprendizagem. Como já citamos, a Bioestatística descritiva é responsável por descrever nossas variáveis ou dados de diversas formas, de acordo com o objetivo do trabalho científico ou das intenções do pesquisador. 2.1 MEDIDAS DE TENDÊNCIA CENTRAL Tanto em amostras como em populações de variáveis, podemos encontrar valores que são próximos do centro das observações. A descrição desses parâmetros ou estatísticas (lembra-se da diferença? Se não, revise o item 1.3) pode ser feita através de diversas medidas que são úteis para descrever propriedades importantes das populações. CAPÍTULO 2 28BIOESTATÍSTICA E EPIDEMIOLOGIA 2.1.1 Média aritmética simples A medida de tendência central mais utilizada é a média aritmética simples, muitas vezes referida apenas como média. Para facilitar a compreensão e adequarmos nossa linguagem às expressões utilizadas em concursos, vestibulares, ENEM e ENADE, vamos indicar os símbolos que representam os itens que compõem as fórmulas que usaremos (uma lista completa desses símbolos pode ser encontrada no AVA). Cada medidaou variável será representada pela letra X; portanto, se medirmos a glicemia de três pessoas para calcularmos a média do índice glicêmico desses três indivíduos, as medições seriam X 1 , X 2 e X 3 . De forma geral, X i indica que o número de variáveis é indeterminado, podendo assumir qualquer valor integral, que será igual ao tamanho do conjunto de dados (no nosso exemplo, nossas medições vão até X 3 ). Falando em tamanho do conjunto de dados, a letra “N” (maiúscula) representa o número de variáveis de uma população, enquanto a letra “n” (minúscula) representa o número de variáveis de uma amostra. Outro símbolo utilizado na fórmula da média é o “∑” (letra grega sigma maiúscula). Por fim, a letra grega “µ” (letra grega mu minúscula) representa a média populacional, enquanto o símbolo (leia “x barra”) representa a média amostral. Ou seja, para obtermos a média, basta somar os valores de todas as variáveis e dividir o resultado pelo número de variáveis. Por exemplo, suponha que alguém pretenda descrever a média de comprimidos que seus 3 pacientes ingerem por semana, sabendo que o paciente A ingere 4 comprimidos, o paciente B ingere 5 comprimidos e o paciente C ingere 6 comprimidos. Como já descrito, basta somar os três valores (4 + 5 + 6 = 15) e dividir o resultado pelo número de variáveis (N = 3 pacientes); a média aritmética simples para esse conjunto de dados é: Note que foi utilizado ”, pois estamos considerando que o pesquisador possui apenas 3 pacientes (portanto, não é uma amostra, mas sim a população). Caso as variáveis fossem obtidas de uma amostra (e.g. número de comprimidos dos 3 pacientes mais idosos), apenas deveríamos 29BIOESTATÍSTICA E EPIDEMIOLOGIA trocar por “ , mas o cálculo e o resultado não mudariam. Você encontrará exercícios e mais exemplos no Ambiente Virtual de Aprendizagem. 2.1.2 Mediana A mediana é definida com a variável que se encontra no centro de um conjunto ordenado de dados. Sendo assim, há exatamente o mesmo número de variáveis que se encontram acima e que se encontram abaixo da mediana. Considere as seguintes medições da pressão arterial sistólica, em mmHg, de 5 indivíduos que serão submetidos a cirurgias simples no seu consultório: (123, 144, 112, 156 e 109). Para o cálculo da mediana, primeiramente devemos ordenar (do menor para o maior valor) esse conjunto de dados; sendo assim: (109, 112, 123, 144 e 156). Agora é só identificar o valor central, ou seja, a mediana desse conjunto de variáveis é igual 123 mmHg. Fácil? Infelizmente, não é tudo. Quando o valor de “N” ou “n” (lembra o que significa?) for ímpar, como no nosso exemplo (n = 5), sempre existirá UM valor central. Contudo, quando “N” for par, não teremos exatamente um valor central. Veja o exemplo a seguir: um dentista pretende descrever a mediana do número de cáries de 4 pacientes, que possuem respectivamente 2, 5, 3 e 9 cáries. Para isso, ele coloca as medições em ordem (2, 3, 5 e 9) e verifica que não há somente um valor central, mas sim 2 (3 e 5). Sempre que o valor de “n” for um número par, deve-se calcular a média aritmética simples dos dois valores centrais. Nesse caso, a mediana é igual a 4 (pois a média entre 3 e 5 é = (3+5) / 2 = 4). A fórmula geral da mediana é: 30BIOESTATÍSTICA E EPIDEMIOLOGIA Note que o resultado da expressão subscrita “(n+1)/2” representa a posição da variável “X”, em um conjunto de dados ordenados, que indica o valor da mediana. Retomando o primeiro exemplo, temos: (109, 112, 123, 144 e 156) X 1 X 2 X 3 X 4 X 5 Já para o segundo exemplo: (2, 3, média X 2 e X 3 5, 9) X 1 X 2 X 2,5 X 3 X 4 temos que calcular o valor médio entre X 2 e X 3 (X 2,5 ), ou seja, 4. A mediana é uma medida de tendência central muito útil em casos específicos. Por exemplo, quando algumas medições não podem ser realizadas por impossibilidade instrumental (e.g. um aparelho que não consegue medir valores muito baixos ou muito altos). Observe: Suponha que um pesquisador mediu o nível de serotonina no lobo frontal de 3 presidiários com um instrumento que possibilita o registro de valores a partir de 9 µg (microgramas). No primeiro indivíduo, o valor foi de 17 µg, no segundo 11 µg e no terceiro o valor não foi visualizado no instrumento, pois ficou abaixo de 9 µg. Sendo assim, os dados foram ordenados (o maior e o menor valor de um conjunto de dados quantitativos. Vamos direto a um exemplo: suponha que você queira descrever a amplitude de um conjunto de variáveis formado pela frequência cardíaca de 3 bebês, cujas medições foram 122, 154 e 133 batimentos por minuto. A fórmula geral e o cálculo para esse exemplo são apresentados a seguir: Assim como a mediana e o ponto médio (tendência central), a amplitude também pode deixar de lado uma parte da informação sobre os dados, pois é calculada a partir de valores extremos somente. 2.2.2 Variância Uma maneira de calcular a dispersão utilizando todas as observações é através da medição da distância entre cada variável em relação à média do conjunto de variáveis. É exatamente isso que o cálculo da variância faz. Contudo, se a média é a medida de tendência central que leva em consideração todos os dados e estes se afastam da média tanto para mais como para menos, o resultado de qualquer cálculo que leve em consideração a diferença das variáveis em relação à média, não seria sempre igual a zero? Vejamos um exemplo. Suponha que você trabalhe em um hemocentro e está responsável por verificar a quantidade média de sangue em um conjunto de três bolsas. Após medi-las, você constatou que elas possuem respectivamente 110 ml, 120 ml e 160 ml. Você inicialmente calcula a média, conforme já estudamos: 34BIOESTATÍSTICA E EPIDEMIOLOGIA Em seguida, calcula a diferença entre cada variável e a média do conjunto: 110 – 130 = – 20 120 – 130 = – 10 após, calcule a soma das diferenças 160 – 130 = + 30 A diferença sempre será igual a zero. Para resolver esse problema, no cálculo da variância, cada valor que representa a diferença entre as variáveis e a média do conjunto (no nosso exemplo ) é elevado ao quadrado. Lembre-se que qualquer número elevado a expoente par, torna-se positivo. Antes de partirmos para a fórmula, precisamos compreender mais um conceito. A variância populacional é representada pela letra grega “σ2”, enquanto a variância amostral é representada pela letra “s2”, assim como acontece no cálculo da média (onde uma letra grega representa a média populacional e uma letra latina representa a média amostral). Contudo, no caso da variância, o cálculo é ligeiramente diferente, como se observa nas fórmulas: Retomando nosso exemplo, e considerando que as três bolsas de sangue representam uma amostra, acompanhe o cálculo da variância amostral: Se as três bolsas de sangue medidas fossem as únicas bolsas existentes, teríamos toda a população. Nesse caso, perceba a diferença no cálculo da variância populacional: 35BIOESTATÍSTICA E EPIDEMIOLOGIA Note que, por mais estranho que pareça, a unidade da variância ( ) está ao quadrado em relação à unidade original (ml). Isso acontece porque elevamos todas as variáveis ao quadrado. Você encontrará exercícios e mais exemplos no Ambiente Virtual de Aprendizagem. 2.2.3 Desvio-padrão Ufa! A explicação sobre o cálculo da variância foi extensa. Isso se deve porque essa medida de dispersão não é tão comum no nosso dia a dia (como a média), nem tão simples (quanto a moda ou a amplitude). Porém, se você conseguiu compreender, já estará apto a calcular o desvio-padrão, que é a medida de dispersão mais utilizada. O desvio-padrão é simplesmente a raiz quadrada da variância. Lembra que no cálculo da variância colocamos todos os dados ao quadrado? Então, agora vamos fazer a operação inversa (o inverso da potência é a raiz). Com isso, teremos novamente a unidade da medida de dispersão igual à unidade das variáveis. Analise a fórmula do desvio-padrão populacional e do desvio-padrão amostral: ou somente Como você já deve ter percebido, o desvio-padrão populacional é representado pela letra grega “σ”, enquanto o desvio-padrão amostral é representado pela letra latina “s”. Vamos continuar no cálculo de medidas de dispersão para as bolsas de sangue. Se você quiser 36BIOESTATÍSTICA E EPIDEMIOLOGIA descrever a variação dos dados através do desvio-padrão, basta calcular a raiz quadrada da variância (aproveitamos os cálculos acima), como segue: Você encontrará exercícios e mais exemplos no Ambiente Virtual de Aprendizagem. Agora que você sabe melhor o que essa medida de dispersão significa, que tal retornar ao item 1.4.4.2? Lá você encontrará os parâmetros de dispersão da Curva de Gauss (ou normal) baseados no desvio-padrão a partir da média. 2.2.4 Coeficiente de variação As medidas de variação que estudadas até agora têm magnitudes que são dependentes das magnitudes dos dados. A amplitude e o desvio-padrão têm a mesma unidade das variáveis, enquanto a variância tem o quadrado da unidade das variáveis. Contudo, algumas vezes nos deparamos com conjuntos de variáveis que possuem unidades com escalas diferentes, como por exemplo o número de dentes de um adulto e o número de dentes de uma criança. Suponha que você queira comparar a variação no número de dentes cariados de um grupo de 3 adultos com o número de dentes cariados de um grupo de 3 crianças. Para isso, você coletou os seguintes dados: adultos (8, 10 e 12 dentes cariados) e crianças (3, 5 e 7 dentes cariados). Como você já deve saber, as médias desses dois conjuntos de dados são: e . Calculando o desvio-padrão dessas duas amostras, temos: 37BIOESTATÍSTICA E EPIDEMIOLOGIA Em ambos os casos, o valor do desvio-padrão foi igual a dois, o que pode levar um pesquisador a acreditar que a dispersão ou variabilidade dos dois grupos foi igual. Contudo, temos que lembrar que os grupos têm escalas diferentes, já que o número de dentes na arcada de uma criança é menor que o número de dentes na arcada de um adulto (e, principalmente, suas médias são diferentes). Quando isso acontece, só poderemos comparar as dispersões ou variabilidades utilizando o coeficiente de variação, muitas vezes representado pelas letras CV. Essa medida de dispersão é simplesmente a divisão do desvio-padrão do grupo, pela média do mesmo grupo; matematicamente: Outro detalhe importante refere-se à unidade do coeficiente de variação. Como o desvio- padrão e a média têm a mesma unidade, a divisão entre eles a anula e, portanto, o CV não tem unidade. Porém, se quisermos multiplicar seu resultado por 100, teremos uma porcentagem, o que pode ser bastante útil para apresentar a variação. Vejamos então, qual dos dois grupos do nosso exemplo realmente variou mais. VAMOS REFLETIR: Se esses dados fossem verdadeiros, como você explicaria a maior variabilidade identificada no grupo das crianças? 38BIOESTATÍSTICA E EPIDEMIOLOGIA 2.3 DISTRIBUIÇÃO DE FREQUÊNCIAS A distribuição de frequências é uma forma bastante prática e útil de descrever os dados, principalmente quando o “n” é muito grande. Essa forma de descrever os dados pode ser utilizada para variáveis qualitativas, como podemos observar na seguinte tabela de distribuição de frequências: Tabela 1. Frequências observada e relativa supostas de 200 indivíduos em função do tipo sanguíneo. Tipo sanguíneo (classes) Frequência observada (nº de dados por classe) Frequência relativa (total / nº cada classe) A 10 0,05 ou 5% B 20 0,1 ou 10% AB 40 0,2 ou 20% O 130 0,65 ou 65% Total 200 1 ou 100% Fonte: o autor. Contudo, nesse nosso curso de Bioestatística, estamos mais interessados nas distribuições de frequências de dados quantitativos. Porém, dividir as classes em conjuntos com variáveis quantitativas exige alguns passos adicionais. Primeiramente, devemos definir o número de classes. Há várias sugestões e você, quando for construir uma tabela de distribuição de frequências para descrever seus dados em uma pesquisa real, pode escolher a que melhor lhe convier, desde seja justificada a escolha. O cálculo mais difundido para determinar o número de classes é a Fórmula de Sturges: , onde “k” é o número de classes e “n” o tamanho da amostra. Já a sugestão mais simples (e utilizada por autores da nossa bibliografia)é simplesmente . Em nossos exemplos e avaliações, utilizaremos esta última fórmula, que apresenta uma ótima aproximação da fórmula de Sturges, exceto quando as amostras forem muito grandes ou muito pequenas. Agora que definimos o cálculo do número de classes ( ), precisamos determinar o intervalo de cada classe (muitas vezes indicado pela letra “h”). Para isso, não há dúvidas; apenas divida a amplitude do conjunto de dados pelo número de classes previamente calculado, ou seja, . Realizados esses passos, basta montarmos nossa tabela de distribuição de 39BIOESTATÍSTICA E EPIDEMIOLOGIA frequência para variáveis quantitativas. Vamos a um exemplo. Suponha que um fisioterapeuta tenha coletado dados sobre o número de pacientes com escaras em determinado hospital, nos últimos 9 anos e obtido os seguintes resultados: (3, 5, 8, 8, 9, 10, 10, 14 e 15). Como já vimos, o número de classes será igual a 3 ( , sendo n = 9); o intervalo de cada classe será igual 4 ( ). A primeira classe se inicia pelo menor número do conjunto de dados (3, nesse caso), e tem uma amplitude de classe igual a 4, conforme h calculado. Portanto, a primeira classe vai de 3 (limite inferior) até 7 (que é o resultado de 3 + 4, e que é seu limite superior). A segunda classe se inicia com o limite superior da primeira classe (7) e termina em 11 (7 + 4). Por fim, a última classe se inicia com o limite superior da segunda classe (11), indo até 15 (11 + 4). Relembrando, o conjunto das variáveis é (3, 5, 8, 8, 9, 10, 10, 14 e 15). O profissional já tem os parâmetros necessários para preencher a tabela de distribuição de frequências, que ficaria assim: Tabela 2. Tabela de distribuição de frequências do número de pacientes com escaras em um hospital nos últimos 9 anos (dados fictícios). Classes (k) Limite inf. ; Limite sup. (intervalo de classe: h) Frequência observada (F i ) C1 2 C2 5 C3 2 Fonte: o autor. Vamos relembrar as notações do intervalo de classe que aprendemos no ensino médio. Os colchetes fechados indicam que o intervalo começa ou termina no número grafado dentro dele, enquanto o colchete aberto indica o limite, excluindo o próprio número grafado. Sendo assim, no exemplo acima, o intervalo indica que, se houver um número 3 no conjunto de dados, ele deve ser computado nesta classe (colchete fechado), mas se houver um número 7, não (colchete aberto). Outra consideração importante, refere-se às informações adicionais em uma tabela de distribuição de frequência. Muitas vezes, você irá se deparar com a frequência relativa (assim como no exemplo das variáveis qualitativas acima), que nada mais é do que a porcentagem das observações em cada classe, e a frequência acumulada, que, como o próprio nome diz, é a soma das observações da classe com as observações das classes anteriores. 40BIOESTATÍSTICA E EPIDEMIOLOGIA 2.3.1 Representações gráficas da distribuição de frequência Lembre-se que as distribuições de frequência são úteis principalmente quando coletamos e descrevemos grandes quantidades de dados (apesar de que, para fins didáticos, utilizamos conjuntos pequenos em nossos exemplos). A partir das tabelas de distribuição de frequência que acabamos de aprender a montar, podemos apresentar os dados através de gráficos adequados a esse tipo de informação. O principal tipo de gráfico de distribuição de frequência é o histograma, que nada mais é do que um gráfico de colunas, onde no eixo x (horizontal) estão indicadas as classes e no eixo y (vertical) estão indicadas as frequências observadas. O outro tipo de gráfico é o polígono de frequências, que é um gráfico de linhas de uma tabela de frequências, que se inicia e termina no zero, passando necessariamente pelos pontos representados pelas frequências observadas. Tendo como base o exemplo anterior, um histograma e um polígono de frequências seriam plotados assim: Figura 3. Histograma e polígono de frequências referentes ao número de pacientes com escaras em um hospital nos últimos 9 anos (dados fictícios). Fonte: o autor. 2.4 RELAÇÕES ENTRE DUAS VARIÁVEIS A descrição das relações entre variáveis pode fornecer informações importantes sobre as características dos dados. Em nosso curso, estudaremos apenas as técnicas que consideram relações entre duas variáveis. Contudo, ressaltamos que há outros procedimentos que consideram que, para fins didáticos, utilizamos conjuntos pequenos em nossos exemplos). A (horizontal) estão indicadas as classes e no eixo (vertical) estão indicadas as em um hospital nos últimos 9 anos (dados fictícios). 0 1 2 3 4 5 C1 C2 C3 Nú m er o de o bs er va çõ es Classes Histograma do número de escaras nos últimos 9 anos 0 1 2 3 4 5 C1 C2 C3 Nú m er o de o bs er va çõ es Classes Polígono de frequência do número de escaras nos últimos 9 anos 41BIOESTATÍSTICA E EPIDEMIOLOGIA a relação entre mais de duas variáveis, como a correlação e a regressão múltiplas. Você já deve ter ouvido falar em características que variam de acordo com a variação de outras características como, por exemplo, que o peso de uma pessoa está relacionado à sua altura ou que a quantidade de cigarros que uma pessoa fuma por dia está relacionada com a probabilidade que essa pessoa tem de desenvolver câncer de pulmão, entre muitas outros. Essa relação entre as variáveis pode ser de dependência de uma sobre a outra. Nesse caso, utilizaremos as técnicas de regressão linear simples para descrever o grau e a direção das variações dos dados. Contudo, há casos em que a relação entre as variáveis não é estabelecida por uma dependência. Quando isso ocorre, devemos utilizar as técnicas de correlação linear simples para descrever o grau e a porcentagem de variação em comum dos dois conjuntos de variáveis. Ainda que as duas técnicas procurem descrever a relação linear entre duas variáveis, você já começa a perceber a diferença entre regressão e correlação. Então vamos nos aprofundar mais um pouco. 2.4.1 Regressão linear simples Quando a relação entre duas variáveis apresenta uma dependência funcional de uma sobre a outra, podemos usar a regressão simples para descrever essa relação ou mesmo estimar ou interpolar medições. Nesses casos, a magnitude de uma das variáveis (chamada de variável dependente) é determinada pela magnitude de outra variável (que chamamos de independente), enquanto o contrário não é verdadeiro. Por isso, na regressão é essencial sabermos determinar qual é a variável dependente e qual é a variável independente. Por exemplo, considerando que haja uma relação entre a pressão arterial e a idade em humanos, qual das variáveis você acha que é a independente, ou seja, a que determina a variação da outra? É claro que a idade é a variável independente, pois sua magnitude impõe uma variação na magnitude da pressão arterial, enquanto o contrário não é verdadeiro. Não seria lógico supormos que uma pressão arterial alta ou baixa determine a idade de uma pessoa, certo? Também é claro que, apesar de não ser o único fator, podemos facilmente considerar a idade um dos fatores determinantes da pressão arterial. Uma maneira simples e conveniente de descrever as relações entre variáveis é através de um gráfico de dispersão (também conhecido como scatter plot). Vejamos um exemplo: imagine que a Tabela 3 contém informação sobre a medição da pressão arterial sistólica de 4 pessoas, juntamente com suas idades. 42BIOESTATÍSTICA E EPIDEMIOLOGIA Tabela 3. Pressão arterial sistólica e idades supostas de 4 pessoas. Pressão arterial sistólica (em mmHg) Idade (em anos) 120 28 145 45 140 40 170 65 Fonte: o autor. Uma forma bastante informativa é plotar os dados da variável dependente no eixo Y do gráfico (vertical) e os dados da variável independente no eixo X (horizontal). Sendo assim, Figura 4. Gráfico de dispersão de valores de pressão arterial sistólica em função da idadeem transmissão direta (por contato direto ou propagação de gotículas) e indireta (transportada pelo ar, por veículos ou vetores mecânicos e biológicos). Na transmissão direta, um agente infeccioso é transferido de um reservatório para um hospedeiro susceptível por contato direto ou propagação de gotículas. O contato direto ocorre através do contato de pele com pele, beijo ou relações sexuais. O contato direto também se refere ao contato com o solo ou vegetação que abrigam organismos infecciosos. Por exemplo, a mononucleose infecciosa (conhecida como doença do beijo) e a gonorreia são disseminadas de pessoa para pessoa por contato direto, enquanto a ancilostomíase (vermes) é espalhada pelo contato direto com solo contaminado. Outra forma de transmissão direta é a dissipação de gotículas ou aerossóis de curto alcance, produzidos por espirros, tosse ou até mesmo conversação. A coqueluche e a infecção meningocócica são exemplos de doenças transmitidas de um doente infeccioso a um hospedeiro susceptível por disseminação de gotículas. A transmissão indireta ocorre quando há transferência de um agente infeccioso de um reservatório para um hospedeiro por partículas de ar suspensas (diferentemente da transmissão direta por gotículas de curto alcance), veículos (objetos inanimados) ou vetores (intermediários vivos). A transmissão pelo ar ocorre quando os agentes infecciosos são transportados por núcleos de pó ou gotículas suspensas no ar. A poeira transportada pelo ar inclui material que se assentou em superfícies e novamente se tornou suspenso por correntes de ar, bem como partículas contendo agente transmissor sopradas pelo vento. Pequenas gotículas, de tamanho inferior a 5 micrômetros, podem permanecer suspensas no ar por longos períodos, bem como podem ser sopradas a longas distância, em contraste com as gotículas de curto alcance (transmissão direta). Os veículos que podem transmitir indiretamente um agente infeccioso incluem alimentos, água, produtos biológicos (sangue) e fômites (objetos inanimados, como lenços, cama ou bisturis cirúrgicos). Um veículo pode transportar passivamente um patógeno, como acontece com o vírus da Hepatite A, ou o veículo pode propiciar um ambiente adequado para o crescimento e multiplicação do agente que produz toxina, como acontece em produtos enlatados contaminados com Clostridium botulinum (toxina botulínica). Vetores são organismos vivos, tais como mosquitos e artrópodes, que podem transportar um agente infeccioso através de meios puramente mecânicos ou podem permitir a manutenção e reprodução desse agente. São exemplos de transmissão mecânica moscas carregando Shigella em seus apêndices e pulgas de ratos carregando Yersinia pestis (peste) em seu intestino. Na transmissão biológica, o agente causador geralmente sofre maturação em um hospedeiro intermediário, antes de ser transmitido ao homem, como ocorre com a malária. Fômite: objeto inanimado capaz de absorver e transportar agentes infecciosos. 103BIOESTATÍSTICA E EPIDEMIOLOGIA 7.2.3 Entrada do agente no hospedeiro O portal de entrada refere-se à maneira pela qual um patógeno entra num hospedeiro susceptível. Esse portal deve permitir acesso aos tecidos nos quais o patógeno irá se multiplicar ou onde a toxina poderá agir. Os agentes infecciosos podem se utilizar do mesmo portal de entrada e saída, como por exemplo o vírus da gripe, que sai do trato respiratório do hospedeiro de origem e entra no trato respiratório de um novo hospedeiro, ou utilizar portais diferentes, como por exemplo os muitos patógenos que causam gastroenterite seguem a chamada rota “fecal-oral” porque saem do hospedeiro-fonte nas fezes, são levados em mãos inadequadamente lavadas para um veículo, como comida, água ou utensílios, e entram em um novo hospedeiro através da boca. Outros portais de entrada incluem a pele (ancilostomíase), mucosas (sífilis) e sangue (Hepatite B, vírus da AIDS). 7.2.4 Hospedeiro suscetível A ligação final na cadeia de infecção é um hospedeiro susceptível. A susceptibilidade de um hospedeiro depende de fatores genéticos ou estruturais do indivíduo, assim como da sua imunidade específica e outros fatores que afetam a capacidade do hospedeiro definitivo em resistir à infecção ou limitar a patogenicidade. A composição genética de um indivíduo pode aumentar ou diminuir a suscetibilidade. Um exemplo clássico é o de pessoas com traço de anemia falciforme, que estão protegidas contra um determinado tipo de malária. Já a imunidade específica refere-se a anticorpos protetores que são direcionados contra um agente específico. Esses anticorpos podem se desenvolver em resposta a infecção prévia, a uma vacina ou a uma toxina que foi desativada, mas mantém a sua capacidade para estimular a produção de anticorpos ou ainda por transferência da placenta da mãe para o feto. Outros fatores não específicos que defendem contra infecção incluem a pele, membranas mucosas, acidez gástrica, cílios no trato respiratório, o reflexo da tosse e resposta imune inespecífica. Por outro lado, alguns fatores podem aumentar a suscetibilidade à infecção por perturbar as defesas do hospedeiro, tais como desnutrição, alcoolismo e doença ou terapia que prejudica a resposta imunológica inespecífica, como a quimioterapia. 104BIOESTATÍSTICA E EPIDEMIOLOGIA 7.2.5 Implicações para a saúde pública O conhecimento das vias de saída e entrada dos patógenos, bem como dos seus modos de transmissão fornece uma base para a determinação de medidas de controle apropriadas. Essas intervenções dependem da dinâmica da infecção e são direcionadas para controlar ou eliminar o agente na fonte de transmissão, proteger vias de entrada ou aumentar as defesas do hospedeiro. Para algumas doenças, a intervenção mais adequada pode ser dirigida para controlar ou eliminar o agente na sua fonte, como por exemplo, quando um paciente com doença transmissível é tratado com antibióticos ou quando o solo é descontaminado ou isolado para evitar a dispersão do agente. Outras intervenções são direcionadas para o modo de transmissão, como acontece quando um paciente infectado é isolado ou há a recomendação de evitar um tipo específico de contato associado ao modo de transmissão, como aconteceu há alguns anos com a água benta que transmitia H1N1 em igrejas católicas. A transmissão de agentes por veículos inanimados pode ser interrompida pela eliminação ou descontaminação do objeto, enquanto que, para evitar a transmissão fecal-oral, os esforços às vezes se concentram em reorganizar o ambiente para reduzir o risco de contaminação no futuro e em mudar comportamentos, como o incentivo para que os indivíduos lavem as mãos. Para doenças cujos agentes são transportados pelo ar, as estratégias podem ser direcionadas para modificação da ventilação ou da pressão do ar, além de filtragem e tratamento do ar. Por fim, para interromper a transmissão por vetores, as medidas podem ser dirigidas para o controle da população desses vetores, tal como a pulverização de inseticidas para reduzir a população de mosquitos. Algumas estratégias que protegem os portais de entrada são simples e eficazes. Por exemplo, mosqueteiros, repelentes e utilização de blusas e calças compridas para evitar picadas de mosquitos que transmitem doenças ou uso de máscara e luvas, que se destinam a proteger o dentista do sangue e outras secreções de um paciente, bem como para proteger o paciente do dentista. Outras intervenções priorizam o aumento das defesas do hospedeiro, como o uso profilático de medicamentos antimaláricos, recomendado para visitantes de áreas endêmicas de malária, que não previne a exposição por picadas de mosquito, mas evita que a infecção se estabeleça, ou o uso de vacinas, que promovem o desenvolvimento de anticorpos específicos que protegem contra a infecção. Em relação às vacinas, um conceito importante é o da imunidade de rebanho, oqual sugere que, se uma proporção suficientemente alta de indivíduos em uma população é 105BIOESTATÍSTICA E EPIDEMIOLOGIA resistente a um agente, então os poucos suscetíveis serão protegidos pela maioria resistente, uma vez que o patógeno dificilmente encontrará um hospedeiro suscetível. A porcentagem da população necessária para adquirir a imunidade de rebanho com a finalidade de prevenir ou interromper um surto ou epidemia varia de acordo com a doença. Um perigo associado a esse conceito é que, em populações altamente imunizadas, as poucas pessoas suscetíveis são frequentemente agrupadas em subgrupos definidos por fatores socioeconômicos ou culturais. Se o patógeno for introduzido em um desses subgrupos, pode ocorrer um surto ou epidemia. Na prática, a imunidade de rebanho não impediu surtos de sarampo e rubéola em populações com níveis de imunização tão elevados como 85% e 90% nos Estados Unidos nas últimas décadas. 7.3 – EPIDEMIOLOGIA DAS DOENÇAS NÃO-INFECCIOSAS No início da Epidemiologia, o único foco de investigação eram as doenças infecciosas, que eram a causa de elevadas taxas de morbidade e mortalidade. Contudo, após a revolução científica nas Ciências da Saúde, ocorreu o controle desse tipo de doença. Essa revolução inclui o uso generalizado de antibióticos e vacinas, o controle eficiente de vetores, a descontaminação eficiente de veículos, entre outras medidas que promoveram o aumento da expectativa de vida no mundo inteiro. Por outro lado, houve um incremento na incidência e prevalência de doenças não-infecciosas, tais como diabetes, obesidade e traumas, a ponto de transformar essas doenças em causa principal de mortalidade em quase todos os países, com raras exceções na África subsaariana. No Brasil, o aumento da violência e de acidentes de trânsito contribuiu ainda mais para que houvesse a transição epidemiológica, que é a substituição da principal causa de mortalidade, que antes era relacionada às doenças infecciosas, para doenças não-infecciosas. Para termos uma ideia da dimensão dessa alteração, em 1930, 45,6% das mortes nas capitais dos estados brasileiros foram em decorrência de doenças infecciosas e parasitárias; em 2010, esse número foi de apenas 4,6%. 7.3.1 Características das doenças não-infecciosas Como vimos, as doenças e agravos não-transmissíveis (DANT) ou não-infecciosas Transição epidemiológica: mudança no perfil de morbi- mortalidade 106BIOESTATÍSTICA E EPIDEMIOLOGIA compreendem todas aquelas que não são adquiridas por contato com um agente infeccioso causador de doenças, nem por vetores ou veículos que o carregam, tampouco por contato com pessoas infectadas. Esse grupo inclui uma variedade de agravos à saúde e tem grande repercussão nos índices de saúde de qualquer país, inclusive no Brasil. Entre as características das DANT, podemos citar um longo período de latência, com poucos ou nenhum sintoma. Além disso, a evolução da doença é lenta, prolongada e permanente, com manifestações clínicas acontecendo nos períodos de exacerbação e remissão. Em geral, as lesões celulares são irreversíveis, com evolução para variados graus de incapacidade e morte. A seguir, vamos abordar alguns preceitos básicos das principais DANT. 7.3.2 Doenças cardiovasculares As doenças cardiovasculares, tais como infarto agudo do miocárdio (1º lugar) e acidente vascular cerebral (2º lugar) são, de longe, a principal causa de morte nos países ocidentais, incluindo o Brasil. Para esse grupo de doenças, o gênero é um fator preditivo bastante importante, pois as taxas de mortalidade são maiores em homens do que em mulheres em todas as faixas etárias. Os principais fatores de risco para essas doenças são relacionados ao estilo de vida e incluem a pressão arterial e o colesterol elevados, uso de tabaco e obesidade. Indivíduos que apresentam em conjunto os três fatores, têm uma probabilidade 20 vezes maior de ser acometido por uma doença cardiovascular. 7.3.3 Câncer O que comumente chamamos de câncer, é representado por um conjunto de mais de 50 doenças relacionadas, que são responsáveis pela segunda causa de morte no planeta. A difusão do teste de Papanicolau, aliado à redução no uso de cigarro e à vacinação contra o vírus do papiloma humano (HPV) são fatores responsáveis pela redução do número de diagnósticos de câncer no mundo todo. Contudo, o aumento da idade tem contribuído para uma maior 107BIOESTATÍSTICA E EPIDEMIOLOGIA prevalência, principalmente entre os indivíduos mais idosos. Aproximadamente metade dos homens e um terço das mulheres terão câncer ao longo da vida. Outro aspecto epidemiológico importante é a redução de mortalidade para alguns tipos de doença, como o câncer de estômago (- 35%) e o câncer cervical (- 29%); alguns tipos, como o câncer de pulmão em mulheres, não tem apresentado nenhuma redução. Já os tipos que mais causam mortes são, em ordem decrescente: câncer de pulmão, de estômago e de fígado. Os fatores de risco para a doença são evitáveis, o que torna a prevenção uma ótima estratégia para redução dos danos relacionados. Entre esses fatores estão o uso de cigarro e álcool, prática sexual sem proteção, poluição, dieta (assim como obesidade) e infecções. Em relação às infecções, 18% dos cânceres no mundo são decorrentes da exposição a vírus, como o HPV, a bactérias, como o H. pylori, e a parasitas. 7.3.4 Causas externas Um grupo de ameaças à saúde da população tem se destacado, principalmente em países em desenvolvimento, como o Brasil. Entre causas externas estão incluídas aquelas relacionadas à violência e aos acidentes de trânsito (ambos os fatores são endêmicos no Brasil). Enquanto agravos à saúde desse tipo têm diminuído sua prevalência em países desenvolvidos, como a Suécia e o Japão, países em desenvolvimento sofrem com epidemias de violência. No Brasil, aproximadamente 100.000 pessoas por ano morrem em decorrência apenas de acidentes de trânsito e crimes violentos (valor que provavelmente está subvalorizado devido à falta de estatísticas adequadas). Os fatores de risco para crimes violentos não são específicos e, às vezes, difíceis de serem identificados. Em geral, são considerados fatores de risco a desigualdade social, a baixa escolaridade e a cultura (das 100 cidades mais violentas do mundo, aproximadamente 90 estão na América Latina). Já para os agravos decorrentes de acidentes de trânsito, os fatores de risco são: infraestrutura de trânsito deficiente, baixa tecnologia dos veículos mais vendidos (populares), excesso de velocidade, uso de celulares e ingestão de álcool e outras drogas antes de dirigir. 108BIOESTATÍSTICA E EPIDEMIOLOGIA 7.4 CONSIDERAÇÕES FINAIS DO CAPÍTULO 7 Neste último capítulo do nosso caderno estudamos o processo epidêmico que ocorre a partir da interação entre os fatores que causam a doença e determina, entre outras coisas, a distribuição e a frequência dos agravos à saúde. Em relação a essa distribuição, vimos que uma enfermidade constantemente presente em uma determinada prevalência e região caracteriza uma endemia. Já o início de uma doença em uma população, é chamado de surto. Quando a enfermidade atinge um número maior que o esperado ao acaso para uma população específica, temos a epidemia (que, quando se espalha para vários países ou continentes, torna-se uma pandemia). Outro fator que determina a dinâmica do processo epidêmico é o tipo de agente causador da doença. Por isso, também estudamos no capítulo 7 as características das doenças infecciosas e não-infecciosas. Em relação às doenças infecciosas, aprendemos que a transmissão ocorre quando o agente causador deixa o reservatório por meio de uma via de saída, é transportado através de um meio de transmissão e entra no hospedeiro suscetível para infectá-lo. Os reservatórios incluem animais não humanos (zoonoses), o meio ambiente (plantas, solo e água) ou portadores humanos (que podem ser assintomáticos,de incubação, convalescentes ou crônicos). A transmissão do agente infeccioso a partir do reservatório pode ser direta (contato direto ou propagação de gotículas) ou indireta (vetores mecânicos ou biológicos, transportados pelo ar ou outros veículos). Ao alcançar o hospedeiro suscetível, o patógeno pode entrar por uma via que o possibilite acessar tecidos onde ele irá se multiplicar ou agir e provocar a doença, dependo das condições de imunidade, genética e estrutural do indivíduo. O conhecimento da cadeia de infecção é a base para a adoção de medidas de controle, que podem ser direcionadas para controlar ou eliminar o agente na fonte de transmissão (e.g. descontaminação de solo, uso de antibióticos), proteger vias de entrada (e.g. uso de máscaras e luvas) ou aumentar as defesas do hospedeiro (e.g. uso de vacinas). Nas últimas décadas, quase todos os países experimentaram uma transição epidemiológica pois, com algumas raras exceções na África subsaariana, todos os países têm doenças não- infecciosas como causas principais de mortalidade, ao contrário do que ocorria no início da Epidemiologia. Essas doenças têm como características longos períodos de latência, com poucos sintomas e evolução lenta, em geral. Contudo, as doenças não-infecciosas representam um grupo variado de agravos à saúde e, por esta razão, decidimos abordar algumas características específicas das principais enfermidades desse tipo. Isoladamente, a primeira causa de morte na maior parte das populações, incluindo a brasileira, é a doença cardiovascular (infarto agudo do miocárdio, acidente vascular cerebral, entre outras), que acomete mais os homens do que as mulheres e tem como fatores de risco colesterol e pressão arterial elevados, uso de tabaco e 109BIOESTATÍSTICA E EPIDEMIOLOGIA obesidade. Os cânceres também estão entre as principais causas de morte no mundo inteiro e acometem mais idosos do que jovens e têm como fatores de risco o uso do tabaco e do álcool, infecções (parasitas, HPV, H. pylori e outras bactérias), prática sexual sem proteção, poluição e má alimentação. Por fim, discutimos um grupo de agravos à saúde que tem acometido principalmente países em desenvolvimento, consumindo uma parcela significativa dos recursos da saúde, que são as causas externas, representadas por acidentes (como os de trânsito, cujos fatores de risco são infraestrutura ineficiente, excesso de velocidade, entre outros) e violência (como homicídios, cujos fatores de risco podem ser desigualdade social, baixa escolaridade e cultura). Chegamos ao final do nosso caderno de estudos e eu gostaria de parabenizar sua dedicação, que é um atributo essencial para que seja alcançada uma aprendizagem significativa. Essa aprendizagem certamente contribuirá para que você se torne um profissional de Saúde apto a ser um agente transformador da nossa sociedade. 110BIOESTATÍSTICA E EPIDEMIOLOGIA ALMEIDA FILHO, N.; ROUQUAYROL, M.Z. Introdução à epidemiologia. 4.ed.,rev. e ampliada. Rio de Janeiro: Guanabara Koogan, 2013. BEAGLEHOLE, R. et al. Epidemiologia básica. São Paulo: Santos, 2010. BUSSAB, W.O.; MORETTIN, P.A. Métodos quantitativos: estatística básica. São Paulo: Editora Atual, 1987. CALLEGARI-JACQUES, S.M. Bioestatística: princípios e aplicações. Porto Alegre: Artemed, 2003. GREENLAND, S.; LASH, T.L.; ROTHMAN, K.J. Epidemiologia moderna. Porto Alegre: Artmed, 2011. KATZ, D.L.; ELMORE, J.G.; JEKEL, J.F. Epidemiologia, bioestatística e medicina. Porto Alegre: Artmed, 2005. LEAVELL, H.; CLARK, E.G. Medicina preventiva. São Paulo: McGraw–Hill do Brasil, 1976. RODRIGUES, V.P. et al. Conceitos e ferramentas de epidemiologia. São Luís: UFMA – UNASUS, 2014. Disponível em < https://ares.unasus.gov.br/acervo/handle/ARES/1109>, acesso em: 02 fev 2017. ZAR, J.H. Biostatistical analysis. 5 ed. New Jersey: Prentice Hall, 2010. REFERÊNCIAS BIBLIOGRÁFICAS 111BIOESTATÍSTICA E EPIDEMIOLOGIA IPCC. Climate Change 2001: The Scientific Basis. Contribution of Working Group I to the Third Assessment Report of the Intergovernmental Panel on Climate Change. Cambridge, United Kingdom, and New York, United States, Cambridge University Press ISDR (1999), 2001. I PCC. Future Work of the IPCC: Chairman’s Vision Paper on the Future of the IPCC. IPCC, 2015. LIMA, G. F. C. Educação ambiental e mudança climática: convivendo em contextos de incerteza e complexidade. Ambiente & Educação . v. 18, 2013. LOURENÇO-DE-OLIVEIRA R.; et al. Aedes aegypti in Brazil: Genetically differentiated populations with high susceptibility to dengue and yellow fever viruses. Trans R Soc Trop Med Hyg. v. 98, n.1, p.43–54, 2004. MARCELINO, E. V. Desastres naturais e geotecnologias: conceitos básicos. Santa Maria, RS: INPE, 2007. MARENGO, J. A. Mudanças climáticas globais e seus efeitos sobre a biodiversidade: caracterização do clima atual e definição das alterações climáticas para o território brasileiro ao longo do século XXI. Brasília: MMA, 2006. MELLO, L. L. Charges e cartuns sobre aquecimento global. 2014. Disponível em: <https:// pucsustentabilidade.wordpress.com/2014/10/02/charges-e-cartuns-sobre-aquecimento-global/> Acesso em: 09, jan. 2017. MENDONÇA, F. Aspectos da interação clima-ambiente-saúde humana: da relação sociedade-natureza à (in) sustentabilidade ambiental. RA’E GA–O espaço geográfico em análise, v.4, n.4, p.85-100, 2000. MILLER, B R.; BALLINGER, M. E. Aedes albopictus mosquitoes introduced into Brazil: vector competence for yellow fever and dengue viruses. Trans R Soc Trop Med Hyg. v.82, n.3, p. 476–7, 1988. 112BIOESTATÍSTICA E EPIDEMIOLOGIA MONTEIRO, A. L.; BERTAGNI, R. F. S. Acidentes do Trabalho e Doenças Ocupacionais. Saraiva: São Paulo, ed. 7, 2012. MONTERO, R. 2007. Poluição, Cubatão - SP. Disponível em: <http://www.pbase.com/rickmoon/ image/157229622/original> Acesso em: 09, jan. 2017. MORAIS, C. R. Dicionário de Saúde e Segurança no trabalho e Meio Ambiente. São Caetano do Sul: Yendis, 2011. MOUSINHO, P. Glossário. In: Trigueiro, A. (Coord.) Meio ambiente no século 21. Rio de Janeiro: Sextante. 2003. NARDOCCI, A. C.; et al. Poluição do ar e doenças respiratórias e cardiovasculares: estudo de séries temporais em Cubatão, São Paulo, Brasil. Cadernos de Saúde Pública, v. 29, n. 9, p. 1867-1876, 2013. NICOLUSSI, F. H.; et al. Poluição do ar e doenças respiratórias alérgicas em escolares. Revista de Saúde Pública, v. 48, n. 2, p. 326-330, 2014. NOGUEIRA, D. P. Incorporação da saúde ocupacional à rede primária de saúde. Revista de saúde pública, v. 18, n. 6, p. 495-509, 1984. NUNES, T. Como a dengue é transmitida. 2016. Disponível em: <http://pontobiologia.com.br/como-a- dengue-e-transmitida/> Acesso em: 09 jan. 2017. O DIA. Polipílula combate hipertensão e colesterol. 2011. Disponível em: <http://odia.ig.com.br/ portal/cienciaesaude/polip%C3%ADlula-combate-hipertens%C3%A3o-e-colesterol-1.60707> Acesso em: 09 jan. 2017. O GLOBO. Entenda o acidente. 2015. Disponível em: < http://infograficos.oglobo.globo.com/brasil/ entenda-o-acidente.html> Acesso em: 09, jan. 2017. 113BIOESTATÍSTICA E EPIDEMIOLOGIA ODUM, E. P. Ecologia. Rio de Janeiro: Editora Guanabara, 1986. OLIVEIRA, M. V. C.� CARVALHO, A. R. Princípios Básicos do Saneamento do Meio. São Paulo: SENAC, 2010. ORGANIZAÇÃO MUNDIAL DA SAÚDE. Constituição da Organização Mundial da Saúde. Nova Iorque, 1946. Disponível em: <http://www.direitoshumanos.usp.br/index.php/OMS- Organiza%C3%A7%C3%A3o-Mundial-da-Sa%C3%BAde/constituicao-da-organizacao-mundial-da- saude-omswho.html> Acesso em: 09 jan. 2017. ORGANIZAÇÃO MUNDIAL DA SAÚDE. Dengue hemorrágica: diagnóstico, tratamento, prevenção e controle. ed. 2, São Paulo; 2001. ORGANIZAÇÃO MUNDIAL DA SAÚDE. Substâncias químicas perigosas à saúde e ao ambiente. São Paulo: Cultura Acadêmica, 2008. ORGANIZACIÓN PANAMERICANA DE LA SALUD. Dengue y dengue hemorrágico em las Américas, guias para su prevención y controle.Publicacion Científica nº 548, Washington; 2002. PATZ, J. A., et al. Impact of regional climate change on human health. Nature, v. 438, n.7066, p. 310-317, 2005. PEGORIM, J. O que é El Niño? 2016. Disponível em: < http://www.climatempo.com.br/noticia/2016/01/11/ o-que-e-o-el-nino--4068> Acesso em: 09 jan. 2017. PEREIRA, S. D. Conceitos e definições da Saúde e Epidemiologia usados na Vigilância Sanitária. Governo do estado de São Paulo, março de 2007. RAU, K. (2012). Ocorrência de Equilíbrio Sustentável. Disponível em: <http://sustentabilidade- 114BIOESTATÍSTICA E EPIDEMIOLOGIA tecnologica.blogspot.com.br/> Acesso em: 08, jan. 2017. RENGIFO CUELLER H. Conceptualización de la saludambiental: teoría y práctica (parte 1). Rev Perú MedExp Salud Publica, v. 25, n.4, p.403-409, 2008. RENGIFO CUELLER H. Conceptualización de la saludambiental: teoría y práctica (parte 2). Rev Perú MedExp Salud Publica, v.26, n.1, p.66-73, 2009. RIBAS, P. P., MATSUMURA, A. T. S. A química dos agrotóxicos: impacto sobre a saúde e meio ambiente. Revista Liberato, v. 10, n. 14, p. 149-158, 2009. RIBEIRO, M. D., et al. Estudo descritivo da ocorrência de dengue e suas relações com o clima e a ação da vigilância em saúde no município de Franca, São Paulo, Brasil, 2007 a 2011. Investigação, v.14, n. 1, 2015. RICKLEFS, R. E. A Economia da Natureza. Rio de Janeiro: Guanabara-Koogan, 5 ed., 2003. ROCHA, H. Natal inicia Campanha de Vacinação contra raiva em cães e gatos. 2016. Disponível em: <http://hdviu.blogspot.com.br/2016/08/natal-inicia-campanha-de- vacinacao.html> Acesso em: 09 jan.,2017. ROUQUAYROL, Maria Zélia; ALMEIDA FILHO, Naomar de. Epidemiologia e Saúde. 7. ed. Rio de Janeiro: MedBook, 2013. SCHLICKMANN, F. Fotos antigas de Balneário Camboriú. 2011. Disponível em: <http://praiadecamboriu.blogspot.com.br/2011/04/fotos-antigas-de-balneario- camboriu-11.html> Acesso em: 08 jan. 2017. 115BIOESTATÍSTICA E EPIDEMIOLOGIA SEMA. Secretaria do Meio Ambiente. O que são políticas públicas. Disponível em: <http://www.meioambiente.pr.gov.br/arquivos/File/coea/pncpr/O_que_sao_ PoliticasPublicas.pdf >. Acesso em: 07 jan. 2017. SILVA JÚNIOR, J. L. R.; et al. Efeito da sazonalidade climática na ocorrência de sintomas respiratórios em uma cidade de clima tropical. Jornal Brasileiro de Pneumologia, v. 37, n.6, p. 759-767, 2011. SILVA, I. Fenômeno La Niña pode trazer chuvas ao sertão do Nordeste. 2016. Disponível em: <http://radiojornal.ne10.uol.com.br/noticia/2016/06/08/fenomeno- la-nina-pode-trazer-chuvas-ao-sertao-do-nordeste-47042> Acesso em: 09 jan. 2017. SULEIDE. Governo de Goiás. Goiânia, Césio, 137. 2012. Disponível em: <http://www.cesio137goiania.go.gov.br/index.php> Acesso em: 09 jan. 2017. SUPERINTERESSANTE. As grandes epidemias ao longo da história. 2004. Disponível em: < http://super.abril.com.br/saude/as-grandes-epidemias-ao-longo- da-historia/ > Acesso em: 09 jan. 2017. TAUIL, P. L. Urbanização e ecologia da dengue. Cadernos de Saúde Pública, n.17, p.99- 102, 2001. TEIXEIRA, J. C., et al. Estudo do impacto das deficiências de saneamento básico sobre a saúde publica no Brasil no período de 2001 a 2009. Eng. sanit. ambient, v. 19, n. 1, p. 87-96, 2014. 116BIOESTATÍSTICA E EPIDEMIOLOGIA TOLEDO, K. Quinto relatório do IPCC mostra intensificação das mudanças climáticas. Agência FAPESP. 2013. Disponível em: <http://agencia.fapesp.br/quinto_ relatorio_do_ipcc_mostra_intensificacao_das_mudancas_climaticas/17944/> Acesso em: 09 jan. 2017. UNITED NATIONS DEPARTMENT OF ECONOMIC SOCIAL AFFAIRS/POPULATION DIVISION. World Urbanization Prospects: The 2007 revision. New York: UN; 2008. VOGES, M. O clima está louco?. 2012. Disponível em: <http://formulageo.blogspot.com. br/2012/07/o-clima-ta-louco-charge.html> Acesso em: 09 jan. 2017. WEIHS, M.; MERTENS, F. Os desafios da geração do conhecimento em saúde ambiental: uma perspectiva ecossistêmica. Cien Saude Colet, v. 18, n. 5, p. 1501-1510, 2013. XAVIER, M. P.; ARAÚJO, J. S. O conceito de saúde e os modelos de assistência: considerações e perspectivas em mudança / the concept of health and models of assistance: considerations and prospects in change. Revista Saúde em Foco, Teresina, v. 1, n. 1, 2014. 117BIOESTATÍSTICA E EPIDEMIOLOGIA DUARTE, A.� SANTOS, T.R.� CASTRO, A. G. O Ambiente e a Saúde. Porto Alegre: Instituto Piaget, 2003. EZZATI M.; et al. Comparative Risk Assessment Collaborating Group. Selected major risk factors and global and regional burden of disease. Lancet. v. 360, n. 9343, p.1347-60, 2002. FIALA, N. Efeito Estufa do Hambúrguer. Scientific American Brasil. 2009. Disponível em: http://www2. uol.com.br/sciam/noticias/efeito_estufa_dos_hamburgueres.html>Acesso em: 3 jan. 2017. FIOCRUZ. Glossário de Doenças da Fiocruz. 2013. Disponível em: <https://agencia.fiocruz.br/ leishmaniose>. Acesso em: 9 jan. 2017. FOGAÇA, J. R. V. Tipos de tratamento de efluentes. Brasil Escola. Disponível em: <http://brasilescola. uol.com.br/quimica/tipos-tratamento-efluentes.htm>. Acesso em: 28 dez. 2016. GAZETA RURAL. Agricultores obrigados a ter formação para usarem pesticidas. 2016. Disponível em: <http://gazetarural.com/2016/01/26/agricultores-obrigados-a-ter-formacao-para-usarem-pesticidas/> Acesso em: 10, jan. 2017. GECOM-TJAC. TJAC oferece atividades de ginástica laboral aos servidores. 2015. Disponível em: <http://www.tjac.jus.br/noticias/tjac-oferece-atividades-de-ginastica-laboral-aos-servidores/> Acesso em: 10, jan. 2017. GIODA, A., DE AQUINO NETO, F. R. Comments on studies of industrial and non-industrial environments in Brazil: a comparative. Cad Saude Pública. v. 19, n. 5, p.1389-97, 2003. GLOBAL PARTNERSHIP TO ROLL BACK MALARIA. Using climate to predict infectious disease outbreaks: a review. Geneva: World Health Organization; 2004. HERZLICH, C. Health and illness on the eve of 21st century: from private experience to the public sphere and back. Physis: Revista de Saúde Coletiva, v. 14, n. 2, p. 383-394, 2004. Av. Marginal Leste, n. 3.600, Bairro dos Estados | CEP: 88.339-125 - Balneário Camboriú (SC) Telefone: (47) 3363-0631 | avantis@avantis.edu.br | www.avantis.edu,br autor APRESENTAÇÃO 1 – CONCEITOS BÁSICOS DE BIOESTATÍSTICA 3.2 O escore padrão e a estatística “Z” 3.3 Teste “t” de Student para uma amostra 3.4 Análise de Variância (ANOVA) 3.5 Teste Não-Paramétrico para Duas Amostras: Mann-Whitney (“U”) 3.6 Teste Não-Paramétrico para 3 ou mais Amostras: Kruskal-Wallis (“H”) 3.7 Considerações Finais do Capítulo 3 3 BIOESTATÍSTICA INFERENCIAL 3.1 Noções de Testes de Hipótese 2.1.1 Média aritmética simples 2.1.2 Mediana 2.1.3 Moda 2.1.4 Ponto médio 2.2 Medidas de Variação e Dispersão 2.2.1 Amplitude 2.2.2 Variância 2.2.3 Desvio-padrão 2.2.4 Coeficiente de variação 2.3 Distribuição de Frequências 2.3.1 Representações gráficas da distribuição de frequência 2.4 Relações entre Duas Variáveis 2.4.1 Regressão linear simples 2.4.2 Correlação linear simples 2.5 Considerações Finais do Capítulo 2 2 BIOESTATÍSTICA DESCRITIVA 2.1 Medidas de Tendência Central 1.1 Tipos de Dados Comuns nas Ciências da Saúde 1.2 Erro, Acurácia, Precisão e Arredondamento 1.3 Coleta de Dados em Populações e Amostras 1.4 Probabilidade 1.4.1 Probabilidade de um evento 1.4.2 Contando os resultados possíveis 1.4.3 Multiplicando e adicionando probabilidades 1.4.4 Modelos probabilísticos 1.4.4.1 Modelos para variáveis aleatórias discretas 1.4.4.2 Modelo para variáveis aleatórias contínuas 1.5 Considerações Finais do Capítulo 1 EPIDEMIOLOGIA 4 – CONCEITOS BÁSICOS DE EPIDEMIOLOGIA 7.2 Epidemiologia das Doenças Infecciosas 7.2.1 Reservatórios de agentes infecciosos 7.2.2 Saída do agente infeccioso e modos de transmissão 7.2.3 Entrada do agente no hospedeiro 7.2.4 Hospedeiro suscetível 7.2.5 Implicações para a saúde pública 7.3 – Epidemiologia das Doenças Não-Infecciosas 7.3.1 Características das doenças não-infecciosas7.3.2 Doenças cardiovasculares 7.3.3 Câncer 7.3.4 Causas externas 7.4 Considerações Finais do Capítulo 7 7 PROCESSO EPIDÊMICO 7.1 Frequência e Distribuição das Doenças: Epidemia e Endemia 6.1.1 Morbidade 6.1.2 Mortalidade 6.2 – Medidas de Associação 6.2.1 – Risco relativo e risco atribuível 6.2.2 – Razão de chances ou Odds Ratio 6.3 – Testes Diagnósticos 6.4 – Vigilância à Saúde 6.4.1 - Sistemas de Informação em Saúde (SIS) 6.5 Considerações Finais do Capítulo 6 6 EPIDEMIOLOGIA DESCRITIVA 6.1 – Indicadores de Saúde Coletiva 5.1.1 Modelo biomédico ou de medicina científica ocidental 5.1.2 Modelo de História Natural da Doença (HND) e prevenção 5.1.3 Modelo sistêmico 5.2 Considerações Finais do Capítulo 5 5 PROCESSO SAÚDE-DOENÇA 5.1 Modelos Explicativos do Processo Saúde-Doença 4.1 Perspectivas Históricas 4.2 Evolução Conceitual 4.3 Definições Básicas 4.4 Considerações Finais do Capítulo 4 REFERÊNCIAS BIBLIOGRÁFICAS