Logo Passei Direto
Buscar
Material
páginas com resultados encontrados.
páginas com resultados encontrados.

Prévia do material em texto

BIOESTATÍSTICA 
E EPIDEMIOLOGIA
AUTOR: 
MARCELO WERNER
C A D E R N O 
ESTUDO
 
Ficha catalográfica elaborada na fonte pela Biblioteca da Faculdade Avantis 
Aline M. d’Oliveira CRB 14 – 1063 
 
 
 
 
 
 
 
 
 
 
 
CDD 21ª ed. 
570.151 - Bioestatística 
 
 Werner, Marcelo 
W492b Bioestatística e epidemiologia [caderno de estudo 
eletrônico] / Marcelo Werner. Balneário Camboriú: Faculdade 
Avantis, 2017. 
 110 p. il. 
 
Inclui Índice 
ISBN: 978-85-66237-81-8 [recurso eletrônico] 
 
 
1.Bioestatística. 2. Epidemiologia. I. Faculdade Avantis. 
II. Título. 
CADERNO DE ESTUDO
AUTOR: MARCELO WERNER
PROJETO GRÁFICO E DIAGRAMAÇÃO
ANA LÚCIA DAL PIZZOL - anadiagrama@gmail.com
BIOESTATÍSTICA 
E EPIDEMIOLOGIA
SUMÁRIO
AUTOR ........................................................................................ 9
APRESENTAÇÃO ..........................................................................10
UNIDADE 1 .................................................................................12
BIOESTATÍSTICA
CAPÍTULO 1
1 – CONCEITOS BÁSICOS DE BIOESTATÍSTICA ...............................................................12
1.1 TIPOS DE DADOS COMUNS NAS CIÊNCIAS DA SAÚDE ..................................................................13
1.2 ERRO, ACURÁCIA, PRECISÃO E ARREDONDAMENTO ....................................................................14
1.3 COLETA DE DADOS EM POPULAÇÕES E AMOSTRAS .....................................................................15
1.4 PROBABILIDADE .........................................................................................................................18
1.4.1 Probabilidade de um evento .................................................................................................19
1.4.2 Contando os resultados possíveis ........................................................................................20
1.4.3 Multiplicando e adicionando probabilidades .........................................................................22
1.4.4 Modelos probabilísticos .......................................................................................................23
1.4.4.1 Modelos para variáveis aleatórias discretas ......................................................................24
1.4.4.2 Modelo para variáveis aleatórias contínuas .......................................................................25
1.5 CONSIDERAÇÕES FINAIS DO CAPÍTULO 1 ....................................................................................26
SUMÁRIO
CAPÍTULO 2
2 BIOESTATÍSTICA DESCRITIVA ..................................................................................27
2.1 MEDIDAS DE TENDÊNCIA CENTRAL .............................................................................................27
2.1.1 Média aritmética simples ....................................................................................................28
2.1.2 Mediana ..............................................................................................................................29
2.1.3 Moda ...................................................................................................................................31
2.1.4 Ponto médio ........................................................................................................................31
2.2 MEDIDAS DE VARIAÇÃO E DISPERSÃO .........................................................................................32
2.2.1 Amplitude ............................................................................................................................33
2.2.2 Variância ..............................................................................................................................33
2.2.3 Desvio-padrão ......................................................................................................................35
2.2.4 Coeficiente de variação ........................................................................................................36
2.3 DISTRIBUIÇÃO DE FREQUÊNCIAS ...............................................................................................38
2.3.1 Representações gráficas da distribuição de frequência ........................................................40
2.4 RELAÇÕES ENTRE DUAS VARIÁVEIS .............................................................................................40
2.4.1 Regressão linear simples .....................................................................................................41
2.4.2 Correlação linear simples ....................................................................................................45
2.5 CONSIDERAÇÕES FINAIS DO CAPÍTULO 2 ....................................................................................47
CAPÍTULO 3
3 BIOESTATÍSTICA INFERENCIAL ................................................................................49
3.1 NOÇÕES DE TESTES DE HIPÓTESE ..............................................................................................49
3.2 O ESCORE PADRÃO E A ESTATÍSTICA “Z” .....................................................................................50
SUMÁRIO
3.3 TESTE “T” DE STUDENT PARA UMA AMOSTRA .............................................................................54
3.4 ANÁLISE DE VARIÂNCIA (ANOVA)..................................................................................................56
3.5 TESTE NÃO-PARAMÉTRICO PARA DUAS AMOSTRAS: MANN-WHITNEY (“U”)..................................57
3.6 TESTE NÃO-PARAMÉTRICO PARA 3 OU MAIS AMOSTRAS: KRUSKAL-WALLIS (“H”) ........................60
3.7 CONSIDERAÇÕES FINAIS DO CAPÍTULO 3 ....................................................................................62
UNIDADE 2 .................................................................................64
EPIDEMIOLOGIA
CAPÍTULO 4
4 – CONCEITOS BÁSICOS DE EPIDEMIOLOGIA ...............................................................64
4.1 PERSPECTIVAS HISTÓRICAS ........................................................................................................65
4.2 EVOLUÇÃO CONCEITUAL ..............................................................................................................66
4.3 DEFINIÇÕES BÁSICAS .................................................................................................................67
4.4 CONSIDERAÇÕES FINAIS DO CAPÍTULO 4 ....................................................................................68
CAPÍTULO 5
 5 PROCESSO SAÚDE-DOENÇA ...................................................................................70
5.1 MODELOS EXPLICATIVOS DO PROCESSO SAÚDE-DOENÇA ..........................................................70
5.1.1 Modelo biomédico ou de medicina científica ocidental ........................................................71
5.1.2 Modelo de História Natural da Doença (HND) e prevenção ...................................................71
5.1.3 Modelo sistêmico ................................................................................................................74
5.2 CONSIDERAÇÕES FINAIS DO CAPÍTULO 5 ....................................................................................75
7BIOESTATÍSTICA E 
EPIDEMIOLOGIA
CAPÍTULO 6
6 EPIDEMIOLOGIA DESCRITIVA ...................................................................................77
6.1 – INDICADORES DE SAÚDE COLETIVA ..........................................................................................77
6.1.1 Morbidade ...........................................................................................................................78
6.1.2 Mortalidade .........................................................................................................................82
6.2 – MEDIDAS DE ASSOCIAÇÃO .......................................................................................................84de quatro pessoas (valores 
supostos).
Fonte: o autor.
Apresentado dessa forma, podemos ver claramente que a pressão arterial sistólica aumenta 
com o aumento da idade. Contudo, precisamos quantificar essa relação (afinal, estamos estudando 
Bioestatística). Sendo assim, vamos à equação da reta da regressão linear simples:
no eixo Y do gráfico (vertical) e os dados da variável independente no eixo X 
(horizontal). Sendo assim,
 
Figura 4. Gráfico de dispersão de valores de pressão arterial sistólica em função da idade de 
quatro pessoas (valores supostos).
 
110
120
130
140
150
160
170
18 23 28 33 38 43 48 53 58 63 68
Pr
es
sã
o 
ar
te
ria
l s
is
tó
lic
a 
(e
m
 m
m
H
g)
Idade (em anos)
Pressão arterial
43BIOESTATÍSTICA E 
EPIDEMIOLOGIA
Relembrando, “y” é a variável dependente e “x” é a variável independente. Já “a” e “b”, são 
calculados através das seguintes fórmulas:
Concordo que o cálculo parece ser muito trabalhoso, mas vamos direto a um exemplo, que 
será muito esclarecedor. Vamos supor que uma fisioterapeuta acredite que haja uma relação de 
dependência entre as variáveis a seguir e pretenda relacionar a angulação da escoliose de três 
adolescentes com as horas que eles permanecem sentados por dia em frente ao computador. 
As medições revelaram que o adolescente Paulo fica 2 horas por dia em frente ao computador e 
apresentou 4º de angulação; o adolescente José fica 4 horas e apresentou 5º; por fim, o adolescente 
João fica 6 horas e apresentou angulação de 6º. Para começar, é ideal calcular os somatórios 
(lembra do símbolo ∑, não é mesmo?) antes de colocar na fórmula. A forma mais fácil de fazer 
isso, é preenchendo uma tabela com os dados e realizar os cálculos simples:
Tabela 4. Valores supostos de horas em frente ao computador e angulação de escoliose de 3 
adolescentes.
Adolescentes
x
(horas por dia)
y
(angulação)
x.y x2
Paulo 2 4 8 4
José 4 5 20 16
João 6 6 36 36
∑ (soma) 12 15 64 56
Fonte: o autor.
Sendo assim, já sabemos que o tamanho da amostra (n) é igual a 3 e temos os somatórios de 
“x” (12), “y” (15), “x.y” (64) e “x2” (56). Agora é só substituir na fórmula para calcular o “b”:
44BIOESTATÍSTICA E 
EPIDEMIOLOGIA
Para calcularmos o “a”, precisamos, além do valor de “b”, calculado acima, os valores das 
médias de “y” e “x”, representados por . Para isso, vamos incluir mais uma linha na nossa 
tabela:
Tabela 5. Valores supostos de horas em frente ao computador, angulação de escoliose e médias 
de 3 adolescentes.
Adolescentes
x
(horas por dia)
y
(angulação)
x.y x2
Paulo 2 4 8 4
José 4 5 20 16
João 6 6 36 36
∑ (soma) 12 15 64 56
Média 4 (12/3) 5 (15/3) - -
Fonte: o autor.
E substituir os termos para calcular o valor de “a”:
Por fim, vamos substituir os valores de “b” e “a” na equação da reta:
Essa equação descreve a relação entre as variáveis independentes (horas em frente ao computador 
por dia) e as variáveis dependentes (angulações de escoliose em adolescentes). Além disso, é 
possível fazer estimações e interpolações de dados que não foram coletados. Por exemplo, quanto 
você esperaria que fosse a angulação da escoliose de um paciente adolescente que permanece 5 
horas por dia em frente ao computador (perceba que não há esse dado na tabela)? Sabendo que essa 
variável é representada por “x” (pois é a variável independente), é só substituirmos na equação da 
reta, para encontrarmos a variável “y” (grau de angulação da escoliose):
45BIOESTATÍSTICA E 
EPIDEMIOLOGIA
2.4.2 Correlação linear simples
Na correlação linear simples também consideramos a relação entre duas variáveis, mas 
nenhuma dessas variáveis apresenta dependência funcional sobre a outra. Se a relação entre 
variáveis não é considerada de dependência, não há variável independente ou variável dependente 
e devemos utilizar técnicas de correlação. O coeficiente de correlação (r) descreve a relação entre 
duas variáveis que estão sendo examinadas e sua fórmula é:
Diferentemente da regressão, na correlação não há a necessidade de se determinar qual 
variável é representada por “x” ou por “y”. Da mesma forma da regressão, é bastante útil preencher 
a tabela, que agora deve ter uma coluna a mais em relação à tabela anterior (y2). Vamos utilizar o 
mesmo conjunto de dados sobre a escoliose, aplicado à regressão (dessa vez, a fisioterapeuta não 
considera que o tempo que os adolescentes ficam em frente ao computador influencie o grau de 
escoliose):
Tabela 6. Valores supostos de horas em frente ao computador e angulação de escoliose de 3 
adolescentes.
Adolescentes
x
(horas por dia)
y
(angulação)
x.y x2 y2
Paulo 2 4 8 4 16
José 4 5 20 16 25
João 6 6 36 36 36
∑ (soma) 12 15 64 56 77
Fonte: o autor.
46BIOESTATÍSTICA E 
EPIDEMIOLOGIA
Substituindo os termos na fórmula, temos:
O coeficiente de correlação pode assumir qualquer valor entre 1 e – 1, sendo que os valores 
positivos indicam relação diretamente proporcional entre as variáveis, ou seja, quando o valor de 
uma variável aumenta, a outra também aumenta ou quando o valor de uma diminui, o valor da 
outra também diminui. Já os valores negativos indicam que a relação é inversamente proporcional, 
ou seja, quando o valor de uma variável aumenta, a outra diminui e vice-versa. Além disso, a 
magnitude do coeficiente reflete o grau de correlação entre duas variáveis. Podemos aplicar uma 
regra prática para estabelecer que:
“r” entre 0 e 0,25 ou entre – 0,25 e 0, temos uma correlação pequena;
“r” entre 0,25 e 0,50 ou entre – 0,50 e – 0,25, temos uma correlação fraca;
“r” entre 0,50 e 0,75 ou entre – 0,75 e – 0,50, temos uma correlação moderada;
“r” entre 0,75 e 0,99 ou entre – 0,99 e – 0,75, temos uma correlação forte;
“r” igual a 1, temos uma correlação positiva perfeita e
“r” igual a – 1, temos uma correlação negativa perfeita.
Outra medida que pode descrever a relação entre duas variáveis é o coeficiente de 
determinação, simplesmente representado pelo quadrado do coeficiente de correlação, ou r2. 
Essa medida descreve quanto do total da variabilidade encontrada em uma das variáveis (“x” ou 
“y”) pode ser atribuída à outra variável.
Você encontrará exercícios e mais exemplos no Ambiente Virtual de 
Aprendizagem.
47BIOESTATÍSTICA E 
EPIDEMIOLOGIA
2.5 CONSIDERAÇÕES FINAIS DO CAPÍTULO 2
A descrição, o resumo e a apresentação dos dados são os objetos da Bioestatística descritiva. 
Neste capítulo, aprendemos a calcular diversas medidas de tendência central (MTC), que indicam 
como nossas variáveis se distribuem ao redor do centro. A medida mais utilizada, como vimos, 
é a média aritmética simples. Contudo, em determinadas situações, outras MTC podem ser 
mais adequadas, como, por exemplo, quando não conseguimos registrar uma variável porque o 
instrumento de medição não possui escala suficiente; nesse caso, a mediana é a única maneira 
de descrevermos um conjunto de dados. Também há a possibilidade de nos depararmos com 
uma dificuldade para utilizar algum valor intermediário do nosso conjunto de dados; quando 
isso ocorrer, devemos utilizar o ponto médio, que é a média aritmética simples entre o maior e o 
menor valor do conjunto. Em outras situações mais restritas, a moda, que representa o valor mais 
frequente obtido, pode ser útil.
Além de descrever a centralidade dos dados, é recomendável informar o quanto esses dados 
variam. Por isso, calculamos outras medidas que representam essa informação, tais como 
a amplitude (diferença entre o maior e o menor valor das variáveis), a variância (soma dos 
desvios em relação à média ao quadrado, dividido por “n” ou “n-1”; populacional e amostral, 
respectivamente) e o desvio-padrão (raiz quadrada da variância). Essas três medidas de dispersão 
(MD) são dependentes da escala dos dados que serão descritos; por isso, quando houver 
necessidade de comparar dispersões entre grupos de variáveis que têm escalas diferentes, 
devemos utilizar uma MD que seja relativa. Nesse caso, dispomos do coeficientede variação, que 
representa a porcentagem de dispersão e é calculado simplesmente dividindo-se o desvio-padrão 
pela média do conjunto de dados.
Ainda estudamos uma forma bastante prática de descrever ou apresentar grandes conjuntos 
de dados: a distribuição de frequências, que é corresponde à divisão do conjunto em classes (cujo 
número é calculado através do arredondamento para cima da raiz de “n”), a determinação do 
intervalo de cada classe (calculado através da divisão da amplitude do conjunto de dados pelo 
número de classes) e a contagem de observações em cada classe. A apresentação gráfica de uma 
distribuição de frequências é feita através de histograma (gráfico de coluna) ou polígono de 
frequências (gráfico de linha).
Além da apresentação de grandes conjuntos de dados e das medidas de tendência central 
e dispersão, também estudamos formas de descrever e quantificar a relação entre grupos 
de variáveis, como a regressão e a correlação linear simples. Se for possível identificar uma 
relação funcional entre esses grupos de dados (e.g. ingestão calórica e IMC), podemos estimar 
48BIOESTATÍSTICA E 
EPIDEMIOLOGIA
ou interpolar uma variável dependente (que sofre influência) em função da magnitude de uma 
variável independente (que causa influência) através da regressão. Já quando não houver essa 
relação e a variação dos grupos for causada por um terceiro fator (e.g. número de homicídios 
e quantidade de café ingerido; ambos devem aumentar devido a um terceiro fator, que é o 
crescimento populacional), podemos utilizar o coeficiente de correlação para determinar o 
grau de relação entre dois grupos de variáveis. Importante ressaltar que, tanto a distribuição 
de frequências, quanto a regressão e correlação, além de permitirem a descrição dos dados 
(motivo pelo qual se encontram no capítulo intitulado Bioestatística descritiva), também podem 
ser ferramentas para inferência dos dados, que será objeto do próximo capítulo. Contudo, não 
utilizaremos esses recursos, pois extrapolam os objetivos do nosso curso. 
49BIOESTATÍSTICA E 
EPIDEMIOLOGIA
3 BIOESTATÍSTICA INFERENCIAL
A Bioestatística inferencial representa a parte da disciplina que estuda os testes estatísticos. 
Esses testes possibilitam que os pesquisadores calculem estatísticas adequadas para suas amostras 
e façam inferências ou generalizem conclusões para a população à qual as amostras pertencem. 
Neste capítulo, estudaremos os principais testes estatísticos e algumas de suas aplicações. Mas 
antes, precisamos trabalhar alguns conceitos.
3.1 NOÇÕES DE TESTES DE HIPÓTESE
O principal objetivo da análise estatística é inferir, ou tirar conclusões, sobre uma população, 
através do exame de uma amostra, uma vez que é quase sempre impossível medir toda a população. 
Para isso, convencionou-se estabelecer hipóteses estatísticas (de preferência antes da coleta dos 
dados, para evitar influência dos pesquisadores) e testá-las. De forma geral, temos duas hipóteses 
antagônicas: a hipótese nula, representada por H
0
, e a hipótese alternativa, representada por 
H
1
 (você poderá encontrar também as notações H
null
 e H
a
 para descrever as hipóteses nula e 
alternativa, respectivamente).
A hipótese nula contém a afirmação de que não há diferença estatisticamente significante 
entre um valor alegado para a média populacional. Por exemplo, retomando o exemplo do peso 
dos alunos da Faculdade, podemos estabelecer a hipótese nula de que a média é igual a 70 kg. Já a 
hipótese alternativa, contém a afirmação de que há diferença estatisticamente significante entre 
o valor a ser testado através de uma amostra e a média real da população. Nesse caso, a hipótese 
alternativa para o exemplo seria de que a população possui um média de peso maior, menor ou 
simplesmente diferente de 70 kg, o que seria testado a partir de uma ou mais amostras. 
Os testes estatísticos nos fornecem um valor de probabilidade, chamado “valor p” (ou, mais 
CAPÍTULO 3
50BIOESTATÍSTICA E 
EPIDEMIOLOGIA
comumente, p-value), que proporciona ao pesquisador o poder de decidir se há ou não evidência 
para rejeitar a hipótese nula. Se a hipótese nula for rejeitada, assume-se de a hipótese alternativa 
é verdadeira. Nos exemplos que seguirão às explicações sobre os testes estatísticos serão incluídas 
hipóteses nulas e alternativa, o que facilitará a compreensão.
A regra geral é: sempre que o valor calculado da estatística ultrapassar o valor crítico tabelado, 
a hipótese nula será rejeitada. Consequentemente, se o valor crítico for maior que o valor 
calculado, a hipótese nula será aceita. O AVA contém os valores críticos tabelados para todas as 
estatísticas utilizadas em nosso curso. Essas tabelas são dependentes do nível de confiança, que 
sempre será de 95% nas avaliações, exemplos e exercícios. Esse nível significa que em 95% das 
vezes, o pesquisador concluirá corretamente sobre a escolha da hipótese; significa também que 
em 5% das vezes, cometerá erro. A propósito, nas avaliações, esse valor será necessariamente 
informado no enunciado da questão. Importante ressaltar que, apesar de 95% ser o nível de 
confiança mais utilizado em estudos científicos, você pode decidir realizar na vida acadêmica ou 
profissional estudos mais restritivos (como, por exemplo, quando houver risco para a saúde dos 
envolvidos, pois não é admissível que 5% dos usuários do produto da pesquisa tenham prejuízos 
à saúde) ou menos restritivos. Se for o caso, não se preocupe, pois é muito fácil encontrar tabelas 
com outros níveis de significância em livros de estatística ou na internet. 
3.2 O ESCORE PADRÃO E A ESTATÍSTICA “Z”
No item 1.4.4.2, iniciamos a explicação sobre curva normal com o auxílio de um exemplo sobre 
o peso dos alunos desta Faculdade; vamos ser mais específicos agora. Suponha que você tenha 
pesado todos os alunos (vamos imaginar n = 4000), calculado a média (µ = 70 kg) e o desvio-
padrão dessa população (digamos σ = 10 kg).
O escore padrão, ou “Z” nos permite calcular quantos desvios-padrão a partir da média uma 
determinada medição se encontra. Sua fórmula é (já sabemos o significado de todos os símbolos, 
mas se ainda tiver dúvida, verifique no AVA):
 
Agora vamos pegar dois alunos quaisquer que pesam 90 kg e 40 kg e calcular seus escores 
51BIOESTATÍSTICA E 
EPIDEMIOLOGIA
padrões (relembrando que µ = 70 kg e σ = 10 kg).
Esses resultados nos informam que o aluno mais pesado está 2 desvios-padrão acima da média, 
enquanto o aluno mais leve está a 3 desvios-padrão abaixo da média. Mas o que isso significa? 
Vejamos algumas das proporções da Curva de Gauss (no AVA, você encontra a tabela com muitas 
outras proporções):
o intervalo entre µ ± 1� contém 68,27% das medições;
o intervalo entre µ ± 2� contém 95,44% das medições e
o intervalo entre µ ± 3� contém 99,73% das medições.
Figura 5. Proporções da Distribuição de Gauss.
Fonte: Zar, 2010. 
No nosso exemplo, significa que 68,27% dos 4000 alunos têm entre 60 kg e 80 kg (µ, que 
é 70 kg, ± 1σ, que é 10 kg); 95,44% têm entre 50 kg e 90 kg; e 99,73% têm entre 40 kg e 100 
kg. Interessante, não é? Veja como ficaria a curva normal, com a anotação do nosso aluno mais 
pesado:
52BIOESTATÍSTICA E 
EPIDEMIOLOGIA
Figura 6. Proporções de uma Distribuição normal com média igual a 70 e desvio-padrão 10.
Fonte: o autor.
Toda a parte clara sob a curva normal representa os alunos que têm menos que 90 kg, enquanto 
a parte rosa representa alunos que têm mais que esse peso.
Já o teste “Z” apresenta outra informação, além de quantos desvios-padrão uma determinada 
medição está além ou aquém da média, como ocorre com o escore padrão. Mas antes de 
continuarmos, precisamos compreender outro conceito: o erro padrão da média, que é a 
estimativa do desvio-padrão de todas as médias de tamanho “n” eventualmente retiradas de uma 
população. Sua fórmula é:
Já a fórmula do teste “Z” é:
53BIOESTATÍSTICA E 
EPIDEMIOLOGIA
Além disso, é importante frisarque as estatísticas “Z” e “t” (que será visto na sequência) 
apresentam distribuições simétricas. Sabendo disso, cabe ressaltar que o teste pode ser unilateral 
ou bilateral. Se optarmos por um teste unilateral, estaremos indicando que estamos verificando 
se a média amostral é maior ou menor que a média populacional (somente uma das duas 
opções). Já se optarmos pelo teste bilateral, estaremos indicando que desejamos verificar se a 
média amostral é diferente (pode ser maior ou menor) da média populacional. Na maioria das 
vezes, é preferível optar pelo teste bilateral, pois eventualmente os tratamentos podem ter efeito 
inesperado (e.g. aumento de flúor na água aumentar a incidência de cárie dental). Além disso, 
considerando a simetria dessas distribuições, qualquer valor positivo será correspondente ao 
mesmo valor negativo, como veremos no exemplo abaixo.
Vamos ao exemplo. Imagine que o secretário de saúde do seu município afirme ter todos os 
dados e informe que a idade média das gestantes atendidas através do SUS é igual a 25 anos, 
com um desvio-padrão de 5 anos. Contudo, você deseja conduzir um estudo, pois percebe uma 
predominância de jovens adultas e adolescentes nos atendimentos em postos de saúde. Para isso, 
você determina as hipóteses nula, ou seja, a média informada pelo secretário é igual a média 
real da população, e alternativa, ou seja, a média informada é diferente. Em seguida, você realiza 
uma amostragem probabilística (conforme vimos no item 1.3) e verifica a idade de 25 gestantes. 
Realiza o cálculo da idade média da sua amostra, que revela o resultado de 22 anos. Agora você já 
tem os dados para realizar um teste estatístico, cujo resultado será:
Como já vimos no item 3.1, os resultados de todos os testes estatísticos devem ser confrontados 
com os valores críticos, que estão nas tabelas para consulta no AVA. Para esse caso, verifica-se 
que o valor crítico para o nível de confiança é de –1,96. Esse valor (assim como o valor positivo 
1,96) proporciona exatamente a porcentagem de 5% de ocorrer aleatoriamente no conjunto de 
dados. Sendo assim, qualquer valor que o ultrapasse tem probabilidade, ou p-value, menor que 
5%. Considerando que nossos exemplos, avaliações e exercícios levam em conta o nível de 95%, 
deve-se rejeitar a hipótese nula, pois o valor calculado ultrapassa o valor crítico.
54BIOESTATÍSTICA E 
EPIDEMIOLOGIA
3.3 TESTE “T” DE STUDENT PARA UMA AMOSTRA
O teste “t” deve ser utilizado quando não possuirmos os parâmetros populacionais (desvio-
padrão “�”, por exemplo) e/ou quando o “n” amostral for muito menor que a população. Raramente 
um pesquisador possui os parâmetros da população, como no caso do secretário que afirmava 
tê-los (pelo resultado do item anterior, parece que na realidade não tinha). Isso acontece porque 
muitas vezes é inviável medir o conjunto completo de variáveis, seja por falta de tempo, verba 
para a pesquisa ou simplesmente impossibilidade prática. Por essa razão, o teste “t” é muito mais 
utilizado na Bioestatística que o teste “Z”.
Felizmente, tudo o que aprendemos sobre o teste “Z” servirá para o teste “t”. A única diferença 
será o valor crítico, que pertence à tabela própria desta estatística (que, como todas as outras, 
encontra-se no AVA). Confira a fórmula para o cálculo de “t” para uma amostra:
Vamos ao exemplo, dessa vez realizando o passo a passo de uma pesquisa quantitativa. 
Destaco que em nossos exemplos e avaliações, o valor da estatística crítica sempre será dado. 
Contudo, as tabelas estão disponíveis no AVA e, se você for procurá-los para conduzir estudos 
ou realizar exercícios, saiba que o tamanho da amostra influencia no seu valor. Você precisa 
procurar na linha indicada pelos graus de liberdade (referenciado como GL ou v), que nada mais 
é que o número de dados menos 1 (n – 1).
Suponha que você queira descobrir se o uso de um anticoncepcional com estrógeno causa 
alterações de peso em mulheres, tanto para mais, quanto para menos (teste bilateral). Para isso, 
você mediu o peso de 4 mulheres antes e depois de dois anos de uso contínuo. As diferenças 
foram 6, 6, – 6 e 6 (valores positivos indicam ganho de peso; o valor negativo indica perda de 
peso). O valor crítico de “t” para “n” = 4 é 3,18 (conforme tabela no AVA) e, como sempre, o nível 
de significância é de 95%.
O primeiro passo é formular as hipóteses nula e alternativa. Como já vimos, a hipótese nula é 
a hipótese da igualdade e a hipótese alternativa é a da diferença. Portanto, para esse caso, 
H
o
: µ = 0, ou seja, a média da população de onde esta amostra foi retirada (pesos de todas as 
mulheres que tomam esse tipo de anticoncepcional) é igual a zero e
55BIOESTATÍSTICA E 
EPIDEMIOLOGIA
H
1
: µ ≠ 0, ou seja, a média pode ser maior ou menor que zero (houve alteração de peso para 
mais ou para menos).
O próximo passo é realizar o cálculo do teste:
O último passo consiste em interpretar o resultado. Considerando que o valor calculado foi 
igual a 1 e não ultrapassou o valor crítico, que é igual a 3,18, devemos aceitar a hipótese nula, 
ou seja, o anticoncepcional não altera o peso das usuárias (ainda que o peso médio daquela 
amostra tenha sido 3 kg maior, não significa que a população de mulheres que tomam esse 
anticoncepcional terá peso maior).
VAMOS REFLETIR:
Se a amostra fosse de 64 mulheres, como acha que seria o resultado? Pesquise e 
descubra a importância de amostras grandes.
VOCÊ SABIA? 
O teste “t” também pode ser utilizado para comparar médias, mas para o propósito 
do nosso curso, o teste para uma amostra (que acabamos de discutir) será mais do que 
suficiente.
56BIOESTATÍSTICA E 
EPIDEMIOLOGIA
3.4 ANÁLISE DE VARIÂNCIA (ANOVA)
Quando for necessária a comparação entre mais de dois grupos paramétricos (que aprendemos 
a realizar com os testes “t” e “Z”), a probabilidade de rejeitar incorretamente a hipótese nula 
aumenta. Para evitar esse aumento na probabilidade de erro, quando houver mais de dois 
tratamentos para serem comparados, deve-se optar pela análise de variância, ou ANOVA. Em 
nossos exemplos, exercícios e avaliações isso não será necessário. Além disso, o estudo da ANOVA 
está além dos objetivos desse nosso curso. Contudo, é importante ressaltar que situações como a 
descrita aqui podem ocorrer na pesquisa real.
Para os propósitos dessa disciplina, será suficiente saber a característica principal da análise 
de variância. Este teste compara a variação entre os grupos, com a variação de ocorre dentro dos 
grupos. Sua fórmula resumida é:
ou seja, quanto maior a proporção da variação entre um grupo, maior será o valor de F, enquanto 
que uma grande variação dentro de um grupo, reduzirá o valor de F. Como em qualquer teste 
estatístico, o aumento da estatística calculada aumenta as chances de se rejeitar a hipótese nula 
(pois quando comparamos com as estatísticas críticas tabeladas, há maior chance de ultrapassá-
las).
 Veja um exemplo simples. Suponha que você seja um odontólogo tentando determinar se há 
diferença estatisticamente significante no escurecimento da dentina que transparece através do 
esmalte em indivíduos que ingerem água, suco de uva ou café. Como de praxe, a hipótese nula será 
a de que não há diferença no escurecimento da dentina em relação à ingestão das três bebidas, 
enquanto a hipótese alternativa será a de que pelo menos uma bebida causa mais escurecimento 
que outra. Perceba que há três grupos (água, café e suco de uva) e suponha que haja 3 medições 
em cada grupo. Se houver uma grande variação dentro de cada grupo, ou seja, cada medição for 
muito diferente de outras, é mais provável que a bebida não causa tanta diferença, mas sim outras 
características dos participantes do experimento. Já se for observada uma grande variação entre 
os três tratamentos, é mais provável que as bebidas causem o escurecimento. É essa relação, entre 
a variação entre grupos com a variação dentro dos grupos que a ANOVA nos fornece.57BIOESTATÍSTICA E 
EPIDEMIOLOGIA
3.5 TESTE NÃO-PARAMÉTRICO PARA DUAS AMOSTRAS: MANN-WHITNEY (“U”)
Todos os testes estatísticos que estudamos até agora podem ser agrupados em uma categoria 
chamada de testes paramétricos, pois são baseados em parâmetros populacionais, tais como 
média, desvio-padrão etc. Porém, alguns métodos estatísticos não requerem a estimação dos 
parâmetros e, portanto, podem ser usados para análise de variáveis cujas distribuições não são 
conhecidas (por exemplo, quando não podemos verificar se os dados têm uma distribuição 
normal). Além disso, a maioria dos testes não-paramétrios utiliza técnicas que convertem os 
dados observados em posições relativas (ou rankings), o que traz a vantagem de diminuir a 
influência de outliers (se você esqueceu o que significa, reveja o item 1.3). Por outro lado, alguma 
informação sobre os dados é perdida na conversão e, quando comparado aos testes paramétricos, 
os testes não-paramétricos têm uma probabilidade de cometer erro ligeiramente superior).
Outra consideração bastante importante: é necessária alguma experiência em análise de dados 
e o conhecimento de outros métodos de verificação de distribuições (que extrapola os objetivos 
do nosso curso) para identificar a necessidade de se utilizar um teste não-paramétrico. Mas não 
se preocupe; nossos exercícios, exemplos e avaliações indicarão claramente essa necessidade.
Agora que já temos uma noção de estatística não-paramétrica, vamos ser mais específicos. A 
comparação de conjuntos de variáveis não-paramétricas é necessária para verificarmos se esses 
conjuntos apresentam diferença estatisticamente significante entre eles, ou a variação percebida 
foi apenas aleatória. Imagine, por exemplo, que você pretende descobrir se os alunos da sua sala 
têm alturas diferentes das alunas. Antes de mais nada, você formula as hipóteses, sendo: H0: 
alunos e alunas têm alturas iguais e H1: alunos e alunas têm alturas diferentes. Em seguida você 
realiza uma das 4 amostragens probabilísticas que você aprendeu e mede 7 alunos selecionados 
(cujos resultados, em centímetros, são: 190, 187, 184, 181, 180, 174 e 169) e 5 alunas selecionadas 
(resultados: 164, 165, 168, 173 e 178). Se você desejasse utilizar alguma técnica de estatística 
descritiva, poderia informar que a média dos alunos é maior que a média das alunas ou alguma 
informação sobre o desvio-padrão, coeficiente de variação etc. 
Contudo, como já dissemos, a Bioestatística inferencial (tema deste capítulo) vai além. O 
que queremos determinar é se, dado o nível de significância (como sempre, 95%), essas duas 
amostras, que chamamos genericamente de Grupo 1 e Grupo 2, vêm de populações com alturas 
médias diferentes ou iguais. Sendo assim, vamos às fórmulas do teste “U” (Mann-Whitney):
58BIOESTATÍSTICA E 
EPIDEMIOLOGIA
onde n
1
 é o número de dados do grupo 1 (alunos, neste caso);
n
2
 é o número de dados do grupo 2 (alunas) e
R
1
 é a soma dos rankings das variáveis do grupo 1. 
Para facilitar a compreensão, vamos dispor os dados em duas colunas e determinar suas 
quantidades de dados ou tamanhos amostrais (n):
Tabela 7. Altura suposta, em centímetros, de 7 alunos e 5 alunas. 
Fonte: o autor.
Agora falta somente a soma dos rankings do grupo 1 (R
1
). Para isso, basta colocar o número 
ordinal em cada uma das medições, independentemente da amostra, começando pelo menor 
(se for começar pelo maior, o resultado será o mesmo). Sendo assim, o menor número de todas 
as 12 medições será o número 1; o segundo menor, o número 2 e assim por diante. Após colocar 
todos os ordinais, basta somar os que pertencem ao grupo 1 para obter o R
1
 que precisamos para 
completar a fórmula. Vejamos como fica:
59BIOESTATÍSTICA E 
EPIDEMIOLOGIA
Tabela 8. Altura suposta, em centímetros, de 7 alunos e 5 alunas e suas posições relativas 
(entre parênteses).
Fonte: o autor.
Finalmente, vamos calcular o U
1
 e U
2
 e comparar o maior deles com o U crítico, fornecido pela 
tabela do AVA, que é igual a 30 para esse conjunto de dados (com n
1
 = 7 e n
2
 = 5). Como sempre, se 
o valor da estatística calculada for maior que o crítico, rejeitamos a hipótese nula (há igualdade) 
e aceitamos a hipótese alternativa (há diferença). Vamos aos cálculos:
Considerando que o maior número entre U
1
 e U
2 
é 32, devemos compará-lo com o valor 
de U crítico tabelado, que é 30. Sendo o U calculado maior que o crítico tabelado, rejeitamos 
H
0
 e aceitamos H
1
, ou seja, os alunos e as alunas não têm a mesma altura, pois a diferença é 
estatisticamente significante.
60BIOESTATÍSTICA E 
EPIDEMIOLOGIA
3.6 TESTE NÃO-PARAMÉTRICO PARA 3 OU MAIS AMOSTRAS: KRUSKAL-WALLIS (“H”)
O princípio do teste de Kruskal-Wallis é o mesmo da estatística “U”, pois também utilizaremos 
o tamanho de cada amostra, além da soma do ranking ou posições relativas. Apesar de apresentar 
uma fórmula diferente, todas as considerações a respeito das características de um conjunto de 
dados não-paramétricos feitas no item anterior, continuam válidas (inclusive a informação nos 
exercícios, exemplos e avaliações sobre a necessidade de se utilizar um teste não-paramétrico). 
O teste “H” deve ser usado quando precisarmos identificar se há diferença significante entre 3 
ou mais amostras, pois o teste “U” permite a comparação apenas entre 2 amostras. A fórmula do 
teste de Krusal-Wallis é:
A fórmula parece ser uma pouco mais complicada que a anterior, mas se calcularmos o 
termo separadamente, facilitará muito o processo. Lembre-se que o “i” sobescrito em “R” 
e “n” representa o número de grupos que devem ser comparados. Vamos supor que desejamos 
comparar três ou quatro grupos. Nesses casos, os termos ficariam assim, respectivamente:
Mais fácil, não é mesmo? Agora vamos a um exemplo. Imagine que você queira determinar 
se há diferença estatisticamente significante entre o índice de massa corporal (IMC) de três 
grupos de 5 mulheres cada, selecionadas aleatoriamente nas cidades de Balneário Camboriú, 
Itajaí e Camboriú. Como você já deve saber, vamos iniciar formulando as hipóteses. H
0
: mulheres 
têm o mesmo IMC nas três cidades e H
1
: em pelo menos uma das três cidades as mulheres têm 
IMC diferente. Agora, apresentamos os dados, juntamente com seus tamanhos amostrais (n) e 
rankings em parênteses, assim como fizemos no item anterior:
61BIOESTATÍSTICA E 
EPIDEMIOLOGIA
Tabela 9. IMC suposto de 15 mulheres e suas posições relativas (entre parênteses).
Fonte: o autor.
Antes de realizarmos o cálculo final, valor calcular separadamente a expressão :
Finalmente, podemos substituir na fórmula:
Considerando que o valor crítico de “H” para 3 grupos de 5 variáveis cada é igual 5,78 (tabela 
no AVA), rejeitamos a hipótese nula, pois o “H” calculado ultrapassou o “H” crítico. Portanto, 
pelo menos em uma das 3 cidades, as mulheres apresentam um IMC maior e a diferença não foi 
aleatória. Sempre que isso acontece, cabe ao pesquisador explicar essa diferença na conclusão ou 
considerações finais do seu trabalho.
Agora que já conhecemos os procedimentos para o cálculo de dois testes estatísticos não-
paramétricos, gostaria de acrescentar uma informação que não será necessária em nossas 
avaliações (para evitar o aumento da complexidade em assuntos tão pouco discutidos ao longo 
da nossa educação formal), mas que pode aparecer em sua pesquisa na prática. Trata-se da 
possibilidade de nos depararmos com valores iguais entre as variáveis. Quando isso ocorrer, 
para calcularmos o ranking, devemos fazer a média aritmética simples das posições e atribuir o 
valor aos valores repetidos. Por exemplo, se tivermos os valores 13, 15, 15 e 17, os rankings, entre 
parênteses, ficariam: 13 (1); 15 (2,5 – que é a média entre as posições 2 e 3); 15 (2,5); 17 (4).
62BIOESTATÍSTICA E 
EPIDEMIOLOGIA
Você encontrará exercícios e mais exemplos no Ambiente Virtual de 
Aprendizagem.
3.7 CONSIDERAÇÕES FINAIS DO CAPÍTULO 3
A Bioestatísticainferencial é representada por diversos testes estatísticos que possibilitam 
ao pesquisador confirmar ou refutar hipóteses sobre populações, a partir de amostras. Neste 
capítulo, entramos em contato com os testes de hipótese e agora já podemos usá-los para aceitar 
ou rejeitar hipóteses, que devem ser formuladas preferencialmente antes da coleta dos dados. 
Aprendemos que a hipótese nula (H
0
) representa a igualdade (e.g. a altura média de um grupo 
não é diferente da altura média do outro grupo), enquanto a hipótese alternativa (H
1
) representa 
a diferença (e.g. a altura média de um grupo é maior/menor que a altura média do outro). Já os 
cálculos dos testes estatísticos com os quais nos deparamos neste capítulo fornecerão os valores 
que serão comparados com os valores críticos (tabelados) e sempre que esses valores calculados 
forem maiores que os valores críticos, devemos rejeitar a hipótese nula (e aceitar a hipótese 
alternativa), ou seja, podemos afirmar que há diferença estatisticamente significante entre os 
grupos ou parâmetros comparados. 
Dividimos os testes em paramétricos (quando temos a possibilidade de comparar uma 
estatística amostral com um parâmetro populacional) e não-paramétricos. Entre os paramétricos, 
aprendemos a calcular o teste “z” e “t” de Student para uma amostra (há outras possibilidades, mas 
essas formas são suficientes para alcançarmos nossos objetivos), cujos resultados representam 
distâncias padronizadas em relação à média populacional ou média alegada. Na prática, a única 
diferença entre esses dois testes consiste no valor das estatísticas tabeladas. Importante frisar 
que só poderemos utilizar o teste “z” quando os parâmetros populacionais (e.g. desvio-padrão) 
forem conhecidos ou quando o “n” for grande (maior que 30). Como raramente isso ocorre, quase 
sempre se utilizará o teste “t” na pesquisa real. Outra observação necessária refere-se ao aumento 
na probabilidade de se rejeitar incorretamente a hipótese nula quando houver a necessidade de 
comparação entre 3 ou mais tratamentos. Para esses casos, é indicado o uso da análise de variância 
(ANOVA), ou estatística “F”, que compara a variação entre os tratamentos, com a variação que 
ocorre dentro dos tratamentos.
Os 3 testes paramétricos descritos no parágrafo anterior são prioritários quando um 
63BIOESTATÍSTICA E 
EPIDEMIOLOGIA
pesquisador for escolher a estatística adequada, pois apresentam menores probabilidades de 
incorrer em erros em relação aos testes não-paramétricos. Contudo, algumas vezes é necessário 
utilizar estes últimos, pois as distribuições não são conhecidas. Em geral, os testes não-
paramétricos utilizam a posição relativa das variáveis para o cálculo e, por isso, não é necessário 
a estimação dos parâmetros populacionais. Neste capítulo 3, aprendemos a calcular o teste não-
paramétrico de Mann-Whitney, ou estatística “U”, que permite a comparação entre dois grupos, 
e o teste não-paramétrico de Kruskal-Wallis, para comparação entre 3 ou mais grupos. 
Gostaria de lembrar que em qualquer teste estatístico, sempre que o valor calculado for maior 
que o valor crítico (tabelado), deve-se rejeitar a hipótese nula. Além disso, como já foi citado, 
os valores críticos dependem da quantidade de dados e do nível de confiança escolhido para o 
estudo específico. Em nossos exercícios e avaliações esse nível será de 95% para todos os casos e 
os valores críticos sempre serão fornecidos. Chegamos ao fim da Bioestatística e nos próximos 4 
capítulos, estudaremos temas relacionados à Epidemiologia.
64BIOESTATÍSTICA E 
EPIDEMIOLOGIA
EPIDEMIOLOGIA
4 – CONCEITOS BÁSICOS DE EPIDEMIOLOGIA
A Epidemiologia é a ciência básica da saúde pública, que utiliza os métodos da Bioestatística, 
que aprendemos na Unidade 1, para quantificar os fenômenos dos processos de saúde e doença. 
Por isso, cada vez mais a Epidemiologia tem se tornado uma importante fonte de informação para 
as Ciências da Saúde. Quanto à etimologia, a palavra deriva do grego: epi (sobre) + demos (povo) 
+ logos (ciência), ou seja, Epidemiologia pode ser entendida como a ciência que estuda o que 
acontece com uma população.
Agora que sabemos a origem da palavra e a utilidade de ciência, vamos a uma definição 
mais completa. A Associação Internacional de Epidemiologia (IEA), em seu Guia de Métodos de 
Ensino, define essa ciência como sendo “o estudo dos fatores que determinam a frequência e a 
distribuição das doenças nas coletividades humanas” (ALMEIDA FILHO; ROUQUAYROL, 2013, p. 
4). A definição pode ser ampliada, diferenciando a atenção individual da coletiva:
 “... enquanto a clínica dedica-se ao estudo da doença no indivíduo, analisando 
caso a caso, a epidemiologia debruça-se sobre os problemas de saúde em 
grupos de pessoas, às vezes grupos pequenos, na maioria das vezes envolvendo 
populações numerosas” (RODRIGUES et al., 2014, p. 9). 
UNIDADE 2
CAPÍTULO 4
65BIOESTATÍSTICA E 
EPIDEMIOLOGIA
Ainda de acordo com o IEA, são três os principais objetivos da epidemiologia:
I. Descrever a distribuição e a magnitude dos problemas de saúde das populações humanas.
II. Proporcionar dados essenciais para o planejamento, execução e avaliação das ações de 
prevenção, controle e tratamento das doenças, bem como para estabelecer prioridades.
III. Identificar fatores etiológicos na gênese das enfermidades.
4.1 PERSPECTIVAS HISTÓRICAS
Hipócrates (460 a.C - 377 a.C), considerado o pai da medicina científica, foi o primeiro a sugerir 
que as causas das doenças não eram intrínsecas à pessoa nem aos desígnios divinos, mas que 
estava relacionada a certas características ambientais. Embora as causas relatadas por Hipócrates 
tenham sido superadas, ele lançou as bases para a procura da causalidade das doenças e agravos 
à saúde, norte principal da epidemiologia até hoje.
Hipócrates, em Tratado dos ares, das águas e dos lugares (século V a.C.), coloca os termos 
epidêmico e endêmico, derivados de epidemion (verbo que significa visitar, referindo-se às 
enfermidades que visitam) e endemion (residir, referindo-se às enfermidades que permanecem 
na comunidade). Ele sugeriu neste trabalho que condições, tais como o clima de uma região, a 
água ou sua situação num lugar em que os ventos sejam favoráveis são elementos que podem 
ajudar o médico a avaliar a saúde geral de seus habitantes. Em outra obra, Tratado do prognóstico 
e aforismos, ele trouxe a ideia, então revolucionária, de que o médico poderia predizer a evolução 
de uma doença mediante a observação de um número suficiente de casos. Essa também é, até 
hoje, uma das principais características da epidemiologia e da demografia.
Infelizmente, os herdeiros de Hipócrates deixaram de lado o espírito coletivo de sua 
medicina. Além disso, na Idade Média, houve o declínio científico nas Ciências da Saúde, que se 
preocupavam mais com as práticas religiosas e de magia, revelando a ideologia da época medieval 
(salvar a alma, mesmo que o corpo material pereça). Nos séculos dominados por essa vertente, 
a preocupação coletiva era revivida em momentos críticos, como as explosões de peste, pragas e 
outras epidemias.
Ainda que tenha havido algumas manifestações de preocupação com a saúde coletiva da 
população, principalmente no mundo árabe (por exemplo, em Bagdá e Córdoba, no século X), 
66BIOESTATÍSTICA E 
EPIDEMIOLOGIA
somente no século XVII teremos contato com uma publicação que tratou de assuntos tipicamente 
epidemiológicos. Trata-se de um trabalho do inglês John Graunt, em 1662, publicado em Londres, 
sobre as observações a respeito das estatísticas de mortalidade, no qual analisou nascimentos e 
óbitos semanais, quantificou o padrão de doença na população londrina e apontou características 
importantes nesses eventos, tais como: diferenças entre homens e mulheres, entre população 
urbana e rural, elevada mortalidade infantil e variações sazonais. Graunt também é considerado 
um dos precursores da epidemiologiae da demografia como disciplinas, já que criou as bases para 
a observação da distribuição de frequência de dados populacionais de mortalidade coletados 
rotineiramente (a propósito, como vimos na Unidade 1, é uma forma adequada de descrever 
grandes quantidades de dados, lembra?)
Outro inglês, John Snow, é pioneiro na procura sistemática dos determinantes das epidemias. 
Seu ensaio sobre a maneira de transmissão da cólera, publicado em 1855, apresenta estudos 
a respeito das epidemias da doença ocorridas em Londres em 1849 e 1854. Suas anotações 
sistemáticas sobre os casos levaram a desenvolver a ideia de que a epidemia da cólera era 
ocasionada por parasitas invisíveis e não por miasmas, como se pensava na época. Ele elaborou 
hipóteses sobre a qualidade da água como meio principal de contágio.
4.2 EVOLUÇÃO CONCEITUAL
A partir das primeiras décadas do século XX, com a melhoria do nível de vida nos países 
desenvolvidos e com o consequente declínio na incidência das doenças infecciosas, outras 
enfermidades de caráter não-transmissível (doenças cardiovasculares, câncer e outras) passaram 
a ser incluídas entre os objetos de estudos epidemiológicos. Além disso, pesquisas mais recentes, 
sobretudo as que utilizam o método de estratificação social, enriqueceram esse campo da ciência, 
ensejando novos debates.
No entanto, é a partir do final da Segunda Guerra Mundial que assistimos ao intenso 
desenvolvimento da metodologia epidemiológica, com a ampla incorporação da estatística, 
propiciada em boa parte pelo aparecimento dos computadores. A aplicação da epidemiologia 
passa a cobrir um largo espectro de agravos à saúde. Os estudos de Doll e Hill (1954), estabelecendo 
associação entre o tabagismo e o câncer de pulmão, e os estudos de doenças cardiovasculares 
desenvolvidas na população da cidade de Framingham, Estados Unidos, são dois exemplos 
Miasmas: 
supostos gases 
de animais e 
dejetos em 
decomposição 
que transmitem 
doenças
67BIOESTATÍSTICA E 
EPIDEMIOLOGIA
da aplicação do método epidemiológico em doenças crônicas que são importantes marcos na 
Epidemiologia.
Hoje a Epidemiologia constitui importante instrumento para a pesquisa na área da saúde, 
seja no campo da clínica, seja no da saúde pública. No Brasil, a organização dos serviços do 
Sistema Único de Saúde (SUS) baseia-se na descentralização sendo, portanto, indispensável 
o conhecimento da epidemiologia nos serviços locais de saúde. Essas novas metodologias e 
concepções ampliaram ainda mais o espectro de atuação da ciência epidemiológica, que inclui 
além dos agravos à saúde, as condições que promovem a prevenção. Também passaram a ser 
objeto de estudo epidemiológico causas externas, como acidentes de trânsito e outras doenças 
difusas, tais como obesidade e cárie.
4.3 DEFINIÇÕES BÁSICAS
Algumas definições, com as quais não estamos familiarizados no dia a dia, são essenciais para 
a compreensão da lógica epidemiológica. Por isso, trabalharemos nesse item alguns conceitos 
que serão úteis no estudo da Epidemiologia, principalmente quando for necessário descrever 
eventos de morbidade e mortalidade.
Primeiramente, vamos conceituar saúde e doença. Pode parecer óbvio a você o que significa 
saúde. Contudo, quando é preciso expressar em palavras, algumas pessoas têm dificuldade 
em definir adequadamente esse termo. A Organização Mundial da Saúde (OMS) define saúde 
como sendo “um estado de completo bem-estar físico, mental e social, e não apenas a ausência 
de doença ou enfermidade” (RODRIGUES et al., p. 10). Já doença, sob essa mesma perspectiva 
pode ser descrita como desajuste ou falha nos mecanismos de adaptação do organismo ou uma 
ausência de reação aos estímulos a cuja ação está exposto, desencadeando um processo que 
conduz a uma perturbação da estrutura ou da função de um órgão, de um sistema ou de todo um 
organismo ou de suas funções vitais. Essas abordagens são bastante simplistas, pois a percepção 
de saúde ou doença é subjetiva e varia de acordo com as características do indivíduo. No âmbito 
do Sistema Único de Saúde (SUS), uma definição mais abrangente, defendida por muitos autores, 
inclui os planos biológicos (alteração de função orgânica), individual (condição geral de saúde) 
e coletivo (fenômeno clínico e social dependente de vários fatores, inclusive extrínsecos ao 
indivíduo como, por exemplo, local de moradia). 
Por outro lado, doença é a falta ou perturbação da saúde, moléstia, mal ou enfermidade e pode 
Morbidade: 
relativo a 
doenças
Mortalidade: 
relativo a 
mortes
68BIOESTATÍSTICA E 
EPIDEMIOLOGIA
ser classificada de várias maneiras. Quanto à forma, as doenças podem ser manifestas ou clínicas 
(apresentam sinais e/ou sintomas), subclínica (aquela em que o indivíduo que não apresenta 
nenhum sinal ou sintoma e somente é revelada através de exames complementares), abortiva 
(desaparece rapidamente após poucos sinais ou sintomas) e fulminante (leva rapidamente 
a óbito). Quanto à transmissibilidade, podem ser transmissíveis ou infecciosas (causada por 
transmissão de um agente patogênico para um hospedeiro suscetível) ou não-transmissíveis 
(todas as que não resultam de infecção, como por exemplo, diabetes). Por fim, quando à duração, 
as doenças podem ser agudas (curta duração) ou crônicas (longa duração).
Outro conceito importante em Epidemiologia é aquele relacionado à delimitação da distribuição 
das doenças ou mortes em intervalos definidos. Para compreendermos melhor como os agravos 
à saúde se distribuem, precisamos saber diferenciar prevalência de incidência. Prevalência é a 
medida que descreve a quantidade de doença verificada em determinado momento, ou seja, o 
número de casos totais dessa doença em uma população. Já incidência representa a quantidade 
de casos de uma doença em um intervalo de tempo, ou seja, o número de casos novos em uma 
população. Por exemplo, suponha que em nossa cidade, o número total de pessoas com câncer 
de boca, no último dia 31 de dezembro seja igual a 80; destes, 20 foram diagnosticados no ano 
passado. Sendo assim, a prevalência de câncer de boca em Balneário Camboriú é de 80, enquanto 
a incidência no ano passado foi de 20.
4.4 CONSIDERAÇÕES FINAIS DO CAPÍTULO 4
Após o estudo desse capítulo, estamos aptos a conceituar Epidemiologia, que é a ciência 
básica da saúde pública, e cujos objetivos são: determinar a distribuição espacial e temporal das 
doenças entre as populações, identificar as causas dessas doenças e proporcionar informação 
para ações de promoção, prevenção e recuperação da saúde. Sob a perspectiva histórica, vimos 
que Hipócrates (cinco séculos antes de Cristo) iniciou a tradição científica na medicina ao 
procurar causas para os agravos à saúde da população. Já no século XVII, o inglês John Graunt 
lançou um tratado que relacionava variáveis (como sexo, idade etc.) ao número de mortos, 
viabilizando os estudos de distribuição de frequências de dados populacionais, utilizados até 
hoje. Dois séculos mais tarde, John Snow utilizou a procura sistemática dos determinantes das 
epidemias (formulando a hipótese de contaminação da água para a disseminação da cólera em 
Londres), usada em estudos epidemiológicos na atualidade.
Prevalência – nº 
total de casos 
totais
Incidência – nº 
de casos novos
69BIOESTATÍSTICA E 
EPIDEMIOLOGIA
Outra constatação interessante foi a de que, na época dos pioneiros da Epidemiologia, 
as doenças transmissíveis constituíam o único objeto de estudo dessa ciência. Contudo, 
principalmente após a Segunda Guerra Mundial, a evolução da tecnologia permitiu a ampliação 
da investigação epidemiológica, ao mesmo tempo em que a prevalência de doenças infecciosas 
diminuiu drasticamente, em função da disseminação de antibióticos e vacinação. Esses fatores 
fizeram com que doenças não-transmissíveis e crônicas, tais com câncer e diabetes, fossem 
introduzidas no estudo epidemiológico. Dessa forma, a Epidemiologia se tornou um instrumentomais completo e essencial para a pesquisa na área da saúde pública e na clínica médica.
Neste capítulo também entramos em contato com alguns termos utilizados com frequência 
na Epidemiologia, tais como medidas de mortalidade (relativas a mortes) e morbidade (relativas 
a doenças), além de definirmos os conceitos de saúde e doença de forma ampla, conforme 
entendido pela Organização Mundial da Saúde. Outra importante informação trazida pelo 
capítulo 4 se refere às maneiras de descrever medidas de saúde/doença em função do número 
de casos totais em uma população em dado momento (prevalência) e em função do número de 
novos casos em determinado período, em uma dada população (incidência). Conhecendo esses 
conceitos, podemos seguir para o estudo do processo que leva uma pessoa saudável a se tornar 
doente; isso será feito no próximo capítulo, no qual explicaremos o processo saúde-doença 
através de 3 modelos explicativos. 
70BIOESTATÍSTICA E 
EPIDEMIOLOGIA
 5 PROCESSO SAÚDE-DOENÇA
Agora que já podemos definir saúde e doença, vamos estudar o caminho que leva uma pessoa 
saudável a se transformar em uma pessoa doente, ou vice-versa. Esse caminho será referido, a 
partir de agora, como sendo o processo saúde-doença, que representa o conjunto de relações e 
variáveis que produzem e condicionam o estado de saúde-doença de uma população, e que varia 
em diversos momentos históricos do desenvolvimento científico da humanidade. A Epidemiologia 
fornece informações e conceitos específicos para a aplicação prática do conhecimento. Essa 
aplicação é realizada através de modelos explicativos do processo saúde-doença, que são 
construções teóricas que procuram entender a realidade desse complexo processo.
5.1 MODELOS EXPLICATIVOS DO PROCESSO SAÚDE-DOENÇA 
Os modelos descritos a seguir constituem visões diferentes de abordar o processo de saúde 
e doença e não têm hierarquia entre si, ou seja, não há um melhor do que outros em todas as 
ocasiões. Cabe ao profissional de saúde compreender a realidade da prática cotidiana para 
utilizar o modelo mais adequado. Além disso, é importante frisar que iremos discutir apenas 
os principais modelos e não incluiremos algumas abordagens que já não se aplicam (e servem 
apenas à história, brevemente citada no capítulo 1), como o modelo mágico-religioso ou o 
empírico-racional (de Hipócrates). Por outro lado, novos modelos poderão surgir e serem mais 
adequados às Ciências da Saúde, dado seu estágio de desenvolvimento científico. 
CAPÍTULO 5
71BIOESTATÍSTICA E 
EPIDEMIOLOGIA
5.1.1 Modelo biomédico ou de medicina científica ocidental
Os princípios teóricos do modelo biomédico atual baseiam-se na orientação científica do século 
XVII, da qual incorporou uma visão mecanicista e reducionista do ser humano e da natureza. 
Essa orientação surgiu quando filósofos como Galileu, Descartes, Newton, Bacon, entre outros, 
conceberam a realidade do mundo como uma máquina. Neste modelo, o conceito de doença deve 
ser analisado em termos estritamente biológicos. Assim, doença pode ser definida como uma 
falha nos mecanismos de adaptação do organismo ou ainda como sendo uma ausência de reação 
aos estímulos causados pela exposição. Esse processo conduz a uma perturbação da estrutura ou 
função de um órgão, de um sistema, organismo ou de suas funções vitais. O conceito de doença 
no modelo biomédico é abordado a partir de duas perspectivas. A primeira é do ponto de vista 
clínico, em que os problemas de saúde são classificados de acordo com a duração das alterações, 
disfunções e sintomas em agudos (curta duração) e crônicos (longa duração). A segunda 
perspectiva do modelo biomédico leva em consideração o caráter etiopatogênico do processo de 
adoecimento; nesse caso, as doenças são classificadas em infecciosas e não-infecciosas. A tabela 
a seguir resume a classificação das doenças de acordo com o modelo biomédico e traz alguns 
exemplos:
Tabela 10. Classificação e exemplos de doenças com base na etiologia e duração
Etiologia
Duração
Aguda Crônica
Infecciosas Tétano, gripe, sarampo Tuberculose, Chagas
Não-infecciosas Envenenamento, acidentes Diabetes, obesidade
Fonte: o autor.
5.1.2 Modelo de História Natural da Doença (HND) e prevenção
O modelo de HND, também chamado de processual, define doença como sendo um conjunto 
de processos ativos que criam o estímulo patológico, seguida da resposta do ser humano a 
Etiopatogenia: 
análise 
especializada 
das causas que 
ocasionam o 
desenvolvimento 
de certas 
doenças.
72BIOESTATÍSTICA E 
EPIDEMIOLOGIA
esse estímulo e finalizando em alterações que levam ao defeito, à invalidez, à recuperação ou à 
morte. Esse modelo considera que a determinação do estado patológico se dá em dois domínios 
complementares e consecutivos: o meio externo e o meio interno. No meio externo, os fatores 
que contribuem para o surgimento do processo de enfermidade podem ser físicos, biológicos, 
sociais, políticos e culturais. Já no meio interno, ocorrem uma série de modificações progressivas 
de natureza fisiológica, bioquímica ou histológica, próprias de cada doença. Outra consideração 
importante do modelo processual (ou de HND) é a divisão da evolução do processo patológico em 
duas fases consecutivas, começando pelo período de pré-patogênese e continuando no período 
de patogênese. No primeiro, os sintomas ou manifestações patológicas ainda não apresentam 
sinais, enquanto no segundo essas manifestações já se encontram ativas.
Os agentes que atuam no período pré-patogênico e que levam os estímulos do meio externo 
até o meio interno podem ser de diversas naturezas e podem estar associados, aumentando a 
probabilidade de que o processo resulte em doença. Seguem alguns exemplos:
 lagentes físicos ou químicos, como radiação ultravioleta ou mercúrio em um rio;
 lbiopatógenos, como parasitas, bactérias e vírus;
 lagentes nutricionais, como carência de vitaminas ou excesso de açúcar;
 lagentes genéticos, como na doença celíaca ou mutações genéticas;
Além dos agentes patogênicos, há fatores que são determinantes parciais ou fatores 
contribuintes que aumentam ainda mais o risco do desenvolvimento da doença. São os 
determinantes econômicos (grande parte das doenças são mais comuns em classes mais baixas, 
enquanto outras são mais comuns em classes mais altas), culturais (tais como hábitos de 
higiene e alimentação, preconceitos e crendices), ecológicos (como desastres naturais e poluição 
atmosférica) e psicossociais (por exemplo, quando o sistema imunológico é suprimido devido à 
episódios de depressão).
Já no período patogênico, o modelo de HND define que se iniciam as primeiras alterações 
visíveis no sujeito afetado. Essas perturbações começam no nível celular e são de origem 
bioquímica, que continuam e se transformam em distúrbios na forma e função de órgãos e 
sistemas. Apesar de já estar instalada a doença, as primeiras alterações são subclínicas, pois 
somente exames clínicos ou laboratoriais orientados podem detectá-las. Esses distúrbios podem 
evoluir para incapacitação, cronicidade, convalescença (período de recuperação), morte ou cura. 
A linha imaginária que divide as alterações subclínicas das alterações clínicas (quando já se pode 
perceber a doença diretamente) é chamado de horizonte clínico. 
Vamos utilizar o modelo processual para investigar uma doença específica como, por 
73BIOESTATÍSTICA E 
EPIDEMIOLOGIA
exemplo, a cárie dentária. Podemos identificar no período pré-patogênico um desequilíbrio entre 
ambiente (ph da saliva), hospedeiro (má higienização e alimentação) e agente (maior atividade 
do S.mutans). As repercussões desse desequilíbrio podem passar para o período patogênico ao 
originar uma mancha branca não cavitada (horizonte clínico ultrapassado, pois já é possível 
observar a alteração diretamente), evoluindo para uma cárie que atinge a dentina e a polpa, 
causando uma incapacitação. O esquema a seguir resume as fases e os possíveis desdobramentosde uma doença qualquer, de acordo com o modelo processual ou de HND.
Figura 7. Fases do modelo de HND e seus possíveis desdobramentos.
Fonte: LEAVELL; CLARK, 1976 (adaptado).
Esse modelo tem a vantagem de considerar todo o processo de saúde-doença, promovendo 
atitudes e práticas em saúde que apresentam uma dimensão qualitativa, pois procura explicar 
e fazer valer os mais diversificados métodos de controle e prevenção das doenças e seus 
consequentes problemas.
A partir dessa perspectiva, os níveis de prevenção e promoção de saúde tornam-se barreiras 
que podem ser interpostas nas diversas etapas do ciclo evolutivo da doença. O modelo de HND 
propõe três níveis de prevenção, a saber: prevenção primária, secundária e terciária. Na prevenção 
primária, que ocorre no período pré-patogênico, são trabalhadas a promoção da saúde, como a 
melhoria das condições sanitárias e educação e vigilância em saúde, e a proteção específica, como 
por exemplo o uso de flúor na água para evitar cárie ou campanhas de imunização. Na prevenção 
secundária, que ocorre no horizonte clínico das doenças, são preconizados o diagnóstico precoce 
74BIOESTATÍSTICA E 
EPIDEMIOLOGIA
e tratamento imediato das patologias que não foram evitadas, além da limitação do dano; 
como exemplo, podemos citar a remineralização do esmalte para mancha branca não cavitada, 
restaurações ou tratamento em fase inicial de câncer. Por fim, a prevenção terciária, que ocorre 
quando é necessária a reabilitação devido às sequelas, como por exemplo, quando um paciente 
recebe uma prótese dentária.
 
5.1.3 Modelo sistêmico
Busca conhecer o conjunto de motivos que provoca a doença, ou seja, faz o papel de 
investigação, buscando amplos conhecimentos e hipóteses para o problema, além de desenvolver 
o conhecimento científico das doenças buscando relacionar as mais diversas razões que possam 
causar o problema. Para a compreensão desse modelo explicativo do processo saúde-doença, 
é necessário estar familiarizado com o conceito de ecossistema. Nesse sentido, ecossistema é 
um conjunto de sistemas de seres vivos e inanimados, onde a mudança no estado de qualquer 
elemento provoca mudança no estado dos demais elementos. Na concepção do modelo sistêmico, 
as epidemias são descritas como sendo consequência da quebra no equilíbrio do ecossistema
Como esse modelo é mais abrangente, o conceito de agente é diferente daquele que estudamos 
no modelo biomédico. No modelo sistêmico, o conceito de agente extrapola as divisões e tanto 
pode ser um agente físico, químico, um gene ou biológico (nesse caso, chamamos de bioagente). 
Já o hospedeiro ou suscetível é aquele em que a doença se desenvolverá e terá oportunidade de se 
manifestar clinicamente. Segundo o modelo sistêmico, as relações entre hospedeiro e bioagente 
patogênico são conduzidas através de três categorias:
 G a resistência, que é o sistema de defesa que tenta impedir a difusão dos agentes infecciosos; 
pode estar associada ao estado nutricional, emocional ou genético do hospedeiro e é 
resultado de fatores permanentes ou temporários; 
 G a suscetibilidade, considerada no nível da espécie; por exemplo, a espécie humana é 
suscetível à penetração de larvas de ancilostomídeos, mas há indivíduos que são resistentes 
(nesse caso, principalmente negros);
 G a imunidade, que é um tipo específico de resistência associada a anticorpos que possuem 
ação específica sobre determinados micro-organismos.
Além do agente e do suscetível, o modelo sistêmico também inclui o ambiente, considerado 
75BIOESTATÍSTICA E 
EPIDEMIOLOGIA
de forma ampla, onde a situação geográfica, a temperatura, os poluentes, o aspecto social, entre 
tantas outras variáveis confluem para determinar a ocorrência da enfermidade ou a manutenção 
da saúde. Esses três elementos formam o sistema epidemiológico em equilíbrio dinâmico, 
que define a estrutura geral de um problema de saúde. Um sistema epidemiológico formado 
por agente, suscetível e ambiente é dotado de organização interna que regula as interações 
determinantes da produção da doença.
5.2 CONSIDERAÇÕES FINAIS DO CAPÍTULO 5
Neste capítulo, estudamos as inter-relações e as variáveis que dirigem o processo de saúde e 
doença em uma população através de modelos, que são teorias utilizadas para explicar a complexa 
transformação de um indivíduo saudável em doente. Essas construções teóricas representam 
diferentes interpretações, que podem ser alteradas em função do desenvolvimento da ciência, da 
época, da cultura etc., sem que sejam necessariamente hierárquicas entre si.
O modelo biomédico foi primeiro visto neste capítulo e é baseado na compreensão de que 
a doença deve ser analisada em termos estritamente biológicos. Sob essa perspectiva, pode-
se dividir os agravos à saúde de acordo com a duração das alterações, disfunções ou sintomas 
em agudos e crônicos, representando respectivamente curta e longa duração. Além disso, as 
doenças também são diferenciadas em relação às causas (etiologia) e classificados em infecciosas 
e não-infecciosas. As doenças infecciosas são causadas por organismos patogênicos, vetores ou 
veículos que o carregam ou que podem ser transmitidas por outros indivíduos contaminados, 
através de contato. Já não-infecciosas compõem um variado grupo de doenças derivadas de 
problemas genéticos, estilos de vida, traumas e acidentes, entre outros, que não envolvem 
agentes patogênicos.
Outro modelo estudado neste capítulo foi o da história natural das doenças, que considera o 
estímulo patológico físico, químico, social, cultural ou biológico do meio externo como o início 
da doença, caracterizada pelo seu período pré-patogênico. Em seguida, ocorre a continuidade no 
meio interno, onde o estímulo provoca alterações histológicas, bioquímicas ou fisiológicas que 
resultam em defeito, invalidez, morte ou recuperação, sintomas que são visíveis e caracterizam 
o período patogênico da doença (limite entre as alterações subclínicas e clínicas é chamado de 
horizonte clínico). O modelo de história natural da doença prevê três níveis de prevenção do 
agravo: primário, que ocorre no período pré-patogênico, secundário, que ocorre no horizonte 
clínico da doença (primeiros sintomas), e terciário, que ocorre na reabilitação.
76BIOESTATÍSTICA E 
EPIDEMIOLOGIA
Por fim, estudamos o modelo sistêmico, para o qual um desequilíbrio entre os fatores que 
compõem o sistema epidemiológico, composto por agente causador (ou bioagente, se for 
biológico), hospedeiro suscetível e ambiente, provoca alterações que podem levar à doença. Para 
esse modelo, as relações entre o hospedeiro e o bioagente são conduzidas através da resistência 
(tentativa de impedir a difusão dos agentes causadores), suscetibilidade (característica de cada 
espécie) e imunidade (relação dependente de anticorpos de ação específica contra determinados 
micro-organismos).
No próximo capítulo, aprenderemos formas de descrever as condições de saúde e doença 
em populações através de indicadores, medidas de risco, diagnósticos e sistemas de vigilância 
epidemiológica.
77BIOESTATÍSTICA E 
EPIDEMIOLOGIA
6 EPIDEMIOLOGIA DESCRITIVA
Como já vimos, a Bioestatística é uma ciência que se relaciona intimamente com a 
Epidemiologia, pois através de seus métodos é possível identificar padrões e diferenças 
significantes entre pessoas, grupos ou populações. Além das medições já estudas, dispomos de 
outros indicadores e medidas que são típicos da Epidemiologia, que discutiremos nesse capítulo.
6.1 – INDICADORES DE SAÚDE COLETIVA
O conhecimento das condições de morbidade e mortalidade na população é essencial para a 
promoção de ações de prevenção e o delineamento das políticas de saúde pública. Para ter acesso 
a esse conhecimento é necessário medir a Saúde Coletiva, através indicadores de saúde. Esses 
indicadores podem ser descritos a partir de valores absolutos ou relativos. 
Os valores absolutos descrevem o número total de ocorrênciasde morbidade ou mortalidade. 
Apresentados dessa forma, esses indicadores têm a desvantagem de reduzirem a capacidade de 
comparação ao longo do tempo (pois o tamanho das populações oscila), bem como inviabilizam 
a comparação entre populações diferentes (pois podem apresentar uma quantidade muito 
diferente). Por outro lado, os valores absolutos são úteis para a administração dos recursos da 
saúde pública como, por exemplo, para a definição do número total de leitos ou de comprimidos 
de um medicamento para uma determinada população.
Já os valores relativos são construídos a partir da relação entre dois fatores, como por exemplo, 
número de mortes em relação a uma quantidade de pessoas. Dessa forma, os valores relativos 
permitem comparar a realidade atual com algum ponto no passado ou comparar a realidade 
entre as diversas populações. Contudo, para viabilizar essa comparação, é necessário seguir 
uma padronização em relação à quantidade de pessoas. Por exemplo, suponha que você queira 
CAPÍTULO 6
Valores 
absolutos – 
número total 
de ocorrências
78BIOESTATÍSTICA E 
EPIDEMIOLOGIA
descrever a mortalidade em sua cidade, para depois compará-la com a mortalidade medida para 
o Brasil inteiro em números relativos. Apenas para facilitar os cálculos, vamos considerar que 
nossa cidade possui 100.000 habitantes e que 300 morreram no último ano. Você poderia decidir 
descrever o coeficiente de mortalidade com base em grupos de 1.000 habitantes. Nesse caso, você 
pode dizer que o coeficiente ou taxa de mortalidade (alguns autores diferenciam taxa e coeficiente, 
mas essa discussão ultrapassa o objetivo da nossa disciplina) para a sua cidade é igual 3 mortes 
por 1.000 habitantes. Para comparar com a taxa do Brasil inteiro, será necessário descrever o 
número de mortes a cada grupo de 1.000 habitantes também. Para seu conhecimento, ocorrem 
no Brasil pouco mais de 1 milhão e 200 mil mortes por ano, o que significa aproximadamente 6 
mortes a cada grupo de mil habitantes.
Os indicadores de saúde coletiva podem ser muito abrangentes, assim como o próprio 
conceito de saúde. Entre outros, podemos nos deparar com indicadores de saúde ambiental, 
tais como os que descrevem as condições de saneamento básico, qualidade do ar e acesso à 
água tratada, e indicadores de serviços de saúde, tais como taxas de profissionais de saúde ou 
leitos hospitalares por grupos de população e acesso aos serviços de saúde básica. Contudo, 
os indicadores mais importantes e que estão de acordo com nossos objetivos nesse curso de 
Bioestatística e Epidemiologia são aqueles que se referem diretamente às condições de saúde 
e doença de indivíduos ou populações como, por exemplo, taxas de mortalidade e morbidade. 
Vejamos a seguir algumas características específicas dessas taxas para as populações de interesse.
6.1.1 Morbidade
Morbidade, que como já vimos expressa a condição de doença, pode ser descrita através de 
coeficientes ou taxas que medem o risco de uma pessoa adoecer. Os coeficientes de prevalência e 
de incidência (se ainda tiver dúvida sobre esses termos, revise o item 4.3) são expressos de acordo 
com as equações a seguir: 
Valores relativos 
– proporção de 
ocorrências
79BIOESTATÍSTICA E 
EPIDEMIOLOGIA
Vamos a um exemplo: imagine que você queira descrever a prevalência e a incidência de anemia 
numa população, digamos entre os moradores da sua rua (vamos considerar, para facilitação dos 
cálculos, 100 pessoas). Para isso, você descobriu que hoje há 3 moradores com anemia e que no 
mês passado, 5 moradores foram diagnosticados com a doença (é possível que a prevalência seja 
menor que a incidência porque a condição de anemia é facilmente reversível com alimentação 
e suplementação adequadas). Com esses dados, já é possível calcular as taxas de prevalência e 
incidência da anemia na sua rua.
Geralmente os valores são frações bem pequenas (como de fato aconteceu no nosso exemplo), 
pois os indicadores representam uma parcela da população que tem a condição expressa. Se toda 
a população fosse acometida pela anemia, por exemplo, teríamos como taxa de prevalência ou 
incidência um valor igual a 1, significando que 100% da população de interesse está acometida 
pela condição. Por esse motivo, os valores de incidência e prevalência, tanto nas apresentações 
de morbidade quanto nas apresentações de mortalidade, são multiplicados por uma potência 
de 10 adequada à descrição (essa potência representa o tamanho do grupo que pretendemos 
descrever). No exemplo acima, poderíamos multiplicar por 102 (ou seja, 100) para termos um 
valor mais facilmente compreensível. Veja como ficaria a taxa de prevalência (o exemplo pode ser 
aplicado igualmente à taxa de incidência):
Ou seja, temos 3 pessoas anêmicas para cada grupo de 100 moradores. Contudo, você pode 
querer comparar com uma cidade que apresentou 25 pessoas anêmicas a cada 1.000 moradores. 
Nesse caso, você deverá multiplicar pela potência de 10 adequada (ou seja, 103 = 1.000). Sendo 
assim,
80BIOESTATÍSTICA E 
EPIDEMIOLOGIA
Sua rua poderia ser descrita como tendo 30 pessoas anêmicas a cada grupo de 1.000 moradores 
(e descobrir que a taxa de prevalência de anemia na sua rua é maior que na cidade). As fórmulas 
gerais para o cálculo de taxas de prevalência e incidência são:
onde “n” é a potência adequada à descrição dos dados de acordo com sua escala. Para 
informação, o Instituto Brasileiro de Geografia e Estatística (IBGE) utiliza 10 elevado à potência 3 
para descrever a taxa de mortalidade geral no Brasil (ou seja, multiplicado por 1.000, como vimos 
no item 6.1).
Considerando que as condições de doença são variadas, podemos descrever as taxas ou 
coeficientes em diversos níveis, conforme a gravidade ou infecção, por exemplo. Para determinada 
população de possíveis hospedeiros suscetíveis, alguns serão expostos ao agente causador da 
doença (pode ser um patógeno ou um agente físico, entre outros). Desses indivíduos que foram 
expostos, nem todos serão infectados devido a uma série de fatores, como a duração da exposição 
ou quantidade e eficiência do agente causador. Mesmo entre os infectados, somente uma fração 
ficará efetivamente doente, pois uma parte conseguirá superar o desequilíbrio entre fatores, 
através do sistema imunológico, por exemplo. Já entre os doentes, alguns serão considerados 
graves e, por fim, entre os doentes graves, alguns morrerão. Para facilitar o entendimento, analise 
a figura a seguir. 
81BIOESTATÍSTICA E 
EPIDEMIOLOGIA
Figura 8. Esquema representativo das proporções da população em relação aos diversos estágios da doença.
Fonte: ALMEIDA FILHO; ROUQUAYROL, 2013.
A partir dessas variadas condições, podemos descrever diversos coeficientes (muitos autores 
têm a tendência de se referir a coeficientes quando tratam de indicadores mais restritos e taxas 
quando tratam de indicadores mais gerais). Nesse contexto, o coeficiente de uma doença numa 
dada população é igual ao número de doentes sobre essa população, multiplicado pela potência 
de 10 adequada ao número de indivíduos, como já vimos. Outros indicadores mais específicos, 
sejam de prevalência ou incidência (você já sabe a diferença, não é?), são:
ou seja, o coeficiente de incidência ou de prevalência de infecção representa a proporção de 
pessoas infectadas (e não somente as doentes) na população de interesse.
82BIOESTATÍSTICA E 
EPIDEMIOLOGIA
ou seja, a patogenicidade (incidência ou de prevalência) representa a proporção de pessoas 
efetivamente doentes entre as infectadas (e não mais somente sobre a população).
ou seja, a virulência representa a proporção de doentes graves entre todos os doentes.
ou seja, a letalidade da doença representa a proporção de óbitos entre os doentes (e não sobre 
toda a população de interesse; se fosse assim, seria a taxa de mortalidade, como veremos a seguir).
6.1.2 Mortalidade
Assim como a morbidade mede a proporção de doentes numa população, as taxas demortalidade medem os óbitos na população. A taxa mais abrangente é a mortalidade geral 
(independente da causa, idade ou outras condições) sobre a população geral. Tipicamente, o 
valor resultante é multiplicado por 103, como podemos observar no caso desse indicador para o 
Brasil, que apresentou uma taxa de mortalidade geral próxima de 6 mortes a cada grupo de mil 
pessoas em 2016:
VAMOS REFLETIR:
Você consegue identificar a diferença entre taxa de mortalidade geral e taxa de 
letalidade, estudada no item anterior?
83BIOESTATÍSTICA E 
EPIDEMIOLOGIA
Esta taxa apresenta variações de acordo com a composição da população por idade. Por esta 
razão, alguns países subdesenvolvidos apresentam valores próximos aos valores observados em 
países desenvolvidos, onde há uma grande proporção de pessoas idosas (que apresentam uma 
taxa de mortalidade específica maior que a dos jovens). Para resolver esse problema, é possível 
determinar um cálculo de mortalidade mais específico por faixas etárias (por exemplo, de 0 a 10 
anos, de 10 a 20 anos, e assim por diante) e calcular a média entre esses indicadores. Em nossos 
exercícios e avalições não será necessário chegar a esse nível de detalhamento, razão pela qual 
não haverá uma taxa de mortalidade ajustada pela idade em nossos exemplos.
Algumas taxas específicas de mortalidade são utilizadas largamente e, por isso, seu 
entendimento é muito importante para a compreensão da ciência epidemiológica. Entre 
eles, destaca-se a taxa de mortalidade infantil geral, que pode ser desmembrada em taxa de 
mortalidade infantil precoce ou neonatal (quando ocorre a morte do recém-nascido em até 28 
dias) e taxa de mortalidade infantil tardia ou pós-neonatal (óbitos entre 28 dias e um ano de vida). 
As taxas de mortalidade infantil são mais adequadas para representar a qualidade de saúde de 
uma população, como se verifica no gráfico a seguir (todas são taxas de mortalidade infantil geral, 
com base no ano de 2014):
Figura 9. Taxas de mortalidade infantil geral de 3 países de baixa renda, 3 países de alta renda e o Brasil (renda média-
-baixa), 2014.
Fonte: o autor.
Taxa de 
mortalidade 
infantil neonatal 
– óbito em até 
28 dias de vida
Taxa de 
mortalidade 
infantil pós-
neonatal – óbito 
entre 28 e 365 
dias de vida
0
20
40
60
80
100
120
Mônaco Japão Noruega Brasil Zâmbia Somália Afeganistão
Taxa de mortalidade infantil geral
óbitos (entre 0 e 1 ano) *103
nascidos vivos
TMI geral (2014)
nascido em até 28 dias) e taxa de mortalidade 
um ano de vida). As taxas 
de mortalidade infantil geral, com base no ano de 2014):
 
 
 
 
 
 
 
 
 
 
 
baixa)
84BIOESTATÍSTICA E 
EPIDEMIOLOGIA
Além das taxas de mortalidade infantil neonatal e pós-neonatal, há outras taxas ou 
coeficientes menos utilizados, mas que podem ser úteis em casos específicos. Por exemplo, se 
você deseja investigar as condições de assistência pré-natal ou de saúde e nutrição materna, pode 
utilizar o coeficiente de mortalidade perinatal, que calcula o número óbitos fetais a partir de 22 
semanas completas de gestação, acrescidos dos óbitos neonatais precoces (de 0 a 6 dias) sobre os 
nascimentos totais. Ou ainda se você deseja identificar a incidência ou prevalência de anomalias 
fetais, pode utilizar o coeficiente de natimortalidade, que representa a proporção de nascidos 
mortos sobre o total de nascidos (mortos e vivos). Na realidade, dependendo do seu objeto de 
estudo, você pode utilizar o indicador que melhor descrever seus dados. O importante é que você 
já está familiarizado com as taxas de mortalidade, assim como com as de morbidade, e apto a 
utilizá-las, pois todas têm o mesmo princípio: calcular proporções de mortes ou doenças sobre 
grupos de pessoas.
6.2 – MEDIDAS DE ASSOCIAÇÃO
As medidas de associação permitem que o pesquisador em Epidemiologia identifique fatores 
de risco ou fatores de proteção a partir das ocorrências proporcionais de saúde ou doença em 
grupos de indivíduos expostos a um fator e em grupos de indivíduos não-expostos ao mesmo 
fator. Por exemplo, você pode querer descobrir se fumar é fator de risco ou de proteção para 
câncer de boca. Para isso, poderia utilizar os dados para calcular uma medida de associação. 
Mas antes de tudo, será necessário definirmos o tipo de estudo feito, pois isso definirá a medida 
adequada.
Entre os principais estudos relacionados à Epidemiologia, podemos citar o estudo de coorte 
e o estudo de caso-controle (observacionais). Resumidamente, um estudo de coorte é aquele em 
que o pesquisador acompanha um grupo que possui características, experiências ou condições 
semelhantes. No exemplo da determinação do cigarro como fator de risco ou de proteção para 
câncer de boca, um estudo de coorte típico envolveria o acompanhamento de dois grupos 
semelhantes, com exceção da condição de fumante ou não-fumante. Perceba que no estudo de 
coorte, a doença ainda não está presente. Após um determinado período, digamos cinco anos, o 
pesquisador contabiliza o número de pessoas do grupo fumante que adquiriram câncer de boca, 
assim como o número de pessoas do grupo não-fumante que adquiriram câncer de boca.
Apesar de ser muito útil, nem sempre é possível realizar um estudo de coorte, devido ao 
85BIOESTATÍSTICA E 
EPIDEMIOLOGIA
tempo de espera ser tipicamente longo. Uma solução seria conduzir um estudo de caso-controle, 
quando a doença já está presente e o pesquisador procura um grupo que possui a condição a 
ser testada (no nosso exemplo, ser fumante) e compara com um grupo (que será chamado de 
controle) que não possui a condição a ser testada (não-fumante, no nosso exemplo). Perceba que 
nesse caso, não é necessário aguardar o adoecimento dos participantes, sendo necessário apenas 
comparar a incidência dos expostos ao fator, com a incidência dos não-expostos ao fator. 
6.2.1 – Risco relativo e risco atribuível
Quando trabalharmos com estudos de coorte, devemos utilizar o risco relativo e o risco 
atribuível para indicar se o fator a ser testado é de risco ou de proteção. O risco relativo (RR) 
indica a probabilidade de um indivíduo ser acometido de uma doença ser for exposto a um fator 
e é calculado dividindo-se a proporção de doentes expostos pela proporção de doentes que não 
foram expostos ao fator, ou seja,
Para se descobrir a incidência de expostos, basta dividir o número de doentes do grupo 
exposto pelo número total do grupo exposto. Da mesma forma, para se descobrir a incidência 
de não-expostos, basta dividir o número de doentes do grupo não-exposto pelo número total do 
grupo não-exposto. Sendo assim, podemos desenvolver melhor a fórmula, que ficaria
Se você achar complicado calcular o risco relativo dessa forma, há uma maneira alternativa 
que poderá lhe ajudar. Para trabalhar com a nova maneira, será necessário construirmos uma 
tabela 2 X 2, muito útil ao estudo de Epidemiologia. 
86BIOESTATÍSTICA E 
EPIDEMIOLOGIA
Tabela 11. Esquema geral de uma tabela para dois grupos e duas condições.
Exposto Não-exposto Total
Doente a b a + b
Não doente c d c + d
Total a + c b + d a + b + c + d
Fonte: o autor.
Na Tabela 11 podemos perceber que o total de expostos (a + c) é composto por alguns indivíduos 
que ficaram doentes (a) durante a pesquisa (lembre-se que se trata de um estudo de coorte) e que 
não ficaram doentes (c), assim como ocorre com os não-expostos. Também podemos perceber 
que o total de doentes (a + b) é composto por indivíduos do grupo exposto (a) e do grupo não-
exposto (b). Sendo assim, podemos reescrever a fórmula do risco relativo da seguinte maneira
Vamos utilizar essa última maneira para calcular um exemplo. Suponha que você acompanhou 
50 fumantes e após 5 anos, contabilizou 2 pessoas com câncer de boca. No outro grupo, era 
composto por 200 pessoas que não fumam, você contabilizou no final do mesmo período 4 
pessoas com câncer de boca. Dessa maneira, antes de calcular o risco relativo do cigarro para 
câncer6.2.1 – Risco relativo e risco atribuível.........................................................................................85
6.2.2 – Razão de chances ou Odds Ratio ......................................................................................88
6.3 – TESTES DIAGNÓSTICOS ...........................................................................................................89
6.4 – VIGILÂNCIA À SAÚDE ...............................................................................................................92
6.4.1 - Sistemas de Informação em Saúde (SIS) ...........................................................................93
6.5 CONSIDERAÇÕES FINAIS DO CAPÍTULO 6 ....................................................................................94
CAPÍTULO 7
7 PROCESSO EPIDÊMICO ...........................................................................................97
7.1 FREQUÊNCIA E DISTRIBUIÇÃO DAS DOENÇAS: EPIDEMIA E ENDEMIA ..........................................97
7.2 EPIDEMIOLOGIA DAS DOENÇAS INFECCIOSAS ...........................................................................100
7.2.1 Reservatórios de agentes infecciosos ................................................................................100
7.2.2 Saída do agente infeccioso e modos de transmissão .........................................................101
7.2.3 Entrada do agente no hospedeiro .......................................................................................103
7.2.4 Hospedeiro suscetível ........................................................................................................103
SUMÁRIO
8BIOESTATÍSTICA E 
EPIDEMIOLOGIA
7.2.5 Implicações para a saúde pública ......................................................................................104
7.3 – EPIDEMIOLOGIA DAS DOENÇAS NÃO-INFECCIOSAS ................................................................105
7.3.1 Características das doenças não-infecciosas .....................................................................105
7.3.2 Doenças cardiovasculares ..................................................................................................106
7.3.3 Câncer ...............................................................................................................................106
7.3.4 Causas externas ................................................................................................................107
7.4 CONSIDERAÇÕES FINAIS DO CAPÍTULO 7 ..................................................................................108
REFERÊNCIAS BIBLIOGRÁFICAS .................................................. 110
SUMÁRIO
9BIOESTATÍSTICA E 
EPIDEMIOLOGIA
MARCELO WERNER
O autor é Biólogo e Economista, mestre em Ciência e Tecnologia Ambiental e especialista 
em Ensino de Ciências e Ensino Virtual. É professor na Faculdade Avantis desde 2014, tutor da 
Secretaria Nacional de Segurança Pública desde 2015 e servidor do Ministério da Justiça desde 
2004.
AUTOR
10BIOESTATÍSTICA E 
EPIDEMIOLOGIA
O caderno de estudos de Bioestatística e Epidemiologia acompanhará sua aprendizagem 
nessa disciplina e será fonte suficiente para você alcançar um ótimo aproveitamento ao final do 
semestre. Apesar disso, inúmeros exemplos e exercícios estarão disponíveis em nosso ambiente de 
virtual de aprendizagem (AVA). Lá também encontraremos material complementar, como vídeos 
e tabelas. Além disso, uma breve revisão de matemática básica, auxiliará aqueles que, porventura, 
tenham dificuldade com a aritmética e a álgebra necessárias para o bom desenvolvimento do 
nosso processo de ensino e aprendizagem.
Este caderno está dividido em duas unidades: Bioestatística e Epidemiologia. É verdade que 
há um forte relacionamento entre as duas ciências, pois a Epidemiologia representa o estudo da 
medicina preventiva e da saúde pública, enquanto a Bioestatística é seu fundamento científico e 
quantitativo. Contudo, muitas ferramentas bioestatísticas podem (e devem) ser usadas, mesmo 
fora do contexto epidemiológico, em seus trabalhos na faculdade, em seu trabalho de conclusão 
de curso e em sua vida profissional. Devo ressaltar que, ao utilizarmos dados reais, os cálculos 
manuais não são adequados devido ao grande número de medições e à variedade de escalas 
numéricas. Para isso, programas de computador (muitos gratuitos) são eficazes em realizar os 
cálculos, para que você formule conclusões. No AVA também teremos uma série de sugestões 
a respeito. Porém, é imprescindível que você execute os primeiros procedimentos estatísticos 
passo a passo, de forma manual, para que possa executá-los posteriormente nos programas de 
computador com mais confiança. A boa notícia é que em nossas avaliações e exercícios, sempre 
que possível, os números serão fáceis de calcular, seja pela quantidade, seja pela complexidade. 
Por isso, apesar de ser altamente recomendável, não é imprescindível o uso de calculadora 
durante a avaliação (isso mesmo, os cálculos não serão complexos); importante ressaltar que não 
é possível usar a calculadora do seu celular.
A primeira unidade está dividida em 3 capítulos. O capítulo 1 traz os conceitos básicos de 
Bioestatística. Ao final do capítulo você será capaz de identificar os principais tipos de dados 
biológicos, bem como os princípios necessários para coletar dados cientificamente; também 
compreenderá a importância da probabilidade para a tomada de decisões baseadas em dados. 
O capítulo 2 introduz as medidas que permitem descrever o conjunto de dados com o qual você 
APRESENTAÇÃO
11BIOESTATÍSTICA E 
EPIDEMIOLOGIA
conduzirá uma pesquisa, além de proporcionar métodos para apresentar grande quantidade de 
dados e descrever relações entre variáveis. As conclusões, previsões e inferências a partir do seu 
conjunto de dados poderão ser feitas ao final do capítulo 3, no qual estudaremos os principais 
testes estatísticos.
A segunda unidade está dividida em 4 capítulos. É possível encontrar uma grande variedade 
de classificações dos assuntos em Epidemiologia. Optamos por uma divisão que prioriza o 
conhecimento sintético e objetivo dessa ciência básica da Saúde Pública. Assim, você encontrará 
os conceitos básicos no capítulo 4, além de ser capaz, ao final do estudo, de descrever o 
desenvolvimento da ciência epidemiológica ao longo do tempo e estabelecer padrões para seu 
futuro. No capítulo 5, o processo saúde-doença será abordado a partir de 3 modelos; ao final, você 
será capaz de reconhecer como os serviços de saúde com os quais você tem contato transitam entre 
esses modelos. O capítulo 6 apresenta técnicas que permitirão que você descreva indicadores de 
saúde de populações, bem como quantifique fatores de risco para os mais diversos agravos à saúde; 
além disso, nesse capítulo entraremos em contato com os sistemas que alimentam os serviços de 
saúde, permitindo-os promover a prevenção e a recuperação da saúde da população. Por fim, no 
capitulo 7, estudaremos o processo epidêmico através da distribuição espacial e temporal das 
doenças e de características das doenças transmissíveis e não- transmissíveis importantes na 
disseminação das enfermidades. Finalizando cada capítulo, você encontrará considerações finais 
que representam um breve resumo do que foi estudado.
Os conceitos e técnicas com os quais entraremos em contato a partir de agora, apesar de 
extensos e nem sempre simples, correspondem a uma introdução. Uma introdução bastante 
robusta, que será mais do que suficiente para um bom aproveitamento nas avaliações, como já 
foi dito, mas também em eventuais concursos dos quais você participe, exames do Ministério 
da Educação (como o ENADE e outros que possam vir) e, principalmente, para a sua prática 
acadêmica e profissional. Não obstante, você poderá se deparar com situações na vida real 
em que outras técnicas serão necessárias. Se for o caso, saiba que sempre poderá contar com 
auxílioVocê encontrará exercícios e mais exemplos no Ambiente Virtual de 
Aprendizagem.
Considerando os resultados, você acha que é válido utilizar o teste alternativo para diagnosticar 
cárie nas crianças do seu município? Os valores calculados foram altos e, considerando a 
impossibilidade de alocar dentistas e exames de imagem para todas as crianças, fica claro que 
professores e professoras podem substituir o teste padrão-ouro. Porém, não há uma regra geral 
para determinar a validade de um teste diagnóstico, pois cada doença tem uma repercussão 
específica. O que deve ser observado, entretanto, é que devemos escolher uma alta sensibilidade 
quando a doença é grave e tratável, mas não pode passar despercebida. Já quando a doença é 
incurável ou de difícil tratamento, deve-se optar por uma alta especificidade. Por fim, quando 
uma doença grave for curável e houver consequências graves se forem identificados falsos 
positivos e falsos negativos, deve-se priorizar uma alta acurácia.
6.4 – VIGILÂNCIA À SAÚDE
Vigilância é a observação contínua da distribuição de doenças. Isso é feito através da coleta 
sistemática, consolidação e avaliação das informações de morbidade e mortalidade, entre outros 
dados relevantes. A divulgação dessas informações viabiliza as ações governamentais e permite 
que todos os interessados (pesquisadores, agentes públicos, imprensa, organismos internacionais 
etc.) tenham acesso aos dados.
Todo sistema de vigilância à saúde deve ser permanentemente atualizado para ser efetivo. As 
inovações científicas e tecnológicas, como banco de dados e sistemas informatizados, permitem 
aumentar a abrangência e qualidade da informação, especialmente aquelas que têm importância 
epidemiológica. A partir dessas informações, o SUS efetiva ações de promoção e proteção da 
saúde, de natureza preventiva, cujo objetivo é reduzir fatores de risco que constituem ameaça à 
saúde das pessoas, podendo provocar-lhes incapacidades e doenças. Entre as ações de promoção 
da saúde, encontram-se a educação, a disseminação de bons padrões de alimentação e nutrição, a 
adoção de estilos de vida saudáveis, o uso adequado e desenvolvimento de aptidões e capacidades, 
os aconselhamentos específicos, como os de cunho genético e sexual, entre outras. Já as ações de 
93BIOESTATÍSTICA E 
EPIDEMIOLOGIA
proteção incluem vigilância epidemiológica, vacinações, saneamento básico, vigilância sanitária, 
exames médicos e odontológicos periódicos.
Nem sempre a ação preventiva é capaz de mitigar o surgimento de enfermidades. Quando 
isso acontece, as informações de vigilância à saúde também subsidiam ações de recuperação, 
que envolvem o diagnóstico e o tratamento de doenças, acidentes e danos de toda natureza, 
além da invalidez e a reabilitação. Alguns exemplos de ações de recuperação: consultas médicas 
e odontológicas, vacinação, atendimento de enfermagem, exames diagnósticos e tratamento, 
inclusive em regime de internação. Todas essas ações têm que ser planejadas a partir de estudos 
epidemiológicos para que sejam definidas as prioridades de prevenção (priorizando grupos de 
risco, por exemplo), cobertura e concentração de ambulatórios e hospitais etc. Por sua vez, esses 
estudos dependem de dados de todo o sistema de saúde, obtidos principalmente através de 
sistemas de informação em saúde. 
6.4.1 - Sistemas de Informação em Saúde (SIS)
SIS são conjuntos de unidades de produção, análise e divulgação de dados de saúde em geral, 
com atuação integrada e articulada, para que sejam atendidas as demandas de serviços de saúde 
pela população, bem como para que sirva de auxiliar no gerenciamento dos recursos, com a 
finalidade de maior aproveitamento e melhores resultados.
O mais importante SIS é o Sistema de informação de agravos de notificação (Sinan), que é 
alimentado pela notificação e investigação de casos de doenças e agravos que constam da lista 
nacional de doenças de notificação compulsória. Entre essas doenças, estão incluídas suspeitas 
ou confirmações de botulismo, cólera, raiva humana, febre amarela, poliomielite e sarampo. 
Também são incluídos surtos ou casos com muitas ocorrências associadas de difteria, influenza 
humana ou agravos inusitados. Também é possível que os municípios incluam outros problemas 
de saúde que sejam importantes no nível local. Por esse motivo, o número de doenças e agravos 
contemplados pelo Sinan vem aumentando progressivamente e ajudando a expressar as diferenças 
regionais de perfis de morbidade. A entrada de dados no Sinan é feita mediante a utilização de 
três formulários: a Ficha individual de notificação, preenchida para cada ocorrência, a Ficha 
individual de investigação (identificação da fonte de infecção e dos mecanismos de transmissão) 
e a Notificação negativa (indica que, apesar de não haver a ocorrência da doença, a equipe de 
vigilância epidemiológica está alerta). 
94BIOESTATÍSTICA E 
EPIDEMIOLOGIA
Outra fonte importante de dados epidemiológicos e o Sistema de informação sobre 
mortalidade (SIM), que é alimentado pelas declarações de óbito expedidas pelos médicos. As 
informações contidas nessas declarações possibilitam o delineamento do perfil de morbidade 
de uma área, no que diz respeito às doenças mais letais e às doenças crônicas não sujeitas à 
notificação compulsória, representando, na prática, a única fonte regular de dados. Para as 
doenças de notificação compulsória que levaram a óbito, a utilização eficiente dessa fonte de 
dados depende da verificação da presença desses agravos no banco de dados do Sinan. Também 
é possível calcular a mortalidade proporcional por causas, faixa etária, sexo, local de ocorrência 
e residência, letalidade de agravos dos quais se conheça a incidência, bem como taxas de 
mortalidade geral, infantil, materna ou por qualquer outra variável contida na declaração de óbito, 
pois são disponibilizadas várias formas de cruzamento dos dados. Entretanto, em muitas áreas, o 
uso dessa rica fonte de dados é prejudicado pelo não preenchimento correto das declarações. Por 
isso, é necessário realizar uma análise crítica dos dados, para evitar registro excessivo de causas 
mal definidas, causas perinatais em adultos, causas exclusivas de um sexo sendo registrada em 
outro etc.
Diversos outros sistemas de informação específica estão disponíveis e podem ser acessados 
por gestores ou pesquisadores. Entre eles podemos citar o Sistema de informações sobre nascidos 
vivos (Sinasc), que fornece dados para riscos à saúde materna e infantil; o Sistema de informações 
hospitalares (SIH/SUS), que reúne aproximadamente 70% dos internamentos no país; o Sistema 
de informações de vigilância alimentar e nutricional (Sisvan), que monitora o estado nutricional 
dos diversos grupos populacionais; entre tantos outros.
6.5 CONSIDERAÇÕES FINAIS DO CAPÍTULO 6
A distribuição de agravos à saúde, bem como a identificação de diferentes padrões de 
morbimortalidade entre indivíduos ou populações é o objeto principal da Epidemiologia 
descritiva, pois seu conhecimento permite a promoção de ações de prevenção e orienta as 
políticas públicas de saúde.
Os indicadores de saúde coletiva, que podem ser apresentados em valores absolutos (úteis 
para a administração dos recursos da saúde) ou relativos (úteis para comparações temporais e 
geográficas), são os principais instrumentos utilizados para descrever os padrões de saúde e 
doença em populações. Existem uma grande diversidade de indicadores, que podem ser usados 
95BIOESTATÍSTICA E 
EPIDEMIOLOGIA
em situações específicas, de acordo com a pesquisa ou divulgação que você pretende fazer. Em 
geral, podemos dividi-los em indicadores de morbidade (e.g. patogenicidade, infecção, virulência, 
letalidade etc.) e de mortalidade (e.g. infantil neonatal e pós-neonatal, materna, geral etc.).
Já as medidas de associação, são instrumentos que descrevem o risco em grupos de indivíduos 
que estão expostos ou não a fatores físicos, químicos,qual sugere que, se uma proporção suficientemente alta de indivíduos em uma população é 
105BIOESTATÍSTICA E 
EPIDEMIOLOGIA
resistente a um agente, então os poucos suscetíveis serão protegidos pela maioria resistente, 
uma vez que o patógeno dificilmente encontrará um hospedeiro suscetível. A porcentagem 
da população necessária para adquirir a imunidade de rebanho com a finalidade de prevenir 
ou interromper um surto ou epidemia varia de acordo com a doença. Um perigo associado a 
esse conceito é que, em populações altamente imunizadas, as poucas pessoas suscetíveis são 
frequentemente agrupadas em subgrupos definidos por fatores socioeconômicos ou culturais. 
Se o patógeno for introduzido em um desses subgrupos, pode ocorrer um surto ou epidemia. Na 
prática, a imunidade de rebanho não impediu surtos de sarampo e rubéola em populações com 
níveis de imunização tão elevados como 85% e 90% nos Estados Unidos nas últimas décadas. 
7.3 – EPIDEMIOLOGIA DAS DOENÇAS NÃO-INFECCIOSAS
No início da Epidemiologia, o único foco de investigação eram as doenças infecciosas, 
que eram a causa de elevadas taxas de morbidade e mortalidade. Contudo, após a revolução 
científica nas Ciências da Saúde, ocorreu o controle desse tipo de doença. Essa revolução inclui 
o uso generalizado de antibióticos e vacinas, o controle eficiente de vetores, a descontaminação 
eficiente de veículos, entre outras medidas que promoveram o aumento da expectativa de 
vida no mundo inteiro. Por outro lado, houve um incremento na incidência e prevalência de 
doenças não-infecciosas, tais como diabetes, obesidade e traumas, a ponto de transformar essas 
doenças em causa principal de mortalidade em quase todos os países, com raras exceções na 
África subsaariana. No Brasil, o aumento da violência e de acidentes de trânsito contribuiu ainda 
mais para que houvesse a transição epidemiológica, que é a substituição da principal causa de 
mortalidade, que antes era relacionada às doenças infecciosas, para doenças não-infecciosas. 
Para termos uma ideia da dimensão dessa alteração, em 1930, 45,6% das mortes nas capitais dos 
estados brasileiros foram em decorrência de doenças infecciosas e parasitárias; em 2010, esse 
número foi de apenas 4,6%. 
7.3.1 Características das doenças não-infecciosas
Como vimos, as doenças e agravos não-transmissíveis (DANT) ou não-infecciosas 
Transição 
epidemiológica: 
mudança no 
perfil de morbi-
mortalidade
106BIOESTATÍSTICA E 
EPIDEMIOLOGIA
compreendem todas aquelas que não são adquiridas por contato com um agente infeccioso 
causador de doenças, nem por vetores ou veículos que o carregam, tampouco por contato com 
pessoas infectadas. Esse grupo inclui uma variedade de agravos à saúde e tem grande repercussão 
nos índices de saúde de qualquer país, inclusive no Brasil. Entre as características das DANT, 
podemos citar um longo período de latência, com poucos ou nenhum sintoma. Além disso, a 
evolução da doença é lenta, prolongada e permanente, com manifestações clínicas acontecendo 
nos períodos de exacerbação e remissão. Em geral, as lesões celulares são irreversíveis, com 
evolução para variados graus de incapacidade e morte. A seguir, vamos abordar alguns preceitos 
básicos das principais DANT.
7.3.2 Doenças cardiovasculares
As doenças cardiovasculares, tais como infarto agudo do miocárdio (1º lugar) e acidente 
vascular cerebral (2º lugar) são, de longe, a principal causa de morte nos países ocidentais, 
incluindo o Brasil. Para esse grupo de doenças, o gênero é um fator preditivo bastante importante, 
pois as taxas de mortalidade são maiores em homens do que em mulheres em todas as faixas 
etárias. 
Os principais fatores de risco para essas doenças são relacionados ao estilo de vida e incluem 
a pressão arterial e o colesterol elevados, uso de tabaco e obesidade. Indivíduos que apresentam 
em conjunto os três fatores, têm uma probabilidade 20 vezes maior de ser acometido por uma 
doença cardiovascular.
7.3.3 Câncer
O que comumente chamamos de câncer, é representado por um conjunto de mais de 50 
doenças relacionadas, que são responsáveis pela segunda causa de morte no planeta. A difusão 
do teste de Papanicolau, aliado à redução no uso de cigarro e à vacinação contra o vírus do 
papiloma humano (HPV) são fatores responsáveis pela redução do número de diagnósticos 
de câncer no mundo todo. Contudo, o aumento da idade tem contribuído para uma maior 
107BIOESTATÍSTICA E 
EPIDEMIOLOGIA
prevalência, principalmente entre os indivíduos mais idosos. Aproximadamente metade dos 
homens e um terço das mulheres terão câncer ao longo da vida. Outro aspecto epidemiológico 
importante é a redução de mortalidade para alguns tipos de doença, como o câncer de estômago 
(- 35%) e o câncer cervical (- 29%); alguns tipos, como o câncer de pulmão em mulheres, não tem 
apresentado nenhuma redução. Já os tipos que mais causam mortes são, em ordem decrescente: 
câncer de pulmão, de estômago e de fígado.
Os fatores de risco para a doença são evitáveis, o que torna a prevenção uma ótima estratégia 
para redução dos danos relacionados. Entre esses fatores estão o uso de cigarro e álcool, prática 
sexual sem proteção, poluição, dieta (assim como obesidade) e infecções. Em relação às infecções, 
18% dos cânceres no mundo são decorrentes da exposição a vírus, como o HPV, a bactérias, como 
o H. pylori, e a parasitas.
7.3.4 Causas externas
Um grupo de ameaças à saúde da população tem se destacado, principalmente em países em 
desenvolvimento, como o Brasil. Entre causas externas estão incluídas aquelas relacionadas à 
violência e aos acidentes de trânsito (ambos os fatores são endêmicos no Brasil). Enquanto 
agravos à saúde desse tipo têm diminuído sua prevalência em países desenvolvidos, como 
a Suécia e o Japão, países em desenvolvimento sofrem com epidemias de violência. No Brasil, 
aproximadamente 100.000 pessoas por ano morrem em decorrência apenas de acidentes 
de trânsito e crimes violentos (valor que provavelmente está subvalorizado devido à falta de 
estatísticas adequadas).
Os fatores de risco para crimes violentos não são específicos e, às vezes, difíceis de serem 
identificados. Em geral, são considerados fatores de risco a desigualdade social, a baixa 
escolaridade e a cultura (das 100 cidades mais violentas do mundo, aproximadamente 90 estão 
na América Latina). Já para os agravos decorrentes de acidentes de trânsito, os fatores de risco são: 
infraestrutura de trânsito deficiente, baixa tecnologia dos veículos mais vendidos (populares), 
excesso de velocidade, uso de celulares e ingestão de álcool e outras drogas antes de dirigir.
108BIOESTATÍSTICA E 
EPIDEMIOLOGIA
7.4 CONSIDERAÇÕES FINAIS DO CAPÍTULO 7
Neste último capítulo do nosso caderno estudamos o processo epidêmico que ocorre a partir 
da interação entre os fatores que causam a doença e determina, entre outras coisas, a distribuição 
e a frequência dos agravos à saúde. Em relação a essa distribuição, vimos que uma enfermidade 
constantemente presente em uma determinada prevalência e região caracteriza uma endemia. Já 
o início de uma doença em uma população, é chamado de surto. Quando a enfermidade atinge 
um número maior que o esperado ao acaso para uma população específica, temos a epidemia 
(que, quando se espalha para vários países ou continentes, torna-se uma pandemia).
Outro fator que determina a dinâmica do processo epidêmico é o tipo de agente causador 
da doença. Por isso, também estudamos no capítulo 7 as características das doenças infecciosas 
e não-infecciosas. Em relação às doenças infecciosas, aprendemos que a transmissão ocorre 
quando o agente causador deixa o reservatório por meio de uma via de saída, é transportado 
através de um meio de transmissão e entra no hospedeiro suscetível para infectá-lo. Os 
reservatórios incluem animais não humanos (zoonoses), o meio ambiente (plantas, solo e 
água) ou portadores humanos (que podem ser assintomáticos,de incubação, convalescentes ou 
crônicos). A transmissão do agente infeccioso a partir do reservatório pode ser direta (contato 
direto ou propagação de gotículas) ou indireta (vetores mecânicos ou biológicos, transportados 
pelo ar ou outros veículos). Ao alcançar o hospedeiro suscetível, o patógeno pode entrar por 
uma via que o possibilite acessar tecidos onde ele irá se multiplicar ou agir e provocar a doença, 
dependo das condições de imunidade, genética e estrutural do indivíduo. O conhecimento da 
cadeia de infecção é a base para a adoção de medidas de controle, que podem ser direcionadas 
para controlar ou eliminar o agente na fonte de transmissão (e.g. descontaminação de solo, uso 
de antibióticos), proteger vias de entrada (e.g. uso de máscaras e luvas) ou aumentar as defesas 
do hospedeiro (e.g. uso de vacinas).
Nas últimas décadas, quase todos os países experimentaram uma transição epidemiológica 
pois, com algumas raras exceções na África subsaariana, todos os países têm doenças não-
infecciosas como causas principais de mortalidade, ao contrário do que ocorria no início da 
Epidemiologia. Essas doenças têm como características longos períodos de latência, com poucos 
sintomas e evolução lenta, em geral. Contudo, as doenças não-infecciosas representam um 
grupo variado de agravos à saúde e, por esta razão, decidimos abordar algumas características 
específicas das principais enfermidades desse tipo. Isoladamente, a primeira causa de morte 
na maior parte das populações, incluindo a brasileira, é a doença cardiovascular (infarto agudo 
do miocárdio, acidente vascular cerebral, entre outras), que acomete mais os homens do que 
as mulheres e tem como fatores de risco colesterol e pressão arterial elevados, uso de tabaco e 
109BIOESTATÍSTICA E 
EPIDEMIOLOGIA
obesidade. Os cânceres também estão entre as principais causas de morte no mundo inteiro e 
acometem mais idosos do que jovens e têm como fatores de risco o uso do tabaco e do álcool, 
infecções (parasitas, HPV, H. pylori e outras bactérias), prática sexual sem proteção, poluição e má 
alimentação. Por fim, discutimos um grupo de agravos à saúde que tem acometido principalmente 
países em desenvolvimento, consumindo uma parcela significativa dos recursos da saúde, que 
são as causas externas, representadas por acidentes (como os de trânsito, cujos fatores de risco 
são infraestrutura ineficiente, excesso de velocidade, entre outros) e violência (como homicídios, 
cujos fatores de risco podem ser desigualdade social, baixa escolaridade e cultura).
 Chegamos ao final do nosso caderno de estudos e eu gostaria de parabenizar sua dedicação, 
que é um atributo essencial para que seja alcançada uma aprendizagem significativa. Essa 
aprendizagem certamente contribuirá para que você se torne um profissional de Saúde apto a ser 
um agente transformador da nossa sociedade.
110BIOESTATÍSTICA E 
EPIDEMIOLOGIA
ALMEIDA FILHO, N.; ROUQUAYROL, M.Z. Introdução à epidemiologia. 4.ed.,rev. e ampliada. 
Rio de Janeiro: Guanabara Koogan, 2013.
BEAGLEHOLE, R. et al. Epidemiologia básica. São Paulo: Santos, 2010.
BUSSAB, W.O.; MORETTIN, P.A. Métodos quantitativos: estatística básica. São Paulo: Editora 
Atual, 1987.
CALLEGARI-JACQUES, S.M. Bioestatística: princípios e aplicações. Porto Alegre: Artemed, 
2003.
GREENLAND, S.; LASH, T.L.; ROTHMAN, K.J. Epidemiologia moderna. Porto Alegre: Artmed, 
2011.
KATZ, D.L.; ELMORE, J.G.; JEKEL, J.F. Epidemiologia, bioestatística e medicina. Porto Alegre: 
Artmed, 2005.
LEAVELL, H.; CLARK, E.G. Medicina preventiva. São Paulo: McGraw–Hill do Brasil, 1976.
RODRIGUES, V.P. et al. Conceitos e ferramentas de epidemiologia. São Luís: UFMA – 
UNASUS, 2014. Disponível em , acesso 
em: 02 fev 2017.
ZAR, J.H. Biostatistical analysis. 5 ed. New Jersey: Prentice Hall, 2010.
REFERÊNCIAS BIBLIOGRÁFICAS
111BIOESTATÍSTICA E 
EPIDEMIOLOGIA
IPCC. Climate Change 2001: The Scientific Basis. Contribution of Working Group I to the Third 
Assessment Report of the Intergovernmental Panel on Climate Change. Cambridge, United 
Kingdom, and New York, United States, Cambridge University Press ISDR (1999), 2001.
I
PCC. Future Work of the IPCC: Chairman’s Vision Paper on the Future of the IPCC. IPCC, 2015.
LIMA, G. F. C. Educação ambiental e mudança climática: convivendo em contextos de incerteza e 
complexidade. Ambiente & Educação . v. 18, 2013.
LOURENÇO-DE-OLIVEIRA R.; et al. Aedes aegypti in Brazil: Genetically differentiated populations with 
high susceptibility to dengue and yellow fever viruses. Trans R Soc Trop Med Hyg. v. 98, n.1, p.43–54, 
2004.
MARCELINO, E. V. Desastres naturais e geotecnologias: conceitos básicos. Santa Maria, RS: INPE, 
2007.
MARENGO, J. A. Mudanças climáticas globais e seus efeitos sobre a biodiversidade: caracterização 
do clima atual e definição das alterações climáticas para o território brasileiro ao longo do século 
XXI. Brasília: MMA, 2006.
MELLO, L. L. Charges e cartuns sobre aquecimento global. 2014. Disponível em: 
Acesso em: 09, jan. 2017.
MENDONÇA, F. Aspectos da interação clima-ambiente-saúde humana: da relação sociedade-natureza 
à (in) sustentabilidade ambiental. RA’E GA–O espaço geográfico em análise, v.4, n.4, p.85-100, 2000.
MILLER, B R.; BALLINGER, M. E. Aedes albopictus mosquitoes introduced into Brazil: vector competence 
for yellow fever and dengue viruses. Trans R Soc Trop Med Hyg. v.82, n.3, p. 476–7, 1988.
112BIOESTATÍSTICA E 
EPIDEMIOLOGIA
MONTEIRO, A. L.; BERTAGNI, R. F. S. Acidentes do Trabalho e Doenças Ocupacionais. Saraiva: São 
Paulo, ed. 7, 2012.
MONTERO, R. 2007. Poluição, Cubatão - SP. Disponível em: Acesso em: 09, jan. 2017.
MORAIS, C. R. Dicionário de Saúde e Segurança no trabalho e Meio Ambiente. São Caetano do Sul: 
Yendis, 2011.
MOUSINHO, P. Glossário. In: Trigueiro, A. (Coord.) Meio ambiente no século 21. Rio de Janeiro: Sextante. 
2003.
NARDOCCI, A. C.; et al. Poluição do ar e doenças respiratórias e cardiovasculares: estudo de séries 
temporais em Cubatão, São Paulo, Brasil. Cadernos de Saúde Pública, v. 29, n. 9, p. 1867-1876, 2013.
NICOLUSSI, F. H.; et al. Poluição do ar e doenças respiratórias alérgicas em escolares. Revista de Saúde 
Pública, v. 48, n. 2, p. 326-330, 2014.
NOGUEIRA, D. P. Incorporação da saúde ocupacional à rede primária de saúde. Revista de saúde 
pública, v. 18, n. 6, p. 495-509, 1984.
NUNES, T. Como a dengue é transmitida. 2016. Disponível em: Acesso em: 09 jan. 2017.
O DIA. Polipílula combate hipertensão e colesterol. 2011. Disponível em: Acesso 
em: 09 jan. 2017.
O GLOBO. Entenda o acidente. 2015. Disponível em: Acesso em: 09, jan. 2017.
113BIOESTATÍSTICA E 
EPIDEMIOLOGIA
ODUM, E. P. Ecologia. Rio de Janeiro: Editora Guanabara, 1986.
OLIVEIRA, M. V. C.� CARVALHO, A. R. Princípios Básicos do Saneamento do Meio. São Paulo: SENAC, 
2010.
ORGANIZAÇÃO MUNDIAL DA SAÚDE. Constituição da Organização Mundial da Saúde. 
Nova Iorque, 1946. Disponível em: Acesso em: 09 jan. 2017.
ORGANIZAÇÃO MUNDIAL DA SAÚDE. Dengue hemorrágica: diagnóstico, tratamento, prevenção e 
controle. ed. 2, São Paulo; 2001.
ORGANIZAÇÃO MUNDIAL DA SAÚDE. Substâncias químicas perigosas à saúde e ao ambiente. São 
Paulo: Cultura Acadêmica, 2008.
ORGANIZACIÓN PANAMERICANA DE LA SALUD. Dengue y dengue hemorrágico em las Américas, 
guias para su prevención y controle.Publicacion Científica nº 548, Washington; 2002.
PATZ, J. A., et al. Impact of regional climate change on human health. Nature, v. 438, n.7066, p. 310-317, 
2005.
PEGORIM, J. O que é El Niño? 2016. Disponível em: Acesso em: 09 jan. 2017.
PEREIRA, S. D. Conceitos e definições da Saúde e Epidemiologia usados na Vigilância Sanitária. 
Governo do estado de São Paulo, março de 2007.
RAU, K. (2012). Ocorrência de Equilíbrio Sustentável. Disponível em: Acesso em: 08, jan. 2017.
RENGIFO CUELLER H. Conceptualización de la saludambiental: teoría y práctica (parte 1). Rev Perú 
MedExp Salud Publica, v. 25, n.4, p.403-409, 2008.
RENGIFO CUELLER H. Conceptualización de la saludambiental: teoría y práctica (parte 2). Rev Perú 
MedExp Salud Publica, v.26, n.1, p.66-73, 2009.
RIBAS, P. P., MATSUMURA, A. T. S. A química dos agrotóxicos: impacto sobre a saúde e meio ambiente. 
Revista Liberato, v. 10, n. 14, p. 149-158, 2009.
RIBEIRO, M. D., et al. Estudo descritivo da ocorrência de dengue e suas relações com o clima e a ação da 
vigilância em saúde no município de Franca, São Paulo, Brasil, 2007 a 2011. Investigação, v.14, n. 1, 2015.
RICKLEFS, R. E. A Economia da Natureza. Rio de Janeiro: Guanabara-Koogan, 5 ed., 2003.
ROCHA, H. Natal inicia Campanha de Vacinação contra raiva em cães e gatos. 
2016. Disponível em: Acesso em: 09 jan.,2017.
ROUQUAYROL, Maria Zélia; ALMEIDA FILHO, Naomar de. Epidemiologia e Saúde. 
7. ed. Rio de Janeiro: MedBook, 2013.
SCHLICKMANN, F. Fotos antigas de Balneário Camboriú. 2011. Disponível em: 
 Acesso em: 08 jan. 2017.
115BIOESTATÍSTICA E 
EPIDEMIOLOGIA
SEMA. Secretaria do Meio Ambiente. O que são políticas públicas. Disponível em: 
. Acesso em: 07 jan. 2017.
SILVA JÚNIOR, J. L. R.; et al. Efeito da sazonalidade climática na ocorrência de sintomas
respiratórios em uma cidade de clima tropical. Jornal Brasileiro de Pneumologia, 
v. 37, n.6, p. 759-767, 2011.
SILVA, I. Fenômeno La Niña pode trazer chuvas ao sertão do Nordeste. 2016. 
Disponível em: Acesso em: 09 jan. 2017.
SULEIDE. Governo de Goiás. Goiânia, Césio, 137. 2012. Disponível em: 
 Acesso em: 09 jan. 2017.
SUPERINTERESSANTE. As grandes epidemias ao longo da história. 2004. 
Disponível em: Acesso em: 09 jan. 2017.
TAUIL, P. L. Urbanização e ecologia da dengue. Cadernos de Saúde Pública, n.17, p.99-
102, 2001.
TEIXEIRA, J. C., et al. Estudo do impacto das deficiências de saneamento básico sobre a saúde 
publica no Brasil no período de 2001 a 2009. Eng. sanit. ambient, v. 19, n. 1, p. 87-96, 2014.
116BIOESTATÍSTICA E 
EPIDEMIOLOGIA
TOLEDO, K. Quinto relatório do IPCC mostra intensificação das mudanças 
climáticas. Agência FAPESP. 2013. Disponível em: Acesso em: 
09 jan. 2017.
UNITED NATIONS DEPARTMENT OF ECONOMIC SOCIAL AFFAIRS/POPULATION 
DIVISION. World Urbanization Prospects: The 2007 revision. New York: UN; 2008.
 VOGES, M. O clima está louco?. 2012. Disponível em: Acesso em: 09 jan. 2017.
WEIHS, M.; MERTENS, F. Os desafios da geração do conhecimento em saúde ambiental: uma 
perspectiva ecossistêmica. Cien Saude Colet, v. 18, n. 5, p. 1501-1510, 2013.
XAVIER, M. P.; ARAÚJO, J. S. O conceito de saúde e os modelos de assistência: considerações 
e perspectivas em mudança / the concept of health and models of assistance: considerations 
and prospects in change. Revista Saúde em Foco, Teresina, v. 1, n. 1, 2014.
117BIOESTATÍSTICA E 
EPIDEMIOLOGIA
DUARTE, A.� SANTOS, T.R.� CASTRO, A. G. O Ambiente e a Saúde. Porto Alegre: Instituto Piaget, 2003.
EZZATI M.; et al. Comparative Risk Assessment Collaborating Group. Selected major risk factors and 
global and regional burden of disease. Lancet. v. 360, n. 9343, p.1347-60, 2002.
FIALA, N. Efeito Estufa do Hambúrguer. Scientific American Brasil. 2009. Disponível em: http://www2.
uol.com.br/sciam/noticias/efeito_estufa_dos_hamburgueres.html>Acesso em: 3 jan. 2017.
FIOCRUZ. Glossário de Doenças da Fiocruz. 2013. Disponível em: . Acesso em: 9 jan. 2017.
FOGAÇA, J. R. V. Tipos de tratamento de efluentes. Brasil Escola. Disponível em: . Acesso em: 28 dez. 2016.
GAZETA RURAL. Agricultores obrigados a ter formação para usarem pesticidas. 2016. Disponível em: 
 
Acesso em: 10, jan. 2017.
GECOM-TJAC. TJAC oferece atividades de ginástica laboral aos servidores. 2015. Disponível em: 
 Acesso 
em: 10, jan. 2017.
GIODA, A., DE AQUINO NETO, F. R. Comments on studies of industrial and non-industrial environments 
in Brazil: a comparative. Cad Saude Pública. v. 19, n. 5, p.1389-97, 2003.
GLOBAL PARTNERSHIP TO ROLL BACK MALARIA. Using climate to predict infectious disease 
outbreaks: a review. Geneva: World Health Organization; 2004.
HERZLICH, C. Health and illness on the eve of 21st century: from private experience to the public sphere 
and back. Physis: Revista de Saúde Coletiva, v. 14, n. 2, p. 383-394, 2004.
Av. Marginal Leste, n. 3.600, Bairro dos Estados | CEP: 88.339-125 - Balneário Camboriú (SC)
Telefone: (47) 3363-0631 | avantis@avantis.edu.br | www.avantis.edu,br
	autor
	APRESENTAÇÃO
	1 – CONCEITOS BÁSICOS DE BIOESTATÍSTICA
	3.2 O escore padrão e a estatística “Z”
	3.3 Teste “t” de Student para uma amostra
	3.4 Análise de Variância (ANOVA)
	3.5 Teste Não-Paramétrico para Duas Amostras: Mann-Whitney (“U”)
	3.6 Teste Não-Paramétrico para 3 ou mais Amostras: Kruskal-Wallis (“H”)
	3.7 Considerações Finais do Capítulo 3
	3 BIOESTATÍSTICA INFERENCIAL
	3.1 Noções de Testes de Hipótese
	2.1.1 Média aritmética simples
	2.1.2 Mediana
	2.1.3 Moda
	2.1.4 Ponto médio
	2.2 Medidas de Variação e Dispersão
	2.2.1 Amplitude
	2.2.2 Variância
	2.2.3 Desvio-padrão
	2.2.4 Coeficiente de variação
	2.3 Distribuição de Frequências 
	2.3.1 Representações gráficas da distribuição de frequência
	2.4 Relações entre Duas Variáveis
	2.4.1 Regressão linear simples
	2.4.2 Correlação linear simples
	2.5 Considerações Finais do Capítulo 2
	2 BIOESTATÍSTICA DESCRITIVA
	2.1 Medidas de Tendência Central
	1.1 Tipos de Dados Comuns nas Ciências da Saúde
	1.2 Erro, Acurácia, Precisão e Arredondamento
	1.3 Coleta de Dados em Populações e Amostras
	1.4 Probabilidade
	1.4.1 Probabilidade de um evento
	1.4.2 Contando os resultados possíveis
	1.4.3 Multiplicando e adicionando probabilidades
	1.4.4 Modelos probabilísticos
	1.4.4.1 Modelos para variáveis aleatórias discretas
	1.4.4.2 Modelo para variáveis aleatórias contínuas
	1.5 Considerações Finais do Capítulo 1
	EPIDEMIOLOGIA
	4 – CONCEITOS BÁSICOS DE EPIDEMIOLOGIA
	7.2 Epidemiologia das Doenças Infecciosas
	7.2.1 Reservatórios de agentes infecciosos
	7.2.2 Saída do agente infeccioso e modos de transmissão
	7.2.3 Entrada do agente no hospedeiro
	7.2.4 Hospedeiro suscetível
	7.2.5 Implicações para a saúde pública
	7.3 – Epidemiologia das Doenças Não-Infecciosas
	7.3.1 Características das doenças não-infecciosasextra, através do AVA. Também se houver dificuldade para a incorporação de definições 
necessárias ao desenvolvimento das atividades, nosso canal de comunicação está sempre aberto.
Por fim, lembre-se que o ensino semipresencial traz grandes vantagens, como a possibilidade 
de você gerenciar seu tempo, mas também requer responsabilidade e dedicação. Sendo o principal 
interessado no ensino, você experimentará um aprendizado muito mais significativo.
Boa sorte e até breve. 
12BIOESTATÍSTICA E 
EPIDEMIOLOGIA
BIOESTATÍSTICA
1 – CONCEITOS BÁSICOS DE BIOESTATÍSTICA
O termo ‘estatística’ tem origem latina e deriva da palavra ‘estado’. Essa associação se deve 
à importância histórica da coleta de dados para os governos, em ações referentes a censos 
demográficos, recrutamentos militares e coleta de impostos. Em 1749, o professor alemão 
Gottfried Achenwall (1719 – 1772) utilizou pela primeira vez a palavra Statistik e somente 42 anos 
depois, registrou-se a primeira publicação do termo em inglês.
Agora que sabemos a origem, precisamos entender o que significa realmente a palavra 
estatística. É muito comum encontrarmos o termo como sinônimo de dados. Por exemplo, 
ouvimos um narrador de futebol comentar sobre as estatísticas do jogo (referindo-se ao número 
de faltas, porcentagem de posse de bola etc.), o Ministério do Trabalho divulgar as estatísticas 
da mão-de-obra (tais como taxas de desemprego ou remuneração média do trabalhador), as 
Secretarias de Educação publicarem estatísticas do ensino médio (referindo-se à criação de novas 
vagas, à relação entre o número de professores e alunos, às taxas de evasão etc.). Ainda que seja 
possível encontrar essa definição em alguns dicionários, neste caderno de estudos utilizaremos 
o sentido científico de Estatística, que pode ser compreendido como a coleta ordenada, análise 
e interpretação de dados como o objetivo de apresentar e avaliar as conclusões baseadas nesses 
dados. Além disso, há outro significado – menos amplo – que aparecerá neste livro: refere-se à 
estimativa de um parâmetro populacional, a partir de uma amostra (veremos mais detalhadamente 
no item 1.3); nesse caso, a palavra deve ser escrita com a letra inicial minúscula.
UNIDADE 1
CAPÍTULO 1
13BIOESTATÍSTICA E 
EPIDEMIOLOGIA
Quando a estatística é aplicada a informações biológicas, chamamos de Bioestatística. Essa 
ciência tem se desenvolvido principalmente a partir do final do século XIX e é responsável 
pelo aumento da expectativa de vida ocorrida em todos os países do mundo e pela melhora nas 
condições de saúde das populações. Neste caderno, os termos Estatística e Bioestatística serão 
utilizados como sinônimos, uma vez que sempre trataremos de informações biológicas.
1.1 TIPOS DE DADOS COMUNS NAS CIÊNCIAS DA SAÚDE
As características que podem se diferenciar entre uma entidade biológica e outra, tais como 
tamanho, cor, composição química etc., são os principais dados utilizados em Bioestatística. Esses 
dados (também chamados de variáveis) podem ser divididos de diversas formas, dependendo 
do objetivo e tipo de Estatística a ser utilizada. Em nosso curso utilizaremos uma classificação 
bastante simples, mas que é suficiente para alcançarmos os objetivos propostos.
As variáveis qualitativas são representadas pelos dados que se encontram em categorias 
ou atributos. Podemos citar como exemplos a manifestação da cor dos olhos em mamíferos, 
classificação em macho ou fêmea, entre outras (é muito comum encontramos fenótipos genéticos 
nesse tipo de variável). As variáveis qualitativas podem ser divididas em nominais e ordinais. 
Os dados qualitativos nominais referem-se a atributos que não guardam entre si hierarquia, 
tais como homem e mulher, preto ou branco, tipo sanguíneo A, B, AB ou O etc. Já as variáveis 
qualitativas ordinais são atributos que têm relação de hierarquia entre si, tais como baixo peso, 
eutrófico, sobrepeso, obesidade.
As variáveis quantitativas são mais comuns em Bioestatística, possibilitam resultados mais 
robustos, são representadas por valores numéricos e podem ser divididas em dois tipos. As 
variáveis quantitativas discretas representam (em geral) valores consecutivos e inteiros, tais 
como o número de dentes extraídos de um paciente, o número de consultas de um fisioterapeuta 
na semana etc. Já as variáveis quantitativas contínuas representam apenas aproximações dentro 
de um intervalo observado, como por exemplo, o peso inicial de um paciente submetido a uma 
dieta restritiva de calorias. Para ficar mais claro, suponha que o referido paciente tenha medido 
seu peso antes do tratamento em uma balança que informa apenas o número de quilogramas, 
sem decimais, e o valor foi 87 kg. Em seguida, ele utilizou uma balança que registra, além dos 
quilogramas, também seus decimais; nesse caso, seu peso foi igual a 86,8 kg. O mesmo indivíduo 
poderia ter seu peso medido em balanças cada vez mais precisas, apresentando pesos iguais 
Variáveis 
qualitativas:
nominais 
(e.g. fator 
Rh positivo 
ou negativo)
ordinais 
(e.g. primeira 
ou segunda 
dentição)
14BIOESTATÍSTICA E 
EPIDEMIOLOGIA
a 86,83 kg, 86,825 kg e assim por diante. Perceba que as medições menos precisas são apenas 
arredondamentos que permitem definirmos um intervalo de valores contínuos; por isso, esse 
tipo de variável se chama quantitativa contínua.
1.2 ERRO, ACURÁCIA, PRECISÃO E ARREDONDAMENTO
Acurácia representa a proximidade das medições coletadas em relação ao valor real da variável 
medida, enquanto precisão refere-se à proximidade dos valores de cada medição repetida em 
relação à mesma variável. A Figura 1 ilustra a diferença entre acurácia e precisão:
Figura 1. Modelo ilustrativo de acurácia e precisão.
Fonte: BUSSAB; MORETTIN, 1987 (adaptado).
Todo pesquisador deve almejar grande acurácia e precisão. Contudo, erros acontecem 
e devemos estar preparados para representá-los. Para isso, é importante relembrar regras 
simples de arredondamento, que nos indicam que os números menores que 5 (cinco) devem ser 
rebaixados, enquanto números iguais ou maiores que 5 (cinco) devem ser aumentados, quando 
formos reduzir as casas decimais. Relembrando o exemplo do paciente submetido à dieta 
restritiva, perceba que seu peso na balança mais precisa, igual a 86,825 kg, foi arredondado para 
86,83 kg, que, por sua vez, foi arredondado para 86,8 kg e, por fim, arredondado para 87 kg, na 
balança menos precisa. Nesse caso, o peso indicado nesta última balança representa um intervalo 
entre uma continuidade de valores entre 86,5 kg e 87,4 kg (pois ambos representam extremos de 
valores que seriam arredondados para 87 kg). Note que, mesmo na balança mais precisa, 86,825 
Variáveis 
quantitativas:
discretas 
(e.g. número 
de animais 
infectados)
contínuas 
(e.g. altura de 
pacientes)
15BIOESTATÍSTICA E 
EPIDEMIOLOGIA
kg representa apenas um intervalo entre 86,8245 kg e 86,8254 kg.
Agora que você está familiarizado com as regras de arredondamento, podemos introduzir o 
conceito de acurácia representada pela indicação numérica da medição. Suponha que você tenha 
percebido uma lesão no pescoço de um paciente e a mediu, obtendo o resultado igual a 3 cm. 
A apresentação dessa informação, indicará que a referida lesão tem entre 2,5 cm e 3,4 cm (pois 
ambos os valores representam os valores extremos que devem ser arredondados para 3 cm, caso 
ocorram). Caso você apresente a mesma informação com uma casa decimal a mais, ou seja, 3,0 cm, 
qualquer observador treinado em Bioestatística saberá que se trata de uma lesão cujo tamanho 
tem entre 2,95 cm e 3,04 cm. Se ainda há dúvidas, podemos continuar aprofundando o mesmo 
exemplo. A representação da lesão como tendo 3,00 cm indica que seu verdadeiro valor está em 
uma continuidade de valores entre 2,995 cm e 3,004 cm; já 3,000 cm representa o intervalo entre 
2,9995 e 3,0004 e assim por diante.
1.3 COLETA DE DADOS EM POPULAÇÕES E AMOSTRAS
O objetivo principal da análisebioestatística consiste em inferir (i.e. deduzir) características 
de um grupo de variáveis através da generalização da análise de uma amostra desse grupo. Essa 
generalização pressupõe o conhecimento de importantes conceitos, tais como população e 
amostra, parâmetros e estatísticas, amostragens aleatórias e outliers.
Em Bioestatística, o termo população tem um significado ligeiramente diferente do que se 
emprega no cotidiano. Biólogos e profissionais da saúde podem ser referir a populações como 
sendo um grupo de seres humanos ou outras espécies de animais. Contudo, para os bioestatísticos, 
população significa um grupo completo de variáveis sobre as quais se deseja tirar conclusões. 
Por exemplo, se uma pesquisadora pretende definir a altura média dos calouros do curso de 
Fisioterapia da Faculdade Avantis, a população será composta pelos valores que representam 
as alturas de todos os calouros do referido curso. Vale ressaltar que é de extrema importância 
delimitar a população de acordo com o objetivo da pesquisa, a fim de evitar extrapolações 
que introduzam vieses nos resultados das análises. Imagine se, por conveniência, a mesma 
pesquisadora coletasse as alturas de todos os alunos que estivessem na terceira aula de anatomia 
do primeiro período, sem se preocupar em identificar os alunos que são repetentes (e, portanto, 
não são calouros) ou os calouros que faltaram naquele dia. Se isso ocorresse, o objetivo passaria 
a ser a definição da altura média dos alunos daquela aula de anatomia.
População: 
conjunto 
completo das 
variáveis de 
interesse
Amostra: 
uma parte 
idealmente 
representativa 
da população
Viés (pl. vieses): 
tendenciosidade 
ou erro 
sistemático
16BIOESTATÍSTICA E 
EPIDEMIOLOGIA
Na realidade da pesquisa científica, quase nunca é possível obter dados da população 
inteira por diversos motivos, como recursos financeiros e humanos limitados, tempo reduzido 
e dinâmica populacional (morte, nascimento, ausências temporárias, mudança de categorias, 
entre outros motivos). Por isso, é muito comum utilizarmos amostras para inferir informações 
sobre a população. Amostras são partes da população que, de preferência, a represente bem. A 
qualidade da amostra depende do seu tamanho em relação à população (quanto maior a amostra, 
menor será o erro amostral) e da aleatoriedade da coleta das variáveis (é ideal que cada membro 
da população tenha a mesma probabilidade de ser escolhido para ser medido). Você certamente já 
participou de uma coleta de dados em que toda a população foi medida: aqui mesmo, na Faculdade 
Avantis, todos os alunos têm que preencher um formulário com sua data de nascimento; nesse 
caso, a instituição fez um censo (quando toda a população é medida). Lembra quando dissemos 
que, quanto maior a amostra, menor será o erro amostral? Pois é, no censo, o erro amostral é igual 
a zero, pois trata-se da maior amostra possível; essa amostra é a própria população.
Importante ressaltar que, quando se mede variáveis de uma população (todos os membros que 
interessam para a pesquisa), temos um parâmetro; por exemplo, se medirmos a quantidade de 
calorias ingeridas por cada um dos ratos de um determinado biotério e dividirmos pelo número 
total de ratos, teremos um parâmetro populacional (a ingestão média de calorias). Já quando 
se mede variáveis de uma amostra (parte da população), temos uma estatística; retomando o 
exemplo, se escolhermos alguns ratos para realizar a medição e dividirmos o total de calorias 
medido pelo número de animais escolhidos, teremos uma estatística.
Já comentamos que o tamanho da amostra é importante para a qualidade do resultado da 
pesquisa; agora vamos nos dedicar um pouco a discutir a aleatoriedade da coleta das variáveis. 
Imagine que um pesquisador esteja tentado comprovar que os alunos do curso de Enfermagem 
têm um IMC (índice de massa corporal) maior que os alunos de Nutrição, pois estes têm melhor 
conhecimento em dietética (ou qualquer outra hipótese). Para isso, ele decide medir o peso e a 
altura (necessários para calcular o IMC) de 10% dos alunos de cada curso, pois seria inviável medir 
todos. No momento da medição dos alunos de Enfermagem, ele escolhe os maiores, enquanto no 
curso de Nutrição, ele escolhe os menores alunos para garantir a confirmação da sua hipótese. É 
claro que isso não seria justo, tampouco teria relevância científica. Para evitar distorções desse 
tipo, que nem sempre são assim tão evidentes (às vezes ocorre sem intenção), há técnicas de 
amostragem probabilística que servem para garantir a aleatoriedade da amostra, permitindo que 
esta seja mais representativa da população. A seguir, serão apresentadas as quatro técnicas de 
amostragem probabilística mais importantes:
Amostragem aleatória simples – todos os membros da população são computados e têm a 
mesma chance de ser escolhidos através de um sorteio. Apesar de ser a amostragem ideal, muitas 
vezes torna-se inviável; imagine que você pretenda identificar a porcentagem de pessoas com 
17BIOESTATÍSTICA E 
EPIDEMIOLOGIA
depressão na cidade e, para isso, queira utilizar a amostragem aleatória simples. Para início de 
conversa, você teria que ter o nome de todas as pessoas da cidade para realizar o sorteio, em uma 
grande urna, por exemplo (difícil, né?).
Amostragem sistemática – os membros de uma população devem estar ordenados e, sem que 
o pesquisador saiba previamente a ordem, deve escolher o nésimo membro da população, sendo 
“n” um número escolhido de acordo com o tamanho da população. Suponha que você queira 
conhecer o número de pessoas deprimidas na sua sala de aula, sem perguntar para todo mundo; 
para isso, sem saber aonde estão localizados seus colegas de sala, você determina um número – 
5, por exemplo – e pergunta ao quinto aluno da fila, depois ao 10º, depois ao 15º, ao 20º e assim 
por diante (a cada cinco colegas). Novamente perceba que, no caso de populações grandes, essa 
técnica se torna bastante difícil.
Amostragem estratificada – a população é dividida em subpopulações relevantes para o 
estudo e uma porcentagem dessa subpopulação é medida. Voltando ao exemplo da determinação 
da porcentagem de depressão, você poderia decidir dividir a cidade em bairros e entrevistar uma 
porcentagem de cada bairro (1%, digamos). Dessa forma, cada bairro estaria representado de 
acordo com sua população.
Amostragem por conglomerado – assim como na amostragem estratificada, a população 
também é dividida em subpopulações relevantes, mas desta vez, o pesquisador sorteia uma 
subpopulação e entrevista ou mede todos os seus membros. Dependendo do objetivo do estudo, 
esse tipo de amostragem pode introduzir muito viés e, por isso, deve ser utilizada com cautela. 
Imagine que você queira determinar a força média dos alunos de Educação Física e, para isso, 
divida a turma em homens e mulheres; ao sortear um grupo para ser medido, você estará 
privilegiando alunos que têm uma intensidade de força muito diferente do outro grupo, em 
média. Contudo, algumas vezes esse tipo de amostragem pode se revelar eficiente. Suponha que 
você trabalhe na Secretaria de Educação de Santa Catarina e decida determinar a qualidade do 
ensino através de visitas às escolas da rede estadual (isso realmente ocorre). Para isso, sortear 
algumas entre todas as escolas do estado (aleatória simples), escolher algumas em determinada 
ordem (sistemática) ou escolher uma porcentagem de cada cidade ou região (estratificada) 
tornaria o trabalho praticamente inviável, pois representantes teriam que se descolar para várias 
cidades. Nesse caso, a amostragem por conglomerado se mostra mais eficaz: você poderia dividir 
em grupos (cidades, por exemplo) e sortear duas ou três a cada ano, para que os representantes 
visitassem todas as unidades daquelas cidades.
Outra consideração importante a fazer sobre variáveis coletadas de populações é que, 
ocasionalmente, conjuntos de dados têm variáveis que sãomuito discrepantes em relação ao 
restante da amostra; são os outliers. Suponha que você esteja tentando determinar o tamanho 
18BIOESTATÍSTICA E 
EPIDEMIOLOGIA
médio dos recém-nascidos em uma maternidade e, para isso, sorteou aleatoriamente 5 bebês; 
seus tamanhos em centímetros foram 41, 42, 45, 47 e 71. Perceba que o último membro da amostra 
apresenta um tamanho muito diferente do restante, sendo considerado um outlier. Sempre que 
um pesquisador se deparar com essa situação, a primeira providência é checar o registro, pois 
pode ter havido um erro de medição ou de marcação. Nessa pesquisa específica, você poderia 
verificar se o tamanho correto não seria 41 cm mas, por erro de digitação, foi computado 71. Se 
não for o caso, você poderia verificar se o indivíduo realmente é um recém-nascido ou é mais 
velho. Após todas as verificações, você pode concluir que realmente se trata de um valor correto 
e que dados muito diferentes da média podem ocorrer (realmente houve um recém-nascido 
norte-americano com essa estatura). Nesse caso, cabe ao pesquisador a decisão de acomodar a 
variável discrepante através de procedimentos estatísticos (que não serão discutidos aqui, pois 
extrapolam os objetivos do nosso curso), repetir o experimento com um novo conjunto de dados 
ou, até mesmo, excluí-la.
1.4 PROBABILIDADE
A probabilidade é uma parte tão extensa da Matemática, que poderíamos ter um curso inteiro 
sobre ela. Contudo, para os propósitos dessa disciplina, poderemos resumi-la a apenas alguns 
tópicos que serão de interesse da Biologia e que também servirão para melhor aplicação dos 
conceitos da estatística inferencial, a qual será introduzida mais adiante.
Em muitos casos, a probabilidade é intuitiva. Prova disso, é que quase qualquer pessoa deve 
responder corretamente se perguntada sobre a chance de se obter uma cara, ao jogarmos uma 
moeda que não seja viciada e que possua dois lados diferentes (cara e coroa). Infelizmente, nem 
sempre é possível identificar de pronto o resultado de um experimento que envolva probabilidade 
e, por isso, será necessário um maior aprofundamento no tema.
Outliers: 
valores muito 
discrepantes em 
um conjunto de 
variáveis
19BIOESTATÍSTICA E 
EPIDEMIOLOGIA
1.4.1 Probabilidade de um evento
Quando nos depararmos com probabilidade, uma fórmula básica poderá resolver a maior 
parte dos problemas:
P(a) = probabilidade de ocorrer o evento “a”;
a = número de vezes que ocorre o evento “a”;
S = nº total de possíveis resultados para aquele experimento ou espaço amostral.
Voltando ao exemplo da moeda não viciada, vamos utilizar a fórmula para calcular a 
probabilidade de se obter uma CARA ao jogarmos uma moeda. Fácil: a probabilidade do evento 
CARA, ou seja, P(CARA), é igual ao número de vezes que ocorre CARA, dividido pelo número total 
de possíveis resultados de uma moeda (espaço amostral) ou simplesmente:
Isso significa que, ao jogarmos uma moeda não viciada, a probabilidade de se obter uma CARA 
é igual a 0,5 ou, se quisermos nos referir à porcentagem, basta multiplicar por 100; nesse caso, 
50% (0,5 x 100).
Agora que você já sabe o básico sobre o assunto, vamos a um exemplo mais adequado. Suponha 
que você seja uma fisioterapeuta que participa de um programa de residência, juntamente com 
outros 3 colegas e, num determinado dia, 4 pacientes precisam de atendimento urgente, sendo 
que três deles têm a necessidade de ventilação mecânica. Sabendo que cada profissional terá 
que atender um dos 4 pacientes, qual a probabilidade de você ter que realizar o procedimento de 
ventilação mecânica? Usando novamente a fórmula, temos:
20BIOESTATÍSTICA E 
EPIDEMIOLOGIA
Você encontrará exercícios e mais exemplos no Ambiente Virtual de 
Aprendizagem.
1.4.2 Contando os resultados possíveis
Nem sempre o espaço amostral (S) está claro. Sendo assim, muitas vezes será preciso 
calculá-lo antes de utilizar a fórmula básica. A condição mais frequente é quando um evento é 
composto por sucessivas fases. Nesse caso, o número de resultados possíveis de cada fase deve 
ser multiplicado, para chegarmos ao espaço amostral (S). Se cada fase possuir o mesmo número 
de resultados possíveis, podemos representar matematicamente por:
k = número de resultados possíveis de cada fase;
n = número de fases.
Com isso em mente, vamos relembrar as aulas de genética. Uma série de três nucleotídeos é 
chamada de códon, que codifica um aminoácido. Lembrando que um nucleotídeo pode conter 
qualquer uma de 4 bases (adenina, citosina, guanina e timina), calcule o espaço amostral (S). 
Primeiramente, identificaremos o número de resultados possíveis de cada fase (k = 4). Em 
seguida, o número de fases (n = 3). Sendo assim,
21BIOESTATÍSTICA E 
EPIDEMIOLOGIA
Agora que já sabemos contar resultados possíveis (espaço amostral) que não estejam evidentes, 
podemos calcular suas probabilidades. Desta vez, vamos usar um jogo para o exemplo. Suponha 
que você tenha jogado um par dados e queira saber a probabilidade de obter o número 12 na soma 
dos dois dados, supondo que estes não sejam viciados (esse jogo se chama craps e é muito comum 
em cassinos dos EUA e da UE). Primeiramente, relembre as fórmulas: 
Agora, vamos determinar o número de vezes que ocorre o evento escolhido. Para isso, pense 
como podemos obter a soma igual a 12 em dois dados. Há apenas 1 possibilidade: 6 no primeiro 
dado e 6 no segundo. Em seguida, devemos nos dedicar a encontrar o espaço amostral. Para isso, 
devemos saber qual é o número de resultados possíveis de cada fase (dado), ou seja 6 (1, 2, 3, 4, 5 
ou 6), para, em seguida, elevarmos ao número de fases. Portanto,
Você encontrará exercícios e mais exemplos no 
Ambiente Virtual de Aprendizagem.
VAMOS REFLETIR:
Se nosso mecanismo de “montagem” de aminoácidos permite 64 variedades diferentes, 
por que temos apenas 20 tipos?
VAMOS REFLETIR:
A probabilidade de se obter a soma dos dois dados igual a 7 seria maior, menor ou igual 
à probabilidade de se obter 12?
22BIOESTATÍSTICA E 
EPIDEMIOLOGIA
1.4.3 Multiplicando e adicionando probabilidades
Outro recurso bastante útil para a Bioestatística refere-se às operações com probabilidades. 
Sempre que dois ou mais eventos forem condições obrigatórias para o resultado final, as 
probabilidades individuais devem ser multiplicadas. Já quando, em dois ou mais eventos 
mutuamente exclusivos, qualquer deles for condição para o resultado final, as probabilidades 
individuais devem ser somadas. Em resumo, quando for necessário determinar a probabilidade 
de uma condição E de outra (E de tantas quantas forem), deve-se multiplicar as probabilidades 
individuais; quando for necessário determinar a probabilidade de uma condição OU de outra 
(OU de tantas quantas forem), deve-se somar as probabilidades individuais.
 Por exemplo, suponha que na espécie humana, homens (♂) e mulheres (♀) nasçam na mesma 
proporção (na realidade, homens têm uma prevalência ligeiramente superior no nascimento). 
Sendo assim, podemos calcular a probabilidade de uma gestante qualquer ter uma menina (que 
será a mesma para um menino),
Agora, se uma gestante qualquer, que pretenda ter dois filhos, nos perguntar sobre a 
probabilidade de ambos serem meninas ou ambos meninos ou um menino e uma menina, 
precisamos realizar operações com probabilidade:
 1ª gravidez 2ª gravidez
 P(♀) = 0,5 P(♀) = 0,5
 P(♂) = 0,5 P(♂) = 0,5
23BIOESTATÍSTICA E 
EPIDEMIOLOGIA
Vamos começar respondendo qual é a probabilidade de a gestante ter duas meninas. Para isso, 
é necessário que a primeira gravidez gere uma menina E a segunda também. Assim, devemos 
multiplicar as probabilidades individuais:
O mesmo pode ser feito para determinar a probabilidade de dois meninos:
Já para uma menina e um menino, devemos levar em consideração duas possibilidades: um 
menino nascer na primeira e uma menina nascer na segunda gestação OU uma menina nascer na 
primeira e um menino nascer na segunda gestação. Para esse cálculo:Você encontrará exercícios e mais exemplos no Ambiente Virtual de 
Aprendizagem.
1.4.4 Modelos probabilísticos
Modelos probabilísticos são ferramentas utilizadas para simplificar a realidade dos dados, sem 
que o pesquisador perca as principais características do conjunto das variáveis. Se soubermos a 
distribuição de um conjunto de variáveis aleatórias, podemos obter suas medidas de localização 
24BIOESTATÍSTICA E 
EPIDEMIOLOGIA
e variação (as quais discutiremos mais adiante). 
1.4.4.1 Modelos para variáveis aleatórias discretas
Você lembra o que são variáveis quantitativas discretas (se tiver dúvida, revise o item 1.1)? Para 
esse tipo de variável, dois modelos são muito utilizados. O primeiro é o modelo de distribuição 
binomial, utilizado para descrever situações em que a variável aleatória pode ser agrupada em 
apenas dois resultados possíveis (e.g. probabilidade de duas gestações gerar meninas ou não). 
Nesse tipo de modelo, a probabilidade de sucesso ou fracasso não muda de ensaio para ensaio e 
os eventos são idênticos e independentes. No exemplo da gestação, mesmo que uma mulher já 
seja mãe de cinco meninas, a próxima gravidez terá a mesma probabilidade da primeira, ou seja, 
aproximadamente 50% de nascer uma menina. Através do modelo binomial, podemos responder 
questões do tipo: qual a probabilidade de, em duas gravidezes, nascer 2 meninas, 1 menina ou 
nenhuma menina. Foi o que fizemos no exemplo do item 1.4.3, para exemplificar o cálculo de 
multiplicações e adições de probabilidade; o resultado, colocado em forma de modelo binomial 
foi:
0 menina 25%
1 menina 50% ou graficamente: 
2 meninas 25% 
 
Outro modelo para descrever variáveis discretas é a distribuição de Poisson, que é muito 
útil quando se pretende descrever situações que ocorrem em um campo ou intervalo definido 
(geralmente área ou tempo), como, por exemplo, o número de infectados por H1N1 nos últimos 
dois meses ou o número de bactérias em uma placa de Petri.
0 ♀ 1 ♀ 2 ♀
25BIOESTATÍSTICA E 
EPIDEMIOLOGIA
1.4.4.2 Modelo para variáveis aleatórias contínuas
A mais importante distribuição contínua de probabilidade é a Distribuição Normal ou 
Gaussiana (também chamada Curva de Gauss). A maior parte dos dados biológicos tem essa 
distribuição. Alguns exemplos são alturas, pesos e outras características físicas, erros de medida 
em experimentos científicos, medidas de inteligência e aptidão, pontuações em testes variados 
e numerosas medidas e indicadores de saúde. Todo gráfico da distribuição normal é simétrico 
em torno da média da distribuição e tem forma de sino. Mais adiante veremos que diversas 
propriedades úteis para a confirmação ou refutação de hipóteses científicas nas Ciências da Saúde 
são derivadas da Curva de Gauss. Por enquanto, vamos nos concentrar nas suas características 
básicas. Um exemplo simples pode ajudar muito na compreensão. Suponha que você pese todos 
os alunos da faculdade e obtenha a média igual a 70 kg (esse será o centro da distribuição, ou seja, 
a coluna mais alta na Figura 2). Muitos alunos estarão próximos desse peso, enquanto poucos 
estarão muito abaixo ou muito acima desse peso (colunas à esquerda e à direita, que são mais 
baixas, representando menor frequência).
Curva de Gauss
Figura 2. Modelo de distribuição normal, com média igual a 70 kg e desvio-padrão igual a 10 kg.
Fonte: o autor.
Uma propriedade importante da curva normal é sua distribuição, que pode determinar a 
proporção dos valores que se encontram em qualquer amplitude específica. Por exemplo: 68,3% 
dos valores estarão a 1 desvio-padrão da média (estudaremos melhor essas medidas no capítulo 
seguinte), enquanto 95,4% dos valores devem estar a 2 desvios-padrão da média.
 40 kg 50 kg 60 kg 70 kg 80 kg 90 kg 100 kg
26BIOESTATÍSTICA E 
EPIDEMIOLOGIA
1.5 CONSIDERAÇÕES FINAIS DO CAPÍTULO 1
Neste capítulo aprendemos que Bioestatística compreende a coleta ordenada, a análise e a 
interpretação de variáveis biológicas. Através desses procedimentos, o pesquisador que utiliza 
a Bioestatística pode apresentar e avaliar as conclusões baseadas nas variáveis coletadas. 
Essas variáveis, ou dados, podem ser classificados em qualitativos (que, por sua vez podem ser 
divididos em nominais e ordinais) e quantitativos (divididos em discretos e contínuos). Como 
vimos, alguns dados quantitativos podem apresentar valores muito diferentes do conjunto de 
variáveis (outliers); quando forem identificados devem ser conferidos, ajustados ou, até mesmo, 
excluídos, desde que haja justificativa.
A partir do estudo do capítulo 1, você já é capaz de definir acurácia, que é representada pela 
proximidade das medições em relação aos valores reais, e precisão, que é representada pela 
proximidade das medições entre si (mesmo que não sejam próximas do valor real). Além disso, 
podemos diferenciar populações (conjunto completo de variáveis de interesse) de amostras 
(subconjuntos da população) e perceber a importância do tamanho amostral para a determinação 
do erro (quanto maior a amostra, menor será o erro amostral). Outra consideração importante 
sobre coleta de variáveis é a técnica de amostragem utilizada; neste capítulo, vimos 4 técnicas 
de amostragem probabilística que podem ser usadas em estudos científicos: aleatória simples, 
sistemática, estratificada e por conglomerado.
Neste primeiro capítulo você também trilhou os primeiros passos na probabilidade e já 
consegue calcular as chances de um evento qualquer ocorrer simplesmente dividindo o número 
de vezes que esse evento ocorre pelo número total de ocorrências possíveis, também chamado 
de espaço amostral (ou P
(a)
=a/S). Mesmo quando não está claro o tamanho do espaço amostral, 
como, por exemplo, quando um experimento é composto por mais de uma fase, você consegue 
defini-lo através da multiplicação dos espaços amostrais individuais (ou, quando todos os espaços 
amostrais forem iguais, através da fórmula S=kn). Também vimos como realizar operações, 
adicionando (quando uma condição OU outra for exigida para o resultado final) e multiplicando 
(quando uma condição E outra for exigida) probabilidades individuais em eventos mutuamente 
exclusivos. Por fim, fomos apresentados aos modelos probabilísticos mais importantes para 
variáveis discretas (binomial e Poisson) e para variáveis contínuas (Curva de Gauss ou normal).
No próximo capítulo aprenderemos as principais técnicas para apresentação de dados 
biológicos: a Bioestatística descritiva. 
27BIOESTATÍSTICA E 
EPIDEMIOLOGIA
2 BIOESTATÍSTICA DESCRITIVA
Agora que estamos mais familiarizados com alguns conceitos da Bioestatística, podemos 
iniciar alguns cálculos. A partir de agora, um pouco de conhecimento de matemática básica será 
bastante útil.
Se tiver dificuldade, experimente o nivelamento no Ambiente Virtual de 
Aprendizagem.
Como já citamos, a Bioestatística descritiva é responsável por descrever nossas variáveis ou 
dados de diversas formas, de acordo com o objetivo do trabalho científico ou das intenções do 
pesquisador. 
2.1 MEDIDAS DE TENDÊNCIA CENTRAL
Tanto em amostras como em populações de variáveis, podemos encontrar valores que são 
próximos do centro das observações. A descrição desses parâmetros ou estatísticas (lembra-se da 
diferença? Se não, revise o item 1.3) pode ser feita através de diversas medidas que são úteis para 
descrever propriedades importantes das populações.
CAPÍTULO 2
28BIOESTATÍSTICA E 
EPIDEMIOLOGIA
2.1.1 Média aritmética simples
A medida de tendência central mais utilizada é a média aritmética simples, muitas vezes 
referida apenas como média. Para facilitar a compreensão e adequarmos nossa linguagem às 
expressões utilizadas em concursos, vestibulares, ENEM e ENADE, vamos indicar os símbolos 
que representam os itens que compõem as fórmulas que usaremos (uma lista completa desses 
símbolos pode ser encontrada no AVA). Cada medidaou variável será representada pela letra X; 
portanto, se medirmos a glicemia de três pessoas para calcularmos a média do índice glicêmico 
desses três indivíduos, as medições seriam X
1
, X
2
 e X
3
. De forma geral, X
i
 indica que o número de 
variáveis é indeterminado, podendo assumir qualquer valor integral, que será igual ao tamanho 
do conjunto de dados (no nosso exemplo, nossas medições vão até X
3
). Falando em tamanho do 
conjunto de dados, a letra “N” (maiúscula) representa o número de variáveis de uma população, 
enquanto a letra “n” (minúscula) representa o número de variáveis de uma amostra. Outro 
símbolo utilizado na fórmula da média é o “∑” (letra grega sigma maiúscula). Por fim, a letra grega 
“µ” (letra grega mu minúscula) representa a média populacional, enquanto o símbolo (leia “x 
barra”) representa a média amostral. 
Ou seja, para obtermos a média, basta somar os valores de todas as variáveis e dividir o 
resultado pelo número de variáveis. Por exemplo, suponha que alguém pretenda descrever a 
média de comprimidos que seus 3 pacientes ingerem por semana, sabendo que o paciente A 
ingere 4 comprimidos, o paciente B ingere 5 comprimidos e o paciente C ingere 6 comprimidos. 
Como já descrito, basta somar os três valores (4 + 5 + 6 = 15) e dividir o resultado pelo número de 
variáveis (N = 3 pacientes); a média aritmética simples para esse conjunto de dados é:
Note que foi utilizado ”, pois estamos considerando que o pesquisador possui apenas 3 
pacientes (portanto, não é uma amostra, mas sim a população). Caso as variáveis fossem obtidas 
de uma amostra (e.g. número de comprimidos dos 3 pacientes mais idosos), apenas deveríamos 
29BIOESTATÍSTICA E 
EPIDEMIOLOGIA
trocar por “ , mas o cálculo e o resultado não mudariam.
Você encontrará exercícios e mais exemplos no Ambiente Virtual de 
Aprendizagem.
2.1.2 Mediana
A mediana é definida com a variável que se encontra no centro de um conjunto ordenado de 
dados. Sendo assim, há exatamente o mesmo número de variáveis que se encontram acima e que 
se encontram abaixo da mediana. Considere as seguintes medições da pressão arterial sistólica, 
em mmHg, de 5 indivíduos que serão submetidos a cirurgias simples no seu consultório: (123, 
144, 112, 156 e 109). Para o cálculo da mediana, primeiramente devemos ordenar (do menor 
para o maior valor) esse conjunto de dados; sendo assim: (109, 112, 123, 144 e 156). Agora é só 
identificar o valor central, ou seja, a mediana desse conjunto de variáveis é igual 123 mmHg. 
Fácil? Infelizmente, não é tudo. Quando o valor de “N” ou “n” (lembra o que significa?) for ímpar, 
como no nosso exemplo (n = 5), sempre existirá UM valor central. 
Contudo, quando “N” for par, não teremos exatamente um valor central. Veja o exemplo 
a seguir: um dentista pretende descrever a mediana do número de cáries de 4 pacientes, que 
possuem respectivamente 2, 5, 3 e 9 cáries. Para isso, ele coloca as medições em ordem (2, 3, 5 e 
9) e verifica que não há somente um valor central, mas sim 2 (3 e 5). Sempre que o valor de “n” 
for um número par, deve-se calcular a média aritmética simples dos dois valores centrais. Nesse 
caso, a mediana é igual a 4 (pois a média entre 3 e 5 é = (3+5) / 2 = 4). A fórmula geral da mediana é:
30BIOESTATÍSTICA E 
EPIDEMIOLOGIA
Note que o resultado da expressão subscrita “(n+1)/2” representa a posição da variável “X”, 
em um conjunto de dados ordenados, que indica o valor da mediana. Retomando o primeiro 
exemplo, temos:
(109, 112, 123, 144 e 156)
X
1 
 X
2 
 X
3 
 X
4 
 X
5
Já para o segundo exemplo:
(2, 3, média X
2
 e X
3
 5, 9)
 X
1 
 X
2 
 X
2,5
 X
3
 X
4 
temos que calcular o valor médio entre X
2
 e X
3 
(X
2,5
), ou seja, 4.
A mediana é uma medida de tendência central muito útil em casos específicos. Por exemplo, 
quando algumas medições não podem ser realizadas por impossibilidade instrumental (e.g. um 
aparelho que não consegue medir valores muito baixos ou muito altos). Observe:
Suponha que um pesquisador mediu o nível de serotonina no lobo frontal de 3 presidiários 
com um instrumento que possibilita o registro de valores a partir de 9 µg (microgramas). No 
primeiro indivíduo, o valor foi de 17 µg, no segundo 11 µg e no terceiro o valor não foi visualizado 
no instrumento, pois ficou abaixo de 9 µg. Sendo assim, os dados foram ordenados (o maior e o menor valor de um conjunto de dados quantitativos. Vamos direto a um exemplo: 
suponha que você queira descrever a amplitude de um conjunto de variáveis formado pela 
frequência cardíaca de 3 bebês, cujas medições foram 122, 154 e 133 batimentos por minuto. A 
fórmula geral e o cálculo para esse exemplo são apresentados a seguir:
Assim como a mediana e o ponto médio (tendência central), a amplitude também pode deixar 
de lado uma parte da informação sobre os dados, pois é calculada a partir de valores extremos 
somente.
2.2.2 Variância
 
Uma maneira de calcular a dispersão utilizando todas as observações é através da medição 
da distância entre cada variável em relação à média do conjunto de variáveis. É exatamente isso 
que o cálculo da variância faz. Contudo, se a média é a medida de tendência central que leva em 
consideração todos os dados e estes se afastam da média tanto para mais como para menos, o 
resultado de qualquer cálculo que leve em consideração a diferença das variáveis em relação à 
média, não seria sempre igual a zero? Vejamos um exemplo. Suponha que você trabalhe em um 
hemocentro e está responsável por verificar a quantidade média de sangue em um conjunto de 
três bolsas. Após medi-las, você constatou que elas possuem respectivamente 110 ml, 120 ml e 
160 ml. Você inicialmente calcula a média, conforme já estudamos:
34BIOESTATÍSTICA E 
EPIDEMIOLOGIA
Em seguida, calcula a diferença entre cada variável e a média do conjunto:
110 – 130 = – 20
120 – 130 = – 10 após, calcule a soma das diferenças 
160 – 130 = + 30
A diferença sempre será igual a zero. Para resolver esse problema, no cálculo da variância, 
cada valor que representa a diferença entre as variáveis e a média do conjunto (no nosso exemplo 
) é elevado ao quadrado. Lembre-se que qualquer número elevado a expoente par, 
torna-se positivo. Antes de partirmos para a fórmula, precisamos compreender mais um conceito. 
A variância populacional é representada pela letra grega “σ2”, enquanto a variância amostral é 
representada pela letra “s2”, assim como acontece no cálculo da média (onde uma letra grega 
representa a média populacional e uma letra latina representa a média amostral). Contudo, no 
caso da variância, o cálculo é ligeiramente diferente, como se observa nas fórmulas:
Retomando nosso exemplo, e considerando que as três bolsas de sangue representam uma 
amostra, acompanhe o cálculo da variância amostral:
Se as três bolsas de sangue medidas fossem as únicas bolsas existentes, teríamos toda a 
população. Nesse caso, perceba a diferença no cálculo da variância populacional:
35BIOESTATÍSTICA E 
EPIDEMIOLOGIA
Note que, por mais estranho que pareça, a unidade da variância ( ) está ao quadrado em 
relação à unidade original (ml). Isso acontece porque elevamos todas as variáveis ao quadrado.
Você encontrará exercícios e mais exemplos no Ambiente Virtual de 
Aprendizagem.
2.2.3 Desvio-padrão
Ufa! A explicação sobre o cálculo da variância foi extensa. Isso se deve porque essa medida 
de dispersão não é tão comum no nosso dia a dia (como a média), nem tão simples (quanto a 
moda ou a amplitude). Porém, se você conseguiu compreender, já estará apto a calcular o 
desvio-padrão, que é a medida de dispersão mais utilizada. O desvio-padrão é simplesmente a 
raiz quadrada da variância. Lembra que no cálculo da variância colocamos todos os dados ao 
quadrado? Então, agora vamos fazer a operação inversa (o inverso da potência é a raiz). Com isso, 
teremos novamente a unidade da medida de dispersão igual à unidade das variáveis. Analise a 
fórmula do desvio-padrão populacional e do desvio-padrão amostral:
ou somente 
Como você já deve ter percebido, o desvio-padrão populacional é representado pela letra grega 
“σ”, enquanto o desvio-padrão amostral é representado pela letra latina “s”.
Vamos continuar no cálculo de medidas de dispersão para as bolsas de sangue. Se você quiser 
36BIOESTATÍSTICA E 
EPIDEMIOLOGIA
descrever a variação dos dados através do desvio-padrão, basta calcular a raiz quadrada da 
variância (aproveitamos os cálculos acima), como segue:
Você encontrará exercícios e mais exemplos no Ambiente Virtual de 
Aprendizagem.
Agora que você sabe melhor o que essa medida de dispersão significa, que tal retornar ao item 
1.4.4.2? Lá você encontrará os parâmetros de dispersão da Curva de Gauss (ou normal) baseados 
no desvio-padrão a partir da média.
2.2.4 Coeficiente de variação
As medidas de variação que estudadas até agora têm magnitudes que são dependentes das 
magnitudes dos dados. A amplitude e o desvio-padrão têm a mesma unidade das variáveis, 
enquanto a variância tem o quadrado da unidade das variáveis. Contudo, algumas vezes nos 
deparamos com conjuntos de variáveis que possuem unidades com escalas diferentes, como por 
exemplo o número de dentes de um adulto e o número de dentes de uma criança. 
Suponha que você queira comparar a variação no número de dentes cariados de um grupo de 
3 adultos com o número de dentes cariados de um grupo de 3 crianças. Para isso, você coletou os 
seguintes dados: adultos (8, 10 e 12 dentes cariados) e crianças (3, 5 e 7 dentes cariados). Como 
você já deve saber, as médias desses dois conjuntos de dados são: e . Calculando o 
desvio-padrão dessas duas amostras, temos:
37BIOESTATÍSTICA E 
EPIDEMIOLOGIA
Em ambos os casos, o valor do desvio-padrão foi igual a dois, o que pode levar um pesquisador 
a acreditar que a dispersão ou variabilidade dos dois grupos foi igual. Contudo, temos que 
lembrar que os grupos têm escalas diferentes, já que o número de dentes na arcada de uma 
criança é menor que o número de dentes na arcada de um adulto (e, principalmente, suas médias 
são diferentes). Quando isso acontece, só poderemos comparar as dispersões ou variabilidades 
utilizando o coeficiente de variação, muitas vezes representado pelas letras CV. Essa medida de 
dispersão é simplesmente a divisão do desvio-padrão do grupo, pela média do mesmo grupo; 
matematicamente:
Outro detalhe importante refere-se à unidade do coeficiente de variação. Como o desvio-
padrão e a média têm a mesma unidade, a divisão entre eles a anula e, portanto, o CV não tem 
unidade. Porém, se quisermos multiplicar seu resultado por 100, teremos uma porcentagem, o 
que pode ser bastante útil para apresentar a variação. Vejamos então, qual dos dois grupos do 
nosso exemplo realmente variou mais.
VAMOS REFLETIR:
Se esses dados fossem verdadeiros, como você explicaria a maior variabilidade 
identificada no grupo das crianças?
38BIOESTATÍSTICA E 
EPIDEMIOLOGIA
2.3 DISTRIBUIÇÃO DE FREQUÊNCIAS 
A distribuição de frequências é uma forma bastante prática e útil de descrever os dados, 
principalmente quando o “n” é muito grande. Essa forma de descrever os dados pode ser 
utilizada para variáveis qualitativas, como podemos observar na seguinte tabela de distribuição 
de frequências:
Tabela 1. Frequências observada e relativa supostas de 200 indivíduos em função do tipo 
sanguíneo.
Tipo sanguíneo 
(classes)
Frequência observada 
(nº de dados por classe)
Frequência relativa 
(total / nº cada classe)
A 10 0,05 ou 5%
B 20 0,1 ou 10%
AB 40 0,2 ou 20%
O 130 0,65 ou 65%
Total 200 1 ou 100%
Fonte: o autor.
Contudo, nesse nosso curso de Bioestatística, estamos mais interessados nas distribuições 
de frequências de dados quantitativos. Porém, dividir as classes em conjuntos com variáveis 
quantitativas exige alguns passos adicionais. Primeiramente, devemos definir o número de classes. 
Há várias sugestões e você, quando for construir uma tabela de distribuição de frequências para 
descrever seus dados em uma pesquisa real, pode escolher a que melhor lhe convier, desde seja 
justificada a escolha. O cálculo mais difundido para determinar o número de classes é a Fórmula 
de Sturges: , onde “k” é o número de classes e “n” o tamanho da amostra. 
Já a sugestão mais simples (e utilizada por autores da nossa bibliografia)é simplesmente . 
Em nossos exemplos e avaliações, utilizaremos esta última fórmula, que apresenta uma ótima 
aproximação da fórmula de Sturges, exceto quando as amostras forem muito grandes ou muito 
pequenas.
Agora que definimos o cálculo do número de classes ( ), precisamos determinar o intervalo 
de cada classe (muitas vezes indicado pela letra “h”). Para isso, não há dúvidas; apenas divida 
a amplitude do conjunto de dados pelo número de classes previamente calculado, ou seja, 
 . Realizados esses passos, basta montarmos nossa tabela de distribuição de 
39BIOESTATÍSTICA E 
EPIDEMIOLOGIA
frequência para variáveis quantitativas.
Vamos a um exemplo. Suponha que um fisioterapeuta tenha coletado dados sobre o número 
de pacientes com escaras em determinado hospital, nos últimos 9 anos e obtido os seguintes 
resultados: (3, 5, 8, 8, 9, 10, 10, 14 e 15). Como já vimos, o número de classes será igual a 3 (
, sendo n = 9); o intervalo de cada classe será igual 4 ( ). A 
primeira classe se inicia pelo menor número do conjunto de dados (3, nesse caso), e tem uma 
amplitude de classe igual a 4, conforme h calculado. Portanto, a primeira classe vai de 3 (limite 
inferior) até 7 (que é o resultado de 3 + 4, e que é seu limite superior). A segunda classe se inicia 
com o limite superior da primeira classe (7) e termina em 11 (7 + 4). Por fim, a última classe se 
inicia com o limite superior da segunda classe (11), indo até 15 (11 + 4). Relembrando, o conjunto 
das variáveis é (3, 5, 8, 8, 9, 10, 10, 14 e 15). O profissional já tem os parâmetros necessários para 
preencher a tabela de distribuição de frequências, que ficaria assim:
Tabela 2. Tabela de distribuição de frequências do número de pacientes com escaras em um 
hospital nos últimos 9 anos (dados fictícios).
Classes 
(k)
Limite inf. ; Limite sup. (intervalo de 
classe: h)
Frequência observada
(F
i
)
C1 2
C2 5
 C3 2
Fonte: o autor.
Vamos relembrar as notações do intervalo de classe que aprendemos no 
ensino médio. Os colchetes fechados indicam que o intervalo começa ou termina 
no número grafado dentro dele, enquanto o colchete aberto indica o limite, 
excluindo o próprio número grafado. Sendo assim, no exemplo acima, o intervalo 
 indica que, se houver um número 3 no conjunto de dados, ele deve ser computado nesta 
classe (colchete fechado), mas se houver um número 7, não (colchete aberto).
Outra consideração importante, refere-se às informações adicionais em uma tabela de 
distribuição de frequência. Muitas vezes, você irá se deparar com a frequência relativa (assim 
como no exemplo das variáveis qualitativas acima), que nada mais é do que a porcentagem das 
observações em cada classe, e a frequência acumulada, que, como o próprio nome diz, é a soma 
das observações da classe com as observações das classes anteriores.
40BIOESTATÍSTICA E 
EPIDEMIOLOGIA
2.3.1 Representações gráficas da distribuição de frequência
Lembre-se que as distribuições de frequência são úteis principalmente quando coletamos 
e descrevemos grandes quantidades de dados (apesar de que, para fins didáticos, utilizamos 
conjuntos pequenos em nossos exemplos). A partir das tabelas de distribuição de frequência que 
acabamos de aprender a montar, podemos apresentar os dados através de gráficos adequados a 
esse tipo de informação. O principal tipo de gráfico de distribuição de frequência é o histograma, 
que nada mais é do que um gráfico de colunas, onde no eixo x (horizontal) estão indicadas as 
classes e no eixo y (vertical) estão indicadas as frequências observadas. O outro tipo de gráfico é 
o polígono de frequências, que é um gráfico de linhas de uma tabela de frequências, que se inicia 
e termina no zero, passando necessariamente pelos pontos representados pelas frequências 
observadas. Tendo como base o exemplo anterior, um histograma e um polígono de frequências 
seriam plotados assim:
Figura 3. Histograma e polígono de frequências referentes ao número de pacientes com escaras em um hospital nos 
últimos 9 anos (dados fictícios).
Fonte: o autor.
2.4 RELAÇÕES ENTRE DUAS VARIÁVEIS
A descrição das relações entre variáveis pode fornecer informações importantes sobre as 
características dos dados. Em nosso curso, estudaremos apenas as técnicas que consideram 
relações entre duas variáveis. Contudo, ressaltamos que há outros procedimentos que consideram 
que, para fins didáticos, utilizamos conjuntos pequenos em nossos exemplos). A 
(horizontal) estão indicadas as classes e no eixo (vertical) estão indicadas as 
 
 
 
 
 
 
 
 
 
 
em um hospital nos últimos 9 anos (dados fictícios).
 
0
1
2
3
4
5
C1 C2 C3
Nú
m
er
o 
de
 o
bs
er
va
çõ
es
Classes
Histograma do número de 
escaras nos últimos 9 
anos
0
1
2
3
4
5
C1 C2 C3
Nú
m
er
o 
de
 o
bs
er
va
çõ
es
Classes
Polígono de frequência 
do número de escaras 
nos últimos 9 anos
41BIOESTATÍSTICA E 
EPIDEMIOLOGIA
a relação entre mais de duas variáveis, como a correlação e a regressão múltiplas.
Você já deve ter ouvido falar em características que variam de acordo com a variação de outras 
características como, por exemplo, que o peso de uma pessoa está relacionado à sua altura ou que 
a quantidade de cigarros que uma pessoa fuma por dia está relacionada com a probabilidade que 
essa pessoa tem de desenvolver câncer de pulmão, entre muitas outros.
Essa relação entre as variáveis pode ser de dependência de uma sobre a outra. Nesse caso, 
utilizaremos as técnicas de regressão linear simples para descrever o grau e a direção das variações 
dos dados. Contudo, há casos em que a relação entre as variáveis não é estabelecida por uma 
dependência. Quando isso ocorre, devemos utilizar as técnicas de correlação linear simples para 
descrever o grau e a porcentagem de variação em comum dos dois conjuntos de variáveis. Ainda 
que as duas técnicas procurem descrever a relação linear entre duas variáveis, você já começa a 
perceber a diferença entre regressão e correlação. Então vamos nos aprofundar mais um pouco.
2.4.1 Regressão linear simples
Quando a relação entre duas variáveis apresenta uma dependência funcional de uma sobre 
a outra, podemos usar a regressão simples para descrever essa relação ou mesmo estimar ou 
interpolar medições. Nesses casos, a magnitude de uma das variáveis (chamada de variável 
dependente) é determinada pela magnitude de outra variável (que chamamos de independente), 
enquanto o contrário não é verdadeiro. Por isso, na regressão é essencial sabermos determinar 
qual é a variável dependente e qual é a variável independente. Por exemplo, considerando que 
haja uma relação entre a pressão arterial e a idade em humanos, qual das variáveis você acha que 
é a independente, ou seja, a que determina a variação da outra? É claro que a idade é a variável 
independente, pois sua magnitude impõe uma variação na magnitude da pressão arterial, 
enquanto o contrário não é verdadeiro. Não seria lógico supormos que uma pressão arterial 
alta ou baixa determine a idade de uma pessoa, certo? Também é claro que, apesar de não ser 
o único fator, podemos facilmente considerar a idade um dos fatores determinantes da pressão 
arterial. Uma maneira simples e conveniente de descrever as relações entre variáveis é através de 
um gráfico de dispersão (também conhecido como scatter plot). Vejamos um exemplo: imagine 
que a Tabela 3 contém informação sobre a medição da pressão arterial sistólica de 4 pessoas, 
juntamente com suas idades.
42BIOESTATÍSTICA E 
EPIDEMIOLOGIA
Tabela 3. Pressão arterial sistólica e idades supostas de 4 pessoas.
Pressão arterial sistólica (em mmHg) Idade (em anos)
120 28
145 45
140 40
170 65
Fonte: o autor.
Uma forma bastante informativa é plotar os dados da variável dependente no eixo Y do gráfico 
(vertical) e os dados da variável independente no eixo X (horizontal). Sendo assim,
Figura 4. Gráfico de dispersão de valores de pressão arterial sistólica em função da idadeem transmissão direta (por contato direto ou 
propagação de gotículas) e indireta (transportada pelo ar, por veículos ou vetores mecânicos e 
biológicos).
Na transmissão direta, um agente infeccioso é transferido de um reservatório para um 
hospedeiro susceptível por contato direto ou propagação de gotículas. O contato direto ocorre 
através do contato de pele com pele, beijo ou relações sexuais. O contato direto também se 
refere ao contato com o solo ou vegetação que abrigam organismos infecciosos. Por exemplo, 
a mononucleose infecciosa (conhecida como doença do beijo) e a gonorreia são disseminadas 
de pessoa para pessoa por contato direto, enquanto a ancilostomíase (vermes) é espalhada pelo 
contato direto com solo contaminado. Outra forma de transmissão direta é a dissipação de 
gotículas ou aerossóis de curto alcance, produzidos por espirros, tosse ou até mesmo conversação. 
A coqueluche e a infecção meningocócica são exemplos de doenças transmitidas de um doente 
infeccioso a um hospedeiro susceptível por disseminação de gotículas.
A transmissão indireta ocorre quando há transferência de um agente infeccioso de um 
reservatório para um hospedeiro por partículas de ar suspensas (diferentemente da transmissão 
direta por gotículas de curto alcance), veículos (objetos inanimados) ou vetores (intermediários 
vivos). A transmissão pelo ar ocorre quando os agentes infecciosos são transportados por núcleos 
de pó ou gotículas suspensas no ar. A poeira transportada pelo ar inclui material que se assentou 
em superfícies e novamente se tornou suspenso por correntes de ar, bem como partículas 
contendo agente transmissor sopradas pelo vento. Pequenas gotículas, de tamanho inferior a 
5 micrômetros, podem permanecer suspensas no ar por longos períodos, bem como podem ser 
sopradas a longas distância, em contraste com as gotículas de curto alcance (transmissão direta). 
Os veículos que podem transmitir indiretamente um agente infeccioso incluem alimentos, água, 
produtos biológicos (sangue) e fômites (objetos inanimados, como lenços, cama ou bisturis 
cirúrgicos). Um veículo pode transportar passivamente um patógeno, como acontece com o 
vírus da Hepatite A, ou o veículo pode propiciar um ambiente adequado para o crescimento e 
multiplicação do agente que produz toxina, como acontece em produtos enlatados contaminados 
com Clostridium botulinum (toxina botulínica).
Vetores são organismos vivos, tais como mosquitos e artrópodes, que podem transportar um 
agente infeccioso através de meios puramente mecânicos ou podem permitir a manutenção e 
reprodução desse agente. São exemplos de transmissão mecânica moscas carregando Shigella 
em seus apêndices e pulgas de ratos carregando Yersinia pestis (peste) em seu intestino. Na 
transmissão biológica, o agente causador geralmente sofre maturação em um hospedeiro 
intermediário, antes de ser transmitido ao homem, como ocorre com a malária.
Fômite: objeto 
inanimado capaz 
de absorver 
e transportar 
agentes 
infecciosos.
103BIOESTATÍSTICA E 
EPIDEMIOLOGIA
7.2.3 Entrada do agente no hospedeiro
O portal de entrada refere-se à maneira pela qual um patógeno entra num hospedeiro 
susceptível. Esse portal deve permitir acesso aos tecidos nos quais o patógeno irá se multiplicar 
ou onde a toxina poderá agir. Os agentes infecciosos podem se utilizar do mesmo portal de 
entrada e saída, como por exemplo o vírus da gripe, que sai do trato respiratório do hospedeiro de 
origem e entra no trato respiratório de um novo hospedeiro, ou utilizar portais diferentes, como 
por exemplo os muitos patógenos que causam gastroenterite seguem a chamada rota “fecal-oral” 
porque saem do hospedeiro-fonte nas fezes, são levados em mãos inadequadamente lavadas para 
um veículo, como comida, água ou utensílios, e entram em um novo hospedeiro através da boca. 
Outros portais de entrada incluem a pele (ancilostomíase), mucosas (sífilis) e sangue (Hepatite B, 
vírus da AIDS).
7.2.4 Hospedeiro suscetível
A ligação final na cadeia de infecção é um hospedeiro susceptível. A susceptibilidade de 
um hospedeiro depende de fatores genéticos ou estruturais do indivíduo, assim como da sua 
imunidade específica e outros fatores que afetam a capacidade do hospedeiro definitivo em 
resistir à infecção ou limitar a patogenicidade. A composição genética de um indivíduo pode 
aumentar ou diminuir a suscetibilidade. Um exemplo clássico é o de pessoas com traço de 
anemia falciforme, que estão protegidas contra um determinado tipo de malária. Já a imunidade 
específica refere-se a anticorpos protetores que são direcionados contra um agente específico. 
Esses anticorpos podem se desenvolver em resposta a infecção prévia, a uma vacina ou a uma 
toxina que foi desativada, mas mantém a sua capacidade para estimular a produção de anticorpos 
ou ainda por transferência da placenta da mãe para o feto. Outros fatores não específicos que 
defendem contra infecção incluem a pele, membranas mucosas, acidez gástrica, cílios no trato 
respiratório, o reflexo da tosse e resposta imune inespecífica. Por outro lado, alguns fatores 
podem aumentar a suscetibilidade à infecção por perturbar as defesas do hospedeiro, tais como 
desnutrição, alcoolismo e doença ou terapia que prejudica a resposta imunológica inespecífica, 
como a quimioterapia.
104BIOESTATÍSTICA E 
EPIDEMIOLOGIA
7.2.5 Implicações para a saúde pública
O conhecimento das vias de saída e entrada dos patógenos, bem como dos seus modos de 
transmissão fornece uma base para a determinação de medidas de controle apropriadas. Essas 
intervenções dependem da dinâmica da infecção e são direcionadas para controlar ou eliminar o 
agente na fonte de transmissão, proteger vias de entrada ou aumentar as defesas do hospedeiro. 
Para algumas doenças, a intervenção mais adequada pode ser dirigida para controlar ou 
eliminar o agente na sua fonte, como por exemplo, quando um paciente com doença transmissível 
é tratado com antibióticos ou quando o solo é descontaminado ou isolado para evitar a dispersão 
do agente. 
Outras intervenções são direcionadas para o modo de transmissão, como acontece quando 
um paciente infectado é isolado ou há a recomendação de evitar um tipo específico de contato 
associado ao modo de transmissão, como aconteceu há alguns anos com a água benta que 
transmitia H1N1 em igrejas católicas. A transmissão de agentes por veículos inanimados pode 
ser interrompida pela eliminação ou descontaminação do objeto, enquanto que, para evitar a 
transmissão fecal-oral, os esforços às vezes se concentram em reorganizar o ambiente para reduzir 
o risco de contaminação no futuro e em mudar comportamentos, como o incentivo para que os 
indivíduos lavem as mãos. Para doenças cujos agentes são transportados pelo ar, as estratégias 
podem ser direcionadas para modificação da ventilação ou da pressão do ar, além de filtragem 
e tratamento do ar. Por fim, para interromper a transmissão por vetores, as medidas podem ser 
dirigidas para o controle da população desses vetores, tal como a pulverização de inseticidas para 
reduzir a população de mosquitos.
Algumas estratégias que protegem os portais de entrada são simples e eficazes. Por exemplo, 
mosqueteiros, repelentes e utilização de blusas e calças compridas para evitar picadas de 
mosquitos que transmitem doenças ou uso de máscara e luvas, que se destinam a proteger o 
dentista do sangue e outras secreções de um paciente, bem como para proteger o paciente do 
dentista.
Outras intervenções priorizam o aumento das defesas do hospedeiro, como o uso profilático 
de medicamentos antimaláricos, recomendado para visitantes de áreas endêmicas de malária, 
que não previne a exposição por picadas de mosquito, mas evita que a infecção se estabeleça, 
ou o uso de vacinas, que promovem o desenvolvimento de anticorpos específicos que protegem 
contra a infecção. Em relação às vacinas, um conceito importante é o da imunidade de rebanho, 
oqual sugere que, se uma proporção suficientemente alta de indivíduos em uma população é 
105BIOESTATÍSTICA E 
EPIDEMIOLOGIA
resistente a um agente, então os poucos suscetíveis serão protegidos pela maioria resistente, 
uma vez que o patógeno dificilmente encontrará um hospedeiro suscetível. A porcentagem 
da população necessária para adquirir a imunidade de rebanho com a finalidade de prevenir 
ou interromper um surto ou epidemia varia de acordo com a doença. Um perigo associado a 
esse conceito é que, em populações altamente imunizadas, as poucas pessoas suscetíveis são 
frequentemente agrupadas em subgrupos definidos por fatores socioeconômicos ou culturais. 
Se o patógeno for introduzido em um desses subgrupos, pode ocorrer um surto ou epidemia. Na 
prática, a imunidade de rebanho não impediu surtos de sarampo e rubéola em populações com 
níveis de imunização tão elevados como 85% e 90% nos Estados Unidos nas últimas décadas. 
7.3 – EPIDEMIOLOGIA DAS DOENÇAS NÃO-INFECCIOSAS
No início da Epidemiologia, o único foco de investigação eram as doenças infecciosas, 
que eram a causa de elevadas taxas de morbidade e mortalidade. Contudo, após a revolução 
científica nas Ciências da Saúde, ocorreu o controle desse tipo de doença. Essa revolução inclui 
o uso generalizado de antibióticos e vacinas, o controle eficiente de vetores, a descontaminação 
eficiente de veículos, entre outras medidas que promoveram o aumento da expectativa de 
vida no mundo inteiro. Por outro lado, houve um incremento na incidência e prevalência de 
doenças não-infecciosas, tais como diabetes, obesidade e traumas, a ponto de transformar essas 
doenças em causa principal de mortalidade em quase todos os países, com raras exceções na 
África subsaariana. No Brasil, o aumento da violência e de acidentes de trânsito contribuiu ainda 
mais para que houvesse a transição epidemiológica, que é a substituição da principal causa de 
mortalidade, que antes era relacionada às doenças infecciosas, para doenças não-infecciosas. 
Para termos uma ideia da dimensão dessa alteração, em 1930, 45,6% das mortes nas capitais dos 
estados brasileiros foram em decorrência de doenças infecciosas e parasitárias; em 2010, esse 
número foi de apenas 4,6%. 
7.3.1 Características das doenças não-infecciosas
Como vimos, as doenças e agravos não-transmissíveis (DANT) ou não-infecciosas 
Transição 
epidemiológica: 
mudança no 
perfil de morbi-
mortalidade
106BIOESTATÍSTICA E 
EPIDEMIOLOGIA
compreendem todas aquelas que não são adquiridas por contato com um agente infeccioso 
causador de doenças, nem por vetores ou veículos que o carregam, tampouco por contato com 
pessoas infectadas. Esse grupo inclui uma variedade de agravos à saúde e tem grande repercussão 
nos índices de saúde de qualquer país, inclusive no Brasil. Entre as características das DANT, 
podemos citar um longo período de latência, com poucos ou nenhum sintoma. Além disso, a 
evolução da doença é lenta, prolongada e permanente, com manifestações clínicas acontecendo 
nos períodos de exacerbação e remissão. Em geral, as lesões celulares são irreversíveis, com 
evolução para variados graus de incapacidade e morte. A seguir, vamos abordar alguns preceitos 
básicos das principais DANT.
7.3.2 Doenças cardiovasculares
As doenças cardiovasculares, tais como infarto agudo do miocárdio (1º lugar) e acidente 
vascular cerebral (2º lugar) são, de longe, a principal causa de morte nos países ocidentais, 
incluindo o Brasil. Para esse grupo de doenças, o gênero é um fator preditivo bastante importante, 
pois as taxas de mortalidade são maiores em homens do que em mulheres em todas as faixas 
etárias. 
Os principais fatores de risco para essas doenças são relacionados ao estilo de vida e incluem 
a pressão arterial e o colesterol elevados, uso de tabaco e obesidade. Indivíduos que apresentam 
em conjunto os três fatores, têm uma probabilidade 20 vezes maior de ser acometido por uma 
doença cardiovascular.
7.3.3 Câncer
O que comumente chamamos de câncer, é representado por um conjunto de mais de 50 
doenças relacionadas, que são responsáveis pela segunda causa de morte no planeta. A difusão 
do teste de Papanicolau, aliado à redução no uso de cigarro e à vacinação contra o vírus do 
papiloma humano (HPV) são fatores responsáveis pela redução do número de diagnósticos 
de câncer no mundo todo. Contudo, o aumento da idade tem contribuído para uma maior 
107BIOESTATÍSTICA E 
EPIDEMIOLOGIA
prevalência, principalmente entre os indivíduos mais idosos. Aproximadamente metade dos 
homens e um terço das mulheres terão câncer ao longo da vida. Outro aspecto epidemiológico 
importante é a redução de mortalidade para alguns tipos de doença, como o câncer de estômago 
(- 35%) e o câncer cervical (- 29%); alguns tipos, como o câncer de pulmão em mulheres, não tem 
apresentado nenhuma redução. Já os tipos que mais causam mortes são, em ordem decrescente: 
câncer de pulmão, de estômago e de fígado.
Os fatores de risco para a doença são evitáveis, o que torna a prevenção uma ótima estratégia 
para redução dos danos relacionados. Entre esses fatores estão o uso de cigarro e álcool, prática 
sexual sem proteção, poluição, dieta (assim como obesidade) e infecções. Em relação às infecções, 
18% dos cânceres no mundo são decorrentes da exposição a vírus, como o HPV, a bactérias, como 
o H. pylori, e a parasitas.
7.3.4 Causas externas
Um grupo de ameaças à saúde da população tem se destacado, principalmente em países em 
desenvolvimento, como o Brasil. Entre causas externas estão incluídas aquelas relacionadas à 
violência e aos acidentes de trânsito (ambos os fatores são endêmicos no Brasil). Enquanto 
agravos à saúde desse tipo têm diminuído sua prevalência em países desenvolvidos, como 
a Suécia e o Japão, países em desenvolvimento sofrem com epidemias de violência. No Brasil, 
aproximadamente 100.000 pessoas por ano morrem em decorrência apenas de acidentes 
de trânsito e crimes violentos (valor que provavelmente está subvalorizado devido à falta de 
estatísticas adequadas).
Os fatores de risco para crimes violentos não são específicos e, às vezes, difíceis de serem 
identificados. Em geral, são considerados fatores de risco a desigualdade social, a baixa 
escolaridade e a cultura (das 100 cidades mais violentas do mundo, aproximadamente 90 estão 
na América Latina). Já para os agravos decorrentes de acidentes de trânsito, os fatores de risco são: 
infraestrutura de trânsito deficiente, baixa tecnologia dos veículos mais vendidos (populares), 
excesso de velocidade, uso de celulares e ingestão de álcool e outras drogas antes de dirigir.
108BIOESTATÍSTICA E 
EPIDEMIOLOGIA
7.4 CONSIDERAÇÕES FINAIS DO CAPÍTULO 7
Neste último capítulo do nosso caderno estudamos o processo epidêmico que ocorre a partir 
da interação entre os fatores que causam a doença e determina, entre outras coisas, a distribuição 
e a frequência dos agravos à saúde. Em relação a essa distribuição, vimos que uma enfermidade 
constantemente presente em uma determinada prevalência e região caracteriza uma endemia. Já 
o início de uma doença em uma população, é chamado de surto. Quando a enfermidade atinge 
um número maior que o esperado ao acaso para uma população específica, temos a epidemia 
(que, quando se espalha para vários países ou continentes, torna-se uma pandemia).
Outro fator que determina a dinâmica do processo epidêmico é o tipo de agente causador 
da doença. Por isso, também estudamos no capítulo 7 as características das doenças infecciosas 
e não-infecciosas. Em relação às doenças infecciosas, aprendemos que a transmissão ocorre 
quando o agente causador deixa o reservatório por meio de uma via de saída, é transportado 
através de um meio de transmissão e entra no hospedeiro suscetível para infectá-lo. Os 
reservatórios incluem animais não humanos (zoonoses), o meio ambiente (plantas, solo e 
água) ou portadores humanos (que podem ser assintomáticos,de incubação, convalescentes ou 
crônicos). A transmissão do agente infeccioso a partir do reservatório pode ser direta (contato 
direto ou propagação de gotículas) ou indireta (vetores mecânicos ou biológicos, transportados 
pelo ar ou outros veículos). Ao alcançar o hospedeiro suscetível, o patógeno pode entrar por 
uma via que o possibilite acessar tecidos onde ele irá se multiplicar ou agir e provocar a doença, 
dependo das condições de imunidade, genética e estrutural do indivíduo. O conhecimento da 
cadeia de infecção é a base para a adoção de medidas de controle, que podem ser direcionadas 
para controlar ou eliminar o agente na fonte de transmissão (e.g. descontaminação de solo, uso 
de antibióticos), proteger vias de entrada (e.g. uso de máscaras e luvas) ou aumentar as defesas 
do hospedeiro (e.g. uso de vacinas).
Nas últimas décadas, quase todos os países experimentaram uma transição epidemiológica 
pois, com algumas raras exceções na África subsaariana, todos os países têm doenças não-
infecciosas como causas principais de mortalidade, ao contrário do que ocorria no início da 
Epidemiologia. Essas doenças têm como características longos períodos de latência, com poucos 
sintomas e evolução lenta, em geral. Contudo, as doenças não-infecciosas representam um 
grupo variado de agravos à saúde e, por esta razão, decidimos abordar algumas características 
específicas das principais enfermidades desse tipo. Isoladamente, a primeira causa de morte 
na maior parte das populações, incluindo a brasileira, é a doença cardiovascular (infarto agudo 
do miocárdio, acidente vascular cerebral, entre outras), que acomete mais os homens do que 
as mulheres e tem como fatores de risco colesterol e pressão arterial elevados, uso de tabaco e 
109BIOESTATÍSTICA E 
EPIDEMIOLOGIA
obesidade. Os cânceres também estão entre as principais causas de morte no mundo inteiro e 
acometem mais idosos do que jovens e têm como fatores de risco o uso do tabaco e do álcool, 
infecções (parasitas, HPV, H. pylori e outras bactérias), prática sexual sem proteção, poluição e má 
alimentação. Por fim, discutimos um grupo de agravos à saúde que tem acometido principalmente 
países em desenvolvimento, consumindo uma parcela significativa dos recursos da saúde, que 
são as causas externas, representadas por acidentes (como os de trânsito, cujos fatores de risco 
são infraestrutura ineficiente, excesso de velocidade, entre outros) e violência (como homicídios, 
cujos fatores de risco podem ser desigualdade social, baixa escolaridade e cultura).
 Chegamos ao final do nosso caderno de estudos e eu gostaria de parabenizar sua dedicação, 
que é um atributo essencial para que seja alcançada uma aprendizagem significativa. Essa 
aprendizagem certamente contribuirá para que você se torne um profissional de Saúde apto a ser 
um agente transformador da nossa sociedade.
110BIOESTATÍSTICA E 
EPIDEMIOLOGIA
ALMEIDA FILHO, N.; ROUQUAYROL, M.Z. Introdução à epidemiologia. 4.ed.,rev. e ampliada. 
Rio de Janeiro: Guanabara Koogan, 2013.
BEAGLEHOLE, R. et al. Epidemiologia básica. São Paulo: Santos, 2010.
BUSSAB, W.O.; MORETTIN, P.A. Métodos quantitativos: estatística básica. São Paulo: Editora 
Atual, 1987.
CALLEGARI-JACQUES, S.M. Bioestatística: princípios e aplicações. Porto Alegre: Artemed, 
2003.
GREENLAND, S.; LASH, T.L.; ROTHMAN, K.J. Epidemiologia moderna. Porto Alegre: Artmed, 
2011.
KATZ, D.L.; ELMORE, J.G.; JEKEL, J.F. Epidemiologia, bioestatística e medicina. Porto Alegre: 
Artmed, 2005.
LEAVELL, H.; CLARK, E.G. Medicina preventiva. São Paulo: McGraw–Hill do Brasil, 1976.
RODRIGUES, V.P. et al. Conceitos e ferramentas de epidemiologia. São Luís: UFMA – 
UNASUS, 2014. Disponível em < https://ares.unasus.gov.br/acervo/handle/ARES/1109>, acesso 
em: 02 fev 2017.
ZAR, J.H. Biostatistical analysis. 5 ed. New Jersey: Prentice Hall, 2010.
REFERÊNCIAS BIBLIOGRÁFICAS
111BIOESTATÍSTICA E 
EPIDEMIOLOGIA
IPCC. Climate Change 2001: The Scientific Basis. Contribution of Working Group I to the Third 
Assessment Report of the Intergovernmental Panel on Climate Change. Cambridge, United 
Kingdom, and New York, United States, Cambridge University Press ISDR (1999), 2001.
I
PCC. Future Work of the IPCC: Chairman’s Vision Paper on the Future of the IPCC. IPCC, 2015.
LIMA, G. F. C. Educação ambiental e mudança climática: convivendo em contextos de incerteza e 
complexidade. Ambiente & Educação . v. 18, 2013.
LOURENÇO-DE-OLIVEIRA R.; et al. Aedes aegypti in Brazil: Genetically differentiated populations with 
high susceptibility to dengue and yellow fever viruses. Trans R Soc Trop Med Hyg. v. 98, n.1, p.43–54, 
2004.
MARCELINO, E. V. Desastres naturais e geotecnologias: conceitos básicos. Santa Maria, RS: INPE, 
2007.
MARENGO, J. A. Mudanças climáticas globais e seus efeitos sobre a biodiversidade: caracterização 
do clima atual e definição das alterações climáticas para o território brasileiro ao longo do século 
XXI. Brasília: MMA, 2006.
MELLO, L. L. Charges e cartuns sobre aquecimento global. 2014. Disponível em: <https://
pucsustentabilidade.wordpress.com/2014/10/02/charges-e-cartuns-sobre-aquecimento-global/> 
Acesso em: 09, jan. 2017.
MENDONÇA, F. Aspectos da interação clima-ambiente-saúde humana: da relação sociedade-natureza 
à (in) sustentabilidade ambiental. RA’E GA–O espaço geográfico em análise, v.4, n.4, p.85-100, 2000.
MILLER, B R.; BALLINGER, M. E. Aedes albopictus mosquitoes introduced into Brazil: vector competence 
for yellow fever and dengue viruses. Trans R Soc Trop Med Hyg. v.82, n.3, p. 476–7, 1988.
112BIOESTATÍSTICA E 
EPIDEMIOLOGIA
MONTEIRO, A. L.; BERTAGNI, R. F. S. Acidentes do Trabalho e Doenças Ocupacionais. Saraiva: São 
Paulo, ed. 7, 2012.
MONTERO, R. 2007. Poluição, Cubatão - SP. Disponível em: <http://www.pbase.com/rickmoon/
image/157229622/original> Acesso em: 09, jan. 2017.
MORAIS, C. R. Dicionário de Saúde e Segurança no trabalho e Meio Ambiente. São Caetano do Sul: 
Yendis, 2011.
MOUSINHO, P. Glossário. In: Trigueiro, A. (Coord.) Meio ambiente no século 21. Rio de Janeiro: Sextante. 
2003.
NARDOCCI, A. C.; et al. Poluição do ar e doenças respiratórias e cardiovasculares: estudo de séries 
temporais em Cubatão, São Paulo, Brasil. Cadernos de Saúde Pública, v. 29, n. 9, p. 1867-1876, 2013.
NICOLUSSI, F. H.; et al. Poluição do ar e doenças respiratórias alérgicas em escolares. Revista de Saúde 
Pública, v. 48, n. 2, p. 326-330, 2014.
NOGUEIRA, D. P. Incorporação da saúde ocupacional à rede primária de saúde. Revista de saúde 
pública, v. 18, n. 6, p. 495-509, 1984.
NUNES, T. Como a dengue é transmitida. 2016. Disponível em: <http://pontobiologia.com.br/como-a-
dengue-e-transmitida/> Acesso em: 09 jan. 2017.
O DIA. Polipílula combate hipertensão e colesterol. 2011. Disponível em: <http://odia.ig.com.br/
portal/cienciaesaude/polip%C3%ADlula-combate-hipertens%C3%A3o-e-colesterol-1.60707> Acesso 
em: 09 jan. 2017.
O GLOBO. Entenda o acidente. 2015. Disponível em: < http://infograficos.oglobo.globo.com/brasil/
entenda-o-acidente.html> Acesso em: 09, jan. 2017.
113BIOESTATÍSTICA E 
EPIDEMIOLOGIA
ODUM, E. P. Ecologia. Rio de Janeiro: Editora Guanabara, 1986.
OLIVEIRA, M. V. C.� CARVALHO, A. R. Princípios Básicos do Saneamento do Meio. São Paulo: SENAC, 
2010.
ORGANIZAÇÃO MUNDIAL DA SAÚDE. Constituição da Organização Mundial da Saúde. 
Nova Iorque, 1946. Disponível em: <http://www.direitoshumanos.usp.br/index.php/OMS-
Organiza%C3%A7%C3%A3o-Mundial-da-Sa%C3%BAde/constituicao-da-organizacao-mundial-da-
saude-omswho.html> Acesso em: 09 jan. 2017.
ORGANIZAÇÃO MUNDIAL DA SAÚDE. Dengue hemorrágica: diagnóstico, tratamento, prevenção e 
controle. ed. 2, São Paulo; 2001.
ORGANIZAÇÃO MUNDIAL DA SAÚDE. Substâncias químicas perigosas à saúde e ao ambiente. São 
Paulo: Cultura Acadêmica, 2008.
ORGANIZACIÓN PANAMERICANA DE LA SALUD. Dengue y dengue hemorrágico em las Américas, 
guias para su prevención y controle.Publicacion Científica nº 548, Washington; 2002.
PATZ, J. A., et al. Impact of regional climate change on human health. Nature, v. 438, n.7066, p. 310-317, 
2005.
PEGORIM, J. O que é El Niño? 2016. Disponível em: < http://www.climatempo.com.br/noticia/2016/01/11/
o-que-e-o-el-nino--4068> Acesso em: 09 jan. 2017.
PEREIRA, S. D. Conceitos e definições da Saúde e Epidemiologia usados na Vigilância Sanitária. 
Governo do estado de São Paulo, março de 2007.
RAU, K. (2012). Ocorrência de Equilíbrio Sustentável. Disponível em: <http://sustentabilidade-
114BIOESTATÍSTICA E 
EPIDEMIOLOGIA
tecnologica.blogspot.com.br/> Acesso em: 08, jan. 2017.
RENGIFO CUELLER H. Conceptualización de la saludambiental: teoría y práctica (parte 1). Rev Perú 
MedExp Salud Publica, v. 25, n.4, p.403-409, 2008.
RENGIFO CUELLER H. Conceptualización de la saludambiental: teoría y práctica (parte 2). Rev Perú 
MedExp Salud Publica, v.26, n.1, p.66-73, 2009.
RIBAS, P. P., MATSUMURA, A. T. S. A química dos agrotóxicos: impacto sobre a saúde e meio ambiente. 
Revista Liberato, v. 10, n. 14, p. 149-158, 2009.
RIBEIRO, M. D., et al. Estudo descritivo da ocorrência de dengue e suas relações com o clima e a ação da 
vigilância em saúde no município de Franca, São Paulo, Brasil, 2007 a 2011. Investigação, v.14, n. 1, 2015.
RICKLEFS, R. E. A Economia da Natureza. Rio de Janeiro: Guanabara-Koogan, 5 ed., 2003.
ROCHA, H. Natal inicia Campanha de Vacinação contra raiva em cães e gatos. 
2016. Disponível em: <http://hdviu.blogspot.com.br/2016/08/natal-inicia-campanha-de-
vacinacao.html> Acesso em: 09 jan.,2017.
ROUQUAYROL, Maria Zélia; ALMEIDA FILHO, Naomar de. Epidemiologia e Saúde. 
7. ed. Rio de Janeiro: MedBook, 2013.
SCHLICKMANN, F. Fotos antigas de Balneário Camboriú. 2011. Disponível em: 
<http://praiadecamboriu.blogspot.com.br/2011/04/fotos-antigas-de-balneario-
camboriu-11.html> Acesso em: 08 jan. 2017.
115BIOESTATÍSTICA E 
EPIDEMIOLOGIA
SEMA. Secretaria do Meio Ambiente. O que são políticas públicas. Disponível em: 
<http://www.meioambiente.pr.gov.br/arquivos/File/coea/pncpr/O_que_sao_
PoliticasPublicas.pdf >. Acesso em: 07 jan. 2017.
SILVA JÚNIOR, J. L. R.; et al. Efeito da sazonalidade climática na ocorrência de sintomas
respiratórios em uma cidade de clima tropical. Jornal Brasileiro de Pneumologia, 
v. 37, n.6, p. 759-767, 2011.
SILVA, I. Fenômeno La Niña pode trazer chuvas ao sertão do Nordeste. 2016. 
Disponível em: <http://radiojornal.ne10.uol.com.br/noticia/2016/06/08/fenomeno-
la-nina-pode-trazer-chuvas-ao-sertao-do-nordeste-47042> Acesso em: 09 jan. 2017.
SULEIDE. Governo de Goiás. Goiânia, Césio, 137. 2012. Disponível em: 
<http://www.cesio137goiania.go.gov.br/index.php> Acesso em: 09 jan. 2017.
SUPERINTERESSANTE. As grandes epidemias ao longo da história. 2004. 
Disponível em: < http://super.abril.com.br/saude/as-grandes-epidemias-ao-longo-
da-historia/ > Acesso em: 09 jan. 2017.
TAUIL, P. L. Urbanização e ecologia da dengue. Cadernos de Saúde Pública, n.17, p.99-
102, 2001.
TEIXEIRA, J. C., et al. Estudo do impacto das deficiências de saneamento básico sobre a saúde 
publica no Brasil no período de 2001 a 2009. Eng. sanit. ambient, v. 19, n. 1, p. 87-96, 2014.
116BIOESTATÍSTICA E 
EPIDEMIOLOGIA
TOLEDO, K. Quinto relatório do IPCC mostra intensificação das mudanças 
climáticas. Agência FAPESP. 2013. Disponível em: <http://agencia.fapesp.br/quinto_
relatorio_do_ipcc_mostra_intensificacao_das_mudancas_climaticas/17944/> Acesso em: 
09 jan. 2017.
UNITED NATIONS DEPARTMENT OF ECONOMIC SOCIAL AFFAIRS/POPULATION 
DIVISION. World Urbanization Prospects: The 2007 revision. New York: UN; 2008.
 VOGES, M. O clima está louco?. 2012. Disponível em: <http://formulageo.blogspot.com.
br/2012/07/o-clima-ta-louco-charge.html> Acesso em: 09 jan. 2017.
WEIHS, M.; MERTENS, F. Os desafios da geração do conhecimento em saúde ambiental: uma 
perspectiva ecossistêmica. Cien Saude Colet, v. 18, n. 5, p. 1501-1510, 2013.
XAVIER, M. P.; ARAÚJO, J. S. O conceito de saúde e os modelos de assistência: considerações 
e perspectivas em mudança / the concept of health and models of assistance: considerations 
and prospects in change. Revista Saúde em Foco, Teresina, v. 1, n. 1, 2014.
117BIOESTATÍSTICA E 
EPIDEMIOLOGIA
DUARTE, A.� SANTOS, T.R.� CASTRO, A. G. O Ambiente e a Saúde. Porto Alegre: Instituto Piaget, 2003.
EZZATI M.; et al. Comparative Risk Assessment Collaborating Group. Selected major risk factors and 
global and regional burden of disease. Lancet. v. 360, n. 9343, p.1347-60, 2002.
FIALA, N. Efeito Estufa do Hambúrguer. Scientific American Brasil. 2009. Disponível em: http://www2.
uol.com.br/sciam/noticias/efeito_estufa_dos_hamburgueres.html>Acesso em: 3 jan. 2017.
FIOCRUZ. Glossário de Doenças da Fiocruz. 2013. Disponível em: <https://agencia.fiocruz.br/
leishmaniose>. Acesso em: 9 jan. 2017.
FOGAÇA, J. R. V. Tipos de tratamento de efluentes. Brasil Escola. Disponível em: <http://brasilescola.
uol.com.br/quimica/tipos-tratamento-efluentes.htm>. Acesso em: 28 dez. 2016.
GAZETA RURAL. Agricultores obrigados a ter formação para usarem pesticidas. 2016. Disponível em: 
<http://gazetarural.com/2016/01/26/agricultores-obrigados-a-ter-formacao-para-usarem-pesticidas/> 
Acesso em: 10, jan. 2017.
GECOM-TJAC. TJAC oferece atividades de ginástica laboral aos servidores. 2015. Disponível em: 
<http://www.tjac.jus.br/noticias/tjac-oferece-atividades-de-ginastica-laboral-aos-servidores/> Acesso 
em: 10, jan. 2017.
GIODA, A., DE AQUINO NETO, F. R. Comments on studies of industrial and non-industrial environments 
in Brazil: a comparative. Cad Saude Pública. v. 19, n. 5, p.1389-97, 2003.
GLOBAL PARTNERSHIP TO ROLL BACK MALARIA. Using climate to predict infectious disease 
outbreaks: a review. Geneva: World Health Organization; 2004.
HERZLICH, C. Health and illness on the eve of 21st century: from private experience to the public sphere 
and back. Physis: Revista de Saúde Coletiva, v. 14, n. 2, p. 383-394, 2004.
Av. Marginal Leste, n. 3.600, Bairro dos Estados | CEP: 88.339-125 - Balneário Camboriú (SC)
Telefone: (47) 3363-0631 | avantis@avantis.edu.br | www.avantis.edu,br
	autor
	APRESENTAÇÃO
	1 – CONCEITOS BÁSICOS DE BIOESTATÍSTICA
	3.2 O escore padrão e a estatística “Z”
	3.3 Teste “t” de Student para uma amostra
	3.4 Análise de Variância (ANOVA)
	3.5 Teste Não-Paramétrico para Duas Amostras: Mann-Whitney (“U”)
	3.6 Teste Não-Paramétrico para 3 ou mais Amostras: Kruskal-Wallis (“H”)
	3.7 Considerações Finais do Capítulo 3
	3 BIOESTATÍSTICA INFERENCIAL
	3.1 Noções de Testes de Hipótese
	2.1.1 Média aritmética simples
	2.1.2 Mediana
	2.1.3 Moda
	2.1.4 Ponto médio
	2.2 Medidas de Variação e Dispersão
	2.2.1 Amplitude
	2.2.2 Variância
	2.2.3 Desvio-padrão
	2.2.4 Coeficiente de variação
	2.3 Distribuição de Frequências 
	2.3.1 Representações gráficas da distribuição de frequência
	2.4 Relações entre Duas Variáveis
	2.4.1 Regressão linear simples
	2.4.2 Correlação linear simples
	2.5 Considerações Finais do Capítulo 2
	2 BIOESTATÍSTICA DESCRITIVA
	2.1 Medidas de Tendência Central
	1.1 Tipos de Dados Comuns nas Ciências da Saúde
	1.2 Erro, Acurácia, Precisão e Arredondamento
	1.3 Coleta de Dados em Populações e Amostras
	1.4 Probabilidade
	1.4.1 Probabilidade de um evento
	1.4.2 Contando os resultados possíveis
	1.4.3 Multiplicando e adicionando probabilidades
	1.4.4 Modelos probabilísticos
	1.4.4.1 Modelos para variáveis aleatórias discretas
	1.4.4.2 Modelo para variáveis aleatórias contínuas
	1.5 Considerações Finais do Capítulo 1
	EPIDEMIOLOGIA
	4 – CONCEITOS BÁSICOS DE EPIDEMIOLOGIA
	7.2 Epidemiologia das Doenças Infecciosas
	7.2.1 Reservatórios de agentes infecciosos
	7.2.2 Saída do agente infeccioso e modos de transmissão
	7.2.3 Entrada do agente no hospedeiro
	7.2.4 Hospedeiro suscetível
	7.2.5 Implicações para a saúde pública
	7.3 – Epidemiologia das Doenças Não-Infecciosas
	7.3.1 Características das doenças não-infecciosas7.3.2 Doenças cardiovasculares
	7.3.3 Câncer
	7.3.4 Causas externas
	7.4 Considerações Finais do Capítulo 7
	7 PROCESSO EPIDÊMICO
	7.1 Frequência e Distribuição das Doenças: Epidemia e Endemia
	6.1.1 Morbidade
	6.1.2 Mortalidade
	6.2 – Medidas de Associação
	6.2.1 – Risco relativo e risco atribuível
	6.2.2 – Razão de chances ou Odds Ratio
	6.3 – Testes Diagnósticos
	6.4 – Vigilância à Saúde
	6.4.1 - Sistemas de Informação em Saúde (SIS)
	6.5 Considerações Finais do Capítulo 6
	6 EPIDEMIOLOGIA DESCRITIVA
	6.1 – Indicadores de Saúde Coletiva
	5.1.1 Modelo biomédico ou de medicina científica ocidental
	5.1.2 Modelo de História Natural da Doença (HND) e prevenção
	5.1.3 Modelo sistêmico
	5.2 Considerações Finais do Capítulo 5
	 5 PROCESSO SAÚDE-DOENÇA
	5.1 Modelos Explicativos do Processo Saúde-Doença 
	4.1 Perspectivas Históricas
	4.2 Evolução Conceitual
	4.3 Definições Básicas
	4.4 Considerações Finais do Capítulo 4
	REFERÊNCIAS BIBLIOGRÁFICAS

Mais conteúdos dessa disciplina