Prévia do material em texto
<p>1</p><p>Estatística Vital e Sistemas de Informação em Saúde</p><p>Unidade I</p><p>Profa. Dra. Milena Baptista Bueno</p><p>2</p><p>APRESENTAÇÃO DA PROFESSORA MILENA BAPTISTA BUENO</p><p>Doutora e Mestre em Saúde Pública pela Faculdade de Saúde Pública da Universidade de</p><p>São Paulo (FSP/USP). Graduada em Nutrição pela Faculdade de Saúde Pública da</p><p>Universidade de São Paulo (FSP/USP). Professora titular e membro do grupo de pesquisa em</p><p>saúde pública da Universidade Paulista (UNIP).</p><p>3</p><p>INTRODUÇÃO</p><p>A disciplina Estatística Vital e Sistemas de Informação em Saúde tem como</p><p>objetivo capacitar o profissional a utilizar os indicadores de saúde disponíveis para a</p><p>tomada de decisão, baseada na realidade da população. A correta análise e</p><p>interpretação dos dados disponíveis são importantes subsídios para a gestão dos</p><p>diversos serviços de saúde e aprimoramento de políticas públicas nas três esferas</p><p>de governo (municipal, estadual e federal). Desta maneira, será possível atingir a</p><p>meta principal de proporcionar à população melhor qualidade de vida, com equidade</p><p>e integralidade.</p><p>A informatização e maior acesso aos dados sobre doenças e agravos a</p><p>saúde, assim como seus determinantes, possibilitaram a melhoria da gestão em</p><p>saúde, no entanto, é necessário conhecimento da magnitude e limitações da analise</p><p>destes dados para que os resultados sejam realmente efetivos.</p><p>Na primeira unidade deste material de estudo serão apresentados os</p><p>conceitos básicos para coleta, análise e interpretação de dados e na segunda</p><p>unidade serão discutidos os principais Sistemas de Informação em Saúde</p><p>atualmente utilizados no país.</p><p>4</p><p>1. ESTATISTICA</p><p>A Estatística originou-se do convívio social das populações, em situações em</p><p>que havia trocas de mercadorias e contagem de eventos, com caráter prático,</p><p>utilitário e empírico. Desde a antiguidade, vários povos já registravam o número de</p><p>habitantes, nascimentos, óbitos, faziam estimativas das riquezas, dividiam as terras,</p><p>cobravam impostos e realizavam inquéritos quantitativos.</p><p>A partir do século XVI começaram a surgir as primeiras análises sistemáticas</p><p>de fatos sociais, como batizados, casamentos e funerais, originando as primeiras</p><p>tábuas de vida e tabelas. No século XVIII, a nova ciência (ou método) foi</p><p>denominada de estatística, ramo da matemática aplicada, utilizada para</p><p>planejamento, coleta, organização, descrição, análise e interpretação de dados. Em</p><p>meados do século XIX, Willian Farr analisou de forma sistemática dados referentes a</p><p>mortalidade na Inglaterra e País de Gales, sendo considerado um dos pioneiros a</p><p>utilizar a estatística vital.</p><p>O conhecimento avançou ao longo do tempo. O sistema de coleta de dados</p><p>foi aperfeiçoado e aumentou a complexidade para a análise de dados. A estatística</p><p>passou a ser utilizada na área da saúde não apenas como uma catalogação de</p><p>eventos relacionados à vida e a morte, mas uma ferramenta para tomada de decisão</p><p>a partir de uma realidade observada.</p><p>Nos últimos anos, aumentou o uso da estatística nas investigações da área</p><p>da saúde, dado que utiliza métodos científicos para a conclusão dos resultados. O</p><p>profissional de saúde precisa compreender os conceitos básicos de estatística em</p><p>diversas situações, tais como na leitura e compreensão de estudos científicos,</p><p>análise de problemas epidemiológicos, seleção e aplicação de procedimentos de</p><p>diagnósticos, elaboração, execução e avaliação de pesquisas. Portanto:</p><p>A Estatística é a parte da Matemática Aplicada que fornece métodos para</p><p>planejamento, coleta, organização, descrição, análise e interpretação de dados</p><p>e para a utilização dos mesmos na tomada de decisões.</p><p>A estatística é empregada em diversas áreas que avaliam de forma</p><p>quantitativa dados coletados, a fim de auxiliar o progresso do conhecimento. Os</p><p>métodos estatísticos são padronizados, mas sua aplicação dependerá do fenômeno</p><p>estudado e dos objetivos estabelecidos.</p><p>2. COLETA DE DADOS</p><p>A coleta de dados é um dos maiores desafios de qualquer sistema de</p><p>informações, considerando que deve ser padronizado, sistematizado e fidedigno. A</p><p>coleta de dados é o componente mais oneroso e difícil de um sistema de vigilância,</p><p>principalmente em países com extensão territorial tão grande como o Brasil (OPAS,</p><p>2018).</p><p>O treinamento e sensibilização constante dos profissionais envolvidos é de</p><p>extrema relevância para manter a qualidade dos dados. É necessário que os</p><p>procedimentos sejam uniformizados e divulgados em manual de normas.</p><p>A definição dos eventos a serem coletados deve ser clara e objetiva,</p><p>suficientemente sensível para identificar o evento desejado de forma simples e</p><p>5</p><p>rápida e específicos a fim de evitar casos falsos positivos. Em relação aos dados</p><p>sobre doenças, é possível classificar o caso como suspeito (com sinais e sintomas,</p><p>mas sem evidências laboratoriais para o diagnostico), provável (com sinais e</p><p>sintomas, podendo haver evidências laboratoriais inespecíficas para o diagnóstico) e</p><p>confirmado (com evidências definitivas da doença) (OPAS, 2018).</p><p>Após o planejamento e a devida determinação das características</p><p>mensuráveis do fenômeno, inicia-se a coleta dos dados necessários à sua descrição</p><p>segundo tempo, espaço e características da pessoa.</p><p>A obtenção de dados pode ser sistemática, como ocorre com dados de</p><p>registro e notificações obrigatórias (Ex. nascimentos, casamentos, hospitalizações,</p><p>imunização, óbitos e doenças de notificação compulsória), ou não sistemático,</p><p>quando os dados são coletados em pesquisas. A coleta de dados pode ser</p><p>classificada em relação ao tempo em (CRESPO, 2009):</p><p>a) contínua (registro) - quando feita continuamente, tal como a de</p><p>nascimentos, óbitos e doenças com notificação compulsória;</p><p>b) periódica - quando feita em intervalos determinados de tempo, como os</p><p>censos (Ex. 10 em 10 anos);</p><p>c) ocasional - quando feita esporadicamente, a fim de atender a uma</p><p>demanda atual, como no caso de epidemias ou inquéritos em saúde.</p><p>Os dados obtidos devem ser avaliados criticamente antes da análise, para</p><p>evitar incoerências ocasionadas por erros na obtenção ou digitação dos dados. A</p><p>apuração dos dados refere-se a contagem dos eventos avaliados. Independente do</p><p>objetivo do estudo, os dados devem ser descritos por meio de proporções e medidas</p><p>de posição e dispersão, podendo ser elaborados tabelas e gráficos que auxiliam a</p><p>interpretação, caracterizando a estatística descritiva. Em algumas situações, há</p><p>coleta de dados em uma parte da população (amostra) mas deseja-se inferir os</p><p>resultados amostrais para toda a população. A generalização dos resultados</p><p>amostrais para a população é possível por meio do uso de teorias de probabilidade,</p><p>caracterizando a estatística indutiva ou inferencial, que possui metodologias</p><p>especificas de análise para avaliar associações entre variáveis (Figura 1).</p><p>Figura 1- Diferenças conceituais entre estatística descritiva e indutiva.</p><p>ANÁLISE ESTATÍSTICA</p><p>DESCRITIVA INDUTIVA</p><p>Análise exploratória e</p><p>descrição dos dados</p><p>Extrapolação dos resultados</p><p>amostrais para uma população.</p><p>Fonte: CRESPO (2009)</p><p>3. AMOSTRA E POPULAÇÃO</p><p>O conjunto de elementos portadores de, pelo menos, uma característica</p><p>comum denomina-se população estatística ou universo estatístico. Assim,</p><p>indivíduos que moram no Brasil formam uma população, pois possuem uma</p><p>característica em comum. Há possibilidade de definir a população de mulheres que</p><p>6</p><p>moram no Brasil, neste caso teríamos dois critérios: gênero e pais que reside. Uma</p><p>população não está limitada a uma população de pessoas, mas pode se referir a</p><p>qualquer conjunto de objetos.</p><p>Algumas vezes, por inviabilidade econômica ou temporal, limitam-se as</p><p>observações de uma população a uma amostra, ou seja, a um subconjunto finito da</p><p>população (Figura 2). O número de elementos que pertencem a uma população é</p><p>representado</p><p>por N, enquanto que na amostra o conjunto de elementos é</p><p>representado por n.</p><p>Figura 2 – Processo de obtenção de amostras.</p><p>Fonte: Próprio autor</p><p>Resultados da observação de uma amostra podem ser inferidos para toda a</p><p>população, desde que a seleção dos elementos que compõe a amostra seja</p><p>adequadamente realizada. Para exemplificar como é feita a generalização, para o</p><p>diagnóstico de uma doença por exame laboratorial é necessária a coleta e análise</p><p>de uma amostra de sangue ou urina, e o resultado obtido é generalizado para o que</p><p>ocorre em todo o organismo. Em degustações de preparações culinárias, as</p><p>características organolépticas (Ex. sabor, odor, textura) de uma parte do que foi</p><p>preparado é suficiente para avaliar toda a receita. Outro exemplo é o que ocorre nas</p><p>empresas com o controle de qualidade de produtos, uma amostra dos produtos de</p><p>um lote é encaminhada para análises laboratoriais e os resultados são</p><p>generalizados para todos os outros elementos produzidos neste lote.</p><p>O registro de dados obrigatórios (óbitos, nascimentos, casamentos) ou</p><p>notificação compulsória de doenças não são considerados amostras, pois todos os</p><p>tipos de eventos relacionados são informados. A sub notificação (falta de registro)</p><p>pode ocorrer por causas diversas, mas de qualquer maneira o conjunto de dados</p><p>obtidos nestas situações não são caracterizadas por amostras.</p><p>A desvantagem de inferir os resultados de uma amostra para a população é</p><p>que sempre haverá a possibilidade de erros na conclusão, mesmo que a</p><p>probabilidade do erro acontecer seja muito pequena. Na figura 3, o centro</p><p>representa o verdadeiro parâmetro (uma prevalência ou média, por exemplo) da</p><p>população comparado ao resultado obtido de uma amostra (estimativa do</p><p>POPULAÇÃO</p><p>AMOSTRA</p><p>AMOSTRAGEM</p><p>7</p><p>a) Preciso e não válido a) Preciso e não válido b) Não Preciso e válido c) Não Preciso e não válido d) Preciso e válido</p><p>parâmetro). A diferença entre o verdadeiro parâmetro e a estimativa observada na</p><p>amostra é o que denominamos de erro ou viés.</p><p>Figura 3- Representação do erro (viés) de um estudo.</p><p>Fonte: Próprio autor</p><p>Em estudos amostrais, é necessário refletir sobre a validade e precisão, como</p><p>mostra a figura 4, sendo a situação ideal a representada no item d, com baixa</p><p>variabilidade (preciso) e próximo do parâmetro populacional (válido).</p><p>Figura 4– Esquema sobre conceitos de precisão e validade de um estudo.</p><p>Fonte: SOUZA, ALEXANDRE, GUIRARDELLO (2017)</p><p>3.1- Amostragem</p><p>Amostragem é o processo utilizado para obtenção de amostras. Existem dois</p><p>tipos de amostras: as de conveniência ou selecionadas (não aleatórias ou não</p><p>probabilística) e as aleatórias (probabilística). As amostras de conveniências são</p><p>constituídas por elementos que foram selecionados por um critério pessoal do</p><p>pesquisador, em geral, por serem elementos mais acessíveis. Os pacientes que são</p><p>Parâmetro populacional</p><p>Estimativa amostral do</p><p>parâmetro</p><p>ERRO (VIES)</p><p>8</p><p>atendidos em um consultório particular representam uma amostra de conveniência</p><p>se considerado todos os pacientes atendidos em um município por exemplo, pois há</p><p>grande possibilidade de não representarem os doentes de toda a população desta</p><p>cidade.</p><p>Para que seja possível fazer inferências dos resultados de uma amostra para</p><p>a população é necessário garantir que a amostra seja representativa. Para isso, é</p><p>preciso que a amostra seja obtida por processos aleatórios, ou seja, todos os</p><p>elementos da população definida tenham uma probabilidade conhecida em</p><p>pertencer a amostra. As amostras aleatórias também são chamadas de casuais,</p><p>probabilísticas ou seleção ao acaso.</p><p>O sorteio dos elementos que comporão a amostra caracteriza uma</p><p>amostragem aleatória, que poderá ser realizada numerando todos os elementos da</p><p>população e utilizar uma metodologia qualquer de sorteio dos números. Neste caso,</p><p>todos elementos têm a mesma probabilidade de ser sorteado. Como exemplo,</p><p>suponha que é necessário coletar uma amostra entre duzentos pacientes</p><p>cadastrados para atendimento em uma Unidade Básica de Saúde. Todos os</p><p>pacientes serão numerados e, em seguida, os números serão escritos em papeis</p><p>com tamanho e formato iguais, que serão colocados em um saco e misturados.</p><p>Retira-se, um de cada vez, vinte números que identificarão os pacientes que</p><p>comporão a amostra de estudo, representando 10% da população de pacientes</p><p>desta Unidade Básica de Saúde.</p><p>Atualmente, há diversos programas computacionais que realizam sorteio de</p><p>amostra, a partir da identificação dos elementos de uma população. Um exemplo é o</p><p>software de domínio público Epi Info, criado e disponibilizado pelo Centers for</p><p>Disease Control and Prevention (CDC), que oferece ferramentas para a digitação e</p><p>análise de dados (Disponível em: https://www.cdc.gov/epiinfo/support/</p><p>por/pt_downloads.html).</p><p>A amostragem proporcional estratificada refere-se à seleção aleatória em</p><p>sub grupos, obtendo uma amostra final que represente proporcionalmente a</p><p>população de acordo com determinada condição. Por exemplo, em uma sala de aula</p><p>de 100 alunos, sendo 10 meninos e 90 meninas, a probabilidade de sortear uma</p><p>menina será sempre maior. Para garantir a representatividade dos meninos, é</p><p>possível determinar que 10% dos elementos que pertencerão a amostra serão</p><p>meninos (sorteio de 10% do número estipulado para amostra apenas entre meninos)</p><p>e 90% meninas (sorteio de 90% do número estipulado para amostra somente entre</p><p>meninas), representando proporcionalmente esta sala de aula em relação ao sexo.</p><p>Por exemplo, em uma sala de 100 alunos (10 meninos (10%) e 90 meninas (90%))</p><p>deseja-se coletar dados de uma amostra de 10 alunos sorteados aleatoriamente de</p><p>forma estratificada por sexo. Desta maneira, obrigatoriamente, 1 individuo (10%)</p><p>será sorteado entre o grupo de meninos e 9 indivíduos (90%) serão selecionados</p><p>entre as meninas.</p><p>A amostragem sistemática pode ser utilizada quando os elementos de uma</p><p>população já estão ordenados por algum critério, por exemplo, ordem alfabética ou</p><p>número de prontuário. Suponhamos que de uma lista de 100 pacientes ordenados</p><p>por ordem alfabética, deseja-se selecionar uma amostra de 20 pacientes. Pode-se</p><p>calcular um intervalo de seleção pela razão do total de elementos da população pelo</p><p>tamanho amostral, neste exemplo, 100/20 (resultando em cinco elementos). Desta</p><p>maneira, a cada cinco pacientes da lista, seleciona-se um. Neste caso, é importante</p><p>sortear o primeiro selecionado e, depois, utilizar o intervalo de seleção para</p><p>selecionar os próximos até compor o tamanho da amostra final.</p><p>9</p><p>A amostragem por conveniência ocorre quando não há critérios pré</p><p>estabelecidos para a seleção da amostra, a não ser a maior facilidade para a</p><p>obtenção dos dados, como por exemplo, quando a amostra é composta por</p><p>familiares ou amigos do pesquisador. Neste caso, esta é uma amostra não</p><p>representativa da população e tem limitação para a generalização de resultados.</p><p>4. ESTATISTICA DESCRITIVA</p><p>4.1- Níveis de mensuração de variáveis</p><p>Variáveis são características coletadas para análise que variam de um</p><p>elemento para outro. Por exemplo, idade é uma variável numérica que varia de uma</p><p>pessoa para outra de uma população, assim como escolaridade, número de filhos,</p><p>estado civil entre outros. Uma variável pode se tornar constante quando faz parte do</p><p>critério de inclusão para amostra, por exemplo, mortalidade entre homens, neste</p><p>caso ser do sexo masculino é uma constante.</p><p>O tipo de variável irá indicar a melhor forma de apresentação e analise do</p><p>dado. Desta maneira, as variáveis são classificadas em:</p><p>Qualitativas: os resultados são expressos por atributos e não números.</p><p> Qualitativa nominal: não há hierarquia entre as categorias. Exemplo:</p><p>gênero (masculino ou feminino), etnia, local de nascimento.</p><p> Qualitativa ordinal: os possíveis resultados de cada elemento têm</p><p>uma ordenação</p><p>já convencionada. Exemplo: escolaridade, estágio da</p><p>doença, grau de ansiedade.</p><p>Quantitativas: os resultados são expressos por números.</p><p> Quantitativa discreta: variável que só pode assumir valores inteiros, sem</p><p>frações. Exemplo: número de filhos, número de gestações, número de</p><p>dentes.</p><p> Quantitativa contínua: pode assumir qualquer valor numérico, inclusive</p><p>fracionados. Exemplo: peso, altura, nível de glicose sanguínea.</p><p>Assim:</p><p>Qualitativa</p><p>Nominal</p><p>Ordinal</p><p>VARIÁVEL</p><p>Quantitativa</p><p>Discreta</p><p>Contínua</p><p>10</p><p>4.2- Apresentação tabular</p><p>Um dos objetivos da estatística é descrever os valores de uma variável de</p><p>forma clara e objetiva, a fim de facilitar a conclusão dos resultados. Tabelas e</p><p>gráficos sintetizam as informações, possibilitando a mais rápida análise do leitor.</p><p>As tabelas devem ter significado próprio, isto é, devem ser entendidas mesmo</p><p>quando não se lê o texto em que estão apresentados os dados. As tabelas devem</p><p>ser citadas no texto e serem apresentadas o mais próximo do trecho a que se</p><p>referem. No texto, não é recomendado repetir todos os dados já apresentados na</p><p>tabela, evitando redundâncias, porém sugere-se destacar os principais resultados</p><p>apresentados. As normas para apresentação tabular foram instituídas pelo Instituto</p><p>Brasileiro de Geografia e Estatística (IBGE, 1993) e são caracterizadas por:</p><p> Devem ser delimitadas, no alto e embaixo, por traços horizontais.</p><p>Esses traços podem ser mais fortes do que os traços feitos no interior</p><p>da tabela;</p><p> Não devem ser delimitadas por traços verticais à direita e à esquerda;</p><p> O cabeçalho (primeira linha que identifica conteúdo das colunas) deve</p><p>ser delimitado por traços horizontais;</p><p> Podem ser feitos traços verticais no interior da tabela, separando as</p><p>colunas;</p><p> Devem ser numeradas com algarismo arábicos, de modo crescente, de</p><p>acordo com a ordem que aparecem no texto, precedidos da palavra</p><p>Tabela;</p><p> Devem conter título no topo da tabela, com informações sobre a</p><p>natureza (o quê?), abrangência geográfica (onde?) e temporal</p><p>(quando?) dos dados apresentados, de forma clara e concisa. O título</p><p>deve ser inserido após a apresentação da numeração da tabela;</p><p> Quando os dados apresentados não forem de autoria própria, deve-se</p><p>apresentar a fonte dos dados no rodapé da tabela, em letra menor;</p><p> Colocar um traço horizontal (-) quando o valor é zero e padronizar o</p><p>número de casas decimais.</p><p>11</p><p>Exemplo:</p><p>Tabela 1- Taxa de mortalidade entre menores de um ano (por 1.000 nascidos vivos) segundo região</p><p>e ano. Brasil, 2008-2011.</p><p>Região ANO</p><p>2008 2009 2010 2011</p><p>Norte 23,1 22,3 21,0 19,9</p><p>Nordeste 21,8 20,3 19,1 18,0</p><p>Sudeste 14,3 13,9 13,4 13,0</p><p>Sul 12,5 12,0 11,6 11,3</p><p>Centro Oeste 17,1 16,4 15,9 15,5</p><p>Fonte: Ministério da Saúde. Sistema de Informações sobre Nascidos Vivos (SINASC) e Sistema de</p><p>Informações sobre Mortalidade (SIM).</p><p>A representação de variáveis quantitativas em tabelas e gráficos, em geral, é</p><p>por intervalos de classe (dados agrupados em sub grupos ou categorias) a fim de</p><p>facilitar a interpretação. Embora não seja necessário, os intervalos de classe são</p><p>frequentemente construídos com amplitude (tamanho) igual, pois facilita a</p><p>comparação entre categorias, como mostrado na tabela 2 (dados fictícios).</p><p>Tabela 2- Distribuição de pacientes de uma Unidade Básica de Saúde segundo idade. Local, Ano.</p><p>Idade (anos) Número de pacientes</p><p>20 |-- 30 202</p><p>30 |-- 40 505</p><p>40 |-- 50 658</p><p>50 |-- 60 725</p><p>Total 2.090</p><p>Fonte: Próprio autor</p><p>O símbolo |-- significa que o valor próximo da linha vertical ( | ) está incluso</p><p>no intervalo, já o valor próximo da linha horizontal (--) não está incluso neste</p><p>intervalo e será incluído no seguinte. Por exemplo, o primeiro intervalo da tabela 2 é</p><p>20 |-- 30, portanto irá conter as idades de 20,0000... a 29,99999 ..., pessoas com</p><p>idade igual a 30 anos será incluído no intervalo seguinte (30 |-- 40). Os intervalos de</p><p>classe devem ser mutuamente exclusivos (um número não deve estar contido em</p><p>dois intervalos) e exaustivos (todos os números devem estar contidos em algum</p><p>intervalo).</p><p>4.3- Tipos de frequência</p><p>Os dados resultantes da coleta de dados serão primeiramente apurados, ou</p><p>seja, contabilizados. Os valores brutos são aqueles que representam o número de</p><p>observações em cada categoria e são conhecidos como frequência absoluta ou</p><p>simples (n). A soma destas frequências será igual ao total dos elementos avaliados.</p><p>Por exemplo, em um total de 20 pacientes atendidos em uma unidade básica</p><p>de saúde, 9 foram diagnosticados com hipertensão arterial, 5 com diabetes e 6</p><p>dislipidemias. O número de indivíduos para cada patologia representa a frequência</p><p>simples ou absoluta. No entanto, a análise apenas pelos valores absolutos pode</p><p>12</p><p>gerar erros de interpretação, desta maneira é frequente a apresentação da</p><p>frequência relativa, calculada pela razão entre a frequências absoluta de cada</p><p>categoria (neste caso patologias) e o total de pacientes (frequência total), podendo</p><p>ser expresso em porcentagem, como mostra a tabela 3 (dados fictícios).</p><p>Tabela 3- Distribuição de participantes de grupo de intervenção para controle do diabetes de uma</p><p>Unidade Básica de Saúde segundo estado nutricional. Local, Ano.</p><p>Estado nutricional n % % acumulada</p><p>Peso adequado 9 45,0 45,0</p><p>Sobrepeso 5 25,0 70,0</p><p>Obeso 6 30,0 100,0</p><p>Total 20 100,0</p><p>Fonte: Próprio autor</p><p>Na tabela 3, no cabeçalho (primeira linha), o n (número) representa a</p><p>frequência simples ou absoluta, % (percentual) refere-se à frequência relativa e %</p><p>acumulada a frequência percentual acumulada (soma das frequências percentuais</p><p>das categorias anteriores). Na última linha é apresentada a frequência total.</p><p>É possível a apresentação de duas variáveis em uma mesma tabela,</p><p>facilitando a análise de associação entre variáveis (tabela 4 (dados fictícios)).</p><p>Tabela 4 – Distribuição de pacientes segundo estado nutricional e faixa etária de crianças atendidas</p><p>em uma determinada escola. Local, Ano.</p><p>Estado</p><p>nutricional</p><p>Faixa etária (meses) Total</p><p>O gráfico de setores, também conhecido como “pizza”, tem como objetivo</p><p>apresentar frequência percentual de variáveis qualitativas que possuam poucas</p><p>categorias. Ressalta-se que a soma das frequências percentuais de cada categoria</p><p>apresentada deve totalizar 100%, como mostra a Figura 6 (dados fictícios).</p><p>0</p><p>5</p><p>10</p><p>15</p><p>20</p><p>25</p><p>Norte Nordeste Sudeste Sul Centro Oeste</p><p>n</p><p>º</p><p>ó</p><p>b</p><p>it</p><p>o</p><p>s</p><p>p</p><p>o</p><p>r</p><p>1.</p><p>00</p><p>0</p><p>n</p><p>as</p><p>ci</p><p>d</p><p>o</p><p>s</p><p>vi</p><p>vo</p><p>s</p><p>Região brasileira</p><p>14</p><p>Figura 6- Distribuição de participantes de grupo de intervenção para controle do diabetes da Unidade</p><p>Básica de Saúde “X” segundo estado nutricional. Local, Ano.</p><p>Fonte: Próprio autor</p><p>4.4.3- Gráfico de linha</p><p>O gráfico de linha ou diagrama linear é adequado para representar a</p><p>associação de duas variáveis quantitativas, sendo que uma está relacionada a</p><p>tempo (Ex. ano, mês, dias). Este tipo de gráfico mede tendência (séries temporais).</p><p>Figura 7- Taxa de mortalidade entre menores de um ano (por 1.000 nascidos vivos) segundo</p><p>região e ano. Brasil, 2008-2011.</p><p>Fonte: Ministério da Saúde. Sistema de Informações sobre Nascidos Vivos (SINASC) e Sistema de</p><p>Informações sobre Mortalidade (SIM).</p><p>4.4.4- Histograma</p><p>O histograma é adequado para representar a frequência (simples ou relativa)</p><p>de uma variável quantitativa contínua. O eixo x (horizontal) representa os valores da</p><p>variável e o eixo y (vertical) a frequência. As colunas são unidas e a variável deverá</p><p>estar categorizada em intervalos de classes, como mostra a tabela 2. Se os</p><p>intervalos de classes forem iguais, a largura das colunas será a mesma para todas</p><p>45%</p><p>25%</p><p>30%</p><p>Peso adequado Sobrepeso Obeso</p><p>0</p><p>5</p><p>10</p><p>15</p><p>20</p><p>25</p><p>2 0 0 8 2 0 0 9 2 0 1 0 2 0 1 1TA</p><p>X</p><p>A</p><p>D</p><p>E</p><p>M</p><p>O</p><p>R</p><p>TA</p><p>LI</p><p>D</p><p>A</p><p>D</p><p>E</p><p>IN</p><p>FA</p><p>N</p><p>TI</p><p>L</p><p>(P</p><p>O</p><p>R</p><p>1</p><p>00</p><p>0</p><p>N</p><p>A</p><p>SC</p><p>ID</p><p>O</p><p>S</p><p>V</p><p>IV</p><p>O</p><p>S)</p><p>ANO</p><p>Norte Nordeste Sudeste Sul Centro Oeste</p><p>15</p><p>as categorias e a altura da coluna representará a frequência. A figura 8 representa a</p><p>frequência simples dos dados já apresentados na tabela 2.</p><p>Figura 8- Distribuição de pacientes de uma Unidade Básica de Saúde segundo idade. Local, Ano.</p><p>Fonte: Próprio autor</p><p>Histogramas com distribuição de dados quantitativos em intervalos de classe</p><p>com amplitudes (tamanho do intervalo) diferentes podem gerar interpretações</p><p>incorretas, dado que gerarão colunas com espessuras diferentes. Assim, sugere-se</p><p>que todos os intervalos de classe tenham tamanhos iguais.</p><p>4.4.5- Polígono de frequências</p><p>Assim como histogramas, os polígonos de frequências também são utilizados</p><p>para análise de variáveis quantitativas continuas. No entanto, o polígono de</p><p>frequências é construído baseado no ponto médio de cada intervalo de classe. Por</p><p>exemplo, o primeiro intervalo de classe da figura 4 é de 20 a 30 anos (incompletos),</p><p>portanto o ponto médio é 25 anos ((20 + 30)/2). O eixo x apresenta a variável de</p><p>estudo, com marcadores nos pontos médios dos intervalos de classe e o eixo y</p><p>mostra a frequência (simples ou relativa). Para fechar o polígono, unimos os</p><p>extremos com o eixo horizontal nos pontos médios de duas classes fictícias com</p><p>amplitudes semelhante aos demais intervalos de classe, como mostra Figura 9.</p><p>0</p><p>100</p><p>200</p><p>300</p><p>400</p><p>500</p><p>600</p><p>700</p><p>800</p><p>N</p><p>º</p><p>p</p><p>ac</p><p>ie</p><p>n</p><p>te</p><p>s</p><p>Idade (anos)</p><p>20 30 40 50 60</p><p>16</p><p>Figura 9- Distribuição de pacientes de uma Unidade Básica de Saúde segundo idade. Local, ano.</p><p>Fonte: Próprio autor</p><p>Pelo polígono de frequência é possível avaliar a simetria da distribuição, ou</p><p>seja, a tendência de maior concentração dos dados em relação a um ponto central,</p><p>e a curtose, referente ao grau de achatamento da curva. Esta análise será de grande</p><p>relevância para a análise estatística inferencial (a extrapolação dos resultados</p><p>amostrais para toda a população).</p><p>4.5- Medidas de tendência central</p><p>Além das frequências, as variáveis podem ser analisadas por medidas de</p><p>tendência central que representam o centro da distribuição dos dados ou o ponto</p><p>que as observações tendem a se agruparem. Resumem variáveis quantitativas,</p><p>sendo as mais utilizadas média, mediana e moda.</p><p>4.5.1- Moda</p><p>A moda é o valor da distribuição de uma variável que apresenta a maior</p><p>frequência. Pode haver distribuições que não apresentem moda pois nenhum valor</p><p>se repete e pode haver distribuições com dois ou mais valores modais, como mostra</p><p>o exemplo 1.</p><p>Exemplo:</p><p>- Notas de alunos da disciplina X: 9, 10, 7, 6, 5, 4, 8 Amodal</p><p>- Notas de alunos da disciplina Y: 8, 8, 8, 7, 9, 8, 7 Moda=8</p><p>- Notas de alunos da disciplina Z: 8, 8, 7, 7, 9, 8, 7 Moda=8 e 7</p><p>4.5.2- Média aritmética ( x )</p><p>Média aritmética ( x ) é a medida de tendência central mais conhecida e</p><p>utilizada. É o valor que indica o centro de equilíbrio de uma distribuição de dados</p><p>numéricos, calculado pela somatória () dos valores observados (xi) dividido pelo</p><p>total de observações (n).</p><p>0</p><p>100</p><p>200</p><p>300</p><p>400</p><p>500</p><p>600</p><p>700</p><p>800</p><p>0 5 10 15 20 25 30 35 40 45 50 55 60 65 70</p><p>n</p><p>º</p><p>p</p><p>ac</p><p>ie</p><p>n</p><p>te</p><p>s</p><p>Idade (anos)</p><p>17</p><p>x = x1 + x2 + x3 + x4 + .... + xn = xi</p><p>n n</p><p>Exemplo:</p><p>Consumo de leite (ml/dia) de sete indivíduos: 100, 140, 130, 250, 352, 458, 120.</p><p>x = 100 + 140 + 130 + 250 + 352 + 458 + 120 = 221,42 ml/dia</p><p>7</p><p>No entanto, a média pode não representar adequadamente a distribuição de</p><p>dados quando há grande variabilidade, dado que esta medida de tendência central</p><p>sofre influência de valores aberrantes. Nestes casos, é recomendado o uso de</p><p>mediana. No exemplo apresentado, suponha que existisse um oitavo indivíduo que</p><p>consumisse 3.000 ml/dia de leite. A média incluindo esta observação seria de 568,75</p><p>ml/dia, valor acima de todos os outros observados e que, portanto, não resume o</p><p>consumo de leite deste grupo de pessoas.</p><p>4.5.3- Mediana (Md)</p><p>A mediana (Md) é um valor que representa a posição central de uma</p><p>distribuição de dados ordenados de forma crescente ou decrescente. A mediana é o</p><p>valor que está posicionada exatamente no centro da distribuição, ou seja, 50% das</p><p>observações possuem valores abaixo da mediana e os demais elementos</p><p>apresentam valores acima da mediana.</p><p>Exemplo:</p><p>Consumo de leite (ml/dia) de sete indivíduos: 100, 140, 130, 250, 352, 458, 120.</p><p>Ordenando dados de forma crescente: 100, 120, 130, 140, 250, 352, 480</p><p>Neste caso, verifica-se que o consumo de leite do quarto indivíduo (140 ml/dia)</p><p>representa o valor central, ou seja, é o valor da mediana, pois metade dos indivíduos</p><p>estão abaixo dele e a outra metade acima dele.</p><p>Exemplo:</p><p>Consumo de leite (ml/dia) de sete indivíduos: 100, 140, 130, 250, 352, 458, 120,</p><p>3000.</p><p>Ordenando dados de forma crescente: 100, 120, 130, 140, 250, 352, 480, 3000</p><p>Neste caso, o número de observações é par (n=8 indivíduos), portanto não há um</p><p>valor único no centro da distribuição. Assim, é necessário fazer uma média</p><p>aritmética dos dois valores centrais para obter a mediana:</p><p>Md = 140 + 250 = 195 ml/dia</p><p>2</p><p>18</p><p>Portanto:</p><p>Quando o número de observações (n) for ímpar, a mediana é o valor da variável</p><p>que ocupa a posição (n+1)/2 e quando o número de observações (n) for par, a mediana</p><p>será a média aritmética dos valores da variável que ocupam as posições n/2 e (n/2) +1.</p><p>Em um conjunto de dados com muitos valores repetidos, recomenda-se optar</p><p>pela média aritmética ou moda como medida resumo. Deve-se preferir o uso da</p><p>mediana como medida resumo de variáveis quantitativas quando a distribuição é</p><p>assimétrica. Em situações de distribuição simétrica, é recomendado utilizar a média</p><p>aritmética por considerar todos os valores observados (Quadro 1).</p><p>Quadro 1- Tipos de distribuição de dados quantitativos.</p><p>Distribuição simétrica Assimetria a direita ou positiva</p><p>Assimetria a esquerda ou negativa</p><p>Fonte: SILVESTRE, SANT’ANA NETO, FLORES (2013)</p><p>4.6- Separatrizes</p><p>A mediana é um valor central</p><p>que divide uma distribuição em duas partes</p><p>iguais. De maneira semelhante, há outras medidas que dividem um conjunto de</p><p>dados em grupos com o mesmo número de observações. Entre as separatrizes, as</p><p>mais utilizadas são quartis, quintis e percentis e referem-se a divisão do conjunto de</p><p>dados em quatro, cinco e cem partes iguais, respectivamente.</p><p>Para a determinação do valor de qualquer separatriz, assim como para a</p><p>mediana, é necessário que os dados quantitativos estejam ordenados para que seja</p><p>verificado o valor contido na posição desejada.</p><p>19</p><p>4.6.1 Quartil</p><p> 1º quartil (Q1): valor situado na distribuição de forma que uma quarta parte</p><p>(25%) dos dados é menor que ele e as 3 quartas partes restantes são</p><p>maiores (75%). Então o valor de Q1 deixa abaixo 25% das observações.</p><p>25% 75%</p><p>Q1</p><p> 2º quartil (Q2): coincide com a mediana pois é o valor que divide a distribuição</p><p>em 2 partes iguais. Então o valor de Q2 deixa abaixo e acima 50% das</p><p>observações.</p><p>50% 50%</p><p>Q2</p><p> 3º quartil (Q3): valor situado de tal modo que as 3 quartas partes (75%) dos</p><p>elementos são menores que ele e uma quarta parte (25%) é maior. Então o</p><p>valor do Q3 deixa abaixo 75% das observações.</p><p>75% 25%</p><p>Q3</p><p>A identificação da posição do elemento que apresenta o valor referente a um</p><p>quartil, considerando que os dados já estão ordenados, é obtida por:</p><p>Q1= 0,25 . (n+1) Q2= 0,5 (n+1) Q3= 0,75 . (n+1)</p><p>* n = quantidade de elementos observados.</p><p>Exemplos:</p><p>a) Idade de 15 pessoas idosas (n=15):</p><p>xi = 62, 62, 63, 63, 64, 65, 68, 68, 69, 70, 70, 71, 73, 73, 74</p><p>Q1 = 0,25 . (15+1) = 4</p><p>Q2= 0,50 . (15+1) = 8</p><p>Q3= 0,75 . (15+1) = 12</p><p>A pessoa idosa com posição 4 tem 63 anos (1º quartil).</p><p>A pessoa idosa com posição 8 tem 68 anos (2º quartil).</p><p>A pessoa idosa com posição 12 tem 71 anos (3º quartil).</p><p>Interpretação: 25% dos indivíduos avaliados tem idade inferior a 63 anos, 50% tem</p><p>idade inferior a 68 anos e 75% tem idade inferior a 71 anos.</p><p>Caso a posição do elemento que contém o valor do quartil não for um</p><p>número inteiro, é necessário fazer ajuste.</p><p>20</p><p>b) Idade de 16 pessoas idosas (n=16).</p><p>xi = 62, 62, 62, 63, 63, 64, 64, 65, 68, 69, 70, 71, 73, 73, 74, 75</p><p>Q1 = 0,25 . (16+1) = 4,25 valor entre a 4ª e a 5ª posição</p><p>Q2= 0,50 . (16+1) = 8,5 valor entre a 8ª e a 9ª posição</p><p>Q3= 0,75 . (16+1) = 12,75 valor entre a 12ª e a 13ª posição</p><p>Fração decimal do valor obtido no cálculo da posição que contém o Q1</p><p>Q1 = 63 + 0,25 . (63 - 63) = 63 anos</p><p>Idade da 4ª posição Diferença de idade das 4ª e 5ª posições</p><p>Fração decimal do valor obtido no cálculo da posição que contém o Q2</p><p>Q2 = 65 + 0,50 . (68 - 65) = 66,5 anos</p><p>Idade da 8ª posição Diferença de idade das 8ª e 9ª posições</p><p>Fração decimal do valor obtido no cálculo da posição que contém o Q3</p><p>Q3 = 71 + 0,75 . (73 - 71) = 72,5 anos</p><p>Diferença de idade das 12ª e 13ª posições</p><p>Idade da 12ª posição</p><p>Interpretação: 25% dos indivíduos avaliados tem idade inferior a 63 anos, 50% tem</p><p>idade inferior a 66,5 anos e 75% tem idade inferior a 72,5 anos.</p><p>4.6.2 Percentil</p><p>Os percentis são valores que dividem em cem partes iguais uma distribuição</p><p>de dados ordenados. Os valores de Q1, Q2 e Q3 correspondem aos 25º, 50º e 75º</p><p>percentis, respectivamente. A mediana representa o percentil 50. Assim como no</p><p>quartil, é necessário identificar a posição do elemento que se encontra no percentil</p><p>desejado e o valor apresentado por esta observação será o valor percentual. A</p><p>identificação da posição do elemento que contém o percentil é por:</p><p>Pi= (i/100) . (n+1)</p><p>i = ordem do percentil desejado</p><p>n= número de elementos da amostra</p><p>Exemplo:</p><p>Idade de 15 pessoas idosas (n=15):</p><p>n = 62, 62, 63, 63, 64, 65, 68, 68, 69, 70, 70, 71, 73, 73, 74</p><p>Deseja-se calcular o percentil 10 (P10)</p><p>P10= (10/100). (15+1) = 1,6 valor entre a 1ª e 2ª posição</p><p>21</p><p>Fração decimal do valor obtido no cálculo da posição que contém o P10</p><p>P10 = 62 + 0,6 . (62 - 62) = 62,6 anos</p><p>diferença de idades da 1ª e 2ª posição</p><p>Idade da 1ª posição</p><p>Interpretação: 10% dos indivíduos tem idade inferior a 62,6 anos e,</p><p>consequentemente, 90% tem idade acima deste valor.</p><p>4.7- Medidas de dispersão ou variação</p><p>As medidas de tendência central são valores pontuais de uma distribuição de</p><p>dados numéricos, mas não descrevem a magnitude da variação que geralmente</p><p>ocorre na análise de variáveis quantitativas relacionadas à saúde, também</p><p>fundamental para a descrição dos dados. Os valores observados podem ser bem</p><p>próximos às medidas centrais (média, mediana e moda) ou não, portanto as</p><p>medidas de dispersão (ou variação) identificam a diversificação dos dados em torno</p><p>de uma medida de tendência central, mais frequentemente a média.</p><p>Exemplo:</p><p>Suponha as seguintes taxas de mortalidade (por 1.000 habitantes) por doenças</p><p>transmissíveis de três estados brasileiros nos anos de 2015, 2016, 2017 e 2018</p><p>(dados fictícios).</p><p>Estado 2015 2016 2017 2018 Média Mediana</p><p>A 36,5 36,7 35,2 38,6 36,75 36,60</p><p>B 16,5 25,5 45,2 59,8 36,75 35,35</p><p>C 98,2 12,9 32,8 3,1 36,75 22,85</p><p>Fonte: Próprio autor</p><p>Apesar dos três estados apresentarem a mesma média, a taxa de mortalidade</p><p>por doenças transmissíveis foi mais homogênea (constante ao longo dos anos) no</p><p>município A, enquanto no munícipio C observa-se maior variabilidade dos dados.</p><p>As medidas de dispersão mais utilizadas são amplitude, variância, desvio</p><p>padrão e coeficiente de variação.</p><p>4.7.1- Amplitude total</p><p>Amplitude Total (AT) é a diferença entre o maior e o menor valor observado.</p><p>Exemplo:</p><p>Taxas de mortalidade (por 1.000 habitantes) por doenças transmissíveis de três</p><p>estados brasileiros nos anos de 2015, 2016, 2017 e 2018 (dados fictícios).</p><p>Estado 2015 2016 2017 2018 Amplitude total (AT)</p><p>A 36,5 36,7 35,2 38,6 38,6 – 35,2 = 3,4 óbitos</p><p>B 16,5 25,5 45,2 59,8 59,8 – 16,5= 43,3 óbitos</p><p>C 98,2 12,9 32,8 3,1 98,2 – 3,1= 95,1 óbitos</p><p>Fonte: Próprio autor</p><p>22</p><p>Verifica-se que a AT do estado C foi maior. O cálculo da amplitude total é</p><p>simples, no entanto a utilização desta medida de dispersão é limitada por considerar</p><p>apenas os dois valores extremos do conjunto de dados, desprezando as demais</p><p>observações. Desta maneira, a AT é muito sensível a valores atípicos e representa</p><p>apenas uma indicação aproximada da variabilidade dos dados</p><p>4.7.2- Variância e Desvio Padrão</p><p>A variância quantifica a variabilidade de todos os dados observados em</p><p>relação à média. Para isso, poder-se-ia calcular a distância de cada valor observado</p><p>em relação à média e dividir pelo tamanho da amostra (desvio médio). No entanto,</p><p>pode-se mostrar matematicamente que a soma da distância em relação a média é</p><p>sempre igual a zero. Para que isto não aconteça, os desvios médios são elevados</p><p>ao quadrado (um valor elevado ao quadrado é sempre positivo) e então divididos</p><p>pelo número de observações menos um. Essa medida é a variância e representada</p><p>por S2.</p><p>S2 = (xi – x)2</p><p>n - 1</p><p>Exemplo:</p><p>Variância das taxas de mortalidade (óbitos a cada 1.000 habitantes) por</p><p>doenças transmissíveis em 2015, 2016, 2017 e 2018 nos Estados A, B e C (dados</p><p>fictícios):</p><p>Estado A</p><p>Média ( x ): 36,75 óbitos por 1.000 habitantes</p><p>Ano TM (xi) (xi – x) (xi – x)2</p><p>2015 36,5 36,5 – 36,75 = -0,25 - 0,25 x -0,25= 0,0625</p><p>2016 36,7 36,7 – 36,75 = -0,05 - 0,05 x – 0,05 = 0,0025</p><p>2017 35,2 35,2 – 36,75 = -1,55 - 1,55 x – 1,55 = 2,4025</p><p>2018 38,6 38,6 – 36,75 = 1,85 1,85 x 1,85 = 3,4225</p><p> = 5,89</p><p>Neste caso temos: (xi – x)2 = 5,89 e n = 4 (nº de observações), ou seja,</p><p>valores de 4 anos (2015, 2016, 2017 e 2018)</p><p>Assim: S2 = 5,89 = 1,96 óbitos2 por 1000 habitantes</p><p>4-1</p><p>Estado B</p><p>Média ( x ): 36,75 óbitos</p><p>(%) são apresentadas as</p><p>prevalências de hipertensão segundo anos de estudo. Observa-se que na amostra o</p><p>percentual da patologia foi maior entre os que possuem menor escolaridade. Nas</p><p>colunas seguintes são apresentados os valores dos intervalos de 95% de confiança,</p><p>limites mínimos e máximos. A interpretação dos intervalos de confiança tem a</p><p>finalidade de estimar o parâmetro populacional, já que o estudo foi realizado com</p><p>uma amostra. Desta maneira, há 95% de chance da prevalência de hipertensão na</p><p>população com menor escolaridade ser entre 40,9% e 44,1%, na população de</p><p>escolaridade mediana há 95% de chance da proporção de hipertensos ser entre</p><p>18,4% e 20,4% e entre os que tem maior escolaridade há 95% de probabilidade da</p><p>hipertensão referida ser entre 13,3% e 15,2%.</p><p>Observa-se na tabela 5 que os intervalos de confiança dos três grupos de</p><p>pessoas com escolaridades diferentes não se sobrepõem (não há valores iguais em</p><p>dois ou mais intervalos), portanto conclui-se que a diferença de proporções por</p><p>escolaridade é significante.</p><p>5.1- Testes estatísticos</p><p>Os objetivos do uso de diversos testes estatísticos em estudos de natureza</p><p>quantitativa são:</p><p>a) Comprovação de modelos explicativos (relação de causa e efeito);</p><p>b) Generalização dos resultados amostrais para toda a população;</p><p>c) Inferências para observações futuras.</p><p>De acordo com o objetivo e distribuição dos dados, seleciona-se o teste de</p><p>hipótese mais adequado. Pode-se citar como exemplos de testes hipóteses:</p><p>- Testes de qui quadrado (teste de associação entre duas variáveis</p><p>qualitativas);</p><p>- Teste t-student (teste de diferença de médias, utilizado quando há uma</p><p>variável quantitativa e outra qualitativa (com duas categorias) em amostras</p><p>independentes);</p><p>- Análise de variância (ANOVA, compara a distribuição de três ou mais</p><p>grupos em amostras independentes);</p><p>- Correlação linear (análise da relação de duas variáveis quantitativas).</p><p>27</p><p>Os exemplos apresentados de testes estatísticos são conhecidos como</p><p>análises bivariadas (ou seja, avaliam a relação de duas variáveis, sejam</p><p>quantitativas ou qualitativas), mas há também as análises multivariadas, com</p><p>modelos matemáticos mais complexos. Há outras análises bivariadas adequadas em</p><p>estudos com amostras pequenas e para variáveis quantitativas que não apresentam</p><p>distribuição normal (testes não paramétricos).</p><p>Distribuição normal: também conhecida como distribuição gaussiana, representa</p><p>uma distribuição de probabilidades de variáveis quantitativas. O gráfico utilizado</p><p>para avaliar a distribuição normal é o polígono de frequência. A média está</p><p>centralizada e a curva é simétrica, em forma de sino, como a figura 12.</p><p>Figura 12- Distribuição Normal</p><p>Fonte: https://www.inf.ufsc.br/~andre.zibetti/probabilidade/normal.html</p><p>*Há modelos matemáticos que comprovam a distribuição normal de determinada variável que não</p><p>serão apresentados neste material de estudo.</p><p>Suponha que um determinado pesquisador queira comprovar que o hábito de</p><p>fumar causa câncer de mama (relação causa e efeito). A suposição do pesquisador</p><p>é que fumantes tem maior risco para câncer de mama. Ainda no planejamento de</p><p>qualquer estudo, estabelece-se a hipótese nula (Ho) e hipótese alternativa (Ha), que</p><p>seguirão as seguintes premissas:</p><p>Hipótese Nula (Ho): populações são iguais.</p><p>Hipótese Alternativa (Ha): populações são diferentes.</p><p>No caso do estudo sobre a relação entre hábito de fumar e câncer de mama,</p><p>teríamos que:</p><p>Hipótese Nula (Ho): A frequência de câncer de mama entre fumantes e não</p><p>fumantes são iguais.</p><p>Hipótese Alternativa (Ha): A frequência de câncer de mama entre fumantes</p><p>é diferente do que não fumantes.</p><p>https://www.inf.ufsc.br/~andre.zibetti/probabilidade/normal.html</p><p>28</p><p>Dado que Ha foi estabelecida como frequências diferentes, sem determinar</p><p>qual grupo terá frequência maior ou menor, temos um teste bicaudal. Se já fosse</p><p>estabelecido que a frequência de câncer em fumantes é maior (conforme a</p><p>suposição do autor) seria realizado um teste unicaudal.</p><p>Após a coleta de dados, na analise dos dados, há duas possibilidades: rejeita-</p><p>se Ho (e aceita-se Ha) ou aceita-se Ho (e rejeita-se Ha). Qualquer que seja a</p><p>tomada de decisão, haverá probabilidade de erro (significância estatística (p-valor)),</p><p>mesmo que seja baixa. A figura 13 mostra as possibilidades de conclusão sobre um</p><p>teste de hipóteses.</p><p>Figura 13- Possibilidades para a conclusão de um teste de hipóteses</p><p>Ho é verdadeira Ho é falsa</p><p>Rejeita Ho Erro tipo I (α) Decisão Correta (1 – β)</p><p>Aceita Ho Decisão Correta</p><p>(Probabilidade: 1- α)</p><p>Erro tipo II (β)</p><p>Fonte: MEDRONHO (2009)</p><p>O erro tipo I é a probabilidade de rejeitar Ho quando Ho é verdadeiro (α) e o</p><p>erro tipo II (β) é a probabilidade de aceitar Ho quando Ho for falso (Figura 13). Antes</p><p>de realizar o teste estatístico fixa-se a probabilidade α, sendo o mais utilizado 5%</p><p>(ou p=0,05), ou seja, existe uma probabilidade de 5% rejeitar Ho quando Ho é</p><p>verdadeiro. Após a realização do teste, se o valor de p resultante for inferior ao nível</p><p>de significância estabelecido (α), rejeita-se Ho, se o p-valor for maior aceita-se Ho.</p><p>Para cada estatístico, existe um modelo matemático que não será abordado</p><p>neste material de estudo. No entanto, para facilitar a interpretação de resultados de</p><p>testes, serão apresentadas algumas situações demostradas em artigos científicos.</p><p>Exemplo 1</p><p>Tabela 6 – Analise bivariada entre orientação sobre teste do pezinho no pré natal e número de filhos.</p><p>Orientação sobre</p><p>teste do pezinho no</p><p>pré natal</p><p>Não tem filhos Possui filhos Total Valor de p</p><p>n % n % n %</p><p>Sim 24 35,3 51 55,4 75 46,9 0,009</p><p>Não 44 67,7 41 43,1 85 53,1</p><p>Fonte: SILVA et al, 2016.</p><p>A tabela 6 apresenta a associação entre duas variáveis qualitativas, avaliada</p><p>pelo teste de associação de qui quadrado cujo resultado final foi um valor-p = 0,009.</p><p>Como os autores instituíram que rejeitariam Ho (nível de α) quando valor de p</p><p>37-44.</p><p>INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATISTICA. Normas de</p><p>apresentação tabular. 3. ed. Rio de Janeiro: IBGE, 1993.</p><p>LARSON, R; FARBER, B. Estatística aplicada. 4 ed. São Paulo: Pearson, 2010.</p><p>MEDRONHO, R.A. Epidemiologia. 2 ed. São Paulo: Atheneu, 2008.</p><p>MELLO JORGE, M. H. P.; GOTLIEB S. L. D. As condições de saúde no Brasil. Rio</p><p>de Janeiro: FIOCRUZ, 2000.</p><p>ORGANIZAÇÃO PAN-AMERICANA DA SAÚDE. Módulos de Princípios de</p><p>Epidemiologia para o Controle de Enfermidades. Módulo 3: medida das</p><p>condições de saúde e doença na população. Brasília: Organização Pan-Americana</p><p>da Saúde/ Ministério da Saúde, 2010.</p><p>PAGANO, M.; GAUVREAU, K. Princípios de bioestatística. São Paulo: Thomson</p><p>Pioneira, 2003.</p><p>PEREIRA MG. Epidemiologia: teoria e prática. Rio de Janeiro: Guanabara</p><p>Koogan, 2016.</p><p>SILVA, M. P. C.; CONTIM, D.; FERREIRA, L. A.; MARQUI, A. T. Teste do pezinho:</p><p>percepção das gestantes nas orientações no pré-natal. Rev. Bras. Saude Mater.</p><p>Infant. 2017, v.17, n.2, p.291-298.</p><p>SILVESTRE, M.R.; SANT’ANA NETO, J.L.; FLORES, E.F. Critérios estatísticos para</p><p>definir anos padrão: uma contribuição à climatologia geográfica. Revista Formação,</p><p>n.20, v.2, p. 23-53, 2013.</p><p>SOUZA, A.C.; ALEXANDRE, N.M.C.; GUIRARDELLO, E.B. Propriedades</p><p>psicométricas de instrumentos: avaliação da confiabilidade e da validade.</p><p>Epidemiol. Serv. Saúde, v.26, n.3, p.649-59, 2017.</p><p>VIEIRA, S. Introdução à Bioestatística. 4. ed. São Paulo: Elsevier, 2008.</p>37-44. INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATISTICA. Normas de apresentação tabular. 3. ed. Rio de Janeiro: IBGE, 1993. LARSON, R; FARBER, B. Estatística aplicada. 4 ed. São Paulo: Pearson, 2010. MEDRONHO, R.A. Epidemiologia. 2 ed. São Paulo: Atheneu, 2008. MELLO JORGE, M. H. P.; GOTLIEB S. L. D. As condições de saúde no Brasil. Rio de Janeiro: FIOCRUZ, 2000. ORGANIZAÇÃO PAN-AMERICANA DA SAÚDE. Módulos de Princípios de Epidemiologia para o Controle de Enfermidades. Módulo 3: medida das condições de saúde e doença na população. Brasília: Organização Pan-Americana da Saúde/ Ministério da Saúde, 2010. PAGANO, M.; GAUVREAU, K. Princípios de bioestatística. São Paulo: Thomson Pioneira, 2003. PEREIRA MG. Epidemiologia: teoria e prática. Rio de Janeiro: Guanabara Koogan, 2016. SILVA, M. P. C.; CONTIM, D.; FERREIRA, L. A.; MARQUI, A. T. Teste do pezinho: percepção das gestantes nas orientações no pré-natal. Rev. Bras. Saude Mater. Infant. 2017, v.17, n.2, p.291-298. SILVESTRE, M.R.; SANT’ANA NETO, J.L.; FLORES, E.F. Critérios estatísticos para definir anos padrão: uma contribuição à climatologia geográfica. Revista Formação, n.20, v.2, p. 23-53, 2013. SOUZA, A.C.; ALEXANDRE, N.M.C.; GUIRARDELLO, E.B. Propriedades psicométricas de instrumentos: avaliação da confiabilidade e da validade. Epidemiol. Serv. Saúde, v.26, n.3, p.649-59, 2017. VIEIRA, S. Introdução à Bioestatística. 4. ed. São Paulo: Elsevier, 2008.