Logo Passei Direto
Buscar
Material
páginas com resultados encontrados.
páginas com resultados encontrados.
details

Libere esse material sem enrolação!

Craque NetoCraque Neto

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

details

Libere esse material sem enrolação!

Craque NetoCraque Neto

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

details

Libere esse material sem enrolação!

Craque NetoCraque Neto

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

details

Libere esse material sem enrolação!

Craque NetoCraque Neto

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

details

Libere esse material sem enrolação!

Craque NetoCraque Neto

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

details

Libere esse material sem enrolação!

Craque NetoCraque Neto

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

details

Libere esse material sem enrolação!

Craque NetoCraque Neto

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

details

Libere esse material sem enrolação!

Craque NetoCraque Neto

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

details

Libere esse material sem enrolação!

Craque NetoCraque Neto

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

details

Libere esse material sem enrolação!

Craque NetoCraque Neto

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Prévia do material em texto

<p>Universidade Federal do Piauí</p><p>Centro de Educação Aberta e a Distância</p><p>bioEstAtístiCA</p><p>Geraldo José de Oliveira</p><p>Maria da Conceição Prado de Oliveira</p><p>Ministério da Educação - MEC</p><p>Universidade Aberta do brasil - UAb</p><p>Universidade Federal do Piauí - UFPi</p><p>Universidade Aberta do Piauí - UAPi</p><p>Centro de Educação Aberta e a Distância - CEAD</p><p>Geraldo José de Oliveira</p><p>Maria da Conceição Prado de Oliveira</p><p>Bioestatística</p><p>Cleidinalva Maria Barbosa Oliveira</p><p>Ubirajara Santana Assunção</p><p>Zilda Vieira Chaves</p><p>Elis Rejane Silva Oliveira</p><p>Roberto Denes Quaresma Rêgo</p><p>Samuel Falcão Silva</p><p>Everton Oliveira de Araújo</p><p>Elizabeth Carvalho Medeiros</p><p>Carmem Lúcia Portela Santos</p><p>PRESIDENTE DA REPÚBLICA</p><p>MINISTÉRIO DA EDUCAÇÃO</p><p>GOVERNADOR DO ESTADO</p><p>REITOR DA UNIVERSIDADE FEDERAL DO PIAUÍ</p><p>SECRETÁRIO DE EDUCAÇÃO A DISTÂNCIA DO MEC</p><p>PRESIDENTE DA CAPES</p><p>COORDENADOR GERAL DA UNIVERSIDADE ABERTA DO BRASIL</p><p>DIRETOR DO CENTRO DE EDUCAÇÃO ABERTA E A DISTÂNCIA DA UFPI</p><p>Dilma Vana Rousseff Linhares</p><p>Fernando Haddad</p><p>Wilson Nunes Martins</p><p>Luiz de Sousa Santos Júnior</p><p>Carlos Eduardo Bielshowsky</p><p>Jorge Almeida Guimarães</p><p>Celso Costa</p><p>Gildásio Guedes Fernandes</p><p>CONSELHO EDITORIAL DA EDUFPI</p><p>Prof. Dr. Ricardo Alaggio Ribeiro ( Presidente )</p><p>Des. Tomaz Gomes Campelo</p><p>Prof. Dr. José Renato de Araújo Sousa</p><p>Profª. Drª. Teresinha de Jesus Mesquita Queiroz</p><p>Profª. Francisca Maria Soares Mendes</p><p>Profª. Iracildes Maria de Moura Fé Lima</p><p>Prof. Dr. João Renór Ferreira de Carvalho</p><p>COORDENAÇÃO DE MATERIAL DIDÁTICO</p><p>TÉCNICOS EM ASSUNTOS EDUCACIONAIS</p><p>EDIÇÃO</p><p>PROJETO GRÁFICO</p><p>DIAGRAMAÇÃO</p><p>REVISÃO</p><p>REVISÃO GRÁFICA</p><p>EQUIPE DE DESENVOLVIMENTO</p><p>COORDENADORES DE CURSOS</p><p>ADMINISTRAÇÃO</p><p>CIÊNCIAS BIOLÓGICAS</p><p>FILOSOFIA</p><p>FÍSICA</p><p>MATEMÁTICA</p><p>PEDAGOGIA</p><p>QUÍMICA</p><p>SISTEMAS DE INFORMAÇÃO</p><p>Antonella Maria das Chagas Sousa</p><p>Maria da Conceição Prado de Oliveira</p><p>Zoraida Maria Lopes Feitosa</p><p>Miguel Arcanjo Costa</p><p>João Benício de Melo Neto</p><p>Vera Lúcia Costa Oliveira</p><p>Rosa Lima Gomes do Nascimento Pereira da Silva</p><p>Luiz Cláudio Demes da Mata Sousa</p><p>© 2011. Universidade Federal do Piauí - UFPI. Todos os direitos reservados.</p><p>A responsabilidade pelo conteúdo e imagens desta obra é dos autores. O conteúdo desta obra foi licenciado temporária e</p><p>gratuitamente para utilização no âmbito do Sistema Universidade Aberta do Brasil, através da UFPI. O leitor se compromete</p><p>a utilizar o conteúdo desta obra para aprendizado pessoal, sendo que a reprodução e distribuição ficarão limitadas ao âmbito</p><p>interno dos cursos. A citação desta obra em trabalhos acadêmicos e/ou profissionais poderá ser feita com indicação da fonte.</p><p>A cópia deste obra sem autorização expressa ou com intuito de lucro constitui crime contra a propriedade intelectual, com</p><p>sansões previstas no Código Penal.</p><p>É proibida a venda ou distribuição deste material.</p><p>O48b Oliveira, Geraldo José de</p><p>Bioestatística/Geraldo José de Oliveira/ Maria da</p><p>Conceição prado de Oliveira. - Teresina: EDUFPI, 2011</p><p>131 p.:il.</p><p>1. Bioestatística. 2. Estatística descritiva. 3. Estatística</p><p>aplicada-Biologia. I. Oliveira, Maria da Conceição Prado de.</p><p>II. Título</p><p>C.D.D: 574.018 2</p><p>Este texto se destina aos estudantes de Licenciatura em Ciências</p><p>Biológicas matriculados no programa de Educação a Distância da</p><p>Universidade Aberta do Piauí (UAPI), vinculados ao consócio formado</p><p>pela Universidade Federal do Piauí (UFPI), Universidade Estadual do</p><p>Piauí (UESPI) e Instituto Federal de Educação, Ciências e Tecnologia</p><p>do Piauí (IFPI), com apoio do Governo do Estado do Piauí, através da</p><p>Secretaria de Educação.</p><p>O presente material didático tem como objetivo principal apresentar</p><p>uma visão geral da estatística, na área específica da Bioestatística,</p><p>destacando a importância de se analisar, por processos numéricos, os</p><p>fenômenos biológicos. Para atingir tal objetivo, atender a ementa do</p><p>curso e facilitar o estudo dos alunos o texto será composto de cinco</p><p>unidades, cujos resumos serão apresentados em cada unidade.</p><p>A nossa proposta, no desenvolvimento do texto, é oferecer ao</p><p>aluno uma ideia do que é estatística e como ela pode ser usada em</p><p>pesquisas, principalmente na área das Ciências Biológicas. Quem está</p><p>estudando estatística pela primeira vez deve imaginá-la associada a</p><p>números, tabelas e gráficos que serão usados no momento de organizar</p><p>e apresentar os dados de uma pesquisa. Entretanto, como tentaremos</p><p>mostrar nesta produção didática, isto não é bem assim. Pois ela pode</p><p>estar presente nas diversas etapas de uma pesquisa cientifica.</p><p>UNiDADE 1</p><p>ESTATÍSTICA DESCRITIVA</p><p>História, Ramificações, Conceitos e Definições da Estatística</p><p>Bioestatística</p><p>UNiDADE 2</p><p>TEORIA DAS PROBABILIDADES</p><p>Conceitos em Probabilidade</p><p>Cálculos das Probabilidades</p><p>UNiDADE 3</p><p>ESTATÍSTICA INFERENCIAL PART. 1</p><p>Variáveis Aleatórias</p><p>Função de Probabilidade</p><p>Distribuição de Probabilidade</p><p>UNiDADE 4</p><p>EstAtístiCA iNFErENCiAl PArt. 2</p><p>Noções de Amostragem</p><p>Noções de Testes de Hipóteses</p><p>19</p><p>09</p><p>41</p><p>11</p><p>12</p><p>21</p><p>24</p><p>43</p><p>43</p><p>48</p><p>59</p><p>60</p><p>57</p><p>UNiDADE 5</p><p>CORRELAÇÃO E REGRESSÃO</p><p>Análise de Variância</p><p>Noções Básicas de Experimentação</p><p>Noções de Delineamentos Experimentais</p><p>97</p><p>99</p><p>99</p><p>102</p><p>UNiDADE 01</p><p>Estatística Descritiva</p><p>bioEstAtístiCA 11</p><p>EstAtístiCA DEsCritivA</p><p>História, Ramificações, Conceitos e Definições da Estatística</p><p>Antes de se fazer um relato histórico da Estatística e da história</p><p>da Educação Estatística no Brasil, é importante que se faça um breve</p><p>comentário sobre o conceito, divisão dos grupos e o que estuda cada um</p><p>dos grupos dessa ciência tão importante para o entendimento das outras</p><p>ciências.</p><p>A palavra estatística tem origem na palavra em latim status,</p><p>traduzida como o estudo do Estado e significa, originalmente, uma</p><p>coleção de informação de interesse para o Estado, sobre população e</p><p>economia (BAYER et al., 2004, p. 2).</p><p>Aurélio Ferreira (2002, p. 717) em “Novo dicionário da língua</p><p>portuguesa” explica que o termo Estatística teve origem grega da palavra</p><p>statistós de, statizo, e que significa estabelecer, verificar. De acordo ainda</p><p>com o novo dicionário de Aurélio, a Estatística é a parte da matemática em</p><p>que se investigam os processos de obtenção, organização e análise de</p><p>dados sobre uma população ou sobre uma coleção de seres quaisquer,</p><p>os métodos de tirar conclusões e fazer ilações ou predições com base</p><p>nesses dados.</p><p>Toledo e Ovalle (1985, p.13) distinguem duas concepções para</p><p>a palavra Estatística, no plural a palavra estatísticas indica qualquer</p><p>coleção de dados numéricos, reunidos com a finalidade de fornecer</p><p>informações acerca de um objeto, enquanto, no singular a expressão</p><p>Estatística indica a atividade humana especializada ou um corpo de</p><p>técnicas, ou, ainda, uma metodologia desenvolvida para a coleta, a</p><p>classificação, a apresentação, a análise e a interpretação de dados</p><p>quantitativos e a utilização desses dados para a tomada de decisões.</p><p>Para Costa Neto (2002, p. 3-4), a Estatística é a ciência que</p><p>UNiDADE 0112</p><p>se preocupa com a organização, descrição, análise e interpretação</p><p>de dados e pode ser dividida em três grandes grupos: a estatística</p><p>descritiva, estatística das probabilidades e estatística inferencial ou</p><p>indutiva. Segundo esse autor, a estatística descritiva tem como função</p><p>resumir os dados e informações investigadas, expondo-os de maneira</p><p>mais prática; a estatística das probabilidades tem como principal objetivo</p><p>planejar jogadas ou estratégia em jogos de azar ou, ainda, estuda o risco</p><p>e o acaso em eventos futuros e determina se é provável ou não o seu</p><p>acontecimento; por fim, a estatística inferencial representa o estudo dos</p><p>dados de amostras com o objetivo de entender o comportamento do</p><p>universo.</p><p>Há alguns anos, falava-se em estatística, apenas, na sociedade</p><p>acadêmica, onde sua aplicação sempre foi vasta e incentivada, com</p><p>alguns poucos privilegiados detendo o saber estatístico e sua aplicação</p><p>muito limitada.</p><p>Entretanto, a origem</p><p>dois dados, considere as seguintes</p><p>variáveis aleatórias:</p><p>X = número de pontos obtidos no 1º dado.</p><p>Y = número de pontos obtidos no 2º dado.</p><p>a) Construa a distribuição de probabilidade através de uma tabela e</p><p>gráfico da seguinte variável:</p><p>i)W = X – Y</p><p>ii)A = 2 Y</p><p>iii)Z = X . Y</p><p>b) Determine E(W), E(A), V(W), V(A) e V(Z).</p><p>3. Uma variável aleatória discreta tem a distribuição de probabilidade</p><p>dada por:</p><p>P(X) = para x = 1, 3, 5 e 7</p><p>a) calcule o valor de K</p><p>b) calcule P(X=5)</p><p>c) E(X)</p><p>d) V(X)</p><p>4. Seja Z a variável aleatória correspondente ao número de pontos de</p><p>uma peça de dominó.</p><p>a) Construa a tabela e traçar o gráfico P(Z).</p><p>b) Calcule P(2 < Z < 6).</p><p>c) E(Z) e V(Z).</p><p>5. Seja</p><p>i) Determine E(X) E V(X).</p><p>6. Seja</p><p>i) P(1 < x < 1,5)</p><p>ii) E(X) e V(X).</p><p>7. Uma variável aleatória X tem a seguinte f.d.p.:</p><p>x < 0 f(x) = 0</p><p>0 < x < 2 f(x) = K</p><p>2 < x < 4 f(x) = k(x – 1) > 4 f(x) = 0</p><p>UNiDADE 0376</p><p>a) Represente graficamente f(x).</p><p>b) Determine K.</p><p>c) E(X) e V(X).</p><p>8. A função de probabilidade de uma V.A.C. X é</p><p>a) Calcule</p><p>b) E(X) e V(X)</p><p>EXERCÍCIO PROPOSTO 02</p><p>1. Admitindo-se o nascimento de meninos e meninas seja igual, calcule a</p><p>probabilidade de um casal com 6 filhos ter:</p><p>a) 4 filhos e 2 filhas.</p><p>b) 3 filhos e 3 filhas.</p><p>2. Um time X tem 2/3 de probabilidade de vitória sempre que joga. Se x</p><p>jogar 5 partidas, calcule a probabilidade de:</p><p>a) X vencer exatamente 3 partidas.</p><p>b) X vencer ao menos uma partida.</p><p>c) X vencer mais da metade das partidas.</p><p>d) X perder todas as partidas.</p><p>3. A probabilidade de um acertar um alvo é 1/3. Se ele atirar 6 vezes, qual</p><p>a probabilidade de:</p><p>a) Acertar exatamente 2 tiros.</p><p>b) Não acertar nenhum tiro.</p><p>4. Certo posto de bombeiros recebe em média 3 chamadas pro dia.</p><p>Calcule a probabilidade de:</p><p>a) Receber 4 chamadas num dia.</p><p>b) Receber 3 ou mais chamadas num dia.</p><p>c) 22 chamadas numa semana.</p><p>5. A média de chamadas telefônicas em uma hora é 3. Qual a probabilidade?</p><p>a) Receber exatamente 2 chamadas numa hora.</p><p>b) Receber 4 ou mais chamadas em 90 minutos.</p><p>bioEstAtístiCA 77</p><p>6. Num teste do tipo certo ou errado, com 100 perguntas, qual a</p><p>probabilidade de um aluno, respondendo as questões ao acaso, acerta</p><p>70 % das perguntas?</p><p>7. Lance, de forma imparcial, uma moeda perfeitamente equilibrada,</p><p>cinco vezes. Calcule as seguintes probabilidades:</p><p>a) Ocorrer exatamente três caras.</p><p>b) Ocorrer 60 % ou mais de caras, isto é, P(X ≥ 3 ) , onde X é o número</p><p>de caras.</p><p>c) Pelo menos 2 caras.</p><p>8) Suponha 400 erros de impressão distribuídos aleatoriamente em um</p><p>livro de 500 páginas. Encontre a probabilidade de que uma dada pagina</p><p>contenha:</p><p>a) Nenhum erro.</p><p>b) Exatamente 2 erros.</p><p>EXERCÍCIO PROPOSTO 03</p><p>1. As alturas dos alunos de uma determinada escola são normalmente</p><p>distribuídas com média 1,60 m e desvio padrão 0,30 m. Encontre a</p><p>probabilidade de um aluno escolhido ao acaso medir:</p><p>a) Entre 1,45 e 1,80 m</p><p>b) Mais que 1,79 m</p><p>c) Menos que 1,56 m</p><p>d) Entre 1,49 e 1,68 m</p><p>e) Menos que 1,75 m</p><p>f) Exatamente 1,83 m</p><p>2. a duração de certo componente eletrônico tem média 850 dias e desvio</p><p>padrão 45 dias. Qual a probabilidade do componente durar?</p><p>a) Entre 700 e 1000 dias</p><p>b) Menos que 750 dias</p><p>c) Mais que 850 dias</p><p>d) Qual deve ser o número de dias necessários para que tenhamos de</p><p>UNiDADE 0378</p><p>repor 5% dos componentes (R=776 dias)?</p><p>3. Em uma distribuição normal, 28% dos elementos são superiores a 38 e</p><p>13% inferiores a 25. Encontre a média e a variância da distribuição.</p><p>4. A precipitação pluviométrica média em certa cidade, no mês de</p><p>dezembro, é de 8,9 cm. Admitindo a distribuição normal com desvio</p><p>padrão de 2,5 cm, determine a probabilidade de que, no mês de dezembro</p><p>próximo, a precipitação seja (a) inferior a 1,6 cm, (b) superior a 5 cm, mas</p><p>não superior a 7,5 cm, (c) superior a 12 cm.</p><p>5. A profundidade dos poços artesianos em um determinado local é uma</p><p>variável aleatória N (20;3) (metros). Se X é a profundidade de determinado</p><p>poço, determine (a) P(X < 15), (b) P(18 < X , 23), (c) P(X > 25).</p><p>6. Certa máquina de empacotar determinado produto oferece variações</p><p>de peso com desvio padrão de 20 g. Em quanto deve ser regulado o</p><p>peso médio do pacote para que apenas 10% tenham menos que 400g?</p><p>Calcule a probabilidade de um pacote sair com mais de 450 g.</p><p>[R = a) μ = 425.6 b) 0,11123)].</p><p>RESUMINDO</p><p>No final dessa unidade, espera-se que o aluno seja capaz de realizar</p><p>analise inferencial de uma população ou de uma amostra. Para atingir tal</p><p>objetivo, foram apresentados os seguintes temas: variáveis aleatórias;</p><p>distribuições de probabilidade; noções de amostragem; distribuições</p><p>amostrais de probabilidade; estimação de parâmetros.</p><p>UNiDADE 04</p><p>Estatística Inferêncial</p><p>Parte 2</p><p>bioEstAtístiCA 81</p><p>EstAtístiCA iNFErêNCiAl</p><p>PArtE 2</p><p>Noções de Amostragem</p><p>Conceitos em amostragem</p><p>Inferência Estatística – é o processo de obter informações sobre uma</p><p>população a partir de resultados observados na amostra.</p><p>Amostragem – É processo de retirada de informações dos “n”</p><p>elementos amostrais, na qual deve seguir um método adequado (tipos</p><p>de amostragem).</p><p>Plano de amostragem</p><p>1º) Definir os objetivos da pesquisa</p><p>2º) População a ser amostrada</p><p>3º) Definição da unidade amostral</p><p>- Seleção dos Elementos que farão parte da amostra</p><p>4º) Forma de seleção dos elementos da população</p><p>UNiDADE 0482</p><p>Tipos de amostragem</p><p>5º) tamanho da amostra</p><p>Ex.: Moradores de uma cidade (população alvo)</p><p>Objetivo: Tipo de residência</p><p>Unidade amostral: domicílios (residências)</p><p>Elementos da população: família por domicílio</p><p>Tipo de amostragem:</p><p>Tipos de amostragem</p><p>Amostragem simples ou ocasional</p><p>É o processo mais elementar e frequentemente utilizado. Todos</p><p>os elementos da população têm igual probabilidade de serem escolhidos.</p><p>Para uma população finita o processo deve ser sem reposição. Todos</p><p>os elementos da população devem ser numerados. Para realizar o</p><p>sorteio dos elementos da população devemos usar a Tabela de Números</p><p>Aleatórios.</p><p>Amostragem sistemática</p><p>Trata-se de uma variação da amostragem aleatória ocasional,</p><p>conveniente quando a população está naturalmente ordenada, como</p><p>fichas em um fichário, lista telefônica, etc.</p><p>Ex.: N = 5000 n = 50, então r= = 10, (P. A. de razão 5)</p><p>Sorteia-se usando a Tabela de Números Aleatórios um número</p><p>entre 1 e 10, (x=3), o número sorteado se refere ao 1º elemento da</p><p>bioEstAtístiCA 83</p><p>amostra, logo os elementos da amostra serão:</p><p>3 13 23 33 43 . . . . . . . .</p><p>Para determinar qualquer elemento da amostra podemos usar a</p><p>fórmula do termo geral de uma P. A.</p><p>an = a1 +(n-1).r</p><p>Amostragem estratificada</p><p>É um processo de amostragem usado, quando nos deparamos</p><p>com populações heterogêneas, na qual se pode distinguir subpopulações</p><p>mais ou menos homogêneas, denominadas estratos.</p><p>Após a determinação dos estratos, seleciona-se uma amostra</p><p>aleatória de cada uma subpopulação (estrato).</p><p>As diversas subamostras retiradas das subpopulações devem</p><p>ser proporcionais aos diversos números de elementos dos estratos, e</p><p>guardarem a proporcionalidade em relação à variabilidade de cada</p><p>estrato, obtendo-se uma estratificação ótima.</p><p>Tipos de variáveis que podem ser usadas em estratificação: idade,</p><p>classes sociais, sexo, profissão, procedência, etc.</p><p>Amostragem por conglomerados (ou Agrupamentos)</p><p>Algumas populações não permitem, ou torna-se extremamente</p><p>difícil que se identifiquem seus elementos, mas podemos identificar</p><p>subgrupos da população. Em tais casos, uma amostra aleatória simples</p><p>desses subgrupos (conglomerados) pode ser escolhida, e uma contagem</p><p>completa deve ser feita no conglomerado sorteado.</p><p>Agregados típicos são: quarteirões, famílias, organizações,</p><p>agências, edifícios, etc.</p><p>Amostragem “COM” e “SEM” reposição</p><p>Seja “N” o número de elementos de uma população, e seja “n” o</p><p>número de elementos de uma amostra, então:</p><p>Se o processo de retirada dos elementos for COM reposição (pop.</p><p>Infinita (f < 5%)), o número de amostras possíveis será:</p><p>nº de amostras = Nn</p><p>UNiDADE 0484</p><p>Se o processo de retirada de elementos for SEM reposição (pop.</p><p>finit (f > 5%)), o número de amostras possíveis será:</p><p>nº de amostras =</p><p>Ex.: Supondo N = 8 e n = 4</p><p>Com reposição: nº de amostras = Nn = 84 = 4096</p><p>Sem reposição: nº de amostras = = 70</p><p>Ex.: processo de amostragem aleatória Simples</p><p>(Distribuição Amostral das Médias)</p><p>-(com reposição)</p><p>N={1, 2, 3, 4} n=2 nº de amostras = Nn = 42 = 16</p><p>{1,1} {1,2} {1,3} {1,4}</p><p>{2,1} {2,2} {2,3} {2,4}</p><p>{3,1} {3,2} {3,3} {3,4}</p><p>{4,1} {4,2} {4,3} {4,4}</p><p>- (sem reposição)</p><p>0</p><p>N = {1, 2, 3, 4} n=2 nº de amostras = = 6</p><p>{1,2} {1,3} {1,4}</p><p>{2,3} {2,4} {3,4}</p><p>Para ilustrar melhor as estatísticas amostrais, usaremos o</p><p>processo com reposição.</p><p>{1,1}→x=10 {1,2}→x=1,5 {1,3}→x=2,0 {1,4}→x=2,5</p><p>{2,1}→x=1,5 {2,2}→x=2,0 {2,3}→x=2,5 {2,4}→x=3,0</p><p>{3,1}→x=2,0 {3,2}→x=2,5 {3,3}→x=3,0 {3,4}→x=3,5</p><p>{4,1}→x=2,5 {4,2}→x=3,0 {4,3}→x=3,5 {4,4}→x=4,0</p><p>bioEstAtístiCA 85</p><p>Representações de uma distribuição amostral</p><p>Dados de uma distribuição amostral</p><p>Representação gráfica de uma distribuição amostral</p><p>Estatísticas amostrais</p><p>- Esperança matemática</p><p>- Variância</p><p>Ou VAR(x) = E(x2) -[E(x)]2</p><p>Onde</p><p>UNiDADE 0486</p><p>Tamanho da amostra</p><p>Os pesquisadores de todo o mundo, na realização de pesquisas</p><p>científicas, em qualquer setor da atividade humana, utilizam as</p><p>técnicas de amostragem no planejamento de seus trabalhos, não só</p><p>pela impraticabilidade de poderem observar, numericamente, em sua</p><p>totalidade determinada população em estudo, como devido ao aspecto</p><p>econômico dessas investigações, conduzidos com um menor custo</p><p>operacional, dentro de um menor tempo, além de possibilitar maior</p><p>precisão nos respectivos resultados, ao contrário, do que ocorre com os</p><p>trabalhos realizados pelo processo censitário (COCHRAN, 1965; CRUZ,</p><p>1978).</p><p>A técnica de amostragem, a despeito de sua larga utilização,</p><p>ainda necessita de alguma didática mais adequada aos pesquisadores</p><p>iniciantes.</p><p>Na teoria da amostragem, são consideradas duas dimensões:</p><p>1ª) Dimensionamento da amostra</p><p>2ª) Composição da amostra</p><p>Procedimentos para determinar o tamanho da amostra</p><p>1ª) Analisar o questionário, ou roteiro da entrevista e escolher</p><p>uma variável que julgue mais importante para o estudo. Se possível mais</p><p>do que uma;</p><p>2ª) Verificar o nível de mensuração da variável: nominal, ordinal</p><p>ou intervalar;</p><p>3ª) Considerar o tamanho da população: infinita ou finita;</p><p>4ª) Se a variável escolhida for:</p><p>- intervalar e a população considerada infinita, você poderá</p><p>determinar o tamanho da amostra pela fórmula:</p><p>onde: Z = abscissa da curva normal padrão, fixado um nível de confiança</p><p>(1- )</p><p>Z = 1,65→(1- α) = 90%</p><p>Z = 1,96→(1- α) = 95%</p><p>Z = 2,00→(1- α) = 95,5%</p><p>Z = 2,57→(1- α) = 99%</p><p>bioEstAtístiCA 87</p><p>Geralmente, usa-se Z = 2</p><p>α = desvio padrão da população, expresso na unidade variável,</p><p>onde poderá ser determinado por:</p><p>• Especificações Técnicas;</p><p>• Resgatar o valor de estudos semelhantes;</p><p>• Fazer conjeturas sobre possíveis valores~.</p><p>d = erro amostral, expresso na unidade da variável. O erro amostral</p><p>é a máxima diferença que o investigador admite suportar entre µ e x, isto</p><p>é: |μ - x| < d</p><p>- intervalar e a população considerada finita, você poderá</p><p>determinar o tamanho da amostra pela fórmula:</p><p>onde: Z = abscissa da normal padrão</p><p>p = estimativa da verdadeira proporção de um dos níveis da variável</p><p>escolhida. Por exemplo, se a variável escolhida for parte da empresa, p</p><p>poderá ser a estimativa da verdadeira proporção de grandes empresas</p><p>do setor que está sendo estudado. p será expresso em decimais(p = 30%</p><p>→ p =0.30).</p><p>q = 1 - p</p><p>d = erro amostral, expresso em decimais. O erro amostral neste caso será</p><p>a máxima diferença que o investigador admite suportar entre π e p, isto</p><p>é: |π - p| < d, em que π é a verdadeira proporção (frequência relativa do</p><p>evento a ser calculado a partir da amostra.</p><p>- nominal ou ordinal, e a população considerada finita, você poderá</p><p>determinar o tamanho da amostra pela fórmula:</p><p>onde: z = abscissa da normal padrão</p><p>N = tamanho da população</p><p>p = estimativa da proporção</p><p>q = 1 - p</p><p>d = erro amostral</p><p>Estas fórmulas são básicas para qualquer tipo de composição da</p><p>amostra. Todavia, existem fórmulas específicas, segundo o critério de</p><p>composição da amostra.</p><p>- Se o investigador escolher mais de uma variável, poderá</p><p>acontecer de ter que aplicar mais de uma fórmula, assim deverá optar</p><p>^</p><p>UNiDADE 0488</p><p>pelo maior valor de “n”.</p><p>Obs.: Quando não tivermos condições de prever o possível valor para</p><p>p, admita p = 0.50, pois, dessa forma, você terá o maior tamanho da</p><p>amostra, admitindo-se constantes os demais elementos.</p><p>Distribuições amostrais de probabilidade</p><p>– Distribuição amostral das médias</p><p>Se a variável aleatória “x” segue uma distribuição normal:</p><p>X ~ N(µ(x);σ2(x)) , onde</p><p>µ(x) = µ (a média amostral é igual a média populacional) e</p><p>σ (Desvio Padrão Amostral)</p><p>Caso COM reposição (pop.infinita)</p><p>Caso SEM reposição (pop. finita)</p><p>Quando a amostra for >5% da população ( ) devemos usar fator</p><p>de correção.</p><p>, onde é o fator de correção</p><p>Ex1 . Uma população muito grande tem média 20,0 e desvio padrão 1,4.</p><p>Extrai-se uma amostra de 49 observações. Responda:</p><p>a) Qual a média da distribuição amostral?</p><p>b) Qual o desvio padrão da distribuição amostral?</p><p>c) Qual a porcentagem das possíveis médias que diferiram por mais</p><p>de 0,2 da média populacional?</p><p>Ex2. Um processo de encher garrafas de coca-cola dá em média 10%</p><p>mal cheias com desvio padrão de 30%. Extraída uma amostra de 225</p><p>garrafas de uma sequência de produção de 625, qual a probabilidade</p><p>amostral das garrafas mal cheias entre 9% e 12%.</p><p>bioEstAtístiCA 89</p><p>O exemplo nº 2 pode ser resolvido usando a distribuição amostral</p><p>das proporções, onde p = proporção populacional, p = média da</p><p>distribuição amostral das proporções. Logo temos:</p><p>Distribuição amostral das proporções</p><p>onde é usado para população finita.</p><p>Ex3 : Uma máquina de recobrir cerejas com chocolate é regulada</p><p>para produzir um revestimento de (3% em relação ao volume da cereja).</p><p>Se o processo segue uma distribuição normal, qual a probabilidade de</p><p>extrair uma amostra de 25 cerejas de um lote de 169 e encontrar uma</p><p>média amostral superior a 3,4%? R=0,44828.</p><p>Estimação de parâmetros</p><p>É um processo de indução, no qual usamos dados extraídos de</p><p>uma amostra para produzir inferência sobre a população. Esta inferência</p><p>só será válida se a amostra for significativa.</p><p>Tipos de estimações de parâmetros</p><p>i) Estimação Pontual</p><p>ii) Estimação Intervalar</p><p>Estimação pontual</p><p>É usada quando a partir da amostra, procura-se obter um único</p><p>valor de certo parâmetro populacional, ou seja, obter estimativas a partir</p><p>dos valores amostrais.</p><p>a) Estatísticas</p><p>Seja (X1, X2, ..., Xn) uma amostra aleatória e (x1, x2, ..., xn), os</p><p>valores pela amostra; então y = H(x1, x2, ..., xn) é uma estatística.</p><p>- Média amostral</p><p>- Proporção amostral</p><p>Variância amostral</p><p>Estimação Intervalar</p><p>UNiDADE 0490</p><p>Uma outra maneira de se calcular um estimativa de um parâmetro</p><p>desconhecido, é construir um intervalo de confiança para esse parâmetro</p><p>com uma probabilidade de 1 - α (nível de confiança) de que o intervalo</p><p>contenha o verdadeiro parâmetro. Dessa maneira, α será o nível de</p><p>significância, isto é, o erro que se estará cometendo ao afirmar que o</p><p>parâmetro está entre o limite inferior e o superior calculado.</p><p>Intervalo de confiança para a média (µ)</p><p>a) Variância pop. (σ)2 conhecida</p><p>(n<30→Z)</p><p>Seja X ~N(µ,σ2)</p><p>Como já vimos anteriormente, x (média amostral) tem distribuição</p><p>normal de média µ e desvio padrão , ou seja:</p><p>X ~N (µ; )</p><p>Portanto, tem distribuição N (0, 1)</p><p>Distribuição normal</p><p>Então,</p><p>(pop. Infinita)</p><p>Para caso de populações finitas, usa-se a seguinte fórmula:</p><p>Pop. Finita</p><p>bioEstAtístiCA 91</p><p>Obs.: Os níveis de confiança mais usados são:</p><p>1 - α = 90%→ = + 1,64</p><p>1 - α = 95%→ = + 1,96</p><p>1 - α = 99%→ = + 2,58</p><p>Ex: Seja X a duração da vida de uma peça de equipamento tal</p><p>que σ = 5 horas. Admita que 100 peças foram ensaiadas fornecendo</p><p>uma duração de vida média de 500 horas e que se deseja obter um</p><p>intervalo de 95% para a verdadeira média populacional R = P (499,02 ó</p><p>µ ó 500,98) = 95%.</p><p>Obs.: Podemos dizer que 95% das vezes, o intervalo acima contém a</p><p>verdadeira média populacional. Isto não é o mesmo que afirmar que</p><p>95% é a probabilidade do parâmetro µ cair dentro do intervalo, o que</p><p>constituirá um erro, pois µ é um parâmetro (número) e ele está ou não</p><p>no intervalo.</p><p>b) Variância populacional (σ2) desconhecida (n < 30)</p><p>Neste caso, precisa-se calcular a estimativa S (desvio padrão</p><p>amostral) a partir dos dados, lembrando que:</p><p>onde n -1 = graus de liberdade</p><p>Portanto, tem distribuição N(0,1)</p><p>Esta distribuição é conhecida como distribuição “t” de Student, no</p><p>caso com (φ = n -1) graus de liberdade.</p><p>UNiDADE 0492</p><p>O gráfico da função densidade da variável “t” é simétrica e tem</p><p>a forma da norma, porém menos “achatada” sua média vale zero, a</p><p>variância em que φ é o grau de liberdade (σ > 2).</p><p>Então,</p><p>(pop. Infinita)</p><p>Para caso de populações finitas, usa-se a seguinte fórmula:</p><p>População</p><p>Finita</p><p>Ex.: A seguinte amostra: 9, 8, 12, 7, 9, 6, 11, 6, 10, 9 foi extraída</p><p>de uma população aproximadamente normal. Construir um intervalo de</p><p>confiança para µ com um nível de 95%.</p><p>Então S = 2</p><p>( desvio padrão )</p><p>φ = 10 - 1 = 9 φ = 5%</p><p>R = P(7,27 < μ < 10,13) = 95%</p><p>Obs.: Quando n > 30 e σ for desconhecido poderemos usar S como uma</p><p>boa estimativa de σ. Esta estimação será melhor quanto maior for o</p><p>tamanho da amostra.</p><p>– Intervalo de confiança para proporções</p><p>Sendo p o estimador de π, onde p segue uma distribuição normal,</p><p>logo:</p><p>(pop. Infinita)</p><p>bioEstAtístiCA 93</p><p>(pop. finita)</p><p>logo onde e</p><p>( população infinita )</p><p>( população finita )</p><p>Ex.: Uma centena de componentes eletrônicos foram ensaiados</p><p>e 93 deles funcionaram mais que 500 horas. Determine um intervalo de</p><p>confiança de 95% para a verdadeira proporção populacional, sabendo</p><p>que os mesmos foram retirados de uma população de 1000 componentes.</p><p>Noções de Testes de Hipóteses</p><p>Trata-se de uma técnica para se fazer inferência estatística, ou</p><p>seja, a partir de um teste de hipótese, realizado com os dados amostrais,</p><p>pode-se inferir sobre a população.</p><p>No caso da inferência através de Intervalo de confiança, busca-se</p><p>“cercar” o parâmetro populacional desconhecido. Aqui se formula uma</p><p>hipótese quanto ao valor do parâmetro populacional, e pelos elementos</p><p>amostrais faz-se um teste que indicará a ACEITAÇÃO ou REJEIÇÃO da</p><p>hipótese formulada.</p><p>Hipótese estatística</p><p>Trata-se de uma suposição quanto ao valor de um parâmetro</p><p>populacional, ou quanto à natureza da distribuição de uma variável</p><p>populacional.</p><p>São exemplos de hipóteses estatísticas:</p><p>a) A altura média da população brasileira é 1,65 m, isto é: H: µ = 1.65mm;</p><p>b) A variância populacional dos salários vale $ 5002 isto é, H: σ2 = 5002;</p><p>c) A proporção de paulistas fumantes é 25%, ou seja, H: p = 0.25.</p><p>d) A distribuição dos pesos dos alunos da nossa faculdade é normal.</p><p>UNiDADE 0494</p><p>Teste de Hipótese</p><p>É uma regra de decisão para aceitar ou rejeitar uma hipótese</p><p>estatística com base nos elementos amostrais.</p><p>Designa-se por H0, chamada hipótese nula, a hipóteses estatísticas</p><p>a ser testada, e por H1 a hipótese alternativa. A hipótese nula expressa</p><p>uma igualdade, enquanto que a hipótese alternativa é dada por uma</p><p>desigualdade (≠,<,>)</p><p>Exemplos:</p><p>Teste Bicaudal ou Bilateral</p><p>Teste Unilateral Direito</p><p>Teste Unilateral Esquerdo</p><p>Tipos de erros</p><p>Há dois tipos de erro ao testar uma hipótese estatística. Pode-</p><p>se rejeitar uma hipótese quando ela é, de fato verdadeira, ou aceitar</p><p>uma hipótese quando ela é, de fato, falsa. A rejeição de uma hipótese</p><p>verdadeira é chamada “erro tipo I”. A aceitação de uma hipótese falsa</p><p>constitui um “erro tipo II”.</p><p>As probabilidades desses dois tipos de erros são designados,</p><p>respectivamente, por α e β .</p><p>A probabilidade α do erro do tipo I é denominada “nível de</p><p>significância” do teste.</p><p>Os possíveis erros e acertos de um teste estão sintetizados</p><p>abaixo:</p><p>bioEstAtístiCA 95</p><p>Observe que o erro tipo I só poderá acontecer se for rejeitado e</p><p>o erro tipo II quando for aceito H0.</p><p>Teste de significância</p><p>Os testes de Significância consideram somente erros do tipo,</p><p>pois são os mais usados em pesquisas educacionais, sócio-econômicas,</p><p>etc.</p><p>O procedimento para realização dos testes de significância é</p><p>resumido nos seguintes passo:</p><p>1º) Enunciar as hipóteses H0 e H1 ;</p><p>2º) Fixar o limite do erro α, e identificar a variável do teste;</p><p>3º) Com o auxílio das tabelas estatísticas, considerando α e a</p><p>variável do teste, determinar as RR (região de rejeição) e RA (região de</p><p>aceitação) para H0;</p><p>4º) Com os elementos amostrais, calcular o valor da variável do</p><p>teste;</p><p>5º) Concluir pela aceitação ou rejeição do H0 pela comparação do</p><p>valor calculado no 4º passo com RA e RR.</p><p>Teste de significância para a média</p><p>1. Enunciar as hipóteses:</p><p>2. Fixar α. Admitindo</p><p>- Se a variância populacional σ2 for conhecida, a variável teste</p><p>será “Z” (n > 30);</p><p>- Se a variância populacional for desconhecida, a variável teste</p><p>será “t” de Student com φ = n - 1 (n < 30).</p><p>3. Com o auxílio das tabelas “z” e “t” determinar as regiões RA e</p><p>RR;</p><p>UNiDADE 0496</p><p>4. Calcular o valor da variável:</p><p>Onde: X = média amostral</p><p>μ0 = valor da hipótese nula</p><p>5. Conclusão para a situação (a)</p><p>-Se não se pode rejeitar.</p><p>-Se ou rejeita-se.</p><p>Obs.: Para qualquer tipo de teste de significância devemos</p><p>considerar:</p><p>- Se a variável teste (calculada) cair dentro da região de aceitação</p><p>(RA) não se pode rejeitar H0;</p><p>- Se a variável teste (calculada) cair fora da região de aceitação</p><p>(RA) rejeita-se H0.</p><p>Ex.: Os dois registros dos últimos anos de um colégio atestam para</p><p>os calouros admitidos uma nota média de 115 pontos (teste vocacional).</p><p>Para testar a hipótese de que a média de uma nova turma é a mesma,</p><p>tirou-se, ao acaso, uma amostra de 20 notas, obtendo-se média 118 e</p><p>desvio padrão 20.</p><p>Admitir α = 5%, para efetuar o teste. (R = aceita-se H0)</p><p>Teste de significância para a produção</p><p>1. Enunciar as hipóteses:</p><p>bioEstAtístiCA 97</p><p>2. Fixar α. Escolhendo a variável normal padrão “Z”.</p><p>3. Com o auxílio da tabela “Z” determinar as regiões RA e RR;</p><p>4. Calcular o valor da variável:</p><p>onde</p><p>Onde: f = frequência relativa do evento na amostral</p><p>X = característica dentro da amostra</p><p>P0 = valor da hipótese nula</p><p>5. Conclusão para a situação (a)</p><p>- Se , não se pode rejeitar</p><p>- Se ou rejeita-se</p><p>Ex.: As condições de mortalidade</p><p>de uma região são tais que</p><p>a proporção de nascidos que sobrevivem até 60 anos é de 0,6. Testar</p><p>essa hipótese ao nível de 2%, se em 1000 nascimentos amostrados</p><p>aleatoriamente, verificou-se 530 sobreviventes até 60 anos. (R = rejeita-</p><p>se H0).</p><p>Teste de significância para igualdade de duas médias</p><p>1º) caso) Se as variâncias populacionais S2 forem conhecidas e</p><p>supostamente iguais, independentes e normais, a variável teste será :</p><p>“Z” (n1 + n2 > 30) ;</p><p>1. Enunciar as hipóteses:</p><p>Onde d é a diferença admitida entre as duas médias.</p><p>2. Fixar α. Escolhendo a variável normal padrão “Z”;</p><p>3. Com o auxílio da tabela “Z” determinar as regiões RA e RR;</p><p>UNiDADE 0498</p><p>4. Calcular o valor da variável;</p><p>5. Conclusão: Optar pela aceitação ou rejeição de.</p><p>Ex.: Um fabricante de pneus faz dois tipos. Para o tipo A, σ = 2500</p><p>km, e para o tipo B, σ = 3000 km. Um táxi testou 50 pneus do tipo A e 40</p><p>pneus do tipo B, obtendo 24000 km e 26000 km de duração média dos</p><p>respectivos tipos. Adotando um risco de 4% e que existe uma diferença</p><p>admitida de 200 km entre as marcas, testar a hipótese de que a vida</p><p>média dos dois tipos é a mesma. (R = rejeita-se H0)</p><p>2º caso) Se as variâncias populacionais forem desconhecidas,</p><p>independentes e normais, a variável teste será “t” (n1 + n2 < 30) com</p><p>φ = n1 + n2 - 2;</p><p>a) Variâncias supostamente diferentes</p><p>1. Enunciar as hipóteses:</p><p>H0 : μ1 = μ2 ou μ1 - μ2 = d</p><p>Onde d é a diferença admitida entre as duas médias.</p><p>2. Fixar α. Escolhendo a variável “t” de Student;</p><p>3. Com o auxílio da tabela “t” determinar as regiões RA e RR;</p><p>4. Calcular o valor da variável;</p><p>5. Conclusões:</p><p>Optar pela aceitação ou rejeição de H0.</p><p>Ex.: Dois tipos de pneus foram testados sob as mesmas condições</p><p>meteorológicas. O tipo A fabricado pela fábrica A, registrou uma média</p><p>de 80.000 km com desvio padrão de 6.500 km em 12 carros amostrados.</p><p>Adotando α = 5% testar a hipótese da igualdade das médias.</p><p>b) Variâncias supostamente iguais</p><p>bioEstAtístiCA 99</p><p>1. Enunciar as hipóteses:</p><p>H0 : μ1 = μ2 ou μ1 - μ2 = d</p><p>Onde d é a diferença admitida entre as duas médias.</p><p>2. Fixar α. Escolhendo a variável “t” de Student;</p><p>3. Com o auxílio da tabela “t” determinar as regiões RA e RR;</p><p>4. Calcular o valor da variável:</p><p>onde</p><p>5. Conclusões:</p><p>Optar pela aceitação ou rejeição de H0.</p><p>Ex.: Dois tipos de tintas foram testados sob as mesmas condições</p><p>meteorológicas. O tipo A registrou uma média de 80 min para secagem</p><p>com desvio padrão de 5 min, em cinco partes amostradas. O tipo B, uma</p><p>média de 83 min. com desvio padrão de 4 min, em 6 partes amostradas.</p><p>Adotando α = 5% testar a hipótese da igualdade das médias. (R = aceita-</p><p>se H0).</p><p>Teste do Qui-quadrado (X2)</p><p>Anteriormente, foi testada hipótese referente a um parâmetro</p><p>populacional ou mesmo a comparação de dois parâmetros, ou seja, são</p><p>os testes paramétricos. Agora serão testados aqueles que não dependem</p><p>de um parâmetro populacional, nem de suas respectivas estimativas.</p><p>Este teste é chamado de teste do Qui-quadrado.</p><p>O teste do Qui-quadrado é usado quando se quer comparar</p><p>frequências observadas com frequências esperadas. Divide-se em três</p><p>tipos:</p><p>-Teste de adequação do ajustamento;</p><p>- Teste de Aderência;</p><p>- Teste de Independência (Tabela de contingência).</p><p>UNiDADE 04100</p><p>Procedimentos para a realização de um teste Qui-quadrado (X2)</p><p>H0: F0 = Fe H1: F0 = Fe</p><p>determinação das hipóteses:</p><p>1º) Escolha do nível de significância (α)</p><p>2º) Estatística calculada</p><p>3º) Estatística tabelada:</p><p>5º) Comparar o com e concluir:</p><p>6º) Conclusão:</p><p>Se ≤ aceita-se H0.</p><p>Se > rejeita-se H0.</p><p>Teste de adequação do ajustamento</p><p>Suponhamos uma amostra de tamanho n. Sejam, E1, E2, ..., Ek,</p><p>um conjunto de eventos possíveis da amostra.</p><p>bioEstAtístiCA 101</p><p>Este teste é indicado para verificar se as frequências observadas</p><p>dos k eventos (k, classes em que a variável é dividida) concordam ou não</p><p>com as frequências teóricas esperadas.</p><p>As frequências esperadas (Fei) são obtidas multiplicando-se o</p><p>número total de elementos pela proporção teórica da classe i (n.pi).</p><p>Para encontrar o X2</p><p>cal, necessita-se de nível de Significância (α)</p><p>e dos graus de liberdade (φ), os quais podem ser obtidos da seguinte</p><p>forma:</p><p>1º) φ = k -1, quando as frequências esperadas puderem ser</p><p>calculadas sem que façam estimativas dos parâmetros populacionais a</p><p>partir das distribuições amostrais.</p><p>2º) φ = k - 1 - m, quando para a determinação das frequências</p><p>esperadas, m parâmetros tiverem estimativas calculadas a partir das</p><p>distribuições amostrais. Pearson mostrou que, se o modelo testado for</p><p>verdadeiro e se todas as Fei < 5%, estas deverão ser fundidas às classes</p><p>adjacentes.</p><p>Ex1.: Deseja-se testar se o número de acidentes numa rodovia se</p><p>distribui igualmente pelos dias da semana. Para tanto, foram levantados</p><p>os seguintes dados (α = 5%):</p><p>Resolução:</p><p>H0 : As frequências são iguais em todos os dias.</p><p>H1 : As frequências são diferentes em todos os dias.</p><p>Conclusão: Como o < aceita-se H0, ou seja, para</p><p>UNiDADE 04102</p><p>α = 5%, as frequências podem ser iguais.</p><p>Ex2.: O número de livros emprestados por uma biblioteca durante</p><p>certa semana está a seguir. Teste a hipótese que o número de livros</p><p>emprestados não dependem do dia da semana, com α = 1%.</p><p>=13.28</p><p>Teste de aderência (Teste de Normalidade)</p><p>É usada a estatística X2 quando se deseja testar a natureza</p><p>da distribuição amostral. Por exemplo, quando se quer verificar se a</p><p>distribuição amostral se ajusta a um determinado modelo de distribuição</p><p>de probabilidade (Normal, Poisson, Binomial), ou seja, verifica-se a boa</p><p>ou má aderência dos dados da amostra do modelo.</p><p>Ex1.: Verificar se os dados da distribuição das alturas de 100</p><p>estudantes do sexo feminino se aproximam de uma distribuição normal,</p><p>com α = 5%.</p><p>Resolução:</p><p>H0 : A distribuição da altura das estudantes do sexo feminino é normal</p><p>H0: A distribuição da altura das estudantes do sexo feminino não é normal</p><p>Para calcular pi, temos: (Distribuição Normal Padrão)</p><p>bioEstAtístiCA 103</p><p>Conclusão: como o H2</p><p>cal < H2</p><p>tab aceita-se H0 ou seja, α=5%, a distribuição</p><p>de altura das estudantes do sexo feminino é normal.</p><p>Tabelas de contingência – Teste de independência</p><p>Uma importante aplicação do teste X2 ocorre quando se quer</p><p>estudar a relação entre duas ou mais variáveis de classificação. A</p><p>representação das frequências observadas, nesse caso, pode ser feita</p><p>por meio de uma tabela de contingência.</p><p>H0 : As variáveis são independentes (não estão associadas).</p><p>H1 : As variáveis não são independentes (estão associadas).</p><p>O número de graus de liberdade é dado por φ =(L-1)(C-1), onde L</p><p>é o número de linhas e C o número de colunas da tabela de contingência.</p><p>Obs. Em tabelas 2x2 temos 1 grau de liberdade, por isso, utiliza-se a</p><p>correção de Yates, onde para n ≥ 50 pode ser omitida.</p><p>O teste de qui-quadrado (X2) não é indicado em tabelas 2x2 nos</p><p>seguintes casos:</p><p>I) Quando alguma frequência esperada for menos que 1;</p><p>UNiDADE 04104</p><p>II) Quando a frequência total for menor que 20 (n ≤ 20);</p><p>III) Quando a frequência total (20≤ n ≤ 40) e algumas frequências</p><p>for menor que</p><p>5. Neste caso, aplica-se o teste de Ficher.</p><p>Exemplo: verifique se há associação entre os níveis de renda e os</p><p>municípios onde foram pesquisados 400 moradores. Use α = 1%.</p><p>Conclusão: Como o H2</p><p>cal < H2</p><p>tab aceita-se H0 ou seja, para α =</p><p>1%, as variáveis são independentes.</p><p>Uma medida do grau de relacionamento, associação ou</p><p>dependência das classificações em uma tabela de contingência é dada</p><p>pelo coeficiente de contingência.</p><p>Quando maior o valor de</p><p>C, maior o grau de associação, O máximo</p><p>de C dependerá do número de linhas e colunas da tabela e pode variar</p><p>de 0 (independência) a 1 (dependência total).</p><p>bioEstAtístiCA 105</p><p>EXERCÍCIO PROPOSTO 01</p><p>1. Uma fábrica de baterias alega que um artigo de primeira categoria tem</p><p>uma vida média de 50 meses e desvio padrão de 4 meses.</p><p>a) Que porcentagem de uma amostra de 36 observações acusaria</p><p>vida média no intervalo de um mês em torno da média?</p><p>b) Qual será a resposta para uma amostra de 64 observações?</p><p>c) Qual seria o percentual das médias amostrais inferior a 49,8 meses</p><p>com n = 100?</p><p>2. Um varejista compra copos diretamente da fábrica em grandes lotes.</p><p>Os copos são embrulhados individualmente. Periodicamente, o varejista</p><p>inspeciona os lotes para determinar a proporção dos quebrados ou</p><p>lascados. Se um grande lote contém 10% de quebrados (lascados), qual</p><p>a probabilidade do varejista obter numa amostra de 100 copos, 17% ou</p><p>mais defeituosos?</p><p>3. Deve-se extrair uma amostra de 36 observações de uma máquina de</p><p>cunhar moedas comemorativas. A espessura media das moedas é de 0,2</p><p>cm, com desvio padrão de 0,01cm.</p><p>a) Que percentagem de médias amostrais estará no intervalo 0,004</p><p>em torno da média?</p><p>b) Qual a probabilidade de obter uma média amostral que se afaste</p><p>por mais de 0,005 cm de média do processo? R=0.00164</p><p>4. Suponha que uma pesquisa recente tenha revelado que 60% de uma</p><p>população de adultos do sexo masculino consistam de não-fumantes.</p><p>Tomada uma amostra de 10 pessoas de uma população muito grande,</p><p>que percentagem esperamos nos intervalos abaixo?</p><p>a) De 50% a 65%</p><p>b) Maior que 53%</p><p>c) De 65% a 80%</p><p>5. Se a vida média de operação de um “flash” é de 24 horas, com</p><p>distribuição normal e desvio padrão de 3 horas, qual é a probabilidade de</p><p>uma amostra de 10 “flashes” retirados de uma população de 500 “flashes”</p><p>apresentar vida média que difira por mais de 30 min. da média?</p><p>UNiDADE 04106</p><p>EXERCÍCIO PROPOSTO 02</p><p>1. Ao se realizar uma contagem de eritrócitos em 144 mulheres,</p><p>encontrou-se em média 5,35 milhões de glóbulos vermelhos e desvio</p><p>padrão 0,4413 milhões de glóbulos vermelhos. Determine os limites de</p><p>confiança de 99% para a média populacional.</p><p>2. Um conjunto de 12 animais de experiência receberam uma dieta</p><p>especial durante 3 semanas e produziram os seguintes aumentos de</p><p>peso (g): 30, 22, 32, 26, 24, 40, 34, 36, 32,33, 28, 30. Determine um</p><p>intervalo de 90% de confiança para a média.</p><p>R → X =30.58, S = 5.09, LI = 27.942, LS =33.218</p><p>3. Construa um intervalo de 95% de confiança para um dos seguintes</p><p>casos:</p><p>4. Numa tentativa de melhor esquema de atendimento, um médico</p><p>procurou estimar o tempo médio que gasta com cada paciente. Uma</p><p>amostra aleatória de 49 pacientes, colhida num período de 3 semanas,</p><p>acusou uma média de 30 minutos, com desvio padrão de 7 minutos.</p><p>Construa um intervalo de 95% de confiança para o verdadeiro tempo</p><p>médio de consulta.</p><p>5. Solicitou-se a 100 estudantes de um colégio que anotasse suas</p><p>despesas com alimentação e bebidas no período de uma semana. Há</p><p>500 estudantes no colégio. O resultado foi uma despesa de $ 400,00</p><p>com um desvio padrão de $ 10,00. Construa um intervalo de 95% de</p><p>confiança para a verdadeira média.</p><p>bioEstAtístiCA 107</p><p>6. Uma amostra aleatória de 100 fregueses, da parte da manhã de</p><p>um supermercado, revelou que apenas 10 não incluem leite em suas</p><p>compras.</p><p>a) Qual seria a estimativa percentual dos fregueses que compram leite</p><p>pela parte da manhã. (α = 5%).</p><p>R = LI = 84.12%, LS = 95.88%¨.</p><p>b) Construir um intervalo de 90% de confiança para a verdadeira</p><p>proporção dos fregueses que não compram leite pela manhã.</p><p>R = LI = 5.08%, LS = 14.92%,</p><p>7. Uma amostra aleatória de 40 homens trabalhando, em um grande</p><p>projeto de construção, revelou que 6 não estavam usando capacetes</p><p>protetores. Construa um intervalo de 98% de confiança para a verdadeira</p><p>proporção dos que não estão usando capacetes neste projeto.</p><p>R= σp = 0.056, LI = 0.02, LS = 0.28</p><p>8. De 48 pessoas escolhidas aleatoriamente de uma longa fila de espera</p><p>de um cinema, 25% acharam que o filme principal continha demasiada</p><p>violência.</p><p>a) Qual deveria ser o tamanho da fila, a partir do qual se pudesse</p><p>desprezar o fator de correção finita?</p><p>b) Construa um intervalo de 98% de confiança para a verdadeira</p><p>proporção, se há 100 pessoas na fila;</p><p>c) Construa um intervalo de 98% de confiança para a verdadeira</p><p>proporção, se há 500 pessoas na fila.</p><p>9. Em uma fábrica, colhida uma amostra (n=30) de certa peça, obtiveram-</p><p>se as seguintes medidas para os diâmetros:</p><p>10, 11, 11, 11, 12, 12, 12, 12, 13, 13, 13, 13, 13, 13, 13, 13, 13,</p><p>13, 13, 13, 14, 14, 14, 14, 14, 15, 15, 15, 16, 16,</p><p>a) Estimar a média e a variância;</p><p>R= 13,13 e 2,05</p><p>b) Construir um intervalo de confiança para a média, sendo = 5%.</p><p>(LI = 12.536 e LS = 13.664)</p><p>c) Construir um intervalo de 95% de confiança para a média, supondo</p><p>que a amostra tenha sido retirada de uma população de 100 peças, sendo</p><p>α = 5%. (LI = 12.581 e LS = 13.579)</p><p>UNiDADE 04108</p><p>EXERCÍCIO PROPOSTO 03</p><p>1. O crescimento da indústria da lagosta na Flórida, nos últimos 20 anos,</p><p>tomou esse estado americano o 2º mais lucrativo centro industrial de</p><p>pesca. Espera-se que uma recente medida tomada pelo governo das</p><p>Bahamas, que proibiu os pescadores norte americanos de jogarem suas</p><p>redes na plataforma continental desse país, produza uma redução na</p><p>quantidade de kg de lagosta que chega aos Estados Unidos. De acordo</p><p>com índices passados, cada rede traz em média 14 kg de lagosta. Uma</p><p>amostra de 20 barcos pesqueiros, recolhida após a vigência da nova lei,</p><p>indicou os seguintes resultados, em kg (Use α = 5%).</p><p>Estes dados mostram evidências suficientes de estar ocorrendo um</p><p>decréscimo na quantidade média de lagostas pescadas por barco, que</p><p>chega aos Estados Unidos, depois do decreto do governo das Bahamas?</p><p>Teste considerando α = 5%. (bilateral)</p><p>2. A Debug Company vende um repelente de insetos que alega ser</p><p>eficiente pelo prazo de 400 horas no mínimo. Uma análise de 90 itens</p><p>aleatoriamente inspecionados acusou uma média de eficiência de 380</p><p>horas.</p><p>a) Teste a afirmativa da companhia, contra a alternativa que a duração</p><p>é inferior a 400 horas, ao nível de 1%, seu desvio padrão é de 60 horas.</p><p>b) Repita o teste, considerando um desvio padrão populacional de 90</p><p>horas.</p><p>3. Ao final de 90 dias de uma dieta alimentar, envolvendo 32 pessoas,</p><p>constatou-se o seguinte ganho médio de peso de 40 g, e desvio padrão</p><p>de 1,378g.</p><p>a) Supondo que o ganho de peso médio dessas pessoas é de 45 g,</p><p>teste a hipótese para α = 5%, se esse valor é o mesmo (bilateral).</p><p>b) Supondo que o ganho de peso médio dessas pessoas é de 45 g,</p><p>teste a hipótese para α = 5%, se esse valor é o mesmo (bilateral).</p><p>4. Uma pesquisa feita alega que 15% das pessoas de uma determinada</p><p>bioEstAtístiCA 109</p><p>região sofrem de cegueira aos 70 anos. Numa amostra aleatória de 60</p><p>pessoas acima de 70 anos, constatou-se que 12 pessoas eram cegas.</p><p>Teste a alegação para α = 5% contra p 15%.</p><p>5. A tabela abaixo mostra a quantidade de pessoas que obtiveram o</p><p>melhor efeito perante a aplicação de duas drogas:</p><p>a) Testar a hipótese de que a proporção de homens submetidos à</p><p>droga A é de 35%, sendo α = 3%.</p><p>b) Testar a hipótese de que a proporção dos adultos que tiveram</p><p>melhor resultado nas aplicações musculares é de 85%, usando α = 2%.</p><p>c) Testar a hipótese de que a proporção de mulheres é de 50%, usando</p><p>α = 5%;</p><p>d) Testar a hipótese de que a proporção de pessoas submetidos a</p><p>droga A é de 65%, usando α = 4%.</p><p>6, A DeBug Company vende um repelente para insetos que alega ser</p><p>eficiente pelo prazo de 400 horas no mínimo. Uma análise de 9 itens</p><p>escolhidos aleatoriamente acusou uma média de eficiência de 380 horas.</p><p>a) Teste a alegação da companhia, contra a alternativa que a duração</p><p>é inferior a 400 horas no mínimo ao nível de 1%, e o desvio padrão</p><p>amostral é de 60 horas.</p><p>b) Repita o item a sabendo que o desvio padrão populacional é de 90</p><p>horas.</p><p>7, Um laboratório de análises clínicas realizou um teste de impurezas,</p><p>em 9 porções de um determinado composto. Os valores obtidos foram:</p><p>10,32; 10,44; 10,56; 10,60; 10,67; 10,70; 10,73; 10,75 mg. a) estimar a</p><p>média e a variância de impurezas é de 10.4, usando α = 5%. b) Testar a</p><p>hipótese de que a variância é um usando α = 5%.</p><p>8, Uma experiência tem mostrado que 40% dos estudantes de uma</p><p>universidade reprovam em pelo menos 5 disciplinas. Poderíamos concluir</p><p>UNiDADE 04110</p><p>quanto a proporção populacional, usando α = 1%.</p><p>9. Sendo</p><p>a) Testar a igualdade das duas médias usando α = 4%.</p><p>b) Na tabela abaixo, estão registrados os índices de vendas em 6</p><p>supermercados para os produtos concorrentes da marca A e marca B.</p><p>Testar a hipótese de que a diferença das médias no índice de vendas</p><p>entre as marcas é zero, usando α = 5%.</p><p>EXERCÍCIO PROPOSTO 04</p><p>1. Verificar se os dados se ajustam a uma distribuição de Poisson,</p><p>α=2,5%.</p><p>2. Testar para α=5% se há alguma relação entre as notas escolares e o</p><p>salário.</p><p>R= aceita H0.</p><p>bioEstAtístiCA 111</p><p>3. Determine o valor do coeficiente de contingência considerando os</p><p>dados: α = 1%.</p><p>C= 4%</p><p>4. Com o objetivo de investigar a relação entre a situação do emprego no</p><p>momento em que se aprovou um empréstimo e saber se o empréstimo</p><p>está, agora, pago ou não, o gerente de uma financeira selecionou ao</p><p>acaso 100 clientes, obtendo os resultados da tabela abaixo. Teste a</p><p>hipótese nula de que a situação de emprego e a de empréstimo são</p><p>variáveis independentes, com α = 5%.</p><p>R= aceita H0.</p><p>5. A tabela indica o numero médio de acidentes por mil homens/hora da</p><p>amostra de 50 firmas obtidas de uma indústria específica. A média desta</p><p>distribuição é de 2.32 e o desvio padrão de 0.42. Teste a hipótese nula</p><p>de que as frequências observadas seguem uma distribuição normal, com</p><p>α=5%.</p><p>R=Aceita H0.</p><p>UNiDADE 04112</p><p>RESUMINDO</p><p>O objetivo dessa unidade foi capacitar o aluno e torná-lo capaz de retirar</p><p>uma amostra de uma população e a partir dela fazer uma inferência sobre</p><p>o universo pesquisado, como também aprender a formular hipóteses</p><p>testando-a, para saber se essa hipótese é verdadeira ou falsa. Para</p><p>tanto, serão abordados os seguintes temas: Noções de amostragem,</p><p>estimação e noções de testes de hipóteses.</p><p>UNiDADE 05</p><p>Correlação e regressão</p><p>bioEstAtístiCA 115</p><p>CorrElAção E rEgrEssão</p><p>Correlação e Regressão</p><p>Existe uma correlação entre duas variáveis quando uma delas</p><p>está relacionada com a outra de alguma maneira. O objetivo do estudo da</p><p>correlação é determinar a força do relacionamento entre duas variáveis.</p><p>Portanto, correlação envolve uma forma de estimação, no caso, a</p><p>estimativa de uma relação que pode existir na população.</p><p>Por exemplo: peso e altura estão correlacionados?</p><p>A idade e a resistência física estão correlacionadas?</p><p>Pessoas com melhor escolaridade tendem a apresentar melhor</p><p>renda?</p><p>A temperatura do dia pode influenciar a produtividade?</p><p>Trincas internas e trincas superficiais apresentam correlação?</p><p>Um diagrama de dispersão é um gráfico no qual os dados</p><p>amostrais emparelhados são plotados no eixo horizontal x e um eixo</p><p>vertical y. Cada par individual (x,y) é plotado como no único ponto.</p><p>Como o exame visual de diagramas de dispersão é altamente</p><p>subjetivo, necessita-se de medidas mais exatas e precisas. Para tanto,</p><p>se utiliza o coeficiente de correlação que é uma medida</p><p>adimensional e varia de -1 a +1. Ele é designado pela letra r (coeficiente</p><p>de correlação de uma amostra) ou p (Lê-se rô, coeficiente da população).</p><p>Na população: -1 < p < 1 ou na amostra: -1 < r < 1.</p><p>O coeficiente de correlação fornece informação através do sinal e</p><p>magnitude. A magnitude, em módulo, indica a força da correlação linear</p><p>entre as variáveis X e Y; enquanto que a sinal indica se essa relação</p><p>é direta ou inversa. Uma relação direta entre as variáveis significa que</p><p>valores altos de uma variável correspondem a valores altos da outra</p><p>UNiDADE 05116</p><p>variável; enquanto, que uma relação inversa indica que valores altos de</p><p>uma variável correspondem a valores baixos da outra variável.</p><p>Como, frequentemente, trabalha-se com dados provenientes de</p><p>uma amostra, calcula-se o coeficiente de correlação amostral, chamado</p><p>de r. Portanto, r é uma estimativa de p. O coeficiente de correlação linear</p><p>é dado pela divisão da covariação de X e Y pelo produto do desvio padrão</p><p>de X e o desvio padrão de Y.</p><p>Exemplo: para cinco volumes de uma solução, foram medidas a</p><p>viscosidade e a densidade. Os resultados obtidos foram os seguintes:</p><p>densidade: 20; 22; 19; 23; 17 e viscosidade: 75; 80; 75; 82; 78. Tabela</p><p>de cálculos:</p><p>Σx2 = 101 Σy = 390 n = 5</p><p>Σx2 = 2063 Σy2 = 30458 ΣXY = 7897</p><p>(Σx)2 = (101)2 = 10201 (ΣY)2 = 152100</p><p>Os dados do diagrama de dispersão indicam uma correlação</p><p>moderada positiva, isto é, quanto maior a viscosidade, maior a densidade.</p><p>bioEstAtístiCA 117</p><p>Diagrama de dispersão indicando uma correlação moderada</p><p>positiva</p><p>Quando se chega à conclusão de que existe uma correlação</p><p>linear significativa entre x e y, pode-se encontrar uma equação linear que</p><p>expresse Y em termos X, e essa equação pode ser usada para predizer</p><p>valores de Y para valores dados de X. Para dizer qual é a proporção da</p><p>variação e explicada pela relação linear entre X e Y utiliza-se o r2.</p><p>Podem acontecer casos em que se conclui que existe uma forte</p><p>correlação linear entre as variáveis estudadas, mas esta correlação, na</p><p>verdade, é de uma variável oculta, ou ainda ter sido baseada na média e</p><p>por isso ser fraca; e tem-se ainda o caso da relação não ser linear. Para</p><p>verificar se a correlação linear entre duas variáveis é significativa, pode-</p><p>se utilizar o teste de hipótese para a correlação.</p><p>H0 : = p = 0 Se o valor absoluto da</p><p>estatística T calculada</p><p>for maior que o valor</p><p>H1 : = p ≠ 0 tabelado, rejeita-se H0.</p><p>Para descrever a relação entre duas variáveis, utiliza-se um</p><p>gráfico e uma equação, a equação de regressão. A equação de regressão</p><p>expressa uma relação entre a variável X (variável independe, preditora</p><p>ou explanatória), enquanto Y (variável dependente, variável resposta).</p><p>A equação de regressão linear fornece uma equação que permite</p><p>determinar os valores da variável, dependente: Y = a + bX.</p><p>UNiDADE 05118</p><p>Onde a e b são os coeficientes da reta de ajuste: a é o coeficiente</p><p>linear, enquanto que b é coeficiente angular (inclinação da reta).</p><p>Dado um valor X, este será usado para prever o valor de Y.</p><p>Como os valores de X são conhecidos, resta-nos estimar os valores dos</p><p>coeficientes a e b.</p><p>Para encontrar os valores de a e b, utiliza-se as seguintes</p><p>equações:</p><p>a = 78 - (0,833) x 20,2 = 61,17</p><p>Então: Y = 61,17 + 0,833X; ou viscosidade = 61,17 + 0,833 x</p><p>densidade</p><p>Interpretação de b= 0,833 >> O aumento da densidade em 1</p><p>unidade provoca um aumento de 0,833 na viscosidade.</p><p>Diagrama de dispersão de uma correlação moderada positiva</p><p>Obs: a equação de regressão serve para prever o valor da variável</p><p>dependente (Y), dado o valor da variável independente (X). Em princípio,</p><p>a estimativa deve ser feita dentro do intervalo de variação dos valores</p><p>amostrados. Extrapolações devem ser feitas com precaução.</p><p>Para determinar a adequação do ajuste, pode ser usado o</p><p>coeficiente de determinação ( r2 ),que nada mais é do que o quadrado do</p><p>coeficiente de correlação.</p><p>bioEstAtístiCA 119</p><p>Para exemplo, r2 = (0,87)2 = 0,76 que significa que 76% da variação</p><p>observada no salário depende do tempo de serviço.</p><p>ATENÇÃO! A análise de regressão deve ser usada para ajudar a</p><p>confirmar uma relação de causa e efeito que é esperada tecnicamente.</p><p>A análise de regressão, sozinha,</p><p>sem amparo técnico, não garante nada.</p><p>Por exemplo, na década de 80, a moeda brasileira foi desvalorizada e, ao</p><p>mesmo tempo, diminuiu o número de gansos na Patagônia, mas essas</p><p>variáveis não têm NENHUMA relação.</p><p>Alguns dados coletados podem estar muito influenciados por fatores</p><p>externos ao estudo, ou podem ter sido digitados errados, ou podem</p><p>ser provenientes de erros de leitura. Quando há confiança da presença</p><p>destes dados, deve-se verificar a procedência dos mesmos e caso sejam</p><p>valores realmente atípicos, deverão ser retirados e uma nova regressão</p><p>deve ser feita.</p><p>Análise de Variância</p><p>Uma hipótese é uma formação feita que pode ser aceita ou</p><p>rejeitada a partir dos dados observados em uma amostra aleatória.</p><p>Nos testes de hipóteses vistos anteriormente, eram comparadas duas</p><p>médias, por exemplo, dois procedimentos, dois tipos de matéria prima,</p><p>dois fornecedores, dois sistemas de medição, dois técnicos e assim por</p><p>diante. Nota-se que eram testes para comparar apenas duas médias.</p><p>Contudo, há situações onde se deseja comparar várias médias,</p><p>cada uma oriunda de um grupo diferente. Esses grupos, poderiam ser</p><p>5 máquinas de corte, ou 4 pressões de operação, ou 3 métodos de</p><p>análise química, etc. Alguém poderia pensar em comparar as médias</p><p>duas a duas, Porém, isso exigiria muitos testes e, se cada teste fosse</p><p>feito usando um nível de significância α, é fácil demonstrar que o nível</p><p>global de significância atribuído as conclusões seria, invariavelmente,</p><p>maior que α. É preciso um outro procedimento que mantenha o nível de</p><p>significância estabelecido. Esse procedimento é a chamada Análise de</p><p>Variância (ANOVA).</p><p>Por exemplo, poder-se-ia analisar a seguinte situação: foram</p><p>retiradas amostras de quatro lotes diferentes de perfis de aço e as peças</p><p>foram medidas quanto a sua resistência em Kgf/cm2. Os dados, nesse</p><p>caso, seriam tabulados conforme aparecem a seguir:</p><p>UNiDADE 05120</p><p>Espera-se que, independente do lote, as médias sejam iguais,</p><p>mas as amostras revelam médias um pouco diferentes. Isso significa</p><p>que os lotes são diferentes? Até que ponto a diferença entre as médias</p><p>dos lotes observadas são suficientemente grandes para serem tomadas</p><p>como evidência de que a produção dos lotes é, suficientemente grandes,</p><p>para serem tomadas como evidência de que a produção dos lotes</p><p>é suficientemente diferente? Essa resposta é dada pela Análise de</p><p>Variância!</p><p>No modelo a níveis fixos, os efeitos dos grupos são definidos</p><p>como desvios da média geral, tais que: H0 : as médias são iguais, H1 : as</p><p>médias são diferentes.</p><p>Ou, estatisticamente falando... H0 : μ1 = μ2 = . . . . = μk</p><p>H1 : μi ≠ μj pelo menos uma média difere.</p><p>A ideia da análise de variância é comparar a variação entre os</p><p>grupos com a variação dentro dos grupos, isto é, se a diferença entre as</p><p>médias dos lotes for muito maior que a variabilidade dentro do lote, diz-</p><p>se que os lotes têm médias diferentes. Caso contrário, se as diferenças</p><p>dentro de cada lote (variabilidade) for maior que a diferença entre eles, diz-</p><p>se que a variação entre as médias foi devido ao acaso (erro experimental</p><p>ou residual). Os dados para a realização da análise de variância têm K</p><p>grupos (para o exemplo K = 4). Cada grupo tem r repetições (no exemplo</p><p>r = 5) e o total de dados é n = K x r (no exemplo 4 x 5=20). Para realizar</p><p>a análise de variância, calcular:</p><p>a) Os graus de liberdade:</p><p>bioEstAtístiCA 121</p><p>b) O valor do termo de correção C</p><p>O valor do termo de correção é dado pelo total geral elevado ao</p><p>quadrado e dividido pelo número de observações:</p><p>c) A Soma dos Quadrados total:</p><p>d) A Soma dos Quadrados dos Grupos:</p><p>e) A Soma dos Quadrados do Resíduo</p><p>f) O Quadrado Médio dos Grupos</p><p>g) O Quadrado Médio dos resíduos</p><p>h) O valor de F (a estatística do teste, ou seja, F calculado):</p><p>Os resultados são apresentados na tabela a seguir:</p><p>UNiDADE 05122</p><p>Para testar a hipótese referente ao efeito dos grupos, usa-se a</p><p>distribuição F, que é o modelo adequado para a distribuição do quociente</p><p>de duas variâncias. A partir do quociente entre MQgr e MQR, pode ser</p><p>demonstrado que, se não há efeito dos grupos, esse quociente deve</p><p>ser próximo de 1 (um). Caso contrário, se há efeito dos grupos, esse</p><p>quociente será, significativamente, maior que 1. O limite de decisão é</p><p>estabelecido usando os valores tabelados da distribuição F, ou seja,</p><p>usando: Fa,k-1,n-k .</p><p>A hipótese nula μ1 = μ2 = . . . . = μk será rejeitada sempre que F</p><p>calculado for maior que o valor tabelado Fa,k-1,n-k</p><p>Como interpretar o valor F = 7,80? Comparar com um valor crítico.</p><p>Para encontrar o valor crítico (F tabelado), precisa-se conhecer os graus</p><p>de liberdade dos grupos e os graus de liberdade dos resíduos.</p><p>Para o exemplo, tem-se: gl dos grupos = 3 e gl dos resíduos = 16</p><p>Assim, procurando na tabela: F0,05;3;16 = 3,24.</p><p>Valores de F tabelado para α = 5%.</p><p>Decisão: Rejeitar H0 pois: Fcalculado (7,80) > Ftabelado (3,24).</p><p>Conclusão: Existe diferença entre as resistências médias observadas</p><p>nos perfis de aço de cada lote. A produção não é homogênea.</p><p>Exemplo: Um pesquisador está investigando o efeito do tempo de</p><p>bioEstAtístiCA 123</p><p>resfriamento sobre a microestrutura de um tipo de liga metálica. Analise</p><p>os dados que aparecem a seguir e conclua sobre o efeito do tempo.</p><p>Cálculo das somas quadradas</p><p>C = (Σy)2 .. n = (1285,9)2 /25 = 66141,55</p><p>SQT = Σ(y)2 - C = 67657,17 - 66141,55 = 1515,6</p><p>SQgr = Σ(T2/r) - C = [(277,6)2 /7] + ... +[(343,9)2 /6] - 66141,55 = 1488,3</p><p>SQR = 1515,62 = 1488,29 = 27,3</p><p>Tabela ANOVA</p><p>Fcalculado = 381,6 > Ftabelado = 3,07</p><p>Há diferenças significativas entre os grupos.</p><p>Comparação múltipla de médias</p><p>Muitas vezes, após detectar que há diferenças significativas entre</p><p>os grupos, haverá interesse em identificar quais as médias que diferem</p><p>entre si. A seguir, são descritas as etapas de uma Comparação Múltipla</p><p>de Médias.</p><p>a) Calcular o desvio padrão das médias:</p><p>Onde rc = (r1 + ... + rk) / K</p><p>S = = = 0,456x rc 6,25</p><p>1,3MQR</p><p>UNiDADE 05124</p><p>b) Calcular o limite de decisão:</p><p>Ld = 3 = 3 . 0,456 = 1,368</p><p>c) Escrever as médias em ordem decrescente e compará-las duas</p><p>a duas. A diferença será significativa se for maior que o Ld:,</p><p>x(1) - x(2) = 58,1 – 57,3 = 0,77</p><p>x(1) - x(3) = 58,1 – 51,6 = 6,53</p><p>x(1) - x(4) = 58,1 – 39,7 = 18,4</p><p>x(2) - x(3) = 57,3 – 51,6 = 5,76</p><p>x(2) - x(4) = 57,3 – 39,7 = 17,7</p><p>x(3) - x(4) = 51,6 – 39,7 = 11,9</p><p>d) Usar barras contínuas sobre as médias que não diferem entre</p><p>si:</p><p>x(1) x(2) x(3) x(4)</p><p>Noções Básicas de Experimentação</p><p>Noções sobre experimentos: conceito, definição e exemplo</p><p>Muito do conhecimento que a humanidade acumulou ao longo dos</p><p>tempos foi adquirido através da experimentação. A ideia de experimentar,</p><p>no entanto, não é apenas antiga, também permanece ao nosso dia-a-</p><p>dia. Todos nós já experimentamos algumas coisas, no longo da vida,</p><p>experimentando.</p><p>A experimentação, no entanto, só se difundiu como técnicas</p><p>sistemáticas de pesquisa neste século, quando foi formalizada através</p><p>da Estatística.</p><p>Hoje são feitos experimentos em quase todas as áreas de</p><p>trabalho, embora alguns pesquisadores acreditem, ingenuamente, que</p><p>certas técnicas experimentais sejam conhecidas apenas na sua área.</p><p>Na verdade, as técnicas experimentais são universais e se aplicam a</p><p>diferentes áreas, como na agronomia, ciências biológicas, na medicina,</p><p>engenharia etc., e os métodos de análise são sempre os mesmos.</p><p>bioEstAtístiCA 125</p><p>1) A ORIGEM DA EXPERIMENTAÇÃO:</p><p>Boa parte da formalização que existe hoje em experimentação se</p><p>deve a Sir Ronald A. Fisher (1890-1962), um estatístico que trabalhou na</p><p>Estação Experimental de Agricultura de Rothamstead, na Inglaterra. É a</p><p>origem agrícola da experimentação que explica o uso de vários termos</p><p>técnicos. Assim, o termo parcela foi criado para designar a unidade de</p><p>área usada no experimento.</p><p>Essa unidade de área era, originalmente, uma faixa de terra, mas</p><p>também poderia ser um vaso.</p><p>O termo</p><p>parcela tem, hoje, significado mais geral porque,</p><p>dependendo do experimento, a parcela pode ser um animal, uma pessoa</p><p>etc.</p><p>O termo tratamento também foi introduzido em experimentação</p><p>pela área agrícola. Servia para indicar o que estava em comparação:</p><p>fertilizantes, inseticidas, variedades. Hoje o termo tratamento tem</p><p>significado mais geral. Muitos experimentos são feitos para comparar</p><p>máquinas, métodos, produtos ou materiais.</p><p>Mas o interesse, em experimentação, nem sempre é o de</p><p>comparar tratamentos. Muitas vezes, o pesquisador quer apenas saber</p><p>se determinado tratamento tem efeito. Nesse caso, deve comparar um</p><p>grupo de unidades que recebeu o tratamento grupo-tratado com um</p><p>grupo de unidades que não recebeu o tratamento grupo-controle (o termo</p><p>usado grupo-controle é usado na área médica, mas , na área agrícola, é</p><p>mais usado o termo testemunha).</p><p>Por exemplo: para saber se determinado adubo tem efeito sobre</p><p>a produção de uma planta, o agrônomo deve tomar um conjunto de</p><p>unidades similares e cultivar metade com o adubo grupo-tratado e deixar</p><p>a outra metade sem o adubo (grupo-controle).</p><p>O uso de grupo-controle já está consagrado em experimentação.</p><p>Nas áreas médicas e paramédica, no entanto, é preciso discutir a ética</p><p>de constituir o grupo-controle. As pessoas submetidas aos experimentos</p><p>não podem correr o risco de sofrer danos graves. Então, a constituição</p><p>de um grupo-controle, nos experimentos feitos nas áreas médica e</p><p>paramédica depende, basicamente, do que está em estudo.</p><p>Por exemplo, para estudar o efeito da vitamina C na prevenção de</p><p>resfriados, parece perfeitamente lógico, do ponto de vista do estatístico e</p><p>perfeitamente ético do ponto de vista do médico, comparar dois grupos de</p><p>pessoas: o tratado, que recebe vitamina C, e o controle, que não recebe</p><p>UNiDADE 05126</p><p>vitamina C. Já na experimentação de novas drogas para o tratamento</p><p>de doenças graves, que têm tratamento convencional , o uso de grupo-</p><p>controle pode não apenas ser falta de ética, mas também caracterizar a</p><p>omissão de tratamento.</p><p>Finalmente, o que está sendo medido ou observado no experimento</p><p>é a variável em análise.</p><p>Por exemplo: em um experimento conduzido para estudar o efeito</p><p>de cremes dentais com flúor na incidência de cáries, o que está em</p><p>observação é a incidência de cáries. Logo esta é a variável em análise.</p><p>2) REPETIÇÃO</p><p>A ideia em experimentação é comparar grupos. Não apenas</p><p>unidades. As unidades experimentais do mesmo grupo recebem, em</p><p>estatística, o nome de repetição. Mas a necessidade do uso de repetições</p><p>precisa ser bem definida.</p><p>Imagine que, para verificar se determinado hormônio tem efeito</p><p>sobre o peso de ratos, um pesquisador forneceu o hormônio para um rato</p><p>e deixou e outro sem o hormônio.</p><p>Se, no final do experimento, o rato tratado pesar, por exemplo,</p><p>150 gramas e o controle pesar 120 gramas, o pesquisador pode afirmar</p><p>que o hormônio tem efeito sobre o peso dos ratos porque o rato que</p><p>recebeu o hormônio pesou mais do que o rato que não recebeu.</p><p>Só que essa conclusão é muito pouco confiável. Afinal, dois ratos</p><p>podem apresentar diferença de peso por diversas razões.</p><p>Por outro lado, se o experimento fosse um grupo de ratos que</p><p>recebe o hormônio e outro grupo que não recebe e acontecer o peso</p><p>dos ratos que receberam o hormônio variarem em torno de 150 gramas,</p><p>enquanto que os pesos dos ratos que não receberam hormônio variarem</p><p>em torno de 120 gramas, o pesquisador também poderá concluir que o</p><p>hormônio teve efeito. Esta conclusão é, porém, mais provável.</p><p>No ponto de vista estatístico, é sempre desejável que os</p><p>experimentos tenham grande número de repetições.</p><p>De qualquer forma, convém deixar claro que é possível calcular</p><p>o número de repetições que devem ser tratadas em determinado</p><p>experimento. A aplicação de fórmulas exige, no entanto, que o pesquisador</p><p>conheça a variabilidade do material experimental.</p><p>Quanto mais homogêneo é o material, em termos de características</p><p>que possam influir nas observações ou medições que serão feitas, menor</p><p>bioEstAtístiCA 127</p><p>é o número de repetições necessário para mostrar, com clareza, o efeito</p><p>de um tratamento.</p><p>Noções de Delineamentos Experimentais</p><p>Para planejar um experimento, é preciso definir a unidade</p><p>experimental e a variável em análise. Também é preciso definir os</p><p>tratamentos em comparação em a maneira de designar os tratamentos</p><p>às unidades. Há até uma necessidade de designar as unidades</p><p>experimentais por um processo aleatório. Mas, às vezes, é preciso impor</p><p>algumas restrições à casualização. Para isso, é preciso dar formas</p><p>alternativas de proceder ao sorteio dos tratamentos, respeitando as</p><p>restrições que o pesquisador considera necessárias.</p><p>Experimentos Inteiramente Ao Acaso:</p><p>Para comparar o efeito de três rações, A, B e C, sobre o peso de</p><p>suínos, um pesquisador dispunha de 12 animais.</p><p>Sorteou então a ração A para 4 animais, a ração B para outros 4</p><p>animais e a ração C para os 4 restantes. Portanto, como os tratamentos</p><p>foram designados às unidades por processo aleatório, sem nenhuma</p><p>restrição, então, o experimento é inteiramente ao acaso.</p><p>Os experimentos inteiramente ao acaso só podem ser conduzidos</p><p>quando as unidades são similares. Mas a ideia de similaridade precisa</p><p>ser bem definida.</p><p>Não existe um conjunto de animais igual, nem uma faixa de</p><p>terra de igual fertilidade. Em experimentação, porém, as unidades não</p><p>precisam ser iguais. Basta que respondam aos tratamentos da mesma</p><p>forma.</p><p>Por exemplo, nos testes de ganho de peso os animais não</p><p>precisam ser iguais, mas, para que sejam considerados similares, é</p><p>preciso que sejam da mesma raça, mesmo sexo, mesma idade e que</p><p>tenham, no início do experimento, pesos bastante próximos.</p><p>É comum, nesses experimentos (inteiramente ao acaso), que</p><p>todos os tratamentos tenham igual número de repetições.</p><p>Experimentos inteiramente ao acaso com número diferente de</p><p>repetições</p><p>O pesquisador nem sempre dispõe para seu experimento de</p><p>um número de unidades que é múltiplo do número de tratamentos que</p><p>UNiDADE 05128</p><p>pretende estudar.</p><p>Vejamos um exemplo:</p><p>O que deve fazer um professor que pretende comparar dois</p><p>métodos de ensino e dispõe, para seu experimento, de 41 crianças</p><p>similares em relação à aptidão para aprender?</p><p>Com base no que foi visto até aqui, o professor precisa dividir o</p><p>conjunto de 41 crianças em dois grupos iguais. Para isso, seria preciso</p><p>descartar uma criança. No entanto, o professor poderia dividir o conjunto</p><p>de 41 crianças em dois grupos em tamanho diferentes. Um grupo poderia</p><p>ter, por exemplo, 20 crianças e o outro 21.</p><p>Este é o delineamento de um experimento inteiramente ao acaso</p><p>com número diferente de repetições</p><p>bioEstAtístiCA 129</p><p>BAYER, A; BITTENCOURT, H. R.; ROCHA, J. ECHEVESTE, S. A</p><p>Estatística e a sua história. In: XII Simpósio Sul brasileiro de Ensino de</p><p>Ciências, 2004. Canoas. Anais do XII Simpósio Sul brasileiro de Ensino</p><p>de Ciências 2004, c v. 1, p.1-12.</p><p>BÍBLIA, Traduzida em português por João Ferreira de Almeida. Revisada</p><p>e atualizada no Brasil. 2 ed. Barueri-SP: Sociedade Bíblica do Brasil,</p><p>2007. Quarto livro de Moisés (Números) 1-2, p. 140; Lucas, Mt. 1.18-25,</p><p>p.1023.</p><p>COSTA-NETO, P.L. de O. Estatística. 2ª ed. Rio de Janeiro. Editora</p><p>Edgard Blucher, 2002. 265p.</p><p>FERREIRA, A. B. de H. Novo dicionário da língua portuguesa. Rio de</p><p>Janeiro: Nova Fronteira. 2002. p. 717.</p><p>MOREIRA, J. S. Elementos da estatística. São Paulo: Atlas, 1964. p.</p><p>11-12.</p><p>TOLEDO, G. L. & OVALLE, I. I. Estatística básica. São Paulo: Atlas.</p><p>1985, 459p.</p><p>SESAPI/DUVAS. Secretaria Estadual de Saúde do Piauí/Diretoria de</p><p>Unidade de Vigilância e Atenção a Saúde – Boletim Epidemiológico.</p><p>Ano 03 – No01 – Março de 2005.</p><p>rEFErêNCiAs130</p><p>Referências na Web</p><p>BRASIL. LEI nº 4739 de 15/07/1965. Diário Oficial da União de 19 de</p><p>julho. 1965. Disponível em <http://www.3.dataprev.gov.br/SISLEX/</p><p>paginas/42/1965/4739.htm.> Acesso em 20 de SET. de 2008.</p><p>FERREIRA, M.J. & TAVARES, I.</p><p>Nota sobre a história da Estatística</p><p>Dossiês didáticos. Disponível em <htt://alea-estp.inet.pt.> Acesso em 30</p><p>de março de 2006.</p><p>GOVERNO DO ESTADO DO PIAUÍ. Plano Plurianual Q U A D R I Ê N I</p><p>O 2008/2011. Disponível em < > Acesso em 13 de dezembro de 2011.</p><p>IBGE.</p><p>Ministério da Saúde/SVS - Sistema de Informações sobre Mortalidade</p><p>( Ministério da Saúde/Indicadores e Dados Básicos - Brasil - 2009)</p><p>Referências consultadas</p><p>ARANGO, H. G. Bioestatística teórica computacional. Rio de Janeiro:</p><p>Guanabara Koogan. 2005.</p><p>BARBETTA, P. A.. Estatística aplicada às ciências sociais. 6ed. Editora</p><p>UFSC, livros série Didática, 2005.</p><p>BERQUÓ, E. S.; Souza, J.M.P.; GOTLIEB, S.L.D. Bioestatística. São</p><p>Paulo: EPU, 1981.</p><p>BUSSAB, W. O.; MORETTIN, P. A.– Estatística Básica. 4ª ed. São</p><p>Paulo: Atual Editora, 1987.</p><p>BRUNI, A. L. Estatística aplicada à gestão empresarial. São Paulo:</p><p>Atlas, 2007. p. 2-3.</p><p>COSTA NETO, P. L. O.. Estatística. São Paulo: Edgar Blucher, , 1977.</p><p>bioEstAtístiCA 131</p><p>CRESPO, A. A. Estatística Fácil. São Paulo: Saraiva, 1999.</p><p>JEKEL, J.F. et al. Epidemiologia, bioestatística e medicina preventiva.</p><p>Rio de Janeiro: Guanabara Koogan. 2005.</p><p>LEVIN,J. Estatística aplicada às ciências médicas. São Paulo: Harbra,</p><p>1987.</p><p>KUME, H.. Métodos Estatísticos para melhoria da qualidade. São</p><p>Paulo: Editora Gente. 1993.</p><p>MONTGOMERY, D. Introduction to Linear Regression Analysis. John</p><p>Willey & Sons. 1992.</p><p>PIMENTEL., GOMES, F. Curso de estatística experimental. 13 ed. São</p><p>Paulo: Nobel, 1990.</p><p>STEVENSON, W. J. Estatística Aplicada à Administração. Tradução</p><p>Alfredo de Farias. São Paulo: Harper & Raw do Brasil, 1981.</p><p>TRIOLA, M. F. Introdução à estatística. Tradução de Vera Regina Lima</p><p>de Farias e Flores, revisão técnica de Ana Maria Lima de Farias Flores.</p><p>Rio de Janeiro: Livros Técnicos e Científicos Editora. 9ª ed. 2005.</p><p>VIEIRA, S. Introdução à Bioestatística. Rio de Janeiro: Campus, 1997.</p><p>_______. Elementos de /estatística. São Paulo: Atlas, 2003.</p><p>ANEXos132</p><p>ANEXO 1</p><p>TRABALHO DE BIOESTATÍSTICA</p><p>Valores de MASSA OSSEA (BMD) e FÊMUR de 30 mulheres,</p><p>levando-se em consideração outras variáveis de interesse.</p><p>bioEstAtístiCA 133</p><p>QUESTÕES</p><p>1) Classifique todas as variáveis mencionadas (se qualitativa nominal ou</p><p>ordinal, quantitativa discreta ou continua).</p><p>2) Encontre MEDIDAS DESCRITIVAS das variáveis: BMDCOL e</p><p>BMDFEM.</p><p>3) Utilizando a variável tempo de menopausa (TEMPOM) divida os</p><p>indivíduos em três grupos com o tempo: Grupo 1: 0 anos; Grupo 2: de 1</p><p>a 9 anos, e grupo 3: mais de 9 anos de menopausa. Ache as MÉDIAS E</p><p>DESVIOS PADRÕES das variáveis BMDCOL e BMDFEM de cada grupo.</p><p>Faça um gráfico comparativo.</p><p>Grupo 1=0 anos</p><p>Grupo 2 = 1 a 9 anos</p><p>Grupo 3 = Mais de 9 anos</p><p>ANEXos134</p><p>4) Retire uma amostra causal simples de tamanho 10 da população</p><p>acima, e descreva o procedimento que você utilizou.</p><p>Logo os dados da que irão compor a amostra são:</p><p>OBS.: Todas as questões abaixo devem ser respondidas usando os</p><p>dados da amostra sorteada.</p><p>A partir de agora os dados da tabela representam toda a população.</p><p>5) Ache MEDIAS e DESVIOS PADROES de todas as variáveis cotínuas.</p><p>Compare os resultados das variáveis BMDCOL e BMDFEM com as</p><p>encontradas na questão 2.</p><p>bioEstAtístiCA 135</p><p>Para comparar a média amostral com a populacional, aplique u</p><p>Teste de Hipótese para a diferença de duas médias, usando α = 5%.</p><p>Conclusão: ___________________________________________</p><p>Conclusão: ___________________________________________</p><p>6) Separe os indivíduos em três classes segundo o mesmo critério da</p><p>questão 3. Encontra as MEDIAS da BMD da coluna e do fêmur para cada</p><p>classe. As três classes são comparáveis segundo as médias? Compare</p><p>com as medidas levantadas na questão 3.</p><p>Grupo 1 = 0 anos</p><p>Grupo 2 = 1 a 9 anos</p><p>Grupo 3 = Mais de 9 anos</p><p>ANEXos136</p><p>Grupo 1 = 0 anos</p><p>Conclusão: ___________________________________________</p><p>Conclusão: ___________________________________________</p><p>Grupo 2 = 1 a 9 anos</p><p>Conclusão: ___________________________________________</p><p>Conclusão: ___________________________________________</p><p>Grupo 3 = Mais de 9 anos</p><p>Conclusão: ___________________________________________</p><p>bioEstAtístiCA 137</p><p>Conclusão: ___________________________________________</p><p>7) Encontre INTERVALOS DE 95% DE CONFIANÇA para as MÉDIAS de</p><p>cada classe para ambas as variáveis BMDCOL e BMDFEM.</p><p>8) Também para uma dessas variáveis, teste se as médias das classes</p><p>são iguais ou não.</p><p>Conclusão: ___________________________________________</p><p>Conclusão: ___________________________________________</p><p>Conclusão: ___________________________________________</p><p>Conclusão: ___________________________________________</p><p>ANEXos138</p><p>Conclusão: ___________________________________________</p><p>Conclusão: ___________________________________________</p><p>9) Separe os indivíduos segundo a CLASSIFICAÇÃO DA OMS: até –</p><p>1,00 ZCOL: NORMAL; de – 1,00 a 2,50 ZCOL: OSTEOPENIA e menor</p><p>de – 2,50 ZCOL: OSTEOPOROSE. Repita os exercícios 9 a 10, para as</p><p>BMD da coluna e fêmur.</p><p>Grupo OSTEOPOROSE ZCOL < 2,5</p><p>Grupo NORMAL -2,5 < ZCOL < -1,0</p><p>Grupo OSTEOPENIA -1,0 < ZCOL < 2,5</p><p>bioEstAtístiCA 139</p><p>Grupo NORMAL -2,5 < ZCOL < -1,0</p><p>Grupo OSTEOPENIA -1,0 < ZCOL < 2,5</p><p>Comparação das médias para os grupos NORMAL e OSTEOPENIA</p><p>Conclusão: ___________________________________________</p><p>Conclusão: ___________________________________________</p><p>ANEXos140</p><p>ANEXO II</p><p>bioEstAtístiCA 141</p><p>ANEXos142</p><p>bioEstAtístiCA 143</p><p>ANEXos144</p><p>bioEstAtístiCA 145</p><p>ANEXos146</p><p>Tabelas estraidas do livro "Curso de Estatística" de Jairo</p><p>Simon e Gilberto de Andrade.</p><p>das técnicas da estatística é bem antiga,</p><p>podendo-se citar várias passagens Bíblicas, com indícios que sugerem</p><p>a existência de censos muito antigos, realizados por volta de 3000 a.C,</p><p>na Babilônia, China e Egito. O livro dos Números do Velho Testamento</p><p>começa com uma ilustração a Moisés.</p><p>No segundo ano após a saída dos filhos de Israel do</p><p>Egito, no primeiro dia do segundo mês, falou o SENHOR</p><p>a Moisés, no deserto do Sinai, na tenda da congregação,</p><p>dizendo: Levantai o censo de toda a congregação dos</p><p>filhos de Israel, segundo as suas famílias, segundo a casa</p><p>de seus pais, contando todos os homens, nominalmente,</p><p>cabeça por cabeça. Da idade de vinte anos para cima,</p><p>todos os capazes de sair à guerra em Israel, a esses</p><p>contareis segundo os seus exércitos, tu e Arão (BÍBLIA</p><p>SAGRADA, 2007, p. 141).</p><p>O filósofo grego Aristóteles (384 a.C.-322 a.C.), ao escrever</p><p>sobre Atenas, não falava apenas da cidade, de seu governo, de justiça,</p><p>costumes e arte; ele também comparava Atenas às demais cidades,</p><p>denotando, assim, em sua obra, alguns princípios de estatística descritiva</p><p>(FERREIRA E TAVARES, 2006).</p><p>Um outro fato estatístico relevante descrito na Bíblia Sagrada</p><p>ocorreu na época do imperador romano César Augusto:</p><p>bioEstAtístiCA 13</p><p>Naquele dia, foi publicado um decreto de César</p><p>Augusto, convocando toda a população do império para</p><p>recensear-se. Este, o primeiro recenseamento, foi feito</p><p>quando Quirino era governador da Síria. Todos iam</p><p>alistar-se, cada um à sua própria cidade. José também</p><p>subiu da Galiléia, da cidade de Nazaré, para a Judéia,</p><p>a cidade de Davi, chamada Belém, por ser ele da casa</p><p>e família de Davi, a fim de alistar-se com Maria, sua</p><p>esposa, que estava grávida. Estando eles ali, aconteceu</p><p>completarem-se os dias e ela deu à luz o seu filho</p><p>primogênito, enfaixou-o e o deixou numa manjedoura,</p><p>porque não havia lugar para eles na hospedaria (BÍBLIA</p><p>SAGRADA 2007, p. 1023).</p><p>Então, essa convocação de Augusto César para o povo se</p><p>recensear em sua cidade de origem contribuiu para que Maria e José</p><p>viajassem para Belém.</p><p>Em 1085, Guilherme, o Conquistador, ordenou a realização de</p><p>um levantamento estatístico da Inglaterra que deveria incluir informações</p><p>sobre terras, proprietários, uso da terra, animais e empregados. Este</p><p>levantamento serviria de base para o cálculo de impostos. O estudo</p><p>originou um volume, conhecido como Domesday book (livro do dia do</p><p>juízo final).</p><p>No século XVII, a estatística ganhou destaque na Inglaterra, a</p><p>partir das tábuas de mortalidade, aritmética política de John Graunt, que</p><p>consiste na análise extensa de nascimentos e mortes.</p><p>Os estudos sobre probabilidade deram à Estatística uma nova</p><p>dimensão; os primeiros a contribuírem para a matematização da</p><p>Estatística foram o suíço Jakob Bernoulli (1654-1705), com o cálculo das</p><p>probabilidades e o britânico Thomas Bayes (1702-1761), com o teorema</p><p>de bayes. Entretanto, os estudos do francês Pierre Simon, Marquis de</p><p>Laplace (1749-1827), do alemão Johnn Carl Friedrich Grauss (1777-</p><p>1855) e do belga Lambert Adophe Jacques Quetelet (1796-1874) foram</p><p>fundamentais para o desenvolvimento do cálculo das probabilidades,</p><p>introduzindo novos métodos e ideias, sendo considerado até hoje um</p><p>dos mais importantes trabalhos sobre o assunto (MOREIRA, 1964, p. 11).</p><p>No século XVIII, a Universidade de Viena promoveu, pela primeira</p><p>vez, um curso avançado de Estatística.</p><p>No século XIX, iniciou-se a aplicação da Estatística aos fenômenos</p><p>sociais e Quetelet foi um dos principais responsáveis por isso. Em sua</p><p>obra publicada em 1835, intitulada "Sur l'homme et le developpement</p><p>UNiDADE 0114</p><p>de ses facultés, essai d'une physique sociale" apresentou sua</p><p>concepção do homem médio, como sendo o valor central das medidas</p><p>de características humanas, que são agrupadas de acordo com a curva</p><p>normal. Ele foi o organizador da primeira conferência internacional sobre</p><p>estatística realizada em 1853. A partir de 1883, a pedido do governo</p><p>Belga, Quetelet se estabeleceu em um observatório em Bruxelas para</p><p>trabalhar com dados estatísticos, geográficos e meteorológicos. Além</p><p>disso, estabeleceu métodos para a comparação e avaliação de dados.</p><p>No século XX, os métodos de aplicações estatísticas evoluíram</p><p>e aperfeiçoaram-se e suas práticas percorreram inúmeras áreas de</p><p>atividades humanas. No início desse século, a estatística inferencial</p><p>tomou impulso e ao término da mesma, com o estabelecimento de novas</p><p>tecnologias, deu agilidade e impulso à aplicação da estatística. Desta</p><p>forma, essa ciência passou a ser encarada como uma ferramenta que</p><p>permite compreender e interpretar o mundo que nos rodeia (FERREIRA</p><p>E TAVARES, 2006).</p><p>De acordo com Bruni (2007, p. 2-3), a história da estatística pode</p><p>ser subdividida em três etapas: sendo a primeira referente ao período</p><p>mais antigo, caracterizada pela organização de informações de interesse</p><p>estatal. A segunda ocorreu entre os meados do século XVII e início</p><p>do século XIX, caracterizada pelas inúmeras tentativas de analisar as</p><p>tabelas e os conjuntos de dados com a finalidade de obter conclusões</p><p>que pudessem interessar à organização do Estado ou ter aplicação</p><p>específica através de previsões para o futuro. A terceira fase teve início</p><p>com o Congresso Internacional de Estatística realizado em 1853 e se</p><p>estendeu aos dias de hoje. Esta última etapa é marcada não somente</p><p>pelos avanços e aperfeiçoamentos tecnológicos da Estatística, como</p><p>também, pelas múltiplas aplicações que essa ciência vem alcançando com</p><p>ênfase maior na pesquisa científica. Desta forma, torna-se fundamental</p><p>compreender que a Estatística constitui um dos mais seguros, eficientes</p><p>e necessários instrumentos da ciência moderna.</p><p>No Brasil, considerando-se essas três etapas da história da</p><p>estatística, pode-se dizer que essa ciência foi introduzida no final da</p><p>segunda e início da terceira etapa.</p><p>De acordo com a Grande Enciclopédia Delta Larousse publicada</p><p>em 1971, a introdução da estatística, no Brasil, ocorreu com a criação da</p><p>Diretoria Geral de Estatística do Império, em caráter autônomo, através</p><p>do decreto de 14 de janeiro de 1871. Os decretos de 9 de setembro</p><p>e 30 de dezembro de 1870 autorizaram o primeiro recenseamento da</p><p>bioEstAtístiCA 15</p><p>população brasileira. Vinte anos depois, foi feito o segundo censo e outros</p><p>ocorreram com intervalos entre eles de vinte anos, os mais recentes têm</p><p>intervalos de dez anos.</p><p>No século XX, no Brasil, a estatística alcançou sua maior expansão</p><p>com a criação, em 1938, do Instituto Brasileiro de Geografia e Estatística</p><p>(IBGE), que passou a responder pelas pesquisas oficiais no país</p><p>(MOREIRA, 1964, p. 12). Hoje, o IBGE é chamado de Fundação Instituto</p><p>Brasileiro de Geografia e Estatística, sendo integrante da Administração</p><p>Federal, subordinado diretamente à Secretaria de Planejamento e</p><p>Coordenação Geral da Presidência da República – Seplan/PR, tendo seu</p><p>estatuto sido aprovado pelo Decreto nº. 97.434 de 05 de janeiro de 1989.</p><p>Vinte e sete anos depois da criação do IBGE, a profissão de</p><p>estatístico foi legalizada no Brasil (15/07/1965, pela Lei nº 4739, publicada</p><p>no Diário Oficial da União de 19 de julho de 1965). De acordo com essa</p><p>lei, é competência do Estatístico:</p><p>Coletar, analisar e interpretar informações estatísticas</p><p>referentes aos setores econômico, financeiro, agrícola,</p><p>industrial, social e científico; atuar em pesquisas e</p><p>análise de mercado e opinião pública. Determinar os</p><p>tipos de amostragens mais convenientes, participar</p><p>dos planejamentos de experimentos e elaborar</p><p>padronizações estatísticas; planejar e dirigir pesquisas</p><p>e levantamentos estatísticos de controle de qualidade.</p><p>Participar na escrituração de livros e registros e controle</p><p>estatístico de exigência legal; analisar os dados</p><p>obtidos em recenseamento, elaborando tabulações dos</p><p>resultados obtidos (BRASIL, 2008).</p><p>Hoje, a estatística é uma ferramenta bastante utilizada por todas</p><p>as ciências, o seu campo de aplicação ampliou a análise de dados da</p><p>Biologia, Medicina,</p><p>Física, Psicologia, Meteorologia, Indústria, Comércio,</p><p>Educação, Sociologia e outros. Isso tem feito com que o MEC venha</p><p>incentivando a inclusão dos conteúdos de Estatística na formação desses</p><p>profissionais.</p><p>Nos cursos de ciências biológicas, medicina, enfermagem,</p><p>fisioterapia e biomédicas os estudos de estatística recebem a denominação</p><p>de Bioestatística.</p><p>UNiDADE 0116</p><p>Bioestatística</p><p>Conceito: é um conjunto de técnicas ou processos que permite observar,</p><p>descrever numericamente e analisar fatos numéricos nas ciências da</p><p>vida, ou seja, é a estatística biológica.</p><p>A estatística pode ser uma ciência, mas nós a trataremos como</p><p>um instrumento auxiliar a todas as ciências, pois não possui um objetivo</p><p>próprio, por isso pode ser usada por qualquer pessoa que saiba manipular</p><p>números: médico, biólogo, enfermeiro, fisioterapeuta, etc.</p><p>Aplicações</p><p>• Nascimentos, óbitos e perdas fetais;</p><p>• Doenças;</p><p>• Educação;</p><p>• Ecologia;</p><p>• Botânica;</p><p>• Zoologia;</p><p>• Serviços.</p><p>Principais Definições</p><p>População x Amostra</p><p>• População (N): conjunto de todos os elementos relativos a</p><p>um determinado fenômeno que possuem pelo menos uma</p><p>característica em comum, a população é o conjunto universo,</p><p>podendo ser finita ou infinita. Exemplos: o conjunto formado</p><p>por todos os alunos da UAPI.</p><p>Finita – apresenta um número limitado de observações, que</p><p>é passível de contagem. Exemplo: número de alunos de</p><p>Ciências Biológicas modalidade a distância da UAB-PI.</p><p>Obs: quando a população é menor que 100.000 é considerada</p><p>finita.</p><p>Infinita - apresenta um número ilimitado de observações, é</p><p>impossível de contar e geralmente está associada a processos.</p><p>Exemplo: população do número de eleitores do estado do</p><p>bioEstAtístiCA 17</p><p>Piauí. Obs: quando a população for maior que 100.000, é</p><p>considerada infinita.</p><p>• Amostra (n): é um subconjunto da população e deverá ser</p><p>considerada finita, a amostra deve ser selecionada seguindo</p><p>certas regras e deve ser representativa, de modo que ela</p><p>represente todas as características da população como se</p><p>fosse uma fotografia desta. Exemplos: alunos do sétimo</p><p>período do curso de licenciatura em ciências biológicas da</p><p>UAB-PI.</p><p>Uma população pode, mediante processos operacionais, ser</p><p>considerada infinita, pois a mesma irá depender do tamanho da amostra.</p><p>Se a frequência relativa entre amostra e população for menor do que</p><p>5%, é considerada infinita se a frequência relativa for maior do que 5%,</p><p>é considerada finita.</p><p>Censo x Amostragem</p><p>• Pesquisa Estatística: é qualquer informação retirada de uma</p><p>população ou amostra, podendo ser através de censo ou</p><p>amostragem.</p><p>• Censo: é a coleta exaustiva de informações das “N” unidades</p><p>populacionais.</p><p>• Amostragem: é o processo de retirada de informações dos</p><p>“n” elementos amostrais, no qual deve seguir um método</p><p>criterioso e adequado (tipos de amostragem, será estudado</p><p>mais adiante na unidade 3).</p><p>Dado x Variável</p><p>• Dados estatísticos: é qualquer característica que possa ser</p><p>observada ou medida de alguma maneira. As matérias-primas</p><p>da estatística são os dados observáveis.</p><p>• Variável: é aquilo que se deseja observar para se tirar</p><p>algum tipo de conclusão, geralmente, as variáveis para</p><p>estudo são selecionadas por processos de amostragem.</p><p>Os símbolos utilizados para representar as variáveis são as</p><p>letras maiúsculas do alfabeto, tais como X, Y, Z, ... que podem</p><p>UNiDADE 0118</p><p>assumir qualquer valor de um conjunto de dados. As variáveis</p><p>podem ser classificadas dos seguintes modos:</p><p>• Qualitativas (ou atributos): são características de uma</p><p>população que não podem ser medidas.</p><p>• Nominal: são utilizados símbolos ou números para</p><p>representar determinado tipo de dados, mostrando, assim,</p><p>a qual grupo ou categoria eles pertencem.</p><p>• Ordinal: quando uma classificação for dividida em</p><p>categorias ordenadas em graus convencionados, havendo</p><p>uma relação entre as categorias do tipo “maior do que”,</p><p>“menor do que”, “igual a”, os dados por postos consistem</p><p>de valores relativos atribuídos para denotar a ordem de</p><p>primeiro, terceiro e, assim, sucessivamente.</p><p>• Quantitativas: são características populacionais que</p><p>podem ser quantificadas, sendo classificadas em discretas</p><p>e contínuas.</p><p>• Discretas: são aquelas variáveis que podem assumir</p><p>somente valores inteiros num conjunto de valores. São</p><p>geradas pelo processo de contagem, como o número de</p><p>veículos que passa um posto de gasolina, o número de</p><p>estudantes nesta sala de aula, quantos dias por semana</p><p>você usa internet (Xi={0, 1, 2, 3, 4, 5, 6, 7}).</p><p>• Contínuas: são aquelas variáveis que podem assumir um</p><p>valor dentro de um intervalo de valores. São geradas pelo</p><p>processo de medição. Neste caso serve como exemplo,</p><p>o volume de água em um reservatório ou o peso de um</p><p>pacote de cereal ou quantas horas por dia você usa a</p><p>internet (Yi={0, ...1,..2..., 3,...24}).</p><p>Obs: na variável continua se trabalha com intervalos.</p><p>Parâmetros x Estatísticas</p><p>• Parâmetros: são medidas populacionais quando se investiga</p><p>a população em sua totalidade. Neste caso, é impossível fazer</p><p>inferências, pois toda a população foi investigada.</p><p>• Estatísticas ou Estimadores: são medidas obtidas da</p><p>amostra, torna-se possível neste caso utilizarmos as teorias</p><p>bioEstAtístiCA 19</p><p>inferências para que possamos fazer conclusões sobre a</p><p>população.</p><p>Arredondamento de Dados</p><p>Regras: Portaria 36 de 06/07/1965 – INPM – Instituto Nacional de</p><p>Pesos e Medidas.</p><p>1º - Se o primeiro algarismo, após aquele que iremos arredondar, for de</p><p>0 a 4, conservamos o algarismo a ser arredondado e desprezamos os</p><p>seguintes.</p><p>Ex.: 9,34856 (para décimos) → 9,3.</p><p>2º - Se o primeiro algarismo, após aquele que formos arredondar, for de</p><p>6 a 9, acrescentamos uma unidade no algarismo a ser arredondado e</p><p>desprezamos os seguintes.</p><p>Ex.: 2,2734 (para décimos) → 2,3</p><p>3º - Se o primeiro algarismo, após aquele que formos arredondar, for 5,</p><p>seguido apenas de zeros, conservamos o algarismo, se ele for par, ou</p><p>aumentamos uma unidade se ele for ímpar, desprezando os seguintes.</p><p>Ex.: 5,2500 (para décimos) → 5,2</p><p>14,350 (para décimos) → 14,4</p><p>E se o 5 for seguido de outros algarismos dos quais, pelo menos</p><p>um é diferente de zero, aumentamos uma unidade no algarismo e</p><p>desprezamos os seguintes.</p><p>Ex.: 6,2502 (para décimos) → 6,3</p><p>7,4503 (para décimos) → 7,5</p><p>UNiDADE 0120</p><p>4º - Quando, arredondamos uma série de parcelas e a soma ficar alterada,</p><p>devemos fazer um novo arredondamento (por falta ou por excesso), na</p><p>maior parcela do conjunto, de modo que a soma fique inalterada.</p><p>Ex.: 16,4% + 19,4% + 13,3% + 29,7% + 21,2% = 100%</p><p>Arredondando para inteiro:</p><p>16% + 19% + 13% + 30% + 21% = 99%</p><p>16% + 19% + 13% + 31% + 21% = 100%</p><p>Estatística vital</p><p>A bioestatística nas ciências da vida</p><p>Um dos grandes problemas que se apresentam ao profissional da</p><p>área de ciências da vida é referente à mensuração do padrão de vida, ou</p><p>nível de vida, da população com o qual está trabalhando. Têm sido alvo</p><p>de comparação os níveis de vida entre diversos países, ou em diferentes</p><p>períodos em um mesmo país.</p><p>No início da década de 50, a ONU, por meio do seu Conselho</p><p>Econômico e Social, formou um comitê, a fim de preparar um informe</p><p>sobre os métodos mais satisfatórios para definir e avaliar o nível de vida.</p><p>Dada a complexidade do assunto, não foi possível construir um</p><p>índice único que traduzisse o nível de vida de uma população e que</p><p>pudesse ter aplicação internacional.</p><p>Para isso, o comitê sugeriu que fossem considerados,</p><p>separadamente, doze componentes passíveis de quantificação:</p><p>1) Saúde – incluindo condições demográficas;</p><p>2) Alimentos e nutrição;</p><p>3) Educação – incluindo alfabetização e ensino técnico;</p><p>4) Condições de trabalho;</p><p>5) Situação em matéria de emprego;</p><p>6) Consumo e economia gerais;</p><p>7) Transporte;</p><p>8) Moradia – incluindo saneamento e instalações domésticas;</p><p>bioEstAtístiCA 21</p><p>9) Vestuário;</p><p>10) Recreação;</p><p>11) Segurança social e</p><p>12) Liberdade humana.</p><p>Mesmo faltando alguns</p><p>itens quanto aos aspectos significativos</p><p>da vida e de difícil obtenção, esses componentes poderiam formar um</p><p>quadro de qualidade de vida de uma população.</p><p>Saúde – incluindo condições demográficas</p><p>A questão que surge é a definição do que se quer medir, isto é,</p><p>saúde. A distinção entre “vivo” e “morto” é clara e bem definida; já o</p><p>mesmo não ocorre entre “saúde” e “doença”. Não existe uma demarcação</p><p>exata entre ambas, exceto em caso de doenças agudas.</p><p>Assim, a dificuldade de se mensurar saúde, ainda que existam</p><p>indicadores aceitos é utilizado há muito tempo, onde a maioria deles tem</p><p>a função de medir a ausência de saúde.</p><p>Alguns requisitos em relação a esses indicadores:</p><p>1. Existência de dados para toda a população geograficamente</p><p>considerada;</p><p>2. As definições empregadas para construir esses índices devem</p><p>ser o mesmo em todos os países;</p><p>3. Devem ser de construção fácil e de simples interpretação;</p><p>4. Devem refletir o maior número que influam no estado da saúde;</p><p>5. Devem ter um poder discriminatório, a fim de permitir</p><p>comparações entre grupos em estudo.</p><p>A Organização Mundial da Saúde (OMS) em seu informe técnico</p><p>137 (21), sugere três indicadores de saúde:</p><p>1 – Aqueles que tentam traduzir diretamente a saúde (ou a sua</p><p>falta) em um grupo populacional. São dois tipos:</p><p>I Globais:</p><p>- Razão de mortalidade proporcional</p><p>- Coeficiente geral de mortalidade</p><p>- Esperança de vida ao nascer</p><p>II Específicos:</p><p>UNiDADE 0122</p><p>- Coeficiente de mortalidade infantil</p><p>- Coeficiente de mortalidade por doenças transmissíveis</p><p>2 – Aqueles que se referem às condições do meio e que têm</p><p>influência sobre a saúde: abastecimento de água, rede de esgoto,</p><p>contaminações ambientais.</p><p>3 – Aqueles que procuram medir os recursos materiais e humanos</p><p>relacionados às atividades de saúde: rede de postos de saúde,</p><p>número de profissionais de saúde, número de leitos hospitalares.</p><p>Medidas estatísticas e principais indicadores em saúde</p><p>Principais Indicadores</p><p>Os valores numéricos referentes à contagem de qualquer evento</p><p>de interesse em Medicina do Trabalho, e obtido pelos diferentes tipos de</p><p>levantamentos (contínuo, periódico ou ocasional), são necessários para</p><p>o conhecimento de uma determinada situação que se deseja avaliar. O</p><p>tipo ou modo de apresentar esses casos (nascimento, óbitos, doenças,</p><p>consultas, etc.), isto é, a tradução numérica poderá ser dada através de:</p><p>- Frequências relativas ou proporções;</p><p>- Números-indices;</p><p>- Coeficientes ou taxas;</p><p>- Índices.</p><p>Frequência relativa ou proporção</p><p>É a relação entre o número de elementos e o total de elementos</p><p>considerados. Geralmente, as frequências relativas são expressas em</p><p>porcentagem.</p><p>(Número de casos diagnosticados) x 100</p><p>fr =</p><p>Número total de casos</p><p>bioEstAtístiCA 23</p><p>Número-índice</p><p>É uma maneira de apresentar a evolução, no tempo, de</p><p>determinado valor numérico que representa a frequência de um evento,</p><p>atribuindo ao valor inicial um outro número, geralmente 100. O número-</p><p>índice é utilizado para comparar as frequências de eventos em diferentes</p><p>classes. O cálculo nada mais é do que uma regra de três.</p><p>Exemplo:</p><p>Distribuição dos exames citopatológico (Câncer) /Piauí 1998 a 2004</p><p>Fonte: SISCOLO/DATASUS (apud SESAPI/DUVAS, 2005)</p><p>Interpretação</p><p>Em 1999 houve um acréscimo de (108-100) 8% do número de</p><p>pacientes que fizeram exames citopatológico no estado do Piauí e em</p><p>2004 houve um decréscimo de (100-90) de 10%, em relação ao ano de</p><p>1998.</p><p>Coeficiente ou taxa</p><p>É uma relação (quociente) entre dois valores numéricos que</p><p>estimaria uma probabilidade ou determinado risco.</p><p>Número de vezes que ocorreu o evento</p><p>Coeficiente e =</p><p>Número de pessoas expostas ao risco de apresentar</p><p>tal evento</p><p>UNiDADE 0124</p><p>É usual multiplicar-se o resultado por um número múltiplo</p><p>de 10 (100, 1000, 10000), que constitui a base do coeficiente à qual</p><p>deve, obrigatoriamente, ser acrescentado a unidade de referência do</p><p>denominador (habitantes, homens, mulheres, nascidos vivos, etc.).</p><p>Alguns coeficientes na área de Medicina do Trabalho</p><p>a) Coeficiente geral de mortalidade</p><p>nº de óbitos na área X, período t * 1000</p><p>CGM =</p><p>População da área X, período t</p><p>b) Coeficiente de mortalidade infantil</p><p>nº de óbitos de menores de 1 ano, na área X, ano t * 1000</p><p>CMI =</p><p>nº de nascidos vivos, na área X, ano t</p><p>c) Coeficiente de natimortalidade</p><p>nº de perdas fetais (natimortos), na área X, ano t * 1000</p><p>CN =</p><p>nº de nascidos vivos + nº de perdas tardias, na área X, ano t</p><p>d) Coeficiente de mortalidade perinatal</p><p>nº de natimortos + nº de óbitos de 0 a 7 anos,</p><p>na área X, ano t * 1000</p><p>CMP =</p><p>nº de nascidos vivos + nº de perdas tardias,</p><p>na área X, ano t</p><p>e) Coeficiente de natalidade</p><p>nº de nascidos vivos, na área X, período t * 1000</p><p>CN =</p><p>População da área X, período t</p><p>f) Coeficiente de incidência</p><p>nº de óbitos devido a doença A, na área X, período t * 1000</p><p>CL =</p><p>no total de casos da doença A, na área X, período t</p><p>bioEstAtístiCA 25</p><p>g) Coeficiente de prevalência</p><p>nº de casos existentes (novos + antigos), na área X,</p><p>período t * 1000</p><p>Cp =</p><p>População da área X, período t</p><p>h) Coeficiente de letalidade</p><p>nº de óbitos devido a doença A, na área X, período t * 1000</p><p>CL =</p><p>no total de casos da doença A, na área X, período t</p><p>Índice</p><p>É muito importante distinguir índice de coeficiente ou taxa, ou</p><p>seja, um índice não indica uma probabilidade, é também um quociente,</p><p>mas o que está expresso no denominador não está sujeito ao risco de</p><p>vir a apresentar o evento que está expresso no numerador. Logo óbito/</p><p>população vem a ser um coeficiente, no caso de mortalidade, ou ainda,</p><p>este coeficiente indica que aquilo que está expresso no denominador</p><p>(população) está sujeito ao risco de apresentar aquilo que está expresso</p><p>no numerador (óbito). Já a relação hospital/população é um índice e não</p><p>expressa probabilidade, dá apenas a informação do número de hospitais</p><p>por habitante.</p><p>Exemplos: médico/hab., leitos/hab., telefones/hab, enfermeiros/</p><p>hab.</p><p>Metodologia de investigação</p><p>Todos esses índices, citados acima, são importantes no estudo</p><p>da Epidemiologia, que nada mais é, do que o estudo das condições de</p><p>saúde e a ocorrência de doenças na população, procurando identificar</p><p>os fatores (e a sua interdependência) que influenciam essas ocorrências,</p><p>para tornar possível que se atue sobre eles, visando a melhoria das</p><p>condições de saúde ou a prevenção das doenças, conforme a notificação</p><p>compulsória (Portaria 608 de outubro de 1979 do Ministério da Saúde –</p><p>GB).</p><p>UNiDADE 0126</p><p>Etapas do método epidemiológico</p><p>Definição do problema e esclarecimento dos objetivos</p><p>Avaliação crítica das informações existentes</p><p>Formulação da hipótese</p><p>-Método de diferença – “incidência diferencial”</p><p>-Método de concordância</p><p>-Método de variação concomitante</p><p>-Método da analogia</p><p>Verificação de hipóteses</p><p>Aplicação da notificação</p><p>Objetivos da notificação</p><p>-Proteção à comunidade;</p><p>-Assistência ao doente e ao portador;</p><p>-Coleta e tabulação de dados.</p><p>A notificação é à base de qualquer trabalho epidemiológico.</p><p>Doenças objeto de notificação</p><p>a) Território nacional</p><p>b) Áreas específicas</p><p>bioEstAtístiCA 27</p><p>Fases do método estatístico</p><p>O método estatístico abrange as seguintes fases:</p><p>a) Definição do Problema</p><p>Consiste na:</p><p>• Formulação correta do problema;</p><p>• Examinar outros levantamentos realizados no mesmo</p><p>campo (revisão da literatura);</p><p>• Saber exatamente o que se pretende pesquisar definindo</p><p>o problema corretamente (variáveis, população, hipóteses,</p><p>etc.).</p><p>b) Planejamento</p><p>Determinar o procedimento necessário para resolver o problema:</p><p>• Como levantar informações;</p><p>• Tipos de levantamentos: por censo (completo);</p><p>• Por amostragem (parcial).</p><p>• Cronograma, custos, etc.</p><p>c) Coleta ou levantamento dos dados</p><p>Consiste na obtenção dos dados referentes ao trabalho que</p><p>desejamos fazer.</p><p>A coleta pode ser:</p><p>• Direta – diretamente da fonte;</p><p>• Indireta – feita através de outras fontes.</p><p>Os dados podem ser obtidos pela própria pessoa (primários) ou</p><p>se baseia no registro de terceiros (secundários).</p><p>d) Apuração dos dados ou sumarização</p><p>Consiste em resumir os dados, através de uma contagem e</p><p>agrupamento. É um trabalho de coordenação e de tabulação.</p><p>Apuração: manual, mecânica, eletrônica e eletromecânica.</p><p>e) Apresentação dos dados</p><p>É a fase em que vamos mostrar os resultados obtidos na coleta</p><p>e na organização.</p><p>Esta apresentação pode ser:</p><p>• Tabular (apresentação numérica);</p><p>UNiDADE 0128</p><p>• Gráfica (apresentação geométrica).</p><p>f) Análise e interpretação dos dados</p><p>É a fase mais importante e também a mais delicada. Tira</p><p>conclusões que auxiliam o pesquisador a resolver seu problema.</p><p>Apresentação tabular e gráfica</p><p>Normas para apresentação tabular (séries estatísticas) consistem</p><p>em dispor os dados, em linhas e colunas, distribuídos de modo ordenado.</p><p>A elaboração de tabelas obedece à resolução nº 886, de 26 de outubro de</p><p>1966, do Conselho Nacional de Estatística. As normas de apresentação</p><p>são editadas pela Fundação Brasileira de Geografia e Estatística (IBGE).</p><p>Como construir uma tabela?</p><p>Titulo</p><p>Cabeçalho</p><p>Corpo</p><p>Rodapé</p><p>Elementos de uma tabela</p><p>• Titulo: o título deve responder as seguintes questões:</p><p>- O quê? (Assunto a ser representado (fato));</p><p>- Onde? (O lugar onde ocorreu o fenômeno (local));</p><p>- Quando? (A época em que se verificou o fenômeno (tempo)).</p><p>• Cabeçalho: parte da tabela na qual é designada a natureza do</p><p>conteúdo de cada coluna.</p><p>• Corpo: parte da tabela composta por linhas e colunas.</p><p>• Linhas: parte do corpo que contém uma sequência horizontal</p><p>de informações.</p><p>• Colunas: parte do corpo que contém uma sequência vertical</p><p>de informações.</p><p>bioEstAtístiCA 29</p><p>• Coluna indicadora: coluna que contém as discriminações</p><p>correspondentes aos valores distribuídos pelas colunas</p><p>numéricas.</p><p>• Casa ou célula: parte da tabela formada pelo cruzamento de</p><p>uma linha com uma coluna.</p><p>• Rodapé: é o espaço aproveitado em seguida ao fecho da</p><p>tabela, onde são colocadas as notas de natureza informativa</p><p>(fonte, notas e chamadas).</p><p>• Fonte: refere-se à entidade que organizou ou forneceu os</p><p>dados expostos.</p><p>• Notas e chamadas: são esclarecimentos contidos na tabela.</p><p>(nota – conceituação geral; chamada – esclarecer minúcias em</p><p>relação a uma célula).</p><p>Séries estatísticas</p><p>Uma série estatística é um conjunto de dados ordenados segundo</p><p>uma característica comum, os quais servirão posteriormente para se</p><p>fazer análises e inferências.</p><p>Série temporal ou cronológica: é a série, cujos dados estão</p><p>dispostos em correspondência com o tempo, ou seja, varia o tempo e</p><p>permanece constante o fato e o local.</p><p>Exemplo:</p><p>Evolução do Produto Interno Bruto do Piauí 2000/2004 (R$ bilhões)</p><p>Fonte: Fundação CEPRO, Coordenação de Contas Regionais</p><p>Série geográfica ou territorial: é a série, cujos dados estão</p><p>dispostos em correspondência com o local, ou seja, varia o local e</p><p>permanece constante a época e o fato.</p><p>UNiDADE 0130</p><p>Exemplo:</p><p>População do Brasil em 2010</p><p>Fonte: IBGE 2010</p><p>Série específica ou qualitativa: é a série, cujos dados estão</p><p>dispostos em correspondência com a espécie ou qualidade, ou seja,</p><p>varia o fato e permanece constante a época e o local.</p><p>Exemplo:</p><p>População Urbana x Rural do Brasil em 2010</p><p>Fonte: IBGE 2010</p><p>Série mista ou composta: a combinação entre duas ou mais séries</p><p>constituem novas séries denominadas compostas e apresentadas em</p><p>tabelas de dupla entrada. O nome da série mista surge de acordo com a</p><p>combinação de pelo menos dois elementos.</p><p>Local + Época= série geográfica temporal</p><p>Exemplo:</p><p>bioEstAtístiCA 31</p><p>População Urbana do Brasil por região de 1940 a 1980 (x 100)</p><p>Distribuição de frequência</p><p>É o tipo de série estatística na qual permanece constante o fato, o</p><p>local e a época. Os dados são colocados em classes pré-estabelecidas,</p><p>registrando a frequência de ocorrência. Uma distribuição de frequência</p><p>pode ser classificada em discreta e intervalar.</p><p>a) Distribuição de frequência discreta ou pontual: é uma série de</p><p>dados agrupados na qual o número de observações está relacionado</p><p>com um ponto real.</p><p>Exemplo:</p><p>Notas do "X" na disciplina de bioestatística segundo critérios de</p><p>avaliação do DE do IFPI - 2010</p><p>UNiDADE 0132</p><p>b) Distribuição de frequência intervalar: na distribuição de</p><p>frequência, os intervalos parciais deverão ser apresentados de maneira a</p><p>evitar dúvidas quanto à classe a que permanece determinado elemento.</p><p>O tipo de intervalo mais usado é do tipo fechado a esquerda e</p><p>aberto a direita, representado pelo símbolo: .</p><p>Exemplo:</p><p>Altura em centímetros de 160 alunos do Curso de Licenciatura</p><p>Plena em Ciências Biológicas da UFPI - 2010</p><p>Elementos de uma distribuição de frequências</p><p>Classe ou Classe de frequência (K): é cada subintervalo (linha) na</p><p>qual dividimos o fenômeno.</p><p>Para determinar o número de classes, a partir dos dados não</p><p>tabelados, podemos usar a fórmula de Sturges, mas, deve-se saber</p><p>que existem outros métodos de determinação do número de classes em</p><p>uma tabela de frequência. O que se deseja fazer é apenas comprimir</p><p>um conjunto de dados em uma tabela, para facilitar a visualização e</p><p>interpretação dos mesmos.</p><p>n(K)=1+3,33log n , onde “n” é nº de informações.</p><p>Além da regra de Sturges, existem outras fórmulas empíricas para</p><p>bioEstAtístiCA 33</p><p>resolver o problema para determinação do número de classes [n(K)],</p><p>há quem prefira n(k)= . Entretanto, verdade é que essas fórmulas</p><p>não nos levam a uma decisão final; esta vai depender na realidade de</p><p>um julgamento pessoal, que deverá estar ligado a natureza dos dados,</p><p>procurando, sempre que possível, evitar classes com frequências nulas</p><p>ou frequências relativas exageradamente grandes.</p><p>Limite de Classe (li ou Li): são os valores extremos de cada classe.</p><p>li= limite inferior da i-ésima classe;</p><p>ls = limite superior da i-ésima classe;</p><p>Amplitude do intervalo de classe (h): é a diferença entre dois limites</p><p>inferiores ou superiores consecutivos.</p><p>h = ls – li ou h = ls – li</p><p>A amplitude do intervalo de classe deve ser constante em toda a</p><p>distribuição de frequências intervalares.</p><p>Amplitude total (At): é a diferença entre o limite superior da última</p><p>classe e o limite inferior da 1ª classe, ou a diferença entre último e o</p><p>primeiro elemento de um conjunto de dados postos em ordem crescente.</p><p>At= ls – l1</p><p>l1( limite inferior da 1ª classe) ls(limite superior da última classe)</p><p>Ponto médio de classe (Xi): é a média aritmética simples do limite</p><p>inferior com o limite superior de uma mesma classe.</p><p>ou a partir do X1 os demais pontos médios podem ser determinados</p><p>por:</p><p>Xn = Xn-1 + h</p><p>Quando substituímos os intervalos de classes pelos pontos</p><p>médios (Xi), ter-se-á uma distribuição de frequência pontual.</p><p>Frequência absoluta (fi): é a quantidade de valores em cada</p><p>classe.</p><p>Frequência Acumulada (Fi): é o somatório da frequência absoluta</p><p>da i-ésima classe com a frequência absoluta das classes anteriores, ou a</p><p>frequência acumulada da classe anterior.</p><p>n</p><p>UNiDADE 0134</p><p>Frequência Relativa (fri): é o quociente entre a frequência absoluta</p><p>da i-ésima classe com o somatório das frequências.</p><p>. 100; onde</p><p>Frequência Relativa Acumulada (Fri): é o somatório da frequência</p><p>relativa da iésima classe com as frequências relativas das classes</p><p>anteriores.</p><p>Representação gráfica</p><p>Os gráficos são uma forma de apresentação visual dos dados.</p><p>Normalmente, contêm menos informações que as tabelas, mas são de</p><p>mais fácil</p><p>leitura. O tipo de gráfico depende da variável em questão.</p><p>Gráficos de linhas</p><p>Usado para ilustrar uma série temporal.</p><p>Taxa de incidência de AIDS em Teresina - Adolescentes de 13 a 19</p><p>anos de idade – 2000-2008</p><p>Fonte: Ministério da Saúde/SVS - Sistema de Informações sobre Mortalidade</p><p>(Ministério da Saúde/Indicadores e Dados Básicos - Brasil - 2009)</p><p>bioEstAtístiCA 35</p><p>Gráfico de linhas comparativas</p><p>Taxa de abandono escolar (evasão) por região- Ensino Médio – 2007-</p><p>2010</p><p>Fonte: IBGE 2010</p><p>Gráficos de colunas ou barras</p><p>Representação gráfica da distribuição de frequências. Este gráfico</p><p>é utilizado para variáveis nominais e ordinais.</p><p>Características:</p><p>- todas as barras devem ter a mesma largura;</p><p>- devem existir espaços entre as barras.</p><p>Gráfico de colunas</p><p>Usado para ilustrar qualquer tipo de série.</p><p>Séries estatísticas</p><p>UNiDADE 0136</p><p>Número de internações hospitalares (SUS) por Câncer no Piauí -</p><p>2004.</p><p>Fonte: Ministério da Saúde-Sistema de Informação Hospitalar do SUS (Apud Boletim</p><p>Epidemiológico, 2005)</p><p>As larguras das barras que deverão ser todas iguais, podendo ser</p><p>adotada qualquer dimensão, desde que seja conveniente e desde que</p><p>não se superponham. O número no topo de cada barra pode ou não ser</p><p>omitido, se forem conservados, a escala vertical pode ser omitida.</p><p>Gráfico de colunas comparativas</p><p>a) Colunas – justapostas (gráfico comparativo)</p><p>Taxa de abandono escolar (evasão) por região- Ensino Médio – 2007-</p><p>2010</p><p>Fonte: IBGE 2010</p><p>bioEstAtístiCA 37</p><p>b) Colunas sobrepostas (gráfico comparativo)</p><p>Taxa de abandono escolar (evasão) por região- Ensino Médio – 2007-</p><p>2010</p><p>Fonte: IBGE 2010</p><p>Gráfico de barras</p><p>As regras para o gráfico de barras são iguais às usadas para o</p><p>gráfico de colunas.</p><p>Casos de Mortalidade por 10.000 habitantes no Piauí – 2004</p><p>Fonte: Ministério da Saúde-Sistema de Informação Hospitalar do SUS (Apud Boletim</p><p>Epidemiológico, 2005)</p><p>UNiDADE 0138</p><p>Assim como os gráficos de colunas podem ser construídos gráficos</p><p>de barras comparativas.</p><p>Gráficos de setores (Pizza)</p><p>Representação gráfica da frequência relativa (percentagem)</p><p>de cada categoria da variável. Este gráfico é utilizado para variáveis</p><p>nominais e ordinais. É uma opção ao gráfico de barras quando se</p><p>pretende dar ênfase à comparação das percentagens de cada categoria.</p><p>A construção do gráfico de setores segue uma regra de três simples,</p><p>onde as frequências de cada classe correspondem ao ângulo que se</p><p>deseja representar em relação à frequência total que representa o total</p><p>de 3600.</p><p>Características:</p><p>- A área do gráfico equivale à totalidade de casos (3600 = 100%);</p><p>- Cada “fatia” representa a percentagem de cada categoria.</p><p>População Urbana e Rural do Brasil 2010 (X 1000)</p><p>Fonte: IBGE 2010</p><p>Gráfica pictorial – Pictograma</p><p>Tem por objetivo despertar a atenção do público em geral, muito</p><p>desses gráficos apresentam grande dose de originalidade e de habilidade</p><p>na arte de apresentação dos dados.</p><p>bioEstAtístiCA 39</p><p>Produção de Grãos no Estado do Piauí – 2002-2006 (Em mil toneladas)</p><p>Fonte: GOVERNO DO ESTADO DO PIAUÍ. Plano Plurianual. Quadriênio: 2008/2011.</p><p>Gráficos utilizados para a análise de uma distribuição de frequência</p><p>Histograma</p><p>Altura em centímetros de 160 alunos do Curso de Lic. em Ciências</p><p>Biológicas da UFPI – 2010</p><p>UNiDADE 0140</p><p>Polígono de frequência</p><p>Altura em centímetros de 160 alunos do Curso de Lic. em Ciências</p><p>Biológicas da UFPI – 2010</p><p>Ogiva crescente</p><p>Altura em centímetros de 160 alunos do curso de Lic. em Ciências</p><p>Biológicas da UFPI – 2010.</p><p>bioEstAtístiCA 41</p><p>Ogiva decrescente</p><p>Altura em centímetros de 160 alunos do curso de Lic. em Ciências</p><p>Biológicas da UFPI – 2010.</p><p>Gráfico em segmentos de reta vertical</p><p>É utilizado para representar uma distribuição de frequência</p><p>pontual, onde os segmentos de reta são proporcionais às respectivas</p><p>frequências absolutas.</p><p>Altura em centímetros de 160 alunos do Curso de Administração da</p><p>UFPI – 2010</p><p>UNiDADE 0142</p><p>Medidas de tendência central</p><p>Tem por objetivo descrever os dados no sentido de apresentar um</p><p>valor característico e representativo para o conjunto.</p><p>Médias</p><p>São medidas descritivas que têm finalidade representar um</p><p>conjunto de dados.</p><p>Média aritmética</p><p>Símbolo: amostral ( ); populacional (µ)</p><p>a) Dados não tabelados</p><p>ou</p><p>b) Dados tabelados</p><p>1. Tabela com valores ponderados</p><p>Média aritmética ponderada ( Xw), (onde Wi é o peso)</p><p>Exemplo:</p><p>Nota do aluno "X" 1º semestre de 2010 – UFPI</p><p>X</p><p>bioEstAtístiCA 43</p><p>2. Distribuição de frequências</p><p>Média aritmética ( )</p><p>Exemplo:</p><p>Altura em centímetros de 160 alunos do Curso de Administração da</p><p>UFPI</p><p>Mediana</p><p>É a medida de posição que divide o conjunto de dados em partes</p><p>proporcionais, quando os mesmos estão ordenados.</p><p>a) Dados não tabelados</p><p>Antes de determinarmos a MEDIANA devemos em primeiro lugar</p><p>encontrar a posição da mesma.</p><p>- Se o número de elementos for ímpar, a mediana segue a seguinte</p><p>ordem:</p><p>Posição =</p><p>UNiDADE 0144</p><p>Se o número de elementos for par, a mediana segue a seguinte</p><p>ordem:</p><p>Posição = e</p><p>1) Distribuição de frequência pontual</p><p>Segue a mesma regra usada para dados não tabelados.</p><p>2) Distribuição de frequências intervalares.</p><p>Onde:</p><p>lI = limite inferior da classe que contém a mediana;</p><p>= posição da mediana;</p><p>Fant = frequência acumulada da classe anterior à que contém a</p><p>mediana;</p><p>h = amplitude do intervalo de classe;</p><p>fmd = frequência absoluta da classe que contém a mediana.</p><p>Moda (Mo)</p><p>É definida como sendo a observação de maior frequência.</p><p>a) Dados não tabelados</p><p>Ex.: 5 6 6 6 7 7 8 8 9 - Mo = 6 (unimodal)</p><p>5 6 7 8 9 10 11 12 13 - Mo = Ǝ (amodal)</p><p>4 4 5 5 7 7 7 8 9 9 9 9 - Mo1 = 7 Mo2 = 9 (bimodal)</p><p>4 4 6 6 8 8 9 9 - Mo = Ǝ (amodal)</p><p>5 5 6 6 7 7 8 8 - Mo1 = 5 Mo2 = 6 Mo3 = 7 (trimodal)</p><p>Obs.: acima de quatro modas usamos o termo polimodal.</p><p>b) Dados tabelados</p><p>1) Distribuição de frequência pontual</p><p>- Moda bruta (Mob) (é o ponto médio da classe de maior</p><p>frequência – classe modal)</p><p>Mob = Xi > fi</p><p>2) Distribuição de frequência intervalar</p><p>n</p><p>2</p><p>bioEstAtístiCA 45</p><p>- Moda de Czuber (Moc): O processo para determinar a moda</p><p>usada por Czuber leva em consideração as frequências anteriores</p><p>e posteriores à classe modal.</p><p>Onde:</p><p>lI = limite inferior da classe modal;</p><p>fMo = frequência absoluta da classe modal;</p><p>h = amplitude do intervalo de classe;</p><p>fant = frequência absoluta da classe anterior a classe modal;</p><p>fpos = frequência absoluta da classe posterior a classe modal;</p><p>Medidas de dispersão</p><p>Medidas de variabilidade ou dispersão</p><p>São medidas estatísticas utilizadas para avaliar o grau de</p><p>variabilidade, ou dispersão, dos valores em torno da média. Servem para</p><p>medir a representatividade da média. Informa se um conjunto de dados é</p><p>homogêneo (pouca variabilidade) ou heterogêneo (muita variabilidade).</p><p>Para estudarmos as medidas de variabilidade para dados não</p><p>tabelados, usaremos um exemplo prático.</p><p>Sejam as seguintes séries:</p><p>a) 20, 20, 20</p><p>b) 15, 10, 20 , 25, 30</p><p>Tem-se: Média a = 20 Média b =20</p><p>Apesar das séries terem médias iguais, na série (a) não tem</p><p>dispersão, enquanto os valores da série (b) apresentam dispersão em</p><p>torno da média 20. Assim, a média é muito mais representativa para a</p><p>série (a) do que para a série (b).</p><p>Desvio extremo ou amplitude de variação (Av)</p><p>Av = Xmax - Xmin</p><p>Desvio médio (d)</p><p>UNiDADE 0146</p><p>Em virtude do , usamos para calcular o desvio</p><p>médio , assim ficando:</p><p>a) Para dados não tabelados</p><p>b) Para dados tabelados</p><p>Desvio quadrático ou variância (S2 (amostra) ou σ2 (pop.))</p><p>a) para dados não tabelados:</p><p>b) para dados tabelados</p><p>Desvio padrão [S (amostra) ou σ (população)]</p><p>a) para dados não tabelados:</p><p>=</p><p>[X - X] + [X - X] + ... + [X - X]1 2 2 n</p><p>n</p><p>i l= ( [X - X])f</p><p>i</p><p>d =</p><p>i f i f f</p><p>n</p><p>n</p><p>i l= f</p><p>i</p><p>n</p><p>i l= f</p><p>i</p><p>bioEstAtístiCA 47</p><p>b) para dados tabelados</p><p>Obs.: (n - 1) é usado como um fator de correção, onde devemos</p><p>considerar a</p><p>variância amostral como uma estimativa da variância</p><p>populacional.</p><p>Medidas de dispersão relativa</p><p>Coeficiente de Variação</p><p>É a medida de variabilidade, em geral, expressa em porcentagem</p><p>e tem por função determinar o grau de concentração dos dados em torno</p><p>da média.</p><p>C. V = ou x 100</p><p>Obs.: 0% ≤ C. V ≤ 100%</p><p>C. V. P. ≤ 50% - A média é representativa</p><p>C. V. = 0 – é a maior representatividade da média (S=0).</p><p>EXERCÍCIO PROPOSTO</p><p>Para os exercícios abaixo construa uma tabela de dispersão o</p><p>suficiente para determinar as medidas de posição (média aritmética,</p><p>mediana e moda de Czuber), dispersão (desvio padrão e variância,</p><p>coeficiente de variação de Pearson). Faça um relatório referente ao</p><p>comportamento dos dados em função dos resultados obtidos. Construa</p><p>um histograma e uma ogiva e nele represente a mediana.</p><p>1. Em exame final de Estatística, aplicado com 50 alunos da Universidade</p><p>Federal do Piauí, ano 1999, resultaram as seguintes notas:</p><p>UNiDADE 0148</p><p>2. Os dados a seguir, referem-se à altura em centímetros de 70 alunos da</p><p>Universidade Federal do Piauí, turma 6, ano 2009.</p><p>RESUMINDO</p><p>O objetivo dessa unidade foi capacitar o aluno de Licenciatura em</p><p>Ciências Biológicas a executar análise descritiva de dados e entender</p><p>os fenômenos determinísticos e probabilísticos. Para tanto, serão</p><p>discutidos os seguintes assuntos: Estatística descritiva: história</p><p>da estatística; ramificações; conceitos e definições; metodologia de</p><p>investigação; estatística vital (indicadores de saúde); fases do método</p><p>estatístico (coleta, critica e apresentação dos dados); apresentação</p><p>tabular e gráfica; medidas estatísticas em saúde; principais indicadores</p><p>de saúde (medidas de morbidade e mortalidade); medidas de tendência</p><p>central (média, mediana e moda); medidas de dispersão (desvio médio,</p><p>variância, desvio padrão e coeficiente de variação).</p><p>UNiDADE 02</p><p>teoria das Probabilidades</p><p>bioEstAtístiCA 51</p><p>tEoriA DAs ProbAbiliDADEs</p><p>Teoria das Probabilidades</p><p>Todas as vezes que se estudam fenômenos de observação, cumpre-</p><p>se distinguir o próprio fenômeno e modelo matemático (determinístico ou</p><p>probabilístico) que melhor o explique.</p><p>Os fenômenos estudados pela bioestatística são fenômenos cujo</p><p>resultado, mesmo em condições normais de experimentação variam de</p><p>uma observação para outra, dificultando dessa maneira a previsão de um</p><p>resultado futuro.</p><p>Para a explicação desses fenômenos (fenômenos aleatórios)</p><p>adota-se um modelo matemático probabilístico. Neste caso, o modelo</p><p>utilizado será o cálculo das probabilidades.</p><p>Modelos matemáticos</p><p>Pode-se distinguir dois tipos de modelos matemáticos:</p><p>Modelos determinísticos</p><p>Refere-se a um modelo que estipule que as condições sob as quais</p><p>um experimento seja executado determinem o resultado do experimento.</p><p>Em outras palavras, um modelo determinístico emprega “Considerações</p><p>Físicas” para prever resultados.</p><p>Modelos não determinísticos ou probabilidades</p><p>São aqueles que informam com que chance ou probabilidade</p><p>os acontecimentos podem ocorrer. Determina o “grau de credibilidade”</p><p>UNiDADE 0252</p><p>dos acontecimentos. (Modelos Estocásticos). Em outras palavras, um</p><p>modelo probabilístico emprega uma mesma espécie de considerações</p><p>para especificar uma distribuição de probabilidade.</p><p>Conceitos das Probabilidades</p><p>Os conceitos fundamentais em probabilidade são experimentos</p><p>aleatórios, espaço amostral e eventos.</p><p>Experimento aleatório (Ω)</p><p>Qualquer processo aleatório, capaz de produzir observações, os</p><p>resultados surgem, ao acaso, podendo admitir repetições no futuro. Um</p><p>experimento aleatório apresenta as seguintes características:</p><p>a) os resultados podem repetir-se n vezes (n → α);</p><p>b) embora não se possa prever que resultados ocorrerão, pode-se</p><p>descrever o conjunto de resultados possíveis;</p><p>c) a medida que se aumenta o número de repetições, aparece</p><p>uma certa regularidade nos resultados.</p><p>Espaço amostral (S)</p><p>É o conjunto de resultados possíveis, de um experimento aleatório.</p><p>Quanto ao número de elementos pode ser</p><p>• Finito</p><p>Número limitado de elementos;</p><p>Ex.: S = {1, 2, 3, 4, 5, 6}</p><p>• Infinito</p><p>Número ilimitado de elementos pode ser sub-dividido em:</p><p>- Enumerável</p><p>Quando os possíveis resultados puderem ser postos em</p><p>concordância biunívoca com o conjunto dos números naturais (N) (caso</p><p>das variáveis aleatórias discretas).</p><p>Ex.: N (conjunto dos nº naturais)</p><p>- Não Enumerável</p><p>Quando os possíveis resultados não puderem ser postos em</p><p>concordância biunívoca com o conjunto dos números naturais (caso das</p><p>variáveis aleatórias contínuas).</p><p>Ex.: Números reais</p><p>bioEstAtístiCA 53</p><p>Evento (E)</p><p>Um evento (E) é qualquer subconjunto de um espaço amostral</p><p>(S). Pode-se ter operações entre eventos da mesma forma que com</p><p>conjuntos, como mostra a seguir:</p><p>Operações com eventos</p><p>• A união B</p><p>Símbolo utilizado “ U ”, é o evento que ocorrerá se, e somente se,</p><p>A ou B ou ambos ocorrerem.</p><p>A U B</p><p>• A interseção B</p><p>Símbolo utilizado “ ∩ ”, é o evento que ocorrerá se, e somente se,</p><p>A e B ocorrem simultaneamente.</p><p>A ∩ B</p><p>• Complementar de A</p><p>Simbologia “A”, é o conjunto que ocorrera se, e somente se A não</p><p>ocorrer.</p><p>(A)</p><p>Tipos de eventos</p><p>Eventos mutuamente excludentes</p><p>São ditos eventos mutuamente excludentes, quando a ocorrência</p><p>de um implica ou não na ocorrência de outro, isto é, não pode ocorrer,</p><p>juntos, e consequentemente, A ∩ B é o conjunto vazio ( ϕ ).</p><p>Eventos não excludentes ou quaisquer</p><p>São ditos eventos não excludentes quando a ocorrência de um</p><p>implica na ocorrência do outro, isto é, são aqueles que ocorrem ao</p><p>mesmo tempo, A ∩ B = ϕ .</p><p>– Eventos independentes</p><p>São aqueles cuja ocorrência de um evento, não possui efeito</p><p>algum na probabilidade de ocorrência do outro.</p><p>UNiDADE 0254</p><p>A ∩ B ≠ ϕ , se A e B forem quaisquer;</p><p>A ∩ B ≠ ϕ , se A e B forem mutuamente excludentes.</p><p>logo,</p><p>P(A ∩ B) = P(A) . P(B)</p><p>Ex.: A e B eventos quaisquer</p><p>S = {1, 2, 3, 4} A = {1, 2} B = {2, 4} A ∩ B = {2}</p><p>P(A ∩ B) = P(A) . P(B)</p><p>P (A) = P(B) = P P(A ∩ B) =</p><p>Eventos dependentes ou condicionados</p><p>Existem várias situações onde a ocorrência de um evento pode</p><p>influenciar fortemente na ocorrência de outro.</p><p>Assim, se (A) e (B) são eventos, deseja-se definir uma quantidade</p><p>denominada probabilidade condicional do evento (A) dado que evento</p><p>(B) ocorre, ou sob a forma simbólica P( ).</p><p>Assim, dá-se a seguinte definição:</p><p>Onde P(B) O. Se P(B) = O, tem-se que P( ) não é definida.</p><p>Cálculos das Probabilidades</p><p>Conceitos empíricos de probabilidade</p><p>O problema fundamental da probabilidade consiste em atribuir um</p><p>número a cada evento(E), o qual avaliará quão possível será a ocorrência</p><p>de “E”, quando o experimento for realizado.</p><p>Uma possível maneira de tratar a questão seria determinar a</p><p>frequência relativa do evento E ( fr(E)),</p><p>Surgem, no entanto, dois problemas:</p><p>a - Qual deve ser o número de repetições do experimento (Ω)?</p><p>b - A sorte ou habilidade do experimentador poderá influir nos</p><p>resultados, de forma tal que a probabilidade é definida como sendo:</p><p>bioEstAtístiCA 55</p><p>P(E) = limn→∞fr(E)</p><p>Onde “n” é o número de repetições do experimento Ω .</p><p>Definição clássica de probabilidade</p><p>Se existe “a” resultados possíveis favoráveis à ocorrência de um</p><p>evento “E” e “b” resultados possíveis não favoráveis, sendo os mesmos,</p><p>mutuamente excludentes, então:</p><p>P(E) =</p><p>Onde os resultados devem ser verossímeis (possível e verdadeiro)</p><p>e permite a observação dos valores da probabilidade antes de ser</p><p>observado qualquer amostra do evento (E).</p><p>Definição Axiomática</p><p>Seja ( Ω ) um experimento, seja (S) um espaço amostral associado</p><p>a ( Ω ). A cada evento (E) associa-se um número real representado por</p><p>P(E) e denominaremos de probabilidade de E, satisfazendo as seguintes</p><p>propriedades:</p><p>a- 0≤P(E)≤1;</p><p>b-P(S) = 1;</p><p>c-Se A e B são eventos mutuamente excludentes, então:</p><p>P(A U B) = P(A) + (B).</p><p>d-Se A1,A2, ... An, são eventos mutuamente excludentes dois a</p><p>dois, então:</p><p>P( A1 U A2 U ... U An ) = P(A1) + P(A2) + ... +</p><p>imprópria não convirja.</p><p>Consequentemente, diremos que E(X) existirá se, e somente se, for</p><p>finita.</p><p>Variância de uma V.A.C.</p><p>Definiçao: Seja X uma V.A.C. de uma função distribuição de</p><p>probabilidade (f.d.p.). A variância de X é:</p><p>onde</p><p>Exemplos:</p><p>bioEstAtístiCA 67</p><p>Variável aleatória discreta</p><p>Seja X o lançamento de duas moedas e descrever o experimento</p><p>em função da obtenção do número de caras:</p><p>i) Determinar a função de probabilidade e represente graficamente;</p><p>ii) E(X) E V(X)</p><p>Da Função de probabilidade</p><p>iii) Esperança Matemática</p><p>Variância</p><p>Variável Aleatória Contínua</p><p>Seja X uma variável aleatória contínua:</p><p>UNiDADE 0368</p><p>i) represente graficamente função densidade de probabilidade;</p><p>ii) Determine</p><p>iii) E(X) e V(X)</p><p>i)</p><p>ii)</p><p>iii)</p><p>logo,</p><p>Distribuição de Probabilidade</p><p>Distribuição binomial</p><p>Após termos visto as definições de V.A.D e V.A.C., citaremos as</p><p>principais distribuições de probabilidade relacionadas a estas variáveis.</p><p>Trata-se de uma distribuição de probabilidade adequada aos experimentos</p><p>que apresentem apenas dois resultados (sucesso ou fracasso).</p><p>O termo “Binomial” é utilizado, quando uma variável aleatória</p><p>está agrupada em duas classes ou categorias. As categorias devem</p><p>ser mutuamente excludentes, de modo a deixar bem claro a qual</p><p>categoria pertence a determinada observação; e as classes devem ser</p><p>coletivamente exaustivas, de forma que nenhum outro resultado fora</p><p>delas é possível.</p><p>Sejam, “p” probabilidade de sucesso e “q” probabilidade de falha,</p><p>ou seja, p + q = 1.</p><p>bioEstAtístiCA 69</p><p>A probabilidade de x sucessos em x tentativas é dado por px e de</p><p>(n – x) falhas em (n – x) tentativas é dado por qn-x , onde o número de</p><p>vezes em que pode ocorrer x sucessos e (n-x) falhas é dado por:</p><p>logo, a probabilidade de ocorrer x sucessos com n tentativas será</p><p>Propriedades (Hipóteses) necessárias para haver uma utilização</p><p>da Distribuição Binomial</p><p>1ª) n provas independentes e do mesmo tipo são realizadas;</p><p>2ª) Cada prova (tentativa) deve resultar num sucesso ou fracasso;</p><p>3ª) A probabilidade de sucesso é p e a probabilidade de fracasso é</p><p>q = i - p;</p><p>4ª)Todas as tentativas devem ser inteligentes.</p><p>Esperança Matemática de Distribuição Binomial</p><p>E(X) = n.p</p><p>Variância de uma Distribuição Binomial</p><p>V(X) = n.p.q</p><p>Exemplos:</p><p>1. Uma moeda não viciada é lançada 7 vezes. Encontre as seguintes</p><p>probabilidades:</p><p>a) Dar 5 caras.</p><p>b) Pelo menos uma cara.</p><p>c) No máximo duas caras.</p><p>d) Calcula-se a média e a variância da distribuição.</p><p>2. Em 320 famílias com 5 crianças cada uma, quantas se esperaria que</p><p>tivessem:</p><p>a) Nenhuma menina</p><p>b) 3 meninos</p><p>c) Pelo menos 1 menino.</p><p>UNiDADE 0370</p><p>Distribuição de Poisson</p><p>Em muitos casos, conhece-se o número de sucessos, porém,</p><p>torna-se difícil e, às vezes, sem sentido, determinar o número de fracassos</p><p>ou o número total de provas. Por exemplo: automóveis que passam numa</p><p>avenida. Pode-se num determinado intervalo de tempo, anotar o número</p><p>de carros que passaram, porém, o número de carros que deixaram de</p><p>passar pela avenida não poderá ser determinado.</p><p>Quando numa distribuição binomial o tamanho “n” das observações</p><p>for muito grande e a probabilidade “p” de sucesso for muito pequena, a</p><p>probabilidade x de ocorrência de um determinado número de observações</p><p>segue uma Distribuição de Poisson.</p><p>A aplicação da distribuição segue algumas restrições:</p><p>- Somente a chance afeta o aparecimento do evento, contando-</p><p>se apenas com a sua ocorrência, ou seja, a probabilidade de</p><p>sucesso “p”.</p><p>- Uma vez não conhecido o número total de eventos, a distribuição</p><p>não pode ser aplicada.</p><p>Substituindo o valor esperado n.p por λ e considerando-o como</p><p>sendo o número médio de ocorrência expresso em unidades de tempo,</p><p>pode-se dizer que λ é a taxa média de ocorrência (ocorrências / unid.</p><p>Tempo) e t o tempo, logo o número médio de ocorrências será λt, assim,</p><p>Fornece a probabilidade de x ocorrência no período de tempo t.</p><p>Esperança matemática da distribuição de Poisson</p><p>E(x) = λ</p><p>Variância da distribuição de Poisson</p><p>V(x) = λ</p><p>Distribuições contínuas de probabilidade</p><p>Distribuição Normal</p><p>É a mais importante distribuição de probabilidade, sendo aplicada</p><p>bioEstAtístiCA 71</p><p>em inúmeros fenômenos e utilizada para o desenvolvimento teórico da</p><p>bioestatística. É também conhecida como distribuição de Gauss.</p><p>É um modelo de distribuição contínua de probabilidade, usada</p><p>tanto para variáveis aleatórias discretas como contínuas.</p><p>Uma variável aleatória X, que torne todos os valores reais -∞ x +∞</p><p>tem distribuição normal quando sua função densidade de probabilidade</p><p>(f.d.p.) for da forma:</p><p>Os parâmetros µ e σ seguem as seguintes condições:</p><p>Propriedades da Distribuição Normal</p><p>a) O aspecto gráfico da função f tem semelhança de um sino, unimodal</p><p>e simétrico em relação à média µ.</p><p>b) A especificação da média µ e do desvio padrão σ é completamente</p><p>evidenciado.</p><p>c) A área total da curva equivale a 100%.</p><p>Distribuição Normal em função da µ e σ</p><p>Esperança Matemática da Distribuição Normal</p><p>E(X) = µ</p><p>Variância da Distribuição Normal</p><p>V(X) = σ2</p><p>UNiDADE 0372</p><p>Distribuição Normal Padronizada</p><p>Tem como objetivo solucionar a complexidade da f(x) através da</p><p>mudança de variável f(z).</p><p>Complemento da Distribuição Normal Padronizada</p><p>Fazendo e z ~N(0,1) temos que</p><p>,</p><p>Com E(z) = 0 e VAR(z) = 1.</p><p>Onde:</p><p>Z = número de desvios padrões a contar da média</p><p>X = valor arbitrário</p><p>µ = média da distribuição normal</p><p>α = desvio padrão da distribuição normal</p><p>Estas probabilidades estão tabeladas e este caso particular é</p><p>chamado de Forma Padrão da Distribuição Normal.</p><p>Distribuição “t” de Student</p><p>Trata-se de um modelo de distribuição contínua que se assemelha</p><p>à distribuição normal padrão, N~(0,1). É utilizada para inferências</p><p>estatísticas, particularmente, quando se tem amostras com tamanhos</p><p>inferiores a trinta elementos.</p><p>A distribuição t também possui parâmetros denominados “grau de</p><p>liberdade”</p><p>φ = n -1</p><p>A média da distribuição é zero e sua variância é dada por:</p><p>bioEstAtístiCA 73</p><p>, para φ > 2.</p><p>A distribuição t é simétrica em relação a sua média.</p><p>Distribuição Qui-quadrado (x2)</p><p>A distribuição Qui-quadrado possui numerosas aplicações</p><p>importantes em inferências estatísticas. Uma das mais importantes é em</p><p>testes não paramétricos, testes de aderência e testes de independência.</p><p>Sejam X1, X2, ..., Xn, V.A, independentes, normalmente distribuídas</p><p>com média zero e variância σ2 Define-se a V. A. x2 , com φ graus de</p><p>liberdade como sendo a soma do quadrado de δ variáveis normais</p><p>padronizadas e independentes, isto é:</p><p>Dependendo do número de graus de liberdade, a distribuição</p><p>assume as seguintes formas gráficas:</p><p>Algumas Representações da Distribuição Qui-quadrado</p><p>1) Para n→α , a distribuição tende a normal;</p><p>2) Para δ = 1 → = Z2 isto é, a variável X2 é igual aos quadrados</p><p>de uma normal reduzida;</p><p>- Parâmetros da distribuição</p><p>UNiDADE 0374</p><p>Média: E(X) = δ</p><p>Variância: V(X) = 2δ</p><p>A distribuição se constitui de uma família de curvas, onde cada</p><p>uma é tabelada e caracterizada pelos graus de liberdade δ. A curva mais</p><p>frequente é a curva unicaudal à direita, isto é:</p><p>Probabilidade da Distribuição de Qui-quadrado</p><p>Para uma dada probabilidade e para um dado, o corpo da tabela</p><p>fornece o valor de tal que , probabilidade essa</p><p>representada, na figura, pela região hachurada.</p><p>- Diferença em relação à curva normal:</p><p>1) É sempre positiva;</p><p>2) É assimétrica;</p><p>3) A tabela fornece o valor x2 a partir de uma probabilidade e um</p><p>certo número de graus de liberdade δ .</p><p>EXERCÍCIO PROPOSTO 01</p><p>1. Admita que a variável X torne valor 1,2 e 3 com probabilidade 1/3, 1/6</p><p>e 1/2, respectivamente.</p><p>a) Determine a função de probabilidade</p><p>b) E(X) e V(X)</p><p>bioEstAtístiCA 75</p><p>2. No lançamento simultâneo de</p>Nota sobre a história da Estatística 
Dossiês didáticos. Disponível em <htt://alea-estp.inet.pt.> Acesso em 30 
de março de 2006.
GOVERNO DO ESTADO DO PIAUÍ. Plano Plurianual Q U A D R I Ê N I 
O 2008/2011. Disponível em < > Acesso em 13 de dezembro de 2011.
IBGE. 
Ministério da Saúde/SVS - Sistema de Informações sobre Mortalidade 
( Ministério da Saúde/Indicadores e Dados Básicos - Brasil - 2009)
Referências consultadas
ARANGO, H. G. Bioestatística teórica computacional. Rio de Janeiro: 
Guanabara Koogan. 2005.
BARBETTA, P. A.. Estatística aplicada às ciências sociais. 6ed. Editora 
UFSC, livros série Didática, 2005.
BERQUÓ, E. S.; Souza, J.M.P.; GOTLIEB, S.L.D. Bioestatística. São 
Paulo: EPU, 1981.
BUSSAB, W. O.; MORETTIN, P. A.– Estatística Básica. 4ª ed. São 
Paulo: Atual Editora, 1987.
BRUNI, A. L. Estatística aplicada à gestão empresarial. São Paulo: 
Atlas, 2007. p. 2-3. 
 
COSTA NETO, P. L. O.. Estatística. São Paulo: Edgar Blucher, , 1977.
bioEstAtístiCA 131
CRESPO, A. A. Estatística Fácil. São Paulo: Saraiva, 1999.
JEKEL, J.F. et al. Epidemiologia, bioestatística e medicina preventiva. 
Rio de Janeiro: Guanabara Koogan. 2005.
LEVIN,J. Estatística aplicada às ciências médicas. São Paulo: Harbra, 
1987.
KUME, H.. Métodos Estatísticos para melhoria da qualidade. São 
Paulo: Editora Gente. 1993.
MONTGOMERY, D. Introduction to Linear Regression Analysis. John 
Willey & Sons. 1992.
PIMENTEL., GOMES, F. Curso de estatística experimental. 13 ed. São 
Paulo: Nobel, 1990.
STEVENSON, W. J. Estatística Aplicada à Administração. Tradução 
Alfredo de Farias. São Paulo: Harper & Raw do Brasil, 1981. 
TRIOLA, M. F. Introdução à estatística. Tradução de Vera Regina Lima 
de Farias e Flores, revisão técnica de Ana Maria Lima de Farias Flores. 
Rio de Janeiro: Livros Técnicos e Científicos Editora. 9ª ed. 2005.
VIEIRA, S. Introdução à Bioestatística. Rio de Janeiro: Campus, 1997.
_______. Elementos de /estatística. São Paulo: Atlas, 2003.
ANEXos132
ANEXO 1
TRABALHO DE BIOESTATÍSTICA
Valores de MASSA OSSEA (BMD) e FÊMUR de 30 mulheres, 
levando-se em consideração outras variáveis de interesse.
bioEstAtístiCA 133
QUESTÕES
1) Classifique todas as variáveis mencionadas (se qualitativa nominal ou 
ordinal, quantitativa discreta ou continua).
2) Encontre MEDIDAS DESCRITIVAS das variáveis: BMDCOL e 
BMDFEM.
 
3) Utilizando a variável tempo de menopausa (TEMPOM) divida os 
indivíduos em três grupos com o tempo: Grupo 1: 0 anos; Grupo 2: de 1 
a 9 anos, e grupo 3: mais de 9 anos de menopausa. Ache as MÉDIAS E 
DESVIOS PADRÕES das variáveis BMDCOL e BMDFEM de cada grupo. 
Faça um gráfico comparativo.
Grupo 1=0 anos
Grupo 2 = 1 a 9 anos
Grupo 3 = Mais de 9 anos
ANEXos134
4) Retire uma amostra causal simples de tamanho 10 da população 
acima, e descreva o procedimento que você utilizou.
Logo os dados da que irão compor a amostra são:
OBS.: Todas as questões abaixo devem ser respondidas usando os 
dados da amostra sorteada.
A partir de agora os dados da tabela representam toda a população.
5) Ache MEDIAS e DESVIOS PADROES de todas as variáveis cotínuas. 
Compare os resultados das variáveis BMDCOL e BMDFEM com as 
encontradas na questão 2.
 
bioEstAtístiCA 135
Para comparar a média amostral com a populacional, aplique u 
Teste de Hipótese para a diferença de duas médias, usando α = 5%.
Conclusão: ___________________________________________
Conclusão: ___________________________________________
6) Separe os indivíduos em três classes segundo o mesmo critério da 
questão 3. Encontra as MEDIAS da BMD da coluna e do fêmur para cada 
classe. As três classes são comparáveis segundo as médias? Compare 
com as medidas levantadas na questão 3.
Grupo 1 = 0 anos
 
Grupo 2 = 1 a 9 anos
 
Grupo 3 = Mais de 9 anos
ANEXos136
Grupo 1 = 0 anos
 
Conclusão: ___________________________________________
Conclusão: ___________________________________________
Grupo 2 = 1 a 9 anos
 
Conclusão: ___________________________________________
Conclusão: ___________________________________________
Grupo 3 = Mais de 9 anos
Conclusão: ___________________________________________
bioEstAtístiCA 137
 
Conclusão: ___________________________________________
7) Encontre INTERVALOS DE 95% DE CONFIANÇA para as MÉDIAS de 
cada classe para ambas as variáveis BMDCOL e BMDFEM.
8) Também para uma dessas variáveis, teste se as médias das classes 
são iguais ou não.
Conclusão: ___________________________________________
Conclusão: ___________________________________________
 
Conclusão: ___________________________________________
 
Conclusão: ___________________________________________
ANEXos138
Conclusão: ___________________________________________
Conclusão: ___________________________________________
9) Separe os indivíduos segundo a CLASSIFICAÇÃO DA OMS: até – 
1,00 ZCOL: NORMAL; de – 1,00 a 2,50 ZCOL: OSTEOPENIA e menor 
de – 2,50 ZCOL: OSTEOPOROSE. Repita os exercícios 9 a 10, para as 
BMD da coluna e fêmur.
Grupo OSTEOPOROSE ZCOL < 2,5
 
Grupo NORMAL -2,5 < ZCOL < -1,0
Grupo OSTEOPENIA -1,0 < ZCOL < 2,5
 
bioEstAtístiCA 139
Grupo NORMAL -2,5 < ZCOL < -1,0
 
Grupo OSTEOPENIA -1,0 < ZCOL < 2,5
 
Comparação das médias para os grupos NORMAL e OSTEOPENIA
 
Conclusão: ___________________________________________
Conclusão: ___________________________________________
ANEXos140
ANEXO II
bioEstAtístiCA 141
ANEXos142
bioEstAtístiCA 143
ANEXos144
bioEstAtístiCA 145
ANEXos146
Tabelas estraidas do livro "Curso de Estatística" de Jairo 
Simon e Gilberto de Andrade.

Mais conteúdos dessa disciplina