Prévia do material em texto
Luciane Souza - 272 ESTATÍSTICA É uma parte da matemática que estuda os métodos para coletar, organizar e analisar dados de diferentes áreas visando a tomada de decisões Descritiva: descreve, resume, apresenta dados Analítica: compara grupos, ajuda a concluir resultados de amostras, utilização de testes estatísticos Papel da Estatística: • Estudar padrões de variação → Estatística Descritiva Responde a perguntas do tipo: ➢ Qual a prevalência de diabetes na população? ➢ Que proporção das pessoas fuma? ➢ Qual é o valor normal da glicose plasmática? Isto é, descrever comportamento das características: agravos, fatores de risco, fatores protetores • Definir faixas de variação: normal/anormal • Permite compor testes diagnósticos Testar formalmente diferenças e associações → Estatística Analítica Responde a perguntas do tipo ➢ Fumar está associado com diabetes? ➢ Penicilina cura pneumonia? ➢ Vacina previne sarampo? Isto é, avalia associações entre fatores de risco e doenças • Avalia eficácia/efetividade de medidas preventivas TERMOS IMPORTANTES Observações: indivíduos avaliados no estudo Dados: informações obtidas a partir das observações, podem ser numéricas ou não Podem ser de fonte primária (dados coletados para o objetivo daquele estudo) ou secundária (utilização de dados já obtidos previamente, não obtidos para o objetivo do estudo) Amostra: parte de um conjunto de dados (população) Variáveis: características estudadas Métodos de Amostragem Casual Simples: sorteio aleatório dos elementos da população Sistemática: utilizada quando os elementos da população a ser estudada já se encontram ordenados e, em seguida, são sorteados de acordo com uma certa periodicidade Proporcional Estratificada: divide a população em subgrupos (estratos) de acordo com outras características da população que devem ser levadas em conta Por que não estudar toda a população? • Complicado logisticamente • Caro e pouco eficiente EQUIPROBABILIDADE Todos os indivíduos da população em estudo têm a mesma probabilidade de aparecer na amostra → Seleção sem agrupamentos e sem reposição ➢ É só colocar todos os nomes num saquinho e pegar (de olho fechado!) A variabilidade das médias amostrais diminui com o tamanho da amostra A amostra da direita tem maior intervalo de confiança, uma maior amostra gera menor erro padrão observado Intervalo de Confiança Dá ideia da precisão do resultado Dá ideia de onde pode variar a medida sendo estimada • Pode ser uma média • Pode ser uma prevalência • Pode ser um risco relativo TESTE DE HIPÓTESES ➢ Primeiramente ele usou o exemplo do chá britânico e da senhora que afirmava saber diferenciar se primeiro haviam colocado a água ou o leite Comparar 2 populações: ➢ Será que um medicamento novo tem efeito maior do que o antigo? ➢ Será que a dieta sem sal faz a pressão arterial reduzir? Em função da variabilidade amostral, os resultados vão ser sempre “diferentes” ➢ Como decidir se há uma “diferença real”? ➢ Que régua utilizar? H0: hipótese da igualdade → Não existe diferença µ1 (efeito da droga nova) = µ2 (efeito da droga velha) • Equivale a “senhora não distingue tipo de chá” H1: hipótese alternativa → Existe diferença µ1 ≠ µ2 Agora tenho que rejeitar ou não rejeitar H0 Supondo que H0 é verdade, posso calcular a probabilidade relacionada com o resultado obtido! • Se esta probabilidade é baixa → Rejeito H0 • Caso contrário → Não rejeito H0 Se a probabilidade de se observar o resultado obtido (ou algo mais extremo) for < 5% → rejeito H0. Esta probabilidade é o valor p CASO CONTRÁRIO → NÃO REJEITO H0 VARIÁVEIS Relação entre variáveis • Exposição Fator que pode influenciar a frequência de ocorrência de um evento Variável explanatória, independente - Fator de risco • Desfecho Variável principal de interesse no estudo Variável resposta, dependente Exemplo: estudo sobre tabagismo na gestação e baixo peso ao nascer TIPOS DE VARIÁVEIS Variáveis Qualitativas (Categóricas): atributos ou características do sujeito Variáveis Quantitativas (Numéricas): medidas a serem tomadas dos sujeitos, medidas em escala numérica Qualitativas (Nominais ou Ordinais): Nominais: atributos que não apresentam uma ordem entre suas possíveis classes • Gênero, presença de doença, concordância em fazer a pesquisa ou não, cor dos olhos, onde mora Ordinais: dados ordinais, apresentam ordem entre suas possíveis classes • Classe social, escolaridade, estágio da doença, mês de observação Quantitativas (Discretas ou Contínuas): Discretas: contagens, pode-se mensurar de uma forma que não irá variar naquele momento, geralmente representadas por números inteiros • Número de filhos, cirurgias anteriores, número de fatores de risco Contínuas: pode assumir qualquer valor real em questão de minutos ou horas, representam resultados de medidas • Glicemia, pressão arterial VARIÁVEIS DERIVADAS • Idade Anos completos (variável discreta) 20-29, 30-39, 40-49, 50-59, 60 ou + (categoria politômica ordinal) Idoso ou não idoso (categoria dicotômica) • Renda Familiar Em reais (numérica contínua) Em salários mínimos (numérica discreta ou dicotômica) • IMC IMC em kg/m₂ (numérica contínua) ORGANIZAÇÃO DE DADOS ➢ Tabelas e figuras ➢ Tipo de variável X forma de apresentação ➢ Números absolutos e relativos Frequência Absoluta: contagem de ocorrências Frequência Relativa: proporção de ocorrências em relação ao todo TABELAS • Apresentação das informações de forma clara e concisa • Resultados mais importantes • Autoexplicativa (idealmente não precisa recorrer ao texto) • Não possuem linhas horizontais • Um título adequado deve informar os resultados: o que? em quem? onde? quando? número de indivíduos avaliados? VALOR P E INTERVALO DE CONFIANÇA Valor P: probabilidade de encontrar o resultado observado, dado que não exista diferença entre os grupos Valor P < 0,5: existe diferença estatisticamente significativa entre os grupos Probabilidade de o resultado encontrado ter sido ao acaso é menor de 5% Intervalo de Confiança: probabilidade de encontrar o valor “verdadeiro” se amostras fossem repetidas N vezes IC 95%: se a amostra for repetida N vezes, em 95% das vezes o IC irá incluir o valor “verdadeiro” da estimativa ANÁLISE ESTATÍSTICA Descritiva: usa-se para fazer resumo de dados → informações Inferencial: generalização dos achados → conclusões Análise de Dados Epidemiológicos Probabilidade: fenômeno cuja ocorrência não pode ser estabelecida equivocadamente Lida com fenômenos incertos (probabilidade de chover, probabilidade de ter uma doença) Apesar de não ter certeza, pode-se ter uma ideia de se é plausível ou não ➢ Desfecho: possível resultado de um experimento aleatório ➢ Espaço Amostral: conjunto de todos os desfechos do experimento aleatório ➢ Evento: subconjunto do espaço amostral Independência: uma variável que é independente da outra se a probabilidade de ocorrência de uma não influenciar a ocorrência da outra Ex: água parada e mosquito da dengue são variáveis dependentes Tendência Central: refere-se a estatística que busca identificar o centro de distribuição dos dados Dispersão: complementam a tendência central → representam o grau de variabilidade dos dados obtidos CURVA COM ASSIMETRIA A DIREITA: tendência central mais para negativo CURVA COM ASSIMETRIA A ESQUERDA: tendência central mais para positivo CUVA COM DISTRIBUIÇÃO NORMAL: dados distribuídos de forma homogênea, respeitando o ponto central dos dados • Curva com distribuição Platicúrtica • Curva com distribuição Leptocúrtica • Curva com distribuição Mesocúrtica O que muda entre elas é a forma com que ocorreu a distribuição dos dadosHomogeneidade da Variância: está relacionado com a variabilidade similar entre duas ou mais amostrar comparadas HIPÓTESE ESTATÍSTICA H0: Hipótese Nula (resultado não é estatisticamente significativo) H1: Hipótese Alternativa (testa-se um resultado e comprova) TESTE ESTATÍSTICO → Nível descritivo do teste Erro tipo I: ocorre quando rejeitamos uma hipótese nula verdadeira, consequentemente a hipótese alternativa é falsa Erro tipo II: ocorre quando aceitamos a hipótese nula como falsa, consequentemente a hipótese alternativa é a verdadeira Poder Estatístico: Valor P < 0,05 (5%) • Para ter poder estatístico precisa ser menor que 5% • Trabalha-se com um nível de significância de 95% DADOS QUALITATIVOS Valor Absoluto (N) Valor Relativo (%) • Média • Mediana • Variância • Desvio Padrão • Primeiro Quartil (25%) • Terceiro Quartil (75%) • Valor Máximo • Valor Mínimo Teste de Shapiro-Wilks / Lilliefors H0: a variável segue uma distribuição normal H1: a variável NÃO segue uma distribuição normal Teste de Levene / Bartlett H0: os grupos apresentam variâncias iguais (de uma variável especificada) H1: os grupos apresentam variâncias DESIGUAIS (de uma variável especificada) Teste de Qui-quadrado de Perason H0: as variáveis são INDEPENDENTES H1: as variáveis são dependentes Teste de Qui-quadrado para adequação de ajustamento H0: as proporções são similares a um padrão H1: as proporções são DIFERENTES de um padrão Teste de Mann-Whitney / Wilconxon (soma das ordens ou dos postos assinalados) H0: os grupos apresentam postos médios iguais (de uma variável especificada) H1: os grupos apresentam postos médios DIFERENTES (de uma variável especificada) Teste t para uma média H0: a variável apresenta média igual a um valor específico determinado a priori H1: a variável apresenta média DIFERENTE de um valor específico determinado a priori Teste t para amostrar diferentes ou paralelas H0: os grupos são similares em relação à média (de uma variável especificada) H1: os grupos são DIFERENTES em relação à média (de uma variável especificada) Teste t para coeficiente de correlação (Pearson/Speraman) ou para os coeficientes de regressão H0: coeficiente é igual a zero H1: coeficiente é DIFERENTE de zero