Prévia do material em texto
<p>Universidade Federal Rutal do Semi-Árido —- UFERSA</p><p>Departamento de Ciências Vegetais —- DCV</p><p>Fitotecnia</p><p>APOSTILA</p><p>DE</p><p>ESTATÍSTICA</p><p>= Professora: MSc. Gilmara Alves Cavalcanti</p><p>Natal/RN</p><p>Mude</p><p>mas comece devagar,</p><p>porque a direção é mais importante</p><p>que a velocidade.</p><p>[...]</p><p>Quando sair,</p><p>Procure andar pelo outro lado da tua.</p><p>Depois mude de caminho,</p><p>ande pot outras ruas,</p><p>calmamente,</p><p>observando com atenção</p><p>os lugares por onde você passa.</p><p>[.]</p><p>ude.</p><p>Lembre-se que a vida é uma só.</p><p>[...]</p><p>Se você não encontrar razões pata ser livre,</p><p>invente-as.</p><p>Seja criativo.</p><p>[..]</p><p>Experimente coisas novas.</p><p>Troque novamente.</p><p>Mude, de novo.</p><p>Experimente outra vez.</p><p>(Clarice Lispector)</p><p>De tudo ficatam três coisas:</p><p>A certeza de que estamos sempre a começar...</p><p>A certeza de que é preciso continuar...</p><p>A certeza de que seremos interrompidos antes de terminar...</p><p>Portanto, devemos:</p><p>Fazer da interrupção um caminho novo...</p><p>Fazer da queda um passo de dança...</p><p>Do medo uma escada...</p><p>Do sonho uma ponte...</p><p>Da procura um encontro...</p><p>E assim terá valido a pena existir...</p><p>(Fernando Sabino)</p><p>PROGRAMA:</p><p>UNIDADE I: ESTATÍSTICA DESCRITIVA.</p><p>1.1 — Introdução.</p><p>1.2 — Coleta, Organização e Apresentação de Dados.</p><p>1.3 — Medidas de Posição (Medidas de Tendência Central).</p><p>1.4 — Medidas de Dispersão e Achatamento.</p><p>UNIDADE II: CONJUNTOS E PROBABILIDADE.</p><p>2.1 — Conjuntos e Subconjuntos.</p><p>2.2 — Operações com Conjuntos.</p><p>2.3 — Conceitos de Probabilidade (Experimento, Espaço Amostral, Eventos).</p><p>2.4 — Probabilidade e suas Leis.</p><p>2.5 — Probabilidade Condicional.</p><p>UNIDADE III: VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÃO DE PROBABILIDADE.</p><p>3.1 — Variáveis Aleatórias (Conceitos).</p><p>3.2 — Distribuições de Probabilidade Discretas.</p><p>3.3 — Funções de Distribuição para Variáveis Aleatórias Discretas.</p><p>3.4 — Distribuições de Probabilidade Contínuas.</p><p>UNIDADE IV: DISTRIBUIÇÕES ESPECIAIS DE PROBABILIDADE.</p><p>4.1 — Distribuição Binomial.</p><p>4.2 — Distribuição de Poisson.</p><p>4.3 — Distribuição Normal.</p><p>4.4 — Distribuição Qui-quadrado.</p><p>4.5 — Distribuição T de Student.</p><p>UNIDADE V: TEORIA DE AMOSTRAGEM.</p><p>5.1 — Introdução.</p><p>5.2 — Amostragem Probabilística (Amostragem Aleatória Simples, Amostragem Sistemática,</p><p>Amostragem Estratificada.).</p><p>5.3 — Amostragem Não-Probabilística (Amostragem a Esmo ou sem Norma, Amostragem</p><p>Intencionais).</p><p>UNIDADE VI: TEORIA DE ESTIMAÇÃO.</p><p>6.1 — Introdução.</p><p>6.2 — Estimação por Ponto e por Intervalo. :</p><p>6.3 — Estimando a Média em Grandes e Pequenas Amostras.</p><p>6.4 — Estimando a Diferença entre Duas Médias em Grandes e Pequenas Amostras.</p><p>UNIDADE VI: TESTES DE HIPÓTESES</p><p>7.1 — Hipótese Estatística.</p><p>7.2 — Erros Tipo Le IH.</p><p>7.3 — Testes Unilaterais e Bilaterais.</p><p>7.4 — Testes Referentes a Médias.</p><p>7.5 — Teste de Ajustamento de Distribuição Teóricas.</p><p>7.6 — Testes de Independências.</p><p>UNIDADE VIII: CORRELAÇÃO E REGRESSÃO LINEAR.</p><p>8.1 — Diagrama de Dispersão.</p><p>8.2 — Coeficiente de Correlação.</p><p>8.3 — Regressão Linear Simples.</p><p>UNIDADE I: ESTATÍSTICA DESCRITIVA</p><p>1.1 - INTRODUÇÃO.</p><p>ESTATÍSTICA mu» CIÊNCIA</p><p>"A ciência não é um conhecimento definitivo sobre a realidade, mas um conhecimento</p><p>hipotético, que pode ser questionado e corrigido".</p><p>(Sónia Vieira)</p><p>Ensinar ciência não significa apenas descrever fatos, enunciar leis e apresentar novas</p><p>descobertas, mas ensinar o método científico, que é a maneira de buscar o conhecimento.</p><p>,</p><p>Exige: Organização dos dados, análise e tomada de decisões em condições de incerteza.</p><p>v e</p><p>ESTATÍSTICA: ferramenta do método científico</p><p>Os métodos estatísticos vêm sendo cada vez mais utilizados nas mais diversas áreas.</p><p>O que é Estatística?</p><p>Definições:</p><p>(1) "É a parte da Matemática Aplicada que trata de chegar a conclusões a partir de dados</p><p>observados".</p><p>(2) "É a ciência que trata de da organização, descrição, análise e interpretação de dados</p><p>experimentais”.</p><p>(3) "É a ciência que se ocupa dos fenômenos aleatórios".</p><p>(4) "É o estudo dos métodos e procedimentos para recolher, classificar, resumir e</p><p>analisar dados e, a partir deles, estabelecer inferências científicas”.</p><p>(5) "Não se limita ao levantamento e apresentação de dados numéricos dispostos em</p><p>tabelas e gráficos, mas também constitui na ciência da tomada de decisões ante a</p><p>incerteza”.</p><p>(6) "É a ciência ocupada em medir com precisão a imprecisão”.</p><p>(7) “É a ciência que se ocupa em medir a incerteza”.</p><p>Generalizando:</p><p>É a ciência que coleta, classifica e avalia numericamente fatos que servirão de base para</p><p>extrair conclusões. É um conjunto de técnicas para se obter conhecimento preciso a partir de</p><p>informações incompletas; é um sistema científico para coleta, organização, análise,</p><p>interpretação e apresentação de informações que possam ser colocadas sob forma numérica.</p><p>A Estatística trata de idéias e métodos que visam aperfeiçoar a obtenção de conclusões a</p><p>partir de informações numéricas, na presença da incerteza. :</p><p>Profa. MSc. Gilmara Alves Cavalcanti 4</p><p>Métodos Estatísticos: são métodos adaptados ao esclarecimento de dados quantitativos sujeitos à</p><p>influência de uma multiplicidade de causas.</p><p>Ramos da Estatística:</p><p>a) Estatística Descritiva: trata da observação de fenômenos de mesma natureza, da coleta de</p><p>dados numéricos referentes a esses fenômenos, da sua organização e classificação através de</p><p>tabelas e gráficos, bem como da análise e interpretação. Utiliza números para descrever</p><p>fatos. A finalidade é tornar as coisas mais fáceis de entender, relatar e discutir.</p><p>Ex.: taxa de desemprego; custo de vida; altura média de estudantes;</p><p>b) Probabilidade Estatística: utilizado para situações que envolvem o acaso (aleatoriedade).</p><p>Ex.: jogos de cartas e de dados; jogos esportivos; decisão de atravessar uma rua;</p><p>c) Inferência Estatística: estuda as características de uma população com base em dados</p><p>obtidos de amostras — Amostragem.</p><p>Ex.: provar um pedaço de bolo; verificar a temperatura da água de uma piscina; folhear um</p><p>novo livro; grandes processos industriais (amostra piloto);</p><p>RAZÕES PARA O USO DA AMOSTRAGEM:</p><p>> Custo (observações custam dinheiro, portanto, quanto maior o número de dados, maior o</p><p>custo envolvido) — a amostragem reduz a quantidade de dados e, consegiientemente, os</p><p>custos;</p><p>> Valor da Informação dura pouco (para ser útil a informação deve ser obtida e usada</p><p>rapidamente, visto que, às vezes o exame de um artigo o destrói) — a amostragem é a</p><p>única maneira de obter isso;</p><p>> Tempo;</p><p>OBS;: Estatística Indutiva pode ser denominada como inferencial. Portanto, a estatística</p><p>indutiva estuda as características de uma população, com base em dados.obtidos de amostras.</p><p>Inferência = Indução + Margem de Erro</p><p>OBS»: Os três ramos da estatística não são separados. Eles tendem a se entrelaçar.</p><p>1.2 - O MÉTODO ESTATÍSTICO (Coleta, Organização e Apresentação de Dados).</p><p>A realização de uma pesquisa deve passar, necessariamente, pelas fases resumidas no diagrama</p><p>abaixo, se um resultado satisfatório e preciso é desejado.</p><p>!</p><p>Definição do ) Planejamento ) Coleta dos ) Crítica dos</p><p>Problema Dados Dados</p><p>Análise e Interpretação Tabelas e Apresentação</p><p>dos Dados Gráficos dos Dados</p><p>Profa. MSc. Gilmara Alves Cavalcanti 5</p><p>& DEFINIÇÃO DO PROBLEMA: saber exatamente o que se pretende pesquisar, ou seja,</p><p>definir corretamente o problema. Essa primeira fase consiste na formulação correta do problema</p><p>a ser estudado. Í</p><p>& PLANEJAMENTO: determinar o procedimento necessário para resolver o problema, como</p><p>levantar informações sobre o assunto objeto do estudo. É importante a escolha das perguntas,</p><p>que na medida do possível, devem ser fechadas. No caso de um experimento, deve-se atentar</p><p>para os objetivos que se pretende alcançar. O levantamento dos dados pode ser de dois tipos:</p><p>Censitário (envolve toda a população);</p><p>Amostragem (utiliza-se uma parte da população);</p><p>Outros elementos do planejamento de uma pesquisa são:</p><p>Y Cronograma das atividades;</p><p>“Custos envolvidos;</p><p>Exemplo 01: Dois dados são lançados, registrando-se os resultados com (Xi, X2). Considere os</p><p>seguintes eventos: A = (( Xi, X5); Xi + X, = 10) e B= $(Xy, X>); Xj > X5). Calcule: P(A),</p><p>P(B), P(A/B)eP(B/A).</p><p>A partir da definição de Probabilidade Condicional pode-se ensinar o Teorema do Produto:</p><p>= P(A/Bj= NB) P(ANB)=P(B).P(A/B)</p><p>. “P(ANB) . PB PANB)=P(A).P(B/ 4)</p><p>> Independência</p><p>Definição: Dois eventos independentes quando a probabilidade de ocorrer um deles não é</p><p>modificada pela ocorrência do outro, isto é, P(4)=P(4/B) ou P(B)=P(B/4). Se A e B são</p><p>independentes então,</p><p>P(ANB)=P(A.P(B)</p><p>Exemplo 02: Um dado e uma moeda são lançados ao mesmo tempo. Qual é a probabilidade de</p><p>ocorrer cara na moeda sabendo que ocorreu número 6 no dado?</p><p>Exemplo 03: Um número é escolhido ao acaso no conjunto f1, 2, 3, ..., 20). Verifique se os</p><p>eventos A e B são independentes no seguinte caso: A = o número escolhido é par e B = o número</p><p>escolhido é múltiplo de 3.</p><p>Profa. MSc. Gilmara Alves Cavalcanti 40</p><p>LISTA DE EXERCÍCIOS 02</p><p>1. Um casal tem dois filhos. Qual é a probabilidade de: (a) O primogênito ser homem? (b) Os</p><p>dois filhos serem homens? (e) Pelo menos um dos filhos ser homem?</p><p>2. No cruzamento de ervilhas amarelas homozigotas (AA) com ervilhas verdes homozigotas (aa)</p><p>ocorrem ervilhas amarelas heterozigotas (Aa). Se estas ervilhas forem cruzadas entre si, ocorrem</p><p>ervilhas amarelas e verdes, na proporção de três para uma. Suponha que foram pegas ao acaso,</p><p>três ervilhas resultantes do cruzamento de ervilhas amarelas heterozigotas. Qual é a</p><p>probabilidade das três serem verdes?</p><p>3. Uma caixa contém dez peças das quais quatro são defeituosas. São retiradas duas peças, uma</p><p>após a outra. Calcular a probabilidade de ambas serem boas (com reposição e sem reposição).</p><p>4. Três componentes C,, C, e C3 de um microscópio são postos em série (em linha reta). Suponha</p><p>que esses mecanismos sejam dispostos em ordem alfabética. Sejam os eventos: A = C; está à</p><p>direita de Cy;e B= C3 está à direita de C,. Os eventos A e B são independentes?</p><p>5. Sejam A e B dois eventos associados a um experimento. Suponha que P(A) = 0,4 e P(AUB) =</p><p>0,7. Seja P(B) = p. Pergunta-se: (a) Para que valor de p, A e B serão mutuamente excludentes?</p><p>(b) Para que valor de p, A e B serão independentes?</p><p>6. Cada uma de duas pessoas joga três moedas equilibradas. Qual é a probabilidade de que elas</p><p>obtenham o mesmo número de caras?</p><p>7. Jogam-se dois dados. Desde que as faces mostrem números diferentes, qual é a probabilidade</p><p>de que uma face seja quatro?</p><p>8. Um dado é lançado e, independentemente, uma carta é extraída de um baralho completo. Qual</p><p>será a probabilidade de que: (a) O dado mostre um número par e a carta seja de um naipe</p><p>vermelho? (b) O dado mostre um número par ou a carta seja de um naipe vermelho?</p><p>9. Uma caixa contém 4 válvulas defeituosas e 6 perfeitas. Duas válvulas são extraídas juntas.</p><p>Uma delas e ensaiada e se verifica ser perfeita. Qual é a probabilidade de que a outra válvula</p><p>também seja perfeita?</p><p>10. Suponha que a probabilidade de um homem com 50 anos viver mais 10 anos seja igual a</p><p>32%, e que a probabilidade de que sua esposa que tem 40 anos, viver mais 10 anos e de 58%.</p><p>Qual é a probabilidade de que: (a) O casal viva mais 10 anos? (b) Somente um viva mais 10</p><p>anos? (e) Pelo menos um viva maisl0 anos?</p><p>11. Uma urna 1 contém 10 bolas brancas e 8 bolas vermelhas. A uma 2 contém 6 bolas brancas e</p><p>5 bolas vermelhas. Uma bola é escolhida da urna 1 e colocada na urna 2. Em seguida, uma bola é</p><p>escolhida ao acaso da urna 2 . Qual a probabilidade de que a bola escolhida seja vermelha?</p><p>12. Considere duas urnas A e B, a urna A contém uma bola branca e uma preta, e a urna B</p><p>contém duas bolas brancas e três pretas. Uma bola é escolhida da urna A e colocada na urna B.</p><p>Em seguida, uma bola é escolhida da urna B. Qual a probabilidade de que: (a) Ambas sejam da</p><p>mesma cor? (b) À primeira seja preta dado que a segunda foi branca?</p><p>13. Em uma população, sabe-se que o número de mulheres é duas vezes maior que a dos</p><p>homens. Sabe-se também que 6% dos homens são daltônicos e 3% das mulheres são daltônicas.</p><p>Se uma pessoa é selecionada, ao acaso, e verifica-se que é daltônica, determine a probabilidade</p><p>de que seja do sexo feminino. ,</p><p>Profa. MSc. Gilmara Álves Cavalcanti 41</p><p>UNIDADE Ill: VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÃO DE PROBABILIDADE</p><p>3.1- VARIÁVEIS ALEATÓRIAS (CONCEITOS)</p><p>E condição inerente à uma população existir variação quanto aos atributos que lhe podem</p><p>ser estudados. Portanto, a VARIABILIDADE é uma característica comum a dados de observação</p><p>e experimentos. Um atributo sujeito à variação é descrito por uma VARIÁVEL. Suponha a</p><p>seguinte situação:</p><p>Um pesquisador cria, em laboratório, ratos de uma só raça, em condições controladas de</p><p>alimentação e manejo. É razoável considerar que os pesos desses ratos variam. Sabe-se</p><p>que,</p><p>o Os machos pesam mais do que as fêmeas;</p><p>o Os animais ganham peso com a idade;</p><p>o Ratos de mesmo sexo, nascidos no mesmo dia têm pesos variáveis;</p><p>VARIABILIDADE: Resulta de um soma de fatores não controlados.</p><p>= O peso dos ratos é uma variável aleatória, X (v.a é toda variável influenciada pelo acaso).</p><p>As variáveis aleatórias (v.a”s) são classificadas em:</p><p>-» Variável Aleatória Discreta: assume um número finito ou infinito contável de valores</p><p>numéricos. Dá uma idéia de contagem (os valores que podem ser associados aos números</p><p>naturais (1,2,3,....)). Por exemplo, número de crias em animais.</p><p>> Variável Aleatória Contínua: assume um valor dado por uma medida numa escala contínua,</p><p>isto é, todos os valores possíveis num intervalo real. Istó é, assume infinitos valores em um dado</p><p>intervalo. Dá uma idéia de medição. Por exemplo, peso e comprimento de animais.</p><p>O DEFINIÇÃO DE VARIÁVEL ALEATÓRIA</p><p>Um modelo de probabilidade associado a um experimento contém dois componentes:</p><p>(1) O espaço amostral;</p><p>(11) As probabilidades associadas a cada resultado elementar.</p><p>Definição 01: Uma variável aleatória X associa um valor numérico a cada resultado elementar de</p><p>um experimento.</p><p>Definição 02: É uma função definida em um espaço amostral, quando a mesma representa um</p><p>fenômeno aleatório. E geralmente representada por X, onde a função de X associa a cada</p><p>elemento s e S um número real, X(s).</p><p>> Contradomínio (R,): É número de valores possíveis da variável aleatória X.</p><p>Exemplo 01: E = lançamento de um dado 5 vezes.</p><p>X = número de vezes que aparece o número 2 D Ry=(0,1,2,3,4,5)</p><p>Exemplo 02: E = lançamento de uma moeda 2 vezes.</p><p>X = número de caras obtidas nos dois lances ) Ry= 10,1,2)</p><p>Definição 03: Seja E um experimento e S um espaço amostral associado ao experimento. Uma</p><p>função X, que associe a cada elemento s e S um número real, X(s), é denominada variável</p><p>aleatória.</p><p>S Rx</p><p>Definição 04: Seja X uma variável aleatória. Se o número de valores possíveis de X, isto é Ry,</p><p>for finito ou infinito numerável então X é uma variável aleatória discreta.</p><p>S1 82 S3 S4 85 S6 s</p><p>SN A | | /</p><p>NA /</p><p>Ki 82 X3 X4</p><p>></p><p>=» A cada valor x; da variável aleatória X, podemos associar a sua probabilidade de ocorrência.</p><p>3.2- DISTRIBUIÇÕES DE PROBABILIDADE DISCRETAS</p><p>É uma expressão matemática aplicável a múltiplas situações desde que determinadas</p><p>premissas sejam respeitadas. Ela torna possível o cálculo de uma probabilidade por meio da</p><p>simples aplicação de fórmulas ou, às vezes, da leitura de uma tabela.</p><p>Distribuição de Probabilidade: É o conjunto de todos os valores que podem ser assumidos pela</p><p>variável discreta, com as respectivas probabilidades.</p><p>Exemplo 01: Considere o lançamento de um dado. A distribuição dos resultados do jogo de um</p><p>dado é dada por:</p><p>P(X)</p><p>X P(X)</p><p>1 1/6</p><p>2 1/6 1/6</p><p>3 1/6</p><p>4 1/6</p><p>5 1/6</p><p>6 1/6</p><p>Total Í HI »</p><p>12 3 4/5 6 X</p><p>Exemplo 02: Seja a variável aleatória X representando o número de caras em 3 lançamentos de</p><p>uma moeda. Como a moeda é honesta, os 8 pontos</p><p>amostrais do espaço amostral tem a mesma</p><p>probabilidade 1/8. Portanto, a distribuição da v.a X é dada por:</p><p>S = f(c, c, e); (e, e, k); (e, k, c); (k, e, c); (k, k, c); (k, c, k); (c, k, k); (k, k, k)3</p><p>P(X)</p><p>x | PG)</p><p>0 1/8 3/8</p><p>1 3/8</p><p>3 1/8</p><p>Total 1 | |</p><p>> x</p><p>0 1 2 3</p><p>Observar que X = 1 corresponde aos pontos amostrais ckk, kck, kkc, isto é, a probabilidades de</p><p>X=163/8.</p><p>Profa. MSc. Gilmara Alves Cavalcanti 43</p><p>3.3 - FUNÇÕES DE DISTRIBUIÇÃO PARA VARIÁVEIS ALEATÓRIAS DISCRETAS</p><p>Definição (Função de Probabilidade): Chama-se função de probabilidade (fp) da variável</p><p>aleatória discreta X, que assume valores Xj, X2,..., Xn; à função p(x;), que a cada valor de x;</p><p>associa sua probabilidade de ocorrência, isto é:</p><p>pCx) = É (xi) = P(X = x5) = Pi,</p><p>e deve satisfazer as seguintes condições: f (a) p(x;) > O para todo i;</p><p>OX pGro 1;</p><p>A função de probabilidade de uma variável aleatória discreta pode ser representada graficamente</p><p>pelo histograma de probabilidades.</p><p>80,9)</p><p>Considere novamente a v.a X representando</p><p>o número de caras em 3 lançamentos de uma</p><p>Moeda honesta. Na figura ao lado temos o</p><p>Histograma de probabilidade de v.a X</p><p>> x</p><p>O 1/2 3</p><p>Exemplo 0t: Supor que 30% das árvores de uma reserva florestal estão infestadas por um</p><p>parasita. Quatro árvores são selecionadas aleatoriamente. Seja X a variável aleatória</p><p>representando o número de árvores na amostra selecionada que tem o parasita presente. Obter a</p><p>distribuição de probabilidade de X e o histograma de probabilidade.</p><p>X=0 X=1 X=2 RX=3 X=4 Como 30% das árvores estão infectadas</p><p>NNNN NNNIL NNII NIII III “temos, P(I) = 0,3 e P(N) = 0,7. Como a</p><p>NNEN NINI INII população de árvores é muito grande e</p><p>NINN NIIN JTIINI a amostra é muito pequena considerar</p><p>INNN INNI TIIN as observações nas 4 árvores como</p><p>ININ independentes. Pela independência</p><p>IINN temos:</p><p>P(NNNN)=(0,7)(0,7)(0,7).(0,7) = 0,2401 D P(X=0)=0,2401</p><p>P(NNND=(0,7.(0,7)(0,70,3) = 0,1029 *» P(X = 1)=4.(0,1029)=0,4116</p><p>P(NNID= (0,7).(0,7)(0,3)(0,3) = 0,0441 D P(X=2) = 6.(0,0441) = 0,2646</p><p>P(NIID =(0,7)(0,3).(0,3).(0,3) = 0,0189 D P(X=3)=4(0,0189) = 0,0756</p><p>PITT = (0,3).(0,3)(0,3)(0,3) = 0,0081 D P(X=4)=0,0081</p><p>A função de probabilidade da v.a X é dada por:</p><p>X f(x)</p><p>0 0,2401 04</p><p>1 0,4116 ?</p><p>2 0,2646 0,3</p><p>3 0,0756</p><p>4 0,0081 0,2</p><p>Total l 0,1 — Sal + o Hm,</p><p>0 1 2/3 4</p><p>Profa. MSc. Gilmara Alves Cavalcanti 44</p><p>Definição (Função de Distribuição Acumulada): Seja X uma variável aleatória discreta.</p><p>Define-se a função de distribuição acumulada, F, da variável aleatória X como:</p><p>F6)=P(X 2</p><p>Muitos experimentos são executados sob diferentes conjuntos de suposições. Por causa</p><p>da sua importância e da sua vasta área de aplicações, estes experimentos recebem nomes</p><p>especiais. Na próxima unidade, vamos derivar as distribuições de probabilidade das variáveis</p><p>aleatórias associadas com estes experimentos e estudar algumas de suas propriedades. Dentre</p><p>algumas distribuições discretas podemos citar: Bernoulli, Binomial, Poisson, entre outras.</p><p>3.4- DISTRIBUIÇÕES DE PROBABILIDADE CONTÍNUAS</p><p>Se a variável X for contínua, somente haverá interesse na probabilidade de que a variável</p><p>assuma valores dentro de determinados intervalos, sendo sua distribuição de probabilidades</p><p>caracterizada por uma função densidade de probabilidade (f.d.p).</p><p>No capítulo 1, descrevemos como observações numa variável contínua podem ser</p><p>representadas num histograma. Quando determinamos um grande número de observações e os</p><p>intervalos de classe são reduzidos, o histograma tende para uma curva suave chamada curva de</p><p>fregiiência.</p><p>Se a altura da curva é padronizada tal que a área</p><p>abaixo é igual a 1, o gráfico é chamado de curva de</p><p>probabilidade. A altura da curva de probabilidade</p><p>em qualquer ponto x é usualmente denotada por</p><p>f (x), e sua função é chamada de função</p><p>densidade de probabilidade (fdp).</p><p>></p><p>3.5 - FUNÇÕES DE DISTRIBUIÇÃO PARA VARIÁVEIS ALEATÓRIAS CONTÍNUAS</p><p>Suponha que X é uma variável aleatória cujo contradomínio é formado por um número</p><p>finito muito grande de valores, digamos o intervalo Osx 0, qualquer que seja x;</p><p>(b) fe (x)d, =1; (a área total sob a curva vale 1)</p><p>b</p><p>(c) para quaisquer a eb com -col</p><p>OBS: As variáveis aleatórias cujos valores resultam de algum processo de mensuração, de um</p><p>modo geral, são as variáveis aleatórias contínuas. Por exemplo, o peso ou a altura de pessoas de</p><p>uma cidade; o tempo de vida de uma lâmpada; o diâmetro de rolamentos de esferas; etc.. Dada</p><p>uma variável aleatória contínua X, deseja-se saber qual a f£d.p de X. Para atingir este objetivo</p><p>alguns modelos são comumente usados para representar a f.d.p de variáveis contínuas, entre eles:</p><p>o modelo Normal, Exponencial, Gama, Qui-quadrado, entre outros.</p><p>Profa. MSc. Gilmara Alves Cavalcanti 46</p><p>3.6 - ESPERANÇA MATEMÁTICA</p><p>-> Variável Aleatória Discreta</p><p>Definição 01: Seja X uma variável aleatória discreta, com valores possíveis x1, x2,....Xn. Seja</p><p>p(x)=P(X=x),1=1,2,..n,... Então o valor esperado de X (ou esperança matemática de X),</p><p>denotado por E(X) é definido como:</p><p>EQ) =3ixpíx,)</p><p>O valor esperado, a exemplo da média aritmética para distribuições de frequências, é uma</p><p>medida de tendência central ou posição, só que utiliza a frequência relativa ou probabilidade.</p><p>Definição 02: Se X é uma variável aleatória discreta com função de probabilidade p(x;), o valor</p><p>esperado da função H(x), denotada por E[H(x)] é definido como:</p><p>ELO] = 5 HGp(x)</p><p>i=l</p><p>> Variável Aleatória Contínua</p><p>Definição: Seja X uma variável aleatória contínua, com f.d.p. O valor esperado de X é definido</p><p>como:</p><p>u= EX)= [ x fl)dx</p><p>> Propriedades do Valor Esperado:</p><p>E(c)</p><p>= c, onde c é uma constante.</p><p>E(cX) = c.E(X), onde c é uma constante</p><p>Sejam X e Y duas variáveis aleatórias quaisquer. Então, E(X + Y)=E(X) + E(Y).</p><p>Sejam n variáveis aleatórias Xi, X3, ..., Xn. Então, E(X, +...t Xn) = E(K1) +...+ E(Xn).</p><p>Seja (X, Y) uma variável aleatória bidimensional e suponha-se que X e Y sejam</p><p>independentes. Então, E(XY) = E(X).E(Y).</p><p>é</p><p>da</p><p>ua</p><p>O</p><p>VARIÂNCIA</p><p>=> Variável Aleatória Discreta</p><p>Definição: Seja X uma variável aleatória. Definimos a variância de X, denotada por V(X) ou</p><p>o; da seguinte maneira:</p><p>VC = E[X — ECO] = EX?) — [EGP</p><p>"> Variável Aleatória Contínua</p><p>Definição: Seja X uma variável aleatória contínua. Definimos a variância de X, denotada por</p><p>+</p><p>V(SX) ou o? da seguinte maneira: VOO = EIX- EGO) = fix - EGO] f(x)dx.</p><p>> Propriedades da Variância:</p><p>V(c) = 0, onde c é uma constante;</p><p>V(X + c) = V(X), onde c é uma constante;</p><p>V(cX) = 2. V(K):</p><p>Se (X, Y) for uma variável aleatória bidimensional, e se X e Y forem independentes.</p><p>Então, V(X + Y)= VR) + VCY).</p><p>5. Sejam Xy, Xo, ..., Xn, N variáveis aleatórias. Então, V(Xy +..+ &n) =V(Xp +... + V(Xn).</p><p>gi</p><p>qua</p><p>Jud</p><p>t</p><p>oa</p><p>Profa. MSc. Gilmara Alves Cavalcanti 47</p><p>Exemplo 01: Considere a v.a X representando o número de caras em 3 lançamentos de uma</p><p>moeda. Calcule F(X) e Var(X).</p><p>X PG) | x.P(S) |xi.P(X)</p><p>0 1/8 0 0 ER) => xp(x;)) = 12/8=1,5</p><p>l 3/8 3/8 3/8 Er</p><p>2 [ 38 [ 68 | 128 VOO = EIX - ECOP = EGO) - [EGOP 3 1/8 3/8 9/8 o 2 o</p><p>Total 1 12/8 | 24/8 VR) = (4/8) - (1,5) =3 2,25 = 0,75</p><p>Exemplo 02: Seja a distribuição uniforme com f.d.p dada: . 1</p><p>rog= [1/3 cI =</p><p>LISTA DE EXERCÍCIOS 03</p><p>1. Considere famílias com três filhos. Uma família é observada verificando-se a idade e o sexo</p><p>das crianças. Seja a variável aleatória: X = número de crianças do sexo masculino. Determine a</p><p>distribuição de probabilidade de X e o seu valor esperado e variância.</p><p>2. Considere o lançamento de um dado. Seja X o número mostrado na face superior. Determine a</p><p>distribuição de probabilidade de X e represente-a graficamente. Encontre E(X) e V(X).</p><p>3. Seja X uma v.a com Ry = f-1, 0, 13 com probabilidades: 1/3, 1/2 e 1/6, respectivamente.</p><p>a) Seja, Y =3X+ 1. Construa a distribuição de probabilidade de Y; Encontre E(Y).</p><p>b) Seja, Z = X2. Construa a distribuição de probabilidade de Z; Encontre V(Z).</p><p>4. Considere o lançamento de dois dados. Seja a variável aleatória X = a soma dos pontos</p><p>obtidos. Determine f(X), F(X) e E(X).</p><p>5. Suponha uma moeda onde cara tem três chances a mais que coroa. Considere três</p><p>lançamentos. Seja X, o número de caras obtido nos três lances. Calcule V(X).</p><p>6. Um jogador joga um dado uma vez, se ocorrer 1, 2 ou 3 ele recebe o dobro do número obtido</p><p>mais R$ 1,00. Caso contrário, ele paga o triplo do número obtido menos R$ 10,00. Calcule o</p><p>ganho esperado do jogador.</p><p>7. Um jogador lança um dado não viciado. Se ocorrer um número primo ele ganha este número</p><p>em dólares. Mas se ocorrer um número que não seja primo ele perde este número em dólares.</p><p>Este jogo e favorável ao jogador?</p><p>8. Considere o lançamento de um dado não viciado. Sejam as v.a's: X = o dobro do número</p><p>obtido; Y = 1 ou 3, conforme ocorra um nº ímpar ou par. Encontre o desvio padrão de X e de Y.</p><p>9. Com base na questão 8, considere a função Z = H(X + Y). Encontre o desvio padrão dessa</p><p>função. Determine E(Z) e V(Z).</p><p>10. Uma válvula eletrônica é posta em um soquete e testada. Suponha que a probabilidade do</p><p>teste ser positivo (+) é Ya. Suponha também que um grande número de válvulas está sendo</p><p>testado. Os ensaios continuam até que a primeira positiva apareça. Defini-se a seguinte variável</p><p>aleatória: X = número de testes necessários para concluir o experimento. Encontre a distribuição</p><p>de probabilidade de X.</p><p>Profa. MSc. Gilmara Alves Cavalcanti 48</p><p>UNIDADE IV: DISTRIBUIÇÕES ESPECIAIS DE PROBABILIDADE</p><p>> DISTRIBUIÇÃO BERNOULLI</p><p>Considere a realização de um experimento cujo resultado pode ser um SUCESSO (se acontecer o</p><p>evento de interesse) ou um FRACASSO (se o evento não se realizar), isto é, existem somente dois</p><p>resultados possíveis.</p><p>Definição: Seja X uma variável aleatória com valores 0 e 1. Então, a função de probabilidade da</p><p>variável aleatória X, chamada de distribuição de Bernoulli é dada por:</p><p>P(X=D=P (Sucesso)</p><p>P(X = 0) = (1-P) (Fracasso) IO)=P(X=3)=PEA-P; x=0]1</p><p>Exemplos:</p><p>1. Lançamento de uma moeda;</p><p>2. Extração de uma bola de uma urna contendo M bolas brancas e N bolas pretas;</p><p>3. Seleção de um item de uma caixa contendo itens perfeitos e defeituosos;</p><p>Principais Características: (a )Média: (X)= p.</p><p>(b) Variância: (00) =p(-p)=pg.</p><p>4.1 - DISTRIBUIÇÃO BINOMIAL</p><p>E uma distribuição que resulta da soma de variáveis aleatórias binárias. Isto é, o experimento</p><p>binomial é aquele no qual uma sequência de ensaios de Bernoulli é executada.</p><p>Definição: Seja a variável aleatória X o número total de sucessos em n ensaios independentes de</p><p>Bernoulli. Seja P a probabilidade de sucesso e (1-P) a probabilidade de fracasso.</p><p>Então, X é chamada de variável aleatória binomial se as seguintes condições são</p><p>satisfeitas:</p><p>(1) cada ensaio tem somente dois resultados sucesso (S) ou fracasso (F);</p><p>(ii) a probabilidade de sucesso é a mesma em cada ensaio;</p><p>(iii ) os ensaios são independentes;</p><p>Se X é uma variável aleatória binomial em n ensaios de Bernoulli, com probabilidade P de</p><p>sucesso e (1-P) de fracasso, a função de probabilidade da variável aleatória X, chamada de</p><p>distribuição binomial é dada por:</p><p>fO= PX == Era “PyS; x=0,,..5n.</p><p>Notação: X — Bin (n, P).</p><p>Exemplos:</p><p>1, Lança-se uma moeda dez vezes. Então, X é o número de caras observadas;</p><p>2. Extraem-se três bolas de uma urna, com reposição, contendo quatro bolas brancas e oito</p><p>bolas pretas. Então, X é o número de bolas pretas extraídas;</p><p>3. Selecionam-se quatro itens, com reposição, de uma caixa contendo três itens defeituosos</p><p>e sete itens perfeitos. Então, X é o número de itens defeituosos extraídos.</p><p>Principais Características: (a) Média: (X)=np.</p><p>(b) Vatiância: (10) =np(l- p)=n.pg.</p><p>Profa. MSc. Gilmara Alves Cavalcanti 49</p><p>LISTA DE EXERCÍCIOS 04 (Binomial)</p><p>1. De um lote contendo vinte itens, dos quais cinco são defeituosos, quatro itens são extraídos</p><p>com reposição. Qual a probabilidade de se obter: (a) exatamente um item defeituoso? (b) pelo</p><p>menos um item defeituoso?</p><p>2. Seja a variável aleatória X, o número de caras em quatro lançamentos de uma moeda. Qual a</p><p>probabilidade de se obter: (a) Exatamente duas caras? (b) Pelo menos uma cara? (c) Mais de</p><p>uma cara? '</p><p>3. Em uma família com cinco crianças, qual a probabilidade de que haja exatamente dois</p><p>meninos, supondo que os sexos são equiprováveis.</p><p>4. A probabilidade de um menino ser daltônico é 8%. Qual é a probabilidade de serem</p><p>daltônicos todos os quatro meninos que se apresentaram, em determinado dia, para um exame</p><p>oftalmológico?</p><p>5. Um exame é constituído de 100 testes com cinco alternativas, onde apenas uma é correta.</p><p>Quantos testes acertam, em média, um aluno que nada sabe sobre a matéria do exame? Qual é a</p><p>variância da distribuição?</p><p>6. Uma moeda é lançada 64 vezes. Determine a média e o desvio padrão do número de caras</p><p>obtidas.</p><p>4.2 - DISTRIBUIÇÃO DE POISSON</p><p>E também conhecida como lei dos fenômenos raros, é uma distribuição de variável descontínua,</p><p>utilizada quando a probabilidade de um acontecimento, embora muito pequena, poderá verificar-</p><p>se quando tomamos uma amostra muito grande. É um caso particular da distribuição Binomial,</p><p>onde P é muito pequeno e n é tão grande que a média é uma constante finita e igual a 4.</p><p>Em alguns casos conhece-se o número de sucessos, porém se torna difícil e, às vezes, sem</p><p>sentido determinar o número de fracassos ou o número total de provas. Por exemplo,</p><p>1. Automóveis que passam em uma esquina = pode-se num determinado intervalo de tempo</p><p>anotar o número de carros que passaram,</p><p>porém, o número de carros que deixaram de passar pela</p><p>esquina não poderá ser determinado.</p><p>2. Número de emendas numa fita colante = pode-se determinar quantas emendas existem, porém</p><p>não é possível contar quantas emendas não ocorreram.</p><p>Muitos experimentos consistem na observação de um número infinito de valores inteiros</p><p>0, 1, 2, .... em um intervalo contínuo de tempo ou em uma região contínua do espaço. A unidade</p><p>de tempo pode ser um minuto, uma hora, um dia, uma semana; e a unidade de espaço pode ser</p><p>comprimento, área, volume. A distribuição de Poisson se aplica a experimentos que conduzem a</p><p>resultados discretos em um espaço contínuo.</p><p>Definição: Seja X uma variável aleatória de Poisson com valores possíveis 0, 1, 2,... Então, a</p><p>probabilidade, ou função de probabilidade da variável aleatória X, chamada</p><p>distribuição de Poisson é dada por:</p><p>-À ax</p><p>e : x=0,1,... e 4>0.</p><p>x!</p><p>f)=PX=)=</p><p>Profa. MSc. Gilmara Alves Cavalcanti 50</p><p>onde e = 2,71828.... e À é o número médio de sucessos que ocorrem em um dado intervalo de</p><p>tempo ou região do espaço.</p><p>Exemplo:</p><p>1. O número de mortes por ano, de uma doença rara, em uma grande cidade:</p><p>2. O número de erros de impressão por página em um grande volume impresso;</p><p>3. O número de acidentes de automóvel por mês, em uma grande cidade;</p><p>4. O número de defeitos em um produto manufaturado;</p><p>5. O número de chamadas por minuto em uma central telefônica;</p><p>6. O número de ratos por acre em uma grande fazenda;</p><p>7. O número de aviões que chegam por hora em um grande aeroporto;</p><p>Principais Características: (a) Média: u= E(X)=A.</p><p>(b) Variância: o” = E(X 9) -[EQOP =</p><p>Aproximação pela Binomial:</p><p>e" fm</p><p>A aproximação: B(x;n,p) = » é boa se n é bastante grande e p pequeno, e de</p><p>tal sorte tal que: np Distribuição Normal Padrão</p><p>Distribuição Normal Padrão (ou Distribuição Normal Reduzida): É a distribuição</p><p>Normal com média igual a zero e variância igual a 1, ou seja, Z -N(0, 1).</p><p>Definição: Se a variável X possuir uma distribuição Normal, com média u e desvio padrão o ,a</p><p>variável Z que efetuará esta redução é dada pela equação, Z = e » onde Z — N(0, 1)</p><p>o</p><p>Graficamente:</p><p>A função de probabilidade da variável Z será:</p><p>I</p><p>AD) = enp| => (2) | —00 DISTRIBUIÇÃO NORMAL E APROXIMAÇÃO PELA BINOMIAL</p><p>Se a amostra for grande (n grande), a distribuição Binomial pode ser aproximada à</p><p>Coma . , , x-n</p><p>distribuição Normal. Neste caso, a variável reduzida será dada por: Z= Pp |</p><p>y RPpq</p><p>Quanto maior for o valor de n, melhor será a aproximação. Na prática, se (np > 5) e (ng > 5), diz-</p><p>se que a Binomial aproxima-se da Normal. Graficamente, se n é grande a aparência da</p><p>distribuição Binomial é geralmente a seguinte:</p><p>P(x)</p><p>. e. trecrcnroncosecaenenst**</p><p>Ls</p><p>Observa-se que, a distribuição Binomial é DISCRETA, enquanto que, a distribuição Normal é</p><p>CONTÍNUA. Diante disso, para que a aproximação seja feita corretamente é necessário que se</p><p>faça uma CORREÇÃO DE CONTINUIDADE (valor X = x da Binomial corresponde o intervalo</p><p>de(x — 0,5) e (x + 0,5)).</p><p>LISTA DE EXERCÍCIOS 04 (Normal)</p><p>1. Calcule as seguintes probabilidades: (D)P(O 1,93)</p><p>(b) P(-2,55</p><p>a 52cm;</p><p>8. X é uma variável aleatória contínua, tal que X-N(12, 25). Qual a probabilidade de uma</p><p>observação ao acaso: (a) ser menor do que —3; (b) cair entre —1 e 15?</p><p>4.4 - DISTRIBUIÇÃO QUE-QUADRADO</p><p>Trata-se de um modelo de distribuição contínua muito importante para a teoria da inferência</p><p>estatística. Seja x1, X2,...» Xp, “p” variáveis aleatórias independentes, normalmente distribuídas,</p><p>com média zero e variância 1. Define-se variável aleatória com distribuição qui-quadadro,</p><p>como:</p><p>XD=M x) +etxi,</p><p>Onde, p é um parâmetro da função densidade denominado grau de liberdade. Normalmente</p><p>utiliza-se a letra grega q para indicar o grau de liberdade.</p><p>Pode-se demonstrar que: Ely,]=x))=p eque Varlyjl=c"(y))=2p</p><p>Conforme o número de graus de liberdade (valor do parâmetro), a curva que descreve a função</p><p>densidade tem determinada forma.</p><p>A distribuição qui-quadrado está tabelada. A tabela dá a abscissa da distribuição para diversas</p><p>áreas (probabilidades) da cauda à direita. Assim</p><p>Exemplos:</p><p>a) Admita P=9e a =5% b) Sendo Q = 25 e a seguinte</p><p>situação:</p><p>sy ;</p><p>X inf X sup T6,9</p><p>Profa. MSc. Gilmara Alves Cavalcanti 54</p><p>Na tabela:</p><p>Em (a) Entrando-se na 1º coluna com PQ = 9, e na 1º linha com « = 0,05, encontra-se na</p><p>interseção dessa linha e coluna o valor 16,9.</p><p>Em (b) o valor da abscissa à direita, y? sup: Entrando-se na 1º coluna com Q = 25, e na 1º linha</p><p>com « = 0,025, encontra-se na interseção dessa linha e coluna o valor 40,6.</p><p>Em (b) o valor da abscissa à esquerda, 7” inf: Entrando-se na 1º coluna com QP = 25, e na 1º linha</p><p>com a = 0,975 = (1.000 — 0,025), encontra-se na interseção dessa linha e coluna o valor 13,1.</p><p>A distribuição de x? (lê-se qui-quadrado) é um caso particular da distribuição Gama, sendo</p><p>muito empregada em estatística Não-paramétrica, uma vez que a estatística 4”, utilizada para</p><p>verificação do ajuste de modelos probabilísticos teóricos a um conjunto de dados observados</p><p>segue tal distribuição. A função densidade de probabilidade é dada por:</p><p>1 BJS</p><p>1 =semro/)” e?</p><p>66,09% Em que: v são os graus de liberdade e I(n) é a função Gama. Para “n” inteiro e positivo,</p><p>E(n)=(n — 1!</p><p>Principais Características: (a) Média: u=E(X)=v.</p><p>(b) Variância: o? = E(X) -[ECOP =20</p><p>4.5 — DISTRIBUIÇÃO T DE STUDENT</p><p>Trata-se de um modelo de distribuição contínua que se assemelha a distribuição normal padrão,</p><p>N (0, 1). E utilizada para inferências estatísticas, particularmente, quando se tem amostras com</p><p>tamanhos inferiores a 30 elementos.</p><p>A distribuição t também possui um parâmetro denominado grau de liberdade (9). A média da</p><p>sua distribuição é zero, e sua variância é dada por:</p><p>o .P</p><p>A distribuição t é simétrica em relação à sua média.</p><p>Para valores de q AMOSTRAGEM ALEATÓRIA SIMPLES: Esta técnica só pode ser aplicada em populações</p><p>homogêneas e de tamanho conhecido. Suponha uma população de tamanho “Nº, da qual se</p><p>pretende obter uma amostra de tamanho “n” de elementos. Será possível, através de análise</p><p>combinatória, onde temos combinação de “N” elementos tomados “n” a “n”, (cx ), obter o</p><p>número possível de amostras simples de tamanho “n?. Enumeram-se todos os indivíduos da</p><p>população e sorteia-se (por meio de um dispositivo aleatório qualquer), os indivíduos que</p><p>comporão a amostra. Neste tipo de amostragem podem ser retiradas N” amostras diferentes</p><p>com reposição ou C” amostras diferentes sem reposição.</p><p>Exemplo: Suponha um hospital que trata de 5 tipos de doenças, A, B, €, D, ce E. Deseja-se fazer</p><p>um estudo em 3 dessas doenças. De quantas maneiras podemos escolher esses 3 tipos?</p><p>!</p><p>a) Solução Matemática: C; = TE =10 amostras distintas de tamanho 3;</p><p>b) Solução Prática: ABC, ABE, ACE, BCD, BDE, ABE, ACD, ADE, BCE, CDE.</p><p>Profa. MSc. Gilmara Alves Cavalcanti 56</p><p>-» AMOSTRAGEM ESTRATIFICADA: É uma técnica utilizada quando a população a ser</p><p>estudada é heterogênea, deste modo, subdivide-se a população em estratos (sub-populações) que</p><p>sejam homogêneos dentro de si, e heterogêneos entre si, e aplica-se uma das outras técnicas de</p><p>amostragem, para retirar-se sub-amostras dentro de cada estrato, de modo que a amostra final</p><p>seja representativa da população, como um todo (contenha indivíduos de todos os estratos).</p><p>Quanto ao tamanho das sub-amostras retiradas (n;) é classificada em:</p><p>l. Uniforme: quando de K estratos, retiram-se amostras de mesmo tamanho n,</p><p>independentemente do tamanho do estrato.</p><p>2. Proporcional: quando o tamanho da amostra retirado em cada estrato (n) é</p><p>proporcional ao tamanho do estrato.</p><p>Exemplo: Consideremos um estudo realizado em propriedades rurais de um município,</p><p>composto por 1000 propriedades rurais, distribuídas, quanto a sua área, conforme Tabela 01, e</p><p>que neste município sejam amostradas 50 propriedades.</p><p>Tabela 01 — Distribuição do número de propriedades rurais de um município qualquer, quanto a</p><p>área e número de propriedades a serem amostradas por estrato (classes).</p><p>Área (ha) Nº de Propriedades Amostra Estratificada (N = 50)</p><p>Uniforme Proporcional</p><p>O |-- 20 500 10 25</p><p>20 |-- 50 320 10 16</p><p>50 |-- 100 100 10 5</p><p>100 |-- 200 50 IO 3</p><p>200 |-- 400 50 10 1</p><p>Total 1000 50 50</p><p>>) AMOSTRAGEM SISTEMÁTICA: É uma simplificação da amostragem aleatória simples</p><p>(AAS). É aquela que ocorre quando a seleção dos elementos que constituirão a amostra é feita</p><p>por um sistema imposto pelo pesquisador. Neste caso, apenas o primeiro elemento da amostra</p><p>será sorteado, e os demais serão retirados em uma progressão aritmética, com razão k, em que:</p><p>K=N/n,</p><p>onde, N = tamanho da população e n = tamanho da amostra até se completar o tamanho da</p><p>amostra desejado.</p><p>Exemplo: À escolha de 3 elementos, em uma população com 5 elementos A, B, €, De E, poderá</p><p>ser feita supondo a escolha:</p><p>a) Os elementos de ordem tmpar:</p><p>A B cDE</p><p>—— rare ————</p><p>ACE</p><p>b) Os primeiros elementos: A BCDE</p><p>c) Os últimos elementos: A B cbDE</p><p>aterrar aaa aaa! aa pa</p><p>c DE</p><p>> AMOSTRAGEM POR CONGLOMERADOS: A amostragem por conglomerados é a</p><p>amostragem por área. Quando uma população apresenta uma subdivisão natural em grupos</p><p>menores (denominados conglomerados), sorteia-se um número suficiente desses grupos</p><p>(conglomerados) e todos os elementos destes vão compor a amostra. Divide-se a área ocupada</p><p>pela população em partes de estudo, como por exemplo, para uma cidade cada unidade amostral</p><p>pode ser um bairro, uma rua, um quarteirão, um condomínio, etc.</p><p>Profa. MSc. Gilmara Alves Cavalcanti 57</p><p>5.3 - AMOSTRAGEM NÃO-PROBABILÍSTICA</p><p>Esse tipo de amostragem tem como característica a impossibilidade da aplicação de</p><p>formulas estatísticas para calcular erros de amostra (Erro Amostral: É a diferença que poderá</p><p>ocorrer quando analisamos os resultados de uma amostra, e o que obteríamos se examinássemos</p><p>toda a população).</p><p>-» AMOSTRAGEM INTENCIONAL: Neste tipo de amostragem o pesquisador está</p><p>interessado na opinião de determinados elementos da população, mas não representativos da</p><p>mesma. O pesquisador não se dirige a massa de pessoas da população, e sim a alguém</p><p>representante dos mesmos. O pesquisador escolhe deliberadamente certos elementos da</p><p>população para formar a amostra, baseado num pré-julgamento.</p><p>Exemplo: Pesquisa de mercado para lançar uma nova marca de leite longa vida tipo A. O</p><p>pesquisador selecionará indivíduos com poder aquisitivo médio/alto, que são os principais</p><p>consumidores deste produto (público alvo), embora toda a população independentemente do</p><p>poder aquisitivo possa ser consumidora deste produto.</p><p>-» AMOSTRAGEM POR “JURIS”: Utilizada quando se deseja obter informações detalhadas,</p><p>durante certo espaço de tempo, sobre questões específicas.</p><p>Exemplo: Audiência de Rádio e TV e Orçamento Familiar são exemplos de pesquisas cuja</p><p>amostragem pode ser por “Júris”. Nesses casos, são escolhidas pessoas representativas do ponto</p><p>de vista da classe sócio-econômicas, pedindo-lhes que preencham relatórios ou diários de</p><p>despesas.</p><p>=) AMOSTRAGEM POR TIPICIDADE: É quando se utiliza um subgrupo que seja típico, em</p><p>relação à população como um todo.</p><p>Exemplo: Informações sobre saúde no esporte. Escolhem-se atletas de determinada modalidade</p><p>esportiva, para obter as informações e, gencralizá-las.</p><p>> AMOSTRAGEM POR “QUOTAS”: Utilizadas em levantamentos de mercado, prévias</p><p>eleitorais e sondagem de opinião pública — mesmo dando margem a polêmicas, devido às</p><p>técnicas probabilísticas. A amostragem por quotas é feita pela fixação do tamanho da amostra e</p><p>posteriormente a estratificação. É fácil a posteriori verificar o erro amostral sofrido pelo</p><p>tamanho da amostra.</p><p>Exemplo: Amostrar 80 frangos num galpão com 3000 frangos, amostrar peixes em um lago,</p><p>pessoas numa praça, etc.</p><p>Outras considerações:</p><p>=> INACESSIBILIDADE A TODA POPULAÇÃO: A amostragem é realizada na parte da</p><p>população que é acessível.</p><p>Exemplo: Controle de qualidade numa linha de produção de peças para motores. Só tem-se</p><p>acesso as peças que já estão prontas, embora as que ainda serão produzidas fazem parte da</p><p>população de peças para motores produzidos por aquela linha de produção.</p><p>> POPULAÇÃO FORMADA POR MATERIAL CONTÍNUO: Processo utilizado para se</p><p>amostrar líquidos, gases ou sólidos. Homogeniza-se o material a ser amostrado e em seguida</p><p>colhe-se a amostra.</p><p>Profa. MSc. Gilmara Alves Cavalcanti 58</p><p>Cálculo do Tamanho da Amostra:</p><p>PROCEDIMENTO PARA REALIZAR A AMOSTRAGEM ALEATÓRIA SIMPLES</p><p>Sejam:</p><p>= N: tamanho da população;</p><p>= n:tamanho da amostra;</p><p>“= no: uma primeira aproximação para o tamanho da amostra;</p><p>” Fo: erro amostral tolerável;</p><p>Um primeiro cálculo do tamanho da amostra Conhecendo o tamanho N da população,</p><p>pode ser feito, através da seguinte podemos corrigir o cálculo anterior por:</p><p>expressão:</p><p>l Nan</p><p>Ro = 3 n= o</p><p>E, N+n,</p><p>Exemplo: Suponha que a universidade deseja investigar o nível de satisfação dos alunos quanto</p><p>aos seus serviços. Com esse intuito é realizada uma pesquisa de opinião pública junto aos alunos</p><p>da instituição. Para minimizar as despesas uma amostra deve ser extraída da população de 3000</p><p>alunos. Supondo um erro amostral de 5%, qual deve ser o tamanho da amostra?</p><p>= N=3000 PR O</p><p>= Eo=5% º E? (0,05) 0,0025</p><p>“ n=? n= No — 3000(400) 15» 04.353</p><p>N+n, 3000 +400</p><p>PROCEDIMENTO PARA REALIZAR A AMOSTRAGEM ESTRATIFICADA</p><p>Estratificar uma população é dividí-la em “L” sub-populações denominadas estratos, tais que:</p><p>ntn+n+.+tnç=0,</p><p>onde os extratos são mutuamente exclusivos. Após a determinação dos estratos, seleciona-se</p><p>uma amostra aleatória de cada sub-população. Se as diversas sub-amostras tiveram tamanhos</p><p>proporcionais ao respectivo número de elementos nos estratos, teremos a estratificação</p><p>proporcional,</p><p>Exemplo: Com o objetivo de levantar o estilo de liderança preferido por uma escola, vamos</p><p>realizar um levantamento por amostragem.</p><p>Professores: P; P, P; P4 Ps Ps P; Ps Ps Pro</p><p>Servidores: Si S2 S3 Sa Ss Se S7 Sg So S1o</p><p>Alunos: A; A, As As As À6 Ay Àg ... Ag</p><p>Suponha:</p><p>Y Preferência quanto ao estilo de liderança possa ser homogêneo dentro de cada categoria.</p><p>YA realização de uma amostragem aleatória estratificada, proporcional por categoria.</p><p>“Obter uma amostra global de tamanho n = 10.</p><p>x a Tamanho do Subgrupo na</p><p>Estratos Proporção na População Amostra</p><p>Professores 10/50 = 0,20 (20%) n=(0,20).10=2</p><p>Servidores 10/50 = 0,20 (20%) n=(0,20).10=2</p><p>Alunos 30/50 = 0,60 (60%) n=(0,60).10 =6</p><p>Profa. MSc. Gilmara Alves Cavalcanti 59</p><p>PROCEDIMENTO PARA REALIZAR A AMOSTRAGEM SISTEMÁTICA</p><p>Seja N a população e n a amostra. Então, calcula-se o intervalo de amostragem (N/n) ou o inteiro</p><p>mais próximo “a”. Sorteia-se, utilizando a tábua dos números aleatórios, um número x entre 1 e</p><p>“a” formando-se a amostra dos elementos correspondentes aos números:</p><p>xxtax+2a..x+(n-Ia</p><p>Exemplo:</p><p>Seja, Então: 500/50 = 10, ou seja, a = 10.</p><p>= N=500 Sorteia-se um número de 1 a 10.</p><p>* n=50 Seja (x = 3) o número sorteado.</p><p>Logo, os elementos numerados por: 3, 13, 23, 33,..... serão os componentes da amostra.</p><p>PROCEDIMENTO PARA REALIZAR A AMOSTRAGEM POR CONGLOMERADOS</p><p>1. Dividir em conglomerados >» Conglomerados</p><p>a população (Companhias)</p><p>2. Selecionar aleatoriamente</p><p>os conglomerados</p><p>3. Pesquisar todos os indivíduos dos conglomerados selecionados</p><p>Amostra (trabalhadores das Companhias Selecionadas)</p><p>Profa. MSc. Gilmara Alves Cavalcanti 60</p><p>Suponha a seguinte situação:</p><p>População: X.</p><p>Parâmetro: O (média, variância, desvio-padrão,...). .</p><p>Amostra aleatória simples, com reposição, de tamanho n.</p><p>Estatística (T): T = (6 x,5...,%,) Dna.</p><p>Validade da Resposta ) Seleção de todas as amostras.</p><p>DISTRIBUIÇÕES AMOSTRAIS</p><p>POPULAÇÃO (X) AMOSTRAS (n)</p><p>(uy</p><p>DISTRIBUIÇÃO AMOSTRAL DA MÉDIA</p><p>Seja X uma população de média yu e variância o? sda qual se extrai uma amostra aleatória de</p><p>(4: : > 1Y “mn” elementos, (x,,x,,...,x,). Sabe-se que a média amostral é dada por, X = —3 x; . Como a</p><p>Ain</p><p>amostra é aleatória, cada x; tem a mesma distribuição que a população. Então,</p><p>Elx)=u e Var(x, )=0".</p><p>S” Demonstração:</p><p>>» ED = (2514, )-1. E) = |</p><p>ho i=l</p><p>Rn n 2 2</p><p>> Va(X)= vas 1) = A Var(x,) = Ro o.</p><p>A, À R Rn</p><p>Profa. MSc. Gilmara Alves Cavalcanti 6]</p><p>Portanto,</p><p>X- No? In) OBS: A variância com que se dispersam os</p><p>X-</p><p>No?) possíveis valores da estatística X é n vezes</p><p>— menor que a variância da população de</p><p>zo Are. N(0, 1) onde a amostra é retirada.</p><p>o/Jn</p><p>No caso de amostragem sem reposição de populações finitas a independência entre os valores X; não se verifica, então:</p><p>2</p><p>Zn Non</p><p>na N-l</p><p>Exemplo;</p><p>Seja X = 12,3, 4, 53. Extrair aleatoriamente, com reposição, amostras de 2 elementos e</p><p>determinar:</p><p>a) Média e variância populacional; b) Média e variância da distribuição amostral das médias;</p><p>Solução:</p><p>É 2434445 a) MN) = E DOE ss</p><p>n</p><p>(x, —*)?</p><p>o (X)= A AQ2=3,5)? +... +(5-3,57</p><p>=1,25</p><p>n 4 |</p><p>b) Número de amostras possíveis: N” =4? =16 amostras.</p><p>02) 23) 2,4) (25) 20 25 30 35 F = No? In)</p><p>(3,2) 6,3) (3,4) (3,5) 25 30 35 4,0 E,</p><p>(42) (43) (44) (49 |30 35 40 45 o</p><p>(52) (53) (54) (5,5) 35 40 45 50 EO) = u(Ã) =3,5</p><p>Var(X)=0"/n=0,625</p><p>X |20 25 30 35 40 45 50</p><p>PO) [1/16 2/16 3/16 4/16 3/16 2/16 1/16</p><p>> EO)=Dxp(x)=35 e VarD=BIE) LEO =0,625</p><p>> DISTRIBUIÇÃO AMOSTRAL DA PROPORÇÃO</p><p>Seja X uma população infinita e p a probabilidade de sucesso de certo evento. Seja</p><p>(X,,X,...,X,) uma amostra aleatória de tamanho A, € x o número de sucessos na amostra.</p><p>Variável aleatória com distribuição Binomial com média np, e variância, npq.</p><p>Profa. MSc. Gilmara Alves Cavalcanti 62</p><p>» A distribuição amostral da proporção (ou fregiiência relativa - fou p), f=xl/n, será dada</p><p>por:</p><p>f-N(p,pa/n)</p><p>“” Demonstração:</p><p>> H(f)= dE)-Le=-p</p><p>R n n</p><p>> Par) =Var( E) = torço = "24 = 24 onde g=(1-—p)</p><p>n) n n n</p><p>Se n for grande (n>30) a distribuição amostral de f(ou b) será normal. Sabe-se que, nesses</p><p>casos, pode-se aproximar a distribuição Binomial pela distribuição Normal. Portanto,</p><p>f-N(p,pq!n)</p><p>Sendo, Z = fp — N(0, 1), a variável normal padronizada da proporção.</p><p>Vpaín</p><p>Exemplo:</p><p>Seja X = (Mi, M>, Hi), onde sucesso é a ocorrência de uma mulher. Retirar as possíveis</p><p>amostras de tamanho 2, com reposição. Determinar:</p><p>a) O valor de f para cada amostra.</p><p>b) A média e a variância da variável aleatória fe</p><p>Solução:</p><p>Sucesso: Ocorrência de uma mulher D p=2/3€, consequentemente, q = 1/3</p><p>Calcular: f= x /n = (número de mulheres) / (tamanho da amostra)</p><p>a) O valor de f para cada amostra:</p><p>Amostras| MM, MM, MH MM, MM MH HM; HM HH;</p><p>f=xn | 1 1 1/2 I 1 1/2 1/2 1/2 0</p><p>f | 0 1/2 1</p><p>PO [1/9 49" 49</p><p>b) Média e variância da variável f:</p><p>Ef)=p=2/3</p><p>Sabe-se que: 7 — N(p, pq /n), então:</p><p>Var(f)=P8 = Q2/3(1/3) =1/9</p><p>a 2</p><p>R ESTIMAÇÃO (Pontual e Intervalar)</p><p>INFERÊNCIA ,</p><p>ESTATÍSTICA TESTES DE HIPOTESES (Paramétricos e Não-Paramétricos)</p><p>Profa. MSc. Gilmara Alves Cavalcanti 63</p><p>UNIDADE VI: TEORIA DE ESTIMAÇÃO</p><p>6.1 - INTRODUÇÃO</p><p>Usualmente é impraticável observar toda uma população, seja pelo custo caríssimo seja por dificuldades diversas. Examina-se então uma amostra. Se essa amostra for bastante</p><p>representativa, os resultados obtidos poderão ser generalizados para toda a população.</p><p>O pesquisador poderá levantar hipóteses das possibilidades das generalizações dos</p><p>resultados aos experimentos semelhantes. Deverá testar essas hipóteses que poderão ser</p><p>rejeitadas.</p><p>Um experimento pode ter por finalidade a determinação da estimativa de um parâmetro</p><p>de uma função.</p><p>Toda conclusão tirada por uma amostragem, quando generalizada para a população, virá</p><p>acompanhada de um grau de incerteza ou risco.</p><p>Ao conjunto de técnicas e procedimentos que permitem dar ao pesquisador um grau de</p><p>confiabilidade, de confiança, nas afirmações que faz para toda a população, baseadas nos</p><p>resultados das amostras, damos o nome de Inferência Estatística.</p><p>O problema fundamental da Inferência Estatística, portanto, é medir o grau de incerteza</p><p>ou risco dessas generalizações. Os instrumentos da Inferência Estatística permitem a viabilidade</p><p>das conclusões por meio de afirmações estatísticas.</p><p>População (N) Amostra (n)</p><p>"Q</p><p>Inferência Estatística Estimador (Estatística): É a medida usada para descrever uma característica da amostra.</p><p>» Estimativa: É o valor numérico do estimador. Por exemplo, X=17,8 é uma estimativa da</p><p>média populacional |.</p><p>Profa. MSc. Gilmara Alves Cavalcanti 64</p><p>6.2 - ESTIMAÇÃO DE PARÂMETROS (POR PONTO E POR INTERVALO).</p><p>Um dos objetivos básicos da experimentação é a estimação de parâmetros. Estuda-se uma população cuja distribuição é considerada conhecida por meio de uma função densidade de</p><p>probabilidade, f (X; O ,, 05, «O ») onde X é uma variável aleatória e O, i= 1,2,..., p, são os parâmetros da distribuição. Por exemplo,</p><p>2</p><p>PD X- N(u,o?) onde f (x; u,0?) = .exp 58 + portanto a</p><p>oN2a 21 6</p><p>distribuição de X, que é normal, depende de 2 parâmetros ,o”.</p><p>Temos de avaliar um ou mais parâmetros da distribuição populacional, tomando por base uma amostra casual simples x, x2,.... Xn. O principal problema é procurar funções de</p><p>observações que forneçam estimativas dos parâmetros.</p><p>A distribuição dessas funções deve estar concentrada o mais possível em torno dos</p><p>verdadeiros valores dos parâmetros de O. Estas funções, como já vimos, são estimadores: O e</p><p>o valor numérico deles, calculados usando as observações x1, x2,.... Xn São as estimativas dos</p><p>parâmetros: É 9. Por exemplo,</p><p>E . > a > X =-5 x, é um estimador de y e X =X, é uma estimativa.</p><p>i=l</p><p>20.14 72 >s = pasa) é um estimador de o? e s?=s?o é uma estimativa</p><p>Ala</p><p>calculada na amostra.</p><p>Vimos no capítulo anterior a distribuição por amostragem de dois estimadores: a média e</p><p>a proporção amostral. Lembrando:</p><p>SeX-N(u,o?)então X- N(u,o? /n)</p><p>Se p é a proporção com yu =pe o? = p.q, então, P) - N(p, pg /n)</p><p>TIPOS DE ESTIMAÇÃO > Há dois tipos fundamentais: POR PONTO e POR INTERVALO.</p><p>ESTIMAÇÃO POR PONTO</p><p>Na Estimação por Ponto, a partir das observações, calcula-se uma estimativa, usando o</p><p>estimador ou “estatística”.</p><p>À distribuição por amostragem dos estimadores torna possível o estudo das qualidades de</p><p>um estimador.</p><p>QUALIDADES DE UM BOM ESTIMADOR:</p><p>Quanto maior o grau de concentração da distribuição amostral do estimador em torno do</p><p>verdadeiro valor do parâmetro pcpulacional, tanto melhor será o estimador. As principais</p><p>qualidades que deve ter um estimador são:</p><p>a) Consistência c) Eficiência</p><p>b) Ausência de vício d) Suficiência</p><p>Profa. MSc. Gilmara Alves Cavalcanti 65</p><p>(a) Consistência</p><p>A</p><p>Definição: Um estimador O é consistente para estimar O , se lim(P | ô-8 be)=0. Po</p><p>nO</p><p>exemplo, Y é um estimador consistente para u“.</p><p>(b) Ausência de Vício ou Justeza</p><p>Definição: Um estimador O é não-viciado, não-tendencioso, não viesado ou justo se E(0)= 0.</p><p>Por exemplo, X é um estimador não-viciado para 4 poisE(X)= u.</p><p>(c) Eficiência</p><p>Definição: Dados dois estimadores O , e 05, definimos eficiência de um parâmetro com relação</p><p>a outro, para um mesmo tamanho de amostra, como E; = Var( O 2/ Var(0 ). Um estimador é</p><p>mais eficiente que outro se sua variância for menor que a do outro. Por exemplo, se É , é menos</p><p>eficiente que 0 2 então Ep 1.</p><p>(d) Suficiência</p><p>Definição: Um estimador O de O é suficiente se contém o máximo possível de informações</p><p>com relação ao parâmetro por ele estimado, em forma bem mais simples de dizer. O estimador</p><p>O de O é suficiente se, para qualquer outro estimador O k à distribuição de 0, for</p><p>independente de 0.</p><p>Há critérios para a escolha de estimadores.</p><p>Por exemplo, O Método da Máxima</p><p>Verossimilhança, O Método dos Momentos e o Método de Bayes.</p><p>ESTIMAÇÃO PONTUAL: a partir da amostra procura-se obter um único valor de certo</p><p>parâmetro populacional.</p><p>é Em geral é INSUFICIENTE Exemplo: A média amostral é um estimador</p><p>pontual da média populacional.</p><p>ESTIMAÇÃO INTERVALAR: a partir da amostra procura-se construir um intervalo de</p><p>A</p><p>variação, 6, 30€ea Tamanho da n>30 n» Act sfots 2, eta</p><p>on</p><p>P|-Z -“X30) D szo.</p><p>* “sº é um estimador viesado para o, mas aumentando o tamanho da amostra o viés tende a</p><p>desaparecer; portanto o IC para y pode ser construído.</p><p>. Quanto menor a amostra mais necessária se torna a introdução de uma correção: t (n- 1) ã0</p><p>invés de Z.</p><p>Sabe-se que, X - N(u,0? In) e Z= RE = N(0, 1).</p><p>o/vn</p><p>Distribuição</p><p>t-Student</p><p>2 X-</p><p>E” I</p><p>Pta StStn)=l-a</p><p>Então, t,, =</p><p>Profa. MSc, Gilmara Alves Cavalcanti 68</p><p>Para o caso de populações finitas:</p><p>PX-tn PO cu</p><p>n(E=s DL cu 30: distribuição binomial = normal, então: :</p><p>Z= f-p = N(O, D</p><p>— Lan 0 Zan Vpg!n</p><p>Fixando-se um nível de confiança (| - «) tem-se:</p><p>PM-Zin 30 pode-se substituir p e gporfe(l-7):</p><p>14 tu (02 eps sf 42 (Dn n n</p><p>Profa. MSc. Gilmara Alves Cavalcanti 69</p><p>6.4 — ESTIMANDO A DIFERENÇA ENTRE DUAS MÉDIAS EM GRANDES E PEQUENAS AMOSTRAS.</p><p>INTERVALO DE CONFIANÇA PARA A DIFERENÇA ENTRE MÉDIAS DE DUAS</p><p>POPULAÇÕES</p><p>CASO 01:</p><p>Intervalo de Confiança para a Diferença Entre Médias de Duas Populações Normais</p><p>(Variâncias Conhecidas)</p><p>Se X, -N(u,0D)e X 2 N(g,,03), então X; e X> são independentes. Dessa forma:</p><p>X, - N(uooi/n) e X, - Ng .04 /n,)</p><p>Portanto,</p><p>2 2 0 - o o</p><p>(X, Fo-afu cu bi</p><p>ho</p><p>X-X)-(u - o E, Z= Hr Ão)- (4 — mo) » para amostras aleatórias independentes.</p><p>o; o; mai + —ami</p><p>Mon</p><p>O intervalo de confiança é dado por:</p><p>X -Y [s o Ss o O</p><p>fe TAZ +</p><p>normal com desvio- padrão populacional 1,2 mm, construir IC para a média (90%, 95% e 99%).</p><p>2. De uma distribuição normal com q? =1,96, obteve-se a seguinte amostra: 25,2: 26,0; 26,4;</p><p>27,1; 28,2; 28,4. Determinar o intervalo de confiança para a média da população, sendo a = 0,05</p><p>e «=00.</p><p>3. Suponha que as alturas dos alunos de nossa faculdade tenham distribuição normal com o = 15</p><p>cm. Foi retirada uma amostra aleatória de 100 alunos obtendo-se X=175 em. Construir, ao nível de 95% o IC para a verdadeira altura média dos alunos.</p><p>4. Dados n = 10, X=IlQ e S= 10, determinar os intervalos de confiança para u aos níveis de</p><p>90% e 95%.</p><p>S. Uma amostra aleatória de 400 domicílios mostra-nos que 25% são casas de aluguel. Qual é o IC da proporção de casas de aluguel? q = 0,05.</p><p>6. Uma amostra de 300 habitantes de uma cidade mostrou que 180 desejavam a água fluorada. Encontrar os IC de 90% e 95% para a população favorável a fluoração.</p><p>7. Em 50 lances de uma moeda foram obtidas 30 caras. A partir de um IC de 96%, pode-se dizer que a moeda é honesta?</p><p>Profa. MSc. Gilmara Alves Cavalcanti 71</p><p>8. Numa pesquisa de mercado, n = 400 pessoas foram entrevistadas sobre determinado produto, e 60% destas pessoas preferiram a marca A. Construa um IC para a proporção a um nível de 95%.</p><p>9. Digitadores são treinados em uma empresa em duas turmas distintas. Na primeira turma (Turma J), utiliza-se um método japonês de ensino, e na segunda turma (Turma A) utiliza-se um</p><p>método alemão. Amostras de cada turma foram escolhidas, onde observou-se s;=41 e</p><p>s) =4,3. Os dados obtidos estão abaixo. Construir um IC para a diferença entre médias, 90%.</p><p>Turma Tempos (min)</p><p>J IO 13 9/10 14 13 10 15 12 IO 9 10 13 14 A IS 12 18 16 15 17 17 15 t6 17 11 17 14</p><p>10. Suponha duas populações normalmente distribuídas de forma que: X|- (1, 25) e a população</p><p>Il normal, onde, X>-(1.,,40). Os dados obtidos são definidos abaixo. Construa um IC para</p><p>(u, -u,) ao nível de 95%.</p><p>População Dados</p><p>I 12 14 15 14 13 17 14 13</p><p>H 13 17 14 13 16 17 18 16</p><p>11. Um teste psicológico destinado a medir a precisão com que uma pessoa julga outras pessoas, foi realizado. As notas possíveis do teste variam de 0a 41. Durante sua elaboração o teste foi aplicado à vários grupos a diferentes de pessoas. De acordo com os resultados observados, construa um intervalo de confiança para a diferença entre as médias dos dois grupos a um nível de 10%.</p><p>Grupo Sexo n X s</p><p>1 Homens 133 25,34 5,05</p><p>2 Mulheres 162 24,94 5,44</p><p>Profa. MSc. Gilmara Alves Cavalcanti 72</p><p>UNIDADE VII: TESTES DE HIPÓTESES</p><p>Suponha que certa distribuição dependa de um parâmetro O e que não se conheça 6 ou, então, há razões para acreditar que O variou, seja pelo passar do tempo ou, então, pela introdução de novas técnicas na produção, por exemplo.</p><p>A Inferência Estatística fornece um processo de análise denominado Teste de Hipóteses, que permite se decidir por um valor do parâmetro 6 ou por sua modificação com um grau de risco conhecido. O Teste de Hipótese é um Processo de Decisão Estatística.</p><p>Regra de decisão que permite aceitar ou rejeitar uma hipótese, decisão esta que é tomada em função dos valores amostrais. Em outras palavras, formula-se uma hipótese quanto ao valor do parâmetro populacional, e pelos elementos amostrais faz-se um teste que indicará a rejeição, ou não, da hipótese nula (Ho).</p><p>7.1 — HIPÓTESE ESTATÍSTICA</p><p>& HIPÓTESE ESTATÍSTICA: Suposição quanto ao valor de um parâmetro ou quanto à natureza da distribuição de uma probabilidade de uma variável populacional.</p><p>“* TIPOS DE HIPÓTESES:</p><p>Ho: Hipótese Nula. É aquela que será testada, sendo sempre contrária ao resultado do experimento.</p><p>Hi: Hipótese Alternativa. É qualquer hipótese diferente da hipótese nula, sendo sempre a</p><p>favor do resultado do experimento.</p><p>7.2 - ERROS TIPOIE II</p><p>Erro Tipo I (o): P(rejeitar Ho | Ho é verdadeira)</p><p>Erro Tipo II (8): P(aceitar Ho | Ho é falsa)</p><p>Deseja-se: reduzir Realidade : Decisão = ao o as Aceitar Ho Rejeitar Ho</p><p>probabilidades dos Ho é verdadeira | Decisão Correta (1 -- a) Erro Tipo I (o)</p><p>erros Ho é falsa Erro Tipo II (8) Decisão Correta (1 — 8)</p><p>TAREFA DIFÍCIL: para uma amostra de tamanho n a probabilidade de se incorrer em</p><p>um erro tipo I[ aumenta à medida que diminui a probabilidade do erro tipo I (vice-versa).</p><p>REDUÇÃO SIMULTÂNEA AUMENTO DO</p><p>DOS ERROS + | TAMANHO DE “np”</p><p>7.3 - TESTES UNILATERAIS E BILATERAIS</p><p>a) H,:0=0, b) H,:0=0, e) H,:0=0,</p><p>H,:0=06, H,:00,</p><p>—</p><p>e</p><p>O</p><p>am</p><p>um</p><p>u</p><p>y</p><p>-</p><p>o</p><p>o</p><p>O</p><p>me</p><p>o</p><p>mi</p><p>O</p><p>u</p><p>m</p><p>Profa. MSc. Gilmara Alves Cavalcanti 73</p><p>*” PROCEDIMENTO PARA CONSTRUÇÃO DO TESTE DE HIPÓTESE:</p><p>1. Enunciar as hipóteses Ho e H.</p><p>2. Fixar o limite do erro & » e identificar a variável do teste.</p><p>3. Determinar as RA e RC para Ho, com o auxílio das tabelas estatísticas, considerando q e a variável do teste.</p><p>4. Com os elementos amostrais, calcular o valor da variável do teste.</p><p>S. Concluir pela aceitação ou rejeição de Ho pela comparação do valor obtido no 4º passo com RA e RC.</p><p>TESTES NÃOQ-PARAMÉTRICOS: a</p><p>hipótese é formulada com respeito à</p><p>natureza da distribuição da população.</p><p>TESTES PARAMÉTRICOS: a hipótese é</p><p>formulada com respeito ao valor de um</p><p>parâmetro populacional.</p><p>TESTES PARAMÉTRICOS</p><p>7.4- TESTES REFERENTES A MÉDIAS E PROPORÇÕES</p><p>» TESTE PARA A MÉDIA</p><p>H+*MHo (a)</p><p>1. Enunciar as hipóteses: H, ut X HosuHo (ec)</p><p>2. Fixar o nível de significância q. Admitindo o? desconhecida, a variável do teste será</p><p>tn.</p><p>3. Determinar RA (Região de Aceitação) e RC (Região de Crítica ou de Rejeição) através</p><p>da tabela t.</p><p>X-u</p><p>Sin.</p><p>4. Calcular a variável do teste La E</p><p>S. Conclusões:</p><p>a)Se Lo tyr2 OU ty -t,» não se pode rejeitar Ho.</p><p>SE Lu t,,» rejeita-se Ho.</p><p>Profa. MSc. Gilmara Alves Cavalcanti 74</p><p>Exemplo: Os registros de um colégio atestam para calouros admitidos uma nota média de 115. Para testar a hipótese de que a média de uma nova turma é a mesma, tirou-se ao acaso, uma amostra de 20 notas, obtendo-se média 118 e desvio-padrão 20. Admitir a =5% para efetuar o teste.</p><p>Solução:</p><p>Dados: u=115, n=20, X =118,8=20€ a = 0,05. 3. Determinar RA e RC:</p><p>Ho :u=115</p><p>1. Enunciar as hipóteses: P fi :uA115</p><p>2.4 =5%</p><p>Variável: 1) =!09) > 095%) = 2,093 à À</p><p>-2,093 0 2,093</p><p>Xu M8-115</p><p>“ giln 20/20</p><p>5. Conclusão: como — 2,093 TESTES PARA PROPORÇÕES</p><p>pépo (a)</p><p>1. Enunciar as hipóteses: H, : p= Po X HiyppPpo (c)</p><p>2. Fixar nível de significância a. A variável escolhida é Z, normal padrão.</p><p>3. Determinar RA e RC através da tabela da distribuição normal padrão, Z.</p><p>- f-po</p><p>VPoão /n</p><p>4. Calcular a variável do teste D Z,,</p><p>5. Conclusões:</p><p>Se Zn Zan ou Zea rejeita-se Ho.</p><p>b) Se Z.y >—Z,, » não se pode rejeitar Ho.</p><p>Se Za 2Z,» tejeita-se Ho. cal</p><p>Profa. Gilmara Alves Cavalcanti 75</p><p>Exemplo: As condições de mortalidade de uma região são tais que a proporção de nascidos vivos que sobrevivem até 60 anos é 0.6. Testar essa hipótese ao nível de 5% se em 1000 nascimentos amostrados aleatoriamente, verificou-se 530 sobreviventes até 60 anos.</p><p>Solução:</p><p>Dados: p, =0,6, n=1000, 2 =0,05 e f =530/1000= 0,53. 3. Determinar RA e RC:</p><p>H,:p=0,6</p><p>1. Enunciar as hipóteses:</p><p>H,:p+0,6</p><p>2.4 =5%</p><p>Variável: Z, sw = 1,96</p><p>I</p><p>I</p><p>1</p><p>1</p><p>I</p><p>1</p><p>I</p><p>0 -1,96 1,96</p><p>4. Calcular a estatística do teste: Z,, = 7 e ; = Jo TA Sos =</p><p>P od n > ></p><p>+,</p><p>5. Conclusão: como —Z.,</p><p>de mortalidade da região de nascidos vivos que sobrevivem até 60 anos é diferente de</p><p>60%.</p><p>> TESTE PARA IGUALDADE DE DUAS MÉDIAS</p><p>CASO 0]:</p><p>Variâncias Populacionais Conhecidas, Independentes e Normais.</p><p>Hoim=M ou m-H=d 1. Enunciar as hipóteses:</p><p>Rn 'MÉM ou H-H, *£d</p><p>2. Fixar o nível de significância q. A variável escolhida é Z, normal padrão. Portanto,</p><p>2 2 on o. o</p><p>(X, -Fo-a(u — Mo, — E)</p><p>Ao A</p><p>3. Determinar RA e RC através da tabela da distribuição normal padrão, Z.</p><p>X -X9)-(u - 4. Calcular a variável do teste: Z,, = (mo) (tm o 4)</p><p>SO</p><p>Ai A,</p><p>S. Conclusões:</p><p>a)Se Zn SZoy £Z,12» não se pode rejeitar Ho. - cal</p><p>Se Zu >Z412 OU Z,y A</p><p>| AA,</p><p>5. Conclusões:</p><p>a) Se —t,,2 Stay t412 OU ty TESTE QUI-QUADRADO DE ADEQUAÇÃO</p><p>Suponha que em uma determinada amostra de tamanho n, observou-se que um conjunto</p><p>de eventos possíveis, E,,E,,...,E,, ocorreram com as fregiiências observadas 0,,0,,...,0,; €</p><p>que de acordo com as regras de probabilidade, era de se esperar que esses eventos ocorressem</p><p>com fregiências esperadas, e,,e,,..., er.</p><p>Objetivo: verificar de</p><p>Eventos E; Eb E .. HH modo significativo se</p><p>Fregiiências Observadas | o, 0; O, O; - as fregiiências</p><p>observadas diferem</p><p>das esperadas.</p><p>Frequências Esperadas e, e, Oo &</p><p>Conceitos Importantes:</p><p>* EVENTO: qualquer ocorrência associada a um fenômeno aleatório.</p><p>& FREQUÊNCIA OBSERVADA: é a freqliência que se observa através da realização de um</p><p>determinado experimento aleatório.</p><p>«e FREQUÊNCIA ESPERADA: é à frequência que se espera que aconteça sem a realização de</p><p>determinado experimento aleatório. :</p><p>Profa. Gilmara Alves Cavalcanti 77</p><p>Procedimento para a Construção do Teste:</p><p>1. Enunciar as hipóteses: | Ho: não há discrepâncias entre as fregiências 0,€ €,.</p><p>Hi: há discrepâncias entre as frequências 0,€e,.</p><p>2. Fixar o nível de significância q. A variável escolhida é Xen onde k é o número de</p><p>eventos.</p><p>3. Determinar RA e RC através da tabela y”.</p><p>4. Calcular a variável do teste:</p><p>2 2</p><p>0, — € 0,-€ (oe? (oe), 2.</p><p>Neca =</p><p>é é,</p><p>5. Conclusões:</p><p>a) Se 2a 7º, rejeita-se Ho.</p><p>Exemplo: Em 100 lances de uma moeda, observaram-se 65 coroas e 35 caras. Testar a hipótese</p><p>de a moeda ser honesta adotando-se q = 5%.</p><p>Solução:</p><p>1. Enunciar as hipóteses: | Ho: A moeda é honesta</p><p>H;: A moeda não é honesta</p><p>2. 4 =5%.</p><p>Variável: Zon =40 Xi 384.</p><p>3. Determinar RA e RC através da tabela 7”.</p><p>4. Calcular a variável do teste</p><p>Eventos Cara Coroa</p><p>Fregiiência Observada | 35 65</p><p>Frequência Esperada 50 50</p><p>3,84</p><p>2. (35-50 4 (65-50 - 9 Xcat 50 50</p><p>5. Conclusão: Como 72, >3,84, rejeita-se Hp, concluindo-se com risco de 5%, que a</p><p>moeda não é honesta.</p><p>Profa. Gilmara Alves Cavalcanti 78</p><p>7.6 — TESTE DE INDEPENDÊNCIA</p><p>> TESTE QUI-QUADRADO DE ASSOCIAÇÃO</p><p>Objetivo: estudar a associação ou dependência, entre duas variáveis.</p><p>Tabela de Contingência: representação das frequências observadas. .</p><p>Cálculo das frequências esperadas tem como base à definição de v.a independentes.</p><p>X e Y independentes: P(X;, Yp = PXD.P(Y9</p><p>Procedimento para a Construção do Teste:</p><p>e</p><p>1. Enunciar as hipóteses:</p><p>Ho: as variáveis são independentes (as variáveis não estão associadas).</p><p>Hy: as variáveis são dependentes (as variáveis estão associadas).</p><p>Fixar o nível de significância q. A variável escolhida é Xec onde Z é o número</p><p>de linhas da tabela de contingência e C é o número de colunas.</p><p>3. Determinar RA e RC através da tabela 7”.</p><p>4. Calcular a variável do teste:</p><p>L € 1 2</p><p>2 - (o; —&; p= E Ce</p><p>i=l j=i ij</p><p>y</p><p>onde, e;= ((soma da linha i)(soma da coluna total de obs.)</p><p>5. Conclusões: Se yºca Xp, rejeita-se Ho.</p><p>Exemplo: Testar ao nível de 5% se há discrepância entre as preferências por sabor da pasta de</p><p>dentes e o bairro.</p><p>2.04 =5%.</p><p>Sabor da Bairros o</p><p>Pasta A B Cc > Variável: Xau) = X6 > 12, =12,6</p><p>Limão 70 44 86 | 200 , . ]</p><p>e RC atr da tabel Chocolate | 50 30 45 125 3 Determinar RA e através da tabela</p><p>Hortelã | 10 06 34 50 x:</p><p>Outros 20 20 85 | 125</p><p>> 150 100 250 | 500</p><p>1. Enunciar as hipóteses:</p><p>Ho: A preferência pelo sabor independe do bairro</p><p>Hj: À preferência pelo sabor depende do bairro</p><p>12,6</p><p>4. Calcular a variável do teste:</p><p>. Le(o;-e, y Tabela de Fregiiências Esperada, 42, =3'3/=1 “1.</p><p>Sabor da Bairros i=1 js E;</p><p>Pasta A B Cc 70 — 60)? 85 — 62,5)? Limão 60 40 100 Xia = EL +...+ a =37,88 Chocolate | 37.5 25 625 2</p><p>Hortelã 15 10 25</p><p>.. , Outros 37.5 25 625 5. Conclusão: Como Xi > 12,6, rejeita-se Ho, ao nível</p><p>de 5%, ou seja, que dependência entre o sabor da pasta</p><p>de dentes e o bairro. 79</p><p>LISTA DE EXERCÍCIOS 07</p><p>1. Uma amostra de 25 elementos resultou média 13,5 com desvio-padrão 4,4. Efetuar o teste ao nível de 0,05 para a hipótese que pz16;e u com variâncias 25, levantaram-se duas amostras de</p><p>tamanhos ny = 9 e np = 16, obtendo-se: "x, =27 e >, x, =32. Ao nível de 20% testar se há</p><p>i=] f=]</p><p>diferença entre as médias das duas populações.</p><p>7. Um supermercado não sabe se deve comprar lâmpadas da marca A ou B, de mesmo preço.</p><p>Testa uma amostra de 100 lâmpadas de cada uma das marcas, obtendo: X 151160 h, X,=1140</p><p>h, sa=90hesg = 80h. Ao nível de 2,5% testar a hipótese de que as marcas são igualmente boas</p><p>contra a hipótese de que as da marca A são melhores que as da marca B.</p><p>8. No congresso Americano grupos de Democratas e Republicanos votaram em um projeto de</p><p>interesse nacional como está na tabela abaixo. Ao nível de 5%, testar a hipótese de não haver</p><p>diferença entre os dois partidos, com relação a esse projeto.</p><p>Parti ao A Favor Contra | Indecisos Total</p><p>Democratas 85 78 37 200</p><p>Republicanos 118 61 25 204</p><p>Total 203 139 62 404</p><p>9. Deseja-se saber se o fato de uma pessoa ficar resfriada está relacionado ao fato de tomar certa</p><p>vacina. Para isso levantou-se uma amostra casual de 100 indivíduos obtendo-se:</p><p>Ficar resfriado Resfriado | Não Resfriado Ser vacinado</p><p>Vacinado 15 20</p><p>Não vacinado 25 40</p><p>Ao nível de 5%, testar as hipóteses de independência entre: ser vacinado e ficar resfriado.</p><p>Profa. Gilmara Alves Cavalcanti 80</p><p>UNIDADE VIII: CORRELAÇÃO E REGRESSÃO</p><p>” Exame das informações disponíveis;</p><p>” Delineamento da amostra;</p><p>& COLETA DOS DADOS: consiste na busca ou compilação dos dados. Pode ser classificada,</p><p>quanto ao tempo, em:</p><p>a) Contínua: quando realizada permanentemente;</p><p>b) Periódica: quando é feita em intervalo de tempo;</p><p>c) Ocasional: quando é efetuada em época pré-estabelecida;</p><p>é CRÍTICA DOS DADOS: objetiva a eliminação de erros capazes de provocar futuros</p><p>enganos. Faz-se uma revisão crítica dos dados suprimindo os valores estranhos ao levantamento.</p><p>& APRESENTAÇÃO DOS DADOS: a organização dos dados denomina-se "Série</p><p>Estatística". Sua apresentação pode ocorrer por meio de tabelas e gráficos.</p><p>& ANÁLISE E INTERPRETAÇÃO DOS DADOS: consiste em tirar conclusões que</p><p>auxiliem o pesquisador a resolver seu problema, descrevendo o fenômeno através do cálculo de</p><p>medidas estatísticas, especialmente as de posição e as de dispersão.</p><p>INCERTEZA —————————p | PESQUISA ESTATÍSTICA</p><p>Palpites com relação a acontecimentos Permite analisar a natureza da realidade</p><p>futuros, a fim de prever o que acontecerá. a fim de escolher as incertezas, testando</p><p>A: podemos confirmar nossas previsões; as idéias através de pesquisas sistemáticas</p><p>B: as previsões podem não ser confirmadas;</p><p>MÉTODO análise e NÚMEROS | processamento | INFORMAÇÕES</p><p>ESTATÍSTICO interpretação (DADOS) ></p><p>E</p><p>DADOS ESTATÍSTICOS: obtidos através de um processo que envolve a observação ou a</p><p>mensuração de itens.</p><p>VA</p><p>Profa. MSc. Gilmara Álves Cavalcanti 6</p><p>VARIÁVEIS: valores que exibem um</p><p>determinado grau de variabilidade.</p><p>1.2.1 - POPULAÇÃO E AMOSTRA. VARIÁVEIS.</p><p>Inferência => Obtenção de resultados para uma população com base em observações</p><p>Estatística extraídas a partir de uma amostra retirada desta população.</p><p>POPULAÇÃO:</p><p>É o conjunto de elementos (na totalidade) que têm, em comum, uma determinada</p><p>característica. Pode ser finita, como por exemplo, o conjunto de alunos de uma determinada</p><p>escola, ou infinita, como o número de vezes que se pode jogar um dado.</p><p>AMOSTRA:</p><p>É qualquer subconjunto da população. A técnica de seleção desse subconjunto de</p><p>elementos é chamada de Amostragem.</p><p>VARIÁVEL:</p><p>É condição inerente à uma população natural existir variação quanto aos atributos que lhe</p><p>podem ser estudados. Portanto, a variabilidade é uma característica comum a dados de</p><p>observação e experimentos. Um atributo sujeito à variação é descrito em Estatística por uma</p><p>variável.</p><p>Nominal ,</p><p>Qualitativa</p><p>LINEAR SIMPLES</p><p>Existem situações nas quais interessa estudar O comportamento conjunto de duas variáveis. Por exemplo, dados de peso e altura de pessoas. Pode haver interesse em estabelecer em que medida aumenta o peso, quando a altura aumenta. O comportamento conjunto de duas variáveis quantitativas pode ser observado graficamente através do Diagrama de Dispersão, e numericamente através do Coeficiente de Correlação.</p><p>- O termo CORRELAÇÃO significa até que ponto duas variáveis estão correlacionadas entre si.</p><p>8.1 - DIAGRAMA DE DISPERSÃO</p><p>O diagrama de dispersão é um dispositivo gráfico utilizado para verificar o grau de</p><p>associação, correlação ou dependência entre duas variáveis.</p><p>Procedimento:</p><p>1) Traçar o sistema de eixos cartesianos;</p><p>2) Representar uma variável no eixo X e a outra no eixo Y;</p><p>3) Colocar os valores das variáveis sobre os eixos e marcar um ponto para cada par de</p><p>valores;</p><p>=) Graficamente a correlação pode ser classificada em três tipos:</p><p>Correlação Positiva Correlação Negativa Correlação Nula</p><p>Y Y Y</p><p>X X XxX</p><p>“* Correlação Positiva: as variáveis X e Y crescem no mesmo sentido.</p><p>* Correlação Negativa: as variáveis X e Y variam em sentidos contrários, ou seja, quando</p><p>X cresce, Y em média decresce.</p><p>" Correlação Nula: ausência de correlação.</p><p>OBS: Correlação positiva entre duas variáveis mostra apenas que essas variáveis crescem no mesmo sentido. Não indica que aumentos sucessivos em X causam aumentos sucessivos em Y.</p><p>Profa. MSc. Gilmara Alves Cavalcanti 81</p><p>8.2 - COEFICIENTE DE CORRELAÇÃO</p><p>Mede o grau de correlação entre duas variáveis.</p><p>n</p><p>À DX as (Cy) een,</p><p>« Cor(XY)=1 >XeYtem correlação perfeitá positiva;</p><p>" Cor(X,Y)=0 > XeYtem correlação nula, são independentes;</p><p>" Cor(XY)=-|1>XeYtem correlação perfeita negativa;</p><p>, =I£ Cor) sl</p><p>p=r=Cor(X,Y)=</p><p>OBS: A correlação é mais forte quanto mais próxima for de — 1 ou de 1, nesse caso, os pontos se aproximam ainda mais de uma reta.</p><p>Índice de Correlação Análise</p><p>0,75 0 Correlação Direta ou Positiva</p><p>Corr (X, Y) ; é Ê 10.</p><p>Anos de Atendimento</p><p>Profa. MSc. Gilmara Alves Cavalcanti 23</p><p>Diagrama de Dispersão: Correlação positiva entre as variáveis X e Y.</p><p>Coeficiente de Correlação: Correlação forte.</p><p>pm (2H</p><p>EE Corr(X, Y) =</p><p>= 0,95</p><p>Coeficiente de Determinação:</p><p>CD(X,Y)= [Cor(X,YW) = (0,95) = 0,9025 = 90,25%</p><p>Reta de Regressão:</p><p>1576 | ença</p><p>3 Joss</p><p>220)</p><p>b= - 2 2</p><p>px MEI 145 - SSL</p><p>Y=a+bX=41+(3,8).X</p><p>a=Y-bX=60-(3,8)(5)=4]</p><p>Previsões:</p><p>Se, X=7 então, Y=67,6</p><p>Se, X=10 então, Y = 79</p><p>Conclusões:</p><p>À partir dos resultados observados conclui-se que:</p><p>Y” As variáveis em estudo, anos de atendimento ao público e número de clientes das 5</p><p>Empresas de Seguro de Automóveis, apresentam correlação forte e positiva entre si.</p><p>Portanto, ambas crescem no mesmo sentido, ou seja, o aumento no número de anos de</p><p>atendimento está correlacionado com o aumento no número de clientes.</p><p>” 90,25% da variabilidade ocorrida quanto ao número de clientes é devida à variabilidade</p><p>decorrida dos anos de atendimento.</p><p>Y Estima-se que em 7 anos de atendimento, as 5 empresas atenderam a aproximadamente</p><p>68 clientes, ao passo que, para 10 anos de atendimento é possível prever que essa</p><p>estimativa passe a ser de 79 clientes.</p><p>Profa. MSc. Gilmara Alves Cavalcanti 84</p><p>Nos exercícios a seguir verifique o comportamento conjunto das variáveis, de forma gráfica e</p><p>numérica e ajuste a reta de regressão. Para alcançar esse objetivo determine as medidas abaixo e</p><p>analise os resultados encontrados.</p><p>Y” Diagrama de Dispersão;</p><p>Y” Coeficiente de Correlação;</p><p>“Coeficiente de Determinação;</p><p>” Ajuste da Reta de Regressão:</p><p>Y Previsões;</p><p>Exercício 01:</p><p>Peso Seco</p><p>0</p><p>0</p><p>Exercício 02:</p><p>Peso seco € úmido, em</p><p>Peso Umido</p><p>6,7</p><p>7,7</p><p>6</p><p>7,4</p><p>6,1</p><p>7,4</p><p>de glóbulos em ratos.</p><p>Quantidade de procaína hidrolisada, em 10 moles/litro, no sangue, em função do tempo</p><p>decorrido</p><p>min</p><p>sua admini</p><p>16</p><p>19</p><p>25,7</p><p>28</p><p>32,6</p><p>3</p><p>9</p><p>hidrolisada</p><p>5,7</p><p>Profa. MSc. Gilmara Alves Cavalcanti 85</p><p>Rural 360 18</p><p>1970 93.139.037 Total 2000 100</p><p>Fonte: Livro de Estatística. Fonte: Livro de Estatística.</p><p>Profa. MSc. Gilmara Alves Cavalcanti 9</p><p>Tabela 03 - Entrevistados segundo a</p><p>distribuição ocupacional. Natal, 2001.</p><p>Distribuição Ocupacional N'de</p><p>Entrevistados</p><p>Artesanato 52</p><p>Gerencial 29</p><p>Serviços Burocráticos 34</p><p>Trabalho Não qualificado 65</p><p>Total 180</p><p>Fonte: Livro de Estatística.</p><p>Exercício 01:</p><p>Tabela 04 —- Número de alunos em uma</p><p>exposição de pintura segundo o sexo e o tipo</p><p>de arte preferida. São Paulo, 2000.</p><p>Sexo - Tipo de Arte</p><p>Arte Arte</p><p>Clássica Moderna</p><p>Masculino 80 70</p><p>Feminino 20 30</p><p>Fonte: Livro de Estatística.</p><p>De acordo com informações do IBGE, em 31.12.99, o pessoal administrativo ocupado em</p><p>estabelecimentos públicos, era, segundo o tipo de ocupação: Administração, 41.371; Serviço</p><p>pessoal, 6.067; Contabilidade, 2.989; Estatística, 5.481; Limpeza e Conservação, 26.520;</p><p>Almoxarifado, 3.970; Serviços Gerais, 46.073; e Outros, 15.689. Nos estabelecimentos da rede</p><p>particular, nas mesmas ocupações anteriores, as quantidades respectivas eram: 45.392, 4.555,</p><p>6.627, 3.112, 42.155, 4.019, 49.038 e 17.302. Dispor os dados acima em uma tabela, utilizando</p><p>valores absolutos e relativos.</p><p>Exercício 02:</p><p>Classifique as séries estatísticas abaixo. Identifique os componentes que faltam e complete-os</p><p>(de modo fictício quando necessário).</p><p>Tabela 01 — Desempenho Operacional da</p><p>Varig (em R$ milhões). Natal, 1997 — 2001.</p><p>Tabela 03 -— Candidatos a Deputado</p><p>Estadual nos estados da região Nordeste.</p><p>Anos Valores f. f% Brasil, 2002.</p><p>1997 41 Estados Nº de Candidatos</p><p>1998 37 Alagoas 267</p><p>1999 61 Ceará 516</p><p>2000 198 Maranhão 474</p><p>2001 483 Paraiba 220</p><p>Fonte: Rev. Época, 15/jul/2002 Pernambuco 631</p><p>Piauí 204</p><p>Tabela 02 — Parcela de gastos (em relação Rio Grande do Norte 233</p><p>ao total) com materiais e medicamentos em Sergipe 231</p><p>internação pelo SUS, em 1994, segundo as Bahia 569</p><p>regiões.</p><p>Regiões Parcela de Gastos (%)</p><p>Norte 46,41</p><p>Nordeste 65,27</p><p>Sudeste 40,53</p><p>Sul 41,68</p><p>Centro-Oeste 43,19</p><p>Fonte: USP / Revista de Saúde Pública</p><p>Fonte: Tribunal Superior Eleitoral</p><p>Tabela 04 — Fracionamento do salário no</p><p>orçamento familiar do brasileiro (%). Brasil,</p><p>2002.</p><p>Descrição %</p><p>Habitação 35,4</p><p>Alimentação 28,7</p><p>Saúde, Tarifas Públicas, Transporte | 19,4</p><p>Vestuário, Educação, Lazer 16,5</p><p>Fonte: Rev. Epoca, 24/06/2002</p><p>Profa. MSc. Gilmara Alves Cavalcanti 10</p><p>Tabela 05 — Principais causas de morte na</p><p>Região Nordeste do Brasil, 1997.</p><p>Tabela 07 — Balança comercial do estado do</p><p>Rio Grande do Norte, 1992-1999.</p><p>Causas de Morte Nº de Mortes Anos Valor (US$ mil)</p><p>Homicídio 331.361 Exportações | Importações</p><p>Acidentes de Trânsito 220.784 1992 72.934 11.271</p><p>Doenças Cerebrovasculares 103.973 1993 81.288 16.393</p><p>Doenças do Coração 74.505 1994 86.729 33.279</p><p>Acidentes sem Especificações 69.949 1995 79.228 34.542</p><p>Afogamento 66.441 1996 94.876 101.978</p><p>Total 867.013 1997 93.504 125.445</p><p>Fonte: Estudos Epidemiológicos 1998 101.748 88.528</p><p>1999 115.473 84.267</p><p>Tabela 06 — Valor de uma dívida de R$ Fonte: Boletim Conjuntural, SUDENE, Agosto/2000.</p><p>1.000 ao fim de 1 (um) ano, de acordo com</p><p>o tipo de financiamento. Brasil, 2002. Tabela.08 —</p><p>Tipo de Financiamento | Montante (R$) :</p><p>Empréstimo Pessoal 1.847,84</p><p>Cheque Especial 3.087,46 . Participação (Yo</p><p>Crediário 2.172,01 Fabricantes 1997 1008 2 999</p><p>Cartão de Crédito 3.296,01 Johnson & Johnson | 424 | 39,0 | 387</p><p>Empréstimo em Financeiras 2.842,06 Kimberly Clark 16,0 21,9 25,1</p><p>Procter & Gamble 23,6 19,2 15,5</p><p>Outros 18,0 19,9 20,1</p><p>Tabela 09 -- Composição estrutural do PIB, 1991 a 2001, anos selecionados (%).</p><p>Setor 1991 | 1992 | 1993 | 1994 | 1995 | 1996 | 1997 | 1998 | 1999 | 2000 | 2001</p><p>Agricultura | 7,8 | 7,7 176199190 /83/80]82 1/82/77 180</p><p>Indústria 36,2 | 38,7 | 41,6 | 40,0 | 36,7 | 34,7 | 35,2 | 34,6 | 35,6 | 37,5 | 35,8</p><p>Manufatura | 24,9 | 26,4 | 29,0 | 26,8 | 23,9 | 21,5 | 21,6 | 21,0 | 21,5 | 22,5 121,1</p><p>Serviços 56,0 | 53,6 | 50,8 | 50,1 | 54,3 | 57,0 | 56,8 | 57,1 | 56,2 | 55,0 | 56,2</p><p>Total 100 | 100 | 100 | 100 | 100 | 100 | 100 | 100 | 100 | 100 | 100</p><p>Fonte: DECNA / IBGE</p><p>Tabela 10 — Estrutura do Comércio Exterior Brasileiro Segundo Destino e Origem, 1990 — 2002,</p><p>anos selecionados, em %.</p><p>Anos Destino das Exportações Origem das Importações</p><p>EUA | Mercosul | UE | Japão | Outros | EUA | Mercosul | UE | Japão | Outros</p><p>1990 | 24,6 4,2 32,5 | 75 31,2 | 20,4 11,2 26172 38,7</p><p>1993 | 20,7 14,0 264 | 60 32,9 | 20,4 13,4 235 | 76 35,0</p><p>1996 | 19,5 15,3 26,9 | 64 3L9 | 24 15,6 26,71 5,2 30,1</p><p>1998 | 19,3 17,4 28,8 | 43 30,2 | 23,77 16,3 292 | 597 25,1</p><p>1999 | 22,6 14,1 28,6 | 46 30,1 | 24,1 13,6 30,5 | 52 26,5</p><p>2000 | 24,3 14,0 26,8 | 4,5 30,4 1 233 14,0 252 1 593 32,2</p><p>2001 | 24,7 10,9 25,5 | 34 354 | 23,5 12,6 26,7 | 5,55 31,7</p><p>2002 | 25,7 5,5 250 1 3,55 403 | 21 11,9 277 | 5,0 33,3</p><p>Fonte: Sistema Alice / MDIC</p><p>Profa. MSc. Gilmara Alves Cavalcanti 11</p><p>>» Distribuição de Fregiiências</p><p>Tabelas com grandes números de dados são cansativas e não dão uma visão rápida e geral do</p><p>fenômeno. Dessa forma. é necessário que os dados sejam organizados em uma distribuição de</p><p>frequências (simples ou em classes).</p><p>Distribuição de Fregiências: série estatística em que os dados são agrupados em classes, com</p><p>suas respectivas frequências absolutas, relativas e percentuais, com</p><p>o objetivo de facilitar ao analista o seu estudo.</p><p>Construção de uma Tabela Simples:</p><p>Y Dados Brutos: são os dados apresentados desordenadamente, da forma como foram</p><p>coletados.</p><p>Y Rol: são os dados apresentados em ordem crescente. A partir da ordenação os números são</p><p>dispostos em uma tabela com as respectivas frequências.</p><p>Construção de uma Distribuição de Frequências em Classes:</p><p>Os seguintes componentes são necessários:</p><p>Y Dados Brutos: são os dados apresentados desordenadamente, da forma como foram</p><p>coletados.</p><p>” Rol: são os dados apresentados em ordem crescente.</p><p>Y” Amplitude Total (A): é a diferença entre o maior valor do rol (LS) e o menor valor (LN).</p><p>A=LS-LI</p><p>Y Número de Classes (c): corresponde à quantidade de classes, nas quais serão agrupados os</p><p>elementos do rol. Para determinar e, utiliza-se a fórmula de Sturges:</p><p>c=1+(3,33333....).log(n) |, onde n = número de elementos do rol.</p><p>Y Amplitude ou Intervalo de Classe (i): geralmente utilizam-se intervalos iguais, obtidos</p><p>através da fórmula:</p><p>i=A/e</p><p>Outros elementos da tabela:</p><p>= L;= limite inferior de cada classe;</p><p>= L,= limite superior de cada classe;</p><p>: PMoux = ponto médio de cadaclasse ——p PM=L;+ (1/2);</p><p>» f= fregiiência absoluta = número de ocorrências de cada classe;</p><p>" f.=fregiênciarelativa —P — f,=f/ >» f;</p><p>= f%= fregiiência percentual —+» f% = 100.£;</p><p>= F =fregiiência absoluta acumulada "abaixo de";</p><p>* Ff = fregiência absoluta acumulada "acima de";</p><p>= F% = fregiiência percentual acumulada "abaixo de";</p><p>* F% 7 = fregiência percentual acumulada "acima de";</p><p>Profa. MSc. Gilmara Alves Cavalcanti 12</p><p>Exempios:</p><p>1. BANCO DE DADOS 01 (Construir uma tabela simples):</p><p>Dados Brutos;</p><p>1 4 2 5 3 2 0 3 2 1</p><p>5 4 2 5 0 3 2 4 2 3</p><p>2 3 2 1 4 2 1 3 4 2</p><p>Rol:</p><p>Construção da tabela simples:</p><p>Análises:</p><p>Profa. MSc. Gilmara Alves Cavalcanti 13</p><p>2. BANCO DE DADOS 02 (Construir uma tabela em classes):</p><p>Dados Brutos:</p><p>1,51 1,65 1,58 1,54 1,65 1,40 1,61 "1,08 1,81 1,38 1,56 1,83</p><p>1,69 1,22 1,22 1,68 1,47 1,68 1,49 1,80 1,33 1,83 1,50 1,46</p><p>1,67 1,60 1,23 1,54 1,73 143 218 1,46 1,53 1,60 1,59 1,49</p><p>1,46 1,72 1,56 1,43 1,69 115 1,89 1,47 2,00 1,58 1,37 1,40</p><p>1,76 1,62 1,96 1,66 1,51 1,31 229 1,58 234 166 1,7] 1,44</p><p>1,66 1,36 1,43 126 1,47 1,52 1,57 1,33 1,86 1,75 1,57 L83</p><p>152 1,66 1,90 1,59 1,47 1,86 1,73 1,55 1,52 1,40 1,86 2,02</p><p>1,08 1,15 1,22 1,22 1,23 1,26 1,31 1,33 1,33 136 1,37 1,38</p><p>1,40 1,40 1,40 1,43 1,43 1,43 1,44 1,46 146 1,46 1,47 1,47</p><p>1,47 1,47 1,49 1,49 1,50 1,51 1,51 1,52 1,52 1,52 1,53 1,54</p><p>1,54 1,55 1,56 1,56 157 1,57 1,58 158 1,58 1,59 1,59 1,60</p><p>1,60 1,61 1,62 1,65 1,65 1,66 1,66 1,66 1,66 1,67 1,68 1,68</p><p>1,69 1,69 1,71 1,722 1,73 1,73 1,75 1,76 1,80 1,81 1,83 1,83</p><p>1,83 1,86 1,86 186 1,89 1,90 1,96 200 2,02 218 2,29 234</p><p>Amplitude Total:</p><p>Número de Classe:</p><p>Intervalo de Classe:</p><p>Análises:</p><p>OBS: Na construção de uma distribuição de fregiiências utilizando dados contínuos perde-se</p><p>certa quantidade de informação, visto que os valores individuais perdem sua identidade quando</p><p>agrupados em classes. Na distribuição de frequências construída utilizando dados discretos não</p><p>há perda de informação.</p><p>Profa. MSc. Gilmara Alves Cavalcanti 14</p><p>LISTA DE EXERCÍCIOS 1.2.2</p><p>= Construir uma tabela de distribuição de fregiência simples e analisar os resultados.</p><p>Banco de Dados 01.: Número de cáries em crianças.</p><p>1 3 i 1 0 l 0 1 t 0 2 2 0 0 0</p><p>1 2 1 2 0 0 1 6 4: 3 3 1 2 4 0</p><p>Banco de Dados 02.: Idade de pacientes submetidos a um determinado exame.</p><p>85 85 85 85 85 87 88 8 388 88 88 88</p><p>88 88 88 88 89 89 89 90 90 90 90 90</p><p>Banco de Dados 03.: Erros de impressão por página.</p><p>9743 6582362303 0213 1/5</p><p>1 7423247321 3 271012223</p><p>3 2543628234 121613 21 1d</p><p>=) Construir uma distribuição de fregiiências em classes e analisar os resultados.</p><p>Banco de Dados 04.: Número de filhos de um grupo de 50 casais.</p><p>2 3 0 2 l l 1 3 2 5</p><p>6 1 l 4 0 1 5 6 0 2</p><p>l 4 Í 3 l 7 6 2 0 l</p><p>3 l 3 5 7 l 3 t 1 0</p><p>3 0 4 l 2 2 ] 2 3 2</p><p>Banco de Dados 05.: Salários (em salários mínimos) de funcionários de uma determinada</p><p>empresa.</p><p>4,00 4,56 5,25 573 6,26 6,66 686 739 744 7,59 812 8,46</p><p>8,74 895 9,13 9,35 9,77 9,80 10,53 10,76 11,06 11,59 12,00 12,79</p><p>13,23 13,60 13,85 14,69 14,71 15,99 16,32 16,61 17,26 18,75 19,40 23,30</p><p>Banco de Dados 06.: Tempo de vida (em horas) de 40 componentes eletrônicos submetidos</p><p>a um experimento em um laboratório industrial.</p><p>3,20 11,70 13,64 15,60 15,89 2844 2907 37,34 41,81 4335</p><p>43,94 49,551 49,82 51,20 51,43 5247 53,72 53,922 54,03 56,89</p><p>63,80 66,40 68,64 70,15 70,98 74,52 76,68 7784 80,91 84,04</p><p>85,70 8648 88,92 89,28 91,36 91,62 98,79 102,39 104,21 124,27</p><p>Banco de Dados 07.: Safra anual (em alqueires/árvore) para 40 pessegueiros.</p><p>1, 4,4 10,7 14,8 3,5 12,5 6,1 15,8 22,6 16,2</p><p>32,4 27,5 25,0 16,0 14,5 7,8 32,8 18,2 19,1 3;2</p><p>21,0 18,5 12,2 74 8,1 16,4 16,4 12,6 9,2 12,9</p><p>1,2 15,1 4,7 10,0 19,1 22,3 6,0 23,5 26,2 13,7</p><p>Banco de Dados 08.: Pluviosidade (mm) anual, nos últimos 50 anos, na comunidade de</p><p>Ohio.</p><p>15,2 14,6 27,9 24,9 20,0 43,5 30,7 30,0 35,7 40,9</p><p>23,4 17,8 26,9 30,8 19,9 36,8 33,4 19,8 29,6 38,2</p><p>25,1 42,0 35,2 15,6 25,5 29,7 278 14,6 22,1 24,3</p><p>30,1 30,1 2,1 24,4 28,7 35,0 26,1 28,2 19,4 28,7</p><p>28,0 25,3 31,8 31,0 28,3 13,5 32,1 25,4 26,7 36,8</p><p>Profa. MSc. Gilmara Alves Cavalcanti 15</p><p>1.2.3 - REPRESENTAÇÃO GRÁFICA</p><p>Tem como objetivo uma melhor visualização do conteúdo das tabelas, expondo sempre</p><p>que possível, as mesmas informações nelas contidas. Os gráficos mais usados são: Diagrama de</p><p>Linhas/Superfície Simples e em Faixa; Diagrama de Colunas/Barras Simples, Superpostas e</p><p>Múltiplas; Diagrama de Setores em Círculo; Os gráficos devem conter título e escala.</p><p>1.2.3.1 — Diagrama de Linhas e de Superfície</p><p>Y Diagrama de Linhas/Superfície Simples: usado unicamente para representar séries</p><p>temporais.</p><p>” Diagrama de Linhas/Superfície em Faixa: usado para comparar a evolução de duas</p><p>variáveis e, ao mesmo tempo, a evolução de cada uma delas isoladamente.</p><p>f f f f</p><p>> > ></p><p>Tempo Tempo Tempo Tempo</p><p>Diagrama de Diagrama de Diagrama de Diagrama de</p><p>Linhas Simples Superfície Simples Linhas em Faixa Superfície em Faixa</p><p>1.2.3.2 — Diagrama de Colunas e de Barras</p><p>Y” Diagrama de Colunas/Barras Simples: usado para apresentar variáveis qualitativas ou</p><p>ordinais. As variações quantitativas da tabela são representadas por colunas dispostas</p><p>verticalmente ou horizontalmente. E usado para representar qualquer tipo de série.</p><p>Procedimento —</p><p>1) Traçar oseixos Xe Y.</p><p>2) Eixo X (categorias da variável em estudo).</p><p>3) Construir barras retangulares.</p><p>X (variável de estudo: categorias) ——— base</p><p>Y (fregiiência ou fregiiência relativa) —p altura</p><p>OBS:</p><p>(1) As barras são desenhadas separadamente, de forma a ficar claro que a variável é qualitativa</p><p>ou ordinal. '</p><p>(2) Os gráficos de barras podem ser classificados em três tipos: Simples, Superpostas</p><p>(Remontadas) ou Múltiplas.</p><p>(3) Os espaços entre cada coluna (ou barra) devem ser iguais entre si, e corresponder a no</p><p>mínimo 1/3 e no máximo 2/3, da medida da base.</p><p>Profa. MSc. Gilmara Alves Cavalcanti 16</p><p>Y Diagrama de Colunas/Barras Superpostas e Múltiplas: usado para comparar o</p><p>comportamento de duas ou mais variáveis (séries mistas).</p><p>Legenda:</p><p>f f ClCategoria 1 f</p><p>[Categoria 2</p><p>> > ></p><p>Categorias Categorias Categorias</p><p>Diagrama de Diagrama de Diagrama de</p><p>Colunas Simples Colunas Múltiplas Colunas Superpostas</p><p>OBS: Os Diagramas de Barras Simples, Múltiplas ou Superpostas obedecem ao mesmo critério,</p><p>entretanto, os retângulos são construídos no sentido horizontal.</p><p>1.2.3.3 — Diagrama de Setores em Círculo (Gráfico de Pizza)</p><p>E um círculo cuja área se divide em segmentos representativos das partes proporcionais</p><p>de um todo. E usado para apresentar variáveis qualitativas ou ordinais.</p><p>Procedimento —</p><p>1) Traçar uma circunferência (360º).</p><p>2) Representar as categorias da variável em estudo.</p><p>Calcular o valor do ângulo central [ 100% - 360º E> x=03,09).f%</p><p>f%- x</p><p>x : valor do ângulo central;</p><p>f'%: frequência relativa;</p><p>3) Marcar no círculo o valor de x.</p><p>1.2.3.4 — Histograma, Polígono de Fregiiências e</p><p>Ogiva de Galton: são os gráficos representativos da</p><p>distribuição de frequência em classes.</p><p>(a) Histograma</p><p>Planejamento —</p><p>1. Largura (L):</p><p>L = (espaço da origem - em cm) + (nº de classes).(distância da base cada retângulo - em cm)</p><p>2. Altura (H): H= (0,6).L</p><p>3. Medidas Gráficas (MG):</p><p>3.1-MG=H / (maior valor de “f” na tabela) = constante</p><p>3.2-MG= constante ), E constante.(f;),......, constante.(fn)</p><p>altura do primeiro retângulo (em cm) altura do segundo retângulo (em cm) ....</p><p>Profa. MSc. Gilmara Alves Cavalcanti 17</p><p>(b) Polígono de Fregiiência</p><p>De</p><p>er</p><p>e</p><p>T</p><p>i</p><p>O</p><p>n</p><p>m</p><p>Classes</p><p>Corresponde a uma linha traçada a partir do ponto médio de cada retângulo do</p><p>histograma. Pode referir-se às freqiiências absolutas ou às frequências relativas, conforme a</p><p>escala utilizada no eixo vertical.</p><p>(c) Ogiva de Galton (Polígono de Fregiências Acumuladas)</p><p>A Ogiva de Galton tem por finalidade a representação gráfica das tabelas de fregiiências</p><p>acumuladas. Esse tipo de gráfico pode ser utilizado para representar as frequências “abaixo de”</p><p>e “acima de”.</p><p>Planejamento —</p><p>1. Largura (L):</p><p>L = (espaço da origem - em cm) + (nº de classes).(distância da base cada retângulo - em cm)</p><p>2. Altura (B): H=(0,6).L</p><p>3. Medidas Gráficas (MG): valores de F SFT, F%WY ou F% +.</p><p>AF+</p><p>></p><p>Classes</p><p>Ogiva de Galton das Fregiiências</p><p>Acumuladas “Abaixo de”</p><p>></p><p>Classes</p><p>Ogiva de Galton das Frequências</p><p>Acumuladas “Acima de”</p><p>Profa. MSc. Gilmara Alves Cavalcanti 18</p><p>LISTA DE EXERCÍCIOS 1.2.3</p><p>1. Construa, de forma adequada, todos os possíveis gráficos para cada uma das tabelas abaixo.</p><p>(a) Tabela 01. Produção brasileira de trigo, por</p><p>Unidade da Federação. 1994,</p><p>UF Quantidade (1000 t)</p><p>Sao Paulo 670</p><p>Santa Catarina</p><p>451</p><p>Paraná 550</p><p>Goiás 420</p><p>Rio de Janeiro 306</p><p>Rio Grande do Sul 560</p><p>Fonte: Fictícia</p><p>(b) Tabela 02. Rebanho brasileiro.</p><p>Espécie | Quantidade (1000 cabeças)</p><p>Bovinos 140.000</p><p>Suínos 1.181</p><p>Bubalinos 5.491</p><p>Coelhos 11.200</p><p>Fonte: IBGE</p><p>(c) Tabela 03. Exportações brasileiras de</p><p>produtos agrícolas. 1990 — 1992.</p><p>Produto | Quantidade (1000 t)</p><p>1990 | 1991 | 1992</p><p>Feijão | 5.600 | 6.200 | 7.300</p><p>Arroz | 8.600 | 9.600 | 10.210</p><p>Soja | 4.000 | 5.000 | 6.000</p><p>Fonte: Ministério da Agricultura</p><p>(d) Tabela 04. Situação dos espetáculos</p><p>cinematográficos. Brasil, 1967.</p><p>Especificação Quantidade</p><p>Número de Cinemas 2.488</p><p>Lotação dos Cinemas 1.722.348</p><p>Sessões por Dia 3.933</p><p>Filme de Longa Metragem | 131.330.488</p><p>Meia Entrada 89.581.234</p><p>Fonte: IBGE</p><p>(e) Tabela 05. Produção agrícola do Estado A.</p><p>Brasil, 1995.</p><p>Produtos Quantidade (ton)</p><p>Café 400.000</p><p>Açúcar 200.000</p><p>Milho 100.000</p><p>Feijão 20.000</p><p>Fonte: Fictícia</p><p>estados do Brasil. 1992 — 1994,</p><p>(f) Tabela 06. Entrada de migrantes em três</p><p>Anos Estado</p><p>Amapá | São Paulo | Paraná</p><p>1992 2.291 1.626 609</p><p>1993 2.456 1.585 592</p><p>1994 2.353 1.389 708</p><p>(g) Tabela 07. Taxas municipais de urbanização</p><p>(em %). Alagoas, 1970.</p><p>Taxas (%) | Nº de Municípios</p><p>6|-- 16 29</p><p>16 |-- 26 24</p><p>26 |-- 36 16</p><p>36 |-- 46 13</p><p>46 |-- 56 4</p><p>56 |-- 66 3</p><p>66 |-- 76 2</p><p>76 |-- 86 2</p><p>86 |--| 96 i</p><p>Total 94</p><p>Fonte: Apostila de Estatística</p><p>(h) Tabela 08. Estatura (em em) de 40 alunos do</p><p>colégio B.</p><p>Taxas (%) Nº de Alunos</p><p>150 |-- 154 4</p><p>154 |-- 158 9</p><p>158 |-- 162 li</p><p>162 |-- 166 8</p><p>166 |-- 170 5</p><p>170 |--| 174 3</p><p>Total 40</p><p>Fonte: Apostila de Estatística</p><p>(1) Tabela 09. Quantidade de faltas no semestre</p><p>de 20 alunos do colégio B.</p><p>Taxas (%) Nº de Alunos</p><p>1|--3 2</p><p>31|--5 4</p><p>5|--7 8</p><p>7|-9 4</p><p>9|--|11 2</p><p>Total 20</p><p>Fonte: Apostila de Estatística</p><p>(j)) Tabela 10. Quantidade de chuva caída em</p><p>Natal, em mm, 1984-1993</p><p>Anos | Quantidade de Chuva</p><p>1984 2.102</p><p>1985 2.224</p><p>1986 2.438</p><p>1987 1.478</p><p>1988 2.163</p><p>1989 4.155</p><p>1990 1.234</p><p>1991 1.359</p><p>1992 1.615</p><p>1993 852</p><p>Fonte: EMPARN</p><p>Profa. MSc. Gilmara Alves Cavalcanti 19</p><p>1.3 - MEDIDAS DE POSIÇÃO (MEDIDAS DE TENDÊNCIA CENTRAL).</p><p>Os dados quantitativos, apresentados em tabelas e gráficos, constituem a informação</p><p>básica do problema. Mas é conveniente apresentar medidas que mostrem a informação de</p><p>maneira resumida. Frequentemente, um conjunto de dados pode se reduzir a uma ou a algumas</p><p>medidas numéricas que resumem todo o conjunto. Duas características importantes dos dados,</p><p>que as medidas numéricas podem evidenciar são: o valor central do conjunto e a dispersão dos</p><p>números. O capítulo a seguir trata das medidas de tendência central.</p><p>MEDIDAS DE TENDÊNCIA CENTRAL '</p><p>São medidas que tendem para o centro da distribuição e têm a capacidade de representá-</p><p>la como um todo. Dão o valor do ponto em torno do qual os dados se distribuem. As principais</p><p>são: Média Aritmética, Mediana, Moda e algumas Separaírizes.</p><p>1.3.1 - MÉDIA ARITMÉTICA</p><p>É a mais importante medida de tendência central, pois possui propriedades matemáticas</p><p>convenientes. A média aritmética pode ser definida em dois tipos: populacional (1) e amostral</p><p>(X). Nos dois casos existem três situações quanto aos cálculos.</p><p>1. Dados apresentados em forma de dados brutos/rol:</p><p>x > X; soma de todos os elementos do rol</p><p>A média será: -</p><p>n número de elementos do rol</p><p>Exemplo 01: A média mínima para aprovação em determinada disciplina é 5,0. Se um estudante</p><p>obtém as notas 7,5; 8,0; 3,5; 6,0; 2,5; 2,0; 5,5; 4,0; nos trabalhos mensais da disciplina em</p><p>questão, pergunta-se se ele foi ou não aprovado.</p><p>2. Dados apresentados em forma de distribuição de freqiiência simples:</p><p>— f,</p><p>A média: | X= Let) Exemplo 02: Calcular a média do banco de dados 01.</p><p>n</p><p>(Unidade IT) e analisar o resultado.</p><p>3. Dados apresentados em forma de distribuição de frequência em classes:</p><p>= PM,.f,</p><p>Amédia: | X = APM; fi) Exemplo 03: Calcular a média do banco de dados 02.</p><p>n (Unidade II) e analisar o resultado.</p><p>Propriedades:</p><p>1. Em um conjunto de números pode sempre ser calculada;</p><p>2. É única para um dado conjunto de números;</p><p>3. É sensível (ou afetada) por todos os valores do conjunto;</p><p>4. Somando-se uma constante a cada valor do conjunto, a média ficará aumentada do</p><p>valor dessa constante. Similarmente se subtrairmos, multiplicarmos ou dividirmos.</p><p>5. A soma dos desvios dos números de um conjunto a contar da média é zero;</p><p>Profa. MSc. Gilmara Alves Cavalcanti 20</p><p>1.3.2 —- MEDIANA</p><p>Valor que divide a distribuição em duas partes iguais, em relação à quantidade de elementos.</p><p>Isto é, é o valor que ocupa o centro da distribuição, de onde se conclui que 50% dos elementos</p><p>ficam abaixo dela e 50% ficam acima. Colocados em ordem crescente, a mediana (Med ou Md)</p><p>é ou valor que divide a amostra, ou população, em duas partes iguais.</p><p>0 Med 100%</p><p>a) VARIÁVEL DISCRETA: os dados estão dispostos em forma de rol ou em uma distribuição</p><p>de fregiiência simples.</p><p>« Se"n" for ímpar:</p><p>0</p><p>Med = elemento central (de ordem [(n+ 1)2]) DP Meg (25)</p><p>Exemplo 01: Calcular a mediana da série: 3, 4,5, 6, 7,8.</p><p>= Seºnº for par:</p><p>Med = média aritmética dos dois elementos Med =</p><p>centrais (de ordem (n/2)º e [(n/2) + 11º)</p><p>Exemplo 02: Calcular a mediana da série: 8,5, 10, 12.</p><p>Exemplo 03: Calcular a mediana do banco de dados 01 (Unidade IJ) e analisar o resultado.</p><p>b) VARIÁVEL CONTÍNUA: os dados estão agrupados em uma distribuição de frequências em</p><p>classes, então:</p><p>(1º Passo) Calcular a ordem, ou posição da mediana, Pmea = (n/2)º. Como a variável é</p><p>contínua não importa se “n” é par ou ímpar.</p><p>(2º Passo) Através da F | identificar a classe que contém a mediana, isto é, a posição da</p><p>mediana,</p><p>(3º Passo) Utilizar a fórmula:</p><p>Pa FY</p><p>Med=Llyca (Ei ça</p><p>Med</p><p>= Llme = limite inferior da classe que “ FVY = fregiência absoluta acumulada</p><p>contém a mediana; "abaixo de" da classe anterior à classe</p><p>Pp o o. . o > o que contém a mediana;</p><p>Med = posição da mediana = o X “ ÍfMed = fregiiência absoluta da classe que</p><p>contém a mediana;</p><p>= imed = intervalo da classe que contém a</p><p>mediana;</p><p>elemento (lê-se: x-ésimo elemento);</p><p>Exemplo 04: Calcular a mediana do banco de dados 02 (Unidade II) e analisar o resultado.</p><p>Profa. MSc. Gilmara Alves Cavalcanti 21</p><p>1.3.3 - MODA</p><p>E o valor que ocorre com maior fregiiência, ou seja, aquele que mais se repete.</p><p>Ex.: Na série 3,4,5,7,7,7,9,9—» M,=7</p><p>a)</p><p>Série Unimodal (tem uma única moda). Ex.: Série 3,5, 6,6, 6, 7,8</p><p>Série Bimodal (ocorrem duas modas). Ex.: Série 2,5, 5,5, 6, 7,9,9,9, 10, 10</p><p>Série Trimodal (ocorrem três modas). Ex.: Série 4, 4, 4,5,6,7,7,7,8,9,9,9</p><p>Série Polimodal (ocorrem quatro ou mais modas)</p><p>Ex.: Série 0,0, 1,3,3,4,7,8,8,11,12,12,13,13</p><p>Série Amodal (não existe moda). Ex.: Série 0, 1,3,4, 7,8</p><p>VARIÁVEL DISCRETA: os dados são apresentados em forma de rol ou em uma distribuição de</p><p>frequência simples.</p><p>M, = elemento que tenha maior freqiiência</p><p>Exemplo 01: Calcular a moda do banco de dados 01 (Unidade II) e analisar o resultado.</p><p>b) VARIÁVEL CONTÍNUA: os dados são apresentados em uma distribuição de frequência em</p><p>classes.</p><p>Nesse caso, a moda pode ser determinada através de quatro processos.</p><p>Moda Bruta (Mo)</p><p>Corresponde ao ponto médio da classe modal, ou seja, | Mop = (LI+ LS)/2</p><p>Moda de Pearson (Mor)</p><p>Utilizada mais especificamente, juntamente com X e Med, para mostrar o comportamento da</p><p>distribuição, em relação a concentração ou não de seus elementos.</p><p>M, =3.Med-2.X</p><p>Utiliza-se a Mop para a análise da assimetria. A distribuição pode ser classificada, em termo de</p><p>simetria, de três formas:</p><p>= Assimetria à esquerda: X</p><p>Simétrica: Mp =Med= X (concentração no centro)</p><p>Profa. MSc. Gilmara Alves Cavalcanti 22</p><p>3. Moda de King (Mox)</p><p>Mo =LIyo |</p><p>post</p><p>am E,</p><p>f ]</p><p>——— lima</p><p>f post ”</p><p>limo = limite inferior da classe modal;</p><p>imo = LS - LI = intervalo da classe modal;</p><p>fhost = fregiiência absoluta da classe posterior à classe modal;</p><p>fnt = frequência absoluta da classe anterior à classe modal;</p><p>4. Moda de Czuber (M.c):</p><p>Mac Uh d,</p><p>dj+d,</p><p>ha onde</p><p>máx Êost</p><p>Exemplo 02: Calcular, para os quatro processos descritos anteriormente, a moda do banco de dados 02</p><p>(Unidade IN) e analisar o resultado.</p><p>Medidas Vantagens Limitações</p><p>1. Reflete cada valor j</p><p>Média |2. Possui propriedades matemáticas |1. E influenciada por valores extremos</p><p>atraentes</p><p>. : sr . Difíci inar para grandes quantidades</p><p>Mediana | 1. Menos sensível que a média 1. Difícil determinar para gr q</p><p>de dados</p><p>no . . 1. Não se presta a análise matemática</p><p>1. valor típico: maior quantidade de . .</p><p>Moda 2. Pode não ser moda para certos conjuntos de</p><p>valores concentrados neste ponto dados</p><p>1.3.4 - SEPARATRIZES</p><p>São valores que dividem a distribuição em partes iguais. Essas medidas são utilizadas para se</p><p>conhecer, com precisão, a distribuição dos dados como um todo.</p><p>« Mediana (Med): divide a distribuição em duas partes iguais.</p><p>« Quartis (Q,, Q», Q3): dividem a distribuição em quatro partes iguais.</p><p>= Decis (D,, D>...., Do): dividem a distribuição em dez partes iguais.</p><p>= Percentis (P,, P5,..., Po9): dividem a distribuição em cem partes iguais.</p><p>Cálculo da Posição das Separatrizes (Pscp):</p><p>f</p><p>1) Mediana: Pa = A,</p><p>) f</p><p>to Dx=1,2,3: 2) Quartis: P, =</p><p>Of</p><p>3) Decis: P;, = a ). x=1,2,..,9;</p><p>O £</p><p>4) Percentis: Pp = A x=1,2,..,99;</p><p>100</p><p>Profa. MSc. Gilmara Alves Cavalcanti 23</p><p>a) VARIÁVEL DISCRETA: uma vez que a posição da separatriz está definida (conforme os cálculos</p><p>acima demonstrados) podemos encontrar a referida medida com a ajuda da fregiiência absoluta</p><p>acumulada “abaixo de” (FV) disposta na distribuição de frequências simples. O valor da separatriz</p><p>desejada corresponde ao elemento que se encontra na coluna da variável em estudo (“coluna</p><p>indicadora”).</p><p>Exemplo 01: Calcular Q,, Ds e Pgs do banco de dados 01 (Unidade II)</p><p>b) VARIÁVEL CONTÍNUA: o cálculo de uma separatriz para uma variável disposta em uma</p><p>distribuição de fregiência em classes é similar ao cálculo da mediana em uma distribuição de</p><p>frequência em classes. De forma mais detalhada o procedimento é realizado através dos seguintes</p><p>passos:</p><p>(1º Passo) Calcular a posição da separatriz conforme o “cálculo da posição das separatrizes”.</p><p>Como a variável é contínua não importa se “n” (tamanho da amostra) é par ou ímpar.</p><p>(2º Passo) Através da F ) identificar a classe que contém a separatriz, isto é, a posição da</p><p>separatriz.</p><p>(3º Passo) Utilizar a fórmula:</p><p>Pao FS).</p><p>Separatriz=Llçop + TE FÍsep</p><p>Sep</p><p>OBS: A nomenclatura “Separatriz ou Sep” da fórmula acima deve ser substituída pela separatriz a ser</p><p>determinada.</p><p>Exemplo 02: Calcular Q3, Ds e Pgg do banco de dados 02 (Unidade IT).</p><p>Interpretação das Separatrizes:</p><p>Mediana Quartis Decis Percentis</p><p>10% —|Do 1% Poo Q</p><p>2% o, 10% | Ds 1% | Pos</p><p>50% 10% |D; 1% Po7</p><p>25% . . ;</p><p>Med Q, . . Pgo</p><p>25% . R .</p><p>50% Q: 10% Ds 1% P3</p><p>10% D> 1% P></p><p>0</p><p>25% 10% ID; 1% P,</p><p>Profa. MSc. Gilmara Alves Cavalcanti 24</p><p>Exercícios de Fixação:</p><p>Com base nas tabelas a seguir determine: Média, Mediana, Moda, Qr, Ds e Pgo. Analise os resultados.</p><p>Tabela 01 — Notas de alunos. Natal, 2000.</p><p>Notas | Nº de Alunos</p><p>4 l</p><p>5 5</p><p>6 6</p><p>7 5</p><p>8 3</p><p>Total 20</p><p>Fonte: Livro de Estatística.</p><p>Tabela 02 — Idade de pacientes. Natal, 2004.</p><p>Classes F</p><p>10 |-- 20 5</p><p>20 |-- 30 10</p><p>30 |-- 40 15</p><p>40 |-- 50 10</p><p>50 |--] 60 5</p><p>Total 45</p><p>Fonte: Livro de Estatística.</p><p>Tabela 03 — Número de faltas em um mês de</p><p>aula dos alunos. Natal, 2005.</p><p>X f</p><p>1 1</p><p>2 3</p><p>3 5</p><p>A</p><p>Total</p><p>Fonte: Livro de Estatística.</p><p>Tabela 04 — Pesos de pacientes (em kg).</p><p>Natal, 2005.</p><p>X f</p><p>82 5</p><p>85 10</p><p>87 is</p><p>89 8</p><p>90 4</p><p>Total</p><p>Fonte: Livro de Estatística</p><p>Profa. MSc. Gilmara Alves Cavalcanti 25</p><p>1.4- MEDIDAS DE DISPERSÃO E ACHATAMENTO</p><p>1.4.1 — MEDIDAS DE DISPERSÃO: Medem o grau de variabilidade ou "espalhamento" dos</p><p>elementos de uma distribuição. Medir a variabilidade é verificar se tais observações se concentram</p><p>mais para um lado ou outro da curva (Histograma) ou se dispõem simetricamente em torno de um</p><p>valor central (geralmente a média). O valor zero indica ausência de dispersão; a dispersão aumenta à</p><p>medida que aumenta o valor da medida. Imagine a seguinte situação:</p><p>Tabela 01 — Notas de alunos em cinco avaliações. Natal, 2004.</p><p>Alunos Notas Média</p><p>Antônio 5 5 5 5 5 5</p><p>João 6 4 5 4 6 5</p><p>José 10 5 5 5 0 5</p><p>Pedro 10 5 0 0 5:</p><p>Observa-se que:</p><p>a) As notas de Antônio não variaram;</p><p>b) As notas de João variaram menos do que as notas de José;</p><p>c) As notas de Pedro variaram mais do que as notas de todos os outros alunos;</p><p>Estas observações são verificadas através das medidas de dispersão. As principais são: Amplitude,</p><p>Variância, Desvio Padrão, Desvio Médio e Coeficiente de Variação.</p><p>1.4.1.1 - AMPLITUDE: Dá uma idéia do campo de variação dos elementos. A = Rmáx — Kmin</p><p>Exemplo 01: No exemplo anterior: Aantônio=?; Ajão=? Ajosé =? Apedro =?</p><p>Através da amplitude verifica-se que as notas de Antônio não variaram, enquanto que, as de João</p><p>variaram menos que as de José. Além disso, observa-se que não houve variação entre as notas de</p><p>José e Pedro.</p><p>OBS: 4 amplitude não mede bem a dispersão dos dados porque, usam-se apenas os valores extremos,</p><p>e não todos os elementos da distribuição. Apesar disso, é muito utilizada como medida de dispersão</p><p>por ser fácil de calcular e de interpretar. :</p><p>1.4.1.2 — VARIÂNCIA: É a medida de dispersão mais utilizada. É o quociente entre a soma dos</p><p>quadrados dos desvios e o número de elementos. E classificada em dois tipos:</p><p>1. Variância Populacional (6”): 2. Variância Amostral (s” ):</p><p>2 DRY 2 ES</p><p>n n-1</p><p>No caso de dados agrupados em uma distribuição de frequências simples ou em classes, a variância</p><p>pode ser definida como:</p><p>1. Variância Populacional (6”): 2. Variância Amostral (s” ):</p><p>& DX -*P4, Em 3-3,</p><p>n n—l</p><p>“Profa. MSc. Gilmara Alves Cavalcanti 26</p><p>onde X; representa o valor de cada observação (no caso de dados agrupados em uma tabela simples),</p><p>ou o ponto médio (no caso dos dados agrupados em uma distribuição de freguências em classes).</p><p>ATENÇÃO: A variância apresenta unidade de medida igual ao quadrado da unidade de medida dos</p><p>dados. Por exemplo, se os dados estão em metros (m), o valor da variância encontrado corresponde a</p><p>metros quadrados (m?).</p><p>L, SOLUÇÃO: utilizar o desvio padrão como unidade de medidas dos dados.</p><p>1.4.1.3 — DESVIO PADRÃO: Medida de dispersão que apresenta as mesmas propriedades da</p><p>variância, exceto que, o resultado final corresponde à mesma unidade de medidas dos dados. E</p><p>definido como sendo a raiz quadrada da variância.</p><p>Desvio Padrão Populacional (6 ): 2. Desvio Padrão Amostral (s ):</p><p>o VT = [LO 7. ES</p><p>n n-l</p><p>No caso de dados agrupados em uma distribuição de fregiiências simples ou em classes, o desvio</p><p>padrão pode ser definido como:</p><p>= OBS: Quanto maior o | XX) f, x</p><p>Desvio Padrão Populacional (6): | o = LO valor do desvio padrão</p><p>n significa que mais</p><p>dispersos estão os</p><p>3 -XPI, elementos em torno da</p><p>TT média.</p><p>Desvio Padrão Amostral (s):| s= n-1</p><p>onde X; representa o valor de cada observação (dados agrupados em tabela de distribuição de</p><p>frequências simples), ou o ponto médio (dados agrupados em tabela de distribuição de frequências em</p><p>classes).</p><p>Exemplo 02: Calcular o desvio padrão da Tabela 01 (Notas</p><p>dos alunos em cinco avaliações).</p><p>Exemplo 03: Calcular o desvio padrão do banco de dados 01 (Unidade IN).</p><p>Exemplo 04: Calcular o desvio padrão do banco de dados 02 (Unidade II).</p><p>1.4.1.4 — DESVIO MÉDIO (DM): O desvio médio, ou média dos desvios, é à média aritmética dos</p><p>valores absolutos dos desvios tomados em relação a uma das seguintes medidas de tendência central:</p><p>média ou mediana.</p><p>a) Desvio Médio para Dados Brutos/Rol: Quando os valores não vierem dispostos em uma tabela de</p><p>frequências, o desvio médio será calculado, através das seguintes fórmulas:</p><p>xs -*</p><p>n</p><p>4 PS — Med</p><p>n</p><p>= Desvio Médio em relação à Média: |DM=</p><p>= Desvio Médio em relação à Mediana: |D</p><p>Profa. MSc. Gilmara Alves Cavalcanti 27</p><p>b) Desvio Médio para Dados Tabulados: Se os valores vierem dispostos em uma tabela de</p><p>frequências, simples ou em classes, serão usadas as seguintes fórmulas:</p><p>Me > x, -X£,</p><p>n</p><p>= Desvio Médio em relação à Média:</p><p>M= > x; — Medlf,</p><p>n</p><p>= Desvio Médio em relação à Mediana:</p><p>onde, X; representa um valor individual (no caso de uma distribuição de fregiência simples) ou o</p><p>ponto médio (PM;) da classe (no caso de uma distribuição de fregiiência em classes).</p><p>OBS:</p><p>1. O desvio médio é mais vantajoso que a amplitude, visto que leva em consideração todos os</p><p>valores da distribuição.</p><p>2. O desvio médio, calculado levando-se em consideração os desvios em torno da mediana, é</p><p>mínimo, ou seja, é menor do que qualquer desvio médio calculado com base em qualquer outra</p><p>medida de tendência central.</p><p>3. Apesar de o desvio médio expressar aceitavelmente a dispersão de uma amostra, não é tão</p><p>frequentemente empregado como o desvio padrão (não apresenta propriedades matemáticas</p><p>interessantes).</p><p>Exemplo 05: Calcular o desvio médio do banco de dados 01 (Unidade IN).</p><p>Exemplo 06: Calcular o desvio médio do banco de dados 02 (Unidade II).</p><p>1.4.1.5 - COEFICIENTE DE VARIAÇÃO (CV)</p><p>O coeficiente de variação é a razão entre o desvio padrão e a média. O resultado é multiplicado</p><p>por 100, para que o coeficiente de variação seja dado em porcentagem.</p><p>CV = +.100</p><p>X</p><p>OBS;: Um CV alto indica que a dispersão dos dados em torno da média é muito grande.</p><p>OBS,: Quando as medidas são expressas em unidades diferentes como peso/atura,</p><p>capacidade/comprimento, etc.., não se pode compará-las através do desvio padrão, por este ser uma</p><p>medida absoluta de variabilidade. Utiliza-se então o CV, que é uma medida relativa que expressa o</p><p>desvio padrão como uma porcentagem da média aritmética. Quanto mais próximo de zero, mais</p><p>homogênea é a distribuição. Quanto mais distante, mais dispersa.</p><p>Exemplo 07; Calcular o coeficiente de variação do banco de dados 01 (Unidade II).</p><p>Exemplo 08: Calcular o coeficiente de variação do banco de dados 02 (Unidade ID).</p><p>Profa. MSc. Gilmara Alves Cavalcanti 28</p><p>1.4.2 — MEDIDAS DE ACHATAMENTO</p><p>1.4.2.1 — ÍNDICE DE ASSIMETRIA DE PEARSON</p><p>ASSIMETRIA: Mostra a forma da distribuição (visualizada pelo histograma alisado) e mensura o</p><p>quanto ela se distancia da condição de normalidade. Mede-se através do índice de assimetria de</p><p>660,9? Pearson, “a”, ou através dos momentos.</p><p>Indice de Assimetria Análise:</p><p>de Pearson</p><p>Se a 0, a distribuição é assimétrica à direita ou positiva;</p><p>Se a = 0 a distribuição é simétrica;</p><p>1.4.2.2 - COEFICIENTE PERCENTÍLICO DE CURTOSE.</p><p>MEDIDAS DE CURTOSE: A curtose ou excesso indica até que ponto a curva de frequências de uma</p><p>distribuição se apresenta mais afilada ou mais achatada do que uma curva-padrão, denominada de</p><p>curva normal. De acordo com o grau de curtose, podemos ter três tipos de curvas de fregiiência:</p><p>a) Curva ou Distribuição de Fregiiências Mesocúrtica: se a curva de fregiiências apresentar um grau</p><p>de achatamento equivalente ao da curva normal.</p><p>b) Curva ou Distribuição de Fregiiências Platicúrtica: uma curva platicúrtica apresenta-se com alto</p><p>grau de achatamento, superior ao da curva normal.</p><p>c) Curva ou Distribuição de Fregiiências Leptocúrtica: uma curva leptocúrtica revela um alto grau de</p><p>afilamento, superior ao normal.</p><p>As medidas de curtose ou achatamento medem o grau de concentração dos elementos de uma</p><p>distribuição. Podem ser calculadas através do coeficiente percentílico de curtose ou através dos</p><p>momentos. .</p><p>Coeficiente Percentílico de Curtose:) k=————— onde D =</p><p>« Dq = Desvio quartílico;</p><p>= Poo= Nonagésimo percentil;</p><p>« Pr = Décimo percentil;</p><p>Análise (em relação ao achatamento):</p><p>Se K 0.263, a distribuição é achatada (PLATICURTICA)</p><p>Se K = 0.263, a distribuição é normal (MESOCURTICA)</p><p>Exemplo 09: Calcular o Índice de Assimetria de Pearson (Banco de Dados 02) e o Coeficiente</p><p>Percentílico de Curtose (Banco de dados 01 e Banco de Dados 02).</p><p>Exercícios de Fixação:</p><p>1. Calcule a variância, o desvio padrão, o desvio médio e o coeficiente de variação dos exercícios do</p><p>Capítulo 03 (Tabela 01, Tabela 02, Tabela 03 e Tabela 04).</p><p>Profa. MSc. Gilmara Alves Cavalcanti 29</p><p>2. Um teste de Estatística aplicado a dois grupos de 50 alunos apresentou os resultados a seguir.</p><p>Calcule o coeficiente de variação (CV) e analise os resultados.</p><p>Notas</p><p>Grupo Média Desvio-Padrão</p><p>A 6 2</p><p>B 6,2 1,5</p><p>3. Dada a distribuição de salários abaixo, determinar: a mediana, o índice de assimetria de Pearson e o</p><p>coeficiente percentílico de curtose. Analise os resultados.</p><p>Salários | Frequências</p><p>20 |-- 25 10</p><p>25 |-- 30 15</p><p>30 |-- 35 20</p><p>35 |-- 40 18</p><p>40 |--| 45 4</p><p>LISTA DE EXERCÍCIO 1.3 E 1.4</p><p>Identifique situações que sejam adequadas às tabelas a seguir, de forma que todos os seus componentes</p><p>sejam determinados. Calcule, para cada caso, as medidas a seguir e analise os resultados encontrados.</p><p>MEDIDAS DE TENDÊNCIA CENTRAL MEDIDAS DE DISPERSÃO</p><p>(a) Média; (h) Variância;</p><p>(b) Mediana; (1) Desvio padrão;</p><p>(c) Moda; ()) Desvio Médio;</p><p>(d) Moda de Pearson; (k) Coeficiente de Variação;</p><p>(e) Que Q3; (1) Índice de Assimetria de Pearson;</p><p>(1) Do; (m) Coeficiente Percentílico de Curtose;</p><p>(g) Pro e Poo;</p><p>Tabela 01.</p><p>X</p><p>10</p><p>1</p><p>15</p><p>19</p><p>21</p><p>26</p><p>Total | 30</p><p>Tabela 02.</p><p>Classes</p><p>10 |-- 12</p><p>12 |-- 14</p><p>14 |-- 16</p><p>16 |-- 18</p><p>18 |-- 20</p><p>20 |-- 22</p><p>22|--24</p><p>24 |--|26</p><p>Profa. MSc. Gilmara Alves Cavalcanti 30</p><p>UNIDADE II: PROBABILIDADE</p><p>As unidades anteriores mostram como apresentar os dados e como calcular medidas que</p><p>descrevem características especificas destes dados. Mas, o pesquisador além de construir tabelas</p><p>e gráficos, calcular médias e desvios padrões, sempre tem a intenção de fazer INFERÊNCIAS.</p><p>y</p><p>Para fazer INFERÊNCIA ESTATÍSTICA usam-se técnicas que exigem o conhecimento de</p><p>PROBABILIDADE.</p><p>DETERMINÍSTICO</p><p>FENÔMENOSDE |... 5 MODELO</p><p>OBSERVAÇÃO MATEMÁTICO</p><p>PROBABILÍSTICO</p><p>Os fenômenos estudados pela Estatística são aqueles que mesmo em condições normais de</p><p>experimentação variam de uma observação para outra, dificultando a previsão de resultados</p><p>futuros. Para a explicação de fenômenos aleatórios utiliza-se o modelo probabilístico (CÁLCULO</p><p>DAS PROBABILIDADES)</p><p>2.1 - CONJUNTOS E SUBCONJUNTOS</p><p>Teoria dos Conjuntos ==> Georg Cantor (1872)</p><p>“Estima-se que são falados 2.790 idiomas em todo o mundo, porém nenhum deles é entendido</p><p>por todos os povos. No entanto, em qualquer lugar da terra a sentença 3 + 4 = 7 é compreendida:</p><p>a matemática une a humanidade, constituindo uma linguagem comum a todos os povos”.</p><p>2.1.1 - CONCEITOS PRIMITIVOS</p><p>> Conjunto: associamos à idéia de grupo, coleção ou classe;</p><p>> Elemento: são os objetos ou “coisas” que constituem o conjunto;</p><p>> Pertinência: associamos à idéia de constituir o conjunto (pertencer);</p><p>Exemplos:</p><p>a) P = conjunto dos números pares entre 1</p><p>e 9; c) L = conjunto dos números da loto;</p><p>Elementos =2,4,6€8. Elementos = 1, 2, 3,......, 99, 00.</p><p>b) N = conjunto dos algarismos do número dq) B = Os alunos dessa sala formam um</p><p>3186; conjunto;</p><p>Elementos = 1,3,6€e8. Elementos = cada aluno é um elemento.</p><p>>» A idéia de constituir o conjunto associamos ao conceito primitivo de pertence (o elemento</p><p>pertence ao conjunto).</p><p>Notação:</p><p>e Letras maiúsculas (A, B, €): conjuntos; Exemplos:</p><p>e Letras minúsculas (a, b, c): elementos;</p><p>e e: pertence; a)6EP c)8eL</p><p>e &:não pertence; b7eN )24B</p><p>Profa. MSc. Gilmara Alves Cavalcanti 31</p><p>2.1.2 - REPRESENTAÇÃO DE UM CONJUNTO</p><p>Considere o conjunto, D, formado pelos elementos dó, ré, mi, fá, sol, lá, e si.</p><p>“> Representação Tabular: enumeração de seus elementos. Apresentados entre chaves,</p><p>separados por vírgulas e sem repetição (não importa a ordem dos elementos). Então,</p><p>D = (dó, ré, mi, fá, sol, lá, si)</p><p>=» Representação através de uma Propriedade: os elementos são descritos através de uma</p><p>propriedade característica que os determina. Então, D = (x | x é nota musical).</p><p>=> Representação através do Diagrama de Venn: os elementos são simbolizados por pontos</p><p>interiores em uma região plana, limitada por uma região fechada. Então,</p><p>D</p><p>2.1.3 - TIPOS DE CONJUNTOS</p><p>> Conjunto Unitário: é todo conjunto formado por um único elemento. (n(A) = 1, onde n(A) é</p><p>o número de elementos distintos de conjunto).</p><p>Exemplos: ajÃ=(5) b)B= fx|x é estrela do sistema solar) = (sol;</p><p>=> Conjunto Vazio: não possui elemento algum. Representa-se por 4 ou É 3. (n(A) = 0).</p><p>Exemplos: a)A=fx|xénúmeroe0x=5)=&6</p><p>b) B= fx|x é palavra proparoxitona da língua portuguesa não acentuada) = 4</p><p>=» Conjunto Finito: é todo conjunto que contando os elementos, um a um, chega-se ao fim da</p><p>contagem.</p><p>Exemplos: ajA=fa bc def! bC=46 c)B=fx|xébrasileiro; d)D=t+4,3,1</p><p>> Conjunto Infinito: é todo conjunto que não é finito.</p><p>Exemplos: a) N = 10,1,2,3,4,......;: Números Naturais</p><p>b) Z =... 2, -1,0, 1, 2,......+: Números Inteiros</p><p>>» Conjunto Universo (U): é aquele ao qual pertencem todos os elementos desse estudo. Pode</p><p>ser finito ou infinito.</p><p>U</p><p>OBS: Quando estudamos os números que A B</p><p>podem resultar da contagem de unidades, então,</p><p>U é o conjunto dos números naturais:</p><p>N =10,1,2,3,4,.....).</p><p>Problemas:</p><p>1. Considere 3X +6=0€eU= 10,1,2,3,..). 2. Considere 2X —-10=0€e U = 10,1,2,...).</p><p>Solução: Solução:</p><p>193X+6=0 > 3X=-6 > X=-2 (192X-10=0 > 2X=10 > X=5</p><p>Q)-2€U > S=4 Q95euÚu > S=(5)</p><p>Profa. MSc. Gilmara Alves Cavalcanti 32</p><p>> Conjunto das Partes</p><p>Considere, M = ((2, 3%, 15), 42,5). Então, 45) e M; $45)) c Mou ff2,3), 15) M)</p><p>Seja um conjunto A finito. É possível construir um novo conjunto cujos elementos sejam todos</p><p>os subconjuntos possíveis de A. Esse novo conjunto é denominado conjunto das partes de A.</p><p>P(A)=fx|x c A!</p><p>Exemplo: A =fa,b) P Subconjuntos de A = 4, fa), fb), fa, b) > P(A)= fo, fa), fb),</p><p>ta, b3)</p><p>Número de Subconjuntos: n(A)=k => A tem 2* subconjuntos</p><p>No exemplo anterior, n(A)=2 => Atem 2º = 2? =4 subconjuntos.</p><p>> Conjunto dos Números Naturais: é o conjunto N= £0, 1,2, 3, 4,5, .... ></p><p>OBS: Usamos o símbolo (*) para indicar a exclusão do elemento O (zero) de qualquer conjunto</p><p>numérico. Portanto, Nº = [1,2,3,4,5,.......).</p><p>OBS;: Neste conjunto são definidas duas operações fundamentais: adição e multiplicação.</p><p>OBS:: Dado um natural “a”, tal que a 0, o simétrico de “a” não existe em N: — a & N. Por</p><p>isso, a subtração (a — b) não tem significado em N.</p><p>Propriedades:</p><p>1. Associativa da Adição: (a+b)+c=a+(b+c), Va, b,ce N;</p><p>2. Comutativa da Adição: (a+b)=(b+a), Va,be N;</p><p>3. Elemento Neutro da Adição: (a+0)=a, Y ae N;</p><p>4, Associativa da Multiplicação: (a.b).c=a.(b.c), V a,b,ce N;</p><p>5. Comutativa da Multiplicação: (a.b) = (b.a), Y a,b e N;</p><p>6. Elemento Neutro da Multiplicação: (a.l)=a, Vae N;</p><p>7. Distributiva da Multiplicação / Adição: a.(b + c)=(a.b)+(a.c), VY a,b,ce N;</p><p>=) Conjunto dos Números Inteiros: é o conjunto Z= Lis -3,-2,-1,0,1,2,3,.....></p><p>OBS: Usamos o símbolo (+) para indicar a exclusão dos elementos negativos e o símbolo (-)</p><p>para indicar a exclusão dos elementos positivos. Portanto,</p><p>= 7'=40,1,2,3,4,.)=N => conjunto dos inteiros não negativos;</p><p>“= Z=[..,3,-2,-1,0) => conjunto dos inteiros não positivos;</p><p>= Z'= f...,-3, -2,-1, 1,2,3,...) > conjunto dos inteiros não nulos;</p><p>OBS,: Z, = [1,2,3,4,...), ouainda, Z. = [...,-3,-2,-1);</p><p>OBS3: Todo número natural é um inteiro > N c Z;</p><p>Operações em Z:</p><p>1. Simétrico ou Oposto para a Adição: V ae Zexiste-a e Ztal quea+(-a)=0;</p><p>2. Subtração: (a-b)=a+(-b), Va,be Z;</p><p>3. Todas as propriedades válidas para os números naturais (Propriedades de 1 a 7);</p><p>Divisibilidade: Dizemos que o inteiro “a” é divisor do inteiro “b”, a | b, quando existe um inteiro</p><p>“c” tal que ca=b.</p><p>albo (IceZlca=b)</p><p>Exemplos: a22>62=12 QJIMST(D=4 OO > 10=0</p><p>b3|-18 > (6)3=-18 40 > 04=0 95]20 > (4).(5)=20</p><p>Profa. MSc. Gilmara Alves Cavalcanti 33</p><p>ma Quando “a” é divisor de “b”, dizemos que “b” é divisível por “a”, ou “b” é múltiplo de</p><p>.« Para um inteiro “a” qualquer: D(a) = conjunto dos divisores de a;</p><p>M(a) = conjunto dos múltiplos de a;</p><p>Exemplos: aJD(2)=11,-1,2,2) > MQ)= 40, £2, £4, L6,..3</p><p>b) D(-3)= $1,-1,3,-3) > M(3)=10, 43,6, £9,..)</p><p>9D(O)=Z > M(0)= 40)</p><p>OBSs: Um número inteiro “p” é primo quando, p * 0, 1e-l, > D(p)=fi,-1,p,-pt. Por</p><p>exemplo, 2, -2, 3,-3,5,-5, 7 e — são primos.</p><p>=> Conjunto dos Números Racionais: é o conjunto Q= (x |x=p/g; pe Zeqe Z'3. Para o</p><p>qual adotam-se as seguintes definições:</p><p>(1º) Igualdade: 2 =“ «> ad=be; OBS:: Número racional é todo número que</p><p>pode ser escrito em forma de fração, com</p><p>(27) Adição: 2 + E ad + be. numerador inteiro e denominador diferente</p><p>$ d bd * de zero.</p><p>(3º) Multiplicação: ' á E no OBS>: Racionais m Irracionais = é</p><p>OBS3: No conjunto dos racionais podemos destacar: Q</p><p>+ . . . mo .</p><p>2 Q =conjunto dos racionais não negativos;</p><p>E Q = = conjunto dos racionais não positivos;</p><p>- Q = conjunto dos racionais não nulos</p><p>OBS,: São números racionais:</p><p>« Todo número inteiro: -4 e Q,0 e Q,183 E Q;</p><p>= Todos os números decimais finitos: 2,72 e Q, 8/5 e Q,-0,23 e Q;</p><p>“ Todos os números decimais infinitos e periódicos: 0,3333... e Q, 0,1815555.... e Q;</p><p>OBSs: Verifique que, Q=Q"U Q enquanto Q'n Q=40)</p><p>OBsSs: Divisão de frações:</p><p>Operações em Q:</p><p>1.(A.1) [E+S)ricds(S 45]; (M.1) ' S) i-é [s e]</p><p>b d/) f bad f bad/ f bid £</p><p>2.(A2) É+lol42, Mo 2.£- £L à</p><p>b d d b “d d b</p><p>a</p><p>b</p><p>3.(A.3) [8)+0- neo lg) -</p><p>e</p><p>i</p><p>s</p><p>e</p><p>l</p><p>o</p><p>Profa. MSc. Gilmara Alves Cavalcanti 34</p><p>nm . Fr . a r</p><p>Representação Decimal: Todo número racional, pode ser representado por um número</p><p>. , . a , . ca o</p><p>decimal. Passa-se um número racional b para a forma de número decimal dividindo o inteiro</p><p>“a” pelo inteiro “b”. Nesse caso podem ocorrer dois casos:</p><p>(1º) O número decimal tem uma quantidade finita de algarismos, diferentes de zero => decimal</p><p>3 1 1 27</p><p>exata. Exemplos: a) — =3 b) — =0,5 — =(0,05 d) —— = 0,027</p><p>) 1 ) 2 3) 20 ) 1000</p><p>(2) O número decimal tem uma quantidade infinita de algarismos que se repetem</p><p>periodicamente => dizima periódica. Exemplos: a) 4 = 0,333... = 0,3 (período 3)</p><p>b) é = (,2857142857142... = 0,2857142 (período 285714)</p><p>OBSs: Decimal Exata => pode ser transformada em uma fração da seguinte forma: o numerador</p><p>é o numeral decimal sem a vírgula, e o denominador é o algarismo 1 seguido de tantos zeros</p><p>quantas forem as decimais do numeral dado.</p><p>37 2631 634598 Exemplos: 0,37= >" 2,631 = “821 63,4598 =</p><p>Exempros 100 1000 10000</p><p>> Conjunto dos Números Reais: é o conjunto obtido da união do conjunto dos números</p><p>racionais com o dos números irracionais: R= £x |x e Q ou x é Irracional). Portanto, é o</p><p>conjunto formado por todos os números com representação decimal, isto é, casas decimais exatas</p><p>ou periódicas (números racionais) e as decimais não exatas e não periódicas (números</p><p>irracionais) > R= (QU Irracionais).</p><p>OBS:: Todo número racional é número real: .Q c R;</p><p>OBS):</p><p>Admite-se também: R,RÍ,R, R$, Rº</p><p>= R'= conjunto dos racionais não negativos;</p><p>" R'= conjunto dos reais não positivos;</p><p>= R'=conjunto dos reais não nulos OBS;: Estão em R os números irracionais: /2 = 1,41421...; 1=3,14159...</p><p>Operações em R: As operações de adição e multiplicação em R gozam das mesmas propriedades</p><p>vistas para o conjunto Q. Em R também é definida a operação de subtração e em R também é</p><p>definida a divisão.</p><p>Intervalos: Podemos representar o conjunto de números reais associando cada x e R a um ponto</p><p>de uma reta R,</p><p>2 38r 1 0 1 2/92</p><p>Intervalo é qualquer conjunto contínuo de R. Dados p e q reais (p [p, q]: Conjunto: (x e R|p Jp [: Conjunto: fx e R|p [p, q [: Conjunto: fx e R|p lp. q E Conjunto: fx e R|p T não é subconjunto de B. Portanto,</p><p>HcBeMc B (lê-se: H está contido em B) e (lê-se:M está contido em B);</p><p>Ta B(lê-se:T não está contido em B);</p><p>Um conjunto A é subconjunto de um conjunto B se, e somente se, todo elemento de A pertencer</p><p>aB.</p><p>Exemplos: a) (2, +93 d) À BC A</p><p>Propriedades .</p><p>1. O conjunto vazio é subconjunto de qualquer conjunto; GC A,VA.</p><p>2. Todo conjunto é subconjunto de si mesmo; AC A,VA.</p><p>2.1.5 - IGUALDADE DE CONJUNTOS</p><p>Dois conjuntos A e B são iguais se, e somente se, possuem os mesmos elementos.</p><p>ABS (Vy)stkeA AUVUB=[1,2,3,6,7)</p><p>bC=[1,2,3,4)eD=[3,4,5,6,7) > CUD=([1,2,3,4,5,6,7)</p><p>JA=fx|xéparyeB=42,4,6) > AU B=(x|xépar)</p><p>=> Representação da União de Conjuntos em Diagrama de Venn:</p><p>U A A</p><p>Região Hachurada: (A U B)</p><p>Profa. MSc. Gilmara Alves Cavalcanti 36</p><p>“> Propriedades da União:</p><p>LAVA=SA VA; SA(AVBUC=-AL(BUCVA,B,C;</p><p>ZAUVG=AVA; SACB>AUB=BVA,B;</p><p>3S&AUVB=BUAVA,B; BCASAUB=A,VA,B;</p><p>Consegientemente, (A UV A UV AGU. U A)=fx|xe Ajouxe Azou...oux E Any</p><p>2.2.2 — INTERSEÇÃO (n): A interseção de dois conjuntos A e B é o conjunto formado pelos</p><p>elementos pertencentes a A ea B.</p><p>AnB=fx|xeAexe B)</p><p>Exemplos:</p><p>aJÃ=(1,2,3,4)eB=(3,4,5,6,7) > An B=(3,4) | OBS: Quando a interseção entre</p><p>bDC=[1,2,3)eD=[7,8,9) > Cn D=4 dois conjuntos é o conjunto 4</p><p>JE=(4,5,6)eF=[2,3,4,5,6,7) > En F=E dizemos que são conjuntos</p><p>DA=[1,3,5,7,9)eB=12,4,6,8) > An B=b6 DISJUNTOS.</p><p>> Representação da Interseção de Conjuntos em Diagrama de Venn: Po</p><p>Região Hachurada: (A m B) (An B)=4 => DISJUNTOS</p><p>U A</p><p>> Propriedades da Interseção:</p><p>LANA=A, VA; 4(ANBnC=AN(BnO,VA,B,C;</p><p>Z2ANd=0,VA; SACBS5S5AnNB=AVA,B;</p><p>3SAnNnB=BnAVA,B; BCADSAnNB=BVA,B;</p><p>Consegiientemente, (A; mn AN AyN ..n An=(tx|xe Ajexe Age...exe An)</p><p>2.2.3 —- DIFERENÇA: Dados dois conjuntos A e B, chamamos de diferença (A — B) ao</p><p>conjunto formado pelos elementos que pertencem a A e não pertencem a B.</p><p>(A-B)=fx|xe Acexg B)</p><p>Exemplos:</p><p>aJA=(1,2,3,4,5/eB=14,5,6,7,8,9) > A-B=[1,2,3) e B-A=(6,7,8,9)</p><p>b)C=1,2,3,4,5,6)eD=(3,4,5) > C-D=([1,2) eD-C=4</p><p>JA=(2,3,5)eB=(4,6,7) > A-B=[2,3,5)=A e B-A=[4,6,7)=B</p><p>“) Representação da Diferença de Conjuntos em Diagrama de Venn:</p><p>A</p><p>U A</p><p>Profa. MSc. Gilmara Alves Cavalcanti 37</p><p>Região Hachurada: (A — B)</p><p>U A A</p><p>SeBcA > B-A=4</p><p>Região Hachurada: (B — A)</p><p>> Propriedades da Diferença:</p><p>LA-AS6,VA; 4BCADB-A-6,VA,B;</p><p>LA-QEAVA; SALB>A-BZB-AVA,B;</p><p>3. 0-ASO,VA; GANB=4existeC) =B-A=(4,5)</p><p>bD=(1,2,3,4)eE=(3,4,6,7) D Dq E > não existe C2</p><p>c) A = (113, 114) eB= f111,112,113,114) D ACB> existe Co =B-A= [111,112)</p><p>> Representação do Complementar de Conjuntos em Diagrama de Venn:</p><p>U B,</p><p>Região Hachurada: C) = A Ci =B-A</p><p>> Propriedades do Complementar:</p><p>1. Ch=4,VA,B; 4. (AUB)=ANB, VA,B;</p><p>2.CL=A,VA; Ss. (ANBJ=AUB, VA,B;</p><p>3. Ci=4:</p><p>Profa. MSc. Gilmara Alves Cavalcanti 38</p><p>2.3 — CONCEITOS DE PROBABILIDADE (EXPERIMENTO, ESPAÇO AMOSTRAL,</p><p>EVENTOS)</p><p>2.3.1 - EXPERIMENTOS ALEATÓRIOS (E): Um experimento é o processo de observar um</p><p>fenômeno que tem variação em seus resultados. Por exemplo,</p><p>E;: Retirar uma carta de um baralho com 52 cartas e observar seu naipe;</p><p>E;: Jogar uma moeda 10 vezes e observar o número de caras obtidas;</p><p>Es: Retirar com ou sem reposição, bolas de uma urna que contém 5 bolas brancas e 6 pretas;</p><p>E,: Jogar um dado e observar o número mostrado na face superior;</p><p>Es: Contar o número de peças defeituosas da produção diária da máquina A;</p><p>2.3.2 - ESPAÇO AMOSTRAL (S ou €2): É o conjunto de todos os resultados possíveis de um</p><p>experimento. Por exemplo,</p><p>a) E = Jogar um dado e observar o número mostrado na face superior D S=?</p><p>b) E = Jogar duas moedas e observar o resultado P S=2</p><p>2.3.3 - EVENTOS: É qualquer subconjunto do espaço amostral. Por exemplo,</p><p>a) E = Jogar três moedas e observar o resultado D S=?</p><p>Seja o evento, A = ocorrer pelo menos duas caras. —» A =?</p><p>b) E = Lançar um dado e observar a face superior D S=?</p><p>Seja o evento, B = ocorrer múltiplo de2. —» B=?</p><p>> Relações entre Eventos</p><p>(1) (AUB): é o evento que ocorre se A ocorre, ou B ocorre ou ambos ocorrem;</p><p>(Gi) (AnB): é o evento que ocorre se A e B ocorrem;</p><p>(ii) A“ou A: éo evento que ocorre se A não ocorre;</p><p>(iv) Dois eventos A e B são denominados mutuamente exclusivos se eles não puderem</p><p>ocorrer simultaneamente, isto é, (ANB) = 4.</p><p>2.4 - PROBABILIDADE E SUAS LEIS</p><p>Definição 1: É o grau de confiança que se tem na ocorrência de um determinado evento.</p><p>Definição »: Seja A um evento associado a um determinado experimento, a sua probabilidade é</p><p>verificada por:</p><p>número de maneiras que ocorre o evento A HA</p><p>P(A)= =</p><p>(A) número de maneiras que ocorre o espaço amostral HS</p><p>Axiomas da Probabilidade: Seja A um evento e considere P(A) a probabilidade desse evento.</p><p>Essa probabilidade deve satisfazer as seguintes condições:</p><p>(a) O</p>