Prévia do material em texto
<p>Unidade II</p><p>52</p><p>Amostragem: estimação e decisão estatística</p><p>A partir de agora, iremos nos aprofundar nas teorias da estimação estatística e da decisão estatística.</p><p>Na primeira dessas teorias, talvez o campo mais usado e conhecido da amostragem, veremos como</p><p>estimar uma população a partir de amostras dela retiradas. Na segunda teoria, nossa preocupação será</p><p>diferenciar o que é causal do que é casual na amostragem.</p><p>Objetivos do módulo</p><p>Anteriormente, vimos que é possível prever o comportamento de amostras sabendo o comportamento</p><p>da população do qual elas são retiradas. Do ponto de vista prático, no entanto, normalmente é mais</p><p>interessante o movimento ao contrário, ou seja, a partir do estudo de uma amostra, estimar-se o</p><p>comportamento de uma população. Podemos, por exemplo, prever quem será eleito em uma próxima</p><p>eleição a partir de uma pesquisa eleitoral, ou estimar qual será o volume de vendas de um produto que</p><p>iremos lançar a partir de uma pesquisa de mercado, ou, ainda, quantos desempregados existem em uma</p><p>região ou em um país.</p><p>Já aprendemos que uma maneira imediata e intuitiva de se conhecer um problema é coletar todos os</p><p>dados relativos a ele. Estatisticamente é a ideia do censo. Porém, muitas vezes é impossível ou difícil de fazê-lo.</p><p>Envolve muito trabalho e custo, isso quando os dados forem reais; se forem improváveis, nem com muito</p><p>trabalho chegaremos a um resultado adequado. A alternativa é coletarmos e estudarmos amostras e a partir</p><p>delas estimarmos a população. Essas estimativas estão no centro do próximo assunto que iremos abordar.</p><p>Por outro lado, também vimos que em estatística sempre estamos sujeitos a cometer erros de</p><p>predição. Mensurar, diminuir e se possível eliminar esses erros é fundamental para a qualidade do estudo</p><p>estatístico. Veremos isso aqui, quando serão estudadas casualidade e causalidade dos experimentos.</p><p>Saiba mais</p><p>Uma das mais importantes pesquisas por amostragem no Brasil é a</p><p>PNAD – Pesquisa Nacional por Amostra em Domicílios, base para grande</p><p>parte do planejamento econômico nacional.</p><p>INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATÍSTICA. Pesquisa nacional</p><p>por amostra de domicílios (PNAD). Disponível em: <https://ww2.ibge.gov.</p><p>br/home/estatistica/pesquisas/pesquisa_resultados.php?id_pesquisa=40>.</p><p>Acesso em: 13 jun. 2019.</p><p>Unidade II</p><p>ESTATÍSTICA APLICADA</p><p>53</p><p>5 TEORIA DA ESTIMAÇÃO ESTATÍSTICA</p><p>A princípio, o valor central da amostra é igual ao valor central correspondente da população. Por</p><p>exemplo, tomamos uma amostra de um determinado processo produtivo e ela revelou uma produtividade</p><p>média de 150 toneladas por hora ( X = 150 t/h). É lícito pensar que se fosse possível avaliar toda a</p><p>população (ou seja, as infinitas vezes em que o processo foi e será repetido), a produtividade média dela</p><p>seria 150 toneladas por hora também (µ = 150 t/h).</p><p>Esse raciocínio é conhecido por estimativa por pontos. É intuitivo notar que esse tipo de estimativa</p><p>é lógico, mas dificilmente exato. Acasos ocasionarão variações que têm que ser de algum modo consideradas.</p><p>Isso nos conduz ao conceito de fidedignidade da estimativa, que consiste em declarar um intervalo</p><p>de variação. É a chamada estimativa por intervalos.</p><p>No caso do processo produtivo, estimaríamos que a produtividade estivesse, por exemplo, entre 145</p><p>e 155 t/h, portanto, uma estimativa por intervalos.</p><p>Calcular esses intervalos é o nosso problema desta etapa. Esse campo do estudo estatístico é</p><p>conhecido como inferência estatística, sendo esta normalmente feita com a definição dos chamados</p><p>intervalos de confiança.</p><p>Suponha uma distribuição amostral das médias cuja média seja Xµ e o erro padrão Xσ . Note que</p><p>uma amostra qualquer, retirada da população correspondente, deve pertencer a essa distribuição.</p><p>Consequentemente, podemos afirmar que temos 100% de certeza (ou de confiança) que a média de</p><p>toda e qualquer amostra estará dentro do intervalo entre X X X X4 até 4µ − σ µ + σ .</p><p>Lembrete</p><p>A curva normal tem como uma de suas características mais notáveis o</p><p>fato de que varia entre mais ou menos quatro vezes o desvio padrão, em</p><p>torno da média. Não existem probabilidades acima ou abaixo desses limites.</p><p>Logo, se uma amostra ou população tiver média igual a 10 e desvio padrão</p><p>igual a 1, será impossível se obter nela valores acima de 14 ou abaixo de 6.</p><p>Vamos entender melhor isso através de um exemplo numérico. Suponha que a população de alunos</p><p>da UNIP que cursaram Estatística no passado apresente uma nota média igual a 6,2, com desvio padrão</p><p>igual a 0,4, distribuída normalmente. Para estudo, retiramos uma amostra de 16 alunos. Qual a nota</p><p>média amostral decorrente, ou seja, entre que valores essa amostra pode ocorrer? Os parâmetros</p><p>amostrais seriam:</p><p>X 6,2µ = µ =</p><p>Unidade II</p><p>54</p><p>X X X</p><p>0,4</p><p>0,1</p><p>n 16</p><p>σ</p><p>σ = →σ = →σ =</p><p>Portanto, temos 100% de certeza que qualquer amostra de 16 alunos retirada da população de</p><p>alunos de Estatística da UNIP terá sua média entre 5,8 e 6,6. É estatisticamente impossível um valor</p><p>médio superior a 6,6 ou inferior a 5,8 ocorrer.</p><p>Podemos fazer o raciocínio inverso. Caso tomemos uma amostra com X e desvio padrão S, poderemos</p><p>afirmar com 100% de certeza que o valor real da população estará entre X − S até X + S.</p><p>Vamos imaginar que temos uma amostra com 25 alunos de Matemática Financeira da UNIP e</p><p>calculamos sua média e desvio padrão chegando aos valores X = 5,6 e S = 2,5. Podemos estimar que</p><p>a nota média desses estudantes (todos) estará entre 3,6 e 7,6, com 100% de certeza. Veja os cálculos:</p><p>X X 5,6µ = µ = =</p><p>X X X</p><p>2,5</p><p>0,5</p><p>n 25</p><p>σ</p><p>σ = →σ = →σ =</p><p>X X X X4 até 4 5,6 4 0,5 até 5,6 4 0,5 3,6 até 7,6µ − σ µ + σ = − × + × =</p><p>Observação</p><p>Nesses cálculos, utilizamos a média da amostra ( X ) no lugar da média</p><p>da população (µ) e o desvio padrão da amostra (S) em vez do desvio padrão</p><p>da população (σ), visto não conhecermos os parâmetros populacionais (é o</p><p>que desejamos saber). O uso alternativo da média é obvio. Espera-se que as</p><p>médias da amostra, da população e a amostral sejam iguais, por definição</p><p>de amostragem. Já a igualdade dos desvios padrões é menos intuitiva, mas</p><p>pode ser assumida se n ≥ 30 ou se a distribuição for normal. Quando isso</p><p>não acontecer, recairemos na Teoria das Pequenas Amostras, que não é</p><p>objeto dos nossos estudos.</p><p>Essa estimativa não é satisfatória, afinal, prever que as notas médias estarão entre 3,6 e 7,6 é pouco</p><p>melhor do que prever que elas estejam entre 0 e 10 e para isso não precisaríamos de estatística.</p><p>Temos duas maneiras de aperfeiçoá-la. A primeira é aumentar o número de elementos da amostra.</p><p>Imagine que pegamos uma amostra de 100 alunos e que ela também apresenta os mesmos valores de</p><p>média e desvio padrão. Refazendo os cálculos, notaríamos uma melhoria significativa:</p><p>ESTATÍSTICA APLICADA</p><p>55</p><p>X X 5,6µ = µ = =</p><p>X X X</p><p>2,5</p><p>0,25</p><p>n 100</p><p>σ</p><p>σ = →σ = →σ =</p><p>X X X X4 até 4 5,6 4 0,25 até 5,6 4 0,25 4,6 até 6,6µ − σ µ + σ = − × + × =</p><p>Estima-se, portanto, que a média de todos os alunos de Matemática Financeira da UNIP esteja</p><p>entre 4,6 e 6,6, com 100% de certeza.</p><p>Reduziu-se pela metade a margem de erro da estimativa, mas o custo foi multiplicado por quatro.</p><p>Esse é um grande problema da amostragem, o custo aumenta muito mais rapidamente que a precisão.</p><p>Observação</p><p>Usamos os termos “margem de erro” e “erro esperado” como sinônimos</p><p>do intervalo de confiança de uma estimativa, que é a variação prevista para</p><p>mais e para menos da estimativa por pontos.</p><p>A segunda maneira é trabalhar com níveis de confiabilidade, ou confiança, menores, assumindo</p><p>algum risco de estarmos em desacordo com a realidade. O gráfico a seguir demonstra esse raciocínio.</p><p>Z</p><p>P(z)</p><p>68,2%</p><p>95,4%</p><p>97,7%</p><p>100,0%</p><p>-4σx -3σx -2σx -1σx µx 1σx 2σx 3σx 4σx</p><p>Figura 14</p><p>Unidade II</p><p>56</p><p>Observe que a probabilidade de que uma amostra tenha valor médio entre X X X X4 até 4µ − σ µ + σ</p><p>�� de 68,2%, quer dizer, temos uma confiança de 68,2% de que o valor médio de uma amostra qualquer</p><p>esteja entre aqueles valores mencionados. Em outras palavras, o intervalo de confiança de 66,2% são os</p><p>valores entre X X X X até µ −σ µ + σ .</p><p>De modo semelhante, o intervalo de confiança de 99,7% está entre X X X X3 até 3µ − σ µ + σ , e assim</p><p>por diante.</p><p>O número de erros padrões que estabelecem a confiabilidade é chamado de coeficientes de confiança</p><p>ou valores críticos e simbolizado por zc. Podemos determinar uma confiança a partir do valor crítico ou,</p><p>ao contrário, estabelecer o valor crítico a partir da confiança desejada, utilizando a tabela da curva</p><p>normal reduzida.</p><p>Por exemplo, caso queiramos trabalhar com uma confiabilidade de 90%, o valor crítico será de 1,645.</p><p>Chega-se a esse valor através do raciocínio estabelecido no gráfico a seguir:</p><p>Z</p><p>P(z)</p><p>-Zc Zc</p><p>100% - 90%</p><p>2</p><p>= 5% = 0,0500</p><p>100% - 90%</p><p>2</p><p>= 5% = 0,050090%</p><p>Figura 15</p><p>Utilizando a tabela da distribuição reduzida, teríamos:</p><p>tab cA 0,0500 z 1,645= → = −</p><p>Perceba que a área 0,0500 é exatamente o ponto médio entre os valores 0,0495 (Z= -1,65) e 0,0505</p><p>(Z= -1,64), daí o valor intermediário igual a -1,645. O sinal negativo será ignorado, por causa da simetria</p><p>da curva. Existe um zc positivo e outro negativo, simétricos.</p><p>Vamos voltar ao exemplo dos alunos de matemática financeira. Devemos considerar a amostra</p><p>original de 25 alunos, e refazer os cálculos para uma confiabilidade de 90%. Como vimos anteriormente,</p><p>ESTATÍSTICA APLICADA</p><p>57</p><p>o valor de zc para uma confiabilidade de 90% seria igual a 1,64 (na prática não usamos o valor 1,645.</p><p>Seria trabalhar com uma precisão desnecessária). Ficaria assim:</p><p>X X 5,6µ = µ = =</p><p>X X X</p><p>2,5</p><p>0,50</p><p>n 25</p><p>σ</p><p>σ = →σ = →σ =</p><p>c cX X X Xz até z 5,6 1,64 0,50 até 5,6 1,64 0,50 4,8 até 6,4µ − ×σ µ + ×σ = − × + × =</p><p>Estima-se, portanto, que a média de todos os alunos esteja entre 4,8 e 6,4, com 90% de certeza. Isso</p><p>quer dizer que se tomarmos 100 amostras de 25 alunos cada, em 90 delas estaríamos corretos, mas em</p><p>10 delas errados, ou seja, errando a estimativa, por pouco, mas equivocando-se.</p><p>Olhando os vários cálculos chegaremos, provavelmente, à conclusão de que essa última estimativa é a</p><p>mais adequada. Tomar uma decisão com um risco de 10% não é tão ruim assim na maioria dos casos práticos.</p><p>Perceba que até aqui falamos e exemplificamos usando sempre a média. Isso é o mais comum</p><p>na prática, mas todas as medidas estatísticas podem ser estimadas. As formulações dos intervalos de</p><p>confiança para os principais parâmetros estão relacionadas a seguir.</p><p>Forma geral das estimativas por intervalos:</p><p>Valor estimado Valor mais provável coeficiente de confiança erro padrão= ± ×</p><p>Intervalo de confiança para a média:</p><p>cValor estimado X z</p><p>n</p><p>σ</p><p>= ± ×</p><p>Intervalo de confiança para as proporções:</p><p>( )</p><p>c</p><p>p 1 p</p><p>Valor estimado p z</p><p>n</p><p>−</p><p>= ± ×</p><p>Intervalo de confiança para a soma de médias:</p><p>( )</p><p>2 2</p><p>A B</p><p>A B c</p><p>A B</p><p>Valor estimado X X z</p><p>n n</p><p>σ σ</p><p>= + ± × +</p><p>Unidade II</p><p>58</p><p>Intervalo de confiança para as diferenças de médias:</p><p>( )</p><p>2 2</p><p>A B</p><p>A B c</p><p>A B</p><p>Valor estimado X X z</p><p>n n</p><p>σ σ</p><p>= − ± × +</p><p>Intervalo de confiança para a soma das proporções:</p><p>( ) ( ) ( )A A B B</p><p>A B c</p><p>A B</p><p>p 1 p p 1 p</p><p>Valor estimado p p z</p><p>n n</p><p>− −</p><p>= + ± × +</p><p>Intervalo de confiança para as diferenças das proporções:</p><p>( ) ( ) ( )A A B B</p><p>A B c</p><p>A B</p><p>p 1 p p 1 p</p><p>Valor estimado p p z</p><p>n n</p><p>− −</p><p>= − ± × +</p><p>Alguns exemplos facilitarão o entendimento da teoria apresentada.</p><p>Exemplo 1: um auditor contábil separou aleatoriamente uma amostra de 45 contas pagas</p><p>por uma empresa e encontrou um valor médio para elas de R$ 14.900,00 com desvio padrão de</p><p>R$ 3.600,00. Baseando-se nesses valores, qual foi o valor estimado para a média populacional,</p><p>com 95% de confiabilidade?</p><p>Resolução:</p><p>A estimativa para a média é dada por:</p><p>cValor estimado X z</p><p>n</p><p>σ</p><p>= ± ×</p><p>Para se fazer essa estimativa, precisamos das seguintes informações:</p><p>• Média: X 14.900,00=</p><p>• Valor crítico: zc = 1,96, conforme o seguinte cálculo:</p><p>tab c</p><p>1 confiabilidade 1 0,95</p><p>A 0,0250 z 1,96 z 1,96</p><p>2 2</p><p>− −</p><p>= = = → = − → =</p><p>• Desvio padrão: σ = s = 3600</p><p>ESTATÍSTICA APLICADA</p><p>59</p><p>• Tamanho da amostra: 45</p><p>c</p><p>3600</p><p>Valor estimado X z 14900 1,96 Valor estimado 14.900,00 1.052,00</p><p>n 45</p><p>σ</p><p>= ± × = ± × → = ±</p><p>Baseado nesse cálculo e nessa amostra, nós podemos dizer que se estima que as contas dessa</p><p>empresa tenham um valor médio entre R$ 13.848,00 e R$ 15.952,00 com 95% de certeza.</p><p>Exemplo 2: uma pesquisa eleitoral feita com 2.500 eleitores revelou que o candidato A tinha 45%</p><p>de intenções de voto para determinado cargo eletivo. Qual a estimativa da votação que esse candidato</p><p>teria se a eleição fosse hoje, com 99% de confiabilidade?</p><p>Resolução:</p><p>A estimativa para a proporção é dada por:</p><p>( )</p><p>c</p><p>p 1 p</p><p>Valor estimado p z</p><p>n</p><p>−</p><p>= ± ×</p><p>Para se fazer essa estimativa, precisamos das seguintes informações:</p><p>• Proporção: p = 0,45</p><p>• Valor crítico: zc = 2,58, conforme o seguinte cálculo:</p><p>tab c</p><p>1 confiabilidade 1 0,99</p><p>A 0,0050 z 2,58 z 2,58</p><p>2 2</p><p>− −</p><p>= = = → = − → =</p><p>• Tamanho da amostra: n = 2500</p><p>( ) ( )</p><p>c</p><p>p 1 p 0,45 1 0,45</p><p>Valor estimado p z 0,45 2,58</p><p>n 2500</p><p>0,45 0,026 ou valor estimado 45% 2,6%</p><p>− −</p><p>= ± × = ± × =</p><p>± = ±</p><p>Desse modo, podemos afirmar que, se a eleição fosse hoje, o candidato A teria 45% dos votos, com</p><p>uma margem de erro, para mais ou para menos, de 2,6%, com 99% de confiabilidade, ou então dizer que</p><p>temos 99% de certeza de que ele teria entre 42,4% e 47,6% dos votos.</p><p>Exemplo 3: uma amostra de 300 lâmpadas da marca A apresentou uma durabilidade média de 2.300</p><p>horas, com desvio padrão de 200 horas. Outra amostra de 150 lâmpadas da marca B apresentou vida útil</p><p>de 2.000 horas, com desvio padrão de 90 horas. Estime com 90% de confiabilidade a diferença entre as</p><p>vidas úteis de ambas as marcas de lâmpadas.</p><p>Unidade II</p><p>60</p><p>Resolução:</p><p>A estimativa para a diferença de médias é dada por:</p><p>( )</p><p>2 2</p><p>A B</p><p>A B c</p><p>A B</p><p>Valor estimado X X z</p><p>n n</p><p>σ σ</p><p>= − ± × +</p><p>Para se fazer essa estimativa, precisamos das seguintes informações:</p><p>• Médias: A BX 2300 e X 2000= =</p><p>• Valor crítico: zc = 1,64, conforme o seguinte cálculo:</p><p>tab c</p><p>1 confiabilidade 1 0,90</p><p>A 0,0500 z 1,64 z 1,64</p><p>2 2</p><p>− −</p><p>= = = → = − → =</p><p>• Desvios padrões: σA = sA = 200; σB = sB = 90</p><p>• Tamanhos das amostras: nA = 300; nB = 150</p><p>( )</p><p>( )</p><p>2 2</p><p>A B</p><p>A B c</p><p>A B</p><p>2 2</p><p>Valor estimado X X z</p><p>n n</p><p>200 90</p><p>2300 2000 1,64 Valor estimado 300 22,4</p><p>300 150</p><p>σ σ</p><p>= − ± × +</p><p>= − ± × + → = ±</p><p>Isso significa que podemos ter 90% de confiança de que a diferença entre as vidas úteis das lâmpadas</p><p>das duas marcas está entre 277,6 horas e 322,4 horas.</p><p>Exemplo 4: uma amostra aleatória, com 250 homens e 320 mulheres, revelou que 150 dos homens e</p><p>240 das mulheres apreciaram o design de um novo modelo de automóvel. Estime com 98% de confiabilidade</p><p>a diferença entre a proporção de todos os homens e mulheres em relação a esse novo automóvel.</p><p>Resolução:</p><p>A estimativa para a diferença de proporções é dada por:</p><p>( ) ( ) ( )A A B B</p><p>A B c</p><p>A B</p><p>p 1 p p 1 p</p><p>Valor estimado p p z</p><p>n n</p><p>− −</p><p>= − ± × +</p><p>ESTATÍSTICA APLICADA</p><p>61</p><p>Para se fazer essa estimativa, precisamos das seguintes informações:</p><p>• Proporções:</p><p>H M</p><p>150 240</p><p>p 0,6 e p 0,75</p><p>250 320</p><p>= = = =</p><p>• Valor crítico: zc = 2,33, conforme o seguinte cálculo:</p><p>tab c</p><p>1 confiabilidade 1 0,98</p><p>A 0,0100 z 2,33 z 2,33</p><p>2 2</p><p>− −</p><p>= = = → = − → =</p><p>• Tamanho da amostra: nH = 250; nM = 320</p><p>( ) ( ) ( )</p><p>( ) ( ) ( )</p><p>M M H H</p><p>M H c</p><p>M H</p><p>p 1 p p 1 p</p><p>Valor estimado p p z</p><p>n n</p><p>0,75 1 0,75 0,60 1 0,60</p><p>0,75 0,60 2,33 0,15 0,092 ou 1 5% 9,2%</p><p>320 250</p><p>− −</p><p>= − ± × +</p><p>− −</p><p>= − ± × + = ± ±</p><p>Estima-se que 15% a mais de mulheres do que homens gostem do design desse automóvel, com</p><p>uma margem de erro de 9,2% e uma confiabilidade de 98% –, ou em outras palavras, a diferença entre</p><p>mulheres e homens nesse aspecto está entre 5,8% e 24,2%, com 98% de certeza.</p><p>Grande parte das utilizações práticas desses conceitos envolve o cálculo do tamanho da amostra</p><p>necessária para se atender a determinadas condições estatísticas. O raciocínio é o mesmo dos casos</p><p>anteriores, invertendo-se, no entanto, a incógnita procurada. As questões seguintes</p><p>demonstram</p><p>esse equacionamento.</p><p>Exemplo 5: um analista de treinamento deseja estimar o tempo de treinamento em horas para</p><p>determinado cargo com uma confiabilidade de 95% e erro esperado de 2 horas. Baseado em estudos</p><p>anteriores, ele estima o desvio padrão das horas gastas em treinamento em 18 horas. Qual é o tamanho</p><p>de amostra com que deve trabalhar?</p><p>Resolução:</p><p>Observe que o erro esperado, ou margem de erro, é dado por:</p><p>cerro esperado z</p><p>n</p><p>σ</p><p>= ×</p><p>Unidade II</p><p>62</p><p>Para se fazer essa estimativa, precisamos das seguintes informações:</p><p>• Valor crítico: zc = 1,96, conforme o seguinte cálculo:</p><p>tab c</p><p>1 confiabilidade 1 0,95</p><p>A 0,0250 z 1,96 z 1,96</p><p>2 2</p><p>− −</p><p>= = = → = − → =</p><p>• Desvio padrão: σ = s = 18 horas</p><p>• Erro esperado desejável: 2 horas</p><p>2</p><p>c</p><p>18 18 18</p><p>erro esperado z 2 1,96 n 1,96 n 1,96 n 312</p><p>2 2n n</p><p>σ = × → = × → = × → = × → = </p><p> </p><p>Baseado nesse cálculo, concluímos que o analista deve trabalhar com uma amostra de 312 elementos.</p><p>Observação</p><p>O cálculo feito na verdade resulta em 311,17, mas como não existe fração</p><p>de elemento e estamos trabalhando a favor da segurança, arredondaremos</p><p>para cima, nesses casos.</p><p>Exemplo 6: uma pesquisa com amostra de 100 consumidores detectou que 40% deles preferiam</p><p>o sabão em pó Lavafacil, em vez de qualquer outra marca. Ao se estimar o comportamento de toda a</p><p>população, com uma confiabilidade de 95%, chegou-se a uma margem de erro inconveniente. O cliente</p><p>da pesquisa deseja que a estimativa seja feita com um erro de no máximo 5%, mantida a confiabilidade.</p><p>Dessa forma, mais quantos consumidores devem ser pesquisados para atender o estabelecido, supondo</p><p>que a proporção de consumidores de Lavafacil permanecesse constante?</p><p>Resolução:</p><p>Observe que o erro esperado, ou margem de erro, é dado por:</p><p>( )</p><p>c</p><p>p 1 p</p><p>erro esperado z</p><p>n</p><p>−</p><p>= ×</p><p>Para se fazer essa estimativa, precisamos das seguintes informações:</p><p>• Erro esperado estabelecido, ou margem de erro: 5% ou 0,05.</p><p>ESTATÍSTICA APLICADA</p><p>63</p><p>• Confiabilidade: zc = 1,96</p><p>tab c</p><p>1 confiabilidade 1 0,95</p><p>A 0,0250 z 1,96 z 1,96</p><p>2 2</p><p>− −</p><p>= = = → = − → =</p><p>• Proporção de consumidores que preferem Lavafacil: 0,4</p><p>( ) ( )</p><p>c</p><p>2</p><p>2</p><p>p 1 p 0,4 1 0.4 0,05 0,24</p><p>erro esperado z 0,05 1,96</p><p>n n 1,96 n</p><p>0,05 0,24 0,24</p><p>n n 369 consumidores</p><p>1,96 n 0,05</p><p>1,96</p><p>− −</p><p>= × → = × → =</p><p> → = → = → = </p><p> </p><p> </p><p> </p><p>Como já foram entrevistados 100 consumidores, precisaríamos entrevistar mais 269 consumidores</p><p>(369 - 100 = 269).</p><p>Observação</p><p>Constantemente, no cálculo do tamanho da amostra para uma</p><p>estimativa de proporções, não se conhece o valor da proporção (p). Nesse</p><p>caso, utilizamos p = 0,5, porque esse é o valor para o qual ocorre o maior</p><p>erro padrão, portanto, gera as amostras de maior tamanho, o que favorece</p><p>a segurança do cálculo. Utilizando essa diretriz no exemplo, chegaríamos a</p><p>385 entrevistados em vez de 369.</p><p>Exemplo 7: um engenheiro deseja avaliar a diferença entre duas marcas distintas de cabos de aço e</p><p>para tanto ensaiou uma amostra de 64 cabos de cada marca, chegando aos valores a seguir:</p><p>Tabela 8</p><p>Cabos Resistência média em kgf Desvio padrão da resistência média em kgf</p><p>Marca A 1635 125</p><p>Marca B 1284 93</p><p>Ao fazer uma estimativa das diferenças de resistência média de todos os cabos de cada uma das</p><p>duas marcas, chegou a 99% de confiabilidade e percebeu que a margem de erro que não o agradava.</p><p>Ele deseja reduzir essa margem de erro em 20 kgf. Quantos cabos a mais ele deverá ensaiar?</p><p>Unidade II</p><p>64</p><p>Resolução:</p><p>A estimativa inicial feita pelo engenheiro foi de 351 kgf ± 49,7 kgf a favor dos cabos da marca A.</p><p>( )</p><p>( )</p><p>2 2</p><p>A B</p><p>A B c</p><p>A B</p><p>2 2</p><p>Valor estimado X X z</p><p>n n</p><p>125 93</p><p>1635 1284 2,57 Valor estimado 351 50</p><p>64 64</p><p>σ σ</p><p>= − ± × +</p><p>= − ± × + → = ±</p><p>Sendo:</p><p>tab c</p><p>1 confiabilidade 1 0,99</p><p>A 0,0050 z 2,57 z 2,57</p><p>2 2</p><p>− −</p><p>= = = → = − → =</p><p>Como ele deseja reduzir essa margem de erro em 20 kgf, o erro esperado deverá baixar para 30 kgf, logo:</p><p>2 2 2 2</p><p>A B</p><p>c</p><p>A B</p><p>2</p><p>2</p><p>125 93</p><p>erro esperado z 30 2,57 30</p><p>n n n n</p><p>24274 30 24274 30 24274 24274</p><p>2,57 n n 179 cabos</p><p>n 2,57 n 2,57 n 30</p><p>2,57</p><p>σ σ</p><p>= × + → = × + →</p><p> = × → = → = → = → = </p><p> </p><p> </p><p> </p><p>Como já foram ensaiados 64 cabos, o engenheiro precisaria ensaiar mais 115 cabos (179 - 64 = 115).</p><p>Exemplo 8: uma amostra de 20 baterias elétricas para uso em tablets revelou uma vida útil média</p><p>de 30.000 horas com desvio padrão de 2.600 horas. Baseado nesses dados, um técnico estimou que as</p><p>baterias desse tipo tivessem uma vida útil de 30.000±744 horas. Qual a confiabilidade dessa estimativa?</p><p>Resolução:</p><p>O erro esperado ou margem de erro é dado por:</p><p>cerro esperado z</p><p>n</p><p>σ</p><p>= ×</p><p>Sabemos que o erro da estimativa é igual a 744 horas, que o desvio padrão da amostra foi de</p><p>2.600 horas e que o tamanho da amostra é de 20 baterias. Com esses dados conseguimos determinar</p><p>o valor de zc.</p><p>ESTATÍSTICA APLICADA</p><p>65</p><p>cerro esperado z 744</p><p>n</p><p>σ</p><p>= × →</p><p>c c</p><p>2600</p><p>z z</p><p>20</p><p>= × →</p><p>c</p><p>744</p><p>z 1,28</p><p>2600</p><p>20</p><p>= → =</p><p>Invertendo o raciocínio que utilizamos anteriormente para determinar o valor crítico (zc), obteremos</p><p>o valor da confiabilidade da amostra, como mostra a figura a seguir.</p><p>Z</p><p>P(z)</p><p>-1,28</p><p>Área tabelada</p><p>0,1003 ou 10,03% Área tabelada</p><p>0,1003 ou 10,03%</p><p>Confiabilidade = 1 - (2 x 0,1003) =</p><p>0,7994 ≅ 0,80 ou 80%</p><p>1,28</p><p>Figura 16</p><p>Podemos então afirmar que o técnico tem 80% de confiança na estimativa que fez.</p><p>Exemplo 9: às vésperas de uma eleição, um importante órgão da mídia informou que, se a eleição</p><p>fosse naquele momento, o candidato João Honesto venceria com 42% dos votos. Afirmou também que</p><p>a pesquisa havia sido feita com 2.000 eleitores e que a margem de erro era de 1% para mais ou para</p><p>menos. Qual a confiabilidade que essa informação tem?</p><p>Resolução:</p><p>A margem de erro é dada por:</p><p>Unidade II</p><p>66</p><p>( )</p><p>c</p><p>p 1 p</p><p>erro esperado z</p><p>n</p><p>−</p><p>= ×</p><p>Temos informado que a margem de erro é de 1%, que o candidato teve 42% dos votos na amostra</p><p>e que o seu tamanho era de 2.000 eleitores. Logo:</p><p>( ) ( )</p><p>( )c c c</p><p>p 1 p 0,42 1 0,42 0,01</p><p>erro esperado z 0,01 z z 0,91</p><p>n 2000 0,42 1 0,42</p><p>2000</p><p>− −</p><p>= × → = × → = =</p><p>−</p><p>Reproduzindo o raciocínio do exemplo 6 definimos que o valor da confiabilidade da informação é</p><p>de apenas 63,72%:</p><p>( )c tabz 0,91 z 0,91 A 0,1814 Confiabilidade 1 2 0,1814 0,6372 ou 63,72%= → = − → = → = − × =</p><p>Exemplo 10: uma pesquisa de mercado pegou amostras do salário de funcionários de duas empresas</p><p>concorrentes, chegando aos valores a seguir:</p><p>Tabela 9</p><p>Empresa Tamanho da amostra</p><p>tomada Salário médio da amostra Desvio padrão dos</p><p>salários médios</p><p>ABC 120 R$ 3.850,00 R$ 850,00</p><p>WXY 165 R$ 4.020,00 R$ 1.018,00</p><p>A partir desses dados, um analista estimou que a diferença salarial entre as duas empresas seria de</p><p>R$ 170,00 ± R$ 166,00. Qual é a confiança que podemos ter nessa estimativa?</p><p>Resolução:</p><p>O erro esperado para a estimativa da diferença de médias é dado por:</p><p>2 2</p><p>A B</p><p>c</p><p>A B</p><p>Erro esperado z</p><p>n n</p><p>σ σ</p><p>= × +</p><p>Logo, nesse caso, teríamos:</p><p>2 2 2 2</p><p>A B</p><p>c c c c</p><p>A B</p><p>850 1018 166</p><p>Erro esperado z 166 z 166 z 111 z 1,50</p><p>n n 120 165 111</p><p>σ σ</p><p>= × + → = × + → = × → == =</p><p>( )c tabz 1,50 z 1,50 A 0,0668 Confiabilidade 1 2 0,0668 0,8664 ou 86,64%= → = − → = → = − × =</p><p>ESTATÍSTICA APLICADA</p><p>67</p><p>A estimativa apresenta uma confiabilidade de 86,64%.</p><p>Exemplo 11: às vésperas de uma importante eleição foi feita uma pesquisa com 4.866 eleitores</p><p>que revelou uma polarização entre dois candidatos. O candidato A teria 48,7% das intenções de votos,</p><p>enquanto o candidato B ficaria com 46,1% dos votos. Um importante jornal decide “cacifar” o resultado</p><p>e coloca na manchete do dia da eleição que o Candidato A será eleito. Considerando que não ocorram</p><p>variações nas intenções de votos, qual é a confiabilidade que o jornal tem dessa informação?</p><p>Resolução:</p><p>Caso consideremos a estimativa por pontos, o candidato A evidentemente ganharia, pois teria 2,6%</p><p>de votos a mais, mas vimos que isso não seria preciso. Ambas as votações têm variações, portanto,</p><p>precisamos considerá-las.</p><p>Irá ganhar a eleição o candidato que tiver um voto a mais do que o outro, ou seja,</p><p>a diferença entre</p><p>eles deverá ser superior a 0%. A estimativa da diferença das proporções é dada por:</p><p>( ) ( ) ( )A A B B</p><p>A B c</p><p>A B</p><p>p 1 p p 1 p</p><p>Valor estimado p p z</p><p>n n</p><p>− −</p><p>= − ± × +</p><p>( ) ( ) ( )</p><p>c</p><p>0,487 1 0,487 0,461 1 0,461</p><p>Valor estimado 0,487 0,461 z</p><p>4866 4866</p><p>− −</p><p>= − ± × +</p><p>( ) cValor estimado 0,0260 z 0,0101= ± ×</p><p>Perceba que o candidato A deverá ter 2,6% mais ou menos uma variação. Ele ganhará a eleição se</p><p>tiver mais 0% dos votos, ou seja, se a margem de erro for abaixo de 2,6%, ele vence. Em outras palavras,</p><p>o valor estimado para a diferença das votações deve ser acima de 0%, e como temos:</p><p>( ) cValor estimado 0,0260 z 0,0101= ± × , podemos estabelecer que, no limite:</p><p>( ) c c0 0,0260 z 0,0101 0,0260 z 0,0101= − × →− = − × →</p><p>c c</p><p>0,0260</p><p>multiplicando por menos 1 0,0260 z 0,0101 z 2,57</p><p>0,0101</p><p>→+ = + × → = =</p><p>( )c tabz 2,57 z 2,57 A 0,0051 Confiabilidade 1 2 0,0051 0,9898 ou 98,98%= → = − → = → = − × =</p><p>Unidade II</p><p>68</p><p>Esse cálculo, no entanto, tem uma imprecisão conceitual. Veja a figura a seguir:</p><p>Z</p><p>P(z)</p><p>-2,57</p><p>Probabilidade de o candidato B</p><p>ter mais votos que o candidato A</p><p>Probabilidade de o candidato A ter acima</p><p>de 2,6 dos votos que o candidato B</p><p>Confiabilidade calculada: 99%</p><p>2,57</p><p>Figura 17</p><p>Perceba que a confiabilidade calculada de 99% exclui duas áreas na cauda da curva normal.</p><p>A área da esquerda realmente tem que ser excluída, visto ser a área na qual o candidato B vence</p><p>e, portanto, a estimativa do jornal estaria errada. Mas a área à direita não tem motivo para ser</p><p>excluída, visto que ela se refere à vitória ainda mais expressiva do candidato A, portanto, a favor</p><p>da previsão do jornal.</p><p>A confiabilidade é calculada em um conceito conhecido como bicaudal, ou seja, caudas de exceção</p><p>de ambos os lados da curva. O nosso problema é de um tipo diferente, o unicaudal. Só faz sentido de um</p><p>dos lados da curva, no exemplo, à esquerda.</p><p>Assim, o jornal estaria correto em todos os casos, com exceção das ocorrências da cauda esquerda,</p><p>ou seja, a confiança que ele tem na manchete é dada pela confiabilidade calculada mais a cauda da</p><p>direita, portanto, 99,49% (0,9898+0,0051).</p><p>Saiba mais</p><p>Pesquisas eleitorais talvez sejam as aplicações mais rotineiras da</p><p>estimação de resultados. É possível verificar muitas dessas previsões e os</p><p>efetivos resultados das eleições, acessando:</p><p>PODER 360. Publicações por Fernando Rodrigues. [on-line]: [s.d.].</p><p>Disponível em: <https://www.poder360.com.br/author/fernando-rodrigues/>.</p><p>Acesso em: 13 jun. 2019.</p><p>ESTATÍSTICA APLICADA</p><p>69</p><p>6 TEORIA DA DECISÃO ESTATÍSTICA</p><p>Quando trabalhamos no terreno das probabilidades, é inevitável aceitar uma variação em torno</p><p>dos valores reais ou esperados. Por exemplo, ao jogarmos certo número de vezes uma moeda honesta</p><p>(não viciada), o esperado é que em metade das vezes saia cara e na outra metade, coroa. Portanto, se</p><p>jogarmos uma moeda honesta 50 vezes, imaginamos que em 25 delas saia cara. E se saírem 26 caras?</p><p>Provavelmente a moeda é honesta e por casualidade saiu uma cara a mais.</p><p>Mas e se saírem 30 caras? Ainda poderemos dizer que a moeda é honesta? Uma variação dessas é</p><p>aceita como uma casualidade? Ou existe uma causa para saírem mais caras (a moeda ser viciada)?</p><p>Precisamos decidir isso.</p><p>Observação</p><p>Fisicamente, o peso de uma moeda deve ser distribuído de modo</p><p>uniforme para que ela seja aleatória, ou seja, não tenha tendência de cair de</p><p>um dos lados. Caso isso não ocorra, porque, por exemplo, colocou-se de um</p><p>lado um pequeno e pouco visível peso, a moeda passa a ter a tendência de</p><p>cair com esse lado mais pesado para baixo, ficando viciada. A probabilidade</p><p>de a face mais leve ser sorteada será maior do que 50%.</p><p>Consideramos que uma pequena variação a mais de caras ou coroas acima ou abaixo dos 50%</p><p>é devido à aleatoriedade. Nesse caso, a diferença seria casual, ocasionada pela aleatoriedade do</p><p>experimento. Todavia, além de um dado ponto, essas desproporções deixam de ser casuais e se tornam</p><p>causais. Ocorrem pela disparidade de peso entre as faces da moeda.</p><p>Decidir quando ocorre um ou outro fato nos leva ao terreno da Teoria da Decisão Estatística, a</p><p>terceira e última abordagem da amostragem.</p><p>Essa teoria é especialmente útil quando precisamos nos decidir sobre populações a partir de</p><p>amostras delas retiradas. Por exemplo, decidir, entre duas campanhas publicitárias, qual é a mais eficaz,</p><p>ou, entre dois processos produtivos, qual é o mais eficiente, ou, entre dois produtos similares, qual tem</p><p>melhor desempenho, ou, ainda, se uma moeda é viciada ou não.</p><p>Vamos iniciar nosso estudo pela decisão de se uma moeda é honesta ou viciada. Suponha que você</p><p>tenha na mão uma moeda e não consiga determinar, visualmente, se ela é honesta ou viciada. A única</p><p>maneira de se chegar a uma conclusão é testar a referida moeda e, a partir dos resultados, decidir se ela</p><p>é viciada ou não.</p><p>Perceba que existem duas hipóteses, ou a moeda é honesta ou é viciada. A hipótese de que ela seja</p><p>honesta é o que se chama de hipótese nula e é simbolizada por H0. Assume-se essa possibilidade muitas</p><p>vezes para desmenti-la. Caso estivéssemos analisando a eficiência de dois processos, por exemplo,</p><p>formularíamos como hipótese H0 não existir diferença entre ambos.</p><p>Unidade II</p><p>70</p><p>Qualquer hipótese que não seja a zero é chamada de hipótese alternativa e simbolizada por H1.</p><p>Assim sendo, no caso de ela ser honesta, tanto a probabilidade de sair cara como de sair coroa é igual</p><p>a 0,5, é a hipótese nula (p=0,5). Qualquer ocorrência diferente (p≠0,5) é considerada hipótese alternativa.</p><p>Imaginemos que uma moeda seja jogada 100 vezes e queiramos saber se ela é viciada ou não. Vimos</p><p>anteriormente que as estatísticas esperadas são:</p><p>Valor esperado = média populacional = média amostral = np = 100 x 0,5 = 50 caras ou 50 coroas</p><p>Desvio padrão da média populacional = ( ) ( )Desvio padrão da média populacional n p 1 p 100 0,5 1 0,5 5 caras ou 5 coroas= × × − = × × − = = 5 caras ou 5 coroas</p><p>Como o tamanho da amostra é maior que 30 (n≥30) e o número esperado de caras ou de coroas é maior</p><p>que 5 (npcara = npcoroa = 100 x 0,5 = 50), podemos usar a aproximação da binomial pela distribuição normal.</p><p>Observação</p><p>Jogar uma moeda envolve uma distribuição binomial, para variáveis</p><p>discretas, mas podemos usar a aproximação para a normal sempre que n ≥ 30</p><p>e np ≥ 5. Como vimos, são recomendações dadas por vários estatísticos,</p><p>entre eles Murray Siegel.</p><p>Utilizando a distribuição normal, podemos afirmar que é impossível lançar 100 vezes uma moeda</p><p>honesta e ter menos de 30 caras ou de 30 coroas – e, consequentemente, mais de 70 coroas ou de 70 caras.</p><p>A figura a seguir relembra esse conceito:</p><p>Z</p><p>P(z)</p><p>100,0%</p><p>50 - 4 x 5 = 30 50 + 4 x 5 = 70</p><p>σ = 5</p><p>-4σ -3σ -2σ -1σ µ= 50 1σ 2σ 3σ 4σ</p><p>Figura 18</p><p>ESTATÍSTICA APLICADA</p><p>71</p><p>Portanto, se ao coletarmos uma amostra de 100 jogadas dessa moeda saírem mais do que 70 caras</p><p>(e, consequentemente, menos do que 30 coroas) ou mais do que 70 coroas (e, consequentemente,</p><p>menos do que 30 caras), a moeda será viciada, nos casos contrários ela será honesta.</p><p>Perceba que essa afirmação tem 100% de confiabilidade, já que abrange toda a curva normal.</p><p>Mas já vimos que esse nível não é muito utilizado na prática. Normalmente, se usam níveis menores</p><p>de confiabilidade, por exemplo, 95%. Isso porque quanto maior o nível de confiabilidade, mais custo</p><p>teremos para obtermos uma precisão adequada. Note que aceitar como honesta uma moeda com toda</p><p>essa variação (entre 30 e 70 caras ou coroas) na prática é pouco interessante.</p><p>Iremos trabalhar com menores confiabilidades, por exemplo, 95%. Graficamente teremos:</p><p>Z</p><p>P(z)</p><p>-1,96</p><p>Região crítica</p><p>2,5%</p><p>Região crítica</p><p>2,5%</p><p>95%</p><p>+1,96</p><p>Figura 19</p><p>tab c</p><p>1 confiabilidade 1 0,95</p><p>A 0,0250 z 1,96 z 1,96</p><p>2 2</p><p>− −</p><p>= = = → = − → =</p><p>Com 95% de confiança, afirmamos que a moeda será honesta caso em uma amostra de 100 jogadas</p><p>não se obtenha mais de 60 caras ou coroas ou menos do que</p><p>40 caras ou coroas:</p><p>cX z X 50 1,96 5 40 e X 50 1,96 5 60 = µ ± ×σ→ = + × = = − × =</p><p>Resumindo, caso ao jogarmos 100 vezes a moeda obtenhamos entre 40 e 60 caras ou coroas,</p><p>assumimos que ela é honesta, caso contrário, entendemos que a moeda é viciada. Perceba que os valores</p><p>que correspondem à moeda ser viciada estão nas áreas sombreadas do gráfico, chamadas de região</p><p>crítica. Resultados nessas áreas expressam que existem diferenças observadas significativas, o que nos</p><p>leva a rejeitar a hipótese nula (H0).</p><p>Unidade II</p><p>72</p><p>Essa regra que estabelecemos (aceitarmos a hipótese zero se o número de caras ou coroas estiver</p><p>entre 40 e 60 e rejeitarmos nos casos contrários) é nomeada como teste de hipóteses ou regra de</p><p>decisão ou ainda teste de significância.</p><p>Perceba que essas regras de decisão são sujeitas a incertezas, como todas as estimativas estatísticas.</p><p>Nesse assunto estamos sujeitos a dois tipos de erros.</p><p>Podemos aceitar como falsa uma hipótese verdadeira, ou seja, rejeitarmos uma situação que deveria ser</p><p>aceita. No nosso exemplo, acharmos que é viciada uma moeda honesta. Esse é o chamado erro do tipo I.</p><p>E, ao contrário, podemos aceitar como verdadeira uma hipótese falsa, ou seja, aceitarmos um evento</p><p>que deveria ser rejeitado. No nosso modelo, considerarmos que é honesta uma moeda viciada. Esse é o</p><p>chamado erro do tipo II.</p><p>Em ambos os casos, teríamos incorrido em decisões erradas ou em um erro de julgamento.</p><p>Um teste de hipóteses deve ser planejado para apresentar os menores erros possíveis, seja</p><p>do tipo I ou do tipo II. O problema é que isso não é uma tarefa elementar. Mantido o tamanho</p><p>da amostra, se nós diminuirmos o erro de um tipo, nós aumentamos o erro do outro. Reduzir</p><p>os dois erros simultaneamente implica acréscimo do tamanho da amostra e, por consequência,</p><p>nos acréscimos de custo já discutidos anteriormente.</p><p>Na prática verificamos qual o tipo de erro mais importante e focamos nele nossos esforços de</p><p>redução. Nesse caso, o que é pior, aceitar uma moeda honesta como viciada ou outra como honesta?</p><p>Da nossa decisão sairá o foco da redução do tipo de erro. Via de regra os erros do tipo I são mais</p><p>importantes e normalmente objeto de tentativa de redução.</p><p>Quando fixamos, como fizemos agora há pouco, um nível de confiabilidade, assumimos um risco de</p><p>ocorrência de erro do tipo I. Nesse caso, nosso nível de confiabilidade foi de 95%, portanto, temos um</p><p>risco de 5% de ocorrerem erros do tipo I. Em outras palavras, se fizermos com essa moeda 100 testes</p><p>e em cada um jogarmos a moeda 100 vezes, em 5 desses testes o resultado cairá na zona sombreada,</p><p>causando um erro do tipo I.</p><p>A esse risco máximo damos o nome de nível de significância do teste (simbolizado normalmente</p><p>por α). Na prática, utilizamos níveis de significância de 0,05 (5%) ou 0,01 (1%), mas qualquer outro nível</p><p>pode ser utilizado.</p><p>Assim sendo, se adotamos um nível de significância de 0,05 ou 5%, quer dizer que há cerca de 5 chances</p><p>em 100 de a hipótese ser rejeitada quando deveria ser aceita; em outras palavras, temos 95% de</p><p>confiança na nossa decisão.</p><p>Suponha que tenhamos obtido uma amostra com 38 caras (e, claro, 62 coroas). Diríamos que a hipótese</p><p>de a moeda ser honesta foi rejeitada no nível de significância 0,05. Haveria, portanto, a probabilidade de</p><p>erro tipo I de 5%.</p><p>ESTATÍSTICA APLICADA</p><p>73</p><p>Observação</p><p>Perceba que o nível de significância e o nível de confiabilidade são</p><p>complementares. A soma dos dois sempre será sempre igual a 1 ou 100%.</p><p>Agora, imagine que tenhamos obtido uma amostra com 42 caras e, portanto, com 58 coroas. Pela</p><p>regra de decisão que estabelecemos (moeda é honesta caso saiam entre 40 e 60 caras ou coroas),</p><p>aceitamos que a moeda é honesta, mas podemos estar incorrendo em um erro do tipo II.</p><p>Comete-se um erro do tipo II quando se aceita uma hipótese que deveria ser rejeitada. Para evitá-lo,</p><p>em vez de aceitá-la, simplesmente não a rejeitamos, o que significa que não estaríamos tomando</p><p>qualquer decisão a respeito.</p><p>Poderíamos então redigir a regra de decisão da seguinte forma para evitar um erro do tipo: se o</p><p>número de caras ou coras estiver entre 40 e 60, não rejeitaremos a hipótese, caso contrário o faremos.</p><p>Perceba que aceitar a hipótese é diferente de não a rejeitar. Não rejeitar é uma não decisão.</p><p>Na prática, no entanto, muitas vezes é necessário definir se uma hipótese deverá ser aceita ou não.</p><p>Isso requer um estudo mais completo dos erros tipo II que faremos posteriormente.</p><p>Existem, portanto, quatro resultados possíveis em um teste de hipóteses:</p><p>Tabela 10</p><p>Hipótese H0</p><p>Decisão Verdadeira Falsa</p><p>Não rejeitar H0 Decisão correta Erro tipo II</p><p>Rejeitar H0 Erro tipo I Decisão correta</p><p>Um exemplo deixa mais claro todo o processo.</p><p>No processo de negociação de uma nova máquina automática o fornecedor informa à</p><p>empresa compradora que a produtividade dela é de 260 toneladas por hora com um desvio</p><p>padrão de 43 toneladas por hora. O comprador decide verificar a veracidade da informação</p><p>para aceitar ou não essa afirmação, e consequentemente adquirir ou não a máquina, e para</p><p>tanto efetua uma amostragem com 36 observações. Para essa amostra, a produtividade média</p><p>observada foi de 240 toneladas por hora. Estabeleça para esses dados:</p><p>• Quais as hipóteses possíveis?</p><p>• Qual o nível de significância que o estudo irá utilizar?</p><p>Unidade II</p><p>74</p><p>• Quais os valores críticos de teste, ou em outras palavras, qual a regra de decisão?</p><p>• Qual a decisão a ser tomada?</p><p>• Quais os riscos desta tomada de decisão?</p><p>Lembrete</p><p>A distribuição normal de probabilidades pode ser utilizada para testar</p><p>um valor hipotético quando n≥30 ou caso n<30 apenas se a população for</p><p>normalmente distribuída.</p><p>Existem duas hipóteses possíveis. A hipótese nula é que o valor da produtividade média seja</p><p>efetivamente de 260 t/h (H0: µ=260) e a hipótese alternativa é a de que a produtividade seja diferente</p><p>de 260 t/h (H1: µ≠260).</p><p>Em tese, qualquer nível de significância pode ser utilizado. Os mais usados são 0,01 e 0,05. Vamos</p><p>utilizar no exemplo esse último.</p><p>tab c</p><p>1 confiabilidade significância 0,05</p><p>A 0,0250 z 1,96 z 1,96</p><p>2 2 2</p><p>−</p><p>= = = = → = − → =</p><p>Observe que a estatística de teste que iremos usar é a média (produtividade média). Dessa forma, o</p><p>valor esperado é de 260 t/h ( Xµ ) e como estamos falando de uma amostra de 36 observações (n) e de</p><p>um desvio padrão populacional de 43 t/h (σ), os valores críticos da média da amostra seriam:</p><p>crítico cX</p><p>43</p><p>x z 260 1,96 260,00 14,05</p><p>n 36</p><p>σ</p><p>= µ ± × = ± = ±</p><p>A regra de decisão será a seguinte:</p><p>• Aceita-se que o fornecedor informou corretamente a produtividade da máquina se a amostra</p><p>estiver com valores entre 245,95 e 274,05 t/h.</p><p>• Rejeita-se a informação do fornecedor se a amostra estiver fora dos limites mencionados.</p><p>Resumindo, aceitamos que a produtividade média da máquina é de 260 t/h, com significância de</p><p>5%, caso uma amostra de 36 observações apresente resultados entre 245,95 e 274,05 t/h.</p><p>A amostra coletada apresentou um valor médio para a produtividade de 240 t/h, fora dos limites</p><p>estabelecidos, portanto, nossa decisão seria rejeitar a hipótese H0 e aceitar a hipótese alternativa H1.</p><p>Isso significa que não aceitamos a informação do fornecedor porque a produtividade média da máquina</p><p>seja igual a 260 t/h.</p><p>ESTATÍSTICA APLICADA</p><p>75</p><p>Essa decisão apresenta risco de erros. O quadro a seguir resume as possibilidades:</p><p>Quadro 1</p><p>Nossa decisão A afirmação do fornecedor é</p><p>verdadeira</p><p>A afirmação do fornecedor não</p><p>é verdadeira</p><p>Rejeitamos H0</p><p>Cometemos um erro do tipo II.</p><p>A máquina tem a produtividade</p><p>anunciada pelo fabricante, mas</p><p>não aceitamos isso e deixamos</p><p>de comprá-la.</p><p>Decisão acertada.</p><p>A máquina não tem a</p><p>produtividade anunciada pelo</p><p>fabricante, e ao não comprá-la</p><p>tomamos a decisão correta.</p><p>Não rejeitamos H0</p><p>Decisão acertada.</p><p>A máquina tem a produtividade</p><p>anunciada pelo fabricante, e</p><p>ao não comprá-la tomamos a</p><p>decisão correta.</p><p>Cometemos um erro do tipo I.</p><p>A máquina não tem a</p><p>produtividade anunciada pelo</p><p>fabricante,</p><p>e ao comprá-la</p><p>cometemos um erro do tipo I.</p><p>Observe, no entanto, uma peculiaridade nesse exemplo. O fabricante da máquina afirma que a</p><p>produtividade dela é de 260 t/h, e como nossa amostra apresentou produtividade de 240 t/h, rejeitamos</p><p>a produtividade anunciada.</p><p>Mas e se nossa amostra tivesse registrado uma produtividade média de 280 t/h? Teríamos</p><p>rejeitado também, porque está fora do intervalo estabelecido (245,95 e 274,05 t/h). No entanto,</p><p>essa rejeição não teria sentido prático, porque a produtividade seria maior que a alegada pelo</p><p>fabricante e, portanto, iria nos favorecer mais ainda, na compra da máquina.</p><p>Isso acontece porque ao resolvermos o exercício adotamos um raciocínio bilateral, rejeitando</p><p>ambos os extremos da curva normal, quando o correto seria usar o raciocínio unilateral, preterindo</p><p>apenas o lado da curva que nos interessa.</p><p>Região</p><p>crítica</p><p>Região</p><p>crítica</p><p>Teste bilateral Teste unilateral</p><p>Região</p><p>crítica</p><p>Zc ZcZc</p><p>Figura 20</p><p>Dessa forma, a resolução do exercício ficaria muito mais adequada com o aspecto prático se a regra</p><p>de decisão fosse a seguinte:</p><p>• aceita-se que o fornecedor informou corretamente a produtividade da máquina se a amostra</p><p>estiver com valores superiores à região crítica do teste unilateral;</p><p>• rejeita-se a informação do fornecedor se a amostra estiver na zona crítica do teste unilateral.</p><p>Unidade II</p><p>76</p><p>Mantendo o nível de significância em 0,05, o valor de zc seria igual a 1,64, e, portanto, os valores</p><p>críticos seriam dados por:</p><p>crítico cX</p><p>43</p><p>x z 260 1,64 260,00 11,75 248,25</p><p>n 36</p><p>σ</p><p>= µ − × = − = − =</p><p>Consequentemente, aceitaríamos a afirmação do fornecedor se a nossa amostra ficasse com valores</p><p>acima de 248,25 t/h, e rejeitaríamos no caso contrário, com os riscos decorrentes de incorrer em erros</p><p>do tipo I ou II.</p><p>No exemplo dado, no qual a amostra de 36 observações teria resultado em uma produtividade média</p><p>de 240 t/h, rejeitaríamos a afirmação do fornecedor com um nível de significância de 5%.</p><p>Observação</p><p>Perceba que para o teste unilateral o cálculo do coeficiente zc é alterado,</p><p>em razão de a região crítica ficar toda em um dos lados da curva normal,</p><p>portanto, sem dividir a significância por 2:</p><p>tab cA significância 0,0500 z 1,64 z 1,64= = → = − → =</p><p>O modelo visto trata de um dos parâmetros estatísticos, a média (no caso, produtividade média),</p><p>mas todos os outros indicadores estão sujeitos aos testes de hipóteses. Nos exemplos a seguir veremos</p><p>algumas aplicações práticas.</p><p>Exemplo 1: um empreendedor pretende assumir uma franquia em determinada região da cidade na</p><p>qual se alega que a renda média familiar é de R$ 15.000,00. Não confinado nessa informação, ele faz</p><p>sua própria pesquisa com 15 famílias e obtém para elas uma renda média de R$ 14.000,00. De estudos</p><p>anteriores ele sabe que o desvio padrão aceitável para as rendas dessa zona é de R$ 2.000,00. Ele deve</p><p>aceitar a alegação feita com um nível de significância de 5%?</p><p>Resolução:</p><p>Observe que H0: µ = R$ 15.000,00 e H1: µ ≠ R$ 15.000,00 e que para um nível de significância</p><p>bilateral zc = 1,96, logo:</p><p>crítico cX</p><p>2.000</p><p>x z 15.000 1,96 15.000,00 1.012,14</p><p>n 15</p><p>σ</p><p>= µ ± × = ± = ±</p><p>Assim, aceitamos a hipótese se a amostra estiver entre R$ 13.987,86 e R$ 16.012,14, que é</p><p>efetivamente o caso visto que o empreendedor obteve uma amostra de média de R$ 14.000,00. Desse</p><p>modo, ele não rejeita a informação recebida.</p><p>ESTATÍSTICA APLICADA</p><p>77</p><p>Exemplo 2: considere que o empreendedor do exemplo anterior não esteja interessado na possibilidade</p><p>de a renda familiar da região ser maior que R$ 15.000,00 e sim de ser menor. Qual seria então a regra</p><p>de decisão a ser aplicada?</p><p>Resolução:</p><p>Essa situação é mais realista, visto que para o empreendedor rendas menores que as esperadas</p><p>representam riscos, não as superiores. O cálculo seria feito não se considerando um teste bilateral e</p><p>sim unilateral. A alteração ocorreria apenas no fator de criticidade (zc), que passaria de 1,96 para 1,64,</p><p>conforme mostrado anteriormente, e teríamos então H0: µ ≥ R$ 15.000,00 e H1: µ< R$ 15.000,00. Para</p><p>um nível de significância unilateral zc = 1,64, logo:</p><p>crítico cX</p><p>2.000</p><p>x z 15.000 1,64 15.000,00 846,89</p><p>n 15</p><p>σ</p><p>= µ − × = − = −</p><p>A regra de decisão fica então: aceita-se a hipótese zero se o valor amostral for maior ou igual a</p><p>R$ 14.153,11 e rejeita-se nos casos contrários. Como a amostra que ele obteve foi de R$ 14.000,00 ele</p><p>deve rejeitar a informação recebida.</p><p>Exemplo 3: um fabricante informa que 95% dos pequenos motores elétricos que fornece estão</p><p>rigorosamente de acordo com as especificações. Um comprador testou 200 desses motores e encontrou</p><p>18 defeituosos. A afirmação do fabricante pode ser aceita com nível de significância de 1%?</p><p>Resolução:</p><p>Note que é um teste unilateral, só interessa testar a quantidade de motores fora da especificação;</p><p>portanto, as hipóteses seriam:</p><p>• H0: p ≤ 0,05</p><p>• H1: p > 0,05</p><p>• zc = 2,33</p><p>( ) ( )</p><p>crítico c</p><p>p 1 p 0,05 1 0,05</p><p>p p z 0,05 2,33 0,05 0,036 ou 5% 3,6%</p><p>n 200</p><p>− −</p><p>= + × = − = + +</p><p>Aceita-se a hipótese zero se a porcentagem de defeitos for menor ou igual a 8,6% e rejeita-se no</p><p>caso contrário. A amostra apresentou 18 defeitos em 200, ou seja, 9%; portanto, rejeitamos a afirmação</p><p>do fabricante com uma significância de 1%.</p><p>Unidade II</p><p>78</p><p>O gráfico da figura a seguir resume a situação calculada.</p><p>Rejeita-se a afirmação</p><p>Significância: 1%</p><p>(Zc=2,33)</p><p>Defeitos apresentados</p><p>Aceita-se a</p><p>afirmação</p><p>5% 9%</p><p>Figura 21</p><p>Exemplo 4: duas classes em princípio semelhantes foram submetidas a uma avaliação da disciplina</p><p>de estatística e obtiveram os resultados mostrados a seguir:</p><p>Tabela 11</p><p>Classe Média alcançada Desvio padrão Quantidade de alunos</p><p>A 74 8 40</p><p>B 78 7 50</p><p>Podemos afirmar com um nível de significância de 5% que as classes apresentam diferenças</p><p>significativas nos seus aproveitamentos?</p><p>Resolução:</p><p>Vamos supor que as duas classes vêm de populações cujas médias são respectivamente µA e µB.</p><p>Nesse caso, as hipóteses seriam:</p><p>• H0: µA = µB, ou seja, as eventuais diferenças são casualidades.</p><p>• H1: µA ≠ µB, ou seja, existem diferenças significativas entres as salas.</p><p>Considerando um teste bilateral, visto que nos interessa saber se há diferenças de uma em relação</p><p>à outra, teríamos:</p><p>( )</p><p>2 2</p><p>A B</p><p>A B Acrítico B c</p><p>A B</p><p>(x x z</p><p>n n</p><p>)</p><p>σ σ</p><p>− = µ −µ ± × +</p><p>ESTATÍSTICA APLICADA</p><p>79</p><p>crític</p><p>2 2</p><p>A B o</p><p>8 7</p><p>(x x 0 1,96 0 3,15</p><p>40 5</p><p>)</p><p>0</p><p>− = ± × + = ±</p><p>O valor crítico de z (zc) é calculado por:</p><p>tab c</p><p>significância 0,05</p><p>A 0,0250 z 1,96 z 1,96</p><p>2 2</p><p>= = = → = − → =</p><p>Dessa forma, podemos supor que no caso de as diferenças entre as notas das classes estarem entre</p><p>-3,15 e +3,15, verifica-se a hipótese zero, ou seja, são casuais; nas situações contrárias, as variações</p><p>são significativas. É o que acontece, a diferença entre os escores foi de 74 - 78 = -4, portanto, existem</p><p>desproporções significativas entre os aproveitamentos das classes com a segunda, sendo, provavelmente,</p><p>a melhor no nível de 5% de significância.</p><p>Exemplo 5: como ficaria o teste de hipóteses do exemplo anterior para o nível de significância de 1%?</p><p>Resolução:</p><p>Vamos supor que as duas classes venham de populações cujas médias são respectivamente µA e µB.</p><p>Nesse caso, as hipóteses seriam:</p><p>• H0: µA = µB, ou seja, as eventuais diferenças são casualidades.</p><p>• H1: µA ≠ µB, ou seja, existem diferenças significativas entres as salas.</p><p>Considerando um teste bilateral, visto que nos interessa saber se há diferenças de uma em relação</p><p>à outra, teríamos:</p><p>( )</p><p>2 2</p><p>A B</p><p>A B Acrítico B c</p><p>A B</p><p>(x x z</p><p>n n</p><p>)</p><p>σ σ</p><p>− = µ −µ ± × +</p><p>crític</p><p>2 2</p><p>A B o</p><p>8 7</p><p>(x x 0 2,58 0 4,14</p><p>40 5</p><p>)</p><p>0</p><p>− = ± × + = ±</p><p>O valor crítico de z (zc) é calculado por:</p><p>tab c</p><p>significância 0,01</p><p>A 0,0050 z 2,58 z 2,58</p><p>2 2</p><p>= = = → = − → =</p><p>Unidade II</p><p>80</p><p>Dessa forma, podemos supor que no caso de as diferenças entre as notas das classes estarem entre</p><p>-4,14 e +4,14, verifica-se a hipótese zero, ou seja, são casuais; nas situações contrárias, as variações</p><p>são significativas. A diferença entre os escores foi de 74 - 78 = -4, portanto,</p><p>não existem diferenças</p><p>significativas entre os aproveitamentos das classes, no nível de 1% de significância.</p><p>Murray Spiegel (1993) afirma que alguns estatísticos fazem a seguinte distinção terminológica:</p><p>Tabela 12</p><p>Resultados significativos no nível de São considerados</p><p>1% Altamente significativos</p><p>5% Provavelmente significativos</p><p>Acima de 5% Não significativos</p><p>Usando esse conceito terminológico nos exemplos 4 e 5 poderíamos afirmar que os resultados são</p><p>provavelmente significativos, visto que estão no nível de 5%, mas não significativos no nível de 1%.</p><p>Exemplo 6: uma pesquisa médica trabalhou com dois grupos de pacientes portadores da</p><p>mesma doença, cada um deles com 100 elementos. Ao grupo A ministrou uma nova medicação</p><p>em desenvolvimento, enquanto ao grupo B administrou apenas placebo (substância com aparência</p><p>medicamentosa, mas sem princípios ativos), para que ele se comportasse como grupo de controle.</p><p>Todas as demais condições foram mantidas idênticas para ambos os grupos. Terminado o teste,</p><p>constatou-se que 75 pessoas do grupo A tinham sido curadas, contra 65 indivíduos do grupo B.</p><p>Teste a hipótese de o medicamento ministrado auxiliar na cura com um nível de significância de 5%.</p><p>Resolução:</p><p>As proporções de cura para os dois grupos seriam:</p><p>A B</p><p>75 65</p><p>p 0,75 e p 0,65</p><p>100 100</p><p>= = = =</p><p>Portanto, a amostragem apresentou uma diferença de 0,10 ou 10% a favor da utilização da</p><p>medicação. Esse resultado é significativo?</p><p>O teste de hipóteses seria montado da seguinte forma:</p><p>• H0: pA = pB, ou seja, as eventuais diferenças são casualidades.</p><p>• H1: pA > pB, ou seja, existem diferenças significativas quando do uso do medicamento.</p><p>ESTATÍSTICA APLICADA</p><p>81</p><p>Observe que se trata de um teste unilateral, portanto:</p><p>( ) ( ) ( )A A B B</p><p>A B crítico A B c</p><p>A B</p><p>p 1 p p 1 p</p><p>(p p p p) z</p><p>n n</p><p>− −</p><p>− = − ± × +</p><p>( ) ( )</p><p>A B crítico</p><p>0,75 1 0,75 0,65 1 0,65</p><p>(p p 0 1,64 0 0,106, ou seja, 0 10,6 pessoas</p><p>100 100</p><p>)</p><p>− −</p><p>− = + × + = + +</p><p>tab cA significância 0,0500 z 1,64 z 1,64= = → = − → =</p><p>Observação</p><p>O sinal ± da fórmula é substituído, no cálculo, pelo sinal + por ser um</p><p>teste unilateral. A hipótese zero só será rejeitada se a proporção de pessoas</p><p>curadas com a medicação for maior do que a curada sem medicação, ou</p><p>seja, interessa a cauda direita do gráfico.</p><p>Portanto, as diferenças serão significativas se o número de pessoas curadas com medicação for</p><p>superior a 10,6 daquelas curadas sem medicação. A diferença, no entanto, é de 10 indivíduos (75 - 65),</p><p>ou seja, a medicação não apresenta variações significativas no nível de 5% de significância. Portanto, a</p><p>discrepância de resultados é devida ao acaso nesse nível de significância.</p><p>Exemplo 7: como ficaria o exemplo anterior no caso de um nível de significância de 10%?</p><p>Resolução:</p><p>As proporções de cura para os dois grupos seriam:</p><p>A B</p><p>75 65</p><p>p 0,75 e p 0,65</p><p>100 100</p><p>= = = =</p><p>Portanto, a amostragem apresentou uma diferença de 0,10 ou 10% a favor da utilização da</p><p>medicação. Esse resultado é significativo?</p><p>O teste de hipóteses seria montado da seguinte forma:</p><p>• H0: pA = pB, ou seja, as eventuais diferenças são casualidades.</p><p>• H1: pA > pB, ou seja, existem diferenças significativas quando do uso do medicamento.</p><p>Unidade II</p><p>82</p><p>Observe que se trata de um teste unilateral, portanto:</p><p>( ) ( ) ( )A A B B</p><p>A B crítico A B c</p><p>A B</p><p>p 1 p p 1 p</p><p>(p p p p) z</p><p>n n</p><p>− −</p><p>− = − ± × +</p><p>( ) ( )</p><p>A B crítico</p><p>0,75 1 0,75 0,65 1 0,65</p><p>(p p 0 1,28 0 0,083, ou seja, 0 8,3 pessoas</p><p>100 10</p><p>)</p><p>0</p><p>− −</p><p>− = + × + = + +</p><p>tab cA significância 0,1000 z 1,28 z 1,28= = → = − → =</p><p>Consequentemente, as diferenças serão significativas se o número de pessoas curadas com medicação</p><p>for superior a 8,3 daquelas curadas sem medicação. Como a diferença foi de 10 pessoas (75 - 65), a</p><p>medicação apresenta diferenças significativas no nível de 10% de significância. Portanto, ela é significativa.</p><p>Note que usando a terminologia apresentada no exemplo 5, diríamos que a amostragem demonstra</p><p>diferenças não significativas.</p><p>Observação</p><p>As conclusões anteriores dependem do risco que estamos dispostos a</p><p>correr ao tomar a decisão requerida. Caso o medicamento seja ineficaz,</p><p>isto é, as diferenças sejam casuais, e concluirmos que as diferenças</p><p>são decorrentes dela, nós estaremos incorrendo em um erro do tipo I e</p><p>acabaremos aplicando a medicação a um grupo muito grande somente para</p><p>chegar à conclusão de que ele é ineficaz. Por outro lado, se o medicamento</p><p>for eficaz e concluirmos que ele não é (erro do tipo II), nós poderemos</p><p>colocar vidas humanas em risco. Ambos os erros trazem problemas e devem</p><p>ser muito bem avaliados, o que na prática nem sempre acontece.</p><p>Resumo</p><p>Grande parte dos problemas administrativos reside na formulação</p><p>de cenários futuros para respaldar a tomada de decisão, nos aspectos</p><p>estratégicos, financeiros, mercadológicos, operacionais, entre outros. A</p><p>estatística de modo geral e a amostragem em particular em muito facilitam</p><p>esse processo, permitindo estimações quantitativas.</p><p>A teoria da estimação permite que ponderemos situações futuras tendo</p><p>o domínio sobre as margens de erro e os custos dos trabalhos estatísticos,</p><p>determinando uma relação de compromisso que ao mesmo tempo nos</p><p>permita tomar decisões com pouco risco, com alta confiabilidade e custos-</p><p>ESTATÍSTICA APLICADA</p><p>83</p><p>benefícios adequados. Equilibrando custos dos estudos (diretamente ligados</p><p>aos tamanhos das amostras), precisão requerida e confiabilidade apropriada</p><p>nós conseguimos ter dados quantitativos suficientemente pertinentes às</p><p>atividades profissionais e científicas de qualidade.</p><p>Entre essas ferramentas decorrentes dos conceitos de amostra,</p><p>uma que se destaca é o controle estatístico da qualidade, vital para a</p><p>avaliação da efetiva eficiência e eficácia de todo e qualquer processo.</p><p>Esses e outros indicadores, muitos deles estatísticos, são decisivos nas</p><p>melhores práticas administrativas.</p><p>Outro aspecto importante tratado foi o dilema que se põe em qualquer</p><p>comparação de observações. As diferenças observadas entre várias</p><p>observações, inevitáveis de ocorrer, seriam devidas a um motivo real, ou</p><p>seja, a uma causa, ou a algo acidental, apenas casual? Essa análise pode</p><p>ser delicada e sutil e nos levar a tomar decisões erradas, aceitando o que</p><p>deveria ser rejeitado ou rejeitando o que deveria ser aceito.</p><p>Estimar algo futuro ou muito complexo e decidir se as ocorrências são</p><p>casuais ou causais nos dá condições de exercer adequadamente toda e</p><p>qualquer atividade decisória.</p><p>Exercícios</p><p>Questão 1. “Diversas pesquisas na área de economia aplicada procuraram avaliar a hipótese da</p><p>histerese no desemprego por meio da aplicação de testes de raízes unitárias. Song & Wu (1998), por</p><p>exemplo, analisaram o referido fenômeno no desemprego dos EUA utilizando dados anuais desagregados</p><p>de desemprego de quarenta e oito estados norte-americanos. Os resultados apontados pelos autores</p><p>indicam a existência de uma tendência estocástica nas séries, em consonância com a hipótese de histerese.”</p><p>Disponível em: <https://bit.ly/2Idcd1M>. Acesso em: 13 jun. 2019.</p><p>O teste de raiz unitária é extremamente importante em séries temporais. A partir dele será possível</p><p>saber se os resultados são seguros ou não.</p><p>Aponte a alternativa correta:</p><p>A) Quando uma série possui raiz unitária significa que os resultados não são estocásticos.</p><p>B) Uma série com raiz unitária possui alto grau de correlação.</p><p>C) O teste de raiz unitária é dispensável em regressões cujo R2 seja maior que 95%.</p><p>Unidade II</p><p>84</p><p>D) O teste de raiz unitária é facultativo em regressões com muitas observações.</p><p>E) A ausência do teste de raiz unitária pode levar a regressões espúrias.</p><p>Resposta correta: alternativa E.</p><p>Análise das alternativas</p><p>A) Alternativa incorreta.</p><p>Justificativa: justamente o contrário, séries com raiz unitária apontam para possíveis resultados</p><p>estocásticos.</p><p>B) Alternativa incorreta.</p><p>Justificativa: a correlação entre as variáveis é perfeitamente visível tanto em séries que apresentam</p><p>raiz unitária quanto naquelas em que a média</p><p>e a variância são constantes.</p><p>C) Alternativa incorreta.</p><p>Justificativa: de forma alguma, a correlação entre variáveis explicativas e dependentes não anula a</p><p>necessidade de observar se a série apresenta raiz unitária.</p><p>D) Alternativa incorreta.</p><p>Justificativa: o tamanho da amostra não determina se a regressão pode ser ou não espúria, portanto,</p><p>neste caso é indispensável o uso de testes como o Dickey-Fuller aumentado, para identificar se a série</p><p>tem ou não raiz unitária.</p><p>E) Alternativa correta.</p><p>Justificativa: sim, algumas variáveis apresentam alto grau de correlação sem, no entanto, terem</p><p>qualquer relação entre si.</p><p>Questão 2. “A estimativa é um processo em que uma amostra é selecionada, medem-se as</p><p>estatísticas necessárias, como, por exemplo, a altura média e o desvio padrão da amostra. Então é feita</p><p>uma inferência, ou seja, um processo de generalização, dizendo que a partir da média da amostra será</p><p>possível concluir que ela será a média da população. Em outras palavras, com os dados da amostra</p><p>tira-se conclusão da população.”</p><p>Disponível em: <https://bit.ly/2NjthrA>. Acesso em: 24 jun. 2019.</p><p>ESTATÍSTICA APLICADA</p><p>85</p><p>O texto anterior faz referência a:</p><p>A) Estimativa por intervalo.</p><p>B) Fidedignidade da estimativa.</p><p>C) Estimativa por pontos.</p><p>D) Intervalo de confiança.</p><p>E) Semelhanças para as proporções.</p><p>Resolução desta questão na plataforma.</p>