Prévia do material em texto
<p>117</p><p>ESTATÍSTICA ECONÔMICA — INTRODUÇÃO À ECONOMETRIA</p><p>Unidade II</p><p>5 TESTES DE HIPÓTESES COM UMA AMOSTRA</p><p>O teste de hipótese oferece um procedimento científico para estimar a validade de uma alegação</p><p>sobre uma população.</p><p>Quando investigamos uma população por intermédio de uma amostra, o principal objetivo é</p><p>tirar conclusões sobre os principais parâmetros dessa população, com uma probabilidade bastante</p><p>significativa de acerto. Um procedimento valioso de avaliação desse tipo de estudo é o teste de</p><p>hipótese, que procura investigar se os dados da amostra estão coerentes com os da população</p><p>ou se duas ou mais amostras possuem parâmetros equivalentes, levando em conta para ambas as</p><p>situações o nível de significância.</p><p>O teste de hipóteses é um procedimento estatístico baseado na análise de uma amostra por meio</p><p>da Teoria de Probabilidades usado para avaliar determinados parâmetros que são desconhecidos numa</p><p>população. Testes paramétricos (são testes baseados em parâmetros da amostra) estão condicionados</p><p>à dimensão da amostra, uma vez que, para amostras grandes, vários fenômenos estudados</p><p>convergem para uma curva normal (propriedade essa que provém do Teorema Central do Limite), o</p><p>qual diz que “toda soma de variáveis aleatórias independentes de média finita e variância limitada</p><p>é aproximadamente Normal, desde que o número de termos da soma seja suficientemente grande”</p><p>(Larson, 2004, p. 186‑197).</p><p>Para exemplificar, um vereador pretende, nas próximas eleições, candidatar‑se a prefeito em sua</p><p>cidade natal. Porém, antes de tomar essa decisão, contratou uma pesquisa em que p representa a</p><p>proporção de votos favoráveis a sua candidatura (0 ≤ p < 1). Supondo que as escolhas de cada cidadão</p><p>sejam independentes, pergunta‑se: quantas pessoas devem ser entrevistadas, com um nível de confiança</p><p>de 95% (1 – α), para que o valor de p tenha um erro inferior a 5%?</p><p>Sendo n o número de candidatos, Xi, i = 1, 2, 3,…, n é a variável aleatória de Bernoulli; assim, temos:</p><p>• P(Xi = 1) = p → Xi assumirá o valor 1, com probabilidade p, se a i‑ésima pessoa entrevistada</p><p>declarar a intenção de votar no candidato;</p><p>• P(Xi = 0) = 1 – p → Xi assumirá o valor 0, com probabilidade (1 – p), caso contrário, i = 1, 2, 3, ..., n.</p><p>Consequentemente, E(Xi) = p e Var(Xi) = p(1 – p) para todo i = 1,..., n.</p><p>118</p><p>Unidade II</p><p>Queremos n mínimo, de modo que:</p><p>P</p><p>s</p><p>n</p><p>pn � �</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>� �0 05 0 95, ,</p><p>Em que</p><p>Sn = X1 + ... + Xn</p><p>Mas temos que:</p><p>P</p><p>s</p><p>n</p><p>p P</p><p>s np</p><p>n</p><p>P</p><p>n</p><p>p p</p><p>s</p><p>n n� �</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>� � � �</p><p>�</p><p>��</p><p>��</p><p>�</p><p>��</p><p>�</p><p>�</p><p>�</p><p>�</p><p>0 05 0 05 0 05</p><p>0 05</p><p>1</p><p>, , ,</p><p>,</p><p>( )</p><p>nn np</p><p>np p</p><p>n</p><p>p p</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>( )</p><p>,</p><p>( )</p><p>,</p><p>1</p><p>0 05</p><p>1</p><p>0 95</p><p>Pelo Teorema Central do Limite, temos que para n suficientemente grande:</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>� �� �</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>� �0 05</p><p>1</p><p>0 05</p><p>1</p><p>0 95,</p><p>( )</p><p>,</p><p>( )</p><p>,</p><p>n</p><p>p p</p><p>n</p><p>p p</p><p>Logo, basta escolhermos n, tal que:</p><p>0 05</p><p>1</p><p>196</p><p>196</p><p>0 05</p><p>1</p><p>2</p><p>,</p><p>( )</p><p>,</p><p>,</p><p>,</p><p>( )</p><p>n</p><p>p p</p><p>n p p</p><p>�</p><p>� � � �</p><p>�</p><p>�</p><p>�</p><p>�</p><p>� �</p><p>,</p><p>,</p><p>�� � �� �� ��</p><p>�� � �� �� � �</p><p>�</p><p>�</p><p>�</p><p>� �� � �</p><p>x x</p><p>x x</p><p>x</p><p>0 95</p><p>1</p><p>0 9755</p><p>Como p p( )1</p><p>1</p><p>4</p><p>� � , temos que:</p><p>n</p><p>,</p><p>,</p><p>,� �</p><p>�</p><p>�</p><p>�</p><p>�</p><p>� �</p><p>196</p><p>0 05</p><p>1</p><p>4</p><p>384 16</p><p>2</p><p>Portanto, devemos entrevistar, para ter 95% de confiabilidade, pelo menos 385 eleitores.</p><p>119</p><p>ESTATÍSTICA ECONÔMICA — INTRODUÇÃO À ECONOMETRIA</p><p>Lembrete</p><p>Se coletarmos várias amostras de 30 eleitores e construirmos um</p><p>intervalo de 95% de confiança para cada uma, 95% desses intervalos</p><p>conterão a média da população µ.</p><p>Os testes de hipóteses são sempre constituídos por duas hipóteses, a hipótese nula H0 e a hipótese</p><p>alternativa H1. Hipótese nula H0 é a hipótese que traduz a ausência do efeito que se quer verificar.</p><p>Hipótese alternativa H1 é a hipótese que o investigador quer verificar.</p><p>Um teste de uma hipótese estatística é o procedimento ou a regra de decisão que nos possibilita</p><p>decidir por H0 ou H1 com base na informação contida na amostra.</p><p>Saiba mais</p><p>Para saber mais sobre o problema e as hipóteses na pesquisa</p><p>econômica, consulte:</p><p>GIL, A. C. Técnicas de pesquisa em economia. 2. ed. São Paulo: Atlas,</p><p>1990. p. 50‑60.</p><p>Exemplo 59: temos duas hipóteses: a máquina funciona corretamente (µ = 8) ou a máquina não</p><p>funciona corretamente (µ ≠ 8)?</p><p>Resolução:</p><p>H0: µ = 8 versus H1: µ ≠ 8</p><p>(hipótese nula) (hipótese alternativa)</p><p>Exemplo 60: numa fábrica de determinadas peças, um lote destas é considerado aceitável caso</p><p>tenha menos de 8% de peças defeituosas. Já que os lotes têm um grande número de peças, sairia muito</p><p>caro inspecionar todas essas peças. A decisão a favor de não rejeitar o lote será tomada no caso de uma</p><p>amostra a retirar do lote dar indicação nesse sentido.</p><p>Resolução: as hipóteses a testar são de que o lote é aceitável – p ≤ 0,08 ou não – p > 0,08. O que se</p><p>pretende é verificar que não temos razões para rejeitar a hipótese de que p ≤ 0,08.</p><p>Exemplo 61: supõe‑se que os estudantes sejam a favor da avaliação contínua, isto é, mais de 50%</p><p>dos estudantes prefiram a avaliação contínua. Para verificar se existem indícios de que essa hipótese não</p><p>seja verdadeira, recolhe‑se uma amostra de estudantes, registando‑se o número de respostas a favor.</p><p>120</p><p>Unidade II</p><p>Resolução: temos as hipóteses p ≥ 0,5 e p < 0,5. O que se pretende testar é se há alguma razão para</p><p>rejeitar p ≥ 0,5.</p><p>Todos esses exemplos referidos anteriormente têm algumas características comuns:</p><p>• Consideram‑se duas hipóteses complementares acerca de uma quantidade desconhecida</p><p>da população.</p><p>• A informação disponível é dada pela amostra que se recolheu da população em estudo.</p><p>• Pretende‑se verificar se uma das hipóteses a que damos mais importância é sustentada ou</p><p>rejeitada pela informação recolhida da amostra.</p><p>Coeficiente ou nível de significância (α): é a probabilidade de rejeitar a hipótese nula quando ela</p><p>é efetivamente verdadeira (erro).</p><p>Região crítica (RC): é o conjunto de valores assumidos pela variável aleatória ou estatística de teste</p><p>para os quais a hipótese nula é rejeitada.</p><p>Hipótese nula (H0): essa hipótese só deverá ser rejeitada quando possíveis diferenças entre</p><p>parâmetros da amostra e da população investigada ou entre parâmetros amostrais for grande a ponto</p><p>de se tornarem significativas, com base no nível de significância estabelecido para o teste.</p><p>Ao utilizarmos a estatística de uma amostra para a tomada de decisão sobre o parâmetro da</p><p>população, poderemos tomar alguma decisão errada em relação à hipótese a ser testada, representada</p><p>por um destes tipos de erros:</p><p>• Erro tipo I: rejeitar H0 quando essa hipótese for verdadeira (alarme falso – resultado comum).</p><p>• Erro tipo II: Aceitar H0 quando essa hipótese for falsa (falha de investigação – resultado raro).</p><p>Tabela 20</p><p>A hipótese nula é</p><p>verdadeira A hipótese nula é falsa</p><p>Decisão</p><p>sobre</p><p>H0</p><p>Decidimos rejeitar a</p><p>hipótese nula</p><p>Erro Tipo I (α)</p><p>(Rejeição de uma hipótese</p><p>nula verdadeira)</p><p>Decisão correta</p><p>Não rejeitamos a</p><p>hipótese nula Decisão correta</p><p>Erro Tipo II (β)</p><p>(não rejeição de uma</p><p>hipótese nula falsa)</p><p>Se X está dentro da região de aceitação (RA), então não achamos evidência para rejeitar H0; por</p><p>outro lado, se X está fora da região de aceitação, rejeitamos H0. Com um risco de 5% e 1%, esses limites</p><p>estão indicados na figura a seguir (a) e (b), respectivamente.</p><p>121</p><p>ESTATÍSTICA ECONÔMICA — INTRODUÇÃO À ECONOMETRIA</p><p>A)</p><p>Rejeitado 5%</p><p>µ ‑ 1,64σx µ</p><p>Aceito</p><p>B)</p><p>Rejeitado 1%</p><p>µ ‑ 2,33σx µ</p><p>Aceito</p><p>Figura 56 – Distribuição normal padronizada (Z)</p><p>Nível de confiança (1 – α): é o complemento da probabilidade do erro Tipo I (α); este coeficiente</p><p>geralmente é conhecido por coeficiente de confiança. Ele representa a probabilidade de que a hipótese</p><p>nula não seja rejeitada quando de fato for verdadeira. A probabilidade de se cometer o erro Tipo II</p><p>(risco β), também conhecido como nível de risco, depende da diferença entre o valor da hipótese e os</p><p>verdadeiros valores dos parâmetros da população.</p><p>Eficácia de um teste (1 – β): é a probabilidade de se rejeitar a hipótese nula quando ela é falsa.</p><p>Uma forma de reduzir a probabilidade</p><p>que possuem veículos populares.</p><p>Exemplo 81 (Bonini, 1972): uma amostra de 80 pilhas de marca A tem XA = 1.258 h e σA</p><p>2 = 94 h. Uma</p><p>outra amostra de 60 pilhas da marca B tem XB = 1.029 h e σB</p><p>2 = 68 h. Como o custo da pilha A é maior</p><p>do que o da B, nós estamos interessados em adquirir B, apesar de A ter uma duração média superior a</p><p>200 h. Adotando‑se α = 0,01 para determinar qual marca iremos comprar.</p><p>Caso II: supondo as populações com variâncias (σ1</p><p>2 e σ2</p><p>2) desconhecidas</p><p>Nesse caso, podemos ter duas ocorrências:</p><p>1) Variâncias de mesma ordem de grandeza.</p><p>2) Variâncias diferentes.</p><p>Para cada uma delas teremos um procedimento diferenciado, porém sempre utilizando a distribuição</p><p>t de Student, conforme a seguir:</p><p>RC RC</p><p>x</p><p>01</p><p>x</p><p>02</p><p>x x</p><p>α</p><p>2</p><p>α</p><p>2</p><p>Figura 78 – Região crítica (t de Student)</p><p>167</p><p>ESTATÍSTICA ECONÔMICA — INTRODUÇÃO À ECONOMETRIA</p><p>Observação</p><p>Este teste é válido para variâncias desconhecidas (substituídas por S1</p><p>2 e</p><p>S2</p><p>2) desde que n1 > 30 e n2 > 30.</p><p>1) Variâncias de mesma ordem de grandeza</p><p>Como não conhecemos as variâncias, mas podemos supor que elas sejam da mesma ordem de</p><p>grandeza (iguais), podemos obter uma estimativa dessa variância comum por meio de:</p><p>Fórmula 44</p><p>S</p><p>n S n S</p><p>n nC</p><p>2 1 1</p><p>2</p><p>2 2</p><p>2</p><p>1 2</p><p>1 1</p><p>2</p><p>�</p><p>�� � � �� �</p><p>� �</p><p>Em que:</p><p>S1</p><p>2 e S2</p><p>2 são as variâncias obtidas das amostras 1 e 2, respectivamente.</p><p>n1 e n2 são os tamanhos das amostras 1 e 2, respectivamente.</p><p>Assim:</p><p>Tabela 31 – Teste t de hipótese (H0 : µ1 ‑ µ2 = ∆0)</p><p>Hipótese nula H0 : µ1 ‑ µ2 = ∆0</p><p>Valor da estatística de teste</p><p>t</p><p>X X D</p><p>S</p><p>n n</p><p>obs</p><p>c</p><p>�</p><p>�</p><p>1 2 0</p><p>1 2</p><p>1 1</p><p>- -</p><p>Hipótese alternativa Intervalo de rejeição (nível α)</p><p>H1 : µ1 ‑ µ2 > ∆0 tobs > tn1 + n2 ‑ 2; α</p><p>H1 : µ1 ‑ µ2 < ∆0 tobs < ‑ tn1 + n2 ‑ 2; α</p><p>H1 : µ1 ‑ µ2 ≠ ∆0 |tobs| > tn1 + n2 ‑ 2; α/2</p><p>168</p><p>Unidade II</p><p>Se o teste for normal para a média, teremos Região Crítica (RC):</p><p>N (0,1)</p><p>‑tc</p><p>tc</p><p>t(υ)</p><p>Figura 79 – A distribuição t de Student e a distribuição normal padrão</p><p>Exemplo 82 (Bonini, 1972): um curso de Introdução à econometria foi oferecido a 15 alunos por</p><p>meio do método convencional, obtendo‑se uma média de 80 e um desvio‑padrão de 4. Um segundo</p><p>grupo de 12 estudantes fez o mesmo curso por meio de instrução programada, e no final do curso, com</p><p>o mesmo exame, obtiveram média 82 e desvio‑padrão 5. Testar a hipótese de que os métodos são iguais</p><p>ao nível de 0,10. Admitir que as populações sejam aproximadamente normais com variâncias iguais.</p><p>Resolução:</p><p>x1 = 80; s1 = 4 e n1 = 15 (método convencional).</p><p>x2 = 82; s2 = 5 e n2 = 12 (instrução programada).</p><p>H0 : µ1 = µ2 ou µ1 ‑ µ2 = 0 (∆0 = 0)</p><p>H1 : µ1 ≠ µ2 ou µ1 ‑ µ2 ≠ 0 (∆0 ≠ 0)</p><p>αα= 0,10 (nível de significância)</p><p>Como não conhecemos as variâncias, mas podemos supor que elas sejam da mesma ordem de</p><p>grandeza, podemos obter uma estimativa dessa variância comum por:</p><p>S</p><p>n S n S</p><p>n nC</p><p>2 1 1</p><p>2</p><p>2 2</p><p>2</p><p>1 2</p><p>1 1</p><p>2</p><p>�</p><p>�� � � �� �</p><p>� �</p><p>169</p><p>ESTATÍSTICA ECONÔMICA — INTRODUÇÃO À ECONOMETRIA</p><p>Calculando:</p><p>S</p><p>t</p><p>X X D</p><p>S</p><p>C</p><p>obs</p><p>c</p><p>2</p><p>1 2 0</p><p>15 1 16 12 1 25</p><p>15 12 2</p><p>499</p><p>25</p><p>19 96</p><p>1</p><p>�</p><p>� �� � � ��</p><p>�</p><p>� �</p><p>�</p><p>- -</p><p>-</p><p>,</p><p>- -</p><p>nn n</p><p>tobs</p><p>1 2</p><p>1</p><p>80 82 0</p><p>4 47</p><p>1</p><p>15</p><p>1</p><p>12</p><p>2</p><p>17312</p><p>116</p><p>- -</p><p>,</p><p>-</p><p>,</p><p>- ,</p><p>�</p><p>�</p><p>� �</p><p>� �</p><p>A região de rejeição: |tobs| > tn1 + n2 ‑ 2; α/2 = 1,71</p><p>Como |tobs| > tn1 + n2 ‑ 2; α/2 ∴ não há diferença entre as médias.</p><p>2) Variâncias diferentes</p><p>Como não conhecemos as variâncias das duas populações nem podemos supor que elas sejam da</p><p>mesma ordem de grandeza (iguais), então teremos de utilizar cada uma das variâncias obtidas nas amostras</p><p>(S1</p><p>2 e S2</p><p>2) como estimativas das variâncias de suas respectivas populações (µ1 e µ2). Teremos de utilizar a</p><p>distribuição t de Student com uma correção do grau de liberdade v, conforme fórmula a seguir:</p><p>Assim:</p><p>Tabela 32 – Teste t (correção) de hipótese (H0 : µ1 ‑ µ2 = ∆0)</p><p>Hipótese nula H0 : µ1 ‑ µ2 = ∆0</p><p>Valor da estatística de teste</p><p>t</p><p>X X D</p><p>S</p><p>n</p><p>S</p><p>n</p><p>obs �</p><p>�</p><p>1 2 0</p><p>1</p><p>2</p><p>1</p><p>2</p><p>2</p><p>2</p><p>- -</p><p>Correção no grau de liberdade v</p><p>S</p><p>n</p><p>S</p><p>n</p><p>S n</p><p>n</p><p>S n</p><p>n</p><p>�</p><p>�</p><p>�</p><p>�</p><p>��</p><p>�</p><p>�</p><p>��</p><p>� �</p><p>�</p><p>�</p><p>� �</p><p>�</p><p>1</p><p>2</p><p>1</p><p>2</p><p>2</p><p>2</p><p>2</p><p>1</p><p>2</p><p>1</p><p>2</p><p>1</p><p>2</p><p>2</p><p>2</p><p>2</p><p>21 1</p><p>/ /</p><p>170</p><p>Unidade II</p><p>Hipótese alternativa Intervalo de rejeição (nível α)</p><p>H1 : µ1 ‑ µ2 > ∆0 tobs > tv; α</p><p>H1 : µ1 ‑ µ2 < ∆0 tobs < ‑ t v; α</p><p>H1 : µ1 ‑ µ2 ≠ ∆0 |tobs| > tv; α/2</p><p>Exemplo 83: deseja‑se saber se duas máquinas de empacotar feijão estão fornecendo o mesmo</p><p>peso médio por pacote. Porém, como uma das máquinas é velha e a outra nova, é razoável supor que</p><p>diferentes variabilidades dos pesos aconteçam nos pacotes. As amostras disponíveis são de 10 pacotes</p><p>produzidos pela máquina velha e 7 produzidos pela máquina nova. Na tabela a seguir, os pesos desses</p><p>pacotes, em quilogramas (kg):</p><p>Tabela 33</p><p>Peso dos pacotes por máquina (kg)</p><p>Máquina velha 0,87 0,90 0,78 0,81 0,84 0,85 0,83 0,89 0,86 0,92</p><p>Máquina nova 0,90 0,91 0,87 0,90 0,89 0,88 0,93</p><p>Testar a hipótese de que há diferença no peso dos pacotes empacotados pelas duas máquinas ao</p><p>nível de 5% de significância.</p><p>Resolução: médias e desvios‑padrões amostrais:</p><p>x1 = 0,86; s1 = 0,0425 e n1 = 10 (máquina velha);</p><p>x2 = 0,90; s2 = 0,0198 e n2 = 7 (máquina nova).</p><p>H0 : µ1 = µ2 ou µ1 ‑ µ2 = 0 (∆0 = 0)</p><p>H1 : µ1 ≠ µ2 ou µ1 ‑ µ2 ≠ 0 (∆0 ≠ 0)</p><p>Podemos agora calcular o grau de liberdade:</p><p>Fórmula 45</p><p>v</p><p>S</p><p>n</p><p>S</p><p>n</p><p>S n</p><p>n</p><p>S n</p><p>n</p><p>�</p><p>�</p><p>�</p><p>�</p><p>��</p><p>�</p><p>�</p><p>��</p><p>� �</p><p>�</p><p>�</p><p>� �</p><p>�</p><p>1</p><p>2</p><p>1</p><p>2</p><p>2</p><p>2</p><p>2</p><p>1</p><p>2</p><p>1</p><p>2</p><p>1</p><p>2</p><p>2</p><p>2</p><p>2</p><p>21 1</p><p>/ /</p><p>171</p><p>ESTATÍSTICA ECONÔMICA — INTRODUÇÃO À ECONOMETRIA</p><p>v</p><p>S</p><p>n</p><p>S</p><p>n</p><p>S n</p><p>n</p><p>S n</p><p>n</p><p>�</p><p>�</p><p>�</p><p>�</p><p>��</p><p>�</p><p>�</p><p>��</p><p>� �</p><p>�</p><p>�</p><p>� �</p><p>�</p><p>�</p><p>1</p><p>2</p><p>1</p><p>2</p><p>2</p><p>2</p><p>2</p><p>1</p><p>2</p><p>1</p><p>2</p><p>1</p><p>2</p><p>2</p><p>2</p><p>2</p><p>21 1</p><p>13</p><p>/ /</p><p>α = 0,05 (nível de significância de 5% e teste bicaudal):</p><p>tv; α/2 = t13; 2,5% = 2,16 (da tabela da distribuição t)</p><p>Devemos, agora, calcular a estatística de teste, isto é:</p><p>t</p><p>X X D</p><p>S</p><p>n</p><p>S</p><p>n</p><p>obs �</p><p>�</p><p>� �1 2 0</p><p>1</p><p>2</p><p>1</p><p>2</p><p>2</p><p>2</p><p>0 86 0 90 0</p><p>0 0002378</p><p>2 60</p><p>- - , - , -</p><p>,</p><p>- ,</p><p>Conclusão: temos de rejeitar H0, pois tcalc = |‑ 2,60| > t13; 2,5% = 2,16, isto é, existem evidências</p><p>significativas para comprovar que as máquinas enchem pacotes de feijão com pesos diferentes ao nível</p><p>de confiança de 95%.</p><p>Caso III – dados emparelhados (mesma população: antes e depois)</p><p>Em alguns casos, temos de testar a possível diferença de média de alguma característica entre duas</p><p>populações, porém surge um inconveniente: a existência de outras características dessas populações</p><p>que, atuando em conjunto, podem influenciar ou mascarar a característica que estamos analisando.</p><p>Para descartar quaisquer influências de outras características, devemos analisar os dados</p><p>emparelhadamente, isto é, trata‑se de uma situação em que queremos comparar as médias de duas</p><p>distribuições normais, supondo que se trate da mesma população, mas em dois momentos diferentes:</p><p>antes e depois. Por exemplo:</p><p>• Pressão arterial de pacientes que apresentam uma determinada doença, em repouso e após um</p><p>certo exercício físico.</p><p>• Peso de pacientes no pré‑operatório e no pós‑operatório.</p><p>Em tais casos em que as amostras não são independentes, costuma‑se chamá‑las de amostras</p><p>emparelhadas. Um outro exemplo disso ocorre quando se compara uma amostra de pesos de pessoas</p><p>antes de se submeterem a uma dada dieta com a amostra de pesos das mesmas pessoas após se</p><p>submeterem à dieta. Nesse caso, o que se faz é comparar a diferença entre os pesos de uma mesma</p><p>pessoa antes e depois da dieta.</p><p>172</p><p>Unidade II</p><p>Vamos supor que em vez de escolher 20 ratos de forma aleatória e separá‑los em duas amostras</p><p>de 10 ratos cada, uma alimentada com a dieta normal e a outra alimentada com dieta deficiente em</p><p>vitamina E, o pesquisador prefira trabalhar com 10 pares de ratos, cada par composto por ratos retirados</p><p>da mesma ninhada e com o mesmo peso. Dessa forma, pode‑se considerar que os ratos de um dado par</p><p>possuem as mesmas condições antes do experimento, ou seja, eles não são independentes.</p><p>Dessa forma, o pesquisador vai trabalhar com 10 pares de ratos nas mesmas condições iniciais.</p><p>A partir daí, as condições passam a ser diferentes. Um rato de cada par é escolhido para ser alimentado</p><p>com a dieta normal</p><p>e o outro rato é alimentado com a dieta deficiente em vitamina E.</p><p>Esse teste t de Student permite inferir a igualdade de médias de duas amostras emparelhadas.</p><p>Frequentemente, cada caso é analisado duas vezes, antes e depois de um tratamento ou intervenção,</p><p>formando pares de observações, cujas diferenças são testadas para ver se o resultado é ou não zero.</p><p>Lembrete</p><p>Inferir significa deduzir, concluir. Em estatística, o termo é utilizado</p><p>como resultado do processo em que se prevê o comportamento de um</p><p>experimento a partir de observações amostrais.</p><p>Porém, em muitos casos em que se faz um teste de hipótese sobre a diferença entre duas médias,</p><p>costuma‑se trabalhar com amostras que possuem algum grau de relação entre si. Portanto, deve haver</p><p>sempre correlação entre os dois grupos para se utilizar esse teste. Se não existir correlação entre os</p><p>dois grupos ou se for muito pequena, significará que o emparelhamento não foi útil, devendo‑se em</p><p>consequência usar o teste t de Student para amostras independentes.</p><p>Há duas formas possíveis de conduzir esse tipo de experimento:</p><p>1) Amostras independentes.</p><p>2) Amostras dependentes ou emparelhadas.</p><p>A diferença entre as duas estratégias está ilustrada na figura:</p><p>Versus</p><p>Grupo A</p><p>Tênis R</p><p>Grupo B</p><p>Tênis V</p><p>Am</p><p>os</p><p>tr</p><p>as</p><p>in</p><p>de</p><p>pe</p><p>nd</p><p>en</p><p>te</p><p>s</p><p>Am</p><p>os</p><p>tr</p><p>as</p><p>e</p><p>m</p><p>pa</p><p>re</p><p>lh</p><p>ad</p><p>as</p><p>Um pé: tênis R versus outro pé: tênis V</p><p>A) B)</p><p>Figura 80 – Experimentos dos tênis com amostras independentes ou emparelhadas</p><p>173</p><p>ESTATÍSTICA ECONÔMICA — INTRODUÇÃO À ECONOMETRIA</p><p>Essa estratégia é adequada quando se podem formar blocos em função de algum critério e realizar</p><p>medidas sob as duas condições diferentes dentro de cada bloco. No exemplo dos tênis, cada menino</p><p>formava um bloco, e as duas condições estavam representadas pelos dois tipos de tênis, um em cada pé.</p><p>O conjunto de dados é constituído de n pares independentes:</p><p>(X1; Y1), (X2; Y2), (X3; Y3), …….(Xn; Yn),</p><p>Interessa‑nos obter, para cada par, a diferença Di = Xi ‑ Yi para estimar ou testar a média da distribuição</p><p>populacional µD.</p><p>Assim, o teste de hipótese será delineado:</p><p>Tabela 34 – Teste t de hipótese (H0 : µD = ∆0)</p><p>Hipótese nula H0 : µD = ∆0</p><p>Valor da estatística de teste t</p><p>d</p><p>S n</p><p>obs</p><p>d</p><p>�</p><p>� �0</p><p>/</p><p>Hipótese alternativa Intervalo de rejeição (nível α)</p><p>H1 : µ1 ‑ µ2 > ∆0 tobs > tn‑1; α</p><p>H1 : µ1 ‑ µ2 < ∆0 tobs < ‑ t n‑1; α</p><p>H1 : µ1 ‑ µ2 ≠ ∆0 |tobs| > tn‑1; α/2</p><p>Se o teste for normal para a média, teremos Região Crítica (RC):</p><p>‑ tc tc</p><p>t</p><p>α</p><p>2</p><p>Figura 81 – Região crítica para o teste t de Student</p><p>Exemplo 84 (Bonini, 1972): dois operários mediram simultaneamente a porcentagem de amônia</p><p>num gás de fábrica em 9 dias sucessivos. Necessita‑se saber se eles diferem significativamente entre</p><p>si em suas determinações. Os resultados encontram‑se na tabela, em que x = %NH3 e Z = 100(x ‑ 12).</p><p>174</p><p>Unidade II</p><p>Tabela 35</p><p>N. da</p><p>amostra Operador A X1 Operador B X2 Z1=100(X1 -12) Z2=100(X2 -12) Z2 – Z1=d d2</p><p>1 12,04 12,18 4 18 14 196</p><p>2 12,37 12,37 37 37 0 0</p><p>3 12,35 12,38 35 38 3 9</p><p>4 12,43 12,36 43 36 ‑7 49</p><p>5 12,34 12,47 34 47 13 169</p><p>6 12,36 12,48 36 48 12 144</p><p>7 12,48 12,57 48 57 9 81</p><p>8 12,33 12,28 33 28 ‑5 25</p><p>9 12,33 12,42 33 42 9 81</p><p>Total 303 351 48 754</p><p>Média 33,67 39,00 5,33</p><p>1) H0 : µ1 ‑ µ2 = 0</p><p>2) H1 : µ1 ‑ µ2 ≠ 0</p><p>3) α = 0,05</p><p>4) R.R. : t > 2,306</p><p>2) Calculamos:</p><p>t</p><p>d</p><p>s</p><p>n</p><p>calc</p><p>d</p><p>�</p><p>� 0</p><p>2</p><p>Os dados fornecem i�� 1</p><p>9 di = 48 e i�� 1</p><p>9 di</p><p>2 = 754</p><p>Em que:</p><p>d</p><p>d</p><p>n</p><p>s</p><p>S</p><p>n</p><p>d d</p><p>n</p><p>d</p><p>d</p><p>ii</p><p>d</p><p>dd i i ii</p><p>ii</p><p>� � �</p><p>� �</p><p>� �</p><p>�</p><p>�</p><p>� �</p><p>�</p><p>� �</p><p>1</p><p>9</p><p>2 1</p><p>9 2 2</p><p>1</p><p>9</p><p>48</p><p>9</p><p>5 33</p><p>1 1</p><p>,</p><p>-</p><p>-</p><p>-</p><p>-</p><p>���� �</p><p>�</p><p>� �</p><p>� �</p><p>1</p><p>9 2</p><p>2</p><p>1</p><p>754</p><p>48</p><p>9</p><p>8</p><p>498</p><p>8</p><p>62 25n</p><p>n-</p><p>-</p><p>,</p><p>175</p><p>ESTATÍSTICA ECONÔMICA — INTRODUÇÃO À ECONOMETRIA</p><p>Assim:</p><p>t</p><p>d</p><p>s</p><p>n</p><p>calc</p><p>d</p><p>�</p><p>�</p><p>� � �</p><p>0 5 33</p><p>62 25</p><p>9</p><p>5 33</p><p>2 63</p><p>2 03</p><p>2</p><p>,</p><p>,</p><p>,</p><p>,</p><p>,</p><p>3) Conclusão: |tcalc| < tcrítico, então, aceita‑se H0.</p><p>Exemplo 85: um banho de óleo é aquecido aos poucos e sua temperatura medida de meia em meia</p><p>hora por dois termômetros (T1 e T2). Tendo‑se obtido os valores na tabela seguinte, pergunta‑se: há</p><p>diferença significativa entre os termômetros ao nível de 5% de significância?</p><p>Tabela 36</p><p>T1 38,2 44,5 53,0 59,0 66,4 71,3</p><p>T2 37,5 44,2 51,6 58,0 66,8 72,4</p><p>Diferença 0,7 0,3 1,4 1,0 ‑0,4 ‑1,1</p><p>Resolução:</p><p>H0 : µD = 0</p><p>H1 : µD ≠ 0</p><p>Nível de significância de 5% e teste bicaudal. Então, da Tabela da Distribuição t (Tabela A3a, vide</p><p>AVA), temos:</p><p>tn‑1; α/2 = t5; 2,5% = 2,571</p><p>Calcular o valor da estatística de teste tcalc. Para isso precisamos da média e do desvio‑padrão:</p><p>d = 0,317</p><p>Sd = 0,928</p><p>Temos:</p><p>t</p><p>d</p><p>S n</p><p>calc</p><p>d</p><p>�</p><p>� �</p><p>�</p><p>�</p><p>�0 0 317 0</p><p>0 928 6</p><p>0 837</p><p>/</p><p>,</p><p>, /</p><p>,</p><p>176</p><p>Unidade II</p><p>Concluindo, devemos aceitar H0 : µD = 0, pois tcalc = 0,837 < t5; 2,5% = 2,57, isto é, não foram encontradas</p><p>evidências significativas para comprovar que os termômetros estivessem descalibrados.</p><p>Exemplo 86: 12 porcos foram submetidos ao tratamento de engorda com certo tipo de ração. Os</p><p>pesos em quilos, antes e após o procedimento, são dados na tabela a seguir. Supondo que os dados</p><p>observados se aproximem de uma distribuição normal, a 1% de significância, podemos concluir que o</p><p>uso da ração contribuiu para o aumento do peso médio dos porcos?</p><p>Tabela 37</p><p>Porcos 1 2 3 4 5 6 7 8 9 10 11 12</p><p>Antes 248 275 258 218 235 291 272 224 247 261 244 226</p><p>Depois 252 279 267 219 239 291 276 228 250 266 247 234</p><p>Resolução: a proposta do exemplo trata‑se de comparar as médias de duas distribuições consideradas</p><p>normais, mas da mesma população, em dois momentos diferentes: antes e após um tratamento de</p><p>engorda. O interesse está em verificar se a dieta contribuiu para a engorda dos porcos, isto é, se os</p><p>porcos estarão em média mais pesados ao final do tratamento. Assim, por exigir que se tome uma</p><p>decisão, iremos aplicar um teste de hipótese que envolve diferenças entre médias populacionais</p><p>para dados pareados (mesma população: antes e depois).</p><p>De acordo com a proposta, a definição da hipótese nula H0 é que a dieta não faz efeito; indicando</p><p>que as médias, antes e depois do tratamento, são iguais (costumamos colocar em H0 o contrário do que</p><p>queremos provar), ou seja, a diferença entre as médias deve ser supostamente igual a zero. Teremos então:</p><p>H0 : µd = 0</p><p>H1 : µd < 0</p><p>Em que µd = µantes ‑ µdepois</p><p>Conforme estabelecido no enunciado do problema:</p><p>αα= 0,01 (nível de significância) 1 ‑ αα= 0,99 (nível de confiança)</p><p>Como a amostra tem menos de 30 elementos (apenas 12), a variável de teste que será utilizada</p><p>será a variável tn-1 da distribuição t de Student.</p><p>Com base na hipótese alternativa H1 : µd < 0, trata‑se de um teste unilateral à esquerda; com um</p><p>nível de confiança de 99% (ou um nível de 1% de significância) e variável de teste tn‑1 (a amostra tem</p><p>n = 12 elementos), o valor crítico obtido da tabela da distribuição t de Student será:</p><p>tn ‑ 1; crítico = t12 ‑ 1; 0,01 = t11; 0,01 = ‑ t11; 0,99 = 2,72</p><p>177</p><p>ESTATÍSTICA ECONÔMICA — INTRODUÇÃO À ECONOMETRIA</p><p>Observe a região de aceitação de H0 na figura a seguir:</p><p>Rejeitar H0</p><p>Aceitar H0</p><p>‑2,72</p><p>α = 1%</p><p>Figura 82 – Região de aceitação</p><p>Para valores maiores que ‑2,72 aceitaremos H0 (ou seja, a dieta não faz efeito, a diferença entre as</p><p>médias é nula). Se tn‑1 for menor do que ‑2,72, rejeitaremos H0 (a média depois aumentou em relação</p><p>à média antes da dieta para que a diferença seja devida apenas ao acaso). Porém, há uma chance de 1%</p><p>de que venhamos a rejeitar H0 sendo ela verdadeira.</p><p>Assim, por meio dos valores das amostras (antes e depois), calculamos a diferença di entre cada par</p><p>de valores, em que:</p><p>di = Xantes ‑ Xdepois</p><p>Procedendo ao cálculo no conjunto sob análise, teremos:</p><p>Tabela 38</p><p>Porcos 1 2 3 4 5 6 7 8 9 10 11 12</p><p>Antes 248 275 258 218 235 291 272 224 247 261 244 226</p><p>Depois 252 279 267 219 239 291 276 228 250 266 247 234</p><p>di ‑4 ‑4 ‑9 ‑1 ‑4 0 ‑4 ‑4 ‑3 ‑5 ‑3 ‑8</p><p>di</p><p>2 16 16 81 1 16 0 16 16 9 25 9 64</p><p>Os dados fornecem i�� 1</p><p>12 di = ‑ 49 e i�� 1</p><p>12 di</p><p>2 = 269</p><p>Calculamos a diferença média e o desvio‑padrão da diferença média:</p><p>d</p><p>d</p><p>n</p><p>quilosi� �</p><p>�</p><p>� �� 49</p><p>12</p><p>4 08,</p><p>178</p><p>Unidade</p><p>II</p><p>s</p><p>d d n</p><p>n</p><p>quilosd</p><p>i i</p><p>�</p><p>� � ��</p><p>��</p><p>�</p><p>��</p><p>�</p><p>�</p><p>� �� ��</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>� �2 2 2</p><p>1</p><p>269 49 12</p><p>12 1</p><p>2 50</p><p>/ /</p><p>,</p><p>Calculamos o valor da variável de teste tn‑1:</p><p>t</p><p>d</p><p>s n</p><p>t t</p><p>n</p><p>d</p><p>�</p><p>�</p><p>�</p><p>� �</p><p>� �</p><p>�</p><p>� �</p><p>� �</p><p>1</p><p>12 1 11</p><p>4 08</p><p>2 50 12</p><p>5 65</p><p>/</p><p>,</p><p>, /</p><p>,</p><p>Decidimos pela aceitação ou rejeição de H0.</p><p>Se o valor t calculado (t11 = ‑ 5,65) for menor do que o valor de t da tabela ou t crítico (t11; 0,01 = ‑ 2,72),</p><p>a hipótese nula será rejeitada a 1% de significância.</p><p>Portanto, concluímos com 99% de confiança (ou com um erro de 1%) que a dieta contribuiu para o</p><p>aumento do peso médio dos porcos.</p><p>6.2 Testes de hipóteses para comparação entre duas proporções</p><p>Vejamos dois casos com relação à hipótese inicial:</p><p>H0 = p1 ‑ p2 = d0</p><p>1º caso: d0 = 0, então p1 ‑ p2 = p. O teste da hipótese para duas proporções iguais quando as amostras</p><p>são grandes é:</p><p>1) H0 = p1 ‑ p2</p><p>2) H1 = alternativas são: p1 < p2, p1 > p2 ou p1 ≠ p2</p><p>3) Escolher α</p><p>4) R.C. Z < ‑ Zα para p1 < p2; Z > Zα para p1 > p2; |Z| > Zα/2 para p1 ≠ p2</p><p>5) Calcular:</p><p>179</p><p>ESTATÍSTICA ECONÔMICA — INTRODUÇÃO À ECONOMETRIA</p><p>Fórmula 46</p><p>Z</p><p>p p</p><p>pq</p><p>n n</p><p>p</p><p>x x</p><p>n n</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>1 2</p><p>1 2</p><p>1 2</p><p>1 21 1</p><p>, ,</p><p>, ,</p><p>,,</p><p>Z</p><p>p p</p><p>pq</p><p>n n</p><p>p</p><p>x x</p><p>n n</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>1 2</p><p>1 2</p><p>1 2</p><p>1 21 1</p><p>, ,</p><p>, ,</p><p>,,</p><p>6) Conclusão: rejeita‑se H0 caso Z caia na região crítica e aceita‑se H0 em caso contrário.</p><p>Exemplo 87: numa pesquisa sobre possuidores de máquina de lavar roupas automática</p><p>encontraram‑se 120 das 200 possuidoras donas de casa da zona urbana entrevistadas e 240 das 500</p><p>na zona suburbana. Há diferença significativa entre a proporção de donas de casas das zonas urbana e</p><p>suburbana que possuem máquina de lavar roupa ao nível de significância de 0,05?</p><p>Resolução:</p><p>α = 0,05</p><p>1) H0 = p1 ‑ p2</p><p>2) H1 = p1 > p2</p><p>3) α = 0,05</p><p>4) R.C. : Z0,025 > 1,96</p><p>5) Calcular:</p><p>p</p><p>x</p><p>n</p><p>p</p><p>x</p><p>n</p><p>p</p><p>x x</p><p>n n</p><p>1</p><p>1</p><p>1</p><p>2</p><p>2</p><p>2</p><p>1 2</p><p>1 2</p><p>120</p><p>200</p><p>0 60</p><p>240</p><p>500</p><p>0 48</p><p>120</p><p>,</p><p>,</p><p>,</p><p>,</p><p>,</p><p>� � �</p><p>� � �</p><p>�</p><p>�</p><p>�</p><p>�</p><p>� 2240</p><p>200 500</p><p>0 51</p><p>�</p><p>� ,</p><p>Assim, Z �</p><p>�</p><p>� ��� �� ��</p><p>��</p><p>�</p><p>��</p><p>�</p><p>0 60 0 48</p><p>0 51 0 49</p><p>1</p><p>200</p><p>1</p><p>500</p><p>2 9</p><p>, ,</p><p>, ,</p><p>,</p><p>180</p><p>Unidade II</p><p>6) Conclusão: rejeita‑se H0 e conclui‑se que a proporção de donas de casa na zona urbana que</p><p>possuem máquinas de lavar é maior do que a da zona suburbana.</p><p>2º caso: seja d0 ≠ 0 e que p1 ≠ p2, quando as amostras são grandes, os passos do teste são: 1), 2), 3),</p><p>4) e 6) são iguais ao 1º caso e o 5) será:</p><p>Fórmula 47</p><p>Z</p><p>p p d</p><p>p q</p><p>n</p><p>p q</p><p>n</p><p>�</p><p>�� � �</p><p>�</p><p>�</p><p>�</p><p>��</p><p>�</p><p>�</p><p>��</p><p>1 2 0</p><p>1 1</p><p>1</p><p>2 2</p><p>2</p><p>, ,</p><p>, , , ,</p><p>,</p><p>Exemplo 88: uma fábrica informa que seu produto A supera em venda o produto B em 10%.</p><p>Observando‑se duas amostras aleatórias e independentes, temos que: de 200 elementos, 56 preferem</p><p>A; e de 150 elementos, 29 preferem B. Verificar se A supera B em 10%, contra a hipótese de que essa</p><p>diferença seja menor do que 10%. Considerar α = 0,06.</p><p>Resolução:</p><p>1) H0 = pA ‑ pB = 0,10</p><p>2) H1 = pA ‑ pB < 0,10</p><p>3) α = 0,06</p><p>4) R.C. : Z0,06 < ‑ 1,55</p><p>5) Calcular:</p><p>p</p><p>x</p><p>n</p><p>p</p><p>x</p><p>n</p><p>Z</p><p>p p d</p><p>p q</p><p>1</p><p>1</p><p>1</p><p>2</p><p>2</p><p>2</p><p>1 2 0</p><p>1 1</p><p>56</p><p>200</p><p>0 28</p><p>29</p><p>150</p><p>0 193</p><p>,</p><p>,</p><p>, ,</p><p>,</p><p>,</p><p>,</p><p>� � �</p><p>� � �</p><p>�</p><p>�� � �</p><p>,, , ,</p><p>, , ,</p><p>, , ,</p><p>n</p><p>p q</p><p>n1</p><p>2 2</p><p>2</p><p>0 28 0 193 0 10</p><p>0 28 0 72</p><p>200</p><p>0 807</p><p>�</p><p>�</p><p>�</p><p>��</p><p>�</p><p>�</p><p>��</p><p>�</p><p>�� � �</p><p>�</p><p>�</p><p>�00 193</p><p>150</p><p>6 5</p><p>,</p><p>,� �</p><p>181</p><p>ESTATÍSTICA ECONÔMICA — INTRODUÇÃO À ECONOMETRIA</p><p>6) Conclusão: rejeita‑se H0 e conclui‑se que a marca A não vende mais do que a B em 10%.</p><p>6.3 Testes de hipóteses para comparação entre duas variâncias</p><p>A distribuição que modela o comportamento aleatório de uma variância é a distribuição</p><p>qui‑quadrado (Xv</p><p>2).</p><p>X</p><p>n S X X</p><p>n</p><p>i2</p><p>1</p><p>2</p><p>2</p><p>2</p><p>2</p><p>1</p><p>( )� �</p><p>�� �</p><p>�</p><p>�� ��</p><p>� �</p><p>A distribuição apresenta:</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>��</p><p>v</p><p>v2 2</p><p>moda = v ‑ 2</p><p>Lembrete</p><p>Moda trata‑se do valor que mais se repete em uma distribuição de</p><p>frequências, ou seja, aquele que possui maior frequência.</p><p>A figura a seguir apresenta a distribuição X2.</p><p>1 - α</p><p>R.A.</p><p>R.C.R.C.</p><p>0</p><p>f(X</p><p>2</p><p>)</p><p>X2X2</p><p>1‑α/2 X2</p><p>α/2</p><p>σ2 ≠ σ2</p><p>0</p><p>α</p><p>2 α</p><p>2</p><p>Figura 83 – Função densidade qui‑quadrado</p><p>182</p><p>Unidade II</p><p>A figura a seguir apresenta algumas distribuições Xv</p><p>2 (qui‑quadrado) para vários graus de liberdade (v):</p><p>x4</p><p>2</p><p>x8</p><p>2</p><p>x2</p><p>16</p><p>x2</p><p>25</p><p>0,2</p><p>0,16</p><p>0,12</p><p>0,08</p><p>0,04</p><p>0 5 10 15 20 25 30 35 40 45 50 55 60</p><p>Figura 84 – Distribuições Xv</p><p>2</p><p>(qui ‑ quadrado) para vários graus de liberdade (v)</p><p>Quer dizer que o quociente anterior X</p><p>n( )−1</p><p>2 tem uma distribuição qui‑quadrado com “n ‑ 1” graus</p><p>de liberdade. A qui‑quadrado é uma distribuição assimétrica positiva que varia de zero a mais infinito.</p><p>Essa distribuição é tabelada também em função dos números de graus de liberdade, isto é, cada grau</p><p>de liberdade (n ‑ 1) representa uma distribuição diferente. As colunas das tabelas representam diferentes</p><p>níveis de significância, ou seja, área sob a curva acima do valor tabelado.</p><p>O teste para comparar duas variâncias populacionais é conhecido por Teste F, por utilizar a distribuição</p><p>F de Snedecor, desenvolvida inicialmente por Fisher. Essa distribuição modela a relação (divisão) entre</p><p>duas variâncias. A distribuição F de Snedecor tem dois graus de liberdade associados, sempre, em ordem,</p><p>à variância no numerador e do denominador:</p><p>Fórmula 48</p><p>F</p><p>S</p><p>S</p><p>X n</p><p>X n</p><p>n n</p><p>n</p><p>n</p><p>( ; )</p><p>( )</p><p>( )</p><p>/</p><p>/1 1 2 1</p><p>1</p><p>2</p><p>2</p><p>2</p><p>2</p><p>1 1 1</p><p>2</p><p>2 1 2</p><p>1</p><p>1</p><p>� �</p><p>�</p><p>�</p><p>� �</p><p>�� �</p><p>�� �</p><p>Em que:</p><p>n1 ‑ 1: é o grau de liberdade do numerador;</p><p>n2 ‑ 1: é o grau de liberdade do denominador.</p><p>183</p><p>ESTATÍSTICA ECONÔMICA — INTRODUÇÃO À ECONOMETRIA</p><p>Observação</p><p>O quociente entre as variâncias amostrais possui uma distribuição F (de</p><p>Snedecor) com n1 ‑ 1 graus de liberdade no numerador e n2 ‑ 1 graus de</p><p>liberdade no denominador.</p><p>Teste de hipótese para duas variâncias:</p><p>Tabela 39 – Teste F de hipótese (H0: σ1</p><p>2 = σ2</p><p>2)</p><p>Hipótese nula H0 : σ1</p><p>2 = σ2</p><p>2</p><p>Valor da estatística de teste F</p><p>S</p><p>S</p><p>obs = 1</p><p>2</p><p>2</p><p>2</p><p>Hipótese alternativa Intervalo de rejeição (nível α)</p><p>H1 : : σ1</p><p>2 > σ2</p><p>2 Fobs > Fv1; v2; α</p><p>H1 : : σ1</p><p>2 < σ2</p><p>2 Fobs < Fv1; v2;1 ‑ α</p><p>H1 : : σ1</p><p>2 ≠ σ2</p><p>2 Fobs > Fv1; v2;α ou Fobs < Fv1; v2;1 ‑ α</p><p>Se o teste for normal para a variância, teremos Região Crítica (RC):</p><p>σ1</p><p>2 ≠ σ2</p><p>2</p><p>R.C.</p><p>R.C.</p><p>F1‑α/2; v1; v2 Fα/2; v1; v2</p><p>F</p><p>R.A.</p><p>f(F)</p><p>1‑α α</p><p>2</p><p>α</p><p>2</p><p>Figura 85 – Função densidade F de Fisher</p><p>184</p><p>Unidade II</p><p>g(f)</p><p>F(v1, v2) = 1</p><p>F(v2, v1)</p><p>α</p><p>0 f0 f</p><p>Figura 86 – Gráfico da distribuição F</p><p>Exemplo 89: um teste de econometria foi dado a 25 rapazes e 30 moças. Os rapazes tiveram média</p><p>83 com desvio‑padrão 7, enquanto as moças média de 78, com desvio‑padrão de 8. Testar a hipótese de</p><p>σ1</p><p>2 = σ2</p><p>2 contra σ1</p><p>2 ≠ σ2</p><p>2, sendo α = 0,05.</p><p>Resolução: teste de hipótese para duas variâncias:</p><p>H0 : σ1</p><p>2 = σ2</p><p>2</p><p>H1 : σ1</p><p>2 ≠ σ2</p><p>2</p><p>Nível de significância de 5% e teste bicaudal, então:</p><p>Fobs > Fv1; v2; α = F24; 29; 5% = 1,90</p><p>Devemos, agora, calcular a estatística do teste:</p><p>F</p><p>S</p><p>S</p><p>obs = = =1</p><p>2</p><p>2</p><p>2</p><p>49</p><p>64</p><p>0 766,</p><p>Conclusão: devemos aceitar H0, pois Fobs = 0,766 < F24; 29; 5% = 1,90, isto é, não foram encontradas</p><p>evidências significativas para comprovar que existe diferença nas variâncias das populações.</p><p>Exemplo 90: seja o seguinte conjunto de preços de geladeiras em 7 lojas distintas:</p><p>750,00 800,00 790,00 810,00 820,00 760,00 780,00</p><p>X1 = 787,14 s1 = 25,63</p><p>185</p><p>ESTATÍSTICA ECONÔMICA — INTRODUÇÃO À ECONOMETRIA</p><p>Seja o seguinte conjunto de preços de liquidificadores nas mesmas lojas acima:</p><p>50,00 45,00 55,00 43,00 52,00 45,00 54,00</p><p>X1 = 49,14 s1 = 4,81</p><p>Existe diferença entre as variâncias dos dois produtos ao nível de significância de 0,05?</p><p>Resolução: teste de hipótese para duas variâncias:</p><p>H0 : σ1</p><p>2 = σ2</p><p>2</p><p>H1 : σ1</p><p>2 ≠ σ2</p><p>2</p><p>Nível de significância de 5% e teste bicaudal, então:</p><p>Fobs > Fv1; v2; α = F6; 6; 5% = 4,28</p><p>Devemos, agora, calcular a estatística do teste:</p><p>F</p><p>S</p><p>S</p><p>obs = = =1</p><p>2</p><p>2</p><p>2</p><p>656 90</p><p>2314</p><p>28 39</p><p>,</p><p>,</p><p>,</p><p>Conclusão: devemos rejeitar H0, pois Fobs = 28,39 > F6; 6; 5% = 4,28, isto é, foram encontradas evidências</p><p>significativas para comprovar que existe diferença nas variâncias de preços dos liquidificadores e</p><p>das geladeiras.</p><p>Exemplo 91: a precisão na dosagem</p><p>de duas empacotadoras de cereais deve ser avaliada para</p><p>descobrir se, de fato, elas estão fornecendo o mesmo peso médio em kg. Duas amostras foram</p><p>extraídas, uma de cada empacotadora (supõe‑se que os pesos das amostras se aproximem de uma</p><p>distribuição normal):</p><p>Máquina nacional – 50 amostras, média = 0,90 kg, variância = 0,0141 kg2.</p><p>Máquina importada – 55 amostras, média = 0,88 kg, variância = 0,0367 kg2.</p><p>Qual a decisão de compra a 5% de significância?</p><p>Resolução: a proposta do exemplo tem por objetivo comparar as médias de duas distribuições</p><p>consideradas normais, mas de duas populações (máquinas) distintas, na qual podemos supor que as</p><p>amostras sejam independentes. O interesse está em verificar se há diferença entre as médias das duas</p><p>populações (para mais ou para menos, isto é bidirecional). Assim, por exigir que se tome uma decisão,</p><p>186</p><p>Unidade II</p><p>iremos aplicar um teste de hipótese que envolve diferenças entre médias populacionais para dados</p><p>não pareados (populações distintas).</p><p>De acordo com a proposta, a definição da hipótese nula H0 é a de considerar que não há diferença</p><p>entre as médias das duas máquinas (importada e nacional). Em H0 é de costume colocarmos o contrário</p><p>do que queremos provar, ou seja, a diferença entre as médias deve ser supostamente igual a zero.</p><p>Teremos então:</p><p>H0 : µ1 = µ2</p><p>H1 : µ1 ≠ µ2</p><p>Em que µ1 =µnacional e µ2 = µimportada</p><p>Conforme estabelecido no enunciado do problema:</p><p>αα= 0,05 (nível de significância) ,</p><p>�</p><p>2</p><p>0 025�</p><p>1 ‑ αα= 0,95 (nível de confiabilidade)</p><p>Identificamos três possíveis variáveis de teste, dependendo das condições do problema, que</p><p>apontam de forma mais diretas para as variâncias das duas populações:</p><p>a) Se as variâncias de ambas as populações forem conhecidas, o que dificilmente ocorre, deveremos</p><p>utilizar a variável Z da distribuição normal padronizada.</p><p>b) Se as variâncias populacionais forem desconhecidas, deveremos usar a variável t da distribuição de</p><p>Student, porém os graus de liberdade dessa variável dependerão do fato de as variâncias serem:</p><p>• iguais: g.l. = n1 + n2 ‑ 2 graus de liberdade, em que n1 e n2 são os tamanhos das amostras;</p><p>• diferentes: quando a variável terá v graus de liberdade, cuja expressão de cálculo está</p><p>na Fórmula 45.</p><p>Se não conhecermos as variâncias populacionais, como poderemos saber se são iguais ou diferentes?</p><p>Esta é a questão a ser resolvida.</p><p>Para solucionar esse problema, é necessário realizar o teste F (de Snedecor) de diferença entre</p><p>variâncias populacionais (ou teste de razão entre variâncias, já que a variável do teste é um quociente</p><p>entre as duas variâncias amostrais).</p><p>Ao aplicarmos um teste de diferença entre médias de duas populações distintas, a princípio, devemos</p><p>fazer um outro teste para verificar se suas variâncias, caso desconhecidas, são iguais ou diferentes.</p><p>187</p><p>ESTATÍSTICA ECONÔMICA — INTRODUÇÃO À ECONOMETRIA</p><p>No caso em questão, as variâncias populacionais são desconhecidas, portanto devemos realizar o</p><p>teste F de Snedecor para obtermos a variável de teste com o número correto de graus de liberdade.</p><p>Teste F de Snedecor:</p><p>H0: σ1</p><p>2 = σ2</p><p>2</p><p>H1: σ1</p><p>2 ≠ σ2</p><p>2</p><p>Em que: s s e s snacional importada1</p><p>2 2</p><p>2</p><p>2 2= =</p><p>O propósito é verificar se há diferença entre as variâncias; assim, o teste será sempre bilateral.</p><p>Nível de significância: como a tabela da distribuição F de Fisher‑Snedecor (Tabela A4a: valores</p><p>de F0,05, no AVA) apresenta valores apenas para 5% de significância (teste monocaudal direito:</p><p>P(F < α) = P), este será o nível adotado em todos os testes F (níveis diferentes poderão ser utilizados, vide</p><p>Tabela A4b e A4c, no AVA). Porém, nesse caso, em que o teste F é bicaudal, podemos obter seu valor por</p><p>meio do Microsoft Excel, consultando a função INVF usada para retornar valores críticos da distribuição</p><p>F. Utilizando a sintaxe: INVF (probabilidade, graus liberdade 1, graus liberdade 2) = INVF (0,025; 54; 49),</p><p>retornará ao valor de 1,75, isto é, F54; 49; 0,025 = 1,75, valor crítico ou da tabela.</p><p>Saiba mais</p><p>Para calcular por meio do Microsoft Excel, consultando a função INVF</p><p>para aprofundamento do uso de suas ferramentas, indicamos o livro‑texto:</p><p>LEVINE, D. M. et al. Estatística: teoria e aplicações – usando Microsoft</p><p>Excel em português. Rio de Janeiro: LTC, 2013.</p><p>Encontrarmos a maior variância amostral, que será chamada de SA</p><p>2 (e, por conseguinte, nA), e a</p><p>menor, que será chamada de SB</p><p>2 (e, por conseguinte, nB).</p><p>Portanto, teremos:</p><p>,S S kg e n</p><p>S S</p><p>A importada A</p><p>B naciona</p><p>2 2 2</p><p>2</p><p>0 0367 55= = =</p><p>= ll Bkg e n2 20 0141 50= =,</p><p>188</p><p>Unidade II</p><p>Assim, a variável de teste do teste F será:</p><p>F</p><p>S</p><p>S</p><p>FnA nB</p><p>A</p><p>B</p><p>� � � �� � �1 1</p><p>2</p><p>2 54 49</p><p>0 0367</p><p>0 0141</p><p>2 60; ;</p><p>,</p><p>,</p><p>, �</p><p>Essa variável assemelha‑se a uma distribuição amostral chamada de distribuição F de Fisher (ou</p><p>de Snedecor) trata‑se de uma distribuição assimétrica positiva que varia de zero a mais infinito e que</p><p>possui graus de liberdade associados ao numerador e ao denominador de um quociente. Observemos a</p><p>figura de uma distribuição F com 54 e 49 graus de liberdade.</p><p>0,975</p><p>F de Fisher (F54;49)</p><p>probabilidades:</p><p>1.750</p><p>0,025</p><p>Figura 87</p><p>Lembrete</p><p>A qui‑quadrado é uma distribuição assimétrica positiva que varia de</p><p>zero a mais infinito.</p><p>A variável calculada F54; 49 = 2,60 será comparada com um valor crítico, que pela tabela será</p><p>F54; 49; 0,025 = 1,75, sendo 54 o número de graus de liberdade do numerador da estatística e 49 o número</p><p>de graus de liberdade do denominador da estatística) para 5% de significância ( α</p><p>2</p><p>= 0,025, por ser um</p><p>teste bicaudal).</p><p>Como o valor da variável F54; 49 = 2,60 é maior do que o valor crítico F54; 49; 0,025 = 1,75), podemos</p><p>rejeitar a hipótese de que as variâncias populacionais, desconhecidas, sejam iguais, com um nível de</p><p>confiança de 95% (ou com uma margem de erro de 5%). Em resposta à questão, a nossa variável t</p><p>de Student terá v graus de liberdade.</p><p>Assim, como as variâncias populacionais são desconhecidas e supostamente diferentes, ao aplicarmos</p><p>o teste F de Fisher‑Snedecor a variável t terá v graus de liberdade, que serão calculados a seguir:</p><p>189</p><p>ESTATÍSTICA ECONÔMICA — INTRODUÇÃO À ECONOMETRIA</p><p>v</p><p>w w</p><p>w</p><p>n</p><p>w</p><p>n</p><p>A B</p><p>A</p><p>A</p><p>B</p><p>B</p><p>�</p><p>�� �</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>2</p><p>2 2</p><p>1 1</p><p>2</p><p>w</p><p>s</p><p>nA</p><p>A</p><p>A</p><p>= = =</p><p>2 0 0367</p><p>55</p><p>0 000667</p><p>,</p><p>, (máquina importada)</p><p>em que:</p><p>w</p><p>s</p><p>nB</p><p>B</p><p>B</p><p>= = =</p><p>2 0 0141</p><p>50</p><p>0 000282</p><p>,</p><p>, (máquina nacional)</p><p>v �</p><p>�</p><p>� �</p><p>�</p><p>�</p><p>� �</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>( , , )</p><p>, ,</p><p>0 000667 0 000282</p><p>0 000667</p><p>55 1</p><p>0 000282</p><p>50 1</p><p>2</p><p>2 2</p><p>��</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>� � �2 92 75 93, ,assim v</p><p>Então a variável de teste t de Student terá 93 graus de liberdade.</p><p>Por se tratar de um teste bilateral (com 5% de significância), e como a variável de teste é t, com</p><p>93 graus de liberdade, então o valor crítico (obtido da tabela da distribuição t de Student pelo uso da</p><p>função INVF no Microsoft Excel) será:</p><p>|tv, crítico|= |t93; 0,975| =1,99</p><p>Observe a região de aceitação de H0 na figura:</p><p>A B</p><p>α = 5%</p><p>0,0250,025</p><p>Z = 0</p><p>α/2α/2</p><p>-1,99 -1,99</p><p>1- α</p><p>NC = 95%</p><p>Figura 88</p><p>190</p><p>Unidade II</p><p>Para valores de t93 menores do que ‑1,99 ou maiores do que 1,99, ou seja, valores em módulo maiores</p><p>do que 1,99, rejeitaremos H0, logo há diferença entre as médias de peso dos pacotes das 2 máquinas</p><p>(havendo 5% de chance de que venhamos a rejeitar H0, caso seja verdadeira).</p><p>Lembrete</p><p>Módulo ou valor absoluto de um número é a distância deste número para</p><p>zero, independentemente do seu sinal, isto é, o módulo de um número será</p><p>o próprio número se ele for positivo, ou seu simétrico (positivo), se for</p><p>negativo. Exemplo: módulo de |+2|=2 e |‑2|=2.</p><p>Como as duas variâncias são desconhecidas e o teste F mostrou que são diferentes, calculamos o</p><p>desvio-padrão das diferenças a seguir:</p><p>s</p><p>s</p><p>n</p><p>s</p><p>n</p><p>kgd</p><p>A</p><p>A</p><p>B</p><p>B</p><p>� � � � � � �</p><p>2 2</p><p>20 0367</p><p>55</p><p>0 0141</p><p>50</p><p>3 081 10</p><p>, ,</p><p>,</p><p>Novamente, como as duas variâncias são desconhecidas e o teste F mostrou que são diferentes,</p><p>iremos utilizar a expressão a seguir para calcular o valor da variável de teste:</p><p>t</p><p>x x</p><p>s</p><p>t tv</p><p>d</p><p>�</p><p>�</p><p>��</p><p>�</p><p>�</p><p>�</p><p>� �� ��</p><p>1 2</p><p>50 2 93</p><p>0 90 0 88</p><p>3 081 10</p><p>0 65 0 65</p><p>, ,</p><p>,</p><p>, ,</p><p>Conforme visto anteriormente, decidir pela aceitação ou rejeição de H0 implica verificar se o</p><p>módulo da variável de teste é maior do que 1,99, quando a hipótese H0 seria rejeitada:</p><p>tv = |t93| = 0,65 < |tv; critico| = |t93; 0,975| = 1,99</p><p>Assim, aceitamos H0 a 5% de significância.</p><p>Concluímos com 95% de confiança (ou uma margem de erro de 5%) que não há diferença entre os pesos</p><p>médios dos pacotes fornecidos pelas duas máquinas. Portanto, sem perder a precisão na dosagem, é recomendável</p><p>decidirmos pela compra de novas máquinas de procedência nacional, visto que o seu preço é menor.</p><p>Observação</p><p>Você pode analisar as distribuições de renda entre dois países para</p><p>determinar se eles têm um grau de diversidade de renda semelhante</p><p>utilizando a distribuição F (teste F, que compara o grau de variabilidade</p><p>em dois conjuntos de dados).</p><p>191</p><p>ESTATÍSTICA ECONÔMICA — INTRODUÇÃO À ECONOMETRIA</p><p>Exemplo 92 (Bussab, 2011): deseja‑se verificar se duas máquinas produzem peças com a mesma</p><p>homogeneidade quanto à resistência à tensão. Para tal, sorteiam‑se duas amostras de 6 peças de cada</p><p>uma das máquinas e observa‑se as resistências. Os resultados estão apresentados a seguir:</p><p>Máquina X: 145 127 136 142 141 137</p><p>Máquina Y: 143 128 132 138 142 132</p><p>Resolução:</p><p>H0: σ x</p><p>2 = σ y</p><p>2 = σ2</p><p>H1: σ x</p><p>2 ≠ σ y</p><p>2</p><p>X</p><p>X</p><p>n</p><p>i</p><p>n</p><p>i</p><p>1</p><p>1</p><p>1</p><p>1</p><p>828</p><p>6</p><p>138 00� � ���</p><p>,</p><p>X</p><p>Y</p><p>n</p><p>S</p><p>X X</p><p>n</p><p>i</p><p>n</p><p>i</p><p>i</p><p>n</p><p>i</p><p>2</p><p>1</p><p>2</p><p>2</p><p>1</p><p>2 1 1</p><p>2</p><p>1</p><p>815</p><p>6</p><p>135 83</p><p>1</p><p>49 121 4 16</p><p>� � �</p><p>�</p><p>�</p><p>�</p><p>�</p><p>� � �</p><p>�</p><p>�</p><p>�</p><p>�</p><p>,</p><p>( ) �� �</p><p>� �</p><p>�</p><p>�</p><p>�</p><p>�</p><p>� � ���</p><p>9 1</p><p>5</p><p>200</p><p>5</p><p>40</p><p>1</p><p>5136 6136 14 69 4 69</p><p>2</p><p>2 1 2</p><p>2</p><p>2</p><p>S</p><p>X X</p><p>n</p><p>i</p><p>m</p><p>i( ) , , , , �� �</p><p>� � �</p><p>38 03 14 69</p><p>5</p><p>184 82</p><p>5</p><p>36 96 37</p><p>, , ,</p><p>,</p><p>Fixando α = 10%</p><p>Como n1 = n2 = 6, tem‑se que:</p><p>Q</p><p>S</p><p>S</p><p>F n n F� � � �� � � � � �1</p><p>2</p><p>2</p><p>2 1 21 1 5 5 5 05; ; ,</p><p>192</p><p>Unidade II</p><p>Fórmula 49</p><p>Q</p><p>S</p><p>S</p><p>X</p><p>n</p><p>X</p><p>n</p><p>F n n</p><p>n</p><p>n</p><p>� �</p><p>�</p><p>�</p><p>� � �� �</p><p>�</p><p>�</p><p>1</p><p>2</p><p>2</p><p>2</p><p>1</p><p>2</p><p>1 1</p><p>2</p><p>1</p><p>2</p><p>2</p><p>2 1</p><p>2</p><p>2</p><p>1 2</p><p>1</p><p>1</p><p>1 1</p><p>�</p><p>�</p><p>;</p><p>A região crítica RC será: RC = (0; 1 / F(n1 ‑ 1); (n2 ‑ 1)) ∪ (F(n1 ‑ 1); (n2 ‑ 1); ∞)</p><p>RC = (0; 1 / 5,05) ∪ (5,05; ∞) = (0; 0,20) ∪ (5,05; ∞)</p><p>As amostras fornecem: S1</p><p>2 = 40 e S2</p><p>2 = 37, portanto a distribuição do quociente Q calculado será:</p><p>Q</p><p>S</p><p>S</p><p>c = = =1</p><p>2</p><p>2</p><p>2</p><p>40</p><p>37</p><p>108,</p><p>Por esses resultados não é possível rejeitar a hipótese de igualdade entre as variâncias a um nível</p><p>de significância de 10% (como o teste é bilateral, ele envolve uma área de 5% em cada cauda da</p><p>distribuição, logo a significância total é de 10%).</p><p>193</p><p>ESTATÍSTICA ECONÔMICA — INTRODUÇÃO À ECONOMETRIA</p><p>Resumo</p><p>Conforme visto nesta unidade, a economia é abrangente, e à medida</p><p>que a realidade se torna complexa, aumenta‑se a necessidade de um maior</p><p>nível de rigor e de sistematização na tentativa de antecipar o futuro.</p><p>Essa questão tão importante para o economista compõe a base do que</p><p>foi contemplado nesta unidade: testar hipóteses (comparação entre grupos)</p><p>a partir do conhecimento de uma amostra e da probabilidade associada ao</p><p>seu comportamento, bem como inferir seus resultados à população em</p><p>geral, a fim de prever acontecimentos.</p><p>O teste de hipótese oferece um procedimento científico para estimar a</p><p>validade de uma alegação sobre uma população e tirar conclusões.</p><p>Foram apresentados os conceitos teóricos com vários exemplos</p><p>envolvendo testes paramétricos e não paramétricos (média, variância,</p><p>proporção) com uma amostra, bem como os testes de hipóteses para</p><p>diferenças com duas amostras – envolvendo as distribuições normal,</p><p>t de Student, qui‑quadrado e F de Fisher‑Snedecor. Um teste de hipótese</p><p>estatística é o procedimento ou a regra de decisão que nos possibilita decidir</p><p>entre duas hipóteses (H0 ou H1), com base na informação contida na amostra.</p><p>Delinearam‑se as etapas do teste de hipótese, tipos de erros, se o</p><p>teste é bilateral ou unilateral, e o teste para qualidade de ajustamento</p><p>(qui‑quadrado) usado para testar se uma distribuição de frequência se</p><p>ajusta a uma distribuição prevista. Teste de qui‑quadrado em tabelas de</p><p>contingência é usado para testar se duas variáveis são independentes.</p><p>Formas possíveis de conduzir experimentos de amostras independentes e</p><p>amostras dependentes ou emparelhadas.</p><p>194</p><p>Unidade II</p><p>Exercícios</p><p>Questão 1. Um cereal é ensacado automaticamente, sendo o peso médio da saca igual a 60 kg, com</p><p>desvio‑padrão de 1,8 kg. Haverá uma indenização de R$ 6,00 para cada saca fornecida com menos de</p><p>58 kg. Admitindo‑se que o peso das sacas tenha distribuição normal, qual será o custo médio no caso</p><p>de serem fornecidas 100 sacas? Para a resolução do exercício, utilize a tabela da distribuição normal</p><p>reduzida, a seguir.</p><p>Tabela 40 – Distribuição normal reduzida</p><p>Z 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09</p><p>0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359</p><p>0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753</p><p>0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141</p><p>0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517</p><p>0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879</p><p>0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224</p><p>0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549</p><p>0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852</p><p>0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133</p><p>0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389</p><p>1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621</p><p>1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830</p><p>1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015</p><p>1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177</p><p>1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319</p><p>1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441</p><p>A) R$ 78,00.</p><p>B) R$ 80,10.</p><p>C) R$ 81,00.</p><p>D) R$ 119,90.</p><p>E) R$ 219,90.</p><p>Resposta correta: alternativa B.</p><p>195</p><p>ESTATÍSTICA ECONÔMICA — INTRODUÇÃO À ECONOMETRIA</p><p>Resolução do exercício</p><p>Z �</p><p>�</p><p>�</p><p>�</p><p>� �</p><p>58 60</p><p>18</p><p>2</p><p>18</p><p>111</p><p>, ,</p><p>,�</p><p>Para consultar a tabela, usa‑se o valor absoluto de z, em que 1,10 é a referência da linha e 0,01 é</p><p>referência da coluna:</p><p>Z 0,01</p><p>1,10 0,3665</p><p>50% – 36,65% = 13,35%</p><p>58 60</p><p>13,35%</p><p>36,65%</p><p>Figura 89</p><p>Portanto, a probabilidade de uma saca ter menos que 58 kg é de 13,35%.</p><p>No caso de serem fornecidas 100 sacas, teremos aproximadamente 100 sacas * 13,35% = 13,35 sacas</p><p>com menos de 58 kg. Como a indenização é de R$ 6,00, temos que: 13,35*6 = 80,10. Logo, o custo médio</p><p>de indenização no caso de serem fornecidas 100 sacas será de R$ 80,10.</p><p>Questão 2. Leia o enunciado e assinale a alternativa correta. Deseja‑se testar a hipótese H0: µ = 20</p><p>contra H1: µ > 20. Sabe‑se que o desvio‑padrão da população é 4 e que a amostra é composta por 16</p><p>elementos e apresentou média de 21,8. Considere que a população tem distribuição normal e admita um</p><p>nível de significância de 5%. Assim:</p><p>A) Deve‑se aceitar H0.</p><p>B) Deve‑se rejeitar H0.</p><p>196</p><p>Unidade II</p><p>C) O valor de z pela tabela da curva normal é 2,16.</p><p>D) A média da população é igual a 20.</p><p>E) H0 deverá ser rejeitada quando a média amostral for menor ou igual a 21,645.</p><p>Resposta correta: alternativa B.</p><p>Análise das alternativas</p><p>A) Alternativa incorreta.</p><p>Justificativa: como a média amostral é 21,8 (dada no enunciado), devemos rejeitar H0, ou seja, a</p><p>média da população não é igual a 20, com probabilidade de erro de 5%.</p><p>B) Alternativa correta.</p><p>Justificativa: indicaremos por X (xis barra) a média da amostra e por μ, a média da população que,</p><p>por hipótese, vale 20. Graficamente, temos:</p><p>µ=20 X</p><p>Figura 90</p><p>Como a hipótese alternativa é μ > 20, devemos procurar um limite crítico à direita para valores</p><p>de X. Assim:</p><p>µ=20</p><p>X</p><p>Xc</p><p>Região de aceitação de H0 Região de rejeição de H0</p><p>Figura 91</p><p>197</p><p>ESTATÍSTICA ECONÔMICA — INTRODUÇÃO À ECONOMETRIA</p><p>A área pintada à</p><p>direita de Xc corresponde à probabilidade de rejeitar H0 quando ela for verdadeira,</p><p>ou seja, a área representa o nível de significância do teste. Para encontrar X, usamos a fórmula:</p><p>Xc=1,645+20=21,645</p><p>Usando a tabela da curva normal, devemos lembrar que ela fornece a probabilidade dada pela área</p><p>entre um valor xi e a média. Portanto, devemos procurar na tabela o valor de z correspondente à área de</p><p>0,45 (ou 45%, entre X e μ = 20). Esse valor é 1,645.</p><p>Assim, aplicando a fórmula, temos:</p><p>Xc=1,645+20=21,645</p><p>Xc=1,645+20=21,645</p><p>A regra de decisão será:</p><p>• Rejeita‑se H0 quando a média amostral for maior que 21,645.</p><p>• Aceita‑se H0 quando a média amostral for menor ou igual a 21,645.</p><p>• Como a média amostral é 21,8 (dada no enunciado), devemos rejeitar H0, ou seja, a média da</p><p>população não é igual a 20, com probabilidade de erro de 5%.</p><p>C) Alternativa incorreta.</p><p>Justificativa: o valor de z correspondente à área de 0,45 (ou 45%, entre X e μ = 20). Esse valor é 1,645.</p><p>D) Alternativa incorreta.</p><p>Justificativa: a média amostral é 21,645.</p><p>E) Alternativa incorreta.</p><p>Justificativa: aceita‑se H0 quando a média amostral for menor ou igual a 21,645.</p><p>de se cometer o erro Tipo II é aumentar com coerência o tamanho</p><p>da amostra para termos mais argumentos nas investigações de diferenças, mesmo pequenas, entre</p><p>parâmetros da amostra e população.</p><p>Quanto maior o tamanho da amostra, maior sua representatividade, portanto maior será o poder do</p><p>teste, isto é: maior será a probabilidade de rejeitarmos H0 falso.</p><p>X N X N</p><p>n</p><p>~ ; ~ ;� � �</p><p>�2</p><p>2</p><p>� � �� �</p><p>�</p><p>��</p><p>�</p><p>�</p><p>��</p><p>A título de ilustração, apresentam‑se na figura a seguir as distribuições amostrais de X para n</p><p>= 16 e n = 4.</p><p>0,18</p><p>0,16</p><p>0,14</p><p>0,12</p><p>0,1</p><p>0,08</p><p>0,06</p><p>0,04</p><p>0,02</p><p>0</p><p>60 70 80 90 100 110 120 130 140</p><p>N(100;100/4)</p><p>N(100;100/16)</p><p>Figura 57 – Distribuição amostral de X com base em amostras de</p><p>tamanho n = 16 e n = 4 de uma população N(100; 100)</p><p>122</p><p>Unidade II</p><p>Observação</p><p>Se n for grande, a distribuição da estatística de teste será aproximada</p><p>pela normal.</p><p>P(não rejeita H0 / H0 verdadeira)</p><p>β=P(não rejeita H0 / H1 verdadeira)</p><p>Não rejeitar H0 Rejeitar H0</p><p>α=P(rejeita H0 / H0 verdadeira)</p><p>Potência=P(rejeita H0 / H1 verdadeira)</p><p>pα^</p><p>p0</p><p>p'</p><p>pα^</p><p>Figura 58 – Distribuição normal padronizada (Z)</p><p>Na figura apresentamos a distribuição estatística de teste para um valor específico do parâmetro</p><p>p̂ α no caso de H0 ser verdadeira (normal superior) e para um valor específico do parâmetro p’, no caso</p><p>de H1 ser verdadeira (normal inferior).</p><p>Algumas conclusões são evidentes na figura:</p><p>• Quanto mais p̂ α estiver para a direita, isto é, quanto menor for o nível de significância do teste,</p><p>ou a probabilidade de cometer o erro Tipo I, maior será a probabilidade de cometer o erro Tipo II.</p><p>Assim, não é possível minimizar os dois erros ao mesmo tempo, a não ser aumentando o tamanho</p><p>da amostra. Efetivamente, se aumentarmos o tamanho da amostra extraída, as normais ficarão</p><p>mais “concentradas” (região crítica fica mais estreita) já que a variância diminuirá;</p><p>123</p><p>ESTATÍSTICA ECONÔMICA — INTRODUÇÃO À ECONOMETRIA</p><p>• Quanto menor for o erro Tipo II, maior será a potência do teste;</p><p>• No caso de H0 ser falsa, a potência do teste será tanto maior quanto mais afastado de p0, estiver</p><p>o verdadeiro valor da proporção p (a normal de baixo afasta‑se para a direita).</p><p>Exemplo 62: consideremos uma população representada por uma variável aleatória normal com</p><p>média µ e variância 400. Deseja‑se testar:</p><p>H0: µ = 100</p><p>H1: µ ≠ 100</p><p>Com base em uma amostra aleatória simples de tamanho n = 16. Para tal, define‑se a seguinte</p><p>região crítica:</p><p>RC: X < 85 ou X > 115</p><p>1) Calcule a probabilidade do erro Tipo I;</p><p>2) Calcule a função poder do teste para os seguintes valores de µ: 75, 80, 85, 90, 95, 100, 105, 110,</p><p>115, 125. Quanto vale a função poder do teste quando µ = 100?</p><p>Resolução: como queremos fazer um teste sobre a média da população, é natural usarmos X como</p><p>estatística de teste. Como a população é normal com média µ e variância 400, sabemos que X também</p><p>é normal com média µ e variância</p><p>400</p><p>16</p><p>25= .</p><p>1. Sob a hipótese nula, µ = 100. Então,</p><p>α = P(rejeitar H0 / H0 verdadeira) = P[{X < 85} ∪ {X > 115} | X ~ N(100;25)]</p><p>= P[ X < 85 | X ~ N(100; 25)] + P[ X > 115 | X ~ N(100; 25)]</p><p>� �</p><p>��</p><p>�</p><p>�</p><p>�</p><p>�</p><p>� � �</p><p>��</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�P Z P Z</p><p>85 100</p><p>5</p><p>115 100</p><p>5</p><p>= P(Z < ‑ 3) + P(Z > 3)</p><p>= 2 x P(Z > 3)</p><p>= 2 x [0,5 ‑ P(0 ≤ Z ≥ 3)]</p><p>= 0,0027</p><p>124</p><p>Unidade II</p><p>2. A função poder é dada por:</p><p>1 ‑ β(µ) = 1‑ P(não rejeitar H0 | µ)</p><p>= 1‑ P(85 ≤ X ≤115 | µ)</p><p>=1‑ P(85 ≤ X ≤115 | X ~ N(µ; 25))</p><p>� �</p><p>�</p><p>� �</p><p>��</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�1</p><p>85</p><p>5</p><p>115</p><p>5</p><p>P Z</p><p>� �</p><p>Vamos ilustrar o cálculo para µ = 75:</p><p>1 ‑ β(75) = 1‑ P (2 ≤ Z ≤ 8)</p><p>= 0,5 + P(0 ≤ Z ≤ 2) = 0,97725</p><p>De forma análoga, obtemos a seguinte tabela.</p><p>Tabela 21</p><p>µ 1 - β(µ)</p><p>75 0,97725</p><p>80 0,84134</p><p>85 0,50000</p><p>90 0,15866</p><p>95 0,02278</p><p>100 0,00270</p><p>105 0,02278</p><p>110 0,15866</p><p>115 0,50000</p><p>120 0,84134</p><p>125 0,97725</p><p>Observe que para µ = 100, valor da hipótese nula, a função poder é igual à probabilidade do erro</p><p>Tipo I (nível de significância).</p><p>É interessante notar também que quanto mais distante do valor µ0 = 100, maior o poder do</p><p>teste, ou seja, há uma probabilidade mais alta de se rejeitar H0 quando o valor alternativo µ está bem</p><p>distante de µ0.</p><p>125</p><p>ESTATÍSTICA ECONÔMICA — INTRODUÇÃO À ECONOMETRIA</p><p>Considere a situação do exemplo anterior com as seguintes diferenças: o tamanho da amostra é</p><p>n = 100 e a região crítica passa a ser:</p><p>RC: X < 94 ou X > 106</p><p>Note que é razoável “estreitar” a região crítica, já que a amostra é maior.</p><p>Vamos calcular α e a função poder do teste para os mesmos valores.</p><p>Resolução: como antes, a função poder é dada por:</p><p>Q(µ) = 1 — P(não rejeitar H0 | µ)</p><p>= 1 — P(94 ≤ X ≤ 106 | µ)</p><p>= 1 — P(94 ≤ X ≤ 106 | X ~ N(µ; 4))</p><p>� �</p><p>�</p><p>� �</p><p>��</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�1</p><p>94</p><p>2</p><p>106</p><p>2</p><p>P Z</p><p>� �</p><p>Com os seguintes valores:</p><p>Tabela 22</p><p>µ Q(µ)</p><p>75 1,00000</p><p>80 1,00000</p><p>85 0,99999</p><p>90 0,97725</p><p>95 0,30854</p><p>100 0,00270</p><p>105 0,30854</p><p>110 0,97725</p><p>115 0,99999</p><p>120 1,00000</p><p>125 1,00000</p><p>Note que se esse teste tem o mesmo nível de significância do exemplo anterior: α = Q(100) = 0,0027.</p><p>Na figura a seguir temos o gráfico da função poder para os dois exemplos. Note que o poder do</p><p>teste baseado em uma amostra de tamanho 100 é sempre maior que o poder do teste baseado em uma</p><p>amostra de tamanho 16.</p><p>126</p><p>Unidade II</p><p>n=16</p><p>n=100</p><p>1.2</p><p>50 60 70 80 90 100 110 120 130</p><p>1.0</p><p>0.8</p><p>0.6</p><p>0.4</p><p>0.2</p><p>0.0</p><p>Figura 59 – Comparação do poder de dois testes</p><p>Observando as duas curvas na figura, notamos que para todos os valores alternativos de µ a</p><p>probabilidade de uma decisão correta é maior para amostras de tamanho 100 do que de tamanho 16.</p><p>Portanto, um teste com amostras maiores deve levar a resultados melhores.</p><p>Nosso interesse em detectar desvios não aleatórios (significativos) de determinado parâmetro</p><p>pode envolver desvios em ambas as direções ou apenas numa direção, ou seja, esses testes podem ser</p><p>unilaterais ou bilaterais. Os Testes Unilaterais são indicados quando se deseja investigar determinada</p><p>característica da população em relação a um único sentido (exemplo: H0 : µ = µ0 × H1 : µ > µ0 ou</p><p>H0 : µ = µ0 × H1 : µ < µ0), enquanto os Testes Bilaterais são indicados sempre que a divergência crítica</p><p>é em ambas as direções (H0 : µ = µ0 × H1 : µ ≠ µ0).</p><p>Rejeitar H0 Rejeitar H0Não rejeitar H0</p><p>H0: µ=50 cm/s</p><p>H1: µ≠50 cm/s</p><p>µ=50 cm/sµ≠50 cm/s</p><p>48.5 51.550</p><p>µ≠50 cm/s</p><p>x</p><p>Figura 60 – Região crítica do teste bilateral</p><p>127</p><p>ESTATÍSTICA ECONÔMICA — INTRODUÇÃO À ECONOMETRIA</p><p>α/2 = 0,0287 α/2 = 0,0287</p><p>48,5 51,5µ = 50 x</p><p>Figura 61 – Distribuição normal padronizada (Z)</p><p>Distribuição amostral baseada no parâmetro alegado (figura a seguir):</p><p>Concluir pela veracidade de</p><p>H0 se a estatística</p><p>de teste está neste intervalo</p><p>Rejeitar H0 se a estatística</p><p>de teste está</p><p>neste intervalo</p><p>Valor crítico</p><p>Nível de significância, α</p><p>Figura 62 – Distribuição normal padronizada (Z)</p><p>128</p><p>Unidade II</p><p>H1 : p ≠ 0,5</p><p>H1 : p < 0,5</p><p>H1 : p > 0,5</p><p>Rejeitar H0Rejeitar H0</p><p>Aceitar H0</p><p>v.c. v.c.</p><p>α/2 α/2</p><p>Rejeitar H0 Aceitar H0</p><p>v.c.</p><p>α</p><p>Rejeitar H0Aceitar H0</p><p>v.c.</p><p>α</p><p>Bilateral</p><p>Unilateral à esquerda</p><p>Unilateral à direita</p><p>Figura 63 – Distribuição normal padronizada (Z)</p><p>5.1 Teste paramétrico com uma amostra</p><p>O teste de hipóteses paramétrico é uma alegação sobre um ou mais parâmetros populacionais que</p><p>envolve fazer inferências sobre a natureza da população com base nas observações de uma amostra</p><p>extraída dessa população, ou seja, envolve determinar a magnitude da diferença entre um valor</p><p>observado de uma estatística, por exemplo, a proporção p, e o suposto valor do parâmetro (π) e então</p><p>decidir se a magnitude da diferença justifica a rejeição da hipótese. O processo segue o esquema da</p><p>figura a seguir:</p><p>129</p><p>ESTATÍSTICA ECONÔMICA — INTRODUÇÃO À ECONOMETRIA</p><p>POPULAÇÃO</p><p>Valor hipotético do</p><p>parâmetro</p><p>AMOSTRA</p><p>Valor observado da</p><p>estatística</p><p>DIFERENÇA PEQUENA</p><p>NÃO rejeitar a HIPÓTESE</p><p>DIFERENÇA GRANDE</p><p>Rejeitar a HIPÓTESE</p><p>p = 0,375^</p><p>p = 0,30</p><p>p = 0,373</p><p>Alegação p=0,30</p><p>z = 3,95</p><p>-4-4</p><p>0,240,22 0,26 0,28 0,30 0,32 0,34 0,36 0,38</p><p>-3 3 4-2 2-1 10</p><p>decisão a ser tomadahipótese alegadaamostra aleatória</p><p>Qual é a magnitude da</p><p>diferença entre o valor observado da estatística</p><p>e o valor hipotético do parâmetro?</p><p>Estatística amostral</p><p>Distribuição amostral</p><p>Valor z padronizado</p><p>Figura 64 – A lógica dos testes de hipóteses</p><p>Etapas do teste de hipóteses:</p><p>Qualquer teste de hipóteses paramétrico segue estes passos:</p><p>1. Formular as hipóteses</p><p>Estabelecer qual a hipótese nula (H0 : θ = θ0) a ser testada e qual a hipótese alternativa (H1). Alguns</p><p>exemplos são:</p><p>H0 : µ = 6 H0 : p = 0,5 H0 : σ</p><p>2 = 25</p><p>A hipótese alternativa vai depender de cada situação, mas, de forma geral, tem‑se:</p><p>H1 : θ = θ2 (hipótese simples) ou então, o que é mais comum, hipóteses compostas</p><p>H1 : θ > θ0 (teste unilateral ou unicaudal à direita)</p><p>H1 : θ < θ0 (teste unilateral ou unicaudal à esquerda)</p><p>H1 : θ ≠ θ0 (teste bilateral ou bicaudal) as hipóteses são do tipo composta</p><p>A forma mais geral de H1 é a hipótese bilateral (H1 : θ ≠ θ0).</p><p>Em algumas situações podemos ter informação que nos permita restringir o domínio da hipótese</p><p>alternativa. Por exemplo, se uma empresa farmacêutica está testando um novo medicamento para dor</p><p>de estômago com o intuito de reduzir o tempo entre a ingestão do medicamento e o alívio dos sintomas,</p><p>uma possível hipótese alternativa é:</p><p>H1 : µ < 10</p><p>130</p><p>Unidade II</p><p>Temos, então, hipóteses unilaterais à esquerda:</p><p>H1 : θ < θ0</p><p>E hipóteses unilaterais à direita:</p><p>H1 : θ > θ0</p><p>A escolha entre essas formas de hipótese alternativa se faz com base no conhecimento sobre o</p><p>problema que está sendo considerado.</p><p>2. Estabelecer a estatística (estimador) a ser utilizada</p><p>Após fixar as hipóteses é necessário determinar se a diferença entre a estatística amostral e</p><p>o suposto valor do parâmetro da população é suficiente para rejeitar a hipótese H0. Use a teoria</p><p>estatística e as informações disponíveis para definir qual a estatística (estimador), suas propriedades</p><p>e sua distribuição teórica determinada (as mais usadas: distribuição normal, distribuição t de Student,</p><p>distribuição qui‑quadrada).</p><p>A tabela a seguir mostra as relações entre parâmetros populacionais e suas correspondentes</p><p>estatísticas de teste, distribuições amostrais e estatística de teste padronizada:</p><p>Quadro 2 – Estatística de teste padronizada</p><p>Parâmetro populacional Estatística de teste Distribuição amostral Estatística de</p><p>teste padronizada</p><p>µ X</p><p>Normal (n > 30) Z</p><p>t de Student (n ≤ 30) t</p><p>p p̂ Normal Z</p><p>σ2 s2 Qui‑quadrado X2</p><p>3. Fixar o nível de significância do teste</p><p>Fixar a probabilidade de se cometer erro do Tipo I, isto é, estabelecer o nível de significância do</p><p>teste (α). Fixado o erro do Tipo I, é possível determinar o valor crítico, que é um valor lido na distribuição</p><p>amostral da estatística considerada (tabela). Esse valor vai separar a região de crítica (de rejeição) da</p><p>região de aceitação.</p><p>Observação</p><p>O nível de significância corresponde à probabilidade de se estar</p><p>enganado ao rejeitar H0 (erro de Tipo I).</p><p>131</p><p>ESTATÍSTICA ECONÔMICA — INTRODUÇÃO À ECONOMETRIA</p><p>4. Calcular a estatística de teste (a estimativa)</p><p>Por meio da amostra obtida, calcular a estimativa que servirá para aceitar ou rejeitar a hipótese</p><p>nula. Dependendo do tipo de hipótese alternativa, esse valor servirá para aceitar ou rejeitar H0. O</p><p>procedimento é:</p><p>Teste estatistico</p><p>Estatistica Parametro</p><p>Erro padrao da Es</p><p>( )</p><p>�</p><p>�</p><p>- tta icatist</p><p>í</p><p>í</p><p>í</p><p>^</p><p>~</p><p>5. Tomar a decisão</p><p>Se o valor da estatística estiver na região crítica (RC), rejeitar H0; caso contrário, aceitar H0.</p><p>Exemplo 63: uma universidade alega que a proporção de estudantes que se graduaram em quatro</p><p>anos é de 83%. Como é preciso interpretar a decisão se você rejeitar H0? E se não conseguir rejeitar H0?</p><p>Resolução: se você rejeitar H0, então pode‑se concluir que “há evidências suficientes para indicar</p><p>que a taxa de graduação em quatro anos da universidade não é 83%”. Se não conseguir rejeitar H0,</p><p>deve‑se concluir que “há evidências insuficientes para indicar que a alegação da universidade (de que a</p><p>taxa de graduação seja de 83%) seja falsa”.</p><p>As regiões críticas para α = 0,05 são:</p><p>|Z| > 1,960 para um teste bicaudal de µ = µ0 contra µ ≠ µ0 ;</p><p>Z > 1,645 para um teste monocaudal à direita de µ = µ0 contra µ > µ0 ;</p><p>Z < ‑ 1,645 para um teste monocaudal à esquerda de µ = µ0 contra µ < µ0.</p><p>Se a população é finita de tamanho N, deveremos calcular Z da seguinte forma:</p><p>Fórmula 38</p><p>Z</p><p>X</p><p>n</p><p>N n</p><p>N</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>1</p><p>6. Formular a conclusão</p><p>Com base na aceitação ou na rejeição da hipótese nula, enunciar qual a decisão a ser tomada na</p><p>situação do problema.</p><p>132</p><p>Unidade II</p><p>Exemplo 64 (Bonini, 1972): um fabricante produz um artigo que em uma amostra de 50 elementos</p><p>apresentou X = 14,8 kg. O desvio‑padrão da população é 0,5 kg. Testar a hipótese de µ = 15 kg contra a</p><p>alternativa de µ ≠ 15 kg. Usar o nível de significância de 0,01.</p><p>Resolução:</p><p>R.R. R.R.</p><p>R.A.</p><p>1 ‑ α</p><p>α</p><p>2</p><p>α</p><p>2</p><p>‑2,58=‑zα/2</p><p>zα/2=2,580 z</p><p>x1</p><p>x2</p><p>xµ0=15</p><p>Figura 65 – Distribuição normal padronizada (Z)</p><p>1) H0 : µ = 15</p><p>2) H1 : µ ≠ 15</p><p>3) αα= 0,01 (nível de significância)</p><p>4) Região crítica: Z e Z� �/ , ,2</p><p>2</p><p>2 58 2 58�� � , porque é bicaudal (H1 : µ ≠ 15).</p><p>5) Calcular:</p><p>Z</p><p>X</p><p>n</p><p>�</p><p>�</p><p>�</p><p>�</p><p>� �</p><p>,</p><p>,</p><p>,</p><p>�</p><p>�</p><p>14 8 15</p><p>0 5</p><p>50</p><p>2 828</p><p>6) Conclusão: como |Z| > Zα/2, caímos na região crítica e, portanto, rejeitamos H0.</p><p>Exemplo 65 (Bonini, 1972): Uma amostra de 100 elementos de um produto apresenta média de</p><p>71,8 kg e desvio‑padrão de 8,9 kg. Testar a hipótese de que o peso médio é maior do que 70, usando o</p><p>nível de significância de 5%.</p><p>Resolução:</p><p>1) H0 : µ = 70</p><p>133</p><p>ESTATÍSTICA ECONÔMICA — INTRODUÇÃO À ECONOMETRIA</p><p>2) H1 : µ > 70</p><p>3) αα= 0,05 (nível de significância)</p><p>4) Região crítica: Zα > 1,64, porque é monocaudal à direita (H1 : µ > 70).</p><p>5) Calcular:</p><p>Z</p><p>X</p><p>n</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>,</p><p>,</p><p>,</p><p>�</p><p>�</p><p>718 70</p><p>8 9</p><p>100</p><p>2 022</p><p>6) Conclusão: como |Z| > Zα , portanto rejeitamos a hipótese H0.</p><p>Para cada nível de significância, o teste da distribuição normal padronizada (Z) tem um valor</p><p>único crítico (por exemplo, 1,96 a 5% por duas caudas), que o torna mais conveniente do que o</p><p>teste t de Student – que tem diferentes valores críticos para cada tamanho de amostra. Portanto,</p><p>muitos testes estatísticos poderão ser convenientemente realizados como aproximação do teste da</p><p>distribuição normal padronizada (Z‑teste) se o tamanho da amostra for de grandes dimensões ou a</p><p>variância da população for conhecida. Se a variância da população σ2 for desconhecida e, portanto,</p><p>tiver de ser calculada a partir da amostra em s2 e o tamanho da amostra não for grande (n ≤ 30),</p><p>o teste t de Student poderá ser mais apropriado.</p><p>5.1.1 Teste para a média de uma população</p><p>O teste para a média de uma população pode ser executado com qualquer tamanho de amostra</p><p>se soubermos que a população de onde for extraída a amostra segue uma distribuição normal.</p><p>Se a distribuição da população não for conhecida, então será necessário trabalhar com amostras</p><p>grandes (pelo menos 30 elementos) para poder garantir a normalidade da média da amostra pelo</p><p>Teorema Central do Limite.</p><p>5.1.1.1 σ conhecido – distribuição normal</p><p>H0 : µ = µ0 × H1 : µ ≠ µ0</p><p>Passos</p><p>Teste de hipótese</p><p>Retira‑se uma amostra de tamanho n e calcula‑se X</p><p>Calcula‑se o valor da estatística:</p><p>134</p><p>Unidade II</p><p>Fórmula 39</p><p>Z</p><p>X</p><p>n</p><p>N�</p><p>��</p><p>�</p><p>~ ( , )0 1</p><p>Sob a hipótese nula, tem‑se que Z possui uma distribuição normal padrão.</p><p>Portanto:</p><p>Rejeita se H se Z Z isto Ø seZ Z ou Z Z</p><p>Aceita</p><p>-</p><p>-</p><p>, , /0</p><p>2 2</p><p>2� � � �� � �</p><p>sse H se Z Z isto é se Z Z Z, , , /0</p><p>2 2</p><p>2� � �� � �</p><p>é,</p><p>Em que α é o nível de significância do teste.</p><p>α/2 α/2</p><p>α</p><p>(a)</p><p>µ0 ‑ k</p><p>µ0 ‑ k</p><p>µ0 + k µ0 + kµ0</p><p>µ0</p><p>µ0</p><p>α</p><p>(b)</p><p>(c)</p><p>Figura 66 – Região crítica para o teste de hipótese sobre a média µ de uma normal com variância</p><p>conhecida: (a) teste bilateral; (b) teste unilateral à direita; (c) teste unilateral à esquerda</p><p>Observação</p><p>Qualquer distribuição normal pode ser trabalhada a partir de uma</p><p>distribuição normal padronizada (transformação da variável X pesquisada em</p><p>uma outra padronizada z), evitando desse modo cálculos longos e cansativos.</p><p>135</p><p>ESTATÍSTICA ECONÔMICA — INTRODUÇÃO À ECONOMETRIA</p><p>O teste para a média de uma população poderá ser executado com qualquer tamanho de amostra</p><p>se soubermos que a população de onde for extraída a amostra segue uma distribuição normal. Se a</p><p>distribuição da população não for conhecida, então será necessário trabalhar com amostras grandes</p><p>(pelo menos 30 elementos) para poder garantir a normalidade da média da amostra por meio do Teorema</p><p>Central do Limite.</p><p>As hipóteses são:</p><p>H0 : µ = µ0 contra</p><p>H1 : µ = µ1 ou então,o que é mais comum:</p><p>H1 : µ > µ0</p><p>H1 : µ < µ0</p><p>H1 : µ ≠ µ0</p><p>A estatística de teste utilizada aqui é a média da amostra: X. Essa média, para ser comparada com o</p><p>valor tabelado, determinado em função da probabilidade do erro do tipo I, (isto é, o nível de significância</p><p>do teste), precisa ser primeiramente padronizada.</p><p>Isto é feito com base no seguinte resultado:</p><p>Se X é uma variável aleatória normal com média µ e desvio‑padrão σ, então a variável</p><p>Z = (X ‑ µ) / σ</p><p>Tem uma distribuição normal com média “0” e desvio‑padrão “1”. A variável resultante Z se encontra</p><p>tabelada. Qualquer livro de estatística traz essa tabela que fornece os valores dessa variável, para z</p><p>variando de ‑3,9 até 3,9 em intervalos de 0,1 (aproximação decimal), entre ‑3,9 e ‑3,0 e entre 3,0 e 3,9,</p><p>e em intervalos de 0,01 (aproximação centesimal) para os valores entre ‑3,0 e 3,0.</p><p>Para X, sabe‑se que µx = µ (média das médias) e que �</p><p>�</p><p>x</p><p>n</p><p>� (erro‑padrão da média), então o valor</p><p>padronizado de X será:</p><p>Z</p><p>X</p><p>X</p><p>n</p><p>x</p><p>x</p><p>�</p><p>�</p><p>� �</p><p>�</p><p>�</p><p>�</p><p>�</p><p>( ) /</p><p>Supondo‑se fixado um nível de significância de α = P(erro do Tipo I), verifica‑se na tabela qual o</p><p>valor de Zα < (no teste unilateral) ou Zα/2 (teste bilateral). Rejeita‑se H0 (hipótese nula) caso o valor de z</p><p>calculado na expressão seja:</p><p>136</p><p>Unidade II</p><p>i. Maior do que Zα (no teste unilateral à direita);</p><p>ii. Menor do ‑ Zα (no teste unilateral à esquerda);</p><p>iii. Maior que Zα/2 ou menor que ‑ Zα/2 (no teste bilateral).</p><p>Tabela 23 – Valores de Z para alguns níveis de significância</p><p>αα= nível de significância = P(erro do Tipo I)</p><p>10% 5% 1%</p><p>Teste bilateral 1,64 1,96 2,57</p><p>Teste unilateral 1,28 1,64 2,33</p><p>Exemplo 66: a associação dos proprietários de indústrias metalúrgicas está preocupada com</p><p>o tempo perdido em acidentes de trabalho, cuja média, nos últimos tempos, tem sido da ordem de</p><p>60 horas/homem por ano com desvio‑padrão de 20 horas/homem. Tentou‑se um programa de prevenção</p><p>de acidentes e, após, tomou‑se uma amostra de 9 indústrias e mediu‑se o número de horas/homem</p><p>perdidas por acidente, que foi de 50 horas. Você diria, ao nível de 5%, que há evidência de melhoria?</p><p>Resolução: as hipóteses a serem testadas são:</p><p>H0 : µ = 60 horas/homem</p><p>H1 : µ < 60 horas/homem</p><p>A evidência amostral para sugerir que a média baixou é dada por meio da amostra de n = 9</p><p>(elementos), que forneceu X = 50 horas/homem. Vamos testar se essa diferença de 10 horas/homem é</p><p>ou não significativa ao nível de 5%. Para isso, é necessário padronizar o resultado amostral.</p><p>Z</p><p>X X</p><p>n</p><p>X</p><p>X</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>� �</p><p>( ) ( )</p><p>/</p><p>( )</p><p>/</p><p>,</p><p>�</p><p>�</p><p>�</p><p>�</p><p>50 60</p><p>20 9</p><p>150</p><p>Para saber se esse valor (‑1,50) é pouco provável, é necessário compará‑lo com o valor crítico</p><p>– Zα (pois se trata de um teste unilateral à esquerda) que, nesse caso, vale ‑1,64, já que o nível de</p><p>significância foi fixado em 5%. Vê‑se portanto que o valor amostral não é inferior ao valor crítico, não</p><p>estando portanto na região de rejeição. Isto quer dizer que a diferença apresentada na amostra não é</p><p>suficientemente grande para provar que a campanha de prevenção deu resultado. Então a conclusão é:</p><p>“Não é possível ao nível de 5% de significância afirmar que a campanha deu resultado, isto é, rejeitar H0”.</p><p>Convém lembrar que o fato de não rejeitar a hipótese nula não autoriza a fazer afirmações a respeito</p><p>da veracidade dela. Ou seja, não se provou H0, pois no momento em que se aceita a hipótese nula, o risco</p><p>envolvido é o do Tipo II, e este, nesse caso, não está fixado (controlado). O teste de hipóteses é feito para</p><p>137</p><p>ESTATÍSTICA ECONÔMICA — INTRODUÇÃO À ECONOMETRIA</p><p>rejeitar a hipótese nula, e sua força está na rejeição. Assim, quando se rejeita, prova‑se algo, mas quando</p><p>se aceita, nada se pode afirmar.</p><p>Exemplo 67: supor uma população em que o peso dos indivíduos seja distribuído normalmente com</p><p>média 68 kg e desvio‑padrão 4 kg. Determinar a proporção de indivíduos.</p><p>a) abaixo de 66 kg;</p><p>b) acima de 72 kg;</p><p>c) entre 66 e 72 kg.</p><p>Lembrete</p><p>As probabilidades para uma distribuição normal com qualquer</p><p>média e variância podem ser determinadas pelas tabelas de uma</p><p>distribuição normal padrão.</p><p>Resolução:</p><p>a P X P</p><p>X</p><p>P Z P Z</p><p>P Z</p><p>) , ( , )</p><p>, (</p><p>�� � � �</p><p>�</p><p>��</p><p>�</p><p>�</p><p>�</p><p>�</p><p>� � � �� � � � �</p><p>� � �</p><p>66</p><p>66 68</p><p>4</p><p>0 5 0 5</p><p>0 5 0</p><p>�</p><p>�</p><p>�� � � �</p><p>�� � � �</p><p>�</p><p>��</p><p>�</p><p>�</p><p>�</p><p>�</p><p>� � �</p><p>0 5 0 5 0 1915 0 3085</p><p>72</p><p>72 68</p><p>4</p><p>1</p><p>, ) , , ,</p><p>) ,b P X P</p><p>X</p><p>P Z</p><p>�</p><p>�</p><p>00 10</p><p>0 5 0 10 0 5 0 3413 0 1587</p><p>66 72</p><p>� � � � �</p><p>� � � � � � �</p><p>� ��</p><p>P Z</p><p>P Z</p><p>c P X</p><p>( , )</p><p>, ( , ) , , ,</p><p>) �� � �</p><p>�</p><p>�</p><p>�</p><p>��</p><p>�</p><p>�</p><p>�</p><p>�</p><p>� � � �</p><p>�</p><p>��</p><p>�</p><p>�</p><p>�</p><p>�</p><p>� �</p><p>� ��</p><p>P</p><p>X</p><p>P</p><p>x</p><p>P Z</p><p>66 68</p><p>4</p><p>72 68</p><p>4</p><p>0 5 10</p><p>10</p><p>�</p><p>�</p><p>�</p><p>�</p><p>, ,</p><p>, �� � � �� � � � �</p><p>� � � � � � �</p><p>P Z ou</p><p>P Z P Z</p><p>0 5 0 8413 0 3085 0 5328</p><p>0 0 5 0 10</p><p>, , , ,</p><p>( , ) ( , ) 00 1915 0 3413 0 5328, , ,� �</p><p>Exemplo 68: uma máquina automática para encher pacotes de café enche‑os segundo uma</p><p>distribuição normal, com média µ e variância sempre igual a 400 g. A máquina foi regulada para</p><p>µ = 500 g. Colhe‑se, periodicamente, uma amostra de 16 pacotes para verificar se a produção está sob</p><p>controle, isto é, se µ = 500 g ou não. Se uma dessas amostras apresentasse uma média amostral de</p><p>492 g, você pararia ou não a produção para regular a máquina, considerando o nível de significância</p><p>de 1%? Para quais valores de média amostral a máquina será regulada?</p><p>138</p><p>Unidade II</p><p>Resolução: as hipóteses são:</p><p>H0 : µ = 500 × H1 : µ ≠ 500</p><p>Pelos dados do problema a variância é sempre a mesma e igual a σ2 = 400.</p><p>A estatística a ser calculada é:</p><p>Z �</p><p>�</p><p>� �</p><p>( )</p><p>/</p><p>,</p><p>492 500</p><p>20 16</p><p>160</p><p>Ao nível de significância de 0,01, a regra de decisão é:</p><p>Rejeita se H se Z Z- 0</p><p>2</p><p>2 58� �� ,</p><p>Aceita se H se Z Z- 0</p><p>2</p><p>2 58� �� ,</p><p>Portanto, aceita‑se H0, e a máquina não necessita ser parada.</p><p>Exemplo 69: a tensão de ruptura dos cabos produzidos por um fabricante apresenta média de</p><p>1.800 kg e desvio‑padrão de 100 kg. Mediante nova técnica no processo de fabricação, proclama‑se</p><p>que a tensão de ruptura pode ter aumentado. Para testar essa declaração, ensaiou‑se uma amostra de</p><p>50 cabos, tendo‑se determinado a tensão média de ruptura de 1.850 kg. Pode‑se confirmar a declaração</p><p>ao nível de significância de 0,01?</p><p>Resolução: as hipóteses são:</p><p>H0 : µ = 1800 × H1 : µ > 1800</p><p>Pelos dados do problema o desvio‑padrão é sempre o mesmo e igual a σ = 100. A estatística a ser</p><p>calculada é:</p><p>Z �</p><p>�</p><p>�</p><p>( )</p><p>/</p><p>,</p><p>1850 1800</p><p>100 50</p><p>3 55</p><p>139</p><p>ESTATÍSTICA ECONÔMICA — INTRODUÇÃO À ECONOMETRIA</p><p>Ao nível de significância de 0,01, a regra de decisão é:</p><p>Rejeita se H se Z Z</p><p>Aceita se H se Z Z</p><p>-</p><p>-</p><p>,</p><p>,</p><p>0</p><p>2</p><p>0</p><p>2</p><p>2 33</p><p>2 33</p><p>� �</p><p>� �</p><p>�</p><p>�</p><p>Portanto, rejeita‑se H0, e confirma‑se a declaração.</p><p>5.1.1.2 σ desconhecido (distribuição t de Student)</p><p>H0 : µ = µ0 × H1 : µ ≠ µ0</p><p>Calcula‑se a estatística:</p><p>Fórmula 40</p><p>t</p><p>X</p><p>S</p><p>n</p><p>�</p><p>��</p><p>Sob a hipótese nula, tem‑se que t possui uma distribuição t de Student com (n ‑ 1) graus de</p><p>liberdade. Portanto:</p><p>Rejeita se H se t t</p><p>Aceita se H se t t</p><p>n</p><p>n</p><p>-</p><p>-</p><p>,</p><p>,</p><p>0</p><p>2</p><p>1</p><p>0</p><p>2</p><p>1</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>no qual α é o nível de significância do teste.</p><p>Quando o desvio‑padrão populacional (σ) é desconhecido, é necessário estimá‑lo pelo desvio‑padrão</p><p>da amostra (s). Mas, ao substituir o desvio‑padrão da população na expressão</p><p>Z</p><p>X</p><p>X</p><p>n</p><p>x</p><p>x</p><p>x�</p><p>�</p><p>� �</p><p>�</p><p>�</p><p>�</p><p>�</p><p>( ) /</p><p>não teremos mais uma distribuição normal.</p><p>140</p><p>Unidade II</p><p>De fato, conforme demonstrado por W. S. Gosset (Student), a distribuição da variável não é mais</p><p>normal padrão.</p><p>X</p><p>X</p><p>s</p><p>n</p><p>x</p><p>x</p><p>x</p><p>�</p><p>� �� ��</p><p>�</p><p>� /</p><p>Ao substituir σ por s na expressão, teremos uma distribuição parecida com</p><p>a normal, isto é, simétrica</p><p>em torno de zero, porém com uma variabilidade maior. Dessa forma, a distribuição t é mais baixa no</p><p>centro do que a normal padrão, mas mais alta nas caudas.</p><p>Assim:</p><p>Z</p><p>X X</p><p>n</p><p>tx</p><p>x</p><p>x</p><p>n�</p><p>�</p><p>�</p><p>�</p><p>� �</p><p>�</p><p>�</p><p>�</p><p>� 1</p><p>Onde n ‑ 1 indica a distribuição t considerada, pois cada tamanho de amostra produz uma distribuição</p><p>de Student diferente.</p><p>A distribuição t de Student encontra‑se tabelada (Tabela A3a e A3b, vide AVA) em função de</p><p>n = tamanho da amostra ou então em função de n – 1 denominada graus de liberdade da distribuição.</p><p>Nesse caso, cada linha de uma tabela se refere a uma distribuição particular, e cada coluna da tabela, a</p><p>um determinado nível de significância. Conforme a tabela, o nível de significância poderá ser unilateral</p><p>ou bilateral. Em todo o caso, é necessário sempre ler no cabeçalho ou no rodapé da tabela as explicações</p><p>sobre como está estruturada.</p><p>Dessa forma, a diferença entre o teste para a média de uma população com σ conhecido e um com</p><p>σ desconhecido é que é necessário trocar a distribuição normal padrão pela distribuição t de Student.</p><p>Exemplo 70: o tempo médio, por operário, para executar uma tarefa tem sido de 100 minutos.</p><p>Introduziu‑se uma modificação para diminuir esse tempo e, após certo período, sorteou‑se uma amostra</p><p>de 16 operários, medindo‑se o tempo de execução gasto por cada um. O tempo médio da amostra foi</p><p>85 minutos, com desvio‑padrão de 12 minutos. Esse resultado evidencia uma melhora no tempo gasto</p><p>para realizar a tarefa? Apresente as conclusões aos níveis de 5% e 1% de significância e diga quais as</p><p>suposições teóricas necessárias que devem ser feitas para resolver o problema.</p><p>Resolução: a suposição teórica necessária é admitir que a distribuição da população de onde foi</p><p>extraída a amostra siga uma normal, pois n ≤ 30.</p><p>H0 : µ = 100</p><p>H1 : µ < 100</p><p>141</p><p>ESTATÍSTICA ECONÔMICA — INTRODUÇÃO À ECONOMETRIA</p><p>Considerando, então, um teste unilateral à esquerda e tendo α = 5% e α = 1%, tem‑se que a região</p><p>de rejeição é constituída por RC = [‑ ∞, ‑1,753] e (RC = [‑ ∞, ‑2,602])</p><p>O valor de teste é:</p><p>t</p><p>X</p><p>s</p><p>n</p><p>15</p><p>85 100</p><p>12</p><p>4</p><p>5�</p><p>�</p><p>�</p><p>�</p><p>� �</p><p>�</p><p>Como esse valor pertence às duas regiões críticas, pode‑se rejeitar a hipótese nula aos níveis de</p><p>5% e 1% de significância, isto é, nesse caso, pode‑se afirmar que a modificação diminuiu o tempo</p><p>de execução da tarefa.</p><p>Exemplo 71: um fabricante afirma que seus cigarros contêm não mais que 30 mg de nicotina. Uma</p><p>amostra de 25 cigarros fornece média de 31,5 mg e desvio‑padrão de 3 mg. Ao nível de 5%, os dados</p><p>refutam ou não a afirmação do fabricante?</p><p>Resolução: as hipóteses são:</p><p>H0 : µ = 30 × H1 : µ > 30</p><p>Como não se conhece a variância populacional e esta foi estimada pela amostra, devemos utilizar a</p><p>estatística t:</p><p>t �</p><p>�</p><p>�</p><p>315 30</p><p>3</p><p>25</p><p>2 5</p><p>,</p><p>,</p><p>Ao nível de significância de 0,05, a regra de decisão é:</p><p>Rejeita se H se t t t</p><p>Aceita se H s</p><p>n</p><p>-</p><p>-</p><p>,</p><p>,</p><p>, ,0</p><p>2</p><p>1</p><p>0 05 24</p><p>0</p><p>171� � �</p><p>�</p><p>�</p><p>ee t t t</p><p>n</p><p>,</p><p>,</p><p>, ,� � �</p><p>�</p><p>�</p><p>2</p><p>1</p><p>0 05 24 171</p><p>Rejeita‑se H0, ou seja, há evidências de que os cigarros contenham mais de 30 mg de nicotina.</p><p>142</p><p>Unidade II</p><p>5.1.2 Teste para a proporção (distribuição normal)</p><p>O teste para a proporção populacional costuma ser pautado na seguinte suposição: tem‑se uma</p><p>população e tem‑se uma hipótese sobre a proporção π de elementos da população que possuem</p><p>uma determinada característica. Essa proporção é supostamente igual a um determinado valor π0.</p><p>Assim, a hipótese nula é:</p><p>H0 : π = π0</p><p>O problema fornece informações sobre a alternativa, que pode ser uma das seguintes:</p><p>a) H1 : π ≠ π0</p><p>b) H1 : π > π0</p><p>c) H1 : π < π0</p><p>A estatística de teste a ser utilizada é a proporção amostral P, que para amostras grandes (n > 30)</p><p>tem uma distribuição aproximadamente normal com média:</p><p>µp = π e desvio‑padrão</p><p>�</p><p>� �</p><p>p n</p><p>�</p><p>�( )1</p><p>Exemplo 72: as condições de mortalidade de uma região são tais que a proporção de nascidos que</p><p>sobrevive até 60 anos é de 0,60. Testar essa hipótese ao nível de 5% de significância,considerando</p><p>que em 1.000 nascimentos amostrados aleatoriamente verificaram‑se 530 sobreviventes até os 60 anos.</p><p>Resolução:</p><p>H1: π = 0,60</p><p>H0: π ≠ 0,60</p><p>Considerando, então, um teste bilateral e tendo α = 5%, tem‑se que a região de aceitação é</p><p>constituída pelo intervalo RA = [‑1,96, 196].</p><p>143</p><p>ESTATÍSTICA ECONÔMICA — INTRODUÇÃO À ECONOMETRIA</p><p>O valor de teste é:</p><p>Z</p><p>p</p><p>n</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>� �</p><p>�</p><p>� �( )</p><p>, ,</p><p>, ( , )</p><p>,</p><p>1</p><p>0 53 0 60</p><p>0 60 1 0 60</p><p>1000</p><p>4 52</p><p>Como esse valor não pertence à região de aceitação, pode‑se rejeitar a hipótese nula ao nível de</p><p>5% de significância, isto é, nesse caso, pode‑se afirmar que a taxa dos que sobrevivem até os 60 anos é</p><p>menor do que 60%. Também poderia ser realizado um teste unilateral à esquerda.</p><p>Esse teste também rejeitaria a hipótese nula, pois para ele o valor crítico Zα = ‑1,645.</p><p>5.1.3 Teste para a variância (distribuição qui‑quadrado)</p><p>Para aplicar o teste para a variância, é necessário supor a normalidade da população de onde será</p><p>extraída a amostra.</p><p>As hipóteses são:</p><p>H0 : σ2 = σ0</p><p>2 contra</p><p>H1 : σ2 ≠ σ0</p><p>2</p><p>H1 : σ2 > σ0</p><p>2</p><p>H1 : σ2 < σ0</p><p>2</p><p>A estatística de teste é</p><p>n S</p><p>Xn</p><p>�� �</p><p>�</p><p>1 2</p><p>0</p><p>2 1</p><p>2</p><p>�</p><p>~ .</p><p>Quer dizer que o quociente tem uma distribuição qui‑quadrado com “n ‑ 1“ graus de liberdade. A</p><p>qui‑quadrado é uma distribuição assimétrica positiva que varia de zero a mais infinito (∞).</p><p>Observação</p><p>O modelo do X2 tem uma função densidade com suporte positivo e</p><p>tem enviesamento para a direita, dependendo a sua forma do número de</p><p>graus de liberdade.</p><p>144</p><p>Unidade II</p><p>Apresenta‑se a seguir a função densidade do qui‑quadrado para vários graus de liberdade:</p><p>0,2</p><p>0,15</p><p>0,1</p><p>0,05</p><p>0</p><p>0 5 10 15 20 25 30 35 40 45</p><p>11 graus de liberdade</p><p>5 graus de liberdade</p><p>2 graus de liberdade</p><p>Figura 67 ‑ Função densidade do x2 para vários graus de liberdade</p><p>Essa distribuição é tabelada (Tabela A2, vide AVA) também em função dos números de graus de</p><p>liberdade, isto é, cada grau de liberdade (n ‑ 1) representa uma distribuição diferente. As colunas da</p><p>tabela representam diferentes níveis de significância, ou seja, área sob a curva acima do valor tabelado.</p><p>Em função do tipo de hipótese alternativa, define‑se a região de rejeição. No primeiro caso, tem‑se</p><p>uma região de rejeição do tipo bilateral. Logo, fixado um nível de significância “α”, a região crítica será</p><p>, ,RC X X� ��</p><p>�</p><p>� � ��</p><p>�</p><p>�</p><p>�0 1</p><p>2</p><p>2</p><p>2 .</p><p>Dessa forma, aceita‑se a hipótese nula caso a estatística de teste pertença ao intervalo ,X X1</p><p>2</p><p>2</p><p>2�</p><p>�</p><p>�</p><p>� .</p><p>145</p><p>ESTATÍSTICA ECONÔMICA — INTRODUÇÃO À ECONOMETRIA</p><p>α/2</p><p>α/2</p><p>(a) Teste bilateral</p><p>α</p><p>(b) Teste unilateral à direita</p><p>α</p><p>(c) Teste unilateral à esquerda</p><p>Figura 68 – Região crítica para testes de hipóteses sobre a variância de uma N(µ; σ2)</p><p>Exemplo 73: uma das maneiras de controlar a qualidade de um produto é controlar a sua variabilidade.</p><p>Uma máquina de empacotar café está regulada para encher os pacotes com desvio‑padrão de 10 g</p><p>e média de 500g, onde o peso de cada pacote distribui‑se normalmente. Colhida uma amostra de</p><p>n = 16, observou‑se uma variância de 169 g. É possível afirmar com esse resultado que a máquina está</p><p>desregulada quanto à variabilidade, supondo uma significância de 5%?</p><p>Resolução:</p><p>H0 : σ</p><p>2 = 100 contra</p><p>H1 : σ</p><p>2 ≠ 100</p><p>X</p><p>n S</p><p>c</p><p>2</p><p>2</p><p>0</p><p>2</p><p>1 15 169</p><p>100</p><p>25 35�</p><p>�� �</p><p>�</p><p>�</p><p>�</p><p>�</p><p>,</p><p>Como α = 5%, a região de aceitação é a região compreendida entre os valores:</p><p>X X25</p><p>2</p><p>975</p><p>2 6 26 27 49, % , %, , ; , ��</p><p>�</p><p>�</p><p>� � � �</p><p>146</p><p>Unidade II</p><p>Como o valor calculado pertence a essa região, aceita‑se H0, isto é, com essa amostra não é possível</p><p>afirmar que a máquina está desregulada ao nível de 5% de significância.</p><p>Exemplo 74 (Larson, 2004): Um laticínio alega que a variância na quantidade de gordura no</p><p>total do leite processado pela companhia é não mais do que 0,25. Você desconfia dessa alegação e</p><p>descobre que uma amostra aleatória de 41 recipientes com leite tem uma variância de 0,27. Sendo</p><p>α = 0,05, há evidência suficiente para rejeitar a alegação da companhia? Assuma que</p><p>a população esteja</p><p>normalmente distribuída.</p><p>Resolução: a alegação é: “a variância é não mais do que 0,25”. Desse modo, as hipóteses nula e</p><p>alternativa são:</p><p>H0 : S</p><p>2 ≤ 0,25 (alegação) e: H1 : σ</p><p>2 > 0,25</p><p>O teste é monocaudal à direita, o nível de significância é α = 0,05 e g.l. = 41 ‑ 1 = 40 graus de</p><p>liberdade. Portanto, os valores críticos são:</p><p>X0</p><p>2 = 55,758</p><p>A região de rejeição é:</p><p>X0</p><p>2 = 55,758</p><p>Usando o teste X2, a estatística de teste padronizada é:</p><p>X</p><p>n S2</p><p>2</p><p>2</p><p>1 41 1 0 27</p><p>0 25</p><p>43 2�</p><p>�� �</p><p>�</p><p>�� ��</p><p>�</p><p>�</p><p>,</p><p>,</p><p>,</p><p>α = 0,05</p><p>10 20 30</p><p>x2 = 43,2 x2 = 55,758</p><p>40 50 60</p><p>x2</p><p>0</p><p>Figura 69 – Função densidade qui‑quadrado</p><p>147</p><p>ESTATÍSTICA ECONÔMICA — INTRODUÇÃO À ECONOMETRIA</p><p>A figura anterior do exemplo mostra a localização da região de rejeição e a estatística de teste</p><p>padronizada X2. Uma vez que X2 não está na região de rejeição, você determina ser impossível rejeitar</p><p>a hipótese nula. Você tem evidência suficiente para aceitar a alegação da companhia a um nível de</p><p>significância de 5%.</p><p>Exemplo 75: um escritório de investimento acredita que o rendimento das diversas ações</p><p>movimentadas por ele tenha sido de 24% ao longo dos últimos anos. Uma nova estratégia é implementada</p><p>para melhorar o desempenho, bem como garantir uma maior uniformidade nos rendimentos das diversas</p><p>ações. No passado, o desvio‑padrão do rendimento era da ordem de 5%. Uma amostra de 8 empresas</p><p>forneceu os seguintes rendimentos (dados em %): 23,6; 22,8; 25,7; 24,8; 26,4; 24,3; 23,9; 25. Quais</p><p>seriam as conclusões? Quais são as hipóteses necessárias para a solução desse problema?</p><p>Resolução: temos de supor que os rendimentos tenham distribuição normal. As hipóteses de</p><p>interesse são µ > 24 e σ2 < 25. Logo, as hipóteses estatísticas são:</p><p>H0 : µ = 24 H0 : σ</p><p>2 = 25</p><p>H0 : µ > 24 H0 : σ</p><p>2 < 25</p><p>Os dados fornecem i i i ix e x� �� �� �1</p><p>8</p><p>1</p><p>8 2196 5 4835 99, ,</p><p>x</p><p>s</p><p>� �</p><p>� � ��</p><p>�</p><p>�</p><p>� � �</p><p>196 5</p><p>8</p><p>24 5625</p><p>1</p><p>7</p><p>4835 99 8 24 5625</p><p>9 45875</p><p>7</p><p>132 2</p><p>,</p><p>,</p><p>, ( , )</p><p>,</p><p>, 55125</p><p>Como o tamanho da amostra é pequeno e tanto a média quanto a variância são desconhecidas, as</p><p>estatísticas de teste são T0 e X0</p><p>2. Os valores críticos para um nível de significância de 5% são:</p><p>t7; 0,05 = 1,895 X7; 0,05 = 2,167</p><p>as regiões críticas são:</p><p>T0 > 1,895 X0</p><p>2 < 2,167</p><p>Os valores observados das estatísticas de teste são:</p><p>t</p><p>x</p><p>0</p><p>0</p><p>2</p><p>8</p><p>24 5625 24</p><p>135125</p><p>13687 1895</p><p>7 135125</p><p>25</p><p>0 378</p><p>� �</p><p>�</p><p>� �</p><p>�</p><p>�</p><p>�</p><p>( , )</p><p>,</p><p>, ,</p><p>,</p><p>, 335 2 167� ,</p><p>148</p><p>Unidade IIt</p><p>x</p><p>0</p><p>0</p><p>2</p><p>8</p><p>24 5625 24</p><p>135125</p><p>13687 1895</p><p>7 135125</p><p>25</p><p>0 378</p><p>� �</p><p>�</p><p>� �</p><p>�</p><p>�</p><p>�</p><p>( , )</p><p>,</p><p>, ,</p><p>,</p><p>, 335 2 167� ,</p><p>Vemos, então, que t0 não pertence à região crítica e, portanto, não podemos dizer que o rendimento</p><p>médio aumentou. No entanto, x0</p><p>2 pertence à região crítica, e, portanto, os dados indicam que houve</p><p>redução na variabilidade dos rendimentos das ações negociadas pelo escritório.</p><p>Saiba mais</p><p>Para saber mais sobre teste de hipóteses, consulte:</p><p>HOFFMAN, R. Estatística para economistas. São Paulo: Pioneira,</p><p>1980. p. 149‑185.</p><p>5.2 Teste não paramétrico com uma amostra</p><p>Os testes paramétricos assumem que a distribuição de probabilidade da população da qual retiramos</p><p>os dados seja conhecida e que somente os valores de certos parâmetros, tais como a média (µ) e o</p><p>desvio‑padrão (σ), sejam desconhecidos. Em geral, os métodos não paramétricos são aplicados em</p><p>problemas de inferência nos quais as distribuições das populações envolvidas não precisam pertencer a</p><p>uma família específica de distribuições de probabilidade, como normal, exponencial, t de Student etc.</p><p>Por isso, os testes não paramétricos são também chamados testes livres de distribuição.</p><p>Os testes não paramétricos são extremamente interessantes para análises de dados qualitativos.</p><p>Na estatística paramétrica, para aplicação de teste como o t de Student, a variável em análise precisa</p><p>ser numérica. Como o próprio nome sugere, a estatística não paramétrica independe dos parâmetros</p><p>populacionais e de suas respectivas estimativas.</p><p>Assim, caso a variável populacional analisada não siga uma distribuição normal e/ou as amostras</p><p>sejam pequenas, pode‑se aplicar um teste não paramétrico.</p><p>Vantagens dos métodos não paramétricos:</p><p>• Os métodos não paramétricos podem ser aplicados a uma ampla diversidade de situações porque</p><p>não exigem populações distribuídas normalmente;</p><p>• Ao contrário dos métodos paramétricos, os métodos não paramétricos podem frequentemente</p><p>ser aplicados a dados não numéricos;</p><p>• Os métodos não paramétricos em geral envolvem cálculos mais simples do que seus correspondentes</p><p>paramétricos, sendo, assim, mais fáceis de entender.</p><p>149</p><p>ESTATÍSTICA ECONÔMICA — INTRODUÇÃO À ECONOMETRIA</p><p>Desvantagens dos métodos não paramétricos:</p><p>• Os métodos não paramétricos tendem a perder informação porque os dados numéricos são</p><p>frequentemente reduzidos a uma forma qualitativa;</p><p>• Os testes não paramétricos não são tão eficientes quanto os testes paramétricos; assim, com um</p><p>teste não paramétrico, em geral, necessitamos de uma amostra maior ou maiores diferenças para</p><p>então rejeitarmos uma hipótese nula.</p><p>5.2.1 Teste qui‑quadrado</p><p>Na unidade anterior, nosso problema foi testar hipóteses sobre os parâmetros média e proporção. A</p><p>maioria das formas das distribuições de probabilidades era conhecida (ou seria aproximada). Aceitarmos</p><p>uma ou outra hipótese sobre o valor desse parâmetro era nossa decisão.</p><p>Outra situação comum é termos observações de uma variável aleatória cuja distribuição na população</p><p>é desconhecida. Nesse caso, o procedimento é tentar identificar o comportamento da variável com um</p><p>modelo teórico e, em algumas situações, obtermos informações de outras variáveis que descrevam</p><p>fenômenos aleatórios similares e tenham distribuição conhecida.</p><p>Observação</p><p>Caso não se tenha a menor ideia do comportamento da variável, a</p><p>representação gráfica pela elaboração do histograma com a frequência de</p><p>ocorrência é uma das formas de encontrar o modelo adequado aos dados.</p><p>Em qualquer caso, o modelo pode ser testado por meio do chamado teste de aderência. Nesta</p><p>unidade, apresentaremos um desses testes que usa a distribuição qui‑quadrado, simbolizada por X2.</p><p>É um teste não paramétrico que se destina a encontrar um valor da dispersão para duas variáveis</p><p>nominais (dados nominais separáveis em categorias, sem nenhuma ordem especial, como sexo, cor dos</p><p>olhos etc.), ou seja, um teste de hipóteses que não depende dos parâmetros populacionais, como média</p><p>e variância.</p><p>Considere uma variável X para a qual temos uma amostra de valores. Pretende‑se verificar a aderência</p><p>ou não de um certo modelo probabilístico. Os valores observados da variável X foram divididos em c</p><p>categorias, conforme quadro de frequência a seguir:</p><p>Quadro 3</p><p>Categorias 1 2 3 ... c</p><p>Frequência observada O1 O2 O3 ... Oc</p><p>Frequência esperada ou teórica E1 E2 E3 ... Ec</p><p>150</p><p>Unidade II</p><p>O quadro, no qual as frequências observadas ocupam uma única linha, é denominado tabela de</p><p>simples entrada (tabela de 1 x c).</p><p>Do modelo que está sendo proposto, calculamos as frequências esperadas ou teóricas em cada uma</p><p>das categorias.</p><p>Portanto, pode‑se se dizer que dois grupos se comportam de forma semelhante entre as frequências</p><p>observadas (Oi) e as esperadas (Ei); se essas duas últimas linhas da tabela não forem muito discrepantes,</p><p>isto é, se as diferenças (Oi ‑ Ei) em cada categoria forem muito pequenas, poderão ser aceitas, pois</p><p>estamos sempre sujeitos a flutuações, quando trabalhamos com variáveis aleatórias.</p><p>Com base nessa ideia, o teste de aderência (qui‑quadrado) define, então, o critério para decidir se</p><p>podemos aceitar ou rejeitar o modelo indicado (decidimos se os dados amostrais aderem ao modelo ou</p><p>não). As hipóteses do teste são:</p><p>• Hipótese nula (H0): as frequências observadas não são diferentes das frequências</p><p>esperadas. Não existe diferença entre as frequências (contagens) dos grupos. Portanto, X</p><p>segue o modelo proposto;</p><p>• Hipótese alternativa (H1): as frequências observadas são</p><p>diferentes das frequências esperadas.</p><p>Existe diferença entre as frequências. Portanto, X não segue o modelo proposto.</p><p>Observação</p><p>Testar hipóteses está associado a avaliar erros aleatórios (erros que não</p><p>podem ser controlados), isto é, comparação entre grupos. A hipótese nula</p><p>(H0) recebe o nome de grupo-controle (valor padrão ou de referência), e</p><p>a hipótese alternativa (H1) recebe o nome de grupo-teste (hipótese que</p><p>queremos testar).</p><p>Condições necessárias para aplicar o teste:</p><p>• Os grupos são independentes;</p><p>• Os itens de cada grupo são selecionados aleatoriamente;</p><p>• As observações devem ser contagens ou frequências;</p><p>• Cada observação pertence a uma e somente a uma categoria;</p><p>• A amostra deve ser relativamente grande (mínimo de 5 observações em cada célula e, no caso de</p><p>poucos grupos, pelo menos 10. Exemplo: tabelas 2 x 2).</p><p>151</p><p>ESTATÍSTICA ECONÔMICA — INTRODUÇÃO À ECONOMETRIA</p><p>O qui‑quadrado constitui uma medida da discrepância entre as frequências observadas e as esperadas,</p><p>usando para o seu cálculo a seguinte fórmula:</p><p>Fórmula 41</p><p>X</p><p>O E</p><p>E</p><p>2</p><p>2</p><p>�</p><p>�� ��</p><p>Em que:</p><p>O = frequência observada para cada categoria;</p><p>E = frequência esperada para aquela categoria.</p><p>Percebe‑se que as frequências observadas são obtidas diretamente dos dados das amostras, enquanto</p><p>as frequências esperadas são calculadas a partir destas.</p><p>Para interpretar a expressão da fórmula 41, é importante destacar que (O - E) é a diferença entre</p><p>a frequência observada e a esperada em uma categoria. Quando as frequências são muito próximas,</p><p>o valor de X2 é pequeno. Caso contrário, se as divergências forem grandes, consequentemente, X2</p><p>assumirá valores grandes, isto é, o desvio em relação ao modelo proposto é, assim, uma medida da</p><p>discrepância que queremos quantificar.</p><p>A estatística de teste é baseada na diferença entre as frequências observadas e as frequências</p><p>esperadas. Caso essa diferença seja pequena, podemos aceitar a hipótese (H0) de não haver diferença.</p><p>Caso a diferença seja grande, devemos então rejeitar a hipótese.</p><p>Dessa forma, o teste de hipótese qui‑quadrado compara proporções, isto é, procura saber se as</p><p>frequências observadas diferem, de modo significativo, das frequências teóricas ou esperadas de uma</p><p>variável aleatória de um determinado evento.</p><p>Devemos, agora, estabelecer uma estatística de teste a fim de verificar essa hipótese. Tendo em vista</p><p>a hipótese estabelecida, é necessário obter duas estatísticas: X2 calculado e X2 tabelado.</p><p>O valor do X2 calculado é obtido a partir dos dados experimentais, levando‑se em consideração os</p><p>valores das frequências observadas e das frequências esperadas.</p><p>Para o valor do X2 tabelado, dependemos do número de graus de liberdade e do nível de significância</p><p>a ser adotado. A decisão a ser tomada depende da comparação entre os dois valores das estatísticas de X2:</p><p>• Se X2 calculado ≥ X2 tabelado: rejeita‑se H0;</p><p>• Se X2 calculado < X2 tabelado: aceita‑se H0.</p><p>152</p><p>Unidade II</p><p>É possível demonstrar que, para um tamanho de amostra suficientemente grande, a distribuição</p><p>X2 pode ser aproximada por um modelo qui‑quadrado com parâmetro (c - 1), denominado grau de</p><p>liberdade da distribuição. Portanto, essa distribuição é representada por X(k-1)</p><p>2 .</p><p>Para a aproximação ao modelo qui‑quadrado, é necessário que todas as frequências esperadas sejam</p><p>ao menos iguais a 5. Caso isso não aconteça para alguma categoria, devemos combiná‑la de uma outra</p><p>maneira conveniente, garantindo que todas as frequências esperadas atendam a esse critério.</p><p>O número de graus de liberdade é dado por g.l. = c - 1 - m quando as frequências esperadas</p><p>somente podem ser calculadas mediante a estimativa de m parâmetros populacionais e a partir de</p><p>estatísticas amostrais.</p><p>Lembrete</p><p>A estatística qui‑quadrado X(k-1)</p><p>2 se baseia nas diferenças entre as</p><p>frequências observadas e as frequências que esperaríamos se a hipótese</p><p>nula (H0) fosse verdadeira.</p><p>Para o cálculo do qui‑quadrado tabelado ou crítico, quando se consulta a tabela de X(k-1)</p><p>2 , observa‑se</p><p>que é determinada uma probabilidade de ocorrência daquele acontecimento associado ao nível de</p><p>significância (α), que representa a máxima probabilidade de erro que se tem ao rejeitar uma hipótese, e</p><p>ao número de graus de liberdade (gl = c ‑ 1), em que c = número de categorias.</p><p>Observação</p><p>Portanto, quanto maior for o valor do qui‑quadrado calculado, mais</p><p>significativa será a relação entre a variável dependente e a variável</p><p>independente.</p><p>Portanto, o teste é utilizado para:</p><p>a) O teste de qui-quadrado para a qualidade do ajustamento</p><p>Um teste qui‑quadrado para a qualidade do ajustamento é usado para testar se uma distribuição de</p><p>frequência se ajusta a uma distribuição prevista.</p><p>A frequência observada (O) de uma categoria é a frequência (da categoria) observada nos dados amostrais.</p><p>A frequência esperada (E) de uma categoria é a frequência calculada para a categoria. A frequência</p><p>esperada para a i‑ésima categoria é:</p><p>Ei = n x pi</p><p>153</p><p>ESTATÍSTICA ECONÔMICA — INTRODUÇÃO À ECONOMETRIA</p><p>Na qual:</p><p>n: é o número de tentativas (tamanho da amostra);</p><p>pi: é a probabilidade assumida da i‑ésima categoria.</p><p>Como se analisa um teste de qui‑quadrado:</p><p>No teste qui‑quadrado, compara‑se o valor X2 calculado com o valor crítico fornecido em uma</p><p>tabela (Tabela A2, vide AVA). Tome‑se o caso de g.l. = 4.</p><p>Probabilidade de rejeitar H0</p><p>quando verdadeira</p><p>Rejeitar H0 se X2 é maior</p><p>que o valor críticoestá neste intervalo</p><p>Aceitar H0 se X2</p><p>valor crítico</p><p>g.l. = 4</p><p>0 2 4 6 8 10 12 X2</p><p>Figura 70 – Função densidade qui‑quadrado</p><p>Para o nível de significância de 5%, obtemos da tabela de valores críticos de qui‑quadrado:</p><p>Xc</p><p>2 (g.l. = 4; α = 0,05) = 9,49</p><p>Rejeitamos a hipótese nula se X2 for maior que o valor crítico fornecido pela tabela.</p><p>A distribuição qui‑quadrado apresenta densidade de probabilidade dependente do grau de liberdade,</p><p>g.l. Na figura a seguir temos a forma da função de densidade (f.d.) da distribuição qui‑quadrado para</p><p>alguns valores de g.l.</p><p>154</p><p>Unidade II</p><p>g.l</p><p>0,6</p><p>0,5</p><p>0,4</p><p>0,3</p><p>0,2</p><p>0,1</p><p>0 10 20 30 40 50</p><p>2</p><p>1</p><p>3</p><p>4 6</p><p>8 10 15 20 25 30</p><p>x2</p><p>f.d</p><p>.p</p><p>Figura 71 – Função densidade qui‑quadrado</p><p>Exemplo 76: ao lançarmos uma moeda não viciada 200 vezes, de acordo com as regras de</p><p>probabilidade, espera‑se obter 100 caras e 100 coroas, isto é, a probabilidade de cair cara é p = 1/2</p><p>e a de cair coroa (q = 1 ‑ p) também é q = 1/2. Sabendo que, na prática, é muito difícil obtermos os</p><p>valores observados idênticos aos esperados, pois estamos sujeitos a flutuações quando trabalhamos</p><p>com variáveis aleatórias, sendo comum encontrarmos valores que se desviam dos teóricos.</p><p>Supondo que uma moeda foi lançada 200 vezes e se obteve 120 caras e 80 coroas:</p><p>a) calcule o valor do X2;</p><p>b) interprete esse valor ao nível de significância de 5%.</p><p>Resolução:</p><p>a) As frequências esperadas em cada categoria são calculadas por:</p><p>Ei = n x pi</p><p>Assim,</p><p>E cara e E coroa</p><p>X</p><p>O E</p><p>� � � � � � � � � �</p><p>�</p><p>�� ��</p><p>200</p><p>1</p><p>2</p><p>100 200</p><p>1</p><p>2</p><p>100</p><p>2</p><p>2</p><p>EE</p><p>�</p><p>�� �</p><p>�</p><p>�� ��</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>�</p><p>� � �</p><p>120 100</p><p>100</p><p>80 100</p><p>100</p><p>4 4 8</p><p>2 2</p><p>155</p><p>ESTATÍSTICA ECONÔMICA — INTRODUÇÃO À ECONOMETRIA</p><p>b) Como se pode interpretar esse valor?</p><p>• Hipótese nula (H0): admite‑se que a moeda não seja viciada (segue o modelo proposto);</p><p>• Hipótese alternativa (H1): admite‑se que a moeda seja viciada (não segue o modelo proposto).</p><p>No item a, como o valor de qui‑quadrado calculado (X2 = 8) para 2 classes foi maior que o esperado</p><p>ou crítico Xc</p><p>2(gl = 1; α = 0,05) = 3,841, aceita‑se a hipótese alternativa (H1) e admite‑se que a moeda</p><p>seja viciada (não segue o modelo teórico).</p><p>Como se analisa um teste de qui‑quadrado Xc</p><p>2(gl = 1; α = 0,05) = 3,841?</p><p>%</p><p>70</p><p>60</p><p>50</p><p>40</p><p>30</p><p>20</p><p>10</p><p>1 2 3 4</p><p>3,841</p><p>x25 6 7</p><p>Figura 72 – Distribuição de qui‑quadrado</p><p>Nota‑se, na figura anterior, que os valores pequenos de X2 ocorrem mais frequentemente que os</p><p>grandes, pois se um experimento puder ser representado pelo modelo teórico proposto, pequenos desvios</p><p>casuais entre proporções esperadas</p><p>e observadas ocorrerão em maior número do que grandes desvios.</p><p>Tomando a área total sob a curva como 100%, sabe‑se que o valor 3,841 delimita 5% dela. Esse é o valor</p><p>crítico de qui‑quadrado conhecido como Xc</p><p>2(gl = 1; α = 0,05) = 3,841. Portanto, espera‑se em experimentos</p><p>semelhantes que valores de X2 menores que 3,841 tenham 95% de probabilidade de ocorrência.</p><p>Sempre que o valor de o X2 for menor que 3,841 aceita‑se a hipótese de igualdade estatística entre os</p><p>números de observados e de esperados (H0). Ou seja, admite‑se que os desvios não sejam significativos.</p><p>156</p><p>Unidade II</p><p>Exemplo 77 (Larson, 2004): um economista alega que a distribuição etária atual entre os moradores</p><p>de uma determinada cidade é a mesma de dez anos atrás. A distribuição etária de dez anos atrás</p><p>é apresentada na tabela a seguir. Quatrocentos moradores são selecionados ao acaso, e a idade de</p><p>cada um é anotada. Os resultados do levantamento feito também constam da tabela. Considerando</p><p>α = 0,05, realiza‑se um teste qui‑quadrado para a qualidade do ajustamento a fim de determinar se a</p><p>distribuição mudou.</p><p>Tabela 24 – Teste qui‑quadrado</p><p>Classe O E O - E (O - E)2 (O-E)</p><p>E</p><p>2</p><p>00 ‑‑‑09 76 64 12 144 2,250</p><p>10 ‑‑‑19 84 80 4 16 0,200</p><p>20 ‑‑‑29 30 32 ‑2 4 0,125</p><p>30 ‑‑‑39 60 56 4 16 0,286</p><p>40 ‑‑‑49 54 60 ‑6 36 0,600</p><p>50 ‑‑‑59 40 48 ‑8 64 1,333</p><p>60 ‑‑‑69 42 40 2 4 0,100</p><p>70 + 14 20 ‑6 36 1,800</p><p>X</p><p>O E</p><p>E</p><p>2</p><p>2</p><p>6 694�</p><p>�� �</p><p>�� ,</p><p>X</p><p>O E</p><p>E</p><p>2</p><p>2</p><p>6 694�</p><p>�� �</p><p>�� ,</p><p>H0: A distribuição etária na cidade é de 16% na faixa etária (0‑9), 20% na faixa etária (10‑19), 8%</p><p>na faixa etária (20‑29), 14% na faixa etária (30‑39), 15% na faixa etária (40‑49), 12% na faixa etária</p><p>(50‑59), 10% na faixa etária (60‑69) e 5% na faixa etária (70+) (alegação).</p><p>H1: A distribuição etária observada nas faixas etárias na cidade difere da distribuição esperada</p><p>ou alegada.</p><p>Como há oito categorias, a distribuição qui‑quadrado tem K ‑ 1 = 8 ‑ 1 = 7 graus de liberdade.</p><p>Usando g.l. = 7 e α = 0,05, o valor crítico é 14,067. Usando as frequências observadas e esperadas, a</p><p>estatística do teste qui‑quadrado é 6,694 (Tabela A2, vide AVA).</p><p>157</p><p>ESTATÍSTICA ECONÔMICA — INTRODUÇÃO À ECONOMETRIA</p><p>Probabilidade de rejeitar H0</p><p>quando verdadeira</p><p>Rejeitar H0 se X2 for maior</p><p>que o valor críticoestiver neste intervalo</p><p>Aceitar H0 se X2</p><p>valor crítico</p><p>g.l. = 7</p><p>0 2 4 6 8 10 12 X2</p><p>X2 = 6,694 14,067</p><p>Figura 73 – Função densidade qui‑quadrado</p><p>O gráfico mostra a localização da área de rejeição e a estatística do teste qui‑quadrado. Uma vez</p><p>que X2 está na área de aceitação, deve‑se decidir por aceitar a hipótese nula. Em outras palavras, a um</p><p>nível de 5%, não há evidência suficiente para concluir que a distribuição etária difere daquela alegada</p><p>ou da distribuição esperada.</p><p>b) O teste de qui-quadrado em tabelas de contingência</p><p>Aprendemos que duas variáveis são independentes caso a ocorrência de uma variável não afete</p><p>a probabilidade de ocorrência da outra. O teste qui‑quadrado, nesse contexto, é usado para testar se</p><p>duas variáveis são independentes, ou seja, pode‑se determinar se a ocorrência de uma variável afeta</p><p>a probabilidade de ocorrência da outra. Por exemplo, suponha que um pesquisador médico queira</p><p>determinar se existe uma relação entre o consumo de cafeína e o risco de ataque cardíaco. Essas</p><p>variáveis são independentes (H0) ou dependentes (H1). Para realizar um teste qui‑quadrado para a</p><p>independência, usam‑se dados amostrais que estão organizados em uma tabela de contingência.</p><p>Uma tabela de contingência l x c (linha x coluna) mostra as frequências observadas para duas</p><p>variáveis. As frequências observadas estão arranjadas em linhas “l” e colunas “c”. A intersecção de uma</p><p>linha com uma coluna é chamada de célula.</p><p>Mesmo não dispondo de uma teoria que permita efetuar o cálculo das classes esperadas, podemos,</p><p>por meio da função de probabilidade conjunta de duas variáveis aleatórias, nos certificar, para todos os</p><p>possíveis valores das variáveis, de que o produto das probabilidades marginais é igual à probabilidade</p><p>conjunta (multiplicamos os totais parciais relativos a cada célula e dividimos pelo total geral).</p><p>Assim, a frequência esperada (E) para células da tabela de contingência, ou seja, a frequência</p><p>esperada para uma célula é:</p><p>158</p><p>Unidade II</p><p>E</p><p>soma da linha l soma da coluna c</p><p>tamanho da amostral c,</p><p>( )</p><p>�</p><p>� ��</p><p>Em casos nos quais não temos informações sobre a ocorrência conjunta das variáveis aleatórias,</p><p>devemos coletar uma amostra anotando a frequência conjunta dos valores observados das variáveis.</p><p>Podemos, então, utilizar o teste de hipótese conhecido como teste de independência entre duas</p><p>variáveis.</p><p>Saiba mais</p><p>Para saber mais sobre probabilidade conjunta de duas variáveis aleatórias</p><p>e associação entre variáveis, consulte:</p><p>MAGALHÃES, M. N.; LIMA, A. C. P. Noções de probabilidade e estatística.</p><p>7. ed. São Paulo: Edusp, 2010. p. 128‑136.</p><p>Para usar o teste de independência qui‑quadrado, as seguintes condições devem ser satisfeitas:</p><p>• A frequência observada deve ser obtida usando uma amostra aleatória;</p><p>• Cada frequência esperada deve ser maior ou igual a cinco.</p><p>Mediante a ampliação da ideia da utilização da tabela de simples entrada (1 x c), isto é, a existência</p><p>de uma única linha ocupada pelas frequências observadas, chega‑se a tabelas de dupla entrada ou de</p><p>(l x c), nas quais as frequências observadas ocupam l linhas e c colunas. São as denominadas tabelas</p><p>de contingência.</p><p>Hipóteses a serem testadas:</p><p>• Hipótese nula (H0): não há associação entre os grupos, ou seja, as variáveis são independentes;</p><p>• Hipótese alternativa (H1): há associação entre os grupos, ou seja, as variáveis são dependentes.</p><p>O número de graus de liberdade (g.l.) para l > 1 e c > 1 quando os dados estão em tabela de</p><p>contingência é dado por:</p><p>g.l.= (número de linhas – 1) x (número de colunas – 1) = (l ‑ 1) × (c ‑ 1)</p><p>ou</p><p>g.l. = (l ‑ 1) × (c ‑ 1) ‑ m,</p><p>159</p><p>ESTATÍSTICA ECONÔMICA — INTRODUÇÃO À ECONOMETRIA</p><p>quando as frequências esperadas somente podem ser calculadas mediante a estimativa de m</p><p>parâmetros populacionais, por meio das estatísticas amostrais.</p><p>Exemplo 78 (Magalhães, 2010): utilizando a tabela a seguir, verifique se existe dependência entre</p><p>o número de filhos e o rendimento familiar. Em seguida, teste tal fato considerando um nível de</p><p>significância de 1%.</p><p>Tabela 25</p><p>Renda R$ / Filhos 0 1 2 >2 Total</p><p>Menos de 4.000 15 27 50 43 135</p><p>4.000 a 7.000 25 37 12 8 82</p><p>7.000 ou mais 8 13 9 10 40</p><p>Total 48 77 71 61 257</p><p>Resolução: usando a fórmula:</p><p>Frequência esperada E</p><p>soma da linha l soma da coluna c</p><p>tamanho da amostral c,</p><p>( )</p><p>�</p><p>� ��</p><p>Tabela 26 – Cálculo da frequência esperada</p><p>E1,1 �</p><p>�</p><p>�</p><p>135 48</p><p>257</p><p>25 21, E1,2 �</p><p>�</p><p>�</p><p>135 77</p><p>257</p><p>40 45, E1,3 �</p><p>�</p><p>�</p><p>135 71</p><p>257</p><p>37 30, E1,4 �</p><p>�</p><p>�</p><p>135 61</p><p>257</p><p>32 04,</p><p>E2,1 �</p><p>�</p><p>�</p><p>82 48</p><p>257</p><p>15 32, E2,2 �</p><p>�</p><p>�</p><p>82 77</p><p>257</p><p>24 57, E2,3 �</p><p>�</p><p>�</p><p>82 71</p><p>257</p><p>22 65, E2 4</p><p>82 61</p><p>257</p><p>19 46, ,�</p><p>�</p><p>�</p><p>E31</p><p>40 48</p><p>257</p><p>7 47, ,�</p><p>�</p><p>� E32</p><p>40 77</p><p>257</p><p>1198, ,�</p><p>�</p><p>� E3,3 �</p><p>�</p><p>�</p><p>40 71</p><p>257</p><p>1105, E3,4 �</p><p>�</p><p>�</p><p>40 61</p><p>257</p><p>9 49,</p><p>A tabela de contingência a seguir mostra os resultados de uma amostra aleatória de 257 famílias</p><p>classificadas por renda e números de filhos. As frequências esperadas estão entre parênteses. Sendo</p><p>α = 0,01, é possível concluir que a renda da família está relacionada com a quantidade de filhos?</p><p>Tabela 27 – Frequência observada e esperada</p><p>Renda R$ / Filhos 0 1 2 >2 Total</p><p>Menos de 4.000</p><p>15</p><p>(25,21)</p><p>27</p><p>(40,45)</p><p>50</p><p>(37,30)</p><p>43</p><p>(32,04)</p><p>135</p><p>4.000 a 7.000</p><p>25</p><p>(15,32)</p><p>37</p><p>(24,57)</p><p>12</p><p>(22,65)</p><p>8</p><p>(19,46)</p><p>82</p><p>7.000 ou mais</p><p>8</p><p>(7,47)</p><p>13</p><p>(11,98)</p><p>9</p><p>(11,05)</p><p>10</p><p>(9,49)</p><p>40</p><p>Total 48 77 71 61 257</p><p>160</p><p>Unidade II</p><p>Uma vez que cada frequência esperada é pelo menos 5 e os dados de renda e número de filhos foram</p><p>selecionados aleatoriamente, podemos usar o teste de independência qui‑quadrado para testar se as</p><p>variáveis são independentes. As hipóteses nula e alternativa estão a seguir:</p><p>H0: as variáveis são independentes</p><p>H1: as variáveis são dependentes</p><p>ou</p><p>H0: o número de filhos é independente do nível</p><p>de renda</p><p>H1: o número de filhos é dependente do nível de renda</p><p>Uma vez que a tabela de contingência tem três linhas e quatro colunas, a distribuição qui‑quadrado</p><p>possui (l ‑ 1)(c ‑ 1) = (3 ‑ 1)(4 ‑ 1) = 6 graus de liberdade. Como g.l. = 6 e α = 0,01, o valor crítico é</p><p>16,812. Usando as frequências observadas e esperadas, a estatística de teste qui‑quadrado está exposta</p><p>na tabela a seguir:</p><p>Tabela 28 – Cálculo do qui‑quadrado</p><p>O E O - E (O - E)2 (O-E)</p><p>E</p><p>2</p><p>15 25,21 ‑10,21 104,24 4,135</p><p>27 40,45 ‑13,45 180,90 4,472</p><p>50 37,30 12,70 161,29 4,324</p><p>43 32,04 10,96 120,12 3,749</p><p>25 15,32 9,68 93,70 6,116</p><p>37 24,57 12,43 154,50 6,288</p><p>12 22,65 ‑10,65 113,42 5,008</p><p>8 19,46 ‑11,46 131,33 6,749</p><p>8 7,47 0,53 0,28 0,038</p><p>13 11,98 1,02 1,04 0,087</p><p>9 11,05 ‑2,05 4,20 0,380</p><p>10 9,49 0,51 0,26 0,027</p><p>41,136</p><p>X</p><p>O E</p><p>E</p><p>2</p><p>2</p><p>41373�</p><p>�� �</p><p>�� ,</p><p>161</p><p>ESTATÍSTICA ECONÔMICA — INTRODUÇÃO À ECONOMETRIA</p><p>Probabilidade de rejeitar H0</p><p>quando verdadeira</p><p>Rejeitar H0 se X2 for maior</p><p>que o valor críticoestiver neste intervalo</p><p>Aceitar H0 se X2</p><p>valor crítico</p><p>g.l. = 6</p><p>0 2 4 6 8 10 12 X2</p><p>16,812 X2 = 41,373</p><p>Figura 74 – Função densidade qui‑quadrado</p><p>A figura anterior mostra a localização da área de rejeição e a estatística do teste qui‑quadrado.</p><p>Como X2 = 41,373 está na área de rejeição, deve‑se decidir por rejeitar a hipótese nula. Em outras</p><p>palavras, a um nível de 1%, há evidência suficiente para concluir que o número de filhos e a renda</p><p>das famílias são dependentes.</p><p>Saiba mais</p><p>Para saber mais sobre o teste de qui‑quadrado e testes não</p><p>paramétricos, consulte:</p><p>HOFFMAN, R. Estatística para economistas. São Paulo: Pioneira.</p><p>1980. p. 197‑230.</p><p>6 TESTES DE HIPÓTESES COM DUAS AMOSTRAS</p><p>No restante desta unidade vamos aprender métodos para testar uma alegação comparando</p><p>parâmetros de duas populações. Exemplo: a alegação de que “a medição da velocidade de acesso à</p><p>internet de um determinado concorrente é maior que o da sua”. Podemos também comparar a eficiência</p><p>de dois métodos de produção de uma peça qualquer ou, se extraídas duas amostras de peças, cada</p><p>qual tomada de uma máquina diferente, poderemos dizer (alegar) se tais equipamentos produzem com</p><p>média ou desvio‑padrão iguais ou não.</p><p>O principal conceito a ser utilizado nesses testes para duas populações é o da combinação de</p><p>duas distribuições. Trabalharemos, então, com uma terceira distribuição resultante da combinação</p><p>das duas primeiras.</p><p>162</p><p>Unidade II</p><p>A alegação de que há diferença significativa na quantidade de tempo de execução em um processo</p><p>de produção entre o turno da manhã e o turno da noite em uma determinada indústria metalúrgica:</p><p>População do</p><p>turno da manhã</p><p>População do</p><p>turno da noite</p><p>Amostra Amostrax1= 35 min</p><p>s1= 11 min</p><p>n1= 100</p><p>x2= 31 min</p><p>s2= 12 min</p><p>n2= 125</p><p>Figura 75 – Parâmetros das amostras</p><p>‑5 ‑4 ‑3 ‑2 ‑1 0 1 2 3 4 5</p><p>Diferença nas médias amostrais (em minutos)</p><p>Estatística de teste padronizada</p><p>Estatística de teste: x1 ‑ x2 = 35 ‑ 31 = 4</p><p>x1 ‑ x2</p><p>‑3 ‑2 ‑1 0 1 2 3</p><p>Z</p><p>Figura 76 – Distribuição amostral</p><p>Observação</p><p>Ao realizar um teste de hipótese de duas amostras, estamos testando uma</p><p>alegação referente à diferença entre os parâmetros nas duas populações,</p><p>mas não o próprio valor dos parâmetros.</p><p>6.1 Testes de hipóteses para diferença entre duas médias</p><p>Temos duas amostras, conforme segue, obtidas de duas populações (X1 e X2), tidas como diferentes:</p><p>1) X11, X12, X13,… … …, X1n1</p><p>. É uma amostra aleatória de uma população com média µ1 e variância σ1</p><p>2;</p><p>2) X21, X22, X23,… … …, X2n2. É uma amostra aleatória de uma população com média µ2 e variância σ2</p><p>2.</p><p>163</p><p>ESTATÍSTICA ECONÔMICA — INTRODUÇÃO À ECONOMETRIA</p><p>Três condições são necessárias à realização desse teste:</p><p>• As amostras devem ser selecionadas aleatoriamente.</p><p>• As amostras devem ser independentes.</p><p>• Cada tamanho de amostra deve ser de pelo menos 30. Caso contrário, cada população deve ter</p><p>uma distribuição normal com desvio‑padrão conhecido.</p><p>Observação</p><p>Duas amostras serão independentes se a amostra selecionada de</p><p>uma população não estiver relacionada à amostra selecionada de uma</p><p>segunda população.</p><p>Assim, podemos combiná‑las, isto é, subtrair a distribuição X1 da X2 e obter uma terceira distribuição</p><p>(X1 ‑ X2), com a qual iremos trabalhar. Pelo Princípio da combinação de Distribuições, podemos obter a</p><p>média e o desvio‑padrão da distribuição resultante:</p><p>µX ‑ Y = µ1 ‑ µ2 �</p><p>� �</p><p>X Y n n� � �1</p><p>2</p><p>1</p><p>2</p><p>2</p><p>2</p><p>Observação</p><p>Observe que a variância da distribuição amostral σ2</p><p>X ‑ Y é a soma das</p><p>variâncias das distribuições amostrais individuais para X1 e X2 .</p><p>Uma vez que a distribuição amostral X1 e X2 é normal, podemos usar o teste Z (normal padronizada)</p><p>para verificar diferenças entre duas médias populacionais µ1 ‑ µ2.</p><p>Z = (diferença observada) ‑ (diferença por hipótese formulada)</p><p>(erro‑padrão)</p><p>Fórmula 42</p><p>Z</p><p>X X m m</p><p>sX X</p><p>=</p><p>( - ) - ( - )</p><p>-</p><p>1 2 1 2</p><p>1 2</p><p>164</p><p>Unidade II</p><p>Caso I: supondo as populações com variâncias (σ1</p><p>2 e σ2</p><p>2) conhecidas</p><p>Tabela 29 – Teste Z de hipótese (H0 : µ1 ‑ µ2 = ∆0)</p><p>Hipótese nula H0 : µ1 ‑ µ2 = ∆0</p><p>Valor da estatística de teste</p><p>z</p><p>X X</p><p>n n</p><p>obs �</p><p>� �</p><p>�</p><p>1 2 0</p><p>1</p><p>2</p><p>1</p><p>2</p><p>2</p><p>2</p><p>�</p><p>� �</p><p>Hipótese alternativa Intervalo de rejeição (nível α)</p><p>H1 : µ1 ‑ µ2 > ∆0 Zobs > Zα</p><p>H1 : µ1 ‑ µ2 < ∆0 Zobs < ‑ Zα</p><p>H1 : µ1 ‑ µ2 ≠ ∆0 |Zobs| > Zα/2</p><p>Se o teste for normal para a média, teremos Região Crítica (RC):</p><p>1 - α 1 - α</p><p>Região de aceitação (R A )</p><p>Região Crítica para µ > µ0</p><p>µ0</p><p>µ0</p><p>Região Crítica para µ < µ0</p><p>Região de</p><p>Rejeição ou Crítica (RR)</p><p>αα</p><p>x0 x0</p><p>x x</p><p>zα ‑ zα</p><p>0 0z z</p><p>Figura 77 – Distribuição normal padronizada (Z)</p><p>Exemplo 79: um teste de econometria foi aplicado a 50 alunos de economia e 75 alunas de</p><p>economia. As alunas obtiveram média de 83 com desvio‑padrão 8, enquanto os alunos tiveram média</p><p>de 75 e desvio‑padrão 6. Podemos concluir que há diferença entre as médias dos alunos e das alunas</p><p>considerando um nível de significância de 5% (α = 0,05).</p><p>Resolução:</p><p>µ1 = média dos alunos; µ2 = média das alunas</p><p>H0 : µ1 = µ2 ou µ1 ‑ µ2 = 0 (∆0 = 0)</p><p>165</p><p>ESTATÍSTICA ECONÔMICA — INTRODUÇÃO À ECONOMETRIA</p><p>H1 : µ1 ≠ µ2 ou µ1 ‑ µ2 ≠ 0 (∆0 ≠ 0)</p><p>Calculando:</p><p>z �</p><p>� �</p><p>�</p><p>�</p><p>�</p><p>� �</p><p>75 83 0</p><p>64</p><p>50</p><p>36</p><p>75</p><p>8</p><p>13266</p><p>6 0305</p><p>,</p><p>,</p><p>A região de rejeição: Z ou Z ou seja Z Z� � �/ /, ,2</p><p>2</p><p>2196 196� � � �</p><p>Como |Z| > Zα/2 ∴ há diferença entre as médias.</p><p>Exemplo 80: um instituto de pesquisa econômica alega que há uma diferença entre a renda média</p><p>das famílias que possuem automóveis populares das marcas A e B. Por meio de um levantamento</p><p>aleatório de 150 possuidores de cada grupo, os resultados obtidos estão apresentados na tabela a seguir.</p><p>Considerando que as duas amostras são independentes, calcule, com nível de 5% de significância, se os</p><p>resultados confirmam a alegação do instituto.</p><p>Tabela 30 – Marcas de automóvel</p><p>Marca A Marca B</p><p>X1 =$ 6.900 X2 = $ 7.290</p><p>S1 =$ 1.360 S2 = $ 1.700</p><p>n1 =150 n2 =150</p><p>Resolução: desejamos testar a alegação de que há uma diferença entre as rendas médias das</p><p>famílias que possuem automóveis populares da marca A e da marca B. Portanto, temos as hipóteses</p><p>nula e alternativa a seguir:</p><p>H0 : µ1 = µ2 e H0 : µ1 ≠ µ2 (alegação)</p><p>Trata‑se de um teste bicaudal, e o nível de significância é de 5% (α = 0,05). Pela tabela da normal</p><p>padronizada, os valores críticos são ‑ 1,96 e 1,96. As regiões de rejeição são Z < ‑1,96 e Z > 1,96. Uma</p><p>vez que ambas as amostras são consideradas grandes (n > 30), podemos usar s1 e s2 para calcular o</p><p>erro‑padrão:</p><p>�x x</p><p>s</p><p>n</p><p>s</p><p>n1 2</p><p>1</p><p>2</p><p>1</p><p>2</p><p>2</p><p>2</p><p>2 21360</p><p>150</p><p>1700</p><p>150</p><p>178� � � � � �</p><p>Utilizando o teste Z, a estatística de teste padronizada é:</p><p>166</p><p>Unidade II</p><p>Fórmula 43</p><p>Z</p><p>X X m m</p><p>sX X</p><p>=</p><p>( - ) - ( - )</p><p>-</p><p>1 2 1 2</p><p>1 2</p><p>µ1 ‑ µ2 = 0, pois H0 estabelece que µ1 = µ2</p><p>Z �</p><p>�� � �</p><p>� � ,</p><p>6900 7290 0</p><p>178</p><p>2 19</p><p>As regiões de rejeição são Z< ‑ 1,96 e Z > 1,96, uma vez que o Z (calculado) se encontra na região</p><p>de rejeição, a um nível de 5%, há evidência suficiente para confirmar a existência de uma diferença</p><p>significante entre as rendas médias das famílias</p>