Prévia do material em texto
ECONOMETRIA CETREDE 01/05/2019 (IBGE 2002 – Analista Socioeconômico) Numa regressão linear simples, o coeficiente de determinação representa: a) a média da soma dos quadrados dos desvios b) a soma dos quadrados dos resíduos c) a raiz quadrada do coeficiente de correlação amostral d) a variância dos dados e) a porcentagem da variação total dos dados que é explicada pela regressão Gabarito Bom pessoal, basta ler a definição do R² que nós chegaremos facilmente à alternativa (e). Ano: 2018 Banca: INSTITUTO AOCP Órgão: ITEP - RN Prova: INSTITUTO AOCP - 2018 - ITEP - RN - Perito Criminal - Engenharia Civil Ao desenvolver um modelo de regressão linear para a avaliação de imóveis, um dos parâmetros populacionais a ser considerado é se o imóvel se encontra em um logradouro tipo “rua” ou tipo “avenida”. A variável independente mais adequada para diferenciar o tipo de logradouro em “rua” ou “avenida” é uma variável do tipo Adicotômica. Bqualitativa. Cquantitativa. Dproxy. Econdicional. GABARITO LETRA A 3.76 variável dicotômica: variável que assume apenas duas posições *4) As variáveis dicotômicas também são conhecidas na literatura como variáveis binárias, “dummies”, “de estado”, “zero-um” e outros termos. 3.73 variáveis qualitativas: variáveis que não podem ser medidas ou contadas, mas apenas ordenadas ou hierarquizadas, de acordo com atributos inerentes ao bem 3.74 variáveis quantitativas: variáveis que podem ser medidas ou contadas 3.77 variável “proxy”: variável utilizada para substituir outra de difícil mensuração e que se presume guardar com ela relação de pertinência, obtida por meio de indicadores publicados ou inferidos em outros estudos de mercado 07/05/2019 GABARITO (F) A variável X é do tipo qualitativo nominal (F) A amplitude é igual ou superior a 5. Falso. Pois a amplitude é a diferença entre o valor máximo e o valor mínimo (4-0=0) As variáveis qualitativas podem ser divididas em nominais e ordinais. Ordinais são aquelas que podem ser ordenadas conforme seu resultado, nominais são aquelas cuja operação não é possível. Perceba que quando eu digo “ordenar” eu estou falando em classificar, a depender de seu resultado. Por exemplo, as realizações de uma pesquisa com indivíduos no quesito “nível de escolaridade”, é passível de ser ordenada, pois uma pessoa com ensino superior estudou mais anos do que outra com ensino médio. Assim, a pessoa com nível superior tem “mais escolaridade” do que a de ensino médio. O mesmo não pode se dizer com relação à variável nacionalidade, pois esta não pode ser ordenada. -“E as quantitativas, professor”? Por outro lado, as variáveis quantitativas podem ser dividas em discretas e contínuas. Veja, uma variável contínua é aquela que pode assumir infinitos valores. Por exemplo, a distância entre os seus olhos e o monitor pode ser de 30 cm, mas pode ser 30,01 cm, 30,0001, e por aí vai. Agora, se você for contar a quantidade de garrafas de água por apartamento em seu prédio, você só encontrará números inteiros, como uma, ou duas garrafas, por exemplo. A primeira é um exemplo de variável contínua e a segunda de discreta. Combinação: combina elementos de um mesmo conjunto de forma que a ordem não seja importante e que não haja reposição. Cn,p= Cn,p = Cn,p = Cn,p = Cn,p = 45 OBSERVAÇÃO: A probabilidade condicional determina qual a probabilidade de ocorrer o evento A, dado que já ocorreu B. A maioria das questões de probabilidade condicional é possível resolver sem precisar utilizar formula. 1º) Procura o total daquele evento (no caso, o total de casas que dispõem de sinal de TV aberta), depois procura o evento especifico (ou seja, o domicilio ser de zona rural e ter sinal de tv aberta). Por último, basta dividi evento provável/ total de eventos possíveis. OBSERVAÇÃO: Probabilidade condicional busca determinar qual a probabilidade de ocorrer o evento A, dado que já ocorreu B. OU -> Soma. E -> multiplica. OBSERVAÇÃO: As distribuições são simétricas quando é possível dividi os dados em duas partes exatamente igual (conforme exposto no gráfico). OBSERVAÇÃO: ESSA FORMULA REFERE-SE A VARIÂNCIA POPULACIONAL. OBSERVAÇÃO: 1º) A variância de uma maneira geral pode ser expressa por média da soma dos quadrados dos itens – quadrado da média. Já o desvio padrão é igual a raiz quadrada da variância. O desvio padrão é muito afetado pelo valor absoluto dos dados analisados, o que dificulta a comparação de duas series com valores muito diferentes. Assim, costuma-se utilizar o conceito de coeficiente de variação (CV). O coeficiente de variação é igual ao desvio padrão/ média. 2º) O intervalo interquartílico= terceiro quartil(75%) – primeiro quartil(25% dos valores) 3º) O diagrama box-plot corresponde a um gráfico que os estatísticos usam para mostra uma conjunto de dados. Quando os valores ultrapassam o limite superior significa que os valores são atípicos (saem do padrão dos demais dados). OBSERVAÇÃO: CURSTOSE MEDE O ACHATAMENTO DA CURVA 10/05/2019 QUANTO MAIOR O PICO MAIR SERÁ A CURTOSE OBSERVAÇÃO: À MEDIDA QUE VOU CALCULANDO AS MÉDIAS AMOSTRAIS, AS MÉDIAS IRÃO TENDER AO VALOR EXATO DA MÉDIA POPULACIONAL. OU SEJA, O VALOR ESPERADO DA MÉDIA AMOSTRA QUANDO ELA É CALCULADA VÁRIAS VEZES É A MÉDIA POPULACIONAL. - Quando a hipótese nula é verdadeira, então, deve-se aceitar a hipótese nula. O erro do tipo I ocorre quando a hipótese nula é verdadeira e mesmo assim rejeita-se a hipótese nula. Ele é representado por alfa e corresponde ao nível de significância. - Quando a hipótese nula é falsa deve-se rejeitar a hipótese nula. O erro do tipo II ocorre quando a hipótese nula é falsa e mesmo assim aceita-se a hipótese nula. Ele é representado por beta. O poder do teste é o complemento de beta, ou seja, corresponde ao erro do tipo II. O item está errado. Pois o conceito refere-se ao nível de significância e não ao poder do teste. Quanto menor for o p-valor mais ele tende a ser menor do que o nível de significância e nesse caso deve-se rejeitar a hipótese nula. A distribuição t de student ocorre quando a variância populacional é desconhecida. A regressão linear é utilizada para relacionar duas variáveis. Existem duas maneiras de calcular o coeficiente angular. Ano: 2014 Banca: CESGRANRIO Órgão: EPE Prova: CESGRANRIO - 2014 - EPE - Analista de Pesquisa Energética - Projetos da Geração de Energia Em um teste de hipótese estatístico sobre um parâmetro, define-se o poder do teste como a Aprobabilidade de rejeitar a hipótese H0 (nula) quando H0 é verdadeira. Bprobabilidade de não rejeitar a hipótese H0 (nula) quando H0 é verdadeira Cprobabilidade de rejeitar a hipótese H1 (alternativa) quando H1 é verdadeira. Dprobabilidade de rejeitar a hipótese H0 (nula) quando H0 é falsa. Emédia das probabilidades dos erros tipo I e tipo II. GABARITO Letra d. Poder = 1 - B, onde B é o erro tipo 2 O Poder do Teste tem como objetivo conhecer o quanto o teste de hipóteses controla um erro do tipo II, ou qual a probabilidade de rejeitar a hipótese nula se realmente for falsa. Na prática, é importante que se tenham testes com nível de significância próximos do nível de significância nominal e que o poder seja alto, mesmo em situações de amostras pequenas. Ano: 2018 Banca: COPS-UEL Órgão: PC-PR Prova: COPS-UEL - 2018 - PC-PR - Escrivão de Polícia Uma empresa recebeu 600 candidatos a uma determinada vaga de emprego. Desses candidatos, 184 possuem Ensino Superior completo. Sabe-se que, do total de candidatos, 405 pessoas falam inglês. Além disso, consta que, do total dos candidatos, 116 não possuem Ensino Superior completo e não falam inglês. Considerando os dados apresentados, assinale a alternativa correta. AA probabilidade de um candidato falar inglês e possuir Ensino Superior completo é de 6%. BA probabilidade de um candidato não falar inglês e possuir Ensino Superior completo é de 25%. CA probabilidade de um candidato falar inglês e não possuir Ensino Superior completo é de 50%. DEntre os candidatos que possuem Ensino Superior completo, a probabilidade de um deles falar inglêsé de 14%. EEntre os candidatos que falam inglês, a probabilidade de um deles possuir Ensino Superior completo é de 22%. GABARITO LETRA C COM ENSINO SUPERIOR E COM INGLÊS: 105 (para achar a intersecção é necessário somar todos os valores dados e diminuir do total, desse modo: 184 + 405 + 116 - 600 = 105). SOMENTE ENSINO SUPERIOR: 79 (é só fazer 184 - 105 = 79, assim estamos tirando o valor da intersecção). SOMENTE INGLÊS: 300 (é só fazer 405 - 105 = 300, assim estamos tirando o valor da intersecção). c) probabilidade de um candidato falar inglês e não possuir Ensino Superior: 300/600 = 0,5 ou 50%. Ano: 2018 Banca: IADES Órgão: IGEPREV-PA Prova: IADES - 2018 - IGEPREV-PA - Técnico de Estatística e Atuária Considere o modelo de regressão linear simples a seguir. Yi = βo + β1Xi + εi Suponha um modelo de regressão que busca explicar o consumo em função da renda, em determinada economia, em que o coeficiente de regressão da variável independente é positivo. Com base apenas nessas informações, assinale a alternativa correta. Aβ1 representa a variável dependente do modelo. BOs coeficientes βo, β1, e εi são as constantes da regressão. CYi representa o consumo, a variável dependente; Xi representa a renda, a variável explanatória; e β1 representa o coeficiente de regressão. DSe 0 < β1 < 1, então o aumento de Xi reduzirá o valor de Yi. EO termo de erro εi está associado à distância entre o valor observado de Yi e o valor atribuído a Xi. GABARITO LETRA C. Na representação gráfica da associação entre duas variáveis, a variável independente ou explicativa, é traçada no eixo X. A variável dependente de resposta é representada no eixo Y. Ano: 2018 Banca: CESPE Órgão: STM Prova: CESPE - 2018 - STM - Analista Judiciário - Estatística Considerando um modelo de regressão linear com erros heteroscedásticos, julgue o item seguinte. Para um modelo de regressão linear múltiplo, o teste de White permite detectar a heteroscedasticidade a partir da regressão de cada erro estimado da regressão original com as variáveis explicativas e seus inversos. · Certo · Errado GABARITO GABARITO ERRADO Heteroscedasticidade é a violação da hipótese de homoscedasticidade. Homoscedasticidade corresponde a hipótese de que a variância dos erros é constante. Ex.: curva de aprendizagem Ao analisar-se, por exemplo, um iniciante comete muitos mais erros em comparação com aqueles que já têm uma certa experiência em digitar. À medida que aumenta experiência com a digitação diminui a quantidade de erros. Para detectar a existência da heteroscedasticidade existem vários testes. Utiliza-se o teste de Goldfeld-Quandt quando se conhece a variável causadora do problema. Mas, o mais usado é aquele no qual não se conhece a variável causadora do problema. Como é solucionado o problema de heteroscedasticidade ? -> Quando variância for conhecida: usar-se o método dos mínimos quadrados ponderados, pois os estimadores obtidos por está técnica são BLUE. -> Quando a variância não for conhecida: deverá ser usado variância e erros-padrão consistentes, em heteroscedasticidade de white. Diz-se corrigido pela matriz de white.