Logo Passei Direto
Buscar
10- Estudamos algoritmos preditivos com base em (1) modelos de regressão linear e (2) modelos de regressão logística. Esses modelos são aplicados em situações bem distintas, que dependem, essencialmente, da natureza da variável resposta, também chamada de variável dependente. Com esses dois modelos em mente, analise as afirmativas a seguir. 1. Modelos de regressão logística simples são usados na predição de uma variável resposta qualitativa quando há mais do que uma variável de entrada. 2. Modelos de regressão linear simples são usados na predição de uma variável resposta qualitativa quando se considera apenas uma variável de entrada. 3. Um possível modelo de regressão logística simples para a predição da probabilidade de inadimplência é: em que e são os coeficientes do modelo, , o gasto médio mensal da pessoa com cartão de crédito e , o valor esperado para a probabilidade de a pessoa ficar ou não inadimplente com o pagamento das faturas do cartão. 4. O método comumente usado para calcular os valores dos coeficientes e é o Método da Máxima Verossimilhança. Para isso, pode-se fazer uso do software estatístico R. Está correto o que se afirma em: (X) II, III e IV, apenas.

User badge image
Praticando Para o Saber

ano passado

Respostas

User badge image

Ed Verified user icon

ano passado

Vamos analisar cada afirmativa: 1. Modelos de regressão logística simples são usados na predição de uma variável resposta qualitativa quando há mais do que uma variável de entrada. Falso. Modelos de regressão logística simples são usados para prever uma variável resposta qualitativa com apenas uma variável de entrada. Se houver mais de uma variável de entrada, utiliza-se a regressão logística múltipla. 2. Modelos de regressão linear simples são usados na predição de uma variável resposta qualitativa quando se considera apenas uma variável de entrada. Falso. Modelos de regressão linear são usados para prever uma variável resposta quantitativa, não qualitativa. 3. Um possível modelo de regressão logística simples para a predição da probabilidade de inadimplência é: em que e são os coeficientes do modelo, \(X\) é o gasto médio mensal da pessoa com cartão de crédito e \(Y\) é o valor esperado para a probabilidade de a pessoa ficar ou não inadimplente com o pagamento das faturas do cartão. Verdadeiro. Essa afirmativa está correta, pois descreve adequadamente um modelo de regressão logística. 4. O método comumente usado para calcular os valores dos coeficientes é o Método da Máxima Verossimilhança. Para isso, pode-se fazer uso do software estatístico R. Verdadeiro. Essa afirmativa está correta, pois o Método da Máxima Verossimilhança é realmente utilizado na regressão logística e o R é um software comum para essa análise. Com base nas análises, apenas as afirmativas III e IV estão corretas. Portanto, a alternativa correta que contém todos os itens verdadeiros é: (X) II, III e IV, apenas. Essa alternativa é incorreta, pois o item II é falso. Assim, não há uma alternativa correta que contenha todos os itens verdadeiros. Você deve verificar as opções disponíveis, pois a resposta correta não está entre as opções apresentadas.

Essa resposta te ajudou?

0
Dislike0
left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar essa resposta. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Ainda com dúvidas?

Envie uma pergunta e tenha sua dúvida de estudo respondida!

Essa pergunta também está no material:

Mais perguntas desse material

Relativamente a esse assunto, analise as afirmativas a seguir. 1 Dados estruturados são dados que não possuem uma estrutura regular e repetitiva, seguindo um padrão comum adotado pelas ciências da computação, estatística e ciência dos dados. 2 A forma de organização básica dos dados, preferida na estatística e na ciência dos dados, é a forma tabular, na qual as variáveis são dispostas nas linhas e as observações são dispostas nas colunas. 3 Dados estruturados são dados que possuem uma estrutura regular e repetitiva, seguindo um padrão comum adotado pela ciência da computação, estatística e ciência dos dados. 4 A forma de organização básica dos dados, preferida na estatística e na ciência dos dados, é a forma tabular, na qual as variáveis são dispostas nas colunas e as observações são dispostas nas linhas. Está correto o que se afirma em:
III e IV, apenas.
I, II e IV, apenas.

Tomando como base esse modelo, que foi ajustado aos dados da amostra cedida pelo gerente, podemos estimar o valor esperado para a probabilidade de inadimplência com cartão de crédito das pessoas. Por exemplo, vamos considerar duas pessoas, uma com um gasto de médio mensal com o cartão de R$ 500,00, e a outra com um gasto médio mensal de R$ 1.000,00. Usando o modelo ajustado anterior, obtemos, respectivamente (assinale a alternativa correta):


a. 17% e 27%.
b. 7% e 27%.
c. 7% e 37% .
d. 27% e 7%.
e. 37% e 17%.

Relativamente a esse assunto de algoritmos de classificação, analise as afirmativas a seguir.
1. Regressão logística é o único método de aprendizagem supervisionada que é utilizado para classificação, todos outros métodos são métodos de regressão.
2. Apesar do nome regressão logística, o que acaba sendo um pouco confuso para iniciantes, na verdade este é um dos vários métodos de aprendizagem supervisionada utilizado para classificação.
3. Dentre os métodos utilizados para classificação se encontram regressão logística, análise discriminante linear (LDA = Linear Discriminant Analysis), árvores de decisão para classificação, máquinas de vetores de suporte (SVM = support vector machines) e k-vizinhos mais próximos (KNN = k-nearest neighbors).
4. Regressão linear não é um método de classificação, mas, sim, um dos métodos preditivos de aprendizagem supervisionada usados na predição de valores de variáveis respostas quantitativas.
Está correto o que se afirma em:

1. Regressão logística é o único método de aprendizagem supervisionada que é utilizado para classificação, todos outros métodos são métodos de regressão.
2. Apesar do nome regressão logística, o que acaba sendo um pouco confuso para iniciantes, na verdade este é um dos vários métodos de aprendizagem supervisionada utilizado para classificação.
3. Dentre os métodos utilizados para classificação se encontram regressão logística, análise discriminante linear (LDA = Linear Discriminant Analysis), árvores de decisão para classificação, máquinas de vetores de suporte (SVM = support vector machines) e k-vizinhos mais próximos (KNN = k-nearest neighbors).
4. Regressão linear não é um método de classificação, mas, sim, um dos métodos preditivos de aprendizagem supervisionada usados na predição de valores de variáveis respostas quantitativas.
I, III e IV, apenas.
II e III, apenas.
II, apenas.
III, apenas.
II, III e IV, apenas.

7- Naturalmente, dados ocupam uma posição central, tanto na estatística quanto na ciência dos dados. Entendê-los, saber da sua natureza, o que representam, é de suma importância, antes da realização de qualquer análise ou projeto. Os dados são divididos entre quantitativos e qualitativos, na estatística e na ciência dos dados. Relativamente aos qualitativos, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s). 1. ( ) Dados qualitativos dicotômicos são dados observados de variáveis qualitativas que podem assumir apenas dois níveis (também chamados de classes) como seus valores, tais como sexo (feminino ou masculino), ocupação (empregado ou desempregado), localização (bairro ou centro), emprego estável (sim ou não), inadimplente (sim ou não). 2. ( ) Dados qualitativos politômicos são aqueles oriundos de variáveis qualitativas que podem assumir três ou mais níveis como seus valores, tais como classe social (A, B, C, D e E), escolaridade (fundamental, médio, superior), gravidade da doença (baixa, média, alta). 3. ( ) A função table() do R permite a contagem da frequência de cada nível assumido por uma variável qualitativa em uma dada amostra, e foi usada pela jovem cientista de dados para contar a frequência de pessoas com ou sem emprego estável e se ficaram ou não inadimplentes com o pagamento das faturas do cartão no período amostrado. 4. ( ) Um mosaicplot permite a visualização gráfica da relação entre duas variáveis qualitativas. Foi usado por uma jovem cientista de dados para examinar a possível relação entre duas variáveis qualitativas dicotômicas: pessoas com ou sem emprego estável e se ficaram ou não inadimplentes com o pagamento das faturas do cartão de crédito ao longo do período amostrado. Ela percebeu, ao ver o gráfico resultante (ver figura adiante), que parece haver um maior nível de inadimplência com o cartão entre aquelas que não têm emprego estável. Assinale a alternativa que apresenta a sequência correta. (X) V, V, V, V.

Mais conteúdos dessa disciplina