Logo Passei Direto
Buscar

Estatísticas Aplicadas

Colégio Objetivo
Vimos que uma jovem cientista de dados realizou o treino (ajuste) de um modelo de regressão logística múltipla aos dados da amostra. Os resultados que encontrou foram muito ricos, sugerindo uma série de explicações, aprendidas pelo algoritmo com base nos dados fornecidos. Veja que dizemos “explicações sugeridas”, pois qualquer resultado de um algoritmo deve ser confrontado com especialistas da área em estudo. Contudo, vamos rever o que o modelo de regressão múltipla treinado pela jovem cientista de dados sugere. Para isso, analise as afirmativas a seguir.

I. A probabilidade da inadimplência cresce com o aumento dos gastos médios com o cartão de crédito. Isto, que nos parece óbvio, foi o que os dados “contaram” para o algoritmo de regressão logística múltipla.
II. A probabilidade da inadimplência cresce com o aumento da renda média mensal das pessoas. Isto não é tão óbvio e provavelmente não teríamos coragem de generalizar para outras situações, mas foi o que os dados da amostra do gerente do banco “contaram” para o algoritmo de regressão logística múltipla.
III. Para duas pessoas com a mesma renda mensal e o mesmo gasto mensal com cartão de crédito, a probabilidade de inadimplência com o cartão é maior para aquela sem emprego estável. Novamente, isto foi o que os dados amostrados “contaram” para o algoritmo de regressão logística múltipla.
IV. O modelo de regressão logística múltipla, ajustado aos dados da amostra, consegue predizer os efeitos da renda mensal da pessoa, do seu gasto médio mensal com cartão de crédito e se ela tem ou não um emprego estável, na probabilidade de a pessoa ficar inadimplente com o cartão de crédito. Um algoritmo desse tipo pode ajudar no processo decisório de um banco quanto à aprovação de cartão de crédito, ao lado de outros critérios e ferramentas analíticas disponíveis para o banco.
Está correto o que se afirma em:

I. A probabilidade da inadimplência cresce com o aumento dos gastos médios com o cartão de crédito.
II. A probabilidade da inadimplência cresce com o aumento da renda média mensal das pessoas.
III. Para duas pessoas com a mesma renda mensal e o mesmo gasto mensal com cartão de crédito, a probabilidade de inadimplência com o cartão é maior para aquela sem emprego estável.
IV. O modelo de regressão logística múltipla, ajustado aos dados da amostra, consegue predizer os efeitos da renda mensal da pessoa, do seu gasto médio mensal com cartão de crédito e se ela tem ou não um emprego estável, na probabilidade de a pessoa ficar inadimplente com o cartão de crédito. Um algoritmo desse tipo pode ajudar no processo decisório de um banco quanto à aprovação de cartão de crédito, ao lado de outros critérios e ferramentas analíticas disponíveis para o banco.
a. I e II, apenas.
b. II, III e IV, apenas.
c. III e IV, apenas.
d. I, II, III e IV.
e. II e III, apenas.
User badge image
Estudando com Questões

há 3 anos

Respostas

User badge image

Ed Verified user icon

ano passado

Vamos analisar cada afirmativa: I. A probabilidade da inadimplência cresce com o aumento dos gastos médios com o cartão de crédito. Verdadeiro, isso é uma relação esperada e geralmente observada em análises de crédito. II. A probabilidade da inadimplência cresce com o aumento da renda média mensal das pessoas. Falso, geralmente espera-se que uma maior renda esteja associada a uma menor probabilidade de inadimplência, a menos que haja outros fatores em jogo que não estão claros aqui. III. Para duas pessoas com a mesma renda mensal e o mesmo gasto mensal com cartão de crédito, a probabilidade de inadimplência com o cartão é maior para aquela sem emprego estável. Verdadeiro, isso faz sentido, pois a estabilidade no emprego geralmente está associada a uma maior capacidade de pagamento. IV. O modelo de regressão logística múltipla, ajustado aos dados da amostra, consegue predizer os efeitos da renda mensal da pessoa, do seu gasto médio mensal com cartão de crédito e se ela tem ou não um emprego estável, na probabilidade de a pessoa ficar inadimplente com o cartão de crédito. Verdadeiro, essa é uma das funções de um modelo de regressão logística múltipla. Com base na análise, as afirmativas I, III e IV são verdadeiras, enquanto a II é falsa. Portanto, a alternativa correta que contém todos os itens verdadeiros é: d) I, II, III e IV.

Essa resposta te ajudou?

1
Dislike0

Experimente
o Premium! 🤩

Libere respostas sem pagar

User badge image

Ed Verified user icon

há 3 anos

A alternativa correta é a letra d) I, II, III e IV. Todas as afirmativas estão corretas e foram sugeridas pelo modelo de regressão logística múltipla treinado pela jovem cientista de dados. No entanto, é importante lembrar que qualquer resultado de um algoritmo deve ser confrontado com especialistas da área em estudo.

Essa resposta te ajudou?

6
Dislike0
User badge image

Carlos De Souza Sandoval

há 2 anos

Resposta correta: I, II, III e IV

Resposta correta. Todas as asserções desta questão são verdadeiras. Para os dados analisados, probabilidade da inadimplência cresce com o aumento dos gastos médios com o cartão de crédito e com o aumento da renda média mensal das pessoas. Para duas pessoas com a mesma renda mensal e o mesmo gasto mensal com cartão de crédito, a probabilidade de inadimplência com o cartão é maior para aquela sem emprego estável. E o modelo de regressão logística múltipla é um modelo preditivo, um classificador probabilístico.

Essa resposta te ajudou?

4
Dislike0

Ainda com dúvidas?

Envie uma pergunta e tenha sua dúvida de estudo respondida!

Essa pergunta também está no material:

Mais perguntas desse material

Naturalmente, dados ocupam uma posição central, tanto na estatística quanto na ciência dos dados. Entendê-los, saber da sua natureza, o que representam, é de suma importância, antes da realização de qualquer análise ou projeto. Os dados são divididos entre quantitativos e qualitativos, na estatística e na ciência dos dados. Relativamente aos qualitativos, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s).

I. ( ) Dados qualitativos dicotômicos são dados observados de variáveis qualitativas que podem assumir apenas dois níveis (também chamados de classes) como seus valores, tais como sexo (feminino ou masculino), ocupação (empregado ou desempregado), localização (bairro ou centro), emprego estável (sim ou não), inadimplente (sim ou não).
II. ( ) Dados qualitativos politômicos são aqueles oriundos de variáveis qualitativas que podem assumir três ou mais níveis como seus valores, tais como classe social (A, B, C, D e E), escolaridade (fundamental, médio, superior), gravidade da doença (baixa, média, alta).
III. ( ) A função table() do R permite a contagem da frequência de cada nível assumido por uma variável qualitativa em uma dada amostra, e foi usada pela jovem cientista de dados para contar a frequência de pessoas com ou sem emprego estável e se ficaram ou não inadimplentes com o pagamento das faturas do cartão no período

I. Dados qualitativos dicotômicos são dados observados de variáveis qualitativas que podem assumir apenas dois níveis (também chamados de classes) como seus valores, tais como sexo (feminino ou masculino), ocupação (empregado ou desempregado), localização (bairro ou centro), emprego estável (sim ou não), inadimplente (sim ou não).
II. Dados qualitativos politômicos são aqueles oriundos de variáveis qualitativas que podem assumir três ou mais níveis como seus valores, tais como classe social (A, B, C, D e E), escolaridade (fundamental, médio, superior), gravidade da doença (baixa, média, alta).
III. A função table() do R permite a contagem da frequência de cada nível assumido por uma variável qualitativa em uma dada amostra, e foi usada pela jovem cientista de dados para contar a frequência de pessoas com ou sem emprego estável e se ficaram ou não inadimplentes com o pagamento das faturas do cartão no período
a. V, V, F
b. F, V, V
c. V, F, V
d. V, V, V
e. F, F, V

Assinale a alternativa que apresenta a sequência correta.

I. ( ) Um mosaicplot permite a visualização gráfica da relação entre duas variáveis qualitativas.
II. ( ) Problemas de classificação são mais frequentes no mundo do que problemas de regressão.
III. ( ) A Netflix usa classificadores para recomendar filmes.
IV. ( ) Dentre os dados fornecidos pelo gerente do banco à jovem cientista de dados, um é relativo a uma variável quantitativa e os outros são relativos a variáveis qualitativas.
a. F, V, F, V.
b. F, F, F, F.
c. V, V, F, F.
d. V, V, F, V.
e. V, V, V, V.

Analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s).

I. ( ) Para examinar visualmente a relação entre duas variáveis, em que uma é quantitativa e a outra é qualitativa, não é possível a utilização de gráficos de dispersão.
II. ( ) Boxplots são uma solução inteligente para a visualização da relação entre uma variável quantitativa e uma variável qualitativa.
III. ( ) Boxplots são uma solução inteligente para a visualização da relação entre duas variáveis quantitativas.
IV. ( ) Boxplots são uma solução inteligente para a visualização da distribuição de uma variável quantitativa.
a. V, F, F, V.
b. F, V, F, V.
c. F, F, V, V.
d. V, F, V, F.
e. F, V, V, F.

Assinale a alternativa que apresenta a sequência correta.

I. O gráfico de barras é um tipo de gráfico que pode ser utilizado para representar variáveis qualitativas.
II. O gráfico de dispersão é um tipo de gráfico que pode ser utilizado para representar a relação entre uma variável quantitativa e uma variável qualitativa.
III. Para examinar visualmente a relação entre duas variáveis quantitativas, um dos gráficos preferidos é o diagrama de caixas, também conhecido como boxplot.
IV. Na construção de um boxplot, podemos representar no eixo vertical os níveis da variável qualitativa e no eixo horizontal, os valores da variável quantitativa. Nesse caso, a visualização da variação dos dados da variável quantitativa é exibida horizontalmente, e os níveis (classes) da variável qualitativa são exibidos verticalmente.
a. F, F, V, V.
b. V, V, F, F.
c. F, V, V, F.
d. V, F, F, V.
e. V, V, F, V.

Está correto o que se afirma em:

I. Modelos de regressão logística simples são usados na predição de uma variável resposta qualitativa quando há mais do que uma variável de entrada.
II. Modelos de regressão linear simples são usados na predição de uma variável resposta qualitativa quando se considera apenas uma variável de entrada.
III. Um possível modelo de regressão logística simples para a predição da probabilidade de inadimplência é: em que e β1 são os coeficientes do modelo, X1 o gasto médio mensal da pessoa com cartão de crédito e P a probabilidade de a pessoa ficar ou não inadimplente com o pagamento das faturas do cartão.
IV. O método comumente usado para calcular os valores dos coeficientes β0 e β1 é o Método da Máxima Verossimilhança. Para isso, pode-se fazer uso do software estatístico R.
a. III e IV, apenas.
b. II e III, apenas.
c. I, II e IV, apenas.
d. I e II, apenas.
e. II, III e IV, apenas.

Relativamente a esse assunto de algoritmos de classificação, analise as afirmativas a seguir.

I. Regressão logística é o único método de aprendizagem supervisionada que é utilizado para classificação, todos outros métodos são métodos de regressão.
II. Apesar do nome regressão logística, o que acaba sendo um pouco confuso para iniciantes, na verdade este é um dos vários métodos de aprendizagem supervisionada utilizado para classificação.
III. Dentre os métodos utilizados para classificação se encontram regressão logística, análise discriminante linear (LDA = Linear Discriminant Analysis), árvores de decisão para classificação, máquinas de vetores de suporte (SVM = support vector machines) e k-vizinhos mais próximos (KNN = k-nearest neighbors).
IV. Regressão linear não é um método de classificação, mas, sim, um dos métodos preditivos de aprendizagem supervisionada usados na predição de valores de variáveis respostas quantitativas.
a. I e II, apenas.
b. II e III, apenas.
c. I, II e IV, apenas.
d. I, III e IV, apenas.
e. II, III e IV, apenas.

Está correto o que se afirma em:

I. Na aprendizagem supervisionada, definimos uma das variáveis estudadas como sendo a variável resposta, a qual responde em função dos valores assumidos pelas outras variáveis, as quais são chamadas de variáveis de entrada.
II. Especificamente na aprendizagem supervisionada, também denominamos uma variável resposta de variável de saída ou variável dependente.
III. Especificamente na aprendizagem supervisionada, também denominamos uma variável de entrada de variável regressora, variável preditora ou variável independente.
IV. Na aprendizagem não supervisionada, tratamos todas as variáveis estudadas da mesma forma, sem procurar explicar o comportamento de uma delas em função dos valores assumidos pelas outras.
a. I, II, III e IV.
b. II, III e IV, apenas.
c. I, II e IV, apenas.
d. II e III, apenas.
e. I, III e IV, apenas.

Está correto o que se afirma em:

I. Na aprendizagem supervisionada, um problema de regressão é um no qual a variável resposta é qualitativa.
II. Na aprendizagem supervisionada, um problema de regressão é um no qual a variável resposta é quantitativa.
III. Na aprendizagem supervisionada, um problema de classificação é um no qual a variável resposta é qualitativa.
IV. Na aprendizagem supervisionada, um problema de classificação é um no qual a variável resposta é quantitativa.
a. II e III, apenas.
b. III e IV, apenas.
c. I e III, apenas.
d. II e IV, apenas.
e. III, apenas.

Está correto o que se afirma em:

I. Dados qualitativos dicotômicos são dados observados de variáveis qualitativas que podem assumir apenas dois níveis (também chamados de classes) como seus valores, tais como sexo (feminino ou masculino), ocupação (empregado ou desempregado), localização (bairro ou centro), emprego estável (sim ou não), inadimplente (sim ou não).
II. Dados qualitativos politômicos são aqueles oriundos de variáveis qualitativas que podem assumir três ou mais níveis como seus valores, tais como classe social (A, B, C, D e E), escolaridade (fundamental, médio, superior), gravidade da doença (baixa, média, alta).
III. A função table() do R permite a contagem da frequência de cada nível assumido por uma variável qualitativa em uma dada amostra, e foi usada pela jovem cientista de dados para contar a frequência de pessoas com ou sem emprego estável e se ficaram ou não inadimplentes com o pagamento das faturas do cartão no período amostrado.
IV. Um mosaicplot permite a visualização gráfica da relação entre duas variáveis qualitativas. Foi usado por uma jovem cientista de dados para examinar a possível relação entre duas variáveis qualitativas dicotômicas: pessoas com ou sem emprego estável e se ficaram ou não inadimplentes com o pagamento das faturas do cartão de crédito ao longo do período amostrado. Ela percebeu, ao ver o gráfico resultante (ver figura adiante), que parece haver um maior nível de inadimplência com o cartão entre aquelas que não têm emprego estável.
a. I e II, apenas.
b. II, III e IV, apenas.
c. III e IV, apenas.
d. I, II, III e IV.
e. II e III, apenas.

Mais conteúdos dessa disciplina