Logo Passei Direto
Buscar

Fundamentos de Machine Learning e Modelagem Preditiva(1)

Ferramentas de estudo

Questões resolvidas

Esta prova examina o entendimento sobre os principais conceitos e algoritmos usados em Machine Learning, abordando tópicos como modelagem preditiva, seleção de variáveis e técnicas de validação.
O que é um modelo de aprendizado supervisionado?
a) Um modelo treinado com dados rotulados, onde o objetivo é prever rótulos ou valores a partir de entradas.
b) Um modelo que aprende de forma independente, sem dados de entrada.
c) Um modelo que usa dados não rotulados para descobrir estruturas ocultas nos dados.
d) Um modelo que busca prever a variabilidade de dados temporais.
e) Um modelo que ajusta os parâmetros automaticamente durante o processo de treinamento.

Qual técnica é comumente usada para evitar overfitting em um modelo de aprendizado de máquina?
a) Regularização
b) Aumento do número de variáveis de entrada
c) Redução da quantidade de dados de treinamento
d) Uso de dados não rotulados
e) Uso exclusivo de modelos de aprendizado supervisionado

Em que tipo de problema o algoritmo de árvore de decisão é mais utilizado?
a) Problemas de classificação e regressão, onde a tarefa é dividir os dados em subconjuntos com base em decisões simples.
b) Para detectar padrões em dados temporais.
c) Para realizar a redução de dimensionalidade.
d) Para classificar dados em clusters.
e) Para realizar previsão de séries temporais com dados históricos.

O que é seleção de variáveis em aprendizado de máquina?
a) O processo de identificar quais variáveis (ou características) são mais importantes para construir um modelo preditivo eficaz.
b) A técnica de aumentar o número de variáveis no modelo para melhorar a precisão.
c) A técnica de reduzir a dimensionalidade do conjunto de dados, excluindo variáveis irrelevantes.
d) O processo de transformação de variáveis contínuas em variáveis categóricas.
e) O processo de normalização dos dados.

O que caracteriza o algoritmo K-Nearest Neighbors (K-NN)?
a) Um modelo de aprendizado supervisionado utilizado para classificação e regressão, baseado na proximidade de dados.
b) Um modelo de aprendizado não supervisionado que agrupa dados em clusters.
c) Um modelo de aprendizado supervisionado utilizado para prever séries temporais.
d) Um modelo de aprendizado profundo para análise de grandes volumes de dados.
e) Um algoritmo utilizado exclusivamente para ajustar parâmetros de redes neurais.

O que significa o termo "underfitting" em um modelo de aprendizado de máquina?
a) Quando o modelo é muito simples e não consegue capturar a complexidade dos dados.
b) Quando o modelo é altamente preciso em dados de teste e de treinamento.
c) Quando o modelo sofre de alta variabilidade devido a um pequeno conjunto de dados.
d) Quando o modelo é complexo demais e se ajusta perfeitamente aos dados de treinamento.
e) Quando o modelo aprende rapidamente sem precisar de muita iteração.

O que é cross-validation (validação cruzada) e qual a sua finalidade?
a) Uma técnica usada para avaliar a performance do modelo dividindo o conjunto de dados em múltiplas partes de treino e teste.
b) Uma técnica usada para aumentar o número de dados de treinamento.
c) Um método de regularização que penaliza os modelos que não generalizam bem.
d) Uma técnica usada para aumentar o número de características em um modelo.
e) Um processo de transformação de dados contínuos em categóricos.

Qual é a principal função de uma rede neural artificial?
a) Simular o funcionamento do cérebro humano para aprender com grandes volumes de dados de forma não linear.
b) Encontrar a melhor combinação de variáveis para uma regressão linear.
c) Agrupar dados em categorias, mesmo sem rótulos.
d) Prever a próxima sequência de dados em séries temporais.
e) Estimar a probabilidade de ocorrências de eventos futuros.

O que é regularização L2 (Ridge) em modelos de aprendizado de máquina?
a) Uma técnica usada para penalizar os grandes coeficientes no modelo e evitar o overfitting.
b) Uma técnica para reduzir o número de variáveis, forçando coeficientes a serem exatamente zero.
c) Um processo de aumento de dados que cria variações de dados de treinamento.
d) Um processo de alteração do algoritmo para lidar com dados não rotulados.
e) Uma técnica para aumentar a complexidade do modelo e melhorar seu ajuste aos dados.

O que caracteriza a técnica de redução de dimensionalidade?
a) A redução do número de características de um conjunto de dados, mantendo a maior parte da informação relevante.
b) A criação de novas variáveis a partir das existentes para aumentar a complexidade do modelo.
c) A transformação de dados de uma escala grande para uma escala pequena.
d) A normalização dos dados para que todas as variáveis tenham a mesma importância.
e) A técnica de aumento do número de dados para melhorar a generalização do modelo.

Material
páginas com resultados encontrados.
páginas com resultados encontrados.
left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Questões resolvidas

Esta prova examina o entendimento sobre os principais conceitos e algoritmos usados em Machine Learning, abordando tópicos como modelagem preditiva, seleção de variáveis e técnicas de validação.
O que é um modelo de aprendizado supervisionado?
a) Um modelo treinado com dados rotulados, onde o objetivo é prever rótulos ou valores a partir de entradas.
b) Um modelo que aprende de forma independente, sem dados de entrada.
c) Um modelo que usa dados não rotulados para descobrir estruturas ocultas nos dados.
d) Um modelo que busca prever a variabilidade de dados temporais.
e) Um modelo que ajusta os parâmetros automaticamente durante o processo de treinamento.

Qual técnica é comumente usada para evitar overfitting em um modelo de aprendizado de máquina?
a) Regularização
b) Aumento do número de variáveis de entrada
c) Redução da quantidade de dados de treinamento
d) Uso de dados não rotulados
e) Uso exclusivo de modelos de aprendizado supervisionado

Em que tipo de problema o algoritmo de árvore de decisão é mais utilizado?
a) Problemas de classificação e regressão, onde a tarefa é dividir os dados em subconjuntos com base em decisões simples.
b) Para detectar padrões em dados temporais.
c) Para realizar a redução de dimensionalidade.
d) Para classificar dados em clusters.
e) Para realizar previsão de séries temporais com dados históricos.

O que é seleção de variáveis em aprendizado de máquina?
a) O processo de identificar quais variáveis (ou características) são mais importantes para construir um modelo preditivo eficaz.
b) A técnica de aumentar o número de variáveis no modelo para melhorar a precisão.
c) A técnica de reduzir a dimensionalidade do conjunto de dados, excluindo variáveis irrelevantes.
d) O processo de transformação de variáveis contínuas em variáveis categóricas.
e) O processo de normalização dos dados.

O que caracteriza o algoritmo K-Nearest Neighbors (K-NN)?
a) Um modelo de aprendizado supervisionado utilizado para classificação e regressão, baseado na proximidade de dados.
b) Um modelo de aprendizado não supervisionado que agrupa dados em clusters.
c) Um modelo de aprendizado supervisionado utilizado para prever séries temporais.
d) Um modelo de aprendizado profundo para análise de grandes volumes de dados.
e) Um algoritmo utilizado exclusivamente para ajustar parâmetros de redes neurais.

O que significa o termo "underfitting" em um modelo de aprendizado de máquina?
a) Quando o modelo é muito simples e não consegue capturar a complexidade dos dados.
b) Quando o modelo é altamente preciso em dados de teste e de treinamento.
c) Quando o modelo sofre de alta variabilidade devido a um pequeno conjunto de dados.
d) Quando o modelo é complexo demais e se ajusta perfeitamente aos dados de treinamento.
e) Quando o modelo aprende rapidamente sem precisar de muita iteração.

O que é cross-validation (validação cruzada) e qual a sua finalidade?
a) Uma técnica usada para avaliar a performance do modelo dividindo o conjunto de dados em múltiplas partes de treino e teste.
b) Uma técnica usada para aumentar o número de dados de treinamento.
c) Um método de regularização que penaliza os modelos que não generalizam bem.
d) Uma técnica usada para aumentar o número de características em um modelo.
e) Um processo de transformação de dados contínuos em categóricos.

Qual é a principal função de uma rede neural artificial?
a) Simular o funcionamento do cérebro humano para aprender com grandes volumes de dados de forma não linear.
b) Encontrar a melhor combinação de variáveis para uma regressão linear.
c) Agrupar dados em categorias, mesmo sem rótulos.
d) Prever a próxima sequência de dados em séries temporais.
e) Estimar a probabilidade de ocorrências de eventos futuros.

O que é regularização L2 (Ridge) em modelos de aprendizado de máquina?
a) Uma técnica usada para penalizar os grandes coeficientes no modelo e evitar o overfitting.
b) Uma técnica para reduzir o número de variáveis, forçando coeficientes a serem exatamente zero.
c) Um processo de aumento de dados que cria variações de dados de treinamento.
d) Um processo de alteração do algoritmo para lidar com dados não rotulados.
e) Uma técnica para aumentar a complexidade do modelo e melhorar seu ajuste aos dados.

O que caracteriza a técnica de redução de dimensionalidade?
a) A redução do número de características de um conjunto de dados, mantendo a maior parte da informação relevante.
b) A criação de novas variáveis a partir das existentes para aumentar a complexidade do modelo.
c) A transformação de dados de uma escala grande para uma escala pequena.
d) A normalização dos dados para que todas as variáveis tenham a mesma importância.
e) A técnica de aumento do número de dados para melhorar a generalização do modelo.

Prévia do material em texto

Prova- 92: Fundamentos de Machine Learning e Modelagem Preditiva
Introdução
Esta prova examina o entendimento sobre os principais conceitos e algoritmos usados em Machine Learning, abordando tópicos como modelagem preditiva, seleção de variáveis e técnicas de validação.
Questões
1. O que é um modelo de aprendizado supervisionado?
a) Um modelo treinado com dados rotulados, onde o objetivo é prever rótulos ou valores a partir de entradas.
b) Um modelo que aprende de forma independente, sem dados de entrada.
c) Um modelo que usa dados não rotulados para descobrir estruturas ocultas nos dados.
d) Um modelo que busca prever a variabilidade de dados temporais.
e) Um modelo que ajusta os parâmetros automaticamente durante o processo de treinamento.
2. Qual técnica é comumente usada para evitar overfitting em um modelo de aprendizado de máquina?
a) Regularização
b) Aumento do número de variáveis de entrada
c) Redução da quantidade de dados de treinamento
d) Uso de dados não rotulados
e) Uso exclusivo de modelos de aprendizado supervisionado
3. Em que tipo de problema o algoritmo de árvore de decisão é mais utilizado?
a) Problemas de classificação e regressão, onde a tarefa é dividir os dados em subconjuntos com base em decisões simples.
b) Para detectar padrões em dados temporais.
c) Para realizar a redução de dimensionalidade.
d) Para classificar dados em clusters.
e) Para realizar previsão de séries temporais com dados históricos.
4. O que é seleção de variáveis em aprendizado de máquina?
a) O processo de identificar quais variáveis (ou características) são mais importantes para construir um modelo preditivo eficaz.
b) A técnica de aumentar o número de variáveis no modelo para melhorar a precisão.
c) A técnica de reduzir a dimensionalidade do conjunto de dados, excluindo variáveis irrelevantes.
d) O processo de transformação de variáveis contínuas em variáveis categóricas.
e) O processo de normalização dos dados.
5. O que caracteriza o algoritmo K-Nearest Neighbors (K-NN)?
a) Um modelo de aprendizado supervisionado utilizado para classificação e regressão, baseado na proximidade de dados.
b) Um modelo de aprendizado não supervisionado que agrupa dados em clusters.
c) Um modelo de aprendizado supervisionado utilizado para prever séries temporais.
d) Um modelo de aprendizado profundo para análise de grandes volumes de dados.
e) Um algoritmo utilizado exclusivamente para ajustar parâmetros de redes neurais.
6. O que significa o termo "underfitting" em um modelo de aprendizado de máquina?
a) Quando o modelo é muito simples e não consegue capturar a complexidade dos dados.
b) Quando o modelo é altamente preciso em dados de teste e de treinamento.
c) Quando o modelo sofre de alta variabilidade devido a um pequeno conjunto de dados.
d) Quando o modelo é complexo demais e se ajusta perfeitamente aos dados de treinamento.
e) Quando o modelo aprende rapidamente sem precisar de muita iteração.
7. O que é cross-validation (validação cruzada) e qual a sua finalidade?
a) Uma técnica usada para avaliar a performance do modelo dividindo o conjunto de dados em múltiplas partes de treino e teste.
b) Uma técnica usada para aumentar o número de dados de treinamento.
c) Um método de regularização que penaliza os modelos que não generalizam bem.
d) Uma técnica usada para aumentar o número de características em um modelo.
e) Um processo de transformação de dados contínuos em categóricos.
8. Qual é a principal função de uma rede neural artificial?
a) Simular o funcionamento do cérebro humano para aprender com grandes volumes de dados de forma não linear.
b) Encontrar a melhor combinação de variáveis para uma regressão linear.
c) Agrupar dados em categorias, mesmo sem rótulos.
d) Prever a próxima sequência de dados em séries temporais.
e) Estimar a probabilidade de ocorrências de eventos futuros.
9. O que é regularização L2 (Ridge) em modelos de aprendizado de máquina?
a) Uma técnica usada para penalizar os grandes coeficientes no modelo e evitar o overfitting.
b) Uma técnica para reduzir o número de variáveis, forçando coeficientes a serem exatamente zero.
c) Um processo de aumento de dados que cria variações de dados de treinamento.
d) Um processo de alteração do algoritmo para lidar com dados não rotulados.
e) Uma técnica para aumentar a complexidade do modelo e melhorar seu ajuste aos dados.
10. O que caracteriza a técnica de redução de dimensionalidade?
a) A redução do número de características de um conjunto de dados, mantendo a maior parte da informação relevante.
b) A criação de novas variáveis a partir das existentes para aumentar a complexidade do modelo.
c) A transformação de dados de uma escala grande para uma escala pequena.
d) A normalização dos dados para que todas as variáveis tenham a mesma importância.
e) A técnica de aumento do número de dados para melhorar a generalização do modelo.
Gabarito e Justificativas
1. a) Modelos supervisionados são treinados com dados rotulados, com o objetivo de prever rótulos ou valores com base nas entradas.
2. a) A regularização adiciona penalidades ao modelo para evitar overfitting, incentivando a simplificação do modelo.
3. a) Árvore de decisão é usada para problemas de classificação e regressão, segmentando os dados em decisões simples.
4. a) A seleção de variáveis é usada para identificar quais características são mais importantes na construção de um modelo eficiente.
5. a) O algoritmo K-NN classifica ou prevê dados com base na proximidade dos dados de treinamento mais próximos.
6. a) Underfitting ocorre quando o modelo é simples demais e não captura a complexidade dos dados.
7. a) Cross-validation é uma técnica para avaliar a performance do modelo ao dividir os dados em várias partes de treino e teste.
8. a) Redes neurais artificiais são projetadas para aprender de forma não linear a partir de grandes volumes de dados, simulando o cérebro humano.
9. a) Ridge regularization (L2) penaliza coeficientes grandes, evitando o overfitting e mantendo o modelo mais simples.
10. a) A redução de dimensionalidade busca diminuir o número de variáveis, mantendo as informações essenciais dos dados.

Mais conteúdos dessa disciplina