Logo Passei Direto
Buscar

Fundamentos e Aplicações de Machine Learning

Ferramentas de estudo

Questões resolvidas

Esta prova examina os principais conceitos e técnicas de machine learning, com foco em modelos de aprendizado supervisionado e não supervisionado, além de discutir a escolha adequada de algoritmos de acordo com os dados e o problema proposto.
O que é overfitting em um modelo de aprendizado de máquina?
a) Quando o modelo tem boa performance em dados de treinamento, mas falha em dados de teste.
b) Quando o modelo generaliza bem para novos dados.
c) Quando o modelo é subajustado e não captura a relação entre os dados.
d) Quando o modelo está perfeitamente ajustado aos dados de treinamento.
e) Quando o modelo é treinado apenas com um conjunto de dados pequeno.

Qual o principal objetivo da técnica de regularização L1 (Lasso)?
a) Reduzir o número de variáveis no modelo, forçando alguns coeficientes a serem exatamente zero.
b) Melhorar a acurácia do modelo em grandes volumes de dados.
c) Ajustar os parâmetros de rede neural para melhor desempenho.
d) Aumentar a complexidade do modelo para capturar mais padrões.
e) Remover a necessidade de normalização dos dados.

O que caracteriza o algoritmo de Random Forest?
a) Um ensemble de árvores de decisão, onde a previsão final é obtida pela média das previsões de várias árvores.
b) Um modelo de redes neurais que realiza clustering de dados.
c) Um modelo que usa apenas uma árvore de decisão para previsões.
d) Um método de validação cruzada para avaliar a performance do modelo.
e) Um algoritmo de classificação baseado em dados temporais.

O que é o conceito de gradiente no contexto de aprendizado de máquina?
a) A taxa de variação da função de erro em relação aos parâmetros do modelo, utilizada para ajustar os pesos.
b) A medida de acurácia de um modelo em um conjunto de dados.
c) A quantidade de erros cometidos pelo modelo durante o treinamento.
d) A divisão dos dados em subconjuntos de treino e teste.
e) O processo de calcular a melhor combinação de variáveis para um modelo.

O que é a curva ROC e o que ela representa?
a) Um gráfico que compara a taxa de verdadeiros positivos com a taxa de falsos positivos.
b) Um gráfico que mostra a acurácia de um modelo em diferentes momentos do treinamento.
c) Uma técnica de visualização de clusters de dados.
d) Um gráfico que avalia o desempenho de modelos de regressão.
e) Uma forma de avaliar o erro do modelo em dados temporais.

Em que tipo de problema o algoritmo K-Means é mais utilizado?
a) Em problemas de clustering não supervisionado, para agrupar dados em clusters baseados em similaridade.
b) Em problemas de classificação supervisionada.
c) Para prever valores contínuos em séries temporais.
d) Para ajustar os hiperparâmetros de redes neurais.
e) Para detecção de anomalias em grandes bases de dados.

Qual das alternativas descreve uma característica das redes neurais convolucionais (CNNs)?
a) São especialmente eficazes em processar imagens e dados com estrutura espacial.
b) São usadas exclusivamente em problemas de regressão linear.
c) São aplicadas somente a problemas de classificação de texto.
d) Trabalham com dados temporais em séries de tempo.
e) São modelos simples, com poucas camadas de aprendizado.

Qual é o propósito do algoritmo de K-Nearest Neighbors (K-NN)?
a) Classificar ou prever a saída de um ponto de dados com base na proximidade de outros pontos no conjunto de dados.
b) Encontrar a melhor combinação de características para um modelo.
c) Realizar a redução da dimensionalidade dos dados.
d) Gerar previsões com base na média de dados históricos.
e) Ajustar os pesos de uma rede neural para melhorar seu desempenho.

O que é validação cruzada?
a) Uma técnica usada para avaliar a performance de um modelo, dividindo os dados em várias partes e treinando com diferentes subconjuntos.
b) O processo de ajustar os hiperparâmetros de um modelo.
c) Uma técnica de regularização utilizada para reduzir o overfitting.
d) Uma forma de adicionar mais dados de treinamento.
e) Uma forma de otimizar a estrutura de uma rede neural.

O que caracteriza um modelo de aprendizado supervisionado?
a) O modelo é treinado com dados rotulados, ou seja, com rótulos conhecidos para prever as saídas.
b) O modelo é treinado sem rótulos, identificando padrões e agrupando dados.
c) O modelo é treinado com dados temporais para prever tendências.
d) O modelo utiliza um único conjunto de dados para treino e teste.
e) O modelo usa redes neurais convolucionais para extrair características de imagens.

Material
páginas com resultados encontrados.
páginas com resultados encontrados.
left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Questões resolvidas

Esta prova examina os principais conceitos e técnicas de machine learning, com foco em modelos de aprendizado supervisionado e não supervisionado, além de discutir a escolha adequada de algoritmos de acordo com os dados e o problema proposto.
O que é overfitting em um modelo de aprendizado de máquina?
a) Quando o modelo tem boa performance em dados de treinamento, mas falha em dados de teste.
b) Quando o modelo generaliza bem para novos dados.
c) Quando o modelo é subajustado e não captura a relação entre os dados.
d) Quando o modelo está perfeitamente ajustado aos dados de treinamento.
e) Quando o modelo é treinado apenas com um conjunto de dados pequeno.

Qual o principal objetivo da técnica de regularização L1 (Lasso)?
a) Reduzir o número de variáveis no modelo, forçando alguns coeficientes a serem exatamente zero.
b) Melhorar a acurácia do modelo em grandes volumes de dados.
c) Ajustar os parâmetros de rede neural para melhor desempenho.
d) Aumentar a complexidade do modelo para capturar mais padrões.
e) Remover a necessidade de normalização dos dados.

O que caracteriza o algoritmo de Random Forest?
a) Um ensemble de árvores de decisão, onde a previsão final é obtida pela média das previsões de várias árvores.
b) Um modelo de redes neurais que realiza clustering de dados.
c) Um modelo que usa apenas uma árvore de decisão para previsões.
d) Um método de validação cruzada para avaliar a performance do modelo.
e) Um algoritmo de classificação baseado em dados temporais.

O que é o conceito de gradiente no contexto de aprendizado de máquina?
a) A taxa de variação da função de erro em relação aos parâmetros do modelo, utilizada para ajustar os pesos.
b) A medida de acurácia de um modelo em um conjunto de dados.
c) A quantidade de erros cometidos pelo modelo durante o treinamento.
d) A divisão dos dados em subconjuntos de treino e teste.
e) O processo de calcular a melhor combinação de variáveis para um modelo.

O que é a curva ROC e o que ela representa?
a) Um gráfico que compara a taxa de verdadeiros positivos com a taxa de falsos positivos.
b) Um gráfico que mostra a acurácia de um modelo em diferentes momentos do treinamento.
c) Uma técnica de visualização de clusters de dados.
d) Um gráfico que avalia o desempenho de modelos de regressão.
e) Uma forma de avaliar o erro do modelo em dados temporais.

Em que tipo de problema o algoritmo K-Means é mais utilizado?
a) Em problemas de clustering não supervisionado, para agrupar dados em clusters baseados em similaridade.
b) Em problemas de classificação supervisionada.
c) Para prever valores contínuos em séries temporais.
d) Para ajustar os hiperparâmetros de redes neurais.
e) Para detecção de anomalias em grandes bases de dados.

Qual das alternativas descreve uma característica das redes neurais convolucionais (CNNs)?
a) São especialmente eficazes em processar imagens e dados com estrutura espacial.
b) São usadas exclusivamente em problemas de regressão linear.
c) São aplicadas somente a problemas de classificação de texto.
d) Trabalham com dados temporais em séries de tempo.
e) São modelos simples, com poucas camadas de aprendizado.

Qual é o propósito do algoritmo de K-Nearest Neighbors (K-NN)?
a) Classificar ou prever a saída de um ponto de dados com base na proximidade de outros pontos no conjunto de dados.
b) Encontrar a melhor combinação de características para um modelo.
c) Realizar a redução da dimensionalidade dos dados.
d) Gerar previsões com base na média de dados históricos.
e) Ajustar os pesos de uma rede neural para melhorar seu desempenho.

O que é validação cruzada?
a) Uma técnica usada para avaliar a performance de um modelo, dividindo os dados em várias partes e treinando com diferentes subconjuntos.
b) O processo de ajustar os hiperparâmetros de um modelo.
c) Uma técnica de regularização utilizada para reduzir o overfitting.
d) Uma forma de adicionar mais dados de treinamento.
e) Uma forma de otimizar a estrutura de uma rede neural.

O que caracteriza um modelo de aprendizado supervisionado?
a) O modelo é treinado com dados rotulados, ou seja, com rótulos conhecidos para prever as saídas.
b) O modelo é treinado sem rótulos, identificando padrões e agrupando dados.
c) O modelo é treinado com dados temporais para prever tendências.
d) O modelo utiliza um único conjunto de dados para treino e teste.
e) O modelo usa redes neurais convolucionais para extrair características de imagens.

Prévia do material em texto

Prova- 90: Fundamentos e Aplicações de Machine Learning
Introdução
Esta prova examina os principais conceitos e técnicas de machine learning, com foco em modelos de aprendizado supervisionado e não supervisionado, além de discutir a escolha adequada de algoritmos de acordo com os dados e o problema proposto.
Questões
1. O que é overfitting em um modelo de aprendizado de máquina?
a) Quando o modelo tem boa performance em dados de treinamento, mas falha em dados de teste.
b) Quando o modelo generaliza bem para novos dados.
c) Quando o modelo é subajustado e não captura a relação entre os dados.
d) Quando o modelo está perfeitamente ajustado aos dados de treinamento.
e) Quando o modelo é treinado apenas com um conjunto de dados pequeno.
2. Qual o principal objetivo da técnica de regularização L1 (Lasso)?
a) Reduzir o número de variáveis no modelo, forçando alguns coeficientes a serem exatamente zero.
b) Melhorar a acurácia do modelo em grandes volumes de dados.
c) Ajustar os parâmetros de rede neural para melhor desempenho.
d) Aumentar a complexidade do modelo para capturar mais padrões.
e) Remover a necessidade de normalização dos dados.
3. O que caracteriza o algoritmo de Random Forest?
a) Um ensemble de árvores de decisão, onde a previsão final é obtida pela média das previsões de várias árvores.
b) Um modelo de redes neurais que realiza clustering de dados.
c) Um modelo que usa apenas uma árvore de decisão para previsões.
d) Um método de validação cruzada para avaliar a performance do modelo.
e) Um algoritmo de classificação baseado em dados temporais.
4. O que é o conceito de gradiente no contexto de aprendizado de máquina?
a) A taxa de variação da função de erro em relação aos parâmetros do modelo, utilizada para ajustar os pesos.
b) A medida de acurácia de um modelo em um conjunto de dados.
c) A quantidade de erros cometidos pelo modelo durante o treinamento.
d) A divisão dos dados em subconjuntos de treino e teste.
e) O processo de calcular a melhor combinação de variáveis para um modelo.
5. O que é a curva ROC e o que ela representa?
a) Um gráfico que compara a taxa de verdadeiros positivos com a taxa de falsos positivos.
b) Um gráfico que mostra a acurácia de um modelo em diferentes momentos do treinamento.
c) Uma técnica de visualização de clusters de dados.
d) Um gráfico que avalia o desempenho de modelos de regressão.
e) Uma forma de avaliar o erro do modelo em dados temporais.
6. Em que tipo de problema o algoritmo K-Means é mais utilizado?
a) Em problemas de clustering não supervisionado, para agrupar dados em clusters baseados em similaridade.
b) Em problemas de classificação supervisionada.
c) Para prever valores contínuos em séries temporais.
d) Para ajustar os hiperparâmetros de redes neurais.
e) Para detecção de anomalias em grandes bases de dados.
7. Qual das alternativas descreve uma característica das redes neurais convolucionais (CNNs)?
a) São especialmente eficazes em processar imagens e dados com estrutura espacial.
b) São usadas exclusivamente em problemas de regressão linear.
c) São aplicadas somente a problemas de classificação de texto.
d) Trabalham com dados temporais em séries de tempo.
e) São modelos simples, com poucas camadas de aprendizado.
8. Qual é o propósito do algoritmo de K-Nearest Neighbors (K-NN)?
a) Classificar ou prever a saída de um ponto de dados com base na proximidade de outros pontos no conjunto de dados.
b) Encontrar a melhor combinação de características para um modelo.
c) Realizar a redução da dimensionalidade dos dados.
d) Gerar previsões com base na média de dados históricos.
e) Ajustar os pesos de uma rede neural para melhorar seu desempenho.
9. O que é validação cruzada?
a) Uma técnica usada para avaliar a performance de um modelo, dividindo os dados em várias partes e treinando com diferentes subconjuntos.
b) O processo de ajustar os hiperparâmetros de um modelo.
c) Uma técnica de regularização utilizada para reduzir o overfitting.
d) Uma forma de adicionar mais dados de treinamento.
e) Uma forma de otimizar a estrutura de uma rede neural.
10. O que caracteriza um modelo de aprendizado supervisionado?
a) O modelo é treinado com dados rotulados, ou seja, com rótulos conhecidos para prever as saídas.
b) O modelo é treinado sem rótulos, identificando padrões e agrupando dados.
c) O modelo é treinado com dados temporais para prever tendências.
d) O modelo utiliza um único conjunto de dados para treino e teste.
e) O modelo usa redes neurais convolucionais para extrair características de imagens.
Gabarito e Justificativas
1. a) Overfitting ocorre quando o modelo se ajusta excessivamente aos dados de treinamento e perde a capacidade de generalizar para novos dados.
2. a) Lasso (L1) é usado para simplificar modelos, forçando coeficientes a serem zero, o que ajuda na seleção de variáveis.
3. a) Random Forest é um ensemble de árvores de decisão, onde cada árvore faz uma previsão e a média ou votação final é tomada.
4. a) O gradiente é a taxa de variação da função de erro em relação aos parâmetros do modelo, utilizado para otimizar o modelo com técnicas como gradiente descendente.
5. a) A curva ROC compara a taxa de verdadeiros positivos e a taxa de falsos positivos, sendo útil para avaliar a performance de modelos de classificação.
6. a) K-Means é usado para clustering não supervisionado, dividindo os dados em grupos baseados em suas similaridades.
7. a) Redes neurais convolucionais são eficazes no processamento de imagens e dados estruturados, como áudio e vídeo.
8. a) K-NN classifica ou prevê a saída de um ponto com base nos K vizinhos mais próximos, fazendo uma média ou votação.
9. a) Validação cruzada é uma técnica usada para avaliar a performance do modelo dividindo os dados em múltiplas partes para treinamento e teste.
10. a) Modelos supervisionados são treinados com dados rotulados, onde os resultados são conhecidos, e o modelo aprende a fazer previsões a partir desses dados.

Mais conteúdos dessa disciplina