Logo Passei Direto
Buscar

Fundamentos e Aplicações de Machine Learning

Ferramentas de estudo

Questões resolvidas

Essa prova explora os fundamentos essenciais do Machine Learning, abordando os principais algoritmos e sua aplicação prática em problemas de classificação, regressão e análise estatística.
O que é a técnica de Cross-Validation em modelos de aprendizado de máquina?
a) A técnica de treinar um modelo com todos os dados disponíveis e avaliar sua performance em um único conjunto de dados.
b) A técnica de dividir os dados em múltiplos subconjuntos para treinar e validar o modelo, a fim de evitar overfitting.
c) A técnica de aumentar o conjunto de dados adicionando variáveis irrelevantes para o modelo.
d) A técnica de melhorar o desempenho do modelo ajustando os parâmetros durante o treinamento.
e) A técnica de eliminar as variáveis com menor correlação com o modelo.

O que é um outlier em um conjunto de dados?
a) Um dado que é comum dentro do conjunto e representa a tendência central.
b) Um dado que está fora do padrão ou que é extremamente diferente dos outros dados.
c) Um dado que é escolhido para ser removido durante a fase de pré-processamento.
d) Um dado com alta relevância para a modelagem estatística.
e) Um dado que se encaixa perfeitamente em uma distribuição normal.

O que caracteriza o algoritmo de k-médias (K-Means)?
a) Um algoritmo de clustering que agrupa os dados em k clusters baseados em suas características.
b) Um algoritmo de classificação utilizado em problemas de reconhecimento de padrões.
c) Um modelo de regressão usado para prever valores contínuos.
d) Um algoritmo de redes neurais para ajustar os pesos das conexões.
e) Um modelo de aprendizado supervisionado para prever valores de saída em séries temporais.

O que é o Overfitting?
a) Quando o modelo tem baixo desempenho em ambos os dados de treinamento e teste.
b) Quando o modelo é incapaz de aprender de maneira geral, falhando até mesmo em dados de treinamento.
c) Quando o modelo é excessivamente complexo e aprende até os detalhes ruidosos dos dados de treinamento, prejudicando sua performance em dados novos.
d) Quando o modelo não consegue aprender padrões nos dados de treinamento.
e) Quando o modelo apresenta uma alta taxa de erro em dados de treinamento, mas baixo erro em dados de teste.

Qual é o propósito do algoritmo de regressão logística?
a) Prever a probabilidade de um evento em uma variável contínua.
b) Realizar clustering de dados para encontrar padrões em grandes conjuntos de dados.
c) Prever a categoria a qual uma observação pertence com base em variáveis independentes.
d) Estimar o valor de uma variável dependente contínua com base em variáveis independentes.
e) Reduzir a dimensionalidade de um conjunto de dados.

O que é a técnica Support Vector Machine (SVM)?
a) Uma técnica de aprendizado supervisionado que separa classes através de um hiperplano de alta dimensão.
b) Uma técnica para reduzir o número de variáveis em um conjunto de dados.
c) Um modelo para encontrar a melhor previsão de séries temporais.
d) Um algoritmo de clustering utilizado em problemas de reconhecimento de padrões.
e) Um modelo para agrupar dados com características semelhantes sem rótulos.

O que significa a sigla PCA em Machine Learning?
a) Principal Component Analysis — uma técnica de redução de dimensionalidade.
b) Partial Classifier Analysis — uma técnica para classificar dados parcialmente.
c) Predictive Component Analysis — uma análise para prever valores em um conjunto de dados.
d) Preprocessing Component Adjustment — uma técnica para ajustar parâmetros de pré-processamento.
e) Pattern Classification Analysis — uma técnica para classificar dados com base em padrões.

O que significa o conceito de generalização em modelos de aprendizado de máquina?
a) Quando o modelo não se adapta bem aos dados de treinamento.
b) Quando o modelo é capaz de fazer previsões precisas sobre dados novos, que não foram vistos durante o treinamento.
c) Quando o modelo ajusta perfeitamente os dados de treinamento e é incapaz de prever novos dados.
d) Quando o modelo é treinado em grandes volumes de dados.
e) Quando o modelo realiza a previsão de dados com base em um pequeno conjunto de variáveis.

O que caracteriza um modelo de aprendizado supervisionado?
a) O modelo é treinado com dados rotulados, ou seja, com as respostas já conhecidas.
b) O modelo é treinado sem qualquer tipo de rótulo e busca encontrar padrões nos dados.
c) O modelo é projetado para prever valores em séries temporais.
d) O modelo é usado para realizar classificação sem a necessidade de variáveis independentes.
e) O modelo apenas agrupa dados em categorias sem previsão ou classificação.

Qual é o objetivo principal de um modelo de regressão?
a) Prever a classe ou categoria de uma variável dependente com base em variáveis independentes.
b) Estimar a probabilidade de ocorrência de um evento.
c) Estimar o valor de uma variável dependente contínua com base em variáveis independentes.
d) Agrupar dados em clusters.
e) Melhorar a precisão de modelos de classificação com base em dados de treinamento.

Material
páginas com resultados encontrados.
páginas com resultados encontrados.
left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Questões resolvidas

Essa prova explora os fundamentos essenciais do Machine Learning, abordando os principais algoritmos e sua aplicação prática em problemas de classificação, regressão e análise estatística.
O que é a técnica de Cross-Validation em modelos de aprendizado de máquina?
a) A técnica de treinar um modelo com todos os dados disponíveis e avaliar sua performance em um único conjunto de dados.
b) A técnica de dividir os dados em múltiplos subconjuntos para treinar e validar o modelo, a fim de evitar overfitting.
c) A técnica de aumentar o conjunto de dados adicionando variáveis irrelevantes para o modelo.
d) A técnica de melhorar o desempenho do modelo ajustando os parâmetros durante o treinamento.
e) A técnica de eliminar as variáveis com menor correlação com o modelo.

O que é um outlier em um conjunto de dados?
a) Um dado que é comum dentro do conjunto e representa a tendência central.
b) Um dado que está fora do padrão ou que é extremamente diferente dos outros dados.
c) Um dado que é escolhido para ser removido durante a fase de pré-processamento.
d) Um dado com alta relevância para a modelagem estatística.
e) Um dado que se encaixa perfeitamente em uma distribuição normal.

O que caracteriza o algoritmo de k-médias (K-Means)?
a) Um algoritmo de clustering que agrupa os dados em k clusters baseados em suas características.
b) Um algoritmo de classificação utilizado em problemas de reconhecimento de padrões.
c) Um modelo de regressão usado para prever valores contínuos.
d) Um algoritmo de redes neurais para ajustar os pesos das conexões.
e) Um modelo de aprendizado supervisionado para prever valores de saída em séries temporais.

O que é o Overfitting?
a) Quando o modelo tem baixo desempenho em ambos os dados de treinamento e teste.
b) Quando o modelo é incapaz de aprender de maneira geral, falhando até mesmo em dados de treinamento.
c) Quando o modelo é excessivamente complexo e aprende até os detalhes ruidosos dos dados de treinamento, prejudicando sua performance em dados novos.
d) Quando o modelo não consegue aprender padrões nos dados de treinamento.
e) Quando o modelo apresenta uma alta taxa de erro em dados de treinamento, mas baixo erro em dados de teste.

Qual é o propósito do algoritmo de regressão logística?
a) Prever a probabilidade de um evento em uma variável contínua.
b) Realizar clustering de dados para encontrar padrões em grandes conjuntos de dados.
c) Prever a categoria a qual uma observação pertence com base em variáveis independentes.
d) Estimar o valor de uma variável dependente contínua com base em variáveis independentes.
e) Reduzir a dimensionalidade de um conjunto de dados.

O que é a técnica Support Vector Machine (SVM)?
a) Uma técnica de aprendizado supervisionado que separa classes através de um hiperplano de alta dimensão.
b) Uma técnica para reduzir o número de variáveis em um conjunto de dados.
c) Um modelo para encontrar a melhor previsão de séries temporais.
d) Um algoritmo de clustering utilizado em problemas de reconhecimento de padrões.
e) Um modelo para agrupar dados com características semelhantes sem rótulos.

O que significa a sigla PCA em Machine Learning?
a) Principal Component Analysis — uma técnica de redução de dimensionalidade.
b) Partial Classifier Analysis — uma técnica para classificar dados parcialmente.
c) Predictive Component Analysis — uma análise para prever valores em um conjunto de dados.
d) Preprocessing Component Adjustment — uma técnica para ajustar parâmetros de pré-processamento.
e) Pattern Classification Analysis — uma técnica para classificar dados com base em padrões.

O que significa o conceito de generalização em modelos de aprendizado de máquina?
a) Quando o modelo não se adapta bem aos dados de treinamento.
b) Quando o modelo é capaz de fazer previsões precisas sobre dados novos, que não foram vistos durante o treinamento.
c) Quando o modelo ajusta perfeitamente os dados de treinamento e é incapaz de prever novos dados.
d) Quando o modelo é treinado em grandes volumes de dados.
e) Quando o modelo realiza a previsão de dados com base em um pequeno conjunto de variáveis.

O que caracteriza um modelo de aprendizado supervisionado?
a) O modelo é treinado com dados rotulados, ou seja, com as respostas já conhecidas.
b) O modelo é treinado sem qualquer tipo de rótulo e busca encontrar padrões nos dados.
c) O modelo é projetado para prever valores em séries temporais.
d) O modelo é usado para realizar classificação sem a necessidade de variáveis independentes.
e) O modelo apenas agrupa dados em categorias sem previsão ou classificação.

Qual é o objetivo principal de um modelo de regressão?
a) Prever a classe ou categoria de uma variável dependente com base em variáveis independentes.
b) Estimar a probabilidade de ocorrência de um evento.
c) Estimar o valor de uma variável dependente contínua com base em variáveis independentes.
d) Agrupar dados em clusters.
e) Melhorar a precisão de modelos de classificação com base em dados de treinamento.

Prévia do material em texto

Prova- 107: Fundamentos e Aplicações de Machine Learning
Introdução
Essa prova explora os fundamentos essenciais do Machine Learning, abordando os principais algoritmos e sua aplicação prática em problemas de classificação, regressão e análise estatística.
Questões
1. O que é a técnica de Cross-Validation em modelos de aprendizado de máquina?
a) A técnica de treinar um modelo com todos os dados disponíveis e avaliar sua performance em um único conjunto de dados.
b) A técnica de dividir os dados em múltiplos subconjuntos para treinar e validar o modelo, a fim de evitar overfitting.
c) A técnica de aumentar o conjunto de dados adicionando variáveis irrelevantes para o modelo.
d) A técnica de melhorar o desempenho do modelo ajustando os parâmetros durante o treinamento.
e) A técnica de eliminar as variáveis com menor correlação com o modelo.
2. O que é um outlier em um conjunto de dados?
a) Um dado que é comum dentro do conjunto e representa a tendência central.
b) Um dado que está fora do padrão ou que é extremamente diferente dos outros dados.
c) Um dado que é escolhido para ser removido durante a fase de pré-processamento.
d) Um dado com alta relevância para a modelagem estatística.
e) Um dado que se encaixa perfeitamente em uma distribuição normal.
3. O que caracteriza o algoritmo de k-médias (K-Means)?
a) Um algoritmo de clustering que agrupa os dados em k clusters baseados em suas características.
b) Um algoritmo de classificação utilizado em problemas de reconhecimento de padrões.
c) Um modelo de regressão usado para prever valores contínuos.
d) Um algoritmo de redes neurais para ajustar os pesos das conexões.
e) Um modelo de aprendizado supervisionado para prever valores de saída em séries temporais.
4. O que é o Overfitting?
a) Quando o modelo tem baixo desempenho em ambos os dados de treinamento e teste.
b) Quando o modelo é incapaz de aprender de maneira geral, falhando até mesmo em dados de treinamento.
c) Quando o modelo é excessivamente complexo e aprende até os detalhes ruidosos dos dados de treinamento, prejudicando sua performance em dados novos.
d) Quando o modelo não consegue aprender padrões nos dados de treinamento.
e) Quando o modelo apresenta uma alta taxa de erro em dados de treinamento, mas baixo erro em dados de teste.
5. Qual é o propósito do algoritmo de regressão logística?
a) Prever a probabilidade de um evento em uma variável contínua.
b) Realizar clustering de dados para encontrar padrões em grandes conjuntos de dados.
c) Prever a categoria a qual uma observação pertence com base em variáveis independentes.
d) Estimar o valor de uma variável dependente contínua com base em variáveis independentes.
e) Reduzir a dimensionalidade de um conjunto de dados.
6. O que é a técnica Support Vector Machine (SVM)?
a) Uma técnica de aprendizado supervisionado que separa classes através de um hiperplano de alta dimensão.
b) Uma técnica para reduzir o número de variáveis em um conjunto de dados.
c) Um modelo para encontrar a melhor previsão de séries temporais.
d) Um algoritmo de clustering utilizado em problemas de reconhecimento de padrões.
e) Um modelo para agrupar dados com características semelhantes sem rótulos.
7. O que significa a sigla PCA em Machine Learning?
a) Principal Component Analysis — uma técnica de redução de dimensionalidade.
b) Partial Classifier Analysis — uma técnica para classificar dados parcialmente.
c) Predictive Component Analysis — uma análise para prever valores em um conjunto de dados.
d) Preprocessing Component Adjustment — uma técnica para ajustar parâmetros de pré-processamento.
e) Pattern Classification Analysis — uma técnica para classificar dados com base em padrões.
8. O que significa o conceito de generalização em modelos de aprendizado de máquina?
a) Quando o modelo não se adapta bem aos dados de treinamento.
b) Quando o modelo é capaz de fazer previsões precisas sobre dados novos, que não foram vistos durante o treinamento.
c) Quando o modelo ajusta perfeitamente os dados de treinamento e é incapaz de prever novos dados.
d) Quando o modelo é treinado em grandes volumes de dados.
e) Quando o modelo realiza a previsão de dados com base em um pequeno conjunto de variáveis.
9. O que caracteriza um modelo de aprendizado supervisionado?
a) O modelo é treinado com dados rotulados, ou seja, com as respostas já conhecidas.
b) O modelo é treinado sem qualquer tipo de rótulo e busca encontrar padrões nos dados.
c) O modelo é projetado para prever valores em séries temporais.
d) O modelo é usado para realizar classificação sem a necessidade de variáveis independentes.
e) O modelo apenas agrupa dados em categorias sem previsão ou classificação.
10. Qual é o objetivo principal de um modelo de regressão?
a) Prever a classe ou categoria de uma variável dependente com base em variáveis independentes.
b) Estimar a probabilidade de ocorrência de um evento.
c) Estimar o valor de uma variável dependente contínua com base em variáveis independentes.
d) Agrupar dados em clusters.
e) Melhorar a precisão de modelos de classificação com base em dados de treinamento.
Gabarito e Justificativas
1. b) A técnica de Cross-Validation divide os dados em múltiplos subconjuntos para treinar e testar o modelo, reduzindo o risco de overfitting.
2. b) Outliers são dados que estão fora do padrão ou extremamente diferentes dos outros dados.
3. a) O algoritmo K-Means agrupa os dados em clusters com base nas semelhanças entre eles.
4. c) Overfitting ocorre quando o modelo é muito complexo e aprende até os ruídos dos dados de treinamento, prejudicando a generalização.
5. c) A regressão logística é usada para prever a categoria de uma variável dependente com base em variáveis independentes.
6. a) O SVM é uma técnica que encontra o hiperplano que separa melhor as classes de dados.
7. a) PCA é uma técnica de redução de dimensionalidade que busca encontrar componentes principais dos dados.
8. b) A generalização refere-se à capacidade do modelo de fazer previsões precisas sobre dados novos que não foram vistos durante o treinamento.
9. a) Modelos de aprendizado supervisionado são treinados com dados rotulados, ou seja, com respostas conhecidas.
10. c) O objetivo de um modelo de regressão é prever o valor de uma variável dependente contínua com base em variáveis independentes.

Mais conteúdos dessa disciplina