Prévia do material em texto
Prova Avançada em Algoritmos de Aprendizado de Máquina: Técnicas e Aplicações Introdução: Esta prova aborda temas avançados em aprendizado de máquina, com foco em técnicas, algoritmos e suas aplicações práticas em problemas do mundo real. Questão 1 O que caracteriza o algoritmo de K-means? a) K-means é um algoritmo de aprendizado supervisionado que usa dados rotulados para realizar a classificação. b) K-means é uma técnica de aprendizado não supervisionado usada para clustering, onde os dados são divididos em k clusters com base na proximidade dos pontos. c) K-means utiliza redes neurais profundas para agrupar dados. d) O K-means é um algoritmo de regressão que prevê valores contínuos para as variáveis de entrada. e) O algoritmo K-means não pode ser utilizado com dados de alta dimensionalidade. Questão 2 Em aprendizado profundo, qual a principal vantagem das Redes Neurais Convolucionais (CNNs) sobre as redes neurais tradicionais? a) Elas são mais rápidas e eficientes para trabalhar com dados sequenciais. b) Elas possuem camadas especializadas para lidar com dados de imagem, identificando características espaciais locais. c) Elas são mais simples e não exigem grandes volumes de dados para treinamento. d) Elas não apresentam problemas de overfitting, sendo ideais para todos os tipos de dados. e) Elas são mais eficientes para modelos de previsão de séries temporais. Questão 3 Qual é a principal função do algoritmo de Random Forest no aprendizado de máquina? a) Melhorar a performance de regressão linear. b) Combinar múltiplas árvores de decisão para aumentar a robustez e reduzir o risco de overfitting. c) Reduzir a dimensionalidade de dados numéricos. d) Utilizar redes neurais para classificações não supervisionadas. e) Ser mais eficiente que o K-means para clustering de dados não rotulados. Questão 4 Qual das alternativas descreve melhor a técnica de regularização L1 (Lasso)? a) A regularização L1 adiciona um termo penalizador baseado no quadrado dos coeficientes do modelo. b) A regularização L1 adiciona um termo penalizador baseado na soma dos valores absolutos dos coeficientes, resultando na seleção de características importantes. c) A regularização L1 não tem impacto na complexidade do modelo. d) A regularização L1 é usada para evitar overfitting em árvores de decisão. e) A regularização L1 nunca resulta em coeficientes iguais a zero. Questão 5 Em qual das situações a técnica de Deep Learning se mostra mais eficiente? a) Quando o problema envolve dados estruturados simples e a relação entre entradas e saídas é linear. b) Quando a quantidade de dados é muito pequena e o modelo precisa ser muito simples. c) Quando há uma grande quantidade de dados não estruturados, como imagens, textos ou áudio. d) Quando se trabalha apenas com dados tabulares e pequenos. e) Quando o objetivo é reduzir a complexidade do modelo e evitar o overfitting. Questão 6 O que é o problema de vanishing gradients em redes neurais? a) O problema ocorre quando os gradientes durante o treinamento se tornam muito grandes, dificultando o aprendizado. b) O problema ocorre quando os gradientes se tornam muito pequenos, causando a estagnação no treinamento das redes neurais profundas. c) O problema é específico de redes neurais convolucionais e não afeta redes tradicionais. d) O problema ocorre apenas em redes neurais rasas e não em redes profundas. e) O problema de vanishing gradients é resolvido automaticamente por algoritmos de otimização como o Adam. Questão 7 O que caracteriza o algoritmo K-vizinhos mais próximos (K-NN) no aprendizado supervisionado? a) O K-NN utiliza a distância entre os dados para fazer previsões, com base na proximidade dos k vizinhos mais próximos. b) O K-NN usa aprendizado não supervisionado para agrupar dados em clusters. c) O K-NN requer a definição de um modelo paramétrico para cada ponto de dados. d) O K-NN é um algoritmo linear utilizado apenas para regressão. e) O K-NN é uma técnica de redes neurais profundas utilizada para classificação de imagens. Questão 8 Em Redes Neurais Recorrentes (RNNs), qual é a principal vantagem de usar a Long Short- Term Memory (LSTM)? a) O LSTM é uma técnica de aprendizado não supervisionado para clustering de dados temporais. b) O LSTM resolve o problema de vanishing gradients, permitindo o aprendizado de dependências de longo prazo em dados sequenciais. c) O LSTM é mais simples que as redes neurais tradicionais e requer menos tempo de treinamento. d) O LSTM é usado apenas em redes neurais profundas, sem aplicações em dados temporais. e) O LSTM é aplicável exclusivamente em problemas de regressão linear. Questão 9 O que caracteriza o algoritmo de Gradient Boosting? a) O Gradient Boosting combina múltiplos modelos fracos, ajustando um novo modelo com base nos erros do modelo anterior, até melhorar a performance. b) O Gradient Boosting utiliza redes neurais convolucionais para melhorar o desempenho de classificação. c) O Gradient Boosting é uma técnica de clustering que agrupa dados em k clusters. d) O Gradient Boosting usa um único modelo simples para resolver problemas complexos. e) O Gradient Boosting é uma técnica de aprendizado não supervisionado baseada em redes neurais profundas. Questão 10 O que significa aprendizado por reforço em um modelo de aprendizado de máquina? a) O modelo aprende de forma passiva a partir de dados rotulados, sem interação com o ambiente. b) O modelo toma ações em um ambiente e aprende com as recompensas ou penalidades associadas a essas ações para maximizar a recompensa total. c) O aprendizado por reforço é utilizado apenas para problemas de regressão. d) O modelo é treinado por meio de redes neurais convolucionais em dados de imagens. e) O aprendizado por reforço não pode ser aplicado a problemas de controle ou otimização. Gabarito e Justificativa 1. b) ○ K-means é um algoritmo de clustering não supervisionado que divide os dados em k clusters, com base na proximidade dos pontos de dados. 2. b) ○ As CNNs são projetadas para identificar características espaciais em dados de imagem e outras formas de dados estruturados, permitindo que aprendam representações hierárquicas. 3. b) ○ O Random Forest usa múltiplas árvores de decisão para melhorar a robustez, reduzir overfitting e aumentar a precisão do modelo. 4. b) ○ A regularização L1 (Lasso) penaliza os coeficientes dos parâmetros do modelo com base no valor absoluto, ajudando na seleção de características e tornando alguns coeficientes zero. 5. c) ○ O deep learning é altamente eficiente quando se trabalha com grandes volumes de dados não estruturados, como imagens, textos ou áudio, onde redes mais simples não são suficientes. 6. b) ○ O problema de vanishing gradients ocorre quando os gradientes se tornam muito pequenos durante o treinamento, impedindo que redes neurais profundas aprendam dependências de longo prazo. 7. a) ○ O algoritmo K-NN prevê as classes de novos dados com base nos k vizinhos mais próximos, utilizando a distância entre os pontos de dados para classificação ou regressão. 8. b) ○ O LSTM é uma variante das RNNs que resolve o problema de vanishing gradients, permitindo aprender dependências de longo prazo em sequências temporais. 9. a) ○ O Gradient Boosting combina vários modelos fracos para corrigir os erros do modelo anterior, criando um modelo final mais forte e preciso. 10. b) ● O aprendizado por reforço envolve a interação de um agente com o ambiente e o aprendizado por meio de recompensas ou penalidades, com o objetivo de maximizar a recompensa total a longo prazo.