Prévia do material em texto
Prova- 155: Avançando em Modelos Supervisionados: Técnicas e Avaliação Introdução Esta prova foca em técnicas avançadas de modelos supervisionados de aprendizado de máquina, cobrindo algoritmos como Máquinas de Vetores de Suporte (SVM), Árvores de Decisão, e técnicas de regularização, além de estratégias de avaliação de desempenho. Questões 1. O que caracteriza um modelo supervisionado de aprendizado? a) O modelo é treinado com dados não rotulados. b) O modelo aprende a partir de exemplos rotulados para fazer previsões ou classificações. c) O modelo realiza agrupamento de dados sem necessidade de supervisão. d) O modelo ajusta-se automaticamente a novos dados. e) O modelo pode prever valores futuros sem supervisão. 2. Qual algoritmo é mais indicado para classificação binária de textos? a) Regressão linear. b) K-Means. c) Máquinas de Vetores de Suporte (SVM). d) Árvore de Decisão. e) PCA (Análise de Componentes Principais). 3. O que é a função de perda em um modelo supervisionado? a) Uma função que ajusta os dados de entrada para o modelo. b) Uma função que calcula o erro entre as previsões do modelo e os valores reais. c) Uma técnica usada para aumentar a acurácia do modelo. d) Uma função que define o número de variáveis a serem utilizadas. e) Uma função que reduz o número de características dos dados. 4. No SVM (Support Vector Machine), o que é um hiperplano de decisão? a) Um plano bidimensional que divide as amostras em diferentes grupos. b) Um limite que separa as classes positiva e negativa. c) Um valor numérico atribuído a cada ponto de dados. d) A distância entre dois vetores de suporte. e) O número de atributos usados para a classificação. 5. O que é a regularização L2 (também conhecida como Ridge)? a) A técnica que penaliza os coeficientes de variáveis grandes e melhora a generalização do modelo. b) A técnica que aumenta a complexidade do modelo ao adicionar novas variáveis. c) A técnica que usa técnicas de ensemble para melhorar o modelo. d) A técnica que remove as variáveis irrelevantes no modelo. e) A técnica que diminui a dimensionalidade dos dados. 6. Qual é o objetivo do gradiente descendente em modelos supervisionados? a) Minimizar o erro do modelo ajustando os parâmetros durante o treinamento. b) Maximizar a precisão do modelo no conjunto de teste. c) Identificar as variáveis mais relevantes do modelo. d) Reduzir a quantidade de dados usados no treinamento. e) Encontrar a melhor combinação de variáveis para o modelo. 7. O que é a técnica de bagging em aprendizado supervisionado? a) Um método que usa vários modelos de classificação e combina suas saídas. b) Um método que reduz a variabilidade do modelo, utilizando um único conjunto de dados. c) Uma técnica para normalizar os dados de entrada. d) Um método para aumentar a complexidade de modelos simples. e) Uma técnica de redução de dimensionalidade. 8. O que significa a métrica de precisão em avaliação de modelos de classificação? a) A proporção de verdadeiros positivos em relação ao total de exemplos classificados como positivos. b) A proporção de verdadeiros negativos em relação ao total de exemplos classificados como negativos. c) A medida do erro médio absoluto das previsões do modelo. d) A proporção de falsos positivos em relação ao total de exemplos classificados. e) A taxa de verdadeiros positivos dividida pela soma de verdadeiros positivos e falsos negativos. 9. O que é a técnica de cross-validation (validação cruzada)? a) Uma técnica que divide os dados em vários subconjuntos para avaliar a performance do modelo. b) Um método para aumentar a quantidade de dados de treinamento. c) Um método para reduzir o overfitting ao treinar o modelo em dados específicos. d) Uma técnica para treinar o modelo em diferentes parâmetros de entrada. e) Uma técnica para calcular o erro do modelo. 10. O que é a curva ROC usada em modelos de classificação? a) Uma curva que compara o desempenho de um modelo de regressão com o valor real. b) Uma curva que analisa a taxa de verdadeiros positivos em relação à taxa de falsos positivos. c) Uma curva que avalia a precisão do modelo. d) Uma técnica usada para ajustar os parâmetros do modelo. e) Uma curva que mede a complexidade do modelo. Gabarito e Justificativas 1. b) Um modelo supervisionado aprende com dados rotulados para fazer previsões ou classificações. 2. c) O SVM é ideal para classificação binária de dados como textos. 3. b) A função de perda calcula o erro entre as previsões e os valores reais. 4. b) O hiperplano de decisão separa as classes positiva e negativa no SVM. 5. a) A regularização L2 penaliza coeficientes grandes, ajudando na generalização. 6. a) O gradiente descendente ajusta os parâmetros do modelo para minimizar o erro. 7. a) O bagging usa vários modelos e combina suas previsões para reduzir a variabilidade. 8. a) A precisão é a proporção de verdadeiros positivos entre os positivos classificados. 9. a) A cross-validation divide os dados em subconjuntos para avaliar a performance do modelo. 10. b) A curva ROC compara a taxa de verdadeiros positivos com a taxa de falsos positivos.