Logo Passei Direto
Buscar

Métodos Avançados de Estatística e Machine Learning

Ferramentas de estudo

Questões resolvidas

Esta prova aborda conceitos avançados de estatística aplicados em Machine Learning, com foco em técnicas de modelagem, validação e otimização de modelos. As questões tratam de métodos como regressão, aprendizado supervisionado, redes neurais e avaliação de desempenho de modelos.
Qual das opções abaixo descreve melhor o conceito de overfitting em Machine Learning?
a) Quando o modelo é simples e não consegue capturar a complexidade dos dados.
b) Quando o modelo se ajusta muito bem aos dados de treino, mas tem desempenho ruim em dados novos.
c) Quando o modelo é validado por uma amostra muito pequena.
d) Quando o modelo não consegue convergir durante o processo de treinamento.
e) Quando o modelo usa muitas variáveis irrelevantes.

O que é a regularização em métodos de aprendizado supervisionado?
a) Um processo para aumentar a complexidade do modelo.
b) Uma técnica para reduzir o viés do modelo.
c) Um processo para reduzir a variância do modelo e evitar o overfitting.
d) Uma técnica para balancear os dados desbalanceados.
e) Um método para aumentar a precisão dos dados de treinamento.

Qual técnica é comumente utilizada para validar o desempenho de um modelo de aprendizado supervisionado em dados não vistos durante o treinamento?
a) Validação cruzada (cross-validation).
b) Regressão linear.
c) Análise de componentes principais (PCA).
d) Análise de variância (ANOVA).
e) Análise de correlação.

Qual é o principal objetivo de um algoritmo de agrupamento como o K-means?
a) Prever uma variável de resposta baseada em variáveis independentes.
b) Agrupar dados semelhantes em clusters sem rótulos predefinidos.
c) Ajustar uma linha reta aos dados de forma linear.
d) Identificar a variável mais importante em um modelo preditivo.
e) Estimar a probabilidade de um evento ocorrer.

Em redes neurais, o backpropagation é utilizado para:
a) Ajustar os pesos dos neurônios durante o processo de treinamento.
b) Prever a saída do modelo para um novo conjunto de dados.
c) Determinar a arquitetura da rede neural.
d) Validar a performance da rede com dados de teste.
e) Ajustar os hiperparâmetros da rede.

Em um modelo de regressão logística, a variável dependente é:
a) Contínua e normalmente distribuída.
b) Uma variável categórica com dois ou mais valores.
c) Variável binária ou categórica com dois valores possíveis.
d) Uma variável contínua e simétrica.
e) Uma variável categórica com mais de dois valores possíveis.

Qual é a função principal da função de ativação em redes neurais?
a) Melhorar a velocidade do treinamento.
b) Introduzir não-linearidade e permitir a modelagem de problemas complexos.
c) Determinar a saída final do modelo.
d) Ajustar os pesos do modelo.
e) Evitar que o modelo sofra de overfitting.

O que é o conceito de viés em modelos de Machine Learning?
a) O erro introduzido por um modelo excessivamente complexo.
b) O erro introduzido ao treinar o modelo com dados não representativos.
c) A diferença entre a previsão do modelo e o valor real de uma variável.
d) O erro introduzido por uma pequena amostra de dados.
e) A precisão do modelo no conjunto de treino.

O que caracteriza o método de aprendizado não supervisionado?
a) O modelo é treinado com dados rotulados.
b) O objetivo é prever uma variável dependente com base em variáveis independentes.
c) O modelo trabalha com dados não rotulados e tenta identificar padrões.
d) O modelo precisa de validação cruzada para funcionar corretamente.
e) O modelo pode ser usado apenas em dados categóricos.

O que é um Random Forest?
a) Um modelo baseado em redes neurais que aprende por repetição.
b) Um conjunto de árvores de decisão que fazem previsões e agregam resultados.
c) Um modelo de regressão utilizado para prever valores contínuos.
d) Um método de agrupamento para agrupar dados similares.
e) Uma técnica de análise de sentimentos em textos.

Material
páginas com resultados encontrados.
páginas com resultados encontrados.
details

Libere esse material sem enrolação!

Craque NetoCraque Neto

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

details

Libere esse material sem enrolação!

Craque NetoCraque Neto

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

details

Libere esse material sem enrolação!

Craque NetoCraque Neto

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Questões resolvidas

Esta prova aborda conceitos avançados de estatística aplicados em Machine Learning, com foco em técnicas de modelagem, validação e otimização de modelos. As questões tratam de métodos como regressão, aprendizado supervisionado, redes neurais e avaliação de desempenho de modelos.
Qual das opções abaixo descreve melhor o conceito de overfitting em Machine Learning?
a) Quando o modelo é simples e não consegue capturar a complexidade dos dados.
b) Quando o modelo se ajusta muito bem aos dados de treino, mas tem desempenho ruim em dados novos.
c) Quando o modelo é validado por uma amostra muito pequena.
d) Quando o modelo não consegue convergir durante o processo de treinamento.
e) Quando o modelo usa muitas variáveis irrelevantes.

O que é a regularização em métodos de aprendizado supervisionado?
a) Um processo para aumentar a complexidade do modelo.
b) Uma técnica para reduzir o viés do modelo.
c) Um processo para reduzir a variância do modelo e evitar o overfitting.
d) Uma técnica para balancear os dados desbalanceados.
e) Um método para aumentar a precisão dos dados de treinamento.

Qual técnica é comumente utilizada para validar o desempenho de um modelo de aprendizado supervisionado em dados não vistos durante o treinamento?
a) Validação cruzada (cross-validation).
b) Regressão linear.
c) Análise de componentes principais (PCA).
d) Análise de variância (ANOVA).
e) Análise de correlação.

Qual é o principal objetivo de um algoritmo de agrupamento como o K-means?
a) Prever uma variável de resposta baseada em variáveis independentes.
b) Agrupar dados semelhantes em clusters sem rótulos predefinidos.
c) Ajustar uma linha reta aos dados de forma linear.
d) Identificar a variável mais importante em um modelo preditivo.
e) Estimar a probabilidade de um evento ocorrer.

Em redes neurais, o backpropagation é utilizado para:
a) Ajustar os pesos dos neurônios durante o processo de treinamento.
b) Prever a saída do modelo para um novo conjunto de dados.
c) Determinar a arquitetura da rede neural.
d) Validar a performance da rede com dados de teste.
e) Ajustar os hiperparâmetros da rede.

Em um modelo de regressão logística, a variável dependente é:
a) Contínua e normalmente distribuída.
b) Uma variável categórica com dois ou mais valores.
c) Variável binária ou categórica com dois valores possíveis.
d) Uma variável contínua e simétrica.
e) Uma variável categórica com mais de dois valores possíveis.

Qual é a função principal da função de ativação em redes neurais?
a) Melhorar a velocidade do treinamento.
b) Introduzir não-linearidade e permitir a modelagem de problemas complexos.
c) Determinar a saída final do modelo.
d) Ajustar os pesos do modelo.
e) Evitar que o modelo sofra de overfitting.

O que é o conceito de viés em modelos de Machine Learning?
a) O erro introduzido por um modelo excessivamente complexo.
b) O erro introduzido ao treinar o modelo com dados não representativos.
c) A diferença entre a previsão do modelo e o valor real de uma variável.
d) O erro introduzido por uma pequena amostra de dados.
e) A precisão do modelo no conjunto de treino.

O que caracteriza o método de aprendizado não supervisionado?
a) O modelo é treinado com dados rotulados.
b) O objetivo é prever uma variável dependente com base em variáveis independentes.
c) O modelo trabalha com dados não rotulados e tenta identificar padrões.
d) O modelo precisa de validação cruzada para funcionar corretamente.
e) O modelo pode ser usado apenas em dados categóricos.

O que é um Random Forest?
a) Um modelo baseado em redes neurais que aprende por repetição.
b) Um conjunto de árvores de decisão que fazem previsões e agregam resultados.
c) Um modelo de regressão utilizado para prever valores contínuos.
d) Um método de agrupamento para agrupar dados similares.
e) Uma técnica de análise de sentimentos em textos.

Prévia do material em texto

Prova 11: Métodos Avançados de Estatística e Machine Learning
Introdução
Esta prova aborda conceitos avançados de estatística aplicados em Machine Learning, com foco em técnicas de modelagem, validação e otimização de modelos. As questões tratam de métodos como regressão, aprendizado supervisionado, redes neurais e avaliação de desempenho de modelos.
Questões
1. Qual das opções abaixo descreve melhor o conceito de overfitting em Machine Learning?
a) Quando o modelo é simples e não consegue capturar a complexidade dos dados.
b) Quando o modelo se ajusta muito bem aos dados de treino, mas tem desempenho ruim em dados novos.
c) Quando o modelo é validado por uma amostra muito pequena.
d) Quando o modelo não consegue convergir durante o processo de treinamento.
e) Quando o modelo usa muitas variáveis irrelevantes.
2. O que é a regularização em métodos de aprendizado supervisionado?
a) Um processo para aumentar a complexidade do modelo.
b) Uma técnica para reduzir o viés do modelo.
c) Um processo para reduzir a variância do modelo e evitar o overfitting.
d) Uma técnica para balancear os dados desbalanceados.
e) Um método para aumentar a precisão dos dados de treinamento.
3. Qual técnica é comumente utilizada para validar o desempenho de um modelo de aprendizado supervisionado em dados não vistos durante o treinamento?
a) Validação cruzada (cross-validation).
b) Regressão linear.
c) Análise de componentes principais (PCA).
d) Análise de variância (ANOVA).
e) Análise de correlação.
4. Qual é o principal objetivo de um algoritmo de agrupamento como o K-means?
a) Prever uma variável de resposta baseada em variáveis independentes.
b) Agrupar dados semelhantes em clusters sem rótulos predefinidos.
c) Ajustar uma linha reta aos dados de forma linear.
d) Identificar a variável mais importante em um modelo preditivo.
e) Estimar a probabilidade de um evento ocorrer.
5. Em redes neurais, o backpropagation é utilizado para:
a) Ajustar os pesos dos neurônios durante o processo de treinamento.
b) Prever a saída do modelo para um novo conjunto de dados.
c) Determinar a arquitetura da rede neural.
d) Validar a performance da rede com dados de teste.
e) Ajustar os hiperparâmetros da rede.
6. Em um modelo de regressão logística, a variável dependente é:
a) Contínua e normalmente distribuída.
b) Uma variável categórica com dois ou mais valores.
c) Variável binária ou categórica com dois valores possíveis.
d) Uma variável contínua e simétrica.
e) Uma variável categórica com mais de dois valores possíveis.
7. Qual é a função principal da função de ativação em redes neurais?
a) Melhorar a velocidade do treinamento.
b) Introduzir não-linearidade e permitir a modelagem de problemas complexos.
c) Determinar a saída final do modelo.
d) Ajustar os pesos do modelo.
e) Evitar que o modelo sofra de overfitting.
8. O que é o conceito de viés em modelos de Machine Learning?
a) O erro introduzido por um modelo excessivamente complexo.
b) O erro introduzido ao treinar o modelo com dados não representativos.
c) A diferença entre a previsão do modelo e o valor real de uma variável.
d) O erro introduzido por uma pequena amostra de dados.
e) A precisão do modelo no conjunto de treino.
9. O que caracteriza o método de aprendizado não supervisionado?
a) O modelo é treinado com dados rotulados.
b) O objetivo é prever uma variável dependente com base em variáveis independentes.
c) O modelo trabalha com dados não rotulados e tenta identificar padrões.
d) O modelo precisa de validação cruzada para funcionar corretamente.
e) O modelo pode ser usado apenas em dados categóricos.
10. O que é um Random Forest?
a) Um modelo baseado em redes neurais que aprende por repetição.
b) Um conjunto de árvores de decisão que fazem previsões e agregam resultados.
c) Um modelo de regressão utilizado para prever valores contínuos.
d) Um método de agrupamento para agrupar dados similares.
e) Uma técnica de análise de sentimentos em textos.
Gabarito e Justificativas
1. b) Overfitting ocorre quando o modelo se ajusta excessivamente aos dados de treino, perdendo a capacidade de generalizar para novos dados.
2. c) Regularização reduz a variância do modelo e evita overfitting, adicionando penalidades aos parâmetros do modelo.
3. a) Validação cruzada é usada para avaliar a performance de um modelo em dados não vistos, dividindo os dados em subconjuntos e realizando múltiplos treinamentos e testes.
4. b) O objetivo do K-means é agrupar dados semelhantes em clusters, sem precisar de rótulos predefinidos.
5. a) Backpropagation ajusta os pesos dos neurônios durante o treinamento da rede neural, baseando-se no erro da previsão.
6. c) A variável dependente na regressão logística é binária, com dois valores possíveis (exemplo: 0 e 1).
7. b) A função de ativação introduz não-linearidade no modelo, permitindo a modelagem de problemas complexos.
8. b) O viés é o erro introduzido por um modelo que não é bem treinado ou que é alimentado com dados não representativos.
9. c) O aprendizado não supervisionado trabalha com dados não rotulados, identificando padrões e agrupamentos.
10. b) Random Forest é um ensemble de árvores de decisão que faz previsões agregadas, melhorando a precisão e a robustez do modelo.

Mais conteúdos dessa disciplina