11- Atividade Objetiva 04 - Modelagem e Preparação de Dados para Machine Learning (2021)

PUC-MINAS

Andreia

em 14/09/2022

Questões resolvidas

Para um atributo específico, pela análise das médias e das variâncias dos subconjuntos de valores relativos a “K” classes (do atributo label) é possível avaliar, para fins de classificação, se o atributo é relevante ou não para diferenciar as “K” classes. Dentro desse contexto, avalie as afirmações a seguir:
É correto o que se afirma em:
1. Se os subconjuntos de valores do atributo, relativos a cada classe “K”, possuem a mesma média e a mesma variança podemos considerar que o atributo NÂO POSSUI capacidade para diferenciar as k classes.
2. Se os subconjuntos de valores do atributo, relativos a cada classe “K”, possuem a mesma média, porém a variância de um dos subconjuntos é significativamente maior qua a variância dos outros subconjuntos pode-se considerar que o atributo POSSUI capacidade para diferenciar as duas classes.
3. Se os subconjuntos de valores do atributo, relativos a cada classe “K”, independente dos valores das médias e varianças, nada pode ser dito em relação à relevância do atributo para diferenciar cada classe. Neste caso recomenda-se aplicar um processo pairwise.
Somente (3)
Apenas (1) e (3)
Apenas (2) e (3)
Somente (1)

A seleção de atributos é uma tarefa típica num projeto de aprendizado de máquina. Esta tem por objetivo identificar o subconjunto de atributos que podem resultar em modelos mais representativos e sem redundância. Esta tarefa também pode melhorar a interpretabilidade dos modelos. Dentro desse contexto, avalie as afirmações a seguir:
É correto o que se afirma em:
1. Os métodos baseado em filtros, para seleção de atributos, são independentes do algoritmo de aprendizado.
2. Os métodos baseados em filtros são mais rápidos, porém é possível que pelo critério utilizado resulte num subconjunto de atributos que pode não trabalhar muito bem no algoritmo de aprendizado.
3. Os métodos baseados em Wrapper consistem na seleção interativa de um subconjunto de atributos para treinamento do algoritmo de aprendizado. Este processo pode ser exaustivo e demorado.
4. Os métodos baseados em Wrapper utilizam para treinamento um subconjunto de atributos escolhido. O procedimento é comparar o modelo atual em relação ao(s) modelo(s) anterior(es) até convergir para uma determinada condição de parada.
Todas são corretas
Apenas (1) e (3)
Apenas (1) e (2)
Apenas (3) e (4)

Um projeto de aprendizado de máquina que procura pela descoberta de conhecimento útil e não óbvio depende da expertise do responsável pela condução do processo, mais do que da aplicação de ferramentas computacionais. Dentro desse contexto, avalie as afirmações a seguir:
É correto o que se afirma em:
1. Não existem fatores desconhecidos que levem ao insucesso de um projeto de Aprendizado de máquina. A única causa do insucesso é apressar-se para a aplicação dos algoritmos de aprendizado de máquina sem passar por um processo de preparação da base de dados.
2. O tempo de preparação da base de dados é significativamente maior ao tempo gasto na aplicação dos algoritmos de aprendizado de máquina. Esse tempo pode chegar a 75% do tempo total.
3. Até o momento não existem ferramentas computacionais ou metodologias únicas para condução de um projeto em ciência de dados que garanta o sucesso.
4. A padronização é resultado da aplicação do processo KDD para um problema específico, embora seja possível generalizar alguns procedimentos.
Apenas (2)
Apenas (2) e (3)
Todas são corretas
Apenas (1)

A redução de dimensionalidade é uma tarefa típica num projeto de aprendizado de máquina. Esta tem por objetivo reduzir o número de atributos buscando identificar aqueles relevantes ao domínio de problema, mas também tornar viável a execusão dos algoritmos de aprendizado de maquina e indiretamente obter modelos com melhor interpretabilidade. Pela análise da média e da variância é possível eliminar atributos isolados. Dentro desse contexto, avalie as afirmações a seguir:
É correto o que se afirma em:
1. Para um atributo isolado com valor de média e variância pequena, pode indicar que o atributo é praticamente uma constante e pode ser eliminado.
2. Para um atributo isolado com valor de média e variância alta, pode indicar que o atributo possui muita informação e não deve ser eliminado.
3. Para um atributo isolado com valor de média baixa, pode indicar que o atributo é praticamente uma constante.
4. Para um atributo isolado com valor de média alta, pode indicar que o atributo possui muita informação e não deve ser eliminado.
Apenas (3) e (4)
Apenas (2), (3) e (4)
Apenas (1) e (2)
Apenas (2) e (3)

Conteúdos escolhidos para você

19 pág.

a67fd847-5163-4da7-b3ad-e86d3f0dbc29

43 pág.

Tema 3 - Treinamento de modelos de aprendizado não supervisionado

ESTÁCIO EAD

4 pág.

Atividade Objetiva 4_ 04 - Modelagem e Preparação de Dados para Aprendizado de Máquina (2023) - teste01

PUC-MINAS

42 pág.

CIÊNCIA DE DADOS - Slides de Aula - Unidade II

FAPAL

32 pág.

machine learning aula4

Perguntas dessa disciplina

O aprendizado supervisionado é um termo geral que diz respeito aos métodos de mineração de dados voltados para a construção de um modelo. Esse mode...

Uniasselvi

Questão 1/10 - Bioestatística Ler em voz alta Leia o excerto de texto: “O processo de investigação passa por diferentes estádios, dos quais já salient

AVALIAÇÃO PRESENCIAL – BIOESTATÍSTICA APLICADA À SAÚDE – 2° PERÍODO – TERAPIA OCUPACIONAL 2 A estatística pode ser definida como um ramo da matemática

O processo de desenvolvimento de um programa envolve a modelagem de dados que serão utilizados nas operações do algoritmo. Cada informação deve ser...

Na figura a seguir, os alimentos estão representados por duas características: temperatura em que devem ser servidos e teor de açúcar. Repare que a...

UNIP

Material

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Questões resolvidas

Para um atributo específico, pela análise das médias e das variâncias dos subconjuntos de valores relativos a “K” classes (do atributo label) é possível avaliar, para fins de classificação, se o atributo é relevante ou não para diferenciar as “K” classes. Dentro desse contexto, avalie as afirmações a seguir:
É correto o que se afirma em:
1. Se os subconjuntos de valores do atributo, relativos a cada classe “K”, possuem a mesma média e a mesma variança podemos considerar que o atributo NÂO POSSUI capacidade para diferenciar as k classes.
2. Se os subconjuntos de valores do atributo, relativos a cada classe “K”, possuem a mesma média, porém a variância de um dos subconjuntos é significativamente maior qua a variância dos outros subconjuntos pode-se considerar que o atributo POSSUI capacidade para diferenciar as duas classes.
3. Se os subconjuntos de valores do atributo, relativos a cada classe “K”, independente dos valores das médias e varianças, nada pode ser dito em relação à relevância do atributo para diferenciar cada classe. Neste caso recomenda-se aplicar um processo pairwise.
Somente (3)
Apenas (1) e (3)
Apenas (2) e (3)
Somente (1)

A seleção de atributos é uma tarefa típica num projeto de aprendizado de máquina. Esta tem por objetivo identificar o subconjunto de atributos que podem resultar em modelos mais representativos e sem redundância. Esta tarefa também pode melhorar a interpretabilidade dos modelos. Dentro desse contexto, avalie as afirmações a seguir:
É correto o que se afirma em:
1. Os métodos baseado em filtros, para seleção de atributos, são independentes do algoritmo de aprendizado.
2. Os métodos baseados em filtros são mais rápidos, porém é possível que pelo critério utilizado resulte num subconjunto de atributos que pode não trabalhar muito bem no algoritmo de aprendizado.
3. Os métodos baseados em Wrapper consistem na seleção interativa de um subconjunto de atributos para treinamento do algoritmo de aprendizado. Este processo pode ser exaustivo e demorado.
4. Os métodos baseados em Wrapper utilizam para treinamento um subconjunto de atributos escolhido. O procedimento é comparar o modelo atual em relação ao(s) modelo(s) anterior(es) até convergir para uma determinada condição de parada.
Todas são corretas
Apenas (1) e (3)
Apenas (1) e (2)
Apenas (3) e (4)

Um projeto de aprendizado de máquina que procura pela descoberta de conhecimento útil e não óbvio depende da expertise do responsável pela condução do processo, mais do que da aplicação de ferramentas computacionais. Dentro desse contexto, avalie as afirmações a seguir:
É correto o que se afirma em:
1. Não existem fatores desconhecidos que levem ao insucesso de um projeto de Aprendizado de máquina. A única causa do insucesso é apressar-se para a aplicação dos algoritmos de aprendizado de máquina sem passar por um processo de preparação da base de dados.
2. O tempo de preparação da base de dados é significativamente maior ao tempo gasto na aplicação dos algoritmos de aprendizado de máquina. Esse tempo pode chegar a 75% do tempo total.
3. Até o momento não existem ferramentas computacionais ou metodologias únicas para condução de um projeto em ciência de dados que garanta o sucesso.
4. A padronização é resultado da aplicação do processo KDD para um problema específico, embora seja possível generalizar alguns procedimentos.
Apenas (2)
Apenas (2) e (3)
Todas são corretas
Apenas (1)

A redução de dimensionalidade é uma tarefa típica num projeto de aprendizado de máquina. Esta tem por objetivo reduzir o número de atributos buscando identificar aqueles relevantes ao domínio de problema, mas também tornar viável a execusão dos algoritmos de aprendizado de maquina e indiretamente obter modelos com melhor interpretabilidade. Pela análise da média e da variância é possível eliminar atributos isolados. Dentro desse contexto, avalie as afirmações a seguir:
É correto o que se afirma em:
1. Para um atributo isolado com valor de média e variância pequena, pode indicar que o atributo é praticamente uma constante e pode ser eliminado.
2. Para um atributo isolado com valor de média e variância alta, pode indicar que o atributo possui muita informação e não deve ser eliminado.
3. Para um atributo isolado com valor de média baixa, pode indicar que o atributo é praticamente uma constante.
4. Para um atributo isolado com valor de média alta, pode indicar que o atributo possui muita informação e não deve ser eliminado.
Apenas (3) e (4)
Apenas (2), (3) e (4)
Apenas (1) e (2)
Apenas (2) e (3)

Conteúdos escolhidos para você

19 pág.

a67fd847-5163-4da7-b3ad-e86d3f0dbc29

43 pág.

Tema 3 - Treinamento de modelos de aprendizado não supervisionado

ESTÁCIO EAD

4 pág.

Atividade Objetiva 4_ 04 - Modelagem e Preparação de Dados para Aprendizado de Máquina (2023) - teste01

PUC-MINAS

42 pág.

CIÊNCIA DE DADOS - Slides de Aula - Unidade II

FAPAL

32 pág.

machine learning aula4

Perguntas dessa disciplina

O aprendizado supervisionado é um termo geral que diz respeito aos métodos de mineração de dados voltados para a construção de um modelo. Esse mode...

Uniasselvi

Questão 1/10 - Bioestatística Ler em voz alta Leia o excerto de texto: “O processo de investigação passa por diferentes estádios, dos quais já salient

AVALIAÇÃO PRESENCIAL – BIOESTATÍSTICA APLICADA À SAÚDE – 2° PERÍODO – TERAPIA OCUPACIONAL 2 A estatística pode ser definida como um ramo da matemática

O processo de desenvolvimento de um programa envolve a modelagem de dados que serão utilizados nas operações do algoritmo. Cada informação deve ser...

Na figura a seguir, os alimentos estão representados por duas características: temperatura em que devem ser servidos e teor de açúcar. Repare que a...

UNIP

Prévia do material em texto

Pontuação desta tentativa: 10 de 10
Enviado 20 jun em 20:03
Esta tentativa levou 5 minutos.
2 / 2 ptsPergunta 1
Para um atributo específico, pela análise das médias e das variâncias
dos subconjuntos de valores relativos a duas classes (do atributo label)
é possível avaliar, para fins de classificação, se o atributo é relevante
ou não para diferenciar as duas classes. Dentro desse contexto, avalie
as afirmações a seguir:
1. Se os subconjuntos de valores do atributo, relativos a cada classe,
possuem a mesma média e a mesma variança podemos considerar
que o atributo NÂO POSSUI capacidade para diferenciar as duas
classes.
2. Se os subconjuntos de valores do atributo, relativos a cada classe,
possuem a mesma média, porém a variância de um dos subconjuntos
é significativamente maior qua a variância do outro subconjunto pode-
se considerar que o atributo POSSUI capacidade para diferenciar as
duas classes.
3. Se os subconjuntos de valores do atributo, relativos a cada classe,
possuem a médias relativamente distantes e varianças relativamente
pequenas podemos considerar que o atributo POSSUI capacidade
para diferenciar as duas classes.
É correto o que se afirma em:
 Somente (2) 
 Somente (1) 
 Apenas (2) e (3) 
 Apenas (1) e (3) 
2 / 2 ptsPergunta 2
A seleção de atributos é uma tarefa típica num projeto de aprendizado
de máquina. Esta tem por objetivo identificar o subconjunto de
atributos que podem resultar em modelos mais representativos e sem
redundância. Esta tarefa também pode melhorar a interpretabilidade
dos modelos. Dentro desse contexto, avalie as afirmações a seguir:
1. Os métodos baseado em filtros, para seleção de atributos, são
independentes do algoritmo de aprendizado.
2. Os métodos baseados em filtros são mais rápidos, porém é possível
que pelo critério utilizado resulte num subconjunto de atributos que
pode não trabalhar muito bem no algoritmo de aprendizado.
3. Os métodos baseados em Wrapper consistem na seleção interativa
de um subconjunto de atributos para treinamento do algoritmo de
aprendizado. Este processo pode ser exaustivo e demorado.
4. Os métodos baseados em Wrapper utilizam para treinamento um
subconjunto de atributos escolhido. O procedimento é comparar o
modelo atual em relação ao(s) modelo(s) anterior(es) até convergir
para uma determinada condição de parada.
É correto o que se afirma em:
 Todas são corretas 
 Apenas (1) e (3) 
 Apenas (1) e (2) 
 Apenas (3) e (4) 
2 / 2 ptsPergunta 3
Para um atributo específico, pela análise das médias e das variâncias
dos subconjuntos de valores relativos a “K” classes (do atributo label) é
possível avaliar, para fins de classificação, se o atributo é relevante ou
não para diferenciar as “K” classes. Dentro desse contexto, avalie as
afirmações a seguir:
1. Se os subconjuntos de valores do atributo, relativos a cada classe
“K”, possuem a mesma média e a mesma variança podemos
considerar que o atributo NÂO POSSUI capacidade para diferenciar as
k classes.
2. Se os subconjuntos de valores do atributo, relativos a cada classe
“K”, possuem a mesma média, porém a variância de um dos
subconjuntos é significativamente maior qua a variância dos outros
subconjuntos pode-se considerar que o atributo POSSUI capacidade
para diferenciar as duas classes.
3. Se os subconjuntos de valores do atributo, relativos a cada classe
“K”, independente dos valores das médias e varianças, nada pode ser
dito em relação à relevância do atributo para diferenciar cada classe.
Neste caso recomenda-se aplicar um processo pairwise.
É correto o que se afirma em:
 Somente (3) 
 Apenas (1) e (3) 
 Apenas (2) e (3) 
 Somente (1) 
2 / 2 ptsPergunta 4
Um projeto de aprendizado de máquina que procura pela descoberta
de conhecimento útil e não óbvio depende da expertise do responsável
pela condução do processo, mais do que da aplicação de ferramentas
computacionais. Dentro desse contexto, avalie as afirmações a seguir:
1. Não existem fatores desconhecidos que levem ao insucesso de um
projeto de Aprendizado de máquina. A única causa do insucesso é
apressar-se para a aplicação dos algoritmos de aprendizado de
máquina sem passar por um processo de preparação da base de
dados.
2. O tempo de preparação da base de dados é significativamente
maior ao tempo gasto na aplicação dos algoritmos de aprendizado de
máquina. Esse tempo pode chegar a 75% do tempo total.
3. Até o momento não existem ferramentas computacionais ou
metodologias únicas para condução de um projeto em ciência de
dados que garanta o sucesso.
4. A padronização é resultado da aplicação do processo KDD para um
problema específico, embora seja possível generalizar alguns
procedimentos.
É correto o que se afirma em:
 Apenas (2) 
 Apenas (2) e (3) 
 Todas são corretas 
 Apenas (1) 
2 / 2 ptsPergunta 5
A redução de dimensionalidade é uma tarefa típica num projeto de
aprendizado de máquina. Esta tem por objetivo reduzir o número de
atributos buscando identificar aqueles relevantes ao domínio de
problema, mas também tornar viável a execusão dos algoritmos de
aprendizado de maquina e indiretamente obter modelos com melhor
interpretabilidade. Pela análise da média e da variância é possível
eliminar atributos isolados. Dentro desse contexto, avalie as
afirmações a seguir:
1. Para um atributo isolado com valor de média e variância pequena,
pode indicar que o atributo é praticamente uma constante e pode ser
eliminado.
2. Para um atributo isolado com valor de média e variância alta, pode
indicar que o atributo possui muita informação e não deve ser
eliminado.
3. Para um atributo isolado com valor de média baixa, pode indicar que
o atributo é praticamente uma constante.
4. Para um atributo isolado com valor de média alta, pode indicar que o
atributo possui muita informação e não deve ser eliminado.
É correto o que se afirma em:
 Apenas (3) e (4) 
 Apenas (2), (3) e (4) 
 Apenas (1) e (2) 
 Apenas (2) e (3) 
Pontuação do teste: 10 de 10

11- Atividade Objetiva 04 - Modelagem e Preparação de Dados para Machine Learning (2021)

PUC-MINAS

Ferramentas de estudo

Conteúdos escolhidos para você

a67fd847-5163-4da7-b3ad-e86d3f0dbc29

Tema 3 - Treinamento de modelos de aprendizado não supervisionado

Atividade Objetiva 4_ 04 - Modelagem e Preparação de Dados para Aprendizado de Máquina (2023) - teste01

CIÊNCIA DE DADOS - Slides de Aula - Unidade II

machine learning aula4

Perguntas dessa disciplina

O aprendizado supervisionado é um termo geral que diz respeito aos métodos de mineração de dados voltados para a construção de um modelo. Esse mode...

Questão 1/10 - Bioestatística Ler em voz alta Leia o excerto de texto: “O processo de investigação passa por diferentes estádios, dos quais já salient

AVALIAÇÃO PRESENCIAL – BIOESTATÍSTICA APLICADA À SAÚDE – 2° PERÍODO – TERAPIA OCUPACIONAL 2 A estatística pode ser definida como um ramo da matemática

O processo de desenvolvimento de um programa envolve a modelagem de dados que serão utilizados nas operações do algoritmo. Cada informação deve ser...

Na figura a seguir, os alimentos estão representados por duas características: temperatura em que devem ser servidos e teor de açúcar. Repare que a...

Crie sua conta grátis para liberar esse material. 🤩

Crie sua conta grátis para liberar esse material. 🤩

Crie sua conta grátis para liberar esse material. 🤩

Crie sua conta grátis para liberar esse material. 🤩

Crie sua conta grátis para liberar esse material. 🤩

Conteúdos escolhidos para você

a67fd847-5163-4da7-b3ad-e86d3f0dbc29

Tema 3 - Treinamento de modelos de aprendizado não supervisionado

Atividade Objetiva 4_ 04 - Modelagem e Preparação de Dados para Aprendizado de Máquina (2023) - teste01

CIÊNCIA DE DADOS - Slides de Aula - Unidade II

machine learning aula4

Perguntas dessa disciplina

O aprendizado supervisionado é um termo geral que diz respeito aos métodos de mineração de dados voltados para a construção de um modelo. Esse mode...

Questão 1/10 - Bioestatística Ler em voz alta Leia o excerto de texto: “O processo de investigação passa por diferentes estádios, dos quais já salient

AVALIAÇÃO PRESENCIAL – BIOESTATÍSTICA APLICADA À SAÚDE – 2° PERÍODO – TERAPIA OCUPACIONAL 2 A estatística pode ser definida como um ramo da matemática

O processo de desenvolvimento de um programa envolve a modelagem de dados que serão utilizados nas operações do algoritmo. Cada informação deve ser...

Na figura a seguir, os alimentos estão representados por duas características: temperatura em que devem ser servidos e teor de açúcar. Repare que a...

Mais conteúdos dessa disciplina