Prévia do material em texto
Pontuação desta tentativa: 10 de 10 Enviado 20 jun em 20:03 Esta tentativa levou 5 minutos. 2 / 2 ptsPergunta 1 Para um atributo específico, pela análise das médias e das variâncias dos subconjuntos de valores relativos a duas classes (do atributo label) é possível avaliar, para fins de classificação, se o atributo é relevante ou não para diferenciar as duas classes. Dentro desse contexto, avalie as afirmações a seguir: 1. Se os subconjuntos de valores do atributo, relativos a cada classe, possuem a mesma média e a mesma variança podemos considerar que o atributo NÂO POSSUI capacidade para diferenciar as duas classes. 2. Se os subconjuntos de valores do atributo, relativos a cada classe, possuem a mesma média, porém a variância de um dos subconjuntos é significativamente maior qua a variância do outro subconjunto pode- se considerar que o atributo POSSUI capacidade para diferenciar as duas classes. 3. Se os subconjuntos de valores do atributo, relativos a cada classe, possuem a médias relativamente distantes e varianças relativamente pequenas podemos considerar que o atributo POSSUI capacidade para diferenciar as duas classes. É correto o que se afirma em: Somente (2) Somente (1) Apenas (2) e (3) Apenas (1) e (3) 2 / 2 ptsPergunta 2 A seleção de atributos é uma tarefa típica num projeto de aprendizado de máquina. Esta tem por objetivo identificar o subconjunto de atributos que podem resultar em modelos mais representativos e sem redundância. Esta tarefa também pode melhorar a interpretabilidade dos modelos. Dentro desse contexto, avalie as afirmações a seguir: 1. Os métodos baseado em filtros, para seleção de atributos, são independentes do algoritmo de aprendizado. 2. Os métodos baseados em filtros são mais rápidos, porém é possível que pelo critério utilizado resulte num subconjunto de atributos que pode não trabalhar muito bem no algoritmo de aprendizado. 3. Os métodos baseados em Wrapper consistem na seleção interativa de um subconjunto de atributos para treinamento do algoritmo de aprendizado. Este processo pode ser exaustivo e demorado. 4. Os métodos baseados em Wrapper utilizam para treinamento um subconjunto de atributos escolhido. O procedimento é comparar o modelo atual em relação ao(s) modelo(s) anterior(es) até convergir para uma determinada condição de parada. É correto o que se afirma em: Todas são corretas Apenas (1) e (3) Apenas (1) e (2) Apenas (3) e (4) 2 / 2 ptsPergunta 3 Para um atributo específico, pela análise das médias e das variâncias dos subconjuntos de valores relativos a “K” classes (do atributo label) é possível avaliar, para fins de classificação, se o atributo é relevante ou não para diferenciar as “K” classes. Dentro desse contexto, avalie as afirmações a seguir: 1. Se os subconjuntos de valores do atributo, relativos a cada classe “K”, possuem a mesma média e a mesma variança podemos considerar que o atributo NÂO POSSUI capacidade para diferenciar as k classes. 2. Se os subconjuntos de valores do atributo, relativos a cada classe “K”, possuem a mesma média, porém a variância de um dos subconjuntos é significativamente maior qua a variância dos outros subconjuntos pode-se considerar que o atributo POSSUI capacidade para diferenciar as duas classes. 3. Se os subconjuntos de valores do atributo, relativos a cada classe “K”, independente dos valores das médias e varianças, nada pode ser dito em relação à relevância do atributo para diferenciar cada classe. Neste caso recomenda-se aplicar um processo pairwise. É correto o que se afirma em: Somente (3) Apenas (1) e (3) Apenas (2) e (3) Somente (1) 2 / 2 ptsPergunta 4 Um projeto de aprendizado de máquina que procura pela descoberta de conhecimento útil e não óbvio depende da expertise do responsável pela condução do processo, mais do que da aplicação de ferramentas computacionais. Dentro desse contexto, avalie as afirmações a seguir: 1. Não existem fatores desconhecidos que levem ao insucesso de um projeto de Aprendizado de máquina. A única causa do insucesso é apressar-se para a aplicação dos algoritmos de aprendizado de máquina sem passar por um processo de preparação da base de dados. 2. O tempo de preparação da base de dados é significativamente maior ao tempo gasto na aplicação dos algoritmos de aprendizado de máquina. Esse tempo pode chegar a 75% do tempo total. 3. Até o momento não existem ferramentas computacionais ou metodologias únicas para condução de um projeto em ciência de dados que garanta o sucesso. 4. A padronização é resultado da aplicação do processo KDD para um problema específico, embora seja possível generalizar alguns procedimentos. É correto o que se afirma em: Apenas (2) Apenas (2) e (3) Todas são corretas Apenas (1) 2 / 2 ptsPergunta 5 A redução de dimensionalidade é uma tarefa típica num projeto de aprendizado de máquina. Esta tem por objetivo reduzir o número de atributos buscando identificar aqueles relevantes ao domínio de problema, mas também tornar viável a execusão dos algoritmos de aprendizado de maquina e indiretamente obter modelos com melhor interpretabilidade. Pela análise da média e da variância é possível eliminar atributos isolados. Dentro desse contexto, avalie as afirmações a seguir: 1. Para um atributo isolado com valor de média e variância pequena, pode indicar que o atributo é praticamente uma constante e pode ser eliminado. 2. Para um atributo isolado com valor de média e variância alta, pode indicar que o atributo possui muita informação e não deve ser eliminado. 3. Para um atributo isolado com valor de média baixa, pode indicar que o atributo é praticamente uma constante. 4. Para um atributo isolado com valor de média alta, pode indicar que o atributo possui muita informação e não deve ser eliminado. É correto o que se afirma em: Apenas (3) e (4) Apenas (2), (3) e (4) Apenas (1) e (2) Apenas (2) e (3) Pontuação do teste: 10 de 10