Prévia do material em texto
Iniciado em terça, 1 out 2024, 00:50 Estado Finalizada Concluída em quarta, 2 out 2024, 01:50 Tempo empregado 1 dia Avaliar 1,80 de um máximo de 2,00(90%) Questão 1 Correto Atingiu 0,20 de 0,20 Sobre o aprendizado não-supervisionado é correto afirmar: I - O objetivo é de identificar os padrões existentes nos dados sob análise, suas similaridades (conforme critério estabelecido), suas diferenças e efetuar um agrupamento consistente das informações analisadas. II- No aprendizado não-supervisionado, o algoritmo não recebe os rótulos de entrada e, portanto, não conhece os rótulos de saída que devem ser gerados III - Têm o objetivo de fazer previsões baseados no conjunto de dados que estão sendo analisados, sejam eles dados históricos ou não, eles são treinados por meio de exemplos rotulados, como uma entrada na qual a saída desejada é conhecida. IV - Os resultados desse tipo de algoritmo são geralmente marcados como classificação e regressão. a. Apenas a alternativa I está correta. b. Apenas a alternativa IV está correta. c. Apenas as alternativas II e III estão corretas. d. Apenas as alternativas I e III estão corretas. e. Apenas as alternativas I e II estão corretas. Sua resposta está correta. A resposta correta é: Apenas as alternativas I e II estão corretas. Painel / Minhas Disciplinas / 2ºGRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO-disc. 13- INTRODUÇÃO A CIÊNCIA DE DADOS/ALGORITIMOS E LÓGICA DE PROGRA / DISCIPLINA - INTRODUÇÃO À CIÊNCIA DE DADOS / AB30 - ATIVIDADE DE ESTUDO - INTRODUÇÃO À CIÊNCIA DE DADOS - ATÉ 27/10/2024 - VALOR 2,0 PONTOS https://www.eadunifatecie.com.br/course/view.php?id=48893 https://www.eadunifatecie.com.br/course/view.php?id=48893 https://www.eadunifatecie.com.br/my/ https://www.eadunifatecie.com.br/course/view.php?id=48893 https://www.eadunifatecie.com.br/course/view.php?id=48893#section-1 https://www.eadunifatecie.com.br/mod/quiz/view.php?id=1578729 Questão 2 Correto Atingiu 0,20 de 0,20 Questão 3 Correto Atingiu 0,20 de 0,20 Vários métodos estatísticos são utilizados para o Machine Learning alcançar o desempenho esperado. Sobre o método clustering é correto afirmar: a. Todas as alternativas estão corretas. b. Esse método encontra padrões e os dados são agrupados de acordo com as relações encontradas entre as variáveis. c. É útil quando o custo associado à rotulação é muito alto para possibilitar um processo de treinamento totalmente rotulado. d. É útil quando o custo associado à rotulação é muito baixo para possibilitar um processo de treinamento totalmente rotulado. e. É feito um mapeamento das apenas de variáveis de saída. Sua resposta está correta. A resposta correta é: Esse método encontra padrões e os dados são agrupados de acordo com as relações encontradas entre as variáveis. Para que seja exibido a matriz abaixo: Qual a biblioteca e atributo devem ser utilizados: a. Pandas e Numpy. b. Pandas e shape. c. Numpy e tensor. d. Pandas e tensor. e. Numpy e shape. Sua resposta está correta. A resposta correta é: Numpy e shape. Questão 4 Correto Atingiu 0,20 de 0,20 De acordo com o código Python abaixo, qual o resultado que será apresentado: Titulação = pd.Series(['Doutorado', 'Mestrado', 'Especialização', 'Graduação', 'Cursos Técnicos'],index=[20,15,85,145,320]) a. b. Todas estão corretas. c. d. e. Sua resposta está correta. Questão 5 Correto Atingiu 0,20 de 0,20 A resposta correta é: Análise de dados é um processo que a partir de dados brutos é realizada a inspeção, limpeza, transformação e modelagem de dados. As etapas de processamento desses dados são as seguintes: I - Observação, questionamento, hipóteses; II - Experimentação, análise dos resultados e conclusão; III - Observação, carregamento dos dados, análise dos resultados; IV - Experimentação e análise e limpeza dos dados. a. Alternativas I e II estão corretas. b. Alternativas I e III estão corretas. c. Somente a alternativa I está correta. d. Somente a alternativa IV está correta. e. Alternativas III e IV estão corretas. Sua resposta está correta. A resposta correta é: Alternativas I e II estão corretas. Questão 6 Correto Atingiu 0,20 de 0,20 A Big Data é uma área tecnológica que trabalha com a coleta, manuseio e interpretação de grandes quantidades de dados. Associe os termos dos 5Vs de Big Data às suas respectivas características, e indique a alternativa correta. (1) Volume (2) Velocidade (3) Variedade (4) Veracidade (5) Valor ( ) Dados autênticos e verdadeiros. ( ) Processamento ágil. ( ) Utilidade dos dados. ( ) Fontes de dados muito heterogêneas. ( ) Grande quantidade de dados gerados. a. 4; 2; 5; 3; 1. b. 3; 4; 5; 1; 2. c. 2; 3; 5; 1; 4. d. 2; 3; 5; 1; 4. e. 5; 4; 3; 2; 1. Sua resposta está correta. A resposta correta é: 4; 2; 5; 3; 1. Questão 7 Correto Atingiu 0,20 de 0,20 Questão 8 Correto Atingiu 0,20 de 0,20 Sobre Machine Learning e Deep Learning, respectivamente é correto afirmar: a. É a capacidade da máquina imitar algumas características humanas, como a percepção visual, reconhecimento de fala, tomada de decisão e tradução de idiomas; Esse sistema é capaz de analisar uma grande quantidade de dados por meio de métodos estatísticos específicos, além de usar uma variedade de algoritmos para encontrar padrões no banco de dados. b. É capaz de analisar uma grande quantidade de dados por meio de métodos estatísticos específicos, além de usar uma variedade de algoritmos para encontrar padrões no banco de dados; Ela tem como base a utilização das redes neurais profundas. c. Esse sistema é capaz de analisar uma grande quantidade de dados por meio de métodos estatísticos específicos, além de usar uma variedade de algoritmos para encontrar padrões no banco de dados; É comumente usados em aplicações onde dados históricos podem prever eventos futuros prováveis. d. Gerencia o armazenamento de grandes conjuntos de dados, também de forma distribuída. É projetada para jogar o processamento para o banco de dados, de modo a aprimorar a performance. e. É uma tendência de rápido crescimento que coloca o poder de acesso, mistura e transformação de dados nas mãos dos usuários organizacionais e outros profissionais não-técnicos; São utilizadas para limpar, perfilar e auditar dados – garantem que os dados sejam confiáveis. Sua resposta está correta. A resposta correta é: É capaz de analisar uma grande quantidade de dados por meio de métodos estatísticos específicos, além de usar uma variedade de algoritmos para encontrar padrões no banco de dados; Ela tem como base a utilização das redes neurais profundas. Uma das grandes vantagens de se utilizar Python são os pacotes exclusivos para Ciência de Dados que podemos citar: a. scikit-learn, NumPy e Pandas. b. Parsing, scikit-learn e NumPy. c. scikit-learn, NumPy e Kivy. d. Parsing, Kivy e Pandas. e. Kivy, Parsing e REPL. Sua resposta está correta. A resposta correta é: scikit-learn, NumPy e Pandas. Questão 9 Correto Atingiu 0,20 de 0,20 Questão 10 Incorreto Atingiu 0,00 de 0,20 Inferir é deduzir um resultado, por lógica, com base na interpretação de outras informações, sobre Estatística inferencial é correto afirmar: a. Está focada na apresentação dos dados, mas não procura fazer inferências ou tirar sólidas conclusões que podem ser usadas para prever futuros dados da amostra. b. Permite a descrição de fenômenos aleatórios oriundos das incertezas. c. Pode ser definida como um conjunto de procedimentos estatísticos que têm por finalidade tirar sólidas conclusões que podem ser usadas para prever futuros dados de uma amostra para uma população. d. Visa descrever e organizar os dados com objetivo de facilitar a compreensão e utilização das informações que serão extraídas. e. São os métodos usados para visualizar dados (data visualization) Sua resposta está correta. A resposta correta é: Pode ser definida como um conjunto de procedimentos estatísticos que têm por finalidade tirar sólidas conclusões que podem ser usadas para prever futuros dadosde uma amostra para uma população. O ETL surge como uma estratégia para simplificar a análise de dados armazenados em um banco de dados, Sobre ETL (EXTRACT TRANSFORM LOAD) que alternativa correta é? a. Atua no plano estratégico da empresa. b. A técnica de integração de dados surgiu da demanda dos negócios de agregar dados de fontes distintas para serem analisadas. c. O processo de ETL é a execução das etapas de Extração, Transformação e Atualização de Dados. d. É o processo não-trivial de identificar, em dados, padrões válidos, novos, potencialmente úteis e ultimamente compreensíveis e. Gerencia o armazenamento de grandes conjuntos de dados, de forma distribuída. Sua resposta está incorreta. A resposta correta é: A técnica de integração de dados surgiu da demanda dos negócios de agregar dados de fontes distintas para serem analisadas. ◄ CLIQUE AQUI PARA ACESSAR AS AULAS DE INTRODUÇÃO À CIÊNCIA DE DADOS https://www.eadunifatecie.com.br/mod/book/view.php?id=1578728&forceview=1 Seguir para... APOSTILA DA DISCIPLINA ► https://www.eadunifatecie.com.br/mod/resource/view.php?id=1578730&forceview=1