Prévia do material em texto
A B C D E 1 Marcar para revisão Em relação aos modelos de serviço de nuvem, selecione a opção correta com o modelo de serviço focado no hardware. CaaS PaaS IaaS HaaS MaaS 2 Marcar para revisão Em relação à fase de mapeamento do Hadoop, selecione a opção correta que apresenta o responsável pela geração de fragmento para os componentes da fase de redução. A B C D E A B C D E Leitor de registros. Mapeador. Redutor. Particionador. Combinador. 3 Marcar para revisão Os dados que, por alguma razão, normalmente interferência humana, não chegam com todos os atributos esperados durante a coleta de dados, são conhecidos como: Faltantes. Corrompidos. Nulos. Enviesados. Embaralhados. A B C D E 4 Marcar para revisão Quais os métodos de aprendizado de máquina que existem? Aprendizado Supersticioso, Não- Supervisionado, Por Reforço, e Semisupervisionado Aprendizado Supervisionado, Não- Supervisionado, Por Reforço, e Semisupervisionado Aprendizado Supervisionado, Escondido, Por Reforço, e Semisupervisionado Aprendizado Supervisionado, Não- Supervisionado, Por Força Bruta, e Semisupervisionado Aprendizado Supervisionado, Não- Supervisionado, Por Reforço, e Aleatório A B C D E 5 Marcar para revisão O boom da IA se deve ao surgimento de novas tecnologias e dispositivos que por estarem sempre conectados produzem uma quantidade enorme de dados. Estes dados que alimentam os modelos de aprendizado de máquina também são conhecidos como: Big Data. Informações. Conhecimento. Dados Faltantes. Observações. 6 Marcar para revisão Em relação às características do processamento de fluxo de dados, selecione a opção correta. A B C D E A B São invariáveis no tempo O fluxo de dados é intermitente São relacionados à aplicações de internet das coisas Sempre são do mesmo tipo Representam o estado de um sistema em um dado momento 7 Marcar para revisão A respeito dos componentes do ecossistema do Hadoop, selecione a opção correta que apresenta o componente responsável pelo gerenciamento dos clusters. HBase HCluster Prova AV Tópicos De Big Data Em Python C D E A B C D E Flume Spark Zookeeper 8 Marcar para revisão A biblioteca Pandas é amplamente utilizada para manipular dados heterogêneos, situação recorrente para aplicações de Big Data. Nesse sentido, selecione a opção que contém a estrutura de dados que possibilita o Cientista de dados atribuir nome para as colunas. DataFrame PySpark SQL RDD numpy.array 00 hora : 41 min : 30 seg Ocultar Questão 10 de 10 Respondidas �10� Em branco �0� Finalizar prova 1 2 3 4 5 6 7 8 9 10 A B C D E 9 Marcar para revisão Compreender os conceitos e princípios do framework Apache Spark é fundamental para o cientista de dados. Selecione a opção correta que contém o componente do ecossistema Spark responsável por dar suporte para tratar fluxo de dados típicos de aplicações de tempo real. Spark SQL Spark Streaming RDDs Spark Core Spark Hadoop 10 Marcar para revisão O seguinte constructo da linguagem Python representa o condicional simples: A B C D E else if for while with