Prévia do material em texto
25/12/2023, 14:01 Estácio: Alunos https://simulado.estacio.br/alunos/ 1/3 Avaliando Aprendizado Teste seu conhecimento acumulado Disc.: TÓPICOS DE BIG DATA EM PYTHON Aluno(a): ANDERSON SILVA FERRAZ DO NASCIMENTO 202110122584 Acertos: 2,0 de 2,0 25/12/2023 Acerto: 0,2 / 0,2 Em relação aos desa�os do processamento de �uxo de dados, selecione a opção correta. Usar algoritmos de criptogra�a nos dados para evitar o acesso indevido. Garantir a qualidade dos dados através de ferramentas de controle que não aceitem qualquer inconsistência. Aplicar recursos de redundância no projeto para reduzir a volatilidade dos dados. Dimensionar o projeto logo no início para evitar a necessidade de expansão posteriormente. Garantir a consistência da informação através da ordenação dos dados. Respondido em 25/12/2023 13:52:16 Explicação: Nas aplicações de streaming de dados, di�cilmente não vai ocorrer alguma inconsistência, pois, normalmente, elas estão contextualizadas em ambientes dinâmicos. Portanto, deve-se ordenar os dados para manter a consistência dos dados e, além disso, o sistema deve ter uma tolerância a falhas sendo capaz de operar ainda que haja problemas, desde que estejam dentro de um patamar de qualidade pré-estabelecido. Acerto: 0,2 / 0,2 Reconhecer os conceitos de Data Lake é fundamental para o pro�ssional de Tecnologia da Informação. Selecione a opção correta que de�ne resumidamente o que é o Data Lake. É um ambiente para tratamento e armazenamento apenas de dados relacionais. É um repositório para tratamento dos dados. É um repositório centralizado para armazenamento de dados. Trata-se de um componente do HDFS responsável pela implementação do mecanismo MapReduce para fazer o gerenciamento dos dados. É uma tecnologia de armazenamento e processamento de dados. Respondido em 25/12/2023 13:52:53 Explicação: O Data Lake é um repositório centralizado capaz de armazenar dados nos diversos formatos: estruturados, não estruturados e semiestruturados sem a necessidade de aplicar nenhum tratamento. Acerto: 0,2 / 0,2 Em relação ao protocolo de transporte para transmissão de aplicações de streaming, selecione a opção correta. MQTT CoAP HTTP UDP TCP Respondido em 25/12/2023 13:54:12 Explicação: O protocolo UDP - protocolo de datagrama do usuário - é utilizado para aplicações de streaming por ser mais rápido. O protocolo TCP é orientado à con�abilidade e, no caso de aplicações de streaming, ele é muito lento inviabilizando a aplicação. Os protocolos HTTP, MQTT e CoAP não se enquadram no transporte de dados. Acerto: 0,2 / 0,2 Em relação ao Data Lake, selecione a opção correta que contenha o(s) formato(s) de dados que pode(m) ser armazenado(s) nele. apenas estruturado Questão / 1 a Questão / 2 a Questão / 3 a Questão / 4 a https://simulado.estacio.br/alunos/inicio.asp https://simulado.estacio.br/alunos/inicio.asp javascript:voltar(); javascript:voltar(); 25/12/2023, 14:01 Estácio: Alunos https://simulado.estacio.br/alunos/ 2/3 apenas tabelas relacionais apenas não estruturado estruturado, não estruturado e semiestruturado estruturado e semiestruturado Respondido em 25/12/2023 13:55:42 Explicação: O Data Lake pode armazenar dados estruturados, semiestruturados e não estruturados que correspondem a característica de variedade dos dados que é bem típica de aplicações de Big Data. Acerto: 0,2 / 0,2 Em relação ao formato dos dados, selecione a opção correta que corresponde ao formato dos dados de transações bancárias. dados semiestruturados dados de Big Data dados de Internet das Coisas dados estruturados dados não estruturados Respondido em 25/12/2023 13:56:42 Explicação: Os dados de transações bancárias são salvos em tabelas e, portanto, correspondem a dados estruturados, que são típicos de sistemas de transações on line armazenados em banco de dados. As demais alternativas tratam de dados não convencionais que não são armazenados em bancos de dados tradicionais. Acerto: 0,2 / 0,2 A respeito do HDFS, selecione a opção correta cujo componente lógico mantém os dados do usuário na forma de blocos de dados. Bloco de dados YARN Replicação NameNode DataNode Respondido em 25/12/2023 13:57:16 Explicação: O DataNode é componente da arquitetura do HDFS responsável pelo armazenamento dos dados na forma de blocos de dados. Acerto: 0,2 / 0,2 (NC-UFPR/2019 - Adaptada) Sobre a IoT (Internet das coisas) e seus blocos básicos de construção, identi�que como verdadeiras (V) ou falsas (F) as seguintes a�rmativas: ( ) Na IoT, os objetos podem prover comunicação entre usuários e dispositivos, viabilizando diversas aplicações, tais como coleta de dados de pacientes e monitoramento de idosos e sensoriamento de ambientes de difícil acesso. ( ) A tecnologia de IoT consiste na coexistência colaborativa de dois componentes: As "coisas" e os protocolos de rede que permitem a sua comunicação. ( ) Protocolos de comunicação: Viabilizam a troca de dados via Internet entre os objetos físicos e outros sistemas. Assinale a alternativa que apresenta a sequência correta, de cima para baixo. F V V F V F F F F V V F V F V Respondido em 25/12/2023 13:57:57 Explicação: O avanço da tecnologia criou dispositivos e sensores eletrônicos que geram enormes quantidades de dados. Esses equipamentos podem ser utilizados em diversas aplicações, tais como: coleta de dados de pacientes e monitoramento de idosos e sensoriamento de ambientes de difícil acesso. A tecnologia de IoT consiste na coexistência colaborativa de quatro componentes: Objetos físicos (ou "coisas"), Computação, Protocolos de comunicação e Serviços. Questão / 5 a Questão / 6 a Questão / 7 a 25/12/2023, 14:01 Estácio: Alunos https://simulado.estacio.br/alunos/ 3/3 Acerto: 0,2 / 0,2 O Hadoop é uma tecnologia especializada em atender as demandas de Big Data. Selecione a opção correta que contenha a linguagem de programação utilizada para o desenvolvimento e implementação do Hadoop. Perl Java Script Java Python Lua Respondido em 25/12/2023 13:58:32 Explicação: O Hadoop foi desenvolvido usando, originalmente, a linguagem de programação Java na distribuição livre da Apache Foundation. Atualmente, diferentes distribuições do framework estão implementadas em diversas linguagens, entre as quais o Python. Acerto: 0,2 / 0,2 Selecione a opção correta que contém a principal plataforma de tecnologia de nuvem que é usada como referência para as outras plataformas. Amazon AWS Oracle Cloud Google Cloud Microsft Azure IBM Cloud Respondido em 25/12/2023 13:59:04 Explicação: A plataforma Amazon AWS foi a primeira plataforma Cloud e até hoje é considerada como principal referência do mercado. As outras plataformas também são muito importantes e, junto com a Amazon, detém boa fatia do mercado. Acerto: 0,2 / 0,2 A respeito do Hadoop, selecione a opção correta com o componente que faz o rastreamento de tarefas. MapReduce Camada de ingestão Task manager Mrjob HDFS Respondido em 25/12/2023 13:59:40 Explicação: O mecanismo MapReduce é responsável pela distribuição de tarefas em um cluster, através de rastreamento de tarefas (Task Trackers) e de trabalhos (Job Trackers). As demais alternativas, embora tenham relação com o Hadoop, não possuem a funcionalidade de rastreamento de tarefas. Questão / 8 a Questão / 9 a Questão / 10 a