Logo Passei Direto
Buscar

Avaliação II - Individual

Ferramentas de estudo

Questões resolvidas

O MapReduce é um modelo que foi proposto para o processamento de grandes conjuntos de dados, através da aplicação de tarefas independentes entre si. Programas em MapReduce são baseados em estilos de programação funcional, capazes de realizar processamento de grandes volumes de dados de forma paralela.
Sobre o fluxo do MapReduce, ordene os itens a seguir:
I- Entrada.
II- Separação.
III- Mapeamento.
IV- Redução.
V- Combinação.
A I - II - III - IV - V.
B V - III - IV - I - II.
C I - II - III - V - IV.
D I - II - IV - V - III.

Big Data é um termo utilizado para descrever conjuntos de dados cuja captura, armazenamento, distribuição e análise requerem métodos e tecnologias avançadas devido a qualquer combinação de seu tamanho (volume), frequência de atualização (velocidade) e diversidade (heterogeneidade).
Sobre o algoritmo MapReduce, classifique V para as sentenças verdadeiras e F para as falsas:
( ) MapReduce é um modelo de programação e implementação associada a esse modelo.
( ) MapReduce é implementado apenas em Java.
( ) O Spark implementa o MapReduce.
( ) O Hadoop implementa o MapReduce.
A V - F - V - F.
B F - F - V - V.
C F - V - F - F.
D V - F - V - V.

A computação em nuvem é a ideia de utilizarmos, em qualquer lugar e independente de plataforma, os mais variados tipos de aplicações através da internet com a mesma facilidade de tê-las instaladas em nossos próprios computadores. Sobre o particionamento de dados em nuvem, classifique V para as sentenças verdadeiras e F para as falsas:
( ) O AWS Lake é um serviço que facilita a configuração de um data lake.
( ) O Azure é um serviço de armazenamento em nuvem Open Source e gratuito.
( ) O Azure pode ter redes virtuais e também pode ser conectado à rede corporativa.
( ) Amazon EMR é uma plataforma de big data que oferece suporte a 19 projetos de código aberto, como Apache Spark, Hive, HBase, entre outros.
A F - V - V - F.
B V - F - F - V.
C F - V - F - V.
D V - F - V - V.

O Spark é baseado no processamento distribuído de dados em memória, por meio de uma abstração chamada RDD (do inglês Resilient Distributed Dataset). Os RDDs são coleções distribuídas de elementos de dados imutáveis. Sobre esse tema, classifique V para as sentenças verdadeiras e F para as falsas:
( ) O Apache PostgreSQL é considerado um framework de Big Data.
( ) O Apache Storm é considerado um framework de Big Data.
( ) O Apache Flink é considerado um framework de Big Data.
( ) O Apache Hadoop é considerado um framework de Big Data.
A F - V - V - V.
B V - F - F - V.
C F - V - F - V.
D V - F - V - F.

O termo streaming é utilizado em diversos contextos em tecnologia, como serviços de streaming de música e vídeo, que têm como objetivo fornecer esses recursos em tempo real. No contexto de Big Data e dados, streaming de dados representa coleta e armazenamento em tempo real.
Considerando as ferramentas que são frameworks de streamming de dados, classifique V para as opções verdadeiras e F para as falsas:
( ) MongoDB.
( ) Neo4J.
( ) Spark.
( ) PostgreSQL.
A V - F - F - V.
B F - F - V - F.
C F - V - V - F.
D F - V - F - V.

Em seu ambiente, apesar de serem necessários apenas dois componentes para compor uma aplicação para se planejar um ambiente distribuído de maior eficiência, são necessários os demais componentes utilizando o Apache Hadoop.
Assinale a alternativa CORRETA que apresenta o componente que é o sistema gerenciador de dados distribuídos do Hadoop, este gerencia o armazenamento dos dados e a distribuição:
A Hue.
B HDFS.
C PostgreSQL.
D Hive.

O HDFS é um sistema de arquivos distribuído altamente escalável e flexível, projetado para ser tolerante a falhas mesmo quando executa em clusters com hardware comum. Dentro do HDFS, segue-se uma arquitetura mestre-escravo formada por dois tipos de nós: NameNode (NN) e DataNode (DN).
Sobre a relação entre HDFS on premise e dados em nuvem, classifique V para as sentenças verdadeiras e F para as falsas:
( ) O HDFS on premise atua sob demanda e só é pago quando consome.
( ) Para utilizar HDFS em nuvem é preciso ter equipe de suporte e espaço físico local.
( ) O HDFS on premise está limitado à capacidade física do hardware local.
( ) O HDFS on em nuvem pode ter o hardware expandido a qualquer momento.
A F - F - V - V.
B F - V - V - F.
C F - F - F - F.
D V - V - F - V.

O particionamento de dados pode acontecer de maneira horizontal, vertical ou funcional. Cada um dos tipos de particionamento apresenta características que irão variar em benefícios, de acordo com a estratégia a ser adotada por uma instituição. Existe um tipo de particionamento chamado de fragmentação ou sharding. Nesse modelo, os dados são fragmentados em partes menores, chamadas de shard ou fragmento, com todos os dados do mesmo tipo juntos.
Assinale a alternativa CORRETA que apresenta esse tipo de particionamento:
A Particionamento orbital.
B Particionamento horizontal.
C Particionamento vertical.
D Particionamento funcional.

Os frameworks de Big Data baseados em lote são caracterizados pelo armazenamento prévio da massa de dados para o processamento da demanda computacional. Por outro lado, os frameworks baseados em tempo real não realizam o armazenamento prévio dos dados, pois nesse caso existe uma fonte responsável pela geração contínua de dados para o processamento.
Sobre os frameworks de Big Data, classifique V para as sentenças verdadeiras e F para as falsas:
( ) No Hadoop, geralmente os dados de entrada e as saídas são armazenados em um sistema de arquivos.
( ) No Spark, os dados podem ser mantidos em memória para os casos de processamento iterativo.
( ) Em todos os cenários, o Hadoop tem um melhor desempenho que o Spark.
( ) O Spark e o Hadoop não podem ser integrados.
A F - F - V - V.
B V - F - V - F.
C F - V - V - F.
D V - V - F - F.

Material
páginas com resultados encontrados.
páginas com resultados encontrados.
left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Questões resolvidas

O MapReduce é um modelo que foi proposto para o processamento de grandes conjuntos de dados, através da aplicação de tarefas independentes entre si. Programas em MapReduce são baseados em estilos de programação funcional, capazes de realizar processamento de grandes volumes de dados de forma paralela.
Sobre o fluxo do MapReduce, ordene os itens a seguir:
I- Entrada.
II- Separação.
III- Mapeamento.
IV- Redução.
V- Combinação.
A I - II - III - IV - V.
B V - III - IV - I - II.
C I - II - III - V - IV.
D I - II - IV - V - III.

Big Data é um termo utilizado para descrever conjuntos de dados cuja captura, armazenamento, distribuição e análise requerem métodos e tecnologias avançadas devido a qualquer combinação de seu tamanho (volume), frequência de atualização (velocidade) e diversidade (heterogeneidade).
Sobre o algoritmo MapReduce, classifique V para as sentenças verdadeiras e F para as falsas:
( ) MapReduce é um modelo de programação e implementação associada a esse modelo.
( ) MapReduce é implementado apenas em Java.
( ) O Spark implementa o MapReduce.
( ) O Hadoop implementa o MapReduce.
A V - F - V - F.
B F - F - V - V.
C F - V - F - F.
D V - F - V - V.

A computação em nuvem é a ideia de utilizarmos, em qualquer lugar e independente de plataforma, os mais variados tipos de aplicações através da internet com a mesma facilidade de tê-las instaladas em nossos próprios computadores. Sobre o particionamento de dados em nuvem, classifique V para as sentenças verdadeiras e F para as falsas:
( ) O AWS Lake é um serviço que facilita a configuração de um data lake.
( ) O Azure é um serviço de armazenamento em nuvem Open Source e gratuito.
( ) O Azure pode ter redes virtuais e também pode ser conectado à rede corporativa.
( ) Amazon EMR é uma plataforma de big data que oferece suporte a 19 projetos de código aberto, como Apache Spark, Hive, HBase, entre outros.
A F - V - V - F.
B V - F - F - V.
C F - V - F - V.
D V - F - V - V.

O Spark é baseado no processamento distribuído de dados em memória, por meio de uma abstração chamada RDD (do inglês Resilient Distributed Dataset). Os RDDs são coleções distribuídas de elementos de dados imutáveis. Sobre esse tema, classifique V para as sentenças verdadeiras e F para as falsas:
( ) O Apache PostgreSQL é considerado um framework de Big Data.
( ) O Apache Storm é considerado um framework de Big Data.
( ) O Apache Flink é considerado um framework de Big Data.
( ) O Apache Hadoop é considerado um framework de Big Data.
A F - V - V - V.
B V - F - F - V.
C F - V - F - V.
D V - F - V - F.

O termo streaming é utilizado em diversos contextos em tecnologia, como serviços de streaming de música e vídeo, que têm como objetivo fornecer esses recursos em tempo real. No contexto de Big Data e dados, streaming de dados representa coleta e armazenamento em tempo real.
Considerando as ferramentas que são frameworks de streamming de dados, classifique V para as opções verdadeiras e F para as falsas:
( ) MongoDB.
( ) Neo4J.
( ) Spark.
( ) PostgreSQL.
A V - F - F - V.
B F - F - V - F.
C F - V - V - F.
D F - V - F - V.

Em seu ambiente, apesar de serem necessários apenas dois componentes para compor uma aplicação para se planejar um ambiente distribuído de maior eficiência, são necessários os demais componentes utilizando o Apache Hadoop.
Assinale a alternativa CORRETA que apresenta o componente que é o sistema gerenciador de dados distribuídos do Hadoop, este gerencia o armazenamento dos dados e a distribuição:
A Hue.
B HDFS.
C PostgreSQL.
D Hive.

O HDFS é um sistema de arquivos distribuído altamente escalável e flexível, projetado para ser tolerante a falhas mesmo quando executa em clusters com hardware comum. Dentro do HDFS, segue-se uma arquitetura mestre-escravo formada por dois tipos de nós: NameNode (NN) e DataNode (DN).
Sobre a relação entre HDFS on premise e dados em nuvem, classifique V para as sentenças verdadeiras e F para as falsas:
( ) O HDFS on premise atua sob demanda e só é pago quando consome.
( ) Para utilizar HDFS em nuvem é preciso ter equipe de suporte e espaço físico local.
( ) O HDFS on premise está limitado à capacidade física do hardware local.
( ) O HDFS on em nuvem pode ter o hardware expandido a qualquer momento.
A F - F - V - V.
B F - V - V - F.
C F - F - F - F.
D V - V - F - V.

O particionamento de dados pode acontecer de maneira horizontal, vertical ou funcional. Cada um dos tipos de particionamento apresenta características que irão variar em benefícios, de acordo com a estratégia a ser adotada por uma instituição. Existe um tipo de particionamento chamado de fragmentação ou sharding. Nesse modelo, os dados são fragmentados em partes menores, chamadas de shard ou fragmento, com todos os dados do mesmo tipo juntos.
Assinale a alternativa CORRETA que apresenta esse tipo de particionamento:
A Particionamento orbital.
B Particionamento horizontal.
C Particionamento vertical.
D Particionamento funcional.

Os frameworks de Big Data baseados em lote são caracterizados pelo armazenamento prévio da massa de dados para o processamento da demanda computacional. Por outro lado, os frameworks baseados em tempo real não realizam o armazenamento prévio dos dados, pois nesse caso existe uma fonte responsável pela geração contínua de dados para o processamento.
Sobre os frameworks de Big Data, classifique V para as sentenças verdadeiras e F para as falsas:
( ) No Hadoop, geralmente os dados de entrada e as saídas são armazenados em um sistema de arquivos.
( ) No Spark, os dados podem ser mantidos em memória para os casos de processamento iterativo.
( ) Em todos os cenários, o Hadoop tem um melhor desempenho que o Spark.
( ) O Spark e o Hadoop não podem ser integrados.
A F - F - V - V.
B V - F - V - F.
C F - V - V - F.
D V - V - F - F.

Prévia do material em texto

09/12/2023, 21:04 Avaliação II - Individual
about:blank 1/5
Prova Impressa
GABARITO | Avaliação II - Individual (Cod.:888613)
Peso da Avaliação 1,50
Prova 70670527
Qtd. de Questões 10
Acertos/Erros 10/0
Nota 10,00
O MapReduce é um modelo que foi proposto para o processamento de grandes conjuntos de 
dados, através da aplicação de tarefas independentes entre si. Programas em MapReduce são baseados 
em estilos de programação funcional, capazes de realizar processamento de grandes volumes de dados 
de forma paralela. Sobre o fluxo do MapReduce, ordene os itens a seguir:
I- Entrada.
II- Separação.
III- Mapeamento.
IV- Redução.
V- Combinação.
Assinale a alternativa CORRETA com a sequência do algoritmo MapReduce:
A I - II - III - IV - V.
B V - III - IV - I - II.
C I - II - III - V - IV.
D I - II - IV - V - III.
Big Data é um termo utilizado para descrever conjuntos de dados cuja captura, armazenamento, 
distribuição e análise requerem métodos e tecnologias avançadas devido a qualquer combinação de 
seu tamanho (volume), frequência de atualização (velocidade) e diversidade (heterogeneidade). Sobre 
o algoritmo MapReduce, classifique V para as sentenças verdadeiras e F para as falsas:
( ) MapReduce é um modelo de programação e implementação associada a esse modelo.
( ) MapReduce é implementado apenas em Java.
( ) O Spark implementa o MapReduce.
( ) O Hadoop implementa o MapReduce.
Assinale a alternativa que apresenta a sequência CORRETA:
FONTE: SILVA, Fabricio Alves Barbosa da. Big data e nuvens computacionais: aplicações em saúde 
pública e genômica. Journal of health Informatics, v. 8, n. 2, 2016.
A V - F - V - F.
B V - F - V - V.
C F - V - V - F.
 VOLTAR
A+ Alterar modo de visualização
1
2
09/12/2023, 21:04 Avaliação II - Individual
about:blank 2/5
D F - F - F - V.
A computação em nuvem é a ideia de utilizarmos, em qualquer lugar e independente de 
plataforma, os mais variados tipos de aplicações através da internet com a mesma facilidade de tê-las 
instaladas em nossos próprios computadores. Sobre o particionamento de dados em nuvem, 
classifique V para as sentenças verdadeiras e F para as falsas:
( ) O AWS Lake é um serviço que facilita a configuração de um data lake.
( ) O Azure é um serviço de armazenamento em nuvem Open Source e gratuito.
( ) O Azure pode ter redes virtuais e também pode ser conectado à rede corporativa.
( ) Amazon EMR é uma plataforma de big data que oferece suporte a 19 projetos de código aberto, 
como Apache Spark, Hive, HBase, entre outros. 
Assinale a alternativa que apresenta a sequência CORRETA:
FONTE: RUSCHEL, Henrique; ZANOTTO, Mariana Susan; MOTA, WC da. Computação em 
nuvem. Curitiba, Pontifícia Universidade Católica do Paraná, 2010.
A F - V - V - F.
B V - F - F - V.
C V - F - V - V.
D F - V - F - V.
O Spark é baseado no processamento distribuído de dados em memória, por meio de uma 
abstração chamada RDD (do inglês Resilient Distributed Dataset). Os RDDs são coleções distribuídas 
de elementos de dados imutáveis. Sobre esse tema, classifique V para as sentenças verdadeiras e F 
para as falsas:
( ) O Apache PostgreSQL é considerado um framework de Big Data.
( ) O Apache Storm é considerado um framework de Big Data.
( ) O Apache Flink é considerado um framework de Big Data. 
( ) O Apache Hadoop é considerado um framework de Big Data.
Assinale a alternativa que apresenta a sequência CORRETA:
FONTE: GUEDES, Thaylon et al. Análise Online de Dados de Proveniência e de Domínio de 
Aplicações Spark com SAMbA. In: SBBD Companion, 2018, p. 17-22.
A F - V - V - V.
B V - F - V - F.
C V - F - F - V.
D F - V - F - V.
3
4
09/12/2023, 21:04 Avaliação II - Individual
about:blank 3/5
O termo streaming é utilizado em diversos contextos em tecnologia, como serviços de streaming 
de música e vídeo, que têm como objetivo fornecer esses recursos em tempo real. No contexto de Big 
Data e dados, streaming de dados representa coleta e armazenamento em tempo real. Considerando as 
ferramentas que são frameworks de streamming de dados, classifique V para as opções verdadeiras e 
F para as falsas:
( ) MongoDB.
( ) Neo4J.
( ) Spark.
( ) PostgreSQL.
Assinale a alternativa que apresenta a sequência CORRETA:
A F - V - V - F.
B V - F - F - V.
C F - F - V - F.
D F - V - F - V.
Em seu ambiente, apesar de serem necessários apenas dois componentes para compor uma 
aplicação para se planejar um ambiente distribuído de maior eficiência, são necessários os demais 
componentes utilizando o Apache Hadoop. Assinale a alternativa CORRETA que apresenta o 
componente que é o sistema gerenciador de dados distribuídos do Hadoop, este gerencia o 
armazenamento dos dados e a distribuição:
A Hue.
B Hive.
C HDFS.
D PostgreSQL.
O HDFS é um sistema de arquivos distribuído altamente escalável e flexível, projetado para ser 
tolerante a falhas mesmo quando executa em clusters com hardware comum. Dentro do HDFS, segue-
se uma arquitetura mestre-escravo formada por dois tipos de nós: NameNode (NN) e DataNode (DN). 
Sobre a relação entre HDFS on premise e dados em nuvem, classifique V para as sentenças 
verdadeiras e F para as falsas:
( ) O HDFS on premise atua sob demanda e só é pago quando consome.
( ) Para utilizar HDFS em nuvem é preciso ter equipe de suporte e espaço físico local.
( ) O HDFS on premise está limitado à capacidade física do hardware local.
( ) O HDFS on em nuvem pode ter o hardware expandido a qualquer momento.
Assinale a alternativa que apresenta a sequência CORRETA:
A F - F - F - F.
5
6
7
09/12/2023, 21:04 Avaliação II - Individual
about:blank 4/5
B F - V - V - F.
C F - F - V - V.
D V - V - F - V.
O particionamento de dados pode acontecer de maneira horizontal, vertical ou funcional. Cada 
um dos tipos de particionamento apresenta características que irão variar em benefícios, de acordo 
com a estratégia a ser adotada por uma instituição. Existe um tipo de particionamento chamado de 
fragmentação ou sharding. Nesse modelo, os dados são fragmentados em partes menores, chamadas 
de shard ou fragmento, com todos os dados do mesmo tipo juntos. Assinale a alternativa CORRETA 
que apresenta esse tipo de particionamento:
A Particionamento vertical.
B Particionamento orbital.
C Particionamento funcional.
D Particionamento horizontal.
Big data é uma expressão relativamente nova. Com o avanço da Tecnologia da Informação e 
Comunicação (TIC), lidar com quantidades enormes de dados tem se tornado algo comum em 
empresas e instituições públicas. Sobre os 3 Vs do conceito de big data, assinale a alternativa 
CORRETA:
A Volume, velocidade, variedade.
B Volume, vaidade, variedade.
C Volume, velocidade, visibilidade.
D Veromicidade, velocidade, variedade.
Os frameworks de Big Data baseados em lote são caracterizados pelo armazenamento prévio da 
massa de dados para o processamento da demanda computacional. Por outro lado, os frameworks 
baseados em tempo real não realizam o armazenamento prévio dos dados, pois nesse caso existe uma 
fonte responsável pela geração contínua de dados para o processamento. Sobre os frameworks de Big 
Data, classifique V para as sentenças verdadeiras e F para as falsas:
( ) No Hadoop, geralmente os dados de entrada e as saídas são armazenados em um sistema de 
arquivos.
( ) No Spark, os dados podem ser mantidos em memória para os casos de processamento iterativo.
( ) Em todos os cenários, o Hadoop tem um melhor desempenho que o Spark.
( ) O Spark e o Hadoop não podem ser integrados.
Assinale a alternativa que apresenta a sequência CORRETA:
8
9
10
09/12/2023, 21:04 Avaliação II - Individual
about:blank 5/5
A F - F - V - V.
B F - V - V - F.
C V - F - V - F.
D V - V - F - F.
Imprimir

Mais conteúdos dessa disciplina