JAQUELINE REIS LIRA RU: 4522234 Disciplina(s): Data de início: Big Data Prazo máximo entrega: 0:15:11 Questão 8/10 - Big Data O Spark e projetado ao redor de um conceito central: o Resilient Distributed Dataset (RDD) RDDs são conjuntos de dados distribuídos e resilientes, ou seja, consistem em uma paralelos. Sobre os RDDs e 0 SparkContext avalie as seguintes afirmações: I -

Question

JAQUELINE REIS LIRA RU: 4522234 Disciplina(s): Data de início: Big Data Prazo máximo entrega: 0:15:11 Questão 8/10 - Big Data O Spark e projetado a...

Ed · Answer

Vamos analisar cada uma das afirmações sobre RDDs e SparkContext:

I - Todo RDD é criado a partir da paralelização de uma coleção de dados existente no Driver Program. Verdadeiro, RDDs podem ser criados a partir de dados existentes no Driver Program.

II - RDDs de nós falhos podem ser recuperados automaticamente. Verdadeiro, uma das características dos RDDs é que eles são resilientes e podem ser recuperados em caso de falhas.

III - RDDs podem ser criados por um SparkContext no Driver Program através da aplicação do método paralelize sobre um conjunto de dados. Verdadeiro, o método `parallelize` é utilizado para criar RDDs a partir de coleções existentes.

IV - RDDs podem ser executados em paralelo. A quantidade de partições de um RDD que serão criadas pode ser configurada automaticamente pelo Spark ou através da configuração. Verdadeiro, RDDs são projetados para serem executados em paralelo e a quantidade de partições pode ser configurada.

V - A variável de broadcast é utilizada para armazenar um valor em memória por todos os nós do cluster e é o único tipo de variável compartilhada do Spark. Falso, embora a variável de broadcast armazene valores em memória para todos os nós, não é o único tipo de variável compartilhada no Spark (existe também a variável Accumulator).

Agora, vamos ver quais afirmações estão corretas:
- I, II, III e IV estão corretas.
- V está incorreta.

Portanto, a alternativa correta que contém todas as afirmações verdadeiras é: **B) I, II, III e IV.**

Bases de Dados

Respostas

Crie sua conta grátis para liberar essa resposta. 🤩

Ainda com dúvidas?

Perguntas dessa disciplina

Ler em voz alta Em relação à seguinte afirmação: “O crescente volume de dados gerados a todo o momento indica com relativa clareza que este é, justame

Analise as informações a seguir: I. Apesar de o termo NoSQL ter surgido posteriormente ao aparecimento de boa parte dos bancos de dados considerad...

Quest��o 8/10 - Big Data Ler em voz alta Leia com atenção o texto a seguir, que trata da variedade dos dados encontrados na rede, um dos dez “Vs” do Bi

Questão 7/10 - Big Data Ler em voz alta Leia atentamente o texto abaixo: Os bancos de dados em geral não contêm todas as informações possíveis sobre a

Conteúdos escolhidos para você

Questões 2 Big Data

Operações no HDFS e Big Data

Modelos de Bancos de Dados NoSQL

Bancos de Dados NoSQL

Mais conteúdos dessa disciplina