Logo Passei Direto
Buscar
"O Apache Hadoop e o Apache Spark são frameworks populares no ecossistema Big Data, mas possuem abordagens diferentes para processamento de dados." Com base nesse contexto, qual das opções abaixo descreve corretamente uma diferença entre os dois frameworks? A (A) O Hadoop realiza processamento em memória, enquanto o Spark utiliza discos locais. B (B) O Spark é mais indicado para processamento em lotes, enquanto o Hadoop é otimizado para análises preditivas. C (C) O Hadoop utiliza o MapReduce, enquanto o Spark processa dados em memória, tornando-o mais rápido. D (D) Ambos realizam processamento exclusivamente em tempo real. E (E) O Spark e o Hadoop não podem ser usados juntos.
User badge image
kaila macedo

há 2 meses

Respostas

User badge image

Ed Verified user icon

há 2 meses

Vamos analisar cada uma das alternativas para identificar a diferença correta entre o Apache Hadoop e o Apache Spark: A) O Hadoop realiza processamento em memória, enquanto o Spark utiliza discos locais. - Incorreto. Na verdade, o Spark realiza processamento em memória, enquanto o Hadoop, especialmente com o MapReduce, utiliza discos. B) O Spark é mais indicado para processamento em lotes, enquanto o Hadoop é otimizado para análises preditivas. - Incorreto. O Spark é mais versátil e pode realizar tanto processamento em lotes quanto em tempo real, enquanto o Hadoop é mais focado em processamento em lotes. C) O Hadoop utiliza o MapReduce, enquanto o Spark processa dados em memória, tornando-o mais rápido. - Correto. O Hadoop utiliza o modelo de programação MapReduce, que é mais lento devido ao uso de disco, enquanto o Spark processa dados em memória, o que o torna mais rápido. D) Ambos realizam processamento exclusivamente em tempo real. - Incorreto. O Hadoop é mais voltado para processamento em lotes, enquanto o Spark pode fazer processamento em tempo real, mas não exclusivamente. E) O Spark e o Hadoop não podem ser usados juntos. - Incorreto. O Spark pode ser usado em conjunto com o Hadoop, aproveitando o HDFS (Hadoop Distributed File System) para armazenamento. Portanto, a alternativa correta é: C) O Hadoop utiliza o MapReduce, enquanto o Spark processa dados em memória, tornando-o mais rápido.

Essa resposta te ajudou?

0
Dislike0

Ainda com dúvidas?

Envie uma pergunta e tenha sua dúvida de estudo respondida!

Mais conteúdos dessa disciplina