"O Apache Hadoop e o Apache Spark são frameworks populares no ecossistema Big Data, mas possuem abordagens diferentes para processamento de dados." Com base nesse contexto, qual das opções abaixo descreve corretamente uma diferença entre os dois frameworks? A (A) O Hadoop realiza processamento em memória, enquanto o Spark utiliza discos locais. B (B) O Spark é mais indicado para processamento em lotes, enquanto o Hadoop é otimizado para análises preditivas. C (C) O Hadoop utiliza o MapReduce, enquanto o Spark processa dados em memória, tornando-o mais rápido. D (D) Ambos realizam processamento exclusivamente em tempo real. E (E) O Spark e o Hadoop não podem ser usados juntos.

Question

"O Apache Hadoop e o Apache Spark são frameworks populares no ecossistema Big Data, mas possuem abordagens diferentes para processamento de dados."...

Ed · Answer

Vamos analisar cada uma das alternativas para identificar a diferença correta entre o Apache Hadoop e o Apache Spark:

A) O Hadoop realiza processamento em memória, enquanto o Spark utiliza discos locais.  
- Incorreto. Na verdade, o Spark realiza processamento em memória, enquanto o Hadoop, especialmente com o MapReduce, utiliza discos.

B) O Spark é mais indicado para processamento em lotes, enquanto o Hadoop é otimizado para análises preditivas.  
- Incorreto. O Spark é mais versátil e pode realizar tanto processamento em lotes quanto em tempo real, enquanto o Hadoop é mais focado em processamento em lotes.

C) O Hadoop utiliza o MapReduce, enquanto o Spark processa dados em memória, tornando-o mais rápido.  
- Correto. O Hadoop utiliza o modelo de programação MapReduce, que é mais lento devido ao uso de disco, enquanto o Spark processa dados em memória, o que o torna mais rápido.

D) Ambos realizam processamento exclusivamente em tempo real.  
- Incorreto. O Hadoop é mais voltado para processamento em lotes, enquanto o Spark pode fazer processamento em tempo real, mas não exclusivamente.

E) O Spark e o Hadoop não podem ser usados juntos.  
- Incorreto. O Spark pode ser usado em conjunto com o Hadoop, aproveitando o HDFS (Hadoop Distributed File System) para armazenamento.

Portanto, a alternativa correta é: **C) O Hadoop utiliza o MapReduce, enquanto o Spark processa dados em memória, tornando-o mais rápido.**

Bases de Dados

Respostas

Ainda com dúvidas?

Perguntas dessa disciplina

Princípio de Big Data Desafio 1 Você foi recentemente contratado por uma empresa de análise de dados como analista de Big Data. Durante uma reunião co

Analise as informações a seguir: I. Apesar de o termo NoSQL ter surgido posteriormente ao aparecimento de boa parte dos bancos de dados considerad...

Princípios de Desenvolvimento de Spark com Python Desafio 1 Você está trabalhando como analista de dados em uma empresa que decidiu adotar novas tecno

A integração de bancos de dados NoSQL com plataformas de Big Data como Hadoop e Apache Spark tem revolucionado a maneira como os dados são processa...

Conteúdos escolhidos para você

05 Frameworks de Big Data uma visão geral

Python com Spark (prova)

Frameworks - Conteudo 2

Visão sobre Apache Spark

Mais conteúdos dessa disciplina