O Spark Streaming é uma extensão do Apache Spark que possibilita o processamento escalável e tolerante a falhas de fluxos contínuos de dados em tempo real. De acordo com a documentação do Apache Spark Streaming, o framework torna simples o desenvolvimento de aplicações em stream de dados de alta taxa de transferência, de forma que as aplicações sejam escaláveis e tolerantes a falhas.Considerando o Spark Streaming, analise as afirmativas a seguir:I. Os pontos de verificação são completamente diferentes dos pontos de verificação dos jogos computacionais, em que o estado do jogo é gravado para que possa ser o ponto de retomada caso o jogador falhe. II. As variáveis de transmissão podem ser utilizadas como uma forma pouco eficiente de manter um grande conjunto de dados em cada um dos nós. III. Algumas das técnicas do Spark envolvem armazenamento de dados em cache, utilização de acumuladores, variáveis de transmissão e pontos de verificação. IV. O armazenamento em cache é útil para dados que precisem ser reprocessados múltiplas vezes, o que gera ganho de desempenho para a aplicação. V. O Spark Streaming não utiliza o conceito de acumuladores para implementar contadores e operações de soma.É correto

Question

O Spark Streaming é uma extensão do Apache Spark que possibilita o processamento escalável e tolerante a falhas de fluxos contínuos de dados em tem...

Ed · Answer

Vamos analisar cada afirmativa sobre o Spark Streaming:

I. Os pontos de verificação são completamente diferentes dos pontos de verificação dos jogos computacionais, em que o estado do jogo é gravado para que possa ser o ponto de retomada caso o jogador falhe. Falso, os pontos de verificação no Spark Streaming têm uma função semelhante, pois servem para salvar o estado da aplicação e permitir a recuperação em caso de falhas.

II. As variáveis de transmissão podem ser utilizadas como uma forma pouco eficiente de manter um grande conjunto de dados em cada um dos nós. Falso, as variáveis de transmissão são projetadas para serem uma forma eficiente de compartilhar dados grandes e imutáveis entre os nós, evitando a necessidade de enviar esses dados repetidamente.

III. Algumas das técnicas do Spark envolvem armazenamento de dados em cache, utilização de acumuladores, variáveis de transmissão e pontos de verificação. Verdadeiro, essa afirmativa está correta, pois todas essas técnicas são realmente utilizadas no Spark para otimizar o processamento.

IV. O armazenamento em cache é útil para dados que precisem ser reprocessados múltiplas vezes, o que gera ganho de desempenho para a aplicação. Verdadeiro, essa afirmativa está correta, pois o armazenamento em cache melhora o desempenho ao evitar o reprocessamento de dados que já foram lidos.

V. O Spark Streaming não utiliza o conceito de acumuladores para implementar contadores e operações de soma. Falso, o Spark Streaming realmente utiliza acumuladores para implementar contadores e operações de soma.

Com base nas análises, as afirmativas corretas são III e IV. Portanto, a alternativa que contém todos os itens verdadeiros é: **não há uma alternativa correta listada**.

Bases de Dados

Respostas

Ainda com dúvidas?

Perguntas dessa disciplina

arlos é gerente de TI de uma empresa que desenvolve soluções de Internet das Coisas (IoT) para a automação industrial. Recentemente, a empresa impl...

Princípio de Big Data Desafio 1 Você foi recentemente contratado por uma empresa de análise de dados como analista de Big Data. Durante uma reunião co

A utilização de estatística e métodos de aprendizado de máquina em aplicações de Big Data é cada vez mais comum. Um dos fatores que influencia para...

Analise as informações a seguir: I. Apesar de o termo NoSQL ter surgido posteriormente ao aparecimento de boa parte dos bancos de dados considerad...

Conteúdos escolhidos para você

Avaliação da Disciplina

Avaliação da Disciplina

Aula 5 - Spark

Avaliação da Disciplina Arquitetura de Coleta e Armazenamento de Dados Hadoop e Spark

Mais conteúdos dessa disciplina