Logo Passei Direto
Buscar
O Spark Streaming é uma extensão do Apache Spark que possibilita o processamento escalável e tolerante a falhas de fluxos contínuos de dados em tempo real. De acordo com a documentação do Apache Spark Streaming, o framework torna simples o desenvolvimento de aplicações em stream de dados de alta taxa de transferência, de forma que as aplicações sejam escaláveis e tolerantes a falhas.Considerando o Spark Streaming, analise as afirmativas a seguir:I. Os pontos de verificação são completamente diferentes dos pontos de verificação dos jogos computacionais, em que o estado do jogo é gravado para que possa ser o ponto de retomada caso o jogador falhe. II. As variáveis de transmissão podem ser utilizadas como uma forma pouco eficiente de manter um grande conjunto de dados em cada um dos nós. III. Algumas das técnicas do Spark envolvem armazenamento de dados em cache, utilização de acumuladores, variáveis de transmissão e pontos de verificação. IV. O armazenamento em cache é útil para dados que precisem ser reprocessados múltiplas vezes, o que gera ganho de desempenho para a aplicação. V. O Spark Streaming não utiliza o conceito de acumuladores para implementar contadores e operações de soma.É correto
User badge image
Bruna Antqueviezc

há 2 semanas

Respostas

User badge image

Ed Verified user icon

há 2 semanas

Vamos analisar cada afirmativa sobre o Spark Streaming: I. Os pontos de verificação são completamente diferentes dos pontos de verificação dos jogos computacionais, em que o estado do jogo é gravado para que possa ser o ponto de retomada caso o jogador falhe. Falso, os pontos de verificação no Spark Streaming têm uma função semelhante, pois servem para salvar o estado da aplicação e permitir a recuperação em caso de falhas. II. As variáveis de transmissão podem ser utilizadas como uma forma pouco eficiente de manter um grande conjunto de dados em cada um dos nós. Falso, as variáveis de transmissão são projetadas para serem uma forma eficiente de compartilhar dados grandes e imutáveis entre os nós, evitando a necessidade de enviar esses dados repetidamente. III. Algumas das técnicas do Spark envolvem armazenamento de dados em cache, utilização de acumuladores, variáveis de transmissão e pontos de verificação. Verdadeiro, essa afirmativa está correta, pois todas essas técnicas são realmente utilizadas no Spark para otimizar o processamento. IV. O armazenamento em cache é útil para dados que precisem ser reprocessados múltiplas vezes, o que gera ganho de desempenho para a aplicação. Verdadeiro, essa afirmativa está correta, pois o armazenamento em cache melhora o desempenho ao evitar o reprocessamento de dados que já foram lidos. V. O Spark Streaming não utiliza o conceito de acumuladores para implementar contadores e operações de soma. Falso, o Spark Streaming realmente utiliza acumuladores para implementar contadores e operações de soma. Com base nas análises, as afirmativas corretas são III e IV. Portanto, a alternativa que contém todos os itens verdadeiros é: não há uma alternativa correta listada.

Essa resposta te ajudou?

0
Dislike0

Ainda com dúvidas?

Envie uma pergunta e tenha sua dúvida de estudo respondida!

Mais conteúdos dessa disciplina