Prévia do material em texto
Questão 8/10 Big Data Ler em voz alta Spark Streaming oferece a capacidade de realizar transformações em janelas, 0 que permite aplicar transformações em um conjunto de RDDs para computar resultados de um intervalo maior. I Transformações de janela acumulam RDDs em intervalos de tempo maior e processa conjuntamente produzindo um resultado acumulado. II O intervalo de slide é a quantidade de tempo entre cada captura de dados, ou seja, a sua frequência. III O intervalo de batch é a quantidade de tempo entre cada aplicação das transformações à janela. Ou seja, é a frequência em que estas são aplicadas e geram resultados. IV O intervalo de janela, ou comprimento da janela, é a duração da janela. V O intervalo de batch a frequência em que OS dados são capturados do fluxo pelo DStream. Dentre essas afirmações estão INCORRETAS: Nota: 10.0 A Todas, exceto V B II, IV V C Todas D III e V E II III Você assinalou essa alternativa (E) Você acertou! Justificativa: intervalo de slide é a quantidade de tempo que define a frequência em que as transformações são aplicadas à janela e não a frequência de captura dos dados como alega INCORRETAMENTE a afirmação II. No entanto 0 intervalo de batch é a quantidade de tempo que define a frequência em que dados são capturados do fluxo pelo DStream. Ou seja, a quantidade de tempo entre cada captura de dados. Diferentemente do que diz ERRONEAMENTE a afirmação III. As demais afirmações (I, IV e V) estão