Princípio de Big Data Desafio 1 Você foi recentemente contratado por uma empresa de análise de dados como analista de Big Data. Durante uma reunião co

Question

Princípio de Big Data Desafio 1 Você foi recentemente contratado por uma empresa de análise de dados como analista de Big Data. Durante uma reunião com a equipe de TI, o gerente explicou que a empresa está lidando com volumes massivos de dados provenientes de diversas fontes, e eles esperam que você utilize técnicas de Big Data para extrair informações valiosas. No entanto, ele enfatizou que o conceito de Big Data vai além do simples volume de dados, envolvendo desafios de processamento que os métodos tradicionais não conseguem resolver. Considerando a situação descrita, qual das seguintes afirmações melhor representa a verdadeira abrangência do conceito de Big Data? A Big Data refere-se exclusivamente ao grande volume de dados que uma empresa deve armazenar. B Big Data é definido principalmente pela capacidade de utilizar métodos estatísticos avançados para analisar grandes volumes de dados. C Big Data se refere a grandes volumes de dados que podem ser facilmente processados por métodos tradicionais de gestão da informação. D Big Data envolve grandes conjuntos de dados que exigem novas abordagens para serem adquiridos, gerenciados e processados eficientemente em tempo hábil. E Big Data se concentra na criação de sistemas para armazenar dados sem considerar o tempo de processamento. Responda Desafio 2 Você está trabalhando como arquiteto de dados em uma empresa que está migrando seus sistemas para uma solução baseada em Big Data. Durante uma reunião com a equipe de TI, foi discutido que a complexidade do Big Data requer uma arquitetura específica que difere significativamente dos sistemas tradicionais de banco de dados. Considerando a discussão mencionada, qual das seguintes afirmações descreve corretamente a arquitetura de Big Data? A A arquitetura de Big Data é baseada exclusivamente em bancos de dados relacionais para garantir a eficiência. B Em sistemas de Big Data, os dados são armazenados em bancos de dados tradicionais, garantindo simplicidade no processamento. C Data lakes são usados em Big Data para armazenar uma variedade de dados, permitindo que sejam processados e analisados de forma eficiente, mesmo em tempo real. D A arquitetura de Big Data não precisa considerar a ingestão de dados, pois todos os dados são previamente organizados. E Sistemas de Big Data não diferem em nada dos sistemas tradicionais de banco de dados, exceto pelo volume de dados. Responda Desafio 3 Como arquiteto de sistemas em uma grande organização de tecnologia, você está liderando um projeto que envolve a implementação de uma infraestrutura baseada em computação distribuída para suportar a expansão da empresa. Com base no conceito de computação distribuída, qual das seguintes alternativas reflete corretamente o funcionamento e os princípios dessa arquitetura? A A computação distribuída centraliza todos os processos em um único servidor para garantir a eficiência. B Na computação distribuída, os dados são processados exclusivamente em dispositivos locais, sem depender de uma rede. C A computação distribuída permite que todos os elementos conectados na rede trabalhem de forma descentralizada, ajustando-se ao crescimento dos dados e dispositivos. D Na computação distribuída, a rede é projetada para operar de forma linear, processando dados de maneira sequencial. E A computação distribuída depende exclusivamente de uma conexão estável à internet para funcionar corretamente. Responda Desafio 4 Como engenheiro de dados, você está desenvolvendo uma solução para uma empresa que processa grandes volumes de dados provenientes de dispositivos IoT. O projeto envolve a coleta, armazenamento e análise desses dados para identificar padrões e tomar decisões em tempo real. Qual das seguintes opções melhor descreve a abordagem ideal para gerenciar grandes volumes de dados em um projeto de Big Data que envolve IoT? A Utilizar um sistema de banco de dados relacional centralizado para armazenar todos os dados coletados. B Armazenar e processar os dados localmente em cada dispositivo IoT. C Implementar uma solução que utilize computação distribuída para coletar, processar e analisar grandes volumes de dados de forma eficiente e em tempo real. D Dependendo de soluções de armazenamento em fita magnética para manter uma cópia segura dos dados e processá-los posteriormente. E Utilizar apenas redes peer-to-peer para compartilhar dados entre dispositivos, sem um sistema de análise centralizado. Responda Desafio 5 Você está atuando como engenheiro de dados em um projeto que envolve a análise de fluxos de dados em tempo real provenientes de sensores e sistemas de monitoramento. Durante o planejamento, você percebe que esses fluxos de dados apresentam características desafiadoras, que precisam ser tratadas de maneira diferente em comparação com os dados históricos tradicionais. Considerando os desafios relacionados ao processamento de fluxos de dados em tempo real, qual das seguintes alternativas reflete corretamente esses desafios? A Os fluxos de dados em tempo real são sempre homogêneos e vêm de uma única fonte, o que facilita o processamento. B A imperfeição dos fluxos de dados refere-se à falta de variação nos formatos e fontes, tornando o processamento mais simples. C A heterogeneidade dos fluxos de dados implica na necessidade de processar dados de diferentes formatos e origens geográficas, o que aumenta a complexidade do sistema. D A imperfeição dos fluxos de dados é um problema menor, pois todos os dados chegam em ordem e de forma consistente. E Os fluxos de dados em tempo real não apresentam desafios específicos em comparação com dados históricos, exceto pelo volume.

Ed · Answer

Vamos analisar cada um dos desafios e suas alternativas para encontrar as respostas corretas.

**Desafio 1:**
A pergunta busca a definição mais abrangente de Big Data. 
- A) Refere-se exclusivamente ao grande volume de dados - Incorreto, pois Big Data envolve mais do que apenas volume.
- B) Definido principalmente pela capacidade de utilizar métodos estatísticos - Incorreto, pois não é apenas sobre métodos estatísticos.
- C) Refere-se a grandes volumes que podem ser processados por métodos tradicionais - Incorreto, pois Big Data desafia métodos tradicionais.
- D) Envolve grandes conjuntos que exigem novas abordagens - Correto, pois reflete a necessidade de novas técnicas para gerenciar Big Data.
- E) Se concentra na criação de sistemas para armazenar dados - Incorreto, pois não considera o processamento.

**Resposta correta: D**

---

**Desafio 2:**
A pergunta trata da arquitetura de Big Data.
- A) Baseada exclusivamente em bancos de dados relacionais - Incorreto, pois Big Data utiliza diversas abordagens.
- B) Dados armazenados em bancos tradicionais - Incorreto, pois isso não reflete a complexidade do Big Data.
- C) Data lakes são usados para armazenar uma variedade de dados - Correto, pois data lakes são uma característica importante da arquitetura de Big Data.
- D) Não precisa considerar a ingestão de dados - Incorreto, pois a ingestão é fundamental.
- E) Não diferem em nada dos sistemas tradicionais - Incorreto, pois há diferenças significativas.

**Resposta correta: C**

---

**Desafio 3:**
A pergunta é sobre computação distribuída.
- A) Centraliza todos os processos em um único servidor - Incorreto, pois a computação distribuída é descentralizada.
- B) Processa dados exclusivamente em dispositivos locais - Incorreto, pois depende de uma rede.
- C) Permite que todos os elementos trabalhem de forma descentralizada - Correto, pois é a essência da computação distribuída.
- D) Rede projetada para operar de forma linear - Incorreto, pois não é linear.
- E) Depende exclusivamente de uma conexão estável à internet - Incorreto, pois pode operar em redes locais.

**Resposta correta: C**

---

**Desafio 4:**
A pergunta é sobre gerenciar dados de IoT em um projeto de Big Data.
- A) Utilizar um sistema de banco de dados relacional centralizado - Incorreto, pois não é ideal para grandes volumes de dados.
- B) Armazenar e processar os dados localmente em cada dispositivo - Incorreto, pois isso não é eficiente para análise em tempo real.
- C) Implementar uma solução que utilize computação distribuída - Correto, pois é a abordagem ideal para grandes volumes de dados.
- D) Dependendo de soluções de armazenamento em fita magnética - Incorreto, pois não é prático para dados em tempo real.
- E) Utilizar apenas redes peer-to-peer - Incorreto, pois não há um sistema centralizado.

**Resposta correta: C**

---

**Desafio 5:**
A pergunta trata dos desafios do processamento de fluxos de dados em tempo real.
- A) Fluxos de dados são sempre homogêneos - Incorreto, pois geralmente são heterogêneos.
- B) A imperfeição refere-se à falta de variação - Incorreto, pois a variação é um desafio.
- C) A heterogeneidade implica na necessidade de processar dados de diferentes formatos - Correto, pois isso aumenta a complexidade.
- D) A imperfeição é um problema menor - Incorreto, pois é um desafio significativo.
- E) Fluxos de dados não apresentam desafios específicos - Incorreto, pois eles têm desafios únicos.

**Resposta correta: C**

---

Resumindo as respostas:
- Desafio 1: D
- Desafio 2: C
- Desafio 3: C
- Desafio 4: C
- Desafio 5: C

Bases de Dados

Respostas

Ainda com dúvidas?

Perguntas dessa disciplina

Uma empresa de tecnologia está em fase de crescimento e precisa implementar um sistema de gerenciamento de dados. Eles lidam com um grande volume de i

A utilização de estatística e métodos de aprendizado de máquina em aplicações de Big Data é cada vez mais comum. Um dos fatores que influencia para...

Ler em voz alta A necessidade do uso de dados em uma organização é muito antiga, porém, a queda drástica no custo das tecnologias desde os anos 1990 t

Projetos de Big Data são complexos, pois muitos aspectos devem ser considerados. Um desses aspectos corresponde ao fluxo de dados que são conhecido...

Conteúdos escolhidos para você

Avaliacao da Disciplina - big data

1

Big Data e o apoio à decisão

Apostila do Módulo 2 -Bootcamp Engenheiro(a) de Dados-1

Mais conteúdos dessa disciplina