Logo Passei Direto
Buscar
Material
páginas com resultados encontrados.
páginas com resultados encontrados.

Prévia do material em texto

1. O que é Big Data? 
Big Data refere-se ao grande volume de dados estruturados e não estruturados que é 
gerado diariamente. Ele é caracterizado pelas "5Vs": volume (quantidade), variedade 
(tipos de dados), velocidade (processamento rápido), veracidade (confiabilidade dos 
dados) e valor (importância dos insights gerados). 
 
2. Qual a diferença entre dados estruturados, não estruturados e 
semiestruturados? 
 Estruturados: Dados organizados em tabelas com colunas e linhas, como em 
bancos de dados. Exemplo: registros financeiros. 
 Não estruturados: Dados sem formato definido, como vídeos, imagens e 
postagens em redes sociais. 
 Semiestruturados: Dados parcialmente organizados, como arquivos JSON ou 
XML. 
 
3. Quais são as principais ferramentas usadas para Big Data? 
 Armazenamento e Processamento: Hadoop, Apache Spark, e Amazon S3. 
 Análise: Tableau, Power BI, Apache Kafka. 
 Banco de Dados: MongoDB, Cassandra e Hive. 
 
4. Como Big Data é usado em negócios? 
Big Data é usado para melhorar a tomada de decisão, identificar padrões de 
comportamento de clientes, otimizar processos operacionais e prever tendências. Por 
exemplo, varejistas usam para personalizar ofertas com base no histórico de compras. 
 
5. O que são pipelines de dados em Big Data? 
Pipelines de dados são fluxos automáticos que capturam, processam, armazenam e 
analisam dados de várias fontes. Eles ajudam a organizar dados para uso em análises ou 
aplicações de IA. 
 
6. Quais os desafios do uso de Big Data? 
Os principais desafios incluem: 
 Gerenciamento de dados em larga escala. 
 Garantia de privacidade e segurança dos dados. 
 Necessidade de infraestrutura robusta e especialistas qualificados. 
 
7. O que é análise preditiva em Big Data? 
A análise preditiva utiliza algoritmos e aprendizado de máquina para identificar padrões 
históricos em dados e prever futuros resultados ou comportamentos. Por exemplo, 
prever demanda por produtos ou risco de churn de clientes. 
 
8. Quais são os benefícios de adotar Big Data em saúde? 
 Monitoramento de pacientes em tempo real. 
 Personalização de tratamentos com base em análises genéticas. 
 Prevenção de surtos com análise epidemiológica. 
 
9. Qual a relação entre Big Data e aprendizado de máquina? 
Big Data fornece os grandes volumes de dados necessários para treinar algoritmos de 
aprendizado de máquina. Sem dados de qualidade, os modelos de IA não alcançam 
precisão ou relevância nos resultados. 
 
10. Qual é o impacto ético do Big Data? 
O impacto ético inclui preocupações com privacidade, uso indevido de dados, 
discriminação algorítmica e transparência. Empresas precisam seguir leis como a LGPD 
(Lei Geral de Proteção de Dados) no Brasil e o GDPR na União Europeia para garantir a 
ética no uso de dados.

Mais conteúdos dessa disciplina