Prévia do material em texto
1. O que é Big Data? Big Data refere-se ao grande volume de dados estruturados e não estruturados que é gerado diariamente. Ele é caracterizado pelas "5Vs": volume (quantidade), variedade (tipos de dados), velocidade (processamento rápido), veracidade (confiabilidade dos dados) e valor (importância dos insights gerados). 2. Qual a diferença entre dados estruturados, não estruturados e semiestruturados? Estruturados: Dados organizados em tabelas com colunas e linhas, como em bancos de dados. Exemplo: registros financeiros. Não estruturados: Dados sem formato definido, como vídeos, imagens e postagens em redes sociais. Semiestruturados: Dados parcialmente organizados, como arquivos JSON ou XML. 3. Quais são as principais ferramentas usadas para Big Data? Armazenamento e Processamento: Hadoop, Apache Spark, e Amazon S3. Análise: Tableau, Power BI, Apache Kafka. Banco de Dados: MongoDB, Cassandra e Hive. 4. Como Big Data é usado em negócios? Big Data é usado para melhorar a tomada de decisão, identificar padrões de comportamento de clientes, otimizar processos operacionais e prever tendências. Por exemplo, varejistas usam para personalizar ofertas com base no histórico de compras. 5. O que são pipelines de dados em Big Data? Pipelines de dados são fluxos automáticos que capturam, processam, armazenam e analisam dados de várias fontes. Eles ajudam a organizar dados para uso em análises ou aplicações de IA. 6. Quais os desafios do uso de Big Data? Os principais desafios incluem: Gerenciamento de dados em larga escala. Garantia de privacidade e segurança dos dados. Necessidade de infraestrutura robusta e especialistas qualificados. 7. O que é análise preditiva em Big Data? A análise preditiva utiliza algoritmos e aprendizado de máquina para identificar padrões históricos em dados e prever futuros resultados ou comportamentos. Por exemplo, prever demanda por produtos ou risco de churn de clientes. 8. Quais são os benefícios de adotar Big Data em saúde? Monitoramento de pacientes em tempo real. Personalização de tratamentos com base em análises genéticas. Prevenção de surtos com análise epidemiológica. 9. Qual a relação entre Big Data e aprendizado de máquina? Big Data fornece os grandes volumes de dados necessários para treinar algoritmos de aprendizado de máquina. Sem dados de qualidade, os modelos de IA não alcançam precisão ou relevância nos resultados. 10. Qual é o impacto ético do Big Data? O impacto ético inclui preocupações com privacidade, uso indevido de dados, discriminação algorítmica e transparência. Empresas precisam seguir leis como a LGPD (Lei Geral de Proteção de Dados) no Brasil e o GDPR na União Europeia para garantir a ética no uso de dados.