Logo Passei Direto
Buscar

Comunicação

ANHANGUERA
Uma empresa de tecnologia recebeu uma base de dados de transações financeiras de um cliente bancário para desenvolver um modelo de detecção de fraudes. O conjunto contém 100.000 registros com informações sobre valor da transação, localização, horário, tipo de estabelecimento e histórico do cliente. Durante a fase inicial de análise, a equipe de ciência de dados identificou diversas inconsistências: 15% dos registros apresentam valores ausentes na coluna 'localização', 8% têm datas inválidas ou futuras, alguns valores de transação são negativos sem justificativa, e há duplicatas aparentes baseadas em timestamp e valor idênticos. Para garantir a confiabilidade do modelo de machine learning, é fundamental aplicar critérios rigorosos de verificação de integridade, consistência e validade dos dados. A avaliação da qualidade dos dados deve preceder qualquer análise estatística ou desenvolvimento de algoritmos, pois dados de baixa qualidade comprometerão inevitavelmente os resultados finais e a confiabilidade das predições do sistema. Considerando o contexto apresentado, assinale a alternativa correta. Alternativas: a) A presença de 15% de valores ausentes na coluna 'localização' não compromete significativamente a qualidade dos dados, podendo ser ignorada durante o desenvolvimento do modelo de detecção de fraudes. b) A verificação de integridade dos dados deve incluir validação de tipos de dados, identificação de outliers estatísticos, análise de distribuições das variáveis e detecção de inconsistências lógicas entre campos relacionados. c) Duplicatas baseadas em timestamp e valor idênticos são sempre indicativas de erro de sistema e devem ser automaticamente removidas sem análise adicional do contexto de negócio. d) A validação de dados financeiros requer apenas verificação de valores positivos e formatação correta, sendo desnecessário analisar padrões temporais ou geográficos das transações. e) Critérios estatísticos de qualidade são menos importantes que critérios técnicos, uma vez que algoritmos de machine l
User badge image
Marcelo Mazan

há 2 meses

Respostas

Ainda não temos respostas

Você sabe responder essa pergunta?

Crie uma conta e ajude outras pessoas compartilhando seu conhecimento!

Ainda com dúvidas?

Envie uma pergunta e tenha sua dúvida de estudo respondida!

Mais conteúdos dessa disciplina