Prévia do material em texto
1 Bootcamp: Desenvolvedor(a) R e Python Desafio Módulo 2: Bibliotecas para análise de Dados Objetivos de Ensino Exercitar os seguintes conceitos trabalhados no Módulo: 1. Coleta de dados. 2. Analisar e realizar tratamento de dados. 3. Analisar resultados obtidos. 4. Conhecimento teórico ministrado nas videoaulas. Enunciado A análise de dados desempenha um papel fundamental no contexto das organizações, permitindo a extração de insights valiosos que podem orientar a tomada de decisões informadas. Neste cenário, apresentamos um conjunto de dados que simulam informações demográficas e características de clientes. Sua tarefa é conduzir uma análise detalhada desses dados, identificando tendências, padrões e informações relevantes que possam beneficiar a organização. Use técnicas estatísticas e de visualização de dados para explorar o conjunto de dados, respondendo às perguntas apresentadas anteriormente e descobrindo outros insights por conta própria. O conhecimento adquirido por meio da análise desses dados pode influenciar estratégias de negócios, marketing, atendimento ao cliente e muito mais. Lembre-se de que a análise de dados é uma ferramenta poderosa para auxiliar as organizações a tomar decisões embasadas em dados, resultando em 2 melhorias significativas e vantagens competitivas. Portanto, aproveite ao máximo essa oportunidade para explorar e analisar os dados fornecidos. ATENÇÃO PARA TRATAMENTO DE DADOS Avaliem se será necessário realizar tratamento de dados ausentes no datasets disponibilizado. Instruções para correção de dados ausentes 1. Utilize a estratégia de eliminação de dados. Atividades Para esta atividade, os alunos deverão realizar análise de dados utilizando as bibliotecas abordadas no curso. 1. Criar uma virtualenv e instalar as bibliotecas necessárias. 2. Coletar os dados dos arquivos: a. clientes_caracteristicas_fisicas.csv b. clientes_informacoes_demograficas.csv 3. Analisar os dados coletados. 4. Avaliar a necessidade de tratamentos de dados ausentes. 5. Manipular e visualizar os resultados. 6. Responder às questões teóricas e práticas do trabalho. 3 Dicas do professor: 1. Analise com cuidado os dados. 2. Antes de enviar as respostas, verifique se o gabarito está correto. 3. Corrija e limpe os dados antes responder às questões. 4. Elimine os dados duplicados (se houver). 5. Utilize as funções das bibliotecas abordas nas videoaulas. 6. Atenção no momento de filtrar e corrigir dados (se necessário). 7. Tenha atenção no que pede cada questão. 8. Os dados disponibilizados no dataset são fictícios. Ou seja, não têm relação com o mundo real. 9. Siga fielmente todos os passos contidos no enunciado das questões. a. Não utilize outras estratégias, pois poderá impactar nas respostas da atividade. 10. O dataset utilizado no trabalho pode ser obtido no link: https://github.com/ProfLeandroLessa/classroom- datasets/tree/master/ANC/BTC%203/Desafio https://github.com/ProfLeandroLessa/classroom-datasets/tree/master/ANC/BTC%203/Desafio https://github.com/ProfLeandroLessa/classroom-datasets/tree/master/ANC/BTC%203/Desafio