Prévia do material em texto
Fundamentos da inteligência de negócios: gestão da informação e de banco de dados 1. Como um banco de dados relacional organiza os dados? 2. Quais são os princípios de um sistema de gestão de banco de dados? 3. Quais são as principais ferramentas e tecnologias para extrair informações de bancos de dados? 4. Qual o papel da política de informação e da gestão de dados na organização dos recursos de dados empresariais? 5. Por que a garantia da qualidade dos dados é tão importante para um negócio? Fundamentos da inteligência de negócios: gestão da informação e de banco de dados Domino’s Pizza orientada a Dados • Mais de 50% das vendas no varejo da Domino’s Pizza vêm de canais digitais. • A Domino’s Pizza tem17 terabytes de dados estruturados e não estruturados de clientes provenientes de 85 mil fontes internas e externas diferentes. • não conseguia analisar os dados para obter uma compreensão detalhada dos seus clientes e dos seus padrões de compra. • solução que fornece ferramentas de software e serviços para integração de dados, gerenciamento de dados, integração de aplicativos empresariais, qualidade de dados, armazenamento em nuvem e manipulação de Big Data para que as organizações possam gerenciar todos os seus dados corporativos em um único ambiente. • Pode avaliar os padrões de compra de cada cliente como um indivíduo, determinando qual membro da família é o comprador dominante, qual reage melhor aos cupons da Domino's Pizza e como cada um reage ao canal empregado para Conecte-se com Domino's Pizza. • A Domino’s Pizza se tornou uma empresa muito mais orientada a dados. • A experiência da Domino’s Pizza ilustra a importância da gestão de dados. – O desempenho dos negócios depende do que uma empresa pode ou não fazer com seus dados. – A Domino’s Pizza era um negócio próspero, mas tanto a eficiência operacional como a tomada de decisões de gestão eram prejudicadas por grandes quantidades de dados de clientes não integrados, provenientes de muitas fontes diferentes e difíceis de aceder e analisar • Domino’s Pizza teve de reorganizar os seus dados num formato padrão para toda a empresa; estabelecer regras, responsabilidades e procedimentos para acesso e utilização dos dados; • e fornecer ferramentas para tornar os dados acessíveis aos usuários para consulta e geração de relatórios. • O novo software de gestão de dados impulsionou a eficiência operacional e a tomada de decisões, disponibilizando dados de clientes mais abrangentes e precisos e facilitando o acesso a todos os dados comerciais de cada cliente. • Ao ajudar a Domino’s Pizza a compreender mais detalhadamente os seus próprios clientes, a solução aumentou as oportunidades de venda aos clientes, bem como a eficácia das campanhas de marketing e vendas. A abordagem de banco de dados para gestão de dados � Um banco de dados é um conjunto de arquivos relacionados entre si com registros sobre pessoas, lugares ou coisas. � Em um sistema de informação, o banco de dados organiza as informações de maneira muito parecida, agrupando dados relacionados entre si. � O banco de dados relacional é o tipo de banco mais comum atualmente. � Bancos de dados relacionais organizam os dados em tabelas bidimensionais (denominadas relações) com colunas e linhas. A abordagem de banco de dados para gestão de dados � Tabela de banco de dados relacional: A abordagem de banco de dados para gestão de dados � Tabela de banco de dados relacional: A abordagem de banco de dados para gestão de dados � Como um pedido pode englobar muitas peças de um mesmo fornecedor e uma única peça pode ser pedida muitas vezes em diferentes pedidos, isso cria uma relação muitos para muitos entre as tabelas PEÇA e PEDIDO. • Normalização •Processo de simplificar grupos complexos de dados a fim de: •minimizar elementos de dados redundantes; •minimizar relações muitos-para-muitos inadequadas; e •aumentar a estabilidade e a flexibilidade. • Regras de integridade referencial •Usadas pelos bancos de dados para garantir que os relacionamentos entre as tabelas permaneçam consistentes. •Exemplo: quando uma tabela possui uma chave estrangeira que aponta para outra tabela, você pode só conseguir incluir um registro na tabela com a chave estrangeira se houver um correspondente na tabela relacionada. A abordagem de banco de dados para gestão de dados • Tipo específico de software para criação, armazenamento, organização e acesso a dados de bancos de dados • Separa as visões lógica e física dos dados • Visão lógica: como os usuários finais veem os dados • Visão física: como os dados estão, de fato, estruturados e organizados • Exemplos de DBMS: Microsoft Access, DB2, Oracle Database, Microsoft SQL Server, MySQL Sistema de gestão de banco de dados (database management system — DBMS) Sistemas de gestão de banco de dados Banco de dados de recursos humanos com múltiplas visões Um único banco de dados de recursos humanos oferece muitas visões dos dados, conforme as necessidades de informação do usuário. Exemplificamos aqui duas visões possíveis, uma que interessa a um especialista em benefícios, e outra que interessa a um funcionário do departamento responsável pela folha de pagamentos da empresa. Sistemas de gestão de banco de dados Sistemas de gestão de banco de dados � No banco de dados relacional, três operações básicas, conforme mostrado na figura a seguir, são utilizadas para desenvolver conjuntos de dados úteis: � select, � project e � join. Sistemas de gestão de banco de dados � Os DBMS têm um recurso de definição de dados para especificar a estrutura do conteúdo do banco de dados. � A maioria dos DBMS possui uma linguagem especializada, a linguagem de manipulação de dados, usada para acrescentar, alterar, apagar e recuperar os dados do banco. � A linguagem de manipulação de dados mais usada atualmente é a linguagem estruturada de consulta ou SQL. � Normalmente, os DBMS incluem recursos para geração de relatórios. Exemplo de uma consulta SQL Vemos aqui os comandos SQL para uma consulta que selecionará fornecedores das peças 137 ou 150. Sistemas de gestão de banco de dados Bancos de dados não relacionais e bancos de dados em nuvem � Atualmente: a maioria dos dados que queremos acessar não são estruturados � Os sistemas de gestão de banco de dados não relacional são projetados para gerenciar grandes conjuntos de dados em vários computadores distribuídos e para permitir que se aumente ou reduza facilmente o número de máquinas e o volume de dados. � Eles são úteis para acelerar consultas simples a grandes volumes de dados estruturados e não estruturados, incluindo dados da Web, de mídias sociais, gráficos e outras formas difíceis de analisar com ferramentas tradicionais baseadas em SQL. � O banco de dados NoSQL é capaz de receber informações estruturadas, semiestruturadas e não estruturadas. � Ex: Oracle NoSQL Database, Amazon’s SimpleDB, MongoDB, etc Bancos de dados não relacionais e bancos de dados em nuvem � Além dos serviços de gestão de dados baseados em nuvem pública, as empresas têm agora a opção de usar bancos de dados em nuvens privadas. � Ferramentas de gestão de carga de trabalho asseguram a disponibilidade dos recursos suficientes para atender as necessidades da aplicação, mesmo quando há alterações na carga de trabalho. � A plataforma de hardware e software compartilhada reduz o número de servidores, DBMS e dispositivos de armazenamento necessários para esses projetos. Bancos de dados não relacionais e bancos de dados em nuvem • O Amazon Relational Database Service (Amazon RDS) oferece MySQL, Microsoft SQL Server, Oracle Database, PostgreSQL, MariaDB ou Amazon Aurora como mecanismos de banco de dados. – O preço é baseado no uso. • A Oracle tem seus próprios serviços de banco de dados em nuvem usando seu banco de dados Oracle relacional • O banco de dados SQL do Microsoft Azure é umserviço de banco de dados relacional baseado em nuvem baseado no Microsoft SQL Server DBMS. • Os serviços de gerenciamento de dados baseados em nuvem têm apelo especial para startups focadas na web ou pequenas e médias empresas que buscam recursos de banco de dados a um custo menor do que produtos de banco de dados internos. Case: banco de dados em nuvem ajudam a Vodafone Fiji a tomar melhores decisões • A Vodafone Fiji Limited é uma provedora de serviços de telecomunicações sem fio de propriedade 100%. • trabalha em estreita colaboração com o Grupo inglês Vodafone • Os clientes pré-pagos representam 96% do mercado de comunicações móveis de Fiji. • Os clientes pré-pagos não estão vinculados a contratos de serviços móveis e, portanto, estão sempre à procura de melhores formas de poupar. • A empresa não tinha capacidade de computação, armazenamento e ferramentas de gerenciamento de dados para analisar dados rapidamente e tomar decisões sobre quais negócios oferecer a quais clientes e os momentos certos para fazê-lo. • Os dados eram armazenados localmente em vários bancos de dados. • Oracle Autonomous Data Warehouse e Oracle Analytics Cloud como uma solução muito mais adequada e econômica. • A Vodafone Fiji é capaz de extrair, mover e transformar dados de fontes distintas na nuvem, onde podem ser analisados muito mais rapidamente. • não precisaria contratar pessoas com habilidades especializadas em gerenciamento de banco de dados Outros tipos de BD e Plataformas para armazenamento • Banco de Dados Distribuído • Blockchain • Plataformas analíticas: – usando tecnologia relacional e não relacional otimizada para analisar grandes conjuntos de dados. – especificamente para processamento de consultas e análises. – As plataformas analíticas também incluem sistemas in-memory e sistemas de gerenciamento de banco de dados não relacionais NoSQL e agora estão disponíveis como serviços em nuvem. • Haddop – uma estrutura de software de código aberto gerenciada pela Apache que permite o processamento paralelo distribuído de grandes quantidades de dados em computadores baratos. – divide um problema de big data em subproblemas, distribui-os entre milhares de nós de processamento de computador e depois combina o resultado em um conjunto de dados menor que é mais fácil de analisar. – Você provavelmente já usou o Hadoop para encontrar a melhor passagem aérea na Internet, obter instruções para chegar a um restaurante, fazer uma pesquisa no Google ou conectar-se com um amigo no Facebook. Como usar bancos de dados para melhorar o desempenho e a tomada de decisão na empresa � Utilizamos, atualmente, o termo big data para descrever esses conjuntos de dados com volumes tão imensos a ponto de estarem além da capacidade que um DBMS típico tem para capturar, armazenar e analisar. � Uma infraestrutura contemporânea para inteligência empresarial consiste em um conjunto de ferramentas para a obtenção de informações úteis. � Esses recursos incluem data warehouses (armazéns de dados) e data marts, data lakes, Hadoop, computação em memória e plataformas analíticas. Armazéns de dados • Armazém de dados (data warehouse): • Banco de dados que armazena dados correntes e históricos de potencial interesse para os tomadores de decisão de toda a empresa. • Consolida e padroniza as informações oriundas de diferentes bancos de dados operacionais e de transações. • Os dados podem ser acessados, mas não podem ser alterados. • Repositório de dados (data mart): • Subconjunto de um armazém de dados altamente focalizado dos dados da organização é colocado em um banco separado destinado a uma população específica de usuários. Como usar bancos de dados para melhorar o desempenho e a tomada de decisão na empresa Componentes de um data warehouse Dados correntes e históricos são extraídos de sistemas operacionais internos à organização. Esses dados são combinados com dados de fontes externas e reorganizados em um banco central projetado para análise gerencial e produção de relatórios. O diretório de informações fornece aos usuários informações sobre os dados disponíveis no data warehouse. Como usar bancos de dados para melhorar o desempenho e a tomada de decisão na empresa Como usar bancos de dados para melhorar o desempenho e a tomada de decisão na empresa � Infraestrutura contemporânea de inteligência empresarial: • Inteligência empresarial: ferramentas que consolidam, analisam e acessam vastas quantidades de dados para ajudar os usuários a decidir melhores escolhas empresariais. • Softwares para consulta e relatórios de bancos de dados • Ferramentas para análise multidimensional de dados • Mineração de dados Inteligência empresarial, análise multidimensional de dados e mineração de dados Como usar bancos de dados para melhorar o desempenho e a tomada de decisão na empresa Uma série de ferramentas analíticas trabalha com os dados armazenados nos bancos de dados, encontrando padrões e insights que ajudam gerentes e funcionários a tomar melhores decisões e, assim, aprimorar o desempenho organizacional. Inteligência empresarial Como usar bancos de dados para melhorar o desempenho e a tomada de decisão na empresa • Permite a análise multidimensional de dados, de forma que os usuários vejam os mesmos dados de diferentes maneiras, pois usa múltiplas dimensões • Cada aspecto da informação — produto, preço, custo, região ou período de tempo — representa uma dimensão diferente. • Exemplo: comparação das vendas da região leste em junho com as vendas de maio e junho do ano anterior. • Permite que os usuários obtenham respostas on-line sobre questões específicas em velocidade razoável Processamento analítico on-line (on-line-analytical processing — OLAP) Como usar bancos de dados para melhorar o desempenho e a tomada de decisão na empresa A visão mostrada é produto x região. Girando o cubo 90 graus, a face que aparecer mostrará produto x vendas projetadas e reais. Girando novamente o cubo 90 graus, pode-se ver região x vendas reais e projetadas. Outras visões também são possíveis. Modelo multidimensional de dados Como usar bancos de dados para melhorar o desempenho e a tomada de decisão na empresa • Descobre padrões e relacionamentos ocultos em grandes bancos de dados e infere regras a partir deles para prever comportamentos futuros. • Tipos de informações obtidas a partir de mineração de dados: • Associações: ocorrências ligadas a um único evento. • Sequências: eventos estão ligados ao longo do tempo. • Classificações: padrões que descrevem o grupo ao qual o item pertence. • Aglomerações: semelhante à classificação quando ainda não foram definidos grupos. • Prognósticos: partem de uma série de valores existentes para prever quais serão os outros valores. Mineração de dados Como usar bancos de dados para melhorar o desempenho e a tomada de decisão na empresa • É comum usar mineração de dados para analisar detalhadamente padrões em dados sobre consumidores e, a partir disso, montar campanhas de marketing um-a-um ou identificar clientes lucrativos. • Análise preditiva: • Usa técnicas de mineração de dados, dados históricos e suposições sobre condições futuras para predizer resultados de eventos, tais como a probabilidade de um cliente responder a uma oferta ou comprar um produto específico. • Mineração de dados versus questões de privacidade • Usado para criar uma imagem de dados detalhada para cada indivíduo. Mineração de dados Como usar bancos de dados para melhorar o desempenho e a tomada de decisão na empresa • Mineração de texto (text mining) • Dados não estruturados, em sua maioria na forma de arquivos de texto, representam mais de 80% das informações úteis de uma empresa. • A mineração de texto permite que as empresas extraiam elementos-chave de grandes conjuntos de dados não estruturados,descubram padrões e relacionamentos e resumam informações. • Mineração na Web (web mining) • Descoberta e análise de padrões e informações úteis na World Wide Web. • Mineração de conteúdo, de estrutura e de uso. Como usar bancos de dados para melhorar o desempenho e a tomada de decisão na empresa Bancos de dados e a Web � Muitas empresas estão usando a Web para disponibilizar algumas informações de seus bancos de dados internos a clientes e parceiros de negócios. � Como muitos bancos de dados back-end não conseguem interpretar comandos escritos em HTML, o servidor Web repassaria essas solicitações para o software que traduz comandos HTML em SQL, de maneira que elas pudessem ser processadas pelo DBMS que trabalha com o banco de dados. Gestão dos recursos de dados � Uma política de informação especifica as regras para compartilhar, disseminar, adquirir, padronizar, classificar e inventariar a informação. � A administração de dados é responsável pelas políticas e procedimentos específicos pelos quais as informações podem ser gerenciadas como recurso organizacional. � As funções que o grupo desempenha são chamadas de gestão de banco de dados. � O data cleansing consiste em atividades para detectar e corrigir, dentro do banco de dados, informações incorretas, incompletas, formatadas inadequadamente ou redundantes. Futuro da Gerência de Dados • Uso de algoritmos inteligentes. – autoML – Algoritmos de inferência • Bases Inteligentes – Ontologias • Integração de informação heterogêneas • Tudo é baseado em dados.....não se iludam Resumo 1. Como um banco de dados relacional organiza os dados? 2. Quais os princípios de um sistema de gestão de banco de dados? 3. Quais as principais ferramentas e tecnologias para extrair informações de bancos de dados e, assim, melhorar o desempenho da empresa e a tomada de decisão? 4. Qual o papel da política de informação e da gestão de dados na gestão dos recursos de dados organizacionais? 5. Por que é importante para a empresa garantir a qualidade dos dados?