Logo Passei Direto
Buscar
Material
páginas com resultados encontrados.
páginas com resultados encontrados.

Prévia do material em texto

Fundamentos da
inteligência de negócios:
gestão da informação e
de banco de dados
1. Como um banco de dados relacional organiza os dados?
2. Quais são os princípios de um sistema de gestão de banco de 
dados?
3. Quais são as principais ferramentas e tecnologias para extrair 
informações de bancos de dados?
4. Qual o papel da política de informação e da gestão de dados na 
organização dos recursos de dados empresariais?
5. Por que a garantia da qualidade dos dados é tão importante para 
um negócio?
Fundamentos da inteligência de 
negócios: gestão da informação e
de banco de dados
Domino’s Pizza orientada a Dados
• Mais de 50% das vendas no varejo da Domino’s Pizza vêm de canais digitais. 
• A Domino’s Pizza tem17 terabytes de dados estruturados e não estruturados 
de clientes provenientes de 85 mil fontes internas e externas diferentes. 
• não conseguia analisar os dados para obter uma compreensão detalhada dos 
seus clientes e dos seus padrões de compra. 
• solução que fornece ferramentas de software e serviços para integração de 
dados, gerenciamento de dados, integração de aplicativos empresariais, 
qualidade de dados, armazenamento em nuvem e manipulação de Big Data 
para que as organizações possam gerenciar todos os seus dados corporativos 
em um único ambiente. 
• Pode avaliar os padrões de compra de cada cliente como um indivíduo, 
determinando qual membro da família é o comprador dominante, qual reage 
melhor aos cupons da Domino's Pizza e como cada um reage ao canal 
empregado para Conecte-se com Domino's Pizza.
• A Domino’s Pizza se tornou uma empresa muito mais orientada a dados.
• A experiência da Domino’s Pizza ilustra a importância da gestão de 
dados. 
– O desempenho dos negócios depende do que uma empresa pode ou não 
fazer com seus dados.
– A Domino’s Pizza era um negócio próspero, mas tanto a eficiência 
operacional como a tomada de decisões de gestão eram prejudicadas por 
grandes quantidades de dados de clientes não integrados, provenientes de 
muitas fontes diferentes e difíceis de aceder e analisar
• Domino’s Pizza teve de reorganizar os seus dados num formato padrão para toda a empresa; 
estabelecer regras, responsabilidades e procedimentos para acesso e utilização dos dados; 
• e fornecer ferramentas para tornar os dados acessíveis aos usuários para consulta e geração de 
relatórios.
• O novo software de gestão de dados impulsionou a eficiência operacional e a tomada de decisões, 
disponibilizando dados de clientes mais abrangentes e precisos e facilitando o acesso a todos os 
dados comerciais de cada cliente. 
• Ao ajudar a Domino’s Pizza a compreender mais detalhadamente os seus próprios clientes, a 
solução aumentou as oportunidades de venda aos clientes, bem como a eficácia das campanhas de 
marketing e vendas.
A abordagem de banco de dados 
para gestão de dados
� Um banco de dados é um conjunto de arquivos relacionados entre 
si com registros sobre pessoas, lugares ou coisas.
� Em um sistema de informação, o banco de dados organiza as 
informações de maneira muito parecida, agrupando dados 
relacionados entre si. 
� O banco de dados relacional é o tipo de banco mais comum 
atualmente.
� Bancos de dados relacionais organizam os dados em tabelas 
bidimensionais (denominadas relações) com colunas e linhas.
A abordagem de banco de dados 
para gestão de dados
� Tabela de banco de dados relacional:
A abordagem de banco de dados 
para gestão de dados
� Tabela de banco de dados relacional:
A abordagem de banco de dados 
para gestão de dados
� Como um pedido pode englobar muitas peças de um mesmo 
fornecedor e uma única peça pode ser pedida muitas vezes em 
diferentes pedidos, isso cria uma relação muitos para muitos entre 
as tabelas PEÇA e PEDIDO.
• Normalização
•Processo de simplificar grupos complexos de dados a fim de: 
•minimizar elementos de dados redundantes; 
•minimizar relações muitos-para-muitos inadequadas; e
•aumentar a estabilidade e a flexibilidade.
• Regras de integridade referencial
•Usadas pelos bancos de dados para garantir que os 
relacionamentos entre as tabelas permaneçam consistentes. 
•Exemplo: quando uma tabela possui uma chave estrangeira que 
aponta para outra tabela, você pode só conseguir incluir um 
registro na tabela com a chave estrangeira se houver um 
correspondente na tabela relacionada.
A abordagem de banco 
de dados para gestão de dados
• Tipo específico de software para criação, armazenamento, 
organização e acesso a dados de bancos de dados
• Separa as visões lógica e física dos dados
• Visão lógica: como os usuários finais veem os dados
• Visão física: como os dados estão, de fato, estruturados e organizados
• Exemplos de DBMS: Microsoft Access, DB2, Oracle Database, Microsoft 
SQL Server, MySQL
Sistema de gestão de banco de dados 
(database management system — DBMS)
Sistemas de gestão
de banco de dados
Banco de dados de recursos humanos com múltiplas visões
Um único banco de dados de recursos humanos oferece muitas visões dos dados, conforme 
as necessidades de informação do usuário. Exemplificamos aqui duas visões possíveis, uma 
que interessa a um especialista em benefícios, e outra que interessa a um funcionário do 
departamento responsável pela folha de pagamentos da empresa.
Sistemas de gestão
de banco de dados
Sistemas de gestão de banco de 
dados
� No banco de dados relacional, três operações básicas, conforme 
mostrado na figura a seguir, são utilizadas para desenvolver 
conjuntos de dados úteis: 
� select, 
� project e 
� join.
Sistemas de gestão de banco de 
dados
� Os DBMS têm um recurso de definição de dados para especificar a 
estrutura do conteúdo do banco de dados.
� A maioria dos DBMS possui uma linguagem especializada, a 
linguagem de manipulação de dados, usada para acrescentar, 
alterar, apagar e recuperar os dados do banco.
� A linguagem de manipulação de dados mais usada atualmente é a 
linguagem estruturada de consulta ou SQL.
� Normalmente, os DBMS incluem recursos para geração de 
relatórios.
Exemplo de uma consulta SQL
Vemos aqui os comandos SQL para uma consulta que selecionará 
fornecedores das peças 137 ou 150.
Sistemas de gestão
de banco de dados
Bancos de dados não relacionais e 
bancos de dados em nuvem
� Atualmente: a maioria dos dados que queremos acessar não são 
estruturados
� Os sistemas de gestão de banco de dados não relacional são 
projetados para gerenciar grandes conjuntos de dados em vários 
computadores distribuídos e para permitir que se aumente ou 
reduza facilmente o número de máquinas e o volume de dados. 
� Eles são úteis para acelerar consultas simples a grandes volumes 
de dados estruturados e não estruturados, incluindo dados da 
Web, de mídias sociais, gráficos e outras formas difíceis de analisar 
com ferramentas tradicionais baseadas em SQL.
� O banco de dados NoSQL é capaz de receber informações 
estruturadas, semiestruturadas e não estruturadas.
� Ex: Oracle NoSQL Database, Amazon’s SimpleDB, MongoDB, etc
Bancos de dados não relacionais e 
bancos de dados em nuvem
� Além dos serviços de gestão de dados baseados em nuvem 
pública, as empresas têm agora a opção de usar bancos de dados 
em nuvens privadas.
� Ferramentas de gestão de carga de trabalho asseguram a 
disponibilidade dos recursos suficientes para atender as 
necessidades da aplicação, mesmo quando há alterações na carga 
de trabalho. 
� A plataforma de hardware e software compartilhada reduz o 
número de servidores, DBMS e dispositivos de armazenamento 
necessários para esses projetos.
Bancos de dados não relacionais e 
bancos de dados em nuvem
• O Amazon Relational Database 
Service (Amazon RDS) oferece 
MySQL, Microsoft SQL Server, 
Oracle Database, PostgreSQL, 
MariaDB ou Amazon Aurora como 
mecanismos de banco de dados.
– O preço é baseado no uso.
• A Oracle tem seus próprios 
serviços de banco de dados em 
nuvem usando seu banco de 
dados Oracle relacional
• O banco de dados SQL do 
Microsoft Azure é umserviço de 
banco de dados relacional 
baseado em nuvem baseado no 
Microsoft SQL Server DBMS. 
• Os serviços de gerenciamento de 
dados baseados em nuvem têm 
apelo especial para startups 
focadas na web ou pequenas e 
médias empresas que buscam 
recursos de banco de dados a um 
custo menor do que produtos de 
banco de dados internos.
Case: banco de dados em nuvem ajudam a 
Vodafone Fiji a tomar melhores decisões
• A Vodafone Fiji Limited é uma 
provedora de serviços de 
telecomunicações sem fio de 
propriedade 100%.
• trabalha em estreita colaboração com 
o Grupo inglês Vodafone
• Os clientes pré-pagos representam 
96% do mercado de comunicações 
móveis de Fiji. 
• Os clientes pré-pagos não estão 
vinculados a contratos de serviços 
móveis e, portanto, estão sempre à 
procura de melhores formas de 
poupar. 
• A empresa não tinha capacidade de 
computação, armazenamento e 
ferramentas de gerenciamento de dados 
para analisar dados rapidamente e tomar 
decisões sobre quais negócios oferecer a 
quais clientes e os momentos certos para 
fazê-lo.
• Os dados eram armazenados localmente em 
vários bancos de dados.
• Oracle Autonomous Data Warehouse e 
Oracle Analytics Cloud como uma solução 
muito mais adequada e econômica. 
• A Vodafone Fiji é capaz de extrair, mover e 
transformar dados de fontes distintas na 
nuvem, onde podem ser analisados muito 
mais rapidamente. 
• não precisaria contratar pessoas com 
habilidades especializadas em 
gerenciamento de banco de dados
Outros tipos de BD e Plataformas para 
armazenamento
• Banco de Dados Distribuído
• Blockchain
• Plataformas analíticas:
– usando tecnologia relacional e não 
relacional otimizada para analisar 
grandes conjuntos de dados. 
– especificamente para 
processamento de consultas e 
análises.
– As plataformas analíticas também 
incluem sistemas in-memory e 
sistemas de gerenciamento de 
banco de dados não relacionais 
NoSQL e agora estão disponíveis 
como serviços em nuvem.
• Haddop
– uma estrutura de software de código aberto 
gerenciada pela Apache que permite o 
processamento paralelo distribuído de 
grandes quantidades de dados em 
computadores baratos.
– divide um problema de big data em 
subproblemas, distribui-os entre milhares de 
nós de processamento de computador e 
depois combina o resultado em um conjunto 
de dados menor que é mais fácil de analisar. 
– Você provavelmente já usou o Hadoop para 
encontrar a melhor passagem aérea na 
Internet, obter instruções para chegar a um 
restaurante, fazer uma pesquisa no Google ou 
conectar-se com um amigo no Facebook.
Como usar bancos de dados para 
melhorar o desempenho e a tomada 
de decisão na empresa
� Utilizamos, atualmente, o termo big data para descrever esses 
conjuntos de dados com volumes tão imensos a ponto de estarem 
além da capacidade que um DBMS típico tem para capturar, 
armazenar e analisar.
� Uma infraestrutura contemporânea para inteligência empresarial 
consiste em um conjunto de ferramentas para a obtenção de 
informações úteis. 
� Esses recursos incluem data warehouses (armazéns de dados) e 
data marts, data lakes, Hadoop, computação em memória e 
plataformas analíticas.
Armazéns de dados
• Armazém de dados (data warehouse):
• Banco de dados que armazena dados correntes e históricos de 
potencial interesse para os tomadores de decisão de toda a empresa.
• Consolida e padroniza as informações oriundas de diferentes bancos 
de dados operacionais e de transações.
• Os dados podem ser acessados, mas não podem ser alterados.
• Repositório de dados (data mart):
• Subconjunto de um armazém de dados altamente focalizado dos 
dados da organização é colocado em um banco separado destinado a 
uma população específica de usuários.
Como usar bancos de dados para 
melhorar o desempenho e a tomada 
de decisão na empresa
Componentes de um data warehouse
Dados correntes e históricos 
são extraídos de sistemas 
operacionais internos à 
organização. Esses dados são 
combinados com dados de 
fontes externas e 
reorganizados em um banco 
central projetado para análise 
gerencial e produção de 
relatórios. O diretório de 
informações fornece aos 
usuários informações sobre os 
dados disponíveis no data 
warehouse.
Como usar bancos de dados para 
melhorar o desempenho e a tomada 
de decisão na empresa
Como usar bancos de dados para 
melhorar o desempenho e a tomada 
de decisão na empresa
� Infraestrutura contemporânea de inteligência empresarial:
• Inteligência empresarial: ferramentas que consolidam, analisam e 
acessam vastas quantidades de dados para ajudar os usuários a decidir 
melhores escolhas empresariais.
• Softwares para consulta e relatórios de bancos de dados
• Ferramentas para análise multidimensional de dados 
• Mineração de dados
Inteligência empresarial, análise multidimensional de 
dados e mineração de dados
Como usar bancos de dados para 
melhorar o desempenho e a tomada 
de decisão na empresa
Uma série de ferramentas 
analíticas trabalha com os 
dados armazenados nos 
bancos de dados, 
encontrando padrões e 
insights que ajudam 
gerentes e funcionários a 
tomar melhores decisões 
e, assim, aprimorar o 
desempenho 
organizacional.
Inteligência empresarial
Como usar bancos de dados para 
melhorar o desempenho e a tomada 
de decisão na empresa
• Permite a análise multidimensional de dados, de forma que os usuários 
vejam os mesmos dados de diferentes maneiras, pois usa múltiplas 
dimensões
• Cada aspecto da informação — produto, preço, custo, região ou 
período de tempo — representa uma dimensão diferente.
• Exemplo: comparação das vendas da região leste em junho com as 
vendas de maio e junho do ano anterior.
• Permite que os usuários obtenham respostas on-line sobre questões 
específicas em velocidade razoável
Processamento analítico on-line 
(on-line-analytical processing — OLAP)
Como usar bancos de dados para 
melhorar o desempenho e a tomada 
de decisão na empresa
A visão mostrada é 
produto x região. 
Girando o cubo 90 graus, 
a face que aparecer 
mostrará produto x vendas 
projetadas e reais. 
Girando novamente o 
cubo 90 graus, pode-se 
ver região x vendas reais 
e projetadas. Outras 
visões também são 
possíveis.
Modelo multidimensional de dados
Como usar bancos de dados para 
melhorar o desempenho e a tomada 
de decisão na empresa
• Descobre padrões e relacionamentos ocultos em grandes bancos de 
dados e infere regras a partir deles para prever comportamentos 
futuros. 
• Tipos de informações obtidas a partir de mineração de dados:
• Associações: ocorrências ligadas a um único evento.
• Sequências: eventos estão ligados ao longo do tempo.
• Classificações: padrões que descrevem o grupo ao qual o item 
pertence.
• Aglomerações: semelhante à classificação quando ainda não foram 
definidos grupos.
• Prognósticos: partem de uma série de valores existentes para prever 
quais serão os outros valores.
Mineração de dados
Como usar bancos de dados para 
melhorar o desempenho e a tomada 
de decisão na empresa
• É comum usar mineração de dados para analisar detalhadamente padrões 
em dados sobre consumidores e, a partir disso, montar campanhas de 
marketing um-a-um ou identificar clientes lucrativos.
• Análise preditiva:
• Usa técnicas de mineração de dados, dados históricos e suposições 
sobre condições futuras para predizer resultados de eventos, tais como a 
probabilidade de um cliente responder a uma oferta ou comprar um 
produto específico.
• Mineração de dados versus questões de privacidade
• Usado para criar uma imagem de dados detalhada para cada indivíduo.
Mineração de dados
Como usar bancos de dados para 
melhorar o desempenho e a tomada 
de decisão na empresa
• Mineração de texto (text mining)
• Dados não estruturados, em sua maioria na forma de arquivos de texto, 
representam mais de 80% das informações úteis de uma empresa.
• A mineração de texto permite que as empresas extraiam 
elementos-chave de grandes conjuntos de dados não estruturados,descubram padrões e relacionamentos e resumam informações.
• Mineração na Web (web mining)
• Descoberta e análise de padrões e informações úteis na World Wide 
Web.
• Mineração de conteúdo, de estrutura e de uso.
Como usar bancos de dados para 
melhorar o desempenho e a tomada 
de decisão na empresa
Bancos de dados e a Web
� Muitas empresas estão usando a Web para disponibilizar algumas 
informações de seus bancos de dados internos a clientes e 
parceiros de negócios.
� Como muitos bancos de dados back-end não conseguem 
interpretar comandos escritos em HTML, o servidor Web 
repassaria essas solicitações para o software que traduz comandos 
HTML em SQL, de maneira que elas pudessem ser processadas 
pelo DBMS que trabalha com o banco de dados.
Gestão dos recursos de dados
� Uma política de informação especifica as regras para 
compartilhar, disseminar, adquirir, padronizar, classificar e 
inventariar a informação.
� A administração de dados é responsável pelas políticas e 
procedimentos específicos pelos quais as informações podem ser 
gerenciadas como recurso organizacional.
� As funções que o grupo desempenha são chamadas de gestão de 
banco de dados.
� O data cleansing consiste em atividades para detectar e corrigir, 
dentro do banco de dados, informações incorretas, incompletas, 
formatadas inadequadamente ou redundantes.
Futuro da 
Gerência 
de Dados
• Uso de algoritmos 
inteligentes.
– autoML
– Algoritmos de 
inferência
• Bases Inteligentes
– Ontologias
• Integração de 
informação 
heterogêneas
• Tudo é baseado em 
dados.....não se 
iludam
Resumo
1. Como um banco de dados relacional organiza os dados?
2. Quais os princípios de um sistema de gestão de banco de dados?
3. Quais as principais ferramentas e tecnologias para extrair 
informações de bancos de dados e, assim, melhorar o 
desempenho da empresa e a tomada de decisão?
4. Qual o papel da política de informação e da gestão de dados na 
gestão dos recursos de dados organizacionais?
5. Por que é importante para a empresa garantir a qualidade dos 
dados?

Mais conteúdos dessa disciplina