Prévia do material em texto
Brasília-DF. Técnicas e FerramenTas OLaP Elaboração Sandra Schrader Serpa Produção Equipe Técnica de Avaliação, Revisão Linguística e Editoração Sumário APrESEntAção .................................................................................................................................. 5 orgAnizAção do CAdErno dE EStudoS E PESquiSA ..................................................................... 6 introdução ..................................................................................................................................... 8 unidAdE i Histórico e conceitos .................................................................................................................. 11 CAPítulo 1 surgimento do termo oLAP ............................................................................................. 11 CAPítulo 2 modeLos muLtidimensionAis x reLAcionAis ...................................................................... 12 CAPítulo 3 cubo de dAdos oLAP ........................................................................................................ 16 CAPítulo 4 FAtos e dimensões oLAP .................................................................................................... 18 unidAdE ii ArquiteturAs e oPerAções oLAP .................................................................................................... 25 CAPítulo 1 ArquiteturAs oLAP ............................................................................................................. 25 CAPítulo 2 oPerAções oLAP ................................................................................................................ 30 unidAdE iii cArActerísticAs dA AnáLise oLAP .................................................................................................. 44 CAPítulo 1 APLicAções, reLAtórios e dashboards ............................................................................ 44 CAPítulo 2 Por que não usAmos PLAniLHAs ou sqL PArA AnáLises oLAP? ......................................... 49 CAPítulo 3 AvALiAndo As FerrAmentAs oLAP ...................................................................................... 54 unidAdE iV KEY ProCEss INdICaTor (KPi) e dashboards ................................................................................... 58 CAPítulo 1 o que é KEY PErformaNCE INdICaTor (KPi)? ..................................................................... 58 CAPítulo 2 dAsHboArds ....................................................................................................................... 61 CAPítulo 3 quAL A diFerençA entre balaNCEd sCorECards e dashboards? .................................. 64 PArA (não) FinAlizAr ...................................................................................................................... 65 rEFErÊnCiAS .................................................................................................................................... 67 5 Apresentação Caro aluno A proposta editorial deste Caderno de Estudos e Pesquisa reúne elementos que se entendem necessários para o desenvolvimento do estudo com segurança e qualidade. Caracteriza-se pela atualidade, dinâmica e pertinência de seu conteúdo, bem como pela interatividade e modernidade de sua estrutura formal, adequadas à metodologia da Educação a Distância – EaD. Pretende-se, com este material, levá-lo à reflexão e à compreensão da pluralidade dos conhecimentos a serem oferecidos, possibilitando-lhe ampliar conceitos específicos da área e atuar de forma competente e conscienciosa, como convém ao profissional que busca a formação continuada para vencer os desafios que a evolução científico-tecnológica impõe ao mundo contemporâneo. Elaborou-se a presente publicação com a intenção de torná-la subsídio valioso, de modo a facilitar sua caminhada na trajetória a ser percorrida tanto na vida pessoal quanto na profissional. Utilize-a como instrumento para seu sucesso na carreira. Conselho Editorial 6 organização do Caderno de Estudos e Pesquisa Para facilitar seu estudo, os conteúdos são organizados em unidades, subdivididas em capítulos, de forma didática, objetiva e coerente. Eles serão abordados por meio de textos básicos, com questões para reflexão, entre outros recursos editoriais que visam a tornar sua leitura mais agradável. Ao final, serão indicadas, também, fontes de consulta, para aprofundar os estudos com leituras e pesquisas complementares. A seguir, uma breve descrição dos ícones utilizados na organização dos Cadernos de Estudos e Pesquisa. Provocação Textos que buscam instigar o aluno a refletir sobre determinado assunto antes mesmo de iniciar sua leitura ou após algum trecho pertinente para o autor conteudista. Para refletir Questões inseridas no decorrer do estudo a fim de que o aluno faça uma pausa e reflita sobre o conteúdo estudado ou temas que o ajudem em seu raciocínio. É importante que ele verifique seus conhecimentos, suas experiências e seus sentimentos. As reflexões são o ponto de partida para a construção de suas conclusões. Sugestão de estudo complementar Sugestões de leituras adicionais, filmes e sites para aprofundamento do estudo, discussões em fóruns ou encontros presenciais quando for o caso. Praticando Sugestão de atividades, no decorrer das leituras, com o objetivo didático de fortalecer o processo de aprendizagem do aluno. Atenção Chamadas para alertar detalhes/tópicos importantes que contribuam para a síntese/conclusão do assunto abordado. 7 Saiba mais Informações complementares para elucidar a construção das sínteses/conclusões sobre o assunto abordado. Sintetizando Trecho que busca resumir informações relevantes do conteúdo, facilitando o entendimento pelo aluno sobre trechos mais complexos. Exercício de fixação Atividades que buscam reforçar a assimilação e fixação dos períodos que o autor/ conteudista achar mais relevante em relação a aprendizagem de seu módulo (não há registro de menção). Avaliação Final Questionário com 10 questões objetivas, baseadas nos objetivos do curso, que visam verificar a aprendizagem do curso (há registro de menção). É a única atividade do curso que vale nota, ou seja, é a atividade que o aluno fará para saber se pode ou não receber a certificação. Para (não) finalizar Texto integrador, ao final do módulo, que motiva o aluno a continuar a aprendizagem ou estimula ponderações complementares sobre o módulo estudado. 8 introdução Quando falamos em Online Analitycal Processing (OLAP), estamos querendo dizer exatamente o quê? Referimo-nos a uma ferramenta que permite realizar relatórios e telas gerenciais para análise com a finalidade de atender ao Business Intelligence? Referimo-nos a um tipo de tecnologia que serve de apoio ao BI? São os conceitos que definem os processos ocorridos na análise dos dados armazenados em data warehouses gerando informação para o Business Intelligence? Na verdade, quando pensamos no termo OLAP, podemos estar nos referindo a um conceito, a uma etapa do processo analítico, a uma tecnologia, a uma ferramenta, a uma arquitetura de banco de dados, a um tipo de modelo de dados, a uma operação funcional de uma ferramenta OLAP etc. Podemos nos referir ao OLAP pensando na ideia de um cubo abstrato de dimensões infinitas, com seus membros e hierarquias interceptando células com valores e relacionar esse conceito a todas as relações existentes no mundo real, como as vendas de produtos em períodos e regiões ou a quantidade das inscrições das pessoas que farão vestibular em 2013 etc. Podemos nos referir ao OLAP quando pensamos em todas as ferramentas que passam por constantes inovações tecnológicas, a fim de melhor prover as análises de dados com o objetivo de atender ao Business Intelligence. Podemos nos referir ao OLAP quando pensamos no conjunto de elementos, ações e termos da linguagem surgidoscom a finalidade de potencializar uma análise, por exemplo, as ações de drill up/down, dice, slide, os Dashboards, os Balanced Scorecards, os KPIs etc. Podemos nos referir ao OLAP pensando nas operações efetuadas com os bancos de dados que contrapõem as operações transacionais. As operações OLAP são as efetuadas em bancos de dados que visam fornecer informação para a análise de dados e servir para a realização de complexas consultas. Podemos nos referir ao OLAP pensando nas arquiteturas de bancos de dados e as várias integrações com CUBOS de DADOS e servidores. Podemos também nos referir ao OLAP quando pensamos nas novas modelagens de dados como o esquema estrela ou o esquema snowflake dos bancos multidimensionais. Enfim, toda atividade de análise do negócio une-se, de certo modo, ao que hoje chamamos de OLAP, seja armazenando, modelando, processando ou analisando dados a fim de atender ao Business Intelligence e à tomada de decisões. Nos capítulos que se seguem vamos detalhar esse amplo mundo multidimensional OLAP. Seja bem-vindo! 9 objetivos » Promover o entendimento do que é o Online Analytical Processing (OLAP) e a modelagem multidimensional, por meio de conceitos e exemplos. » Analisar a tecnologia (arquitetura e operações) OLAP de modo a compreender por que o OLAP é eficiente ao Business Intelligence, ou seja, de que modo as ferramentas OLAP geram com facilidade dashboards e relatórios. Conhecer os mecanismos mais utilizados para aprimorar as análises OLAP. » Conhecer os tipos de análises feitas para o BI. Compreender o que torna a tecnologia OLAP insubstituível para a realização de análises de apoio ao BI. Analisar os benefícios que ferramentas OLAP disponíveis no mercado podem oferecer aos desenvolvedores e usuários. » Analisar como é feita a análise de dados utilizando ferramentas OLAP, visualizando o dinamismo das telas e elementos mais utilizados em exemplos e demos disponibilizados na internet. Conceituar os elementos analíticos que usualmente compõem dashboards e relatórios. 11 unidAdE iHiStóriCo E ConCEitoS CAPítulo 1 Surgimento do termo olAP O termo “OLAP” surgiu em 1993, proferido por Edgar Frank Codd, matemático britânico, que é considerado “o pai do banco de dados relacional”. Edgar F. Codd e colegas lançaram 12 regras para definir o Online Analytical Processing (OLAP), a indústria de software e o processo de dados que permite a análise dos dados em um espaço multidimensional. No início dos anos 1980, ocorreu a popularização do modelo relacional. Cood lançou essas regras a fim de melhor definir o que realmente deveria ser o banco de dados relacional no mercado de produtos comercializados. <http://olap.com/w/index.php/Codd’s_Paper> <http://en.wikipedia.org/wiki/Edgar_F._Codd> Definimos OLAP, ou Online Analytical Processing, como a capacidade de manipular e analisar grande volume de dados sob múltiplas perspectivas. O sistema OLAP é uma aplicação (ferramenta) que permite aos usuários efetuar consultas complexas com grande quantidade de dados, com grande interatividade entre os dados e automaticamente agregar os dados contidos no data warehouse. O data warehouse provê uma infraestrutura de dados armazenados que possibilita aos usuários obter precisas e eficientes respostas a complexas perguntas. Desde o início de 1990, data warehouses foram desenvolvidos e implantados como parte integral de um moderno sistema de apoio à tomada de decisões. Desse modo, os usuários que, na prática, são profissionais que “tomam decisões”, podem facilmente acessar as informações requeridas e efetuar a análise em vários níveis de detalhes, auxiliando o gerenciamento nas tomadas de decisões e na análise de informações estratégicas nas organizações. 12 CAPítulo 2 Modelos multidimensionais x relacionais dados analíticos x dados transacionais As rápidas mudanças no mundo e a acirrada concorrência entre empresas promoveu o desenvolvimento de condutas empresariais voltadas para o crescimento do negócio. Os dados de uma empresa passaram a ser armazenados a fim de constituírem informações que, com sofisticadas análises, servissem de suporte nas tomadas de decisões. Entretanto, os bancos de dados tradicionais, também chamados de bancos de dados transacionais ou banco de dados operacionais, não atendiam às necessidades para a análise dos dados. Esses bancos serviam para operações diárias e para múltiplos usuários, como, por exemplo, as operações cadastradas de uma consulta de conta- corrente de determinada instituição bancária. A principal função dos bancos de dados transacionais é manter a consistência dos dados, que são altamente normalizados, possuem alto desempenho e não guardam dados históricos. Para efetuar consultas complexas em bancos transacionais, teríamos baixo desempenho, pois tal tarefa exige joins de várias tabelas ou a agregação de um grande volume de dados. Para análise de dados de uma organização como um todo também é necessária a integração dos dados que, muitas vezes, são recebidos de diversos sistemas operacionais. Ou seja, a definição de um dado e seu conteúdo deve ser a mesma quando armazenado em um banco de dados com a finalidade de análise. Por exemplo, em uma integração dos dados são recebidos por um sistema operacional os dados da coluna sexo definidos como: F, M e de outro sistema operacional esses mesmos dados são definidos como: Fem e Masc, ou 1 e 2. No final, teríamos armazenado um mesmo dado definido de várias formas. Nesse contexto, surgiram os data warehouses, que foram propostos a fim de melhor responderem às grandes demandas dos usuários para tomadas de decisões. tabela 1. online transacional Processing (oLtP) x online Analytical Processing (oLAP) OLTP OLAP Atualiza constantemente os dados, pois as informações são modificadas diariamente (insert e update). Analisam o negócio sob vários ângulos, isso é, sob variadas perspectivas ou visões. Sustentam o negócio. Apoiam a decisão. Rodam nos chamados sistemas transacionais ou operacionais. Servem de base para novas ações. Servem para fazer o registro das transações cotidianas (conta- corrente, controle de estoque, controle da produção, contabilidade etc.). Por meio das análises realizadas, possibilitam mudanças e correções de rumo na estratégia corporativa adotada. São os principais alimentadores das soluções analíticas. Possibilitam, normalmente, apenas acessos de leitura (porque lidam com dados estáticos). Fonte: elaborado pelo autor. 13 HISTÓRICO E CONCEITOS │ UNIDADE I Figura 1. modelo de dados transacional x modelo de dados multidimensional Modelo Transacional Modelo Multidimensional » Relacionamento entre entidades. » Fato relaciona-se com dimensões. » Entidades possuem atributos (colunas). » Dimensões possuem atributos com níveis. » Tabelas normalizadas. » Tabelas Desnormalizadas. data warehouses Porque os data warehouses foram criados nas organizações? De que maneira os dados armazenados no data warehouse podem ser úteis para as consultas analíticas? Qual a diferença entre modelo multidimensional e modelo relacional? O Data Warehouse (DW) é um tipo de banco de dados construído com a finalidade de servir ao suporte de decisões de uma empresa. São modelados para que efetuem rapidamente complexas consultas acessando grande volume de dados armazenados. Os dados armazenados têm como origem outros bancos de dados e outras fontes externas e internas que fazem parte da estrutura de uma organização. Esses dados são tratados para que possam servir a realização de análises do Business Intelligence. Para atender às necessidades de desempenho do Data Warehouse surgiram os modelos multidimensionais. O Data Mart (DM) possui atribuições semelhantes às do Data Warehouse, porém, para diferenciá-lo, podemos conceituá-lo como uma porção física ou lógica do Data Warehouse com a finalidade de atender a setores específicos da empresa. 14 UNIDADE I │ HISTÓRICO E CONCEITOS Figura2. visão geral do fluxo de dados em um ambiente de bi Data warehouse é uma coleção de dados: » orientados a assuntos; » integrados; » não voláteis; » variáveis com o tempo; » destinados a auxiliar decisões de negócio. (William H. Inmon) Característica dos dados tratados no data warehouse: Dados integrados (integração dos dados dos vários sistemas operacionais – definição e conteúdo único para os dados). » Orientada ao negócio (os dados devem estar focados nas necessidades de análise de uma organização, devem representar o negócio). » Dados não voláteis (os dados são armazenados por um longo período). » Variação do dado ao longo do tempo. » Armazena dados históricos (a alteração de um dado ao longo do tempo deve estar armazenada no data warehouse). 15 HISTÓRICO E CONCEITOS │ UNIDADE I Para que serve o data warehouse? » localizar e integrar dados provenientes de diversas fontes; » organizar e armazenar dados para o processamento analítico de informações; » disponibilizar informações atuais e históricas de modo dinâmico. 16 CAPítulo 3 Cubo de dados olAP O sistema OLAP é baseado no modelo multidimensional, que permite a realização de consultas analíticas complexas com um desempenho melhor do que nos modelos relacionais. A visão dos dados do modelo multidimensional é chamada de cubo de dados (hipercubo). O cubo de dados (Figura 3) é definido por fatos e dimensões. Os fatos na figura abaixo são representados pelas células do cubo e indicam os valores numéricos ou medidas (métricas). Os fatos são valores que irão quantificar as análises. As dimensões na figura a seguir são representadas pelos eixos x, pelo eixo y e pelo eixo z. Um cubo pode ter “n” dimensões, ou seja, quantas dimensões forem necessárias para atender a análise desejada pelo usuário. Figura 3. cubo de dados dados armazenados no cubo de dados O cubo de dados é uma tecnologia avançada que permite análises sofisticadas. Utiliza uma estrutura multidimensional que organiza os dados em hierarquias e os armazena em cubos. Os elementos formadores dessa estrutura são as dimensões e servem para divisões das medidas. Os valores numéricos agregados são as medidas dessa estrutura. O aplicativo cliente utiliza o cubo de dados (estrutura lógica) para recuperar os valores como se esses valores estivessem contidos nas células dessa estrutura. As células armazenam os menores valores possíveis da estrutura que são os valores agregados definidos pela interseção dos membros ou níveis das dimensões consultadas. Essa estrutura possibilita resumos de alto nível como totais de vendas para um país ou região, assim como a realização de operações OLAP para (drill up / down) exibir detalhes de menor ou maior granularidade das dimensões. 17 HISTÓRICO E CONCEITOS │ UNIDADE I O cubo de dados, ilustrado na figura acima (Figura 3), está sendo representado por três dimensões: Tempo, Produtos e Geografia. As dimensões são as perspectivas ou visões que uma análise pode ter, ou seja, podemos analisar as quantidades dos produtos vendidos nas regiões analisadas, ou a quantidade de produtos vendidos durante os meses do ano. As instâncias das dimensões são chamadas de membros e expressam as características de uma dimensão. Na dimensão Geografia, dentro da hierarquia Região, verificamos os membros: Sul, Sudeste, Norte e Nordeste. Cada dimensão também tem seus atributos que a definirão. A dimensão Produtos, por exemplo, poderá ter os atributos: item, descrição, tamanho, cor etc. As métricas são o foco da análise dos dados, pois expressam os valores que irão quantificar o que desejamos analisar. Podemos analisar o valor total em Real dos produtos vendidos, assim como podemos, em uma análise, representar a métrica das quantidades vendidas de produtos. As métricas, que são as células da figura, apresentam valores diferentes dependendo da perspectiva ou da visão analisada. Nos eixos “X - Y” temos as quantidades de Produtos vendidos durante um período de Tempo, ou seja, as quantidades vendidas nas perspectivas Tempo x Produto. Podemos ter outros valores para as perspectivas Geografia x Produtos ou Geografia x Tempo. 18 CAPítulo 4 Fatos e dimensões olAP O modelo Multidimensional é formado por tabelas relacionais organizadas em estruturas denominadas de esquema Estrela (star schema – Figura 4), esquema Snowflake (floco de neve – Figura 4) ou a união de ambos, ou seja, o esquema Starflake (Figura 4). O esquema Estrela apresenta uma ou mais tabelas Fatos, que são tabelas de valores numéricos, relacionadas com várias tabelas denominadas de Dimensões, que são as perspectivas ou visões de uma análise. Cada tabela Fato é única para as tabelas dimensões relacionadas e os níveis de detalhe dessas tabelas são desnormalizados. O esquema Snowflake é uma variação do esquema Estrela, porém com tabelas normalizadas para as Dimensões em vários níveis de detalhe. Modelo dimensional: 1. Projetado para alto desempenho nas consultas. 2. Assimétrico (tabela de fatos dominante). 3. Fisicamente fatos e dimensões são tabelas. 4. Tabelas de dimensões possuem apenas uma junção com a tabela de fatos. 5. Dimensões só se relacionam através da tabela de fatos. Figura 4. modelagem Física do dW Fato A tabela de fatos (Figuras 5 e 6) é o foco da análise e principal tabela do modelo dimensional; seus dados são sempre quantidades mensuráveis e seus atributos são denominados métricas. As 19 HISTÓRICO E CONCEITOS │ UNIDADE I métricas geralmente são valores numéricos que possibilitam a realização de análise. Como o nome sugere, a tabela de fatos registra os fatos que uma organização deseja analisar. Ex.: de fatos a serem analisados: vendas, custo, margem de lucro etc. Figura 5. tabela de fatos e dimensões no esquema estrela Figura 6. Fato e dimensões com seus níveis o Fato é: A informação central que se deseja analisar ou obter. Ex.: A quantidade de recursos, a quantidade prevista, o valor de venda etc. 20 UNIDADE I │ HISTÓRICO E CONCEITOS Métricas Métricas (Figura 7), por definição, é qualquer coisa que possa ser medida. Devemos observar que métricas e medidas são coisas diferentes: » A métrica é um conjunto de medidas que se tem por base uma unidade padrão e permite fornecer a informação por meio de classificação, agrupamento, filtragem, sumarização etc. O total de vendas de um produto num período é uma métrica. » Uma medida é um valor de dado único, que é de natureza quantitativa e associado a algo que é quantificado. Por exemplo, 100 é um valor de dados. Dependendo do contexto, o total das vendas de um produto pode tornar-se uma medida. Podemos dividir as métricas em: » Métricas aditivas: quando todas as medidas podem ser somadas em uma mesma dimensão. As métricas aditivas permitem operações como adição subtração e média de valores em todas as dimensões. Ex.: custo, margem, quantidade pedida. » Métricas semiaditivas: nessas métricas, os valores apenas podem ser somados em algumas das dimensões Ex.: a métrica “saldo” de uma conta-corrente é considerada semiaditiva, pois não faz sentido somar o saldo de um cliente ao longo do tempo. » Métricas não aditivas: nessas métricas, os valores não podem ser manipulados livremente, pois são valores percentuais ou valores relativos que precisam ser calculados a partir dos valores absolutos. Ex.: preço de custo e de venda de um produto etc. dimensões As dimensões (fig. 6) combinadas analisam valores numéricos, ou métricas, sob variadas perspectivas. Podemos efetuar combinações de dimensões como produtos, regiões geográficas, tempo etc, obtendo assim a análise desejada, como por exemplo, a quantidade de um produto vendida, durante um determinado mês em determinados locais de venda. As dimensões nos cubos de dados geralmente possuem atributos que são divididos por hierarquias, permitindo assim a análise em níveis de detalhes. A dimensão tempo pode ser dividida em dia, mês, ano. A hierarquia dia, no exemplo citado, é o maisbaixo nível de granularidade (mais alto nível de detalhe – fig. 12) e, portanto, é filha de mês, que por sua vez é filha de ano. As ferramentas OLAP realizam relatórios com tabelas e gráficos dinâmicos em que cada hierarquia se torna um conjunto de campos que pode ser expandido exibindo detalhes mais baixos ou ser recolhido mostrando os níveis de detalhe mais altos. Dimensão Tempo à Ano – Mês – Dia A dimensão região pode ser dividida ou ter como membros (Figura 7): cidade, estado e país. Quando analisamos dados que possuem vários níveis de detalhe, como, por exemplo, a hierarquia dia, mês e 21 HISTÓRICO E CONCEITOS │ UNIDADE I ano da dimensão Tempo e desejamos saber as vendas de um produto apenas no nível ano, fazemos, então, agregação dos valores de venda para os vários anos. Figura 7. medidas da tabela de fato e membros de dimensões Atributos Os atributos (Figura 8) armazenam descrições textuais das dimensões e definem os níveis de agregação. São os níveis dentro das dimensões e servem para qualificar os dados. O usuário pode agrupar um ou mais atributos nos relatórios realizados. Fisicamente, são colunas das tabelas dimensões. 22 UNIDADE I │ HISTÓRICO E CONCEITOS Figura 8, Atributos Atributos: » Definem níveis de agregação dos dados. » Qualificam os dados. » O usuário pode usar um ou mais atributos para qualificar os dados. Hierarquias Outro importante fator das dimensões, que potencializam as consultas analíticas, são as hierarquias. As hierarquias servem para classificar o nível de detalhe de cada medida e são agrupadas de acordo com a granularidade da dimensão. No CUBO da figura abaixo (fig. 10), as granularidades são indicadas nos parênteses. A dimensão Tempo apresenta como mais baixo nível de granularidade no CUBO de Dados os meses: Jan, Fev, Mar e Abr. A dimensão Produtos as categorias: Livros, Eletrônicos, Filmes e Músicas. Na Dimensão Geografia o mais baixo nível de granularidade são as regiões Sudeste, Nordeste, Sul e Norte. Figura 9. Hierarquia no cubo de dados 23 HISTÓRICO E CONCEITOS │ UNIDADE I A hierarquia possibilita mapear, em sequência, a o mais baixo nível de granularidade até os níveis mais altos de granularidade. O nível mais baixo da hierarquia, ou seja, o mais baixo nível de granularidade é chamado de filho, sendo pai o nível logo acima desse e assim por diante. Os membros fazem parte dos diversos níveis hierárquicos de uma dimensão. Os membros de um mesmo nível são chamados de parentes. Agrupamos todo o conteúdo de um mesmo nível de detalhe, ou mesma granularidade em “todos”. O membro “todos” é utilizado para a obtenção das agregações das medidas para uma mesma hierarquia. Realizando uma consulta em ”todos” na hierarquia Geografia, por exemplo, teríamos o total de vendas para todas as regiões. A variação da granularidade, ou grão, no CUBO DE DADOS OLAP permite uma análise de acordo com as necessidades do usuário e tem como objetivo a obtenção de consultas complexas para tomadas de decisão no Business Intelligence. Figura 10. Hierarquia granularidade A granularidade de uma dimensão são os níveis de detalhe em que podemos observá-la. A dimensão Região pode ser analisada por País, Cidade ou Loja. Loja é o nível que possui mais detalhes (alto nível de detalhe), ou seja, o mais baixo nível de granularidade (fig. 12) em que podemos observar a dimensão Região. Segundo Kimball (1997), o grão é um único registro na tabela de fatos. Totais diários de itens de todos os produtos vendidos numa loja são os grãos de Venda de Produtos por Tempo. Granularidade e detalhe são grandezas inversamente proporcionais, portanto quanto mais detalhes sendo gravados, mais baixo será o nível de granularidade. Quanto menos detalhes, mais alto será o nível de granularidade. Granularidade corresponde ao nível de sumarização (resumo) dos detalhes e elementos. Sumarização e Granularidade são grandezas diretamente proporcionais, portanto quanto maior for a sumarização, mais alto nível de granularidade, quanto menor for a sumarização, mais baixo nível de granularidade. Podemos então concluir que quanto mais dados detalhados tivermos em uma base de dados, ou maior for o volume de dados armazenados, menor será o desempenho, porém, maior será a capacidade do sistema responder a qualquer consulta requerida. Dados detalhados são dados com baixo nível de granularidade e dados resumidos são dados com alto nível de granularidade. 24 UNIDADE I │ HISTÓRICO E CONCEITOS Figura 11 – granularidade (fonte: adaptado de inmom, 1997) Aplicações olAP: » Tecnologia voltada para consultas. » Dados constantes e com poucas atualizações (quase não sofrem alterações). » Dados e consultas gerenciais. » Visão multidimensional dos dados. » Cálculos complexos. » Visão histórica dos dados (séries de tempo). Descreva os diferentes componentes do modelo Multidimensional (Fato, Dimensões, Métricas e Hierarquias). 25 unidAdE iiArquitEturAS E oPErAçõES olAP CAPítulo 1 Arquiteturas olAP A característica fundamental do sistema Online Analytical Processing (OLAP) é a capacidade de poder analisar e manipular dinamicamente grande quantidade de informações, agregando automaticamente os dados contidos no Banco de Dados. As aplicações OLAP permitem que o usuário tenha acesso aos dados corporativos, por meio consultas feitas de maneira simples com recursos da ferramenta, visualizando esses dados sob múltiplas perspectivas (ou visões) e sob vários níveis de detalhe (níveis hierárquicos das dimensões). Relatórios são gerados combinando dimensões e sumarizando dados de acordo com as necessidades de visualização da informação. O usuário final geralmente analisa essas informações navegando em telas gerenciais com os relatórios que devem atender à descoberta de tendências, anomalia dos dados, ao gerenciamento do negócio e ao processo de tomada de decisões do Business Intelligence. O sistema OLAP (Figura 12) é implementado utilizando-se basicamente duas tecnologias: relacional OLAP (ROLAP) e multidimensional OLAP (MOLAP). O Hybrid OLAP (HOLAP) é a utilização do ROLAP com o MOLAP, aproveitando-se das vantagens que cada um oferece. Outras tecnologias OLAP surgiram procurando atender a fins específicos: o Desktop OLAP (DOLAP), o Local OLAP (LOLAP), o Web OLAP (WOLAP), o Java OLAP (JOLAP) e SOLAP – Spatial OLAP (SIG + OLAP). Os sistemas MOLAP (Figura 12) armazenam os dados em matrizes multidimensionais enquanto os sistemas ROLAP (Figura 12) armazenam seus dados em tabelas (relações). O modelo multidimensional envolve dois tipos de tabelas para armazenar os dados: tabela de dimensão e tabela de fato. 26 UNIDADE II │ ARQUITETURAS E OPERAÇÕES OLAP Figura 12. sistemas roLAP e moLAP Aplicações rolAP Na ferramenta Relational Online Analytical Processing (ROLAP) – Figura 13, os dados são acessados no banco de dados Relacional e são utilizadas consultas Structured Query Language (SQL) para gerar informação no nível desejado. Essa ferramenta não utiliza cubos pré-calculados; as consultas são feitas por consultas SQL, por isso, nem tudo é possível realizar, pois não são possíveis cálculos complexos com o SQL. A consulta ROLAP é mais lenta que a consulta MOLAP. Em contrapartida, permite a análise de grande quantidade de dados. Figura 13. sistema roLAP rolAP: » Dados armazenados em um Banco de Dados Relacional. 27 arquiteturas e operações olap │ uNiDaDe ii » Gerador Inteligente de SQL a partir da especificação do modelo multidimensional. » Simulação das operações OLAP (slice & dice, por exemplo, transformam-se em uma declaração WHERE de SQL). » Análise mais exploratória dos dados. » Servidor de banco de dados relacional e a engine OLAP em um servidor que armazena cubos de informação (a consulta é enviada e processada no servidor do banco de dados relacional). » Permite análise de grande quantidade de dados. Quais as vantagens e as desvantagens da utilização de aplicações ROLAP? Aplicações MolAP Na arquiteturaMOLAP (Figura 14), os dados são armazenados em um banco de Dados Multidimensional. O CUBO é agregado a partir do modelo relacional. Como os dados já estão pré- agregados no CUBO, as consultas têm menor tempo de resposta. O usuário manipula os dados do CUBO diretamente no servidor, porém esse armazenamento é feito em formatos proprietários. Figura 14. sistema moLAP MolAP: » Cubo é agregado a partir do modelo relacional. 28 UNIDADE II │ ARQUITETURAS E OPERAÇÕES OLAP » Consultas têm menor tempo de resposta, já que todos os dados estão pré-agregados no cubo. » Dados armazenados em formatos proprietários. » Acesso aos dados diretamente no banco de dados multidimensional. » Usuário manipula os dados do cubo diretamente no servidor. » Benefícios de desempenho. » Avaliações mais simples e rápidas, mas com limitação de tamanho. Quais as vantagens e as desvantagens da utilização de aplicações MOLAP? Aplicações HolAP O HOLAP combina as soluções das arquiteturas ROLAP E MOLAP, aproveitando-se das vantagens que cada uma oferece, ou seja, o alto desempenho do ROLAP para detalhar os dados da tabela de FATO e da facilidade do MOLAP para agregar os dados. Um servidor HOLAP pode armazenar grande quantidade de dados detalhados em um banco de dados relacional enquanto agregações são realizadas em um banco de dados Multidimensional. HolAP » Combina as soluções ROLAP e MOLAP – alta performance do MOLAP. » Melhor escalabilidade do ROLAP. Aplicações dolAP e lolAP Na Aplicação DOLAP Desktop Online Analytical Processing (DOLAP) – Figura 15, ou na aplicação Local Online Analytical Processing (LOLAP) todo o processamento é feito pela máquina cliente. A consulta é disparada de uma estação cliente para o servidor, que retorna enviando um cubo processado de volta para ser analisado pelo usuário. As vantagens desse tipo de aplicação é a portabilidade aos dados, menor tráfego na rede e menor sobrecarga no servidor. A desvantagem é o maior tempo para iniciar a análise e a limitação no volume de dados do cubo (devido ao tempo/volume do transporte). (Fonte: <http://pt.wikipedia.org/wiki/DOLAP> acesso em 17/4/2013). 29 arquiteturas e operações olap │ uNiDaDe ii Figura 15. sistema HoLAP Aplicações WolAP Na aplicação Web Online Analytical Processing (WOLAP DOLAP) uma consulta é disparada via navegador web para o servidor, que, por sua vez, retorna enviando o CUBO processado de volta, para que possa ser analisado pelo usuário. Esta tecnologia utiliza uma ferramenta OLAP a partir de um navegador web (browser). A arquitetura das ferramentas WOLAP é uma variação da cliente/ servidor. A diferença está na utilização de um middleware do lado servidor que será o responsável pela comunicação entre o cliente e uma aplicação servidora. Aplicações JolAP O Java Online Analytical Processing (JOLAP) é um esforço da Java Community Process (JCP) de projetar uma API Java para servidores e aplicações OLAP, aderentes ao ambiente Java 2Plataform Enterprise Edition (J2EE). Os fornecedores como a IBM, ORACLE, Microsoft, Sun, entre outros, fazem parte deste grupo e já estão desenvolvendo soluções baseadas nestas especificações. Pacotes Java estão sendo propostos como extensão do padrão JOLAP, são eles: javax.olap, javax.olap. metadata, javax.olap.data e javx.olap.quer. Aplicações SolAP Na aplicação Spatial Online Analytical Processing (SOLAP), é a união de aplicação de OLAP com aplicação de Sistema de Informações Geográficas (SIG), para possibilitar análises. Permite localizar sobre uma carta geográfica as informações correspondentes às áreas por meio de OLAP e vice- versa. Em todo o mundo, existem muitos grupos de investigação que trabalham nesta área. Eles contribuem para melhorar as bases de dados geoespaciais, facilitar a agregação de dados espaciais e ajudar a avaliar a qualidade de agregação geoespacial. (Fonte: <http://spatialolap.scg.ulaval. ca/>acesso em 18/4/2013>) 30 CAPítulo 2 operações olAP A visualização dos dados em um modelo OLAP é feita por meio de uma interface gráfica que pode ser uma tela de desktop, notebook, mobile ou IPAD. A navegação entre painéis é um recurso indispensável das ferramentas OLAP que permitem aos usuários visualizarem todos os dados preferencialmente em uma única tela. Sendo assim, o usuário navegará entre vários painéis superpostos de um dashboard analisando as informações de seu negócio e utilizará os recursos da ferramenta, como o drill up ou o drill down, descendo ou subindo os níveis das dimensões para visualizar o nível de detalhe desejado sem a menor dificuldade. As aplicações OLAP simplificam o processo de realizar consultas (queries) complexas, criar relatórios, efetuar análises comparativas ou visualizar subconjuntos (slice ou dice). A visualização dos dados de uma organização, que é feita em diferentes níveis de abstração de um CUBO de DADOS, na prática, ocorre por “operações OLAP”. As ferramentas OLAP, em sua maioria, disponibilizam, por meio de seus recursos, a realização das seguintes operações: roll up, drill down, pivot, slice, dice, drill across e drill through, data surfing entre outras. Descreveremos as operações OLAP básicas mais utilizadas. Roll up A operação de ROLL UP transforma medidas detalhadas em medidas sumarizadas, movendo acima na hierarquia ou reduzindo a dimensão (agrega para o nível acima). Ex.: ROLL UP do nível Centro de Distribuição para o nível Região e do nível Região para o nível País da Dimensão Geografia. dimensão geografia Figura 16. Ferramenta oLAP – visualizando as dimensões 31 arquiteturas e operações olap │ uNiDaDe ii Visualizamos nas Figuras 16 e 17 a dimensão Geografia que contém os níveis ou membros: País, Região e Centro de Distribuição. » PAÍS é pai de REGIÃO e de CENTRO DE DISTRIBUIÇÃO. » REGIÃO E CENTRO DE DISTRIBUIÇÃO são parentes. » REGIÃO e CENTRO DE DISTRIBUIÇÃO são filhos de PAÍS. Figura 17. Ferramenta oLAP – visualizando as dimensões A seguir, na Figura 18, visualizamos a Dimensão Geografia e seus diversos níveis hierárquicos. Pais → Região → Centro de Distribuição. Figura 18. Ferramenta oLAP – visualizando as dimensões e seus níveis hierárquicos 32 UNIDADE II │ ARQUITETURAS E OPERAÇÕES OLAP Na Planilha esta DIMENSÃO seria visualizada como na figura a seguir (Figura 19): Figura 19. Ferramenta oLAP – visualizando dimensões Os ícones de Cubos de Dados exibidos à direita (Figura 19) são os ATRIBUTOS da ferramenta OLAP. A MÉTRICA Receita é exibida com um ícone representado por uma régua (fig. 19). Fazendo um DRILL UP, removeremos da planilha os níveis Centro de Distribuição e Região da DIMENSÃO Produtos (Figura 20). A planilha, então, apenas mostrará o nível hierárquico País da dimensão Geografia; o nível Categoria da dimensão Produtos e a métrica Receita (Figura 21): Figura 20. Ferramenta oLAP – realizando o driLL uP 33 arquiteturas e operações olap │ uNiDaDe ii Figura 21. Ferramenta oLAP – realizando o driLL uP Figura 22. Ferramenta oLAP – realizando o driLL uP drill doWn A operação de DRILL DOWN realiza o oposto da operação ROLL UP, ou seja, passa de um nível mais geral para um nível mais detalhado em uma hierarquia de uma dimensão, exibindo índices (medidas) mais detalhados ou de mais baixo nível de granularidade. Ex. (fig. 25): DRILL DOWN do nível Categoria para o nível Subcategoria da dimensão Produto. 34 UNIDADE II │ ARQUITETURAS E OPERAÇÕES OLAP Figura 23. Ferramenta oLAP – visualizando as dimensões e níveis hierárquicos Categoria → Subcategoria → Item. Item é o nível de menor grão ou de mais baixo nível de granularidade. A figura a seguir (Figura 24) apresenta uma planilha exibindo o nível Categoria e a métrica Receita em que faremos um DRILL DOWN do nível Categoria para o nível Subcategoria de menor grão. Figura 24. Ferramenta oLAP – realizando o driLL doWn 35 arquiteturas e operações olap │ uNiDaDe ii Figura 25. Ferramenta oLAP – realizando o driLL doWn Na Figura 26, visualizamos o DRILL DOWNdo nível Categoria para o nível Subcategoria de menor grão. Figura 26. Ferramenta oLAP – realizando o driLL doWn PiVot A operação PIVOT (ou ROTATE) roda os eixos de um Cubo de Dados para oferecer alternativa de visualização dos dados. No Cubo de Dados a seguir (Figura 27), a análise é alterada de região (linha) por ano (coluna) para ano (linha) por região (coluna). 36 UNIDADE II │ ARQUITETURAS E OPERAÇÕES OLAP Figura 27. Pivot no cubo de dados Na planilha abaixo (Figura 28), visualizamos o nível ou membro Ano (linha) da DIMENSÃO Tempo e o nível ou membro Categoria (coluna) da Dimensão Produtos. Figura 28. Ferramenta oLAP – realizando o Pivot Faremos o PIVOT com estas dimensões e o nível hierárquico Ano da DIMENSÃO Tempo ficará na coluna e o nível hierárquico Categoria da Dimensão Produtos ficará na linha. Veja a figura abaixo (Figura 29), após ser executada a operação PIVOT: Figura 29. Ferramenta oLAP – realizando o Pivot 37 arquiteturas e operações olap │ uNiDaDe ii SliCE A operação SLICE pode ser entendida como se fosse feita fatia em uma face do CUBO DE DADOS (Figura 30). Essa operação seleciona uma dimensão em um cubo resultando em um subcubo. Funciona como um filtro que restringe uma dimensão a apenas um ou alguns de seus valores. Na consulta SQL seria o resultado da realização do “WHERE”. A figura ilustra os dados sendo filtrados e somente Rio de Janeiro é filtrado. Figura 30. sLice no cubo de dados A planilha a seguir (Figura 31) apresenta a Receita dos Anos 2008, 2009 e 2010. Na planilha a seguir, inserimos um filtro para mostrar apenas a Receita do Ano de 2009 (Figura 32). Ou seja, aplicamos um filtro na DIMENSÃO Tempo para que apenas seja exibido o Ano 2009. O nível Ano que possuía dados (valores quantitativos da receita) em 2008, 2009 e 2010 passou a exibir apenas dados do Ano 2009. Veja as figuras que se seguem: Figura 31. Ferramenta oLAP – realizando o sLice 38 UNIDADE II │ ARQUITETURAS E OPERAÇÕES OLAP Figura 32 Ferramenta oLAP – realizando o sLice diCE A operação DICE define uma seleção em duas ou mais dimensões, resultando em outro subcubo. A Figura 33 apresenta as vendas nas lojas do Rio de Janeiro e de São Paulo para os primeiros seis meses. Seria como se filtrássemos duas dimensões ao mesmo tempo ou em uma consulta SQL fizéssemos “WHERE” para duas dimensões. Figura 33. dice no cubo de dados A Figura 34 exibe a aplicação de filtros nos ATRIBUTOS Categoria e Ano. Figura 34. Ferramenta oLAP – realizando o dice 39 arquiteturas e operações olap │ uNiDaDe ii Na Figura 35, o ATRIBUTO Ano possui em sua base de dados os anos: 2008, 2009 e 2010 e o ATRIBUTO Categoria possui em sua base dados as categorias: Livros, Eletrônicos, Filmes e Músicas. Faremos um DISSE mostrando na DIMENSÃO Tempo os anos: 2008 e 2009 e na DIMENSÃO Categoria as categorias: Filmes e Música. Figura 35. Ferramenta oLAP – realizando o dice Figura dos Filtros que foram aplicados no modo de visualização “Estrutura” na ferramenta OLAP (Figura 36): Figura 36. Ferramenta oLAP – realizando o dice Na Figura 37 visualizamos como é feita a seleção dos filtros escolhidos para exibir os dados. Figura 37. Ferramenta oLAP – realizando o dice 40 UNIDADE II │ ARQUITETURAS E OPERAÇÕES OLAP drill ACroSS A operação DRILL ACROSS executa consultas envolvendo mais de um CUBO DE DADOS. Essa operação ocorre entre níveis de uma dimensão e ocorre quando o usuário pula um nível intermediário dentro de uma mesma dimensão. Vamos analisar a DIMENSÃO Produto. No exemplo (Figura 38), o nível Item da dimensão Produtos é filho de Subcategoria que é filho de Categoria. O usuário estará executando um DRILL ACROSS quando ele passar do nível Item para o nível Categoria, pulando o nível Subcategoria (Figura 39). Figura 38. Ferramenta oLAP – realizando o driLL Across item → subcategoria → categoria A seguir, exibimos a DIMENSÃO Produtos com todos seus membros ou níveis e a relação hierárquica entre esses membros (Figura 39): Figura 39. Ferramenta oLAP – realizando o driLL Across 41 arquiteturas e operações olap │ uNiDaDe ii O Relatório no formato planilha abaixo (Figura 40) exibe a Receita dos Itens da DIMENSÃO Produtos e logo a seguir (Figura 41) a Receita das Categorias da DIMENSÃO Produtos: Figura 40. Ferramenta oLAP – realizando o driLL Across Planilha exibindo o DRILL ACROSS realizado (Figura 41) Figura 41. Ferramenta oLAP – realizando o driLL Across No Relatório a seguir (Figura 42), podemos visualizar os três níveis da DIMENSÃO Produtos: Item, Subcategoria e Categoria e a Receita. O DRILL ACROSS sobe ou desce os níveis de uma DIMENSÃO pulando níveis intermediários dessa mesma dimensão analisada. Figura 42. Ferramenta oLAP – realizando o driLL Across 42 UNIDADE II │ ARQUITETURAS E OPERAÇÕES OLAP drill tHrougH A operação de DRILL THROUGH (Figuras 43 e 44) pode ser entendida como a mudança de uma visão, ou seja, analisando um produto (DIMENSÃO Produto) na visão geográfica (DIMENSÃO Geografia – Figura 43), passamos a analisá-lo na visão Tempo (DIMENSÃO Tempo – Figura 44). Figura 43. Ferramenta oLAP – realizando o driLL tHrougH Figura 44. Ferramenta oLAP – realizando o driLL tHrougH Consultas Ad-hoc São as consultas que unem os recursos oferecidos pela ferramenta que está sendo utilizada às necessidades eventuais do usuário, ou seja, qualquer consulta que não seja predefinida. 43 arquiteturas e operações olap │ uNiDaDe ii Figura 45. consulta ad-hoc 44 unidAdE iiiCArACtEríStiCAS dA AnáliSE olAP CAPítulo 1 Aplicações, relatórios e dashboards Aplicações olAP Em uma organização podemos encontrar aplicações OLAP em diversas áreas: empresa (Tabela 2). tabela 2. Aplicações oLAP Finanças Análise de L&P, Relatórios L&P, Orçamento, Análise de Balanço, Fluxo de Caixa, Contas a Receber etc. Vendas Análise de vendas (por região, produto, vendedor, etc.), Previsões, Lucratividade de Cliente/Contrato, Análise de Canais de Distribuição etc. Marketing Análise de Preço/Volume, Lucratividade de Produto, Análise de Mercados etc. Recursos Humanos Análise de Benefícios, Projeção de Salários, Análise de “Headcount” etc. Manufatura Gerência de Estoque, Cadeia de Fornecimento, Planejamento de Demanda, Análise de custos de matéria-prima etc. Fonte:<http://pt.wikipedia.org/wiki/oLAP> relatórios Os relatórios podem ser Corporativos ou Operacionais e de Produção. relatórios Corporativos Os Relatórios Corporativos (Figura 46) são essenciais em análises diárias efetuadas por tomadores de decisão da empresa. O Business Intelligence é uma prática atual de executivos e gerentes que analisam os vários setores empresariais por meio de consultas efetuadas em relatórios realizados com ferramentas OLAP. As ferramentas OLAP facilitam e aprimoram a visualização analítica, proporcionando recursos em tabelas ou gráficos dinâmicos como: page-by, pivot, sort, filter e drill up/down. 45 características da análise olap │ Unidade iii Figura 46. relatórios em um dashboard Fonte: <http://www.microstrategy.com.br/software/business-intelligence/enterprise-reporting/> acessado em 12/4/2013)> relatórios operacionais e de Produção Os relatórios Operacionais (Figura 47) são efetuados quando é necessário organizar uma grande quantidade de dados operacionais que são divididos em categorias hierárquicas. As categorias hierárquicas são constantes em operações de produção. Para atender de forma adequada e gerando eficiência a esse tipo de consulta, as ferramentas OLAP oferecem recursos como: etiquetas, cabeçalhos, rodapé e lógica de quebra de página. Figura 47. relatório corporativo Fonte: <http://www.microstrategy.com.br/software/business-intelligence/enterprise-reporting/>acessado em 12/042013 Faturas e Comunicados As faturas e comunicados (Figura 48) são rotinas comuns em empresas e, embora não façam parte do Business Intelligence, podem ser efetuados com as ferramentas OLAP, uma vez que 46 UNIDADE III │ CARACTERÍSTICAS DA ANÁLISE OLAP essas ferramentasfacilitam a realização de relatórios. Esses documentos geralmente servem para informar dados transacionais detalhados ou outras informações resumidas para clientes, funcionários ou da empresa. Figura 48. relatório operacional Fonte: <http://www.microstrategy.com.br/software/business-intelligence/enterprise-reporting/>acessado em 12/4/2013 Faça um relatório no MicroStrategy Tutorial utilizando as métricas e atributos existentes no Tutorial. Utilize três atributos e uma métrica. Pratique as operações OLAP em seu relatório. Versão Trial do MicroStrategy: <http://www.microstrategy.com.br/freeevalcd.asp> Nas Figuras 49 e 50, visualizamos um Dashboard sendo realizado com uma ferramenta OLAP. As bases de dados encontram-se à direita e o Dashboard, à esquerda, é visualizado no modo de edição da ferramenta. Figura 49. Ferramenta oLAP – realizando um relatório no dashboard 47 características da análise olap │ Unidade iii Na Figura 50, visualizamos um relatório dentro de um Dashboard sendo exibido no browser pela ferramenta OLAP. Figura 50. Ferramenta oLAP – realizando um relatório no dashboard Dashboards Os dashboards (Figura 51) possibilitam mostrar uma grande quantidade de informações em reduzido espaço, geralmente todos os gráficos e planilhas são exibidos em um único documento (arquivo). Esse documento nada mais é do que o próprio dashboard exibido por um navegador web e por meio de “botões” ou links possibilita ao usuário navegar entre visualizações sem comprometer o desempenho das consultas. As operações típicas do OLAP: roll up, drill down, pivot, slice, dice, drill-across e drill-through efetuados em planilhas ou gráficos incrementam a análise dos dados. A escolha de qual tipo de gráfico será utilizado para a análise dos dados dependerá da eficiência apresentada por cada tipo para exibir a informação pretendida. 48 UNIDADE III │ CARACTERÍSTICAS DA ANÁLISE OLAP Figura 51. dashboard na interface gráfica Fonte:< http://www.microstrategy.com/dashboardgallery/dashboards/interactivesalesoverview.asp> acesso em 12/4/2013. 49 CAPítulo 2 Por que não usamos planilhas ou Sql para análises olAP? As ferramentas de análise OLAP suportam múltiplas dimensões, hierarquias, cálculos dimensionais e a separação entre estrutura e representação. A seguir, veremos por que as planilhas e o SQL não atendem plenamente aos requisitos das análises OLAP. Qual o método mais eficiente para definir e produzir as informações precisas, em curto tempo e de uma forma compreensível? Antes, definiremos o que é agregação e o que é generalização. É bastante difícil definir aplicações que dependam exclusivamente de complexos dados agregados, o que torna necessária a construção de uma abstração de alto nível no modelo relacional. Podemos entender como exemplos de abstrações as agregações e generalizações. Agregações são objetos do tipo dados (que estão relacionados entre si em um modelo); podemos citar como exemplo de agregação um objeto do tipo Departamento, que possui os campos funcionários, número de registro, número de telefone etc. Uma matrícula seria outro exemplo de agregação, possuindo os campos: nome, dia da matrícula, nome do curso, período a ser cursado etc. Generalizações são agregações que possuem elementos comuns entre si. Uma generalização de Alunos e Professores, que poderia se chamar Curso, possuiria como campos associados os campos comuns de Alunos e Professores: salas, matérias, horários etc. Para a análise de dados é importante considerar também as hierarquias e seus relacionamentos. Planilhas Nas planilhas podemos reorganizar linhas e colunas. Como podemos rearranjar as views para alterar os valores entre linhas e colunas no SQL? Ou seja, se desejarmos colocar a dimensão Tempo, que está como linha, para ser visualizada como coluna, isso é feito facilmente? Com o desenvolvimento dos computadores pessoais, muitos usuários passaram a realizar análises em seus computadores. Os softwares aumentaram a funcionalidade de suas planilhas de várias maneiras para atender aos desejos de seus usuários. No início dos anos 1980, eram realidades comerciais os bancos de dados SQL que atendiam às várias necessidades de armazenamento, consulta e manipulação de dados das empresas. 50 UNIDADE III │ CARACTERÍSTICAS DA ANÁLISE OLAP Porém, como veremos a seguir, as planilhas ou mesmo as consultas SQL em Bancos de Dados não atendem adequadamente às necessidades de análises para tomadas de decisão com a mesma eficiência que as funcionalidades OLAP conseguem realizar. Nas planilhas, inicialmente, temos de decidir se dividiremos as tabelas ou uma tabela única conterá todos os dados. Se fizermos uma tabela única, precisamos decidir quais itens ficarão nas linhas e quais ficarão nas colunas. A disposição dos itens afeta o que será agregado, pois apenas as células contínuas poderão ser somadas. Se as tabelas forem separadas, teremos a tabela produto, a tabela loja e a tabela tempo. Ao combinarmos as tabelas, teremos, por exemplo, 100 produtos x 3 meses x 4 lojas, que daria um resultado. Planilhas não foram estruturadas para trabalhar com dados multidimensionais. O que ocorre com as planilhas e o SQL é a dificuldade de acessar os dados a partir de uma fonte comum a todas as tabelas. No esquema Estrela, a tabela FATO é comum a todas as Dimensões. A tabela FATO pode facilmente crescer em linhas sem prejudicar o desempenho de uma análise, pois a definição dos dados e seus detalhes (atributos), assim como as hierarquias estão nas tabelas dimensões. A tabela de fato apenas recebe valores numéricos ou valores simples e relaciona todos os dados entre si. Quando tentamos satisfazer uma demanda vinda de um usuário final por meio de uma planilha, deparamos com vários problemas: 1o Problema: decidir o formato da base de dados que será acessada para a análise a ser feita, pois, dependendo de como seja essa base de dados, tornará ineficiente a integração entre os dados. Podemos construir uma única tabela ou dividir os dados em várias tabelas. Além disso, podemos informar o que será informado como linha e o que será informado como coluna, ou seja, se colocarmos os produtos nas linhas e o tempo e valores nas colunas ou de outra forma. O que será feito afetará a facilidade de se realizar a análise; dessa forma, é necessário pensar antecipadamente de que forma será estruturada a base de dados. Pode-se, por exemplo, necessitar distribuir os dados em várias planilhas, por questões de gerenciamento. Tal fato terá como consequência a tarefa de integrar os dados que estão separados em planilhas diversas (o que talvez possam ser centenas ou milhares de planilhas). 2o problema: agregar a base de dados é a segunda questão que dificulta a utilização de planilhas. Cada planilha necessita ter a informação de desmembramento do dado (o nível de detalhe ou granularidade a ser visualizado) incorporado na agregação, ou, caso contrário, apenas teríamos como solução a definição de mais planilhas contendo essas informações. De qualquer forma, teríamos muita redundância. Como exemplo, podemos citar a análise de vendas dos produtos de uma rede de lojas. Poderíamos organizar as vendas dos produtos por lojas. Se desejarmos bairro e cidade agregados à loja e se tivermos 3.000 planilhas organizadas por loja, precisaremos de 3.000 cópias das planilhas com as informações das hierarquias (região – bairro – filial) para cada planilha de loja. 51 características da análise olap │ Unidade iii tabela 3. dados de uma planilha Loja Blusa Região Bairro Filial Valor Venda Loja1 modelo 1 Rio de janeiro Botafogo Filial 1 22 Loja 1 modelo 2 Rio de janeiro Botafogo Filial 1 23 Loja 1 modelo 3 Rio de janeiro Botafogo Filial 1 24 As planilhas não fornecem suporte para agregações. 3o problema: as planilhas trabalham com células baseadas em fórmulas. Toda célula de agregação necessita ser definida com a fórmula. Não apenas é necessário repetir a informaçãoda hierarquia loja 3.000 vezes, mas, também, para cada uma dessas 3.000 vezes, você tem de repetir a fórmula que soma a loja 1 para cada um dos 3 bairros para cada uma das 10 medidas, ou seja, 3.000 x 10 somas = 30.000 vezes faríamos o cálculo da soma em toda a planilha. Ou seja, na Planilha do Produto 1 – Loja 1: tabela 4. dados de uma planilha Blusa Região Bairro Filial Valor Venda Valor Total Por produto modelo 1 Rio de Janeiro Botafogo Filial 1 22 69 modelo 2 Rio de Janeiro Botafogo Filial 1 23 69 modelo 3 Rio de Janeiro Botafogo Filial 1 24 69 Concluímos que planilhas não suportam cálculos dimensionais. 4o problema: planilhas não oferecem uma maneira fácil de alterar as visões. Para alterar a visão de uma planilha seria necessário criar uma nova view. Visualização da Agregação Blusa tabela 5. dados de uma planilha Blusa Região Bairro Filial Valor Venda modelo b1 Rio de janeiro Botafogo Loja 1 22 modelo b2 Rio de janeiro Botafogo Loja 1 23 modelo b3 Rio de janeiro Copacabana Loja 2 24 Visualização da Agregação região tabela 6. dados de uma planilha Região Bairro Blusa Filial Valor Venda Rio de Janeiro Botafogo modelo 1 Loja 1 22 Botafogo modelo 2 Loja 1 23 Copacabana modelo 3 Loja 2 24 52 UNIDADE III │ CARACTERÍSTICAS DA ANÁLISE OLAP Essa reorganização da view é causada porque as planilhas não separam a estrutura do modelo da visão do modelo. Sqls SQL, ou Structured English Query Language (inicialmente chamada de SEQUEL), é a linguagem estruturada utilizada para consultas e manipulações dos dados em banco de dados relacionais. O SQL foi a linguagem desenvolvida para manipular as tabelas de bancos de dados relacionais. As consultas a esses dados são formatadas em planilhas e a forma como os dados são estruturados limitam o que pode ser feito. Muitas comparações, que são habituais em análise de dados, são de difícil implementação com o SQL. O SQL foi um avanço no que poderia ser realizado por meio de planilhas. O SQL escondia sua complexidade do usuário final que apenas visualizava os dados necessários para sua análise. O SQL, diferentemente das planilhas, suporta múltiplas dimensões. Para utilizar o SQL para fazer as tabelas agregadas, teremos uma tabela para cada nível de agregação. Por exemplo, se tivéssemos três níveis na dimensão Tempo (ano, mês, dia), três níveis em Veículo (marca 1, marca 2, marca 3) e três níveis em Grupo lojas (loja 1, loja 2, loja 3), então, teríamos 27 tabelas agregadas. tabela 7. dados de uma planilha 1. ano.marca1.loja1 10. ano marca1.loja2 19. ano. marca1.loja3 2. ano.marca2.loja1 11. ano. marca2.loja2 20. ano. marca2.loja3 3. ano. marca 3.loja1 12. ano. marca3.loja2 21. ano. marca3.loja3 4. mes. marca 1.loja1 13. mês. marca1.loja2 22. mês. marca1.loja3 5. mês. marca2.loja1 14. mês. marca2.loja2 23. mês. marca2.loja3 6. mês.marca3.loja1 15. mês. marca3.loja2 24. mês. marca3.loja3 7. dia. marca1.loja1 16. dia. marca1.loja2 25. dia. marca1.loja3 8. dia. marca2.loja1 17. dia. marca2.loja2 26. dia. marca2.loja3 9. dia.marca3.loja1 18. dia. marca3.loja2 27. dia. marca3.loja3 Views são criadas utilizando-se as tabelas agregadas, para que as análises possam ser feitas. O SQL realizando joins entre as várias colunas das tabelas agregadas existentes ou de outras views criadas antecipadamente, modela as novas tabelas denominadas de views. As views são mecanismos de visualização dos dados extraídos de uma ou mais tabelas e apenas existem para uma melhor composição dos dados, transpondo apenas os dados necessários para o processo analítico e a tomada de decisões. Da mesma forma, se necessário para obter-se algum dado analítico proveniente de operações entre os valores (fórmula), efetuamos operações entre as colunas das tabelas existentes 53 características da análise olap │ Unidade iii ou views criadas e geramos uma nova coluna. Ex.: variação pode ser uma nova coluna resultante da divisão da coluna venda atual por venda planejada. Transpor linhas por colunas não é possível no SQL. Teríamos de recriar as views para isso. Tal fato ocorre porque no SQL a estrutura dos dados está vinculada a sua representação. Temos de antecipadamente saber qual visualização desejamos para desenvolver a estrutura da base de dados que será utilizada na análise dos dados. O SQL também não realiza tarefas simples de cálculos entre os valores, como a razão entre vendas planejadas e venda atual, o que é muito fácil para as planilhas (que facilmente utiliza fórmulas aplicadas em suas colunas) ou ferramentas OLAP. O SQL também apresentava limitações analíticas para se calcular médias acumuladas, calcular totais ou classificar os dados. Extensões foram desenvolvidas na tentativa de suprir as necessidades analíticas. As tabelas Dimensões armazenam toda a descrição do tempo, produto e loja, enquanto a tabela Fato armazena apenas o ID das dimensões. A tabela Fato pode crescer muitas linhas, pois apenas recebe valores. As dimensões também possuem hierarquias entre seus objetos. OLAP tem como requisitos lógicos para atender aos propósitos na análise de dados: » Suportar múltiplas dimensões. » Suportar hierarquias. » Suportar cálculos dimensionais. » Separar a estrutura dos dados de sua representação. 54 CAPítulo 3 Avaliando as ferramentas olAP Como escolher a ferramenta OLAP adequada para cada necessidade analítica? Ferramentas olAP As ferramentas OLAP são o apoio para soluções de BI nas organizações e surgiram como uma consequência do crescimento dos data warehouses. Nesse contexto, surgiram várias ferramentas procurando atender aos requisitos de análises de dados para a tomada de decisões empresariais. Cada ferramenta, no entanto, possui características particulares. Na hora de escolhermos a ferramenta certa para nossas exigências analíticas, podemos, por exemplo, avaliar suas características como o preço, suporte, funcionalidade, facilidade de uso e implementação etc. Ao implementar uma solução de BI, a organização deve procurar avaliar a opção que melhor atenda às suas necessidades e que apresente o melhor custo-benefício. Citaremos algumas ferramentas existentes no mercado e, no item seguinte, os critérios que podemos utilizar para avaliar a eficiência de uma ferramenta OLAP. Podemos dividir as ferramentas OLAP em ferramentas OLAP livres (open source) e ferramentas OLAP proprietárias. » Ferramentas OLAP Livres: › Pentaho etc. » Ferramentas OLAP Proprietárias: › Cognos; › MicroStrategy; › Microsoft; › Oracle Business Intelligence; › QlikView; › SAS; › Business Objects etc. 55 características da análise olap │ Unidade iii Critérios para avaliação de ferramentas olAP disponíveis no mercado Podemos analisar as ferramentas OLAP existentes no mercado segundo vários critérios, sendo alguns básicos e outros desejáveis. Muitos estudos existem no sentido de medir a capacidade e a qualidade dessas ferramentas. Não pretendemos estabelecer todos os critérios utilizados para avaliar as ferramentas OLAP, pretendemos apenas esclarecer em relação ao que se pode pretender de suas características. os critérios básicos De maneira geral, esperamos que uma ferramenta OLAP tenha as seguintes características, segundo os critérios: » Interface Gráfica: possibilite a geração de telas (dashboards) a partir de um modelo de dados intuitivamente e com suporte nas diversas tarefas de execução. » ETL: oferecer suporte em relação ao processo de ETL. » Consultas Ad-Hoc: possibilite a geração de relatórios ad-hoc e permitam ao usuário definir livremente como será a consulta dentro de um contexto. os critérios de avaliação desejáveis Analisam a flexibilidade da ferramenta em relação à execução das tarefas comuns ao OLAP e, em geral, dizem respeito a: Arquitetura, ETL, Relatórios, Usabilidade, Administração, Custo do Produto e Integração com produtos de outros fabricantes. » Arquitetura: Multiplataforma, suporte a SGBDs, arquitetura escalável, acesso à internet/intranet de qualquerregião, customização dos componentes etc. » ETL: funções específicas visando facilitar o processo de ETL. Exportação para PDF e outros arquivos de modo a permitir a integração com outras ferramentas. » Usabilidade: interface amigável, suporte técnico e documentação. De preferência, a ferramenta deve permitir a customização e a realização de interfaces personalizáveis. » Administração: diz respeito ao gerenciamento do uso da ferramenta. A ferramenta deve permitir agendamento de tarefas a serem executadas, controles de acesso e segurança etc. » Valor de custo do produto: custo de licenças por usuário (implementação e manutenção). » Integração da ferramenta com produtos de outros fabricantes: deve-se verificar a compatibilidade da ferramenta utilizada com outros produtos que serão utilizados pela organização como ferramentas de planilhas eletrônicas e fontes de dados. 56 UNIDADE III │ CARACTERÍSTICAS DA ANÁLISE OLAP Os pontos mais analisados quanto à eficiência e à capacidade de uma ferramenta são: » bom desempenho ou desempenho satisfatório para o cliente no atendimento de suas necessidades para manipular grande quantidade de dados e cálculos complexos; » quanto à qualidade no suporte ao desenvolvedor e ao usuário final. Suporte para a solução de dificuldades ou ocorrências negativas na utilização da ferramenta por desenvolvedores etc.; » boa produtividade na utilização da ferramenta por desenvolvedor; » não necessitar de alto investimento inicial em treinamento dos desenvolvedores para a utilização da ferramenta e dessa forma não limitar tanto a manutenção quanto ao desenvolvimento em relação ao custo e disponibilidade de profissionais de TI; » investimento em aplicações de BI, em dispositivos móveis assim como estar sempre inovando e colocando a ferramenta atualizada na implementação de experiências dinâmicas, interativas para o usuário e relacionadas ao impacto visual na criação das interfaces gráficas; » reusabilidade de sua camada semântica orientada a objeto; » fácil implementação da ferramenta; » custo de licenças por usuário (implementação e manutenção); » alto nível de integração dos componentes que compõe a plataforma quando utilizada por desenvolvedores ou clientes; » criação de dashboards, relatórios e consultas ad hoc de forma amigável; » ampla variedade de funcionalidades; » usabilidade e facilidade de uso quando utilizada pelo usuário final. Possibilitar que o usuário utilize a ferramenta sem o envolvimento de profissionais de TI, seja na realização de relatórios e de dashboards ou quando necessitar alterar seus arquivos; » integração dos dados provenientes de fontes heterogêneas (Data Warehouse, planilhas, arquivos simples, registros web, dados de aplicações transacionais; » compatibilidade funcional entre ferramentas complementares do mesmo fabricante; » capacidade de integração entre sistemas; » visão das informações através de relatórios, análises ad hoc e painéis de personalizados, com qualidade e vastos recursos que possibilitem o design desejado pelo cliente; » capacidade de usar APIs e serviços web; » amplo e fácil gerenciamento dos metadados; 57 características da análise olap │ Unidade iii » flexibilidade nas opções de saída, como os formatos de saída comumente utilizados: Adobe PDF, HTML, Microsoft Excel, texto plano etc.; » rodar em multiplataformas: Windows, Linux, Macintosh, Unix etc. » arquitetura OLAP com alta escalabilidade, como por exemplo, ROLAP ou HOLAP. Para que servem as ferramentas olAP? Manipular e analisar um grande volume de dados sob múltiplas perspectivas (dimensões) para responder a perguntas analíticas em modelos multidimensionais e, desse modo, auxiliar nas tomadas de decisões, pesquisar tendências e monitorar atividades em organizações. 58 unidAdE iV KEY PROCESS INDICATOR (KPi) E DASHBOARDS CAPítulo 1 o que é Key Performance Indicator (KPi)? Key Performance Indicator (KPI) é uma medida de algo que é estrategicamente importante para o negócio. Os KPIs (Figura 53) servem para monitorar as atividades e o desempenho de uma organização diante de seus objetivos estratégicos, auxiliando os gerentes ou stakeholders a efetuaram planejamentos corretos. Os KPIs ajudam não só no planejamento, mas, também, servem para alterar erros nos processos em andamento antes que os problemas ocorram. O KPI a ser utilizado por uma organização é decorrente de discussões estratégicas de negócios com a liderança de toda a organização. Envolve a avaliação da estratégia da organização de alto nível, metas de curto e longo prazo, e os direcionamentos do negócio que impactam a execução da estratégia. A partir dessas discussões são avaliadas as métricas de desempenho corretas para monitorar as atividades e o desempenho do negócio. O KPI, ou o indicador de desempenho, uma vez que significa o que é importante para a organização, está vinculado ao setor a que se destina. Um KPI utilizado para o departamento financeiro será bem diferente do KPI utilizado para o departamento de vendas. Para a compreensão do que é importante para uma organização e, dessa forma, termos condições de escolher os indicadores corretos a serem utilizados, devemos inicialmente avaliar as principais atividades da organização. Uma organização pode usar KPIs para avaliar o seu desempenho ou de determinada atividade em que está envolvido. O objetivo estratégico da empresa definirá o que almeja alcançar e, consequentemente, medir se está no caminho certo. Ou seja, pode-se medir o crescimento de determinado setor ou a necessidade de manter-se dentro de uma meta operacional pré-definida como, por exemplo: um percentual em relação aos defeitos de uma produção qualquer ou um percentual de satisfação do cliente etc. 59 KEY PROCESS INDICATOR (KPI) E DASHBOARDS │ UNIDADE IV Figura 52. balanced scorecard Fonte:< http://www.microstrategy.com/dashboardgallery/dashboards/interactivesalesoverview.asp> Figura 53. balanced scorecard Fonte:< http://www.microstrategy.com.br/balanced-scorecard/> O Balanced Scorecard (Figura 54) fornece aos executivos e gerentes um método para notificar e analisar KPIs (indicadores chave de desempenho) e desse modo determinar se as atividades operacionais estão alinhadas com a estratégia e visão da organização como um todo. O Balanced Scorecard ™ metodologia é uma técnica para usuários de negócio acompanhar e melhorar o desempenho das empresas com a apresentação de KPIs, ou métricas estratégicas, utilizando resultados atuais e históricos e metas em um registro visual. (Fonte (Tradução livre): <http://www.microstrategy.com.br/balanced-scorecard/>) 60 UNIDADE IV │ KEY PROCESS INDICATOR (KPI) E DASHBOARDS Um KPI é usado para avaliar o desempenho da organização ou de uma atividade desta em relação aos seus objetivos estratégicos. Um indicador é uma métrica utilizada para avaliar o desempenho da organização ou de uma atividade em relação a uma meta estabelecida pela empresa. O painel exibido a seguir (Figura 54) mostra os KPIs para as cidades selecionadas. O KPI da tela informa se a cidade escolhida tem determinada métrica acima ou abaixo da expectativa. Caso a métrica esteja em um valor esperado, permanecerá com a fonte de letra do valor na cor preta e com a espessura normal; caso a métrica esteja acima do esperado, a fonte do valor assumirá a cor verde – bold e, caso esteja abaixo, assumirá o valor vermelho – bold. Na imagem da tela a seguir, a cidade de Miami tem para o crescimento do lucro anual um valor maior do que o valor esperado (27%) e para a margem de lucro um valor menor do que o valor esperado (17,22%). Figura 54. balanced scorecard Fonte:<http://www.microstrategy.com/dashboardgallery/dashboards/interactivesalesoverview.asp> 61 CAPítulo 2 DASHBOARDS Os dashboards (Figura 55) objetivam que as informações visualizadas sejam rapidamente entendidas, por isso utilizam principalmente as representações gráficas(gráficos de vários tipos, sinalizadores, cores e imagens). Outro benefício dos dashboards é tornar a organização transparente a todos, pois recebem informações de diversas fontes e unificam a visão do negócio, transmitindo-a para vários setores e alinhando a organização diante de objetivos comuns ou planejados. Figura 55 Fonte: <http://www.microstrategy.com.br/software/business-intelligence/dashboards-and-scorecards/gallery/> Podemos descrever alguns itens que caracterizam os dashboards: 1. Utilizam elementos gráficos para informar 2. Utilização de KPIs (Key performance Indicators) para auxiliar as análises feitas. 3. Preferencialmente exibem os gráficos e planilhas em uma única tela com navegabilidade para o usuário visualizar toda a informação necessária para suas análises. 4. Com frequência fornecem dados agregados que são destacados a fim de mostrar tendências. 5. Planejar o dashboard de modo que atenda às solicitações de análises específicas dos usuários que irão utilizá-lo, auxiliando desse modo as tomadas de decisões. Os Dashboards podem fornecer diferentes níveis de análises utilizando apenas uma tela. Por exemplo, podemos analisar uma venda no nível da corporação, região ou cidade, como exibido 62 UNIDADE IV │ KEY PROCESS INDICATOR (KPI) E DASHBOARDS no painel demo exibido no site da ferramenta OLAP MicroStrategy. Da mesma forma podemos ter seletores para escolhermos variadas visões. No exemplo abaixo podemos ver no gráfico Gauge (gráfico de bússola) a análise da receita corporativa ou do desempenho regional da receita por ano. As cores no gráfico “Gauge” sinalizam o status do valor exibido, onde o vermelho alerta para uma situação de risco e o verde para a situação ideal. Podemos escolher o tipo de seletor que iremos utilizar para aprimorar a análise (seletor de rádio, controle deslizante, botões, seletor de opções etc.) e utilizando-o podemos variar a visão, fazer um drill up ou down, detalhar um atributo etc., em um mesmo gráfico. No seletor de controle deslizante mostrado no segundo quadrante à direita, podemos escolher o mês a ser utilizado na análise da receita e logo abaixo nos botões podemos escolher a subcategoria desejada para analisar a receita e receita por unidade vendida. Um mesmo seletor pode servir para vários gráficos ao mesmo tempo. No quadrante de baixo à esquerda visualizamos um gráfico realizado com um widget. Widgets são aplicativos incorporados à ferramenta OLAP que servem para proporcionar ao usuário experiências ricas em uma análise. O widget visualizado abaixo é um gráfico interativo de bolhas (interactive buble widget) ele mostra categorias do produto analisados por receita e unidade vendida. O tamanho de cada bolha está relacionado à margem de lucro obtida por categoria do produto. No painel a seguir estamos analisando os dados da corporação (Corporate) conforme está selecionado no seletor do topo. Clicando na opção “Regional” ou na opção “City” visualizaremos novas telas de análise com novos relatórios. Esses seletores localizados no topo servem para abrirmos novas telas sobrepostas como se virássemos as páginas de um livro. Os Dashboards podem ser visualizados em desktops ou aplicados para serem visualizados em dispositivos móveis como IPADs e mobiles (Figura 56), dependendo da necessidade do usuário e/ ou da disponibilidade de recursos oferecidos pela ferramenta OLAP a ser utilizada: Figura 56 Fonte: <http://www.microstrategy.com.br/mobile/gallery/> 63 KEY PROCESS INDICATOR (KPI) E DASHBOARDS │ UNIDADE IV Cite algumas características típicas de um Dashboard. Experimente os demos de Dashboards apresentados pela MicroStrategy online – Interactive Dashboard Gallery: <http://www.microstrategy.com.br/software/business-intelligence/dashboards- and-scorecards/gallery/> 64 CAPítulo 3 qual a diferença entre balanced scorecards e dashboards? Balanced Scorecards – Balanced Scorecards e Dashboards exibem informações de desempenho de uma organização, porém, o Balanced Scorecard tem um formato mais definido. Um Scorecard deve sempre incluir os seguintes componentes: perspectivas (agrupamentos de áreas estratégicas de alto nível), objetivos (verbo-frases resultantes de um planejamento estratégico), métricas de desempenho ou KPIs e indicadores visuais (vermelho, verde e amarelo) que forneçam rápida interpretação do desempenho de uma medida. Esses componentes que formam um Balanced Scorecard garantem que se tenha uma visão crítica das necessidades estratégicas de uma organização. Dashboards – O conceito do que é um dashboard ou painel é bem mais amplo e apresenta formatos variados. Os dashboards são, em geral, vários relatórios apresentados em forma de gráficos e planilhas em uma mesma tela e servem para o monitoramento do desempenho de uma organização, de um setor da empresa ou de atividades da empresa. Alguns desses monitoramentos são estratégicos, porém é possível que o usuário deseje visualizar na mesma tela outros gráficos de menor importância estratégica. No dashboard, inclusive, pode-se ter um Balanced Scoredcard ,além dos gráficos variados, planilhas, gauges e muitas informações de tendências. Os dashboards são tipicamente uma ou mais telas com vários relatórios em forma de gráfico ou planilha que efetuam várias operações OLAP com a finalidade de aprimorar a análise dos dados. (Fonte: What’s the Difference Between Balanced Scorecards and Dashboards? (adaptação e tradução livre): <http://www.activestrategy.com/resources/white-papers/balanced-scorecard-vs- dashboard/>) 65 Para (não) Finalizar Para onde irá o olAP? Uma tendência que verificamos, que transformará o modo de produzir informação para o BI e a forma de visualizar os dados analíticos é o fato do BI, num futuro muito próximo, direcionar suas análises para os dispositivos móveis. Com a mudança do cenário para o desenvolvimento de aplicações OLAP, os profissionais terão de se adequar para projetar com eficiência de modo que usuários recebam e introduzam facilmente e rapidamente os dados em seus e dispositivos móveis pessoais. A “internet das coisas” irá ultrapassar limites graças à velocidade de maquinações Por Sanjay Poonen, Presidente e Chefe da Divisão de Mobile, SAP Na SAP (sistema integrado de gestão) temos refletido sobre o que esperar para 2013, tanto para as tendências que já surtem efeito, tanto quanto para as que já se iniciam. Com isso em mente, coloquei as três seguintes previsões para o ano que se inicia: 1. A Internet das Coisas irá ultrapassar limites graças à velocidade de maquinações para a convergência de três grandes forças: Primeiro, o dispositivo móvel continuará o seu crescimento explosivo na “arena”, conectando mais pessoas globalmente que irão pular do desktop e ir direto para o smartphone ou o tablet. Mas, iremos também assistir os pontos marcantes relativos às plataformas móveis com o desenvolvimento de todos os tamanhos e reconhecendo a necessidade de criar seus próprios fundamentos, em vez de construir sobre os ecossistemas atuais. Segundo, as pessoas não vão querer compartilhar suas experiências apenas no Facebook, mas também vão querem compartilhar através de múltiplos canais, através de múltiplos meios. Portanto, o aspecto social será fundamental para qualquer aplicativo que emergir avançando para frente, seja ele voltado para o consumidor ou para empresas. Finalmente, a nuvem vai continuar a transformar a forma como desenvolvemos a tecnologia, mas os jogadores no espaço irão consolidar e competir mais do que nunca, com a IDC (consultoria que ajuda às empresas fornecedoras de TI a definir e implementar as estratégias de marketing mais adequadas à sua realidade 66 Para Não FiNalizar e estágio de evolução, de forma a atingirem os seus objetivos de negócio ) estimando um gasto acelerado de aproximadamente US $ 25 bilhões até meados de 2015. Juntas, essas três forças familiares – o dispositivo móvel, a nuvem e o social – significarão um maior acesso aos dadose a capacidade de usá-lo a qualquer hora e por qualquer pessoa. 2. A batalha sobre BYOD (iniciais de “bring your own device.” – trazer seu próprio dispositivo - BYOD é um termo que se tornou amplamente difundido em referência aos funcionários que trazem seus próprios aparelhos de computação - como smartphones, laptops e PDAs - ao local de trabalho para uso e conectividade na rede corporativa.) foi vencida, e não foi pela IT – Inteligência tecnológica – (sorry, guys). A empresa Gartner de pesquisas estima que 70% dos dispositivos móveis profissionais irão realizar o seu trabalho em dispositivos pessoais inteligentes em 2018. Agora, o “IT” precisa lidar com a onda de BYOA (trazer seus próprios aplicativos), lidando com a força de aplicativos corporativos que ajudam a gerir o trabalho das pessoas e que sejam tão ágeis e bonitos como seus aplicativos favoritos de uso habitual. LogMeln publicou recentemente um relatório que encontrou 89% dos profissionais de TI dizendo que” BYOA” vai exigir mudanças para o conjunto de habilidades necessárias para o gerenciamento de ambientes de TI de SMB (Small and Medium Business – pequenos e grandes negócios). A mudança está aqui, os hábitos dos trabalhadores exigem isso – os departamentos de TI não deve apenas responder, mas antecipar o que vai acontecer logo. 3. Corporações globais vai sentir o surgimento de novos mercados mais diretamente do que nunca. Como populações inteiras irão adotar a tecnologia móvel, efetivamente ignorando infraestruturas tradicionais , novas oportunidades de negócios e táticas vão surgir mais rápido e com a ressonância muito mais forte do que jamais visto. Segundo a IDC, os dispositivos móveis serão responsáveis por 20% de todos os gastos de TI em 2013 – 2100000 milhões de dólares em todo o mundo. Como líderes de mercado e desreguladores emergem, não apenas serão forçados a enfrentar a já estabelecida habitual forma de negócios, mais do que isso, exigirão novas formas de pensar, especialmente em termos de design, inovação e entrega. Fonte: (Tradução Livre) <http://mobileenterprise.edgl.com/how-to/The--Internet-of-Things--Will- Hit-Warp-Speed84446> acessado em 11/04/2013 Você sabia? 70% dos dispositivos móveis vão realizar seus trabalhos em dispositivos pessoais inteligentes em 2018. Fonte<http://www.gartner.com/technology/topics/byod.jsp> acesso em 11/4/2013 67 referências gOLDSCHMIDT, Ronaldo. PASSOS, Emmanuel. Datamining: um Guia Prático. Ronaldo Ed. Campus, 2005. MALINOWSKI, Elzbieta. ZIMÁNYI, Esteban. Advanced Data Warehouse Design – From Conventional To Spacial and Temporal Aplicattions. Alemanha: Springer, 2009. THOMPSEN, Erik. OLAP Solutions – Building Multidimensional Information Systems. New York.: John Wiley e Sons, Inc., 2002. Sites MOBILE ENTERPRISE. Disponível em:<http://mobileenterprise.edgl.com/how-to/The--Internet- of-Things--Will-Hit-Warp-Speed84446> Galeria de dashboards Corporativos. Disponível em:<<http://www.microstrategy.com.br/ software/business-intelligence/dashboards-and-scorecards/gallery/> 15-S1-1-97127-Uma%20An%C3%A1lise%20Comparativa___.pdf Disponível em:<< http://www. infobrasil.inf.br/userfiles/> ArtigoERBD-MATB10.pdf Disponível em:<<http://www.ambientelivre.com.br/downloads/cat_ view/68-pentaho-business-intelligence.html?start=10> What’s the Difference Between Balanced Scorecards and Dashboards? (adaptação e tradução livre): Disponível em:<<http://www.activestrategy.com/resources/white-papers/balanced-scorecard-vs- dashboard/> Balanced Scorecard (Tradução livre): Disponível em:<<http://www.microstrategy.com.br/ balanced-scorecard/> D a s h b o a r d < h t t p : / / w w w . m i c r o s t r a t e g y . c o m / D a s h b o a r d G a l l e r y / D a s h b o a r d s / InteractiveSalesOverview.asp> Geração de Relatórios Corporativos Disponível em:<<http://www.microstrategy.com.br/software/ business-intelligence/enterprise-reporting/> Codd’s Paper Disponível em:<<http://olap.com/w/index.php/Codd’s_Paper>acessado em 12/04/2013 CODD, Edgar_F._ Disponível em:<<http://en.wikipedia.org/wiki/Edgar_F._Codd>acessado em 12/042013. 68 RefeRências DOLAP. Disponível em:<<http://pt.wikipedia.org/wiki/DOLAP> acesso em 17/04/2013 SPATIALOLAP <http://spatialolap.scg.ulaval.ca/>acesso em 18/04/2013> OLAP. Disponível em:<<http://pt.wikipedia.org/wiki/OLAP>