Prévia do material em texto
Sistemas de apoio a decisão
Briefing Doc: Análise do Documento "O Ciclo da Informação"
Propósito: Este documento apresenta uma análise detalhada dos principais temas, ideias e fatos
contidos no material "O Ciclo da Informação", com o objetivo de fornecer um resumo conciso e
referenciado para facilitar a compreensão da importância da informação, do conhecimento e do
processo decisório nas organizações.
Principais Temas Abordados:
1. Dados, Informação e Conhecimento: Definição, hierarquia e diferenciação desses
conceitos fundamentais no contexto da tomada de decisão.
2. Tipos de Conhecimento: Exploração das categorias de conhecimento, com foco no
conhecimento tácito e explícito, e o modelo SECI de conversão do conhecimento.
3. Importância Estratégica da Informação: Análise de como a informação, especialmente
em um mundo VUCA, se tornou crucial para a vantagem competitiva e a tomada de
decisões embasadas em dados.
4. Processo Decisório nas Organizações: Detalhamento das etapas do processo decisório
e a crescente importância da coleta e análise de dados nesse contexto.
Ideias e Fatos Mais Importantes:
1. Dados, Informação e Conhecimento:
• O mundo atual é caracterizado por um volume imenso de dados e informações, tornando
essencial para os profissionais entenderem seu uso na tomada de decisão.
• O conceito VUCA (Volátil, Incerto, Complexo e Ambíguo) explica o cenário de rápidas
mudanças e incertezas, reforçando a necessidade de decisões baseadas em dados em vez
de "achismos".
• "O mundo tradicional, em que o tempo passava lentamente, não existe mais. Decisões
tomadas sem embasamento, surgidas de achismos, tendem ao erro. Cada vez mais, as
decisões são baseadas em dados e informações."
• Dados são a matéria-prima da informação, conjuntos de números, nomes, textos e
símbolos que, isoladamente, não possuem significado.
• "Os dados são considerados a matéria-prima da informação e de qualquer análise de
dados que porventura venha a ser feita."
• Informação é o aglomerado de dados com significado, resultado do processamento e
organização dos dados dentro de um contexto.
• "Podemos dizer que informação é o aglomerado dos dados com significado."
• Conhecimento é a inteligência aplicada à informação, resultante da compreensão das
informações e sua aplicação na resolução de problemas.
• "Essas informações, quando aplicadas à tomada de decisão, se tornam conhecimento."
• Existe uma pirâmide do conhecimento com dados na base, seguidos por informação e,
no topo, conhecimento.
• Os dados podem ser quantitativos (discretos ou contínuos) ou qualitativos (nominais ou
ordinais).
• As fontes de dados podem ser primárias (dados ainda não coletados) ou secundárias
(dados já existentes).
• Alguns autores consideram a sabedoria como um nível acima do conhecimento,
envolvendo maior entendimento, contexto, reflexão e uma visão mais voltada para o futuro.
2. Tipos de Conhecimento:
• O conhecimento é um ativo intangível e valioso para as organizações.
• Os dois tipos mais comuns de conhecimento são:
• Explícito (E): Formalizado, expresso em dados, manuais, procedimentos, fácil de gravar e
transferir.
• "Conhecimento formalizado, expressado na forma de dados, fórmulas, especificações,
manuais ou procedimentos. É fácil de ser gravado e transferido."
• Tácito (T): Não verbalizado, intuitivo, reside na mente das pessoas, difícil de transferir.
• "Conhecimento não verbalizado, intuitivo. Ainda não foi abstraído da prática. Reside na
mente, no comportamento e na percepção humana. Possui certa dificuldade de ser
transferido."
• O modelo SECI descreve a espiral de criação e transferência do conhecimento através de
quatro modos de conversão:
• Socialização (T-T): Troca informal de conhecimento entre indivíduos.
• Externalização (T-E): Formalização do conhecimento tácito em conhecimento explícito.
• Combinação (E-E): Combinação de diferentes conhecimentos explícitos.
• Internalização (E-T): Internalização do conhecimento explícito, tornando-o tácito.
• A gestão do conhecimento é o processo de captura, distribuição e uso do conhecimento
dentro de uma organização, visando manter o conhecimento circulando e atualizado para
obter vantagem competitiva.
• O processo de gestão do conhecimento geralmente envolve:
• Aquisição de conhecimento: Coleta de novos conhecimentos.
• Armazenamento de conhecimento: Preservação do conhecimento em repositórios.
• Distribuição do conhecimento: Facilitação do acesso ao conhecimento por todos os
funcionários.
• Uso do conhecimento: Aplicação efetiva do conhecimento em atividades e na tomada de
decisão.
• Na prática, a gestão do conhecimento pode envolver:
• Gerenciamento de conteúdo: Disponibilização do conhecimento em sistemas ou
estruturas organizadas.
• Busca de especialistas: Catalogação de especialistas e seus conhecimentos.
• Lições aprendidas: Catalogação de erros, acertos e melhores práticas.
• Comunidades: Fomento da troca de conhecimento por meio de fóruns e debates.
3. Importância Estratégica da Informação:
• O mundo VUCA transformou o papel do vendedor, com clientes realizando grande parte da
pesquisa antes do contato comercial.
• A coleta de informações dos clientes (dados demográficos, hábitos de consumo, histórico)
permite entender segmentos rentáveis, focar marketing e vendas, e identificar novos
potenciais clientes.
• A netnografia (estudo do comportamento na Internet) permite entender os sentimentos
dos clientes em relação à marca através de textos e comentários online.
• "Netnografia: É o estudo de comportamento na Internet."
• Com ferramentas e dados adequados, é possível prever o comportamento do cliente e
criar ofertas personalizadas.
• Decisões baseadas em dados (Data Driven) substituem a intuição e trazem diversos
benefícios:
• Confiança na decisão: Decisões fundamentadas em fatos e lógica.
• "Decisões fundamentadas em dados substituem opiniões baseadas em achismos e
subjetividade, tendo mais clareza e impessoalidade."
• Compreensão do ambiente: Melhor entendimento do mercado e da concorrência.
• Oportunidades: Detecção de novas oportunidades e tendências.
• Previsibilidade: Maior assertividade na previsão de cenários.
• Melhoria de performance: Monitoramento e ajuste contínuo do desempenho.
• Redução de custos: Identificação de gastos e desperdícios.
• Sistemas de informação estratégica auxiliam na coleta, processamento, análise e
apresentação de informações, fornecendo vantagem competitiva.
• Pessoas e responsabilidades são cruciais para uma cultura voltada a dados, incluindo o
papel dos líderes em promover essa cultura e dos especialistas em domínio do
conhecimento em analisar dados, manter a base de conhecimento e influenciar melhorias.
• Todos os colaboradores são importantes para criar e compartilhar conhecimento.
4. Processo Decisório nas Organizações:
• O processo decisório é uma série de ações específicas para tomar uma decisão,
importante para o desenvolvimento organizacional.
• Todos os níveis de gestão estão envolvidos no processo decisório.
• "Mas não se engane em achar que apenas altos gestores, nos níveis mais próximos aos
presidenciais, precisam se preocupar com o processo decisório. Todos os níveis participam
ou são responsáveis nesse processo."
• A tomada de decisão deve ser idealmente baseada em dados e informações, e segue
etapas recomendadas:
1. Entender a decisão: Clarificar o problema ou a decisão a ser tomada.
2. Coletar dados e informações: Obter informações relevantes para a decisão.
3. Identificar as alternativas: Levantar as possíveis opções.
4. Selecionar a alternativa: Escolher a melhor opção com base na viabilidade e nos
impactos.
5. Implementar a alternativa: Colocar a decisão em prática.
6. Revisar a decisão: Avaliar a eficácia da decisão tomada.
• A etapa de coleta de dados e informações é cada vez mais relevante e pode ser
detalhada em cinco fases:
7. Definição do problema: Clarificara pergunta raiz da pesquisa.
8. Planejamento da pesquisa: Definir o que e como será medido e analisado.
9. Execução da pesquisa: Coletar os dados utilizando fontes primárias ou secundárias.
10. Análise: Processar e interpretar os dados coletados.
11. Comunicação das descobertas: Apresentar os resultados de forma clara, muitas vezes
utilizando gráficos.
• A complexidade e o impacto da decisão influenciam o nível de detalhe e esforço em cada
etapa do processo decisório. Decisões rotineiras e de baixo impacto podem envolver uma
aplicação mais empírica das etapas.
• A automação e organização de dados nas grandes empresas facilitam o suporte à tomada
de decisão, mesmo em decisões complexas e rotineiras.
Conclusão:
O documento "O Ciclo da Informação" enfatiza a transformação do mundo pela tecnologia e pelo
cenário VUCA, destacando a importância crucial da informação e do conhecimento para a
tomada de decisão eficaz nas organizações. A transição de decisões baseadas em "achismos"
para abordagens "Data Driven" é apresentada como essencial para a obtenção de vantagem
competitiva. O material detalha os conceitos de dados, informação e conhecimento, explora os
tipos e a gestão do conhecimento, demonstra a relevância estratégica da informação em diversas
áreas e descreve o processo decisório, com foco na importância da coleta e análise de dados em
suas etapas. A implementação de uma cultura organizacional voltada a dados e conhecimento,
com o envolvimento de líderes, especialistas e todos os colaboradores, é apresentada como
fundamental para o sucesso nesse novo paradigma.
Briefing Doc: Análise de Negócio e Inteligência
Empresarial
Data: 26 de outubro de 2023
Fonte: Excertos de "Análise de Negócio e Inteligência Empresarial.pdf" do Prof. Jorge Fernandes
Propósito: Compreender a relevância da análise de negócio e da inteligência empresarial como
diferenciais competitivos na nova economia, explorando seus conceitos, modelos e técnicas.
Principais Temas e Ideias:
Este documento explora a importância da análise de negócio e da inteligência empresarial (IE)
no contexto da quarta revolução industrial, caracterizada pela Indústria 4.0 e o uso intensivo de
tecnologias como sistemas ciber-físicos, internet das coisas e computação em nuvem. O autor
argumenta que a capacidade de transformar dados em insights para a tomada de decisões
estratégicas é essencial para a competitividade.
1. Análise de Negócio:
• Definição e Importância: A análise de negócio é definida como a aplicação de
conhecimentos, habilidades, ferramentas e técnicas para determinar problemas, identificar
necessidades, recomendar soluções viáveis, gerenciar requisitos de stakeholders e facilitar
a implementação bem-sucedida de produtos, serviços ou resultados. Segundo o Prof.
Vinha Júnior (2016, p. 4), ela permite que uma empresa "atinga metas e objetivos por meio
da identificação dos problemas da organização e da necessidade de mudança." A análise
de negócios é crucial para facilitar a mudança e fornecer soluções para as necessidades
do negócio.
• Benefícios: O texto detalha diversos benefícios da análise de negócios, incluindo:
• Melhor controle e aumento do retorno sobre o investimento (ROI).
• Melhor controle e redução de custos.
• Melhora na tomada de decisão: "Um dos aspectos mais importantes da análise de
negócios é facilitar a tomada de decisão."
• Identificação dos requisitos de negócios.
• Benefícios para todos na empresa.
• Identificação da posição no mercado.
• Antecipação de crises.
• Avaliação de mudanças.
• Objetivo Final: O objetivo final da análise de negócios é "permitir que uma empresa
minimize custos, maximize lucros, identifique novas oportunidades de crescimento e
implemente estratégias comprovadas que ajudarão os gerentes de negócios a atingir os
objetivos estabelecidos."
• Técnicas de Análise de Negócios: O documento apresenta três técnicas principais:
• Análise MOST (Mission, Objectives, Strategy, Tactics): Foca em alinhar as ações da
organização com sua missão, transformando metas gerais em ações alcançáveis.
• Análise SWOT (Strengths, Weaknesses, Opportunities, Threats): Avalia os fatores
internos (forças e fraquezas) e externos (oportunidades e ameaças) que afetam o resultado
da organização.
• Análise CATWOE (Clients, Actors, Transformation, World View, Owner, Environmental):
Ajuda a entender o que uma empresa está tentando alcançar, definindo áreas
problemáticas, soluções e stakeholders envolvidos para alinhar ideias.
2. Modelos de Inteligência Empresarial (BIM):
• Definição e Finalidade: Um BIM oferece oportunidades para as empresas transformarem
dados brutos em informações significativas e úteis para construir planos estratégicos e
criar insights para a tomada de decisões. A finalidade do BI é "auxiliar a organização na
estruturação e interpretação de informações para que possa alcançar seus objetivos de
negócios e sua missão organizacional."
• Processo de BI: O processo de BI baseia-se na transformação de dados em informações,
depois em decisões e, por fim, em ações. As informações precisam chegar às pessoas
certas, no momento certo e pelo canal correto.
• Roteiro Conceitual de um BIM: O texto descreve um roteiro genérico com as seguintes
etapas:
• Coleta e entrada de dados de diversas fontes (estruturadas e não estruturadas).
• Preparação dos dados para análise (limpeza, organização).
• Filtragem dos dados relevantes.
• Análise dos dados para identificar insights.
• Implementação/relatório dos resultados em formatos acessíveis (relatórios, painéis).
• Compartilhamento dos relatórios com os stakeholders.
• Sistemas de Inteligência Empresarial: São apresentados diversos tipos de softwares e
sistemas de BI, adequados a diferentes necessidades: plataformas de inteligência de
negócios, software de visualização de dados, software integrado de inteligência de
negócios, software de inteligência de geolocalização e software de inteligência de negócios
de autoatendimento. É crucial a integração desses sistemas entre si e com outros sistemas
da organização (ERP, CRM, etc.).
3. Inteligência Empresarial (IE) e Inteligência Competitiva (IC):
• Inteligência Empresarial (IE): Conceituada como o processo de coletar dados sobre o
negócio de várias fontes, centralizá-los, analisá-los e tomar decisões para beneficiar o
crescimento da empresa. O objetivo é usar os dados para melhorar iniciativas e estratégias
existentes ou implementar novas, tornando os negócios mais eficientes.
• Benefícios da IE: A IE pode beneficiar diversas áreas da organização, como marketing de
produtos, marketing digital, força de vendas, diretoria e gerência, equipe de operação e
recursos humanos, fornecendo insights valiosos para cada área.
• Inteligência Competitiva (IC): Definida como "um processo sistemático e ético,
ininterruptamente avaliado, de identificação, coleta, tratamento, análise e disseminação da
informação estratégica para a empresa, viabilizando seu uso no processo
decisório" (GOMES; BRAGA, 2004). É o processo de coletar dados sobre a concorrência
para entender suas principais informações e antecipar seus próximos passos.
• Benefícios da IC: Similarmente à IE, a IC traz benefícios para marketing de produtos,
marketing digital, força de vendas, diretoria e gerência, equipe de operação e recursos
humanos, permitindo uma melhor compreensão do cenário competitivo e a identificação de
oportunidades. Segundo Gomes e Braga (2017), a IC contribui para decisões informadas,
antecipação de ações da concorrência, identificação de necessidades de clientes e busca
de informações sobre tecnologias e inovações.
• Roteiro para uma Pesquisa de IC Eficiente: O texto detalha cinco passos:
1. Identificar os concorrentes (diretos e indiretos).
2. Definir objetivos claros para a pesquisa ("O que queremos aprender?").
3. Determinar estratégias de coleta de dados (fontes de informação).
4. Reunir e analisar os dados (identificar padrões,pontos fortes e fracos da concorrência).
5. Transmitir insights para os principais interessados, contextualizando a importância das
descobertas.
• Distinção e Complementaridade: Embora distintas, IE e IC desempenham papéis
importantes no crescimento dos negócios a curto e longo prazo.
4. Ciclo da Inteligência Competitiva e Gestão de Conhecimento:
• Ciclo da Inteligência Competitiva: Apresenta um modelo genérico de seis etapas para
garantir o fornecimento de informações vitais para o negócio:
6. Identificação de concorrentes.
7. Identificação de oportunidades e ameaças.
8. Reunião das informações de diversas fontes.
9. Análise das informações para formar uma narrativa.
10. Disseminação das descobertas em relatórios claros.
11. Tomada de decisões com base nos resultados.
• Gestão de Conhecimento (GC): Enfatiza a importância de organizar, criar, usar e
compartilhar o conhecimento coletivo dentro de uma organização para melhorar a
eficiência operacional e acelerar a tomada de decisões. A GC se apoia em bases de
conhecimento e abrange três tipos de conhecimento:
• Tácito: Adquirido pela experiência, difícil de articular e codificar. Ex: habilidades de
liderança.
• Implícito: Existe em processos, know-how, precisa ser documentado.
• Explícito: Capturado em documentos (manuais, relatórios), facilmente compartilhado.
• Ciclo da Gestão de Conhecimento (Ciclo GC): Apresenta etapas para garantir o uso
eficiente dos recursos de conhecimento da organização:
1. Criar conhecimento (novas formas de fazer as coisas, benchmarking).
2. Capturar conhecimento (identificar valor em meio a dados).
3. Refinar o conhecimento (contextualizar, mesclar insights).
4. Armazenar o conhecimento (repositórios acessíveis).
5. Gerenciar o conhecimento (manter atualizado).
6. Disseminar o conhecimento (torná-lo disponível e divulgar seu uso).
Conclusão:
A análise de negócios, a inteligência empresarial e a inteligência competitiva são ferramentas
essenciais para as organizações na era da Indústria 4.0. A capacidade de analisar dados, obter
insights sobre o próprio negócio e o ambiente competitivo, e gerenciar o conhecimento
organizacional são cruciais para a tomada de decisões estratégicas, a otimização de processos e
a obtenção de um diferencial competitivo sustentável. A implementação eficaz dessas disciplinas,
com o suporte de tecnologias adequadas e uma compreensão clara de seus processos e
técnicas, pode impulsionar o sucesso e o crescimento das empresas.
Prova: Análise de Negócio e Inteligência Empresarial
1. Qual o principal propósito da análise de negócio e da inteligência empresarial no
contexto da nova economia?1 A) Reduzir a necessidade de tecnologia na gestão de negócios.
B) Simplificar a gestão de negócios, tornando-a mais artesanal. C) Tornar-se um diferencial
competitivo relevante, transformando dados em conhecimento essencial para a gestão de
negócios. D) Garantir que as empresas não precisem se adaptar à globalização. E) Diminuir a
importância da tomada de decisão empresarial.
2. Qual a principal diferença entre o BI "tradicional" e o BI "moderno" apresentados no
texto?2 A) O BI tradicional foca em dados não estruturados, enquanto o moderno usa apenas
dados estruturados. B) O BI moderno utiliza dados estruturados e não estruturados para
prever cenários futuros, aplicando tecnologias como machine learning e IA, enquanto o
tradicional foca na análise de dados estruturados para decisões estratégicas. C) O BI
tradicional é mais focado na melhoria da eficiência e produtividade. D) Não existe diferença
significativa entre os dois. E) O BI moderno é utilizado principalmente por pequenas empresas, e
o tradicional por grandes organizações.
3. Segundo o professor Vinha Júnior (2016), qual o objetivo principal da análise de
negócios?3 A) Apenas identificar problemas financeiros na organização. B) Identificar
problemas e necessidades do negócio, recomendar soluções viáveis, gerenciar requisitos e
facilitar a implementação bem-sucedida de produtos ou serviços. C) Garantir que os
funcionários sigam rigorosamente os processos existentes. D) Aumentar a complexidade dos
processos de tomada de decisão. E) Focar exclusivamente na extração e documentação de
dados.
4. Qual a principal finalidade de um Modelo de Inteligência Empresarial (BIM)?4 ... A) Ser um
produto ou sistema único para a gestão de dados. B) Oferecer oportunidades para as
empresas transformarem dados brutos em informações significativas e úteis para construir
planos estratégicos e criar insights para a tomada de decisões. C) Substituir a necessidade
de análise de dados por gestores. D) Coletar dados apenas de fontes externas à organização. E)
Garantir que as decisões sejam sempre tomadas em tempo real.
5. Qual a primeira etapa de um modelo genérico de Business Intelligence (BI) apresentado
no texto?6 A) Análise dos dados coletados. B) Filtragem dos dados relevantes. C)
Implementação e geração de relatórios. D) Coleta e entrada dos dados no sistema de BI. E)
Compartilhamento dos relatórios com as partes interessadas.
6. Qual o principal objetivo da Inteligência Competitiva (IC)?7 A) Apenas reduzir custos e
despesas da empresa. B) Promover a automação total dos sistemas empresariais. C) Coletar
dados sobre a concorrência, entender informações importantes e usar essas descobertas para
antecipar os próximos passos dos concorrentes e melhorar as iniciativas internas. D) Garantir que
a empresa sempre adote as mesmas estratégias dos concorrentes. E) Focar apenas nas
tendências gerais do mercado, sem analisar os concorrentes diretamente.
7. Qual a primeira etapa recomendada para uma pesquisa de inteligência competitiva
eficiente?8 A) Analisar os dados coletados. B) Determinar as estratégias de coleta de dados. C)
Transmitir insights para os principais interessados. D) Identificar os concorrentes diretos e
indiretos. E) Definir o orçamento para a pesquisa.
8. Qual a principal característica do conhecimento tácito?9 A) Ser facilmente documentado em
manuais e relatórios. B) Ser transferido com facilidade entre indivíduos. C) Ser adquirido através
da experiência e intuitivamente compreendido, tornando sua articulação e codificação
desafiadoras. D) Existir principalmente em bancos de dados e sistemas de informação. E) Não ter
valor para a organização.
9. Qual a importância da etapa de "Refinar o conhecimento" no ciclo de gestão do conhecimento
(GC)?10 A) Apenas armazenar o conhecimento em um repositório centralizado. B) Criar novas
formas de fazer as coisas sem considerar o contexto. C) Colocar o novo conhecimento no
contexto adequado, mesclando insights humanos com fatos explícitos para que ações
apropriadas possam ser executadas. D) Disseminar o conhecimento sem verificar sua relevância.
E) Capturar grandes volumes de dados sem identificar seu valor.
10. Segundo o texto, qual o objetivo final da análise de negócios para uma empresa?11 A)
Aumentar a complexidade dos processos internos. B) Manter os custos da empresa sempre
elevados. C) Ignorar novas oportunidades de crescimento. D) Minimizar custos, maximizar lucros,
identificar novas oportunidades de crescimento e implementar estratégias comprovadas para
atingir os objetivos estabelecidos. E) Dificultar o trabalho dos gestores de negócios.
--------------------------------------------------------------------------------
Gabarito:
1.
C
2.
B
gustavomarialva
Highlight
gustavomarialva
Highlight
gustavomarialva
Highlight
gustavomarialva
Highlight
3.
B
4.
B
5.
D
6.
C
7.
D
8.
C
9.
C
10.
D
Briefing Doc: Big Data e o Apoio à Decisão
Fonte: Excertos de "Bigdata e o Apoio à Decisão.pdf" da Prof.ª Daisy Albuquerque.
Propósito do Documento:
Este briefing documenta as principais temáticas, ideias e fatos apresentados no excerto "Bigdata
e o Apoio à Decisão.pdf", visando fornecer uma visão geral concisa e detalhada sobre o
conceito, a importância e a aplicação do Big Data no contexto empresariale tecnológico.
Principais Temas e Ideias:
1. Conceituação e Importância do Big Data:
• O Big Data é definido como a coleta, análise, transformação e interpretação de um grande
volume de dados com alta variedade e velocidade de geração. Requer soluções
específicas para manipulação de dados estruturados e não estruturados.
• Citação: "O Big Data está relacionado à coleta, análise, transformação e interpretação de
um grande volume de dados carregado de grande variedade e sendo gerado em alta
velocidade."
• A tecnologia de Big Data visa prever comportamentos de consumidores e clientes para
influenciar decisões de negócio e alcançar melhores resultados.
• Citação: "O Big Data é uma tecnologia que prevê os comportamentos dos consumidores e
clientes capazes de influenciar as decisões de negócio com o objetivo de conquistar
melhores resultados."
• O Big Data é mais do que apenas volume; envolve a velocidade de produção, as diversas
formas e as múltiplas origens dos dados.
2. Breve Histórico da Gestão de Dados:
• O texto traça uma linha do tempo da utilização de dados para agregar valor, desde a
contabilidade na Mesopotâmia até o surgimento do termo "Big Data" no início dos anos
2000.
• Marcos importantes incluem o método de John Graunt para calcular mortalidade, o uso do
termo "Inteligência de Negócios" por Richard Millar Devens, a invenção da máquina de
Hollerith para processamento do censo nos EUA, a criação do armazenamento em fita
magnética, a máquina de Turing, a primeira discussão sobre armazenamento de dados
(EDVAC), a criação de data centers e da World Wide Web.
• A "Era do Big Data" é marcada por estudos que quantificaram o volume de dados (Lyman e
Varian), a articulação dos 3Vs (Volume, Velocidade, Variedade) por Doug Laney e o
surgimento de ferramentas como Hadoop.
• Citação: "Doug Laney, analista famoso do Grupo Meta, publicou o artigo: Gestão de dados
3D: controlar o volume de dados, velocidade e variedade. Ele articulou a definição de Big
Data incluindo três Vs: volume, velocidade e variedade."
• O crescimento da Web 2.0, redes sociais e dispositivos móveis contribuiu
significativamente para o aumento exponencial do volume de dados.
• Citação: "A Web 2.0 evoluiu com o surgimento das redes sociais, e atualmente muito mais
dados são criados diariamente."
3. Definição Detalhada de Big Data:
• Big Data não é meramente um grande volume de dados, mas sim a extração de
informações significativas desses volumes para pautar estratégias e ações.
• Citação: "Na verdade, Big Data é a extração de informações de um volume enorme de
dados. Além de extrair informações, também atribui significado a elas, pautando
estratégias e ações."
• Pode ser conceituado como um conjunto de metodologias para capturar, armazenar e
processar grandes volumes de dados de diversas fontes para acelerar a tomada de
decisão e gerar vantagem competitiva.
• O diferencial reside na possibilidade de cruzar dados de diferentes fontes, gerando insights
rápidos e valiosos.
• Citação: "O grande diferencial do Big Data está na possibilidade de cruzamento dos dados
oriundos de diversas fontes, permitindo insights rápidos e preciosos."
• A essência do Big Data é gerar valor para os negócios, equilibrando o volume de dados
com o esforço de processamento e a velocidade para obter informações relevantes.
• Comentário: "A essência do conceito de Big Data está em gerar valor para os negócios."
4. Os "Vs" do Big Data:
• Inicialmente composto por três Vs (Volume, Velocidade, Variedade), o conceito evoluiu para
incluir até sete ou oito Vs.
• Volume: Enorme quantidade de dados gerados diariamente, com tendência de
crescimento exponencial.
• Citação: "Segundo a IBM (International Business Machines Corporation), nós geramos
mais de 2,5 exabytes de dados por dia."
• Velocidade: Rapidez na produção e necessidade de processamento ágil, muitas vezes em
tempo real, para que os dados não se tornem obsoletos.
• Dica: "Em se tratando de vantagem competitiva, pode ser mais interessante manipular
uma quantidade um pouco menor de dados em tempo real do que uma enorme
quantidade, que só poderá ser disponibilizada para uso depois de um tempo
considerável."
• Variedade: Diversidade de fontes e formatos dos dados (estruturados, não estruturados e
semiestruturados), representando um desafio na compilação e análise.
• Citação: "Os dados que manipulamos atualmente são oriundos de diversas fontes, como:
redes sociais, aplicativos, cookies, IoT, e-mails, dentre outros. Atualmente, cerca de 70%
dos dados gerados são dados não estruturados, que não seguem uma modelagem
padrão."
• Veracidade: Necessidade de garantir a confiabilidade e consistência dos dados, filtrando
informações desatualizadas ou imprecisas.
• Comentário: "Nosso desafio com a veracidade é determinar a relevância dos dados
disponíveis de forma que esses dados possam servir como um tipo de guia para o seu
planejamento com maior segurança."
• Valor: O retorno e os benefícios que a análise e interpretação dos dados geram para as
organizações e usuários.
• Citação: "Um dos mais importantes Vs do Big Data é o V de valor, valor que os dados
geram para as organizações e para os usuários."
• Visualização: A forma como os dados são apresentados e interpretados, utilizando
softwares de análise gráfica como Tableau e Power BI.
• Variabilidade: O entendimento e interpretação dos dados com base no seu contexto,
considerando que nem todos os dados se comportam da mesma maneira.
• Viscosidade: A dificuldade de navegação e integração entre dados variados.
5. Estruturação dos Dados:
• Dados Estruturados: Organizados em uma estrutura rígida e predefinida (ex: bancos de
dados relacionais).
• Citação: "Os dados estruturados são organizados e representados por uma estrutura
rígida e previamente planejada para armazená-los."
• Dados Não Estruturados: Possuem estrutura flexível ou inexistente (ex: textos, imagens,
vídeos, posts em redes sociais).
• Citação: "Os dados não estruturados são o oposto dos dados estruturados. Nos dados
não estruturados temos uma estrutura flexível e dinâmica, ou até mesmo sem estrutura."
• Dados Semiestruturados: Situam-se entre os dois, possuindo alguma estrutura, mas com
maior flexibilidade (ex: XML, JSON).
• Citação: "Os dados semiestruturados estão no meio termo entre os dados estruturados e
os não estruturados. Um dado semiestruturado possui estrutura, porém ela é mais flexível."
6. Tipos de Dados Quanto ao Estado:
• Dados em Movimento (Stream): Dados em trânsito na rede, difíceis de processar, mas
capazes de fornecer informações valiosas em tempo real (ex: live streaming).
• Citação: "Quando os dados estão em movimento, são considerados dados de stream, ou
melhor, dados em trânsito, que se movem na rede e de um lado para o outro, ou de um nó
para outro."
• Dados em Repouso (Data in Rest): Dados armazenados em um destino, não estando em
uso ou em trânsito, importantes para a operação e existência das organizações.
• Citação: "Os dados em repouso, ou Data in Rest, são os dados armazenados em um
determinado destino que não estão em uso nem viajando para outros destinos."
• Dados Pequenos (Small Data): Pequenas quantidades de dados de alta qualidade,
prontos para análise e tomada de decisão (ex: dados de ERP e CRM), complementares ao
Big Data.
• Citação: "Os dados pequenos, ou Small Data, são um termo utilizado para se referenciar
às pequenas quantidades de dados, ou uma quantia suficiente utilizada para a tomada de
decisão."
• Em resumo: "o Big Data é para as máquinas, enquanto o Small Data é para os seres
humanos."
7. Infraestrutura e Tecnologia de Big Data:
• O texto aborda conceitos de arquitetura como Manutenibilidade, Modularidade,
Performance e Escalabilidade.
• Define papéis como Big Data Application Provider, Big Data Framework Provider e Data
Consumer.
• Compara Data Warehouse (DW) e Data Lake (DL) como formas de armazenamentode
dados.
• DW: Armazém de dados consolidados, principalmente estruturados, com esquema
definido na escrita (ETL).
• DL: Repositório centralizado de todos os tipos de dados (estruturados, não estruturados,
semiestruturados) em formato bruto, com esquema definido na leitura (ELT), mais flexível e
escalável.
• Introduz o conceito de Data Lakehouse, que combina características de DW e DL,
suportando transações, governança de esquema, BI, armazenamento desacoplado da
computação e diversos tipos de dados e cargas de trabalho.
• Discute tecnologias de computação e rede para Big Data, incluindo bancos de dados
NoSQL (alternativa aos relacionais, com alta escalabilidade e desempenho) com modelos
chave-valor, família de colunas, documentos e grafos.
• Explica o modelo de programação distribuída MapReduce (Map, Shuffle/Sort, Reduce)
para processamento em lote de grandes volumes de dados.
• Apresenta o Hadoop, a primeira implementação open source de MapReduce, utilizando o
Hadoop MapReduce (HMR) para processamento e o Hadoop Distributed File System
(HDFS) para armazenamento distribuído. Menciona o ecossistema Hadoop com projetos
como Yarn, Avro, Pig, HBase, Cassandra e MongoDB.
8. A Estratégia de Big Data nas Empresas:
• A utilização estratégica do Big Data permite a captação e análise de informações de
consumidores com agilidade e precisão, gerando resultados de alto valor agregado.
• Vantagens: Melhores tomadas de decisão, estratégias de marketing mais eficazes
(direcionadas e personalizadas), obtenção de informações profundas sobre audiência e
mercado, redução de custos, antecipação de tendências, identificação de falhas
operacionais e comportamentos fraudulentos.
• Boas Práticas para a Estratégia de Big Data:Compreender as metas do negócio e os
dados disponíveis.
• Analisar necessidades de dados adicionais.
• Priorizar casos de uso.
• Identificar sistemas e ferramentas necessárias.
• Criar um roteiro de implantação.
• Avaliar habilidades internas e necessidades de treinamento.
• Implementar governança de dados e processos de gerenciamento de qualidade.
• A Lei Geral de Proteção de Dados (LGPD) é fundamental, regulando o tratamento de
dados pessoais e exigindo consentimento ou outra base legal para coleta e uso de dados.
• Citação: "Essa lei busca proteger o usuário do uso indevido e excessivo dos dados,
garantindo a segurança de suas informações e exigindo maior transparência das
empresas."
1. Passos para Implementar Big Data:Identificar os desafios da empresa.
2. Priorizar os problemas de negócios.
3. Utilizar fontes de dados relevantes.
4. Recorrer a dados internos e externos.
5. Escolher a ferramenta adequada (segurança, agilidade, precisão).
6. Saber quais dados usar e quais excluir.
9. Conclusão:
• O Big Data é uma tecnologia inovadora essencial para agregar valor e apoiar a tomada de
decisão nas empresas.
• Compreender seus conceitos, características e importância é crucial para profissionais de
TI.
• O conhecimento da infraestrutura de Big Data é necessário para uma implementação
eficiente.
• Um bom planejamento e estratégia na utilização do Big Data são diferenciais competitivos
para as empresas.
Este briefing documenta as principais ideias e fatos apresentados na fonte. Para uma
compreensão mais aprofundada, recomenda-se a leitura completa do material original.
Prova sobre Big Data e o Apoio à Decisão
1. Qual das alternativas abaixo melhor define Big Data, de acordo com o texto? a) Um
software específico para análise de dados financeiros1 . b) Um grande conjunto de dados
com milhões de registros1 . c) A extração de informações de um volume enorme de dados,
atribuindo significado para pautar estratégias e ações1 . d) Um tipo de banco de dados
relacional com alta capacidade de armazenamento2 . e) A simples coleta e armazenamento
de dados em alta velocidade3 . Gabarito: c)
2. Qual dos seguintes eventos históricos NÃO está diretamente relacionado à evolução do Big
Data, conforme apresentado no texto? a) A criação do método para calcular as mortes pela peste
bubônica por John Graunt4 . b) A invenção da máquina de Turing para decifrar códigos na
Segunda Guerra Mundial5 . c) A criação da World Wide Web por Tim Berners6 . d) A
popularização dos dispositivos móveis e redes sociais7 .... e) A invenção do telefone por
Alexander Graham Bell. Gabarito: e)
3. Doug Laney, em 2002, articulou a definição de Big Data incluindo três Vs. Quais eram eles? a)
Veracidade, Valor e Visualização9 . b) Volume, Variedade e Veracidade9 . c) Velocidade, Valor e
Variabilidade9 . d) Volume, Velocidade e Valor3 . e) Volume, Velocidade e Variedade10 . Gabarito:
e)
4. Qual dos "Vs do Big Data" está relacionado à confiabilidade e autenticidade dos dados? a)
Volume9 . b) Velocidade9 . c) Variedade9 . d) Veracidade9 .... e) Valor9 .... Gabarito: d)
5. Qual das seguintes opções descreve corretamente um Data Lake? a) Um banco de dados
relacional contendo principalmente dados estruturados2 . b) Um sistema de pagamento online
que comunica o consumidor, o banco e a operadora do cartão de crédito13 . c) Um repositório
que centraliza e armazena todos os tipos de dados gerados pela e para a empresa, em seu
estado bruto. d) Um diretório do NIST que contém sete volumes de documentos sobre
arquitetura de Big Data e) Uma plataforma de análise visual como Tableau ou Power BI17 ....
Gabarito: c)
6. O processo ETL (Extrair, Transformar, Carregar) é tradicionalmente utilizado em projetos de: a)
Data Lake19 . b) Data Warehouse20 . c) Data Lakehouse21 . d) Bancos de dados NoSQL22 . e)
Hadoop23 . Gabarito: b)
7. Qual das seguintes opções apresenta exemplos de bancos de dados NoSQL orientados a
documentos? a) DynamaDB, Redis, Voldemont24 . b) Hbase, Cassandra e Accumulo25 . c)
MongoDB, Elasticsearch e CouchDB26 . d) Neo4J, AllegroGraph, InfinitGraph27 . e) Oracle,
MySQL, PostgreSQL. Gabarito: c)
8. Qual das seguintes alternativas descreve a principal função do MapReduce no contexto de Big
Data? a) Armazenar grandes volumes de dados não estruturados28 . b) Gerenciar recursos e
agendar serviços em um cluster Hadoop29 . c) Facilitar a consulta de grandes conjuntos de
dados utilizando uma linguagem similar a SQL30 . d) Utilizar computação paralela distribuída
para transformar grandes volumes de dados em pedaços menores para processamento27 . e)
Garantir a segurança e a privacidade dos dados em um ambiente de Big Data31 . Gabarito: d)
9. De acordo com o texto, qual é um dos principais benefícios da utilização de Big Data pelas
empresas? a) Eliminar a necessidade de profissionais de TI3 . b) Garantir a total privacidade dos
dados dos clientes32 . c) Simplificar a coleta de dados estruturados33 . d) Auxiliar na tomada de
decisões mais eficazes e identificar tendências de mercado34 .... e) Reduzir completamente os
custos com infraestrutura de TI23 . Gabarito: d)
10. A Lei Geral de Proteção de Dados (LGPD) estabelece que a coleta e tratamento de dados
pessoais pelas organizações só são possíveis se justificados em bases legais. Qual das
alternativas abaixo apresenta uma dessas bases legais mencionadas no texto? a) Para fins de
análise interna e não compartilhamento com terceiros, independentemente do consentimento37 .
b) Para qualquer finalidade comercial, desde que os dados sejam anonimizados
posteriormente38 . c) Mediante consentimento do titular dos dados37 . d) Para a livre
comercialização dos dados com outras empresas38 . e) Para a coleta indiscriminada de dados
disponíveis publicamente na internet39 . Gabarito: c)
Data Warehouse
Fonte: Excertos de "Data Warehouse.pdf" do Prof. Sérgio Assunção Monteiro
Data: 26 de Outubro de 2023
Propósito: Este documento fornece um resumo dos principais temas, ideias e fatos
apresentados nos excertos do material sobre Data Warehouse (DW). O objetivo é consolidar o
conhecimento essencial sobre o tema, incluindo conceitos fundamentais, arquiteturas, modelos
de dados e etapasde implementação.
Principais Temas e Ideias:
1. Introdução e Propósito do Data Warehouse:
• Um Data Warehouse (DW) é definido como um repositório de dados históricos, essencial
para o suporte à tomada de decisão.
• Citação: "Um data warehouse (DW) é um repositório de dados históricos. Ele é a base para
qualquer solução que tenha como objetivo dar suporte à tomada de decisão."
• O aumento da demanda por serviços de qualidade pressiona as empresas a utilizarem
dados para entender melhor as necessidades dos consumidores. O DW surge como uma
solução para fornecer informações essenciais para decisões mais precisas e efetivas.
2. Ambiente de Data Warehouse e Data Marts:
• Diferença entre DW e Bancos de Dados Transacionais: O DW é um banco de dados
relacional construído para consultas e análises, diferente dos bancos de dados
transacionais (OLTP) focados em persistência de dados e operações CRUD (Criar, Ler,
Atualizar, Deletar) para o dia a dia.
• Citação: "Um DW possui um conjunto de dados históricos que podem ter origem de
diferentes fontes. Assim, podemos utilizá-los de modo integrado como uma fonte relevante
que alimente modelos e algoritmos que serão usados para dar suporte aos tomadores de
decisão."
• Características Gerais de um DW:Não transacional e voltado para análise.
• Utilizado por diversas aplicações.
• Normalmente utilizado por um pequeno grupo de pessoas com foco investigativo.
• Centralização do histórico de dados de diferentes fontes.
• Principal operação é a leitura.
• Tabelas podem conter grande volume de dados.
• Características Específicas de um DW (Orientado ao Assunto, Integrado, Tempo Variável,
Não Volátil):Orientado ao assunto: Dados organizados em torno de temas principais
(clientes, produtos, vendas) para suporte à decisão.
• Citação: "Significa que o conjunto dos dados tem um tema principal, como clientes,
produtos ou vendas. E por que isso ocorre? Devemos lembrar desta resposta
constantemente: para fornecer informação relevante como suporte para tomada de
decisão."
• Integrado: Agregador de dados de diversas fontes, utilizando o processo ETL (Extração,
Transformação e Carga).
• Citação: "O DW é um grande agregador de dados que podem ter origem em diversas
fontes, como outros bancos de dados e arquivos. O processo de integração de dados é
conhecido pela sigla ETL..."
• Tempo variável (Histórico): Foco em dados históricos para comparações, crucial para a
tomada de decisão.
• Não volátil: Dados inseridos não devem ser alterados ou excluídos, apenas incluídos e
consultados.
• Data Mart (DM): Subconjunto de informações do DW, orientado a uma finalidade
específica para atender necessidades de negócios (ex: vendas de um departamento
específico).
• Pode ser alimentado pelo DW ou por outras fontes.
• Aumenta o foco dos dados para funções de negócios específicas.
• Útil para Business Intelligence (BI), facilitando o acesso a dados relevantes e a imposição
de regras de acesso.
• Tipos de Data Marts:Dependente (Top-down): Subconjunto lógico do DW.
• Independente (Bottom-up): Criados primeiro e depois compostos para formar o DW.
• Híbrido: Combina dados do DW e outras fontes.
• Benefícios e Comparações entre DW e DM:DW: Conjunto abrangente de dados
históricos centralizados e confiáveis, base para modelos e algoritmos, desempenho
otimizado para acesso a dados.
• DM: Benefícios semelhantes ao DW, mas com foco em segmentos específicos, menor
tempo de construção, facilidade de manutenção e inclusão de novas fontes.
• Diferenças: Escopo (DW abrange o negócio como um todo, DM focado em unidades),
granularidade (DW mais detalhado), centralização (DW centralizado, DM pode ser
descentralizado).
3. Arquitetura de um Data Warehouse:
• A arquitetura define os itens estruturais do DW, incluindo:
• Armazenamento dos dados: Persistência dos dados em DWs ou DMs, logicamente
organizados para localização, consulta e configuração.
• Metadados: Informações sobre os dados (fontes, nomes de tabelas/colunas).
• Qualidade dos dados: Processos para detecção e limpeza de incoerências.
• Governança: Alinhamento dos dados aos objetivos de negócios, ciclo de vida e controle
de acesso.
• Citação: "Os dados precisam estar alinhados aos objetivos dos negócios da organização.
Por isso mesmo, eles são ativos de valor que precisam de um tratamento explícito que
cubra o ciclo de vida e controle de acesso."
• Usuários: Definição de perfis e operações permitidas.
• Propriedades da Arquitetura de DW:Isolamento: Manter a separação entre
processamento analítico e transacional.
• Escalabilidade: Capacidade de receber, processar e transmitir grandes volumes de dados
em alta velocidade e diferentes formatos.
• Extensibilidade: Permitir a adição de novas funcionalidades conforme as demandas de
negócios.
• Segurança de dados: Implementação de mecanismos para proteger dados valiosos, com
operações mapeadas por papéis e rastreáveis.
• Bem documentado: Documentação completa para consulta, manutenção e treinamento.
• Tipos de Arquiteturas de DW:Camada Única: Reduzir o volume de dados armazenados,
utilizada para processar dados operacionais.
• Duas Camadas: Separação das fontes de dados físicas do DW (sistema DW e servidor de
banco de dados), melhor organização, tolerância a falhas e segurança, mas limitada em
expansão e número de usuários.
• Três Camadas: Modelo mais utilizado atualmente:
• Primeira camada: Repositório de dados e garantia de suas propriedades.
• Segunda camada: Reorganização dos dados em estrutura OLAP (OnLine Analytical
Processing) para otimizar o acesso.
• Terceira camada: Utilização de APIs para acesso por outras aplicações analíticas.
• Vantagens da Arquitetura de DW:Velocidade para recuperação de dados (centralização e
padronização).
• Identificação e correção de erros (processo de limpeza e transformação).
• Facilidade de integração (repositório confiável para outras ferramentas).
• Desvantagens da Arquitetura de DW:Preparação demorada (tratamento dos dados antes
da inserção).
• Limitações de compatibilidade (soluções de software proprietárias).
• Custos de manutenção (correções, ajustes e melhorias).
• Uso limitado devido a informações confidenciais (necessidade de segurança robusta).
4. Modelo Estrela x Modelo Floco de Neve:
• Conceitos Fundamentais: Tabelas, chaves primárias, chaves estrangeiras,
relacionamentos (um para um, um para muitos/muitos para um, muitos para muitos),
esquemas estrela e floco de neve, tabela de fato (mede os negócios), tabela de dimensão
(descreve aspectos), metadados (dados sobre os dados).
• Esquema Estrela:Estrutura mais comum, com uma tabela de fatos central relacionada a
várias tabelas de dimensões em um relacionamento um para muitos.
• Citação: "Esquema estrela é a forma mais comum de estruturar os dados de um DW.
Basicamente, esse esquema possui uma tabela de fatos no centro relacionada a várias
tabelas de dimensões."
• Facilita consultas devido às referências de chaves estrangeiras.
• Dados das tabelas de dimensão são desnormalizados para otimizar a velocidade da
consulta (pode gerar redundância).
• Benefícios: Otimização do tempo de resposta das consultas, compatibilidade com a
maioria das ferramentas de BI.
• Desvantagens: Dificuldade em modificar a estrutura (inserir novas dimensões),
redundância de dados (em alguns cenários), impacto no desempenho de consultas
personalizadas por usuários.
• Esquema Floco de Neve:Extensão do esquema estrela, com normalização das tabelas de
dimensão.
• Tabela de fatos central cercada por hierarquias de tabelas de dimensão.
• Relacionamentos um para muitos entre a tabela de fatos e as dimensões de primeiro nível,
e entre os diferentes níveis de dimensões.
• Citação: "O esquema floco de neve (Snowflake) é uma extensão do esquema estrela. Sua
principal característica é a normalização das tabelas de dimensão de um esquema em
estrela."
• Benefícios: Eliminação da redundânciade dados (devido à normalização), melhor
utilização dos recursos de armazenamento, facilidade para atualizar dados e adicionar
novas dimensões.
• Desvantagens: Maior tempo para carregar dados nas tabelas de dimensões
(normalização), desempenho prejudicado nas consultas (necessidade de mais joins).
5. Etapas Fundamentais de um Projeto de Data Warehouse:
• Motivação para Desenvolver um DW: Agregação de valor para o negócio, consolidação
de dados para relatórios analíticos, suporte à tomada de decisão baseada em fatos,
automatização de relatórios, criação de cultura de dados, consolidação da segurança de
dados.
• Componentes de Arquitetura a Considerar:Origem dos dados: Tipos de bancos de
dados, formatos de arquivos, dados de IoT e nuvem.
• Citação: "Precisamos determinar quais são as tecnologias de bancos de dados – por
exemplo, Oracle, SQL Server, PostgreSQL e MySQL –, quais os formatos dos arquivos e se
vamos utilizar captura de dados de sistemas mais elaborados, como dispositivos de
Internet das Coisas (IoT) e dados hospedados na nuvem..."
• Área de preparação de dados: Para transformação antes do carregamento no DW.
• Armazenamento de dados: Destino dos dados tratados.
• Governança de dados e gerenciamento de metadados.
• Documentação das etapas.
• Etapas de Construção do DW:Definição de requisitos de negócios: Entendimento dos
objetivos da organização e dos departamentos, métricas, processos críticos, foco (interno/
clientes), frequência e tipo de análises. Utilização de checklists para estruturar as
perguntas.
• Citação: "Este é o passo mais importante na construção de um DW: os requisitos de
negócios. O DW precisa estar alinhado ao negócio da organização como uma fonte
confiável e valiosa de dados que alimentem sistemas analíticos e, assim, dê suporte à
tomada de decisão."
• Seleção de tecnologia: Escolha de softwares (comerciais ou livres), fornecedores, tipos de
licença, volume de dados, tempo de resposta para processamento, impacto no ambiente
tecnológico atual, competências técnicas necessárias, configurações de segurança, tipo
de implantação (local ou nuvem).
• Projeto de ambiente: Mapeamento das fontes de dados, identificação de tipos e
estruturas de dados, estimativa de volume e periodicidade, modelagem lógica (entidade-
relacionamento) e física (estruturas de banco de dados), modelagem do DW (estrela, floco
de neve ou hierárquico com DMs), conexão de todas as partes.
• Desenvolvimento: Construção dos projetos de ETL e dos projetos de análise (integração
com ferramentas analíticas). Importância do treinamento da equipe. Resultado: unidade
lógica do projeto DW.
• Suporte e manutenção: Definição de perfis e controles de acesso, associação de
usuários, correção de erros, melhorias contínuas, implantação em novos clientes. Garantir
o funcionamento a longo prazo e o aproveitamento dos benefícios.
• Papéis de Responsabilidade no Projeto DW:Gestor de projeto: Define escopo, plano,
orçamento, recursos e prazos, gerencia tarefas.
• Analista de negócios: Identifica requisitos dos usuários e traduz para a equipe técnica,
realiza entrevistas e documenta.
• Modelador de dados: Responsável pela modelagem lógica e física dos dados e pela
arquitetura do DW.
• Administrador de banco de dados (DBA): Traduz modelos lógicos para físicos, ajusta
desempenho, garante disponibilidade e integridade, planeja e executa backups e
recuperação.
• Desenvolvedor ETL: Implementa os processos de extração, transformação e carregamento
de dados.
• Engenheiro de qualidade: Garante o funcionamento adequado do sistema, planeja testes,
atua como arquiteto de soluções, desenvolve automação (DevOps), atua como instrutor.
6. Conclusão:
• A construção de um DW envolve decisões importantes tanto do ponto de vista de negócios
quanto técnico.
• É crucial mobilizar pessoas dentro da organização e fazer escolhas de arquitetura que
impactarão a prestação de serviços.
• As etapas para desenvolver e implantar um DW, assim como os diversos perfis
profissionais envolvidos, são fundamentais para o sucesso do projeto.
Este briefing documenta as informações essenciais extraídas dos excertos fornecidos,
oferecendo uma visão geral abrangente sobre o conceito, a arquitetura, os modelos e o processo
de implementação de um Data Warehouse.
Teste sobre Data Warehouse
Questão 1: Qual das seguintes alternativas apresenta uma característica fundamental de um
Data Warehouse (DW)?
A) Ser um banco de dados transacional otimizado para operações CRUD (Criar, Ler, Atualizar,
Excluir). B) Manter dados históricos centralizados como fonte de dados para análises1 .... C)
Garantir alta velocidade nas operações de inserção e modificação de dados em tempo real. D)
Priorizar a exclusão de dados redundantes para otimizar o espaço de armazenamento. E) Permitir
que todas as pessoas da organização realizem alterações nos dados históricos.
Questão 2: Qual a principal diferença entre um Data Warehouse (DW) e um Data Mart (DM)?
A) O DW é focado em unidades de negócio específicas, enquanto o DM possui uma visão mais
geral dos dados. B) O DM contém dados históricos detalhados de diversas fontes, enquanto o
DW foca em dados operacionais atuais. C) O DM é focado em unidades do negócio, enquanto
o DW é mais geral4 .... D) O DW é utilizado principalmente para alimentar aplicações de
Business Intelligence (BI), enquanto o DM é usado para sistemas transacionais. E) Não existe
diferença fundamental entre DW e DM, sendo ambos utilizados para os mesmos propósitos.
Questão 3: Qual das seguintes opções descreve corretamente a arquitetura de três camadas de
um Data Warehouse?
A) Consiste em um sistema DW integrado diretamente às fontes de dados físicas. B) Envolve a
utilização de um DW e um servidor de banco de dados, separando as fontes físicas do sistema
analítico. C) Possui uma camada para o repositório de dados, uma camada OLAP para
otimizar o acesso e uma camada com APIs para acesso de outras aplicações analíticas7 .
D) Tem como principal objetivo reduzir o volume de dados armazenados, sendo utilizada para
processar dados operacionais. E) É caracterizada pela ausência de um repositório de dados
centralizado, com os dados sendo processados diretamente nas fontes.
Questão 4: No contexto de modelagem de dados para Data Warehouse, qual a principal
característica do esquema estrela?
A) A normalização das tabelas de dimensão para evitar redundância de dados. B) Uma estrutura
complexa com múltiplos níveis de hierarquia entre as tabelas de dimensão. C) Uma tabela de
fatos central conectada diretamente a várias tabelas de dimensões8 .... D) A utilização
exclusiva de tabelas de fatos para armazenar todas as informações relevantes para análise. E) A
otimização das operações de inserção e atualização de dados nas tabelas.
Questão 5: Qual das seguintes etapas é considerada a mais importante na construção de um
projeto de Data Warehouse (DW)?
A) A seleção da tecnologia de hardware e software a ser utilizada. B) O projeto do ambiente físico
de armazenamento dos dados. C) O desenvolvimento dos processos de ETL (Extração,
Transformação e Carga). D) A definição dos requisitos de negócios, alinhando o DW aos
objetivos da organização12 . E) A fase de suporte e manutenção do sistema após a sua
implementação.
Gabarito:
1.
B
2.
C
3.
C
4.
C
5.
D
Briefing Doc: Sistemas de Apoio à Decisão
Fonte: Excertos de "Sistemas de Apoio à Decisão.pdf" do Prof. Sérgio Assunção Monteiro
Data: [Inserir Data Atual]
Propósito: Este documento fornece um resumo detalhado dos principais temas, ideias e fatos
apresentados nos excertos do material "Sistemas de Apoio à Decisão.pdf". O objetivo é oferecer
uma visão concisa e abrangente sobre o conceito, tipos, componentes e aplicações empresariais
dos Sistemas de Apoio à Decisão (SAD).
Principais Temas e Ideias:
1. Introdução e Conceitos Fundamentais:
• Demanda Organizacional: Os SAD surgem para atender à crescente necessidadedas
organizações em diversas áreas de otimizar seus processos, especialmente em um
mercado com grande oferta e consumidores exigentes por preço e qualidade.
• "Os sistemas de apoio à decisão surgiram para atender a essa demanda de melhoria do
desempenho das organizações."
• Objetivo Primário: O objetivo central dos SAD é fornecer elementos (informações
fundamentadas) que apoiem as escolhas e decisões dentro das organizações.
• "...todos têm o mesmo objetivo: fornecer elementos que fundamentem as escolhas."
• Tipos de Decisão: O texto distingue entre decisões programadas (rotineiras,
automatizadas) e não programadas (não previstas, exigindo adaptação). O ideal é focar em
decisões programadas para aumentar a previsibilidade, mas também investir em
treinamento para lidar com as não programadas.
• Programadas: "São o resultado de processos organizados e, algumas vezes,
automatizados."
• Não programadas: "São situações não previstas e que, portanto, não fazem parte da
rotina de trabalho."
• Definição de SAD: Um SAD é uma aplicação computacional que auxilia no processo de
tomada de decisões, interagindo com o usuário de diferentes maneiras (personalizado,
guiado).
• "Um sistema de suporte à decisão é uma aplicação computacional que auxilia como
suporte para tomar decisões."
• Elementos Essenciais de um SAD: Um SAD é composto por três eixos principais:
• Base de Conhecimento (Dados): Dados corretos e atualizados são cruciais para alimentar
os modelos e algoritmos. A gestão do ciclo de vida dos dados e a segurança da
informação são importantes.
• "A base de conhecimento é composta por dados. São eles que nos permitem alimentar os
modelos e os algoritmos."
• Modelo de Gerenciamento do Sistema: Envolve as estratégias de tomada de decisão
para analisar dados e estudar possíveis cenários. Diferentes técnicas podem ser aplicadas
aqui, dependendo das necessidades e recursos.
• "O modelo de gerenciamento, por sua vez, é formado por diferentes estratégias de tomada
de decisão."
• Interface de Usuário: A aplicação que exibe os resultados do processamento, podendo
ser interativa ou estatística.
• "A interface do usuário é uma aplicação que exibe o resultado do processamento do
modelo de gerenciamento."
• Estratégias do Modelo de Gerenciamento: O texto destaca quatro estratégias principais:
• Sistemas baseados em regras: Associam recomendações à ocorrência de eventos (ex:
controle de estoque).
• "Trata-se do tipo mais comum de sistema de suporte à tomada de decisão. Basicamente,
tais sistemas são compostos por regras de negócio que associam recomendações a partir
da ocorrência de um evento."
• Sistemas baseados em indicadores: Utilizam indicadores de desempenho (KPIs) para
monitorar o negócio (ex: MTBF em manutenção).
• "Trata-se de uma solução bastante comum em aplicações de inteligência de negócios (BI -
Business intelligence) em que os principais controles de um negócio são associados a
indicadores de desempenho (KPI - Key performance indicator)."
• Sistemas baseados em algoritmos de otimização: Resolve problemas complexos de
programação linear, inteira, etc. (ex: roteamento, carteiras de investimento).
• "Trata-se de algoritmos sofisticados para resolver problemas de programação linear, inteira,
combinatória, mista e não linear."
• Sistemas baseados em aprendizado de máquina: Aprendem com a experiência e
generalizam informações (ex: reconhecimento de imagens).
• "Trata-se de sistemas que baseiam-se no aprendizado com a experiência, ou seja, os
algoritmos extraem informações de uma base de conhecimento e as generalizam."
2. Tipos de Sistemas de Apoio à Decisão:
• Classificação: Os SAD podem ser classificados em cinco categorias principais:
• Orientado a dados: Baseia-se na detecção de padrões nos dados (tendências,
sazonalidades) para auxiliar em decisões sobre estoque, vendas, etc.
• "Tais sistemas utilizam técnicas que se baseiam na detecção de padrões nos dados."
• Orientado por modelo: Personalizado para contextos específicos, auxiliando na análise de
diferentes cenários (ex: decisões de crédito, previsão de demanda).
• "Esses sistemas são construídos para atender a contextos específicos. Na prática, isso
significa que eles são personalizados de acordo com um conjunto predefinido de requisitos
do usuário para ajudar na análise de diferentes cenários que satisfaçam a determinadas
condições."
• Orientado à comunicação e de grupo: Focado em aumentar a interatividade entre
usuários por meio de ferramentas colaborativas (questionários online, brainstorming).
• "Um sistema de apoio à decisão orientado à comunicação e de grupo tem como objetivo
aumentar a interatividade entre os usuários por meio de recursos colaborativos."
• Orientado a conhecimento: Utiliza uma base de conhecimento de técnicas e regras para
fornecer informações compatíveis com os processos de negócios.
• "Utiliza uma base de conhecimento formada por um conjunto de técnicas e regras que
permite fornecer informações aos usuários compatíveis com os processos de negócios das
organizações em que trabalham."
• Orientado a documentos: Recupera informações dentro de documentos corporativos
(políticas, especificações, atas).
• "Recupera informações dentro de documentos."
• Benefícios dos SAD: A utilização de SAD traz diversos benefícios, como padronizar o
processo de tomada de decisão, aumentar a efetividade das decisões, garantir decisões
fundamentadas, simular cenários, realizar comparações e fundamentar decisões com
velocidade, além de proporcionar um posicionamento estratégico.
• "A utilização desse tipo de sistema traz diversos benefícios para a organização."
3. Componentes de Sistemas de Apoio à Decisão:
• Arquitetura Tradicional: Um SAD tradicionalmente possui quatro componentes principais
interrelacionados, com o usuário no centro:
• Componente de Banco de Dados: Gerencia todas as fontes de entrada de dados
(estruturados, semiestruturados, não estruturados, internos, externos, de especialistas).
• "Trata de todas as fontes de entradas de dados;"
• Componente de Modelagem: Contém as técnicas matemáticas, estatísticas, algoritmos
de aprendizado de máquina, regras de negócio e conhecimento de especialistas para
processar os dados e gerar recomendações.
• "Utiliza técnicas matemáticas e estatísticas, algoritmos de aprendizado de máquina, regras
de negócio e conhecimento dos especialistas;"
• Componente de Comunicação: Abrange a tecnologia de hardware e software que permite
a interconexão e o funcionamento do sistema.
• "Cobre todos os aspectos da tecnologia de hardware e software, que permite o
funcionamento do sistema por meio da interconexão dos demais componentes;"
• Componente de Interface Gráfica: Inclui os elementos visuais e de interação que
facilitam a comunicação entre o usuário e o sistema (entrada de dados, análise de
resultados, ajustes). A experiência do usuário (usabilidade, responsividade) é crucial.
• "Abarca todos os itens visuais e os aspectos de interação que facilitem a interação do
usuário com o sistema."
• Foco na Solução e no Usuário: O texto enfatiza que o SAD é um meio para auxiliar o
gestor na tomada de decisão, e não uma solução absoluta. A confiança do gestor na
recomendação é fundamental, assim como a facilidade de entendimento e a
contextualização da solução.
• "O papel central da decisão é do gestor, pois é ele que deve decidir se confia o suficiente
na recomendação dada pelo sistema para utilizá-la."
• Importância da Cooperação entre Componentes: Os componentes do sistema devem
cooperar para tornar os detalhes técnicos transparentes para o tomador de decisão.
4. Aplicações Empresariais:
• Gerenciamento e Papéis de Responsabilidade: Uma boa gestão envolve definir metas
para cada parte do negócio e desenvolver rotinas de trabalho que permitam registrar
ocorrências, analisar desempenho, ajustar atividades, identificar boas práticas e
desenvolver estratégias.É crucial atribuir papéis de responsabilidade e gerenciar
demandas de clientes, ciclo de vida dos dados, controle de processos e tomada de
decisões fundamentadas.
• Distinção entre Produtos e Serviços: Compreender se a organização foca em produtos
(itens tangíveis) ou serviços (atividades sistematizadas) é importante para direcionar a
aplicação dos SAD. Muitas empresas combinam ambos.
• ERP (Enterprise Resource Planning): Sistemas de software que integram aplicações com
diferentes objetivos (compras, finanças, RH, estoque) em um sistema multifuncional com
módulos interconectados. Benefícios incluem eliminação de inconsistências e redução de
trabalho redundante, além de uma unidade central de gerenciamento. A integração com
SAD é vital, com o ERP fornecendo fontes de dados e regras de negócio para o SAD, e o
SAD auxiliando o ERP com projeções, otimização de estoque, detecção de irregularidades,
etc.
• "Os sistemas ERP (enterprise resource planning), ou sistema de planejamento de recursos
empresariais, são soluções de software que integram aplicações com diferentes
objetivos..."
• CRM (Customer Relationship Management): Sistemas especializados na automatização
dos processos de atendimento ao cliente (formulários automatizados, atendimento
automático com reconhecimento de voz, chatbots). O CRM padroniza o atendimento,
melhora a relação custo-benefício e coleta informações valiosas dos clientes que podem
alimentar os SAD para melhorar a qualidade dos serviços.
• "CRM (customer relationship management), ou gestão de relacionamento com o cliente,
trata-se de sistemas especializados na automatização dos processos de atendimento ao
cliente."
• SCM (Supply Chain Management): Sistemas focados na integração entre fornecedores e
consumidores para otimizar o fluxo de bens e serviços. Os SAD auxiliam o SCM em
diversas etapas da logística, como projeção de vendas, controle de validade,
recomendações de ofertas (em redes de supermercados), escolha de fornecedores,
controle de custos (em redes de franquias) e planejamento logístico (em grandes eventos),
garantindo que a demanda dos clientes seja atendida eficientemente.
• "SCM (supply chain management), ou gestão das cadeias de suprimentos, trata-se de
sistemas focados na integração entre os fornecedores e os consumidores com o objetivo
de prover parcerias que abordem o fluxo de bens e serviços."
5. Conclusão:
• Relevância e Necessidade: Os SAD são ferramentas cruciais para obter resultados
excelentes nos negócios, abrangendo desde conceitos básicos até aplicações práticas
como ERP, CRM e SCM.
• Trabalho Multidisciplinar: O desenvolvimento e a implementação de SAD envolvem
diferentes perfis de profissionais, todos com o objetivo de fornecer uma ferramenta que
melhore a qualidade das decisões do usuário final.
• Melhoria Contínua: Em um cenário de crescente pressão por melhoria de processos, o
conhecimento sobre SAD se torna cada vez mais relevante e aumenta o valor profissional
no mercado.
Próximos Passos (Sugestões da Fonte):
• Pesquisar sobre CRM no site CRM.org.
• Pesquisar sobre automação de decisões no site oficial da IBM.
Este briefing documenta os principais pontos abordados nos excertos fornecidos, oferecendo
uma base sólida para a compreensão dos Sistemas de Apoio à Decisão e suas aplicações no
contexto empresarial.
Briefing Doc: Análise de Negócio e Inteligência Empresarial
Briefing Doc: Big Data e o Apoio à Decisão
Data Warehouse