Prévia do material em texto
Verifique o seu desempenho e continue treinando! Você pode refazer o exercício quantas vezes quiser. A B 1 Big Data surgiu a partir da necessidade de manipular um grande volume de dados e, com isso, novos conceitos foram introduzidos, como o Data Lake, que: é depósito de dados relacionados, porém orientado por assunto e por coluna. é um aplicativo para armazenamento de bases de dados relacionais com esquemas de tabelas relacionadas entre si. Questão de 10 Corretas Incorretas Em branco 1 2 3 4 5 6 7 8 9 10 Bigdata e o… C D E é um ambiente de manipulação de dados, com a função de visualização dos dados através de relatórios e dashboards de maneira amigável para os analistas de negócio e não desenvolvedores. é um tipo de repositório que armazena conjuntos grandes e variados de dados brutos em formato nativo. é uma espécie de lago de dados não estruturados, porém armazenando somente texto e fotos. Opa! A alternativa correta é a letra D. Confira o gabarito comentado! Um data lake ou na tradução lago de dados é um sistema ou repositório de dados armazenados em seu formato natural / bruto, geralmente objetos blobs (objetos de imagem, áudio ou outros objetos multimídia) ou arquivos. A alternativa "é depósito de dados relacionados, porém orientado por assunto e por coluna" está errado porque os dados não precisam estar relacionados e, portanto, não é orientado por assunto. A alternativa "é um aplicativo para armazenamento de bases de dados relacionais com esquemas de tabelas relacionadas entre si" está errado porque não é um conjunto de dados relacionais e não precisa haver relacionamentos entre tabelas de diferentes esquemas - os dados são de diversos formatos e de diversas fontes. A alternativa "é um ambiente de manipulação de dados, com a função de visualização dos dados através de relatórios e dashboards de maneira amigável para os analistas de negócio e não desenvolvedores" está errado porque não é o resultado de operações de mineração de dados - são dados brutos sem tratamento e da maneira que foram capturados. 2 �CESPE � 2017 � TCE�PE � Auditor de Controle Externo - Auditoria de Contas Públicas - questão adaptada) Com relação a fundamentos e conceitos de Big Data, julgue os itens a seguir. I � Além de estar relacionado à grande quantidade de informações a serem analisadas, o Big Data considera o volume, a velocidade e a variedade dos dados estruturados - dos quais se conhece a estrutura de armazenamento - bem como dos não estruturados, como imagens, vídeos, áudios e documentos. II � Big Data refere-se a uma nova geração de tecnologias e arquiteturas projetadas para processar volumes muito grandes e com grande variedade de dados, permitindo alta velocidade de captura, descoberta e análise. III � De maneira geral, Big Data não se refere apenas aos dados, mas também às soluções tecnológicas criadas para lidar com dados em volume, variedade e velocidade significativos. A B C D E Estão certos apenas os itens: Os itens I � II � III estão corretos. Apenas o item I está correto. Apenas o item III está correto. Apenas os itens II e III estão corretos. Apenas os itens I e III estão corretos. Opa! A alternativa correta é a letra A. Confira o gabarito comentado! Big Data é um conceito que se refere ao grande volume de dados, tanto estruturados quanto não estruturados, que impactam as empresas diariamente. Os dados estruturados são aqueles que possuem uma estrutura predefinida, com categorias e definições claras, como localização, vendas e informações sobre o perfil de clientes, contatos, entre outros. Já os dados não estruturados são dados de mídias sociais, como YouTube, Facebook, portais de notícias, etc. Além disso, o Big Data não se refere apenas aos dados em si, mas também às soluções tecnológicas desenvolvidas para lidar com esses dados A B C em grande volume, variedade e velocidade. Portanto, todos os itens I, II e III estão corretos. 3 �INSTITUTO AOCP � 2019 � UFFS � Analista de Tecnologia da Informação) Bancos de Dados não relacionais, também conhecidos como NoSQL, surgiram para armazenar dados não estruturados, usando modelos de armazenamento específicos para os tipos de dados que são armazenados, usualmente, fugindo do padrão de armazenamento de linhas e colunas dos bancos de dados tradicionais. Em relação ao Banco de Dados NoSQL, quais são as categorias consideradas para esse tipo de armazenamento? Armazéns chave-valor; Banco de dados orientados a documentos; Banco de dados de grafos. Primeira forma normal; Banco de dados orientados a documentos; Normalização. Armazéns chave-valor; Normalização; Banco de dados orientados a coluna. D E Banco de dados de grafos; Banco de dados orientados a linha; Formas normais de armazenamento. Banco de dados orientados a linha; Normalização; Banco de dados orientados a coluna. Opa! A alternativa correta é a letra A. Confira o gabarito comentado! Os Bancos de Dados NoSQL são uma alternativa aos bancos de dados relacionais tradicionais e são projetados para lidar com dados não estruturados. Eles são categorizados em quatro tipos principais: armazéns chave-valor, bancos de dados orientados a documentos, bancos de dados de grafos e bancos de dados orientados a coluna. A alternativa a correta é que menciona três dessas categorias: armazéns chave-valor, bancos de dados orientados a documentos e bancos de dados de grafos. As outras alternativas mencionam conceitos que são mais aplicáveis a bancos de dados relacionais, como normalização e formas normais, que não são categorias de bancos de dados NoSQL. A B C D E 4 ( FAURGS � 2018 � TJ�RS � Administrador de Banco de Dados) Os dados _______ são armazenados em ________. Os dados ________ misturam nomes de tipos de dados e valores de dados, mas nem todos eles precisam seguir uma estrutura predefinida fixa. Os dados ________ referem-se à informação exibida na Web, caso em que a informação sobre os tipos dos itens de dados não existe. Assinale a alternativa que completa, correta e respectivamente, as lacunas do texto acima. semiestruturados / banco de dados tradicionais / estruturados / não estruturados não estruturados / XML / semiestruturados / estruturados estruturados / HTML / não estruturados / semiestruturados estruturados / bancos de dados tradicionais / semiestruturados / não estruturados semiestruturados / web / estruturados / não estruturados Parabéns, você selecionou a alternativa correta. Confira o gabarito comentado! Os dados podem ser divididos em três categorias, como Dados estruturados, Dados semiestruturas e Dados não estruturados. Os Dados estruturados são organizados e representados por uma estrutura rígida e previamente planejada para armazená-los. Os Dados não estruturados são o oposto dos dados estruturados. Nos dados não estruturados temos uma estrutura flexível e dinâmica ou até sem estrutura. Os dados semiestruturados estão no meio termo entre os dados estruturados e os dados não estruturados. Um dado semiestruturado possui estrutura, porém ela é mais flexível. 5 Em um mundo cada vez mais conectado, o Big Data é um dos temas mais relevantes do mercado de TI. O seu conceito é composto pelos Vs, relacione cada V com seu significado, associe os itens, utilizando o código a seguir: I� Volume. II� Velocidade. III� Variedade. IV� Valor. ( ) Processamento ágil para gerar as informações necessárias. ( ) É importante que empresas entrem no negócio do Big Data, mas é sempre importante A B C D E lembrar dos custos e benefícios e tentar agregar valor ao que se está fazendo. ( ) Big Data é uma grande quantidade de dados gerada a cada segundo. ( ) Com o Big Data, mensagens, fotos, vídeos e sons, que são dados não-estruturados, podem ser administrados juntamente com dados tradicionais. Assinale a alternativa que apresenta a sequência CORRETA� A sequência correta é IV � III � II � I. A sequência correta é I � II � III � IV. A sequência correta é II � IV � I � III. A sequência correta é III � II � I �IV. A sequência correta é IV � II � I � III. Opa! A alternativa correta é a letra C. Confira o gabarito comentado! BIG DATA é um conjunto de soluções tecnológicas capazes de lidar com dados digitais em volume, variedade, velocidade e valor inéditos até os dias atuais. A velocidade está relacionada com a agilidade de processamento na geração de A B C informação. O valor é obtido a partir da manipulação dos dados na geração de informação útil. O volume está na grande quantidade de dados gerados atualmente. E a variedade se refere aos tipos de fontes de dados, com dados estruturados, semiestruturados e não estruturados. 6 �ESAF � 2015 � ESAF � Gestão e Desenvolvimento de Sistemas) Em relação a Big Data e NoSQL, é correto afirmar que: os "3 Vs" principais do Big Data referem-se a Volume, Velocidade e Versatilidade de dados. na era do Big Data, as únicas estratégias eficientes para garantir a privacidade são consentimento individual, opção de exclusão e anonimização. o Hadoop, o mais conhecido e popular sistema para gestão de Big Data, foi criado pela IBM, a partir de sua ferramenta de Data Mining WEKA. D E o NoSQL é um sistema relacional, distribuído, em larga escala, muito eficaz na organização e análise de grande quantidade de dados. o Cassandra é um sistema de banco de dados baseado na abordagem NoSQL, originalmente criado pelo Facebook, no qual os dados são identificados por meio de uma chave. Opa! A alternativa correta é a letra E. Confira o gabarito comentado! Cassandra é um banco NoSQL do tipo chave-valor. Os 5 Vs do Big Data são: Volume, Velocidade, Variedade, Veracidade e Valor. Não existe nada relacionado com Versatilidade. Há diversas alternativas para gerar privacidade, inclusive há uma lei específica que trata desse assunto, a Lei Geral de Proteção de Dados �13.709/2018�. O Hadoop foi criado pelo projeto Apache, e não pela IBM. E o NoSQL é um termo genérico para banco de dados não relacionais. Não significa sem SQL, na verdade ele inclui o SQL. NoSQL é Not Only SQL (não somente SQL�. A B C D E 7 Em relação aos objetivos estratégicos em se implantar as tecnologias de Big Data nas empresas, assinale a alternativa correta: Tomar decisões mais operacionais e menos inteligentes sobre seu negócio. Gerar preços e ofertas com base em hábitos reais de compra dos clientes. Desenvolver produtos e ofertas com pouca assertividade. Aumentar tempo com prospecção de clientes. Traçar estratégias de marketing digital não se baseando em dados reais, somente dados futurísticos. Opa! A alternativa correta é a letra B. Confira o gabarito comentado! A tecnologia de Big Data tem sido estrategicamente adotada por empresas com o objetivo de otimizar suas operações e melhorar a tomada de decisões. Uma das principais vantagens do uso de Big Data é a capacidade de analisar grandes volumes de informações, o que permite às empresas entenderem melhor o comportamento de seus clientes. Com base nesses dados, as empresas podem gerar preços e ofertas que correspondem aos hábitos reais de compra dos clientes. Isso torna a tomada de decisões mais inteligente e as ofertas de produtos mais assertivas. Além disso, a utilização de Big Data reduz a necessidade de gastar tempo com a prospecção de clientes, pois as estratégias de marketing digital podem ser baseadas em dados reais, tornando-as mais eficazes. 8 O Big Data é uma tecnologia que tem sido implantada nas empresas como uma estratégia de levantamento de informação através da coleta e processamento de dados. Sendo assim, identifique nos itens os passos necessários para a implantação de Big Data nas empresas. I � Primeiramente, precisamos identificar os desafios da empresa e priorizar os problemas de negócio. II � A escolha da ferramenta que irá manipular o Big Data é um passo importante, devemos dar preferência a ferramentas inteligentes. III � A relevância dos dados não é algo importante, para a tomada de decisão a relevância dos dados não tem importância. IV � Um passo importante e desejável é a utilização de dados internos, os dados externos não afetam a tomada de decisão e se tornam A B C D E relevantes na implantação do Big Data. Estão certos apenas os itens: Os itens I � II � III � IV estão corretos. Apenas o item I está correto. Apenas o item III está correto. Apenas os itens II e III estão corretos. Apenas os itens I e II estão corretos. Opa! A alternativa correta é a letra E. Confira o gabarito comentado! O Big Data tem revolucionado a forma como as empresas desenvolvem suas estratégias de mercado, avaliam a recepção do público aos seus produtos e serviços e identificam as principais tendências do seu setor. Para implementar o Big Data, existem alguns passos cruciais a serem seguidos, tais como: • Identificar os desafios da empresa e priorizar os problemas de negócio. • Escolher a ferramenta adequada para manipular o Big Data, dando preferência a ferramentas inteligentes que possam ser aplicadas em processos extremamente importantes para a coleta, processamento, análise e armazenamento dos dados. • Reconhecer a relevância dos dados para a tomada de decisão. • Utilizar tanto dados internos quanto externos, pois ambos podem afetar a tomada de decisão e são relevantes na implantação do Big Data. Portanto, apenas os itens I e II estão corretos, pois a relevância dos dados (item III) é sim importante para a tomada de decisão e tanto os dados internos quanto externos (item IV) são relevantes na implantação do Big Data. 9 Em relação ao Ecossistema Hadoop, julgue os itens a seguir: I��O Yarn é um gerenciador de pacotes para aplicar comandos prontos ao código de uma aplicação. II��O Pig é uma plataforma que facilita a manipulação de dados e a realização de consultas em um ambiente de Big Data. III��HBase, Cassandra e MongoDB são exemplos de banco de dados distribuídos NoSQL. IV��O Hive é um sistema de data warehouse para Apache Hadoop. O Hive permite o resumo de dados, consultas e análise de dados. Estão certos apenas os itens: A B C D E Os itens I � II � III � IV estão corretos. Apenas os itens I e II estão corretos. Apenas o item III está correto. Apenas os itens I, II e III estão corretos. Apenas os itens II, III e IV estão corretos. Opa! A alternativa correta é a letra E. Confira o gabarito comentado! O Ecossistema Hadopp é formado por vários aplicativos com funções diferentes. Dentre eles o Yarn, o Pig, o HBase e o Hive. Os aplicativos possuem as funções de gerenciamento de recursos e agendamento de serviços, além de fornecer uma facilidade na manipulação de grandes volumes de dados. Dentre os aplicativos, existem bancos de dados para armazenamento de dados não estruturados, os bancos de dados NoSQL, como HBase, Cassandra e MongoDB. Mas também é previsto na plataforma aplicativos para manipulação de dados estruturados como um Data Warehouse, facilitando a manipulação de grandes A B C D volumes de dados (datasets) em ambientes de armazenamento paralelo. Porém, no contexto do Hadoop, o Yarn não é um gerenciador de pacotes como afirmado na afirmativa I. Sendo assim, apenas as afirmativas II, III e IV estão corretas. 10 Sobre a Estratégia de implantação de Big Data nas empresas, julgue os itens: I � A implantação de Big Data eleva os custos não sendo uma opção viável para as grandes organizações. II � No planejamento da implantação de Big Data nas empresas, a área de Marketing Digital é a única que não se beneficia. III � O diferencial do Big Data está em adquirir conhecimento profundo sobre a audiência, os concorrentes e o mercado. Estão certos apenas os itens: Os itens I, II e III estão corretos. Os itens I e II estão corretos. Apenas o item III está correto. Apenas o item I está correto. E Os itens I e III estão corretos. Opa! A alternativa correta é a letra C. Confira o gabarito comentado! A implantação de Big Data, ao contrário do que é afirmado no item I, é uma estratégia que pode reduzir custos e agregar valorao negócio, tornando-se uma opção viável para organizações de todos os tamanhos. O item II também é incorreto, pois a área de Marketing Digital é uma das que mais se beneficia com a implantação de Big Data, através da análise de dados que permite uma compreensão mais profunda do comportamento do consumidor. O item III está correto, pois o diferencial do Big Data realmente está em adquirir conhecimento profundo sobre a audiência, os concorrentes e o mercado, permitindo que as empresas tomem decisões mais informadas e estratégicas.