Prévia do material em texto
Acadêmico: Mharcos Vinicius Gonçalves de Hungria (1935095) Disciplina: Fundamentos de Big Data (19358) Avaliação: Avaliação Final (Objetiva) - Individual FLEX ( Cod.:514246) ( peso.:3,00) Prova: 18440728 Nota da Prova: 9,00 Legenda: Resposta Certa Sua Resposta Errada 1. O processo de KDD é um conjunto de atividades contínuas que compartilham o conhecimento descoberto a partir de bases de dados. Esse processo é composto por várias etapas. Sobre as etapas do KDD, associe os itens, utilizando o código a seguir: I- Seleção. II- Pré-processamento. III- Transformação. IV- Mineração de Dados. ( ) Etapa responsável por selecionar os atributos que serão utilizados. ( ) Etapa em que os dados são transformados. ( ) Etapa em que os dados são limpos e preparados. ( ) Etapa que executa os algoritmos para extrair conhecimento dos dados. Assinale a alternativa que apresenta a sequência CORRETA: FONTE: STEINER, Maria Teresinha Arns et al. Abordagem de um problema médico por meio do processo de KDD com ênfase à análise exploratória dos dados. Gestão & Produção, v. 13, n. 2, p. 325-337, 2006. a) I - III - II - IV. b) IV - III - II - I. c) I - IV - III - II. d) I - II - IV - III. 2. A imensidão de informações é composta, numa pequena parte, de dados limpos, corretos, checados, como urna pesquisa do ruGE. São os "dados estruturados". No entanto, a grande novidade do Big Data, o elemento verdadeiramente novo e transformador, são os "dados não estruturados". Os dados sujos, incompletos, caóticos. Sobre o universo de Big Data, associe os itens, utilizando o código a seguir: I- Cientista de Dados. II- Ciência de Dados. III- Dados. IV- Dataset. ( ) Conjunto de dados sobre um tema específico. ( ) Matéria-prima da informação, que sozinho não faz sentido. ( ) Profissional da área de Big Data responsável por trabalhar com dados. ( ) Área do conhecimento que utiliza Big Data para resolver os mais diversos problemas. Assinale a alternativa que apresenta a sequência CORRETA: FONTE: PETRY, André. O berço do Big Data. Revista Veja, São Paulo, Abril, v. 2321, n. 20, p. 71-76, 2013. a) III - I - IV - II. b) IV - III - I - II. c) I - II - IV - III. d) I - III - IV - II. 3. A computação em nuvem é uma tendência observada após a Internet. A partir 1995, deixa de ser exclusivamente acadêmica e passa a ser também explorada comercialmente por empresas em escala global. Nesses últimos dezoito anos, observou-se rapidamente uma enorme incorporação da Internet no cotidiano, de tal forma que, no ano de 2012, 2,5 bilhões de humanos já se encontravam conectados à rede. Sobre os modelos de arquitetura em nuvem, classifique V para as sentenças verdadeiras e F para as falsas: ( ) PaaS é o termo indicado quando o fornecedor entrega uma plataforma de desenvolvimento de software que pode ser usada em diferentes ambientes, ou mesmo em um único fornecedor. ( ) É considerada LaaS a aplicação para um fim específico, que é vendida sob a forma de serviços. ( ) IaaS é o termo aplicado quando o fornecedor entrega recursos computacionais de infraestrutura, como servidores, espaço de armazenamento e capacidade de rede, sob uma taxa mensal de utilização. ( ) É considerada SaaS a aplicação para um fim específico, que é vendida sob a forma de serviços. Assinale a alternativa que apresenta a sequência CORRETA: FONTE: ZUFFO, Marcelo Knörich et al. A computação em nuvem na Universidade de São Paulo. Revista USP, n. 97, p. 9-18, 2013. a) F - V - F - F. b) F - V - F - V. c) V - V - V - F. d) V - F - V - V. 4. O Big Data é caracterizado como um conjunto extremamente amplo de dados e que, por esse motivo, necessita de ferramentas especialmente preparadas para lidar com grandes volumes, de forma que toda e qualquer informação possa ser encontrada, analisada e aproveitada em tempo hábil. Sobre as características do Big Data, classifique V para as sentenças verdadeiras e F para as falsas: ( ) Volume se refere ao tempo que os dados devem levar para chegar na fonte. ( ) Variedade se refere aos diversos tipos de fontes de dados. ( ) Velocidade trata do tempo em que as informações devem ser coletadas e visualizadas. ( ) Valor trata da quantidade imensa de dados. Assinale a alternativa que apresenta a sequência CORRETA: FONTE: AMARAL, Brenna Nicole Jurchacks Santos do. Big Data: um benchmark de grande volume de dados de serviços de internet. Trabalho de Conclusão de Curso. 54 f. Recife: UFPE, 2017. a) V - F - F - F. b) V - V - V - F. c) V - F - F - V. d) F - V - V - F. 5. O Big Data vem revolucionando as mais diversas áreas do conhecimento. Com um grande conjunto de dados, pode-se realizar previsões, predições e as mais diversas análises. Pode-se dizer que o Big Data é baseado em 5 Vs que o conceituam. Sobre o exposto, assinale a alternativa CORRETA: a) Volume, volatilidade, variedade, valor e veracidade. b) Volume, velocidade, variedade, valor e veracidade. c) Volatilidade, velocidade, variedade, valor e veracidade. d) Volume, velocidade, variedade, volatilidade e veracidade. 6. A mineração de dados é uma técnica computacional que consiste em aplicar algoritmos que objetivam transformar os dados em informação e, posteriormente, em conhecimento, imprescindível para o processo de tomada de decisão. Sobre as tarefas de mineração de dados, classifique V para as sentenças verdadeiras e F para as falsas: ( ) A classificação é uma tarefa que prevê que cada registro faça parte de outro conjunto de dados e pertença a uma determinada classe. ( ) A regressão identifica grupos que poderão ser utilizados como ponto inicial de exploração de relação, procurando semelhanças e diferenças em conjunto de dados e agrupando registros semelhantes em segmentos ou clusters. ( ) A clusterização prevê que cada registro faça parte de outro conjunto de dados e tenha um determinado valor. ( ) A visualização é a apresentação gráfica dos dados. Assinale a alternativa que apresenta a sequência CORRETA: FONTE: PRAVITZ, Daniel; FROZZA, Rejane. Mineração de dados aplicada à análise e previsão de crimes. Anais do Salão de Ensino e de Extensão, p. 248. Santa Cruz do Sul: Edunisc, 2019. a) V - F - V - F. b) F - V - V - F. c) F - V - F - V. d) V - F - F - V. 7. A gestão de conteúdo empresarial é também chamada de Enterprise Content Management (ECM), e caracteriza-se pela forma como as empresas organizam e arquivam os dados (documentos) ligados aos processos empresariais. Sobre as funcionalidades contidas nos ECM dentro das empresas, assinale a alternativa CORRETA: a) Captura, Gestão, Acesso, Integração, Análise, Animação. b) Conceito, Gestão, Acesso, Integração, Análise, Armazenamento. c) Captura, Gestão, Acesso, Integração, Análise, Armazenamento. d) Captura, Configuração, Acesso, Integração, Análise, Armazenamento. 8. A Computação em Nuvem (Cloud Computing) é fruto da evolução e da reunião dos fundamentos técnicos de áreas como virtualização de servidores, Grid Computing (Computação em Grade), Software orientado a serviços, gestão de grandes instalações (Data Centers), dentre outras. Trata-se de um modelo eficiente para utilizar softwares, acessar, armazenar e processar dados por meio de diferentes dispositivos e tecnologias web. Sobre os modelos de computação em nuvem, classifique V para as sentenças verdadeiras e F para as falsas: ( ) A Nuvem híbrida é o modelo no qual a infraestrutura de nuvem é utilizada exclusivamente por uma organização, sendo física na empresa ou remota, não deixando de ser administrada pela própria organização. ( ) A Nuvem pública é um modelo onde a infraestrutura é disponibilizada para o grande público, sendo acessada por qualquer usuário que conheça a localização do serviço. ( ) A Nuvem comunidade agrupa uma comunidade que tenha afinidade ou interesses em comum. ( ) Nuvem privada fornece uma infraestrutura composta de uma ou mais nuvens, que podem ser do tipo privada, pública ou comunidade e que continuam a ser entidades únicas, porém conectadaspor meio e tecnologia própria ou padronizada que permite o acesso de dados e aplicações. Assinale a alternativa que apresenta a sequência CORRETA: a) V - F - F - V. b) V - F - V - F. c) F - V - V - F. d) F - V - F - V. 9. A mineração de dados é uma solução que pode ser proveitosa às organizações que querem melhor explorar os dados que possuem em seus repositórios. Utilizando o processo de KDD, a mineração permite extrair conhecimento sobre os dados armazenados. Sobre o processo de KDD, classifique V para as sentenças verdadeiras e F para as falsas: ( ) Os algoritmos genéticos consistem em modelos preditivos não lineares que aprendem por meio do treinamento e se assemelham às redes neurais biológicas. ( ) O método do vizinho mais próximo é a técnica que classifica cada registro em um conjunto de dados combinando os registros mais semelhantes. ( ) A indução de regras consiste na extração baseada em regras condicionais a partir da significância estatística. ( ) As redes neurais artificiais consistem em modelos preditivos não lineares que aprendem por meio do treinamento e se assemelham às redes neurais biológicas. Assinale a alternativa que apresenta a sequência CORRETA: a) F - V - V - V. b) F - F - F - V. c) V - V - V - F. d) V - F - V - V. 10. Big Data pode ser traduzido como "grande conjunto de dados", dos mais diversos tipos. Entre suas características, o Big Data deve contar com variedade de dados. A respeito dessa variedade, assinale a alternativa CORRETA: a) A variedade é o valor obtido a partir dos dados (informação útil). b) As fontes de dados devem ser variadas, aumentando a complexidade. c) O processamento deve ser ágil, para gerar as informações necessárias. d) A variedade é ligada diretamente ao quanto a informação é verdadeira e fidedigna. Prova finalizada com 9 acertos e 1 questões erradas.