Prévia do material em texto
1a
Questão
Acerto: 1,0 / 1,0
Big Data se refere ao imenso volume de conjuntos de dados que alcançam elevadas
ordens de magnitude. O valor real do Big Data está no insight que ele produz quando
analisado ¿ buscando padrões, derivando significado, tomando decisões e, por fim,
respondendo ao mundo com inteligência. Referente ao Big Data, é correto afirmar que o
termo variedade refere-se:
Aos data centers físicos que transformam os dados em informações pertinentes
ao negócio
Ao controle de dados semiestruturados de formatos definidos como texto e
números
A um conjunto de dados mais diversos, incluindo dados estruturados,
semiestruturados e não estruturados. É heterogêneo e vem em muitos
formatos, incluindo texto, documento, imagem, vídeo e outros
Ao banco de dados homogêneo que trata de informações do mesmo tipo
definindo padrões de segurança
A um conjunto de dados que são gerados em tempo real, o que requer a oferta
imediata de informações úteis
Respondido em 17/12/2021 14:07:44
2a
Questão
Acerto: 1,0 / 1,0
(FCC - 2020 - AL-AP - Analista Legislativo - Desenvolvedor de Banco de Dados)
Atualmente, diversos dados são coletados pelos sistemas digitais de empresas na
internet para constituir Big Data com conteúdo sobre os resultados alcançados por seus
produtos e serviços, prestígio da imagem da organização e seus representantes. Porém,
parte desses dados pode ser falsa ou manipulada por internautas. O tratamento dos
dados, a fim de qualificá-los antes de disponibilizá-los para a tomada de decisão na
empresa, segundo o conceito das cinco dimensões ¿V¿ de avaliação de um Big Data, se
refere:
À veracidade
À variedade
Ao valor
Ao volume
À velocidade
Respondido em 17/12/2021 14:08:18
Explicação:
O V de Veracidade é sobre as fontes e a qualidade dos dados, pois eles devem ser
confiáveis
3a
Questão
Acerto: 1,0 / 1,0
(FUNDATEC - 2017 - CREMERS - Técnico em Informática) Analisando uma tabela em um
banco de dados relacional, qual seria o conceito de chave primária?
Uma coluna que permita a inserção de um valor de documento válido.
Uma coluna ou combinação de colunas cujos valores distinguem uma linha das
demais, dentro da mesma tabela.
Apenas uma coluna que possua valor numérico e autoincremental.
Uma coluna que permita a inserção de um valor de documento inválido.
Apenas uma coluna que possua valor numérico e não autoincremental.
Respondido em 17/12/2021 14:09:09
Explicação:
Uma coluna ou combinação de colunas cujos valores distinguem uma linha das demais,
dentro da mesma tabela.
4a
Questão
Acerto: 1,0 / 1,0
O conceito de computação em nuvem (em inglês, cloud computing) refere-se:
Ao armazenamento de dados feito em serviços que poderão ser acessados de
qualquer lugar do mundo, a qualquer hora, havendo necessidade de instalação
de programas ou, por vezes, de armazenar dados
À tecnologia de comunicação de dados que permite uma transmissão de dados
mais rápida através de linhas de telefone do que um modem convencional pode
oferecer, sendo os dados transmitidos mais rapidamente em uma direção do que
na outra, assimetricamente
À utilização da memória e da capacidade de armazenamento e cálculo de
computadores e servidores compartilhados e interligados por meio da Internet,
seguindo o princípio da computação em grade
Ao protocolo de comunicação da comada de aplicação utilizado para sistemas de
informação de hipermídia, distribuídos e colaborativos, representando a base
para a comunicação de dados da World Wide Web
Ao programa que habilita seus usuários a interagirem com documentos HTML
hospedados em um servidor da rede, destacando-se na era da web 2.0, uma vez
que quase tudo do que se necessita está online
Respondido em 17/12/2021 14:11:29
5a
Questão
Acerto: 1,0 / 1,0
Marque a opção que apresenta SOMENTE ferramentas utilizadas para análise de dados.
R e Apache Spark
Apache mahout e Spark mllib
HBase e Python
MarkLogic e Weka
Hadoop MapReduce e Apache mahout
Respondido em 17/12/2021 14:12:35
6a
Questão
Acerto: 1,0 / 1,0
Visualização de dados é importante para comunicar a mensagem de forma rápida e
eficiente. Marque a opção que representa o tipo de visualização que tem como objetivo
representar a frequência de ocorrência de cada palavra existente em uma base de
dados textual.
Barra
Word cloud
Linha
Rain of words
Jogo de palavras
Respondido em 17/12/2021 14:13:07
7a
Questão
Acerto: 1,0 / 1,0
São componentes do método do MapReduce:
Computador mestre e computador escravo
Computador principal e computador secundário
Nó gestor e nó operário
Nó principal e nó secundário
Nó mestre e nó escravo
Respondido em 17/12/2021 14:15:57
Explicação:
Nó mestre e nó escravo
8a
Questão
Acerto: 1,0 / 1,0
O ecossistema do Hadoop possui um conjunto de ferramentas de alto nível para facilitar
a manipulação dos dados em sistemas distribuídos. Marque a opção que apresenta a
ferramenta projetada para transferir dados entre o Hadoop e um banco de dados
relacional.
Hive
Mahout
Sqoop
Cassandra
HBase
Respondido em 17/12/2021 14:16:55
9a
Questão
Acerto: 1,0 / 1,0
(FUNCAB 2008) A técnica RAID (Redundant Arrays of Inexpensive Disk) é usada:
em gerenciamento de disco para otimizar as operações de E/S e implementar
redundância e proteção de dados;
na conexão à rede padrão ethernet;
no armazenamento de informação ECC (error correcting code), que é a
informação de controle de erros;
na alocação dinâmica de memória RAM;
na otimização das interfaces IDE.
Respondido em 17/12/2021 14:17:56
Explicação:
Em gerenciamento de disco para otimizar as operações de E/S e implementar redundância e
proteção de dados;
10a
Questão
Acerto: 1,0 / 1,0
O Apache Spark é um mecanismo de análise unificado para processamento de dados em
grande escala com várias vantagens. Marque a opção que NÃO representa uma dessas
vantagens.
O Spark tem um gerenciador de recursos do cluster próprio responsável por
alocar e monitorar os recursos disponíveis no cluster para todas as aplicações
O Spark é tem a flexibilidade para processar dados em HDFS, HBase, Cassandra,
Hive e qualquer outro formato de entrada aceito pelo Hadoop
No Spark as aplicações têm possibilidade de serem escritas em Java, Scala,
Python ou R
O Spark tem um rico conjunto de bibliotecas para implementar processamentos
em estilo SQL, processamento de streaming, algoritmos de grafos e aprendizado
de máquina
A combinação de DAG e RDD ajudam ao Spark realizar o processamento paralelo
extremamente rápido, em particular quando o cluster é grande o suficiente para
armazenar todos os dados em memória
Respondido em 17/12/2021 14:19:01
javascript:abre_colabore('38403','276013569','5097882878');