Logo Passei Direto
Buscar

Simulado BigData

User badge image
caleby soares

em

Ferramentas de estudo

Questões resolvidas

Big Data se refere ao imenso volume de conjuntos de dados que alcançam elevadas ordens de magnitude. O valor real do Big Data está no insight que ele produz quando analisado ¿ buscando padrões, derivando significado, tomando decisões e, por fim, respondendo ao mundo com inteligência.
Referente ao Big Data, é correto afirmar que o termo variedade refere-se:
Aos data centers físicos que transformam os dados em informações pertinentes ao negócio
A um conjunto de dados que são gerados em tempo real, o que requer a oferta imediata de informações úteis
A um conjunto de dados mais diversos, incluindo dados estruturados, semiestruturados e não estruturados. É heterogêneo e vem em muitos formatos, incluindo texto, documento, imagem, vídeo e outros
Ao banco de dados homogêneo que trata de informações do mesmo tipo definindo padrões de segurança
Ao controle de dados semiestruturados de formatos definidos como texto e números

O conceito de computação em nuvem (em inglês, cloud computing) refere-se:
Ao armazenamento de dados feito em serviços que poderão ser acessados de qualquer lugar do mundo, a qualquer hora, havendo necessidade de instalação de programas ou, por vezes, de armazenar dados
Ao protocolo de comunicação da comada de aplicação utilizado para sistemas de informação de hipermídia, distribuídos e colaborativos, representando a base para a comunicação de dados da World Wide Web
À utilização da memória e da capacidade de armazenamento e cálculo de computadores e servidores compartilhados e interligados por meio da Internet, seguindo o princípio da computação em grade
À tecnologia de comunicação de dados que permite uma transmissão de dados mais rápida através de linhas de telefone do que um modem convencional pode oferecer, sendo os dados transmitidos mais rapidamente em uma direção do que na outra, assimetricamente
Ao programa que habilita seus usuários a interagirem com documentos HTML hospedados em um servidor da rede, destacando-se na era da web 2.0, uma vez que quase tudo do que se necessita está online

Marque a opção que apresenta SOMENTE ferramentas utilizadas para análise de dados.
R e Apache Spark
HBase e Python
Hadoop MapReduce e Apache mahout
MarkLogic e Weka
Apache mahout e Spark mllib

Visualização de dados é importante para comunicar a mensagem de forma rápida e eficiente.
Marque a opção que representa o tipo de visualização que tem como objetivo representar a frequência de ocorrência de cada palavra existente em uma base de dados textual.
Rain of words
Word cloud
Barra
Jogo de palavras
Linha

São componentes do método do MapReduce:
Computador mestre e computador escravo
Nó mestre e nó escravo
Computador principal e computador secundário
Nó gestor e nó operário
Nó principal e nó secundário

(FUNCAB 2008) A técnica RAID (Redundant Arrays of Inexpensive Disk) é usada:
em gerenciamento de disco para otimizar as operações de E/S e implementar redundância e proteção de dados;
na conexão à rede padrão ethernet;
no armazenamento de informação ECC (error correcting code), que é a informação de controle de erros;
na alocação dinâmica de memória RAM;
na otimização das interfaces IDE.

O Apache Spark é um mecanismo de análise unificado para processamento de dados em grande escala com várias vantagens.
Marque a opção que NÃO representa uma dessas vantagens.
O Spark tem um gerenciador de recursos do cluster próprio responsável por alocar e monitorar os recursos disponíveis no cluster para todas as aplicações
O Spark tem um rico conjunto de bibliotecas para implementar processamentos em estilo SQL, processamento de streaming, algoritmos de grafos e aprendizado de máquina
No Spark as aplicações têm possibilidade de serem escritas em Java, Scala, Python ou R
O Spark é tem a flexibilidade para processar dados em HDFS, HBase, Cassandra, Hive e qualquer outro formato de entrada aceito pelo Hadoop
A combinação de DAG e RDD ajudam ao Spark realizar o processamento paralelo extremamente rápido, em particular quando o cluster é grande o suficiente para armazenar todos os dados em memória

Material
páginas com resultados encontrados.
páginas com resultados encontrados.
left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Questões resolvidas

Big Data se refere ao imenso volume de conjuntos de dados que alcançam elevadas ordens de magnitude. O valor real do Big Data está no insight que ele produz quando analisado ¿ buscando padrões, derivando significado, tomando decisões e, por fim, respondendo ao mundo com inteligência.
Referente ao Big Data, é correto afirmar que o termo variedade refere-se:
Aos data centers físicos que transformam os dados em informações pertinentes ao negócio
A um conjunto de dados que são gerados em tempo real, o que requer a oferta imediata de informações úteis
A um conjunto de dados mais diversos, incluindo dados estruturados, semiestruturados e não estruturados. É heterogêneo e vem em muitos formatos, incluindo texto, documento, imagem, vídeo e outros
Ao banco de dados homogêneo que trata de informações do mesmo tipo definindo padrões de segurança
Ao controle de dados semiestruturados de formatos definidos como texto e números

O conceito de computação em nuvem (em inglês, cloud computing) refere-se:
Ao armazenamento de dados feito em serviços que poderão ser acessados de qualquer lugar do mundo, a qualquer hora, havendo necessidade de instalação de programas ou, por vezes, de armazenar dados
Ao protocolo de comunicação da comada de aplicação utilizado para sistemas de informação de hipermídia, distribuídos e colaborativos, representando a base para a comunicação de dados da World Wide Web
À utilização da memória e da capacidade de armazenamento e cálculo de computadores e servidores compartilhados e interligados por meio da Internet, seguindo o princípio da computação em grade
À tecnologia de comunicação de dados que permite uma transmissão de dados mais rápida através de linhas de telefone do que um modem convencional pode oferecer, sendo os dados transmitidos mais rapidamente em uma direção do que na outra, assimetricamente
Ao programa que habilita seus usuários a interagirem com documentos HTML hospedados em um servidor da rede, destacando-se na era da web 2.0, uma vez que quase tudo do que se necessita está online

Marque a opção que apresenta SOMENTE ferramentas utilizadas para análise de dados.
R e Apache Spark
HBase e Python
Hadoop MapReduce e Apache mahout
MarkLogic e Weka
Apache mahout e Spark mllib

Visualização de dados é importante para comunicar a mensagem de forma rápida e eficiente.
Marque a opção que representa o tipo de visualização que tem como objetivo representar a frequência de ocorrência de cada palavra existente em uma base de dados textual.
Rain of words
Word cloud
Barra
Jogo de palavras
Linha

São componentes do método do MapReduce:
Computador mestre e computador escravo
Nó mestre e nó escravo
Computador principal e computador secundário
Nó gestor e nó operário
Nó principal e nó secundário

(FUNCAB 2008) A técnica RAID (Redundant Arrays of Inexpensive Disk) é usada:
em gerenciamento de disco para otimizar as operações de E/S e implementar redundância e proteção de dados;
na conexão à rede padrão ethernet;
no armazenamento de informação ECC (error correcting code), que é a informação de controle de erros;
na alocação dinâmica de memória RAM;
na otimização das interfaces IDE.

O Apache Spark é um mecanismo de análise unificado para processamento de dados em grande escala com várias vantagens.
Marque a opção que NÃO representa uma dessas vantagens.
O Spark tem um gerenciador de recursos do cluster próprio responsável por alocar e monitorar os recursos disponíveis no cluster para todas as aplicações
O Spark tem um rico conjunto de bibliotecas para implementar processamentos em estilo SQL, processamento de streaming, algoritmos de grafos e aprendizado de máquina
No Spark as aplicações têm possibilidade de serem escritas em Java, Scala, Python ou R
O Spark é tem a flexibilidade para processar dados em HDFS, HBase, Cassandra, Hive e qualquer outro formato de entrada aceito pelo Hadoop
A combinação de DAG e RDD ajudam ao Spark realizar o processamento paralelo extremamente rápido, em particular quando o cluster é grande o suficiente para armazenar todos os dados em memória

Prévia do material em texto

1a 
 Questão 
Acerto: 1,0 / 1,0 
 
Big Data se refere ao imenso volume de conjuntos de dados que alcançam elevadas 
ordens de magnitude. O valor real do Big Data está no insight que ele produz quando 
analisado ¿ buscando padrões, derivando significado, tomando decisões e, por fim, 
respondendo ao mundo com inteligência. Referente ao Big Data, é correto afirmar que o 
termo variedade refere-se: 
 
 
Aos data centers físicos que transformam os dados em informações pertinentes 
ao negócio 
 
Ao controle de dados semiestruturados de formatos definidos como texto e 
números 
 A um conjunto de dados mais diversos, incluindo dados estruturados, 
semiestruturados e não estruturados. É heterogêneo e vem em muitos 
formatos, incluindo texto, documento, imagem, vídeo e outros 
 
Ao banco de dados homogêneo que trata de informações do mesmo tipo 
definindo padrões de segurança 
 
A um conjunto de dados que são gerados em tempo real, o que requer a oferta 
imediata de informações úteis 
Respondido em 17/12/2021 14:07:44 
 
 
2a 
 Questão 
Acerto: 1,0 / 1,0 
 
(FCC - 2020 - AL-AP - Analista Legislativo - Desenvolvedor de Banco de Dados) 
Atualmente, diversos dados são coletados pelos sistemas digitais de empresas na 
internet para constituir Big Data com conteúdo sobre os resultados alcançados por seus 
produtos e serviços, prestígio da imagem da organização e seus representantes. Porém, 
parte desses dados pode ser falsa ou manipulada por internautas. O tratamento dos 
dados, a fim de qualificá-los antes de disponibilizá-los para a tomada de decisão na 
empresa, segundo o conceito das cinco dimensões ¿V¿ de avaliação de um Big Data, se 
refere: 
 
 
 À veracidade 
 
À variedade 
 
 Ao valor 
 
 
 Ao volume 
 
À velocidade 
 
Respondido em 17/12/2021 14:08:18 
 
Explicação: 
O V de Veracidade é sobre as fontes e a qualidade dos dados, pois eles devem ser 
confiáveis 
 
 
3a 
 Questão 
Acerto: 1,0 / 1,0 
 
(FUNDATEC - 2017 - CREMERS - Técnico em Informática) Analisando uma tabela em um 
banco de dados relacional, qual seria o conceito de chave primária? 
 
 
Uma coluna que permita a inserção de um valor de documento válido. 
 Uma coluna ou combinação de colunas cujos valores distinguem uma linha das 
demais, dentro da mesma tabela. 
 
Apenas uma coluna que possua valor numérico e autoincremental. 
 
Uma coluna que permita a inserção de um valor de documento inválido. 
 
Apenas uma coluna que possua valor numérico e não autoincremental. 
Respondido em 17/12/2021 14:09:09 
 
Explicação: 
Uma coluna ou combinação de colunas cujos valores distinguem uma linha das demais, 
dentro da mesma tabela. 
 
 
4a 
 Questão 
Acerto: 1,0 / 1,0 
 
O conceito de computação em nuvem (em inglês, cloud computing) refere-se: 
 
 
Ao armazenamento de dados feito em serviços que poderão ser acessados de 
qualquer lugar do mundo, a qualquer hora, havendo necessidade de instalação 
de programas ou, por vezes, de armazenar dados 
 
À tecnologia de comunicação de dados que permite uma transmissão de dados 
mais rápida através de linhas de telefone do que um modem convencional pode 
oferecer, sendo os dados transmitidos mais rapidamente em uma direção do que 
na outra, assimetricamente 
 À utilização da memória e da capacidade de armazenamento e cálculo de 
computadores e servidores compartilhados e interligados por meio da Internet, 
seguindo o princípio da computação em grade 
 
Ao protocolo de comunicação da comada de aplicação utilizado para sistemas de 
informação de hipermídia, distribuídos e colaborativos, representando a base 
para a comunicação de dados da World Wide Web 
 
Ao programa que habilita seus usuários a interagirem com documentos HTML 
hospedados em um servidor da rede, destacando-se na era da web 2.0, uma vez 
que quase tudo do que se necessita está online 
Respondido em 17/12/2021 14:11:29 
 
 
5a 
 Questão 
Acerto: 1,0 / 1,0 
 
Marque a opção que apresenta SOMENTE ferramentas utilizadas para análise de dados. 
 
 
R e Apache Spark 
 Apache mahout e Spark mllib 
 
HBase e Python 
 
MarkLogic e Weka 
 
Hadoop MapReduce e Apache mahout 
Respondido em 17/12/2021 14:12:35 
 
 
6a 
 Questão 
Acerto: 1,0 / 1,0 
 
Visualização de dados é importante para comunicar a mensagem de forma rápida e 
eficiente. Marque a opção que representa o tipo de visualização que tem como objetivo 
representar a frequência de ocorrência de cada palavra existente em uma base de 
dados textual. 
 
 
Barra 
 Word cloud 
 
Linha 
 
Rain of words 
 
Jogo de palavras 
Respondido em 17/12/2021 14:13:07 
 
 
7a 
 Questão 
Acerto: 1,0 / 1,0 
 
 São componentes do método do MapReduce: 
 
 
Computador mestre e computador escravo 
 
Computador principal e computador secundário 
 
Nó gestor e nó operário 
 
Nó principal e nó secundário 
 
 Nó mestre e nó escravo 
Respondido em 17/12/2021 14:15:57 
 
Explicação: 
Nó mestre e nó escravo 
 
 
8a 
 Questão 
Acerto: 1,0 / 1,0 
 
O ecossistema do Hadoop possui um conjunto de ferramentas de alto nível para facilitar 
a manipulação dos dados em sistemas distribuídos. Marque a opção que apresenta a 
ferramenta projetada para transferir dados entre o Hadoop e um banco de dados 
relacional. 
 
 
Hive 
 
Mahout 
 Sqoop 
 
Cassandra 
 
HBase 
Respondido em 17/12/2021 14:16:55 
 
 
9a 
 Questão 
Acerto: 1,0 / 1,0 
 
(FUNCAB 2008) A técnica RAID (Redundant Arrays of Inexpensive Disk) é usada: 
 
 
 em gerenciamento de disco para otimizar as operações de E/S e implementar 
redundância e proteção de dados; 
 
na conexão à rede padrão ethernet; 
 
no armazenamento de informação ECC (error correcting code), que é a 
informação de controle de erros; 
 
na alocação dinâmica de memória RAM; 
 
na otimização das interfaces IDE. 
Respondido em 17/12/2021 14:17:56 
 
Explicação: 
Em gerenciamento de disco para otimizar as operações de E/S e implementar redundância e 
proteção de dados; 
 
 
10a 
 Questão 
Acerto: 1,0 / 1,0 
 
O Apache Spark é um mecanismo de análise unificado para processamento de dados em 
grande escala com várias vantagens. Marque a opção que NÃO representa uma dessas 
vantagens. 
 
 O Spark tem um gerenciador de recursos do cluster próprio responsável por 
alocar e monitorar os recursos disponíveis no cluster para todas as aplicações 
 
O Spark é tem a flexibilidade para processar dados em HDFS, HBase, Cassandra, 
Hive e qualquer outro formato de entrada aceito pelo Hadoop 
 
No Spark as aplicações têm possibilidade de serem escritas em Java, Scala, 
Python ou R 
 
O Spark tem um rico conjunto de bibliotecas para implementar processamentos 
em estilo SQL, processamento de streaming, algoritmos de grafos e aprendizado 
de máquina 
 
A combinação de DAG e RDD ajudam ao Spark realizar o processamento paralelo 
extremamente rápido, em particular quando o cluster é grande o suficiente para 
armazenar todos os dados em memória 
Respondido em 17/12/2021 14:19:01 
 
 
 
 
 
javascript:abre_colabore('38403','276013569','5097882878');

Mais conteúdos dessa disciplina