Logo Passei Direto
Buscar

Teste de Conhecimento TÓPICOS DE BIG DATA EM PYTHON

User badge image
Rafael

em

Ferramentas de estudo

Questões resolvidas

Selecione a opção correta com a medida de volume de dados que normalmente é usada para se referenciar a projetos de Big Data.
Zetabytes
Petabytes
Exabytes
Gigabytes
Terabytes

Em relação às plataformas para Internet das Coisas, selecione a opção correta sobre o Arduino.
É um protocolo de internet das coisas
É um ecossistema que envolve software e hardware
É um programa
É o outro nome para Raspberry PI
É uma placa de hardware

Selecione a opção correta a respeito do código: query = "SELECT * FROM tabela_teste WHERE valor = "+str(str_valor)
A execução do trecho de código vai funcionar corretamente.
A implementação do trecho de código está errada.
É possível afirmar que a tabela_teste existe.
Trata-se de um exemplo de utilização do Spark SQL.
É um exemplo de aplicação de GraphX.

Selecione a opção que contém o componente do ecossistema do Spark especializado em aplicações de aprendizado de máquina.
MLlib
RDDs
GraphX Learning
Spark Learning
MLSpark

A qual técnica de Aprendizado de Máquina o Algoritmo de Árvore de Decisão Classificadora pertence?
Modelos Generativos
Q-Learning
Classificação
Regressão
Agrupamento

Material
páginas com resultados encontrados.
páginas com resultados encontrados.
left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Questões resolvidas

Selecione a opção correta com a medida de volume de dados que normalmente é usada para se referenciar a projetos de Big Data.
Zetabytes
Petabytes
Exabytes
Gigabytes
Terabytes

Em relação às plataformas para Internet das Coisas, selecione a opção correta sobre o Arduino.
É um protocolo de internet das coisas
É um ecossistema que envolve software e hardware
É um programa
É o outro nome para Raspberry PI
É uma placa de hardware

Selecione a opção correta a respeito do código: query = "SELECT * FROM tabela_teste WHERE valor = "+str(str_valor)
A execução do trecho de código vai funcionar corretamente.
A implementação do trecho de código está errada.
É possível afirmar que a tabela_teste existe.
Trata-se de um exemplo de utilização do Spark SQL.
É um exemplo de aplicação de GraphX.

Selecione a opção que contém o componente do ecossistema do Spark especializado em aplicações de aprendizado de máquina.
MLlib
RDDs
GraphX Learning
Spark Learning
MLSpark

A qual técnica de Aprendizado de Máquina o Algoritmo de Árvore de Decisão Classificadora pertence?
Modelos Generativos
Q-Learning
Classificação
Regressão
Agrupamento

Prévia do material em texto

08/04/2023, 16:33 Estácio: Alunos
https://simulado.estacio.br/bdq_simulados_exercicio_ensineme.asp#ancora_10 1/5
Teste de
Conhecimento
 avalie sua aprendizagem
Selecione a opção correta com a medida de volume de dados que normalmente é usada para se referenciar a
projetos de Big Data.
Em relação às plataformas para Internet das Coisas, selecione a opção correta sobre o Arduino.
TÓPICOS DE BIG DATA EM PYTHON
Lupa  
 
DGT0134_202004013785_TEMAS
Aluno: RAFAEL MENDES Matr.: 202004013785
Disc.: TÓPICOS DE BIG DAT  2023.1 EAD (G) / EX
Prezado (a) Aluno(a),
Você fará agora seu TESTE DE CONHECIMENTO! Lembre-se que este exercício é opcional, mas não valerá ponto para
sua avaliação. O mesmo será composto de questões de múltipla escolha.
Após responde cada questão, você terá acesso ao gabarito comentado e/ou à explicação da mesma. Aproveite para se
familiarizar com este modelo de questões que será usado na sua AV e AVS.
02727PRINCÍPIOS DE BIG DATA
 
1.
Gigabytes
Exabytes
Terabytes
Zetabytes
Petabytes
Data Resp.: 08/04/2023 16:28:35
Explicação:
As aplicações que possuem ordem de grandeza de petabytes de volume de dados são consideradas de Big Data.
As alternativas da questão podem ser vistas em ordem crescente de grandeza das unidades de medida de
armazenamento: Gigabytes, Terabytes, Petabytes, Exabytes e Zetabytes.
 
2.
É um programa
É um protocolo de internet das coisas
É o outro nome para Raspberry PI
É uma placa de hardware
É um ecossistema que envolve software e hardware
javascript:voltar();
javascript:voltar();
javascript:diminui();
javascript:aumenta();
08/04/2023, 16:33 Estácio: Alunos
https://simulado.estacio.br/bdq_simulados_exercicio_ensineme.asp#ancora_10 2/5
O Hadoop é um framework de código aberto voltado para aplicações de Big Data. Neste sentido, selecione a
alternativa correta que apresenta um grande desa�o no processo de con�guração e gerenciamento do
Hadoop.
Reconhecer os conceitos de Data Lake é fundamental para o pro�ssional de Tecnologia da Informação. Selecione a
opção correta que de�ne resumidamente o que é o Data Lake.
Observe o trecho de código abaixo
Data Resp.: 08/04/2023 16:29:07
Explicação:
O arduino é uma tecnologia que combina hardware e software e é utilizada para internet das coisas. Portanto,
não é um programa, nem uma placa de hardware e tão pouco um protocolo de comunicação. Já o Raspberry PI
não é o mesmo que Arduino, pois se trata de uma outra tecnologia para internet das coisas.
02508HADOOP E ARMAZENAMENTO DE DADOS
 
3.
Tratar dados não-estruturados.
Gerenciamento do armazenamento de dados.
Processos de extração, transformação e carregamento dos dados.
Aplicar políticas de segurança.
Mecanismo para melhorar o processamento dos dados.
Data Resp.: 08/04/2023 16:29:49
Explicação:
O tratamento da segurança da informação é um grande desa�o para o Hadoop, pois o pro�ssional responsável
por essa etapa terá que con�gurar o sistema que, pela natureza dos problemas de Big Data, é uma tarefa
complexa.
 
4.
É um repositório para tratamento dos dados.
É um ambiente para tratamento e armazenamento apenas de dados relacionais.
Trata-se de um componente do HDFS responsável pela implementação do mecanismo MapReduce para fazer
o gerenciamento dos dados.
É um repositório centralizado para armazenamento de dados.
É uma tecnologia de armazenamento e processamento de dados.
Data Resp.: 08/04/2023 16:30:53
Explicação:
O Data Lake é um repositório centralizado capaz de armazenar dados nos diversos formatos: estruturados, não
estruturados e semiestruturados sem a necessidade de aplicar nenhum tratamento.
02729PRINCIPIOS DE DESENVOLVIMENTO DE SPARK COM PYTHON
 
5.
08/04/2023, 16:33 Estácio: Alunos
https://simulado.estacio.br/bdq_simulados_exercicio_ensineme.asp#ancora_10 3/5
query = "SELECT * FROM tabela_teste WHERE valor = "+str(str_valor)
registros = spark.sql(query)
Selecione a opção correta a respeito dele.
Os componentes do Spark têm como objetivo facilitar o desenvolvimento de projetos com �nalidades especí�cas.
Selecione a opção que contém o componente do ecossistema do Spark especializado em aplicações de aprendizado
de máquina.
Dado que Felipe quer fazer a junção entre dois conjuntos de dados e escreveu o seguinte código:
import pandas as pd
df1 = pd.DataFrame({'lkey': ['foo', 'bar', 'baz', 'foo'], 'value': [1, 2, 3, 5]})
df2 = pd.DataFrame({'rkey': ['foo', 'bar', 'baz', 'foo'], 'value': [5, 6, 7, 8]})
df1.merge(df2, left_on='lkey', right_on='rkey')
Qual destas alternativas descreve as saídas do código?
A execução do trecho de código vai funcionar corretamente.
A implementação do trecho de código está errada.
É possível a�rmar que a tabela_teste existe.
Trata-se de um exemplo de utilização do Spark SQL
É um exemplo de aplicação de GraphX.
Data Resp.: 08/04/2023 16:31:19
Explicação:
Gabarito: Trata-se de um exemplo de utilização do Spark SQL
Justi�cativa: O trecho de código corresponde a uma aplicação do Spark SQL. Esse componente viabiliza a
utilização de código SQL que facilita bastante a manipulação de dados estruturados. A implementação está
codi�cada corretamente, apesar de não ser possível a�rmar se vai executar sem erros, pois no código não
aparecem informações que permitam fazer a�rmações sobre a execução.
 
6.
MLlib
RDDs
GraphX Learning
Spark Learning
MLSpark
Data Resp.: 08/04/2023 16:31:55
Explicação:
Gabarito: MLlib
Justi�cativa: O componente MLlib é o componente do ecossistema do Spark usado para implementar
algoritmos estatísticos e de aprendizado de máquina para simpli�car pipelines de aprendizado de máquina em
projetos de big data. As opções Spark Learning, GraphX Learning e MLSpark não são componentes válidos do
Spark. Os RDDs são componentes para conjunto de dados resilientes.
02260ANÁLISE DE DADOS EM PYTHON COM PANDAS
 
7.
08/04/2023, 16:33 Estácio: Alunos
https://simulado.estacio.br/bdq_simulados_exercicio_ensineme.asp#ancora_10 4/5
I ¿ O conjunto resultante terá colunas lkey, value_x, rkey, value_y
II ¿ O código não executará, pois Filipe não de�niu os su�xos de coluna
III ¿ O resultado do código em questão retornará um pd.Series juntando os conjuntos pela lkey e rkey.
Dados categóricos são aqueles normalmente expressos por texto, que representam rótulos, nomes e símbolos.
Qual tipo de visualização de dados abaixo é recomendado para dados categóricos?
A qual técnica de Aprendizado de Máquina o Algoritmo de Árvore de Decisão Classi�cadora pertence?
Apenas a opção III está correta.
Apenas as opções II e III estão corretas.
Apenas a opção II está correta.
Apenas a opção I está correta.
Apenas as opções I e III estão corretas.
Data Resp.: 08/04/2023 16:32:20
Explicação:
A a�rmativa I está corretíssima uma vez que o resultado terá as colunas chaves e as colunas valores acrescidas
dos su�xos padrões, porquanto não há declaração explícita. A a�rmativa II é incorreta, por mais que seja uma
boa prática de�nir os nomes dos su�xos de suas junções, não sendo impeditivo à biblioteca executar a junção
sem elas. A a�rmativa III é incorreta, pois o resultado de uma junção é um pd.DataFrame, uma vez que estamos
falando de operações fechadas assim como a álgebra que rege o bom funcionamento de um sistema, i.e., como a
entrada é de DataFrames, a saída obrigatoriamente também tem que ser de DataFrames.
 
8.
Grá�co de Matriz de Dispersão.
Grá�co de Faces de Chernoff.
Grá�co de Estrela.
Grá�cos de Barra.
Grá�cos de Linha.
Data Resp.: 08/04/2023 16:32:34
Explicação:
O grá�co de barras mostra as proporções dos dados categóricos assim evidenciando os extratos da amostra.
Lembrando que os dados categóricos não se encaixam nos grá�cos de dados numéricos, como o de dispersão
causando confusão na função de visualização ou quebrando a mesma dependendo da biblioteca escolhida.
02318BIG DATA ANALYTICS
 
9.
Regressão
Modelos Generativos
Classi�cação
Q-Learning
Agrupamento
Data Resp.: 08/04/2023 16:32:53
Explicação:
O algoritmo de árvore de decisão é um dos mais simplese poderosos algoritmos de aprendizado de máquina
que pode ser utilizado tanto para regressão quanto para classi�cação, mas muda sua terminação dependendo da
08/04/2023, 16:33 Estácio: Alunos
https://simulado.estacio.br/bdq_simulados_exercicio_ensineme.asp#ancora_10 5/5
As técnicas de aprendizado de máquina para aprendizado supervisionado são:
 
I - Classi�cação
II - Agrupamento
III - Regressão
técnica em questão, por exemplo, para classi�cação é a Árvore de Decisão Classi�cadora, enquanto para
regressão se chama Árvore Regressora, ou Árvore de Decisão Regressora.
 
10.
Apenas I
Apenas II e III
Apenas II
Apenas I e III
Apenas I e II
Data Resp.: 08/04/2023 16:33:12
Explicação:
O aprendizado supervisionado contempla duas técnicas que são a de classi�cação, em que o modelo tenta
aprender a categorizar observações, e a regressão, que tenta aferir um valor numérico para novos registros,
baseado no registro histórico e suas características.
    Não Respondida      Não Gravada     Gravada
Exercício inciado em 08/04/2023 16:22:57.

Mais conteúdos dessa disciplina