Prévia do material em texto
Disciplina: TÓPICOS DE BIG DATA EM PYTHON AV
29/09/2023
Avaliação: 10,00 pts Nota SIA: 10,00 pts
02260 - ANÁLISE DE DADOS EM PYTHON COM PANDAS
1. Ref.: 6076628 Pontos: 1,00 / 1,00
O seguinte constructo da linguagem Python representa o condicional simples:
while
if
with
for
else
2. Ref.: 6076764 Pontos: 1,00 / 1,00
A biblioteca pandas é poderosa e de grande valia para a vida de um cientista de dados.
Sobre ela podemos afirmar que:
I - O nome Pandas se refere a dados em painel ou panel data
II - O DataFrame é o coletivo de listas (lists)
III - É possível criarmos DataFrames a partir de praticamente qualquer estrutura de
dados, principalmente CSVs, Excels, e JSONsAnalise as frases listadas e assinale a
alternativa correta.
Apenas I.
Apenas II e III.
Apenas I e III.
Apenas I e II.
Apenas II.
02318 - BIG DATA ANALYTICS
javascript:alert('C%C3%B3digo%20da%20quest%C3%A3o:%206076628.');
javascript:alert('C%C3%B3digo%20da%20quest%C3%A3o:%206076764.');
3. Ref.: 6075827 Pontos: 1,00 / 1,00
Quais os métodos de aprendizado de máquina que existem?
Aprendizado Supervisionado, Não-Supervisionado, Por Reforço, e
Semisupervisionado
Aprendizado Supervisionado, Não-Supervisionado, Por Reforço, e Aleatório
Aprendizado Supersticioso, Não-Supervisionado, Por Reforço, e
Semisupervisionado
Aprendizado Supervisionado, Escondido, Por Reforço, e Semisupervisionado
Aprendizado Supervisionado, Não-Supervisionado, Por Força Bruta, e
Semisupervisionado
4. Ref.: 6075828 Pontos: 1,00 / 1,00
Os modelos simbólicos são aqueles que:
Se baseiam em lógica e regras de inferência para aprender e raciocinar
São aqueles que só lidam com problemas categóricos
Se baseiam em táticas de agrupamento por similaridade
Se baseiam estritamente em dados e inferências estatísticas em cima deles
São aqueles que lidam apenas com problemas numéricos
02508 - HADOOP E ARMAZENAMENTO DE DADOS
5. Ref.: 6076138 Pontos: 1,00 / 1,00
Em relação aos RDBMS, selecione a opção que apresenta a característica que trata
as transações em um banco de dados como uma unidade indivisível.
Atomicidade.
Consistência.
Durabilidade.
Indivisibilidade.
Isolamento.
6. Ref.: 6076196 Pontos: 1,00 / 1,00
Compreender a tecnologia Hadoop e os aspectos fundamentais do seu ecossistema
é fundamental para o profissional de Tecnologia da Informação. Sendo assim,
selecione a opção correta sobre o Hadoop.
javascript:alert('C%C3%B3digo%20da%20quest%C3%A3o:%206075827.');
javascript:alert('C%C3%B3digo%20da%20quest%C3%A3o:%206075828.');
javascript:alert('C%C3%B3digo%20da%20quest%C3%A3o:%206076138.');
javascript:alert('C%C3%B3digo%20da%20quest%C3%A3o:%206076196.');
O Hadoop tem apenas uma única distribuição.
O Hadoop utiliza o HDFS para armazenar dados.
O Hadoop não funciona com pequenos volumes de dados.
Hadoop é um ambiente ideal para extrair e transformar pequenos volumes de
dados.
A estrutura de desenvolvimento no Hadoop é sequencial.
02727 - PRINCÍPIOS DE BIG DATA
7. Ref.: 6067206 Pontos: 1,00 / 1,00
A respeito das aplicações de fluxos de dados, selecione a opção correta.
Serviços de compras online
Serviços sob demanda, como serviços de filme online.
Reapresentação de programas de televisão.
Transações bancárias, como o serviço de PIX.
Serviço de correio eletrônico
8. Ref.: 6067388 Pontos: 1,00 / 1,00
Em relação às aplicações de Internet das coisas, selecione a opção correta sobre os
seus objetivos.
Aumentar a diversidade dos dados
Aumentar a complexidade do processo de gestão dos dados
Melhorar a interatividade com o usuário
Ampliar o volume de dados da aplicação
Obter dados que sirvam como base na tomada de decisão
02729 - PRINCIPIOS DE DESENVOLVIMENTO DE SPARK COM PYTHON
9. Ref.: 6082364 Pontos: 1,00 / 1,00
Observe o trecho de código abaixo
import numpy as np
x = np.array([1, 5, 1, 6, 4, 7, 7])
função_teste = lambda x: x+x
print(função_teste(x))
Selecione a opção correta a respeito dele.
javascript:alert('C%C3%B3digo%20da%20quest%C3%A3o:%206067206.');
javascript:alert('C%C3%B3digo%20da%20quest%C3%A3o:%206067388.');
javascript:alert('C%C3%B3digo%20da%20quest%C3%A3o:%206082364.');
A saída do programa é [2].
O programa produz a saída 31.
O programa ficará sintaticamente correto se for acrescentado o "SparkContext"
para executar o MapReduce.
O programa vai gerar um erro.
O programa vai gerar e imprimir [2 10 2 12 8 14 14].
10. Ref.: 6076009 Pontos: 1,00 / 1,00
A biblioteca Pandas é amplamente utilizada para manipular dados heterogêneos,
situação recorrente para aplicações de Big Data. Nesse sentido, selecione a opção que
contém a estrutura de dados que possibilita o Cientista de dados atribuir nome para as
colunas.
SQL
RDD
PySpark
DataFrame
numpy.array
javascript:alert('C%C3%B3digo%20da%20quest%C3%A3o:%206076009.');