Logo Passei Direto
Buscar

Avaliação da Disciplina

User badge image
Hugh

em

Ferramentas de estudo

Questões resolvidas

Em relação à análise digital é correto afirmar que:

A - Conhecida hoje como “Web Analytics” e compreende todas as páginas de um website. A análise de dados nos websites é feita observando as diferentes métricas de ferramentas como Google Analytics para avaliar o comportamento virtual do usuário dentro da página.
B - Antigamente restringia-se apenas ao termo “web”, mas nos dias de hoje o termo digital expande a todos os dispositivos capazes de conectar a web. A base dessas análises está relacionada a indicadores ou métricas específicas, como: taxa de rejeição, usuários ativos por hora, informações demográficas, etc.
C - Possui uma diversidade de APIs para acesso e exploração dos dados digitais. São dados como: origens do tráfego, sites mais visitados, registros de compras em um site de vendas e assim por diante. Apesar de todo o potencial, a complexidade e o custo para extrair esses dados impedem o amplo uso desses recursos digitais.
D - Está relacionada a um conjunto de métricas e indicadores para avaliar o comportamento digital de um usuário, como cliques de mouse, posts nas redes sociais, tempo de sessão e assim por diante. Por ser uma área recente, ainda não possui ferramentas com recursos suficientes para análise de grande volume de dados.
A
B
C
D

Em relação ao processo de Big Data, o que é possível afirmar?

A - É interativa e constituída de etapas similares à análise tradicional, com a diferença de que pode manipular grandes conjuntos de dados em nuvem.
B - É interativo devido às etapas de todo o processo serem independentes umas das outras, além de apresentar escopo bem reduzido, simplificando a análise.
C - É considerado iterativo de baixa complexidade se comparado à análise de dados tradicional, com etapas bem definidas e dependentes entre si.
D - É interativo e constituído pelas etapas de extração, ingestão, transformação, limpeza, análise de dados e visualização de dados.
A
B
C
D

Diante disso, em qual cenário uma empresa pode estar diante de um Big Data? A partir das alternativas abaixo, assinale a CORRETA:


A - Quando o conjunto de dados ultrapassar a casa dos 1PB e a empresa precise lidar com dados estruturados, semiestruturados e/ou não estruturados.
B - Em situações onde a infraestrutura de dados da empresa apresenta elevada taxa de latência e/ou inviabilidade para análises de dados de grande volume e em diferentes formatos e estruturas.
C - Em circunstâncias onde o volume de dados da organização aumente significativamente, tornando-se necessário comprar novos servidores, o que poderia elevar os custos com armazenamento.
D - Quando a análise de dados tradicional não estiver mais trazendo real valor para a organização, o que poderia indicar a possibilidade de trazer inovação com novas formas de analisar os dados.

Em relação aos componentes principais da arquitetura do HDFS, assinale a alternativa CORRETA.

O HDFS é formado pelo JobTracker e o TaskTrack. O primeiro é responsável por agendar e gerenciar as tarefas de armazenamento, enquanto que o segundo realiza as atividades diretamente nas máquinas destino.
O HDFS é formado pelo NameNode e DataNode. O primeiro é considerado vital, pois gerencia todos os dados que chegam ao sistema e notifica aos escravos (Data Node) em caso de falha. Estes apenas executam as tarefas solicitadas.
O HDFS é formado pelo JobTracker e o TaskTrack. O primeiro está relacionado ao armazenamento e processamento dos dados diretamente no cluster “pai”, enquanto que o segundo apenas obedece às instruções do pai e o notifica quando for o caso.
O HDFS é formado pelo NameNode e DataNode. O primeiro é considerado mestre porque controla todas as atividades relacionadas ao armazenamento físico dos dados em cada nó, enquanto o segundo processa os dados e comunica ao mestre.
a) A afirmativa II está correta.
b) A afirmativa IV está correta.
c) A afirmativa I está correta.
d) A afirmativa III está correta.

Relacione as técnicas com os algoritmos que as compõem, associando os itens, conforme o código abaixo: I – Clusterização Paralela. II – Clusterização baseada em MapReduce. ( ) GPMR. ( ) PBIRCH. ( ) MR-DBSCAN. ( ) G-DBSCAN. A partir das alternativas abaixo, assinale a CORRETA:


a) I – II – II – I.
b) II – I – I – II.
c) I – II – I – II.
d) II – I – II – I.

Material
páginas com resultados encontrados.
páginas com resultados encontrados.
left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Questões resolvidas

Em relação à análise digital é correto afirmar que:

A - Conhecida hoje como “Web Analytics” e compreende todas as páginas de um website. A análise de dados nos websites é feita observando as diferentes métricas de ferramentas como Google Analytics para avaliar o comportamento virtual do usuário dentro da página.
B - Antigamente restringia-se apenas ao termo “web”, mas nos dias de hoje o termo digital expande a todos os dispositivos capazes de conectar a web. A base dessas análises está relacionada a indicadores ou métricas específicas, como: taxa de rejeição, usuários ativos por hora, informações demográficas, etc.
C - Possui uma diversidade de APIs para acesso e exploração dos dados digitais. São dados como: origens do tráfego, sites mais visitados, registros de compras em um site de vendas e assim por diante. Apesar de todo o potencial, a complexidade e o custo para extrair esses dados impedem o amplo uso desses recursos digitais.
D - Está relacionada a um conjunto de métricas e indicadores para avaliar o comportamento digital de um usuário, como cliques de mouse, posts nas redes sociais, tempo de sessão e assim por diante. Por ser uma área recente, ainda não possui ferramentas com recursos suficientes para análise de grande volume de dados.
A
B
C
D

Em relação ao processo de Big Data, o que é possível afirmar?

A - É interativa e constituída de etapas similares à análise tradicional, com a diferença de que pode manipular grandes conjuntos de dados em nuvem.
B - É interativo devido às etapas de todo o processo serem independentes umas das outras, além de apresentar escopo bem reduzido, simplificando a análise.
C - É considerado iterativo de baixa complexidade se comparado à análise de dados tradicional, com etapas bem definidas e dependentes entre si.
D - É interativo e constituído pelas etapas de extração, ingestão, transformação, limpeza, análise de dados e visualização de dados.
A
B
C
D

Diante disso, em qual cenário uma empresa pode estar diante de um Big Data? A partir das alternativas abaixo, assinale a CORRETA:


A - Quando o conjunto de dados ultrapassar a casa dos 1PB e a empresa precise lidar com dados estruturados, semiestruturados e/ou não estruturados.
B - Em situações onde a infraestrutura de dados da empresa apresenta elevada taxa de latência e/ou inviabilidade para análises de dados de grande volume e em diferentes formatos e estruturas.
C - Em circunstâncias onde o volume de dados da organização aumente significativamente, tornando-se necessário comprar novos servidores, o que poderia elevar os custos com armazenamento.
D - Quando a análise de dados tradicional não estiver mais trazendo real valor para a organização, o que poderia indicar a possibilidade de trazer inovação com novas formas de analisar os dados.

Em relação aos componentes principais da arquitetura do HDFS, assinale a alternativa CORRETA.

O HDFS é formado pelo JobTracker e o TaskTrack. O primeiro é responsável por agendar e gerenciar as tarefas de armazenamento, enquanto que o segundo realiza as atividades diretamente nas máquinas destino.
O HDFS é formado pelo NameNode e DataNode. O primeiro é considerado vital, pois gerencia todos os dados que chegam ao sistema e notifica aos escravos (Data Node) em caso de falha. Estes apenas executam as tarefas solicitadas.
O HDFS é formado pelo JobTracker e o TaskTrack. O primeiro está relacionado ao armazenamento e processamento dos dados diretamente no cluster “pai”, enquanto que o segundo apenas obedece às instruções do pai e o notifica quando for o caso.
O HDFS é formado pelo NameNode e DataNode. O primeiro é considerado mestre porque controla todas as atividades relacionadas ao armazenamento físico dos dados em cada nó, enquanto o segundo processa os dados e comunica ao mestre.
a) A afirmativa II está correta.
b) A afirmativa IV está correta.
c) A afirmativa I está correta.
d) A afirmativa III está correta.

Relacione as técnicas com os algoritmos que as compõem, associando os itens, conforme o código abaixo: I – Clusterização Paralela. II – Clusterização baseada em MapReduce. ( ) GPMR. ( ) PBIRCH. ( ) MR-DBSCAN. ( ) G-DBSCAN. A partir das alternativas abaixo, assinale a CORRETA:


a) I – II – II – I.
b) II – I – I – II.
c) I – II – I – II.
d) II – I – II – I.

Prévia do material em texto

29/04/2023, 11:19 Avaliação da Disciplina
about:blank 1/9
Prova Impressa
GABARITO | Avaliação da Disciplina (Cod.:645387)
Peso da Avaliação 10,00
Prova 63888727
Qtd. de Questões 20
Nota 5,50
Os meios digitais consistem em um grande potencial para geração e análise dos dados. Nos dias de 
hoje as empresas têm investido nesses meios para compreender melhor como seus clientes atuam 
nestas redes.
 Em relação à análise digital é correto afirmar que:
A
 Conhecida hoje como “Web Analytics” e compreende todas as páginas de um website. A análise
de dados nos websites é feita observando as diferentes métricas de ferramentas como Google
Analytics para avaliar o comportamento virtual do usuário dentro da página.
B
 Antigamente restringia-se apenas ao termo “web”, mas nos dias de hoje o termo digital expande
a todos os dispositivos capazes de conectar a web. A base dessas análises está relacionada a
indicadores ou métricas específicas, como: taxa de rejeição, usuários ativos por hora, informações
demográficas, etc. 
C
 Possui uma diversidade de APIs para acesso e exploração dos dados digitais. São dados como:
origens do tráfego, sites mais visitados, registros de compras em um site de vendas e assim por
diante. Apesar de todo o potencial, a complexidade e o custo para extrair esses dados impedem o
amplo uso desses recursos digitais.
D
 Está relacionada a um conjunto de métricas e indicadores para avaliar o comportamento digital
de um usuário, como cliques de mouse, posts nas redes sociais, tempo de sessão e assim por
diante. Por ser uma área recente, ainda não possui ferramentas com recursos suficientes para
análise de grande volume de dados.
Apesar do grande crescimento, o Big Data é um conceito amplo que se refere à forma como lidamos 
com a grande quantidade de dados disponível para uso. Além disso, a empresa precisa construir uma 
infraestrutura para lidar com uma infinidade de fontes e processá-las em um tempo razoável.
 
Diante disso, em qual cenário uma empresa pode estar diante de um Big Data? A partir das 
alternativas abaixo, assinale a CORRETA:
A Quando o conjunto de dados ultrapassar a casa dos 1PB e a empresa precise lidar com dados
estruturados, semiestruturados e/ou não estruturados.
B Em situações onde a infraestrutura de dados da empresa apresenta elevada taxa de latência e/ou
inviabilidade para análises de dados de grande volume e em diferentes formatos e estruturas.
C
 Em circunstâncias onde o volume de dados da organização aumente significativamente,
tornando-se necessário comprar novos servidores, o que poderia elevar os custos com
armazenamento. 
D Quando a análise de dados tradicional não estiver mais trazendo real valor para a organização, o
que poderia indicar a possibilidade de trazer inovação com novas formas de analisar os dados.
 VOLTAR
A+ Alterar modo de visualização
1
2
29/04/2023, 11:19 Avaliação da Disciplina
about:blank 2/9
“O processo de Big Data Analytics é utilizado nos negócios para descobrir padrões. Encontrar as 
tendências de mercado e acompanhar o comportamento do consumidor ajuda os negócios em suas 
decisões estratégicas e de marketing”.
Disponível em: < https://marketingconteudo.com/big-data-analytics/ > 
Em relação ao processo de Big Data, o que é possível afirmar?
A partir das alternativas abaixo, assinale a CORRETA:
A É interativa e constituída de etapas similares à análise tradicional, com a diferença de que pode
manipular grandes conjuntos de dados em nuvem.
B É interativo devido às etapas de todo o processo serem independentes umas das outras, além de
apresentar escopo bem reduzido, simplificando a análise. 
C É considerado iterativo de baixa complexidade se comparado à análise de dados tradicional,
com etapas bem definidas e dependentes entre si.
D É interativo e constituído pelas etapas de extração, ingestão, transformação, limpeza, análise de
dados e visualização de dados. 
O HDFS é um sistema de arquivos do Hadoop que permite armazenar grandes volumes de dados e 
possui uma arquitetura que apresenta alguns componentes importantes.
 Dentre os componentes principais da arquitetura do HDFS, assinale a alternativa CORRETA.
A
 O HDFS é formado pelo JobTracker e o TaskTrack. O primeiro é responsável por agendar e
gerenciar as tarefas de armazenamento, enquanto que o segundo realiza as atividades diretamente
nas máquinas destino. 
B
 O HDFS é formado pelo NameNode e DataNode. O primeiro é considerado vital, pois gerencia
todos os dados que chegam ao sistema e notifica aos escravos (Data Node) em caso de falha.
Estes apenas executam as tarefas solicitadas.
C
 O HDFS é formado pelo JobTracker e o TaskTrack. O primeiro está relacionado ao
armazenamento e processamento dos dados diretamente no cluster “pai”, enquanto que o segundo
apenas obedece às instruções do pai e o notifica quando for o caso. 
D
 O HDFS é formado pelo NameNode e DataNode. O primeiro é considerado mestre porque
controla todas as atividades relacionadas ao armazenamento físico dos dados em cada nó,
enquanto o segundo processa os dados e comunica ao mestre. 
Uma das principais vantagens da clusterização baseada em MapReduce é, sem dúvida, a 
transparência de toda complexidade de implementação envolvida com a distribuição dos dados entre 
os clusters ou mesmo a capacidade para detectar e corrigir falhas que eventualmente possam ocorrer 
durante o processo.
 
Relacione as técnicas com os algoritmos que as compõem, associando os itens, conforme o código 
abaixo:
 I – Clusterização Paralela. II – Clusterização baseada em MapReduce. ( ) GPMR. ( ) PBIRCH. 
( ) MR-DBSCAN. ( ) G-DBSCAN. A partir das alternativas abaixo, assinale a CORRETA: 
A I – II – II – I.
B
3
4
5
29/04/2023, 11:19 Avaliação da Disciplina
about:blank 3/9
 II – I – I – II. 
C I – II – I – II. 
D II – I – II – I. 
Existem diversos métodos tradicionais que podem ser empregados para análise em cluster e são 
potencialmente interessantes em cenários de baixa complexidade - com quantidade de dados 
reduzida.
 Em relação aos métodos hierárquicos é CORRETO afirmar que:
A Agrupa um conjunto de pontos de dados em uma estrutura de árvore (dendograma) e fornece
boa capacidade para comunicação dos resultados. 
B Apresenta como vantagem a simplicidade e o fato de ser eficiente, mesmo em situações onde o
conjunto de dados é significativo.
C Divide o cluster através de níveis, onde os objetos alocados nos níveis superiores da árvore são
mais próximos entre si. 
D Define aleatoriamente um ponto de partida para o parâmetro K e assim tenta otimizar o
resultado ao longo das iterações.
Uma das soluções mais empregadas em Big Data para armazenamento, processamento e análise de 
grandes volumes de dados é conhecida como Hadoop. É uma solução open-source da Apache que 
possui diversas bibliotecas ou módulos.
 
Que características do Apache Hadoop são consideradas centrais, tanto para termos de 
armazenamento como processamento? A partir das alternativas abaixo, assinale a CORRETA: 
A Armazenamento por meio de um sistema de arquivos simples, robusto e escalável que pode ser
gerenciado por uma única máquina além de processamento em GPU para ganho de performance. 
B
 Armazenamento por meio de um sistema de arquivos próprio que armazena grandes volumes de
dados de forma distribuída e processamento distribuído por intermédio de um modelo simples e
eficiente de programação.
C
 Armazenamento por intermédio de um sistema de arquivos distribuído: NTFS para máquinas em
Windows e Ext4 para sistemas Linux, o processamento é feito pelo Hadoop MapReduce que
processa paralelamente os dados de forma eficiente.
D Armazenamento por meio de um sistema de arquivos distribuído e processamento
computacional veloz e paralelo utilizando GPU para tornar o processo mais eficiente. 
A transição da Web representou um importante mecanismo para a revolução dos dados e expôs um 
novo cenário de explosão e novos formatos para análise de dados nos meios digitais.
Nesse sentido, dentre as três fasesda web, qual destas representou a gênese para explosão dos dados?
 A partir das alternativas abaixo, assinale a CORRETA:
A Na Web 1.0 que representou o primeiro contato dos usuários em relação à web. 
6
7
8
29/04/2023, 11:19 Avaliação da Disciplina
about:blank 4/9
B Na Web 3.0 a partir da geração de conteúdo por parte do usuário e a compreensão semântica de
suas atividades na rede.
C Na Web 2.0 onde os usuários passaram a gerar conteúdo a partir de sistemas dinâmicos. 
D Entre a Web 1.0 e Web 2.0 com o surgimento das primeiras redes sociais. 
Nossa mente processa tudo por meio de imagens, sons e sensações, registrados internamente. Embora 
todos tenham os sistemas visual, auditivo e sinestésico, é comum que um deles seja mais 
desenvolvido do que os outros.
 Compreendido isso, analise e associe os itens que seguem: I – Predominância sensorial visual.
II – Predominância sensorial auditiva.III – Predominância sensorial sinestésica. 
( ) As pessoas com desta predominância dizem muito "E então eu disse... Daí ele falou... Eu sempre 
falo que...”, enquanto contam uma história, um fato ou uma lembrança.
( ) As pessoas desta predominância são capazes de falar durante meia hora sobre um almoço 
delicioso, contando sobre a beleza dos pratos, da louça e dos talheres.
( ) As pessoas desta predominância estão sempre dizendo "Eu sinto...", “Pressinto que...”. Geralmente 
são pessoas que gostam de tocar e abraçar as demais.
 Assinale a alternativa que apresenta a sequência correta de respostas:
A I – II – III.
B III – I – II.
C II – I – III.
D I – III – II.
Os métodos tradicionais de agrupamento (clustering) podem ser implementados por uma diversidade 
de algoritmos.
 Relacione a classe de algoritmos com os métodos, associando os itens, conforme o código abaixo: 
I – Algoritmos DIANA, ROCK.II – Algoritmos DBSCAN, OPTICS.
III – Algoritmos Expectation-Maximization (EM), Self-Organization Map (SOM)
IV – Algoritmos K-Means, CLARANS.V – Algoritmos STING, WAVECLUSTER. 
( ) Métodos hierárquicos.( ) Métodos baseados em grid.( ) Métodos de particionamento.
( ) Métodos baseados em modelos.( ) Métodos baseados em densidade. 
Assinale a alternativa que apresenta a sequência CORRETA: 
A II – V – III – IV – I.
B I – V – IV – III – II. 
C I – IV – V – II – III.
D III – IV – II – I – V.
9
10
29/04/2023, 11:19 Avaliação da Disciplina
about:blank 5/9
Um processo de análise de dados pode ser representado em quatro etapas. Cada uma dessas etapas 
possui particularidades que vão desde a base para implementação de análise de dados nas empresas 
até profundos e sofisticados mecanismos de análise dentro das organizações.
 
Em se tratando dos tipos de análises existentes, qual a opção que descreve a análise prescritiva? A 
partir das alternativas abaixo, assinale a CORRETA:
A
 É um tipo de análise voltado para responder apenas perguntas de situações que ainda não
ocorreram, mas que provavelmente venham a ocorrer. Isso é obtido através da criação de modelos
de aprendizagem de máquina avançados.
B
 Análise prescritiva refere-se ao tipo de análise que é responsável por tomar as decisões com
independência. Procura responder perguntas como: “Por que esse evento aconteceu?” e obtém
respostas através de algoritmos de classificação.
C
 É um processo voltado para responder perguntas do passado para inferir situações que venham a
ocorrer. Por isso, a participação humana é importante para fornecer suporte e aprimorar as
decisões obtidas pelos algoritmos implementados.
D
 Etapa mais avançada da análise de dados que fornece apoio à tomada de decisão de forma
automatizada com mínima intervenção humana. Isso é possível graças às experiências
desenvolvidas que são aperfeiçoadas ao longo do tempo.
O Apache Hadoop contém uma série de componentes que podem ser integrados ao framework. Esses 
componentes podem ser úteis para as mais diversas finalidades, como armazenamento, transferência 
de grandes volumes de dados ou até mesmo aplicação de algoritmos preditivos.
 A partir das opções abaixo, classifique V para as sentenças verdadeiras e F para as falsas: 
( ) O Apache Hive é um componente que pode ser integrado ao Hadoop para coletar dados de fontes 
estruturadas.
 
( ) O Apache HBase é um banco de dados não relacional propício a ambientes Big Data, uma vez 
que suporta um grande volume de dados mantendo alto desempenho.
 ( ) O Apache Sqoop permite mover grandes volumes de dados das fontes para o HDFS. 
( ) O Apache Mahout é um componente responsável por trabalhar diretamente com os dados da 
fonte: extraindo e coletando dados tanto para processamento em lote como em tempo real.
 A partir das alternativas abaixo, assinale a CORRETA: 
A V – V – V – F. 
B F – F – V – V. 
C F – V – F – V.
D V – V – F – F. 
Existem dois tipos de comunicação: a verbal e a não verbal. A verbal se utiliza de palavras para 
comunicar, como, por exemplo, a comunicação oral e a comunicação escrita. Já a comunicação não 
verbal, utiliza-se de outras ferramentas para transmitir as informações.
 Nesse sentido, assinale V para verdadeiro e F para falso nas afirmações que seguem: 
11
12
13
29/04/2023, 11:19 Avaliação da Disciplina
about:blank 6/9
( ) Comunicação por mímica: são os gestos das mãos, do corpo e da face.
( ) Comunicação por expressões faciais: é o olhar, a forma dos lábios e a contração dos músculos da 
face.
( ) Comunicação pela postura: é o modo como sentamos, o corpo inclinado para trás ou para frente e 
até mesmo a posição dos pés.
( ) Comunicação por gestos: pode ser voluntária, como um beijo ou um cumprimento, mas também 
pode ser involuntária, como, por exemplo, mãos que não param de rabiscar ou de mexer em algo.
 Assinale a alternativa que apresenta a sequência correta de respostas:
A V – V – V – F.
B F – V – V – F.
C V – V – V – V.
D F – V – V – V.
Comunicação é o processo de transmissão de informação de uma pessoa para outra e compartilhada 
por ambas.
 
Nesse sentido, assinale V para verdadeiro e F para falso acerca dos elementos que compõem o 
processo de comunicação:
 ( ) Emissor ou fonte: é a pessoa, coisa ou processo para o qual a mensagem é enviada.
( ) Mensagem: é o uso de SMS e mensagens de Whatsapp.
( ) Canal: espaço situado entre emissor e receptor.
( ) Destino ou destinatário: é a pessoa, coisa ou processo que emite a mensagem. 
Assinale a alternativa que apresenta a sequência correta de respostas:
A F – V – V – F.
B V – F – F – F.
C V – F – V – F.
D F – F – V – F.
O Apache Spark oferece não somente a capacidade de processamento, como também a possibilidade 
de realizar análises mais avançadas através de um conjunto de bibliotecas. Considerando isso, 
associe os itens, conforme o código abaixo:
 I – Spark SQL.II – Spark Streaming.III – Spark MLlib.IV – Spark GraphX. 
( ) Contém um conjunto de algoritmos otimizados de Machine Learning projetados para 
trabalharem em paralelo.
( ) Projetadas para processar estruturas em rede de forma otimizada e com elevada eficiência.
( ) É possível realizar consultas e processar dados estruturados em ambiente Big Data de forma ágil.
( ) Útil para manipular e processar dados de tempo real, analisando microbacths de dados de tempos 
em tempos.
 A partir das alternativas abaixo, assinale a CORRETA:
A III – IV – I – II. 
14
15
29/04/2023, 11:19 Avaliação da Disciplina
about:blank 7/9
B III – II – I – IV.
C IV – III – I – II.
D II – III – IV – I. 
As limitações advindas de técnicas tradicionais de análise em cluster motivaram o surgimento de 
propostas, especialmente para melhoria de desempenho. Dentre essas propostas surgiram as novas 
técnicas de clusterização.
 Tendo isso em mente, classifique V para as sentenças verdadeiras e F para as falsas:
( ) As técnicas de Single Machine Clustering (SMC) representaram uma das primeiras iniciativas 
para análise de dados de grande volume.
( ) As técnicas de Multi Machine Clustering (MMC) processam e analisam grandes conjuntos de 
dados de formaparalela e dessa forma são mais eficientes que técnicas de SMC.
( ) Embora as técnicas de MMC sejam mais eficientes que abordagens tradicionais, a complexidade 
do seu uso é um fator determinante para apostar em técnicas de SCM.
 A partir das alternativas abaixo, assinale a CORRETA: 
A V – V – V
B V – V – F. 
C V – F – F.
D F – V – V.
Em épocas passadas as empresas conviviam com certas limitações, em termos de tecnologia, para que 
pudessem analisar seus dados.
Por outro lado, nos dias atuais, as tecnologias possibilitaram e estimularam a produção de conteúdo.
Tendo isso em mente, classifique V para as sentenças verdadeiras e F para as falsas: 
( ) As empresas precisam lidar com o alto volume e variedade de dados digitais propondo soluções 
automáticas de análise a fim de se manterem competitivas.
( ) As empresas orientadas a dados têm à disposição uma massiva quantidade de dados, porém, em 
muitos casos não sabem como gerenciá-los.
( ) A elevada produção de conteúdo implica em um problema de sobrecarga de informação, 
evidenciando as limitações da ação humana para lidar com isso.
 Assinale a alternativa correta:
A V – F – F.
B F – V – V.
C V – F – V.
D V – V – V.
16
17
29/04/2023, 11:19 Avaliação da Disciplina
about:blank 8/9
Em métodos hierárquicos tradicionais a complexidade no espaço O(n²) e no tempo O(n³) é algo que 
limita o poder de ação dos algoritmos. E, em muitos casos, algumas circunstâncias tornam o processo 
de análise extremamente oneroso ou mesmo inviável. Essa limitação tem sido evidenciada por 
alguns fatores, quais destes é possível destacar?
 A partir das alternativas abaixo, assinale a CORRETA:
A O volume intenso e variado de dados que estão sendo gerados e requeridos para análise. 
B O modelo de gestão de dados que impôs o uso de algoritmos distribuídos para ganhos de
performance.
C O crescente número de ferramentas voltadas para Big Data que substituem as formas de análise
tradicionais.
D A exigência cada vez mais recorrente de aplicações voltadas para detecção de eventos
anômalos.
As técnicas de Multi Machine Clustering surgiram para otimizar e melhorar a escalabilidade e o 
desempenho das análises em cluster para atender às demandas do Big Data. Em relação às técnicas 
de Multi Machine Clustering, o que é possível afirmar?
 A partir das alternativas abaixo, assinale a CORRETA:
A Apresentam como grande característica o alto poder de processamento com implementação de
baixa complexidade e algoritmos como PAM, DBSCAN e PIRBICH. 
B São mais velozes que as abordagens tradicionais de agrupamento, no entanto, a alta
complexidade de implementação inviabiliza projetos de análises mais amplos. 
C É constituída pelas técnicas de clusterização paralela e baseada em MapReduce que tornam o
processo de paralelização menos complexo para o desenvolvedor.
D É composta pela clusterização paralela e pela clusterização baseada em MapReduce. A segunda,
inclusive, torna o processo de paralelização mais transparente para o desenvolvedor. 
Apesar da possibilidade de aprender pelos sistemas auditivo, visual e sinestésico, de maneira 
combinada, a maioria das pessoas utilizam um deles de forma predominante.
 
Sobre os estilos de organização de acordo com a predominância sensorial, analise as sentenças que 
seguem:
 
I – Visual: a percepção é global, ou seja, percebe o todo e, se necessário, decompõe em partes 
menores a percepção inicial.
II – Sinestésico: depende de informações detalhadas e de instruções na forma de passo a passo.
III – Auditivo: organização gradual, criativa e divergente, que se caracteriza por conclusões diferentes 
da maioria.
 Assinale a alternativa que apresenta a resposta correta:
A As sentenças II e III estão corretas.
B As sentenças I e III estão corretas.
18
19
20
29/04/2023, 11:19 Avaliação da Disciplina
about:blank 9/9
C As sentenças I, II e III estão corretas.
D A sentença I está correta.
Imprimir

Mais conteúdos dessa disciplina