Logo Passei Direto
Buscar
Existem diversos métodos tradicionais que podem ser empregados para análise em cluster e são potencialmente interessantes em cenários de baixa complexidade - com quantidade de dados reduzida. Em relação aos métodos hierárquicos é CORRETO afirmar que:

Agrupa um conjunto de pontos de dados em uma estrutura de árvore (dendograma) e fornece boa capacidade para comunicação dos resultados.
Apresenta como vantagem a simplicidade e o fato de ser eficiente, mesmo em situações onde o conjunto de dados é significativo.
Divide o cluster através de níveis, onde os objetos alocados nos níveis superiores da árvore são mais próximos entre si.
Define aleatoriamente um ponto de partida para o parâmetro K e assim tenta otimizar o resultado ao longo das iterações.
a) A afirmativa I está correta.
b) A afirmativa II está correta.
c) A afirmativa III está correta.
d) A afirmativa IV está correta.
User badge image
EstrategiaEmpresarial

há 2 anos

Respostas

User badge image

Ed Verified user icon

há 7 meses

Vamos analisar cada afirmativa sobre os métodos hierárquicos de análise em cluster: I. Agrupa um conjunto de pontos de dados em uma estrutura de árvore (dendograma) e fornece boa capacidade para comunicação dos resultados. Verdadeiro, essa afirmativa está correta, pois os métodos hierárquicos realmente produzem um dendograma que facilita a visualização e interpretação dos resultados. II. Apresenta como vantagem a simplicidade e o fato de ser eficiente, mesmo em situações onde o conjunto de dados é significativo. Falso, embora os métodos hierárquicos sejam simples, eles podem se tornar ineficientes em conjuntos de dados grandes, pois a complexidade computacional aumenta significativamente. III. Divide o cluster através de níveis, onde os objetos alocados nos níveis superiores da árvore são mais próximos entre si. Verdadeiro, essa afirmativa está correta, pois nos métodos hierárquicos, os clusters são formados em níveis, e os objetos nos níveis superiores são, de fato, mais próximos entre si. IV. Define aleatoriamente um ponto de partida para o parâmetro K e assim tenta otimizar o resultado ao longo das iterações. Falso, essa descrição se refere ao método K-means, que não é um método hierárquico. Com base nas análises, as afirmativas corretas são I e III. Portanto, a alternativa correta que contém uma afirmativa verdadeira é: a) A afirmativa I está correta.

Essa resposta te ajudou?

0
Dislike0
left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar essa resposta. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

User badge image

Ed Verified user icon

há 2 anos

A alternativa correta é a letra A) A afirmativa I está correta. Os métodos hierárquicos de análise em cluster agrupam um conjunto de pontos de dados em uma estrutura de árvore (dendograma) e fornecem boa capacidade para comunicação dos resultados.

Essa resposta te ajudou?

0
Dislike0
User badge image

Marion Borges Baesso

há 2 anos

A alternativa correta é:

a) A afirmativa I está correta.

Métodos hierárquicos de análise de cluster realmente agrupam um conjunto de pontos de dados em uma estrutura de árvore (dendrograma) e fornecem uma boa capacidade para a comunicação dos resultados. Eles dividem os clusters através de níveis, onde os objetos alocados nos níveis superiores da árvore são mais próximos entre si.

Essa resposta te ajudou?

0
Dislike0

Ainda com dúvidas?

Envie uma pergunta e tenha sua dúvida de estudo respondida!

Essa pergunta também está no material:

Mais perguntas desse material

Em relação à análise digital é correto afirmar que:

A - Conhecida hoje como “Web Analytics” e compreende todas as páginas de um website. A análise de dados nos websites é feita observando as diferentes métricas de ferramentas como Google Analytics para avaliar o comportamento virtual do usuário dentro da página.
B - Antigamente restringia-se apenas ao termo “web”, mas nos dias de hoje o termo digital expande a todos os dispositivos capazes de conectar a web. A base dessas análises está relacionada a indicadores ou métricas específicas, como: taxa de rejeição, usuários ativos por hora, informações demográficas, etc.
C - Possui uma diversidade de APIs para acesso e exploração dos dados digitais. São dados como: origens do tráfego, sites mais visitados, registros de compras em um site de vendas e assim por diante. Apesar de todo o potencial, a complexidade e o custo para extrair esses dados impedem o amplo uso desses recursos digitais.
D - Está relacionada a um conjunto de métricas e indicadores para avaliar o comportamento digital de um usuário, como cliques de mouse, posts nas redes sociais, tempo de sessão e assim por diante. Por ser uma área recente, ainda não possui ferramentas com recursos suficientes para análise de grande volume de dados.
A
B
C
D

Em relação ao processo de Big Data, o que é possível afirmar?

A - É interativa e constituída de etapas similares à análise tradicional, com a diferença de que pode manipular grandes conjuntos de dados em nuvem.
B - É interativo devido às etapas de todo o processo serem independentes umas das outras, além de apresentar escopo bem reduzido, simplificando a análise.
C - É considerado iterativo de baixa complexidade se comparado à análise de dados tradicional, com etapas bem definidas e dependentes entre si.
D - É interativo e constituído pelas etapas de extração, ingestão, transformação, limpeza, análise de dados e visualização de dados.
A
B
C
D

Diante disso, em qual cenário uma empresa pode estar diante de um Big Data? A partir das alternativas abaixo, assinale a CORRETA:


A - Quando o conjunto de dados ultrapassar a casa dos 1PB e a empresa precise lidar com dados estruturados, semiestruturados e/ou não estruturados.
B - Em situações onde a infraestrutura de dados da empresa apresenta elevada taxa de latência e/ou inviabilidade para análises de dados de grande volume e em diferentes formatos e estruturas.
C - Em circunstâncias onde o volume de dados da organização aumente significativamente, tornando-se necessário comprar novos servidores, o que poderia elevar os custos com armazenamento.
D - Quando a análise de dados tradicional não estiver mais trazendo real valor para a organização, o que poderia indicar a possibilidade de trazer inovação com novas formas de analisar os dados.

Em relação aos componentes principais da arquitetura do HDFS, assinale a alternativa CORRETA.

O HDFS é formado pelo JobTracker e o TaskTrack. O primeiro é responsável por agendar e gerenciar as tarefas de armazenamento, enquanto que o segundo realiza as atividades diretamente nas máquinas destino.
O HDFS é formado pelo NameNode e DataNode. O primeiro é considerado vital, pois gerencia todos os dados que chegam ao sistema e notifica aos escravos (Data Node) em caso de falha. Estes apenas executam as tarefas solicitadas.
O HDFS é formado pelo JobTracker e o TaskTrack. O primeiro está relacionado ao armazenamento e processamento dos dados diretamente no cluster “pai”, enquanto que o segundo apenas obedece às instruções do pai e o notifica quando for o caso.
O HDFS é formado pelo NameNode e DataNode. O primeiro é considerado mestre porque controla todas as atividades relacionadas ao armazenamento físico dos dados em cada nó, enquanto o segundo processa os dados e comunica ao mestre.
a) A afirmativa II está correta.
b) A afirmativa IV está correta.
c) A afirmativa I está correta.
d) A afirmativa III está correta.

Relacione as técnicas com os algoritmos que as compõem, associando os itens, conforme o código abaixo: I – Clusterização Paralela. II – Clusterização baseada em MapReduce. ( ) GPMR. ( ) PBIRCH. ( ) MR-DBSCAN. ( ) G-DBSCAN. A partir das alternativas abaixo, assinale a CORRETA:


a) I – II – II – I.
b) II – I – I – II.
c) I – II – I – II.
d) II – I – II – I.

Mais conteúdos dessa disciplina