Ed
há 3 semanas
Vamos analisar cada uma das assertivas: I. O Word2Vec toma como entrada um grande corpus de texto e o vetoriza. A saída é uma lista de palavras, cada uma com um vetor correspondente. Verdadeiro, essa é uma descrição correta do funcionamento do Word2Vec. II. Word2Vec é uma boa técnica para lidar com ambiguidades. Duas palavras exatamente iguais, mas em dois contextos diferentes, terão vetores iguais. Falso, o Word2Vec não lida bem com ambiguidades, pois palavras idênticas em contextos diferentes terão vetores iguais, o que não ajuda a distinguir seus significados. III. O TF-IDF, na LSA, fornece a contagem de cada palavra e a frequência de palavras raras a fim de fornecer-lhes pesos com base em sua raridade. Falso, o TF-IDF realmente fornece pesos, mas a descrição não está correta em relação à LSA (Latent Semantic Analysis), que utiliza a matriz TF-IDF para reduzir a dimensionalidade e identificar relações semânticas. IV. A modelagem de tópicos realiza a contagem de palavras para inferir tópicos em dados estruturados, gerando um vetor do tamanho do vocabulário. Verdadeiro, essa é uma descrição correta da modelagem de tópicos. V. Dentre as bibliotecas presentes na linguagem Python para modelagem de tópicos, destaca-se a biblioteca de código aberto Gensim. Verdadeiro, Gensim é uma biblioteca popular para modelagem de tópicos em Python. Agora, vamos ver quais alternativas contêm as assertivas verdadeiras: - A) I, II e IV, apenas. (Falsa, pois II é falsa) - B) I, IV e V, apenas. (Verdadeira, pois todas são verdadeiras) - C) II, III e V, apenas. (Falsa, pois II e III são falsas) - D) I, III e V, apenas. (Falsa, pois III é falsa) - E) II, (Falsa, pois II é falsa) Portanto, a alternativa correta que contém todas as assertivas verdadeiras é: B) I, IV e V, apenas.