Prévia do material em texto
1. O que é Text Mining (Mineração de Texto)? A) Processo de classificar documentos em categorias predefinidas. B) Técnica para extrair informações e padrões úteis de grandes volumes de dados textuais. C) Processo de transformar textos em imagens. D) Análise de sentimentos expressos em textos. Resposta correta: B) Técnica para extrair informações e padrões úteis de grandes volumes de dados textuais. Explicação: Text Mining refere-se à análise de grandes volumes de dados textuais com o objetivo de extrair informações valiosas, como padrões, tendências e relações entre palavras e conceitos. 2. Qual é o principal objetivo do Text Mining? A) Transformar texto em dados numéricos. B) Encontrar padrões e relações em dados textuais para ajudar na tomada de decisões. C) Organizar arquivos de texto em pastas. D) Melhorar a legibilidade de textos em websites. Resposta correta: B) Encontrar padrões e relações em dados textuais para ajudar na tomada de decisões. Explicação: O objetivo do Text Mining é processar grandes volumes de dados textuais e extrair insights úteis, como padrões, tendências e relacionamentos, que podem ser usados para melhorar a tomada de decisões. 3. O que é Tokenização no contexto de Text Mining? A) Processo de remoção de palavras irrelevantes do texto. B) Divisão de um texto em palavras ou frases menores (tokens). C) Transformação de palavras em números. D) Classificação de documentos em categorias. Resposta correta: B) Divisão de um texto em palavras ou frases menores (tokens). Explicação: A tokenização é o processo de dividir um texto em unidades menores, como palavras ou frases, chamadas de "tokens", para facilitar a análise e processamento. 4. Qual é a principal diferença entre Text Mining e Data Mining? A) Text Mining analisa apenas textos, enquanto Data Mining analisa qualquer tipo de dado. B) Data Mining é mais eficaz do que Text Mining. C) Text Mining lida com dados estruturados, enquanto Data Mining lida com dados não estruturados. D) Data Mining é mais rápido e simples do que Text Mining. Resposta correta: A) Text Mining analisa apenas textos, enquanto Data Mining analisa qualquer tipo de dado. Explicação: A principal diferença é que Text Mining se foca em analisar e extrair informações de dados textuais, enquanto Data Mining pode ser aplicado a qualquer tipo de dado, como numérico, de imagem, entre outros. 5. O que é o conceito de Stop Words em Text Mining? A) Palavras irrelevantes que são removidas durante o pré-processamento. B) Palavras com mais de cinco letras que devem ser analisadas com mais cuidado. C) Palavras que indicam sentimentos em um texto. D) Palavras-chave que definem o tema principal do texto. Resposta correta: A) Palavras irrelevantes que são removidas durante o pré-processamento. Explicação: Stop Words são palavras comuns (como "e", "o", "a", "de") que não agregam significado relevante para a análise e, por isso, são frequentemente removidas no pré-processamento de textos. 6. O que é Stemming no processo de Text Mining? A) Transformação de palavras em suas formas dicionárias ou base. B) Remoção de palavras irrelevantes do texto. C) Divisão de um texto em frases menores. D) Identificação de emoções expressas no texto. Resposta correta: A) Transformação de palavras em suas formas dicionárias ou base. Explicação: Stemming é o processo de reduzir as palavras às suas raízes, por exemplo, "amando", "amou" e "amar" podem ser reduzidas à palavra base "am". Isso ajuda a generalizar e reduzir a complexidade do texto. 7. O que é a técnica de TF-IDF usada em Text Mining? A) Técnica que calcula a relevância de uma palavra com base na frequência em um documento. B) Técnica para identificar o sentimento do autor do texto. C) Método para dividir um texto em tokens. D) Técnica para organizar textos em ordem cronológica. Resposta correta: A) Técnica que calcula a relevância de uma palavra com base na frequência em um documento. Explicação: TF-IDF (Term Frequency-Inverse Document Frequency) é uma métrica que ajuda a determinar a relevância de uma palavra em um documento, levando em conta a frequência no documento e a raridade da palavra em um conjunto maior de documentos. 8. O que é Lematização em Text Mining? A) O processo de reduzir palavras a uma forma base ou raiz, considerando seu significado. B) A remoção de palavras irrelevantes. C) A transformação de palavras em seus plurais. D) A divisão de palavras em sílabas. Resposta correta: A) O processo de reduzir palavras a uma forma base ou raiz, considerando seu significado. Explicação: Lematização é o processo de transformar palavras em sua forma base ou raiz, levando em consideração seu significado, o que permite identificar as formas canônicas das palavras, como "correndo" para "correr". 9. O que é Bag of Words (BoW) em Text Mining? A) Técnica que representa documentos como uma coleção de palavras, ignorando a ordem, mas mantendo a frequência. B) Modelo que organiza palavras de acordo com sua importância em um documento. C) Método para identificar o tom emocional de um texto. D) Técnica que utiliza imagens para representar as palavras de um texto. Resposta correta: A) Técnica que representa documentos como uma coleção de palavras, ignorando a ordem, mas mantendo a frequência. Explicação: O modelo Bag of Words ignora a ordem das palavras e foca apenas na frequência com que cada palavra aparece em um documento, o que pode ser útil para tarefas de classificação de texto. 10. Qual das opções abaixo é um exemplo de tarefa realizada por Text Mining? A) Classificação de documentos com base em categorias temáticas. B) Previsão de vendas futuras em mercados financeiros. C) Identificação de relações complexas entre variáveis em dados numéricos. D) Análise de sinais de uma rede de sensores. Resposta correta: A) Classificação de documentos com base em categorias temáticas. Explicação: Uma das tarefas comuns do Text Mining é classificar documentos em categorias temáticas (por exemplo, notícias sobre esportes, saúde, política) com base no conteúdo textual.