Logo Passei Direto
Buscar
Material
páginas com resultados encontrados.
páginas com resultados encontrados.
details

Libere esse material sem enrolação!

Craque NetoCraque Neto

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

details

Libere esse material sem enrolação!

Craque NetoCraque Neto

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Prévia do material em texto

1) Teoria dos conjuntos é a teoria matemática que estuda coleções de elementos ou objetos 
chamadas de conjuntos. A similaridade de Jaccard é recomendada para calcular a 
similaridade entre conjuntos de objetos. Nesse contexto, calcule a similaridade de Jaccard das 
seguintes frases: 
 
Frase 1: "Fazer exercício ajuda no aprendizado". 
 
Frase 2: "Estudar é importante no aprendizado". 
 
Maque a alternativa que indica o resultado do cálculo. 
 
 
Você acertou! 
 
C. 
0,25. 
 
A similaridade de Jaccard é definida por: (Interseção de A e B)/(União de A e B). A interseção é igual a 2, 
pois existem apenas duas palavras comuns nos dois conjuntos: "no" e "aprendizado". A união dos 
conjuntos A e B é igual a 8. Como 2 é o valor da interseção entre os dois conjuntos e 8 é o valor da união, 
ao aplicar a similaridade de Jaccard o cálculo ficará da seguinte maneira: 
 
Similaridade de Jaccard = 8/2 
 
Similaridade de Jaccard = 0,25 
 
 
 
2) A similaridade textual é uma das principais técnicas no processamento de linguagem natural. 
Marque a alternativa que apresenta a correta definição de similaridade léxica: 
 
Você acertou! 
 
A. A similaridade léxica estuda a similaridade de fragmentos de textos a nível de palavras, frases ou 
documentos. 
 
A similaridade léxica estuda a similaridade de fragmentos de textos a nível de palavras, frases ou 
documentos. A similaridade semântica estuda o significado das palavras em determinado contexto ou 
situação. O som das palavras ou frases é estudado na Fonologia. Algoritmos de ordenação são 
responsáveis por ordenar vetores de objetos. A origem e a formação das palavras são foco da 
Etimologia. 
 
 
3) Duas strings podem ser consideradas similares se o valor da distância de edição for o menor 
possível, ou seja, o número mínimo de operações para transformar uma string em outra. 
 
Assim, qual é o número mínimo de operações de edição para transformar a string "TUTU" na 
string "ETU"? 
 
 
Resposta correta. 
 
E. Duas operações. 
 
São necessárias duas operações. Existem algumas formas de fazer, mas essa abordagem pode ser 
realizada por: 1) exclusão da primeira letra T, gerando a string "UTU"; 2) troca do primeiro U por E, 
gerando a string "ETU". Não é possível transformar a string "TUTU" em "ETU" com apenas uma 
operação, mas é possível com quatro, três e cinco operações. Porém, nesses casos, a transformação 
não será feita utilizando o número mínimo de operações. 
 
4) Diferentes abordagens foram propostas para medir a similaridade entre um texto e outro. 
Nesse contexto, qual método de similaridade textual utiliza vetores? 
 
Você acertou! 
 
A. Similaridade de cosseno. 
 
A similaridade de cosseno utiliza vetores para verificar a similaridade entre fragmentos de texto. O 
valor retornado por esse método está em um intervalo de −1 e 1, e quanto mais perto de 1 for, mais 
similares são os fragmentos de texto. 
 
A similaridade de Jaccard utiliza conjuntos. Os métodos minimum edit distance e distância de 
Levenshtein não precisam utilizar vetores para calcular o custo das operações. Os algoritmos de 
ordenação, apesar de trabalharem com vetores, não calculam a similaridade textual. 
 
 
5) Uma inovação tecnológica recente é criação de repostas inteligentes por e-mail. Qual dos 
métodos abaixo é o mais adequado para sugestão de respostas a partir do conteúdo de um e-
mail? 
 
Você acertou! 
 
C) N-gram. 
 
O métod o N-gram é um dos mais recomendados para predizer palavras por meio da 
probabilidade e calcular a possibilidade de uma resposta a partir do conteúdo de um e-mail. 
 
Os métodos minimum edit distance e distância de Levenshtein contabilizam o número mínimo de 
operações para transformar uma string em outra. A similaridade de Jaccard é utilizada para verificar a 
similaridade de objetos em conjuntos diferentes. Algoritmos de ordenação não calculam similaridade 
textual. Nenhum desses métodos calcula probabilidades para sugestão de textos.

Mais conteúdos dessa disciplina