Prévia do material em texto
1) Teoria dos conjuntos é a teoria matemática que estuda coleções de elementos ou objetos chamadas de conjuntos. A similaridade de Jaccard é recomendada para calcular a similaridade entre conjuntos de objetos. Nesse contexto, calcule a similaridade de Jaccard das seguintes frases: Frase 1: "Fazer exercício ajuda no aprendizado". Frase 2: "Estudar é importante no aprendizado". Maque a alternativa que indica o resultado do cálculo. Você acertou! C. 0,25. A similaridade de Jaccard é definida por: (Interseção de A e B)/(União de A e B). A interseção é igual a 2, pois existem apenas duas palavras comuns nos dois conjuntos: "no" e "aprendizado". A união dos conjuntos A e B é igual a 8. Como 2 é o valor da interseção entre os dois conjuntos e 8 é o valor da união, ao aplicar a similaridade de Jaccard o cálculo ficará da seguinte maneira: Similaridade de Jaccard = 8/2 Similaridade de Jaccard = 0,25 2) A similaridade textual é uma das principais técnicas no processamento de linguagem natural. Marque a alternativa que apresenta a correta definição de similaridade léxica: Você acertou! A. A similaridade léxica estuda a similaridade de fragmentos de textos a nível de palavras, frases ou documentos. A similaridade léxica estuda a similaridade de fragmentos de textos a nível de palavras, frases ou documentos. A similaridade semântica estuda o significado das palavras em determinado contexto ou situação. O som das palavras ou frases é estudado na Fonologia. Algoritmos de ordenação são responsáveis por ordenar vetores de objetos. A origem e a formação das palavras são foco da Etimologia. 3) Duas strings podem ser consideradas similares se o valor da distância de edição for o menor possível, ou seja, o número mínimo de operações para transformar uma string em outra. Assim, qual é o número mínimo de operações de edição para transformar a string "TUTU" na string "ETU"? Resposta correta. E. Duas operações. São necessárias duas operações. Existem algumas formas de fazer, mas essa abordagem pode ser realizada por: 1) exclusão da primeira letra T, gerando a string "UTU"; 2) troca do primeiro U por E, gerando a string "ETU". Não é possível transformar a string "TUTU" em "ETU" com apenas uma operação, mas é possível com quatro, três e cinco operações. Porém, nesses casos, a transformação não será feita utilizando o número mínimo de operações. 4) Diferentes abordagens foram propostas para medir a similaridade entre um texto e outro. Nesse contexto, qual método de similaridade textual utiliza vetores? Você acertou! A. Similaridade de cosseno. A similaridade de cosseno utiliza vetores para verificar a similaridade entre fragmentos de texto. O valor retornado por esse método está em um intervalo de −1 e 1, e quanto mais perto de 1 for, mais similares são os fragmentos de texto. A similaridade de Jaccard utiliza conjuntos. Os métodos minimum edit distance e distância de Levenshtein não precisam utilizar vetores para calcular o custo das operações. Os algoritmos de ordenação, apesar de trabalharem com vetores, não calculam a similaridade textual. 5) Uma inovação tecnológica recente é criação de repostas inteligentes por e-mail. Qual dos métodos abaixo é o mais adequado para sugestão de respostas a partir do conteúdo de um e- mail? Você acertou! C) N-gram. O métod o N-gram é um dos mais recomendados para predizer palavras por meio da probabilidade e calcular a possibilidade de uma resposta a partir do conteúdo de um e-mail. Os métodos minimum edit distance e distância de Levenshtein contabilizam o número mínimo de operações para transformar uma string em outra. A similaridade de Jaccard é utilizada para verificar a similaridade de objetos em conjuntos diferentes. Algoritmos de ordenação não calculam similaridade textual. Nenhum desses métodos calcula probabilidades para sugestão de textos.