Logo Passei Direto
Buscar

Mineração de Dados - COM360 - Semana 6 - Atividade Avaliativa

User badge image
Ninjaboy

em

Ferramentas de estudo

Questões resolvidas

Material
páginas com resultados encontrados.
páginas com resultados encontrados.
left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Questões resolvidas

Prévia do material em texto

A mineração de itens frequentes requer a mineração de um algoritmo eficiente que possa minerar todo 0 conjunto. No entanto, construir uma FP-Tree não é suficiente. Pesquisas adicionais são necessárias para criar um algoritmo eficiente que também possa minerar itens frequentes com eficiência. Esse processo envolve uma técnica de "avançar e dividir" chamada "FP-Crescimento". Ele divide 0 problema em subproblemas menores para que um método de "dividir e conquistar", chamado "FP-Growth", possa ser aplicado. Com base no método de construção de uma FP-Tree compacta, assinale a alternativa que melhor descreve esse processo. a. As regras com confiança mínima de 30% ou mais devem ser selecionadas antes de qualquer outra regra. Isso ocorre porque todas as regras suportadas têm uma confiança superior a 30%, e cálculo da confiança é necessário ao selecionar quais regras usar. b. Para 0 algoritmo Apriori e 0 algoritmo FP-Growth, um conjunto inicial de itens com frequência maior do que 0 suporte mínimo atribuído, minsup, deve ser selecionado. Isso pode ser feito usando algoritmo FP-Growth ou algoritmo Apriori. C. Primeiro, combine dois itens do conjunto inicial em um único item. Em seguida, determine suporte para cada par de itens e elimine quaisquer pares com menos de 30% de suporte. Em seguida, algoritmo Apriori é usado para gerar conjunto de itens frequentes. algoritmo explora a FP-Tree das folhas até a raiz. Seja um nó na folha da FP-Tree. Em seguida, ele encontra conjuntos de itens frequentes de e continua até Após a exploração até a raiz, ele continua explorando as árvores até o-2, e assim por diante. e. No algoritmo Apriori, que gera repetidamente um conjunto de itens de ocorrência frequente, é necessário combinar os dois itens selecionados em três, com objetivo de determinar seu suporte. Uma árvore de itens usada com frequência é chamada de "FP-Tree". Ela tem um nulo como raiz, sendo que cada subárvore de itens tem uma tabela de cabeçalho de itens frequentes como filhos. Cada nó da árvore possui três campos: nome do item, contagem do número de transações representadas pela parte do caminho que passa por aquele nó e um link para próximo nó ou nulo (a raiz). Cada entrada na tabela de cabeçalho usada com frequência contém um nome de nó e um link para primeiro nó que compartilha esse nome. Além disso, cada entrada possui dois outros campos: um nome para item e um link para primeiro nó que compartilha esse nome. Avalie as afirmações a seguir sobre construção da FP-Tree e as correlacione adequadamente aos termos ou às ferramentas às quais se referem. 1. Determinação da lista de itens frequentes. 2. Construção da árvore. 3. Função I.A árvore possui um descendente D, então, incremente a contagem de D em 1. II. Dados os parâmetros de entrada relativos ao suporte mínimo, minsup, leia banco de dados. III. Chamada simplesmente de Tree e 0 rotule como null. Assinale a alternativa que correlaciona adequadamente os dois grupos de informações. a. b. C. d. e. Sobre as características do algoritmo FP-Growth, escolha a alternativa que contém somente afirmações corretas a respeito do algoritmo. I. Cada nó na sub-árvore de itens frequentes (FP-Tree) possui três campos: nome_do_item, contagem e link para outro nó II. FP-Growth usa uma estrutura de matriz para armazenar 0 conjunto de itens frequentes de forma comprimida. III. O conjunto de itens frequentes armazenado pela FP-Growth é, no pior caso, do mesmo tamanho da base transacional original. IV. O FP-Growth usa uma estrutura de árvore para armazenar conjunto de itens frequentes de forma comprimida. e III, apenas. III e IV, apenas. e IV, apenas. e III, apenas. I, III e IV, apenas.Observe a representação binária da base transacional abaixo contendo cinco transações com itens comprados em um supermercado. Escolha a alternativa que indica corretamente valores de suporte e confiança da regra de associação (Tomate). ID Alface Cebola Tomate Maçã Sabão Arroz Leite Açúcar 1 1 0 1 1 1 0 0 1 2 1 1 1 0 1 1 0 0 3 1 0 1 0 0 0 0 1 4 0 1 0 0 0 1 1 0 5 1 0 1 1 0 0 1 0 Suporte = confiança = 80% Suporte = 80%, confiança = 100% Suporte = 80%, confiança = 80% Suporte = confiança = 75% Suporte = 75%, confiança 80% Sobre as medidas de suporte e confiança, indique a alternativa que relaciona corretamente as afirmações a seguir com as duas medidas. 1. Suporte. 2. Confiança. I.É útil para a definição de limite para a eliminação de regras de associação pouco interessantes. II. Sua fórmula é: número de registros da tabela que contêm todos os itens da regra de asociação dividido pelo número de registros da tabela que contêm o antecedente de tal regra. III. É medida de acurácia de uma regra de associação. IV. Indica a probabilidade de ocorrência de uma regra de associação no conjunto total de transações. 1 e II; 2 III e IV. 1 e IV; 2 e III.Sobre a análise de regras de associação, indique a alternativa que contém somente exemplos de onde essas regras são frequentemente utilizadas. I. Realização de promoções. II. Campanhas de III. Identificação de categorias de produtos. IV. Vendas casadas. I, e III, apenas. IV, apenas. II e III, apenas. III e IV, apenas. I, e IV, apenas. Sobre as etapas do processo de mineração de regras de associação, observe a imagem a seguir. Selecione a alternativa que indica corretamente quais são as etapas no diagrama apresentado da figura. 1 2 3 4 Avaliação. II. Mineração das regras. III. Pré-processamento dos dados. IV. Geração do conjunto de itens frequentes. 1 III; 2 IV: 3 II; 4 1 III; 2 3 II; 4 IV

Mais conteúdos dessa disciplina