Prévia do material em texto
28/04/2022 19:37 Avaliação II - Individual
1/5
Prova Impressa
GABARITO | Avaliação II - Individual (Cod.:742748)
Peso da Avaliação 1,50
Prova 45422242
Qtd. de Questões 10
Acertos/Erros 10/0
Nota 10,00
Os métodos de classificação baseados em distância consideram proximidade entre dados em
relação ao espaço cartesiano. Esse tipo de método considera que dados similares tendem a estar em
uma mesma região no espaço de entrada. Sobre os elementos que compõem a classificação, baseados
em distância, associe os itens, utilizando o código a seguir: I- Similaridade. II- Dissimilaridade. III-
Minkowski. IV- Euclidiana. ( ) Um tipo de proximidade na qual quanto maior o valor observado,
mais parecidos são os objetos. Por exemplo, o coeficiente de correlação. ( ) Um tipo de proximidade
na qual quanto maior o valor observado, menos parecidos (mais dissimilares) serão os objetos. ( ) É
uma das medidas de dissimilaridade entre comunidades mais utilizadas na prática. Quanto menor o
valor da distância euclidiana entre dois objetos, mais próximas elas se apresentam em termos de
parâmetros quantitativos por classe; logo, quanto menor a distância euclidiana, maior a eficiência do
procedimento. ( ) É uma generalização da distância euclidiana, em que r é um parâmetro, n é o
número de dimensões (atributos) e pk e qk são, respectivamente, os k-ésimos atributos (componentes)
dos objetos de dados p e q. Assinale a alternativa que apresenta a sequência CORRETA:
A I - II - IV - III.
B I - II - III - IV.
C IV - III - I - II.
D IV - III - II - I.
O classificador Naïve Bayes é construído utilizando dados de treinamento para estimar a
probabilidade de um documento pertencer a uma classe. O teorema de Bayes, mostrado em anexo, é
utilizado para estimar estas probabilidades. Sobre a fórmula, classifique V para as sentenças
verdadeiras e F para as falsas: ( ) P (x) é a probabilidade original do preditor. ( ) P (c l x) é a
probabilidade posterior da classe (c, alvo) dado preditor (x, atributos). ( ) x é o conjunto de dados. ( )
P(C) é a probabilidade original da classe. Assinale a alternativa que apresenta a sequência
CORRETA: FONTE: OLIVEIRA, G. L.; NETO, M. G. M. Expertext: Uma ferramenta de
combinação de múltiplos classificadores naive bayes. Anales de la 4ª Jornadas Iberoamericanas de
Ingeniería de Software e Ingeniería de Conocimiento. Madrid, v. 1, p. 317-32, 2004.
A F - V - V - V.
B V - F - F - F.
C V - V - V - V
VOLTAR
A+ Alterar modo de visualização
1
2
28/04/2022 19:37 Avaliação II - Individual
2/5
C V V V V
D F - F - F - F.
A classificação, também denominada de categorização, é a atividade de rotular dados com suas
respectivas categorias temáticas, a partir de um conjunto de dados predefinidos. Os métodos de
classificação podem ser de aprendizado on-line ou off-line, de acordo com a capacidade de construir
e atualizar do classificador. Sobre as métricas de classificação, classifique V para as sentenças
verdadeiras e F para as falsas: ( ) A precisão é a porcentagem de amostras classificadas como
pertencentes à classe positiva e que realmente fazem parte de tal classe. ( ) A revocação, também
chamada de sensibilidade ou recall, é uma métrica que, entre todas as situações de classe positiva
como valor esperado, indica quantas estão corretas. ( ) Os verdadeiros negativos são baseados na
classificação correta da classe negativa. ( ) A revocação é a porcentagem de amostras classificadas
como pertencentes à classe positiva e que realmente fazem parte de tal classe. Assinale a alternativa
que apresenta a sequência CORRETA:
A F - V - V - F.
B F - V - F - V.
C V - V - V - F.
D V - F - V - F.
O Scikit-Learn é uma biblioteca para Python que oferece uma grande variedade de métodos de
aprendizado de máquina, tanto nas áreas de aprendizado supervisionado quanto em aprendizado não
supervisionado. Sobre o Scikit-Learn e sua implementação, analise as afirmações a seguir: ( ) Ao
utilizar from sklearn. import estará sendo importado do scikit-learn o método e seus recursos poderão
ser utilizados. ( ) x = LinearRegression() é uma instância de uma rede neural. ( ) O comando train é
utilizado para ajustar os dados e fazer com que o método aprenda. ( ) O comando predict permite
utilizar o método para predição. Assinale a alternativa que apresenta a sequência CORRETA:
FONTE: MASIERO, Andrey Araujo; FERREIRA, Leonardo Anjoletto; AQUINO, Plinio Thomaz.
Algoritmos de clusterização e python científico apoiando modelagem de usuário. Livro dos Tutoriais
do sobre Fatores Human, p. 42, 2012.
A F - V - V - F.
B V - F - F - V.
C F - V - F - V.
D V - F - F - F.
Uma das bases de dados mais utilizadas para estudos de machine learning é o conjunto de dados
Iris, no qual a partir de um conjunto de dados sobre flores, é possível realizar sua classificação.
3
4
5
28/04/2022 19:37 Avaliação II - Individual
3/5
Acerca do conjunto de dados Iris e o campo que representa seu rótulo em uma tarefa de classificação,
assinale a alternativa CORRETA:
A SepalLengthCm.
B Id.
C Species.
D PetallLengthCm.
A ideia básica do algoritmo dos K-vizinhos mais próximos é determinar a categoria de um
determinado objeto com base em similaridades entre os documentos no espaço. Para calcular a
similaridade, usa-se uma métrica de distância. Na imagem anexa, o ponto vermelho representa um
novo objeto que não se sabe a classe. Com base na imagem e na execução do KNN, classifique V
para as sentenças verdadeiras e F para as falsas: ( ) Considerando que K = 3, o ponto será na Classe
B. ( ) Considerando que K = 5, o ponto será na Classe B. ( ) Considerando que K = 6, o ponto será na
Classe A. ( ) Considerando que K = 7, o ponto será na Classe A. Assinale a alternativa que apresenta
a sequência CORRETA:
A V - F - F - V.
B F - V - V - F.
C F - V - F - V.
D V - F - V - V.
O scikit-learn é uma biblioteca de Python que possui várias implementações de algoritmos de
aprendizado de máquina, tais como de regressão, classificação e agrupamento. Foi projetado para
facilitar o uso do aprendizado de máquina através de uma linguagem simplificada. Assumindo que os
dados de um dataset qualquer já foram carregados nas variáveis de treino e teste: X_train, X_test,
y_train, y_test. Sobre a implementação do Naive Bayes com o scikit-learn, para que o comando seja
executado com êxito, ordene os itens a seguir: I- print('A acurácia do Naive Bayes na base de treino
é: {:.2f} '.format(classificador_NB.score(X_train_normalizado, y_train))) II- classificador_NB =
MultinomialNB() III- classificador_NB.fit(X_train_normalizado, y_train) IV- from
6
7
28/04/2022 19:37 Avaliação II - Individual
4/5
sklearn.naive_bayes import MultinomialNB Assinale a alternativa que apresenta a sequência
CORRETA: FONTE: COSTA, Axel Vieira Gomes et al. Classificador de fake news utilizando um
modelo de aprendizado de máquina com técnicas de processamento de linguagem natural. 2020.
Disponível em: https://repositorio.ufersa.edu.br/handle/prefix/5851. Acesso em: 13 abr. 2021.
A IV - III - II - I.
B I - II - III - IV.
C IV - II - III - I.
D I - III - IV - II.
A classificação é uma tarefa de machine learning que tem por objetivo classificar itens de dados
em uma entre diversas classes previamente definidas, com base em propriedades comuns, entre um
conjunto de objetos no banco de dados. Sobre a saída de um classificador binário analise os exemplos
que se encaixam nesse tipo assinalando-os com V ou F. ( ) Reconhecer como "positivo" ou
"negativo". ( ) Diagnosticar se um paciente tem determinada doença. ( ) Classificar um texto em 20
tipos de categorias. ( ) Determinar se uma foto contém um item específico ou não. Assinale a
alternativa que apresenta a sequência CORRETA: FONTE: MAXIMO, Fernando Attique;
OLIVEIRA, SR de M.; LOPES-ASSAD, Maria Leonor. Avaliação de métodos de seleção de
atributos para classificação de solos. In: Embrapa Informática Agropecuária-Artigo em anais de
congresso (ALICE). In: CONGRESSO BRASILEIRO DE AGROINFORMÁTICA, 6., 2007, São
Pedro, SP. Anais... Campinas: EmbrapaInformática Agropecuária, 2007.
A F - V - V - F.
B V - F - V - F.
C V - V - F - V.
D F - F - V - V.
A regressão logística é um classificador linear, membro do conjunto de modelos de regressão
linear chamado Modelos Lineares Generalizados, utilizado para o desenvolvimento dos mais diversos
tipos de previsões com machine learning. Assumindo que os dados de um dataset qualquer já foram
carregados nas variáveis de treino e teste: X_train, X_test, y_train, y_test, sobre a implementação da
Regressão Logística com o scikit-learn, e para que o método seja executado com êxito, ordene os
itens a seguir: I- from sklearn.linear_model import LogisticRegression II- classificador_RLog =
LogisticRegression(random_state=0) III- print('A acurácia da Regressão Logistíca na base de treino
é: {:.2f} '.format(classificador_RLog.score(X_train_normalizado,y_train))) IV-
classificador_RLog.fit(X_train_normalizado, y_train) Assinale a alternativa que apresenta a
sequência CORRETA:
A I - II - III - IV.
B I - II - IV - III.
C IV - III - II - I.
D IV - II - III - I
8
9
28/04/2022 19:37 Avaliação II - Individual
5/5
IV II III I.
O SVM é uma técnica de Aprendizagem de Máquina desenvolvida por Vapnik em 1995, que é
fundamentada na Teoria de Aprendizado Estatístico e utilizada para a classificação de dados.
Assumindo que os dados de um dataset qualquer já foram carregados nas variáveis de treino e teste:
X_train, X_test, y_train, y_test, sobre a implementação do SVM com o scikit-learn e para que o
método seja executado com êxito, ordene os itens a seguir: I- print('A acurácia do SVM na base de
treino é: {:.2f} '.for-mat(classificador_SVM.score(X_train_normalizado, y_train))) II-
classificador_SVM.fit(X_train_normalizado, y_train) III- classificador_SVM = svm.SVC() IV- from
sklearn import svm Assinale a alternativa que apresenta a sequência CORRETA: FONTE:
DOSCIATTI, Mariza Miola; FERREIRA, L. P. C.; PARAISO, E. C. Identificando emoções em textos
em português do Brasil usando máquina de vetores de suporte em solução multiclasse. ENIAC-
Encontro Nacional de Inteligência Artificial e Computacional. Fortaleza, Brasil, 2013.
A IV - II - I - III.
B IV - II - III - I.
C IV - III - II - I.
D I - II - III - IV.
10
Imprimir