Prévia do material em texto
Questão 1/12 - Inteligência Artificial Aplicada
Você foi contratado para o posto de cientista de dados, para compor uma equipe, que atualmente
já trabalha com dados, mas não possui experiência em aprendizagem de máquina. Um das suas
primeiras tarefas designadas, foi a tradução de trechos de códigos em linguagem relacionados ao
treinamento de modelos de aprendizagem de máquina.
Um dos trechos que a equipe gostaria de decifrar se refere ao seguinte código:
from sklearn.preprocessing import StandardScaler
X = carrega_dataset()
sc = StandardScaler()
sc.fit(X)
De acordo com os seus conhecimentos de aprendizagem de máquina, o código acima
executa:
Nota: 0.0Você não pontuou essa questão
A um processo de treinamento dos dados
Você assinalou essa alternativa (A)
B um processo de predição
C um processo de normalização dos dados
Justificativa:
O uso do método fit da classe StandardScaler executa um processo de
normalização de dados.
D um processo de expansão dos dados
E não faz nada e pode ser comentado
Questão 2/12 - Inteligência Artificial Aplicada
Você necessita desenvolver um classificador bayesiano para detecção de spam baseado nas
palavras contidas nos e-mails recebidos. Para isso o classificador deverá utilizar o teorema de
Bayes, considerando as classes como spam e não-spam e o vetor de características como a
presença ou ausência de uma palavra, de acordo com a imagem acima.
Considerando do texto acima e valendo-se do seu conhecimento sobre classificação
bayesiana, o elemento P(?) será corretamente substituído por :
Nota: 10.0
A P(não-spam | spam)
B P(spam)
C P(palavra)
D P(spam | não-spam)
E P(palavra | spam)
Você assinalou essa alternativa (E)
Você acertou!
Justificativa:
Como o classificador bayesiano utiliza conhecimento prévio para fazer a
predição, nesse caso ele utilizará a informação da probabilidade de um
documento conter uma palavra, dado que ele é um spam, ou seja P(palavra
| spam).
Questão 3/12 - Inteligência Artificial Aplicada
O chefe de uma equipe de ciência de dados recebeu o resultado do treinamento de um modelo
de aprendizagem de máquina, conforme a imagem acima e gostaria de obter mais informações
sobre os dados de treinamento.
De acordo com os seus conhecimentos de aprendizagem de máquina e utilizando apenas
as informações fornecidas pelo gráfico podemos concluir que:
Nota: 10.0
A a base de testes possui 1845 instâncias
Você assinalou essa alternativa (A)
Você acertou!
Justificativa:
Não se pode fazer inferências sobre a divisão da base de treino ou o seu
uso. Contudo, podemos somar o quantitativo de todas as instâncias preditas
o que nos dá o total de 1845 instâncias.
B a base de testes possui 1720 instâncias
C a base de testes está dividida proporcionalmente
D não foi usada uma base de treino
E não há informações suficientes
Questão 4/12 - Inteligência Artificial Aplicada
O kNN é um algoritmo de aprendizagem supervisionada com a predição das classes feita por
meio de voto. Ou seja, contabiliza-se as classes dos vizinhos e a instância em análise recebe a
classe que teve maior número de votos.
Considerando o texto acima e valendo-se do seu conhecimento sobre aprendizagem de
máquina, o k da sigla do kNN está relacionado ao hiperparâmetro que define:
Nota: 0.0Você não pontuou essa questão
A coeficiente de erros
B o limite de erros
C o número de vizinhos a serem comparados
Justificativa:
Hiperparâmetro é um parâmetro, cujo valor é utilizado para direcionar ou
controlar o processo de aprendizagem. No caso do k-NN o número de
vizinho a serem comparados é um hiperparâmetro que define quantas
instâncias vizinhas serão comparadas com a instância sendo analisada.
D a taxa de erros
Você assinalou essa alternativa (D)
E o limite de acertos
Questão 5/12 - Inteligência Artificial Aplicada
Você foi contratado para o posto de cientista de dados, para compor uma equipe, que atualmente
já trabalha com dados, mas não possui experiência em aprendizagem de máquina. Um das suas
primeiras tarefas designadas, foi planejar um modelo de aprendizagem de máquina que consiga
agrupar os clientes de um site de venda online eu grupos de interesse. As informações de
navegação dos clientes no site foram coletadas e partir dessas informações devem ser criados os
agrupamentos de clientes, porém o agrupamento dos clientes deve ser feito de forma que os
agrupamentos possam ser considerados em grupos e subgrupos.
Utilizando os seus conhecimentos de aprendizagem de máquina e sabendo que a sua
equipe dispõe de capacidade de processamento e dados em abundância, você
recomendaria a utilização de:
Nota: 0.0Você não pontuou essa questão
A um modelo de agrupamento hierárquico
Justificativa:
De acordo com a descrição trata-se de um problema de aprendizagem não-
supervisionada, além disso é preciso obter uma estrutura hierárquica entre
os agrupamentos. Isso pode ser feito com o modelo de agrupamento
hierárquico.
B um classificador do tipo MLP
C uma classificador do tipo k-NN
Você assinalou essa alternativa (C)
D uma rede neural do tipo LSTM
E uma rede neura do tipo CNN
Questão 6/12 - Inteligência Artificial Aplicada
Os modelos de regressão logística e regressão linear, apresentam semelhanças, além do nome.
No entanto, utilizam funções diferentes para obtenção dos valores, apresentando outras
diferenças entre si que determinam os diferentes uso para os quais os modelos podem ser
aplicados.
Considerando o texto acima e valendo-se do seu conhecimento sobre aprendizagem de
máquina, de maneria simplificada podemos dizer que a principal diferença entre os
modelos é:
Nota: 0.0Você não pontuou essa questão
A o tipo treinamento
B a predição de valores contínuos e discretos
Justificativa:
A regressão logística realiza a predição de valores discretos, em intervalos
determinados. Enquanto a regressão linear realiza a predição de valores
contínuos.
C vetores de atributos com tamanhos distintos
D as categorias utilizadas
E o número de categorias
Você assinalou essa alternativa (E)
Questão 7/12 - Inteligência Artificial Aplicada
Como um iniciante na área de ciência de dados, você recebeu uma tarefa de agrupar um conjunto
de dados de pessoas, utilizando um algoritmo de agrupamento. Você executou a separação
utilizando um tutorial de internet, mas os resultados não foram satisfatórios. Buscando melhorar
os resultados você pediu ajuda a um expert que lhe disse apenas o seguinte: “Altere o seu k-
means para usar Manhattan ou Mahalanobis”.
De acordo com o seu conhecimento do algoritmo k-means, o expert estava sugerindo que
você:
Nota: 10.0
A utilizasse outro algoritmo
B utilizasse métricas de distância diferentes
Você assinalou essa alternativa (B)
Você acertou!
Justificativa:
Manhattan e Mahalanobis se referem a dois tipos distintos de métricas de
distância.
C utilizasse uma outra linguagem de programação
D utilizasse um método supervisionado
E utilizasse um framework
Questão 8/12 - Inteligência Artificial Aplicada
Durante o seu trabalho com redes neurais, buscando conseguir melhorar o seu modelo, você
pediu ajuda para amigo e lhe enviou o seu código de definição do modelo. O seu amigo, enviou
uma resposta dizendo o seguinte:
Altere o código
mlp_clf = MLPClassifier(warm_start=False, max_iter=100)
para
mlp_clf = MLPClassifier(warm_start=True, max_iter=100)
Utilizando os seus conhecimentos você prontamente identificou que o seu amigo estava
sugerindo:
Nota: 0.0Você não pontuou essa questão
A Cria um outro tipo de modelo
B Eliminar os pesos do seu modelo
C Inicializar os pesos do modelo
Justificativa:
O parâmetro warm_start faz com que os pesos do modelos sejam
inicializados, o que permite um processo de aprendizagemmais rápido.
D Estacionar os pesos do modelo
E Inverter os pesos do modelo
Você assinalou essa alternativa (E)
Questão 9/12 - Inteligência Artificial Aplicada
Você necessita implementar um módulo de detecção de spam. Como o volume e a frequência de
e-mails muito alta, você precisa de um algoritmo de classificação que permita obter de forma
rápida a identificação se o e-mail recebida se trata ou não de um spam, ainda que alguns falsos
positivos possam ocorrer.
Usando os seus conhecimentos de aprendizagem de máquina, você optaria por um
algoritmo de:
Nota: 0.0Você não pontuou essa questão
A classificador bayesiano
Justificativa:
Modelos de agrupamento hierárquico e do tipo k-NN não são indicados, pois
eles comparam uma instância com todos as outras instâncias, não
respondendo de forma rápida. Métodos de redes neurais (MLP, CNN)
tendem a necessitar de muita memória e processamento, o que faz com que
demorem em dar uma resposta rápida. Já modelos do tipo classificador
bayesiano tendem a ser mais rápidos que os demais, ainda que a sua
precisão e taxa de erros seja maior que outros algoritmos.
B agrupamento hierárquico
C rede neural profunda
Você assinalou essa alternativa (C)
D k-NN
E rede neural do tipo CNN
Questão 10/12 - Inteligência Artificial Aplicada
Um classificador bayesiano simples é treinado utilizando um conjunto de classes, C = {c1,c2 ,cn } e
um conjunto de instâncias de dados identificadas pelos vetores de características V = {v1, v2, …,
vn}.
Considerando as informações do texto acima e valendo-se do seu conhecimento sobre
teorema de Bayes, o classificador bayesiano, calcula a probabilidade de:
Nota: 0.0Você não pontuou essa questão
A uma instância ser da classe c, dado que o seu vetor de características
é v
Justificativa:
O classificador bayesiano executa uma classificação utilizando um
informação prévia e determinando qual o probabilidade de um instância
pertencer a uma classe, dado o seu vetor de características.
B uma instância ter o vetor de características v, dado que sua classe é c
C de uma instância ser da classe c, sem considerar o seu vetor de
características
Você assinalou essa alternativa (C)
D de uma instância possuir um vetor de características v
E de uma instância ser de uma classe que não consta em C
Questão 11/12 - Inteligência Artificial Aplicada (questão opcional)
Você foi contratado para o posto de cientista de dados, para compor uma equipe, que atualmente
já trabalha com dados, mas não possui experiência em aprendizagem de máquina. Um das suas
primeiras tarefas designadas, foi planejar um modelo de aprendizagem de máquina para trabalhar
com textos, que serão fornecidos de forma sequencial ao modelo.
Utilizando os seus conhecimentos de aprendizagem de máquina e sabendo que a sua
equipe dispõe de capacidade de processamento e dados em abundância, você
recomendaria a utilização de:
Nota: 0.0Você não pontuou essa questão
A um classificador bayesiano
B um classificador do tipo k-Means
C uma classificador do tipo k-NN
D uma rede neural do tipo LSTM
Justificativa:
As redes meurais do tipo LSTM são recomendadas para trabalhar com
dados fornecidos sequencialmente e que apresentem dependência dos
elementos fornecidos anteriormente, como no caso de dados de texto.
E uma rede neura do tipo CNN
Questão 12/12 - Inteligência Artificial Aplicada (questão opcional)
“Criada nos anos 1960, a tecnologia que usa computadores e algoritmos para reconhecer rostos
humanos ganhou escala há pelo menos uma década, muito graças ao avanço das redes sociais
e da internet. Com milhares de pessoas disponibilizando voluntariamente suas fotos na internet,
existe hoje um banco de dados com bilhões de imagens que servem para treinar redes de
inteligência artificial a detectar e reconhecer rostos.”
Disponível em <https://revistagalileu.globo.com/>. Acesso em 19/04/2021
Apesar de ter sido criada na década de 60, a tecnologia de reconhecimento facial somente
veio ser aplicada de fato e em larga escala nos tempos atuais. Dentre os motivos para que
essa tecnologia não tenha sido melhor explorada na décadas passadas, podemos destacar
como um fator de grande peso:
Nota: 0.0Você não pontuou essa questão
A a ausência de interesse em pesquisas
B os erros contidos nos métodos de reconhecimento
C não existir fotografia digital na época
D a baixa capacidade de armazenamento e processamento
Justificativa:
O processo de treinamento das redes neurais exige uma grande capacidade
de processamento computacional por conta da quantidade de cálculos que
devem ser executados para o correto ajuste dos pesos. Além disso, o
processo de aprendizagem a partir dos dados necessita de um grande
volume de dados, o que até algumas décadas atrás não era possível.
E nenhuma das anteriores