Logo Passei Direto
Buscar
Material
páginas com resultados encontrados.
páginas com resultados encontrados.
left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Prévia do material em texto

PERGUNTA 1 
1. No universo da ciência de dados, há várias tipologias de algoritmos 
essencialmente utilizadas visando ao aprendizado de máquina por intermédio de 
modelos e análise de dados, sendo que os mesmos comumente dependem do 
número e dos atributos de exemplos para gerar conhecimentos. É importante 
ressaltar que o aprendizado de máquina será mais eficiente a partir do momento 
em que a cardinalidade de exemplos seja maior, pois se tem um aparato mais 
estruturado para representar a realidade. 
Em relação ao exposto, avalie as afirmações a seguir. 
I. O algoritmo de Random Forest é usualmente conhecido por Floresta Aleatória 
no contexto de Machine Learning. 
II. Fundamentalmente falando, trata-se de um algoritmo computacional voltado 
à criação de predições. 
III. O algoritmo de Random Forest gera aleatoriamente diversas áreas de 
decisão e, com base na combinação dos resultados das mesmas, caracteriza o 
resultado final. 
Está correto o que se afirma em: 
 
a. II e III, apenas. 
 
b. I e II, apenas. 
 
c. I e III, apenas. 
 
d. I, II e III. 
 
e. Apenas em I. 
2 pontos 
PERGUNTA 2 
1. Random Forest é um algoritmo específico de inteligência de máquina muito 
poderoso que visa caracterizar ou gerar predições, tendo aplicabilidades infinitas 
no mercado, desde bolsa de valores, passando pela área de gestão da 
tecnologia, bem como operação de equipamentos e CRM (Customer 
Relationship Management, em português, gestão de relacionamento com o 
cliente). Nesse contexto, surgem algoritmos voltados a projetos de ciência de 
dados na prática organizacional, dentre os quais pode ser citado o algoritmo 
de Random Forest, com suas características e funcionalidades peculiares. 
Em relação ao exposto, avalie as afirmações a seguir. 
I. No mundo globalizado, há competitividade acirrada entre organizações quanto 
à predição de dados, a qual pode ser um aparato fundamental para que as 
mesmas aumentem sua competitividade de mercado. 
II. Fundamentalmente falando, alguns dos algoritmos preditivos se alicerçam em 
essência em métodos estatísticos. 
III. O algoritmo de Random Forest é um dos principais e mais populares 
algoritmos de predição de dados e, por conseguinte, de ciência de dados. 
 
Está correto o que se afirma em: 
 
a. II e III, apenas. 
 
b. I e III, apenas. 
 
c. I, II e III. 
 
d. I e II, apenas. 
 
e. II, apenas. 
2 pontos 
PERGUNTA 3 
1. No mundo globalizado atual (com acesso a informações crescendo 
exponencialmente), é de fundamental importância o conhecimento de métodos 
e técnicas que auxiliem gestores e tomadores de decisão a entender melhor as 
referidas informações. Logo, transfigurar dados em informações relevantes é o 
desejo de toda organização, surgindo, assim, a Machine Learning (ML), a 
ciência de dados e a Inteligência Artificial (IA) com algoritmos diversos. 
Em relação ao exposto, avalie as afirmações a seguir. 
I. Existem diversos algoritmos de inteligência de máquina que se traduzem como 
algoritmos preditivos. 
II. A análise preditiva casada com a inteligência de máquina busca gerar 
predições futuras com base em padrões descobertos. 
III. A principal característica de um algoritmo preditivo é sua entrada, 
fundamentalmente falando, ser uma série temporal. 
Está correto o que se afirma em: 
 
a. I e II, apenas. 
 
b. Apenas em I. 
 
c. II e III, apenas. 
 
d. I e III, apenas. 
 
e. I, II e III. 
2 pontos 
PERGUNTA 4 
1. É sabido que a ciência de dados se alicerça em métodos e técnicas vinculadas 
a algoritmos diversos, sendo que tais algoritmos apresentam características e 
propriedades particulares de acordo com a tarefa desejada. De outra forma, é 
um tipo de abordagem na Ciência de Dados que ajuda as organizações a prever 
o futuro, com o intuito de se antecipar com relação ao mercado. Estamos 
especificamente falando da: 
 
a. análise customizada de dados. 
 
b. análise descritiva de dados. 
 
c. análise fatorial de dados. 
 
d. análise preditiva de dados. 
 
e. análise de regressão de dados. 
 
PERGUNTA 5 
1. Com a transformação digital, acelerada e dinâmica, a análise preditiva de 
dados tornou-se uma poderosa ferramenta para auxiliar estratégias de negócios 
e organizacionais como um todo, sendo amplamente utilizada por empresas dos 
mais variados portes e segmentos. No contexto atual, tomar decisões gerenciais 
assertivas pode significar aumento de lucratividade e ganho de competitividade 
de mercado por parte das organizações. É corriqueira, por exemplo, a 
conceituação de dados e informações como o “novo petróleo”, significando uma 
metodologia interessante para que empresas ganhem insights, observem 
oportunidades de mercado, realizem previsões futuras de mercado e atuem de 
forma mais concisa em linhas estratégicas. 
 
 
Considerando a teoria sobre predição de dados e suas principais características 
que contribuem significativamente a estudos e tomadas de decisões nas 
organizações, avalie as afirmações a seguir e as correlacione adequadamente 
aos termos a que se referem. 
1. Algoritmo preditivo. 
2. Algoritmo Random Forest. 
3. Árvore de decisão. 
I. Tem como fundamentação básica a geração de informações confiáveis sobre 
distintos aspectos para alicerçar e facilitar o processo decisório organizacional. 
II. É um algoritmo de treinamento supervisionado cuja entrada é uma série 
temporal que se enquadra na metodologia ensemble (métodos ensemble). 
III. É um elemento importante no contexto dos algoritmos preditivos de dados e 
um dos algoritmos mais comuns em aprendizado de máquina, realiza divisões 
sucessivas nos dados e gera conjuntos menores e específicos (atributos) até 
alcançar dimensões simplificadas para que informações sejam padronizadas. 
Assinale a alternativa que correlaciona adequadamente os dois grupos de 
informação: 
 
a. 1, II; 2, I; 3, III. 
 
b. 1, I; 2, II; 3, III. 
 
c. 1, III; 2, I; 3, II. 
 
d. 1, I; 2, III; 3, II. 
 
e. 1, III; 2, II; 3, I. 
1,5 pontos 
PERGUNTA 6 
1. O contexto das análises preditivas necessita do conhecimento sobre 
conceituação de análise de dados. Tal fato se baseia na argumentação de que 
a predição de dados se caracteriza como ferramenta gerencial com potencial de 
interpretar informações a fim de gerar padrões e descrever tendências de 
mercado. Ilustrando: quando se fala em previsões futuras de mercado, isso 
propicia que empresas distingam seus produtos e serviços daqueles de 
potenciais concorrentes, agregando valor de competitividade a si mesmas. 
Diante disso, algoritmos preditivos surgem como poderosa ferramenta para 
solucionar problemas (por exemplo, os algoritmos de Random Forest, KNN e 
árvores de decisão). Os algoritmos citados se enquadram num conjunto de 
métodos com a característica básica de apresentar a combinação de distintos 
modelos para computar um único resultado. 
 
Na ciência de dados, esses métodos são conhecidos como: 
 
a. métodos kensemble. 
b. métodos censemble. 
c. métodos densemble. 
d. métodos ensemble. 
e. métodos tensemble. 
 
Fazer teste: Semana 7 - Atividade Avaliativa 
Informações do teste 
Descrição 
Instruções Olá, estudante! 
Para responder a esta atividade, selecione a(s) alternativa(s) que você considerar correta(s); 
Após selecionar a resposta correta em todas as questões, vá até o fim da página e pressione “Enviar teste”. 
A cada tentativa, você receberá um conjunto diferente de questões. 
Pronto! Sua atividade já está registrada no AVA. 
Várias tentativas Este teste permite 3 tentativas. Esta é a tentativa número 1. 
Forçar conclusão Este teste pode ser salvo e retomado posteriormente. 
Suas respostas foram salvas automaticamente. 
Estado de Conclusão da Pergunta: 
Pergunta 1 2 pontos 
No mundo globalizado atual (com acesso a informações crescendo exponencialmente), é de fundamental importância o conhecimento Clique em Salvar e Enviar para salvar e enviar. Clique em Salvar todas as respostas para salvar todas as respostas. 
de métodos e técnicas que auxiliem gestores e tomadores dedecisão a entender melhor as referidas informações. Logo, transfigurar 
dados em informações relevantes é o desejo de toda organização, surgindo, assim, a Machine Learning (ML), a ciência de dados e a 
Inteligência Artificial (IA) com algoritmos diversos. 
Em relação ao exposto, avalie as afirmações a seguir. 
I. Existem diversos algoritmos de inteligência de máquina que se traduzem como algoritmos preditivos. 
II. A análise preditiva casada com a inteligência de máquina busca gerar predições futuras com base em padrões descobertos. 
III. A principal característica de um algoritmo preditivo é sua entrada, fundamentalmente falando, ser uma série temporal. 
Está correto o que se afirma em: 
a. Apenas em I. 
b. II e III, apenas. 
c. I, II e III. 
d. I e II, apenas. 
e. I e III, apenas. 
Pergunta 2 2 pontos 
Random Forest é um algoritmo específico de inteligência de máquina muito poderoso que visa caracterizar ou gerar predições, tendo 
aplicabilidades infinitas no mercado, desde bolsa de valores, passando pela área de gestão da tecnologia, bem como operação de 
equipamentos e CRM ( Customer Relationship Management , em português, gestão de relacionamento com o cliente). Nesse contexto, 
surgem algoritmos voltados a projetos de ciência de dados na prática organizacional, dentre os quais pode ser citado o algoritmo de 
Random Forest , com suas características e funcionalidades peculiares. 
Em relação ao exposto, avalie as afirmações a seguir. 
I. No mundo globalizado, há competitividade acirrada entre organizações quanto à predição de dados, a qual pode ser um aparato 
fundamental para que as mesmas aumentem sua competitividade de mercado. 
II. Fundamentalmente falando, alguns dos algoritmos preditivos se alicerçam em essência em métodos estatísticos. 
III. O algoritmo de Random Forest é um dos principais e mais populares algoritmos de predição de dados e, por conseguinte, de 
ciência de dados. 
Está correto o que se afirma em: 
a. I, II e III. 
b. I e II, apenas. 
c. II e III, apenas. 
d. II, apenas. 
e. I e III, apenas. 
Pergunta 3 2 pontos 
No universo da ciência de dados, há várias tipologias de algoritmos essencialmente utilizadas visando ao aprendizado de máquina por 
intermédio de modelos e análise de dados, sendo que os mesmos comumente dependem do número e dos atributos de exemplos para 
gerar conhecimentos. É importante ressaltar que o aprendizado de máquina será mais eficiente a partir do momento em que a 
cardinalidade de exemplos seja maior, pois se tem um aparato mais estruturado para representar a realidade. 
Em relação ao exposto, avalie as afirmações a seguir. 
I. O algoritmo de Random Forest é usualmente conhecido por Floresta Aleatória no contexto de Machine Learning . 
II. Fundamentalmente falando, trata-se de um algoritmo computacional voltado à criação de predições. 
III. O algoritmo de Random Forest gera aleatoriamente diversas áreas de decisão e, com base na combinação dos resultados das 
mesmas, caracteriza o resultado final. 
Está correto o que se afirma em: 
a. II e III, apenas. 
b. Apenas em I. 
c. I e III, apenas. 
d. I e II, apenas. 
e. I, II e III. 
Pergunta 4 1,5 pontos 
Com a transformação digital, acelerada e dinâmica, a análise preditiva de dados tornou-se uma poderosa ferramenta para auxiliar 
estratégias de negócios e organizacionais como um todo, sendo amplamente utilizada por empresas dos mais variados portes e 
segmentos. No contexto atual, tomar decisões gerenciais assertivas pode significar aumento de lucratividade e ganho de 
competitividade de mercado por parte das organizações. É corriqueira, por exemplo, a conceituação de dados e informações como o 
“novo petróleo”, significando uma metodologia interessante para que empresas ganhem insights , observem oportunidades de mercado, 
realizem previsões futuras de mercado e atuem de forma mais concisa em linhas estratégicas. 
Considerando a teoria sobre predição de dados e suas principais características que contribuem significativamente a estudos e 
tomadas de decisões nas organizações, avalie as afirmações a seguir e as correlacione adequadamente aos termos a que se referem. 
1. Algoritmo preditivo. 
2. Algoritmo Random Forest . 
3. Árvore de decisão. 
I. Tem como fundamentação básica a geração de informações confiáveis sobre distintos aspectos para alicerçar e facilitar o processo 
decisório organizacional. 
II. É um algoritmo de treinamento supervisionado cuja entrada é uma série temporal que se enquadra na metodologia ensemble 
(métodos ensemble ). 
III. É um elemento importante no contexto dos algoritmos preditivos de dados e um dos algoritmos mais comuns em aprendizado de 
máquina, realiza divisões sucessivas nos dados e gera conjuntos menores e específicos (atributos) até alcançar dimensões 
simplificadas para que informações sejam padronizadas. 
Assinale a alternativa que correlaciona adequadamente os dois grupos de informação: 
a. 1, I; 2, III; 3, II. 
b. 1, II; 2, I; 3, III. 
c. 1, III; 2, I; 3, II. 
d. 1, III; 2, II; 3, I. 
e. 1, I; 2, II; 3, III. 
Pergunta 5 1,5 pontos 
O contexto das análises preditivas necessita do conhecimento sobre conceituação de análise de dados. Tal fato se baseia na 
argumentação de que a predição de dados se caracteriza como ferramenta gerencial com potencial de interpretar informações a fim de 
gerar padrões e descrever tendências de mercado. Ilustrando: quando se fala em previsões futuras de mercado, isso propicia que 
empresas distingam seus produtos e serviços daqueles de potenciais concorrentes, agregando valor de competitividade a si mesmas. 
Diante disso, algoritmos preditivos surgem como poderosa ferramenta para solucionar problemas (por exemplo, os algoritmos de 
Random Forest , KNN e árvores de decisão). Os algoritmos citados se enquadram num conjunto de métodos com a característica 
básica de apresentar a combinação de distintos modelos para computar um único resultado. 
Na ciência de dados, esses métodos são conhecidos como: 
a. métodos ensemble . 
b. métodos tensemble . 
c. métodos densemble . 
d. métodos kensemble . 
e. métodos censemble . 
Pergunta 6 1 pontos 
Algoritmos são elementos fundamentais para que possamos criar mecanismos via ciência de dados na resolução de problemas 
diversos no contexto organizacional, ou seja, para transformarmos dados em informações relevantes para organizações tomarem 
decisões confiáveis. 
Assim sendo, constituem tipos de algoritmos utilizados na ciência de dados na aplicabilidade prática: 
a. algoritmo KMM; árvores de decisão; Random Forest . 
b. algoritmo KMM; árvores de decisão; Handle Forest . 
c. algoritmo PNN; árvores de decisão; Handle Forest . 
d. algoritmo KNN; árvores de decisão; Random Forest . 
e. algoritmo KMM; árvores MNP; Random Forest . 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
PERGUNTA 1 
1. Observe a imagem a seguir: 
 
 
Analise as afirmações sobre o algoritmo KNN representado pela imagem. 
I. O algoritmo realizará uma tarefa de regressão. 
II. O círculo verde, sendo um novo ponto a ser classificado, caso tenhamos um K 
igual a 3, passará a ser da Classe A. 
III. Se o algoritmo utilizar a linha (círculo) preta como definição dos vizinhos, o K 
será igual a 6. 
IV. Se o algoritmo utilizar a linha (círculo) vermelha como definição dos vizinhos, o 
K será igual a 3. 
De acordo com as afirmações apresentadas, indique qual alternativa traz todas as 
afirmações corretas. 
 
Apenas a afirmação IV. 
 
Apenas as afirmações I, III e IV. 
 
Apenas as afirmações II, III e IV. 
 
Apenas as afirmações I e II. 
 
Apenas as afirmações I e III. 
1,85 pontos 
PERGUNTA 2 
1. No contexto atual, cada vez mais as organizações devem basear suas 
decisões na análise de dados, desde problemas mais simples até os mais 
complexos. O conhecimento prévio e a obtenção de informações relevantes por 
meio de dados podem se tornar diferenciais competitivos para as organizações,independentemente da área de atuação e dos negócios. Disso advém a 
importância das análises preditivas de dados. 
Em relação ao exposto, avalie as afirmações a seguir. 
I. Atualmente as organizações se utilizam da análise preditiva de dados com o 
intuito de obter vantagem competitiva de mercado e aumentar a lucratividade. 
II. A análise preditiva de dados se baseia essencialmente em dados, modelos 
estatísticos e ferramentas de inteligência de máquina (grande volume de dados). 
III. Na tratativa organizacional, a análise preditiva de dados tem como 
responsabilidade fundamental municiar os gestores com informações confiáveis 
para o processo decisório. 
IV. A análise preditiva de dados permite, por exemplo, a caracterização de 
possíveis comportamentos a posteriori de mercado para direcionar os negócios 
empresariais. 
Está correto o que se afirma em: 
 
a. I e III, apenas. 
 
b. I, II e III, apenas. 
 
c. II e IV, apenas. 
 
d. I, II, III e IV. 
 
e. III e IV, apenas. 
1,85 pontos 
PERGUNTA 3 
1. Considere como verdadeiras (V) ou falsas (F) as afirmações a seguir sobre análise 
preditiva. 
( ) A análise preditiva permite que você veja o invisível para as outras pessoas – em 
especial, padrões úteis em seus dados. 
( ) Aumentar ou não o limite de crédito de um cliente está relacionado à vantagem de 
visão que a análise preditiva proporciona. 
( ) Conhecer a lista de desejos dos seus clientes é uma vantagem de decisão que a 
análise preditiva proporciona. 
( ) Um modelo de análise preditiva bem-feito oferece resultados analíticos livres de 
emoção ou viés. 
A sequência correta de preenchimento dos parênteses, de cima para baixo, é: 
 
F, F, V, F 
 
F, V, F, V 
 
V, F, F, V 
 
V, V, F, F 
 
F, V, V, V 
1,3 pontos 
PERGUNTA 4 
1. Considere como verdadeiras (V) ou falsas (F) as afirmações sobre o uso de datasets 
da biblioteca Scikit-Learn: 
( ) Para usar o dataset é necessário importá-lo usando o comando “from sklearn 
import datasets”. 
( ) O comando “iris=datasets.load_iris()” 
 carrega todo o dataset iris para a variável iris. 
( ) Com a variável íris tendo sido carregada com o dataset, o atributo “iris.atributes” 
terá o nome das colunas do dataset. 
( ) Com a variável íris tendo sido carregada com o dataset, os dados, sem a coluna 
alvo, estarão disponíveis em “iris.target”. 
A sequência correta de preenchimento dos parênteses, de cima para baixo, é: 
 
V, V, F, F 
 
V, F, F, V 
 
V, V, F, V 
 
F, V, V, F 
 
V, F, V, F 
1,3 pontos 
PERGUNTA 5 
1. É notório que vivemos num mundo cada vez mais caracterizado pelas 
informações presentes e pelo conhecimento gerado por elas com base em 
análises e interpretações estruturadas, coerentes e precisas. Dessa maneira, 
percebe-se claramente que técnicas e tecnologias associadas com a predição 
de dados estão se transformando em aparato fundamental e crucial para as 
organizações tomarem decisões nos mais variados campos. Disso advém a 
importância do conhecimento de métodos e técnicas vinculados a ciência de 
dados, Machine Learning (ML), Inteligência Artificial (IA) etc. 
Considerando a importância de predição de dados e utilização de algoritmos 
diversos que direcionam à resolução de problemas no contexto organizacional 
de forma mais confiável, avalie as afirmações a seguir, em relação a 
estruturação e aplicabilidade da predição de dados via ML, e as correlacione 
adequadamente aos termos a que se referem. 
1. Algoritmo KNN. 
2. Predição. 
3. Conhecimento. 
I. Caracteriza-se como um algoritmo de aprendizado de ML de simples 
implementação alicerçado na técnica de aprendizado supervisionado. 
II. Técnica vinculada à ciência de dados para predizer ações futuras e moldar 
comportamentos diversos. 
III. A criação de modelos preditivos é feita com base em algoritmos de 
reprodução do conhecimento. 
Assinale a alternativa que correlaciona adequadamente os dois grupos de 
informação: 
 
a. 1, II; 2, III; 3, I. 
 
b. 1, II; 2, I; 3, III. 
 
c. 1, III; 2, II; 3, I. 
 
d. 1, I; 2, III; 3, II. 
 
e. 1, I; 2, II; 3, III. 
1,3 pontos 
PERGUNTA 6 
1. Um modelo preditivo bastante conhecido, baseado em distâncias e que não parte de 
hipóteses matemáticas, nem exige maquinário pesado é: 
 
Árvore de Decisão. 
 
Random Forest. 
 
Naive Bayes. 
 
KNN. 
 
SVM. 
1,2 pontos 
PERGUNTA 7 
1. No mundo globalizado em que vivemos, tornando-se a informação um aparato 
competitivo para organizações por intermédio de decisões mais assertivas, 
tecnologias relacionadas a predição de dados são visualizadas como 
ferramentas indispensáveis às empresas, independentemente da área de 
atuação (às vezes, vistas como mecanismo indispensável à sobrevivência por 
conta da transfiguração de dados em verdadeiros tesouros — informações 
relevantes). Diante disso, questionamentos como os dispostos adiante podem 
aparecer frequentemente. Qual produto ou marca você visualizou antes de 
decidir por qual comprar? Como você poderia escolher a melhor profissão para 
o futuro? Antes de adquirir um produto, você visualiza comentários sobre o 
mesmo? 
Nesse sentido, modelar comportamentos e descrever ações em data 
science pode ser realizado por: 
 
a. predição de variáveis. 
 
b. predição unilaterais. 
 
c. predição de caracteres. 
 
d. predição de dados. 
 
e. predição de regressões. 
 
 
PERGUNTA 1 
No mundo atual, informações têm valor relevante para as organizações buscarem as melhores soluções a 
seus problemas, independentemente do grau de complexidade, ou seja, amostrar dados e transformá-los 
em informações relevantes é uma maneira de as empresas gerarem as melhores decisões e criarem 
estratégias mais confiáveis para a alta competitividade de mercado. Em outras palavras, as tecnologias se 
baseiam na busca inteligente de informações por meio de análise e interpretação de grande volume de 
dados de seu público-alvo. Logo os algoritmos são os elementos chave para tratativa da resolução de 
problemas no cunho de ciência de dados, Machine Learning (ML), Inteligência Artificial (IA) etc., cada um 
com características específicas. 
Ilustrando: temos o algoritmo usualmente conhecido como “K-vizinhos mais próximos”, de simples 
compreensão e que constitui ferramenta importante para problemas de classificação e regressão na gestão 
dos negócios organizacionais. 
Com base no exposto, assinale a alternativa que descreve a nomenclatura para tal algoritmo. 
 
a. Algoritmo KNM. 
 
b. Algoritmo KMM. 
 
c. Algoritmo KNN. 
 
d. Algoritmo KKN. 
 
e. Algoritmo KMN 
 
PERGUNTA 2 
Um método de avaliação bastante utilizado em aprendizado de máquina em que o conjunto de exemplos é dividido 
em r subconjuntos de tamanho aproximadamente igual. Os objetos de r – 1 partições são utilizados no treinamento 
de um preditor, o qual é então testado na partição restante. Esse processo é repetido r vezes, utilizando em cada 
ciclo uma partição diferente para teste. O desempenho final do preditor é dado pela média dos desempenhos 
observados sobre cada subconjunto de teste. Qual é esse método? 
 
 Amostragem aleatória. 
 
 Bootstrap. 
 
 MSE – Mean Squared Error (Erro Quadrático Médio). 
 
 Holdout. 
 
 Validação Cruzada. 
 
PERGUNTA 3 
Observe a imagem a seguir: 
 
Analise as afirmações sobre o algoritmo KNN representado pela imagem. 
I. O algoritmo realizará uma tarefa de regressão. 
II. O círculo verde, sendo um novo ponto a ser classificado, caso tenhamos um K igual a 3, passará a ser da Classe A. 
III. Se o algoritmo utilizar a linha (círculo) preta como definição dos vizinhos, o K será igual a 6. 
IV. Se o algoritmo utilizar a linha (círculo) vermelha como definição dos vizinhos, o K será igual a 3. 
De acordo com as afirmações apresentadas, indique qual alternativa traz todas as afirmações corretas. 
 
 Apenas as afirmações I, III e IV. 
 
 Apenas a afirmação IV. 
 
 Apenas as afirmações II, III e IV. 
 
 Apenas as afirmações I e II.Apenas as afirmações I e III. 
 
PERGUNTA 4 
Analise as informações a seguir sobre modelos, no contexto de ciência de dados. 
I. A visualização é parte fundamental e integrante de um modelo de Machine Learning. 
II. Modelos são construídos para simular um fenômeno do mundo real como um passo investigativo, em busca da 
compreensão sobre algo que está acontecendo. 
III. Um modelo é uma representação matemática de um objeto ou um processo. 
IV. Um modelo pode nascer da análise de transações históricas, na busca por um padrão consistente nessas 
transações. 
De acordo com as afirmações apresentadas, indique qual alternativa traz todas as afirmativas corretas. 
 
 Apenas as afirmações II e III. 
 
 Apenas a afirmação II. 
 
 Apenas as afirmações II, III e IV. 
 
 Apenas as afirmações I e IV. 
 
 Apenas as afirmações III e IV. 
 
PERGUNTA 5 
Considere as afirmações a seguir, sobre Análise ROC, como verdadeiras (V) ou falsas (F): 
( ) O gráfico ROC é um gráfico bidimensional plotado em um espaço denominado espaço ROC, com eixos X e Y 
representando as medidas de taxa de falsos positivos (TFP) e taxa de verdadeiros positivos (TVP), respectivamente. 
( ) ROC quer dizer Receiving Operating Characteristics. 
( ) Seu uso inicial foi para avaliação e comparação de algoritmos. 
( ) Uma das principais desvantagens do uso da Análise ROC é seu baixo desempenho com grande quantidade de 
dados. 
A sequência correta de preenchimento dos parênteses, de cima para baixo, é: 
 
 F, V, F, V 
 
 V, V, V, F 
 
 V, F, V, V 
 
 F, F, V, F 
 
 V, F, F, V 
PERGUNTA 6 
No mundo globalizado de intensa concorrência entre indivíduos e organizações, ferramentas voltadas ao 
agrupamento de ações que permitam vantagem competitiva são de extrema importância. Diante disso, data 
science se caracteriza como alicerce interessante, pois a predição de dados permite criar modelos de 
comportamentos e predizer ações futuras; logo, as indagações adiante podem ser mais bem estudadas pela 
análise de predição de dados. Qual marca o cliente pesquisou antes de comprar? O cliente visualizou que 
tipo de propaganda sobre os produtos avaliados? Quanto tempo levou para o cliente decidir pelo produto A 
ou B? 
Com base nas informações apresentadas, identifique se são (V) verdadeiras ou (F) falsas as afirmativas a 
seguir. 
I. ( ) Análise preditiva é a capacidade de prever resultados e gerar insights futuros alicerçados numa base 
de dados (passado e presente). 
II. ( ) As grandes organizações mundiais se utilizam substancialmente da análise preditiva de dados com o 
intuito de gerar soluções mais assertivas. 
III. ( ) A análise preditiva se utiliza de Machine Learning e modelagem estatística. 
Assinale a alternativa que apresenta a sequência CORRETA. 
 
a. V; F; F. 
 
b. V; V; F. 
 
c. F; F; V. 
 
d. V; V; V. 
 
e. F; V; V. 
 
Estado de Conclusão da Pergunta: 
Fazer teste: Semana 6 - Atividade Avaliativa 
Informações do teste 
Descrição 
Instruções Olá, estudante! 
Para responder a esta atividade, selecione a(s) alternativa(s) que você considerar correta(s); 
Após selecionar a resposta correta em todas as questões, vá até o fim da página e pressione “Enviar teste”. 
A cada tentativa, as perguntas e alternativas são embaralhadas 
Pronto! Sua atividade já está registrada no AVA. 
Várias tentativas Este teste permite 3 tentativas. Esta é a tentativa número 1. 
Forçar conclusão Este teste pode ser salvo e retomado posteriormente. 
Suas respostas foram salvas automaticamente. 
Pergunta 1 1,2 pontos 
Clique em Salvar e Enviar para salvar e enviar. Clique em Salvar todas as respostas para salvar todas as respostas. 
Para realizar a acurácia no algoritmo KNN podemos utilizar uma função do próprio Scikit-Learn. Qual das funções abaixo é responsável por calcular 
a acurácia? 
fit() 
KNeighborsRegressor() 
predict() 
KNeighborsClassifier() 
score() 
Pergunta 2 1,2 pontos 
Sempre que se fala em data science ou big data vem à tona o termo “predição”, ressaltando que ambos os contextos visam à tomada 
de decisão com confiabilidade por parte das organizações. 
Com base no exposto, assinale a alternativa voltada corretamente a predição de dados e tomada de decisão no big data alicerçadas 
por meio de fatos já ocorridos. 
a. Decisões específicas com base nos fatos já ocorridos. 
b. Decisões pautadas no que aconteceu e naquilo que pode acontecer. 
c. Decisões arbitrárias com base nos fatos já ocorridos. 
d. Decisões essencialmente pautadas no que aconteceu. 
e. Decisões pautadas no que aconteceu e não necessariamente naquilo que pode acontecer. 
Pergunta 3 1,3 pontos 
Considere como verdadeiras (V) ou falsas (F) as afirmações sobre o uso de datasets da biblioteca Scikit-Learn: 
( ) Para usar o dataset é necessário importá-lo usando o comando “from sklearn import datasets”. 
( ) O comando “iris=datasets.load_iris()” 
carrega todo o dataset iris para a variável iris. 
( ) Com a variável íris tendo sido carregada com o dataset, o atributo “iris.atributes” terá o nome das colunas do dataset. 
( ) Com a variável íris tendo sido carregada com o dataset, os dados, sem a coluna alvo, estarão disponíveis em “iris.target”. 
A sequência correta de preenchimento dos parênteses, de cima para baixo, é: 
V, V, F, F 
F, V, V, F 
V, F, V, F 
V, V, F, V 
V, F, F, V 
Pergunta 4 1,3 pontos 
É notório que vivemos num mundo cada vez mais caracterizado pelas informações presentes e pelo conhecimento gerado por elas 
com base em análises e interpretações estruturadas, coerentes e precisas. Dessa maneira, percebe-se claramente que técnicas e 
tecnologias associadas com a predição de dados estão se transformando em aparato fundamental e crucial para as organizações 
tomarem decisões nos mais variados campos. Disso advém a importância do conhecimento de métodos e técnicas vinculados a 
ciência de dados, Machine Learning (ML), Inteligência Artificial (IA) etc. 
Considerando a importância de predição de dados e utilização de algoritmos diversos que direcionam à resolução de problemas no 
contexto organizacional de forma mais confiável, avalie as afirmações a seguir, em relação a estruturação e aplicabilidade da predição 
de dados via ML, e as correlacione adequadamente aos termos a que se referem. 
1. Algoritmo KNN. 
2. Predição. 
3. Conhecimento. 
I. Caracteriza-se como um algoritmo de aprendizado de ML de simples implementação alicerçado na técnica de aprendizado 
supervisionado. 
II. Técnica vinculada à ciência de dados para predizer ações futuras e moldar comportamentos diversos. 
III. A criação de modelos preditivos é feita com base em algoritmos de reprodução do conhecimento. 
Assinale a alternativa que correlaciona adequadamente os dois grupos de informação: 
a. 1, I; 2, II; 3, III. 
b. 1, III; 2, II; 3, I. 
c. 1, I; 2, III; 3, II. 
d. 1, II; 2, I; 3, III. 
e. 1, II; 2, III; 3, I. 
Pergunta 5 1,3 pontos 
A utilização de algoritmos por parte da ciência de dados é de fundamental importância para diversos estudos envolvendo dados a fim 
de criar padrões ou modelagens de comportamentos ou para estimar ações futuras. Para organizações como um todo, qualquer tipo 
de vantagem competitiva faz com que as mesmas estejam à frente das demais, ou seja, saber mais, um pouco antes, sempre é melhor. 
Para a análise preditiva de dados, temos algoritmos próprios utilizados, dentre eles o algoritmo KNN ( K-Nearest Neighbors ) o qual 
pode ser utilizado para vários contextos da gestão de negócios, seja para classificação ou regressão etc. 
Com base nas informações apresentadas, identifique se são (V) verdadeiras ou (F) falsas as afirmativas a seguir. 
I. ( ) A biblioteca Scikit-Learn propicia um leque extenso de aplicações envolvendo o algoritmo KNN. 
II. ( ) No âmbito da ciência de dados, o algoritmo KNN é conhecido por “K-vizinhos mais próximos” e apresenta fácil implementação. 
III. ( ) Essencialmente falando, o algoritmo KNN se traduz como um algoritmo supervisionado deinteligência de máquina usado para 
situações/problemas organizacionais de classificação. 
Assinale a alternativa que apresenta a sequência CORRETA. 
a. V; F; F. 
b. V; V; F. 
c. V; V; V. 
d. F; V; V. 
e. F; F; V. 
Pergunta 6 1,85 pontos 
Analise as informações a seguir sobre modelos, no contexto de ciência de dados. 
A visualização é parte fundamental e integrante de um modelo de Machine Learning . 
Modelos são construídos para simular um fenômeno do mundo real como um passo investigativo, em busca da compreensão sobre algo que 
está acontecendo. 
Um modelo é uma representação matemática de um objeto ou um processo. 
Um modelo pode nascer da análise de transações históricas, na busca por um padrão consistente nessas transações. 
De acordo com as afirmações apresentadas, indique qual alternativa traz todas as afirmativas corretas. 
Apenas a afirmação II. 
Apenas as afirmações II, III e IV. 
Apenas as afirmações I e IV. 
Apenas as afirmações II e III. 
Apenas as afirmações III e IV. 
Pergunta 7 1,85 pontos 
Observe a imagem a seguir: 
Analise as afirmações sobre o algoritmo KNN representado pela imagem. 
O algoritmo realizará uma tarefa de regressão. 
O círculo verde, sendo um novo ponto a ser classificado, caso tenhamos um K igual a 3, passará a ser da Classe A. 
Se o algoritmo utilizar a linha (círculo) preta como definição dos vizinhos, o K será igual a 6. 
Se o algoritmo utilizar a linha (círculo) vermelha como definição dos vizinhos, o K será igual a 3. 
De acordo com as afirmações apresentadas, indique qual alternativa traz todas as afirmações corretas. 
Apenas a afirmação IV. 
Apenas as afirmações I e II. 
Apenas as afirmações I, III e IV. 
Apenas as afirmações II, III e IV. 
Apenas as afirmações I e III. 
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
Fazer teste: Semana 6 - Atividade Avaliativa 
Informações do teste 
Descrição 
Instruções Olá, estudante! 
Para responder a esta atividade, selecione a(s) alternativa(s) que você considerar correta(s); 
Após selecionar a resposta correta em todas as questões, vá até o fim da página e pressione “Enviar teste”. 
A cada tentativa, as perguntas e alternativas são embaralhadas 
Pronto! Sua atividade já está registrada no AVA. 
Várias tentativas Este teste permite 3 tentativas. Esta é a tentativa número 2. 
Forçar conclusão Este teste pode ser salvo e retomado posteriormente. 
Suas respostas foram salvas automaticamente. 
Estado de Conclusão da Pergunta: 
Pergunta 1 1,2 pontos 
Clique em Salvar e Enviar para salvar e enviar. Clique em Salvar todas as respostas para salvar todas as respostas. 
No mundo globalizado em que vivemos, tornando-se a informação um aparato competitivo para organizações por intermédio de 
decisões mais assertivas, tecnologias relacionadas a predição de dados são visualizadas como ferramentas indispensáveis às 
empresas, independentemente da área de atuação (às vezes, vistas como mecanismo indispensável à sobrevivência por conta da 
transfiguração de dados em verdadeiros tesouros — informações relevantes). Diante disso, questionamentos como os dispostos 
adiante podem aparecer frequentemente. Qual produto ou marca você visualizou antes de decidir por qual comprar? Como você 
poderia escolher a melhor profissão para o futuro? Antes de adquirir um produto, você visualiza comentários sobre o mesmo? 
Nesse sentido, modelar comportamentos e descrever ações em data science pode ser realizado por: 
a. predição de variáveis. 
b. predição de dados. 
c. predição de caracteres. 
d. predição de regressões. 
e. predição unilaterais. 
Pergunta 2 1,2 pontos 
No mundo atual, informações têm valor relevante para as organizações buscarem as melhores soluções a seus problemas, 
independentemente do grau de complexidade, ou seja, amostrar dados e transformá-los em informações relevantes é uma maneira de 
as empresas gerarem as melhores decisões e criarem estratégias mais confiáveis para a alta competitividade de mercado. Em outras 
palavras, as tecnologias se baseiam na busca inteligente de informações por meio de análise e interpretação de grande volume de 
dados de seu público-alvo. Logo os algoritmos são os elementos chave para tratativa da resolução de problemas no cunho de ciência 
de dados, Machine Learning (ML), Inteligência Artificial (IA) etc., cada um com características específicas. 
Ilustrando: temos o algoritmo usualmente conhecido como “K-vizinhos mais próximos”, de simples compreensão e que constitui 
ferramenta importante para problemas de classificação e regressão na gestão dos negócios organizacionais. 
Com base no exposto, assinale a alternativa que descreve a nomenclatura para tal algoritmo. 
a. Algoritmo KNM. 
b. Algoritmo KMM. 
c. Algoritmo KKN. 
d. Algoritmo KNN. 
e. Algoritmo KMN. 
Pergunta 3 1,85 pontos 
Observe a imagem a seguir: 
Analise as afirmações sobre o algoritmo KNN representado pela imagem. 
O algoritmo realizará uma tarefa de regressão. 
O círculo verde, sendo um novo ponto a ser classificado, caso tenhamos um K igual a 3, passará a ser da Classe A. 
Se o algoritmo utilizar a linha (círculo) preta como definição dos vizinhos, o K será igual a 6. 
Se o algoritmo utilizar a linha (círculo) vermelha como definição dos vizinhos, o K será igual a 3. 
De acordo com as afirmações apresentadas, indique qual alternativa traz todas as afirmações corretas. 
Apenas as afirmações I, III e IV. 
Apenas as afirmações II, III e IV. 
Apenas as afirmações I e II. 
Apenas as afirmações I e III. 
Apenas a afirmação IV. 
Pergunta 4 1,85 pontos 
No contexto atual, cada vez mais as organizações devem basear suas decisões na análise de dados, desde problemas mais simples 
até os mais complexos. O conhecimento prévio e a obtenção de informações relevantes por meio de dados podem se tornar 
diferenciais competitivos para as organizações, independentemente da área de atuação e dos negócios. Disso advém a importância 
das análises preditivas de dados. 
Em relação ao exposto, avalie as afirmações a seguir. 
I. Atualmente as organizações se utilizam da análise preditiva de dados com o intuito de obter vantagem competitiva de mercado e 
aumentar a lucratividade. 
II. A análise preditiva de dados se baseia essencialmente em dados, modelos estatísticos e ferramentas de inteligência de máquina 
(grande volume de dados). 
III. Na tratativa organizacional, a análise preditiva de dados tem como responsabilidade fundamental municiar os gestores com 
informações confiáveis para o processo decisório. 
IV. A análise preditiva de dados permite, por exemplo, a caracterização de possíveis comportamentos a posteriori de mercado para 
direcionar os negócios empresariais. 
Está correto o que se afirma em: 
a. I e III, apenas. 
b. III e IV, apenas. 
c. I, II, III e IV. 
d. II e IV, apenas. 
e. I, II e III, apenas. 
Pergunta 5 1,3 pontos 
A utilização de algoritmos por parte da ciência de dados é de fundamental importância para diversos estudos envolvendo dados a fim 
de criar padrões ou modelagens de comportamentos ou para estimar ações futuras. Para organizações como um todo, qualquer tipo 
de vantagem competitiva faz com que as mesmas estejam à frente das demais, ou seja, saber mais, um pouco antes, sempre é melhor. 
Para a análise preditiva de dados, temos algoritmos próprios utilizados, dentre eles o algoritmo KNN ( K-Nearest Neighbors ) o qual 
pode ser utilizado para vários contextos da gestão de negócios, seja para classificação ou regressão etc. 
Com base nas informações apresentadas, identifique se são (V) verdadeiras ou (F) falsas as afirmativas a seguir. 
I. ( ) A bibliotecaScikit-Learn propicia um leque extenso de aplicações envolvendo o algoritmo KNN. 
II. ( ) No âmbito da ciência de dados, o algoritmo KNN é conhecido por “K-vizinhos mais próximos” e apresenta fácil implementação. 
III. ( ) Essencialmente falando, o algoritmo KNN se traduz como um algoritmo supervisionado de inteligência de máquina usado para 
situações/problemas organizacionais de classificação. 
Assinale a alternativa que apresenta a sequência CORRETA. 
a. F; F; V. 
b. V; F; F. 
c. F; V; V. 
d. V; V; V. 
e. V; V; F. 
Pergunta 6 1,3 pontos 
Considere como verdadeiras (V) ou falsas (F) as afirmações a seguir sobre análise preditiva. 
( ) A análise preditiva permite que você veja o invisível para as outras pessoas – em especial, padrões úteis em seus dados. 
( ) Aumentar ou não o limite de crédito de um cliente está relacionado à vantagem de visão que a análise preditiva proporciona. 
( ) Conhecer a lista de desejos dos seus clientes é uma vantagem de decisão que a análise preditiva proporciona. 
( ) Um modelo de análise preditiva bem-feito oferece resultados analíticos livres de emoção ou viés. 
A sequência correta de preenchimento dos parênteses, de cima para baixo, é: 
V, F, F, V 
F, F, V, F 
F, V, V, V 
F, V, F, V 
V, V, F, F 
Pergunta 7 1,3 pontos 
Considere as afirmações a seguir, sobre Análise ROC, como verdadeiras (V) ou falsas (F): 
( ) O gráfico ROC é um gráfico bidimensional plotado em um espaço denominado espaço ROC, com eixos X e Y representando as medidas de 
taxa de falsos positivos (TFP) e taxa de verdadeiros positivos (TVP), respectivamente. 
( ) ROC quer dizer Receiving Operating Characteristics . 
( ) Seu uso inicial foi para avaliação e comparação de algoritmos. 
( ) Uma das principais desvantagens do uso da Análise ROC é seu baixo desempenho com grande quantidade de dados. 
A sequência correta de preenchimento dos parênteses, de cima para baixo, é: 
F, F, V, F 
F, V, F, V 
V, F, F, V 
V, V, V, F 
V, F, V, V 
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
PERGUNTA 1 
Assinale com V (verdadeiro) ou F (falso) as afirmações a seguir sobre aprendizado de máquina: 
( ) – Algoritmo é um passo a passo para resolução de problemas, nesse caso específico por meio de uma 
linguagem computacional. 
( ) – Aprendizado Supervisionado traz um objetivo estabelecido e pode ser dividido entre problemas de regressão e 
classificação. 
( ) – O Aprendizado de Máquina não supervisionado acontece quando as saídas não estão bem definidas e as 
respostas só podem ser aferidas após algumas execuções. 
( ) – Quando o intuito é compreender melhor os dados para realizar agrupamentos, estamos nos referindo a 
Aprendizado de Máquina por reforço. 
A sequência correta de preenchimento dos parênteses, de cima para baixo, é: 
 
 F, F, V, F. 
 
 V, F, V, V. 
 
 V, V, F, F. 
 
 F, V, V, V. 
 
 V, F, F, V. 
 
PERGUNTA 2 
Analise as informações a seguir: 
I. Algoritmo é um passo a passo para resolução de problemas. 
II. Ao processo de indução de uma hipótese a partir de experiência passada, dá-se o nome de aprendizado de máquina. 
III. No aprendizado de máquina, deve ocorrer o desenvolvimento de métricas, a partir das quais as máquinas devem ser 
capazes de criar hipóteses e, assim, resolvê-las. 
IV. Uma hipótese é o resultado de um problema resolvido por um algoritmo de aprendizado de máquina. 
De acordo com as afirmações apresentadas, indique qual alternativa é a correta: 
 
 Apenas as afirmações I e IV estão corretas. 
 
 Apenas as afirmações II e IV estão corretas. 
 
 Apenas as afirmações I, II e III estão corretas. 
 
 Apenas as afirmações II e III estão corretas. 
 
 Apenas a afirmação I é correta. 
 
PERGUNTA 3 
Em aprendizado de máquinas, relacione o tipo de tarefa as suas características? 
 
A sequência correta de preenchimento dos parênteses, de cima para baixo, é: 
 
 IV, I, III, II. 
 
 I, II, III, IV. 
 
 I, IV, III, II. 
 
 III, II, I, IV. 
 
 IV, III, II, I. 
PERGUNTA 4 
A Ciência de Dados é desenvolvida por meio de um conjunto de processos, entre eles o aprendizado de máquina 
(Machine Learning). Dentre esses processos, qual deles geralmente acontece após a execução do aprendizado de 
máquina? 
 
 Coleta de Dados. 
 
 Visualização. 
 
 Limpeza dos Dados. 
 
 Análise Exploratória. 
 
 Pré-Processamento 
PERGUNTA 5 
A ciência de dados é uma área interdisciplinar que se baseia em ferramentas distintas e algoritmos para 
descrever padrões e insights por intermédio de dados brutos. Isso mostra que fundamentalmente nossos 
movimentos na internet podem ser rastreados para que empresas, com base em informações, entendam 
nossas preferências de consumo. Dessa forma, a Inteligência de Máquina é um aparato fundamental para 
a ciência de dados, constituindo uma metodologia que automatiza a descrição de modelos analíticos 
alicerçados em dados e que buscam padrões com o mínimo de participação humana na tomada de decisão. 
 
Diante da contextualização anterior, assinale a alternativa que descreve corretamente a subárea da ciência 
de dados que automatiza modelos analíticos por meio de informações. 
 
 
a. Simulação Monte Carlo. 
 
b. Redes neurais. 
 
c. Big data. 
 
d. Machine Learning. 
 
e. Estatística espacial 
PERGUNTA 6 
É sabido que um algoritmo se traduz como sequência lógica de passos a fim de solucionarmos um problema. 
Assim sendo, para Machine Learning, Inteligência Artificial e ciência de dados, tal elemento constitui 
ferramenta importantíssima que propicia gerar conclusões com base em dados de treino e dados de teste 
propriamente ditos. Relacionando-se a tal contexto, tem-se a necessidade de mensuração de desempenho 
de algoritmos em procedimentos de estimação. 
 
Assinale a alternativa que descreve corretamente um algoritmo de Machine Learning voltado a treinamento 
de máquina e que não gera um bom rendimento. 
 
a. Letofitting. 
 
b. Data fitting. 
 
c. Overfitting. 
 
d. Chromofitting. 
 
e. Underfitting. 
PERGUNTA 7 
Analise as afirmações a seguir: 
I. A classificação é um fator discriminatório que pode impactar as atividades de integração, agregação e análise do 
ciclo de vida dos dados. 
II. A ótica do analista de dados é um fator discriminatório que pode impactar a atividade de obtenção do ciclo de vida 
dos dados. 
III. A atividade de obtenção, do ciclo de vida dos dados, pode ser impactada com os fatores de amostra, com dados 
incorretos ou incompletos para a questão da discriminação. 
IV. Amostra com dados parciais é um fator com impacto discriminatório na atividade de limpeza do ciclo de vida dos 
dados. 
De acordo com as afirmações apresentadas, indique qual alternativa é a correta: 
 
 Apenas as afirmações II, III e IV estão corretas. 
 
 Apenas as afirmações I, III e IV estão corretas. 
 
 Apenas as afirmações I e II estão corretas. 
 
 Apenas as afirmações I e III estão corretas. 
 
 Apenas a afirmação IV está correta. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
PERGUNTA 1 
1. O KDD (Knowledge Discovery in Databases) geralmente é dividido em cinco 
fases. Qual delas consiste em fazer a verificação da qualidade dos dados, exceções e 
ruídos são removidos, também ocorre limpeza, correção, remoção de dados 
inconsistentes, e identificação de dados ausentes, incompletos ou não íntegros? 
 
Transformação. 
 
Interpretação. 
 
Mineração de Dados. 
 
Seleção. 
 
Pré-Processamento. 
 
PERGUNTA 2 
1. Na Ciência de Dados e na Mineração de Dados podemos ter a 
existência de valores que não condizem com arealidade de um 
determinado conjunto de dados. Tais valores são conhecidos 
rotineiramente por “outliers”. 
 
Os outliers são importantes para descrição de dados do tipo: 
 
a. dados com ruídos. 
 
b. dados redundantes. 
 
c. dados inconsistentes. 
 
d. dados multidimensionais. 
 
e. dados aleatórios. 
 
PERGUNTA 3 
1. A nomenclatura Mineração de Dados que é derivada do termo inglês Data 
Mining, é uma metodologia processual para identificar irregularidades, padrões, 
correlações e regressões em grandes banco de dados para estimar resultados 
e gerar decisões assertivas, por intermédio de várias tipologias de dados, 
melhorando por exemplo, receitas e lucros e a relação com clientes. Neste 
contexto, o pré-processamento de dados é usado para modificar dados brutos 
em informações relevantes e úteis, tendo três passos principais com suas 
peculiares atividades, que são: a limpeza de dados, transformação de dados e 
redução de dados. 
 
Considerando o pré-processamento de dados e seus passos fundamentais, 
avalie as afirmações a seguir, e relacione-as adequadamente aos passos do pré-
processamento. 
 
1 – Limpeza de dados. 
2 – Transformação de dados. 
3 – Redução de dados. 
 
I – É o passo do pré-processamento que envolve as atividades de normalização, 
seleção de atributos, discretização e geração de hierarquia de conceitos. 
II – O grau de complexidade do sistema computacional pode ser reduzido 
consideravelmente por meio da redução de dados, permitindo uma melhor 
eficiência e diminuição de custos envolvidos no processo. 
III – Os dados brutos do dataset podem possuir pontos irrelevantes ou ausentes, 
assim sendo, a limpeza de dados se torna um ponto essencial no processo. 
 
Assinale a alternativa que correlaciona adequadamente os dois grupos de 
informação. 
 
a. 1-I; 2-II; 3-III. 
 
b. 1-III; 2-II; 3-I. 
 
c. 1-I; 2-III; 3-II. 
 
d. 1-III; 2-I; 3-II. 
 
e. 1-II; 2-I; 3-III. 
 
PERGUNTA 4 ERRADO 
1. Considere verdadeiras (V) ou falsas (F) as afirmações a seguir sobre caracterização de 
dados: 
 ( ) Atributos contínuos contêm um número finito ou infinito contável de valores. 
( ) O tipo de um atributo diz respeito ao grau de quantização nos dados, e a escala 
indica a significância relativa dos valores. 
( ) Os atributos qualitativos podem ter seus valores ordenados, entretanto operações 
aritméticas não podem ser aplicadas aos seus valores. 
( ) Um atributo que tem um tipo que representa qualidades pode ser denominado 
qualitativo, simbólico ou categórico. 
 A sequência correta de preenchimento dos parênteses, de cima para baixo, é: 
 
ERRADO V, F, F, V 
 
 
F, V, V, V 
 
V, V, F, V 
 
V, F, V, F 
 
F, F, V, F 
 
 
 
 
PERGUNTA 5 
1. Considere verdadeiras (V) ou falsas (F) as afirmações a seguir sobre as medidas de 
localidade. 
 
( V ) A média truncada é o cálculo da média que descarta os valores extremos de uma 
sequência ordenada de valores, de forma a minimizar os erros. 
( F ) A mediana é calculada pela soma, dividida pela quantidade, dos valores de um 
determinado atributo. 
( V ) A moda é o valor com maior frequência para um atributo. 
( F ) São chamados de outliers aqueles valores que se repetem muito em um mesmo 
atributo. 
A sequência correta de preenchimento dos parênteses, de cima para baixo, é: 
 
F, V, V, F 
 
F, F, V, V 
 
V, F, F, V 
 
V, F, V, F 
 
V, V, F, V 
 
PERGUNTA 6 
 
No contexto envolvendo a Ciência de Dados, sabe-se que a Mineração de Dados pode 
ser entendida como um aparato de negócios que tem como intuito principal a 
investigação de grandes bancos de dados com enfoque na identificação de regras e 
padrões entre variáveis e informações no dado estudo. Quando se fala em grandes 
bancos de dados, sempre vem à tona o termo Big Data, que no contexto atual de 
mercado apresenta cinco dimensões, que são: volume, velocidade, variedade, 
variabilidade e complexidade. Dessa maneira, temos que o Processo de Descoberta do 
Conhecimento (KDD) surge não só como um conceito, e sim como uma metodologia útil 
para tais análises e estudos. 
 
Considerando as características e os termos relacionados ao KDD, avalie as 
afirmações a seguir, em relação às suas fases, e relacione-as adequadamente 
aos termos às quais se referem. 
 
1 – Seleção. 
2 – Transformação. 
3 – Interpretação. 
 
I – Incorpora técnicas como normalização, geração de outros atributos, redução 
e sumarização de dados, visando a identificação de atributos importantes para 
alcançar os propósitos previamente definidos. 
II – É a fase que realiza a aferição da performance do modelo, sucedendo a 
solidificação do conhecimento deparado. 
III – É a fase que engloba o recolher um conjunto ou subconjunto de dados que 
irá compor a parte da análise de dados, tendo fontes de dados de diversas 
tipologias e estruturas. 
 
Assinale a alternativa que correlaciona adequadamente os dois grupos de 
informação. 
 
a. 1-I; 2-II; 3-III. 
 
b. 1-II; 2-I; 3-III. 
 
c. 1-I; 2-III; 3-II. 
 
d. 1-III; 2-I; 3-II. 
 
e. 1-III; 2-II; 3-I. 
 
PERGUNTA 7 
 
Observa-se que a Mineração de Dados do Processo de Descoberta do Conhecimento 
de Dados (KDD) vincula-se de forma substancial com as técnicas de inteligência de 
máquina, identificando regras, otimalidade, simulação e análises estatísticas 
multivariadas a fim de gerar padrões por intermédio do banco de dados em questão. 
Nota-se que a Mineração de Dados é uma das etapas do KDD, sendo que ela é 
organizada em seis fases ou etapas, que integram o CRISP-DM (Processo Padrão 
Intersetorial de Mineração de Dados, tradução da nomenclatura em inglês Cross-
Industry Standard Process of Data Mining). 
 
Dessa maneira, assinale a alternativa que apresenta as etapas que integram o CRISP-
DM. 
 
a. Compreensão dos negócios, entendimento dos dados, preparação dos dados, modelagem, 
análise dos resultados, divulgação dos resultados. 
 
b. Compreensão dos negócios, simulação dos dados, preparação dos dados, modelagem, 
análise dos resultados, divulgação dos resultados. 
 
c. Compreensão dos negócios, entendimento dos dados, caracterização dos dados, 
modelagem, análise dos resultados, divulgação dos resultados. 
 
d. Identificação dos parâmetros, entendimento dos dados, preparação dos dados, modelagem, 
análise dos resultados, divulgação dos resultados. 
 
e. Compreensão dos negócios, entendimento dos dados, preparação dos dados, modelagem, 
simulação dos resultados, divulgação dos resultados. 
 
PERGUNTA 8 
 
No contexto do mercado empresarial e/ou organizacional, a Mineração de Dados 
assume algumas identidades com relação às nomenclaturas, sendo conhecida, por 
exemplo, como inteligência de negócios, modelagem e análise preditiva, descoberta do 
conhecimento, dentre outras. Ressalta-se que as técnicas voltadas para a Mineração 
de Dados são recentes, todavia a Mineração de Dados não é um aparato recente, já 
que indivíduos já interpretavam dados desde a invenção dos primeiros computadores. 
 
Existem tarefas principais vinculadas à Mineração de Dados, assinale a alternativa que 
apresenta algumas das principais tarefas da Mineração de Dados. 
a. Otimização e simulação, separação de parâmetros, padrões de associação, enquadramento 
de variáveis. 
 
b. Separação de parâmetros, clustering, padrões de associação, avaliação. 
c. Descrição, enquadramento de variáveis, padrões de independência, predição. 
 
d. Otimização e simulação, enquadramento de variáveis, padrões discriminantes, predição. 
 
e. Otimização e simulação, clustering, padrões de associação, predição. 
 
PERGUNTA 9 
 
O conhecimento é o elemento fundamental buscado nas atividades relacionadas a 
banco de dados, especialmente na Mineração de Dados, sendo muito relevante para o 
processo decisório assertivo. É importante salientar também que a Mineração de Dados 
constitui um processo no âmbito dos negócios avaliando grandes quantidades de dados 
com o objetivo de descobrir regras e padrões. O pontapé inicial se dá na atividadede 
pré-processamento dos dados. 
 
Com relação ao pré-processamento de dados, assinale a alternativa correta. 
a. Caracteriza-se como a preparação, organização e estruturação de dados, consumindo 
aproximadamente 5 a 15% do tempo e do esforço vinculado a um sistema de análise de 
dados. 
 
b. Caracteriza-se como a preparação, organização e estruturação de dados, consumindo 
aproximadamente 70 a 80% do tempo e do esforço vinculado a um sistema de análise de 
dados. 
 
c. Caracteriza-se como a preparação, organização e estruturação de dados, consumindo 
aproximadamente 30 a 40% do tempo e do esforço vinculado a um sistema de análise de 
dados. 
 
d. Caracteriza-se como a preparação, organização e estruturação de dados, consumindo 
aproximadamente 10 a 25% do tempo e do esforço vinculado a um sistema de análise de 
dados. 
 
e. Caracteriza-se como a preparação, organização e estruturação de dados, consumindo 
aproximadamente 90 a 98% do tempo e do esforço vinculado a um sistema de análise de 
dados. 
 
PERGUNTA 10 
 
1. Qual é a biblioteca capaz de gerar um relatório em HTML com informações acerca dos 
atributos de um conjunto de dados, incluindo comparação entre os atributos? 
 
Seaborn. 
 
SweetViz. 
 
MatPlotLib. 
 
BeautifulSoup. 
 
Scikit-Learn. 
 
 
 
 
 
Fazer teste: Semana 4 - Atividade Avaliativa 
Informações do teste
Descrição
Instruções Olá, estudante!
1. Para responder a esta atividade, selecione a(s) alternativa(s) que você
considerar correta(s);
2. Após selecionar a resposta correta em todas as questões, vá até o fim da
página e pressione “Enviar teste”.
3. A cada tentativa, as perguntas e alternativas são embaralhadas
Pronto! Sua atividade já está registrada no AVA.
Várias
tentativas
Este teste permite 3 tentativas. Esta é a tentativa número 1.
Forçar
conclusão
Este teste pode ser salvo e retomado posteriormente.
Suas respostas foram salvas automaticamente.
No contexto envolvendo a Ciência de Dados, sabe-se que a
Mineração de Dados pode ser entendida como um aparato de
negócios que tem como intuito principal a investigação de
grandes bancos de dados com enfoque na identificação de
regras e padrões entre variáveis e informações no dado estudo.
Quando se fala em grandes bancos de dados, sempre vem à
tona o termo Big Data, que no contexto atual de mercado
apresenta cinco dimensões, que são: volume, velocidade,
variedade, variabilidade e complexidade. Dessa maneira, temos
que o Processo de Descoberta do Conhecimento (KDD) surge
não só como um conceito, e sim como uma metodologia útil para
tais análises e estudos.
Considerando as características e os termos relacionados ao
KDD, avalie as afirmações a seguir, em relação às suas fases, e
l i d d t t à i f
PERGUNTA 1 1,7 pontos   Salva
 Estado de Conclusão da Pergunta:
Clique em Salvar e Enviar para salvar e enviar. Clique em Salvar todas as respostas para salvar todas as res
relacione-as adequadamente aos termos às quais se referem.
1 – Seleção.
2 – Transformação.
3 – Interpretação.
I – Incorpora técnicas como normalização, geração de outros
atributos, redução e sumarização de dados, visando a
identificação de atributos importantes para alcançar os
propósitos previamente definidos.
II – É a fase que realiza a aferição da performance do modelo,
sucedendo a solidificação do conhecimento deparado.
III – É a fase que engloba o recolher um conjunto ou subconjunto
de dados que irá compor a parte da análise de dados, tendo
fontes de dados de diversas tipologias e estruturas.
Assinale a alternativa que correlaciona adequadamente os dois
grupos de informação.
a. 1-I; 2-II; 3-III.
b. 1-II; 2-I; 3-III.
c. 1-III; 2-II; 3-I.
d. 1-III; 2-I; 3-II.
e. 1-I; 2-III; 3-II.
O conhecimento é o elemento fundamental buscado nas
atividades relacionadas a banco de dados, especialmente na
Mineração de Dados, sendo muito relevante para o processo
decisório assertivo. É importante salientar também que a
Mineração de Dados constitui um processo no âmbito dos
negócios avaliando grandes quantidades de dados com o
objetivo de descobrir regras e padrões. O pontapé inicial se dá
na atividade de pré-processamento dos dados.
Com relação ao pré-processamento de dados, assinale a
alternativa correta.
a. Caracteriza-se como a preparação, organização e estruturação
de dados, consumindo aproximadamente 5 a 15% do tempo e
PERGUNTA 2 1,7 pontos   Salva
Clique em Salvar e Enviar para salvar e enviar. Clique em Salvar todas as respostas para salvar todas as res
de dados, co su do ap o ada e te 5 a 5% do te po e
do esforço vinculado a um sistema de análise de dados. 
b. Caracteriza-se como a preparação, organização e estruturação
de dados, consumindo aproximadamente 10 a 25% do tempo e
do esforço vinculado a um sistema de análise de dados. 
c. Caracteriza-se como a preparação, organização e estruturação
de dados, consumindo aproximadamente 70 a 80% do tempo e
do esforço vinculado a um sistema de análise de dados. 
d. Caracteriza-se como a preparação, organização e estruturação
de dados, consumindo aproximadamente 30 a 40% do tempo e
do esforço vinculado a um sistema de análise de dados. 
e. Caracteriza-se como a preparação, organização e estruturação
de dados, consumindo aproximadamente 90 a 98% do tempo e
do esforço vinculado a um sistema de análise de dados. 
Observe a seguir o comando e sua respectiva saída abaixo. Verifique
que no Dataset de Prêmios da Netflix há 8 tipos de programas, além de
alguns registros que contém o valor nulo (nan).
Baseado no comando acima e no dataset apresentado, qual dos
comandos abaixo é capaz de substituir, de forma definitiva, todos os
registros com valor “nan” para o valor “indefinido” no atributo kind?
d3['kind']="indefinido"
d3['kind']='indefinido'
d3['kind'].isnull(value='indefinido',inplace=True)
d3['kind']=="nan"="indefinido"
d3['kind'].fillna(value='indefinido',inplace=True)
PERGUNTA 3 1,7 pontos   Salva
Na Ciência de Dados e na Mineração de Dados podemos ter a
existência de valores que não condizem com a realidade de um
determinado conjunto de dados. Tais valores são conhecidos
rotineiramente por “outliers”. 
Os outliers são importantes para descrição de dados do tipo:
a. dados aleatórios.
b. dados redundantes.
c. dados com ruídos.
d. dados multidimensionais.
PERGUNTA 4 1,2 pontos   Salva
Clique em Salvar e Enviar para salvar e enviar. Clique em Salvar todas as respostas para salvar todas as res
e. dados inconsistentes.
Quando se trata do manuseio de dados, especialmente do foco
de um profissional que trabalha com dados, independentemente
das ferramentas utilizadas, sejam elas de análise ou de
inteligência de máquina, é de fundamental importância a
atividade de pré-processamento de dados, incluindo o
conhecimento da sua tipologia. 
Nesse contexto, podem ser interpretados como objetos similares
a outros objetos no mesmo conjunto de dados:
a. dados redundantes.
b. dados sem ruídos.
c. dados com ruídos.
d. dados elementares.
e. dados inconsistentes. 
PERGUNTA 5 1,2 pontos   Salva
Observa-se que a Mineração de Dados do Processo de
Descoberta do Conhecimento de Dados (KDD) vincula-se de
forma substancial com as técnicas de inteligência de máquina,
identificando regras, otimalidade, simulação e análises
estatísticas multivariadas a fim de gerar padrões por intermédio
do banco de dados em questão. Nota-se que a Mineração de
Dados é uma das etapas do KDD, sendo que ela é organizada
em seis fases ou etapas, que integram o CRISP-DM (Processo
Padrão Intersetorial de Mineração de Dados, tradução da
nomenclatura em inglês Cross-Industry Standard Process of
Data Mining). 
Dessa maneira, assinale a alternativa que apresenta as etapas
que integram o CRISP-DM.
a. Compreensão dos negócios, entendimento dos dados,
caracterização dos dados, modelagem, análise dos resultados,
divulgação dos resultados. 
b. Identificação dos parâmetros, entendimento dos dados,
preparação dos dados, modelagem, análise dos resultados,divulgação dos resultados
PERGUNTA 6 1,25 pontos   Salva
Clique em Salvar e Enviar para salvar e enviar. Clique em Salvar todas as respostas para salvar todas as res
divulgação dos resultados. 
c. Compreensão dos negócios, entendimento dos dados,
preparação dos dados, modelagem, análise dos resultados,
divulgação dos resultados. 
d. Compreensão dos negócios, simulação dos dados, preparação
dos dados, modelagem, análise dos resultados, divulgação dos
resultados. 
e. Compreensão dos negócios, entendimento dos dados,
preparação dos dados, modelagem, simulação dos resultados,
divulgação dos resultados.
No contexto do mercado empresarial e/ou organizacional, a
Mineração de Dados assume algumas identidades com relação
às nomenclaturas, sendo conhecida, por exemplo, como
inteligência de negócios, modelagem e análise preditiva,
descoberta do conhecimento, dentre outras. Ressalta-se que as
técnicas voltadas para a Mineração de Dados são recentes,
todavia a Mineração de Dados não é um aparato recente, já que
indivíduos já interpretavam dados desde a invenção dos
primeiros computadores. 
Existem tarefas principais vinculadas à Mineração de Dados,
assinale a alternativa que apresenta algumas das principais
tarefas da Mineração de Dados.
a. Otimização e simulação, clustering, padrões de associação,
predição. 
b. Descrição, enquadramento de variáveis, padrões de
independência, predição. 
c. Otimização e simulação, enquadramento de variáveis, padrões
discriminantes, predição. 
d. Otimização e simulação, separação de parâmetros, padrões de
associação, enquadramento de variáveis. 
e. Separação de parâmetros, clustering, padrões de associação,
avaliação.
PERGUNTA 7 1,25 pontos   Salva
Clique em Salvar e Enviar para salvar e enviar. Clique em Salvar todas as respostas para salvar todas as res
PERGUNTA 1 
A funcionalidade dos Web Scrapers, no contexto da Ciência de Dados, é de fundamental importância para 
a busca eficiente de dados. Assim, eles podem buscar todos os dados de sites peculiares e até mesmo os 
dados específicos que o pesquisador-usuário desejar. 
 
Nesse sentido, com base na tipologia dos Web Scrapers, o número de critérios que os classifica é: 
 
a. 5. 
 
b. 2. 
 
c. 4. 
 
d. 1. 
 
e. 3 
PERGUNTA 2 
A busca por informações gerenciais sempre foi de grande valia para as organizações e/ou empresas para 
que possam aumentar o seu leque competitivo de mercado. No mundo globalizado isso se faz extremamente 
necessário, assim, a busca por uma quantidade exponencial de informações relevantes é um aparato para 
a criação de estratégias organizacionais. 
 
Nesse sentido, a importância da utilização do Web Scraping deve-se pela: 
 
a. busca de um número infinito de informações de forma mais rápida e dinâmica, a fim de treinar e aprimorar 
algoritmos de aprendizagem de máquina. 
 
b. busca de um número finito de informações de forma simples, a fim de treinar e aprimorar algoritmos de 
aprendizagem de máquina. 
 
c. busca de um número limitado e restrito de informações de forma mais rápida e dinâmica, a fim de treinar e 
aprimorar algoritmos de aprendizagem de máquina. 
 
d. busca de um número exponencial de informações de forma mais rápida e dinâmica, a fim de treinar e 
aprimorar algoritmos de aprendizagem de máquina. 
 
e. criação de um número exponencial de informações de forma simples, a fim de treinar e aprimorar algoritmos 
de aprendizagem de máquina. 
PERGUNTA 3 
Assinale com V (verdadeiro) ou F (falso) as afirmações a seguir sobre a atividade de Web Scraping em Ciência de 
Dados: 
( ) – O processo de Web Scraping pode ser realizado por consumo de dados via API (Interface de Programação de 
Aplicações). 
( ) – As bibliotecas BeautifulSoup e Selenium são duas bibliotecas para realizar atividades de Web Scraping. 
( ) – A biblioteca BeautifulSoup constrói uma árvore a partir de vários elementos de uma página. 
( ) – Ao usar o comando soup.find_all('a'), é possível recuperar todos os parágrafos html que estão no objeto soup. 
 
A sequência correta de preenchimento dos parênteses, de cima para baixo, é: 
 
 V, F, V, V. 
 
 V, V, F, V. 
 
 F, V, V, F. 
 
 F, F, V, V. 
 
 V, F, V, F. 
PERGUNTA 4 
A análise de dados, pautada na linguagem Python, tem fundamentação estrutural e desenvolve métodos e 
técnicas voltados para a Ciência de Dados, em suas diversas bibliotecas constituintes, com suas 
potencialidades e particularidades. O conhecimento e o entendimento das funcionalidades das bibliotecas é 
um ponto-chave para o usuário-pesquisador na Ciência de Dados. 
 
Considerando a importância das bibliotecas inseridas na linguagem Python e suas particularidades, avalie 
as afirmações a seguir, e relacione-as adequadamente aos termos às quais se referem. 
 
1 – Matplotlib 
2 – Scikit-Learn 
3 – Seaborn 
 
I – É a biblioteca do Python voltada para visualização com alicerce no Matplotlib, contribuindo para um 
conjunto de diretrizes voltadas para a plotagem de gráficos estatísticos pertinentes. 
II – É uma biblioteca do Python voltada essencialmente para o aprendizado de máquina. 
III – É uma biblioteca do Python voltada essencialmente para a parte gráfica, ou seja, pode ser entendida 
como uma biblioteca voltada para a plotagem. 
 
Assinale a alternativa que correlaciona adequadamente os dois grupos de informação. 
 
a. 1-II; 2-I; 3-III. 
 
b. 1-I; 2-II; 3-III. 
 
c. 1-III; 2-II; 3-I. 
 
d. 1-I; 2-III; 3-II. 
 
e. 1-II; 2-III; 3-I. 
PERGUNTA 5 
Analise a execução do comando dados=np.arange(1,5,2), e veja as afirmações a seguir: 
I. O comando cria um ndarray com 4 elementos. 
II. O comando cria um ndarray em que o primeiro elemento é o valor 1. 
III. O comando cria um ndarray em que o último valor é 3. 
IV. A função arange da biblioteca NumPy cria um ndarray com valores aleatórios. 
De acordo com as afirmações apresentadas, indique qual alternativa é a correta: 
 
 Apenas as afirmações II e III estão corretas. 
 
 Apenas a afirmação IV está correta. 
 
 Apenas as afirmações I e III estão corretas. 
 
 Apenas as afirmações I e II estão corretas. 
 
 Apenas as afirmações I, III e IV estão corretas. 
PERGUNTA 6 
Dada a imagem a seguir, que representa um dataframe Pandas nomeado df: 
 
Após ser executado o comando df2=df[df['QtdeFunc']>1000], analise as afirmações a seguir: 
I. Serão listadas as linhas de df que tem o atributo QtdeFunc com mais de 1000. 
II. Será criado um dataframe df2, que conterá 2 linhas. 
III. Será criado um dataframe df2, que conterá 3 linhas. 
IV. Será criado um dataframe df2, que será uma réplica exata do dataframe df. 
V. A linha indexada como 6 no dataframe df, também fará parte do dataframe df2, que será criado. 
De acordo com as afirmações apresentadas, indique qual alternativa é a correta: 
 
 Apenas a afirmação I é correta. 
 
 Apenas as afirmações I, IV e V estão corretas. 
 
 Apenas as afirmações I, II e IV estão corretas. 
 
 Apenas as afirmações III, IV e V estão corretas. 
 
 Apenas as afirmações II e V estão corretas. 
PERGUNTA 7 
A análise de dados com a linguagem Python é de extrema importância para a tomada de decisão gerencial 
com confiabilidade por intermédio da coleta, análise, interpretação e compartilhamento de dados. Dessa 
maneira, a estruturação do Python com suas diversas bibliotecas se torna um aparato relevante e constitui 
um diferencial de mercado. 
 
Considerando a importância da Ciência de Dados e seus procedimentos que contribuem para a resolução 
de problemas no contexto organizacional, avalie as afirmações a seguir, em relação a algumas bibliotecas 
e suas características voltadas para o Python, e relacione-as adequadamente aos termos às quais se 
referem. 
 
1 – Stats Models. 
2 – Bokeh. 
3 – Scrapy. 
 
I – Caracteriza-se como sendo uma biblioteca do Python com visão interativa voltada para navegadores do 
mundo moderno vinculada a apresentações, tendo como intuito principal gerar uma obra apurada e sucintano ambiente gráfico. 
II – É uma espécie de framework de acompanhamento web, concedendo a navegação no site para páginas 
que apresentam as informações devidamente procuradas e requisitadas. 
III - Em linhas gerais, trata-se de uma biblioteca que oferece uma complementação para Scipy para 
mensurações estatísticas, sejam descritivas sejam inferenciais. 
 
Assinale a alternativa que correlaciona adequadamente os dois grupos de informação. 
 
a. 1-III; 2-I; 3-II. 
 
b. 1-II; 2-I; 3-III. 
 
c. 1-I; 2-II; 3-III. 
 
d. 1-I; 2-III; 3-II. 
 
e. 1-III; 2-II; 3-I. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
PERGUNTA 1 
A tipologia de dados, independentemente de serem números discretos, sequencial de caracteres ou 
operadores lógicos, constitui um pressuposto básico para uma específica linguagem de programação. Logo, 
a obtenção de uma tipologia de dados dinâmica gera um programa autossuficiente no sentido de 
declarações prévias. Seguindo ainda nessa direção, a linguagem Python, de forma contínua, gera uma 
manutenção da memória por intermédio de mecanismos como o coletor de lixo e a contagem de referência, 
mostrando o ganho que o programador possui na não preocupação em realizar de modo manual a gerência 
da memória. 
 
Com base no descritivo envolvendo a tipologia de dados no âmbito da linguagem Python e suas 
nomenclaturas relacionadas, avalie as afirmações a seguir, em relação à estruturação de dados no Python, 
e relacione-as adequadamente aos termos às quais se referem. 
 
1 – Garbage collector. 
2 – Reference Counting. 
3 – Tipos de dados. 
 
I – O garbage collector é o mecanismo específico da linguagem Python que trabalha com a questão da 
limpeza de memória, sendo usualmente conhecido como coletor de lixo. 
II – A Reference Counting é o mecanismo peculiar da linguagem Python que trabalha em essência com a 
manutenção da memória, ou seja, pode ser interpretada como uma espécie de contagem de referência. 
III – Uma estrutura dinâmica na tipologia de dados faz com que o programa entenda a priori o tipo de 
informação que está sendo utilizada. 
 
Assinale a alternativa que correlaciona adequadamente os dois grupos de informação. 
 
a. 1-III; 2-I; 3-II. 
 
b. 1-I; 2-II; 3-III. 
 
c. 1-III; 2-II; 3-I. 
 
d. 1-I; 2-III; 3-II. 
 
e. 1-II; 2-III; 3-I. 
PERGUNTA 2 
Python é uma linguagem de programação desenvolvida com o intuito de simplicidade e versatilidade, 
podendo ser utilizada para a realização de diversas tarefas, tais como construção de aplicativos, criação de 
sites, criação de programas, jogos e análise de dados. A grosso modo, a linguagem Python 
é ___________________________________ e que sustenta _______________________________ de 
programação: _________________________, ____________________________ e 
___________________________. 
 
Preencha as lacunas escolhendo a alternativa correta. 
 
a. interpretada de maior nível, múltiplos paradigmas, imperativo, orientado a objetos, não funcional. 
 
b. interpretada de menor nível, paradigmas únicos, imperativo, não orientado a objetos, não funcional. 
 
c. interpretada de menor nível, paradigmas únicos, imperativo, orientado a objetos, funcional. 
 
d. interpretada de menor nível, múltiplos paradigmas, imperativo, orientado a objetos, funcional. 
 
e. interpretada de maior nível, paradigmas únicos, imperativo, orientado a objetos, funcional. 
PERGUNTA 3 
A linguagem Python constitui uma das principais linguagens de programação voltada para a análise de 
dados e possui algumas características peculiares, das quais podemos citar a questão de ser considerada 
uma linguagem de programação interpretada e de alto nível, ou seja, apresenta maior proximidade com a 
linguagem humana do que com a linguagem de máquina (sistema binário). 
 
Com base nas informações apresentadas, identifique se são verdadeiras (V) ou falsas (F) as afirmativas a 
seguir. 
 
I. No Python a implementação é realizada por intermédio de um processo no qual um dos elementos 
fundamentais é exatamente o interpretador. 
II. No Python tem-se a utilização de estruturas denominadas “funções”. 
III. No Python temos classes e objetos, sendo, portanto, uma programação multiplataforma. 
 
Assinale a alternativa correta. 
 
a. V - F - F. 
 
b. F - F - F. 
 
c. V - V - V. 
 
d. V - V - F. 
 
e. F - F - V. 
PERGUNTA 4 
A linguagem Python apresenta grande valorização e aplicabilidade no contexto atual, sendo amplamente 
utilizada em grandes áreas, tais como Análise de Dados e Ciência de Dados, Automações e 
Desenvolvimento Web. Em termos específicos, quando se fala em Ciência de Dados tem-se um dos campos 
mais populares de utilização do Python. De outro modo, a automatização de tarefas possíveis está 
intimamente ligada à produtividade e à eficiência de processos diversos. Adicionalmente, aplicações 
para Web são evidenciadas com maior simplicidade com base na fundamentação do sistema Python. 
 
Nesse contexto, em linhas de mercado, constituem-se fundamentalmente como proveitos significativos da 
utilização da linguagem Python visando a modelagem de soluções de problemas empresariais: 
 
 
a. multiplataforma e periodicidade, especificidade de aprendizado e gratuidade. 
 
b. multiplataforma e extensibilidade, dinamismo de aprendizado e gratuidade. 
 
c. plataforma única e extensibilidade, especificidade de aprendizado e gratuidade. 
 
d. multiplataforma e extensibilidade, especificidade de aprendizado e gratuidade. 
 
e. multiplataforma e fundamentalidade, especificidade de aprendizado e gratuidade. 
PERGUNTA 5 
Sabemos que há uma biblioteca da linguagem Python voltada para a análise de dados, e que sua 
nomenclatura, derivada de “dados de painel”, do inglês panel data, constitui uma terminologia econométrica 
usada para a descrição de conjuntos de dados estruturados multidimensionais. 
Nesse sentido, caracteriza-se como uma das bibliotecas mais utilizadas ao redor do mundo por cientistas 
de dados. Estamos falando da: 
 
a. biblioteca Numpy. 
 
b. biblioteca Catplotlib. 
 
c. biblioteca Natplotlib. 
 
d. biblioteca Pandas. 
 
e. biblioteca Mumpy. 
PERGUNTA 6 
As linguagens de programação são o alicerce fundamental para o desenvolvimento de sistemas, sites etc., 
assim sendo, a construção de inteligências artificiais, a realização de análise de dados ou a projeção 
do back-end de uma aplicação envolvem a utilização da linguagem Python e de aparatos derivativos. 
 
Nesse contexto, são visualizadas como características fundamentais da linguagem Python: 
 
 
a. multiplataforma / multiparadigma / linguagem interpretada. 
 
b. plataforma simples / multiparadigma / linguagem interpretada. 
 
c. multiplataforma / paradigma único / linguagem interpretada. 
 
d. multiplataforma / multiparadigma / linguagem orientada. 
 
e. multiplataforma / paradigma único / linguagem programada. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Fazer teste: Semana 1 - Atividade Avaliativa 
Informações do teste
Descrição
Instruções Olá, estudante!
1. Para responder a esta atividade, selecione a(s) alternativa(s) que você considerar correta(s);
2. Após selecionar a resposta correta em todas as questões, vá até o fim da página e pressione
“Enviar teste”.
3. A cada tentativa, você receberá um conjunto diferente de questões.
Pronto! Sua atividade já está registrada no AVA.
Várias
tentativas
Este teste permite 3 tentativas. Esta é a tentativa número 1.
Forçar
conclusão
Este teste pode ser salvo e retomado posteriormente.
Suas respostas foram salvas automaticamente.
A Ciência de Dados está diretamente ligada à Inteligência Artificial, utilizando
de modelos matemáticos, métodos estatísticos e científicos, bem como da
análise de dados. Ou ainda, tem seus procedimentos alicerçados em campos
específicos do conhecimento, conforme mostrado na Figura 1 a seguir.
 
Fonte: Elaborada pelo autor.
Com base nas informações apresentadas, identifique se são verdadeiras (V)ou falsas (F) as afirmativas a seguir.
PERGUNTA 1
 Estado de Conclusão da Pergunta:
I. A Ciência de Dados é uma ciência interdisciplinar.
II. A Ciência de Dados utiliza de procedimentos para reconhecer padrões em
problemas de diferentes naturezas.
III. O propósito da Ciência de Dados é transformar o “dado” em informação
importante por intermédio de etapas que permitem reconhecer padrões e
identificar comportamentos a posteriori.
Assinale a alternativa que apresenta a sequência correta.
a. F - V - V.
b. F - V - F.
c. V - V - V.
d. V - V - F.
e. V - F - F.
Segundo Alves (2022, p. 34), “Os números governam o mundo, os negócios
e o Universo”. Além disso, sabe-se que dados e informações são de
fundamental importância para as tomadas de decisões, independentemente
do contexto estudado e trabalhado, daí a relevância da Ciência de Dados
para estudos diversos de mercado. 
ALVES, A. F. Guia de estudos da disciplina Métodos Quantitativos. Varginha: [S.
I.], 2020.
Nesse contexto, a Ciência de Dados caracteriza-se como:
a. a ciência que estuda o volume exponencial de informações. 
b. a Inteligência Artificial propriamente dita.
c. a área do conhecimento que interpreta informações na sua base natural. 
d. a subárea da inteligência de máquina que organiza as informações. 
e. o campo do conhecimento que busca transformar dados em informações.
PERGUNTA 2
O uso da Ciência de Dados no contexto do mundo globalizado, consolida-se
por conta da complexidade de resolução de problemas diversos, que
necessitam de uma estimativa futura de tendências, comportamentos e
possíveis soluções assertivas, bem como pela utilização da tecnologia.
Associado a isso, temos o crescimento exponencial da visualização e
recebimento de informações, independentemente da área da
problematização abordada.
Considerando a importância da Ciência de Dados e seus procedimentos que
PERGUNTA 3
contribuem para a resolução de problemas no contexto organizacional, avalie
as afirmações a seguir, em relação à fundamentação e à aplicabilidade da
Ciência de Dados, e relacione-as adequadamente aos termos às quais se
referem.
1 – Inteligência Artificial.
2 – Matemática e Computação.
3 – Dados.
I – São ferramentas específicas utilizadas pela Ciência de Dados na criação
e utilização dos seus procedimentos peculiares na resolução de problemas. 
II – A Ciência de Dados fundamentalmente constitui um subconjunto da
Inteligência Artificial (IA).
III – É a célula fundamental do processo de geração das informações
relevantes no âmbito da Ciência de Dados.
Assinale a alternativa que correlaciona adequadamente os dois grupos de
informação.
a. 1-II; 2-III; 3-II.
b. 1-I; 2-III; 3-II.
c. 1-III; 2-II; 3-I.
d. 1- II; 2-I; 3-III.
e. 1-I; 2-II; 3-III.
É sabido que a Ciência de Dados pode ser caracterizada como um campo do
conhecimento que nos permite modelar e solucionar problemas de uma
forma ampla e com aplicabilidade em diversas áreas. Comumente, trata-se
da aplicabilidade da Ciência de Dados “de a a z”, mostrando exatamente tal
extensionalidade.
No _________________ da Ciência de Dados, o ______________ é levado
a uma informação pertinente, por intermédio de passos que permitem _____
_______________________________________________________. 
Preencha as lacunas escolhendo a alternativa correta.
a. mecanismo é o menor nível, valor, identificar tendências e inferir
comportamentos a posteriori.
b. mecanismo é o maior nível, dado, caracterizar efetivamente tendências e
comportamentos.
c. mecanismo é o menor nível, dado, identificar tendências e inferir
comportamentos a posteriori.
d. mecanismo é o maior nível, atributo, identificar tendências e inferir
comportamentos a posteriori.
e mecanismo é o menor nível dado caracterizar efetivamente tendências e
PERGUNTA 4
e. mecanismo é o menor nível, dado, caracterizar efetivamente tendências e
comportamentos.

Mais conteúdos dessa disciplina