TS - Introdução a Ciência de Dados - COM350 - Turma 001

Humanas / Sociais

Silvia Conceição

em 15/08/2024

Conteúdos escolhidos para você

16 pág.

Noções Gerais de Mineração de Dados

ESTÁCIO

30 pág.

Introdu Ciência de Dados Semana1 à 7

Perguntas dessa disciplina

Em organizações que lidam com grande volume de informações, a estruturação e o acesso eficiente aos dados são fatores importantes para a tomada de dec

UNIVESP

Pergunta 1 A Engenharia de Prompt transforma a interação com as IAs Generativas de um simples diálogo para uma colaboração cocriativa. Os prompts mais

31:05 Progresso:5/5 60 minutos QUESTIONÁRIO 01 – ESTATÍSTICA APLICADA 1 O aprimoramento de técnicas ___________ para coleta e análise de informações p

ESTÁCIO

D. ( V-V-F 5. Nas últimas décadas, devido ao aumento do poder computacional e do crescimento das técnicas de IA, a linha de pesquisa conhecida com...

UFSC

Projetos de visualização computacional no varejo exigem mais do que habilidade técnica com gráficos ou ferramentas de BI: envolvem um entendimento est

UNIVESP

Material

Libere esse material sem enrolação!

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Libere esse material sem enrolação!

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Libere esse material sem enrolação!

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Libere esse material sem enrolação!

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Libere esse material sem enrolação!

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Libere esse material sem enrolação!

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Libere esse material sem enrolação!

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Libere esse material sem enrolação!

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Libere esse material sem enrolação!

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Libere esse material sem enrolação!

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Conteúdos escolhidos para você

16 pág.

Noções Gerais de Mineração de Dados

ESTÁCIO

30 pág.

Introdu Ciência de Dados Semana1 à 7

Perguntas dessa disciplina

Em organizações que lidam com grande volume de informações, a estruturação e o acesso eficiente aos dados são fatores importantes para a tomada de dec

UNIVESP

Pergunta 1 A Engenharia de Prompt transforma a interação com as IAs Generativas de um simples diálogo para uma colaboração cocriativa. Os prompts mais

31:05 Progresso:5/5 60 minutos QUESTIONÁRIO 01 – ESTATÍSTICA APLICADA 1 O aprimoramento de técnicas ___________ para coleta e análise de informações p

ESTÁCIO

D. ( V-V-F 5. Nas últimas décadas, devido ao aumento do poder computacional e do crescimento das técnicas de IA, a linha de pesquisa conhecida com...

UFSC

Projetos de visualização computacional no varejo exigem mais do que habilidade técnica com gráficos ou ferramentas de BI: envolvem um entendimento est

UNIVESP

Prévia do material em texto

PERGUNTA 1
1. No universo da ciência de dados, há várias tipologias de algoritmos
essencialmente utilizadas visando ao aprendizado de máquina por intermédio de
modelos e análise de dados, sendo que os mesmos comumente dependem do
número e dos atributos de exemplos para gerar conhecimentos. É importante
ressaltar que o aprendizado de máquina será mais eficiente a partir do momento
em que a cardinalidade de exemplos seja maior, pois se tem um aparato mais
estruturado para representar a realidade.
Em relação ao exposto, avalie as afirmações a seguir.
I. O algoritmo de Random Forest é usualmente conhecido por Floresta Aleatória
no contexto de Machine Learning.
II. Fundamentalmente falando, trata-se de um algoritmo computacional voltado
à criação de predições.
III. O algoritmo de Random Forest gera aleatoriamente diversas áreas de
decisão e, com base na combinação dos resultados das mesmas, caracteriza o
resultado final.
Está correto o que se afirma em:

a. II e III, apenas.

b. I e II, apenas.

c. I e III, apenas.

d. I, II e III.

e. Apenas em I.
2 pontos
PERGUNTA 2
1. Random Forest é um algoritmo específico de inteligência de máquina muito
poderoso que visa caracterizar ou gerar predições, tendo aplicabilidades infinitas
no mercado, desde bolsa de valores, passando pela área de gestão da
tecnologia, bem como operação de equipamentos e CRM (Customer
Relationship Management, em português, gestão de relacionamento com o
cliente). Nesse contexto, surgem algoritmos voltados a projetos de ciência de
dados na prática organizacional, dentre os quais pode ser citado o algoritmo
de Random Forest, com suas características e funcionalidades peculiares.
Em relação ao exposto, avalie as afirmações a seguir.
I. No mundo globalizado, há competitividade acirrada entre organizações quanto
à predição de dados, a qual pode ser um aparato fundamental para que as
mesmas aumentem sua competitividade de mercado.
II. Fundamentalmente falando, alguns dos algoritmos preditivos se alicerçam em
essência em métodos estatísticos.
III. O algoritmo de Random Forest é um dos principais e mais populares
algoritmos de predição de dados e, por conseguinte, de ciência de dados.

Está correto o que se afirma em:

a. II e III, apenas.

b. I e III, apenas.

c. I, II e III.

d. I e II, apenas.

e. II, apenas.
2 pontos
PERGUNTA 3
1. No mundo globalizado atual (com acesso a informações crescendo
exponencialmente), é de fundamental importância o conhecimento de métodos
e técnicas que auxiliem gestores e tomadores de decisão a entender melhor as
referidas informações. Logo, transfigurar dados em informações relevantes é o
desejo de toda organização, surgindo, assim, a Machine Learning (ML), a
ciência de dados e a Inteligência Artificial (IA) com algoritmos diversos.
Em relação ao exposto, avalie as afirmações a seguir.
I. Existem diversos algoritmos de inteligência de máquina que se traduzem como
algoritmos preditivos.
II. A análise preditiva casada com a inteligência de máquina busca gerar
predições futuras com base em padrões descobertos.
III. A principal característica de um algoritmo preditivo é sua entrada,
fundamentalmente falando, ser uma série temporal.
Está correto o que se afirma em:

a. I e II, apenas.

b. Apenas em I.

c. II e III, apenas.

d. I e III, apenas.

e. I, II e III.
2 pontos
PERGUNTA 4
1. É sabido que a ciência de dados se alicerça em métodos e técnicas vinculadas
a algoritmos diversos, sendo que tais algoritmos apresentam características e
propriedades particulares de acordo com a tarefa desejada. De outra forma, é
um tipo de abordagem na Ciência de Dados que ajuda as organizações a prever
o futuro, com o intuito de se antecipar com relação ao mercado. Estamos
especificamente falando da:

a. análise customizada de dados.

b. análise descritiva de dados.

c. análise fatorial de dados.

d. análise preditiva de dados.

e. análise de regressão de dados.

PERGUNTA 5
1. Com a transformação digital, acelerada e dinâmica, a análise preditiva de
dados tornou-se uma poderosa ferramenta para auxiliar estratégias de negócios
e organizacionais como um todo, sendo amplamente utilizada por empresas dos
mais variados portes e segmentos. No contexto atual, tomar decisões gerenciais
assertivas pode significar aumento de lucratividade e ganho de competitividade
de mercado por parte das organizações. É corriqueira, por exemplo, a
conceituação de dados e informações como o “novo petróleo”, significando uma
metodologia interessante para que empresas ganhem insights, observem
oportunidades de mercado, realizem previsões futuras de mercado e atuem de
forma mais concisa em linhas estratégicas.

Considerando a teoria sobre predição de dados e suas principais características
que contribuem significativamente a estudos e tomadas de decisões nas
organizações, avalie as afirmações a seguir e as correlacione adequadamente
aos termos a que se referem.
1. Algoritmo preditivo.
2. Algoritmo Random Forest.
3. Árvore de decisão.
I. Tem como fundamentação básica a geração de informações confiáveis sobre
distintos aspectos para alicerçar e facilitar o processo decisório organizacional.
II. É um algoritmo de treinamento supervisionado cuja entrada é uma série
temporal que se enquadra na metodologia ensemble (métodos ensemble).
III. É um elemento importante no contexto dos algoritmos preditivos de dados e
um dos algoritmos mais comuns em aprendizado de máquina, realiza divisões
sucessivas nos dados e gera conjuntos menores e específicos (atributos) até
alcançar dimensões simplificadas para que informações sejam padronizadas.
Assinale a alternativa que correlaciona adequadamente os dois grupos de
informação:

a. 1, II; 2, I; 3, III.

b. 1, I; 2, II; 3, III.

c. 1, III; 2, I; 3, II.

d. 1, I; 2, III; 3, II.

e. 1, III; 2, II; 3, I.
1,5 pontos
PERGUNTA 6
1. O contexto das análises preditivas necessita do conhecimento sobre
conceituação de análise de dados. Tal fato se baseia na argumentação de que
a predição de dados se caracteriza como ferramenta gerencial com potencial de
interpretar informações a fim de gerar padrões e descrever tendências de
mercado. Ilustrando: quando se fala em previsões futuras de mercado, isso
propicia que empresas distingam seus produtos e serviços daqueles de
potenciais concorrentes, agregando valor de competitividade a si mesmas.
Diante disso, algoritmos preditivos surgem como poderosa ferramenta para
solucionar problemas (por exemplo, os algoritmos de Random Forest, KNN e
árvores de decisão). Os algoritmos citados se enquadram num conjunto de
métodos com a característica básica de apresentar a combinação de distintos
modelos para computar um único resultado.

Na ciência de dados, esses métodos são conhecidos como:

a. métodos kensemble.
b. métodos censemble.
c. métodos densemble.
d. métodos ensemble.
e. métodos tensemble.

Fazer teste: Semana 7 - Atividade Avaliativa
Informações do teste
Descrição
Instruções Olá, estudante!
Para responder a esta atividade, selecione a(s) alternativa(s) que você considerar correta(s);
Após selecionar a resposta correta em todas as questões, vá até o fim da página e pressione “Enviar teste”.
A cada tentativa, você receberá um conjunto diferente de questões.
Pronto! Sua atividade já está registrada no AVA.
Várias tentativas Este teste permite 3 tentativas. Esta é a tentativa número 1.
Forçar conclusão Este teste pode ser salvo e retomado posteriormente.
Suas respostas foram salvas automaticamente.
Estado de Conclusão da Pergunta:
Pergunta 1 2 pontos
No mundo globalizado atual (com acesso a informações crescendo exponencialmente), é de fundamental importância o conhecimento Clique em Salvar e Enviar para salvar e enviar. Clique em Salvar todas as respostas para salvar todas as respostas.
de métodos e técnicas que auxiliem gestores e tomadores dedecisão a entender melhor as referidas informações. Logo, transfigurar
dados em informações relevantes é o desejo de toda organização, surgindo, assim, a Machine Learning (ML), a ciência de dados e a
Inteligência Artificial (IA) com algoritmos diversos.
Em relação ao exposto, avalie as afirmações a seguir.
I. Existem diversos algoritmos de inteligência de máquina que se traduzem como algoritmos preditivos.
II. A análise preditiva casada com a inteligência de máquina busca gerar predições futuras com base em padrões descobertos.
III. A principal característica de um algoritmo preditivo é sua entrada, fundamentalmente falando, ser uma série temporal.
Está correto o que se afirma em:
a. Apenas em I.
b. II e III, apenas.
c. I, II e III.
d. I e II, apenas.
e. I e III, apenas.
Pergunta 2 2 pontos
Random Forest é um algoritmo específico de inteligência de máquina muito poderoso que visa caracterizar ou gerar predições, tendo
aplicabilidades infinitas no mercado, desde bolsa de valores, passando pela área de gestão da tecnologia, bem como operação de
equipamentos e CRM ( Customer Relationship Management , em português, gestão de relacionamento com o cliente). Nesse contexto,
surgem algoritmos voltados a projetos de ciência de dados na prática organizacional, dentre os quais pode ser citado o algoritmo de
Random Forest , com suas características e funcionalidades peculiares.
Em relação ao exposto, avalie as afirmações a seguir.
I. No mundo globalizado, há competitividade acirrada entre organizações quanto à predição de dados, a qual pode ser um aparato
fundamental para que as mesmas aumentem sua competitividade de mercado.
II. Fundamentalmente falando, alguns dos algoritmos preditivos se alicerçam em essência em métodos estatísticos.
III. O algoritmo de Random Forest é um dos principais e mais populares algoritmos de predição de dados e, por conseguinte, de
ciência de dados.
Está correto o que se afirma em:
a. I, II e III.
b. I e II, apenas.
c. II e III, apenas.
d. II, apenas.
e. I e III, apenas.
Pergunta 3 2 pontos
No universo da ciência de dados, há várias tipologias de algoritmos essencialmente utilizadas visando ao aprendizado de máquina por
intermédio de modelos e análise de dados, sendo que os mesmos comumente dependem do número e dos atributos de exemplos para
gerar conhecimentos. É importante ressaltar que o aprendizado de máquina será mais eficiente a partir do momento em que a
cardinalidade de exemplos seja maior, pois se tem um aparato mais estruturado para representar a realidade.
Em relação ao exposto, avalie as afirmações a seguir.
I. O algoritmo de Random Forest é usualmente conhecido por Floresta Aleatória no contexto de Machine Learning .
II. Fundamentalmente falando, trata-se de um algoritmo computacional voltado à criação de predições.
III. O algoritmo de Random Forest gera aleatoriamente diversas áreas de decisão e, com base na combinação dos resultados das
mesmas, caracteriza o resultado final.
Está correto o que se afirma em:
a. II e III, apenas.
b. Apenas em I.
c. I e III, apenas.
d. I e II, apenas.
e. I, II e III.
Pergunta 4 1,5 pontos
Com a transformação digital, acelerada e dinâmica, a análise preditiva de dados tornou-se uma poderosa ferramenta para auxiliar
estratégias de negócios e organizacionais como um todo, sendo amplamente utilizada por empresas dos mais variados portes e
segmentos. No contexto atual, tomar decisões gerenciais assertivas pode significar aumento de lucratividade e ganho de
competitividade de mercado por parte das organizações. É corriqueira, por exemplo, a conceituação de dados e informações como o
“novo petróleo”, significando uma metodologia interessante para que empresas ganhem insights , observem oportunidades de mercado,
realizem previsões futuras de mercado e atuem de forma mais concisa em linhas estratégicas.
Considerando a teoria sobre predição de dados e suas principais características que contribuem significativamente a estudos e
tomadas de decisões nas organizações, avalie as afirmações a seguir e as correlacione adequadamente aos termos a que se referem.
1. Algoritmo preditivo.
2. Algoritmo Random Forest .
3. Árvore de decisão.
I. Tem como fundamentação básica a geração de informações confiáveis sobre distintos aspectos para alicerçar e facilitar o processo
decisório organizacional.
II. É um algoritmo de treinamento supervisionado cuja entrada é uma série temporal que se enquadra na metodologia ensemble
(métodos ensemble ).
III. É um elemento importante no contexto dos algoritmos preditivos de dados e um dos algoritmos mais comuns em aprendizado de
máquina, realiza divisões sucessivas nos dados e gera conjuntos menores e específicos (atributos) até alcançar dimensões
simplificadas para que informações sejam padronizadas.
Assinale a alternativa que correlaciona adequadamente os dois grupos de informação:
a. 1, I; 2, III; 3, II.
b. 1, II; 2, I; 3, III.
c. 1, III; 2, I; 3, II.
d. 1, III; 2, II; 3, I.
e. 1, I; 2, II; 3, III.
Pergunta 5 1,5 pontos
O contexto das análises preditivas necessita do conhecimento sobre conceituação de análise de dados. Tal fato se baseia na
argumentação de que a predição de dados se caracteriza como ferramenta gerencial com potencial de interpretar informações a fim de
gerar padrões e descrever tendências de mercado. Ilustrando: quando se fala em previsões futuras de mercado, isso propicia que
empresas distingam seus produtos e serviços daqueles de potenciais concorrentes, agregando valor de competitividade a si mesmas.
Diante disso, algoritmos preditivos surgem como poderosa ferramenta para solucionar problemas (por exemplo, os algoritmos de
Random Forest , KNN e árvores de decisão). Os algoritmos citados se enquadram num conjunto de métodos com a característica
básica de apresentar a combinação de distintos modelos para computar um único resultado.
Na ciência de dados, esses métodos são conhecidos como:
a. métodos ensemble .
b. métodos tensemble .
c. métodos densemble .
d. métodos kensemble .
e. métodos censemble .
Pergunta 6 1 pontos
Algoritmos são elementos fundamentais para que possamos criar mecanismos via ciência de dados na resolução de problemas
diversos no contexto organizacional, ou seja, para transformarmos dados em informações relevantes para organizações tomarem
decisões confiáveis.
Assim sendo, constituem tipos de algoritmos utilizados na ciência de dados na aplicabilidade prática:
a. algoritmo KMM; árvores de decisão; Random Forest .
b. algoritmo KMM; árvores de decisão; Handle Forest .
c. algoritmo PNN; árvores de decisão; Handle Forest .
d. algoritmo KNN; árvores de decisão; Random Forest .
e. algoritmo KMM; árvores MNP; Random Forest .

PERGUNTA 1
1. Observe a imagem a seguir:

Analise as afirmações sobre o algoritmo KNN representado pela imagem.
I. O algoritmo realizará uma tarefa de regressão.
II. O círculo verde, sendo um novo ponto a ser classificado, caso tenhamos um K
igual a 3, passará a ser da Classe A.
III. Se o algoritmo utilizar a linha (círculo) preta como definição dos vizinhos, o K
será igual a 6.
IV. Se o algoritmo utilizar a linha (círculo) vermelha como definição dos vizinhos, o
K será igual a 3.
De acordo com as afirmações apresentadas, indique qual alternativa traz todas as
afirmações corretas.

Apenas a afirmação IV.

Apenas as afirmações I, III e IV.

Apenas as afirmações II, III e IV.

Apenas as afirmações I e II.

Apenas as afirmações I e III.
1,85 pontos
PERGUNTA 2
1. No contexto atual, cada vez mais as organizações devem basear suas
decisões na análise de dados, desde problemas mais simples até os mais
complexos. O conhecimento prévio e a obtenção de informações relevantes por
meio de dados podem se tornar diferenciais competitivos para as organizações,independentemente da área de atuação e dos negócios. Disso advém a
importância das análises preditivas de dados.
Em relação ao exposto, avalie as afirmações a seguir.
I. Atualmente as organizações se utilizam da análise preditiva de dados com o
intuito de obter vantagem competitiva de mercado e aumentar a lucratividade.
II. A análise preditiva de dados se baseia essencialmente em dados, modelos
estatísticos e ferramentas de inteligência de máquina (grande volume de dados).
III. Na tratativa organizacional, a análise preditiva de dados tem como
responsabilidade fundamental municiar os gestores com informações confiáveis
para o processo decisório.
IV. A análise preditiva de dados permite, por exemplo, a caracterização de
possíveis comportamentos a posteriori de mercado para direcionar os negócios
empresariais.
Está correto o que se afirma em:

a. I e III, apenas.

b. I, II e III, apenas.

c. II e IV, apenas.

d. I, II, III e IV.

e. III e IV, apenas.
1,85 pontos
PERGUNTA 3
1. Considere como verdadeiras (V) ou falsas (F) as afirmações a seguir sobre análise
preditiva.
( ) A análise preditiva permite que você veja o invisível para as outras pessoas – em
especial, padrões úteis em seus dados.
( ) Aumentar ou não o limite de crédito de um cliente está relacionado à vantagem de
visão que a análise preditiva proporciona.
( ) Conhecer a lista de desejos dos seus clientes é uma vantagem de decisão que a
análise preditiva proporciona.
( ) Um modelo de análise preditiva bem-feito oferece resultados analíticos livres de
emoção ou viés.
A sequência correta de preenchimento dos parênteses, de cima para baixo, é:

F, F, V, F

F, V, F, V

V, F, F, V

V, V, F, F

F, V, V, V
1,3 pontos
PERGUNTA 4
1. Considere como verdadeiras (V) ou falsas (F) as afirmações sobre o uso de datasets
da biblioteca Scikit-Learn:
( ) Para usar o dataset é necessário importá-lo usando o comando “from sklearn
import datasets”.
( ) O comando “iris=datasets.load_iris()”
carrega todo o dataset iris para a variável iris.
( ) Com a variável íris tendo sido carregada com o dataset, o atributo “iris.atributes”
terá o nome das colunas do dataset.
( ) Com a variável íris tendo sido carregada com o dataset, os dados, sem a coluna
alvo, estarão disponíveis em “iris.target”.
A sequência correta de preenchimento dos parênteses, de cima para baixo, é:

V, V, F, F

V, F, F, V

V, V, F, V

F, V, V, F

V, F, V, F
1,3 pontos
PERGUNTA 5
1. É notório que vivemos num mundo cada vez mais caracterizado pelas
informações presentes e pelo conhecimento gerado por elas com base em
análises e interpretações estruturadas, coerentes e precisas. Dessa maneira,
percebe-se claramente que técnicas e tecnologias associadas com a predição
de dados estão se transformando em aparato fundamental e crucial para as
organizações tomarem decisões nos mais variados campos. Disso advém a
importância do conhecimento de métodos e técnicas vinculados a ciência de
dados, Machine Learning (ML), Inteligência Artificial (IA) etc.
Considerando a importância de predição de dados e utilização de algoritmos
diversos que direcionam à resolução de problemas no contexto organizacional
de forma mais confiável, avalie as afirmações a seguir, em relação a
estruturação e aplicabilidade da predição de dados via ML, e as correlacione
adequadamente aos termos a que se referem.
1. Algoritmo KNN.
2. Predição.
3. Conhecimento.
I. Caracteriza-se como um algoritmo de aprendizado de ML de simples
implementação alicerçado na técnica de aprendizado supervisionado.
II. Técnica vinculada à ciência de dados para predizer ações futuras e moldar
comportamentos diversos.
III. A criação de modelos preditivos é feita com base em algoritmos de
reprodução do conhecimento.
Assinale a alternativa que correlaciona adequadamente os dois grupos de
informação:

a. 1, II; 2, III; 3, I.

b. 1, II; 2, I; 3, III.

c. 1, III; 2, II; 3, I.

d. 1, I; 2, III; 3, II.

e. 1, I; 2, II; 3, III.
1,3 pontos
PERGUNTA 6
1. Um modelo preditivo bastante conhecido, baseado em distâncias e que não parte de
hipóteses matemáticas, nem exige maquinário pesado é:

Árvore de Decisão.

Random Forest.

Naive Bayes.

KNN.

SVM.
1,2 pontos
PERGUNTA 7
1. No mundo globalizado em que vivemos, tornando-se a informação um aparato
competitivo para organizações por intermédio de decisões mais assertivas,
tecnologias relacionadas a predição de dados são visualizadas como
ferramentas indispensáveis às empresas, independentemente da área de
atuação (às vezes, vistas como mecanismo indispensável à sobrevivência por
conta da transfiguração de dados em verdadeiros tesouros — informações
relevantes). Diante disso, questionamentos como os dispostos adiante podem
aparecer frequentemente. Qual produto ou marca você visualizou antes de
decidir por qual comprar? Como você poderia escolher a melhor profissão para
o futuro? Antes de adquirir um produto, você visualiza comentários sobre o
mesmo?
Nesse sentido, modelar comportamentos e descrever ações em data
science pode ser realizado por:

a. predição de variáveis.

b. predição unilaterais.

c. predição de caracteres.

d. predição de dados.

e. predição de regressões.

PERGUNTA 1
No mundo atual, informações têm valor relevante para as organizações buscarem as melhores soluções a
seus problemas, independentemente do grau de complexidade, ou seja, amostrar dados e transformá-los
em informações relevantes é uma maneira de as empresas gerarem as melhores decisões e criarem
estratégias mais confiáveis para a alta competitividade de mercado. Em outras palavras, as tecnologias se
baseiam na busca inteligente de informações por meio de análise e interpretação de grande volume de
dados de seu público-alvo. Logo os algoritmos são os elementos chave para tratativa da resolução de
problemas no cunho de ciência de dados, Machine Learning (ML), Inteligência Artificial (IA) etc., cada um
com características específicas.
Ilustrando: temos o algoritmo usualmente conhecido como “K-vizinhos mais próximos”, de simples
compreensão e que constitui ferramenta importante para problemas de classificação e regressão na gestão
dos negócios organizacionais.
Com base no exposto, assinale a alternativa que descreve a nomenclatura para tal algoritmo.

a. Algoritmo KNM.

b. Algoritmo KMM.

c. Algoritmo KNN.

d. Algoritmo KKN.

e. Algoritmo KMN

PERGUNTA 2
Um método de avaliação bastante utilizado em aprendizado de máquina em que o conjunto de exemplos é dividido
em r subconjuntos de tamanho aproximadamente igual. Os objetos de r – 1 partições são utilizados no treinamento
de um preditor, o qual é então testado na partição restante. Esse processo é repetido r vezes, utilizando em cada
ciclo uma partição diferente para teste. O desempenho final do preditor é dado pela média dos desempenhos
observados sobre cada subconjunto de teste. Qual é esse método?

Amostragem aleatória.

Bootstrap.

MSE – Mean Squared Error (Erro Quadrático Médio).

Holdout.

Validação Cruzada.

PERGUNTA 3
Observe a imagem a seguir:

Analise as afirmações sobre o algoritmo KNN representado pela imagem.
I. O algoritmo realizará uma tarefa de regressão.
II. O círculo verde, sendo um novo ponto a ser classificado, caso tenhamos um K igual a 3, passará a ser da Classe A.
III. Se o algoritmo utilizar a linha (círculo) preta como definição dos vizinhos, o K será igual a 6.
IV. Se o algoritmo utilizar a linha (círculo) vermelha como definição dos vizinhos, o K será igual a 3.
De acordo com as afirmações apresentadas, indique qual alternativa traz todas as afirmações corretas.

Apenas as afirmações I, III e IV.

Apenas a afirmação IV.

Apenas as afirmações II, III e IV.

Apenas as afirmações I e II.Apenas as afirmações I e III.

PERGUNTA 4
Analise as informações a seguir sobre modelos, no contexto de ciência de dados.
I. A visualização é parte fundamental e integrante de um modelo de Machine Learning.
II. Modelos são construídos para simular um fenômeno do mundo real como um passo investigativo, em busca da
compreensão sobre algo que está acontecendo.
III. Um modelo é uma representação matemática de um objeto ou um processo.
IV. Um modelo pode nascer da análise de transações históricas, na busca por um padrão consistente nessas
transações.
De acordo com as afirmações apresentadas, indique qual alternativa traz todas as afirmativas corretas.

Apenas as afirmações II e III.

Apenas a afirmação II.

Apenas as afirmações II, III e IV.

Apenas as afirmações I e IV.

Apenas as afirmações III e IV.

PERGUNTA 5
Considere as afirmações a seguir, sobre Análise ROC, como verdadeiras (V) ou falsas (F):
( ) O gráfico ROC é um gráfico bidimensional plotado em um espaço denominado espaço ROC, com eixos X e Y
representando as medidas de taxa de falsos positivos (TFP) e taxa de verdadeiros positivos (TVP), respectivamente.
( ) ROC quer dizer Receiving Operating Characteristics.
( ) Seu uso inicial foi para avaliação e comparação de algoritmos.
( ) Uma das principais desvantagens do uso da Análise ROC é seu baixo desempenho com grande quantidade de
dados.
A sequência correta de preenchimento dos parênteses, de cima para baixo, é:

F, V, F, V

V, V, V, F

V, F, V, V

F, F, V, F

V, F, F, V
PERGUNTA 6
No mundo globalizado de intensa concorrência entre indivíduos e organizações, ferramentas voltadas ao
agrupamento de ações que permitam vantagem competitiva são de extrema importância. Diante disso, data
science se caracteriza como alicerce interessante, pois a predição de dados permite criar modelos de
comportamentos e predizer ações futuras; logo, as indagações adiante podem ser mais bem estudadas pela
análise de predição de dados. Qual marca o cliente pesquisou antes de comprar? O cliente visualizou que
tipo de propaganda sobre os produtos avaliados? Quanto tempo levou para o cliente decidir pelo produto A
ou B?
Com base nas informações apresentadas, identifique se são (V) verdadeiras ou (F) falsas as afirmativas a
seguir.
I. ( ) Análise preditiva é a capacidade de prever resultados e gerar insights futuros alicerçados numa base
de dados (passado e presente).
II. ( ) As grandes organizações mundiais se utilizam substancialmente da análise preditiva de dados com o
intuito de gerar soluções mais assertivas.
III. ( ) A análise preditiva se utiliza de Machine Learning e modelagem estatística.
Assinale a alternativa que apresenta a sequência CORRETA.

a. V; F; F.

b. V; V; F.

c. F; F; V.

d. V; V; V.

e. F; V; V.

Estado de Conclusão da Pergunta:
Fazer teste: Semana 6 - Atividade Avaliativa
Informações do teste
Descrição
Instruções Olá, estudante!
Para responder a esta atividade, selecione a(s) alternativa(s) que você considerar correta(s);
Após selecionar a resposta correta em todas as questões, vá até o fim da página e pressione “Enviar teste”.
A cada tentativa, as perguntas e alternativas são embaralhadas
Pronto! Sua atividade já está registrada no AVA.
Várias tentativas Este teste permite 3 tentativas. Esta é a tentativa número 1.
Forçar conclusão Este teste pode ser salvo e retomado posteriormente.
Suas respostas foram salvas automaticamente.
Pergunta 1 1,2 pontos
Clique em Salvar e Enviar para salvar e enviar. Clique em Salvar todas as respostas para salvar todas as respostas.
Para realizar a acurácia no algoritmo KNN podemos utilizar uma função do próprio Scikit-Learn. Qual das funções abaixo é responsável por calcular
a acurácia?
fit()
KNeighborsRegressor()
predict()
KNeighborsClassifier()
score()
Pergunta 2 1,2 pontos
Sempre que se fala em data science ou big data vem à tona o termo “predição”, ressaltando que ambos os contextos visam à tomada
de decisão com confiabilidade por parte das organizações.
Com base no exposto, assinale a alternativa voltada corretamente a predição de dados e tomada de decisão no big data alicerçadas
por meio de fatos já ocorridos.
a. Decisões específicas com base nos fatos já ocorridos.
b. Decisões pautadas no que aconteceu e naquilo que pode acontecer.
c. Decisões arbitrárias com base nos fatos já ocorridos.
d. Decisões essencialmente pautadas no que aconteceu.
e. Decisões pautadas no que aconteceu e não necessariamente naquilo que pode acontecer.
Pergunta 3 1,3 pontos
Considere como verdadeiras (V) ou falsas (F) as afirmações sobre o uso de datasets da biblioteca Scikit-Learn:
( ) Para usar o dataset é necessário importá-lo usando o comando “from sklearn import datasets”.
( ) O comando “iris=datasets.load_iris()”
carrega todo o dataset iris para a variável iris.
( ) Com a variável íris tendo sido carregada com o dataset, o atributo “iris.atributes” terá o nome das colunas do dataset.
( ) Com a variável íris tendo sido carregada com o dataset, os dados, sem a coluna alvo, estarão disponíveis em “iris.target”.
A sequência correta de preenchimento dos parênteses, de cima para baixo, é:
V, V, F, F
F, V, V, F
V, F, V, F
V, V, F, V
V, F, F, V
Pergunta 4 1,3 pontos
É notório que vivemos num mundo cada vez mais caracterizado pelas informações presentes e pelo conhecimento gerado por elas
com base em análises e interpretações estruturadas, coerentes e precisas. Dessa maneira, percebe-se claramente que técnicas e
tecnologias associadas com a predição de dados estão se transformando em aparato fundamental e crucial para as organizações
tomarem decisões nos mais variados campos. Disso advém a importância do conhecimento de métodos e técnicas vinculados a
ciência de dados, Machine Learning (ML), Inteligência Artificial (IA) etc.
Considerando a importância de predição de dados e utilização de algoritmos diversos que direcionam à resolução de problemas no
contexto organizacional de forma mais confiável, avalie as afirmações a seguir, em relação a estruturação e aplicabilidade da predição
de dados via ML, e as correlacione adequadamente aos termos a que se referem.
1. Algoritmo KNN.
2. Predição.
3. Conhecimento.
I. Caracteriza-se como um algoritmo de aprendizado de ML de simples implementação alicerçado na técnica de aprendizado
supervisionado.
II. Técnica vinculada à ciência de dados para predizer ações futuras e moldar comportamentos diversos.
III. A criação de modelos preditivos é feita com base em algoritmos de reprodução do conhecimento.
Assinale a alternativa que correlaciona adequadamente os dois grupos de informação:
a. 1, I; 2, II; 3, III.
b. 1, III; 2, II; 3, I.
c. 1, I; 2, III; 3, II.
d. 1, II; 2, I; 3, III.
e. 1, II; 2, III; 3, I.
Pergunta 5 1,3 pontos
A utilização de algoritmos por parte da ciência de dados é de fundamental importância para diversos estudos envolvendo dados a fim
de criar padrões ou modelagens de comportamentos ou para estimar ações futuras. Para organizações como um todo, qualquer tipo
de vantagem competitiva faz com que as mesmas estejam à frente das demais, ou seja, saber mais, um pouco antes, sempre é melhor.
Para a análise preditiva de dados, temos algoritmos próprios utilizados, dentre eles o algoritmo KNN ( K-Nearest Neighbors ) o qual
pode ser utilizado para vários contextos da gestão de negócios, seja para classificação ou regressão etc.
Com base nas informações apresentadas, identifique se são (V) verdadeiras ou (F) falsas as afirmativas a seguir.
I. ( ) A biblioteca Scikit-Learn propicia um leque extenso de aplicações envolvendo o algoritmo KNN.
II. ( ) No âmbito da ciência de dados, o algoritmo KNN é conhecido por “K-vizinhos mais próximos” e apresenta fácil implementação.
III. ( ) Essencialmente falando, o algoritmo KNN se traduz como um algoritmo supervisionado deinteligência de máquina usado para
situações/problemas organizacionais de classificação.
Assinale a alternativa que apresenta a sequência CORRETA.
a. V; F; F.
b. V; V; F.
c. V; V; V.
d. F; V; V.
e. F; F; V.
Pergunta 6 1,85 pontos
Analise as informações a seguir sobre modelos, no contexto de ciência de dados.
A visualização é parte fundamental e integrante de um modelo de Machine Learning .
Modelos são construídos para simular um fenômeno do mundo real como um passo investigativo, em busca da compreensão sobre algo que
está acontecendo.
Um modelo é uma representação matemática de um objeto ou um processo.
Um modelo pode nascer da análise de transações históricas, na busca por um padrão consistente nessas transações.
De acordo com as afirmações apresentadas, indique qual alternativa traz todas as afirmativas corretas.
Apenas a afirmação II.
Apenas as afirmações II, III e IV.
Apenas as afirmações I e IV.
Apenas as afirmações II e III.
Apenas as afirmações III e IV.
Pergunta 7 1,85 pontos
Observe a imagem a seguir:
Analise as afirmações sobre o algoritmo KNN representado pela imagem.
O algoritmo realizará uma tarefa de regressão.
O círculo verde, sendo um novo ponto a ser classificado, caso tenhamos um K igual a 3, passará a ser da Classe A.
Se o algoritmo utilizar a linha (círculo) preta como definição dos vizinhos, o K será igual a 6.
Se o algoritmo utilizar a linha (círculo) vermelha como definição dos vizinhos, o K será igual a 3.
De acordo com as afirmações apresentadas, indique qual alternativa traz todas as afirmações corretas.
Apenas a afirmação IV.
Apenas as afirmações I e II.
Apenas as afirmações I, III e IV.
Apenas as afirmações II, III e IV.
Apenas as afirmações I e III.
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
Fazer teste: Semana 6 - Atividade Avaliativa
Informações do teste
Descrição
Instruções Olá, estudante!
Para responder a esta atividade, selecione a(s) alternativa(s) que você considerar correta(s);
Após selecionar a resposta correta em todas as questões, vá até o fim da página e pressione “Enviar teste”.
A cada tentativa, as perguntas e alternativas são embaralhadas
Pronto! Sua atividade já está registrada no AVA.
Várias tentativas Este teste permite 3 tentativas. Esta é a tentativa número 2.
Forçar conclusão Este teste pode ser salvo e retomado posteriormente.
Suas respostas foram salvas automaticamente.
Estado de Conclusão da Pergunta:
Pergunta 1 1,2 pontos
Clique em Salvar e Enviar para salvar e enviar. Clique em Salvar todas as respostas para salvar todas as respostas.
No mundo globalizado em que vivemos, tornando-se a informação um aparato competitivo para organizações por intermédio de
decisões mais assertivas, tecnologias relacionadas a predição de dados são visualizadas como ferramentas indispensáveis às
empresas, independentemente da área de atuação (às vezes, vistas como mecanismo indispensável à sobrevivência por conta da
transfiguração de dados em verdadeiros tesouros — informações relevantes). Diante disso, questionamentos como os dispostos
adiante podem aparecer frequentemente. Qual produto ou marca você visualizou antes de decidir por qual comprar? Como você
poderia escolher a melhor profissão para o futuro? Antes de adquirir um produto, você visualiza comentários sobre o mesmo?
Nesse sentido, modelar comportamentos e descrever ações em data science pode ser realizado por:
a. predição de variáveis.
b. predição de dados.
c. predição de caracteres.
d. predição de regressões.
e. predição unilaterais.
Pergunta 2 1,2 pontos
No mundo atual, informações têm valor relevante para as organizações buscarem as melhores soluções a seus problemas,
independentemente do grau de complexidade, ou seja, amostrar dados e transformá-los em informações relevantes é uma maneira de
as empresas gerarem as melhores decisões e criarem estratégias mais confiáveis para a alta competitividade de mercado. Em outras
palavras, as tecnologias se baseiam na busca inteligente de informações por meio de análise e interpretação de grande volume de
dados de seu público-alvo. Logo os algoritmos são os elementos chave para tratativa da resolução de problemas no cunho de ciência
de dados, Machine Learning (ML), Inteligência Artificial (IA) etc., cada um com características específicas.
Ilustrando: temos o algoritmo usualmente conhecido como “K-vizinhos mais próximos”, de simples compreensão e que constitui
ferramenta importante para problemas de classificação e regressão na gestão dos negócios organizacionais.
Com base no exposto, assinale a alternativa que descreve a nomenclatura para tal algoritmo.
a. Algoritmo KNM.
b. Algoritmo KMM.
c. Algoritmo KKN.
d. Algoritmo KNN.
e. Algoritmo KMN.
Pergunta 3 1,85 pontos
Observe a imagem a seguir:
Analise as afirmações sobre o algoritmo KNN representado pela imagem.
O algoritmo realizará uma tarefa de regressão.
O círculo verde, sendo um novo ponto a ser classificado, caso tenhamos um K igual a 3, passará a ser da Classe A.
Se o algoritmo utilizar a linha (círculo) preta como definição dos vizinhos, o K será igual a 6.
Se o algoritmo utilizar a linha (círculo) vermelha como definição dos vizinhos, o K será igual a 3.
De acordo com as afirmações apresentadas, indique qual alternativa traz todas as afirmações corretas.
Apenas as afirmações I, III e IV.
Apenas as afirmações II, III e IV.
Apenas as afirmações I e II.
Apenas as afirmações I e III.
Apenas a afirmação IV.
Pergunta 4 1,85 pontos
No contexto atual, cada vez mais as organizações devem basear suas decisões na análise de dados, desde problemas mais simples
até os mais complexos. O conhecimento prévio e a obtenção de informações relevantes por meio de dados podem se tornar
diferenciais competitivos para as organizações, independentemente da área de atuação e dos negócios. Disso advém a importância
das análises preditivas de dados.
Em relação ao exposto, avalie as afirmações a seguir.
I. Atualmente as organizações se utilizam da análise preditiva de dados com o intuito de obter vantagem competitiva de mercado e
aumentar a lucratividade.
II. A análise preditiva de dados se baseia essencialmente em dados, modelos estatísticos e ferramentas de inteligência de máquina
(grande volume de dados).
III. Na tratativa organizacional, a análise preditiva de dados tem como responsabilidade fundamental municiar os gestores com
informações confiáveis para o processo decisório.
IV. A análise preditiva de dados permite, por exemplo, a caracterização de possíveis comportamentos a posteriori de mercado para
direcionar os negócios empresariais.
Está correto o que se afirma em:
a. I e III, apenas.
b. III e IV, apenas.
c. I, II, III e IV.
d. II e IV, apenas.
e. I, II e III, apenas.
Pergunta 5 1,3 pontos
A utilização de algoritmos por parte da ciência de dados é de fundamental importância para diversos estudos envolvendo dados a fim
de criar padrões ou modelagens de comportamentos ou para estimar ações futuras. Para organizações como um todo, qualquer tipo
de vantagem competitiva faz com que as mesmas estejam à frente das demais, ou seja, saber mais, um pouco antes, sempre é melhor.
Para a análise preditiva de dados, temos algoritmos próprios utilizados, dentre eles o algoritmo KNN ( K-Nearest Neighbors ) o qual
pode ser utilizado para vários contextos da gestão de negócios, seja para classificação ou regressão etc.
Com base nas informações apresentadas, identifique se são (V) verdadeiras ou (F) falsas as afirmativas a seguir.
I. ( ) A bibliotecaScikit-Learn propicia um leque extenso de aplicações envolvendo o algoritmo KNN.
II. ( ) No âmbito da ciência de dados, o algoritmo KNN é conhecido por “K-vizinhos mais próximos” e apresenta fácil implementação.
III. ( ) Essencialmente falando, o algoritmo KNN se traduz como um algoritmo supervisionado de inteligência de máquina usado para
situações/problemas organizacionais de classificação.
Assinale a alternativa que apresenta a sequência CORRETA.
a. F; F; V.
b. V; F; F.
c. F; V; V.
d. V; V; V.
e. V; V; F.
Pergunta 6 1,3 pontos
Considere como verdadeiras (V) ou falsas (F) as afirmações a seguir sobre análise preditiva.
( ) A análise preditiva permite que você veja o invisível para as outras pessoas – em especial, padrões úteis em seus dados.
( ) Aumentar ou não o limite de crédito de um cliente está relacionado à vantagem de visão que a análise preditiva proporciona.
( ) Conhecer a lista de desejos dos seus clientes é uma vantagem de decisão que a análise preditiva proporciona.
( ) Um modelo de análise preditiva bem-feito oferece resultados analíticos livres de emoção ou viés.
A sequência correta de preenchimento dos parênteses, de cima para baixo, é:
V, F, F, V
F, F, V, F
F, V, V, V
F, V, F, V
V, V, F, F
Pergunta 7 1,3 pontos
Considere as afirmações a seguir, sobre Análise ROC, como verdadeiras (V) ou falsas (F):
( ) O gráfico ROC é um gráfico bidimensional plotado em um espaço denominado espaço ROC, com eixos X e Y representando as medidas de
taxa de falsos positivos (TFP) e taxa de verdadeiros positivos (TVP), respectivamente.
( ) ROC quer dizer Receiving Operating Characteristics .
( ) Seu uso inicial foi para avaliação e comparação de algoritmos.
( ) Uma das principais desvantagens do uso da Análise ROC é seu baixo desempenho com grande quantidade de dados.
A sequência correta de preenchimento dos parênteses, de cima para baixo, é:
F, F, V, F
F, V, F, V
V, F, F, V
V, V, V, F
V, F, V, V
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight
unifesp
Highlight

PERGUNTA 1
Assinale com V (verdadeiro) ou F (falso) as afirmações a seguir sobre aprendizado de máquina:
( ) – Algoritmo é um passo a passo para resolução de problemas, nesse caso específico por meio de uma
linguagem computacional.
( ) – Aprendizado Supervisionado traz um objetivo estabelecido e pode ser dividido entre problemas de regressão e
classificação.
( ) – O Aprendizado de Máquina não supervisionado acontece quando as saídas não estão bem definidas e as
respostas só podem ser aferidas após algumas execuções.
( ) – Quando o intuito é compreender melhor os dados para realizar agrupamentos, estamos nos referindo a
Aprendizado de Máquina por reforço.
A sequência correta de preenchimento dos parênteses, de cima para baixo, é:

F, F, V, F.

V, F, V, V.

V, V, F, F.

F, V, V, V.

V, F, F, V.

PERGUNTA 2
Analise as informações a seguir:
I. Algoritmo é um passo a passo para resolução de problemas.
II. Ao processo de indução de uma hipótese a partir de experiência passada, dá-se o nome de aprendizado de máquina.
III. No aprendizado de máquina, deve ocorrer o desenvolvimento de métricas, a partir das quais as máquinas devem ser
capazes de criar hipóteses e, assim, resolvê-las.
IV. Uma hipótese é o resultado de um problema resolvido por um algoritmo de aprendizado de máquina.
De acordo com as afirmações apresentadas, indique qual alternativa é a correta:

Apenas as afirmações I e IV estão corretas.

Apenas as afirmações II e IV estão corretas.

Apenas as afirmações I, II e III estão corretas.

Apenas as afirmações II e III estão corretas.

Apenas a afirmação I é correta.

PERGUNTA 3
Em aprendizado de máquinas, relacione o tipo de tarefa as suas características?

A sequência correta de preenchimento dos parênteses, de cima para baixo, é:

IV, I, III, II.

I, II, III, IV.

I, IV, III, II.

III, II, I, IV.

IV, III, II, I.
PERGUNTA 4
A Ciência de Dados é desenvolvida por meio de um conjunto de processos, entre eles o aprendizado de máquina
(Machine Learning). Dentre esses processos, qual deles geralmente acontece após a execução do aprendizado de
máquina?

Coleta de Dados.

Visualização.

Limpeza dos Dados.

Análise Exploratória.

Pré-Processamento
PERGUNTA 5
A ciência de dados é uma área interdisciplinar que se baseia em ferramentas distintas e algoritmos para
descrever padrões e insights por intermédio de dados brutos. Isso mostra que fundamentalmente nossos
movimentos na internet podem ser rastreados para que empresas, com base em informações, entendam
nossas preferências de consumo. Dessa forma, a Inteligência de Máquina é um aparato fundamental para
a ciência de dados, constituindo uma metodologia que automatiza a descrição de modelos analíticos
alicerçados em dados e que buscam padrões com o mínimo de participação humana na tomada de decisão.

Diante da contextualização anterior, assinale a alternativa que descreve corretamente a subárea da ciência
de dados que automatiza modelos analíticos por meio de informações.

a. Simulação Monte Carlo.

b. Redes neurais.

c. Big data.

d. Machine Learning.

e. Estatística espacial
PERGUNTA 6
É sabido que um algoritmo se traduz como sequência lógica de passos a fim de solucionarmos um problema.
Assim sendo, para Machine Learning, Inteligência Artificial e ciência de dados, tal elemento constitui
ferramenta importantíssima que propicia gerar conclusões com base em dados de treino e dados de teste
propriamente ditos. Relacionando-se a tal contexto, tem-se a necessidade de mensuração de desempenho
de algoritmos em procedimentos de estimação.

Assinale a alternativa que descreve corretamente um algoritmo de Machine Learning voltado a treinamento
de máquina e que não gera um bom rendimento.

a. Letofitting.

b. Data fitting.

c. Overfitting.

d. Chromofitting.

e. Underfitting.
PERGUNTA 7
Analise as afirmações a seguir:
I. A classificação é um fator discriminatório que pode impactar as atividades de integração, agregação e análise do
ciclo de vida dos dados.
II. A ótica do analista de dados é um fator discriminatório que pode impactar a atividade de obtenção do ciclo de vida
dos dados.
III. A atividade de obtenção, do ciclo de vida dos dados, pode ser impactada com os fatores de amostra, com dados
incorretos ou incompletos para a questão da discriminação.
IV. Amostra com dados parciais é um fator com impacto discriminatório na atividade de limpeza do ciclo de vida dos
dados.
De acordo com as afirmações apresentadas, indique qual alternativa é a correta:

Apenas as afirmações II, III e IV estão corretas.

Apenas as afirmações I, III e IV estão corretas.

Apenas as afirmações I e II estão corretas.

Apenas as afirmações I e III estão corretas.

Apenas a afirmação IV está correta.

PERGUNTA 1
1. O KDD (Knowledge Discovery in Databases) geralmente é dividido em cinco
fases. Qual delas consiste em fazer a verificação da qualidade dos dados, exceções e
ruídos são removidos, também ocorre limpeza, correção, remoção de dados
inconsistentes, e identificação de dados ausentes, incompletos ou não íntegros?

Transformação.

Interpretação.

Mineração de Dados.

Seleção.

Pré-Processamento.

PERGUNTA 2
1. Na Ciência de Dados e na Mineração de Dados podemos ter a
existência de valores que não condizem com arealidade de um
determinado conjunto de dados. Tais valores são conhecidos
rotineiramente por “outliers”.

Os outliers são importantes para descrição de dados do tipo:

a. dados com ruídos.

b. dados redundantes.

c. dados inconsistentes.

d. dados multidimensionais.

e. dados aleatórios.

PERGUNTA 3
1. A nomenclatura Mineração de Dados que é derivada do termo inglês Data
Mining, é uma metodologia processual para identificar irregularidades, padrões,
correlações e regressões em grandes banco de dados para estimar resultados
e gerar decisões assertivas, por intermédio de várias tipologias de dados,
melhorando por exemplo, receitas e lucros e a relação com clientes. Neste
contexto, o pré-processamento de dados é usado para modificar dados brutos
em informações relevantes e úteis, tendo três passos principais com suas
peculiares atividades, que são: a limpeza de dados, transformação de dados e
redução de dados.

Considerando o pré-processamento de dados e seus passos fundamentais,
avalie as afirmações a seguir, e relacione-as adequadamente aos passos do pré-
processamento.

1 – Limpeza de dados.
2 – Transformação de dados.
3 – Redução de dados.

I – É o passo do pré-processamento que envolve as atividades de normalização,
seleção de atributos, discretização e geração de hierarquia de conceitos.
II – O grau de complexidade do sistema computacional pode ser reduzido
consideravelmente por meio da redução de dados, permitindo uma melhor
eficiência e diminuição de custos envolvidos no processo.
III – Os dados brutos do dataset podem possuir pontos irrelevantes ou ausentes,
assim sendo, a limpeza de dados se torna um ponto essencial no processo.

Assinale a alternativa que correlaciona adequadamente os dois grupos de
informação.

a. 1-I; 2-II; 3-III.

b. 1-III; 2-II; 3-I.

c. 1-I; 2-III; 3-II.

d. 1-III; 2-I; 3-II.

e. 1-II; 2-I; 3-III.

PERGUNTA 4 ERRADO
1. Considere verdadeiras (V) ou falsas (F) as afirmações a seguir sobre caracterização de
dados:
( ) Atributos contínuos contêm um número finito ou infinito contável de valores.
( ) O tipo de um atributo diz respeito ao grau de quantização nos dados, e a escala
indica a significância relativa dos valores.
( ) Os atributos qualitativos podem ter seus valores ordenados, entretanto operações
aritméticas não podem ser aplicadas aos seus valores.
( ) Um atributo que tem um tipo que representa qualidades pode ser denominado
qualitativo, simbólico ou categórico.
A sequência correta de preenchimento dos parênteses, de cima para baixo, é:

ERRADO V, F, F, V

F, V, V, V

V, V, F, V

V, F, V, F

F, F, V, F

PERGUNTA 5
1. Considere verdadeiras (V) ou falsas (F) as afirmações a seguir sobre as medidas de
localidade.

( V ) A média truncada é o cálculo da média que descarta os valores extremos de uma
sequência ordenada de valores, de forma a minimizar os erros.
( F ) A mediana é calculada pela soma, dividida pela quantidade, dos valores de um
determinado atributo.
( V ) A moda é o valor com maior frequência para um atributo.
( F ) São chamados de outliers aqueles valores que se repetem muito em um mesmo
atributo.
A sequência correta de preenchimento dos parênteses, de cima para baixo, é:

F, V, V, F

F, F, V, V

V, F, F, V

V, F, V, F

V, V, F, V

PERGUNTA 6

No contexto envolvendo a Ciência de Dados, sabe-se que a Mineração de Dados pode
ser entendida como um aparato de negócios que tem como intuito principal a
investigação de grandes bancos de dados com enfoque na identificação de regras e
padrões entre variáveis e informações no dado estudo. Quando se fala em grandes
bancos de dados, sempre vem à tona o termo Big Data, que no contexto atual de
mercado apresenta cinco dimensões, que são: volume, velocidade, variedade,
variabilidade e complexidade. Dessa maneira, temos que o Processo de Descoberta do
Conhecimento (KDD) surge não só como um conceito, e sim como uma metodologia útil
para tais análises e estudos.

Considerando as características e os termos relacionados ao KDD, avalie as
afirmações a seguir, em relação às suas fases, e relacione-as adequadamente
aos termos às quais se referem.

1 – Seleção.
2 – Transformação.
3 – Interpretação.

I – Incorpora técnicas como normalização, geração de outros atributos, redução
e sumarização de dados, visando a identificação de atributos importantes para
alcançar os propósitos previamente definidos.
II – É a fase que realiza a aferição da performance do modelo, sucedendo a
solidificação do conhecimento deparado.
III – É a fase que engloba o recolher um conjunto ou subconjunto de dados que
irá compor a parte da análise de dados, tendo fontes de dados de diversas
tipologias e estruturas.

Assinale a alternativa que correlaciona adequadamente os dois grupos de
informação.

a. 1-I; 2-II; 3-III.

b. 1-II; 2-I; 3-III.

c. 1-I; 2-III; 3-II.

d. 1-III; 2-I; 3-II.

e. 1-III; 2-II; 3-I.

PERGUNTA 7

Observa-se que a Mineração de Dados do Processo de Descoberta do Conhecimento
de Dados (KDD) vincula-se de forma substancial com as técnicas de inteligência de
máquina, identificando regras, otimalidade, simulação e análises estatísticas
multivariadas a fim de gerar padrões por intermédio do banco de dados em questão.
Nota-se que a Mineração de Dados é uma das etapas do KDD, sendo que ela é
organizada em seis fases ou etapas, que integram o CRISP-DM (Processo Padrão
Intersetorial de Mineração de Dados, tradução da nomenclatura em inglês Cross-
Industry Standard Process of Data Mining).

Dessa maneira, assinale a alternativa que apresenta as etapas que integram o CRISP-
DM.

a. Compreensão dos negócios, entendimento dos dados, preparação dos dados, modelagem,
análise dos resultados, divulgação dos resultados.

b. Compreensão dos negócios, simulação dos dados, preparação dos dados, modelagem,
análise dos resultados, divulgação dos resultados.

c. Compreensão dos negócios, entendimento dos dados, caracterização dos dados,
modelagem, análise dos resultados, divulgação dos resultados.

d. Identificação dos parâmetros, entendimento dos dados, preparação dos dados, modelagem,
análise dos resultados, divulgação dos resultados.

e. Compreensão dos negócios, entendimento dos dados, preparação dos dados, modelagem,
simulação dos resultados, divulgação dos resultados.

PERGUNTA 8

No contexto do mercado empresarial e/ou organizacional, a Mineração de Dados
assume algumas identidades com relação às nomenclaturas, sendo conhecida, por
exemplo, como inteligência de negócios, modelagem e análise preditiva, descoberta do
conhecimento, dentre outras. Ressalta-se que as técnicas voltadas para a Mineração
de Dados são recentes, todavia a Mineração de Dados não é um aparato recente, já
que indivíduos já interpretavam dados desde a invenção dos primeiros computadores.

Existem tarefas principais vinculadas à Mineração de Dados, assinale a alternativa que
apresenta algumas das principais tarefas da Mineração de Dados.
a. Otimização e simulação, separação de parâmetros, padrões de associação, enquadramento
de variáveis.

b. Separação de parâmetros, clustering, padrões de associação, avaliação.
c. Descrição, enquadramento de variáveis, padrões de independência, predição.

d. Otimização e simulação, enquadramento de variáveis, padrões discriminantes, predição.

e. Otimização e simulação, clustering, padrões de associação, predição.

PERGUNTA 9

O conhecimento é o elemento fundamental buscado nas atividades relacionadas a
banco de dados, especialmente na Mineração de Dados, sendo muito relevante para o
processo decisório assertivo. É importante salientar também que a Mineração de Dados
constitui um processo no âmbito dos negócios avaliando grandes quantidades de dados
com o objetivo de descobrir regras e padrões. O pontapé inicial se dá na atividadede
pré-processamento dos dados.

Com relação ao pré-processamento de dados, assinale a alternativa correta.
a. Caracteriza-se como a preparação, organização e estruturação de dados, consumindo
aproximadamente 5 a 15% do tempo e do esforço vinculado a um sistema de análise de
dados.

b. Caracteriza-se como a preparação, organização e estruturação de dados, consumindo
aproximadamente 70 a 80% do tempo e do esforço vinculado a um sistema de análise de
dados.

c. Caracteriza-se como a preparação, organização e estruturação de dados, consumindo
aproximadamente 30 a 40% do tempo e do esforço vinculado a um sistema de análise de
dados.

d. Caracteriza-se como a preparação, organização e estruturação de dados, consumindo
aproximadamente 10 a 25% do tempo e do esforço vinculado a um sistema de análise de
dados.

e. Caracteriza-se como a preparação, organização e estruturação de dados, consumindo
aproximadamente 90 a 98% do tempo e do esforço vinculado a um sistema de análise de
dados.

PERGUNTA 10

1. Qual é a biblioteca capaz de gerar um relatório em HTML com informações acerca dos
atributos de um conjunto de dados, incluindo comparação entre os atributos?

Seaborn.

SweetViz.

MatPlotLib.

BeautifulSoup.

Scikit-Learn.

Fazer teste: Semana 4 - Atividade Avaliativa
Informações do teste
Descrição
Instruções Olá, estudante!
1. Para responder a esta atividade, selecione a(s) alternativa(s) que você
considerar correta(s);
2. Após selecionar a resposta correta em todas as questões, vá até o fim da
página e pressione “Enviar teste”.
3. A cada tentativa, as perguntas e alternativas são embaralhadas
Pronto! Sua atividade já está registrada no AVA.
Várias
tentativas
Este teste permite 3 tentativas. Esta é a tentativa número 1.
Forçar
conclusão
Este teste pode ser salvo e retomado posteriormente.
Suas respostas foram salvas automaticamente.
No contexto envolvendo a Ciência de Dados, sabe-se que a
Mineração de Dados pode ser entendida como um aparato de
negócios que tem como intuito principal a investigação de
grandes bancos de dados com enfoque na identificação de
regras e padrões entre variáveis e informações no dado estudo.
Quando se fala em grandes bancos de dados, sempre vem à
tona o termo Big Data, que no contexto atual de mercado
apresenta cinco dimensões, que são: volume, velocidade,
variedade, variabilidade e complexidade. Dessa maneira, temos
que o Processo de Descoberta do Conhecimento (KDD) surge
não só como um conceito, e sim como uma metodologia útil para
tais análises e estudos.
Considerando as características e os termos relacionados ao
KDD, avalie as afirmações a seguir, em relação às suas fases, e
l i d d t t à i f
PERGUNTA 1 1,7 pontos Salva
Estado de Conclusão da Pergunta:
Clique em Salvar e Enviar para salvar e enviar. Clique em Salvar todas as respostas para salvar todas as res
relacione-as adequadamente aos termos às quais se referem.
1 – Seleção.
2 – Transformação.
3 – Interpretação.
I – Incorpora técnicas como normalização, geração de outros
atributos, redução e sumarização de dados, visando a
identificação de atributos importantes para alcançar os
propósitos previamente definidos.
II – É a fase que realiza a aferição da performance do modelo,
sucedendo a solidificação do conhecimento deparado.
III – É a fase que engloba o recolher um conjunto ou subconjunto
de dados que irá compor a parte da análise de dados, tendo
fontes de dados de diversas tipologias e estruturas.
Assinale a alternativa que correlaciona adequadamente os dois
grupos de informação.
a. 1-I; 2-II; 3-III.
b. 1-II; 2-I; 3-III.
c. 1-III; 2-II; 3-I.
d. 1-III; 2-I; 3-II.
e. 1-I; 2-III; 3-II.
O conhecimento é o elemento fundamental buscado nas
atividades relacionadas a banco de dados, especialmente na
Mineração de Dados, sendo muito relevante para o processo
decisório assertivo. É importante salientar também que a
Mineração de Dados constitui um processo no âmbito dos
negócios avaliando grandes quantidades de dados com o
objetivo de descobrir regras e padrões. O pontapé inicial se dá
na atividade de pré-processamento dos dados.
Com relação ao pré-processamento de dados, assinale a
alternativa correta.
a. Caracteriza-se como a preparação, organização e estruturação
de dados, consumindo aproximadamente 5 a 15% do tempo e
PERGUNTA 2 1,7 pontos Salva
Clique em Salvar e Enviar para salvar e enviar. Clique em Salvar todas as respostas para salvar todas as res
de dados, co su do ap o ada e te 5 a 5% do te po e
do esforço vinculado a um sistema de análise de dados.
b. Caracteriza-se como a preparação, organização e estruturação
de dados, consumindo aproximadamente 10 a 25% do tempo e
do esforço vinculado a um sistema de análise de dados.
c. Caracteriza-se como a preparação, organização e estruturação
de dados, consumindo aproximadamente 70 a 80% do tempo e
do esforço vinculado a um sistema de análise de dados.
d. Caracteriza-se como a preparação, organização e estruturação
de dados, consumindo aproximadamente 30 a 40% do tempo e
do esforço vinculado a um sistema de análise de dados.
e. Caracteriza-se como a preparação, organização e estruturação
de dados, consumindo aproximadamente 90 a 98% do tempo e
do esforço vinculado a um sistema de análise de dados.
Observe a seguir o comando e sua respectiva saída abaixo. Verifique
que no Dataset de Prêmios da Netflix há 8 tipos de programas, além de
alguns registros que contém o valor nulo (nan).
Baseado no comando acima e no dataset apresentado, qual dos
comandos abaixo é capaz de substituir, de forma definitiva, todos os
registros com valor “nan” para o valor “indefinido” no atributo kind?
d3['kind']="indefinido"
d3['kind']='indefinido'
d3['kind'].isnull(value='indefinido',inplace=True)
d3['kind']=="nan"="indefinido"
d3['kind'].fillna(value='indefinido',inplace=True)
PERGUNTA 3 1,7 pontos Salva
Na Ciência de Dados e na Mineração de Dados podemos ter a
existência de valores que não condizem com a realidade de um
determinado conjunto de dados. Tais valores são conhecidos
rotineiramente por “outliers”.
Os outliers são importantes para descrição de dados do tipo:
a. dados aleatórios.
b. dados redundantes.
c. dados com ruídos.
d. dados multidimensionais.
PERGUNTA 4 1,2 pontos Salva
Clique em Salvar e Enviar para salvar e enviar. Clique em Salvar todas as respostas para salvar todas as res
e. dados inconsistentes.
Quando se trata do manuseio de dados, especialmente do foco
de um profissional que trabalha com dados, independentemente
das ferramentas utilizadas, sejam elas de análise ou de
inteligência de máquina, é de fundamental importância a
atividade de pré-processamento de dados, incluindo o
conhecimento da sua tipologia.
Nesse contexto, podem ser interpretados como objetos similares
a outros objetos no mesmo conjunto de dados:
a. dados redundantes.
b. dados sem ruídos.
c. dados com ruídos.
d. dados elementares.
e. dados inconsistentes.
PERGUNTA 5 1,2 pontos Salva
Observa-se que a Mineração de Dados do Processo de
Descoberta do Conhecimento de Dados (KDD) vincula-se de
forma substancial com as técnicas de inteligência de máquina,
identificando regras, otimalidade, simulação e análises
estatísticas multivariadas a fim de gerar padrões por intermédio
do banco de dados em questão. Nota-se que a Mineração de
Dados é uma das etapas do KDD, sendo que ela é organizada
em seis fases ou etapas, que integram o CRISP-DM (Processo
Padrão Intersetorial de Mineração de Dados, tradução da
nomenclatura em inglês Cross-Industry Standard Process of
Data Mining).
Dessa maneira, assinale a alternativa que apresenta as etapas
que integram o CRISP-DM.
a. Compreensão dos negócios, entendimento dos dados,
caracterização dos dados, modelagem, análise dos resultados,
divulgação dos resultados.
b. Identificação dos parâmetros, entendimento dos dados,
preparação dos dados, modelagem, análise dos resultados,divulgação dos resultados
PERGUNTA 6 1,25 pontos Salva
Clique em Salvar e Enviar para salvar e enviar. Clique em Salvar todas as respostas para salvar todas as res
divulgação dos resultados.
c. Compreensão dos negócios, entendimento dos dados,
preparação dos dados, modelagem, análise dos resultados,
divulgação dos resultados.
d. Compreensão dos negócios, simulação dos dados, preparação
dos dados, modelagem, análise dos resultados, divulgação dos
resultados.
e. Compreensão dos negócios, entendimento dos dados,
preparação dos dados, modelagem, simulação dos resultados,
divulgação dos resultados.
No contexto do mercado empresarial e/ou organizacional, a
Mineração de Dados assume algumas identidades com relação
às nomenclaturas, sendo conhecida, por exemplo, como
inteligência de negócios, modelagem e análise preditiva,
descoberta do conhecimento, dentre outras. Ressalta-se que as
técnicas voltadas para a Mineração de Dados são recentes,
todavia a Mineração de Dados não é um aparato recente, já que
indivíduos já interpretavam dados desde a invenção dos
primeiros computadores.
Existem tarefas principais vinculadas à Mineração de Dados,
assinale a alternativa que apresenta algumas das principais
tarefas da Mineração de Dados.
a. Otimização e simulação, clustering, padrões de associação,
predição.
b. Descrição, enquadramento de variáveis, padrões de
independência, predição.
c. Otimização e simulação, enquadramento de variáveis, padrões
discriminantes, predição.
d. Otimização e simulação, separação de parâmetros, padrões de
associação, enquadramento de variáveis.
e. Separação de parâmetros, clustering, padrões de associação,
avaliação.
PERGUNTA 7 1,25 pontos Salva
Clique em Salvar e Enviar para salvar e enviar. Clique em Salvar todas as respostas para salvar todas as res
PERGUNTA 1
A funcionalidade dos Web Scrapers, no contexto da Ciência de Dados, é de fundamental importância para
a busca eficiente de dados. Assim, eles podem buscar todos os dados de sites peculiares e até mesmo os
dados específicos que o pesquisador-usuário desejar.

Nesse sentido, com base na tipologia dos Web Scrapers, o número de critérios que os classifica é:

a. 5.

b. 2.

c. 4.

d. 1.

e. 3
PERGUNTA 2
A busca por informações gerenciais sempre foi de grande valia para as organizações e/ou empresas para
que possam aumentar o seu leque competitivo de mercado. No mundo globalizado isso se faz extremamente
necessário, assim, a busca por uma quantidade exponencial de informações relevantes é um aparato para
a criação de estratégias organizacionais.

Nesse sentido, a importância da utilização do Web Scraping deve-se pela:

a. busca de um número infinito de informações de forma mais rápida e dinâmica, a fim de treinar e aprimorar
algoritmos de aprendizagem de máquina.

b. busca de um número finito de informações de forma simples, a fim de treinar e aprimorar algoritmos de
aprendizagem de máquina.

c. busca de um número limitado e restrito de informações de forma mais rápida e dinâmica, a fim de treinar e
aprimorar algoritmos de aprendizagem de máquina.

d. busca de um número exponencial de informações de forma mais rápida e dinâmica, a fim de treinar e
aprimorar algoritmos de aprendizagem de máquina.

e. criação de um número exponencial de informações de forma simples, a fim de treinar e aprimorar algoritmos
de aprendizagem de máquina.
PERGUNTA 3
Assinale com V (verdadeiro) ou F (falso) as afirmações a seguir sobre a atividade de Web Scraping em Ciência de
Dados:
( ) – O processo de Web Scraping pode ser realizado por consumo de dados via API (Interface de Programação de
Aplicações).
( ) – As bibliotecas BeautifulSoup e Selenium são duas bibliotecas para realizar atividades de Web Scraping.
( ) – A biblioteca BeautifulSoup constrói uma árvore a partir de vários elementos de uma página.
( ) – Ao usar o comando soup.find_all('a'), é possível recuperar todos os parágrafos html que estão no objeto soup.

A sequência correta de preenchimento dos parênteses, de cima para baixo, é:

V, F, V, V.

V, V, F, V.

F, V, V, F.

F, F, V, V.

V, F, V, F.
PERGUNTA 4
A análise de dados, pautada na linguagem Python, tem fundamentação estrutural e desenvolve métodos e
técnicas voltados para a Ciência de Dados, em suas diversas bibliotecas constituintes, com suas
potencialidades e particularidades. O conhecimento e o entendimento das funcionalidades das bibliotecas é
um ponto-chave para o usuário-pesquisador na Ciência de Dados.

Considerando a importância das bibliotecas inseridas na linguagem Python e suas particularidades, avalie
as afirmações a seguir, e relacione-as adequadamente aos termos às quais se referem.

1 – Matplotlib
2 – Scikit-Learn
3 – Seaborn

I – É a biblioteca do Python voltada para visualização com alicerce no Matplotlib, contribuindo para um
conjunto de diretrizes voltadas para a plotagem de gráficos estatísticos pertinentes.
II – É uma biblioteca do Python voltada essencialmente para o aprendizado de máquina.
III – É uma biblioteca do Python voltada essencialmente para a parte gráfica, ou seja, pode ser entendida
como uma biblioteca voltada para a plotagem.

Assinale a alternativa que correlaciona adequadamente os dois grupos de informação.

a. 1-II; 2-I; 3-III.

b. 1-I; 2-II; 3-III.

c. 1-III; 2-II; 3-I.

d. 1-I; 2-III; 3-II.

e. 1-II; 2-III; 3-I.
PERGUNTA 5
Analise a execução do comando dados=np.arange(1,5,2), e veja as afirmações a seguir:
I. O comando cria um ndarray com 4 elementos.
II. O comando cria um ndarray em que o primeiro elemento é o valor 1.
III. O comando cria um ndarray em que o último valor é 3.
IV. A função arange da biblioteca NumPy cria um ndarray com valores aleatórios.
De acordo com as afirmações apresentadas, indique qual alternativa é a correta:

Apenas as afirmações II e III estão corretas.

Apenas a afirmação IV está correta.

Apenas as afirmações I e III estão corretas.

Apenas as afirmações I e II estão corretas.

Apenas as afirmações I, III e IV estão corretas.
PERGUNTA 6
Dada a imagem a seguir, que representa um dataframe Pandas nomeado df:

Após ser executado o comando df2=df[df['QtdeFunc']>1000], analise as afirmações a seguir:
I. Serão listadas as linhas de df que tem o atributo QtdeFunc com mais de 1000.
II. Será criado um dataframe df2, que conterá 2 linhas.
III. Será criado um dataframe df2, que conterá 3 linhas.
IV. Será criado um dataframe df2, que será uma réplica exata do dataframe df.
V. A linha indexada como 6 no dataframe df, também fará parte do dataframe df2, que será criado.
De acordo com as afirmações apresentadas, indique qual alternativa é a correta:

Apenas a afirmação I é correta.

Apenas as afirmações I, IV e V estão corretas.

Apenas as afirmações I, II e IV estão corretas.

Apenas as afirmações III, IV e V estão corretas.

Apenas as afirmações II e V estão corretas.
PERGUNTA 7
A análise de dados com a linguagem Python é de extrema importância para a tomada de decisão gerencial
com confiabilidade por intermédio da coleta, análise, interpretação e compartilhamento de dados. Dessa
maneira, a estruturação do Python com suas diversas bibliotecas se torna um aparato relevante e constitui
um diferencial de mercado.

Considerando a importância da Ciência de Dados e seus procedimentos que contribuem para a resolução
de problemas no contexto organizacional, avalie as afirmações a seguir, em relação a algumas bibliotecas
e suas características voltadas para o Python, e relacione-as adequadamente aos termos às quais se
referem.

1 – Stats Models.
2 – Bokeh.
3 – Scrapy.

I – Caracteriza-se como sendo uma biblioteca do Python com visão interativa voltada para navegadores do
mundo moderno vinculada a apresentações, tendo como intuito principal gerar uma obra apurada e sucintano ambiente gráfico.
II – É uma espécie de framework de acompanhamento web, concedendo a navegação no site para páginas
que apresentam as informações devidamente procuradas e requisitadas.
III - Em linhas gerais, trata-se de uma biblioteca que oferece uma complementação para Scipy para
mensurações estatísticas, sejam descritivas sejam inferenciais.

Assinale a alternativa que correlaciona adequadamente os dois grupos de informação.

a. 1-III; 2-I; 3-II.

b. 1-II; 2-I; 3-III.

c. 1-I; 2-II; 3-III.

d. 1-I; 2-III; 3-II.

e. 1-III; 2-II; 3-I.

PERGUNTA 1
A tipologia de dados, independentemente de serem números discretos, sequencial de caracteres ou
operadores lógicos, constitui um pressuposto básico para uma específica linguagem de programação. Logo,
a obtenção de uma tipologia de dados dinâmica gera um programa autossuficiente no sentido de
declarações prévias. Seguindo ainda nessa direção, a linguagem Python, de forma contínua, gera uma
manutenção da memória por intermédio de mecanismos como o coletor de lixo e a contagem de referência,
mostrando o ganho que o programador possui na não preocupação em realizar de modo manual a gerência
da memória.

Com base no descritivo envolvendo a tipologia de dados no âmbito da linguagem Python e suas
nomenclaturas relacionadas, avalie as afirmações a seguir, em relação à estruturação de dados no Python,
e relacione-as adequadamente aos termos às quais se referem.

1 – Garbage collector.
2 – Reference Counting.
3 – Tipos de dados.

I – O garbage collector é o mecanismo específico da linguagem Python que trabalha com a questão da
limpeza de memória, sendo usualmente conhecido como coletor de lixo.
II – A Reference Counting é o mecanismo peculiar da linguagem Python que trabalha em essência com a
manutenção da memória, ou seja, pode ser interpretada como uma espécie de contagem de referência.
III – Uma estrutura dinâmica na tipologia de dados faz com que o programa entenda a priori o tipo de
informação que está sendo utilizada.

Assinale a alternativa que correlaciona adequadamente os dois grupos de informação.

a. 1-III; 2-I; 3-II.

b. 1-I; 2-II; 3-III.

c. 1-III; 2-II; 3-I.

d. 1-I; 2-III; 3-II.

e. 1-II; 2-III; 3-I.
PERGUNTA 2
Python é uma linguagem de programação desenvolvida com o intuito de simplicidade e versatilidade,
podendo ser utilizada para a realização de diversas tarefas, tais como construção de aplicativos, criação de
sites, criação de programas, jogos e análise de dados. A grosso modo, a linguagem Python
é ___________________________________ e que sustenta _______________________________ de
programação: _________________________, ____________________________ e
___________________________.

Preencha as lacunas escolhendo a alternativa correta.

a. interpretada de maior nível, múltiplos paradigmas, imperativo, orientado a objetos, não funcional.

b. interpretada de menor nível, paradigmas únicos, imperativo, não orientado a objetos, não funcional.

c. interpretada de menor nível, paradigmas únicos, imperativo, orientado a objetos, funcional.

d. interpretada de menor nível, múltiplos paradigmas, imperativo, orientado a objetos, funcional.

e. interpretada de maior nível, paradigmas únicos, imperativo, orientado a objetos, funcional.
PERGUNTA 3
A linguagem Python constitui uma das principais linguagens de programação voltada para a análise de
dados e possui algumas características peculiares, das quais podemos citar a questão de ser considerada
uma linguagem de programação interpretada e de alto nível, ou seja, apresenta maior proximidade com a
linguagem humana do que com a linguagem de máquina (sistema binário).

Com base nas informações apresentadas, identifique se são verdadeiras (V) ou falsas (F) as afirmativas a
seguir.

I. No Python a implementação é realizada por intermédio de um processo no qual um dos elementos
fundamentais é exatamente o interpretador.
II. No Python tem-se a utilização de estruturas denominadas “funções”.
III. No Python temos classes e objetos, sendo, portanto, uma programação multiplataforma.

Assinale a alternativa correta.

a. V - F - F.

b. F - F - F.

c. V - V - V.

d. V - V - F.

e. F - F - V.
PERGUNTA 4
A linguagem Python apresenta grande valorização e aplicabilidade no contexto atual, sendo amplamente
utilizada em grandes áreas, tais como Análise de Dados e Ciência de Dados, Automações e
Desenvolvimento Web. Em termos específicos, quando se fala em Ciência de Dados tem-se um dos campos
mais populares de utilização do Python. De outro modo, a automatização de tarefas possíveis está
intimamente ligada à produtividade e à eficiência de processos diversos. Adicionalmente, aplicações
para Web são evidenciadas com maior simplicidade com base na fundamentação do sistema Python.

Nesse contexto, em linhas de mercado, constituem-se fundamentalmente como proveitos significativos da
utilização da linguagem Python visando a modelagem de soluções de problemas empresariais:

a. multiplataforma e periodicidade, especificidade de aprendizado e gratuidade.

b. multiplataforma e extensibilidade, dinamismo de aprendizado e gratuidade.

c. plataforma única e extensibilidade, especificidade de aprendizado e gratuidade.

d. multiplataforma e extensibilidade, especificidade de aprendizado e gratuidade.

e. multiplataforma e fundamentalidade, especificidade de aprendizado e gratuidade.
PERGUNTA 5
Sabemos que há uma biblioteca da linguagem Python voltada para a análise de dados, e que sua
nomenclatura, derivada de “dados de painel”, do inglês panel data, constitui uma terminologia econométrica
usada para a descrição de conjuntos de dados estruturados multidimensionais.
Nesse sentido, caracteriza-se como uma das bibliotecas mais utilizadas ao redor do mundo por cientistas
de dados. Estamos falando da:

a. biblioteca Numpy.

b. biblioteca Catplotlib.

c. biblioteca Natplotlib.

d. biblioteca Pandas.

e. biblioteca Mumpy.
PERGUNTA 6
As linguagens de programação são o alicerce fundamental para o desenvolvimento de sistemas, sites etc.,
assim sendo, a construção de inteligências artificiais, a realização de análise de dados ou a projeção
do back-end de uma aplicação envolvem a utilização da linguagem Python e de aparatos derivativos.

Nesse contexto, são visualizadas como características fundamentais da linguagem Python:

a. multiplataforma / multiparadigma / linguagem interpretada.

b. plataforma simples / multiparadigma / linguagem interpretada.

c. multiplataforma / paradigma único / linguagem interpretada.

d. multiplataforma / multiparadigma / linguagem orientada.

e. multiplataforma / paradigma único / linguagem programada.

Fazer teste: Semana 1 - Atividade Avaliativa
Informações do teste
Descrição
Instruções Olá, estudante!
1. Para responder a esta atividade, selecione a(s) alternativa(s) que você considerar correta(s);
2. Após selecionar a resposta correta em todas as questões, vá até o fim da página e pressione
“Enviar teste”.
3. A cada tentativa, você receberá um conjunto diferente de questões.
Pronto! Sua atividade já está registrada no AVA.
Várias
tentativas
Este teste permite 3 tentativas. Esta é a tentativa número 1.
Forçar
conclusão
Este teste pode ser salvo e retomado posteriormente.
Suas respostas foram salvas automaticamente.
A Ciência de Dados está diretamente ligada à Inteligência Artificial, utilizando
de modelos matemáticos, métodos estatísticos e científicos, bem como da
análise de dados. Ou ainda, tem seus procedimentos alicerçados em campos
específicos do conhecimento, conforme mostrado na Figura 1 a seguir.

Fonte: Elaborada pelo autor.
Com base nas informações apresentadas, identifique se são verdadeiras (V)ou falsas (F) as afirmativas a seguir.
PERGUNTA 1
Estado de Conclusão da Pergunta:
I. A Ciência de Dados é uma ciência interdisciplinar.
II. A Ciência de Dados utiliza de procedimentos para reconhecer padrões em
problemas de diferentes naturezas.
III. O propósito da Ciência de Dados é transformar o “dado” em informação
importante por intermédio de etapas que permitem reconhecer padrões e
identificar comportamentos a posteriori.
Assinale a alternativa que apresenta a sequência correta.
a. F - V - V.
b. F - V - F.
c. V - V - V.
d. V - V - F.
e. V - F - F.
Segundo Alves (2022, p. 34), “Os números governam o mundo, os negócios
e o Universo”. Além disso, sabe-se que dados e informações são de
fundamental importância para as tomadas de decisões, independentemente
do contexto estudado e trabalhado, daí a relevância da Ciência de Dados
para estudos diversos de mercado.
ALVES, A. F. Guia de estudos da disciplina Métodos Quantitativos. Varginha: [S.
I.], 2020.
Nesse contexto, a Ciência de Dados caracteriza-se como:
a. a ciência que estuda o volume exponencial de informações.
b. a Inteligência Artificial propriamente dita.
c. a área do conhecimento que interpreta informações na sua base natural.
d. a subárea da inteligência de máquina que organiza as informações.
e. o campo do conhecimento que busca transformar dados em informações.
PERGUNTA 2
O uso da Ciência de Dados no contexto do mundo globalizado, consolida-se
por conta da complexidade de resolução de problemas diversos, que
necessitam de uma estimativa futura de tendências, comportamentos e
possíveis soluções assertivas, bem como pela utilização da tecnologia.
Associado a isso, temos o crescimento exponencial da visualização e
recebimento de informações, independentemente da área da
problematização abordada.
Considerando a importância da Ciência de Dados e seus procedimentos que
PERGUNTA 3
contribuem para a resolução de problemas no contexto organizacional, avalie
as afirmações a seguir, em relação à fundamentação e à aplicabilidade da
Ciência de Dados, e relacione-as adequadamente aos termos às quais se
referem.
1 – Inteligência Artificial.
2 – Matemática e Computação.
3 – Dados.
I – São ferramentas específicas utilizadas pela Ciência de Dados na criação
e utilização dos seus procedimentos peculiares na resolução de problemas.
II – A Ciência de Dados fundamentalmente constitui um subconjunto da
Inteligência Artificial (IA).
III – É a célula fundamental do processo de geração das informações
relevantes no âmbito da Ciência de Dados.
Assinale a alternativa que correlaciona adequadamente os dois grupos de
informação.
a. 1-II; 2-III; 3-II.
b. 1-I; 2-III; 3-II.
c. 1-III; 2-II; 3-I.
d. 1- II; 2-I; 3-III.
e. 1-I; 2-II; 3-III.
É sabido que a Ciência de Dados pode ser caracterizada como um campo do
conhecimento que nos permite modelar e solucionar problemas de uma
forma ampla e com aplicabilidade em diversas áreas. Comumente, trata-se
da aplicabilidade da Ciência de Dados “de a a z”, mostrando exatamente tal
extensionalidade.
No _________________ da Ciência de Dados, o ______________ é levado
a uma informação pertinente, por intermédio de passos que permitem _____
_______________________________________________________.
Preencha as lacunas escolhendo a alternativa correta.
a. mecanismo é o menor nível, valor, identificar tendências e inferir
comportamentos a posteriori.
b. mecanismo é o maior nível, dado, caracterizar efetivamente tendências e
comportamentos.
c. mecanismo é o menor nível, dado, identificar tendências e inferir
comportamentos a posteriori.
d. mecanismo é o maior nível, atributo, identificar tendências e inferir
comportamentos a posteriori.
e mecanismo é o menor nível dado caracterizar efetivamente tendências e
PERGUNTA 4
e. mecanismo é o menor nível, dado, caracterizar efetivamente tendências e
comportamentos.

TS - Introdução a Ciência de Dados - COM350 - Turma 001

Humanas / Sociais

Ferramentas de estudo

Conteúdos escolhidos para você

Fundamentos de Big Data

Avaliação N2 - UAM

QUESTÕES

Noções Gerais de Mineração de Dados

Introdu Ciência de Dados Semana1 à 7

Perguntas dessa disciplina

Em organizações que lidam com grande volume de informações, a estruturação e o acesso eficiente aos dados são fatores importantes para a tomada de dec

Pergunta 1 A Engenharia de Prompt transforma a interação com as IAs Generativas de um simples diálogo para uma colaboração cocriativa. Os prompts mais

31:05 Progresso:5/5 60 minutos QUESTIONÁRIO 01 – ESTATÍSTICA APLICADA 1 O aprimoramento de técnicas ___________ para coleta e análise de informações p

D. ( V-V-F 5. Nas últimas décadas, devido ao aumento do poder computacional e do crescimento das técnicas de IA, a linha de pesquisa conhecida com...

Projetos de visualização computacional no varejo exigem mais do que habilidade técnica com gráficos ou ferramentas de BI: envolvem um entendimento est

Libere esse material sem enrolação!

Libere esse material sem enrolação!

Libere esse material sem enrolação!

Libere esse material sem enrolação!

Libere esse material sem enrolação!

Libere esse material sem enrolação!

Libere esse material sem enrolação!

Libere esse material sem enrolação!

Libere esse material sem enrolação!

Libere esse material sem enrolação!

Conteúdos escolhidos para você

Fundamentos de Big Data

Avaliação N2 - UAM

QUESTÕES

Noções Gerais de Mineração de Dados

Introdu Ciência de Dados Semana1 à 7

Perguntas dessa disciplina

Em organizações que lidam com grande volume de informações, a estruturação e o acesso eficiente aos dados são fatores importantes para a tomada de dec

Pergunta 1 A Engenharia de Prompt transforma a interação com as IAs Generativas de um simples diálogo para uma colaboração cocriativa. Os prompts mais

31:05 Progresso:5/5 60 minutos QUESTIONÁRIO 01 – ESTATÍSTICA APLICADA 1 O aprimoramento de técnicas ___________ para coleta e análise de informações p

D. ( V-V-F 5. Nas últimas décadas, devido ao aumento do poder computacional e do crescimento das técnicas de IA, a linha de pesquisa conhecida com...

Projetos de visualização computacional no varejo exigem mais do que habilidade técnica com gráficos ou ferramentas de BI: envolvem um entendimento est

Mais conteúdos dessa disciplina