Prévia do material em texto
Verifique o seu desempenho e continue
treinando! Você pode refazer o exercício
quantas vezes quiser.
A
B
1
Sobre o Pandas DataFrame, o que podemos
afirmar?
I � É o coletivo de séries temporais
pandas.Series
II � É a estrutura de dados que representa os
dados em painel
III � É uma matriz conjunto de vetores
IV � É o bloco fundamental da análise de dados
moderna, principalmente para aprendizado de
máquina.
Analise as frases listadas e assinale a
alternativa correta.
Apenas a opção III.
Apenas as opções I, II, IV.
Questão de 10
Corretas
Em branco
1 2 3 4 5
6 7 8 9 10
Análise De…
Firefox https://estacio.saladeavaliacoes.com.br/exercicio/684639a3f464610f1c...
1 of 16 08/06/2025, 22:36
C
D
E
Apenas as opções I, II, III.
Apenas as opções II, III.
Todas as opções I, II, III, IV.
Parabéns, você selecionou a
alternativa correta. Confira o
gabarito comentado!
A afirmação I é correta, pois o DataFrame
no Python é um coletivo de objetos Pandas
Series, que são séries temporais. A
afirmação II também é correta, pois o
DataFrame representa dados em painel,
que são conjuntos de séries temporais
heterogêneas organizadas de forma
tabular. A afirmação III, no entanto, é
incorreta, pois o DataFrame não é uma
matriz conjunto de vetores, mas sim um
conjunto de Series. Por fim, a afirmação IV
é correta, pois o DataFrame é fundamental
na análise de dados moderna, sendo
amplamente utilizado em projetos de
aprendizado de máquina. Portanto, as
opções I, II e IV são as corretas.
2
Firefox https://estacio.saladeavaliacoes.com.br/exercicio/684639a3f464610f1c...
2 of 16 08/06/2025, 22:36
A
B
C
D
E
Dados categóricos são aqueles normalmente
expressos por texto, que representam rótulos,
nomes e símbolos. Qual tipo de visualização de
dados abaixo é recomendado para dados
categóricos?
Gráficos de Linha.
Gráficos de Barra.
Gráfico de Matriz de Dispersão.
Gráfico de Faces de Chernoff.
Gráfico de Estrela.
Parabéns, você selecionou a
alternativa correta. Confira o
gabarito comentado!
O gráfico de barras é a melhor opção para
a visualização de dados categóricos. Isso
ocorre porque ele permite a representação
clara das proporções dos dados
categóricos, evidenciando os estratos da
amostra. É importante ressaltar que os
dados categóricos não se encaixam bem
em gráficos de dados numéricos, como o
gráfico de dispersão. Isso pode causar
confusão na função de visualização ou até
Firefox https://estacio.saladeavaliacoes.com.br/exercicio/684639a3f464610f1c...
3 of 16 08/06/2025, 22:36
A
B
C
D
E
mesmo quebrar a mesma, dependendo da
biblioteca escolhida para a visualização dos
dados.
3
Para a regularização dos dados obtidos, qual
técnica podemos utilizar objetivando fazer com
que os dados fiquem na mesma escala?
Map & Reduce
Divide
Shuffle
MinMax
Splice
Parabéns, você selecionou a
alternativa correta. Confira o
gabarito comentado!
A técnica correta para a regularização dos
dados, com o objetivo de colocá-los na
mesma escala, é a MinMax. Essa técnica é
Firefox https://estacio.saladeavaliacoes.com.br/exercicio/684639a3f464610f1c...
4 of 16 08/06/2025, 22:36
A
utilizada para transformar os dados, de
forma que eles se enquadrem em uma
escala específica, geralmente de 0 a 1. Isso
é feito através da extração da proporção do
dado observado em relação ao valor
mínimo possível até o valor máximo. Dessa
forma, todos os dados são enquadrados
nessa escala, realizando a regularização.
As outras opções apresentadas, como Map
& Reduce, Divide, Shuffle e Splice, não são
técnicas utilizadas para essa finalidade.
4
Luís planeja começar um projeto particular
visando construir um módulo de análise de
dados. Primeiramente, ele deseja começar por
um módulo de coleta de dados. Para que ele
possa obter um padrão organizado de criação
de projeto, qual é a sequência desejável de
passos que esperamos que Luís siga?
Criar uma pasta para acomodar seu
projeto; Levantar um virtualenv através
do venv; Instalar as dependências com
as quais ele quer trabalhar através do
pip install; congelar as mesmas no
requirements.txt através do pip freeze;
criar uma pasta para o módulo de
coleta e dentro dela criar um arquivo
__init__.py em branco e outro para a
lógica do módulo.
Firefox https://estacio.saladeavaliacoes.com.br/exercicio/684639a3f464610f1c...
5 of 16 08/06/2025, 22:36
B
C
D
Criar uma pasta para acomodar seu
projeto; Instalar as dependências com
as quais ele quer trabalhar através do
pip install; congelar as mesmas no
requirements.txt através do pip freeze;
criar uma pasta para o módulo de
coleta e dentro dela criar um arquivo
__init__.py em branco e outro para a
lógica do módulo.
Criar uma pasta para acomodar seu
projeto; Instalar as dependências com
as quais ele quer trabalhar através do
pip install; criar uma pasta para o
módulo de coleta e dentro dela criar
um arquivo __init__.py em branco e
outro para a lógica do módulo.
Criar uma pasta para acomodar seu
projeto; Levantar um virtualenv através
do venv; Instalar as dependências com
as quais ele quer trabalhar através do
pip install; congelar as mesmas no
requirements.txt através do pip freeze;
criar uma pasta para o módulo de
coleta e dentro dela criar um para a
lógica do módulo.
Firefox https://estacio.saladeavaliacoes.com.br/exercicio/684639a3f464610f1c...
6 of 16 08/06/2025, 22:36
E
Criar uma pasta para acomodar seu
projeto; Levantar um virtualenv através
do venv; Instalar as dependências com
as quais ele quer trabalhar através do
pip install; congelar as mesmas no
requirements.txt através do pip freeze;
criar uma pasta para o módulo de
coleta e dentro dela criar um arquivo
__init__.py com a lógica do módulo.
Parabéns, você selecionou a
alternativa correta. Confira o
gabarito comentado!
A sequência correta de passos para a
criação de um projeto de análise de dados,
como o que Luís pretende iniciar, envolve:
criar uma pasta para acomodar o projeto;
levantar um ambiente virtual através do
venv; instalar as dependências necessárias
para o projeto utilizando o pip install;
registrar essas dependências no arquivo
requirements.txt através do pip freeze; criar
uma pasta específica para o módulo de
coleta de dados e, dentro dela, criar um
arquivo __init__.py em branco e outro
arquivo para a lógica do módulo. As
alternativas que não descrevem todos
esses passos estão incompletas ou
apresentam a sequência de passos em uma
ordem incorreta.
Firefox https://estacio.saladeavaliacoes.com.br/exercicio/684639a3f464610f1c...
7 of 16 08/06/2025, 22:36
A
B
C
D
E
5
Bibliotecas poderosas de análise e manipulação
de dados podem ser utilizadas com a linguagem
Python. Qual o método utilizado para fazer a
junção entre DataFrames no pandas?
set_index
reset_index
values
merge
sum
Parabéns, você selecionou a
alternativa correta. Confira o
gabarito comentado!
O método 'merge' é a opção correta para
realizar a junção entre DataFrames no
pandas. Este método é similar ao 'join' da
linguagem SQL, que une dois DataFrames a
partir de índices de mesmo nome ou
índices pré-definidos pelo cientista de
dados. As demais alternativas
apresentadas na questão, como 'set_index',
Firefox https://estacio.saladeavaliacoes.com.br/exercicio/684639a3f464610f1c...
8 of 16 08/06/2025, 22:36
A
B
C
D
E
'reset_index', 'values' e 'sum', não são
utilizadas para a operação de junção entre
DataFrames.
6
A linguagem Python fornece para o cientista de
dados uma grande variedade de funções e
bibliotecas. Qual o método que faz a projeção
do Dataframe orientado pelos rótulos das
colunas do conjunto?
iloc
shuffle
loc
reset_index
sum
Parabéns, você selecionou a
alternativa correta. Confira o
gabarito comentado!
O método 'loc' é utilizado para fazer a
Firefox https://estacio.saladeavaliacoes.com.br/exercicio/684639a3f464610f1c...
9 of 16 08/06/2025, 22:36
A
B
C
D
projeção do DataFrame orientado pelos
rótulos das colunas do conjunto. Isso
significa que, ao passar o nome da coluna
ou colunas desejadas entre colchetes, a
operação de projeçãodo DataFrame é
aplicada de acordo com o objetivo
desejado. As demais alternativas
apresentadas na questão não estão
relacionadas à projeção do DataFrame. O
'iloc' é usado para indexação baseada em
posição inteira, 'shuffle' para embaralhar os
dados, 'reset_index' para redefinir o índice
do DataFrame e 'sum' para somar os
valores.
7
Compreender a análise de dados em Python
é fundamental para o cientista de dados.
Qual o papel do sistema pip da linguagem
Python?
Gerenciador de Pacotes do Python.
Gerenciador de memória do Python.
Gerenciador de espaços virtuais do
Python.
Motor de Busca da IDE do Python.
Firefox https://estacio.saladeavaliacoes.com.br/exercicio/684639a3f464610f1c...
10 of 16 08/06/2025, 22:36
E
Biblioteca de Processamento de
Linguagem Natural.
Parabéns, você selecionou a
alternativa correta. Confira o
gabarito comentado!
O sistema pip desempenha um papel
crucial na linguagem Python, pois é
responsável pelo gerenciamento de
pacotes. Isso significa que ele permite a
instalação e o gerenciamento de pacotes
de software escritos em Python, que
podem ser importados e utilizados em
nossos programas. A instalação desses
pacotes é feita através do comando 'pip
install'. É importante esclarecer que o
gerenciamento de memória é uma função
do sistema operacional, e não do pip. Além
disso, o gerenciamento de espaços virtuais
é realizado pelo venv ou virtualenv, não
pelo pip. O motor de busca é uma
característica de uma IDE �Ambiente de
Desenvolvimento Integrado), e não está
relacionado com a linguagem de
programação em si. Por fim, o
processamento de linguagem natural é uma
função desempenhada por uma biblioteca
específica, e não tem relação com o
gerenciamento de pacotes.
Firefox https://estacio.saladeavaliacoes.com.br/exercicio/684639a3f464610f1c...
11 of 16 08/06/2025, 22:36
A
B
C
D
E
8
Dado que Felipe quer fazer a junção entre dois
conjuntos de dados e escreveu o seguinte
código:
import pandas as pd
df1 = pd.DataFrame({'lkey': ['foo', 'bar', 'baz',
'foo'], 'value': �1, 2, 3, 5���
df2 = pd.DataFrame({'rkey': ['foo', 'bar', 'baz',
'foo'], 'value': �5, 6, 7, 8���
df1.merge(df2, left_on='lkey', right_on='rkey')
Qual destas alternativas descreve as saídas do
código?
I��O conjunto resultante terá colunas lkey,
value_x, rkey, value_y
II��O código não executará, pois Filipe não
definiu os sufixos de coluna
III��O resultado do código em questão
retornará um pd.Series juntando os conjuntos
pela lkey e rkey.
Apenas a opção I está correta.
Apenas a opção II está correta.
Apenas a opção III está correta.
Apenas as opções II e III estão
corretas.
Apenas as opções I e III estão
corretas.
Firefox https://estacio.saladeavaliacoes.com.br/exercicio/684639a3f464610f1c...
12 of 16 08/06/2025, 22:36
Parabéns, você selecionou a
alternativa correta. Confira o
gabarito comentado!
A afirmativa I está corretíssima uma vez
que o resultado terá as colunas chaves e as
colunas valores acrescidas dos sufixos
padrões, porquanto não há declaração
explícita. A afirmativa II é incorreta, por
mais que seja uma boa prática definir os
nomes dos sufixos de suas junções, não
sendo impeditivo à biblioteca executar a
junção sem elas. A afirmativa III é incorreta,
pois o resultado de uma junção é um
pd.DataFrame, uma vez que estamos
falando de operações fechadas assim
como a álgebra que rege o bom
funcionamento de um sistema, i.e., como a
entrada é de DataFrames, a saída
obrigatoriamente também tem que ser de
DataFrames.
9
Eduardo quer mostrar aos gestores da empresa
como as ações da carteira de investimentos
recomendada que ele e o time dele propuseram
estão valorizando e gerando muitos dividendos
aos clientes. Para isso, Eduardo construiu um
gráfico de ______, pois está lidando com dados
________ e quer mostrar o quão bem as
recomendações geradas por seu time estão
Firefox https://estacio.saladeavaliacoes.com.br/exercicio/684639a3f464610f1c...
13 of 16 08/06/2025, 22:36
A
B
C
D
E
evoluindo.
Respectivamente a resposta que completa as
duas lacunas é:
Pizza; Categóricos
Linha; Numéricos
Linha; Temporais
Pizza; Numéricos
Linha; Categóricos
Parabéns, você selecionou a
alternativa correta. Confira o
gabarito comentado!
O gráfico correto é o de linhas, pois os
dados são temporais, uma vez que Eduardo
quer mostrar cronologia para os acionistas
e o gráfico de linha representa muito bem
isto, e os dados em questão variam ao
longo de meses ou anos. Gráficos de pizza
não se aplicam a dados temporais. Os
dados não são simplesmente numéricos
pois, em essência, estamos lidando com a
cronologia, logo são dados temporais. O
tipo de dados em que números variam no
tempo não pode ser classificado como tipo
Firefox https://estacio.saladeavaliacoes.com.br/exercicio/684639a3f464610f1c...
14 of 16 08/06/2025, 22:36
A
B
C
D
E
categórico.
10
A linguagem Python se destaca como intuitiva e
de fácil aprendizagem. Analise o código abaixo
que apresenta laços condicionais e instruções
de repetição.
for i in range(10):
if (i%2��0):
print(i)
Qual a saída esperada após a execução do
programa?
Serão impressos no console os
números ímpares entre 0 e 9.
Serão impressos no console os
números ímpares entre 0 e 10.
Serão impressos no console os
números pares entre 1 e 10.
Serão impressos no console os
números pares entre 0 e 9.
Serão impressos no console os
números racionais entre 0 e 9.
Parabéns, você selecionou a
alternativa correta. Confira o
Firefox https://estacio.saladeavaliacoes.com.br/exercicio/684639a3f464610f1c...
15 of 16 08/06/2025, 22:36
gabarito comentado!
O constructo de laço que itera sobre uma
sequência dos números reais de 0 a 9, e
cujo condicional dentro do laço escolhe
apenas os números cujo resto de sua
divisão por 2 seja 0, condição lógica que
define se um número é par ou não.
Firefox https://estacio.saladeavaliacoes.com.br/exercicio/684639a3f464610f1c...
16 of 16 08/06/2025, 22:36