Logo Passei Direto
Buscar

BIG DATA PYTHON - TEMA 05 ex01

User badge image
Daniel Moura

em

Ferramentas de estudo

Questões resolvidas

Luís planeja começar um projeto particular visando construir um módulo de análise de dados. Primeiramente, ele deseja começar por um módulo de coleta de dados. Para que ele possa obter um padrão organizado de criação de projeto, qual é a sequência desejável de passos que esperamos que Luís siga?
A Criar uma pasta para acomodar seu projeto; Levantar um virtualenv através do venv; Instalar as dependências com as quais ele quer trabalhar através do pip install; congelar as mesmas no requirements.txt através do pip freeze; criar uma pasta para o módulo de coleta e dentro dela criar um arquivo __init__.py em branco e outro para a lógica do módulo.
B Criar uma pasta para acomodar seu projeto; Instalar as dependências com as quais ele quer trabalhar através do pip install; congelar as mesmas no requirements.txt através do pip freeze; criar uma pasta para o módulo de coleta e dentro dela criar um arquivo __init__.py em branco e outro para a lógica do módulo.
C Criar uma pasta para acomodar seu projeto; Instalar as dependências com as quais ele quer trabalhar através do pip install; criar uma pasta para o módulo de coleta e dentro dela criar um arquivo __init__.py em branco e outro para a lógica do módulo.
D Criar uma pasta para acomodar seu projeto; Levantar um virtualenv através do venv; Instalar as dependências com as quais ele quer trabalhar através do pip install; congelar as mesmas no requirements.txt através do pip freeze; criar uma pasta para o módulo de coleta e dentro dela criar um para a lógica do módulo.
E Criar uma pasta para acomodar seu projeto; Levantar um virtualenv através do venv; Instalar as dependências com as quais ele quer trabalhar através do pip install; congelar as mesmas no requirements.txt através do pip freeze; criar uma pasta para o módulo de coleta e dentro dela criar um arquivo __init__.py com a lógica do módulo.

Dado que Felipe quer fazer a junção entre dois conjuntos de dados e escreveu o seguinte código: import pandas as pd df1 = pd.DataFrame({'lkey': ['foo', 'bar', 'baz', 'foo'], 'value': [1, 2, 3, 5]}) df2 = pd.DataFrame({'rkey': ['foo', 'bar', 'baz', 'foo'], 'value': [5, 6, 7, 8]}) df1.merge(df2, left_on='lkey', right_on='rkey') Qual destas alternativas descreve as saídas do código?
I ¿ O conjunto resultante terá colunas lkey, value_x, rkey, value_y II ¿ O código não executará, pois Filipe não definiu os sufixos de coluna III ¿ O resultado do código em questão retornará um pd.Series juntando os conjuntos pela lkey e rkey.

Material
páginas com resultados encontrados.
páginas com resultados encontrados.
left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Questões resolvidas

Luís planeja começar um projeto particular visando construir um módulo de análise de dados. Primeiramente, ele deseja começar por um módulo de coleta de dados. Para que ele possa obter um padrão organizado de criação de projeto, qual é a sequência desejável de passos que esperamos que Luís siga?
A Criar uma pasta para acomodar seu projeto; Levantar um virtualenv através do venv; Instalar as dependências com as quais ele quer trabalhar através do pip install; congelar as mesmas no requirements.txt através do pip freeze; criar uma pasta para o módulo de coleta e dentro dela criar um arquivo __init__.py em branco e outro para a lógica do módulo.
B Criar uma pasta para acomodar seu projeto; Instalar as dependências com as quais ele quer trabalhar através do pip install; congelar as mesmas no requirements.txt através do pip freeze; criar uma pasta para o módulo de coleta e dentro dela criar um arquivo __init__.py em branco e outro para a lógica do módulo.
C Criar uma pasta para acomodar seu projeto; Instalar as dependências com as quais ele quer trabalhar através do pip install; criar uma pasta para o módulo de coleta e dentro dela criar um arquivo __init__.py em branco e outro para a lógica do módulo.
D Criar uma pasta para acomodar seu projeto; Levantar um virtualenv através do venv; Instalar as dependências com as quais ele quer trabalhar através do pip install; congelar as mesmas no requirements.txt através do pip freeze; criar uma pasta para o módulo de coleta e dentro dela criar um para a lógica do módulo.
E Criar uma pasta para acomodar seu projeto; Levantar um virtualenv através do venv; Instalar as dependências com as quais ele quer trabalhar através do pip install; congelar as mesmas no requirements.txt através do pip freeze; criar uma pasta para o módulo de coleta e dentro dela criar um arquivo __init__.py com a lógica do módulo.

Dado que Felipe quer fazer a junção entre dois conjuntos de dados e escreveu o seguinte código: import pandas as pd df1 = pd.DataFrame({'lkey': ['foo', 'bar', 'baz', 'foo'], 'value': [1, 2, 3, 5]}) df2 = pd.DataFrame({'rkey': ['foo', 'bar', 'baz', 'foo'], 'value': [5, 6, 7, 8]}) df1.merge(df2, left_on='lkey', right_on='rkey') Qual destas alternativas descreve as saídas do código?
I ¿ O conjunto resultante terá colunas lkey, value_x, rkey, value_y II ¿ O código não executará, pois Filipe não definiu os sufixos de coluna III ¿ O resultado do código em questão retornará um pd.Series juntando os conjuntos pela lkey e rkey.

Prévia do material em texto

Verifique o seu desempenho e continue
treinando! Você pode refazer o exercício
quantas vezes quiser.
A
B
C
D
1
Compreender a análise de dados em Python
é fundamental para o cientista de dados.
Qual o papel do sistema pip da linguagem
Python?
Gerenciador de Pacotes do Python.
Gerenciador de memória do Python.
Gerenciador de espaços virtuais do
Python.
Motor de Busca da IDE do Python.
Questão de 10
Corretas
Incorretas
Em branco
1 2 3 4 5
6 7 8 9 10
Análise De…
Firefox https://estacio.saladeavaliacoes.com.br/exercicio/684601fd2fca09715a7...
1 of 16 08/06/2025, 22:33
E
Biblioteca de Processamento de
Linguagem Natural.
Parabéns, você selecionou a
alternativa correta. Confira o
gabarito comentado!
O sistema pip desempenha um papel
crucial na linguagem Python, pois é
responsável pelo gerenciamento de
pacotes. Isso significa que ele permite a
instalação e o gerenciamento de pacotes
de software escritos em Python, que
podem ser importados e utilizados em
nossos programas. A instalação desses
pacotes é feita através do comando 'pip
install'. É importante esclarecer que o
gerenciamento de memória é uma função
do sistema operacional, e não do pip. Além
disso, o gerenciamento de espaços virtuais
é realizado pelo venv ou virtualenv, não
pelo pip. O motor de busca é uma
característica de uma IDE �Ambiente de
Desenvolvimento Integrado), e não está
relacionado com a linguagem de
programação em si. Por fim, o
processamento de linguagem natural é uma
função desempenhada por uma biblioteca
específica, e não tem relação com o
gerenciamento de pacotes.
Firefox https://estacio.saladeavaliacoes.com.br/exercicio/684601fd2fca09715a7...
2 of 16 08/06/2025, 22:33
A
B
C
D
E
2
Gabriel entrou recentemente em uma
empresa de gestão de fundos de
investimento. No seu primeiro dia de
trabalho, lhe é conferida a tarefa de buscar
os relatórios do pessoal da contabilidade
para fazer suas análises exploratórias. O
departamento de contabilidade extrai os
dados de seus relatórios de um SAP que
retorna valores brutos de compras,
quantidades de produtos etc. Então os
contadores organizam, por agregação,
informação relevante no relatório em
planilhas por eles desenvolvidos. Por
questões de acesso e segurança, Gabriel só
pode lidar com essas planilhas. Este tipo de
coleta feita por Gabriel e pelos Contadores é
respectivamente dos tipos:
Secundária; Primária.
Primária; Primária.
Secundária; Terciária.
Primária; Secundária.
Secundária; Secundária.
Opa! A alternativa correta é a letra
Firefox https://estacio.saladeavaliacoes.com.br/exercicio/684601fd2fca09715a7...
3 of 16 08/06/2025, 22:33
A
A. Confira o gabarito comentado!
A coleta de dados realizada por Gabriel é
classificada como secundária, pois ele está
utilizando informações já processadas e
organizadas pelos contadores, ou seja, ele
não está coletando os dados diretamente
da fonte original. Por outro lado, os
contadores estão realizando uma coleta
primária, pois eles extraem os dados
diretamente do SAP, que é a fonte original
das informações. Portanto, a alternativa
correta é a "A", que afirma que a coleta de
dados feita por Gabriel é secundária e a
dos contadores é primária.
3
Eduardo quer mostrar aos gestores da empresa
como as ações da carteira de investimentos
recomendada que ele e o time dele propuseram
estão valorizando e gerando muitos dividendos
aos clientes. Para isso, Eduardo construiu um
gráfico de ______, pois está lidando com dados
________ e quer mostrar o quão bem as
recomendações geradas por seu time estão
evoluindo.
Respectivamente a resposta que completa as
duas lacunas é:
Pizza; Categóricos
Firefox https://estacio.saladeavaliacoes.com.br/exercicio/684601fd2fca09715a7...
4 of 16 08/06/2025, 22:33
B
C
D
E
Linha; Numéricos
Linha; Temporais
Pizza; Numéricos
Linha; Categóricos
Opa! A alternativa correta é a letra
C. Confira o gabarito comentado!
O gráfico correto é o de linhas, pois os
dados são temporais, uma vez que Eduardo
quer mostrar cronologia para os acionistas
e o gráfico de linha representa muito bem
isto, e os dados em questão variam ao
longo de meses ou anos. Gráficos de pizza
não se aplicam a dados temporais. Os
dados não são simplesmente numéricos
pois, em essência, estamos lidando com a
cronologia, logo são dados temporais. O
tipo de dados em que números variam no
tempo não pode ser classificado como tipo
categórico.
4
No mundo de Big Data, temos dados os mais
Firefox https://estacio.saladeavaliacoes.com.br/exercicio/684601fd2fca09715a7...
5 of 16 08/06/2025, 22:33
A
B
C
D
E
variados possíveis, e sua classificação é
fundamental para um cientista de dados. As
notas que compõem o histórico escolar de um
aluno são classificadas como que tipo de
dados?
Numéricos
Temporais
Atemporais
Categóricos
Semi-Estruturados
Opa! A alternativa correta é a letra
D. Confira o gabarito comentado!
As notas que compõem o histórico escolar
de um aluno são classificadas como dados
categóricos. Isso ocorre porque, embora as
notas possam ser operadas por funções de
soma, média, entre outras, elas
representam um conceito ou proporção de
aprendizado de um aluno. Por exemplo,
uma nota 8 pode significar que o aluno
aprendeu 80% do conteúdo da matéria, ou
pode implicar na condição de apto ou
reprovado. Se não houvesse o contexto
Firefox https://estacio.saladeavaliacoes.com.br/exercicio/684601fd2fca09715a7...
6 of 16 08/06/2025, 22:33
A
B
C
D
implícito de categoria, o tipo numérico seria
o correto. Portanto, é importante ter
cuidado ao modelar nossos dados para
garantir que eles sejam classificados
corretamente.
5
A linguagem Python se destaca como intuitiva e
de fácil aprendizagem. Analise o código abaixo
que apresenta laços condicionais e instruções
de repetição.
for i in range(10):
    if (i%2��0):
        print(i)
Qual a saída esperada após a execução do
programa?
Serão impressos no console os
números ímpares entre 0 e 9.
Serão impressos no console os
números ímpares entre 0 e 10.
Serão impressos no console os
números pares entre 1 e 10.
Serão impressos no console os
números pares entre 0 e 9.
Firefox https://estacio.saladeavaliacoes.com.br/exercicio/684601fd2fca09715a7...
7 of 16 08/06/2025, 22:33
E
Serão impressos no console os
números racionais entre 0 e 9.
Opa! A alternativa correta é a letra
D. Confira o gabarito comentado!
O constructo de laço que itera sobre uma
sequência dos números reais de 0 a 9, e
cujo condicional dentro do laço escolhe
apenas os números cujo resto de sua
divisão por 2 seja 0, condição lógica que
define se um número é par ou não.
6
Luís planeja começar um projeto particular
visando construir um módulo de análise de
dados. Primeiramente, ele deseja começar por
um módulo de coleta de dados. Para que ele
possa obter um padrão organizado de criação
de projeto, qual é a sequência desejável de
passos que esperamos que Luís siga?
Firefox https://estacio.saladeavaliacoes.com.br/exercicio/684601fd2fca09715a7...
8 of 16 08/06/2025, 22:33
A
B
C
Criar uma pasta para acomodar seu
projeto; Levantar um virtualenv através
do venv; Instalar as dependências com
as quais ele quer trabalhar através do
pip install; congelar as mesmas no
requirements.txt através do pip freeze;
criar uma pasta para o módulo de
coleta e dentro dela criar um arquivo
__init__.py em branco e outro para a
lógica do módulo.
Criar uma pasta para acomodar seu
projeto; Instalar as dependências com
as quais ele quer trabalhar através do
pip install; congelar as mesmas no
requirements.txt através do pip freeze;
criar uma pasta para o módulo de
coleta e dentro dela criar um arquivo
__init__.py em branco e outro para a
lógica do módulo.
Criar uma pasta para acomodar seu
projeto; Instalar as dependências com
as quais ele quer trabalhar através do
pip install; criar uma pasta para o
módulo de coleta e dentro dela criar
um arquivo __init__.py em branco e
outro para a lógica do módulo.
Firefox https://estacio.saladeavaliacoes.com.br/exercicio/684601fd2fca09715a7...9 of 16 08/06/2025, 22:33
D
E
Criar uma pasta para acomodar seu
projeto; Levantar um virtualenv através
do venv; Instalar as dependências com
as quais ele quer trabalhar através do
pip install; congelar as mesmas no
requirements.txt através do pip freeze;
criar uma pasta para o módulo de
coleta e dentro dela criar um para a
lógica do módulo.
Criar uma pasta para acomodar seu
projeto; Levantar um virtualenv através
do venv; Instalar as dependências com
as quais ele quer trabalhar através do
pip install; congelar as mesmas no
requirements.txt através do pip freeze;
criar uma pasta para o módulo de
coleta e dentro dela criar um arquivo
__init__.py com a lógica do módulo.
Opa! A alternativa correta é a letra
A. Confira o gabarito comentado!
A sequência correta de passos para a
criação de um projeto de análise de dados,
como o que Luís pretende iniciar, envolve:
criar uma pasta para acomodar o projeto;
levantar um ambiente virtual através do
venv; instalar as dependências necessárias
para o projeto utilizando o pip install;
registrar essas dependências no arquivo
requirements.txt através do pip freeze; criar
uma pasta específica para o módulo de
coleta de dados e, dentro dela, criar um
Firefox https://estacio.saladeavaliacoes.com.br/exercicio/684601fd2fca09715a7...
10 of 16 08/06/2025, 22:33
A
B
C
D
E
arquivo __init__.py em branco e outro
arquivo para a lógica do módulo. As
alternativas que não descrevem todos
esses passos estão incompletas ou
apresentam a sequência de passos em uma
ordem incorreta.
7
Bibliotecas poderosas de análise e manipulação
de dados podem ser utilizadas com a linguagem
Python. Qual o método utilizado para fazer a
junção entre DataFrames no pandas?
set_index
reset_index
values
merge
sum
Parabéns, você selecionou a
alternativa correta. Confira o
gabarito comentado!
Firefox https://estacio.saladeavaliacoes.com.br/exercicio/684601fd2fca09715a7...
11 of 16 08/06/2025, 22:33
A
B
C
O método 'merge' é a opção correta para
realizar a junção entre DataFrames no
pandas. Este método é similar ao 'join' da
linguagem SQL, que une dois DataFrames a
partir de índices de mesmo nome ou
índices pré-definidos pelo cientista de
dados. As demais alternativas
apresentadas na questão, como 'set_index',
'reset_index', 'values' e 'sum', não são
utilizadas para a operação de junção entre
DataFrames.
8
A função de agrupamento do Pandas é o
groupby, responsável por influenciar a
indexação das colunas. O que acontece ao
aplicarmos o método reset_index() no resultado
de uma agregação?
Nada, o DataFrame fica imutável.
Os índices não são deletados, evitando
a perda de colunas no DataFrame da
agregação.
As colunas de agrupamento somem, e
o DataFrame passa a ser indexado
pelo número da linha.
Firefox https://estacio.saladeavaliacoes.com.br/exercicio/684601fd2fca09715a7...
12 of 16 08/06/2025, 22:33
D
E
A
O DataFrame é indexado pelas suas
colunas.
O DataFrame é embaralhado.
Opa! A alternativa correta é a letra
B. Confira o gabarito comentado!
Quando utilizamos a função groupby do
Pandas, o DataFrame é reindexado com
base nos grupos de colunas escolhidos.
Assim, o índice das agregações passa a ser
o agrupamento. Ao aplicarmos o método
reset_index() após a agregação, os índices
originais das colunas são mantidos,
evitando a perda de colunas no DataFrame
da agregação. Portanto, a alternativa B está
correta, pois afirma que os índices não são
deletados, preservando as colunas
originais do DataFrame.
9
Para a regularização dos dados obtidos, qual
técnica podemos utilizar objetivando fazer com
que os dados fiquem na mesma escala?
Map & Reduce
Firefox https://estacio.saladeavaliacoes.com.br/exercicio/684601fd2fca09715a7...
13 of 16 08/06/2025, 22:33
B
C
D
E
Divide
Shuffle
MinMax
Splice
Opa! A alternativa correta é a letra
D. Confira o gabarito comentado!
A técnica correta para a regularização dos
dados, com o objetivo de colocá-los na
mesma escala, é a MinMax. Essa técnica é
utilizada para transformar os dados, de
forma que eles se enquadrem em uma
escala específica, geralmente de 0 a 1. Isso
é feito através da extração da proporção do
dado observado em relação ao valor
mínimo possível até o valor máximo. Dessa
forma, todos os dados são enquadrados
nessa escala, realizando a regularização.
As outras opções apresentadas, como Map
& Reduce, Divide, Shuffle e Splice, não são
técnicas utilizadas para essa finalidade.
10
Firefox https://estacio.saladeavaliacoes.com.br/exercicio/684601fd2fca09715a7...
14 of 16 08/06/2025, 22:33
A
B
C
D
E
Dado que Felipe quer fazer a junção entre dois
conjuntos de dados e escreveu o seguinte
código:
import pandas as pd
df1 = pd.DataFrame({'lkey': ['foo', 'bar', 'baz',
'foo'], 'value': �1, 2, 3, 5���
df2 = pd.DataFrame({'rkey': ['foo', 'bar', 'baz',
'foo'], 'value': �5, 6, 7, 8���
df1.merge(df2, left_on='lkey', right_on='rkey')
Qual destas alternativas descreve as saídas do
código?
I��O conjunto resultante terá colunas lkey,
value_x, rkey, value_y
II��O código não executará, pois Filipe não
definiu os sufixos de coluna
III��O resultado do código em questão
retornará um pd.Series juntando os conjuntos
pela lkey e rkey.
Apenas a opção I está correta.
Apenas a opção II está correta.
Apenas a opção III está correta.
Apenas as opções II e III estão
corretas.
Apenas as opções I e III estão
corretas.
Firefox https://estacio.saladeavaliacoes.com.br/exercicio/684601fd2fca09715a7...
15 of 16 08/06/2025, 22:33
Opa! A alternativa correta é a letra
A. Confira o gabarito comentado!
A afirmativa I está corretíssima uma vez
que o resultado terá as colunas chaves e as
colunas valores acrescidas dos sufixos
padrões, porquanto não há declaração
explícita. A afirmativa II é incorreta, por
mais que seja uma boa prática definir os
nomes dos sufixos de suas junções, não
sendo impeditivo à biblioteca executar a
junção sem elas. A afirmativa III é incorreta,
pois o resultado de uma junção é um
pd.DataFrame, uma vez que estamos
falando de operações fechadas assim
como a álgebra que rege o bom
funcionamento de um sistema, i.e., como a
entrada é de DataFrames, a saída
obrigatoriamente também tem que ser de
DataFrames.
Firefox https://estacio.saladeavaliacoes.com.br/exercicio/684601fd2fca09715a7...
16 of 16 08/06/2025, 22:33

Mais conteúdos dessa disciplina