Prévia do material em texto
<p>Impresso por Marciano Matias, E-mail mmatiasdsant@gmail.com para uso pessoal e privado. Este material pode ser protegido por</p><p>direitos autorais e não pode ser reproduzido ou repassado para terceiros. 26/08/2024, 17:30:27</p><p>Questão 1</p><p>Correto</p><p>Atingiu 1,00 de 1,00</p><p>Marcar questão</p><p>Texto da questão</p><p>UMA GRANDE EMPRESA DE VAREJO QUER CRIAR UM PROJETO DE BIG DATA PARA</p><p>ANALISAR O SENTIMENTO DE SEUS CLIENTES COM RELAÇÃO A MARCA. PARA TAL</p><p>A EMPRESA COLETOU POSTAGENS DO TWITTER E FACEBOOK. ALÉM DE MILHARES</p><p>DE FORMULÁRIOS ONLINE, TIPO GOOGLE FORMS, DE PESQUISA DE SATISFAÇÃO.</p><p>QUAL A MELHOR SOLUÇÃO DE ARMAZENAMENTO PARA FACILITAR A ANÁLISE E</p><p>PROCESSAMENTO DOS DADOS?</p><p>Escolha uma opção:</p><p>a. NENHUMA DAS OUTRAS ALTERNATIVAS</p><p>b. SISTEMA DE ARQUIVOS FAT</p><p>c. SISTEMA DE BANCO DE DADOS RELACIONAIS</p><p>d. SISTEMA DE ARQUIVOS HDFS</p><p>e. SISTEMA DE ARQUIVOS NFTS</p><p>Feedback</p><p>Sua resposta está correta.</p><p>A MELHOR FORMA DE ARMAZENAMENTO DE DIVERSOS DADOS DE FORMATOS</p><p>DIFERENTES É O SISTEMA DE ARQUIVOS HDFS DO APACHE HADOOP.</p><p>A resposta correta é: SISTEMA DE ARQUIVOS HDFS</p><p>Questão 2</p><p>Correto</p><p>Atingiu 1,00 de 1,00</p><p>Remover marcação</p><p>Texto da questão</p><p>AO UTILIZAR O ALGORITMO K-MEANS O DESENVOLVEDOR ATRIBUI UM VALOR AO</p><p>PARÂMETRO N_CLUSTERS, CONHECIDO COMO PARÂMETRO K.</p><p>DE ACORDO COM O GRÁFICO ABAIXO, QUAL A QUANTIDADE DE CLUSTERS IDEAL?</p><p>Escolha uma opção:</p><p>Impresso por Marciano Matias, E-mail mmatiasdsant@gmail.com para uso pessoal e privado. Este material pode ser protegido por</p><p>direitos autorais e não pode ser reproduzido ou repassado para terceiros. 26/08/2024, 17:30:27</p><p>a. N_CLUSTERS = 1</p><p>b. N_CLUSTERS = 3</p><p>c. N_CLUSTERS = 4</p><p>d. N_CLUSTERS = 5</p><p>e. N_CLUSTERS = 2</p><p>Feedback</p><p>Sua resposta está correta.</p><p>A ÚLTIMA MUDANÇA BRUSCA NO GRÁFICO OCORRE PARA O VALOR K = 3,</p><p>PORTANTO, A QUANTIDADE IDEAL DE CLUSTERS PARA O PROBLEMA PROPOSTO É</p><p>DE N_CLUSTERS = 3.</p><p>A resposta correta é: N_CLUSTERS = 3</p><p>Questão 3</p><p>Incorreto</p><p>Atingiu 0,00 de 1,00</p><p>Marcar questão</p><p>Texto da questão</p><p>UM PROJETO DE BIG DATA NECESSITA IDENTIFICAR IDADE DE PESSOAS BASEADO</p><p>EM SUAS FOTOGRAFIAS. ALGUMAS IMAGENS POSSUEM O NOME DA PESSOA E</p><p>SUA IDADE NO MOMENTO DA FOTO. OUTRAS IMAGENS POSSUEM O NOME DA</p><p>PESSOA, MAS A IDADE REGISTRADA É A ATUAL.</p><p>QUAL TIPO DE APRENDIZADO DE MÁQUINA IDEAL PARA O CASO RELATADO NO</p><p>ENUNCIADO?</p><p>Escolha uma opção:</p><p>a. APRENDIZADO SEMI-SUPERVISIONADO</p><p>b. APRENDIZADO POR REFORÇO</p><p>c. APRENDIZADO NÃO SUPERVISIONADO</p><p>d. NENHUMA DAS OUTRAS ALTERNATIVAS</p><p>e. APRENDIZADO SUPERVISIONADO</p><p>Feedback</p><p>Sua resposta está incorreta.</p><p>DE ACORDO COM O PROBLEMA APRESENTADO NO ENUNCIADO O APRENDIZADO</p><p>QUE TRARÁ MELHORES RESULTADOS É O APRENDIZADO SEMI-SUPERVISIONADO</p><p>A resposta correta é: APRENDIZADO SEMI-SUPERVISIONADO</p><p>Questão 4</p><p>Incorreto</p><p>Impresso por Marciano Matias, E-mail mmatiasdsant@gmail.com para uso pessoal e privado. Este material pode ser protegido por</p><p>direitos autorais e não pode ser reproduzido ou repassado para terceiros. 26/08/2024, 17:30:27</p><p>Atingiu 0,00 de 1,00</p><p>Remover marcação</p><p>Texto da questão</p><p>COM BASE NO DATASET ABAIXO, CALCULE: MODA DA VARIÁVEL “Dist. Praia (m)”</p><p>Escolha uma opção:</p><p>a. NENHUM DOS VALORES ESTÁ CORRETO</p><p>b. MODA = 245,57</p><p>c. MODA = 600,00</p><p>d. MODA = 550,00</p><p>e. MODA = 415,00</p><p>Feedback</p><p>Sua resposta está incorreta.</p><p>A MODA DA VARIÁVEL “Dist. Praia (m)” É IGUAL À 600,00</p><p>A resposta correta é: MODA = 600,00</p><p>Questão 5</p><p>Correto</p><p>Atingiu 1,00 de 1,00</p><p>Marcar questão</p><p>Texto da questão</p><p>O QUE OCORRE QUANDO UM NÓ POSSUI ENTROPIA IGUAL À ZERO?</p><p>Escolha uma opção:</p><p>a. DEVERÁ DIVIDIR O NÓ UTILIZANDO DIFERENTES ATRIBUTOS</p><p>b. DEVERÁ SER CALCULADO O GANHO PARA ESCOLHA DO NÓ DE DECISÃO</p><p>c. NENHUMA DAS OUTRAS ALTERNATIVAS</p><p>d. A AMOSTRA É COMPLETAMENTE HETEROGÊNEA</p><p>e. ELE SE TORNARÁ UM NÓ FOLHA</p><p>Feedback</p><p>Sua resposta está correta.</p><p>UM NÓ QUE POSSUI ENTROPIA ZERO É TOTALMENTE HOMOGÊNEO, OU SEJA, NÃO</p><p>HÁ MAIS DECISÕES A SEREM FEITAS, PORTANTO ELE SE TORNARÁ UM NÓ FOLHA.</p><p>Impresso por Marciano Matias, E-mail mmatiasdsant@gmail.com para uso pessoal e privado. Este material pode ser protegido por</p><p>direitos autorais e não pode ser reproduzido ou repassado para terceiros. 26/08/2024, 17:30:27</p><p>A resposta correta é: ELE SE TORNARÁ UM NÓ FOLHA</p><p>Questão 6</p><p>Correto</p><p>Atingiu 1,00 de 1,00</p><p>Marcar questão</p><p>Texto da questão</p><p>QUAIS SÃO AS ETAPAS DE APRENDIZADO DE MÁQUINA?</p><p>Escolha uma opção:</p><p>a. OBTENÇÃO DOS DADOS; LIMPEZA E ADEQUAÇÃO DOS DADOS; TREINAMENTO</p><p>DO MODELO; TESTE; AJUSTE E REFINAMENTO;</p><p>b. NENHUMA DAS OUTRAS ALTERNATIVAS</p><p>c. PRIVACIDADE; INTEGRAÇÃO; QUALIDADE; DIREITOS AUTORAIS; DISSEMINAÇÃO;</p><p>PRESERVAÇÃO;</p><p>d. COLETA; ARMAZENAMENTO; RECUPERAÇÃO; DESCARTE;</p><p>e. SELEÇÃO; PRÉ-PROCESSAMENTO; FORMATAÇÃO; MINERAÇÃO DE DADOS;</p><p>INTERPRETAÇÃO E AVALIAÇÃO;</p><p>Feedback</p><p>Sua resposta está correta.</p><p>AS ETAPAS DE APRENDIZADO DE MÁQUINA SÃO: OBTENÇÃO DOS DADOS; LIMPEZA</p><p>E ADEQUAÇÃO DOS DADOS; TREINAMENTO DO MODELO; TESTE; AJUSTE E</p><p>REFINAMENTO;</p><p>A resposta correta é: OBTENÇÃO DOS DADOS; LIMPEZA E ADEQUAÇÃO DOS DADOS;</p><p>TREINAMENTO DO MODELO; TESTE; AJUSTE E REFINAMENTO;</p><p>Questão 7</p><p>Completo</p><p>Vale 2,00 ponto(s).</p><p>Marcar questão</p><p>Texto da questão</p><p>A BIBLIOTECA SKLEARN POSSUI VÁRIOS MÉTODOS DE APRENDIZADOS DE</p><p>MÁQUINA, INCLUINDO A ÁRVORE DE DECISÃO. PARA SE MEDIR A ACURÁCIA DOS</p><p>RESULTADOS OBTIDOS PODE-SE UTILIZAR AS TÉCNICAS HOLD-OUT OU</p><p>CROSS-VALIDATION. QUAL A DIFERENÇA ENTRE OS MÉTODOS DE VERIFICAÇÃO</p><p>DE ASSERTIVIDADE? JUSTIFIQUE SUA RESPOSTA.</p><p>A diferença entre hold-out e cross-validation como técnicas de verificação da assertividade</p><p>em modelos de aprendizado de máquina está na forma como os dados são divididos em</p><p>conjuntos de treinamento e teste.</p><p>Impresso por Marciano Matias, E-mail mmatiasdsant@gmail.com para uso pessoal e privado. Este material pode ser protegido por</p><p>direitos autorais e não pode ser reproduzido ou repassado para terceiros. 26/08/2024, 17:30:27</p><p>O hold-out divide os dados em um conjunto de treinamento e um conjunto de teste,</p><p>geralmente com proporções de 70/30 ou 80/20. Já o cross-validation divide os dados em</p><p>vários conjuntos de treinamento e teste, executando o treinamento e a validação várias</p><p>vezes em cada conjunto de teste diferente, gerando resultados mais robustos e reduzindo o</p><p>efeito de aleatoriedade na divisão dos dados.</p><p>O hold-out é mais simples e rápido de executar, mas pode gerar resultados menos precisos</p><p>em modelos com poucos dados. O cross-validation é mais demorado, mas fornece uma</p><p>validação mais precisa, especialmente em modelos com muitos dados.</p><p>Feedback</p><p>O MÉTODO HOLD-OUT EXECUTA UM SPLIT NO DATASET DEIXANDO DE FORA UMA</p><p>PARTE DOS DADOS, GERALMENTE DIVIDE-SE EM 80-20, ESSES DADOS NÃO FAZEM</p><p>PARTE DO TREINAMENTO, LOGO O MODELO SERÁ TESTADO COMO SE FOSSEM</p><p>DADOS NOVOS.</p><p>JÁ O MÉTODO CROSS-VALIDATION FARÁ UM TESTE UTILIZANDO TODO O DATASET</p><p>DE DADOS. ENTRETANTO, A CADA LOOP DE INTERAÇÃO DE TREINAMENTO PARTE</p><p>DO DATASET FICARÁ DE FORA, E ESTE SERVIRÁ DE BASE DE TESTES. ISSO É</p><p>FEITO ATÉ QUE TODO O DATASET SEJA PERCORRIDO. NO FINAL O</p><p>CROSS-VALIDATION TRARÁ UMA ASSERTIVIDADE MÉDIA DO MODELO.</p><p>Questão 8</p><p>Completo</p><p>Vale 2,00 ponto(s).</p><p>Marcar questão</p><p>Texto da questão</p><p>EM UM PROJETO DE MONITORAMENTO DE PLANTAÇÕES 02 SENSORES,</p><p>TEMPERATURA E RAIOS-UV, COLETAVAM DADOS A CADA 15 MINUTOS DAS</p><p>CONDIÇÕES METEOROLÓGICAS. ESSES DADOS SERIAM ANALISADOS</p><p>POSTERIORMENTE PARA AVERIGUAR AS CONDIÇÕES IDEAIS PARA PLANTAÇÃO DE</p><p>SOJA.</p><p>ENTRETANTO, POR UM ERRO TÉCNICO, OS SENSORES FORAM INSTALADOS EM</p><p>UM LOCAL ONDE OS DADOS SOFRIAM INTERFERÊNCIAS EXTERNAS, ONDE PARTE</p><p>DOS DADOS SERIAM COMPROMETIDOS.</p><p>QUAL DOS 5 V’s DO BIG DATA FOI IMPACTADO NESSE CASO? JUSTIFIQUE SUA</p><p>RESPOSTA.</p><p>O V afetado nesse caso é o da Veracidade (ou Validade), que se refere à qualidade dos</p><p>dados e sua capacidade de representar a realidade de forma precisa e confiável. Devido às</p><p>Impresso por Marciano Matias, E-mail mmatiasdsant@gmail.com para uso pessoal e privado. Este material pode ser protegido por</p><p>direitos autorais e não pode ser reproduzido ou repassado para terceiros. 26/08/2024, 17:30:27</p><p>interferências externas, os dados coletados pelos sensores não são totalmente precisos e</p><p>confiáveis, comprometendo a veracidade dos dados. Isso pode levar</p><p>a análises incorretas e</p><p>a tomada de decisões inadequadas com base nesses dados. Portanto, é importante garantir</p><p>a qualidade e a veracidade dos dados coletados para evitar erros e prejuízos.</p><p>Feedback</p><p>A PRINCIPAL CARACTERÍSTICA DO BIG DATA IMPACTADA FOI A VERACIDADE, POIS</p><p>ESTA TRATA DA QUALIDADE DO DADO, PARA QUE SE POSSA GERAR</p><p>INFORMAÇÕES CONFIÁVEIS PARA SUPORTAR A TOMADA DE DECISÃO.</p><p>NESSE CASO A QUALIDADE DOS DADOS FOI COMPROMETIDA, POIS ESTES</p><p>POSSUEM ERROS E NÃO REPRESENTAM A REALIDADE, PODEM LEVAR A</p><p>CONCLUSÕES ENVIEZADAS.</p>