Prévia do material em texto
Disciplina
Pensamento Analítico e Análise
de Dados
Unidade 1
Pensamento Analítico para Tomada de Decisão
Aula 1
Introdução ao pensamento analítico e à tomada de decisão
Introdução
Olá, estudante!
Nesta aula você verá a lógica aristotélica, a qual corresponde a uma teoria clássica que esclarece
como o raciocínio humano é formulado. A partir de noções preliminares, Aristóteles re�etia em
como chegar a determinadas conclusões com relação a um assunto especí�co, sem que
houvesse dúvida ou incerteza. Silogismo, teoria da inferência criada por Aristóteles, é um tipo
especí�co de argumento em que a conclusão segue necessariamente duas premissas.
Nesta aula, você irá conhecer a função da lógica analítica (aristotélica), sua importância e seu
desenvolvimento desde a Antiguidade. A aula inicia com uma breve contextualização histórica a
respeito do surgimento, da estrutura e da fundamentação, serão discutidos os quatro tipos
Disciplina
Pensamento Analítico e Análise
de Dados
básicos de proposições categóricas, em seguida serão apresentadas as habilidades
matemáticas, tais como diagramas em lógica e as habilidades estatísticas para auxiliar nas
tomadas de decisão, bem como resolução de problemas.
Então, vamos lá?
Fundamentos da lógica e do raciocínio
Lógica aristotélica
A lógica aristotélica é o estudo da lógica baseada na obra do �lósofo grego Aristóteles (384-322
a.C.), o primeiro pensador a formalizar o sistema lógico de tal forma que suas propostas
transcenderam até os dias atuais. Aristóteles apresentou suas ideias em diversas obras,
posteriormente reunidas sob o nome de Órganon, para difundir seu conhecimento sobre as leis
do raciocínio, argumentando que estas eram vitais para ingressar no mundo da �loso�a. As seis
obras que compõem o Órganon são: Categorias; Da Interpretação; Primeiros Analíticos;
Segundos Analíticos; Tópicos; Refutações Sofísticas (Barbosa, 2017).
Proposição categórica
Na lógica, uma proposição categórica é uma sentença que a�rma ou nega que todos ou alguns
dos membros de uma categoria estão incluídos em outra. O conceito de proposição é o alicerce
Disciplina
Pensamento Analítico e Análise
de Dados
da lógica aristotélica. Observe a seguir os quatro tipos básicos de proposições categóricas
(Barbosa, 2017).
A�rmação universal: todo médico é doutor.
Negação universal: nenhum médico é doutor.
A�rmação particular: algum médico é doutor.
Negação particular: algum médico não é doutor.
Silogismo aristotélico
Na lógica aristotélica, trabalhamos com os silogismos, os quais são constituídos por duas
premissas e uma conclusão. A palavra “silogismo” vem do grego e signi�ca reunião, interconexão
de palavras. Os silogismos aristotélicos, as premissas e a conclusão são proposições
categóricas em um dos quatro tipos vistos anteriormente (Costa, 2020).
Um silogismo aristotélico envolve dois termos, um sujeito e um predicado. As duas premissas
não podem ser totalmente desconexas, precisam apresentar um elemento (sujeito ou predicado)
em comum. A esse elemento dá-se o nome de termo médio.
Silogismo é o estudo da validade ou invalidade de argumentos relacionados por premissas das
quais se tira uma conclusão. A validade do silogismo está relacionada à forma e não se a
premissa é verdadeira ou falsa. É o que permite distinguir argumentos bem construídos,
formalmente válidos daqueles falaciosos, ainda que sua aparência induza a enganos (Costa,
2020).
Vejamos alguns exemplos.
Exemplo 1
Premissa 1: todo homem é mortal. (A�rmação universal)
Premissa 2: Sócrates é homem. (A�rmação particular)
Conclusão: Sócrates é mortal. (A�rmação particular)
O argumento é válido não porque a conclusão é verdadeira, mas por estar no modelo formal.
Exemplo 2
Premissa 1: Os sucos são feitos de água doce. (A�rmação universal)
Premissa 2: O lago é feito de água doce. (A�rmação universal)
Conclusão: O lago é um suco. (A�rmação universal)
Neste caso, estamos diante de uma falácia.
Diagramas em lógica, resolução de problemas e tomada de decisão
https://www.todamateria.com.br/falacia/
Disciplina
Pensamento Analítico e Análise
de Dados
Como algumas das regras elaboradas por Aristóteles não eram muito intuitivas, o uso de
diagramas simples relacionados com as proposições categóricas das quais tratou Aristóteles era
comum. A partir da análise desses diagramas, é possível avaliar a legitimidade de um
argumento.
Diagrama de Euler
Os diagramas de Euler são uma representação visual das relações entre uma série de elementos
(conjuntos). Em matemática, conjuntos representam coleções de objetos. Esses agrupamentos
ou “conjuntos” podem ser de qualquer categoria: pessoas, edifícios, carros, redes de
computadores ou qualquer outra coisa. O diagrama de Euler pode ser utilizado para veri�car, de
forma bem acessível, se um argumento é válido ou inválido (Costa, 2020).
Exemplo 1:
Argumento:
Todos os cariocas (C) são brasileiros (B).
Ana é carioca.
Logo, Ana (A) é brasileira.
Utilizando o diagrama de Euler (Figura 1):
Portanto, o argumento é válido.
Disciplina
Pensamento Analítico e Análise
de Dados
Figura 1 | Diagrama de Euler para o exemplo 1. Fonte: elaborada pela autora.
Exemplo 2:
Argumento:
Todos os cariocas (C) são brasileiros (B).
Maria (M) não é carioca.
Logo, Maria não é brasileira.
Utilizando o diagrama de Euler (Figura 2):
Portanto, o argumento é inválido.
Figura 2 | Diagrama de Euler para o exemplo 2. Fonte: elaborada pela autora.
Diagrama de Venn
John Venn aperfeiçoou os diagramas de Euler, representando conjuntos sempre por círculos
entrelaçados (Costa, 2020).
Disciplina
Pensamento Analítico e Análise
de Dados
Exemplo: uma pesquisa realizada entre 600 associados ao INSS apresentou que grande parte
dos entrevistados tinha convênio com duas empresas privadas de plano de saúde, A e B, de
acordo com a tabela a seguir:
Tabela 1 | Pesquisa com associados ao INSS. Fonte: elaborada pela autora.
Convênio com A Convênio com B Filiados somente ao INSS
430 160 60
Pergunta-se: quantos entrevistados responderam que eram �liados às empresas A e B?
Solução:
Resolvendo o problema utilizando o diagrama de Venn.
Cada convênio será representado por um conjunto (Figura 3).
Figura 3 | Diagrama de Venn. Fonte: elaborada pela autora.
Seja:
x número de elementos que pertencem apenas ao conjunto A (�liados somente à empresa A).
z número de elementos que pertencem apenas ao conjunto B (�liados somente à empresa B).
y número de elementos que pertencem a ambos os conjuntos (�liados às duas empresas).
Resolvendo o sistema de equações e levando em consideração que 60 pessoas são �liadas
somente ao INSS, não pertencendo a nenhum dos conjuntos, logo:
x + y = z = 540
x + y = 430
y + z = 160
Portanto: y = 50; x = 380 e z = 110
O número de pessoas entrevistadas que responderam que eram �liadas a ambas as empresas
corresponde a 50 pessoas.
Resolução de problemas e tomada de decisão
Uma organização se concentra na resolução de problemas e tomada de decisão. O termo
problema deve ser interpretado não como algo negativo ou uma situação difícil, e sim como uma
situação que apresenta alternativas ou caminhos a serem seguidos. Em um ambiente
corporativo, as resoluções dos problemas estão relacionadas aos procedimentos de situações
Disciplina
Pensamento Analítico e Análise
de Dados
que podem ser conhecidas ou desconhecidas. Temos então a classi�cação dos problemas,
segundo seu nível de estruturação e de acordo com os autores Rainer Júnior e Cegielski (2011).
Problema estruturado: um problema é considerado estruturado se a sua de�nição é bem
clara e se as etapas a serem cumpridas para a obtenção dos resultados desejados são
bem delineadas (RAINER JÚNIOR ; CEGIELSKI, 2011). Exemplo: incluem a emissão de uma
folha de pagamento e a execução do processo de faturamento.
Problemas não estruturados: manifestam-se em situações de natureza complexa e para as
quais não há uma sequência de passos de�nida a ser aplicada (Rainer, 2011). Exemplo:
criação de uma nova política de segurançaa nova fábrica falhar, a empresa perderá US$ 10 milhões. Benjamin estima
que a probabilidade de a nova planta operar satisfatoriamente é de 40%.
Disciplina
Pensamento Analítico e Análise
de Dados
Que decisão Benjamin Smith deve tomar?
Solução: Construindo a árvore de decisão (Figura 2), neste exemplo foi construída no Excel,
temos:
O valor esperado (VE) simbolizado pelo círculo é calculado multiplicando-se o resultado obtido
com a ocorrência do evento pela sua probabilidade de ocorrência, logo:
Opção 1: construir uma planta: VE1 = 0,4 . (20000000) + 0,6 . (-10000000) = 200000 = US$ 2
milhões
Opção 2: não construir uma planta (não fazer nada): VE2 = 0
No ponto de decisão todas as alternativas (construir ou não construir uma planta) são
comparadas com seus valores esperados (VEs), neste problema deve-se escolher a alternativa
que apresenta o maior valor de VE, que é a alternativa de construir uma nova planta. O valor
esperado dessa alternativa irá se encontrar no ponto de decisão (Figura 2).
Figura 2 | Árvore de decisão do exemplo 1. Fonte: elaborada pela autora.
Resposta: tomada de decisão é construir uma nova planta.
Exemplo 2: Uma fábrica atingiu plena capacidade. Agora, a empresa precisa construir uma
segunda fábrica, seja ela pequena ou grande, em algum lugar próximo. A demanda futura pode
ser alta ou baixa. A probabilidade de ser baixa é de 0,3. Se a demanda for baixa, a grande fábrica
terá um valor presente de US$ 5 milhões e a pequena fábrica terá um valor presente de US$ 8
milhões. Se a demanda for alta, a grande fábrica terá um valor presente de US$ 18 milhões e a
pequena fábrica terá um valor presente de apenas US$ 10 milhões. No entanto, a pequena
fábrica pode ser expandida mais tarde se a procura for elevada, para atingir um valor atualizado
de US$ 14 milhões.
a. Construa uma árvore de decisão para este problema.
b. O que a administração deve fazer para obter o maior lucro esperado?
Solução:
Obs.: com relação à opção planta pequena, o valor 14000000 foi escolhido como resultado se
houver demanda alta, por ser maior do que o valor 1000000.
Calculando o valor esperado para cada opção:
Disciplina
Pensamento Analítico e Análise
de Dados
Opção 1 planta grande: VE1 = 0,7 . 18000000 + 0,3 . 500000 = 14100000
Opção 2 planta pequena: VE2 = 0,7 . 14000000 + 0,3 . 8000000 = 12200000
Logo, neste problema deve-se escolher a alternativa que apresenta o maior valor de VE, que é a
alternativa de construir uma planta grande. O valor esperado dessa alternativa irá se encontrar no
ponto de decisão (Figura 3).
a. Construindo a árvore de decisão (Figura 3), foi utilizado o Excel:
Figura 3 | Árvore de decisão do exemplo 2. Fonte: elaborada pela autora.
b. Resposta: a tomada de decisão é construir uma planta grande.
Videoaula: Aplicações práticas do pensamento analítico e da tomada de
decisão
Este conteúdo é um vídeo!
Para assistir este conteúdo é necessário que você acesse o AVA pelo
computador ou pelo aplicativo. Você pode baixar os vídeos direto no aplicativo
para assistir mesmo sem conexão à internet.
Olá, estudante!
Disciplina
Pensamento Analítico e Análise
de Dados
Neste vídeo você verá exemplos de pensamento analítico na tomada de decisão, conceitos sobre
árvore de decisão, exemplo de seleção de opções, de avaliação de resultados e de identi�cação
de oportunidades.
No vídeo também você notará como elementos fundamentais da �loso�a e matemática são
essenciais para o processo de articulação correta de ferramentas modernas como as árvores de
decisão, e também como as árvores de decisão são aplicadas a exemplos práticos das áreas de
medicina e engenharia.
Então, vamos lá?
Saiba mais
Olá, estudante!
Para auxiliar o aprofundamento do aprendizado sobre conceitos aqui abordados, recomendo a
leitura do Capítulo 5 do livro a seguir:
Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações.
Bons estudos!
Referências
https://plataforma.bvirtual.com.br/Account/Login?redirectUrl=%2FLeitor%2FPublicacao%2F164477%2Fepub%2F0%3F%3Fcode%3Doetga8gg891OoUOiHcROdtn79cywYtrUjf0OQQl5Rqrfoce6HQoRHNWN6QJQKtMXhSd0zcG4YY7AwkS%2BDJDBsg%3D%3D
https://plataforma.bvirtual.com.br/Account/Login?redirectUrl=%2FLeitor%2FPublicacao%2F164477%2Fepub%2F0%3F%3Fcode%3Doetga8gg891OoUOiHcROdtn79cywYtrUjf0OQQl5Rqrfoce6HQoRHNWN6QJQKtMXhSd0zcG4YY7AwkS%2BDJDBsg%3D%3D
Disciplina
Pensamento Analítico e Análise
de Dados
BARBOSA, M. A. Introdução à lógica matemática para acadêmicos. Curitiba: InterSaberes, 2017.
CASTRO, D. G. F. L. N. D. Introdução à mineração de dados: conceitos básicos, algoritmos e
aplicações. São Paulo: Editora Saraiva, 2016. Disponível em: Minha Biblioteca.
COSTA, M. Filoso�a da lógica. Curitiba: InterSaberes, 2020.
MACHADO, N. J.; CUNHA, M. O. Lógica e linguagem cotidiana: verdade, coerência, comunicação,
argumentação. 4. ed. Belo Horizonte: Autêntica, 2019.
O’BRIEN, J.; MARAKAS, G. Administração de sistemas de informação. 15. ed. Porto Alegre:AMGH,
2013. E-book.
RAINER JÚNIOR, R. K.; CEGIELSKI, C. G. Introdução a sistemas de informação. 3. ed. Riode
Janeiro: Elsevier, 2011.
SOUSA, W. E. Raciocínio lógico-analítico: uma proposta de conteúdo e abordagem para o ensino
médio e para concursos públicos. 2019. Dissertação (Mestrado Pro�ssional) –Universidade
Federal de Goiás, Catalão, 2019. Disponível em:
http://repositorio.bc.ufg.br/tede/handle/tede/9479. Acesso em: 7 jun. 2021.
ZANONI, A. P.; BITENCOURT, L.; FARINA, E. A lógica aristotélica. Revista Pandora Brasil, n.75,
2016. Disponível em: http://revistapandorabrasil.com/revista_pandora/projetos_75/logica_2.pdf.
Acesso em: 7 jun. 2021.
Aula 5
Revisão da unidade
http://revistapandorabrasil.com/revista_pandora/projetos_75/logica_2.pdf
Disciplina
Pensamento Analítico e Análise
de Dados
Pensamento analítico para tomada de decisão
Olá, estudante!
Chegamos ao �m desta unidade, em que vimos os conceitos relacionados ao pensamento
analítico e à tomada de decisão.
Temos, em muitas situações, a tendência de sobrevalorizar ou subvalorizar prioridades e a
importância de cada fator de in�uência em um problema, devido às nossas próprias emoções ou
experiências anteriores. São nesses momentos em que as ferramentas de pensamento analítico
se tornam um importante aliado, para �ltrar questões relacionadas ao nosso desconhecimento
sobre o tema ou sobre variáveis que foram muito in�uenciadoras no passado, mas que perderam
força no presente e que não serão signi�cativas ou existentes no futuro.
Com relação aos tópicos que estudados destacamos:
Lógica aristotélica - onde houve a oportunidade de entender como os rudimentos da lógica
servem até hoje como primeiro passo para a de�nição de um problema e o encaminhamento de
sua solução.
Disciplina
Pensamento Analítico e Análise
de Dados
Proposição categórica - vimos que os alicerces da lógica aristotélica são formalizados por meio
dos quatro tipos básicos de proposições categóricas (Barbosa, 2017).
A�rmação universal: todo médico é doutor.
Negação universal: nenhum médico é doutor.
A�rmação particular: algum médico é doutor.
Negação particular: algum médico não é doutor.
Silogismo aristotélico - os silogismos são constituídos por duas premissas e uma conclusão.
(Costa, 2020). Um silogismo aristotélico envolve dois termos, um sujeito e um predicado. As
duas premissas não podem ser totalmente desconexas, precisam apresentar um elemento
(sujeito ou predicado) em comum. A esse elemento dá-se o nome de termo médio. Silogismo é o
estudo da validade ou invalidade de argumentos relacionados por premissas das quais se tira
uma conclusão. A validade do silogismo está relacionada à forma, e não se a premissa é
verdadeira ou falsa. É o que permite distinguir argumentos bem construídos, formalmente válidos
daqueles falaciosos, ainda que sua aparência induza a enganos (Costa, 2020).
Vejamos alguns exemplos.
Exemplo 1
Premissa 1: todo homem é mortal. (A�rmação universal)
Premissa 2: Sócrates é homem. (A�rmação particular)
Conclusão:Sócrates é mortal. (A�rmação particular)
O argumento é válido não porque a conclusão é verdadeira, mas por estar no modelo formal.
Exemplo 2
Premissa 1: Os sucos são feitos de água doce. (A�rmação universal)
Premissa 2: O lago é feito de água doce. (A�rmação universal)
Conclusão: O lago é um suco. (A�rmação universal)
Neste caso, estamos diante de uma falácia.
Habilidades em matemática e estatística para coletar, analisar e interpretar dados para tomada
de decisão
Estatística aplicada - a estatística compreende duas funções muito vastas. A primeira é a da
descrição, o resumo da informação de forma que possa ser melhor aproveitada. E a segunda é a
da indução, que consiste em formular generalizações sobre uma determinada população a partir
de uma amostra dela extraída (Castro, 2016). O campo da estatística é geralmente dividido em
duas grandes áreas, que são a Estatística Descritiva e a Estatística Inferencial. A estatística criou
uma base numérica e quantitativa para permitir que a lógica pudesse ser tratada em problemas
mais complexos. Se analisarmos o funcionamento dos computadores modernos, eles repetem
inúmeras vezes em seus programas funções lógicas e estatísticas.
Pensamento analítico - o diferencial desse tipo de pensamento é que ele divide o objeto de
estudo ou problema em partes menores que podem ser identi�cadas, categorizadas e
analisadas, a �m de obter uma resposta ou solução adequada ao que queremos resolver
(O’Brien; Marakas, 2013). Podemos sempre usá-lo para tomar decisões, resolver con�itos,
compreender um problema, etc. Com o pensamento analítico, a solução problemas tratados com
https://www.todamateria.com.br/falacia/
Disciplina
Pensamento Analítico e Análise
de Dados
a lógica e a estatística podem ser adaptadas ou replicadas a problemas análogos em outras
disciplinas, populações ou temas.
Análise de custo-benefício, sua utilização no processo de tomada de decisão - do ponto de vista
empresarial, um dos objetivos mais importantes a atingir é a rentabilidade, embora se reconheça
que existem outros tão relevantes como crescer, acrescentar valor à entidade e assim por diante.
Sem rentabilidade não é possível a permanência da empresa no médio e longo prazo. Para que
isso exista, as receitas devem ser maiores que as despesas, ou seja, as receitas de vendas
devem ser maiores que os custos (Alvarez, 2006). Todas as empresas ou os negócios têm hoje o
seu objetivo principal muito bem delineado, visando especi�camente aumentar o seu nível de
rentabilidade através da obtenção de lucros, pelo que concentram os seus esforços nas
diferentes estratégias que permitem alcançá-lo (Rainer Júnior; Cegielski, 2011).
Custo, volume e lucro - com relação às estratégias para a tomada de decisões administrativas,
podemos:
Fixar os preços de venda.
Comprar insumos ou fabricá-los.
Aumentar ou diminuir o mix de produção, etc.
Pensamento crítico – esse conceito pode ser de�nido como a capacidade de analisar qualquer
informação e construir a própria interpretação, com base em fatos ou dados veri�cados e
afastando-se de crenças infundadas (Rainer Júnior; Cegielski, 2011). Com o pensamento
cientí�co, a solução de problemas antes resolvidos apenas com lógica, estatística, e pensamento
analítico, podem ser adaptadas para novos problemas, abrindo caminho para a inovação de
produtos, processos e ciência em geral.
Análise e interpretação de informações complexas: inteligência de negócios (Business
Intelligence - BI) - o objetivo da inteligência de negócios é melhorar o desempenho geral e a
trajetória das empresas. Usando ferramentas tecnológicas durante essa metodologia, os
gestores podem interpretar o que aconteceu, por que aconteceu e o que precisa acontecer para
otimizar ainda mais suas operações. Quando as empresas utilizam Business Intelligence (BI)
para informar todas as suas decisões, podem adaptar-se rapidamente às mudanças no cenário
empresarial. A inteligência de negócios permite de�nir outras linhas de produtos, buscar novos
clientes por meio de planos de marketing direcionados e otimizar canais de vendas (Castro,
2016). A inteligência de negócios constitui a reunião de todas as ferramentas anteriores de
lógica, pensamentos analítico e crítico e estatística em projetos dedicados à melhoria contínua
ou focada de uma empresa em um determinado mercado de consumidores de seus produtos.
Árvore de decisão - uma ferramenta considerada excelente por empresas bem-sucedidas é a
árvore de decisão, a qual permite a análise de opções, avaliação de resultados e identi�cação de
oportunidades (Machado; Cunha, 2019). A árvore de decisão re�ete muito bem a evolução dos
programas de computador e sua capacidade de lidar com grandes quantidades de dados. É uma
ferramenta que representa visualmente todo o encadeamento lógico existente atualmente em
muitos programas e rotinas que acompanham por exemplo um processo ou mercado e auxilia na
tomada de decisão por parte dos analistas. A árvore de decisão (Figura 1) é um diagrama em
forma de árvore que mostra as probabilidades estatísticas ou determina um curso de ação.
Mostra aos analistas e aos decisores quais os passos que devem tomar e como as diferentes
escolhas podem afetar todo o processo. Tudo isso apoiado por dados.
Disciplina
Pensamento Analítico e Análise
de Dados
Figura 1 | Árvore de decisão. Fonte: elaborada pela autora.
Videoaula: Revisão da unidade
Este conteúdo é um vídeo!
Para assistir este conteúdo é necessário que você acesse o AVA pelo
computador ou pelo aplicativo. Você pode baixar os vídeos direto no aplicativo
para assistir mesmo sem conexão à internet.
Olá, estudante!
Neste vídeo, você verá os conceitos discutidos nesta Unidade, para ampliar a chance de �xar
todos os assuntos estudados. Serão abordados os conceitos de introdução ao pensamento
analítico; habilidades em matemática e estatística para coletar, analisar e interpretar dados para
tomada de decisão; análise de custo-benefício; introdução ao pensamento crítico; análise e
interpretação de informações complexas; conceitos de árvore de decisão.
Então, vamos lá?
Disciplina
Pensamento Analítico e Análise
de Dados
Estudo de caso
Olá, estudante!
Nosso estudo de caso consiste no seguinte enunciado: Willian tem um restaurante, o qual
apresenta problemas com relação à demanda em época de chuvas. Sua demanda sofre
in�uência com relação ao tempo (chover ou não chover). Analisando o movimento e aspectos do
seu restaurante, Willian já constatou que, mesmo em dias chuvosos, há chance de ter um bom
lucro, desde que haja no cardápio um tipo de cerveja gourmet, a qual o restaurante tem um custo
considerável com o fornecedor, assim como se houver cantores bem animados (que cobram
mais caro para cantar) no restaurante.
Willian adotou as seguintes estratégias:
1. Forte – Considerável disponibilidade de cerveja gourmet e cantores animados.
2. Rotineira – Disponibilidade média de cerveja gourmet e os mesmos cantores de sempre.
3. Cuidadosa – Disponibilidade média de cerveja gourmet e apenas um cantor.
Sabe-se que a chance de chover no próximo sábado é de 45%.
A estratégia forte gera um lucro de R$ 3.000 se não chover e uma perda de R$ 800 se
chover.
A estratégia rotineira gera um lucro de R$ 2.000 se não chover e um lucro de R$ 700 se
chover.
A estratégia cuidadosa gera um lucro de R$ 2.000 se não chover e um lucro de R$ 700 se
chover.
Disciplina
Pensamento Analítico e Análise
de Dados
Qual a melhor decisão Willian deve tomar?
Re�ita
Antes de partir diretamente para a resolução, re�ita sobre os seguintes pontos abaixo:
Você consegue perceber a importância em estrati�car as variáveis e condições do
problema para construir a árvore de decisão?
Você é capaz de de�nir onde serão inseridos os resultados esperados para cada cenário?
Você consegue inserir os resultados em seus respectivos cenários?
O processo de montagem da árvore de decisão não é simples, mas você notou nos
exemplos anteriores como a visualização do problema se modi�ca ou se simpli�ca, quandoa utilizamos?
Videoaula: Resolução do estudo de caso
Este conteúdo é um vídeo!
Para assistir este conteúdo é necessário que você acesse o AVA pelo
computador ou pelo aplicativo. Você pode baixar os vídeos direto no aplicativo
para assistir mesmo sem conexão à internet.
Construindo a árvore de decisão:
Para encontrar a solução desse problema, você deverá re�etir sobre os conceitos de árvore de
decisão e realizar os seguintes procedimentos:
Construir a árvore de decisão, partindo do nó de decisão – quadrado (raiz da árvore); em
seguida ramos do nó de decisão (alternativas de decisão); a seguir vem os nós de
probabilidade (círculos); seguindo os ramos dos nós de probabilidade (cenários com suas
respectivas probabilidades); e os terminais (triângulos), onde serão inseridos os resultados
esperados para cada cenário.
Inserir os resultados em seus respectivos cenários.
Calcular os valores esperados e inseri-los em seus respectivos nós de probabilidade.
Analisar a situação do problema e decidir, com base na análise dos valores esperados
calculados, qual valor esperado escolher.
O valor esperado escolhido deve ser inserido do nó de decisão e seu cenário será
interpretado como a decisão escolhida.
Disciplina
Pensamento Analítico e Análise
de Dados
Figura 2 | Árvore de decisão do estudo de caso. Fonte: elaborada pela autora.
Calculando os valores esperados para os nós de probabilidade (Figura 3) envolvendo os
resultados e suas respectivas probabilidades.
Disciplina
Pensamento Analítico e Análise
de Dados
Figura 3 | Árvore de decisão. Fonte: elaborada pela autora.
VE1 = 0,45 . (-800) + 0,55 . (3.000) = R$ 1.290
VE2 = 0,45 . (700) + 0,55 . (2.000) = R$ 1.415
VE3 = 0,45 . (1.000) + 0,55 . (1.500) = R$ 1.275
Aqui nesta resolução, o valor que deve ser escolhido é o maior valor esperado encontrado.
Logo, o valor esperado 2 (VE2) deve ser escolhido.
Portanto, Willian deve tomar a decisão de adotar a estratégia rotineira.
Resumo visual
Disciplina
Pensamento Analítico e Análise
de Dados
Figura 4 | Fluxograma. Fonte: elaborada pela autora.
Disciplina
Pensamento Analítico e Análise
de Dados
Referencia
ALVAREZ, M. E. B. Manual de organização, sistemas e métodos. São Paulo: Atlas, 2006.
BARBOSA, M. A. Introdução à lógica matemática para acadêmicos. Curitiba: InterSaberes, 2017.
CASTRO, D. G. F. L. N. D. Introdução à mineração de dados: conceitos básicos, algoritmos e
aplicações. São Paulo: Editora Saraiva, 2016. Disponível em: Minha Biblioteca.
COSTA, M. Filoso�a da lógica. Curitiba: InterSaberes, 2020.
MACHADO, N. J.; CUNHA, M. O. Lógica e linguagem cotidiana: verdade, coerência, comunicação,
argumentação. 4. ed. Belo Horizonte: Autêntica, 2019.
O’BRIEN, J.; MARAKAS, G. Administração de sistemas de informação. 15. ed. Porto Alegre:
AMGH, 2013. E-book.
RAINER JÚNIOR, R. K.; CEGIELSKI, C. G. Introdução a sistemas de informação. 3. ed. Rio de
Janeiro: Elsevier, 2011.
SOUSA, W. E. Raciocínio lógico-analítico: uma proposta de conteúdo e abordagem para o ensino
médio e para concursos públicos. 2019. Dissertação (Mestrado Pro�ssional) – Universidade
Federal de Goiás, Catalão, 2019. Disponível em:
http://repositorio.bc.ufg.br/tede/handle/tede/9479. Acesso em: 7 jun. 2021.
ZANONI, A. P.; BITENCOURT, L.; FARINA, E. A lógica aristotélica. Revista Pandora Brasil, n. 75,
2016. Disponível em: http://revistapandorabrasil.com/revista_pandora/projetos_75/logica_2.pdf.
Acesso em: 7 jun. 2021.
,
http://repositorio.bc.ufg.br/tede/handle/tede/9479
http://revistapandorabrasil.com/revista_pandora/projetos_75/logica_2.pdf
Disciplina
Pensamento Analítico e Análise
de Dados
Unidade 2
Pensamento Analítico na Pro�ssão de Engenheiro
Aula 1
Tomada de decisão com base na análise de risco em projetos de engenharia
Introdução
Caro estudante, a cada momento de nossas vidas, estamos constantemente nos deparando com
o imprevisto e o incerto. Essa constante torna-se ainda mais profunda no domínio da engenharia,
onde cada projeto é um convite para enfrentar e gerenciar o "risco".
Mas o que realmente signi�ca esse termo e como ele se diferencia da "incerteza"? E mais
crucialmente, como podemos efetivamente identi�car, compreender e até mesmo mitigar esses
riscos? Esta aula promete desvendar essas questões, armando você com ferramentas e técnicas
para lidar com desa�os de maneira mais holística.
Ao �nal desta jornada, você estará mais preparado para aplicar esses conceitos no seu cotidiano
pro�ssional, fazendo escolhas mais informadas e seguras. Está pronto para embarcar nesta
aventura e explorar mais sobre gestão de riscos?
Vamos lá!
Disciplina
Pensamento Analítico e Análise
de Dados
Entendendo risco
Olá, estudante!
A vida, em sua essência, é um mosaico de situações inesperadas e desa�os, uma constante
evolução que nos faz lidar com o desconhecido todos os dias. Essa característica intrínseca da
existência humana é acentuada ainda mais quando nos aprofundamos no mundo da engenharia.
A engenharia, com sua ampla gama de projetos e processos, exige uma abordagem meticulosa
para enfrentar essas incertezas.
A boa notícia é que, nesse campo, temos o privilégio de acessar uma variedade de metodologias
e ferramentas meticulosamente desenvolvidas para auxiliar nessa tarefa. É nesse cenário que
nos deparamos com o conceito crucial de "risco". No domínio da engenharia, quando falamos de
"risco", estamos nos referindo à dualidade entre a chance de um evento ocorrer e o consequente
efeito ou repercussão que esse evento pode trazer.
Ao se aprofundar nesse conceito, é comum questionar-se sobre as nuances entre “risco” e
“incerteza”. "Eles não são a mesma coisa?", você pode se perguntar. A resposta é um tanto
quanto interessante. Enquanto o risco pode ser entendido como algo que podemos prever ou ao
menos quanti�car com alguma precisão, a incerteza entra no jogo quando nos deparamos com
fatores totalmente imprevistos, aqueles que estão além de nossas capacidades preditivas.
Imagine, por um momento, um prédio erguido em uma área conhecida por sua atividade sísmica.
A possibilidade de um terremoto é um risco identi�cável, mas quando, com que magnitude e
quais seriam suas rami�cações exatas imergem no território da incerteza.
Disciplina
Pensamento Analítico e Análise
de Dados
Compreendendo a importância da identi�cação e gestão de riscos, como podemos, então,
equipar-nos para lidar com eles? Existem inúmeras técnicas a nossa disposição, com cada uma
delas oferecendo uma lente única para examinar potenciais riscos. O brainstorming, por exemplo,
é uma abordagem colaborativa onde um grupo discute e identi�ca possíveis riscos.
A técnica da entrevista é outra ferramenta valiosa. Ao conversar com especialistas ou indivíduos
que possuem experiência prática em determinada área, podemos descobrir nuances e
perspectivas que talvez não fossem evidentes à primeira vista. A análise documental é mais uma
ferramenta essencial, onde uma inspeção sistemática de documentos e registros passados pode
revelar tendências ou incidentes que podem se repetir no futuro.
Por �m, mas não menos importante, temos os checklists e questionários projetados
especi�camente para avaliação de riscos. Esses documentos, frequentemente baseados em
vastos estudos e experiências passadas, servem como bússolas, direcionando nossa atenção
para riscos comuns e recorrentes em contextos especí�cos. O valor dessas listas é inestimável.
Elas não apenas proporcionam uma metodologia mais organizada e sistemática, mas também
agem como um baluarte contra a possibilidade de se ignorar riscos que poderiam, de outra
forma, passar despercebidos. Ao recorrer a essas ferramentas, estamos fortalecendo nossa
capacidade de abordar a identi�cação e gestão de riscos de forma mais holística e rigorosa.
Análise e estratégias de mitigação de riscos
Disciplina
Pensamento Analítico e Análise
de Dados
O universo da gestão de riscos é intrincado e fascinante. À medida que nos aprofundamos nele,
percebemos a importância de cada fase para garantir a integridadee o sucesso dos projetos.
Depois de identi�car rigorosamente os riscos associados a uma iniciativa ou projeto, nos
encontramos diante do desa�o de compreendê-los a fundo, e é aqui que a análise se apresenta
como uma etapa de suma importância.
1. Métodos qualitativos: nessa abordagem, empregamos ferramentas e técnicas que não
necessariamente se baseiam em dados numéricos. Os riscos são avaliados com base em
critérios subjetivos, como sua gravidade e probabilidade. Um instrumento frequentemente
adotado é o diagrama de Ishikawa, ou diagrama de espinha de peixe, que proporciona uma
visualização clara das causas potenciais dos riscos, permitindo uma discussão
aprofundada sobre suas origens e interações.
2. Métodos quantitativos: aqui, a abordagem é mais estruturada e se concentra na
mensuração exata dos riscos. Através da quanti�cação numérica, obtemos uma
representação objetiva do risco em termos de sua probabilidade de ocorrência e impacto
potencial. A fórmula mais comum é:
A matriz de probabilidade e impacto é um instrumento vital nessa fase. É uma representação
grá�ca que facilita a categorização e priorização dos riscos, permitindo uma ação mais
direcionada. Ao mapear os riscos em relação à sua probabilidade e impacto, decisões
estratégicas podem ser tomadas com maior clareza.
A Análise de Monte Carlo, uma técnica estatística avançada, se destaca no campo quantitativo.
Baseada em múltiplas simulações, essa técnica nos proporciona uma visão panorâmica de
diversos cenários possíveis, elevando nossa capacidade de antecipação e preparação.
Com a análise em mãos, avançamos para a estratégia. O ato de mitigar riscos não é uma ciência
exata, mas é fortalecido por uma série de métodos e práticas. Estratégias comuns incluem:
Evitação: buscando erradicar o risco na fonte.
Transferência: passando a responsabilidade do risco, por exemplo, através da contratação
de um seguro.
Mitigação: adotando medidas para minimizar o impacto ou a probabilidade.
Aceitação: aceitando o risco e se preparando para suas consequências.
Os planos de contingência são um baluarte nesse processo. Como mapas de navegação em
águas turbulentas, eles nos guiam através de situações imprevistas, garantindo uma resposta
rápida e e�caz.
No coração de todas essas etapas está o desejo inabalável de proteger e promover nossos
empreendimentos. A gestão de riscos, com sua complexidade e profundidade, é uma ferramenta
essencial que nos permite enfrentar o futuro com con�ança, sabendo que estamos armados com
o conhecimento e as estratégias necessárias para superar os desa�os que encontrarmos. E à
medida que continuamos a aprimorar nossas habilidades e ferramentas nessa área, estamos, de
fato, pavimentando o caminho para um futuro mais seguro e promissor.
Riscos = Probabilidade x Impacto
Disciplina
Pensamento Analítico e Análise
de Dados
Sintetizando os conceitos
Bem-vindo novamente! Anteriormente, exploramos a intrincada rede do universo da gestão de
riscos. Agora, vamos alçar voo sobre um cenário prático, enraizando os conhecimentos
adquiridos no pulsante e imprevisível ambiente de trabalho.
Analisando o terreno: pense em si mesmo como um engenheiro-chefe em uma renomada
construtora. Recordando nossas discussões sobre riscos e incertezas, um terreno instável ou
propenso a inundações apresenta-se como um risco tangível e mensurável para a integridade do
projeto. Por outro lado, fatores como mudanças inesperadas na legislação de zoneamento ou
uma crise econômica são incertezas que pairam como nuvens no horizonte do projeto. A
capacidade de discernir entre essas variáveis e preparar-se para ambas é o que de�ne um
gerente de riscos competente.
Aplicando as ferramentas: no campo da construção, por exemplo, um planejamento meticuloso é
imperativo. Os brainstormings poderiam abranger não só engenheiros e arquitetos, mas também
urbanistas, geólogos e até ecologistas, dependendo da localização do projeto. Utilizando
ferramentas como o diagrama de Ishikawa, a equipe pode identi�car e categorizar riscos como
falhas estruturais, erosão do solo ou até mesmo protestos locais contra o projeto.
Mensurando impactos e tomando decisões: digamos que, no decorrer do projeto, surgem
notícias sobre uma greve iminente dos fornecedores de cimento. Essa situação representa um
risco claro de atrasos. Com a abordagem quantitativa, pode-se calcular o possível atraso, seus
Disciplina
Pensamento Analítico e Análise
de Dados
impactos �nanceiros e, assim, tomar medidas proativas – como estocar mais cimento antes da
greve ou buscar fornecedores alternativos.
Simulando futuros com Monte Carlo: em empresas que buscam expansão, especialmente no
competitivo mercado atual, a Análise de Monte Carlo é uma joia. Considerando uma empresa
lançando um inovador gadget tecnológico, esta ferramenta pode simular cenários desde vendas
estrondosas até rejeição do mercado, permitindo uma preparação holística.
Estratégias de mitigação em campo: usando o exemplo anterior da construtora, suponhamos que
um risco identi�cado seja a possibilidade de deslizamentos de terra durante a escavação. Aqui, a
mitigação poderia passar por avaliações geotécnicas do terreno, reforçando as barreiras e
promovendo treinamentos especí�cos para os trabalhadores.
Agindo com planos de contingência: pense numa grande empresa de eventos organizando um
festival de música ao ar livre. Diante do risco de chuvas intensas, o plano de contingência poderia
incluir desde tendas impermeáveis até locais alternativos previamente alugados, garantindo o
show mesmo sob tempestades.
A realidade é o verdadeiro teste de nossos conhecimentos. Ao entrelaçar a teoria com situações
práticas, não apenas solidi�camos nossa compreensão, mas também nos equipamos para o
sucesso. Continuar a re�nar essas habilidades e moldá-las de acordo com as exigências
especí�cas do projeto é o verdadeiro cerne de uma gestão de riscos e�ciente.
Videoaula: Tomada de decisão com base na análise de risco em projetos de
engenharia
Este conteúdo é um vídeo!
Para assistir este conteúdo é necessário que você acesse o AVA pelo
computador ou pelo aplicativo. Você pode baixar os vídeos direto no aplicativo
para assistir mesmo sem conexão à internet.
Olá, estudante! Preparado para embarcar em uma jornada profunda sobre a gestão de riscos na
engenharia? Neste vídeo, você mergulhará nos desa�os e nas ferramentas para identi�car e
gerenciar riscos, explorará estratégias de análise e mitigação e, �nalmente, verá como aplicar
tudo isso no ambiente de trabalho real. Conhecimento é poder e você está prestes a se armar
para um futuro mais seguro e promissor. Não perca!
Saiba mais
Disciplina
Pensamento Analítico e Análise
de Dados
Se você deseja se aprofundar ainda mais no universo da gestão de riscos e suas aplicações
práticas, temos uma indicação para ampliar sua visão sobre o tema. É uma oportunidade para
você explorar e entender as nuances que não apenas solidi�carão seu aprendizado, mas também
lhe oferecerão uma vantagem no mercado de trabalho.
Um bom exemplo da aplicação da Simulação de Monte Carlo, aplicada à Gestão de Projetos, está
descrito no artigo intitulado GERENCIAMENTO DE PROJETOS: SIMULAÇÃO DE MONTE CARLO
VIA A FERRAMENTA SIMULAR, escrito por Gilberto de Aguiar, Custodio da Cunha Alves e Elisa
Henning.
Essa fonte é apenas um ponto de partida. A gestão de riscos, como mencionado anteriormente, é
um campo vasto e em constante evolução. Portanto, manter-se atualizado e em busca contínua
de conhecimento será sua chave para a excelência pro�ssional. Boa leitura!
Referências
https://abepro.org.br/biblioteca/enegep2010_tn_sto_120_783_17492.pdf
https://abepro.org.br/biblioteca/enegep2010_tn_sto_120_783_17492.pdf
Disciplina
Pensamento Analítico e Análise
de Dados
ALMEIDA, C. H. Gestão de riscos em projetos de engenharia: um panorama atual. São Paulo:
Editora Engenharia & Saber, 2021.
BARBOSA, R. L.; SILVA, E. P. Desvendando a Análise de Monte Carlo: simulações para um futuro
incerto. Belo Horizonte: Publicações Inovação,2022.
CAMPOS, J. M. O universo da gestão de riscos: técnicas qualitativas e quantitativas. Rio de
Janeiro: Editora Horizonte, 2020.
FERNANDES, A. C. Do teórico ao prático: estratégias de mitigação e planos de contingência em
gestão de riscos. Curitiba: Editora Ponta, 2023.
LIMA, R. T.; GONÇALVES, M. P. Riscos na construção civil: uma abordagem prática para
engenheiros e arquitetos. Porto Alegre: Construir Editora, 2019.
Aula 2
Tomada de decisão com base em modelos e simulações em projetos de engenharia
Introdução
Disciplina
Pensamento Analítico e Análise
de Dados
Olá, estudante!
Bem-vindo à aula sobre Modelagem e Simulação em Engenharia, um tópico crucial que vai além
das simples equações e fórmulas para entrar no mundo real de resolução de problemas e
inovação. Entender a modelagem e a simulação é como ter um superpoder que permite visualizar
e testar suas ideias em um ambiente controlado antes de implementá-las no mundo real. Isso é
fundamental para qualquer engenheiro que deseje fazer mais do que apenas entender teorias; é
para aqueles que querem aplicá-las de forma e�caz.
Nesta aula, você vai aprender como a modelagem serve como o esboço inicial de qualquer
projeto de engenharia, enquanto a simulação age como um laboratório virtual para testar
cenários variados. Esses conceitos se tornam particularmente importantes quando lidamos com
sistemas complexos, sejam eles uma aeronave, uma linha de produção industrial ou até mesmo
o tráfego de uma cidade inteira.
Vamos começar?
Introdução à modelagem e simulação em engenharia
Disciplina
Pensamento Analítico e Análise
de Dados
Nesta aula, vamos nos aprofundar no universo da modelagem e simulação em engenharia. Esses
são instrumentos poderosos que possibilitam aos engenheiros visualizar, compreender e,
posteriormente, transformar ideias complexas em realidade. A modelagem e a simulação, em
sua essência, servem como pontes entre o teórico e o prático.
Vamos pegar o projeto de um novo avião como exemplo. Antes de dar início à construção física
desse avião, os engenheiros criaram modelos. Um desses modelos, o físico, seria algo que você
poderia ver e tocar, como uma maquete ou um protótipo em escala reduzida. No entanto, a
engenharia não se detém apenas ao tangível. Precisamos entender, por exemplo, como as asas
desse avião responderão a diferentes condições atmosféricas. Nesse contexto, a modelagem
matemática, que se baseia em teorias aprofundadas de aerodinâmica, dinâmica dos �uidos e
termodinâmica, torna-se essencial. Por meio dela, é possível criar equações que representam o
comportamento esperado do avião sob diferentes condições.
Mas os sistemas reais não são simpli�cados e podem ser altamente complexos. Um avião, por
exemplo, não é apenas sobre aerodinâmica. Envolve sistemas de propulsão, eletrônica,
mecanismos de controle, entre outros. Essa complexidade multifacetada leva-nos ao mundo dos
modelos computacionais. Com a potência dos computadores modernos e softwares de
simulação avançados, é possível combinar diferentes domínios da física, química e matemática
para simular o desempenho esperado do avião em uma variedade de cenários.
O processo de modelagem começa, muitas vezes, de maneira mais abstrata e generalizada com
a criação de um modelo conceitual. Pense nisso como um esboço ou um mapa mental, onde
Disciplina
Pensamento Analítico e Análise
de Dados
capturamos a natureza e os principais componentes do sistema. Se estivéssemos examinando o
tráfego de uma cidade, em vez de nos preocuparmos com cada veículo individual, nos
concentraríamos em grandes avenidas, rotas principais e padrões de �uxo.
Contudo, para que esses conceitos iniciais e modelos se tornem tangíveis e facilmente
compreendidos por uma equipe multidisciplinar, necessitamos de ferramentas de representação
grá�ca. Diagramas de blocos, �uxogramas ou até mesmo modelos 3D são instrumentos
essenciais. Por exemplo, se estivéssemos tentando compreender o �uxo de produção em uma
fábrica, um diagrama detalhado poderia ilustrar cada etapa do processo, desde a entrada de
matérias-primas até o produto �nal.
Em resumo, a modelagem e a simulação funcionam como lentes ampliadoras, permitindo que os
engenheiros observem, analisem e testem sistemas em ambientes controlados antes de sua
implementação no mundo real. Ao traduzir teorias complexas em representações visuais e
simulações, a engenharia torna possível a inovação e a solução de problemas de maneira e�caz.
E este é apenas o começo de nossa jornada. Prepare-se para mergulhar ainda mais fundo nas
próximas aulas!
Adentrando em simulações
Disciplina
Pensamento Analítico e Análise
de Dados
A engenharia, como disciplina, está em constante evolução e no coração dessa evolução estão a
modelagem e a simulação, dois pilares que convergem teoria e prática para gerar inovações
tangíveis. Antes de mergulhar profundamente no reino da simulação, é crucial entender o papel
vital da modelagem.
Modelagem de sistemas e processos
Antes de qualquer simulação, está a etapa de modelagem. A modelagem é como criar o esboço
de um complexo quebra-cabeça. Por exemplo, ao desenhar a planta de uma casa, o arquiteto
está modelando como a estrutura se parecerá e funcionará. Em termos mais técnicos, modelar
envolve a representação matemática e lógica de um sistema ou processo, capturando suas
características essenciais. É o primeiro passo para entender como um sistema pode responder a
diferentes cenários.
Aprofundando-se no campo da simulação, a modelagem se manifesta de forma vívida.
Imaginemos que você tenha modelado uma cidade meticulosamente detalhada, desde seus
arranha-céus até os semáforos intermitentes. Esse modelo serve como base para a próxima
etapa crucial: a simulação.
Simulação de sistemas e processos
A simulação é o processo pelo qual injetamos vida em nossos modelos. Usando nossa cidade
modelada como exemplo, a simulação nos permitirá observar como ela responderia a diferentes
situações, como tráfego pesado, eventos de grande público ou mudanças climáticas extremas.
As metodologias de simulação variam e podem ser agrupadas em três categorias dominantes:
1. Discreta: como em uma loja, onde cada cliente que entra ou sai representa um evento
singular e separado no tempo.
2. Contínua: analogamente, a observação da variação de temperatura ao longo de um dia,
onde as mudanças ocorrem de forma �uida.
3. Híbrida: representada por ambientes como hospitais, onde eventos discretos e contínuos
coexistem e se inter-relacionam.
Na era digital em que vivemos, softwares avançados, incluindo MATLAB, Simulink, Arena, ANSYS
e AutoCAD, têm simpli�cado e aprimorado o processo de simulação, tornando-o mais preciso e
e�ciente.
Análise de resultados de simulação
Depois que uma simulação é realizada, entramos na etapa vital de decifrar o que ela nos revela.
Aqui, não é apenas sobre reunir informações, mas decodi�car, analisar e interpretá-las. A análise
ajuda a identi�car padrões, reconhecer desvios, assegurar a precisão dos dados e, o mais
importante, proporcionar insights acionáveis para otimização e inovação.
Concluindo, a modelagem e a simulação são a alquimia da engenharia moderna, transformando
teorias abstratas em soluções palpáveis e impactantes. Como engenheiro, ao dominar essas
habilidades, você se equipará com as ferramentas necessárias para moldar o futuro da inovação.
Portanto, explore profundamente, aplique e permita que seu conhecimento trace o caminho para
um mundo de possibilidades sem �m.
Sintetizando os conceitos
Disciplina
Pensamento Analítico e Análise
de Dados
Durante nossa jornada, exploramos os pilares da modelagem e simulação em engenharia,
desvendando suas teorias e práticas. Através desses conceitos, podemos convergir a teoria e a
prática para gerar soluções tangíveis e inovadoras. Para consolidar esse aprendizado, vamos
aplicar essas ferramentas em contextos práticos e reais.
No ambiente corporativo, a modelagem é o alicerce que antecede a simulação. Se você fosse um
engenheiro encarregado de otimizaro layout de uma linha de produção, por exemplo, a
modelagem serviria para criar uma representação matemática e lógica de todo o processo,
desde a entrada de materiais até o produto �nal. Usando simulação, é possível antever como as
mudanças propostas podem afetar a e�ciência, evitando custos adicionais e garantindo a
qualidade da produção.
No setor de transporte, a modelagem e simulação atuam como instrumentos essenciais para os
planejadores urbanos. Uma cidade com tráfego crescente pode se bene�ciar de uma modelagem
detalhada da rede viária atual. Posteriormente, simulações podem ser usadas para projetar a
e�cácia de intervenções, como a adição de vias ou mudanças no sistema de semáforos,
facilitando a tomada de decisões embasadas e e�cientes.
No contexto energético, as metodologias de modelagem e simulação também são vitais.
Suponha uma usina que busca aprimorar sua produção energética. Primeiramente, os
engenheiros podem modelar o processo de geração, criando um esboço do complexo "quebra-
cabeça" energético. Depois, simulações permitiriam testar diferentes variáveis, como a alteração
das fontes de energia, otimizando o processo como um todo.
Disciplina
Pensamento Analítico e Análise
de Dados
Já no universo tecnológico, o lançamento de um novo dispositivo passa por rigorosos testes de
modelagem e simulação. Antes que um produto chegue ao consumidor, é crucial que se
compreenda plenamente sua performance. Aqui, softwares avançados como MATLAB e ANSYS
têm papel fundamental, proporcionando simulações precisas e con�áveis.
Após a realização de qualquer simulação, uma etapa essencial é a análise dos resultados. Não
se trata apenas de coletar informações, mas sim de decifrá-las, buscando padrões, desvios e
insights que possam direcionar otimizações e inovações. Essa análise é o que realmente traduz
os dados em ações concretas.
Em síntese, a modelagem e simulação são mais do que meras ferramentas; são essenciais para
a engenharia moderna. Quando aplicadas com maestria, têm o poder de reformular a forma
como encaramos problemas, propondo soluções inovadoras e e�cientes. Para um engenheiro, a
habilidade de antecipar e se adaptar a cenários variados, fundamentando-se em análises
criteriosas, é uma competência inestimável.
Videoaula: Tomada de decisão com base em modelos e simulações em
projetos de engenharia
Este conteúdo é um vídeo!
Para assistir este conteúdo é necessário que você acesse o AVA pelo
computador ou pelo aplicativo. Você pode baixar os vídeos direto no aplicativo
para assistir mesmo sem conexão à internet.
Olá, estudante!
Preparado para decifrar o incrível mundo da modelagem e simulação em engenharia? Neste
vídeo você vai embarcar em uma viagem completa, passando desde os conceitos básicos até
suas aplicações práticas no ambiente de trabalho. Vamos explorar como os engenheiros usam
essas ferramentas para transformar teorias complexas em soluções inovadoras e e�cazes. Você
também analisará como softwares avançados estão revolucionando esse campo. Então, ajuste
seu cinto de segurança e prepare-se para um voo de imersão no universo da engenharia!
Saiba mais
Disciplina
Pensamento Analítico e Análise
de Dados
Se você deseja se aprofundar ainda mais no universo da modelagem / simulação de processos e
suas aplicações práticas, temos uma indicação para ampliar sua visão sobre o tema. É uma
oportunidade para você explorar e entender as nuances que não apenas solidi�carão seu
aprendizado, mas também lhe oferecerão uma vantagem no mercado de trabalho.
Um bom exemplo da aplicação da modelagem e simulação de processos, voltada à manufatura
aditiva, está descrito no artigo intitulado Simulações Computacionais dos Processos de
Manufatura Aditiva de Metais: Um Review Introdutório, dos autores Rodrigo Martins Farias e
Louriel Oliveira Vilarinho, disponibilizado na base de artigos cientí�cos Scielo.
Essa fonte é apenas um ponto de partida. A modelagem e simulação de processos, como
mencionado anteriormente, é um campo vasto e em constante evolução. Portanto, manter-se
atualizado e em busca contínua de conhecimento será sua chave para a excelência pro�ssional.
Boa leitura !
Referências
https://www.scielo.br/j/si/a/wWJ3vXWqnZrt5CGjmHKVrQP/?format=pdf&lang=pt
https://www.scielo.br/j/si/a/wWJ3vXWqnZrt5CGjmHKVrQP/?format=pdf&lang=pt
Disciplina
Pensamento Analítico e Análise
de Dados
ALMEIDA, C. H. Gestão de riscos em projetos de engenharia: um panorama atual. São Paulo:
Editora Engenharia & Saber, 2021.
BARBOSA, R. L.; SILVA, E. P. Desvendando a Análise de Monte Carlo: simulações para um futuro
incerto. Belo Horizonte: Publicações Inovação, 2022.
CAMPOS, J. M. O universo da gestão de riscos: técnicas qualitativas e quantitativas. Rio de
Janeiro: Editora Horizonte, 2020.
FERNANDES, A. C. Do teórico ao prático: estratégias de mitigação e planos de contingência em
gestão de riscos. Curitiba: Editora Ponta, 2023.
LIMA, R. T.; GONÇALVES, M. P. Riscos na construção civil: uma abordagem prática para
engenheiros e arquitetos. Porto Alegre: Construir Editora, 2019.
Aula 3
Tomada de decisão com base em projeto e otimização em projetos de engenharia
Introdução
Disciplina
Pensamento Analítico e Análise
de Dados
Olá, estudante!
Bem-vindo à mais uma aula, onde vamos desvendar o mundo da Otimização e Análise de
Requisitos em engenharia.
Esses dois conceitos são a espinha dorsal de qualquer projeto bem-sucedido, seja ele uma
viagem de carro ou a construção de uma grande estrutura como uma ponte. Pense nisso como
escolher o melhor caminho em uma jornada repleta de opções e limitações.
Esta aula é crucial porque vai equipá-los com as ferramentas necessárias para tomar decisões
e�cazes em qualquer projeto de engenharia. Vamos começar identi�cando e priorizando
requisitos e, em seguida, traduziremos esses requisitos em modelos matemáticos. Esses
modelos nos permitirão aplicar algoritmos de otimização para encontrar a melhor solução
possível dentro das limitações do projeto.
Então, preparem-se para uma viagem empolgante pelo universo da engenharia otimizada! Esta
aula não só enriquecerá seu conhecimento acadêmico, mas também lhe dará habilidades
práticas que são absolutamente vitais no mundo pro�ssional. Acreditem, os conceitos que vocês
vão aprender aqui serão aplicáveis em muitos cenários da vida real, ajudando vocês a se
tornarem pro�ssionais mais e�cientes e e�cazes.
Vamos começar?
Introdução à otimização e análise de requisitos
Disciplina
Pensamento Analítico e Análise
de Dados
Vamos falar sobre otimização e análise de requisitos em engenharia, temas essenciais para
qualquer projeto. Imagine que você está planejando uma viagem de carro e tem vários caminhos
para escolher. O problema é decidir qual é o melhor. O que fazemos em engenharia é bem similar.
Em um projeto, há diversas maneiras de alcançar o objetivo, e a otimização nos ajuda a encontrar
o melhor caminho. No contexto de otimização linear, por exemplo, costumamos de�nir uma
função objetivo que queremos maximizar ou minimizar, sujeita a um conjunto de restrições. Em
notação matemática, seria algo como:
Sujeito a:
Aqui, é o valor que queremos maximizar (como lucro) ou minimizar (como custo), e as outras
equações são as restrições do problema, como limites de material ou tempo. Em problemas não
lineares, as coisas �cam um pouco mais complexas, e os métodos de solução também são mais
so�sticados. Em problemas de otimização inteira, as variáveis só podem
assumir valores inteiros, como, por exemplo, o número de unidades produzidas em uma fábrica.
Maximizar ou Minimizar Z = c1x1 + c2x2 + . . . + cn xn
a11x1 + a12x2+. . . +a1nxn ≤ b1
a21x1 + a22x2+. . . +a2nxn ≤ b2
am1x1 + am2x2+. . . +amnxn ≤ bm
Z
x1, x2, . . . , x n
Disciplina
Pensamento Analítico e Análise
de Dados
Agora, vamos dar uma olhada na análise de requisitos. Antes de otimizar algo, você precisa saber
o que é realmente necessário. Pense em um projeto de construção de uma ponte. Se não
considerarmos os requisitos, como opeso e o tipo de veículos que passarão por ela, podemos
acabar com uma estrutura inadequada. Portanto, coletar e documentar esses requisitos é crucial.
É como elaborar uma lista de compras precisa antes de ir ao mercado.
A etapa seguinte é a validação desses requisitos. Não adianta ter uma lista de compras se ela
inclui itens que você não precisa ou que estão fora do orçamento, certo? O mesmo vale para os
requisitos de um projeto. Eles devem ser validados para garantir que estão alinhados com os
objetivos do projeto.
E como escolher quais requisitos são mais importantes? Imagine que você tem um orçamento
limitado para a construção da ponte e precisa decidir entre usar um material mais caro que
durará mais tempo ou um material mais barato com uma vida útil menor. Aqui entra o conceito
de priorização. Por exemplo, se você optar pelo material mais durável, pode usar a análise custo-
benefício para justi�car sua escolha.
Então, para resumir: primeiro, identi�camos os requisitos e os priorizamos. Em seguida,
traduzimos o problema para uma forma matemática que nos permite usar algoritmos
de otimização. Com isso, garantimos que as decisões tomadas sejam as melhores possíveis
dentro das limitações do projeto.
Agora esses conceitos devem estar claros! Em breve, entraremos em detalhes sobre como essas
técnicas são aplicadas na prática.
Modelagem matemática e algoritmos de otimização
Disciplina
Pensamento Analítico e Análise
de Dados
Muito bem, já entramos no mundo da otimização e da análise de requisitos. Agora, como
transformamos essas ideias todas em algo que um computador consiga compreender e
resolver? A resposta é: modelagem matemática. É aqui que convertemos os problemas da vida
real em linguagem matemática.
Vamos pegar um exemplo prático. Imagine que você está encarregado de otimizar a distribuição
de energia elétrica para minimizar as perdas. Esse problema pode ser descrito matematicamente
usando uma série de equações. Por exemplo, se L é a perda de energia, I é a corrente e R é a
resistência, a função que você quer minimizar poderia ser:
Sujeito a:
Esse é um exemplo de como você transformaria um problema prático em algo que um algoritmo
possa resolver.
Beleza, agora que o problema está em forma matemática, o próximo passo é escolher o
algoritmo de otimização certo para resolvê-lo. Temos basicamente dois grandes grupos de
algoritmos: os métodos exatos e os heurísticos. Os métodos exatos, como o Simplex, são ótimos
Minimizar L = R1I1
2 + R2I2
2 + . . . + RnIn
2
I1 + I2+. . +In = Itotal
V1 − R1I1 = V2 − R2I2 =. . . = Vn − RnIn
Disciplina
Pensamento Analítico e Análise
de Dados
para determinados tipos de problemas, como programação linear. O método Simplex é uma
técnica que passa por várias iterações ajustando as variáveis para encontrar o mínimo ou
máximo da função objetivo. Para ilustrar, um problema clássico seria:
Exemplo do Simplex:
Sujeito a:
Mas atenção: métodos exatos podem ser bem pesados computacionalmente, especialmente se
o problema for muito grande ou complexo.
Aí é que entram os métodos heurísticos, como Algoritmo Genético e Simulated Annealing. Esses
são mais rápidos, mas a desvantagem é que eles não garantem a melhor solução possível. Só
uma solução "boa o su�ciente", digamos assim. O Algoritmo Genético, por exemplo, simula o
processo evolutivo para buscar soluções ótimas ou quase ótimas, usando mecanismos como
seleção, cruzamento e mutação.
Finalmente, temos as técnicas de busca e re�namento. Pense como se você estivesse jogando
um jogo de "quente ou frio" para encontrar o tesouro escondido. Você começa em um lugar,
analisa o ambiente e toma decisões para se aproximar do objetivo. No mundo dos algoritmos,
isso é feito através de técnicas como gradiente descendente ou ascendente, ajustando suas
variáveis passo a passo para chegar à solução ótima.
Então, o resumo é o seguinte: primeiro, descrevemos nosso problema real em forma de modelo
matemático. Depois, escolhemos o algoritmo de otimização mais adequado e aplicamos
técnicas de busca e re�namento para encontrar a melhor solução possível. Isso é a essência da
tomada de decisão em projetos de engenharia quando falamos em otimização.
Conseguiu conectar os pontos! E �que ligado, porque a seguir vamos pôr a mão na massa e ver
como todas essas teorias se aplicam na prática.
Sintetizando os conceitos
Maximizar Z = 3x1 + 2x2
2x1 + x2 ≤ 4
x1 + 2x2 ≤ 3
Disciplina
Pensamento Analítico e Análise
de Dados
Vamos fazer um rápido resumo de tudo o que aprendemos até agora e como isso se aplica no
ambiente de trabalho, com exemplos práticos. Então, basicamente, aprendemos que a
otimização e a análise de requisitos são cruciais na engenharia. Semelhante à forma como você
escolheria o melhor caminho para uma viagem de carro, a otimização ajuda a encontrar o melhor
percurso para alcançar os objetivos de um projeto. Por exemplo, no planejamento logístico de
uma empresa, você poderia usar otimização para determinar a rota mais e�ciente para as
entregas, minimizando tempo e custo.
O primeiro passo é a análise de requisitos, onde identi�camos e validamos o que é realmente
necessário para o projeto. Pensem na gerência de um projeto de software. Antes de começar a
codi�car, você precisa coletar e validar os requisitos para entender o que o cliente realmente
quer. Essa fase também inclui priorizar esses requisitos com base em critérios, como custo e
benefício, similar ao que faríamos ao escolher materiais para a construção de uma ponte.
Após ter os requisitos bem de�nidos, o passo seguinte é traduzir esse entendimento em uma
linguagem que um computador possa entender: a modelagem matemática. No contexto de
trabalho, isso poderia ser feito ao modelar as preferências do consumidor em um algoritmo de
recomendação para uma loja on-line, por exemplo. Você de�niria uma função objetivo e as
restrições, como o estoque disponível ou as preferências anteriores do usuário.
Agora que o problema está bem de�nido matematicamente, escolhemos um algoritmo de
otimização para resolvê-lo. Em uma empresa de manufatura, por exemplo, métodos exatos como
o Simplex poderiam ser usados para otimizar a linha de produção, garantindo que o máximo de
Disciplina
Pensamento Analítico e Análise
de Dados
produtos seja feito com a menor quantidade de recursos. Mas cuidado: esses métodos podem
ser computacionalmente intensivos!
Métodos heurísticos, como o Algoritmo Genético, são alternativas mais rápidas, mas menos
precisas. Estes poderiam ser úteis em situações em que uma "boa" solução é su�ciente e o
tempo é um fator crítico. Um exemplo prático seria usá-los para otimizar o layout de um site para
aumentar as conversões de vendas.
Finalmente, usamos técnicas de busca e re�namento para ajustar nossa solução. Num ambiente
de vendas, por exemplo, isso seria como ajustar o preço dos produtos baseado na resposta do
mercado, utilizando técnicas como gradiente descendente para encontrar o preço ótimo que
maximiza o lucro.
Vimos neste resumo como os princípios de otimização e análise de requisitos podem ser
aplicados de forma prática no ambiente de trabalho.
Videoaula: Tomada de decisão com base em projeto e otimização em
projetos de engenharia
Este conteúdo é um vídeo!
Para assistir este conteúdo é necessário que você acesse o AVA pelo
computador ou pelo aplicativo. Você pode baixar os vídeos direto no aplicativo
para assistir mesmo sem conexão à internet.
Olá, estudante!
Pronto para embarcar em uma jornada de descoberta pela engenharia? Neste vídeo, você vai
fazer um tour completo sobre otimização e análise de requisitos. Primeiro, desvendaremos o
mistério de como tomar as melhores decisões em projetos através da otimização. Depois,
mergulharemos em como transformar esses problemas em linguagem matemática para resolvê-
los com algoritmos e�cazes. Por �m, veremos como aplicar esses conceitos na vida real, no
ambiente de trabalho. Assista e �que à frente na arte da decisão inteligente!
Saiba mais
Disciplina
Pensamento Analítico e Análise
de DadosSe você deseja se aprofundar ainda mais no universo da modelagem matemática, algoritmos de
otimização e suas aplicações práticas, temos uma indicação para ampliar sua visão sobre o
tema. É uma oportunidade para você explorar e entender as nuances que não apenas
solidi�carão seu aprendizado, mas também lhe oferecerão uma vantagem no mercado de
trabalho.
Um bom exemplo das principais vulnerabilidades e vantagens da aplicação da modelagem
matemática e algoritmos de otimização, sob a perspectiva dos algoritmos genéticos, está
descrito no artigo intitulado Algoritmo Genético: Principais Gaps, Trade-offs e Perspectivas para
Futuras Pesquisas, dos autores A. R. F. PINTO, N. J. MARTARELLI e M. S. NAGANO, também
disponível na base de artigos cientí�cos Scielo.
Essa fonte é apenas um ponto de partida. A modelagem matemática e algoritmos de otimização,
como mencionado anteriormente, é um campo vasto e em constante evolução. Portanto, manter-
se atualizado e em busca contínua de conhecimento será sua chave para a excelência
pro�ssional. Boa leitura!
Referências
https://www.scielo.br/j/tcam/a/DcLsnWLxJSQBwQrfm3sh6Cp/?format=pdf&lang=pt
https://www.scielo.br/j/tcam/a/DcLsnWLxJSQBwQrfm3sh6Cp/?format=pdf&lang=pt
Disciplina
Pensamento Analítico e Análise
de Dados
ALMEIDA, C. H. Gestão de riscos em projetos de engenharia: um panorama atual. São Paulo:
Editora Engenharia & Saber, 2021.
BARBOSA, R. L.; SILVA, E. P. Desvendando a Análise de Monte Carlo: simulações para um futuro
incerto. Belo Horizonte: Publicações Inovação, 2022.
CAMPOS, J. M. O universo da gestão de riscos: técnicas qualitativas e quantitativas. Rio de
Janeiro: Editora Horizonte, 2020.
FERNANDES, A. C. Do teórico ao prático: estratégias de mitigação e planos de contingência em
gestão de riscos. Curitiba: Editora Ponta, 2023.
LIMA, R. T.; GONÇALVES, M. P. Riscos na construção civil: uma abordagem prática para
engenheiros e arquitetos. Porto Alegre: Construir Editora, 2019.
Aula 4
Aplicações práticas do pensamento analítico na engenharia
Introdução
Disciplina
Pensamento Analítico e Análise
de Dados
Olá, estudante!
Preparado para uma jornada empolgante pelo mundo do pensamento analítico aplicado à
engenharia? Esta aula vai cobrir tópicos essenciais como "Projetos de Experimentos e Controle
de Qualidade", "Resolução de Problemas e Estudos de Caso", entre outros. Vamos explorar como
técnicas e ferramentas analíticas são fundamentais na engenharia para melhorar a qualidade,
otimizar processos e resolver problemas complexos de maneira e�caz.
Esta aula foi cuidadosamente planejada para fornecer um conhecimento aplicável e relevante
que contribuirá signi�cativamente para o seu desenvolvimento pro�ssional. Com as habilidades
adquiridas aqui, você será capaz de planejar experimentos estratégicos, tomar decisões
baseadas em dados e até mesmo aprimorar a e�ciência de processos industriais.
Então, está pronto para mergulhar de cabeça? Garanto que os conceitos abordados hoje serão
ferramentas valiosas em seu dia a dia pro�ssional. Seja você um engenheiro de materiais,
químico ou em qualquer outro campo, a capacidade de aplicar um pensamento analítico rigoroso
fará de você um pro�ssional altamente competente e procurado no mercado. Vamos lá, o futuro
te espera!
Projetos de experimentos e controle de qualidade
Disciplina
Pensamento Analítico e Análise
de Dados
Nessa aula vamos abordar como aplicar o pensamento analítico na engenharia, com foco em
tópicos bem práticos. E começaremos com algo que você vai usar muito: o Projeto de
Experimentos. Imagine que você tem diferentes materiais para usar em uma peça de engenharia
e quer saber qual oferece o melhor desempenho. O projeto de experimentos é como um guia
estruturado para você planejar testes que vão isolar os efeitos de cada material sobre o
desempenho da peça.
No Projeto de Experimentos, um termo que você vai encontrar frequentemente é a Análise de
Variância ou ANOVA. A ideia da ANOVA é comparar as médias de diferentes grupos para ver se
são estatisticamente diferentes. A fórmula básica para uma ANOVA univariada é
. Se F é signi�cativamente grande, podemos concluir que há uma
diferença estatística entre os grupos testados. Por exemplo, se estivermos comparando a
resistência de três diferentes tipos de materiais, a ANOVA pode nos dizer se um material é
signi�cativamente mais resistente que os outros.
E aí temos os experimentos fatoriais, onde a coisa �ca ainda mais interessante. Aqui, você pode
testar múltiplas variáveis ao mesmo tempo. Imagine que além dos tipos de materiais, você
F = V ariação entre grupos
V ariação dentro dos grupos
Disciplina
Pensamento Analítico e Análise
de Dados
também quer testar diferentes temperaturas de operação. Em um experimento fatorial, você
poderia avaliar ambos os fatores juntos. Isso é super útil em engenharia de materiais, química e
muitos outros campos.
Agora, mudando um pouco de assunto, vamos para o Controle de Qualidade. Qual engenheiro
não quer garantir que um projeto ou produto tenha a melhor qualidade, certo? Aqui, entram várias
ferramentas para monitorar e aprimorar processos. Desde métodos simples, como inspeção
visual, até abordagens estatísticas mais complexas.
Uma dessas abordagens é a carta de controle. Imagine um grá�co onde o eixo Y representa uma
característica de qualidade, como o diâmetro de uma peça, e o eixo X o tempo. Você plotaria os
dados coletados e colocaria duas linhas, uma para o limite superior de controle (LSC) e outra
para o limite inferior de controle (LIC). Se algum ponto sair fora dessas linhas, é sinal de que algo
está errado e você precisa investigar. Essas cartas são vitais na produção industrial para
identi�car variações que podem levar a defeitos.
Por �m, temos o conceito de capabilidade do processo, que basicamente mede quão bom é seu
processo em fazer algo que esteja dentro das especi�cações, a fórmula mais comum para
calcular a capabilidade do processo, também conhecida como é
. Se isso sugere que seu processo é capaz
de produzir resultados dentro das especi�cações. Se for menor que 1, bem, você tem algum
trabalho pela frente para aprimorá-lo.
Esses conceitos, fórmulas e exemplos ajudam a ter um pensamento analítico aplicado na
engenharia e vão ser muito usados no dia a dia pro�ssional!
Resolução de problemas e a importância dos estudos de caso
Cp
Cp =
Tolerância superior − Tolerância inferior
6 x Desvio padrão do processo
Cp > 1
Disciplina
Pensamento Analítico e Análise
de Dados
Vamos continuar nossa aula com muito conteúdo interessante, vamos nos aprofundar em
Resolução de Problemas. Já ouviram o ditado "Se algo pode dar errado, dará"? É, Murphy estava
falando sério. Como futuros engenheiros, vocês vão precisar de boas estratégias para lidar com
problemas. E uma delas é o DMAIC, que signi�ca De�nir, Medir, Analisar, Melhorar e Controlar. É
uma técnica comumente usada em projetos Six Sigma para otimizar processos. O interessante
aqui é que você pode quanti�car o impacto das suas melhorias. Por exemplo, se você reduz o
tempo de um processo de 10 horas para 7 horas, seu índice de melhoria seria
.
Agora, além do DMAIC, temos o 8D, que foca em oito disciplinas para ter uma abordagem bem
abrangente na resolução de problemas. Isso inclui desde a formação da equipe até a
implementação de correções permanentes e a celebração dos sucessos. É um método
estruturado que evita o problema de "atirar para todos os lados" ao tentar resolver uma questão.
E temos também o 5W2H, que é super útil quando você precisa desdobrar um problema em
partes gerenciáveis. As perguntas Who? What? Where? When? Why? How? e How much? ajudam
você a entender todos os aspectos do que está sendo feito, por quem, onde, quando e por quê. A
ideia é criar um plano de ação que seja quase como uma receita de bolo, bem fácil de seguir.
Imagine que você tem um projeto com falhas na produção. O 5W2H ajudará a identi�car quem é
(10 −7)
10
× 100 = 30
Disciplina
Pensamento Analítico e Análise
de Dados
responsávelpor cada etapa, o que precisa ser feito, onde e quando, permitindo uma gestão de
problemas muito mais e�caz.
Falando em identi�car problemas, vamos abordar algumas ferramentas analíticas, como o
diagrama de Ishikawa, também conhecido como diagrama de espinha de peixe. Esse é um ótimo
jeito de mapear todas as possíveis causas de um problema. Imagine que um produto sai com
defeito da linha de produção. Usando Ishikawa, você pode categorizar possíveis causas, como
"Pessoas, Métodos, Máquinas, Materiais" e assim por diante.
A Lei de Pareto também é uma ferramenta crucial aqui. Ela nos diz que 80% dos nossos
problemas geralmente vêm de 20% das causas. E para quanti�car isso, você pode usar um
grá�co de Pareto, que é basicamente um grá�co de barras que ordena as causas do mais
signi�cativo para o menos signi�cativo. É uma forma de priorizar esforços.
Ah, e tem o método dos 5 Porquês, que é basicamente como ser um detetive. Você pergunta "por
quê?" repetidamente até chegar à causa raiz do problema. É como descascar uma cebola,
camada por camada, até você encontrar o cerne da questão.
Por último, mas não menos importante, Estudos de Caso. Nada melhor do que aprender com
exemplos reais, certo? Aqui, você verá como todas essas técnicas foram aplicadas em situações
reais e quais foram os resultados. É como um laboratório virtual onde você pode ver a teoria em
ação, o que é excelente para consolidar o aprendizado e promover discussões produtivas em
grupo.
Espero que tenham curtido essa viagem pelo mundo da resolução de problemas e do
pensamento analítico em engenharia. Todas essas técnicas e métodos serão muito úteis na
carreira de vocês.
Sintetizando os conceitos
Disciplina
Pensamento Analítico e Análise
de Dados
Você esteja pronto para fechar com chave de ouro a nossa série de tópicos sobre pensamento
analítico na engenharia? O que foi coberto até agora fornece um conjunto sólido de ferramentas
e métodos que você vai encontrar com frequência em suas carreiras. Então, vamos reforçar o
aprendizado com alguns exemplos práticos, unindo as duas partes que já discutimos: o Projeto
de Experimentos e Controle de Qualidade e a Resolução de Problemas e Estudos de Caso.
Primeiramente, considere que você está trabalhando em uma fábrica e nota que há um aumento
no número de peças defeituosas. Você pode começar aplicando a ANOVA para identi�car se as
variações nas peças são estatisticamente signi�cativas. Após isso, um experimento fatorial
poderia ser utilizado para examinar as diversas variáveis em jogo – talvez diferentes máquinas
ou turnos de trabalho sejam a causa.
Agora, entrando na resolução de problemas, vocês poderiam empregar o DMAIC. Depois de
"De�nir" que o aumento das peças defeituosas é um problema, você poderia "Medir" a taxa atual
de defeitos e "Analisar" os dados coletados durante os experimentos fatoriais. Com essas
informações, você pode "Melhorar" o processo e, em seguida, "Controlar" para garantir que as
melhorias sejam mantidas. Se o índice de melhoria for, digamos, de 40%, você saberá que o
tempo e esforço investidos valeram a pena.
Não se esqueça das ferramentas como o 5W2H e o diagrama de Ishikawa. Imagine que vocês
identi�caram que um turno especí�co está produzindo mais defeitos. O 5W2H pode ajudar a
quebrar essa observação em ações especí�cas: "Quem" precisa ser treinado? "O que" precisa
Disciplina
Pensamento Analítico e Análise
de Dados
mudar no processo? "Onde" essa mudança ocorrerá? "Quando" ela será implementada? "Por quê"
é importante? "Como" será feito? E "Quanto" isso custará?
Nesse cenário, você também poderia utilizar um grá�co de Pareto para identi�car se apenas
algumas máquinas ou operadores são responsáveis pela maioria dos defeitos. Isso ajuda a
direcionar esforços de forma e�caz. Imagine que 80% dos problemas vêm de apenas 20% das
máquinas; nesse caso, suas ações corretivas seriam muito mais direcionadas.
Por último, vale mencionar a importância dos Estudos de Caso em um ambiente de trabalho.
Você não precisa reinventar a roda cada vez que encontra um problema. Consultar estudos de
casos anteriores de situações similares pode fornecer insights valiosos e economizar um tempo
precioso. Também é uma maneira excelente de engajar a equipe em discussões produtivas,
trocando experiências e soluções que funcionaram no passado.
Esses exemplos práticos ilustram como essas ferramentas e métodos se encaixam no mundo
real da engenharia. Você está se armando com um conjunto de habilidades valiosas que, tenho
certeza, farão toda a diferença na sua carreira pro�ssional.
Videoaula: Aplicações práticas do pensamento analítico na engenharia
Este conteúdo é um vídeo!
Para assistir este conteúdo é necessário que você acesse o AVA pelo
computador ou pelo aplicativo. Você pode baixar os vídeos direto no aplicativo
para assistir mesmo sem conexão à internet.
Olá, estudante! Preparado para uma jornada intensa no mundo do pensamento analítico na
engenharia? Neste vídeo, vamos consolidar tudo o que aprendemos nesta aula. De Projetos de
Experimentos e Controle de Qualidade a Resolução de Problemas e Estudos de Caso, você verá
como essas ferramentas e métodos se aplicam na prática. Imagina solucionar problemas
complexos em uma fábrica com as técnicas que você aprendeu? Em apenas alguns minutos,
você vai ter essa visão completa. Não perca!
Saiba mais
Disciplina
Pensamento Analítico e Análise
de Dados
Se você deseja se aprofundar ainda mais no universo do projeto de experimentos e em suas
aplicações práticas, temos uma indicação para ampliar sua visão sobre o tema. É uma
oportunidade para você explorar e entender as nuances que não apenas solidi�carão seu
aprendizado, mas também lhe oferecerão uma vantagem no mercado de trabalho.
Um bom exemplo da aplicação do projeto de experimentos, voltado à manufatura aditiva, está
descrito no artigo intitulado Sequenciamento sistemático de experimentos fatoriais como
alternativa à ordem aleatória, dos autores Pedro Carlos Oprime, Vitória Maria Miranda Pureza e
Samuel Conceição de Oliveira, também disponível na base de artigos cientí�cos Scielo.
Essa fonte é apenas um ponto de partida. O projeto de experimentos, como mencionado
anteriormente, é um campo vasto e em constante evolução. Portanto, manter-se atualizado e em
busca contínua de conhecimento será sua chave para a excelência pro�ssional. Boa leitura!
Referências
https://www.scielo.br/j/gp/a/XQgywyNLPTpvZtgqQnWk8TD/?format=pdf&lang=pt
https://www.scielo.br/j/gp/a/XQgywyNLPTpvZtgqQnWk8TD/?format=pdf&lang=pt
Disciplina
Pensamento Analítico e Análise
de Dados
ALMEIDA, C. H. Gestão de riscos em projetos de engenharia: um panorama atual. São Paulo:
Editora Engenharia & Saber, 2021.
BARBOSA, R. L.; SILVA, E. P. Desvendando a Análise de Monte Carlo: simulações para um futuro
incerto. Belo Horizonte: Publicações Inovação, 2022.
CAMPOS, J. M. O universo da gestão de riscos: técnicas qualitativas e quantitativas. Rio de
Janeiro: Editora Horizonte, 2020.
FERNANDES, A. C. Do teórico ao prático: estratégias de mitigação e planos de contingência em
gestão de riscos. Curitiba: Editora Ponta, 2023.
LIMA, R. T.; GONÇALVES, M. P. Riscos na construção civil: uma abordagem prática para
engenheiros e arquitetos. Porto Alegre: Construir Editora, 2019.
Aula 5
Revisão da unidade
Entendendo conceitos fundamentais do pensamento analítico
Disciplina
Pensamento Analítico e Análise
de Dados
Parabéns por ter chegado até aqui, completando todas as aulas desta unidade! Sua dedicação e
empenho são notáveis e re�etem seu compromisso com o desenvolvimento pro�ssional em
engenharia. O conjunto de conhecimentos que você adquiriu é crucial para uma formação sólida
e para enfrentar desa�os futuros na sua carreira. À medida que nos preparamos para avançar
para os próximos tópicos, gostaria de apresentar um resumo das aulas desta unidade para
reforçar os principais conceitos que exploramos.
Em gestão de riscos na engenharia, vimos a diferença de "risco" e "incerteza" e apresentamos
ferramentas como brainstorming,entrevistas com especialistas e checklists para identi�cação e
avaliação de riscos. A segunda parte da aula aprofundou-se na análise e mitigação de riscos,
explorando abordagens qualitativas e quantitativas, bem como estratégias para tratá-los, como
evitação, transferência e aceitação. A importância dos planos de contingência foi enfatizada
como um meio de se preparar para situações imprevistas.
Vimos modelagem e simulação como pontes entre teoria e prática em engenharia. Discutimos o
uso de computadores modernos e softwares avançados para simular sistemas complexos e
fornecer insights práticos para otimização e inovação. A modelagem e simulação foram
destacadas como competências essenciais, não apenas para economia de custos, mas também
para acelerar o ciclo de inovação.
Otimização e análise de requisitos são dois conceitos cruciais em engenharia. A otimização foi
descrita como a busca da melhor solução dentro de restrições, enquanto a análise de requisitos
serve para entender as necessidades do projeto antes dessa busca. Métodos exatos e
Disciplina
Pensamento Analítico e Análise
de Dados
heurísticos de otimização foram introduzidos, cada um com suas vantagens e desvantagens em
termos de precisão e e�ciência computacional.
Por �m, vimos Projetos de Experimentos e Controle de Qualidade e Resolução de Problemas e
Estudos de Caso. O primeiro abordou técnicas como Análise de Variância (ANOVA) para planejar
testes que isolam variáveis. O segundo focou em estratégias estruturadas como DMAIC, 8D e
5W2H para gerenciamento e�caz de problemas. Ferramentas analíticas como o diagrama de
Ishikawa e a Lei de Pareto foram destacadas para identi�cação e priorização de causas de
problemas, enquanto estudos de caso serviram para ilustrar a aplicação prática de todos esses
conceitos.
Videoaula: Revisão da unidade
Este conteúdo é um vídeo!
Para assistir este conteúdo é necessário que você acesse o AVA pelo
computador ou pelo aplicativo. Você pode baixar os vídeos direto no aplicativo
para assistir mesmo sem conexão à internet.
Olá, estudante!
Em reconhecimento ao seu empenho em completar todas as aulas desta unidade, preparamos
um vídeo especial para você, no qual, vamos revisitar os conceitos-chave que moldaram sua
compreensão na engenharia. Desde a gestão de riscos até técnicas avançadas de otimização,
este resumo é seu guia rápido para solidi�car o aprendizado. Não perca essa chance de reforçar
seus conhecimentos.
Dê o play e mergulhe nessa recapitulação!
Estudo de caso
Disciplina
Pensamento Analítico e Análise
de Dados
Imagine que você é o Gerente de Projetos Sênior em um exemplo �ctício de uma empresa
multinacional de renome que oferece soluções abrangentes no setor de engenharia civil,
manufatura, logística e qualidade. Você está no comando de uma equipe diversi�cada de
especialistas e engenheiros e atualmente tem sob sua responsabilidade quatro projetos críticos,
cada um com seu próprio conjunto de desa�os e complexidades.
Construção de ponte: construir uma ponte em terreno instável entre duas cidades, sob alta
visibilidade pública e regulamentação governamental.
Otimização da linha de produção de smartphones: resolver gargalos em uma fábrica de
smartphones para acelerar a produção de um novo modelo.
E�ciência das rotas de distribuição logística: melhorar uma rede de distribuição ine�ciente
para reduzir atrasos e custos.
Problemas de qualidade em componentes automotivos: corrigir uma alta taxa de defeitos
em uma linha de produção de componentes automotivos, afetando prazos e reputação.
Perguntas:
Gestão de Riscos e Incertezas
1. Como você abordaria a gestão da complexidade e incerteza inerentes a esses múltiplos
projetos de alto risco?
2. Quais métodos você utilizaria para identi�car e avaliar riscos nos diferentes cenários?
3. Quais abordagens, tanto qualitativas quanto quantitativas, você aplicaria para analisar
profundamente os riscos identi�cados?
Mitigação e Planejamento de Contingência
Disciplina
Pensamento Analítico e Análise
de Dados
1. Quais estratégias você consideraria para mitigar cada tipo de risco em seus projetos?
2. Como você formularia planos de contingência para lidar com desa�os imprevistos nos
diferentes projetos?
Otimização de Produção e Logística
1. Como você aplicaria técnicas de modelagem e simulação para resolver os problemas na
linha de produção de smartphones?
2. Após realizar simulações, quais métricas você usaria para avaliar a e�cácia das mudanças
implementadas?
3. Que ferramentas de software você consideraria para auxiliar nos processos de otimização
de produção e logística?
E�ciência na Distribuição e Roteirização
1. Quais critérios você adotaria para validar os requisitos necessários para a otimização das
rotas de entrega?
2. Como você abordaria a modelagem matemática para encontrar a rota de entrega mais
e�ciente?
3. Quais algoritmos você consideraria mais adequados para otimizar as rotas de entrega?
4. Que métodos você aplicaria para re�nar a solução de roteirização?
Controle de Qualidade
1. Que técnicas você empregaria para identi�car a causa subjacente dos defeitos na linha de
produção de componentes automotivos?
2. Quais indicadores você usaria para medir a e�cácia das soluções que você implementou?
3. Que ferramentas você escolheria para assegurar uma solução de longo prazo para os
problemas de qualidade?
4. Agora, coloque-se no lugar desse Gerente de Projetos Sênior e pense em como você lidaria
com cada um desses desa�os.
Re�ita
Ao enfrentar múltiplos e complexos projetos, é fundamental adotar uma abordagem estruturada.
Aqui estão algumas dicas para orientar seu pensamento:
Gestão de Riscos e Incertezas
Pense em métodos formais de avaliação de riscos: você conhece todos os métodos
disponíveis e qual se adequaria melhor a cada projeto?
Mitigação e Planejamento de Contingência
Avalie o grau de �exibilidade em seus planos: você já considerou várias alternativas e
estratégias de backup para cada desa�o que possa surgir?
Otimização de Produção e Logística
Disciplina
Pensamento Analítico e Análise
de Dados
Considere a utilização de simulações para testar diferentes cenários: você tem uma ideia
de como simulações podem replicar o ambiente real e ajudar a identi�car pontos fracos?
E�ciência na Distribuição e Roteirização
Pense em algoritmos de otimização para logística: já pesquisou sobre as diversas
abordagens matemáticas para encontrar a rota mais e�caz?
Controle de Qualidade
Contemple técnicas estatísticas para análise de qualidade: quais ferramentas poderiam
ajudá-lo a ir além da simples detecção de defeitos para entender suas causas
subjacentes?
Essas dicas não fornecem soluções prontas, mas apontam para direções que você pode explorar
para encontrar suas próprias respostas.
Videoaula: Resolução do estudo de caso
Este conteúdo é um vídeo!
Para assistir este conteúdo é necessário que você acesse o AVA pelo
computador ou pelo aplicativo. Você pode baixar os vídeos direto no aplicativo
para assistir mesmo sem conexão à internet.
Abaixo podemos ver uma possível resolução para o nosso estudo de caso.
Gestão de Riscos e Incertezas
Gestão da complexidade e incerteza: uma abordagem e�caz seria aplicar o princípio da
gestão de portfólio para balancear e priorizar os projetos. Utilizaria o diagrama de Ishikawa,
e a matriz de probabilidade e impacto (Matriz de Risco) e para avaliar a relação risco-
recompensa de cada projeto.
Identi�cação e avaliação de riscos: ferramentas como Brainstorming, Análise de Causa Raiz
e Diagramas de Ishikawa poderiam ser usadas para identi�car riscos. Posteriormente,
aplicaria uma Matriz de Impacto/Probabilidade para avaliar esses riscos.
Abordagens para análise de riscos: utilizaria métodos qualitativos, como análises de
especialistas, juntamente com métodos quantitativos, como a Simulação de Monte Carlo,
para uma compreensão abrangente dos riscos.
Mitigação e Planejamento de Contingência
Disciplina
Pensamento Analítico e Análise
de Dadosde dados, envolve pesquisa, aquisição de
conhecimento relacionado ao assunto, decisões baseadas na realidade dos dados da
empresa e uma série de elementos que demandarão do tomador de decisão boa dose de
intuição.
Problemas semiestruturados: esse tipo de problema está contextualizado em situações
que apresentam elementos estruturados e não estruturados, em quantidades semelhantes
ou distintas (Rainer, 2011). Exemplo: uma situação típica e que bem descreve esse tipo de
problema é a compra de matérias-primas de um produto ainda não desenvolvido pela
empresa.
As decisões tomadas no nível operacional (ou de gerenciamento operacional) são mais
estruturadas em geral. Uma decisão estruturada é tomada em uma situação que apresenta um
problema estruturado, assim como a efetivação de uma compra de insumos para a
organização.
As decisões tomadas no nível estratégico tendem a ser não estruturadas, pois envolvem
situações que não permitem a especi�cação antecipada da maioria dos procedimentos a serem
seguidos (não por acaso, essas decisões estão associadas a problemas não estruturados, nos
moldes daqueles já abordados nesta aula. As decisões semiestruturadas estão comumente
ligadas ao nível tático e, no contexto em que ocorrem, é possível antecipar alguns procedimentos
já estruturados, embora não o bastante para que a solução de�nitiva se consolide (Rainer,
2011).
As decisões que envolvem, por exemplo, a criação de uma nova linha de serviços de comércio
eletrônico podem ser enquadradas no tipo semiestruturadas, pois o procedimento de inserção de
novos itens no portal é bastante conhecido, ao passo que as de�nições relacionadas aos novos
itens, em especí�co, são consideradas não estruturadas.
Habilidades em matemática e estatística para coletar, analisar e interpretar
dados para tomada de decisão
Disciplina
Pensamento Analítico e Análise
de Dados
Estatística aplicada
A estatística aplicada pode ser de�nida como
“um conjunto de procedimentos para coletar, medir, classi�car, codi�car, computar,
analisar e resumir informação numérica sistematicamente adquirida”.
Quando falamos em ferramentas estatísticas aplicadas na gestão das organizações, estamos
nos referindo a estatísticas aplicadas. A estatística compreende duas funções muito vastas. A
primeira é a da descrição, o resumo da informação de forma que possa ser melhor aproveitada. E
a segunda é a da indução, que consiste em formular generalizações sobre uma determinada
população a partir de uma amostra dela extraída (Castro, 2016, p.57).
O campo da estatística é geralmente dividido em duas grandes áreas, que são a Estatística
Descritiva e a Estatística Inferencial.
A estatística descritiva ou dedutiva é aquela que trata de descrever e analisar um grupo
especí�co, sem que esse estudo permita tirar conclusões cienti�camente válidas de uma
amostra maior. Um conjunto de dados é recolhido, apresentado e caracterizado de forma a
descrever adequadamente as suas diversas características; ou seja, um estudo é considerado
descritivo quando apenas os dados são analisados e descritos.
Estatística indutiva ou inferencial é aquela que trata de inferir conclusões importantes sobre uma
população a partir de uma amostra representativa. Essa inferência não é totalmente precisa, por
esse motivo, nesse tipo de estatística devem ser tidas em conta as probabilidades para
Disciplina
Pensamento Analítico e Análise
de Dados
estabelecer conclusões. A inferência estatística também se preocupa em estruturar uma
amostra representativa da população em estudo, a �m de desenhar modelos, inferências,
tendências e previsões sobre o seu comportamento com base na aleatoriedade das
observações. Esse projeto seria alcançado usando técnicas como testes de hipóteses,
estimativas, correlação, análise de regressão, séries temporais, mineração de dados, etc.
(O’Brien; Marakas, 2013).
Estatísticas nas organizações
Organizações sólidas dão um lugar especial ao tratamento estatístico das informações
relacionadas tanto aos seus processos internos quanto ao comportamento do seu ambiente:
políticas públicas, mercado, concorrentes, etc. (O’Brien; Marakas, 2013).
Especialmente nos negócios e na economia, a informação obtida através da recolha, análise,
apresentação e interpretação de dados proporciona aos gestores, administradores e decisores
uma melhor compreensão do ambiente empresarial ou econômico, permitindo-lhes tomar
melhores decisões com base em melhores informações. As organizações podem enfrentar
diversas situações de negócios utilizando técnicas estatísticas, transformando dados em
informações valiosas para ter um conhecimento mais profundo do ambiente e, assim, tomar
melhores decisões. Com base no estabelecido por Castro (2016), estas são algumas das
situações diárias que as empresas enfrentam e que as estatísticas podem ajudar a resolver:
Controle estatístico de processos.
O nível de falhas dos equipamentos e suas frequências.
Os tempos de troca ou preparação do ferramental.
Os níveis de produtividade de diferentes processos.
Níveis de satisfação de clientes e usuários.
Os tipos de acidentes e suas frequências.
Análise de defeitos e retrabalho.
O nível e as previsões de vendas.
A capacidade dos processos.
O comportamento dos estoques.
O nível de conformidade dos fornecedores.
Previsão de vendas.
A evolução dos diferentes índices macroeconómicos e �nanceiros.
Pesquisa de mercado.
O cálculo dos custos.
Desempenho da equipe.
Assim, obter informações completas, oportunas e con�áveis por meio de ferramentas
estatísticas torna-se essencial para a gestão integral das organizações. A esse respeito, a�rma
que a ciência estatística está preocupada com o desenvolvimento de teorias e técnicas
apropriadas para fazer inferências sob condições de incerteza e ignorância parcial, que
inevitavelmente existem numa ampla gama de atividades. Pode-se dizer que, praticamente, todas
as ferramentas da estatística aplicada são aplicáveis às situações organizacionais, de forma a
apoiar a tomada de decisões gerenciais. A seguir serão apresentadas as ferramentas estatísticas
mais utilizadas em situações organizacionais:
Disciplina
Pensamento Analítico e Análise
de Dados
Medidas de tendência central: mais utilizadas para localizar o centro dos dados são a
média, mediana e moda; quando o valor obtido nessas três medidas não difere entre si,
pode-se garantir que estamos trabalhando com dados que seguem uma distribuição
normal (Castro, 2016).
Medidas de localização: dividem a distribuição em partes proporcionais, ou seja, em
intervalos que contêm o mesmo número de observações. Eis as medidas de localização: os
quartis (Q), que são três valores que dividem a distribuição em quatro partes iguais; e os
decis (D), que são nove valores que dividem a distribuição em dez partes iguais; e os
percentis (P), que são noventa e nove valores que dividem a distribuição em cem partes
iguais (Castro, 2016).
Medidas de dispersão: embora as medidas de tendência central nos mostrem o valor em
que o resto dos dados tende a se concentrar, também é importante identi�car o quão
dispersos estão os dados em relação à sua medida de tendência central. Em muitas
situações a média não será necessariamente uma representação �el do resto dos dados.
As medidas de dispersão, portanto, indicam o quanto as observações se desviam em torno
da sua média. O desvio padrão, que corresponde à raiz quadrada da variância, é a medida
de dispersão utilizada nessa análise (Castro, 2016). Exemplo: uma empresa realiza uma
pesquisa de mercado sobre quanto as pessoas estariam dispostas a pagar por um veículo.
A estatística será aplicada para a tomada de decisões na área de marketing.
Tabela 2 | Pesquisa de mercado sobre quanto as pessoas estariam dispostas a pagar por um
veículo. Fonte: elaborada pela autora.
Disciplina
Pensamento Analítico e Análise
de Dados
Medidas estatísticas: variável
preço (R$) a pagar por veículo
Homens Mulheres
Média 19.249,94 12.849,56
Mediana 15.750,00 12.375,00
5º Percentil 13.500,00Estratégias de mitigação: dependeria do tipo de risco, por exemplo, para riscos de solo
instável na construção da ponte, métodos de engenharia geotécnica poderiam ser
utilizados. Para riscos legislativos, manteria um canal aberto com autoridades locais.
Planos de contingência: criaria planos de ação alternativos para cenários de "pior caso" e
"melhor caso", envolvendo equipes multifuncionais para garantir uma visão completa.
Otimização de Produção e Logística
Técnicas de modelagem e simulação: utilizaria softwares de simulação de processo como
o Arena ou o Simul8 para modelar o �uxo de trabalho da linha de produção e identi�car
gargalos.
Métricas de e�cácia: tempo de ciclo, taxa de defeito e custo por unidade seriam métricas
principais para avaliar as mudanças.
Ferramentas de software: além de softwares de simulação, consideraria sistemas ERP para
integrar todas as operações de produção e logística.
E�ciência na Distribuição e Roteirização
Critérios para validar requisitos: utilizaria métricas como tempo de entrega, custo por milha
e satisfação do cliente para validar os requisitos de otimização de rota.
Modelagem matemática: empregaria modelos como o Problema do Caixeiro Viajante ou
Algoritmos Genéticos para encontrar a rota mais e�ciente.
Algoritmos de otimização: Dijkstra ou A* poderiam ser métodos e�cazes, dependendo da
complexidade.
Métodos de re�namento: a implementação de feedback loops para ajustar as rotas em
tempo real com base em dados de desempenho.
Controle de Qualidade
Técnicas para identi�car causas: utilizaria a análise de requisitos para identi�car a causa
raiz dos defeitos.
Indicadores de e�cácia do processo: são indicadores que avaliam o quanto as metas
determinadas para um sistema ou equipamento foram atingidas. exemplos: métricas como
taxa de produtos com defeito ou produtos entregues com atraso
Indicadores de e�ciência do processo: são indicadores que avaliam o quanto que os
recursos disponíveis, como tempo, pessoas envolvidas e investimentos �nanceiros foram
otimamente utilizados tempo de inatividade da máquina e custo de qualidade.
Ferramentas para soluções de longo prazo: implementaria um conjunto de indicadores de
controle da e�ciência e e�cácia do processo e auditorias regulares para garantir a
sustentabilidade das melhorias.
Este gabarito fornece uma visão completa e e�caz de como gerir diversos desa�os em um
ambiente de projeto complexo.
Disciplina
Pensamento Analítico e Análise
de Dados
Resumo visual
Disciplina
Pensamento Analítico e Análise
de Dados
Fonte: elaborada pelo autor.
Disciplina
Pensamento Analítico e Análise
de Dados
Referencia
ALMEIDA, C. H. Gestão de riscos em projetos de engenharia: um panorama atual. São Paulo:
Editora Engenharia & Saber, 2021.
BARBOSA, R. L.; SILVA, E. P. Desvendando a Análise de Monte Carlo: simulações para um futuro
incerto. Belo Horizonte: Publicações Inovação, 2022.
CAMPOS, J. M. O universo da gestão de riscos: técnicas qualitativas e quantitativas. Rio de
Janeiro: Editora Horizonte, 2020.
FERNANDES, A. C. Do teórico ao prático: estratégias de mitigação e planos de contingência em
gestão de riscos. Curitiba: Editora Ponta, 2023.
LIMA, R. T.; GONÇALVES, M. P. Riscos na construção civil: uma abordagem prática para
engenheiros e arquitetos. Porto Alegre: Construir Editora, 2019.
,
Unidade 3
Data Driven
Aula 1
Importância do data driven na engenharia
Disciplina
Pensamento Analítico e Análise
de Dados
Introdução
“O recurso mais valioso do mundo é o dado, não o petróleo”, esta foi a manchete de capa da
revista The Economist em maio de 2017. Nessa reportagem, ela demonstra o poder que as
grandes empresas de tecnologia têm com suas enormes bases de dados e reforça a ideia
(famosa no mercado �nanceiro), criada pelo Clive Humby, de que “os dados são o novo
petróleo”.
Passados anos após a publicação dessa reportagem, essa ideia só está ganhando mais força,
visto que cada vez mais empresas vêm investindo na área voltada para análise de dados. Desde
grandes transformações digitais nos bancos até análises feitas por recursos humanos, dados
têm se tornando uma das principais fontes de informações, criando uma nova forma de tomar
decisões, em que os dados se tornam protagonistas na geração de insigths e também nos testes
de hipóteses e intuições. Essa nova cultura de tomada de decisão chama-se “Data Driven”, ou
seja, decisão baseada em dados.
Entendendo o que é data driven Forma
Disciplina
Pensamento Analítico e Análise
de Dados
Data Driven é a cultura de tomada de decisão baseada em dados, ela pode ser considerada uma
evolução do modelo de tomada de decisão baseada exclusivamente na intuição ou experiência
de especialistas, pois com o Data Driven as intuições podem ser geradas ou testadas através de
análises dos dados.
Para entendermos melhor o Data Driven é necessário primeiro entendermos o que são dados.
Dados são uma coleção de fatos, armazenados de diversas maneiras, sejam número, imagem,
texto, sons e outros. Eles são separados em três diferentes grupos segundo seu formato:
Dados estruturados: são dados organizados em tabelas, com tipos �xos, projetados
previamente, geralmente gerenciados por um sistema de bancos de dados.
Dados semiestruturados: são dados estruturados, porém com formas �exíveis, podendo
alterar de tipo. Podem ser organizados por chaves ou tags e utilizados em bancos de dados
não relacionais.
Dados não estruturados: não têm estruturas �xas, podendo assumir diversos tipos e
formatos. Podem ser encontrados como imagem, som, texto e outros.
Com a ferramentas e o processo correto de análise, dados se transformam em informação,
essas informações podem ser utilizadas para gerar insights, testar hipóteses, criar conclusões ou
Disciplina
Pensamento Analítico e Análise
de Dados
fazer predições. O processo de Data Drive se dá ao retirar essas informações dos dados a �m de
guiar decisões.
Diferentes processos de análise dos dados nos permite resolver diferentes tipos de problemas,
entre eles podemos destacar:
Quanti�car e classi�car valores: os dados podem ser agrupados devido às suas
similaridades, esses grupos podem ser comparados com valores numéricos, assim
podemos quanti�car e classi�car diferentes informações. Esse tipo de problema pode ser
utilizado para identi�car produtos ou sistemas que performam melhor ou geram mais
lucros.
Observar gaps e pontos fora da curva: com uma devida organização dos dados, podemos
perceber algumas anomalias, sejam elas formadas por gaps em pontos onde faltam
informações ou por valores muito destoantes do padrão. Esses pontos podem ser
interessantes para análises, como para descobrir falhas em um determinado sistema ou
locais onde os gastos estão exagerados.
Análise do passado: os dados sempre são informações armazenadas em algum momento
passado, e observarmos essas informações sobre um tempo, podemos tirar algumas
conclusões importantes. Essas análises podem, por exemplo, identi�car um setor que vem
ganhando mais destaque ao longo do tempo, ou até mesmo um equipamento que vem se
deteriorando antes do previsto.
Veri�car tendências de padrões: ao relacionar dados de diferentes fontes, é possível
identi�car padrões entre elas, algum tipo de informação pode ter uma sinergia com outra,
demonstrando uma correlação. Por exemplo, podemos veri�car que em um determinado
clima (como dias chuvosos) algum produto ou setor tem uma performance pior que nos
demais.
Projetar o futuro: em uma análise temporal dos dados, podemos identi�car padrões, e
projetando esses padrões para o futuro, podemos criar palpites muito assertivos sobre um
determinado assunto. Por exemplo, podemos analisar a receita passada de uma empresa e
projetar sua receita para o os próximos anos.
Atualmente, a importância do Data Driven na engenharia é inegável, transformando a forma como
pro�ssionais enfrentam desa�os e tomam decisões. Essa cultura traz consigo uma série de
benefícios, desde o monitoramento aprimorado de desempenho até a otimização de processosde produção e a gestão e�caz de projetos. Além disso, ela incentiva uma cultura que valoriza a
objetividade, a e�ciência e a inovação baseada em evidências.
O Data Driven também permite tomadas de decisões mais fundamentadas, utilizando análises
detalhadas em vez de depender apenas da intuição. Ao adotar essa cultura, as organizações
podem maximizar a utilização de seus recursos, minimizar riscos e, em última análise,
impulsionar a inovação.
Processo de data driven
Disciplina
Pensamento Analítico e Análise
de Dados
A Google divide o processo de Data Driven em seis etapas, assim facilitando e organizando um
método de tomada de decisão baseada em dados. São estas as etapas:
1. Planejar: nesta primeira etapa de�nimos o problema, para isso, é importante uma boa
comunicação com as partes envolvidas no problema, de�nindo as metas.
2. Preparar: na etapa de preparação, de�nimos as fontes dos dados necessários para
concluirmos as metas, bem como as ferramentas necessárias para analisar os dados.
3. Processar: os dados que recebemos diretamente das fontes costumam não estar em um
formato adequado para análise, assim, na etapa de processamento, transformamos,
limpamos e corrigimos os erros presentes nos dados, visando uma análise mais precisa.
4. Analisar: na etapa de análise é onde extraímos as informações contidas nos dados, nesta
etapa utilizamos cálculos estatísticos para responder as perguntas iniciais e criamos os
modelos matemáticos que nos permite concluir nossas metas.
5. Apresentar: após respondermos as perguntas iniciais, e necessário apresentar nossas
conclusões para as partes envolvidas no processo de planejamento, para isso, é
interessante criar grá�cos e tabelas que demonstrem as informações contidas nos dados,
esses grá�cos podem ser apresentados em formados de dashboards ou reportes
individuais.
�. Agir: após apresentar os dados, conseguimos demonstrar os problemas analisados e quais
as melhores maneiras de resolvê-lo. Agora, na etapa �nal, é onde agimos para resolver
esses problemas, a partir da estratégia criada através da análise dos dados.
Disciplina
Pensamento Analítico e Análise
de Dados
Arquitetura e ferramentas do Data Driven
Para extrairmos informações dos dados, é necessário que eles sejam manipulados,
transformados em alguns casos corrigidos. Esse processamento ocorre por meio de algumas
ferramentas de sistemas, essas ferramentas podem variar segundo o volume, a velocidade e a
variedade dos dados analisados, saindo de simples programas de análises das tabelas, como
Excel ou Google Sheets, a grandes sistemas de Big Data.
Apesar da grande diferença de sistemas capazes de serem usados para a análise de dados,
algumas etapas do processo continuam sempre similares, alterando somente a sua proporção,
assim podemos considerar que a grande maioria dos processos de análise de dados seguem
uma arquitetura em comum..
Nessa arquitetura podemos observar alguns pontos importantes e similares na grande maioria
dos processos de análise de dados:
Captura dos dados: dados podem vir de várias fontes, sejam de um sistema de medição de
sensores, de imagem de câmeras ou de um sistema de vendas. Esses dados devem ser
capturados dessas fontes para que possamos utilizá-los em nosso sistema.
Ingestão na base dados: após a captura do dado, é necessário armazená-los para nosso
uso, conforme o tipo e volume dos dados, eles podem ser armazenados em data lakes, em
bancos de dados ou até mesmo em simples arquivos Excel. Para essa etapa podemos
utilizar ferramentas de cloud (como Azure, Google Cloud ou AWS), bancos de dados (como
SQL Server, MongoDB, Postgres) ou editores de planilhas (Excel, Google Sheets).
Fluxo de análise e predição: o �uxo de análise de dados é a etapa de processamento e
transformação dos dados em informações, essa também é a etapa de criação de modelos
de machine learning. Para essa etapa, podemos utilizar ferramentas como editores de
planilha para análise simples (Excel, Google Sheets), linguagem de programação para
análises complexas ou criação de modelos de aprendizado de máquina (Python, R, Scala)
ou ferramentas de automação de machine learning – AutoML (Azure Studio, WansonX,
Google Vertex).
Apresentação dos resultados: a última etapa da arquitetura é a apresentação dos dados,
nessa etapa construímos grá�cos e tabelas que demonstram os resultados de maneira
clara e simples. Essas tabelas podem ser mostradas em dashboards, que são atualizados
automaticamente ou de reports, que apresentam uma visão dos dados em um período
especí�co. Para ela podemos utilizar ferramentas como editores de planilhas, que
permitem gerar grá�cos simples (Excel, Google Sheets), software de visualização de dados
(Power BI, Tableau) ou linguagem de programação (Python, R).
Podemos perceber uma similaridade desses pontos analisados, com o processo de Data Driven
demonstrado anteriormente, é importante frisar que eles não representam o mesmo processo,
porém são complementares um ao outro. O processo de Data Driven apresentado inicialmente é
responsável por organizar as etapas de um projeto, enquanto a arquitetura apresentada é uma
demonstração técnica de como um sistema computacional pode realizar a transformação do
dado em informação.
Disciplina
Pensamento Analítico e Análise
de Dados
Exemplo prático
Para que todo esse processo de arquitetura seja criado, é necessário pro�ssionais
especializados. O número de cargos e funções necessárias pode variar conforme o tamanho da
empresa e da análise feita, por exemplo, análises com poucos dados podem ser feitas com
apenas um funcionário analista, mas em empresas grandes que utilizam processos de Big Data,
é necessária uma série de pro�ssionais diferentes, esses pro�ssionais se dividem em algumas
funções, são elas:
Engenheiro de dados: especialista em bancos de dados e Big Data, ele é responsável pelo
processo de captura do dado da fonte original e de ingestão desse dado no data lake ou na
base de dados utilizada, bem como pela manutenção dos bancos de dados.
Cientista de dados: é o especialista responsável pela análise dos dados, bem como pela
criação dos modelos de inteligência arti�cial. Ele utiliza uma grande base estatística e de
aprendizado de máquina para conseguir extrair as informações necessárias dos dados.
Analista de dados: é o pro�ssional mais próximo da equipe de negócio, ele é responsável
por criar os grá�cos e as tabelas que apresentam os resultados para as partes envolvidas
no negócio. Ele deve ter um bom conhecimento do objetivo �nal e da área de negócio no
qual o projeto está envolvido.
Disciplina
Pensamento Analítico e Análise
de Dados
Engenheiro de machine learning: é o pro�ssional que tem uma visão geral de todo o
processo e cria o �uxo completo pelo qual os dados irão passar, garantindo que cada etapa
ocorra de maneira correta e possa se reproduzir novamente. Ele também tem o
conhecimento das ferramentas de todo o processo e como elas se interagem.
Uma aplicação bastante prática do Data Driven na engenharia pode ser observada em uma
empresa de manufatura que utiliza sensores incorporados em máquinas de produção. Nela, os
colaboradores coletam dados em tempo real sobre temperatura, vibração e e�ciência
operacional. Esses dados são analisados para identi�car padrões que precedem falhas de
equipamento. Como resultado, a empresa tem a oportunidade de implementar uma estratégia e
um plano de ação de manutenção preditiva, substituindo peças antes que falhem.
Considerando essa aplicação, percebe-se que o impacto é signi�cativo para a empresa, que
reduz os custos de manutenção corretiva, evita paradas não planejadas e aumenta a vida útil de
seus equipamentos. Essa abordagem não apenas otimiza a e�ciência operacional, mas também
demonstra como os dados podem ser transformados em ações tangíveis, gerando benefícios.
Além desse caso especí�co, o Data Driven também possui aplicações em diversas áreas da
engenharia, como:
Monitoramento ambiental: por meio de sensores, coleta dados sobre qualidadedo ar, níveis
de poluição e outros fatores ambientais para informar decisões em projetos de
infraestrutura.
Projeto de sistemas de energia: analisa dados para otimizar o design e operação de
sistemas de energia, levando a uma produção mais e�ciente e sustentável.
Projetos estruturais: podem aplicar dados para monitorar a integridade de estruturas, prever
manutenções necessárias e garantir a segurança em construções civis.
Gerenciamento de recursos hídricos: utiliza dados para monitorar o uso da água, prever
demandas futuras e otimizar o gerenciamento de recursos hídricos em projetos de
engenharia.
Desenvolvimento de veículos inteligentes: coleta e analisa dados para melhorar a e�ciência
e segurança de veículos autônomos, integrando sistemas avançados de sensores.
Percebe-se que o Data Driven na engenharia não é apenas uma prática, mas uma mudança de
paradigma que impulsiona a e�ciência e a inovação. Ao adotar essa abordagem, os pro�ssionais
e organizações são capacitados a tomar decisões mais informadas, antecipar desa�os e
transformar dados brutos em resultados tangíveis.
Videoaula: Importância do data driven na engenharia
Este conteúdo é um vídeo!
Para assistir este conteúdo é necessário que você acesse o AVA pelo
computador ou pelo aplicativo. Você pode baixar os vídeos direto no aplicativo
Disciplina
Pensamento Analítico e Análise
de Dados
para assistir mesmo sem conexão à internet.
Data Driven é uma cultura de tomada de decisão, na qual as decisões são baseadas em dados.
Neste vídeo serão apresentados os conceitos gerais do Data Driven. Para isso será apresentado
um conceito formal de dados e suas divisões, qual o processo padrão para uma tomada de
decisão baseada nesses dados, quais os tipos de problemas que podemos abordar, os
pro�ssionais que estão presentes nesse modelo de tomada de decisões, além de uma breve
apresentação de uma arquitetura simples de Big Data para criação de modelos analíticos. Por
�m, será apresentado um exemplo real e prático de como o Data Driven pode ajudar uma
empresa na manutenção de equipamentos.
Saiba mais
Aprofundamento sobre a cultura Data Driven (ou orientada a dados)
Se você deseja se aprofundar mais na cultura Data Driven para análise de dados, faça a leitura
complementar do artigo intitulado A cultura Data Driven (orientada por dados) e o COMEX, dos
autores Leandro Carelli Barreto e Ana Fragoso.
Ao explorar esse recurso, você se preparará para aplicar o Data Driven de forma prática no
ambiente de trabalho, até em áreas distintas à de transportes marítimos, a qual é o foco deste
https://www.portosenavios.com.br/artigos/artigos-de-opiniao/artigo-a-cultura-data-driven-orientada-por-dados-e-o-comex
https://www.portosenavios.com.br/artigos/artigos-de-opiniao/artigo-a-cultura-data-driven-orientada-por-dados-e-o-comex
https://www.portosenavios.com.br/artigos/artigos-de-opiniao/artigo-a-cultura-data-driven-orientada-por-dados-e-o-comex
Disciplina
Pensamento Analítico e Análise
de Dados
artigo. Bom aprendizado!
Referências
CHAVES, M. C. S. Utilizando aprendizado de máquina para predizer falhas na Ferrovia.
Estatidados, [s. d.]. Disponível em: http://estatidados.com.br/utilizando-aprendizado-de-maquina-
para-predizer-falhas-na-ferrovia/. Acesso em: 14 set. 2023.
BARRETO, L.; FRAGOSO, A. A cultura Data Driven (orientada por dados) e o Comex! Portos e
Navios, 7 jun. 2023. Disponível em: https://www.portosenavios.com.br/artigos/artigos-de-
opiniao/artigo-a-cultura-data-driven-orientada-por-dados-e-o-comex. Acesso em: 7 dez. 2023.
DIETRICH, D. et al. Data science & big data analytics: discovering, analyzing, visualizing and
presenting data. Indianapolis: Wiley, 2015.
GAUTAM, A. 6 phases of data analysis according to Google. Medium, 2021. Disponível em:
https://medium.com/codex/6-phases-of-data-analysis-according-to-google-9e084b89f848.
Acesso em: 14 set. 2023.
PRAJAPATI, V. Understanding the data analytics project life cycle. Pingax, 2013. Disponível em:
https://pingax.com/understanding-data-analytics-project-life-cycle/. Acesso em: 14 set. 2023.
THE WORLD’S most valuable resource is no longer oil, but data. The Economist, 6 maio 2017.
Disponível em: https://www.economist.com/leaders/2017/05/06/the-worlds-most-valuable-
resource-is-no-longer-oil-but-data. Acesso em: 7 dez. 2023.
USGS. Data lifecycle. [s. d.]. Disponível em: https://www.usgs.gov/data-management/data-
lifecycle. Acesso em: 14 set. 2023.
http://estatidados.com.br/utilizando-aprendizado-de-maquina-para-predizer-falhas-na-ferrovia/
http://estatidados.com.br/utilizando-aprendizado-de-maquina-para-predizer-falhas-na-ferrovia/
https://www.portosenavios.com.br/artigos/artigos-de-opiniao/artigo-a-cultura-data-driven-orientada-por-dados-e-o-comex
https://www.portosenavios.com.br/artigos/artigos-de-opiniao/artigo-a-cultura-data-driven-orientada-por-dados-e-o-comex
https://medium.com/codex/6-phases-of-data-analysis-according-to-google-9e084b89f848
https://pingax.com/understanding-data-analytics-project-life-cycle/
https://www.economist.com/leaders/2017/05/06/the-worlds-most-valuable-resource-is-no-longer-oil-but-data
https://www.economist.com/leaders/2017/05/06/the-worlds-most-valuable-resource-is-no-longer-oil-but-data
https://www.usgs.gov/data-management/data-lifecycle
https://www.usgs.gov/data-management/data-lifecycle
Disciplina
Pensamento Analítico e Análise
de Dados
Aula 2
Aprendizado de máquina
Introdução
Sistemas de segurança baseados em reconhecimento facial, chatbots que parecem humanos
conversando, carros com direção autônoma, sistemas de detecção de incêndio em �orestas por
imagem de satélite, programas capazes de detectar câncer de pele através de imagem e
modelos que criam imagem ou músicas inovadoras. Todos esses são exemplos de sistemas
criados através de algoritmos de aprendizado de máquina. Este modelo de algoritmo permite que
o computador “aprenda” através de dados, reconhecendo os padrões que muitas vezes nem os
especialistas são capazes de encontrar. Eles podem aprender por tentativa (penalizando seus
erros e premiando seus acertos), aglomerando ou simpli�cando dados, ou através de análises de
similaridade. No entanto, este tipo de algoritmo sempre tem como propósito encontrar a melhor
função matemática que permita chegar a um determinado objetivo, seja este detectar um objeto
em uma imagem ou prever ações futuras. Os algoritmos utilizados para realizar estas tarefas
utilizam dados.
Modelos de aprendizado
Disciplina
Pensamento Analítico e Análise
de Dados
O aprendizado de máquina é uma subárea da inteligência arti�cial focada em identi�car padrões.
Nesta área estão os algoritmos capazes de serem treinados a partir de dados. Este treinamento
acontece através da otimização de parâmetros de uma função matemática.
Neste modelo de algoritmo, o objetivo é encontrar a função, da qual dado um grupo de dados X,
normalmente chamado de variáveis preditoras (features), encontramos um valor y, chamado de
variável alvo (target). Este modelo pode ser simpli�cado com a função a seguir:
Logo, estes algoritmos permitem chegar a uma função que nos dá o valor pretendido a partir de
uma série de características. Por exemplo, é possível criar um algoritmo capaz de “aprender”
automaticamente como calcular o índice de massa corporal (IMC) de uma pessoa por meio de
dados de altura e peso, sem a necessidade de conhecer a fórmula do IMC. Neste exemplo, os
dados de peso e altura representam a variável X, e o IMC seria a variável alvo, y.
Estes algoritmos se dividem majoritariamente em três grupos: os algoritmos de aprendizado
supervisionado, aprendizado não supervisionado e aprendizado por reforço. Os dois primeiros
modelos são os algoritmos mais pesquisados e utilizados atualmente, assim o foco dessa aula
será colocado sobre eles.
Algoritmos de aprendizado supervisionado
Nos algoritmos de aprendizado supervisionado, para que ocorra o aprendizado, é necessário que
tenhamos, inicialmente, dados com o valor da variável alvo (o valor y) a ser calculado.
Por exemplo, no cálculodo IMC, se utilizarmos um algoritmo de aprendizado de máquina, é
necessário que, para algumas pessoas, além dos dados de peso, altura, tenhamos também o
IMC já calculado. A partir destes dados, o algoritmo criará a função de cálculo, a qual podemos
utilizar para calcular o IMC das demais pessoas.
f(X) = y
Disciplina
Pensamento Analítico e Análise
de Dados
Estes algoritmos podem resolver uma série de problemas diferentes, conforme o tipo de dado
que queremos calcular, porém os três tipos de problema mais abordados são:
Problemas de regressão: neste tipo de problema, a variável resposta é um valor numérico
contínuo, ou seja, ela pode ser qualquer número. Estes modelos envolvem problemas
como: preci�cação de produtos, cálculo de score, cálculo de valor de crédito, cálculo de
quantidade ótima de um determinado produto. O modelo de machine learning mais
clássico para esse problema é a função de regressão linear, porém também é bem comum
utilizar outros modelos, como: KNN (K-nearest neighbors, ou K-vizinhos mais próximos),
Árvores de decisão, Random Forest, Redes Neurais, XGboosting.
Problemas de classi�cação: nestes problemas, o objetivo é classi�car os dados em grupos,
assim a variável resposta é um valor que representa uma categoria, podendo ser
representado como 0 ou 1 (em que 1 signi�ca pertencente a um grupo e 0 signi�ca não
pertencente), ou pode ser representado como um conjunto de números, em que cada
número representa um grupo. Através destes modelos, podem ser resolvidos problemas,
por exemplo, a previsão se um cliente será inadimplente ou não, a previsão de evasão de
clientes, a previsão se um sistema terá falhas ou não, a classi�cação de um objeto em uma
imagem, a detecção de pacientes com uma determinada doença. Nestes modelos, o
objetivo da função-alvo não é encontrar o valor correto, mas, sim, a melhor separação entre
grupos. Para estes problemas, podemos utilizar modelos, como regressão logística, Naive
Bayes e SVM, ou podemos adaptar modelos de regressão, como as Árvores de decisão,
Random Forest, Redes Neurais ou XGboosting.
Problemas de forecast: estes problemas têm como objetivo prever um valor futuro
dependente de valores passados, como estimar a temperatura de um objeto nos próximos
30 minutos. Para calcular esse valor, é necessário conhecer o valor da temperatura atual.
Problemas de forecast são baseados em problemas de regressão, em que a variável
preditora representa o valor da variável alvo em momentos anteriores. No exemplo
mencionado, podemos calcular a temperatura de um objeto, observando o quanto essa
temperatura vem sendo alterada nas últimas duas horas, em intervalos de um minuto.
Apesar de podermos utilizar todos os modelos de regressão já mencionados, existem
modelos especí�cos para este tipo de problema: modelos AR, ARIMA ou Redes Neurais
Recorrentes.
Algoritmos de aprendizado não supervisionado
Nesta classe de algoritmo, para que o aprendizado ocorra, não é necessário que tenhamos
exemplos do valor-alvo (o valor y) a ser calculado.
No exemplo do IMC, nos nossos dados iniciais, é possível que não tenhamos nenhum dado com
o IMC previamente calculado, ou seja, para todas as pessoas, temos apenas o dado de altura e
peso. Neste caso, não podemos chegar à função exata de IMC, porém podemos dividir estes
dados em três grupos distintos e, ao analisar separadamente cada grupo, podemos descobrir
que o primeiro grupo tem um valor de peso muito alto em proporção à sua altura, o segundo tem
uma proporção mediana e o terceiro tem uma proporção baixa, algo que seria similar a alto, baixo
e médio IMC.
É importante avaliar que, neste modelo, não teremos certeza de que os grupos gerados
realmente re�etem os dados de IMC, então, após a criação dos grupos pelo modelo, é necessária
Disciplina
Pensamento Analítico e Análise
de Dados
uma análise de cada grupo para veri�car o que ele realmente representa.
Os algoritmos de aprendizado supervisionado também podem ser utilizados em diferentes tipos
de problema, dentre os quais, destacam-se:
Clusterização: algoritmos de clusterização têm como objetivo separar os dados em grupos.
Eles podem ser utilizados para problemas, como: separação de grupos de clientes com
diferentes per�s, algoritmos de recomendação, separação de diferentes tipos de produto.
Alguns dos algoritmos mais famosos para estes modelos são: KMeans, MeanShift, DBScan
e cluster
Redução de dimensionalidade: estes algoritmos têm como função encontrar as principais
variáveis de um grupo de dados. Podem ser utilizados para perceber quais são as
características que melhor descrevem um grupo ou para reduzir o número de variáveis que
deverão ser utilizados para treinar outros algoritmos, assim diminuindo o tempo de
treinamento.
Processo completo: Seleção de recursos, treinamento, validação e avaliação
de modelos
Disciplina
Pensamento Analítico e Análise
de Dados
Para construirmos o modelo de aprendizado, necessitamos passar por algumas etapas, as quais
podem ser entendidas como o processo de aprendizado de máquina, conforme segue:
1. Coleta dos dados: o recurso mais importante para um modelo de aprendizado de máquina
é o dado, assim o primeiro passo necessário é a coleta adequada do dado. Nesta etapa,
decidimos quais dados serão necessários e o local onde os dados serão armazenados.
Caso seja utilizado um modelo de aprendizado supervisionado, esta também é a etapa da
escolha (ou criação) dos dados da variável-alvo e da métrica de validação do modelo.
2. Preparação: os dados brutos, recebidos pela coleta de dados, costumam apresentar erros
ou inconsistências. Estas falhas precisam ser removidas ou corrigidas – esse processo de
correção é chamado de limpeza de dados. Também, é comum a criação de novos dados a
partir da manipulação dos dados brutos. Podemos, por exemplo, calcular a média móvel de
um valor, ou calcular o lucro de uma empresa a partir dos dados de venda e custos, criando,
assim, dados, em uma etapa que pode ser chamada de processamento dos dados.
3. Divisão dos dados: para avaliarmos um modelo de aprendizado de máquina, é necessário
treinarmos este modelo em um grupo de dados, prever o valor predito pelo modelo treinado
e comparar este valor com o valor real. Porém, os dados que utilizamos para treinar
in�uenciam na função criada pelo modelo e, quando colocarmos o modelo em uso, não
teremos o valor real da função. Desta forma, para sermos corretos em nossa avaliação,
precisamos testar o modelo com dados que não foram utilizados no treinamento. Para este
procedimento, existem algumas estratégias de separação dos dados para treino e testes.
Dentre as principais estratégias, podemos citar:
a. Treino/Teste/Validação: nesse modelo, o dado é separado em três grupos. O primeiro
grupo são os dados de treino, que serão utilizados para treinar um modelo supervisionado.
Dessa forma, o modelo recebe tanto as variáveis preditoras quando a variável-alvo e cria
uma função matemática para os dados. O segundo grupo é formado pelos dados de teste.
Esses dados não são utilizados no treinamento do modelo, porém, após treinado, eles são
utilizados para veri�car a qualidade do modelo; caso a qualidade não seja satisfatória,
podemos fazer alterações no modelo e treiná-lo novamente. Por �m, temos o grupo de
dados de validação. Após chegarmos a uma qualidade satisfatória do modelo, testamos
ele nos dados de validação: o resultado encontrado aqui será considerado o valor real da
qualidade do modelo.
Figura 1 | Exemplo de divisão de dados por treino/teste/validação. Fonte: elaborada pelo autor.
b. Cross Validade: neste modelo, o mesmo dado é divido em n partes, e cada parte é
chamada de fold. No processo de treino e teste, ocorrem n partes (mesmo número de
divisões). A cada treino, um fold diferente é escolhido para teste. Todos os demais são
utilizados para treino. Ao �nal, o modelo é avaliado, calculando a média das métricas
Disciplina
Pensamento Analítico e Análise
de Dados
calculadas a cada etapa de treino e teste. A imagem a seguir demonstra um pouco como
ocorremestas divisões.
Figura 2 | Exemplo de divisão de dados por cross validade com 5 folds. Fonte: elaborada pelo autor.
c. Análise temporal: modelos de análise temporal possuem uma peculiaridade: os dados
que ocorrem anteriormente são importantes para os dados que seguem na sequência.
Nestes modelos, não faz sentido utilizarmos dados de um evento posterior ao que
queremos calcular. Dessa forma, caso desejemos testar os dados utilizando a previsão de
um dia especí�co, só podemos utilizar dados que ocorram antes deste dia. Por isso, o
processo de treino e teste destes dados possui uma peculiaridade, isto é, os cortes são
feitos escolhendo o dia de teste e utilizando para treino apenas os dias anteriores a ele,
como na imagem a seguir.
Figura 3 | Exemplo de divisão de dados para modelo temporal. Fonte: elaborada pelo autor.
1. Treino: após separação dos dados coletados para o processamento, os quais serão
utilizados para treino e teste, chega o momento da escolha do modelo e do treino
propriamente dito. Esta etapa pode ser realizada de forma automática, ou com
customizações, criando um modelo de aprendizado de máquina especí�co.
2. Validação: após treinarmos o modelo, temos que testá-lo com os dados de teste e avaliar
sua performance, em um modelo supervisionado. Nesta etapa, aplicamos a função treinada
nas variáveis preditoras dos dados de teste e veri�camos se a resposta é similar à resposta
real dos dados. Caso o modelo apresente uma qualidade aceitável, podemos utilizá-lo em
nosso sistema �nal. Caso não apresente, podemos fazer apenas alterações no modelo e
voltar à etapa de treinamento. Já em um modelo de aprendizado não supervisionado,
podemos analisar a resposta do modelo, veri�cando se os agrupamentos ou as escolhas
do modelo fazem sentido para o nosso objetivo.
Disciplina
Pensamento Analítico e Análise
de Dados
3. Produção: por último, após criarmos um modelo com uma qualidade satisfatória, temos
que colocar este modelo em uso no sistema. Essa etapa é chamada de etapa de produção.
Nela, utilizamos os modelos treinados para prever dados novos. Com o tempo,
acompanhamos as respostas do modelo, para veri�car, em um cenário real, se ele
realmente apresenta a mesma qualidade que foi testada. É comum também os modelos
perderem qualidade ao longo do tempo, pois o contexto dos dados pode mudar, seja por
uma alteração na empresa ou no equipamento. Essa perda de qualidade é chamada de
data drift. É, portanto, necessário sempre monitorarmos o modelo no processo de
produção e, caso seja constatado o data drift, podemos voltar à etapa de treinamento e
atualizar o modelo.
Os modelos de aprendizagem aplicados
A aplicação dos modelos de regressão linear abre possibilidades para solucionar diversos
desa�os na busca da resposta de variáveis para funções complexas que não permitem a
realização de um cálculo analítico pelo desconhecimento do comportamento real dessas
variáveis.
Utilizando o modelo KNN (K-nearest neighbors, ou K-vizinhos mais próximos), podemos estimar o
preço de um produto com base nos preços dos produtos mais semelhantes. Essa abordagem é
Disciplina
Pensamento Analítico e Análise
de Dados
particularmente interessante em ambientes dinâmicos, onde as condições de contorno mudam
com uma velocidade relativamente grande.
As árvores de decisão representam outro modelo muito utilizado para determinar a quantidade
ótima de um item para maximizar os lucros. Essa técnica é bastante versátil e encontra aplicação
em problemas técnicos relacionados a problemas de qualidade, em que pode ser utilizada para
tomada de decisão no âmbito de resolução de problemas de qualidade e as suas
consequências.
O Random Forest é uma técnica que pode ser utilizada para prever o valor de crédito de um
cliente com base em diversas variáveis que são correlacionadas e estabelecem um padrão para
que possa ser determinado o valor do crédito do cliente.
Dentre os modelos que são utilizados para modelar problemas de classi�cação, utiliza-se muito
o SVM (Máquinas de Vetores de Suporte) para prever se um paciente tem uma determinada
doença com base em dados clínicos, por exemplo, e facilitar o estabelecimento de um
diagnóstico que permita a determinação de uma terapia adequada. Dentro do universo de
modelagem de problemas de classi�cação, cita-se também o Naïve Bayes, que permite
classi�car notícias em categorias, como política, esporte e entretenimento, o que facilita a
organização e o data mining em empresas que necessitam �ltrar informações para o
desenvolvimento de produtos ou serviços de forma mais assertiva, por exemplo, em conjunto
com outras ferramentas, como o benchmarking, necessário para garantir a competitividade no
mercado. Ainda referente aos modelos de modelagem para problemas de classi�cação, pode-se
mencionar o modelo de Regressão Logística. Neste modelo, podem ser classi�cadas
informações de acordo com palavras-chave que permitem a segregação de informações. Este
recurso pode ser utilizado para classi�car um e-mail como spam e segregá-lo no sistema.
Os problemas de previsão de dados são de extrema importância em todas as empresas,
principalmente para previsão das vendas e, assim, a alocação de recursos sob forma de
investimentos em maquinário, contratação de mão de obra quali�cada e campanhas
publicitárias. São informações estratégicas que trazem um ganho muito importante em
competitividade e assertividade de planejamento para as empresas. Os modelos AR
(Autorregressivos) ajudam na tarefa de prever a demanda de produtos no futuro baseado nas
demandas do passado.
No caso da previsão de produção de energia elétrica de curto prazo, baseado em padrões
sazonais, pode ser utilizada a modelagem com o ARIMA (Autorregressivos Integrados de Médias
Móveis).
As empresas estão fazendo muito uso do modelo RNN (Redes Neurais Recorrentes) para
problemas de previsão de dados futuros, baseado nos dados reais do passado. A previsão da
temperatura futura com base em histórico de dados de leitura de temperatura de sensores é uma
possível aplicação desse modelo.
De uma forma geral, todas as modelagens e suas aplicações apresentadas demonstram o
grande poder que estes recursos conferem no sentido de munir as empresas com ferramentas
que auxiliam na garantia de uma maior assertividade e segurança de planejamento.
Videoaula: Aprendizado de máquina
Disciplina
Pensamento Analítico e Análise
de Dados
Este conteúdo é um vídeo!
Para assistir este conteúdo é necessário que você acesse o AVA pelo
computador ou pelo aplicativo. Você pode baixar os vídeos direto no aplicativo
para assistir mesmo sem conexão à internet.
Aprendizado de máquina é uma subárea da inteligência arti�cial que permite que computadores
e sistemas “aprendam” através de dados. Essa é a técnica por trás de algoritmos de detecção de
face, chat boots que conversam como humanos ou modelos de previsão de falhas. Nesta
videoaula, vamos ver como é o processo dos modelos de aprendizado de máquina, quais são
suas divisões e quais problemas conseguimos resolver com estes modelos.
Saiba mais
Aprofundamento sobre algoritmos de aprendizado não supervisionado
Se você deseja se aprofundar mais em algoritmos de aprendizado não supervisionado para
análise de dados, utilize como referência de leitura complementar o artigo intitulado O que é
Aprendizado Não Supervisionado?, publicado pela empresa IBM.
Ao explorar esse recurso, você se preparará para aplicá-lo de forma prática tanto no ambiente de
trabalho quanto em áreas distintas daquelas elencadas neste artigo. Bom aprendizado!
https://www.ibm.com/br-pt/topics/unsupervised-learning#:~:text=Aprendizado%20n%C3%A3o%20supervisionado%2C%20tamb%C3%A9m%20conhecido,a%20necessidade%20de%20interven%C3%A7%C3%A3o%20humana
https://www.ibm.com/br-pt/topics/unsupervised-learning#:~:text=Aprendizado%20n%C3%A3o%20supervisionado%2C%20tamb%C3%A9m%20conhecido,a%20necessidade%20de%20interven%C3%A7%C3%A3o%20humana
Disciplina
Pensamento Analítico e Análise
de Dados
Referências
GOOGLE. What is Machine Learning?. Google Cloud,2023. Disponível em
https://cloud.google.com/learn/what-is-machine-learning. Acesso em: 14 set. 2023.
MATHWORKS. What Is Machine Learning?. Mathworks, 2023. Disponível em:
https://www.mathworks.com/discovery/machine-learning.html. Acesso em: 14 set. 2023.
THEOBALD, O. Machine learning for absolute beginners. London, UK: Scatterplot Press, 2017
Aula 3
Técnicas de análise de Big Data
Introdução
https://cloud.google.com/learn/what-is-machine-learning
https://www.mathworks.com/discovery/machine-learning.html
Disciplina
Pensamento Analítico e Análise
de Dados
Atualmente no Brasil existem mais smartphones do que habitantes, e cada um desses
dispositivos é uma grande fonte de dados, seja coletado dos seus sensores ou publicados pelos
próprios usuários nas redes sociais. Essa quantidade de dispositivos e seus usuários permitem
que a cada minuto 208 mil pessoas participem de reuniões pelo Zoom, 70 mil pessoas se
cadastrem em novas vagas e o YouTube ganha 500 novas horas de vídeo. Isso demonstra um
pouco da quantidade de dados que são gerados a cada minuto.
Esses números gigantescos e essa velocidade enorme de dados faz as ferramentas tradicionais
de armazenamento e processamento não serem capazes de extrair informações e decisões,
assim se tornou necessária a criação de várias novas técnicas e tecnologias, criando até uma
nova área da computação, focada no processamento e armazenamento de grandes volumes de
dados, chamada de processamento de Big Data.
O que é Big Data?
Disciplina
Pensamento Analítico e Análise
de Dados
Big Data é um conjunto de dados tão grande e complexo que modelos tracionais não são
capazes de processá-los ou armazená-los, sendo necessário novas tecnologias e sistemas para
gerenciá-los. Esses conjuntos de dados podem variar em forma, valores ou objetivos.
A maioria dos especialistas caracterizam um conjunto de dados como Big Data por conterem
três atributos em comum, que são chamados dos 3Vs do Big Data, são eles: volume, velocidade e
variedade, porém alguns autores também incluem dois atributos a mais, completando 5Vs, esses
dois atributos extras são veracidade e valor. Vamos detalhar melhor cada atributo:
Volume: é o conceito que mais se refere ao “Big” do Big Data, ele se refere à quantidade de
dados que são processados e arquivados nas bases. Nesse cenário podemos encontrar
bases ou tabelas que ultrapassem 1 Terabyte (1.000 GigaBytes), uma quantidade de dados
que um computador pessoal normal não contém de espaço total de armazenamento.
Sendo assim, são necessários computadores especí�cos para armazená-las. Um exemplo
desses enormes números é que em 2014 estimava-se que na internet circulava um volume
de 250 Exabytes (um Exabyte vale 1000000 TeraBytes) por ano, quase 1 Exabyte por dia.
Velocidade: pode ser a caraterística mais estratégia do Big Data, pois vários sistemas
atuais precisam de processamento em tempo real. Podemos perceber a diferença dessa
característica em diversos problemas do cotidiano, a�nal não queremos esperar minutos
para que nossa compra no cartão de crédito seja processada, mas caso essa compra seja
feita por alguém aplicando um golpe, queremos que ela seja cancelada antes mesmo do
seu processamento, outro exemplo é o fato de que quase todos nós já tivemos a péssima
Disciplina
Pensamento Analítico e Análise
de Dados
experiência de escutar um vizinho gritando gol antes de nossa televisão transmitir a jogada
devido a um atraso no sistema. Nesses dois casos a velocidade de processamento e
transmissão é crucial para o sistema, dando uma vantagem à empresa que processa e
transmite o dado mais rápido.
Variedade: os dados podem ter diversas formas e formatos, podemos fazer análises em
vídeos de esportes, em sensores de equipamentos, em textos publicados em redes sociais
ou valores referentes a uma operação �nanceira, cada um dos dados descritos é
armazenado em formatos diferentes e precisam de técnicas especi�cas para análises. Por
exemplo, um algoritmo de reconhecimento de face de em uma imagem recebe dados muito
diferentes de um algoritmo de previsão de vendas de uma empresa. Sistemas de Big Data
são capazes de armazenar e processar esses diferentes formatos e tipos de dados.
Veracidade: ter uma enorme quantidade de dados não é su�ciente para extrairmos
informação válida de um sistema de Big Data, também é necessário que esses dados
re�itam a realidade, ou seja, que eles sejam con�áveis e representativos. Se �zermos uma
pesquisa para veri�car a qualidade de uma série de televisão, porém apenas coletarmos
dados vindo do fã clube da série, teremos uma análise que não re�ete o público geral.
Também podemos ter problemas de veracidade ao fazer uma análise para um sistema de
entregas e calcularmos a distância entre dois locais como a distância em linha reta,
enquanto o entregador terá que seguir um percurso diferente pelas ruas, que será muito
maior que a distância calculada.
Valor: por �m, toda a informação criada através de uma análise em Big Data, deve ser feita
visando algum propósito especí�co, o resultado desse propósito visa gerar algum valor à
empresa e ao analista. Esse valor pode ser monetário, através de uma análise que encontre
maneiras de a empresa diminuir o custo de um determinado processo, ou pode ser um
valor agregado à pesquisa, como a descoberta cientí�ca ao analisar dados de imagens de
satélites.
Cabe ainda mencionar que a utilização de técnicas de análise de Big Data, como a análise
descritiva, a análise exploratória e a análise de redes sociais, desempenha um papel fundamental
na extração de insights a partir de conjuntos de dados. Essas técnicas são essenciais para
enfrentar os desa�os associados ao Big Data, oferecendo uma compreensão profunda, revelando
padrões complexos e fornecendo informações valiosas para orientar decisões estratégicas. A
seguir, apresentaremos as principais de�nições dessas técnicas:
A análise descritiva em Big Data visa compreender e resumir as características
fundamentais dos dados. Ela envolve a utilização de estatísticas descritivas, grá�cos e
técnicas de resumo que permitem obter uma visão geral do conjunto de dados.
A análise exploratória em Big Data é uma abordagem mais aprofundada e interativa. Ela
envolve a investigação mais detalhada dos dados para descobrir padrões, relações e
tendências.
A análise de redes sociais em Big Data concentra-se na compreensão das relações e
interações entre entidades em um conjunto de dados. Em contextos sociais, podem ser
Disciplina
Pensamento Analítico e Análise
de Dados
pessoas, organizações ou qualquer outro componente com o qual as interações são
registradas.
Armazenamento, processamento e cloud
Aprofundando sobre as técnicas de análise de Big Data, primeiramente vamos compreender a
análise descritiva em ambientes de Big Data. A análise descritiva em Big Data pode incluir a
geração de estatísticas de resumo para grandes volumes de dados, como médias, medianas,
desvios-padrão, entre outros. A visualização de dados é uma parte essencial da análise descritiva
em Big Data, e ferramentas especializadas podem ser usadas para criar grá�cos e visualizações
interativas que facilitam a interpretação dos resultados. A análise exploratória em Big Data, por
sua vez, utiliza técnicas como clustering (agrupamento) e técnicas de redução de
dimensionalidade que podem ser aplicadas para identi�car estruturas complexas nos dados.
Dessa forma, a análise exploratória muitas vezes inclui a exploração visual de dados e pode ser
usada para formular hipóteses que podem ser testadas posteriormente com técnicas mais
avançadas. Essa abordagem é muito importante para descobrir insights inesperados e levantar
questões que podem orientar análises mais aprofundadas. Por �m, a análise de redes sociais
pode envolver a criação de grafos, em que os nós representam entidades e as arestas
representam as relações entre elas. Métricas como centralidade, densidade e modularidade
Disciplina
Pensamento Analítico e Análise
de Dados
podem ser calculadaspara entender a estrutura da rede. Algoritmos de detecção de
comunidades podem ser aplicados para identi�car grupos de entidades mais interconectadas.
Figura 1 | Grafo. Fonte: Wikipedia.
Agora, também precisamos nos atentar ao fato de que para que uma grande quantidade de
dados seja transformada em informação, é necessário o uso de técnicas especí�cas, tanto de
armazenamento, processamento ou até mesmo na arquitetura utilizada no sistema. Neste
momento, vamos focar na questão do armazenamento.
Armazenamento
Em modelos tracionais temos uma menor quantidade e variedade de dados, o que nos permite
armazená-los com maior organização, normalmente encontramos os dados armazenados em
bancos de dados relacionais. Já nos ambientes de Big Data, os dados têm maior variedade e
quantidade, o que nos obriga a criamos modelos de armazenamento mais �exíveis, como Data
Lakes e Data Warehouse. Vamos detalhar esses modelos:
Bancos de dados relacionais: em sistemas tradicionais é comum salvarmos os dados em
formatos de tabelas, similares às encontradas em ferramentas como o Excel. Essas tabelas
se relacionam através de colunas em comum. Por exemplo, podemos ter uma tabela que
mostre as vendas de uma empresa com dados do produto vendido, quantidade e valor.
Essa tabela pode se relacionar à tabela que contém informações detalhadas de produtos,
produtos a partir de uma coluna de id em comum. Esse modelo de base de dados, apesar
de ser muito utilizado tem limitações, ele não é e�ciente para se trabalhar com grande
quantidade de dados, além de não ser possível armazenar formatos diferentes de arquivos.
Data Lakes: são os modelos de armazenamentos mais utilizados em Big Data. Eles
permitem o armazenamento de qualquer tipo de dados, desde imagens a tabelas, assim
temos �exibilidade para trabalhar com qualquer tipo de arquivo, porém para ter essa
�exibilidade temos que abrir mão de organização, assim os dados nos data lake podem
Disciplina
Pensamento Analítico e Análise
de Dados
conter muitos erros, ou terem formatos complexos que di�cultam as análises.
Normalmente esse modelo de armazenamento é similar a sistemas de arquivos de um
computador, onde podemos salvar qualquer tipo de arquivos em pastas.
Data Warehouse: é o meio do caminho entre o Data Lake e os bancos de dados relacionais.
Nele podemos armazenar uma variedade maior de formatos de dados, podendo ser de
tabelas a dados semiestruturados, porém os dados armazenados nesse formato não
passam por uma fase de processamento inicial, que permite uma correção mínima dos
erros, e criação de metadados que facilitam sua organização.
Exemplo prático
Processamento
Existem duas formas principais de processamento de dados de Big Data, são os
processamentos em batch e processamentos próximos ao tempo real (real time).
Batch: neste tipo de processamento os dados são processados em pacotes, ou seja, em
grupos de dados. O processamento pode ocorrer sempre em um período �xo, como um
Disciplina
Pensamento Analítico e Análise
de Dados
boletim diário de vendas de uma empresa, ou quando o pacote gera algum gatilho. Como
exemplo, um relatório que ocorre sempre que um usuário gasta um valor pré-determinado.
Real time: neste formato os dados são processados no momento que chegam ao sistema,
por exemplo, pode ser feita uma veri�cação de fraude toda vez que uma compra é feita em
um cartão de crédito. Essa veri�cação deve ser feita antes da con�rmação da transação.
Este formato é sempre focado na velocidade, assim os serviços são processados antes
mesmo que sejam armazenados.
Arquitetura
O volume e a velocidade dos dados gerados em sistemas de Big Data são tão grandes que se
torna inviável trabalharmos com apenas uma máquina ou um computador, algumas bases são
tão grandes que não existe computador nenhum capaz de armazená-las. Assim é necessária a
criação de arquiteturas especí�cas, e a principal solução tomada é dividir os dados em vários
computadores diferentes. Desse modo, cada um pode processar (ou armazenar) uma parte
especí�ca dos dados, que no �nal tem a solução agrupada por um computador central.
Esse modelo de computação descentralizada também permite que o processamento ocorra em
sistemas que estão no mesmo lugar, apenas se comunique através da internet. Algumas
empresas se aproveitam desse modelo de computação, vendendo serviços de processamento
ou armazenamento on-line para projetos de Big Data, criando assim as famosas “nuvens”.
A nuvem na computação são as que se caracterizam por ser modelo de negócio, em que as
empresas oferecem serviços e recursos de computação através da internet, normalmente esses
serviços são cobrados por demanda. Existem três principais tipos de serviços oferecidos em
nuvem e eles são divididos em IaaS (infraestrutura como serviço), PaaS (plataforma como
serviço) e SaaS (software como serviço).
IaaS: neste modelo de negócio as empresas oferecem uma infraestrutura on-line, é o mais
próximo que a empresa pode oferecer de um computador físico. Nele o usuário tem acesso
ao sistema operacional (Linux, Windows ou IOS) através de rede, esse sistema será
executado através de virtualização, em um servidor da empresa fornecedora e o usuário
poderá utilizar em seu próprio computador através da internet. O usuário tem a
possibilidade de escolher quanto de recurso ele necessita nesse sistema, personalizando,
por exemplo, a quantidade de CPUs ou memória terá.
PaaS: neste modelo o usuário tem acesso a uma plataforma que permite programação,
personalização ou criação de serviços. Ele pode ser encontrado em sistema de
gerenciamentos de banco de dados on-line, onde o usuário utiliza um sistema que permite
que ele crie e gerencie um banco de dados próprio. Outro exemplo desse modelo é um
sistema que permite criação de sites on-line, nele utiliza um sistema para personalizar o
seu próprio site para que uma próxima pessoa utilize.
SaaS: neste modelo o usuário apenas utiliza um sistema on-line, essa é a maneira mais
utilizada atualmente, porém muitas vezes seus usuários não têm conhecimento de que
estão utilizando um sistema em nuvem. Podemos ver esse modelo quando utilizando as
Disciplina
Pensamento Analítico e Análise
de Dados
ferramentas como o Google Maps e a versão on-line do O�ce 365 ou um editor de imagens
on-line.
Técnicas de análise
Agora vamos ver um exemplo de aplicação dessas técnicas. Considere um projeto de engenharia
voltado para a implementação de uma fazenda solar. A análise descritiva seria inicialmente
aplicada para resumir dados, como a produção diária de energia, padrões sazonais e e�ciência
dos painéis solares. Isso fornece uma visão geral dos aspectos fundamentais do projeto. Já a
análise exploratória seria empregada para investigar padrões mais complexos, como correlações
entre a produção de energia e fatores ambientais, como luz solar, temperatura e condições
atmosféricas. Essa análise detalhada poderia revelar insights sobre como otimizar a e�ciência
do sistema em diferentes condições climáticas. Por �m, a análise de redes sociais pode ser
aplicada para entender as interações entre pessoas que participam da produção ou os
componentes do sistema, como inversores, baterias e medidores de energia. Isso seria essencial
para garantir uma integração e�ciente e coordenada de todos os elementos do projeto.
Sendo assim, a aplicação dessas técnicas de análise de Big Data é de extrema importância para
a inovação, otimizando processos, aprimorando a e�ciência e garantindo decisões
fundamentadas em dados para enfrentar os desa�os complexos do mundo pro�ssional.
Videoaula: Técnicas de análise de Big Data
Este conteúdo é um vídeo!
Para assistir este conteúdo é necessário que você acesse o AVA pelo
computador ou pelo aplicativo. Você pode baixar os vídeos direto no aplicativo
para assistir mesmo sem conexão à internet.
A quantidade de dados gerada atualmente no mundo é enorme, seja através das leituras das
empresas ou de dados gerados pelos smartphones e redes sociais. Devido a esse enorme
volume e velocidadedos dados, torna-se inviável utilizar sistemas tradicionais de
armazenamento e processamento. Visando resolver esse problema, surgiu o termo Big Data, uma
área voltada para o processamento e armazenamento de grandes volumes de dados. Nesta
videoaula serão ensinados os conceitos desta área, mostrando suas de�nições através dos 5 Vs
do Big Data, seus modelos de armazenamento e processamento, bem com as arquiteturas
utilizadas, também serão apresentadas as ferramentas mais utilizadas.
Saiba mais
Disciplina
Pensamento Analítico e Análise
de Dados
Aprofundamento sobre Big Data
Se você deseja se aprofundar mais sobre Big Data, leia o artigo intitulado Uma análise das
relações entre a qualidade das informações e Big Data, dos autores Priscila Bastos Fagundes,
Douglas Dyllon de Jerônimo Macedo e Moisés Lima Dutra.
Ao explorar esse recurso, você se preparará para aplicar conhecimentos no ambiente de trabalho,
até em áreas distintas às tratadas neste artigo. Bom aprendizado!
Referências
https://periodicos.ufpb.br/index.php/itec/article/view/40182/21045
https://periodicos.ufpb.br/index.php/itec/article/view/40182/21045
https://periodicos.ufpb.br/index.php/itec/article/view/40182/21045
https://periodicos.ufpb.br/index.php/itec/article/view/40182/21045
Disciplina
Pensamento Analítico e Análise
de Dados
FAGUNDES, P. B.; MACEDO, D. D. J. de; DUTRA, M. L. Uma análise das relações entre a qualidade
da informação e Big Data. Informação & Tecnologia (ITEC), v. 4, n. 2, p. 206–220, jul./dez. 2017.
Disponível em: https://periodicos.ufpb.br/index.php/itec/article/view/40182/21045. Acesso em:
7 dez. 2023.
GOOGLE CLOUD. O que é Big Data? Google Cloud, [s. d.]. Disponível em:
https://cloud.google.com/learn/what-is-big-data?hl=pt-br. Acesso em: 7 out. 2023.
GTA. Os 5 V's do Big Data. Rio de Janeiro: Universidade Federal do Rio de Janeiro, [s. d.].
Disponível em:
https://www.gta.ufrj.br/grad/15_1/bigdata/vs.html#:~:text=A%20proposta%20de%20uma%20sol
u%C3%A7%C3%A3o,a%20Veracidade%20e%20o%20Valor. Acesso em: 7 out. 2023.
ORACLE BRASIL. O que é Big Data? Oracle Brasil, [s. d.]. Disponível em:
https://www.oracle.com/br/big-data/what-is-big-data/ acesso em: 7 out. 2023.
SALESFORCE BRASIL. O que é Data Warehouse e Data Lake? Property Salesforce Brasil Blog,
2020. Disponível em: https://www.salesforce.com/br/blog/data-warehouse-e-data-lake/. Acesso
em: 7 out. 2023.
TOTVS. Big Data: o que é, para que serve, como aplicar e exemplos. TOTVS, 2023. Disponível em:
https://www.totvs.com/blog/inovacoes/big-data/. Acesso em: 7 out. 2023.
Aula 4
Aplicações práticas de data driven na engenharia
https://periodicos.ufpb.br/index.php/itec/article/view/40182/21045
https://cloud.google.com/learn/what-is-big-data?hl=pt-br
https://www.gta.ufrj.br/grad/15_1/bigdata/vs.html#:~:text=A%20proposta%20de%20uma%20solu%C3%A7%C3%A3o,a%20Veracidade%20e%20o%20Valor
https://www.gta.ufrj.br/grad/15_1/bigdata/vs.html#:~:text=A%20proposta%20de%20uma%20solu%C3%A7%C3%A3o,a%20Veracidade%20e%20o%20Valor
https://www.oracle.com/br/big-data/what-is-big-data/
https://www.salesforce.com/br/blog/data-warehouse-e-data-lake/
https://www.totvs.com/blog/inovacoes/big-data/
Disciplina
Pensamento Analítico e Análise
de Dados
Introdução
Técnicas de aprendizado de máquina, aliadas à grande quantidade de dados provenientes de
sistemas de Big Data, permitem que empresas de diferentes ramos apliquem metodologias
baseadas em Data Driven para seus projetos, alcançando, assim, grandes resultados.
Após apresentar separadamente os conceitos iniciais de Data Driven, aprendizado de máquina e
Big Data, focaremos, agora, em exemplos práticos e reais dessas técnicas e tecnologias em
funcionamento. Nesta aula, apresentaremos três exemplos de sucesso da cultura de Data Driven
em ação.
Vivendo o data driven
Disciplina
Pensamento Analítico e Análise
de Dados
A cultura do Data Driven (orientada por dados) envolve uma abordagem organizacional que
valoriza a tomada de decisão baseada em dados concretos e análises objetivas, em vez de
depender exclusivamente de intuição, experiência ou opiniões subjetivas. Essa cultura promove a
coleta, a análise e a interpretação de dados para embasar decisões e estratégias em diversos
setores e níveis de uma organização. O conceito do Data Driven envolve uma coleta de dados
sistemática, utilizando fontes diversi�cadas. Empresas buscam dados provenientes de várias
fontes, como transações, interações de clientes, redes sociais, feedbacks, sensores, entre outros.
Quanto à qualidade dos dados, deve ser priorizada a qualidade e precisão dos dados para
garantir que as análises sejam con�áveis. No tocante à análise de dados, ferramentas e técnicas
analíticas, como estatísticas, aprendizado de máquina e visualização de dados, para extrair
insights signi�cativos, são utilizados.
É realizada uma análise preditiva com a implementação de modelos de previsão para antecipar
tendências e comportamentos futuros com base em dados históricos.
As tomadas de decisão são baseadas em dados concretos e descentralizados, o que demanda a
capacitação de equipes em todos os níveis para tomar decisões informadas com base em dados
relevantes.
Faz parte do conceito e da cultura do Data Driven o feedback contínuo envolvendo um ciclo
contínuo de análise, a decisão e a avaliação com base em dados, permitindo adaptação rápida às
Disciplina
Pensamento Analítico e Análise
de Dados
mudanças dentro de um ambiente de cultura colaborativa, no qual ocorre o compartilhamento de
conhecimento, sempre sendo estimulada a comunicação aberta e o compartilhamento de
insights entre diferentes equipes e departamentos. Essa interdisciplinaridade garante a
integração de habilidades analíticas em diversas áreas, como marketing, operações, recursos
humanos e �nanças.
Esse ambiente nos traz para outro conceito básico elementar: o foco no cliente. O entendimento
do cliente e a utilização de dados para compreender as necessidades, as preferências e os
comportamentos dos clientes permite uma personalização com a oferta de produtos, serviços e
experiências personalizadas com base nas informações coletadas.
Outro aspecto de grande relevância é a segurança e privacidade. O respeito à privacidade envolve
a adoção de práticas éticas em relação à coleta e ao uso de dados, garantindo conformidade
com regulamentações de privacidade e ajudando a construir uma imagem de credibilidade e
con�ança.
A mensuração de resultados representa uma premissa básica para permitir a instalação de um
processo de melhoria contínua que é de extrema importância no ambiente de competição atual.
Indicadores-chave de Desempenho (KPIs) garantem o estabelecimento de metas, e o seu
monitoramento permite avaliar o desempenho com base em dados reais e concretos. Este
monitoramento está diretamente aliado ao aprendizado contínuo, que permite uma re�exão
sistemática, visando sempre à documentação das lições aprendidas que são transformadas em
melhores práticas ou em planos de ação, quando são necessárias correções nos rumos para o
atingimento das metas.
A implementação bem-sucedida de uma cultura Data Driven pode resultar em decisões mais
informadas, e�ciência operacional, identi�cação de oportunidades de crescimento e maior
capacidade de adaptação às mudanças no ambiente de negócios. É uma abordagem essencial
em um cenário onde os dados desempenham um papel cada vez mais crucial no sucesso
organizacional.
O funcionamento do data driven
Disciplina
Pensamento Analítico e Análise
de Dados
Diversas áreas podem se bene�ciar da cultura de Data Driven, seja em exemplos de empresas de
engenharia, com cálculos de falhas de equipamentos ou análises de viabilidade �nanceira para
licitações, até mesmo em áreas da saúde, com análise de casos de doenças ou e�cácia de
remédios.
A engenharia de dados desempenha um papel fundamental na preparação e organização dos
dados para análise e modelagem em projetos de ciência de dados e aprendizado de máquina.
A limpeza de dados é fundamental para garantir a consistênciada base de dados, envolvendo o
tratamento de dados ausentes com a identi�cação e o preenchimento ou a remoção de valores
ausentes para evitar distorções nos resultados, o que demanda também a detecção e o
tratamento de valores discrepantes que podem distorcer as análises.
A transformação de dados engloba a normalização e a padronização: o ajuste das escalas dos
dados para facilitar comparações entre diferentes variáveis.
Segue a codi�cação de variáveis categóricas que devem ser convertidas em formatos numéricos
para serem utilizadas em algoritmos de aprendizado de máquina.
O Feature Engineering compreende a criação de novas variáveis através da derivação de
características adicionais que podem fornecer informações mais relevantes para os modelos,
envolvendo também a extração de características com a utilização de técnicas para extrair
padrões e informações importantes dos dados existentes.
Disciplina
Pensamento Analítico e Análise
de Dados
O manuseio de datas e tempo permite a extração de componentes temporais, o
desmembramento de datas em componentes, como ano, mês, dia, hora etc., e que seja feito um
tratamento especializado para dados temporais, como preenchimento de lacunas ou
suavização.
Quanto à integração de dados, compreende a fusão de dados através da combinação de
conjuntos de dados diferentes com base em chaves comuns e da agregação de dados,
permitindo um resumo de dados para níveis superiores, como médias, totais e contagens.
A utilização de amostragem de dados envolve a amostragem aleatória através da utilização de
seleção de uma subamostra representativa dos dados para análise exploratória ou modelagem e
uma amostragem estrati�cada com a seleção de amostras mantendo a representatividade das
categorias originais.
O tratamento de dados desbalanceados considera o caso de amostras grandes ou pequenas
demais, estabelecendo abordagens para lidar com conjuntos de dados em que as classes são
desproporcionais.
O escalonamento de recursos envolve o escalonamento de atributos compreendendo o ajuste de
escalas para algoritmos sensíveis à magnitude dos dados, como algoritmos de gradiente
descendente.
A validação de dados ocorre através da divisão de dados em conjuntos de treinamento e teste,
separando os dados para treinamento e avaliação de modelos e a realização de validação
cruzada, envolvendo a avaliação do desempenho do modelo em diferentes subconjuntos dos
dados.
Finalizando, o gerenciamento de erros demanda o registro e monitoramento para rastreamento
de erros e problemas nos dados ao longo do tempo, bem como a reversão de mudanças através
da capacidade de reverter alterações e corrigir problemas nos dados.
Visando exempli�car um pouco as possibilidades que o Data Driven traz para empresas de
engenharia, nesta aula, apresentaremos quatro projetos reais em diferentes empresas, os quais
aplicam técnicas diferentes de análise ou diferentes modelos de aprendizado de máquina,
conforme segue:
Análise de falhas em trilhos ferroviários: neste primeiro exemplo, mostraremos um projeto
de construção de um modelo de previsão de falha em trilhos ferroviários, em que a
empresa cria um modelo de forecast, para prever um aumento de temperatura que possa
gerar uma falha em um trilho.
Análise de documentos automáticos por empresas aéreas: este é um projeto de sucesso
criado pela empresa United Airlines para avaliar automaticamente os documentos dos
passageiros que compraram suas passagens, diminuindo o tempo em �la e a burocracia da
empresa.
Simulação de cenários pela Petrobras: neste exemplo, veremos o Digital Twins, um sistema
de simulação da Petrobras que possibilita análises em tempo real, antecipação de falhas e
sugestões de ações a serem tomadas.
O data driven em ação
Disciplina
Pensamento Analítico e Análise
de Dados
1. Análise de falhas em trilhos ferroviários
De�nições e conceitos de Data Driven
O primeiro exemplo apresentado é uma solução de uma empresa ferroviária construindo um
algoritmo para prever falhas nos trilhos. Aqui, mostraremos o passo a passo de como a empresa
pode seguir do processo de Data Driven apresentado. Este exemplo é inspirado em um caso real
demonstrado no link nas referências.
O processo:
Planejar: esta é a primeira etapa, na qual a empresa apresenta para a equipe de análise de
dados qual é o seu problema, no caso, “Prever possíveis falhas nos trilhos”. Após algumas
reuniões e conversas, a equipe descobre quais são os dados disponíveis e o passo a passo
a ser realizado e cria uma hipótese a ser analisada: “Seria possível detectar a temperatura
crítica no trilho com 12h de antecedência?”. Para isso, eles optam por utilizar um modelo de
regressão. Essa etapa é compartilhada com toda a equipe.
Preparar: com o objetivo em mente, o próximo passo é capturar os dados necessários. Para
análise, optou-se por utilizar os dados medidos por sensores de temperatura no trilho em
Disciplina
Pensamento Analítico e Análise
de Dados
um período de janeiro de 2017 a março de 2019. Esses dados foram armazenados em um
banco de dados, no qual poderiam ser processados em Python. Essa etapa �ca a cargo do
engenheiro de dados.
Processar: o primeiro passo do processamento foi escolher os intervalos de dados
analisados, para que sempre tenha um intervalo �xo. Escolheu-se o período de 1h, assim os
dados foram agrupados em intervalos regulares de 1h, em que foram extraídos dados
estatísticos da temperatura nesse período. Essa etapa é produzida pelo cientista de dados.
Analisar: neste projeto, a análise foi a principal etapa, pois observou-se a correlação dos
dados com as horas do dia e as épocas dos anos; também, fez-se uma engenharia de
variável, em que foi possível criar análises através de medidas móveis, e um
balanceamento dos dados, visando calibrar a distribuição de dados entre temperaturas
críticas e não críticas. Por �m, essa etapa criou o algoritmo de regressão logística
responsável por prever a ocorrência de uma futura temperatura crítica. Essa etapa também
é produzida pelo cientista de dados.
Apresentar: após a �nalização da construção do algoritmo, chegou à etapa de
apresentação, para isso, esse projeto optou por apresentar o resultado em uma tabela �nal
com as métricas do algoritmo, porém apresentou os grá�cos que permitiram as análises
parciais. Essa etapa pode ser criada pelos analistas de dados.
Agir: por último, é o momento de agir. Neste caso, o objetivo era a criação de um algoritmo
de previsão, para trazer valor à empresa. Esse algoritmo deve ser colocado em um
ambiente de produção, no qual receberá os dados em tempo real, sempre prevendo o
resultado das próximas 12 horas; se identi�car uma possível falha, alertará a empresa para
manutenção. Nesta última etapa, o principal pro�ssional é o engenheiro de dados, pois ele
é responsável por fazer o modelo de regressão, criado pelo cientista, funcionar no ambiente
de produção em tempo real.
2. Análise automática de documento para empresas de aviação
Benefícios da cultura Data Driven
A pandemia de Covid que tomou o mundo em 2020 fez com que várias empresas tivessem que
mudar o modelo de trabalho, tentando tomar as medidas de segurança obrigatórias para diminuir
a disseminação do vírus. Entre essas medidas, uma que foi obrigatória para empresas aéreas é a
veri�cação do estado da vacina de prevenção da Covid pelos clientes, assim as empresas eram
obrigadas a veri�car os documentos emitidos pelos órgãos de saúde, a �m de saber se os
clientes haviam tomado a quantidade de vacinas para haver uma segurança mínima nos voos.
Visando agilizar estas veri�cações, a empresa United Airlines optou por um processo automático
com a utilização de Big Data. Neste processo, os clientes poderiam enviar os seus documentos
de vacinação através de um aplicativo, e estes eram enviados para um servidor em cloud que os
avaliava a partir de um algoritmo de aprendizado de máquina baseado em redes neurais
convolucionais. Ao �nal, o algoritmo retornava se os documentos eram válidos ou não.
Essa técnica permitiu à empresaanalisar automaticamente 75% dos documentos sobre dados
de vacinação contra Covid, um total de mais de 4 milhões de passageiros. Ela utilizou o sistema
para avaliar os documentos pessoais de seus clientes, como passaportes e documentos de
identi�cação, conseguindo automatizar esse processo para 66% dos documentos.
Disciplina
Pensamento Analítico e Análise
de Dados
3. Simulação de cenários pela Petrobras
Como grandes empresas utilizam Data Driven e aprendizado de máquina
Além de uma das principais empresas brasileiras, a Petrobras também é uma das líderes em
inovação e pesquisa em tecnologia. Uma prova disso é o fato de ela ser a dona de vários
supercomputadores, entres eles, o Pégaso, o atual maior computador da América e o 33º do
mundo. Esses supercomputadores ajudam as empresas em vários projetos e funções, como
localizar e planejar a extração de materiais de forma e�ciente e segura.
Um dos grandes projetos da Petrobrás utilizando Big Data e aprendizado de máquina é o Digital
Twins, um projeto que cria simulação virtuais exatamente �éis à realidade. Ela utiliza essa
ferramenta para testar inovações de maneira controlada antes que elas sejam implementadas na
prática e para acompanhar em tempo real os processos em ação, o que permite prever falhar
futuras em equipamentos, testar cenários diferentes ou aumentar a e�ciência de processos
atuais.
Esta tecnologia simula os cenários reais de plataformas de extração de petróleo, de re�narias ou
dos processos de logística da empresa. Nesses cenários, são adicionados dados reais dos
sensores presentes nos equipamentos, podendo calcular os estados atuais dos sistemas da
empresa. Com os dados destes sensores, são feitos modelos de aprendizado de máquina, para
testar ocorrências futuras, ou até mesmo testar cenários antes que ocorram na prática.
Este modelo de simulação permite a Petrobras aumentar sua rentabilidade e otimizar seus
gastos de produção, ajudando os ganhos da empresa.
Videoaula: Aplicações práticas de data driven na engenharia
Este conteúdo é um vídeo!
Para assistir este conteúdo é necessário que você acesse o AVA pelo
computador ou pelo aplicativo. Você pode baixar os vídeos direto no aplicativo
para assistir mesmo sem conexão à internet.
Após introduzir os conceitos de Data Driven, aprendizado de máquina e Big Data, está na hora de
vermos os poderes que essas ferramentas têm em ação. Nesta videoaula, apresentaremos
quatro projetos reais de empresas de diferentes setores aplicando a cultura do Data Driven,
assim como um projeto de detecção de falhas em trilhos ferroviários, um projeto de desvio
automático de colisões por um drone, um projeto de uma empresa aérea para analisar
automaticamente os documentos de seus clientes e o Digital Twin em um projeto de simulação
da Petrobras para análises de toda sua cadeia de produção.
Saiba mais
Disciplina
Pensamento Analítico e Análise
de Dados
Aprofundamento sobre aplicações práticas do Data Driven
Se você deseja se aprofundar mais sobre aplicações do Data Driven em empresas, bem como
benefícios e desa�os, utilize como referência de leitura complementar o Capítulo 8 do livro Big
Data no trabalho, do autor Thomas H. Davenport.
Big Data no trabalho.
Ao explorar esse recurso, você se preparará para aplicá-lo de forma prática no ambiente de
trabalho para diferentes setores pro�ssionais. Bom aprendizado!
Referências
https://login.vitalsource.com/?redirect_uri=https%3A%2F%2Fintegrada.minhabiblioteca.com.br%2Freader%2Fbooks%2F9786555206838&brand=integrada.minhabiblioteca.com.br
Disciplina
Pensamento Analítico e Análise
de Dados
ALMEIDA, V. M. de. Framework modular para detecção e desvio de objetos em veículos aéreos
não tripulados. 2022. Dissertação (Mestrado em Engenharia de Computação) – Universidade de
São Paulo, São Paulo, 2022.
AWS. United Airlines agiliza a experiência de viagem usando aplicações com a tecnologia da
AWS. AWS, 2021. Disponível em: https://aws.amazon.com/pt/solutions/case-studies/united-
airlines-2021-reinvent-video/. Acesso em: 7 out. 2023.
CHAVES, M. C. S. Utilizando aprendizado de máquina para predizer falhas na ferrovia.
Estatidados, 2023. Disponível em: http://estatidados.com.br/utilizando-aprendizado-de-maquina-
para-predizer-falhas-na-ferrovia/. Acesso em: 7 out. 2023.
PETROBRAS. Digital Twins: os gêmeos virtuais que ajudam a resolver problemas reais. Petrobras,
2023. Disponível em: https://nossaenergia.petrobras.com.br/energia/digital-twins-os-gemeos-
virtuais-que-ajudam-a-resolver-problemas-reais/. Acesso em: 7 out. 2023.
Aula 5
Revisão da unidade
Cultura data driven (ou orientada a dados)
https://aws.amazon.com/pt/solutions/case-studies/united-airlines-2021-reinvent-video/
https://aws.amazon.com/pt/solutions/case-studies/united-airlines-2021-reinvent-video/
http://estatidados.com.br/utilizando-aprendizado-de-maquina-para-predizer-falhas-na-ferrovia/
http://estatidados.com.br/utilizando-aprendizado-de-maquina-para-predizer-falhas-na-ferrovia/
https://nossaenergia.petrobras.com.br/energia/digital-twins-os-gemeos-virtuais-que-ajudam-a-resolver-problemas-reais/
https://nossaenergia.petrobras.com.br/energia/digital-twins-os-gemeos-virtuais-que-ajudam-a-resolver-problemas-reais/
Disciplina
Pensamento Analítico e Análise
de Dados
Chegamos ao �nal da nossa unidade. Nesse momento, revisaremos os conceitos importantes
passados nas aulas, iniciando com o que é Data Driven e seus conceitos.
Data Driven é a cultura de tomada de decisão baseada em dados. Ela pode ser considerada uma
evolução do modelo de tomada de decisão baseada exclusivamente na intuição ou experiência
de especialistas, pois, com o Data Driven, as intuições podem ser geradas ou testadas através de
análises dos dados.
Para implementar a cultura de Data Driven em projetos, diversas empresas optam por criar um
processo �xo, que facilita a extração de informações dos dados. Dentre os processos, um dos
mais famosos é o adotado pelo Google, o qual foi o apresentado aqui. Veremos novamente seus
principais pontos.
O Google divide o processo de Data Driven em seis etapas, facilitando e organizando um método
de tomada de decisão baseada em dados. Estas são as etapas:
1. Planejar: nesta primeira etapa, de�nimos o problema, para isso, é importante uma boa
comunicação com as partes envolvidas no problema, de�nindo as metas.
2. Preparar: na etapa de preparação, de�nimos as fontes dos dados necessários para
concluirmos as metas, bem como as ferramentas necessárias para analisar os dados.
3. Processar: os dados que recebemos diretamente das fontes costumam não estar em um
formato adequado para análises, assim, na etapa de processamento, transformamos,
limpamos e corrigimos os erros presentes nos dados, visando a uma análise mais
precisa.
Disciplina
Pensamento Analítico e Análise
de Dados
4. Analisar: na etapa de análise, extraímos as informações contidas nos dados e utilizamos
cálculos estatísticos para responder às perguntas iniciais, assim como criamos os modelos
matemáticos que nos permitem concluir nossas metas.
5. Apresentar: após respondermos às perguntas iniciais, é necessário apresentar nossas
conclusões para as partes envolvidas no processo de planejamento, para isso, é
interessante criar grá�cos e tabelas que demonstrem as informações contidas nos dados.
Isso pode ser apresentado em formato de dashboards ou reportes individuais.
�. Agir: após apresentar os dados, conseguimos demonstrar os problemas analisados e as
melhores maneiras de resolvê-los. Agora, na etapa �nal, agimos para resolver estes
problemas a partir da estratégia criada através da análise dos dados.
Videoaula: Revisão da unidade
Este conteúdo é um vídeo!
Para assistir este conteúdo é necessário que você acesse o AVA pelo
computador ou pelo aplicativo. Você pode baixar os vídeos direto no aplicativo
para assistir mesmo sem conexão à internet.
Olá, estudante! Em reconhecimento ao seu empenho em completar todas as aulas desta unidade,
preparamos um vídeo especial para você, no qual revisitaremos10.178,00
95º percentil 36.788,00 18.750,00
Desvio padrão 9.111,78 2.935,60
Mínimo 9.000,00 9.000,00
Máximo 79.980,00 30.000 00
Interpretando as medidas estatísticas
As mulheres são muito mais sensíveis à variável preço e não parecem dispostas a pagar
muito por um veículo. Isto é algo que se con�rma pelo máximo a pagar por cada um dos
segmentos (R$ 79.980 para homens e R$ 30.000 para mulheres).
Com relação ao 95º percentil, a seguinte análise pode ser feita: no caso dos homens, 5%
estariam dispostos a pagar mais de R$ 36.788,00 por um veículo; no caso das mulheres, 5%
estariam dispostas a pagar mais de 18.750 dólares.
Na análise do desvio padrão, os valores no caso dos homens são mais dispersos em
relação aos valores das mulheres.
Pode-se também pensar em lançar campanhas publicitárias que destaquem com mais
força determinados atributos dos veículos; sobretudo aqueles que são considerados
importantes para as mulheres, como segurança, família, economia, etc.
Videoaula: Introdução ao pensamento analítico e à tomada de decisão
Este conteúdo é um vídeo!
Para assistir este conteúdo é necessário que você acesse o AVA pelo
computador ou pelo aplicativo. Você pode baixar os vídeos direto no aplicativo
para assistir mesmo sem conexão à internet.
Olá, estudante!
Neste vídeo você verá os conceitos de fundamentos da lógica e do raciocínio; diagramas em
lógica; tomada de decisão e resolução de problemas e habilidades em matemática e estatística
para coletar, analisar e interpretar dados para tomada de decisão.
Disciplina
Pensamento Analítico e Análise
de Dados
Você também notará no vídeo a importância de elementos fundamentais da �loso�a e
matemática para a articulação correta tanto de problemas estruturados, como problemas não
estruturados e como elementos básicos da estatística são utilizados para resolver tais
problemas.
Então, vamos lá?
Saiba mais
Olá, estudante!
Para auxiliar o aprofundamento do aprendizado sobre conceitos aqui abordados, recomendamos
a leitura dos Capítulos 2 e 3 do livro a seguir:
CASTRO, D. G. F. L. N. D. Introdução à mineração de dados: conceitos básicos, algoritmos e
aplicações. São Paulo: Editora Saraiva, 2016.
Bons estudos!
Referências
https://login.vitalsource.com/?redirect_uri=https%3A%2F%2Fintegrada.minhabiblioteca.com.br%2Freader%2Fbooks%2F978-85-472-0100-5%2Fpageid%2F0&brand=integrada.minhabiblioteca.com.br
https://login.vitalsource.com/?redirect_uri=https%3A%2F%2Fintegrada.minhabiblioteca.com.br%2Freader%2Fbooks%2F978-85-472-0100-5%2Fpageid%2F0&brand=integrada.minhabiblioteca.com.br
https://login.vitalsource.com/?redirect_uri=https%3A%2F%2Fintegrada.minhabiblioteca.com.br%2Freader%2Fbooks%2F978-85-472-0100-5%2Fpageid%2F0&brand=integrada.minhabiblioteca.com.br
Disciplina
Pensamento Analítico e Análise
de Dados
BARBOSA, M. A. Introdução à lógica matemática para acadêmicos. Curitiba: InterSaberes, 2017.
CASTRO, D. G. F. L. N. D. Introdução à mineração de dados: conceitos básicos, algoritmos e
aplicações. São Paulo: Editora Saraiva, 2016. Disponível em: Minha Biblioteca.
COSTA, M. Filoso�a da lógica. Curitiba: InterSaberes, 2020.
MACHADO, N. J.; CUNHA, M. O. Lógica e linguagem cotidiana: verdade, coerência, comunicação,
argumentação. 4. ed. Belo Horizonte: Autêntica, 2019.
O’BRIEN, J.; MARAKAS, G. Administração de sistemas de informação. 15. ed. Porto Alegre:
AMGH, 2013. E-book.
RAINER JÚNIOR, R. K.; CEGIELSKI, C. G. Introdução a sistemas de informação. 3. ed. Rio de
Janeiro: Elsevier, 2011.
SOUSA, W. E. Raciocínio lógico-analítico: uma proposta de conteúdo e abordagem para o ensino
médio e para concursos públicos. 2019. Dissertação (Mestrado Pro�ssional) – Universidade
Federal de Goiás, Catalão, 2019. Disponível em:
http://repositorio.ufcat.edu.br/tede/handle/tede/9479. Acesso em: 7 jun. 2021.
ZANONI, A. P.; BITENCOURT, L.; FARINA, E. A lógica aristotélica. Revista Pandora Brasil, n. 75,
2016. Disponível em: http://revistapandorabrasil.com/revista_pandora/projetos_75/logica_2.pdf.
Acesso em: 7 jun. 2021.
Aula 2
Tomada de decisão com base na análise de custo-benefício
http://repositorio.ufcat.edu.br/tede/handle/tede/9479
https://revistapandorabrasil.com/revista_pandora/projetos_75/logica_2.pdf
Disciplina
Pensamento Analítico e Análise
de Dados
Introdução
Olá, estudante!
Nesta aula você verá os conceitos de pensamento analítico, o qual baseia-se na divisão do
problema ou objeto de estudo em pequenas partes que, depois de identi�cadas, categorizadas e
analisadas, são formadas separadamente para obter uma resposta ou gerar um valor transferível
e uma solução aplicável para tudo. Quem adota o conceito utiliza a informação para desenvolver
competências que lhe permitam compreender e resolver problemas, habilidade de grande
benefício no âmbito pro�ssional, social e intelectual. Esse é o motivo que leva à necessidade de
aperfeiçoar o pensamento analítico, descobrir como alcançá-lo em uma entrega que busca
oferecer o que há de mais relevante nesse tema.
Nesta aula, você também verá análise de custo-benefício e coleta de dados e comunicação de
resultados, compreenderá a gestão de custos a partir dos principais métodos de custeio e as
possíveis alternativas que esses métodos fornecem em auxílio ao processo decisório
empresarial.
Então, vamos lá?
Introdução ao pensamento analítico
Disciplina
Pensamento Analítico e Análise
de Dados
O que é pensamento analítico?
O pensamento analítico é um pensamento razoável e re�exivo sobre uma determinada situação
ou um problema que se concentra na decisão do que fazer ou no que acreditar e na relação entre
esse problema e o ambiente em geral (O´Brien ; Marakas, 2013).
O diferencial desse tipo de pensamento é que ele divide o objeto de estudo ou problema em
partes menores que podem ser identi�cadas, categorizadas e analisadas, a �m de obter uma
resposta ou solução adequada ao que queremos resolver (O´Brien ; Marakas, 2013). Podemos
sempre usá-lo para tomar decisões, resolver con�itos, compreender um problema, etc.
Quais são suas características?
Como qualquer outro tipo de pensamento, o pensamento analítico possui uma série de
características que o de�nem. Os mais importantes são:
Baseia-se em evidências (e não em emoções).
É questionar: envolve responder perguntas: O quê? Como? Quando?
É detalhista: analisa os detalhes do problema.
É metódico: implica um método de análise.
Desenvolve a capacidade de investigar.
Permite que você organize suas ideias com clareza e precisão.
Envolve decompor o problema em partes menores para compreender sua estrutura e as
possíveis inter-relações existentes.
Permite identi�car o que é relevante e irrelevante sobre um problema.
Disciplina
Pensamento Analítico e Análise
de Dados
Qual metodologia seguir?
Através do pensamento analítico, segue-se uma série de passos que nos permitirão chegar a
uma conclusão ou a uma série de re�exões. Nem sempre temos que seguir todos os passos;
porém, é importante conhecê-los para ter um referencial que nos permita construir nossa
metodologia (Alvarez, 2006):
Formule uma hipótese.
Reformule o problema.
Re�ita sobre isso.
Proponha estratégias que nos permitam chegar a uma conclusão.
Selecione a estratégia mais apropriada.
Três particularidades do pensamento analítico
É crítico: decompõe as partes de um todo para analisar o signi�cado de cada uma delas,
interessando-se mais pelos elementos do que pelas relações.
É sequencial: segue as etapas em sequência para análise, estuda linearmente, sem saltos
ou alterações, cada uma das partes e aumenta-as até chegar à solução.
É decisivo: concentra-se o tempo todo em encontrar uma solução, seja para resolver um
problema ou para tomar uma decisão.
Para que serve?
Resolução de problemas: com o pensamento analítico podemos resolver problemas por
diferentes pontos de vista, re�etindo e aprendendo novas estratégias que nos permitam
chegar ao nosso objetivo ou conclusão.
Tomando uma decisão: quando tomamos decisões, também podemos usar esse tipo de
pensamento.os conceitos-chave que
moldaram sua compreensão na engenharia. Desde os 3 Vs do Big Data até a consolidação da
cultura Data Driven em grandes empresas de vários setores da economia, este resumo é seu guia
rápido para solidi�car o aprendizado. Não perca essa chance de reforçar seus conhecimentos.
Dê o play e mergulhe nessa recapitulação!
Estudo de caso
Disciplina
Pensamento Analítico e Análise
de Dados
Imagine que você é o Gerente de Tecnologia da Informação ou Engenharia de Desenvolvimento
de Produtos de uma empresa que desenvolve drones para a entrega de produtos nas casas ou
nos escritórios dos clientes e possui o seguinte desa�o pro�ssional.
Problema: o aumento de uso de drones e aeronaves não tripuladas. Há também um aumento do
risco de colisão destas aeronaves com aviões tripulados, gerando um risco de vida à tripulação,
sendo necessária a criação de um sistema que impeça a colisão. Ainda que seja considerada
apenas uma colisão de menor porte, entre duas aeronaves pequenas e não tripuladas, que
realizam entregas de pequenos pacotes, ainda há o risco de colisão e de fragmentos oriundos
das colisões atingirem pessoas, veículos ou residências.
Objetivos:
Criação de um algoritmo que possa ser executado em um drone e utilize seus sensores
para detectar a posição de uma aeronave, tripulada ou não, e calcular a possibilidade de
colisão.
Caso o risco de colisão seja identi�cado, o algoritmo deve ser capaz de criar e executar
uma rota de desvio para o drone.
Uma vez que o risco de colisão foi evitado, o drone precisa retornar à sua rota original e
concluir a entrega, registrando as perdas de tempo e energia neste processo.
O número de situações de colisões que cada drone encontrou e resolveu também constitui
um histórico importante, uma vez que o aumento do número de tais situações ao longo do
tempo pode indicar um aumento do número de drones dos concorrentes ou de drones
utilizados para outras aplicações.
O histórico de situações onde colisões foram evitadas também poderá ser aproveitado
posteriormente pelas equipes de Marketing ou Pós Vendas, as quais poderão utilizar alguns
Disciplina
Pensamento Analítico e Análise
de Dados
dados para demonstrar a segurança ou resiliência do sistema.
Pronto para desenvolver um plano para implementar não somente um sistema de detecção
anticolisão mas também um sistema capaz de fornecer informações adicionais sobre como,
quando e onde situações de colisão foram evitadas para aprimoramento contínuo do sistema e
utilização desta vantagem competitiva para atrair novos clientes e �delizar os atuais ? Note que o
desa�o contempla não somente um sistema ágil su�ciente para evitar uma colisão, mas também
um sistema resiliente, que avalia até que ponto seria necessário abortar a entrega e retornar à
base de retorno, no caso de um desvio muito grande da rota original para evitar a colisão.
Re�ita
1. Uma cultura Data Driven ou orientada a dados é o resultado da maturação de inúmeras
ferramentas ao longo de, pelo menos, alguns anos. Quais departamentos dentro de uma
empresa estariam diretamente envolvidos neste esforço ?
2. Algumas ferramentas podem trazer resultados imediatos, mas outras necessitam de vários
ciclos de aplicação e análise após os dados coletados em diferentes épocas e com
diferentes amostragens. Nesses ciclos de aplicação e análise, quais indicadores seriam
mais indicados para medir o progresso do sistema ?
3. A retenção dos pro�ssionais que atuam diretamente para a consolidação da cultura
orientada a dados também é importante, uma vez que esta é uma competência altamente
desejada no mercado. O que retém um pro�ssional em um projeto ou empresa ? Apenas a
maior remuneração, ou as oportunidades de aprendizado em novas tecnologias ?
4. Cultura Data Driven, apesar de estar sempre relacionada ao Big Data, não necessariamente
está relacionada a apenas uma grade de tipos de dados, pois cada dado compilado precisa
ser preservado e ter sua validade assegurada ao longo do tempo, portanto, antes de
planejar ou utilizar um dado, vale sempre refazer a mesma pergunta básica: para que este
dado deve ser armazenado ? Se a resposta não é imediata e simples, é um sinal de que
talvez ele não precisa ser manipulado, pelo menos dentro da cadeia de alguns processos
da sua empresa.
Videoaula: Resolução do estudo de caso
Este conteúdo é um vídeo!
Para assistir este conteúdo é necessário que você acesse o AVA pelo
computador ou pelo aplicativo. Você pode baixar os vídeos direto no aplicativo
para assistir mesmo sem conexão à internet.
A seguir, podemos ver uma possível resolução para o nosso estudo de caso.
Solução: criação de um sistema dividido em três etapas de atuação:
Disciplina
Pensamento Analítico e Análise
de Dados
1. A detecção e fusão de dados dos sensores de voo.
2. O cálculo da provável colisão.
3. O desvio do cenário de colisão.
4. A análise crítica se após evitar a colisão, ainda há condições de concluir a entrega ou se
será necessário abortar a entrega e retornar à base.
5. O retorno à rota original para conclusão da entrega.
O funcionamento do sistema cumprirá quatro etapas:
1. Detecção da aeronave através de dados de diversos sensores.
2. Fusão dos sensores encontrando a posição e rota real da aeronave.
3. Veri�cação se a rota das aeronaves cria cenários de colisão.
4. Planejar e executar uma rota de evasão do cenário de colisão.
5. Planejar e executar uma rota de retorno à rota original de entrega, cálculo de uma nova rota
de entrega ou retorno à base, abortando a entrega.
Para a solução, os passos do processo Data Driven devem ser seguidos:
Planejar: de�na os problemas a serem tratados e os objetivos para resolvê-los, através de
uma boa comunicação e de perguntas assertivas.
Preparar: encontre as fontes dos dados, identi�que seus formatos, tipos, erros e as
ferramentas necessárias para se trabalhar com eles.
Processar: “limpe” os dados, corrija seus erros, veri�que a sua integridade e crie dados a
partir de transformações da dados existentes.
Analisar: faça análises estatísticas, busque respostas para as perguntas iniciais, identi�que
padrões e crie modelos de predição e recomendação a partir dos dados.
Apresentar: a partir de grá�cos e tabelas, gere relatórios e dashboards que demonstrem de
maneira e�ciente e visual os resultados obtidos.
Agir: elabore e execute um plano de ação a partir dos insights gerados pelos dados.
Note que não se trata simplesmente de criar um sistema robusto de detecção mas também
conhecer os prováveis sistemas de concorrentes e como todas essas informações podem servir
como informações adicionais para o processo de tomada de decisão dos clientes. Os históricos
de colisões evitadas e mapeamento de riscos de áreas mais vulneráveis são também
instrumentos importantes para a �delização dos clientes.
Resumo visual
Disciplina
Pensamento Analítico e Análise
de Dados
A seguir, um exemplo de resumo visual de elementos da cultura Data Driven associados ao ciclo
de captura de informações críticas da imagem e qualidade de um produto no mercado até a
consolidação da �delidade dos clientes deste produto.
Disciplina
Pensamento Analítico e Análise
de Dados
Fonte: adaptada de De Luca (2020).
Referencia
DE LUCA, C. Nunca foi tão importante ser data-driven e customer centric. The Shift, 2020.
Disponível em: https://theshift.info/hot/nunca-foi-tao-importante-ser-data-driven-e-customer-
centric/. Acesso em: 29 nov. 2023.
DIETRICH, D. et al. Data science & big data analytics: discovering, analyzing, visualizing and
presenting data. Hoboken: Wiley, 2015.
GAUTAM, A. 6 Phases Of Data Analysis According To Google. Medium, 2021. Disponível em:
https://medium.com/codex/6-phases-of-data-analysis-according-to-google-9e084b89f848.
Acesso em: 14 set. 2023.
GOOGLE. O que é Big Data?. Google, 2023. Disponível em: https://cloud.google.com/learn/what-
is-big-data?hl=pt-br. Acesso em: 7 out. 2023.
MATHWORKS. What Is Machine Learning?. Mathworks, 2023. Disponível em:
https://www.mathworks.com/discovery/machine-learning.html.Acesso em: 14 set. 2023.
THEOBALD, O. Machine learning for absolute beginners. London, UK: Scatterplot Press, 2017.
,
Unidade 4
https://theshift.info/hot/nunca-foi-tao-importante-ser-data-driven-e-customer-centric/
https://theshift.info/hot/nunca-foi-tao-importante-ser-data-driven-e-customer-centric/
https://medium.com/codex/6-phases-of-data-analysis-according-to-google-9e084b89f848
https://cloud.google.com/learn/what-is-big-data?hl=pt-br
https://cloud.google.com/learn/what-is-big-data?hl=pt-br
https://www.mathworks.com/discovery/machine-learning.html
Disciplina
Pensamento Analítico e Análise
de Dados
Ferramentas Computacionais para Análise de Dados
Aula 1
Introdução ao Python para análise de dados
Introdução
Olá, estudante! Preparado para conhecer mais sobre a linguagem Python?
Nesta aula vamos entender por que Python é uma ferramenta indispensável na análise de dados
e como a lógica de programação funciona como uma verdadeira "receita" para solucionar
problemas complexos.
Ambos os conceitos são fundamentais para quem, como você, deseja se tornar um especialista
em manipular e interpretar grandes volumes de dados.
Ao longo desta aula, você vai descobrir as razões que tornam o Python a escolha número um dos
pro�ssionais da área e como bibliotecas como Pandas e Numpy podem tornar sua vida muito
mais fácil.
Também vamos desmisti�car conceitos como algoritmos, variáveis e �uxo de controle, que são
os tijolos básicos da lógica de programação. Compreender esses temas é um passo crucial para
alcançar uma análise de dados precisa e e�caz.
Disciplina
Pensamento Analítico e Análise
de Dados
Então, que tal iniciar essa jornada de aprendizado? Garanto que os conhecimentos adquiridos
aqui serão ferramentas valiosas em seu dia a dia pro�ssional, não apenas tornando você mais
e�ciente, mas também um membro indispensável em qualquer equipe focada em dados. Vamos
nessa!
Contextualização do Python na análise de dados e lógica de programação
Olá, aluno! Vamos expandir um pouco mais nosso conhecimento sobre porque Python é tão
crucial na análise de dados. Você sabia que além de ser criado em 1989 por Guido van Rossum,
o Python foi concebido com foco na legibilidade do código? Isso é muito interessante para
engenheiros como nós, pois permite que a gente entenda o que está acontecendo mais
rapidamente, economizando tempo e esforço.
Mas a legibilidade não é o único ponto forte do Python. Você deve ter estudado "Big Data", certo?
Vivemos na era da informação, onde milhões de terabytes de dados são gerados todos os dias. E
aqui entra o Python como um dos protagonistas. Ele se destaca na manipulação e análise
desses grandes conjuntos de dados, e isso é amplamente devido à sua e�ciência e capacidade
de lidar com diferentes tipos de dados.
Por que Python e não outras linguagens como R ou Java? É uma pergunta válida! O Python tem
uma vantagem competitiva devido à sua vasta gama de bibliotecas e frameworks. Bibliotecas
Disciplina
Pensamento Analítico e Análise
de Dados
como Pandas, Numpy e Scikit-learn são como kits de ferramentas que nos permitem realizar
tarefas complicadas com poucas linhas de código. Em comparação, enquanto R é uma excelente
linguagem para estatísticas, ela não é tão versátil como o Python. E Java, apesar de ser
poderoso, não tem a mesma facilidade de uso quando se trata de ciência de dados.
Agora podemos falar também sobre lógica de programação. Você sabe o que é isso? Bem,
imagine que você está cozinhando seguindo uma receita. A ordem em que você adiciona os
ingredientes e a forma como você os mistura determinam o sabor do prato �nal, certo? Lógica de
programação é bem parecido com isso. Ela é uma forma de colocar ordem e estrutura na
resolução de problemas. Pode ser considerada uma espécie de "receita" para o computador
seguir.
Dentro dessa "receita", existem o que chamamos de algoritmos. São séries de etapas lógicas e
bem de�nidas que o computador deve seguir para resolver um problema ou executar uma tarefa.
Algoritmos são a espinha dorsal de qualquer programa. Por exemplo, um algoritmo para calcular
a média de notas de uma turma iria somar todas as notas e dividir pelo número total de alunos.
Simples, mas e�caz!
Para tornar esses algoritmos funcionais, nós utilizamos variáveis. Pense nelas como pequenos
armários onde você pode armazenar informações. Se você estiver fazendo um programa para
gerenciar uma biblioteca, por exemplo, você terá variáveis para armazenar o número de livros, os
títulos, os autores, e assim por diante.
Finalmente, para que esses algoritmos e variáveis interajam de forma e�caz, nós utilizamos o
que é conhecido como �uxo de controle. Isso inclui instruções como if-else e loops como for e
while. Imagine que você está num cruzamento de estradas. O �uxo de controle atua como os
semáforos e as placas de sinalização, direcionando o �uxo de execução do seu código. Se uma
determinada condição for verdadeira, vá para a esquerda; se não, vá para a direita.
Então, para resumir: Python é a linguagem de escolha para análise de dados, principalmente por
sua versatilidade, e�ciência e rica coleção de bibliotecas. Lógica de programação, algoritmos,
variáveis e �uxo de controle são os tijolos fundamentais que nos ajudarão a manipular e analisar
esses dados de forma e�caz. E acredite, o investimento no aprendizado desses conceitos vai
valer cada centavo em seu futuro como engenheiro de dados ou analista.
Ambiente Python para análise de dados e exemplos práticos
Disciplina
Pensamento Analítico e Análise
de Dados
Agora que já temos uma sólida base sobre o papel do Python e a lógica de programação na
análise de dados, vamos nos aprofundar em como preparar nosso ambiente Python e colocá-lo
em ação com exemplos práticos.
Con�gurando o ambiente Python
Para começar, recomendamos fortemente utilizar o Anaconda. Não apenas é uma distribuição
gratuita do Python, mas ele vem com um arsenal de bibliotecas de ciência de dados pré-
instaladas, o que poupa muito tempo e evita dores de cabeça com incompatibilidades. Outra
grande vantagem do Anaconda é que ele vem com o Jupyter Notebook, um ambiente de
desenvolvimento interativo que é um dos melhores amigos de qualquer analista de dados. Para
encontrá-lo, entre no site do Anaconda (https://www.anaconda.com/download) e siga os passos
para seu download.
Variáveis, Tipos de Dados e Comandos da Linguagem Python
A linguagem Python contém seis tipos de variáveis: números inteiros, números reais, texto
(strings), booleanas, listas e vetores.
Para a atribuição de uma variável a seu respectivo tipo, bem como uma breve explicação e
utilidade de cada variável e seus tipos de dados, podem ser utilizados como referência os
exemplos da tabela 1 a seguir:
Tabela 1 – Exemplos de variáveis e seus respectivos dados na linguagem Python;
https://www.anaconda.com/download
Disciplina
Pensamento Analítico e Análise
de Dados
Variável
Exemplo de dados contidos
nesta variável
Formato da variável na linha
de comando
Texto (string) '5', '3.45', 'True' str()
Números inteiros 5, 3, 1 int()
Números reais 5.0, 1.0 �oat()
Booleanas True, False bool()
Listas (lists)
>>> a = 'is'
>>> b = 'nice'
>>> my_list = ['my', 'list', a, b]
Nome dado à lista, no caso
deste exemplo: my_list
Vetores (arrays)
>>> my_list = [1, 2, 3, 4]
>>> my_array =
np.array(my_list)
Nome dado ao vetor, no caso
deste exemplo: my_array e o
vetor foi formado a partir de
uma lista denominada my_list
e utiliza a biblioteca de
vetores Numpy (np.)
Uma lista de comandos mais úteis e comuns na construção de algoritmos utilizando-se a
linguagem Python encontram-se na tabela 2 a seguir:
Tabela 2 – Exemplos de comandos mais úteis e comuns na linguagem Python;
Descrição ou utilidade do comando Exemplo de linha de comando
Atribuição de uma variável
>>> x=5
>>> x
5
Soma de duas variáveis
>>> x+2
7
Disciplina
Pensamento Analítico e Análise
de Dados
Subtração de duas variáveis
>>> x-2
3
Multiplicação de duas variáveis
>>> x*2
10
Exponenciação deuma variável
>>>x**2
25
Divisão de uma variável
>>>x/�oat(2)
2,5
Resto de uma variável
>>> x÷2
1
Solicitar biblioteca de ajuda de comandos,
neste exemplo para a variável texto (string)
>>> help (str)
Essenciais da biblioteca Python para ciência de dados
O ecossistema de bibliotecas Python é vasto, mas algumas bibliotecas são absolutamente
cruciais para qualquer trabalho em ciência de dados.
Pandas: esta biblioteca é o rei quando se trata de manipulação de dados tabulares. Se você
já trabalhou com tabelas Excel, o Pandas será seu novo melhor amigo.
NumPy: NumPy (Numerical Python) é fundamental para qualquer computação cientí�ca.
Ele fornece suporte para matrizes multidimensionais e funções matemáticas para operar
nessas matrizes com e�ciência.
Matplotlib: esta é a biblioteca perfeita para visualização de dados. Ela oferece uma maneira
muito �exível de criar grá�cos e plots diversos.
Scikit-Learn: quando se trata de aprendizado de máquina, o Scikit-Learn é frequentemente a
primeira escolha. Ele tem uma gama de algoritmos prontos para uso e é extremamente
amigável para iniciantes.
Aplicando na prática
Imaginemos agora que você tem um conjunto de dados armazenado em um arquivo CSV que
você gostaria de analisar. Com Pandas, a importação desses dados para o ambiente Python é
bem fácil:
import pandas as pd
Disciplina
Pensamento Analítico e Análise
de Dados
data = pd.read_csv('seuarquivo.csv')
Mas o poder do Pandas não para por aí. Ele é altamente e�caz para limpeza e transformação de
conjuntos de dados. Você pode preencher valores faltantes, descartar colunas desnecessárias e
até mesmo criar novas colunas calculadas, como médias ou totais.
# Preenchendo valores faltantes
data.fillna(0, inplace=True)
# Calculando a média de uma coluna
media = data['sua_coluna'].mean()
Visualização de dados
A visualização é uma parte crucial na análise de dados. Você pode ter o conjunto de dados mais
bem preparado do mundo, mas se você não for capaz de apresentá-lo de forma compreensível,
tudo isso será em vão. Aqui é onde o Matplotlib brilha.
import matplotlib.pyplot as plt
plt.bar(data['Categoria'], data['Valor'])
plt.show()
Esse simples código gera um grá�co de barras mostrando valores por categoria. Mas o
Matplotlib também é capaz de muito mais: grá�cos de dispersão, histogramas, grá�cos de pizza
e até visualizações tridimensionais.
Em resumo, o Python oferece um ambiente de análise de dados incrivelmente rico e versátil,
tornando-o uma escolha ideal para pro�ssionais. E como você viu, colocar tudo isso em prática
não é nada intimidante.
Sintetizando os conceitos
Disciplina
Pensamento Analítico e Análise
de Dados
Agora, vamos condensar o que aprendemos até agora. Python destaca-se na análise de dados
devido à sua legibilidade, e�ciência e uma rica gama de bibliotecas, como Pandas, NumPy e
Scikit-learn. Essas bibliotecas simpli�cam tarefas complexas e economizam tempo.
Paralelamente, entender a lógica de programação, algoritmos, variáveis e �uxo de controle é
crucial para manipular e analisar dados e�cientemente.
Imagine que você trabalha em um departamento de RH e tem que analisar dados de
desempenho dos funcionários. Utilizando o Pandas, você poderia facilmente importar um arquivo
CSV contendo esses dados e começar a trabalhar. Com apenas algumas linhas de código, você
poderia limpar os dados, preenchendo valores faltantes e calculando médias de desempenho.
import pandas as pd
dados_funcionarios = pd.read_csv('desempenho_funcionarios.csv')
dados_funcionarios.fillna(0, inplace=True)
media_desempenho = dados_funcionarios['Desempenho'].mean()
NumPy seria útil, por exemplo, para cálculos matemáticos complexos, como a correlação entre
diferentes métricas de desempenho. Enquanto isso, você pode utilizar o Matplotlib para criar
grá�cos de desempenho por departamento, o que torna a informação mais fácil de interpretar
para a equipe de gestão.
import numpy as np
import matplotlib.pyplot as plt
correlacao = np.corrcoef(dados_funcionarios['Desempenho'], dados_funcionarios['Satisfação'])
[0,1]
plt.bar(dados_funcionarios['Departamento'], dados_funcionarios['Desempenho'])
Disciplina
Pensamento Analítico e Análise
de Dados
plt.show()
Se o objetivo for mais avançado, como prever desempenho com base em diferentes métricas, o
Scikit-Learn tem uma variedade de algoritmos de aprendizado de máquina que podem ajudar. Por
exemplo, um modelo de regressão linear poderia prever o desempenho futuro com base em
variáveis como anos de experiência, nível de educação e satisfação no trabalho.
No ambiente de trabalho, a aplicação desses conceitos e ferramentas pode fornecer insights
valiosos para a tomada de decisões, otimização de processos e estratégias de longo prazo. Para
ser e�caz, no entanto, é crucial que você tenha um ambiente Python bem con�gurado. O
Anaconda é uma excelente opção para isso, pois ele já vem com várias bibliotecas de ciência de
dados pré-instaladas e o Jupyter Notebook, facilitando a execução e o compartilhamento de seu
código.
Videoaula: Introdução ao Python para análise de dados
Este conteúdo é um vídeo!
Para assistir este conteúdo é necessário que você acesse o AVA pelo
computador ou pelo aplicativo. Você pode baixar os vídeos direto no aplicativo
para assistir mesmo sem conexão à internet.
Olá, estudante!
Preparado para uma jornada por análise de dados com Python? Neste vídeo, você vai passar por
três blocos ricos em conteúdo. Primeiro, entenderá o papel crucial do Python na análise de dados
e a importância da lógica de programação. Depois, aprenderá como con�gurar seu ambiente
Python para análise de dados, com exemplos práticos usando bibliotecas como Pandas e
Matplotlib. Finalmente, veremos como esses conceitos se aplicam em um ambiente de trabalho
real. São apenas alguns minutos que vão otimizar seu aprendizado. Vamos lá?
Saiba mais
Disciplina
Pensamento Analítico e Análise
de Dados
Aprofundamento em Python para Análise de Dados
Se você deseja se aprofundar mais no uso do Python para Análise de Dados, utilize como
referência de leitura complementar o artigo intitulado Uso do Módulo Python Uncertainties no
Cálculo de Incertezas Experimentais da Diferença de Potencial e Corrente Elétrica de um
Protótipo Experimental, dos autores Flávio M. do Couto e Julio F. da Silva.
Ao explorar esse recurso, você não somente aprofundará seus conhecimentos teóricos, mas
também se preparará para aplicá-los de forma prática no ambiente de trabalho. Desejamos uma
excelente jornada de aprendizado!
Referências
https://www.scielo.br/j/rbef/a/zPhrQhWFVzGfcmVwmbkv8bs/?format=pdf&lang=pt
https://www.scielo.br/j/rbef/a/zPhrQhWFVzGfcmVwmbkv8bs/?format=pdf&lang=pt
https://www.scielo.br/j/rbef/a/zPhrQhWFVzGfcmVwmbkv8bs/?format=pdf&lang=pt
https://www.scielo.br/j/rbef/a/zPhrQhWFVzGfcmVwmbkv8bs/?format=pdf&lang=pt
https://www.scielo.br/j/rbef/a/zPhrQhWFVzGfcmVwmbkv8bs/?format=pdf&lang=pt
Disciplina
Pensamento Analítico e Análise
de Dados
ALVES, T. S.; MARTINS, R. A. Comparação de desempenho entre Python e R em análise de dados.
Revista de Sistemas e Computação, v. 7, n. 1, p. 10-25, 2017.
COSTA, V. G.; LIMA, P. R. Análise exploratória de dados com Python e Matplotlib. Revista de
Estatística e Sistemas de Informação, v. 9, n. 2, p. 33-44, 2019.
FERNANDES, J. S.; OLIVEIRA, R. F. Introdução à lógica de programação com Python. Revista de
Informática Teórica e Aplicada, v. 18, n. 2, p. 67-89, 2019.
GONÇALVES, F. J.; SILVA, D. M. Utilizando Python em ambientes empresariais: um estudo de
caso. Revista de Administração e Negócios, v. 21, n. 3, p. 45-60, 2020.
MORAES, A. F.; SOUZA, J. R. Algoritmos e estruturas de controle no desenvolvimento de software.
Revista Brasileira de Engenharia de Software, v. 13, n. 1, p. 88-100, 2018.
MOURA, G. R.; COSTA, E. B. Big Data e Python: estratégias para análise de grandes conjuntos de
dados. Revista Brasileira de Computação, v. 14, n. 3, p. 128-141, 2021.
SANTOS, L. A.; PEREIRA, R. C. Uma abordagem prática para utilização de Pandase NumPy em
ciência de dados. Revista de Informática e Tecnologia, v. 16, n. 4, p. 47-55, 2018.
SILVA, S. M.; RIBEIRO, M. A. O papel do Python na ciência de dados: uma revisão sistemática.
Revista Brasileira de Computação Aplicada, v. 12, n. 1, p. 21-35, 2020.
Aula 2
Processamento de dados em larga escala com Hadoop e Spark
Disciplina
Pensamento Analítico e Análise
de Dados
Introdução
Olá, estudante!
Seja bem-vindo à aula, onde vamos conhecer mais sobre o Big Data e explorar uma das suas
ferramentas mais poderosas: o Hadoop. Nesta era digital, os dados são o novo petróleo. E não
estamos falando apenas de um monte de números, mas de um recurso valioso que, quando bem
gerenciado e analisado, pode oferecer insights inestimáveis e impulsionar o sucesso nos
negócios. Entender o Big Data e como lidar com ele é uma habilidade cada vez mais crucial no
mercado de trabalho atual.
Nesta aula, você não apenas aprenderá os conceitos básicos do Big Data e o que o faz ser
"Grande", mas também como o Hadoop nos ajuda a gerenciar esses dados de maneira e�caz.
Conheceremos o funcionamento interno do Hadoop, sua arquitetura e componentes como o
HDFS e o MapReduce. Com isso, você estará preparado para enfrentar os desa�os do
processamento de grandes volumes de dados, o que é essencial em áreas como comércio
eletrônico, streaming de conteúdo e análise de comportamento do consumidor.
Então, está pronto para começar? Esta habilidade é incrivelmente relevante em várias indústrias e
pode ser o diferencial na sua carreira. Vamos juntos descobrir como o Big Data e o Hadoop
podem transformar dados brutos em decisões inteligentes e estratégias de negócios e�cazes.
Pegue suas "pás de dados" e preparem-se para explorar!
Introdução ao Big Data e entendendo o Hadoop
Disciplina
Pensamento Analítico e Análise
de Dados
Olá, estudante!
Vamos entrar no vasto e complexo mundo do Big Data. Para começar uma pergunta: você sabe o
que faz algo ser considerado "Big Data"? Você teve a oportunidade de veri�car anteriormente que
não é apenas o Volume; temos outros dois Vs para considerar: Variedade e Velocidade. Essa
tríade forma o que muitos chamam de "Os 3Vs do Big Data". Além disso, alguns pesquisadores e
pro�ssionais também acrescentam outros Vs, como Veracidade e Valor, mostrando que o Big
Data não é só sobre quantidade, mas também sobre qualidade e utilidade.
Então, qual é o grande desa�o aqui? O desa�o está em como organizar e processar essa enorme
quantidade e diversidade de dados em tempo hábil. É aí que entra o Hadoop, uma solução criada
para lidar com esses desa�os. Pensem no Hadoop como um "orquestrador", que distribui as
tarefas de processamento de dados em vários computadores e depois junta tudo de novo. Isso é
o que chamamos de computação distribuída, e é a alma do Hadoop (Hadoop Distributed File
System).
Disciplina
Pensamento Analítico e Análise
de Dados
Figura 1 | Hadoop. Fonte: Wikipedia Commons.
Mas como essa orquestração acontece? Imagine o HDFS como um grande armazém onde os
dados são estocados. Mas esse armazém é especial, porque ele se divide em várias partes
menores, cada uma em um computador diferente. Dessa forma, se um dos "galpões" tiver um
problema, os outros ainda estão lá, operando normalmente. É uma questão de resiliência e
segurança.
Mas e o processamento desses dados? Para isso, temos o MapReduce, a engrenagem que move
o Hadoop. É como se fosse um maestro que rege duas grandes partes da orquestra: a seção
Map, que organiza os dados, e a seção Reduce, que faz a síntese e entrega algo signi�cativo.
Imagine que você tem um texto enorme e quer contar a frequência de cada palavra. O Map vai
quebrar o texto em palavras e criar pares (palavra, 1). O Reduce vai somar esses "1s" para cada
palavra, e você terá a contagem.
Vale lembrar que o Hadoop não está sozinho no ecossistema de Big Data. Ele faz parte de uma
família maior que inclui outras ferramentas como o Hive para consultas SQL, Pig para
processamento de �uxo de dados e HBase para armazenamento NoSQL. Cada uma tem um
papel especí�co, mas todas elas podem interagir com o Hadoop e o HDFS.
Mas a�nal, "Em que situações eu usaria Hadoop?", você deve se perguntar. Imagine uma
empresa de comércio eletrônico que quer analisar o comportamento de compra dos clientes, ou
um serviço de streaming querendo recomendar músicas ou �lmes com base nos gostos dos
usuários. Pois é, o Hadoop é perfeito para essas tarefas que envolvem processar e analisar
grandes conjuntos de dados.
A ideia até aqui é entender que a computação distribuída, orquestrada pelo Hadoop, é uma
resposta e�caz aos complexos desa�os do Big Data. E esse é só o começo, então prepare-se,
porque a seguir, vamos explorar o Apache Spark, outro gigante do processamento de Big Data!
Introdução ao Apache Spark e comparativo detalhado com Hadoop
Disciplina
Pensamento Analítico e Análise
de Dados
Agora que já conhecemos o Hadoop, vamos mergulhar no universo do Apache Spark, um "irmão"
mais jovem e ágil do Hadoop no mundo do Big Data. E a relação é mesmo de parentesco: o Spark
foi projetado para resolver algumas das limitações do Hadoop, ampliando suas capacidades e
oferecendo mais velocidade e �exibilidade.
Vamos começar pela arquitetura do Spark. Uma das principais inovações aqui é o RDD (Resilient
Distributed Dataset). Imagine o RDD como a espinha dorsal do Spark, uma estrutura de dados
distribuída que permite realizar operações como mapeamento, �ltragem e agregação de forma
extremamente e�ciente. Ao contrário do MapReduce do Hadoop, que lê e escreve no disco após
cada operação, o RDD permite manter dados na memória, o que torna o Spark muito mais rápido
para certas tarefas.
Mas o Spark não é apenas RDDs! Ele também introduziu abstrações de dados mais avançados
como DataFrames e Datasets, que são otimizados para operações semelhantes ao SQL. Esses
são acessados através de SparkSQL, uma interface que permite realizar consultas SQL em dados
distribuídos, misturando a familiaridade do SQL com o poder do processamento distribuído.
E tem mais: para lidar com dados em tempo real, o Spark oferece o Spark Streaming. Imagine
que você é uma empresa que precisa processar tuítes em tempo real para analisar o sentimento
do público. Com o Spark Streaming, isso se torna uma tarefa menos assustadora.
No domínio do aprendizado de máquina, o Spark fornece uma biblioteca chamada MLlib, que
contém uma variedade de algoritmos prontos para uso, de regressões a árvores de decisão e até
Disciplina
Pensamento Analítico e Análise
de Dados
mesmo algoritmos de aprendizado profundo. Isso torna o Spark uma ferramenta altamente
versátil para Data Scientists.
Vamos a um comparativo direto com o Hadoop:
1. Velocidade: o Spark é conhecido por ser até 100 vezes mais rápido que o Hadoop em
operações em memória e 10 vezes mais rápido em operações em disco.
2. Facilidade de uso: o Spark suporta múltiplas linguagens de programação, como Scala,
Python e Java. Ele também oferece APIs mais simples e menos verbosas, o que acelera o
desenvolvimento.
3. Recursos avançados: o Spark oferece bibliotecas nativas para tarefas como
processamento de �uxo contínuo e aprendizado de máquina, algo que você teria que
adicionar ao ecossistema Hadoop por meio de outras ferramentas como Mahout ou Storm.
4. Consumo de recursos: uma das desvantagens do Spark é o consumo maior de memória
RAM, tornando-o menos ideal para sistemas com recursos limitados.
5. Comunidade e suporte: embora o Hadoop tenha uma trajetória mais longa e, portanto, mais
suporte e recursos, o Spark tem ganhado terreno rapidamente devido à sua comunidade
ativa e crescente.
A escolha entre Hadoop e Spark depende, em última análise, dos requisitos especí�cos do seu
projeto. Se você precisa de um sistema robusto e testado para armazenamento de dados, o
Hadoop é uma escolha sólida. No entanto, se você busca rapidez e uma gama mais ampla de
capacidades de processamento, o Spark pode ser o caminho a seguir.
As duas ferramentas são poderosas! Ambas têmseus méritos e limitações, e a escolha entre
elas deve ser baseada nas necessidades especí�cas do seu projeto ou organização.
Sintetizando os conceitos
Disciplina
Pensamento Analítico e Análise
de Dados
Vamos consolidar o que aprendemos sobre Big Data, Hadoop e Apache Spark e falar um pouco
sobre como isso se aplica no mundo real. Lembre-se, Big Data não é apenas sobre o "volume" de
dados, mas também sobre "velocidade" e "variedade". E para processar essa avalanche de dados,
temos duas ferramentas incríveis: Hadoop e Apache Spark.
O Hadoop é como um "orquestrador" que utiliza o sistema de arquivos distribuído HDFS e o
framework de programação MapReduce. Ele é perfeito para tarefas que envolvem
armazenamento de dados de grande volume e computação distribuída. Imagine um ambiente de
trabalho como uma grande empresa de e-commerce. Usando o Hadoop, essa empresa pode
processar milhões de transações para analisar padrões de compra, otimizar o estoque e
melhorar a experiência do cliente.
Já o Apache Spark é um "irmão mais ágil" do Hadoop, projetado para ser mais rápido e mais
�exível. Ele opera com RDDs e oferece funcionalidades avançadas como DataFrames, Datasets e
Spark Streaming. Se você trabalha em uma empresa que precisa processar dados em tempo real,
como tuítes ou cliques em um site, o Spark é mais adequado. Ele é especialmente útil para
tarefas de aprendizado de máquina, graças à sua biblioteca MLlib.
Agora, sobre as diferenças:
1. Velocidade: Spark é geralmente mais rápido, pois permite o processamento em memória.
2. Facilidade de uso: Spark suporta múltiplas linguagens e tem APIs mais simples.
3. Capacidades avançadas: Spark oferece mais funcionalidades "fora da caixa" para tarefas
como streaming de dados e aprendizado de máquina.
Disciplina
Pensamento Analítico e Análise
de Dados
Mas atenção! O Spark consome mais memória RAM, o que pode ser um desa�o em sistemas
com recursos limitados. Enquanto isso, o Hadoop é mais maduro e pode ser uma escolha mais
segura para armazenamento de dados robustos e tarefas de processamento que não requerem
uma resposta em tempo real.
No ambiente de trabalho, a escolha entre Hadoop e Spark geralmente depende das necessidades
especí�cas do projeto. Uma empresa de análise de saúde poderia usar o Hadoop para armazenar
registros médicos em larga escala, enquanto um serviço de streaming como a Net�ix poderia
usar o Spark para fazer recomendações de �lmes em tempo real.
Então, qual é a moral da história? Tanto o Hadoop quanto o Spark são ferramentas poderosas
para lidar com os desa�os do Big Data, e cada uma tem seus próprios prós e contras. A chave é
entender suas necessidades e escolher a ferramenta que melhor se adapta a elas. Ficou mais
claro agora? Espero que sim!
Videoaula: Processamento de dados em larga escala com Hadoop e Spark
Este conteúdo é um vídeo!
Para assistir este conteúdo é necessário que você acesse o AVA pelo
computador ou pelo aplicativo. Você pode baixar os vídeos direto no aplicativo
para assistir mesmo sem conexão à internet.
Olá, estudante!
Pronto para embarcar em uma jornada pelo universo do Big Data? Neste vídeo, você vai
mergulhar fundo nos mundos do Hadoop e do Apache Spark. Vamos começar relembrando os
famosos "3 Vs" do Big Data (Variedade, Velocidade e Volume) e como o Hadoop age como um
"orquestrador" para gerenciar essa avalanche de dados. Depois, você conhecerá o Apache Spark,
o "irmão ágil" do Hadoop, e suas vantagens em termos de velocidade e funcionalidades
avançadas. Por último, mas não menos importante, exploraremos casos práticos que ilustram
quando usar cada ferramenta. Não perca!
Saiba mais
Disciplina
Pensamento Analítico e Análise
de Dados
Aprofundamento em Hadoop para Análise de Dados
Se você deseja se aprofundar mais no uso do Hadoop para Análise de Dados, utilize como
referência de leitura complementar o trabalho de conclusão de curso intitulado BANCO DE
DADOS: BIG DATA (HADOOP) - TRABALHANDO COM ALTA QUANTIDADE DE DADOS, do autor
Tiago Silva Lima.
Ao explorar esse recurso, você não somente aprofundará seus conhecimentos teóricos, mas
também se preparará para aplicá-los de forma prática no ambiente de trabalho. Desejamos uma
excelente jornada de aprendizado!
Referências
https://repositorio.pgsskroton.com/bitstream/123456789/64697/1/TIAGO_SILVA_LIMA.pdf
https://repositorio.pgsskroton.com/bitstream/123456789/64697/1/TIAGO_SILVA_LIMA.pdf
Disciplina
Pensamento Analítico e Análise
de Dados
ALVES, T. S.; MARTINS, R. A. Comparação de desempenho entre Python e R em análise de dados.
Revista de Sistemas e Computação, v. 7, n. 1, p. 10-25, 2017.
COSTA, V. G.; LIMA, P. R. Análise exploratória de dados com Python e Matplotlib. Revista de
Estatística e Sistemas de Informação, v. 9, n. 2, p. 33-44, 2019.
FERNANDES, J. S.; OLIVEIRA, R. F. Introdução à lógica de programação com Python. Revista de
Informática Teórica e Aplicada, v. 18, n. 2, p. 67-89, 2019.
GONÇALVES, F. J.; SILVA, D. M. Utilizando Python em ambientes empresariais: um estudo de
caso. Revista de Administração e Negócios, v. 21, n. 3, p. 45-60, 2020.
MORAES, A. F.; SOUZA, J. R. Algoritmos e estruturas de controle no desenvolvimento de software.
Revista Brasileira de Engenharia de Software, v. 13, n. 1, p. 88-100, 2018.
MOURA, G. R.; COSTA, E. B. Big Data e Python: estratégias para análise de grandes conjuntos de
dados. Revista Brasileira de Computação, v. 14, n. 3, p. 128-141, 2021.
SANTOS, L. A.; PEREIRA, R. C. Uma abordagem prática para utilização de Pandas e NumPy em
ciência de dados. Revista de Informática e Tecnologia, v. 16, n. 4, p. 47-55, 2018.
SILVA, S. M.; RIBEIRO, M. A. O papel do Python na ciência de dados: uma revisão sistemática.
Revista Brasileira de Computação Aplicada, v. 12, n. 1, p. 21-35, 2020.
Aula 3
Mineração de dados com Weka
Disciplina
Pensamento Analítico e Análise
de Dados
Introdução
Olá, estudante!
Preparado para conhecer sobre a Mineração de Dados? Essa é uma área vital em nosso mundo
cada vez mais orientado por dados, ajudando a descobrir padrões e insights que podem
revolucionar a forma como fazemos negócios, tomamos decisões e até resolvemos problemas
complexos de engenharia.
Nesta aula, você vai aprender sobre o processo completo da Mineração de Dados, começando
com a seleção e o pré-processamento de dados até a aplicação de algoritmos so�sticados para
extrair conhecimento útil. Vamos explorar ferramentas práticas como o software Weka e nos
aprofundar em teorias e técnicas, como Regras de Associação e Reforço de Aprendizagem. Tudo
isso vai equipá-lo com habilidades que são essenciais para qualquer pro�ssional da área de
dados.
Empolgado para começar? Entender esses conceitos não apenas fortalecerá seu currículo, mas
também o preparará para enfrentar desa�os do mundo real em diversos setores, desde otimizar
sistemas energéticos em prédios até melhorar estratégias de marketing.
Então, vamos lá, mergulhe de cabeça e descubra como você pode transformar montanhas de
dados brutos em joias de conhecimento!
Desvendando o mundo da mineração de dados e teorias associadas
Disciplina
Pensamento Analítico e Análise
de Dados
Olá, estudante!
O foco desta aula é no fascinante mundo da Mineração de Dados. Imagine que você está
trabalhando com enormes volumes de dados e buscando padrões ou informações que possam
ser úteis em tomadas de decisão, estratégia de negócios, ou mesmo na resolução de problemas
complexos de engenharia. Aqui entra a mineração de dados.
Mas vamos por partes. A Mineração de Dados é, na verdade, uma etapa em um processo mais
amplo conhecido como KDD (Knowledge Discovery in Databases). Imagine o KDD como uma
jornada: você começa selecionando um universo de dados para explorar; segue para o pré-
processamento para limpar e preparar esses dados; e, então, transformam-nos em um formato
que facilitará a etapa de mineração. Depois disso, aplica algoritmos de mineração para descobrir
padrões ou associações. Finalmente, interpreta e avalia o que encontrou para garantir queseja
útil e preciso. Ufa! É uma jornada intensa, não é?
Para essa missão, uma das ferramentas mais legais que temos à nossa disposição é o Weka.
Esse software de aprendizado de máquina foi escrito em Java e é amigável até mesmo para
quem não tem grande experiência com programação. O Weka oferece uma gama de algoritmos
para tarefas, como classi�cação, regressão e agrupamento. O primeiro passo é, claro, baixar e
instalar o software. Há uma grande quantidade de tutoriais on-line para ajudar você a começar.
Então, como usamos o Weka na prática? Digamos que você está projetando um sistema para
otimizar o uso de energia em um prédio inteligente. Você pode usar o Weka para analisar dados
históricos de consumo de energia, aplicando algoritmos para identi�car padrões de uso durante
Disciplina
Pensamento Analítico e Análise
de Dados
diferentes períodos do dia ou em diferentes condições climáticas. Essa informação pode ser
crucial para projetar sistemas mais e�cientes.
Agora, vamos nos aprofundar em algumas teorias. Já ouviu falar sobre Regras de Associação?
Elas são extremamente úteis para encontrar relações entre diferentes variáveis em um conjunto
de dados. Há vários algoritmos para isso, um dos mais conhecidos é o Apriori. Suponha que você
queira descobrir quais itens de um supermercado são frequentemente comprados juntos; o
Apriori é perfeito para essa tarefa. O Weka oferece esse algoritmo, além de outros para diferentes
tarefas.
Para complicar um pouco mais as coisas, vamos introduzir outra teoria: a do Reforço de
Aprendizagem. Esse é um tipo de aprendizado de máquina onde um agente aprende como se
comportar em um ambiente realizando ações e observando as recompensas dessas ações.
Parece complicado? Não é tanto assim. Pense nisso como um processo de "tentativa e erro"
orientado por dados. Acredite ou não, o Weka também tem ferramentas que apoiam esse tipo de
análise!
E por último, mas não menos importante, vamos falar sobre Clustering ou Agrupamento. Esse é
um método de dividir um grande conjunto de dados em subconjuntos (ou “clusters”), que são
mais manejáveis e signi�cativos. Algoritmos como k-means, que está disponível no Weka, são
comumente usados aqui. Imagine que você está tentando segmentar diferentes tipos de
comportamento de compra entre consumidores; o agrupamento pode ser uma abordagem útil.
Mãos à obra com Weka - avançando nas técnicas de mineração de dados
Disciplina
Pensamento Analítico e Análise
de Dados
Vamos ver aqui diversas abordagens sobre o Weka, desde regras de associação até técnicas de
aprendizado supervisionado e não supervisionado. Preparado?
Regras de associação e algoritmos
Conforme discutido anteriormente, regras de associação, como o algoritmo Apriori, são
excelentes para descobrir relações entre variáveis. Mas vocês sabiam que além do Apriori, há
outros algoritmos igualmente poderosos? O algoritmo FP-Growth, por exemplo, é uma alternativa
mais e�ciente computacionalmente. Ele é ideal para grandes conjuntos de dados e minimiza a
quantidade de varreduras necessárias na base de dados.
Exemplo prático: suponha que você trabalhe em um projeto de mobilidade urbana. Usando
regras de associação, você pode descobrir que altos níveis de tráfego são associados a
determinadas condições meteorológicas e horários. Essa informação pode ser vital para
planejar desvios ou ajustar os tempos dos semáforos para melhorar o �uxo de tráfego.
Pré-processamento de dados
Não se esqueça, antes de alimentar qualquer algoritmo, é crucial limpar e preparar seus dados. O
Weka oferece uma vasta gama de ferramentas para tratar de valores ausentes, normalizar e
padronizar dados, e até para realizar engenharia de atributos.
Importância: dados mal preparados podem distorcer os resultados, causando o que é
conhecido como "lixo entra, lixo sai" (GIGO - Garbage In, Garbage Out). Portanto, sempre
Disciplina
Pensamento Analítico e Análise
de Dados
dediquem tempo su�ciente para esta etapa.
Avaliação e validação de modelos
Depois de executar algoritmos e encontrar padrões, o próximo passo é avaliar a qualidade
dessas descobertas. O Weka facilita isso oferecendo várias métricas como precisão, recall, F1-
Score e a curva ROC.
Aprendizado supervisionado versus não supervisionado
Nem toda mineração de dados é feita da mesma forma. No aprendizado supervisionado, temos
uma variável alvo que estamos tentando prever ou classi�car. O Weka oferece algoritmos como
árvores de decisão, máquinas de vetores de suporte (SVMs) e regressão logística para essas
tarefas.
Exemplo prático: suponham que você tem dados de falhas de equipamentos em uma
fábrica. Usando classi�cação, você pode prever que equipamentos são mais propensos a
falhas e agir preventivamente.
Por outro lado, no aprendizado não supervisionado, estamos mais interessados em encontrar
estruturas ocultas nos dados. Técnicas de agrupamento, como o k-means, são frequentemente
usadas aqui.
Exemplo prático: se você está no setor de varejo, o agrupamento pode ser usado para
segmentar clientes com base em hábitos de compra, o que pode ser útil para campanhas
de marketing personalizadas.
A importância da atualização contínua
O campo de mineração de dados e aprendizado de máquina está sempre em evolução. Novas
técnicas, como redes neurais profundas e métodos de aprendizado por reforço, estão sendo
desenvolvidos constantemente. O Weka também se atualiza frequentemente para incluir essas
novas técnicas. Portanto, mantenha-se atualizado!
A seguir, vamos colocar em prática tudo o que aprendemos.
Sintetizando os conceitos
Disciplina
Pensamento Analítico e Análise
de Dados
Agora que vimos o universo da Mineração de Dados e suas diversas técnicas e teorias, vamos
fazer um resumo rápido para consolidar o aprendizado.
Primeiramente, lembrem-se de que a Mineração de Dados é parte de um processo maior
chamado KDD (Knowledge Discovery in Databases). Esse processo envolve várias etapas, como
seleção, pré-processamento e transformação dos dados antes de aplicar algoritmos para
descobrir padrões úteis. No ambiente de trabalho, isso pode ser utilizado em várias áreas, como
otimização de sistemas energéticos em prédios ou mobilidade urbana. Por exemplo, você pode
usar algoritmos para identi�car padrões de consumo de energia e assim criar um prédio mais
e�ciente.
Segundo, a ferramenta Weka pode ser uma grande aliada nessa jornada. Ela oferece uma
variedade de algoritmos para tarefas, como classi�cação, regressão e agrupamento. No
ambiente corporativo, o Weka pode ser usado para, digamos, analisar o comportamento de
compra dos consumidores. Algoritmos como o Apriori ou o FP-Growth podem ajudar a entender
quais produtos são frequentemente comprados juntos, otimizando estratégias de venda
cruzada.
Terceiro, o pré-processamento de dados é um passo crítico. Lembre-se sempre do princípio "lixo
entra, lixo sai" (GIGO). Dados mal preparados podem levar a insights imprecisos. Em um
ambiente de fábrica, por exemplo, a falta de limpeza nos dados pode resultar em previsões
erradas sobre falhas de equipamentos, comprometendo a e�ciência da produção.
Disciplina
Pensamento Analítico e Análise
de Dados
Quarto, é vital avaliar e validar os modelos que vocês criam. Métricas como precisão, recall e F1-
Score são cruciais para entender o quão con�áveis são suas descobertas. Isso é especialmente
importante em setores críticos como saúde, onde modelos imprecisos podem ter consequências
graves.
Quinto, temos dois tipos principais de aprendizado: supervisionado e não supervisionado.
Enquanto o aprendizado supervisionado é útil para tarefas como prever falhas de equipamento
em uma fábrica, o não supervisionado, com técnicas como o k-means, pode ser usado para
segmentar clientes em um negócio de varejo, melhorando as campanhas de marketing.
Por último, mas de�nitivamente não menos importante, a área de mineração de dados está em
constante evolução. É crucial manter-se atualizado com as novas técnicas e atualizações do
Weka ou qualquer outra ferramenta quevocês estejam usando. O aprendizado é um processo
contínuo, e estar atualizado pode fornecer uma vantagem competitiva signi�cativa para você e
sua empresa.
Videoaula: Mineração de dados com Weka
Este conteúdo é um vídeo!
Para assistir este conteúdo é necessário que você acesse o AVA pelo
computador ou pelo aplicativo. Você pode baixar os vídeos direto no aplicativo
para assistir mesmo sem conexão à internet.
Olá, estudante!
Preparado para uma verdadeira jornada no mundo da Mineração de Dados? Neste vídeo, vamos
mergulhar em todos os tópicos abordados na aula: do fascinante processo de KDD à prática com
o software Weka. Você analisará como aplicar teorias e algoritmos em cenários do mundo real,
como otimização de sistemas energéticos e mobilidade urbana. Ainda mais, destacaremos a
importância do pré-processamento de dados e como avaliar seus modelos de forma e�caz. É um
guia completo para você dominar essa arte!
Saiba mais
Disciplina
Pensamento Analítico e Análise
de Dados
Aprofundamento do WEKA para Análise de Dados
Se você deseja se aprofundar mais no uso do WEKA para Análise de Dados, utilize como
referência de leitura complementar o artigo intitulado Mineração de dados e características da
mortalidade infantil, dos autores Rossana Cristina Xavier Ferreira Vianna, Claudia Maria Cabral de
Barra Moro, Samuel Jorge Moysés, Deborah Carvalho e Julio Cesar Nievola.
Ao explorar esse recurso, você não somente aprofundará seus conhecimentos teóricos, mas
também se preparará para aplicá-los de forma prática no ambiente de trabalho. Desejamos uma
excelente jornada de aprendizado !
Referências
https://www.scielo.br/j/csp/a/cpJFDz8tCwHgXLJRvqPRzJz/?format=pdf&lang=pt
https://www.scielo.br/j/csp/a/cpJFDz8tCwHgXLJRvqPRzJz/?format=pdf&lang=pt
Disciplina
Pensamento Analítico e Análise
de Dados
ALVES, T. S.; MARTINS, R. A. Comparação de desempenho entre Python e R em análise de dados.
Revista de Sistemas e Computação, v. 7, n. 1, p. 10-25, 2017.
COSTA, V. G.; LIMA, P. R. Análise exploratória de dados com Python e Matplotlib. Revista de
Estatística e Sistemas de Informação, v. 9, n. 2, p. 33-44, 2019.
FERNANDES, J. S.; OLIVEIRA, R. F. Introdução à lógica de programação com Python. Revista de
Informática Teórica e Aplicada, v. 18, n. 2, p. 67-89, 2019.
GONÇALVES, F. J.; SILVA, D. M. Utilizando Python em ambientes empresariais: um estudo de
caso. Revista de Administração e Negócios, v. 21, n. 3, p. 45-60, 2020.
MORAES, A. F.; SOUZA, J. R. Algoritmos e estruturas de controle no desenvolvimento de software.
Revista Brasileira de Engenharia de Software, v. 13, n. 1, p. 88-100, 2018.
MOURA, G. R.; COSTA, E. B. Big Data e Python: estratégias para análise de grandes conjuntos de
dados. Revista Brasileira de Computação, v. 14, n. 3, p. 128-141, 2021.
SANTOS, L. A.; PEREIRA, R. C. Uma abordagem prática para utilização de Pandas e NumPy em
ciência de dados. Revista de Informática e Tecnologia, v. 16, n. 4, p. 47-55, 2018.
SILVA, S. M.; RIBEIRO, M. A. O papel do Python na ciência de dados: Uma revisão sistemática.
Revista Brasileira de Computação Aplicada, v. 12, n. 1, p. 21-35, 2020.
Aula 4
Aplicações práticas das ferramentas computacionais para análise de dados em projetos de
engenharias
Disciplina
Pensamento Analítico e Análise
de Dados
Introdução
Olá, estudante!
Você já se perguntou como tomar decisões mais acertadas em seus projetos de engenharia?
Esta aula é para você! Vamos conhecer mais sobre a análise estatística aplicada à engenharia,
focando em softwares poderosos como SPSS, SAS e R. Embora a engenharia seja
frequentemente associada a cálculos e design, a análise estatística é um pilar essencial que não
deve ser negligenciado.
Esta aula é projetada para elevar seu nível de compreensão e habilidades práticas em análise de
dados. Você aprenderá como técnicas estatísticas podem otimizar processos, prever cenários
futuros e até salvar vidas em áreas como engenharia biomédica. Os softwares abordados aqui
são ferramentas que você poderá usar em uma ampla gama de aplicações, desde melhorar a
e�ciência energética até desenvolver algoritmos de aprendizado de máquina.
A habilidade de analisar dados de forma e�ciente é altamente valorizada no mundo pro�ssional e
pode ser o diferencial que levará seus projetos de engenharia ao próximo patamar. Vamos
embarcar nessa jornada de aprendizado e descobrir como você pode aplicar essas ferramentas
em seu dia a dia como engenheiro!
Introdução à análise estatística com software e SPSS em projetos de
engenharia
Disciplina
Pensamento Analítico e Análise
de Dados
Vamos focar na importância da análise estatística em projetos de engenharia. Quando falamos
de engenharia, muitas vezes pensamos em física, cálculos e design, mas frequentemente
esquecemos o papel crucial que a análise estatística desempenha. Por isso, softwares como
SPSS, SAS e R são ferramentas indispensáveis no kit de todo engenheiro.
Começando com a relevância da análise estatística em engenharia: é uma prática que vai muito
além do uso de números. Ela se entrelaça com Teoria das Probabilidades, oferecendo meios para
otimizar processos, identi�car correlações e até mesmo prever cenários futuros. Por exemplo, na
engenharia elétrica, técnicas estatísticas são aplicadas para otimizar redes elétricas e garantir
que o �uxo de energia seja e�ciente e con�ável.
Agora, vamos falar sobre o SPSS. Esse software, que signi�ca "Statistical Package for the Social
Sciences", tem uma interface muito amigável e intuitiva, tornando a análise estatística acessível
mesmo para quem não é um expert em programação. Ele é amplamente usado em várias
disciplinas de engenharia. Pense em engenharia mecânica: você pode usar o SPSS para analisar
a durabilidade de diferentes materiais sob várias condições de pressão e temperatura. Esse tipo
de análise muitas vezes usa conceitos de Estatística Bayesiana para calcular a probabilidade de
falha de um material.
No SPSS você tem uma variedade de testes estatísticos ao seu alcance, como t-test, ANOVA e
regressão. Suponha que você está trabalhando em um projeto de engenharia ambiental e quer
avaliar a e�cácia de diferentes métodos de tratamento de água. Usando o ANOVA, você pode
comparar as médias de vários grupos (neste caso, métodos de tratamento) para determinar qual
Disciplina
Pensamento Analítico e Análise
de Dados
é o mais e�caz. Conhece a Lei dos Grandes Números da estatística? Ela garante que, com um
tamanho de amostra grande o su�ciente, suas estimativas serão cada vez mais precisas.
Para compreender melhor as relações entre variáveis, você usará regressões. Em engenharia de
tráfego, por exemplo, você pode querer entender como diferentes fatores, como velocidade, �uxo
de tráfego e condições climáticas afetam a probabilidade de acidentes em uma rodovia. A
regressão linear múltipla é uma técnica que permite incorporar todas essas variáveis em um
único modelo, facilitando uma compreensão abrangente e precisa do problema em questão.
Além disso, o SPSS também é capaz de realizar Análise de Componentes Principais (PCA), uma
técnica usada em aprendizado de máquina e visão computacional. Digamos que você esteja na
engenharia aeroespacial e deseje reduzir a dimensão de um conjunto de dados sobre as
características de diferentes materiais usados na fabricação de aeronaves. A PCA ajuda você a
identi�car os componentes mais importantes desses dados, reduzindo a complexidade sem
perder informações críticas.
Então, como você pode ver, o SPSS é uma ferramenta robusta que se encaixa em uma variedade
de aplicações em engenharia, desde a otimização de processos até o entendimento profundo de
relações complexas entre variáveis. Ele oferece uma série de abordagens estatísticas, baseadas
em teorias sólidas, como Teoria das Probabilidades, Lei dos Grandes Números e Estatística
Bayesiana, que ajudam a tomar decisões bem fundamentadas em seus projetos de engenharia.
Não subestime o poder da análise estatística, ela é um pilar que sustenta muitas das grandes
inovações no campoda engenharia.
SAS e R em projetos de engenharia expandida
Disciplina
Pensamento Analítico e Análise
de Dados
Excelente, agora que já exploramos o universo do SPSS, vamos abordar o SAS e o R, dois outros
pesos-pesados na análise estatística aplicada à engenharia. Ambos têm características únicas
que os tornam adequados para diferentes tipos de projetos e preferências pessoais em termos
de manipulação de dados e análise.
SAS: a força programática na análise estatística
O SAS, que signi�ca "Statistical Analysis System", oferece uma abordagem mais programática
para a análise estatística. Ao contrário do SPSS, que é orientado para o usuário através de uma
interface grá�ca, o SAS permite maior controle por meio da escrita de código. Isso é
especialmente útil em campos como engenharia de dados, análise de sistemas e engenharia
biomédica, onde a personalização e a manipulação avançada de dados são frequentemente
necessárias.
O SAS tem uma característica única chamada “Procedimentos” ou “PROC”, que são conjuntos de
instruções pré-de�nidas para realizar uma série de análises. “PROC MEANS”, por exemplo, é
extremamente útil para calcular estatísticas descritivas, enquanto “PROC REG” se especializa em
regressão linear. O SAS também tem recursos para análise de séries temporais (“PROC ARIMA”)
e modelos de mistura (“PROC MIXED”), tornando-o uma escolha forte para engenheiros que
trabalham com dados longitudinais ou hierárquicos.
Teoria e exemplos no SAS: a Teoria da Inferência Causal é muitas vezes aplicada usando o
SAS, especialmente em engenharia de sistemas de saúde. Por exemplo, usando o “PROC
CAUSALTRT”, você pode analisar o efeito de diferentes tratamentos em pacientes para
Disciplina
Pensamento Analítico e Análise
de Dados
otimizar os resultados. Além disso, no campo da engenharia de produção, os engenheiros
usam o SAS para executar Análise de Custo-Benefício. A linguagem de programação SAS
permite incorporar múltiplas variáveis e cenários, tornando a análise mais robusta e
abrangente.
R: a caixa de ferramentas open-source
R, por outro lado, é uma linguagem de programação open-source com um foco em análise
estatística e grá�cos de dados. É altamente extensível, com uma comunidade ativa que contribui
com uma in�nidade de pacotes para praticamente qualquer tipo de análise que você possa
imaginar.
No ambiente R, há um ecossistema de pacotes conhecido como "tidyverse", criado para tornar a
manipulação e visualização de dados mais intuitiva. Isso é especialmente útil em engenharia civil
e engenharia ambiental, onde a visualização de dados geoespaciais é crítica.
Teoria e exemplos no R: o R é rico em teorias estatísticas, como Testes Não Paramétricos e
Modelos Lineares Generalizados (GLM). Por exemplo, engenheiros mecânicos que
trabalham com sistemas de vibração podem utilizar o pacote “lme4” para ajustar modelos
lineares mistos, uma extensão do GLM, para entender melhor o comportamento de
diferentes materiais sob diversas condições.
O R também é forte na aplicação de Machine Learning, sendo frequentemente usado em
engenharia de software e engenharia de dados para criar algoritmos de aprendizado de máquina.
Pacotes como “randomForest” e “xgboost” permitem que os engenheiros construam modelos
preditivos altamente e�cazes.
Integração e �exibilidade: uma das maiores vantagens do R é sua capacidade de se integrar
com outras linguagens de programação, como Python e C++. Isso é crucial em projetos de
engenharia multidisciplinares, onde diferentes equipes podem preferir diferentes
ferramentas de análise.
Sintetizando os conceitos
Disciplina
Pensamento Analítico e Análise
de Dados
Agora que já exploramos o SPSS, SAS e R, é hora de sintetizar o que aprendemos e entender
como essas ferramentas podem ser utilizadas de forma e�caz em diferentes ramos da
engenharia. O ponto em comum entre essas três plataformas é a capacidade de realizar análises
estatísticas robustas que auxiliam na otimização de processos, identi�cação de correlações e
predição de cenários futuros.
No mundo empresarial, imagine que você é um engenheiro de produção e quer melhorar a
e�ciência da linha de montagem. Você pode utilizar o SPSS para realizar testes ANOVA e
entender se diferentes métodos de produção têm impactos signi�cativos na produtividade. Com
o SAS, você poderia ir um passo além, utilizando “Procedimentos”, como “PROC REG” para
desenvolver modelos de regressão que preveem a produtividade com base em diversas variáveis,
como velocidade da linha de montagem e qualidade dos materiais.
O SAS também tem uma vantagem particular em áreas como a engenharia biomédica. Utilizando
o “PROC CAUSALTRT”, é possível analisar o efeito de diferentes tratamentos médicos. Suponha
que você queira entender qual medicamento oferece o melhor resultado em termos de redução
da pressão arterial sem efeitos colaterais signi�cativos. O SAS permite um nível de
personalização e complexidade que pode ser crucial em áreas que lidam com vidas humanas.
Já o R destaca-se pela sua extensibilidade e pelo ecossistema de pacotes, como o “tidyverse”.
Engenheiros ambientais, por exemplo, podem se bene�ciar enormemente da capacidade do R em
manipular e visualizar dados geoespaciais. Imagine que você está avaliando o impacto ambiental
de diferentes locais de construção para um novo aeroporto. Utilizando pacotes especí�cos no R,
Disciplina
Pensamento Analítico e Análise
de Dados
você pode criar mapas de calor que mostram variáveis como poluição do solo e qualidade da
água.
Em engenharia de software, o R também tem um papel signi�cativo, especialmente em Machine
Learning. Pacotes como “randomForest” e “xgboost” permitem a construção de modelos
preditivos. Digamos que você está desenvolvendo um sistema de recomendação para uma
plataforma de streaming, o R permite que você treine um modelo para prever as preferências dos
usuários com alta precisão.
Em resumo, SPSS, SAS e R oferecem uma gama diversi�cada de técnicas e métodos estatísticos,
tornando-se ferramentas indispensáveis em qualquer projeto de engenharia que busque decisões
baseadas em dados. Cada software tem suas particularidades, mas todos são fundamentais
para entender relações complexas entre variáveis e para aprimorar continuamente os processos
e produtos em diversos campos da engenharia.
Videoaula: Aplicações práticas das ferramentas computacionais para análise
de dados em projetos de engenharias
Este conteúdo é um vídeo!
Para assistir este conteúdo é necessário que você acesse o AVA pelo
computador ou pelo aplicativo. Você pode baixar os vídeos direto no aplicativo
para assistir mesmo sem conexão à internet.
Olá, estudante! Preparado para desvendar o fascinante mundo da análise estatística em
engenharia? Neste vídeo, vamos revisitar os pontos-chave dos softwares SPSS, SAS e R e como
eles são aplicados em diferentes ramos da engenharia. Você verá como essas ferramentas
podem otimizar processos, prever cenários futuros e até mesmo salvar vidas em campos como a
engenharia biomédica. Este é um conteúdo indispensável se você busca tomar decisões bem
fundamentadas em seus projetos. Vamos lá?
Saiba mais
Disciplina
Pensamento Analítico e Análise
de Dados
Aprofundamento em Python para Análise de Dados
Se você deseja se aprofundar mais no uso de Python para Análise de Dados, utilize como
referência de leitura complementar o artigo intitulado Animações de conceitos da teoria de erros
usando Manim/Python, do autor Vitor R. Coluci.
Ao explorar esse recurso, você não somente aprofundará seus conhecimentos teóricos, mas
também se preparará para aplicá-los de forma prática no ambiente de trabalho. Desejamos uma
excelente jornada de aprendizado!
Referências
https://www.scielo.br/j/rbef/a/YlfHKMG9B4HWKZfPtDNgPsn/?format=pdf&lang=pt
https://www.scielo.br/j/rbef/a/YlfHKMG9B4HWKZfPtDNgPsn/?format=pdf&lang=pt
Disciplina
Pensamento Analítico e Análise
de Dados
ALVES, T. S.; MARTINS, R. A. Comparação de desempenho entre Python e R em análise de dados.
Revista de Sistemas e Computação,v. 7, n. 1, p. 10-25, 2017.
COSTA, V. G.; LIMA, P. R. Análise exploratória de dados com Python e Matplotlib. Revista de
Estatística e Sistemas de Informação, v. 9, n. 2, p. 33-44, 2019.
FERNANDES, J. S.; OLIVEIRA, R. F. Introdução à lógica de programação com Python. Revista de
Informática Teórica e Aplicada, v. 18, n. 2, p. 67-89, 2019.
GONÇALVES, F. J.; SILVA, D. M. Utilizando Python em ambientes empresariais: um estudo de
caso. Revista de Administração e Negócios, v. 21, n. 3, p. 45-60, 2020.
MORAES, A. F.; SOUZA, J. R. Algoritmos e estruturas de controle no desenvolvimento de software.
Revista Brasileira de Engenharia de Software, v. 13, n. 1, p. 88-100, 2018.
MOURA, G. R.; COSTA, E. B. Big Data e Python: estratégias para análise de grandes conjuntos de
dados. Revista Brasileira de Computação, v. 14, n. 3, p. 128-141, 2021.
SANTOS, L. A.; PEREIRA, R. C. Uma abordagem prática para utilização de Pandas e NumPy em
ciência de dados. Revista de Informática e Tecnologia, v. 16, n. 4, p. 47-55, 2018.
SILVA, S. M.; RIBEIRO, M. A. O papel do Python na ciência de dados: Uma revisão sistemática.
Revista Brasileira de Computação Aplicada, v. 12, n. 1, p. 21-35, 2020.
Aula 5
Revisão da unidade
Disciplina
Pensamento Analítico e Análise
de Dados
Entendendo conceitos fundamentais das ferramentas computacionais
Olá, estudante, parabéns por ter chegado até aqui!
Agora chegou a hora de revermos os principais conceitos estudados, vamos lá?
O Python foi destacado como uma linguagem essencial para análise de dados devido à sua
legibilidade, e�ciência e rica biblioteca de ferramentas, como Pandas, NumPy e Scikit-Learn.
Essas bibliotecas facilitam a manipulação e análise de grandes conjuntos de dados,
economizando tempo e esforço. O ensino também focou na importância da lógica de
programação, algoritmos, variáveis e �uxo de controle como fundamentos para resolver
problemas complexos. Além disso, foi enfatizada a necessidade de um ambiente Python bem
con�gurado para a prática e�caz de ciência de dados, recomendamos o uso do Anaconda e do
Jupyter Notebook. Exemplos práticos ilustraram como esses conceitos e essas ferramentas
podem ser aplicados em um contexto de trabalho, fornecendo insights valiosos para tomada de
decisões e estratégias a longo prazo.
Abordamos os principais conceitos e ferramentas relacionados ao mundo do Big Data,
enfatizando o Hadoop e o Apache Spark como soluções para os desa�os de processamento e
análise de grandes volumes de dados. O Hadoop é descrito como um "orquestrador" que utiliza o
HDFS para armazenamento e o MapReduce para processamento de dados. Ele é ideal para
situações que requerem armazenamento seguro e processamento distribuído de grandes
volumes de dados, como empresas de e-commerce.
Disciplina
Pensamento Analítico e Análise
de Dados
Já o Apache Spark é apresentado como uma versão mais rápida e �exível, que utiliza RDDs e
oferece funcionalidades como Spark Streaming e MLlib para aprendizado de máquina. Além da
velocidade e da �exibilidade, o Spark também oferece uma gama mais ampla de recursos e
suporta múltiplas linguagens de programação. A escolha entre as duas ferramentas deve ser
feita com base nas necessidades especí�cas do projeto, sendo que Hadoop é mais robusto para
armazenamento e Spark oferece mais recursos para processamento em tempo real e análise de
dados.
No universo da Mineração de Dados, apontamos que essa atividade é apenas uma etapa dentro
do processo maior conhecido como KDD (Knowledge Discovery in Databases). Esse ciclo
começa com a seleção de dados, seguido de pré-processamento para limpeza e transformação e
culmina na aplicação de algoritmos para descobrir padrões ou associações úteis. O Weka surge
como uma ferramenta valiosa nesse contexto, permitindo que até mesmo os não-programadores
possam executar tarefas complexas de aprendizado de máquina, como classi�cação, regressão
e agrupamento. Foi destacado como o software pode ser aplicado em cenários práticos, como a
otimização do uso de energia em prédios inteligentes.
Também introduzimos teorias e técnicas especí�cas usadas em mineração de dados. Regras de
Associação e algoritmos como o Apriori são úteis para descobrir relações entre variáveis. A
Reforço de Aprendizagem permite que um agente aprenda a se comportar em um ambiente
através de "tentativa e erro". O conceito de Agrupamento (Clustering) ajuda a segmentar grandes
volumes de dados em subconjuntos mais gerenciáveis. Além disso, o curso sublinhou a
importância do pré-processamento de dados e a necessidade de avaliação e validação rigorosas
dos modelos gerados. Métricas como precisão, recall e F1-Score foram indicadas como
essenciais para esse processo de avaliação.
Exploramos a importância da análise estatística em diferentes áreas da engenharia e como
softwares como SPSS, SAS e R se tornam ferramentas cruciais nesse contexto. O SPSS destaca-
se pela sua interface amigável, oferecendo uma variedade de testes estatísticos como t-test e
ANOVA, úteis em campos como engenharia elétrica e mecânica. O SAS, por outro lado,
proporciona uma abordagem mais programática e é especialmente relevante em campos que
requerem personalização e complexidade, como engenharia biomédica.
O R é notável pela sua extensibilidade e forte ecossistema de pacotes, sendo amplamente
utilizado em engenharia ambiental e de software. Cada um desses softwares possui suas
particularidades e fortes aplicações teóricas, desde a Teoria das Probabilidades até a Inferência
Causal, permitindo aos engenheiros realizar análises robustas para otimização de processos,
identi�cação de correlações e predição de cenários futuros.
Videoaula: Revisão da unidade
Este conteúdo é um vídeo!
Para assistir este conteúdo é necessário que você acesse o AVA pelo
computador ou pelo aplicativo. Você pode baixar os vídeos direto no aplicativo
Disciplina
Pensamento Analítico e Análise
de Dados
para assistir mesmo sem conexão à internet.
Olá, estudante!
Prepare-se para uma jornada empolgante de aprendizado com nosso vídeo. Vamos mergulhar no
universo da programação em Python, explorar o mundo do Big Data com Hadoop e Spark e
desvendar os mistérios da Mineração de Dados e análise estatística em engenharia. Você verá
como essas ferramentas e conceitos são cruciais na tomada de decisões e estratégias em
diversos campos. Fique atento, pois os próximos minutos vão enriquecer signi�cativamente sua
compreensão desses tópicos essenciais.
Estudo de caso
Para contextualizar as aulas e �xar os conhecimentos, vamos trabalhar em dois estudos de
caso.
Estudo 1
Suponha que você foi recentemente contratado como um analista de dados sênior para uma
grande empresa de varejo multinacional. A empresa opera em diversos países e tem tanto lojas
físicas quanto uma presença robusta on-line. Embora a empresa tenha experimentado um
crescimento substancial nos últimos anos, a alta gerência está preocupada com os índices
decrescentes de satisfação do cliente capturados nas pesquisas internas.
Disciplina
Pensamento Analítico e Análise
de Dados
Diante desse cenário, a equipe de gestão fez uma pesquisa de satisfação do cliente em grande
escala. Essa pesquisa abordou vários aspectos da experiência do cliente, incluindo satisfação
geral, tempo de espera na �la, qualidade do atendimento ao cliente, facilidade de encontrar
produtos e até mesmo a e�cácia das estratégias de marketing on-line. Os dados estão agora
disponíveis e é sua responsabilidade analisá-los.
Não apenas a equipe de gestão quer entender os principais fatores que afetam a satisfação do
cliente, mas também está particularmente interessada em saber se existem diferenças
signi�cativas entre as experiências em lojas físicas e on-line. Além disso, a pesquisa contém
feedback em texto aberto dos clientes, e a empresa está curiosa para saber se esses
comentários podem fornecer insights adicionais.
Como você analisaria esses dados multifacetados e complexos para identi�car os principais
determinantes da satisfação do cliente, diferençasentre os canais de loja e fornecer insights
acionáveis para a equipe de gestão, mantendo em mente a escala global e a diversidade de
operações da empresa?
Estudo 2
Você é o Chefe de Tecnologia de DataStream Analytics, uma empresa especializada em análise
de dados em tempo real. A equipe está dividida sobre a adoção do Apache Spark em vez do
Hadoop atualmente em uso. Sarah, a engenheira de dados sênior, está ansiosa para utilizar o
Spark devido às suas capacidades avançadas de análise e aprendizado de máquina. Mark, o
arquiteto de soluções, tem suas reservas, particularmente em relação ao custo e outros fatores
práticos. Você precisa tomar uma decisão informada que atenda às necessidades a longo prazo
da empresa.
Como Chefe de Tecnologia, qual tecnologia você escolheria para o futuro processamento de
dados na DataStream Analytics: Apache Spark ou Hadoop? Justi�que sua escolha considerando
os seguintes aspectos:
1. Velocidade de processamento e escalabilidade.
2. Complexidade das tarefas de processamento.
3. Custo.
4. Maturidade e robustez.
Re�ita
Estudo 1
1. Seleção de ferramentas: pense em qual linguagem de programação e bibliotecas seriam
mais e�cazes para essa análise. Considere a facilidade de uso, e�ciência e as bibliotecas
disponíveis para análise de dados e visualização.
2. Limpeza e preparação de dados: quais etapas você seguiria para limpar e preparar os
dados para análise? Quais colunas são realmente necessárias e quais poderiam ser
descartadas?
3. Análise estatística: quais métricas estatísticas você usaria para entender a distribuição dos
dados? Média, mediana, desvio padrão?
4. Correlação entre métricas: como você identi�caria a relação entre diferentes métricas? Que
tipo de análise de correlação faria sentido aqui?
Disciplina
Pensamento Analítico e Análise
de Dados
5. Visualização de dados: quais tipos de grá�cos seriam mais e�cazes para apresentar suas
descobertas? Grá�cos de barra, linhas, grá�cos de dispersão?
�. Insights acionáveis: como você traduziria suas descobertas em ações práticas que a
equipe de gestão possa implementar?
Estudo 2
1. Velocidade de processamento e escalabilidade: pense nas necessidades especí�cas da
DataStream Analytics. O que é mais crítico: processamento em lote ou em tempo real?
Como isso impacta a escolha entre Spark e Hadoop?
2. Complexidade das tarefas de processamento: Spark tem vantagens em cenários que
exigem análises complexas e operações de Machine Learning. Hadoop é mais voltado para
tarefas de MapReduce. Quais são as necessidades atuais e futuras da empresa?
3. Custo: ambas as plataformas têm seus custos associados. Hadoop tem um ecossistema
mais maduro e pode ser mais barato em termos de armazenamento. Spark é conhecido por
consumir mais recursos. Como o orçamento afeta sua decisão?
4. Maturidade e robustez: embora o Spark seja uma tecnologia emergente com recursos
avançados, o Hadoop tem um histórico mais longo e é considerado mais robusto para
armazenamento. Como isso pesa na sua decisão?
Videoaula: Resolução do estudo de caso
Este conteúdo é um vídeo!
Para assistir este conteúdo é necessário que você acesse o AVA pelo
computador ou pelo aplicativo. Você pode baixar os vídeos direto no aplicativo
para assistir mesmo sem conexão à internet.
Estudo 1
1. Seleção de ferramentas: escolha usar Python como linguagem de programação devido à
sua versatilidade e e�ciência. Utilizar o ambiente Anaconda, que oferece uma ampla gama
de bibliotecas para análise de dados como Pandas, NumPy e Matplotlib.
2. Limpeza e preparação de dados: importar os dados usando Pandas e iniciar um processo
de limpeza de dados. Descartar colunas irrelevantes e lidar com valores faltantes, seja
removendo-os ou substituindo-os pela média ou mediana, dependendo do caso.
3. Análise estatística: utilizar funções do Pandas e NumPy para calcular métricas estatísticas
como a média, mediana e desvio padrão para cada métrica de satisfação, para ter um
entendimento claro da distribuição dos dados.
Disciplina
Pensamento Analítico e Análise
de Dados
4. Correlação entre métricas: realizar uma análise de correlação usando NumPy para entender
como diferentes métricas se relacionam entre si. Isso ajudaria a identi�car quais fatores
têm o maior impacto na satisfação do cliente.
5. Visualização de dados: usar Matplotlib para criar grá�cos de barra, mostrando a satisfação
do cliente em diferentes categorias e grá�cos de dispersão para mostrar a correlação entre
diferentes métricas.
�. Insights acionáveis: com base na análise, se descobrisse que, por exemplo, que o tempo de
espera na �la tem uma forte correlação negativa com a satisfação do cliente, sugerir à
equipe de gestão a necessidade de implementar medidas para reduzir o tempo de espera,
como abrir mais caixas durante horários de pico.
Assim, a análise de dados realizada com Python forneceria insights valiosos para melhorar a
satisfação do cliente, orientando a estratégia e as operações da empresa de forma mais e�caz.
Estudo 2
Neste cenário, a escolha ideal para a DataStream Analytics seria o Apache Spark. Aqui estão as
razões:
1. Velocidade de processamento e escalabilidade: a necessidade da empresa é análise de
dados em tempo real, uma área em que o Spark supera o Hadoop.
2. Complexidade das tarefas de processamento: as operações de Machine Learning e
análises complexas são cruciais para a DataStream Analytics, tornando o Spark mais
adequado.
3. Custo: embora o Spark possa ser mais caro em termos de recursos computacionais, ele
compensa em e�ciência e velocidade, o que pode, a longo prazo, ser mais econômico.
4. Maturidade e robustez: embora o Hadoop seja mais maduro, o Spark tem visto um rápido
desenvolvimento e adoção, e sua comunidade está crescendo, tornando-o uma escolha
sustentável para o futuro.
Por essas razões, o Apache Spark seria a escolha mais alinhada com as necessidades e os
objetivos de longo prazo da DataStream Analytics.
Resumo visual
Disciplina
Pensamento Analítico e Análise
de Dados
Disciplina
Pensamento Analítico e Análise
de Dados
Fonte: elaborada pelo autor.
Disciplina
Pensamento Analítico e Análise
de Dados
Referencia
ALVES, T. S.; MARTINS, R. A. Comparação de desempenho entre Python e R em análise de dados.
Revista de Sistemas e Computação, v. 7, n. 1, p. 10-25, 2017.
COSTA, V. G.; LIMA, P. R. Análise exploratória de dados com Python e Matplotlib. Revista de
Estatística e Sistemas de Informação, v. 9, n. 2, p. 33-44, 2019.
FERNANDES, J. S.; OLIVEIRA, R. F. Introdução à lógica de programação com Python. Revista de
Informática Teórica e Aplicada, v. 18, n. 2, p. 67-89, 2019.
GONÇALVES, F. J.; SILVA, D. M. Utilizando Python em ambientes empresariais: um estudo de
caso. Revista de Administração e Negócios, v. 21, n. 3, p. 45-60, 2020.
MORAES, A. F.; SOUZA, J. R. Algoritmos e estruturas de controle no desenvolvimento de software.
Revista Brasileira de Engenharia de Software, v. 13, n. 1, p. 88-100, 2018.
MOURA, G. R.; COSTA, E. B. Big Data e Python: estratégias para análise de grandes conjuntos de
dados. Revista Brasileira de Computação, v. 14, n. 3, p. 128-141, 2021.
SANTOS, L. A.; PEREIRA, R. C. Uma abordagem prática para utilização de Pandas e NumPy em
ciência de dados. Revista de Informática e Tecnologia, v. 16, n. 4, p. 47-55, 2018.
SILVA, S. M.; RIBEIRO, M. A. O papel do Python na ciência de dados: Uma revisão sistemática.
Revista Brasileira de Computação Aplicada, v. 12, n. 1, p. 21-35, 2020.Graças a ele podemos recolher informação através de critérios lógicos,
analisá-la procurando as melhores estratégias ou soluções alternativas e escolher as mais
adequadas de acordo com os nossos critérios.
Procure pela verdade: através do pensamento analítico, que nos permite fazer inferências,
podemos chegar à “verdade”. Ou seja, o que nos propusemos a descobrir (não existe uma
“verdade única”).
Analise para entender: como vimos, o pensamento analítico nos permite ir além de um
problema, permitindo-nos compreender a sua origem, natureza, funções, causas e
consequências. Envolve compreender algo em detalhe e ajuda-nos a avaliá-lo com rigor e a
desenvolver outras competências, como o pensamento crítico.
Portanto, é um pensamento útil para muitas tarefas, tanto no dia a dia como no âmbito mais
acadêmico ou pro�ssional.
Tomada de decisão com base na análise de custo-benefício
Disciplina
Pensamento Analítico e Análise
de Dados
Gestão de custos
Gestão de custos é o processo de cálculo, alocação e controle de custos em um projeto. Ele
permite que as empresas prevejam despesas futuras para reduzir as chances de ultrapassar o
orçamento. Os custos esperados são calculados durante a fase de planejamento de um projeto e
devem ser aprovados antes do início dos trabalhos. À medida que o plano do projeto é
executado, as despesas são documentadas e rastreadas para que tudo �que dentro do plano de
gerenciamento de custos. Uma vez concluído o projeto, os custos projetados são comparados
aos custos reais, fornecendo referências para futuros planos de gestão de custos e orçamentos
de projetos (Alvarez, 2006).
Para a tomada de decisão dentro das empresas, a gestão de custos é um dos elementos
principais. Ter o conhecimento de quanto se gasta é importante não só para as pessoas, mas
principalmente para as organizações, pois é tendo esse conhecimento que as empresas
constatam quanto ganham. Muitas empresas desconhecem os reais resultados alcançados em
suas atividades principais.
In�uência dos custos para tomada de decisões
No Brasil, a legislação �scal não permite a utilização do custeio direto ou variável para a
apuração dos impostos e das contribuições incidentes sobre o resultado do período. No entanto,
esse custeio pode ser utilizado, sem qualquer problema, nas estratégias empresariais,
gerencialmente. Tal uso se restringe à diretoria e aos níveis hierárquicos mais altos de uma
entidade.
Classi�cação dos gastos
Custos �xos: independentemente do volume de negócios ou da atividade empresarial,
essas despesas não variam e devem ser assumidas sem exceção. Algumas dessas
despesas incluem:
Aluguéis: é uma das despesas mais comuns que as empresas têm, relacionadas com o
pagamento de arrendamento de escritórios ou instalações. Mesmo quando o modelo de
negócio depende da utilização de um espaço de coworking, essa despesa é �xa e deve ser
incluída no código correspondente.
Disciplina
Pensamento Analítico e Análise
de Dados
Folhas de pagamento: esse tipo de despesa, além de contemplar a folha de pagamento,
contempla também o que está relacionado à Previdência Social, seja uma empresa que
contribui para o Regime Geral ou para a Previdência Social dos Autônomos.
Suprimentos: essas despesas incluem o fornecimento de serviços como eletricidade, água,
telefone ou gás.
Custos variáveis: relacionadas com a atividade de cada empresa e com o funcionamento
do negócio, por vezes essas despesas são mais difíceis de prever e contabilizar. A seguir
são descritos os tipos de despesas que geralmente se enquadram nessa classi�cação:
Impostos: abrange tudo o que se refere aos impostos municipais ou regionais e às taxas
que devem ser pagas, de acordo com a atividade especí�ca de cada empresa.
Matéria-prima: à medida que o volume de vendas aumenta, o custo de produção também
aumenta, uma vez que é necessária uma maior quantidade de matéria-prima para
responder à procura.
Comunicação externa: para se dar a conhecer, promover os seus produtos e serviços e
reforçar a sua marca, uma empresa poderá necessitar dedicar parte do seu orçamento
mensal à comunicação externa.
Subcontratação de serviços: dependendo da atividade da sua empresa e do seu modelo de
negócio, poderá necessitar de contratar serviços como transporte de matérias-primas ou
produtos acabados.
Análise de custo-benefício, sua utilização no processo de tomada de decisão
Do ponto de vista empresarial, um dos objetivos mais importantes a atingir é a rentabilidade,
embora se reconheça que existem outros tão relevantes como crescer, acrescentar valor à
entidade e assim por diante. Sem rentabilidade não é possível a permanência da empresa no
médio e longo prazo. Para que isso exista, as receitas devem ser maiores que as despesas, ou
seja, as receitas de vendas devem ser maiores que os custos (Alvarez, 2006).
Todas as empresas ou negócios têm hoje o seu objetivo principal muito bem delineado, visando
especi�camente aumentar o seu nível de rentabilidade através da obtenção de lucros, pelo que
concentram os seus esforços nas diferentes estratégias que permitem alcançá-lo (Rainer Júnior;
Cegielski, 2011).
Custo, volume e lucro
Com relação às estratégias para a tomada de decisões administrativas, podemos:
Fixar os preços de venda.
Comprar insumos ou fabricá-los.
Aumentar ou diminuir o mix de produção, etc.
O processo de tomada de decisão
É uma sequência lógica de etapas que expressam a racionalidade com a qual os administradores
buscam soluções para os problemas da empresa (Alvarez, 2006).
A abordagem do processo de tomada de decisão passa pelas seguintes fases:
1. De�nição do problema.
2. Obtenção dos fatos.
3. Formulação das alternativas.
Disciplina
Pensamento Analítico e Análise
de Dados
4. Ponderação e decisão.
A tomada de decisão leva à escolha da ação a ser implementada.
Coleta de dados e comunicação de resultados
Coleta e análise de dados
A coleta de dados permite que um indivíduo ou uma empresa responda a perguntas relevantes,
avalie resultados e antecipe melhor as probabilidades e tendências futuras. A precisão na coleta
de dados é essencial para garantir a integridade de um estudo, decisões de negócios sólidas e
garantia de qualidade (Rainer Júnior; Cegielski, 2011).
O que é a coleta de dados?
A coleta de dados é o processo de coleta e medição de informações sobre variáveis especí�cas
em um sistema estabelecido, o que permite que perguntas relevantes sejam respondidas e os
resultados sejam avaliados. A recolha de dados é uma componente da investigação em todas as
áreas de estudo. O objetivo de toda coleta de dados é capturar evidências de qualidade que
permitirão que a análise conduza à formulação de respostas convincentes e credíveis às
questões que foram colocadas (Alvarez, 2006).
Disciplina
Pensamento Analítico e Análise
de Dados
Por mais que a coleta de dados possa parecer um acontecimento extraordinário, é apenas uma
atividade rotineira no dia a dia das empresas. Os dados são considerados um ativo
extremamente valioso em qualquer mercado, simplesmente porque podem traduzir resultados de
negócios e percepções externas sobre produtos, serviços e marca. Num mundo digitalizado, os
dados estão em todo o lado e são gerados a partir de uma simples interação de um consumidor
com o site de uma empresa (Rainer Júnior; Cegielski, 2011).
Por que a análise de dados é importante?
Quando você tem uma empresa, poder acessar informações de qualidade traz grandes
benefícios na tomada de decisões, permite detectar quais pontos fracos precisam ser
melhorados e ter maiores oportunidades de lucro (Alvarez, 2006).
Quando você está disposto a agir com base na análise de dados, você está escolhendo o
caminho certo para o desenvolvimento da sua organização. No entanto, é necessário
implementar as soluções encontradas, caso contrário, se recolher informação apenas com a
�nalidade de a registrar, o investimento não terá valor.
A análise de dados permite-nos antecipar situações possíveis. Isso é útil porque permite
conhecer seus clientese tomar uma decisão imediata com base em algum comportamento
anterior.
Tipo de análise de dados para tomada de decisão
Interpretar os dados obtidos não é uma tarefa fácil. Para resolver isso, existem três tipos de
análises que permitem realizar esse processo de forma e�caz (Castro, 2016):
Análise descritiva: tem o objetivo de resumir uma grande quantidade de dados e registros
para que sejam compreensíveis e possam ser tomadas medidas que se adaptem aos
objetivos da organização.
Análise preditiva: é a aplicação de técnicas matemáticas ou estatísticas às informações da
empresa. Desta forma você pode prever o que pode acontecer e tomar as medidas
necessárias para resolver os problemas. À medida que a organização se consolida, esta
ferramenta torna-se essencial.
Análise prescritiva: este último tipo de análise é perfeito para estabelecer o caminho que
sua empresa pode seguir e contabilizar as ações que auxiliam na tomada de decisões que
bene�ciam a organização.
Técnicas e ferramentas para a coleta de dados
Identi�cados os usuários que estrategicamente podem contribuir, faz-se necessário de�nir as
técnicas a serem utilizadas para a obtenção de informações para o sistema de apoio à decisão.
Realizar entrevistas: as entrevistas são realizadas a partir de um conjunto de perguntas
previamente estabelecidas (ou não) para identi�car as informações dos usuários a serem
contempladas no sistema que será implantado (Castro, 2018).
Aplicar questionários: a elaboração de questionários direciona os participantes a
responderem o que se deseja saber sobre o que é importante para o sistema de apoio à
decisão. Possibilita alcançar muitas pessoas e, com isso, identi�car comportamentos e
informações que o sistema deve atender com base na opinião maciça dos representantes
da organização.
Disciplina
Pensamento Analítico e Análise
de Dados
A coleta de dados é um trabalho que deve ser realizado com o apoio de ferramentas
especializadas. Dos recursos mais simples e tradicionais aos mais avançados e indispensáveis,
cada um deles tem um papel importante de acordo com a estratégia e os objetivos da empresa.
Principais ferramentas na coleta de dados: Google forms; QuestionPro; SurveyMonkey;
Mindminers; Survey Anyplace, entre outras.
Comunicação de resultados
De posse das informações estratégicas, o resultado será impulsionar a gestão organizacional e,
como consequência, alavancar os lucros. Cabe ressaltar que os resultados entregues pelos
sistemas que apoiam a tomada de decisão são comumente gerados na forma de relatórios e
grá�cos em plataformas de análises que permitem visualizar e comparar os resultados dos
diferentes cenários analisados (Castro, 2018). Ademais, a apresentação dos resultados deve ser
de fácil utilização pelos gestores e com capacidade de gerar diversos serviços. O objetivo é
aumentar a sua e�ciência, inclusive contemplando versões em dispositivos portáteis.
Ao �nal da fase de obtenção de resultados para o sistema de apoio à decisão, devem ser obtidos
os seguintes conhecimentos
Entendimento do negócio.
Detalhes sobre os dados necessários para incluir na implementação inicial do sistema de
apoio à decisão.
Conhecimento dos dados essenciais para a tomada de decisão.
Identi�cação das informações circunstanciais a serem usadas por outras áreas da
organização.
Videoaula: Tomada de decisão com base na análise de custo-benefício
Este conteúdo é um vídeo!
Para assistir este conteúdo é necessário que você acesse o AVA pelo
computador ou pelo aplicativo. Você pode baixar os vídeos direto no aplicativo
para assistir mesmo sem conexão à internet.
Olá, estudante!
Neste vídeo você verá os conceitos de Introdução ao pensamento analítico; Análise de custo-
benefício; Coleta de dados e comunicação de resultados.
No vídeo você também notará como a análise de custo / benefício é articulada em empresas,
utilizando apropriadamente a coleta e análise de dados relacionados às variáveis de mercado
como preço dos concorrentes e equilíbrio entre demanda e oferta.
Então, vamos lá?
Disciplina
Pensamento Analítico e Análise
de Dados
Saiba mais
Olá, estudante!
Para auxiliar o aprofundamento do aprendizado sobre conceitos aqui abordados, recomendo a
leitura do Capítulo 2 do livro a seguir:
Manual de organização, sistemas e métodos.
Bons estudos!
Referências
https://login.vitalsource.com/?redirect_uri=https%3A%2F%2Fintegrada.minhabiblioteca.com.br%2Freader%2Fbooks%2F9788522493265%2Fpageid%2F0&brand=integrada.minhabiblioteca.com.br
Disciplina
Pensamento Analítico e Análise
de Dados
ALVAREZ, M. E. B. Manual de organização, sistemas e métodos. São Paulo: Atlas, 2006.
BARBOSA, M. A. Introdução à lógica matemática para acadêmicos. Curitiba: InterSaberes, 2017.
CASTRO, D. G. F. L. N. D. Introdução à mineração de dados: conceitos básicos, algoritmos e
aplicações. São Paulo: Editora Saraiva, 2016. Disponível em: Minha Biblioteca.
COSTA, M. Filoso�a da lógica. Curitiba: InterSaberes, 2020.
MACHADO, N. J.; CUNHA, M. O. Lógica e linguagem cotidiana: verdade, coerência, comunicação,
argumentação. 4. ed. Belo Horizonte: Autêntica, 2019.
O’BRIEN, J.; MARAKAS, G. Administração de sistemas de informação. 15. ed. Porto Alegre:
AMGH, 2013. E-book.
RAINER JÚNIOR, R. K.; CEGIELSKI, C. G. Introdução a sistemas de informação. 3. ed. Rio de
Janeiro: Elsevier, 2011.
SOUSA, W. E. Raciocínio lógico-analítico: uma proposta de conteúdo e abordagem para o ensino
médio e para concursos públicos. 2019. Dissertação (Mestrado Pro�ssional) – Universidade
Federal de Goiás, Catalão, 2019. Disponível em:
http://repositorio.ufcat.edu.br/tede/handle/tede/9479. Acesso em: 7 jun. 2021.
ZANONI, A. P.; BITENCOURT, L.; FARINA, E. A lógica aristotélica. Revista Pandora Brasil, n. 75,
2016. Disponível em: http://revistapandorabrasil.com/revista_pandora/projetos_75/logica_2.pdf.
Acesso em: 7 jun. 2021.
Aula 3
Tomada de decisão com base no pensamento crítico
http://repositorio.ufcat.edu.br/tede/handle/tede/9479
http://revistapandorabrasil.com/revista_pandora/projetos_75/logica_2.pdf
Disciplina
Pensamento Analítico e Análise
de Dados
Introdução
Olá, estudante!
Nesta aula você verá os conceitos de pensamento crítico, análise e interpretação de informações
complexas; avaliação crítica das informações. Você terá ciência de que uma pessoa que exerce o
pensamento crítico tem a capacidade de analisar qualquer informação e construir a própria
interpretação, com base em fatos ou dados veri�cados, e não com base em crenças infundadas.
O pensar criticamente é uma forma de tentar compreender, a partir da razão, o mundo que nos
rodeia.
Com base no pensamento crítico, pode-se adotar metodologias, tais como a inteligência de
negócios, também chamada de Business Intelligence (BI), utilizada para a otimizar decisões de
desempenho em uma organização. Você verá que a avaliação crítica deve se basear no
conhecimento do ambiente no qual você está inserido e que para realizar essa avaliação não se
pode analisar apenas os dados parciais, e sim os dados históricos e atuais de uma organização.
Então, vamos lá?
Introdução ao pensamento crítico
Disciplina
Pensamento Analítico e Análise
de Dados
O que é pensamento crítico?
Ao longo do tempo, inúmeros �lósofos, cientistas e estudiosos procuraram alcançar a verdade
através do pensamento crítico. Esta capacidade única do ser humano oferece a oportunidade de
deixar de lado crenças e superstições em favor da lógica e da razão. poderíamos de�nir este
conceito como a capacidade de analisar qualquer informação e construir a própria interpretação,
com base em fatos ou dados veri�cados e afastando-se de crenças infundadas (Rainer Júnior;
Cegielski, 2011).
Embora a verdade absoluta não exista, o pensamento crítico tenta abordar a verdade do seu
próprio ponto de vista. Para pensar de forma crítica, deve-se compreender a opinião alheia, ter
empatia com os outros e se melhorar constantemente. Pensar criticamente é uma forma de
tentar compreender, a partir da razão, o mundo que nos rodeia.
Como construiro pensamento crítico?
Aristóteles, um dos grandes pensadores da história da humanidade, disse que “é sinal de uma
mente educada ser capaz de considerar um pensamento sem ter que aceitá-lo”. E, para ter
pensamento crítico, é preciso treinar a mente. Como podemos fazer isso? Por ser mais uma
forma de ver as coisas do que uma habilidade que só utilizamos em determinadas ocasiões,
exige um trabalho diário e constante. Porém, existem certos aspectos que contribuem para a
construção desse tipo de pensamento (Costa, 2020).
Mantenha a mente aberta: o pensamento “fora da caixa” é outro exemplo de pensamento
crítico. Fechar-nos nas nossas ideias, não aceitar as dos outros ou negar tudo o que está
Disciplina
Pensamento Analítico e Análise
de Dados
fora das nossas crenças nos torna mais fracos. No entanto, manter a mente aberta é
essencial para projetar nossas próprias ideias. Imagine que alguém acredita que a
tecnologia é ruim. Mesmo que outras pessoas tentem convencê-lo, essa pessoa
provavelmente se recusará até mesmo a tentar. Como você vê, embora seja um exemplo
muito simples, é fácil ver tudo o que está faltando por não ter uma mente aberta e receptiva
que lhe permita ver por si mesmo (O´Brien e Marakas, 2013).
Evite críticas inúteis em favor da opinião crítica: um dos erros mais comuns que todos
cometemos é cair em críticas fáceis. Dar uma opinião não construtiva é muito mais fácil do
que pensar e oferecer outro ponto de vista que apresente uma alternativa. Esses tipos de
situações ocorrem muito no ambiente de trabalho (Machado; Cunha, 2019). Por exemplo,
pode ser que um colega tenha feito uma tarefa errada e você simplesmente disse a ele
“isso não está certo”. A verdade é que nenhum ganha nada. Porém, se você for capaz de
analisar o que deu errado, não apenas poderá ajudá-lo a melhorar, mas também aprenderá
com os erros dos outros.
Concentre-se na solução: outro exemplo para estimular o pensamento crítico é parar de
pensar nos problemas e começar a trabalhar para encontrar soluções. Ficar obcecado com
os problemas não leva a nada de bom. Porém, se formos capazes de pensar criticamente,
podemos analisá-los e encontrar soluções (Costa, 2020). Quando surge um problema no
trabalho, o mais fácil é encontrar falhas e apontar erros. Porém, pessoas com pensamento
crítico conseguem analisar cuidadosamente as reais causas do problema para focar em
encontrar soluções e evitar que ele se repita.
Seja claro sobre seus objetivos: quando você não tem uma direção �xa, é difícil chegar ao
seu destino. No entanto, se tivermos clareza sobre os nossos objetivos, será mais fácil
atingir as metas que estabelecemos para nós mesmos (Zanoni; Bitencourt; Farina, 2021). O
pensamento crítico nos permite construir estratégias que nos ajudam a conseguir isso.
Imagine que o seu sonho é fazer uma ótima viagem para os EUA, por um lado você pode
sonhar que ganha um sorteio ou acreditar que a vida vai te proporcionar aquela viagem dos
sonhos. Por outro lado, você pode analisar sua situação �nanceira e criar um plano de
poupança para atingir esse objetivo. Qual das estratégias parece mais viável?
Partindo do não conhecimento: achar que temos a verdade absoluta, que sabemos tudo ou
que não há nada que possamos aprender é um dos maiores erros que podemos cometer.
Pelo contrário, a aprendizagem constante alimenta-se a si mesma, quanto mais
aprendemos, mais cultivamos o pensamento crítico e mais queremos aprender (Machado;
Cunha, 2019).
Análise e interpretação de informações complexas
Disciplina
Pensamento Analítico e Análise
de Dados
Inteligência de negócios (Business Intelligence – BI)
Tomando como base o pensamento crítico, a análise de informações complexas de um contexto
organizacional é feita utilizando-se uma metodologia chamada inteligência de negócios, também
conhecida como Business Intelligence (BI), a qual leva a apresentar os resultados dessa análise
de modo simples e sucinto, essa metodologia irá facilitar a interpretação dos dados pelos
gestores para que seja tomada decisões estratégicas (Castro, 2016).
O objetivo da inteligência de negócios é melhorar o desempenho geral e a trajetória das
empresas. Usando ferramentas tecnológicas durante essa metodologia, os gestores podem
interpretar o que aconteceu, por que aconteceu e o que precisa acontecer para otimizar ainda
mais suas operações.
A inteligência de negócios ajuda as empresas a analisar dados continuamente, tirar conclusões e
tomar ações práticas que impactam o desempenho de curto e longo prazo. Os dados analisados
podem revelar padrões e tendências importantes em quase todas as áreas de negócios, como
vendas, atendimento ao cliente, produção, segurança, etc.
Quando as empresas utilizam Business Intelligence (BI) para informar todas as suas decisões,
podem adaptar-se rapidamente às mudanças no cenário empresarial. A inteligência de negócios
permite de�nir outras linhas de produtos, buscar novos clientes por meio de planos de marketing
direcionados e otimizar canais de vendas (Castro, 2016).
Por que a inteligência de negócios é importante?
Disciplina
Pensamento Analítico e Análise
de Dados
A inteligência de negócios tem impacto direto nas decisões estratégicas e táticas operacionais
de uma organização. Incentiva a tomada de decisões baseadas em fatos, usando dados
históricos em vez de suposições e instintos. As ferramentas utilizadas na inteligência de
negócios realizam análises de dados e criam relatórios, resumos, mapas, grá�cos e tabelas para
fornecer ao usuário informações detalhadas sobre a natureza do negócio (SHARDA et al., 2019).
A seguir estão algumas das vantagens da inteligência de negócios:
A inteligência de negócios ajuda a aumentar a produtividade em uma organização usando
relatórios, painéis analíticos e infográ�cos.
Proporciona à organização uma visão holística da sua empresa, segmentada em vários
departamentos, produtos, serviços, etc., facilitando a identi�cação de áreas que necessitam
de atenção ou melhoria.
Processos complexos em uma organização podem ser simpli�cados usando análises
automatizadas avançadas, permitindo reduzir tempo e esforço para processos de negócios
mais rápidos e e�cientes.
Como as empresas utilizam inteligência de negócios?
Empresas de todos os setores usam business intelligence para sintetizar e simpli�car
informações complexas, seguem as iniciativas tomadas para este �m:
Relatórios: fornece periodicamente dados resumidos aos tomadores de decisão para que
possam de�nir a estratégia e a direção do negócio.
Análise preditiva: analisa dados históricos para prever padrões futuros usando técnicas
estatísticas como mineração de dados e modelagem preditiva.
Gestão de desempenho empresarial: analisa e mede metas de desempenho, como
objetivos de excelência operacional impulsionados pelas vendas on-line e pela satisfação
do cliente.
Visualização de dados: apresenta informações em um formato visual que facilita a
compreensão instantânea de dados complexos.
Exemplos e avaliação crítica das informações
Disciplina
Pensamento Analítico e Análise
de Dados
Exemplos de visualização de dados
Elementos visuais tais como grá�cos, diagramas, infográ�cos, mapas, planilhas, painéis, são
utilizados para visualizar informações complexas de forma clara, compreensível, sintetizada,
informativa e precisa para a tomada de decisões.
A Figura 1 apresenta em um grá�co as estatísticas de forma clara, utilizando formas e cores que
chamam atenção durante a análise das informações.
Disciplina
Pensamento Analítico e Análise
de Dados
Figura 1 | Grá�co representando tipos de de�ciência no Brasil. Fonte: IBGE (2010).
A Figura 2 apresenta os diversos tipos de grá�cos que podem ser utilizados na análise e
interpretação de informações.
Disciplina
Pensamento Analítico e Análise
de Dados
Figura 2 | Tipos de grá�cos. Fonte: Freepik.
A Figura 3 é um diagrama, uma representação grá�ca resumida que apresenta as etapas de um
processo.
Disciplina
Pensamento Analítico e Análise
de Dados
Figura 3 | Exemplode diagrama. Fonte: Mankiw (2019, p. 19).
Os infográ�cos são ótimos para nos ajudar a processar informações complexas com mais
facilidade. Eles são muito úteis, pois eles podem: fornecer um resumo rápido sobre um tópico;
explicar um processo complexo; apresentar os resultados de uma investigação ou os dados de
uma pesquisa; resumir uma postagem ou relatório longo; aumentar a conscientização sobre uma
causa ou problema. Veja um exemplo na Figura 4.
Disciplina
Pensamento Analítico e Análise
de Dados
Figura 4 | Exemplo de infográ�co. Fonte: Liziero (2016). Figura 5 | Exemplo de mapa
A Figura 5 apresenta um mapa, que indica, visualmente, uma região.
Disciplina
Pensamento Analítico e Análise
de Dados
Figura 5 | Exemplo de mapa. Fonte: Freepik.
Planilha é uma ferramenta extremamente útil para as pessoas trabalharem com números e
realizarem cálculos. A planilha nos permite trabalhar com uma grande quantidade de dados e
números, e graças a uma grande variedade de funções que a integram, podemos realizar cálculos
matemáticos, estatísticos, técnicos e �nanceiros. Veja um exemplo de planilha na Figura 6):
Disciplina
Pensamento Analítico e Análise
de Dados
Figura 6 | Exemplo de planilha. Fonte: elaborada pela autora.
Os painéis são empregados para apresentar várias informações de forma sucinta. Veja um
exemplo na Figura 7:
Figura 7 | Exemplo de painel. Fonte: INPI (2017).
Exemplos de ferramentas utilizadas na inteligência nos negócios (Business Intelligence - BI)
O Power BI é uma coleção de serviços de software, aplicativos e conectores que trabalham
juntos para transformar fontes de dados não relacionadas em informações coerentes, interativas
e visualmente atraentes. O Power BI oferece os dashboards, os quais são painéis que unem
Disciplina
Pensamento Analítico e Análise
de Dados
informações dispersas de forma visualmente compreensível, simples e dinâmica e interativa que
facilitam a análise das informações, como mostra a Figura 8:
Figura 8 | Exemplo de dashboard elaborado no Power BI. Fonte: Soares (2017, p. 34).
Um dashboard mostra as principais métricas da empresa em tempo real.
Existem três tipos de dashboards (painéis): operacionais (Figura 9), estratégicos (Figura 10) e
analíticos ou táticos (Figura 11).
Painéis operacionais informam o que está acontecendo agora. Os painéis operacionais são
um dos tipos de painéis de dados que respondem à pergunta: “O que está acontecendo
agora?”.
Um painel de operações é usado para monitorar dados transacionais ou em tempo real em
relação às principais métricas. Os dados do painel são atualizados com frequência, até mesmo
minuto a minuto. Os painéis operacionais geralmente também contêm informações contextuais,
para que os usuários possam explorar os dados e usá-los no processo de tomada de decisão.
Métricas que podem ser rastreadas em um painel operacional:
Métricas de desempenho do site, como novos usuários ou taxa de rejeição.
Contagem de seguidores ou comentários em canais de mídia social.
Retorno do investimento em publicidade para monitorar a e�cácia do investimento em
publicidade digital.
Disciplina
Pensamento Analítico e Análise
de Dados
Figuro 9 | Exemplo de dashboard operacional. Fonte: Gomes (2018, p. 12).
Um painel de estratégia rastreia os principais indicadores de desempenho. Os painéis
estratégicos são projetados para serem visualizados uma vez por dia para ajudar os
executivos a �carem atualizados sobre os KPIs da organização ou Key Performance
Indictors (Indicador-chave de desempenho). Frequentemente, os painéis de estratégia
resumem o desempenho ao longo de um período (mês, trimestre, ano). Métricas que
podem ser acompanhadas em um dashboard estratégico:
Desempenho �scal mensal, trimestral ou anual.
Taxa de crescimento da conta.
Indicador contábil da rentabilidade de uma empresa.
Figura 10 | Exemplo de dashboard estratégico. Fonte: Gomes (2018, p. 10).
Painéis analíticos (ou táticos): processam dados para identi�car tendências. Painéis
analíticos analisam grandes volumes de dados. Esse é um dos tipos de painéis que
permitem aos usuários investigar tendências, prever resultados e descobrir insights e
de�nir metas com base na compreensão de dados históricos.
Disciplina
Pensamento Analítico e Análise
de Dados
Métricas que você pode acompanhar em um painel analítico:
Valor anual dos contratos para saber o valor médio de um contrato.
Despesas habituais.
Aumento de usuários ativos diariamente durante um período de tempo.
Figura 11 | Exemplo de dashboard analítico. Fonte: Gomes (2018, p. 11).
O Excel é uma ferramenta que serve para construir planilhas eletrônicas para armazenar,
organizar e analisar informações, podendo ser realizados cálculos e gerar grá�cos.
O Google Data Studio é uma ferramenta que serve para criar relatórios de dados, reportar e
visualizar informações de forma simples e muito visual. Além disso, para ter acesso a todas as
suas funcionalidades, basta ter uma conta Google, sua utilização é gratuita.
O Watson Analytics é uma ferramenta utilizada na visualização de dados e análise preditiva
usada para descobrir padrões e signi�cados nos dados que serão analisados de forma rápida e
objetiva.
Avaliação crítica das informações
Após análise e interpretação das informações, utilizando os conceitos da inteligência de
negócios, a próxima etapa para realizar a tomada de decisão é a avaliação das informações,
levando-se em consideração o conceito de pensamento crítico. Para uma avaliação crítica das
informações compartilhadas, deve-se considerar não apenas os dados parciais, e sim todos os
dados atuais e históricos, analisar não só os aspectos internos, como também os aspectos
externos e principalmente conhecer o ambiente o qual você está inserido.
A norma ISO 9001 estabelece que a alta administração (corresponde à gestão ou líderes que
tomam as decisões que de�nem os rumos da organização) deve revisar o sistema de gestão da
qualidade da organização em intervalos planejados para garantir sua adequação, ou seja,
procurar a melhoria contínua dos processos que regem a empresa.
Para realizar a avaliação crítica das informações é necessário:
Realizar um planejamento, incluindo cronograma de reuniões com pautas de�nidas.
Analisar os dados.
Revisar relatórios das auditorias externas e internas.
Disciplina
Pensamento Analítico e Análise
de Dados
Analisar o per�l e o feedback do cliente, se houve reclamações e, nessa situação, quais as
atitudes que o sistema de gestão de qualidade deve tomar.
Videoaula: Tomada de decisão com base no pensamento crítico
Este conteúdo é um vídeo!
Para assistir este conteúdo é necessário que você acesse o AVA pelo
computador ou pelo aplicativo. Você pode baixar os vídeos direto no aplicativo
para assistir mesmo sem conexão à internet.
Olá, estudante!
Nesse vídeo você verá os conceitos de Introdução ao pensamento crítico; análise e interpretação
de informações complexas; avaliação crítica das informações.
Você também notará no vídeo como as ferramentas descritas nesta aula são articuladas pelas
empresas atuantes do mercado, em departamentos ou projetos exclusivamente dedicados ao
tema inteligência de mercado (ou Business Intelligence-BI), e como tais ações estão
relacionadas às normas de sistemas de gestão como a série de normas ISO 9000.
Então, vamos lá?
Saiba mais
Disciplina
Pensamento Analítico e Análise
de Dados
Olá, estudante!
Para auxiliar o aprofundamento do aprendizado sobre conceitos aqui abordados, recomendo a
leitura do Capítulo 1 do livro a seguir:
Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações.
Bons estudos!
Referências
https://login.vitalsource.com/?redirect_uri=https%3A%2F%2Fintegrada.minhabiblioteca.com.br%2Freader%2Fbooks%2F978-85-472-0100-5%2Fpageid%2F0&brand=integrada.minhabiblioteca.com.br
https://login.vitalsource.com/?redirect_uri=https%3A%2F%2Fintegrada.minhabiblioteca.com.br%2Freader%2Fbooks%2F978-85-472-0100-5%2Fpageid%2F0&brand=integrada.minhabiblioteca.com.brDisciplina
Pensamento Analítico e Análise
de Dados
ALVAREZ, M. E. B. Manual de organização, sistemas e métodos. São Paulo: Atlas, 2006.
CASTRO, D. G. F. L. N. D. Introdução à mineração de dados: conceitos básicos, algoritmos e
aplicações. São Paulo: Editora Saraiva, 2016. Disponível em: Minha Biblioteca.
COSTA, M. Filoso�a da lógica. Curitiba: InterSaberes, 2020.
GOMES, R. F. Desenvolvimento de um Dashboard para o contexto de Gestão Acadêmica. 2018.
Trabalho de Conclusão de Curso (Graduação) – Curso de Ciência da Computação, Centro
Universitário Luterano de Palmas, Palmas/TO, 2018. Disponível em: https://ulbra-
to.br/bibliotecadigital/uploads/document5cae372481c98.pdf. Acesso em: 06 dez. 2023.
IBGE, Instituto Brasileiro de Geogra�a e Estatística. Pessoas com De�ciência – Série: Conheça o
Brasil – População, 2010. Disponível em: https://educa.ibge.gov.br/jovens/conheca-o-
brasil/populacao/20551-pessoas-com-de�ciencia.html. Acesso em 25/11/2023.
INPI, Instituto Nacional de Propriedade Industrial. Painel de Marcas, 2017. Disponível em:
https://www.gov.br/inpi/pt-br/assuntos/marcas/painel-de-marcas. Acesso em 23/11/2023.
LIZIERO, A. Guia visual sobre o desperdício de alimentos, 2016. Disponível em:
https://geogra�avisual.com.br/infogra�co/guia-visual-sobre-o-desperdicio-de-alimentos. Acesso
em: 20/11/2023.
MACHADO, N. J.; CUNHA, M. O. Lógica e linguagem cotidiana: verdade, coerência, comunicação,
argumentação. 4. ed. Belo Horizonte: Autêntica, 2019.
MANKIW, N. G. Introdução à Economia. São Paulo: Cengage Learning, 2019. Disponível em:
https://integrada.minhabiblioteca.com.br/#/books/9788522127924/. Acesso em: 06 dez. 2023.
O’BRIEN, J.; MARAKAS, G. Administração de sistemas de informação. 15. ed. Porto
Alegre: AMGH, 2013. E-book.
RAINER JÚNIOR, R. K.; CEGIELSKI, C. G. Introdução a sistemas de informação. 3. ed. Rio de
Janeiro: Elsevier, 2011.
https://ulbra-to.br/bibliotecadigital/uploads/document5cae372481c98.pdf
https://ulbra-to.br/bibliotecadigital/uploads/document5cae372481c98.pdf
https://educa.ibge.gov.br/jovens/conheca-o-brasil/populacao/20551-pessoas-com-deficiencia.html
https://educa.ibge.gov.br/jovens/conheca-o-brasil/populacao/20551-pessoas-com-deficiencia.html
https://www.gov.br/inpi/pt-br/assuntos/marcas/painel-de-marcas
https://geografiavisual.com.br/infografico/guia-visual-sobre-o-desperdicio-de-alimentos
https://integrada.minhabiblioteca.com.br/#/books/9788522127924/
Disciplina
Pensamento Analítico e Análise
de Dados
SHARDA, R. et al. Business intelligence e análise de dados para gestão do negócio. 4. edição.
Porto Alegre: Grupo A, 2019. Disponível em: Minha Biblioteca.
SOARES, A. C. F. Análise de Ferramentas de Business Intelligence com destaque dos serviços de
BI na Cloud Computing. Trabalho de conclusão de curso (Engenharia de computação) –
Universidade de Uberaba, 2017. Disponível em:
https://repositorio.uniube.br/bitstream/123456789/481/1/Ana%20Camila%20Fonseca%20Soare
s.pdf. Acesso em: 06 dez. 2023.
ZANONI, A. P.; BITENCOURT, L.; FARINA, E. A lógica aristotélica. Revista Pandora Brasil, n.75,
2016. Disponível em: http://revistapandorabrasil.com/revista_pandora/projetos_75/logica_2.pdf.
Acesso em: 7 jun. 2021.
Aula 4
Aplicações práticas do pensamento analítico e da tomada de decisão
Introdução
Olá, estudante!
Nesta aula você verá os conceitos de aplicações práticas do pensamento analítico e da tomada
de decisão, você irá analisar exemplos de como aplicar o pensamento e a tomada de decisão,
https://repositorio.uniube.br/bitstream/123456789/481/1/Ana%20Camila%20Fonseca%20Soares.pdf
https://repositorio.uniube.br/bitstream/123456789/481/1/Ana%20Camila%20Fonseca%20Soares.pdf
http://revistapandorabrasil.com/revista_pandora/projetos_75/logica_2.pdf
Disciplina
Pensamento Analítico e Análise
de Dados
uma vez que o pensamento analítico é uma habilidade que envolve dividir problemas complexos
em componentes menores e mais gerenciáveis para facilitar a análise e a tomada de decisões.
Para conhecer as aplicações práticas do pensamento analítico e da tomada de decisão, serão
abordados conceitos e exemplos relacionados à árvore de decisão, a qual corresponde a um
�uxograma em forma de árvore que mostra aos analistas e aos decisores quais os passos que
devem tomar e como as diferentes escolhas podem afetar todo o processo. Tudo isso apoiado
por dados.
Então, vamos lá?
Introdução: pensamento analítico na tomada de decisão
No ambiente de negócios, as organizações enfrentam desa�os e problemas cada vez mais
complexos. Para superar esses obstáculos, é fundamental contar com líderes e colaboradores
capazes de aplicar o pensamento analítico na tomada de decisão.
O pensamento analítico é uma habilidade que envolve dividir problemas complexos em
componentes menores e mais gerenciáveis para facilitar a análise e a tomada de decisões. Em
vez de abordar um problema na sua totalidade, o pensamento analítico permite analisar cada
parte separadamente e encontrar soluções mais precisas e e�cazes. Além disso, essa habilidade
ajuda a identi�car padrões, relações e tendências que podem passar despercebidos em uma
Disciplina
Pensamento Analítico e Análise
de Dados
abordagem mais super�cial. A seguir, você poderá ver um passo a passo para aplicar o
pensamento analítico na solução de problemas da área empresarial. Essas etapas ajudarão você
a enfrentar desa�os complexos e a desenvolver soluções e�cientes que impulsionam o
crescimento e o sucesso da sua organização (Costa, 2020).
Identi�que o problema: questões-chave e abordagem sistêmica
Ao identi�car o problema, é essencial fazer perguntas-chave para determinar o âmbito e a
natureza do desa�o. Essas perguntas podem incluir:
Qual é o principal problema?
Quais são os sintomas e causas subjacentes?
Como o problema afeta a organização ou os indivíduos envolvidos?
Existem fatores externos ou internos que contribuem para o problema?
Além disso, é necessária uma abordagem sistêmica para considerar como as partes individuais
do problema interagem entre si e com o ambiente empresarial mais amplo.
Colete informações e dados relevantes: fontes e métodos
Para coletar informações e dados relevantes, considere usar uma combinação de fontes
primárias (entrevistas, pesquisas, observação direta) e secundárias (relatórios, estudos, artigos
acadêmicos). Também é útil empregar métodos quantitativos e qualitativos para obter uma
compreensão mais completa do problema (Zanoni; Bitencourt; Farina, 2016).
Analisar informações: ferramentas e abordagens analíticas
Ao analisar as informações coletadas, você pode usar diversas ferramentas e abordagens
analíticas para identi�car padrões, tendências e relacionamentos.
Gerar soluções possíveis: pensamento criativo e divergente
Ao gerar soluções possíveis, é importante adotar uma abordagem criativa e divergente. Não se
limite a soluções convencionais ou previsíveis; em vez disso, explore opções inovadoras e fora
do comum.
Avaliar e selecionar a melhor solução: critérios e tomada de decisão
Ao avaliar e selecionar a melhor solução, estabeleça critérios claros que permitam comparar as
diferentes opções. Esses critérios podem incluir viabilidade, custo, tempo necessário para
implementar a solução, impacto na organização e benefícios de curto e longo prazo. Além disso,
considere o uso de ferramentas e abordagens de tomada de decisão, conforme mencionado nas
aulas anteriores.
Implementar e monitorar a solução: gerenciamento e monitoramento de mudanças
Uma vez selecionada a solução, é importante gerir adequadamente a sua implementação e
adaptar a organização à mudança. Isso pode incluir a comunicação e�caz dos objetivos e
benefícios da solução, o treinamento da equipe e a alocação de recursos apropriados. Além
disso, monitore continuamente o progresso e o impacto da solução para garantir que os
resultados desejados sejam alcançados. Ajuste sua abordagem conforme necessário e aprenda
com os sucessos e fracassos para melhorar continuamente seu pensamento analítico e
habilidadesde resolução de problemas (O’Brien; Marakas, 2013).
Disciplina
Pensamento Analítico e Análise
de Dados
Exemplos de aplicação de pensamento analítico e interpretação de árvore de
decisão
Exemplos de pensamento analítico
Alguns exemplos de pensamento analítico são os seguintes:
A reparação de um carro: o mecânico deve revisar as peças que compõem o circuito onde
ocorre a falha e veri�car se cada elemento funciona corretamente, avançando
sequencialmente até encontrar o elemento defeituoso e substituí-lo. Com a nova peça
instalada, o carro deve funcionar corretamente.
A correção, através de cirurgia, de um defeito que compromete a saúde: o médico deve
primeiro estudar o conjunto de partes do corpo relacionadas, até identi�car a causa do
desconforto e então traçar um plano de ação que pode ser: retirar a parte defeituosa (como
o apêndice), substituí-la por uma prótese ou um órgão doado ou remodelar a estrutura para
compensar o defeito (Sousa, 2019).
Catalogação de livros em uma biblioteca: o responsável pela tarefa deve desenhar ou
encontrar um critério adequado para satisfazer as necessidades particulares daquela
biblioteca especí�ca, colocando um número de estantes nas quais os livros serão
distribuídos de acordo com um tema, primeiro, e um nome, em segundo lugar,
estabelecendo uma lógica que permite encontrar rapidamente o título que você precisa.
Melhorar a produção da fábrica: o colaborador deve revisar os diferentes departamentos
envolvidos em sua cadeia produtiva para garantir que operem de maneira ideal. Esse
estudo do �uxo de matérias-primas no seu caminho para se tornarem produtos
Disciplina
Pensamento Analítico e Análise
de Dados
manufaturados acabará por encontrar o “gargalo” que retarda o processo e, uma vez
identi�cado, poderá ser resolvido através da redistribuição de recursos dentro do sistema
fabril.
Árvore de decisão
Uma ferramenta considerada excelente por empresas bem-sucedidas é a árvore de decisão, a
qual permite a análise de opções, avaliação de resultados e identi�cação de oportunidades
(Machado; Cunha, 2019).
A árvore de decisão (Figura 1) é um diagrama em forma de árvore que mostra as probabilidades
estatísticas ou determina um curso de ação. Mostra aos analistas e aos decisores quais os
passos que devem tomar e como as diferentes escolhas podem afetar todo o processo. Tudo
isso apoiado por dados.
Figura 1 | Árvore de decisão. Fonte: elaborada pela autora.
Elementos de uma árvore de decisão
Uma árvore de decisão é composta de três partes principais:
Nós de decisão ou nó raiz: são sempre o primeiro nó do caminho e representam a decisão
a ser tomada. Eles são exibidos gra�camente como um quadrado.
Nós de probabilidade ou nós internos: mostram a probabilidade ou incerteza e geralmente
são incluídos na forma de um círculo. Cada um tem suas próprias rami�cações e se
conecta a um nó anterior. Esses nós são interligados com a ajuda de outros elementos
Disciplina
Pensamento Analítico e Análise
de Dados
chamados “ramos”, que podem ser usados repetidamente em diferentes combinações,
dependendo da complexidade da árvore de decisão.
Nós �nais ou nós folhas: representam um resultado e são exibidos como um triângulo. Eles
são fáceis de identi�car porque não se dividem nem se rami�cam.
Cada elemento da árvore de decisão é de extrema importância e recomenda-se respeitar a sua
ordem e �gura para que a análise da informação seja muito mais simples e e�caz.
Características de uma árvore de decisão
Embora cada árvore de decisão possa variar dependendo do tópico principal que você deseja
focar, as principais características que distinguem esse diagrama são:
É composto por �guras quadradas, circulares e triangulares.
É um método não paramétrico para construção de modelos de classi�cação.
Geralmente usa uma abordagem baseada em heurística para orientar a pesquisa dentro de
uma hipótese.
Pode ser construído de forma fácil e rápida, mesmo quando seu nível de complexidade é
muito alto.
É caracterizado por uma de�nição muito rápida de dados de teste com alto nível de
profundidade.
Ele suporta uma descrição expressiva para aprender funções de valores discretos, mas não
generaliza um único método para resolver um problema.
Exemplos de árvore de decisão: seleção de opções, avaliação de resultados e
identi�cação de oportunidades
Disciplina
Pensamento Analítico e Análise
de Dados
Vantagens e desvantagens de uma árvore de decisão
Agora que você sabe o que é uma árvore de decisão, quais os elementos que ela contém e quais
são suas características, vamos analisar detalhadamente os aspectos positivos e negativos
desse método.
Vantagens de uma árvore de decisão
Interpretabilidade: uma árvore de decisão é muito intuitiva e fácil de entender. Sua forma de
�uxograma permite que as previsões do modelo sejam analisadas e explicadas de forma
prática. Isso fornece informações detalhadas sobre o que está acontecendo em um evento,
situação ou problema (Machado; Cunha, 2019).
Boa preparação de dados: se você necessita de preparação prévia de dados para
desenvolver um modelo ou projeto, a árvore de decisão é um método muito e�caz para
fornecer previsões de qualidade graças ao seu bom tratamento de valores faltantes e
padronização de dados. Portanto, torna-se uma alternativa de referência para muitas
empresas em seu processo de tomada de decisão.
Não é paramétrico: uma das grandes vantagens da árvore de decisão é que não há
suposições signi�cativas que você deva atender ou uma distribuição de dados obrigatória
que você deva considerar ao construí-la.
Versatilidade: a árvore de decisão é muito versátil e pode executar diversas funções além
de apenas uma previsão de resultado padrão. Também é utilizado para explorar dados,
resolver problemas de regressão e classi�cação, bem como segmentar problemas.
Disciplina
Pensamento Analítico e Análise
de Dados
Desvantagens da árvore de decisão
Muitos recursos e amostragem de dados: embora a árvore de decisão nos permita
conhecer muitas variáveis e opções, isso também pode se tornar uma desvantagem se
houver conjuntos de dados de classe desequilibrados, pois o modelo pode ser tendencioso
para algum resultado majoritário (Machado; Cunha, 2019).
Como fazer uma árvore de decisão?
1. Determine sua decisão
No nó raiz escreva sua decisão, que será o conceito inicial no qual você se baseará para
decompor o restante dos elementos que o levam a uma série de resultados ou variáveis.
2. Comece a rami�car seus nós
Depois de ter sua ideia ou decisão principal, é hora de diversi�car. Para fazer isso, use as linhas
que emergem do seu nó de decisão para abrir um caminho para os seus nós de oportunidade.
3. Cubra todas as decisões possíveis
Como já mencionamos, cada nó deve possuir rami�cações que representem as possibilidades
consequentes da decisão que se deseja tomar, isso o ajudará a contemplar cada um deles. É
importante que nesta etapa você cubra todos os detalhes possíveis para que a análise �nal seja
bem-sucedida.
4. Calcule risco e recompensa
Nesta etapa é hora de analisar os dados e as informações que você possui. Uma recomendação
é que você forneça dados quantitativos à sua árvore para que sua interpretação seja mais fácil e
você possa calcular o valor esperado em cada decisão.
5. Avalie os resultados
Nesta etapa você deve determinar qual decisão é ideal com base na quantidade de risco que
você está disposto a assumir. Isso vai depender diretamente do que você e sua equipe
determinam como melhor resultado com base em orçamento, cronograma, necessidades, entre
outros fatores.
Exemplos de árvores de decisão
Para visualizar melhor o que acabamos de conhecer, apresentamos os seguintes exemplos de
árvores de decisão.
Exemplo 1: Em um exemplo �ctício, o engenheiro-chefe de uma indústria química multinacionals,
deve decidir se construirá uma nova planta de processamento baseada em uma tecnologia
experimental. Se a nova fábrica tiver um bom desempenho, a empresa terá um lucro líquido de
US$ 20 milhões. Se