Prévia do material em texto
v1.0
31/01/2024
2024
Trilha de Aprendizagem:
Inteligência Artificial aplicada
à Visão Computacional
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
Conteúdo
Adriana da Silva Nogueira
Bruno Agrofoglio Ferreira
Júlio César Leitão Júnior
Larissa de Oliveira Figueira
Marcelo de Almeida Viana
Peterson Gomes de Moura Barros
Coordenação-Geral
José Augusto de Lima Prestes
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
Adriana da Silva Nogueira é professora licenciada há mais de 18 anos em
Computação, mestre em Educação e pós-graduada em TI aplicada à Educação.
Possui experiência ministrando aulas para ensino superior em cursos da área
de TI que somam mais de 16 anos. Sua experiência no ensino superior envolve
disciplinas relacionadas à programação de computadores, análise de sistemas
e engenharia de software.
Durante 6 anos atuou como educadora maker desenvolvendo projetos
do-it-yourself e projetos de automação com alunos do Ensino Fundamental.
Atualmente é especialista em projetos na Facti - Fundação de Apoio à
Capacitação em Tecnologia da Informação, e integra o time de capacitação dos
projetos Letramento Digital e QualiFacti.
O perfil público está disponível aqui.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://www.linkedin.com/in/adriana-silva-63071537/
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
Bruno Agrofoglio Ferreira é físico pela UNICAMP. Entre 2002 e 2005,
trabalhou com a aquisição e análise de dados do Observatório Pierre Auger
(Argentina). A colaboração no maior observatório de Raios Cósmicos do
mundo proporcionou-lhe a primeira experiência em hardware embarcado e
transmissão de dados via rádio. Desde 2001, participou junto à Pró-Reitoria de
Extensão e Cultura da UNICAMP do Projeto Raio de Sol e do Projeto Educativo
de Integração Social. Colaborou em projetos de iniciação e divulgação
científica júnior junto ao Instituto de Física Gleb Wataghin. Cursa mestrado
como estudante especial na Faculdade de Engenharia Elétrica e da
Computação da UNICAMP e Pedagogia na UNIVESP. Desde 2013 trabalha com
tecnologias na educação básica, lecionando na rede pública do Estado de São
Paulo, escolas particulares e sem fins lucrativos, além de projetos de
emancipação digital em Campinas. Foi revisor e autor colaborativo de Ciências,
além de avaliador no programa InovAtiva vinculado ao Ministério do
Desenvolvimento, Indústria, Comércio e Serviços (MDIC).
O perfil público está disponível aqui.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://www.linkedin.com/in/agrofoglio
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
Júlio Leitão é bacharel em administração de empresas e possui pós
graduação (MBA) em gestão financeira e controladoria.
Com vivência e experiência em departamentos administrativos, na gestão
de projetos e em rotinas técnicas dos mais variados projetos que passou,
possui habilidade para solucionar problemas de forma eficiente.
Atualmente é Especialista de Projetos Pleno na Facti - Fundação de Apoio à
Capacitação em Tecnologia da Informação, e integra os times de capacitação
dos Projetos LINFO CCTI (QualiFacti) e LINFO LD (Letramento Digital).
O perfil público está disponível aqui.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://www.linkedin.com/in/j%C3%BAlio-c%C3%A9sar-leit%C3%A3o-j%C3%BAnior/
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
Larissa de Oliveira Figueira é mestre em Física Aplicada pela Universidade
Estadual Paulista e adquiriu vasta experiência em Inteligência Artificial,
Otimização, Robótica Educacional e tecnologias educacionais ao longo de sua
carreira. Desempenhou diferentes papéis, incluindo o de docente no Ensino
Superior e gestora educacional, o que lhe proporcionou uma visão abrangente
das necessidades e demandas no campo da tecnologia.
Larissa também se destaca pelo seu envolvimento na capacitação de
educadores no âmbito tecnológico.
Atualmente, ela faz parte da equipe de capacitação da Facti, onde
compartilha seus conhecimentos e auxilia profissionais a ingressarem ou se
consolidarem no promissor campo da tecnologia.
O perfil público está disponível aqui.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://www.linkedin.com/in/larissa-oliveira-604124ba
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
Marcelo de Almeida Viana é mestre e doutor em Engenharia Elétrica pela
UNICAMP, especialista em gerenciamento de projetos pelo SENAC-SP e
engenheiro eletricista pela PUC-MG.
Tem experiência na área de Inteligência Artificial, Engenharia Biomédica,
Engenharia Elétrica e Eletrônica, atuando principalmente com programação de
algoritmos de Inteligência Artificial, projetos eletrônicos e soluções para
produtos ou serviços para saúde.
Também atuou como professor universitário e é membro do Comitê
Brasileiro Odonto-Médico-Hospitalar da ABNT/CB-026, relacionado a projetos
de normas técnicas.
Atualmente é especialista em projetos na Facti - Fundação de Apoio à
Capacitação em Tecnologia da Informação, e integra o time de capacitação dos
projetos Letramento Digital e QualiFacti.
O perfil público está disponível aqui.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://www.linkedin.com/in/marcelo-a-viana
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
Peterson Gomes de Moura Barros possui especializações em Engenharia de
Automação e Eletrônica Industrial, Engenharia de Produção e atualmente é
pós-graduando em Educação online e Tecnologias de Aprendizagem. É
tecnólogo em Gestão da TI e técnico em Eletroeletrônica.
Atuou como docente entre 2011 e 2023 nas áreas de Eletroeletrônica,
Tecnologia da Informação eCloud Computing.
Realizou projetos de formação para docentes em pensamento
computacional e lógica de programação, com uso educacional de linguagens
como Scratch, HTML, CSS e Javascript.
Atualmente está buscando construir um futuro melhor por meio da
educação e da tecnologia, atuando como Especialista de Projetos em Educação e
Capacitação na Facti.
O perfil público está disponível aqui.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://www.linkedin.com/in/petersonmourabarros
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
José Augusto de Lima Prestes está desde abril de 2018 como Gerente de
Governança e Compliance da Facti. Nesta função, tem a responsabilidade de
gerenciar o trabalho de todas as áreas técnicas e administrativas da instituição.
Adicionalmente, ocupa, desde agosto de 2020, a função de Encarregado pelo
Tratamento de Dados Pessoais da organização. Ele também ocupa o papel de
gerente de diferentes projetos de Pesquisa, Desenvolvimento e Inovação em
TICs, atuando em escopos diversos que vão do desenvolvimento de software
para a gestão de políticas públicas à capacitação de pessoas para lidarem com
os desafios da Indústria 4.0. Na sua produção técnico-científica, teve
participação em artigos, capítulos de livros, pedidos de patente e programa de
computador. Foi membro do Laboratório de Estudos sobre a Organização da
Pesquisa e da Inovação (Lab-GEOPI) da Unicamp e participou do Projeto
HEIP-link da Universidade de Alicante (Espanha), parte do Programa Erasmus
Mundus da União Europeia.
Os seus atuais tópicos de interesse abrangem Ética e Filosofia da Tecnologia,
Inovação Responsável, Inteligência Artificial, Neurodireitos, Privacidade Mental e
Robótica. O perfil público está disponível aqui.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://www.linkedin.com/in/jalprestes
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
Sumário
Prefácio 18
Capítulo 1: Introdução à Inteligência Artificial 19
1.1. Introdução 20
1.2. Inspirar 21
1.2.1. Estudo de Caso 23
1.3. Conceitualizar 25
1.3.1. Introdução à Inteligência Artificial 25
1.3.2. Contexto histórico 28
1.3.3. Definições e conceitos de IA 34
1.3.4. Tipos e modelos de IA 38
1.3.5. Importância e aplicações na sociedade moderna 44
1.3.6. Aprendizado de Máquina 69
1.3.7. Redes neurais e Deep Learning 81
1.3.8. Mineração de dados 87
1.4. Consolidar 91
1.4.1. Consolidando o conhecimento 91
1.4.2. Solução final do Estudo de Caso 93
1.5. Avaliar 95
Referências 96
Capítulo 2: Introdução à Visão Computacional 101
2.1. Introdução 102
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
2.2. Inspirar 103
2.2.1. Estudo de Caso 104
2.3. Conceitualizar 106
2.3.1. Introdução à Visão Computacional 106
2.3.2. Redes neurais e Deep Learning para a Visão Computacional 147
2.3.3. Algoritmos mais comuns em Visão Computacional 148
2.3.4. Apresentando a plataforma Edge Impulse 150
2.4. Consolidar 164
2.4.1. Estudo de caso 164
2.4.2. Solução final do Estudo de Caso 183
2.5. Avaliar 184
Referências 186
Capítulo 3: Python para o desenvolvimento de Inteligência
Artificial do básico às aplicações avançadas 188
3.1. Introdução 189
3.2. Inspirar 191
3.2.1. Estudo de Caso 194
3.3. Conceitualizar 196
3.3.1. De onde vem a linguagem Python? 196
3.3.2.Instalação do Python 200
3.3.3. Comandos essenciais em Python 202
3.3.4. Ferramentas de programação em Python 206
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
3.3.5. Atividades de experimentação 238
3.3.6. Tipos de dados e variáveis 241
3.3.7. O que é um comando de entrada? 244
3.3.8. Operadores Aritméticos 249
3.3.9. Atividades de experimentação 254
3.3.10. Estruturas de controle de fluxo 257
3.3.11. Funções Modularidade 291
3.3.12. Atividades de experimentação 300
3.3.13. Manipulação de Arquivos e Strings 303
3.3.14. Estrutura de Dados 331
3.3.15. Bibliotecas e comandos de instalação 357
3.4. Consolidar 408
3.4.1. Consolidando o conteúdo 408
3.4.2. Solução final do Estudo de Caso 411
3.5. Avaliar 413
Referências 414
Capítulo 4: Visão Computacional aplicada ao reconheci-
mento facial em imagens 416
4.1. Introdução 417
4.2. Inspirar 419
4.2.1. Estudo de Caso 421
4.3. Conceitualizar 424
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
4.3.1. Definição sobre detecção e reconhecimento de imagem 424
4.3.2. Introdução ao reconhecimento facial em imagem 427
4.3.3. Como o Aprendizado de Máquina detecta e
reconhece imagens 431
4.3.4. Principais algoritmos de reconhecimento facial 433
4.4. Consolidar 447
4.4.1. Estudo de Caso 447
4.4.2. Proposta de implementação 448
4.4.3. Solução final do Estudo de Caso 448
4.5. Avaliar 457
Referências 458
Capítulo 5: Visão Computacional aplicada ao reconheci-
mento de imagens 461
5.1. Introdução 462
5.2. Inspirar 463
5.2.1. Estudo de Caso 465
5.3. Conceitualizar 471
5.3.1. Como redes neurais aprimoram o reconhecimento de imagens 471
5.3.2. Introdução à rede neural convolucional 474
5.3.3. Conhecendo o modelo de rede neural para
reconhecimento de imagens 480
5.4. Consolidar 503
5.4.1. Estudo de Caso 503
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
5.4.2. Infraestrutura para o estudo de caso 504
5.4.3. Solução final do Estudo de Caso 505
5.5. Avaliar 514
Referências 515
Capítulo 6: Visão Computacional aplicada ao reconheci-
mento de emoções 517
6.1. Introdução 518
6.2. Inspirar 520
6.2.1. Estudo de Caso 522
6.3. Conceitualizar 525
6.3.1. Introdução ao reconhecimento de emoções 525
6.3.2. Importância e desafios dos dados no reconhecimento
de emoções 531
6.3.3. Como o Aprendizado de Máquina reconhece
emoções em imagens 533
6.3.4. Atividade de experimentação 536
6.4. Consolidar 541
6.4.1. Estudo de Caso 541
6.4.2. Proposta de implementação 542
6.4.3. Infraestrutura para o estudo de caso 5426.4.4. Solução final do Estudo de Caso 542
6.5. Avaliar 547
Referências 548
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
Capítulo 7: Visão Computacional aplicada ao rastreamento
de objetos 549
7.1. Introdução 550
7.2. Inspirar 552
7.2.1. Estudo de Caso 554
7.3. Conceitualizar 557
7.3.1. Diferenças entre detecção, reconhecimento e
rastreamento de objetos 557
7.3.2. Desafios comuns no rastreamento de objetos 562
7.3.3. Como o Aprendizado de Máquina rastreia e reconhece
objetos em vídeos 566
7.3.4. Algoritmos de detecção e rastreamento de objetos 571
7.4. Consolidar 589
7.4.1. Estudo de Caso 589
7.4.2. Proposta de implementação 590
7.4.3. Solução final do Estudo de Caso 590
7.5. Avaliar 594
Referências 595
Capítulo 8: Visão Computacional aplicada ao reconheci-
mento de textos 596
8.1. Introdução 597
8.2. Inspirar 599
8.2.1. Estudo de Caso 601
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
8.3. Conceitualizar 604
8.3.1. Introdução ao reconhecimento de textos com OCR 604
8.3.2. Técnicas para pré-processamento de imagens 609
8.3.3. Abordagens das ferramentas técnicas com OCR 622
8.3.4. Uso do Aprendizado de Máquina no reconhecimento
de texto com OCR 635
8.4. Consolidar 638
8.4.1. Estudo de Caso 638
8.4.2. Proposta de implementação 639
8.4.3. Infraestrutura para o estudo de caso 639
8.4.4. Solução final do Estudo de Caso 640
8.5. Avaliar 642
Referências 643
Capítulo 9: Visão Computacional aplicada ao reconheci-
mento e sintetização de voz 645
9.1. Introdução 646
9.2. Inspirar 648
9.2.1. Estudo de Caso 650
9.3. Conceitualizar 653
9.3.1. Introdução ao reconhecimento e sintetização de voz 653
9.3.2. Características e processo de extração de áudio 657
9.3.3. Como o Aprendizado de Máquina reconhece e sintetiza voz 666
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
17
9.4. Consolidar 682
9.4.1. Estudo de Caso 682
9.4.2. Proposta de implementação 683
9.4.3. Solução final do Estudo de Caso 683
9.5. Avaliar 687
Referências 688
Avaliar final 690
Considerações finais 691
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
18
Prefácio
Este curso de Inteligência Artificial aplicada à Visão Computacional abordará
dois temas que nos próximos anos deverão estar cada vez mais presentes em
nossa vida acadêmica, pessoal e profissional.
De acordo com os mais recentes estudos a respeito, é esperado que ambas
as tecnologias estejam em um platô de produtividade até o ano de 2026. Isto
significa dizer que se tornarão passíveis de utilização nos mais diversos
contextos e finalidades, permitindo que consigamos realizar atividades até
então consideradas impossíveis, muito difíceis ou muito caras.
O formato assíncrono - adotado para a ministração deste curso - vai ao
encontro das abordagens mais modernas, que visam a permitir que as pessoas
estudem nos momentos mais adequados às respectivas rotinas.
Logo, o objetivo da Facti é conseguir ministrar um conteúdo aderente às
demandas do mercado em um formato que permita a qualquer pessoa
participar do curso.
Ao longo do material didático, bem como no Google Sala de Aula, você
receberá diversas instruções e orientações. A leitura atenta desse conteúdo é
que lhe permitirá construir conhecimento e avançar ao próximo capítulo.
Esperamos que você goste deste curso tanto quanto nós gostamos de
elaborá-lo. E, por fim, que o conhecimento adquirido possa ser relevante para os
seus próximos passos nos estudos, na carreira ou com a família.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
Capítulo 1:
Introdução à
Inteligência Artificial
Autor
Peterson Gomes de Moura Barros
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
20
1.1. Introdução
Boas-vindas ao capítulo 2! Aqui será tratado o tema Introdução à
Inteligência Artificial! Você avançará, neste capítulo, adentrando nessa
tecnologia que vem revolucionando a criação e operação de sistemas nos mais
diversos setores da sociedade (acadêmico-científico, industrial, agrícola etc.) de
forma mais ampla: a Inteligência Artificial (IA) vem revolucionando vários
aspectos nas interações humanas!
Você irá explorar os princípios fundamentais que regem a IA, seu contexto
histórico, definições, tipos e modelos. Descobrirá a importância deste campo e
suas aplicações na nossa sociedade, e como as máquinas aprendem e utilizam
os dados para aperfeiçoar sua operação, por meio do Aprendizado de Máquina,
redes neurais e Deep Learning.
Ao final deste capítulo, você terá não apenas compreendido os conceitos
fundamentais da IA, mas também terá adquirido habilidades para refletir sobre
desafios mais profundos neste campo.
Figura 01: Introdução à Inteligência Artificial
Fonte: imagem gerada por IA.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
1.2. Inspirar
Você já deve ter ouvido falar sobre IA não é? Já deve ter percebido o
surgimento, cada vez mais constante, de máquinas e sistemas que tomam
decisões aperfeiçoando seu próprio modo de operar, como se fossem
inteligentes.
No meio destas percepções todas, você talvez já tenha se perguntado qual
será o seu lugar - ou mesmo o de nós, como humanos - em meio a toda esta
revolução crescente. Este medo ou receio, por vezes, começa, como explica Lee
(2019), em ambientes como o jardim de infância, quando crianças já se deparam
com o seguinte questionamento: “Os computadores vão se tornar tão inteligentes
quepoderão começar a mandar na gente?”
Entretanto, boa parte desse receio em relação à IA provém da falta de
conhecimento sobre o campo e suas tecnologias, deixando muitas pessoas à
mercê de toda a sorte de ideias mal construídas a respeito - impedindo assim
que tomem consciência de que há, sim, riscos relacionados ao uso da IA, mas
justamente quando ela não é aplicada dentro de parâmetros que só adquirimos
conhecendo-a bem e estabelecendo os seus limites.
Logo, obter conhecimentos sobre IA é preparar-se adequadamente para a
inclusão no novo contexto que essa tecnologia vem desenhando no mundo do
trabalho e das interações humanas. E quando se fala em uma boa preparação
para lidar com IA, isto também representa aumentar as chances de
empregabilidade.
Em entrevista à revista IstoÉ Dinheiro, na edição eletrônica de 15 de
setembro de 2023, Leonardo Berto, gerente da Robert Half, diz que “no futuro,
atividades mais operacionais poderão ser executadas majoritariamente por IA. Isso
não significa, no entanto, uma redução no número de empregos e oportunidades”.
21
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
22
E como preparar-se profissionalmente neste novo mundo, permeado por IA?
Na mesma entrevista, Leonardo Berto afirma que “é preciso reforçar, no entanto,
que a responsabilidade está quase totalmente no profissional, que deve ser o
protagonista da sua própria carreira e investir em qualificação técnica [...]”.
Desta forma, você já está no caminho certo, buscando qualificação técnica
profissional em uma temática que certamente será presente e influente no
futuro do mundo do trabalho e na sociedade como um todo.
Antes de iniciarmos a "Etapa de Conceitualização", na qual
haverá a apresentação do conteúdo e a experimentação dos
conceitos trabalhados por meio de atividades práticas, entre no
Google Sala de Aula, na aba "Etapa Inspirar", para acessar todos
os materiais disponibilizados, que visam a estimular sua reflexão e
iniciar a ambientação com o conteúdo deste capítulo.
Como última atividade desta etapa, prepare-se para trabalhar a
solução inicial do estudo de caso que será apresentado na
próxima seção.
A solução inicial que você elaborará não será objeto de
correção ou avaliação: trata-se de uma atividade individual que
deverá lhe ajudar a refletir sobre os conceitos apresentados e a
entender como trabalhá-los de maneira prática.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
1.2.1. Estudo de Caso
Este estudo de caso busca incentivar a reflexão sobre os impactos da IA nos
diversos setores produtivos da sociedade e nas relações humanas como um
todo. O objetivo principal é mostrar como, por meio do uso da IA de forma
consciente, podemos obter imensos avanços em diversas áreas. Uma reflexão
profunda sobre este caso servirá para embasar futuras discussões e uma visão
positiva e funcional sobre a IA.
1.2.1.1. Cenário
Você é uma pessoa colaboradora na Facti e recebeu o convite para auxiliar
na elaboração do material didático para um curso de qualificação técnica do
QualiFacti. O curso é na área de IA.
Você irá auxiliar na construção da resposta a uma atividade específica,
apresentada no material didático dos estudantes e que propõe o seguinte
debate: “Inteligência Artificial - devemos temê-la ou abraçá-la?”.
23
Leia com atenção o cenário do estudo de caso e lembre-se: o
propósito desta atividade é promover uma reflexão inicial acerca do
assunto a ser discutido no cenário tendo por base somente os
conhecimentos de que você dispõe neste momento.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
24
O seu papel, dentro da equipe de produção do material didático, será
desenvolver um texto que convença os leitores de que “a IA, uma vez aplicada de
forma consciente e responsável, produz mais benefícios do que malefícios para a
sociedade moderna”, inclusive você deve acrescentar que a IA é um dos
caminhos mais promissores de desenvolvimento para diversas áreas, como
medicina, agricultura, educação, indústria, segurança, mobilidade e a
proliferação de cidades mais inteligentes.
Você deverá escrever um texto com a forma, quantidade de linhas,
parágrafos e páginas que considerar necessárias para defender o argumento
acima, sempre buscando embasar as suas ideias com fatos e dados técnicos
comprovados e, de preferência, com referência a especialistas da área.
Importante: coloque a sua resposta na atividade
"Apresentação da solução inicial", no Google Sala de Aula, em
um documento no formato de texto. Utilize este momento para
trabalhar as suas ideias iniciais com o máximo de detalhamento que
puder. Mais adiante, as suas anotações serão retomadas para o
refinamento da solução do estudo de caso.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
25
1.3. Conceitualizar
1.3.1. Introdução à Inteligência Artificial
A Inteligência Artificial é um campo multidisciplinar que envolve a criação e o
desenvolvimento de sistemas e programas de computador capazes de realizar
tarefas que, normalmente, requerem inteligência humana. Seu objetivo
fundamental é simular e reproduzir características e habilidades cognitivas,
como aprendizado, raciocínio, percepção, Processamento de Linguagem Natural
e tomada de decisões, com o intuito de replicar ou superar o desempenho
humano nessas áreas. E toda esta tecnologia já está mais presente do que
muitos de nós imaginam, inclusive em atividades do dia-a-dia, como mostra o
infográfico a seguir:
Figura 02: Uso cotidiano da IA.
Fonte: Parlamento Europeu.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://www.europarl.europa.eu/news/pt/headlines/society/20200827STO85804/o-que-e-a-inteligencia-artificial-e-como-funciona
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
Ainda em relação a presença da IA em nosso cotidiano, o colunista da
Investnews, Aloísio Sotero, na edição de 11 de janeiro de 2024, diz: “Vejo que, na
atualidade, praticamente todo usuário da internet interage com uma IA diversas
vezes ao dia, ou pelo menos com um conteúdo online configurado por uma IA. Eis a
mão invisível da IA “.
Para além do cotidiano que enxergamos,a IA também já é responsável por
muitos serviços que rodam nos bastidores, no que chamamos de backend dos
sistemas, realizando predições e operações em campos mais complexos, como
transações financeiras e análises científicas. Já em outros casos, o uso da IA é tão
intrincado que, por vezes, não percebemos que ela já está presente e operante,
como nas projeções de cenários econômicos e políticos, nas simulações
envolvendo relações internacionais, etc. E todos eles, direta ou indiretamente,
também afetam as nossas vidas.
Desse modo, ainda estamos criando uma percepção do quão influente a IA
já é sobretudo no que nos cerca, o que pode parecer assustador para alguns,
assim como Lee (2022, p.282) disserta: “Tecnologias disruptivas podem se tornar
nosso fogo de Prometeu, ou caixa de Pandora, dependendo de como são usadas”.
Mas, perceba no fim da frase de Lee um detalhe revelador, a condicionante
“dependendo de como são usadas”.
Esse deve ser nosso maior ponto de atenção, agora e para o futuro, em
nossa relação com as máquinas inteligentes. Por enquanto, ainda estamos no
comando de como elas são usadas. Como lidaremos com essa responsabilidade
é fator preponderante para que a IA seja nossa aliada de desenvolvimento, e
não nossa inimiga.
Discutiremos no decorrer deste capítulo a respeito de fatores éticos que
envolvem o uso da IA, nos mais diversos campos, tornando-a assim parte de um
desenvolvimento sustentável e que traz benefícios reais à sociedade.
26
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
Esta preocupação com a implementação ética envolvendo sistemas de IA
tem crescido, à medida que também cresce a percepção de que a IA está se
tornando onipresente, diante de tantas inovações que acompanhamos
diariamente, que têm sido fonte de muitas discussões em vários de nossos
círculos de convivência.
E como chegamos até aqui, qual foi o caminho dessa tecnologia para
chegar até o que conhecemos hoje?
Veremos na próxima etapa deste capítulo mais sobre este contexto histórico
da IA.
27
Figura 03: Introdução à Inteligência Artificial.
Fonte: imagem gerada por IA.
Reflita: Você considera que muito do que acontece no seu
dia-a-dia já tem influência de uma IA? Consegue identificar algo
em específico?
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
28
1.3.2. Contexto histórico
Podemos pensar que IA é um assunto novo, no entanto a origem da
Inteligência Artificial retrocede a várias décadas, com diferentes marcos ao
longo do tempo.
Já foi entre as décadas de 1930 e 1940 que o conceito moderno de IA
começou a se desenvolver, junto com o advento da computação. Tivemos
figuras importantíssimas desta era pioneira que já discorriam sobre as
possibilidades da existência e funcionamento de máquinas inteligentes, mesmo
que não houvesse ainda tecnologia para implementação. Alguns avanços
conceituais e teóricos no campo da IA já começavam a se manifestar nestas
primeiras décadas. Um pioneiro notável nesse período foi Alan Turing, cujas
contribuições transcenderam décadas (Kissinger et al., 2023).
Embora o termo "Inteligência Artificial" não tivesse sido cunhado, Turing
estava mergulhado em questões fundamentais sobre a capacidade de
máquinas para imitar o pensamento humano (National Geographic Brasil,
2023). O seu trabalho delineou o conceito de máquinas universais e
estabeleceu os princípios teóricos que se tornariam cruciais para o
desenvolvimento da computação e, eventualmente, para a IA. Apesar de não
ter havido um movimento definido de IA nestes anos iniciais da história da
computação, as ideias de Turing estabeleceram um alicerce fundamental para a
futura exploração da Inteligência Artificial, demonstrando a visão e a audácia
que caracterizariam os pioneiros desse campo inovador.
Foi somente a partir de 1950 que passou a haver uma colaboração mais
intensa entre engenheiros e matemáticos na construção dos alicerces da IA
moderna, com avanços significativos em campos como a lógica simbólica, o
Processamento de Linguagem Natural e o desenvolvimento de algoritmos de
aprendizado.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
29
Foi nesta década, em 1956, que o termo “Inteligência Artificial” foi
oficialmente estabelecido por John McCarthy, outro pioneiro neste campo. Ele
cunhou a expressão durante a Conferência de Dartmouth, um marco
importante no reconhecimento acadêmico desse conceito. McCarthy usou
ainda a expressão "Eros Eletrônicos" para descrever a ideia de criar máquinas
inteligentes.
Figura 04 : O projeto de pesquisa de verão de 1956, em Inteligência Artificial de
Dartmouth, foi iniciado por essa proposta de 31 de agosto de 1955.
Fonte: Opencadd.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://www.opencadd.com.br/blog/como-surgiu-a-inteligencia-artificial
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
Mas, desde aquela ocasião, e nas décadas seguintes, a IA permaneceu
prioritariamente como um assunto acadêmico, com alguns poucos avanços
práticos. Era tida mais como tema de pesquisa, pois, segundo Kissinger et al.
(2023), “desde o final dos anos 1980 até os anos 1990, o setor entrou em um
período conhecido como inverno da IA”.
Mas, ao passo que computadores e linguagens de programação evoluíram,
a IA também crescia e era aplicada a outros setores. Veja a seguir uma linha do
tempo que ilustra a evolução do conceito e experimentações com IA desde as
primeiras décadas na história da computação até os anos de 1980:
Contudo, a partir da década de 1990 começaram a acontecer diversos
avanços em sequência, que unidos mudaram muito o paradigma e as hipóteses
a respeito da IA construídas na era anterior.
30
Figura 05: Linha do tempo evolução da IA nas primeiras décadas
Fonte: Webestrategica
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://webestrategica.com.br/como-funciona-a-inteligencia-artificial/
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
31
Os pesquisadores perceberam que para conseguir atender ao princípio da IA
de executar tarefas por meio de máquinas aptas a solucionar problemas
complexos, seria necessário que, de alguma maneira,as máquinas aprendessem
sozinhas, deixando de somente tentar codificar insights filtrados de humanos.
Ocorreu então uma mudança conceitual, e o foco passou para o Machine
Learning, ou Aprendizado de Máquina (Kissinger et al., 2023). Veremos mais
adiante neste capítulo mais sobre o conceito de Machine Learning.
A partir daí, tornou-se possível o surgimento de agentes mais inteligentes e
sistemas capazes de agir autonomamente. Esses avanços pavimentaram o
caminho para a evolução contínua da IA nas décadas subsequentes,
consolidando-a como uma força transformadora em diversas áreas da
sociedade.
E o aperfeiçoamento de métodos mais sofisticados de Machine Learning
levaram ao advento das Redes Neurais Artificiais e o Deep Learning (Aprendizado
Profundo), permitindo avanços notáveis em tarefas de reconhecimento de
padrões e Processamento de Linguagem Natural. Também estudaremos mais
sobre estes tópicos adiante neste capítulo.
Os anos 2000 e suas primeiras décadas estão testemunhando o
desenvolvimento contínuo do Deep Learning, com novos algoritmos e
paradigmas de programação com foco em IA, e a existência de computadores
capazes de rodar tais sistemas, o que permitiu que este campo adentrasse de
vez em setores produtivos que necessitavam de um nível de análise de dados e
predição ainda não alcançado até então, por falta de tecnologia física (hardware)
para isso (Nascimento Jr e Yoneyama, 2011).
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
32
Observe o infográfico abaixo e acompanhe a evolução da IA entre os anos
1990 e 2000:
Hoje, as possibilidades de implementações envolvendo a IA parecem
infinitas, conforme Lee (2022, p.18): “de eras passadas até o presente, a força
imparável da IA tem revolucionado todas as dimensões da civilização humana e
continuará fazendo isso”.
Veremos ainda muitos avanços, boa parte deles hoje inimagináveis,
especialmente quando a computação quântica estiver estabelecida.
Computação quântica é um campo multidisciplinar que compreende aspectos
da ciência da computação, da física e da matemática e que utiliza a mecânica
quântica para resolver problemas complexos muito mais rapidamente do que
em computadores tradicionais (AWS, 2023).
Figura 06 : Pontos marcantes no desenvolvimento da Inteligência Artificial.
Fonte: Opencadd.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://opencadd.com.br/como-surgiu-a-inteligencia-artificial/
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
33
Nestas últimas décadas temos observado também o surgimento de novos
patamares para a IA Forte, mesmo que conceituais, e que prevêem próximos
passos de desenvolvimento que aproximarão mais as máquinas à forma de
pensamento humano, até mesmo superando-a. IA Forte é outro tema no qual
nos aprofundaremos mais adiante.
Quem sabe, um dia, teremos a resposta final para o questionamento que
existe desde os primórdios da computação, a respeito dos computadores: “Eles
podem pensar? Em caso positivo, um dia eles se equiparariam aos seres humanos?”
(Onody, 2021).
Reflita: Observando como a IA se desenvolveu nos últimos
anos, você acredita que as máquinas poderão superar os seres
humanos um dia?
Figura 07 : Computador quântico
Fonte:Revista Galileu
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://revistagalileu.globo.com/Ciencia/noticia/2021/12/como-os-computadores-quanticos-podem-mudar-o-mundo-que-conhecemos.html
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
34
1.3.3. Definições e conceitos de IA
Iniciamos esta seção com a seguinte reflexão: para definir o que é IA
utilizamos diversas características tecnológicas que estão ainda em evolução,
mas no futuro quais serão estas características, já que estão em constante
mutação?
Portanto, a própria definição de IA também está evoluindo, correto? Assim,
conceituar o que é a IA, ou o que vem a ser uma máquina inteligente, pode ser
mais assertivo se focarmos nossa análise em características imutáveis e
atemporais, que qualquer sistema possuidor de IA deva apresentar. Com esta
premissa em mente, vamos tentar buscar definições apropriadas para a IA.
Como ponto de partida, podemos considerar uma característica atemporal o
fato de que se um determinado sistema é inteligente, seus processos devem
produzir uma saída racional, assim como seria o resultado de uma ação criativa
ou de tomada de decisão humana.
Mas, como dizer se a saída de um sistema foi gerada de forma racional,
inteligente? É a essa pergunta que o teste de Turing se propõe a responder,
determinando se uma máquina é inteligente, imbuída de IA, analisando o que
ela é capaz de produzir (Nascimento Jr e Yoneyama, 2011).
Alan Turing, conhecido como o pai da computação, construiu, por meio do
seu modelo teórico, os alicerces para o desenvolvimento das máquinas que
utilizamos. Ele também ficou muito conhecido como um dos responsáveis por
decifrar o código utilizado pelas comunicações nazistas durante a Segunda
Guerra Mundial (Russel e Norvig, 2003).
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
35
Pensando, como outros da época, na hipótese de os computadores
chegarem a se equiparar aos seres humanos, Turing publicou um artigo em
1950, no qual apresentava o “Jogo da Imitação”, o qual deu origem ao teste de
Turing, que é explicado da seguinte forma na obra “Computing machinery and
intelligence”, em trechos: “[...] suponha que seja possível arranjar as coisas de modo
que um interrogador humano não possa distinguir uma máquina de um ser
humano, em uma conversa escrita [...] Então eu diria que a máquina é inteligente"
(Turing, 1950, p.434).
O teste é composto por um interrogador humano que interage com duas
outras entidades: uma pessoa e uma máquina, sendo realizado em três etapas:
● O interrogador se encontra em uma sala separada das outras duas
entidades.
● O interrogador interage com as duas entidades por meio de um
dispositivo de comunicação, como um teclado e um monitor.
● O interrogador tenta determinar qual das duas entidades é uma pessoa
e qual é uma máquina.
Se o interrogador não conseguir distinguir a máquina da pessoa, então a
máquina é considerada inteligente. Aqui está uma definição prática do que seria
uma máquina inteligente, baseada em IA - aquela que, ao menos em alguns
aspectos, não se distingue do homem!
Reflita: se o teste de Turing fosse aplicado hoje, a IA já
seria capaz de ser identificada como uma pessoa? Caso
positivo, em quais circunstâncias?
D
oc
um
en
to
ass
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
36
Na mesma linha do conceito de Alan Turing para a IA, podemos agora trazer
outras definições, como a do Parlamento Europeu (2023): “A Inteligência Artificial
(IA) é a capacidade que uma máquina tem para reproduzir competências
semelhantes às humanas, como é o caso do raciocínio, a aprendizagem, o
planejamento e a criatividade.” Ou ainda da empresa IBM (2023), que define assim
a IA em seu site: “A Inteligência Artificial utiliza computadores e máquinas para
imitar a capacidade de resolução de problemas e tomada de decisão da mente
humana”.
McCarthy (2007) define assim a IA: “É a ciência e engenharia da criação de
máquinas inteligentes, especialmente programas de computação inteligentes. Está
relacionado à tarefa semelhante de usar computadores para entender a inteligência
humana [...]”
Segundo o Ministério da Ciência, Tecnologia e Inovação (MCTI) e a
Financiadora de Estudos e Projetos (Finep), em edital de contratação de startups
para o “Projeto Soluções de Inteligência Artificial para o Poder Público” de agosto
de 2023, entende-se por Inteligência Artificial como sendo: “Tecnologia que
simula, por meio de algoritmos computacionais, mecanismos avançados de cognição
e suporte à decisão baseado em grandes volumes de informação”.
Também podemos considerar abordagens diferentes para trazer a definição
de IA, como fizeram Stuart Russell e Peter Norvig (2003). Eles dividem a
conceitualização da IA em quatro objetivos potenciais, que distingue sistemas
computacionais com base na racionalidade e pensamento versus ação:
● Abordagem humana: sistemas que pensam como humanos e Sistemas que
agem como humanos;
● Abordagem ideal: sistemas com pensamento racional e Sistemas com atos
racionais.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://repositorio.enap.gov.br/handle/1/7685
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
Todas estas definições e conceitos, em conjunto, contribuem para
entendermos o campo diversificado e dinâmico da IA.
Na próxima seção, nos aprofundaremos nos tipos e modelos de IA, trazendo
exemplos práticos para cada caso.
37
Reflita: As IAs que nos rodeiam hoje, atendem mais à
abordagem humana ou à abordagem ideal, propostas por Stuart
Russell e Peter Norvig (2003)? Por que você tem esse ponto de
vista?
Figura 08: Máquina inteligente.
Fonte: imagem gerada por IA.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
38
1.3.4. Tipos e modelos de IA
Figura 09: IA Forte vs IA Fraca.
Fonte: Lifewire.
A IA pode ser classificada em duas categorias principais, com três modelos
diferentes divididos entres elas. Estas categorias e modelos são: IA fraca ou
“Inteligência Artificial Estreita” e IA forte, que engloba os conceitos de
“Inteligência Artificial Geral” e “Superinteligência Artificial”.
A IA fraca, ou ANI (Artificial Narrow Intelligence), refere-se a sistemas
projetados para realizar tarefas específicas de forma eficiente, como
reconhecimento de voz, diagnóstico médico, recomendações de produtos e
tradução automática. Esses sistemas são programados para processar dados e
aplicar algoritmos e modelos estatísticos a fim de gerar resultados sem
possuírem compreensão ou consciência. São tipos de ANI: assistentes virtuais
(como a SIRI, da Apple; a Alexa, da Amazon; e a Google Assistant) e IAs
Generativas (como o ChatGPT, da OpenAI; o Bard, da Google; e o Copilot, da
Microsoft).
Os assistentes virtuais baseados em IA representam uma inovação
significativa no campo da tecnologia, desempenhando um papel cada vez mais
crucial em diversas áreas da vida cotidiana. Essas ferramentas inteligentes são
projetadas para interagir com os usuários de maneira natural, fornecendo
informações, realizando tarefas e facilitando a comunicação.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://www.lifewire.com/strong-ai-vs-weak-ai-7508012
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
39
Um componente fundamental desses assistentes é a capacidade de
compreender e interpretar a linguagem natural, o que é alcançado por meio de
avançados modelos de Processamento de Linguagem Natural e redes neurais.
Esses assistentes virtuais utilizam algoritmos de Aprendizado de Máquina
para analisar padrões, entender o contexto e melhorar suas respostas ao longo
do tempo com base nas interações anteriores. Isso resulta em uma experiência
mais personalizada e eficiente para os usuários. O reconhecimento de fala é
outra característica essencial, permitindo que os assistentes compreendam
comandos verbais e realizem ações correspondentes (Kissinger et al., 2023) .
Em ambientes domésticos, assistentes como Alexa, Google Assistant e Siri
se tornaram parte integrante da vida diária, controlando dispositivos
domésticos inteligentes, respondendo a perguntas e executando tarefas
simples.
No campo da saúde, assistentes virtuais estão sendo empregados para
fornecer informações médicas, agendar consultas e até mesmo monitorar
condições de saúde. Os assistentes virtuais na medicina representam um
avanço significativo, combinando a inteligência artificial com o cuidado ao
paciente. Esta tecnologia está se tornando cada vez mais vital na medicina
moderna, melhorando a acessibilidade e a qualidade dos cuidados de saúde.
À medida que a IA continua a evoluir, os assistentes virtuais prometem
desempenhar um papel ainda mais relevante, transformando a maneira como
interagimos com a tecnologia e integrando-se cada vez mais às diversas facetas
de nossas vidas.
Essas inovações, embora promissoras, requerem uma abordagem
cuidadosa para equilibrar os benefícios oferecidos com as considerações éticas
e de segurança, este assunto será nosso objeto de estudo na próxima seção.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
40
Ainda dentro da IA fraca, temos a Inteligência Artificial Generativa (IA
Generativa). Ela representa uma classe fascinante de algoritmos que têm
revolucionado diversas áreas, desde a arte até a medicina. Essa abordagem
inovadora utiliza redes neurais para criar dados ou conteúdo novo, muitas
vezes indistinguível de criações humanas. Veja o caso do do prêmio Jabuti de
2023,na categoria Ilustrações: uma obra contendo imagens geradas por IA foi
selecionada como finalista do Prêmio Jabuti 2023, e só foi desclassificada pela
organização da premiação após uma grande polêmica envolvendo o uso da
tecnologia. Concorrendo na categoria de Melhor Ilustração de 2023, o livro em
questão é uma nova edição do clássico Frankenstein, de Mary Shelley. A obra
traz em torno de 50 imagens geradas por IA (Tecmundo, 2023).
Mas, o que mais impressiona nesse caso, é que um dos jurados responsável
pela categoria de ilustrações, o desenhista André Dahmer, disse que não sabia
do uso da tecnologia para a criação da ilustração quando votou!
Diante disso, lembre-se do teste de Turing e reflita novamente: como
podemos avaliar a inteligência das máquinas?
Figura 10: Livro ilustrado por IA Generativa.
Fonte: Tecmundo.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://www.tecmundo.com.br/software/273742-premio-jabuti-desclassifica-livro-ilustrado-ferramenta-ia.htm
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
41
E a IA generativa já trabalha em alto nível não somente com imagens, mas
com outras formas de criação também.
Veja o infográfico a seguir:
Na área da arte, a IA Generativa tem desafiado conceitos tradicionais de
criatividade. O projeto "Edmond de Belamy" da Obvious, por exemplo, gerou
uma obra de arte utilizando um algoritmo baseado em IA, alcançando
reconhecimento e vendas em leilões renomados. Essa interseção entre
tecnologia e criatividade evidencia o potencial transformador da IA Generativa.
Figura 11: Exemplos de uso de IA Generativa.
Fonte: Sankhya
Figura 12: Projeto Obvious.
Fonte: globo.com
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://www.sankhya.com.br/blog/ia-generativa/
https://gq.globo.com/Prazeres/Tecnologia/noticia/2018/09/christies-faz-historia-com-o-primeiro-leilao-de-uma-obra-pintada-por-inteligencia-artificial.html
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
42
No campo da música, a IA Generativa também deixou sua marca. O modelo
Magenta, desenvolvido pelo Google, é capaz de criar composições musicais
inéditas, demonstrando a capacidade da tecnologia em expandir os horizontes
da expressão artística. Artistas e músicos têm explorado colaborações com
algoritmos para criar peças únicas e inovadoras.
Outro exemplo interessante é a aplicação da IA Generativa em design de
produtos. Empresas têm utilizado algoritmos para gerar designs de moda,
móveis e até mesmo automóveis. Essa abordagem não apenas acelera o
processo criativo, mas também introduz elementos inesperados e criativos,
resultando em produtos únicos e cativantes.
Contudo, é crucial considerar os desafios éticos associados à IA Generativa,
como o potencial de criar deepfakes convincentes e manipulações de mídia.
Conforme a tecnologia avança, é imperativo implementar salvaguardas éticas e
regulamentações para mitigar possíveis abusos.
Por fim, falemos de dois modelos de IA Forte que ainda estão em fase de
pesquisa. Primeiro, a Inteligência Artificial Geral (ou AGI - Artificial General
Intelligence), que visa alcançar um nível de inteligência comparável ou superior
à inteligência humana em todos os aspectos.
Figura 13: Cena do filme Ex-Machina.
Fonte: DNA Films; Film4; Scott Rudin Productions.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
43
Esse tipo de IA deverá ser capaz de compreender, aprender e raciocinar em
uma ampla variedade de tarefas e contextos, assim como um ser humano. No
momento, ainda não há exemplos de serviços disponíveis - apenas projetos em
andamento.
Já a Superinteligência Artificial ou ASI (Artificial Superintelligence) buscaria
não somente igualar as capacidades intelectuais humanas, como ocorre no
modelo AGI, mas deverá focar no incremento e superação dessas capacidades.
Este ainda é um campo teórico da IA, que, uma vez implementado, possibilitaria
às máquinas não só aprender com as operações que realizam nas mais diversas
áreas, mas também dispor da capacidade para melhorar e reformular todo um
campo do conhecimento, como a engenharia, medicina e economia.
Embora não haja exemplos de IA forte, o campo está apresentando
inovações constantemente (IBM, 2023). Dito isso, voltaremos o nosso foco para
áreas em que a IA já está desempenhando um papel mais importante
atualmente, fora do campo das hipóteses.
É sobre algumas dessas aplicações e a sua importância em nossa sociedade
que discutiremos na próxima seção.
Figura 14: Superinteligência Artificial.
Fonte: Genetic Literacy Project.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://geneticliteracyproject.org/2021/06/16/too-smart-for-our-own-good-how-artificial-superintelligence-could-lead-to-humanitys-demise/
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
44
1.3.5. Importância e aplicações na
sociedade moderna
Grandes avanços teóricos em IA finalmente têm produzido aplicações práticas
que estão prestes a mudar nossas vidas. A IA já alimenta muitos de nossos
aplicativos e sites favoritos, e nos próximos anos dirigirá nossos carros,
gerenciará nossos portfólios, fabricará muito do que compramos e
potencialmente tirará nossos empregos. Estes usos estão repletos de riscos
promissores e perigos potenciais, e devemos nos preparar para as duas coisas.
(Lee, 2019, p.7)
A pesquisa e o desenvolvimento contínuo com IA têm impulsionado avanços
significativos, permitindo que ela desempenhe um papel cada vez mais
relevante em nossa sociedade.
Conforme Kissinger et al. (2023), diferentes inteligências artificiais têm
aprendido a realizar diferentes tarefas, antes atribuídas somente à capacidade
humana, como vencer no xadrez, descobrir um novo antibiótico e pilotar jatos
de combates.
Ainda segundo Kissinger et al. (2023, p.12) “agora [...] que o poder de
computação necessário para operar a IA sofisticada está se tornando prontamente
disponível, poucos setores permanecerão inalterados.”
Hoje, a IA já promove desenvolvimento na medicina, automação, transporte,
finanças, entretenimento e muitos outros setores, por conta da sua capacidade
de processar dados em larga escala, aprender com eles e tomar decisões
inteligentes; os ganhos atuais e as perspectivas futuras já são visíveis e
mensuráveis.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
ocó
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
45
O infográfico abaixo ilustra, com dados de 2023, a presença da IA no Brasil:
A Universidade de Stanford e o Instituto de Tecnologia de Massachusetts
(MIT) desenvolveram um estudo que acompanhou durante um ano os efeitos
do uso da IA em uma empresa de softwares de grande porte.
Ao fim do estudo, chegaram aos seguintes resultados, divulgado em 2023: o
uso de sistemas de IA generativa, como o ChatGPT, pode aumentar em até 14%
a produtividade de trabalhadores. Em se tratando de funcionários
recém-chegados, o estudo mostra que aqueles trabalhadores menos
habituados a determinados afazeres da companhia conseguiram realizar seu
trabalho 35% mais rápido com ajuda das mesmas IAs generativas, em
comparação com os que não tiveram o suporte dessas tecnologias (Pergentino,
2023).
Os Trabalhadores com dois meses de experiência e que receberam ajuda da
IA tiveram um desempenho igual ou melhor do que os trabalhadores com mais
de seis meses de experiência, e que trabalharam sem a ferramenta (Pergentino,
2023).
Figura 15: Aplicação da IA nas organizações.
Fonte: Valor Econômico
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://valor.globo.com/publicacoes/especiais/telecomunicacoes/noticia/2023/10/11/expansao-do-uso-depende-de-estrategia-adequada.ghtml
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
46
Observe o infográfico abaixo, que traz os resultados de outro estudo,
realizado pela Accenture Research em 2023, e que mostra o quanto o uso da IA
já tem sido um importante fator para aumento da lucratividade de empresas
dos mais variados segmentos:
Figura 16: aumento de lucratividade com uso da IA.
Fonte: Zendesk.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://www.zendesk.com.br/blog/chatbot-de-inteligencia-artificial/
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
47
Justamente por conta dos benefícios que a IA traz, é necessário ponderar
sobre o emprego inadequado da tecnologia: o seu uso de maneira
irresponsável, ilegal ou antiético pode trazer prejuízos às pessoas,
organizações e governos, dificultando ou mesmo impedindo o avanço da
sociedade. Por isso, é de extrema importância o olhar ético ao construir-se
quaisquer implementação utilizando IA.
Diversas empresas e instituições, tanto públicas quanto privadas, têm
buscado compreender as nuances da ética no contexto da IA. Dentre diversos
esforços, nós podemos, a título ilustrativo, observar e aprender com a
abordagem que a Microsoft (2022) trouxe nos seus 6 Princípios da IA
responsável:
1 - Princípio da justiça: os sistemas de AI devem tratar todas as pessoas de
forma justa. Por exemplo, uma IA de conversação não pode atender somente
um cliente bom pagador;
2 - Princípio da inclusão: os sistemas de AI devem capacitar a todos e
envolver as pessoas. A IA não pode deixar de atender todas as classes sociais,
os diferentes gêneros e qualquer tipo de diversidade existente em nossa
sociedade;
3 - Princípio da transparência: os sistemas de AI e seus resultados devem ser
compreensíveis à todos. A documentação da IA deve estar disponível e clara
em conceito e aplicação para o desenvolvedor que vier a utilizá-las;
4 - Princípio da responsabilidade: as pessoas devem ser responsáveis pelos
sistemas de AI. Nunca devemos colocar a responsabilidade de uma tomada de
decisão errada em uma IA, mas, sim, lembramos que um ser humano foi o
responsável por treinar e validar as informações de saída do sistema;
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
48
5 - Princípio da confiabilidade e segurança: os sistemas de AI devem
funcionar de forma confiável e segura. Quando falamos em Confiabilidade,
estamos falando de todas as entradas de dados de usuário que alimentarão um
treinamento de uma IA, seja por meio de campos como inputs de formulários
ou base de dados (mesmo aquelas adquiridas no mercado);
6 - Princípio da privacidade: os sistemas de AI devem ser seguros e respeitar a
privacidade. Quando falamos em Privacidade, estamos falando de todas as
saídas de dados mostradas para os usuários. Nelas, os valores devem ser
mostrados somente se necessário e/ou com proteções como criptografia.
Em 2023, a UNESCO divulgou recomendação sobre as implicações éticas do
uso da IA. Os valores contidos nessa recomendação são:
Nenhum ser humano ou comunidade deve ser prejudicado ou subordinado,
seja fisicamente, economicamente, socialmente, politicamente, culturalmente
ou mentalmente durante qualquer fase do ciclo de vida dos sistemas de IA. Nas
interações com a IA, as pessoas nunca devem ser objetificadas, nem sua
dignidade deve ser prejudicada, ou os direitos humanos e liberdades
fundamentais violados ou abusados. (UNESCO, 2023)
Nos próximos itens, nós discutiremos os benefícios que o uso da IA
consciente e responsável tem trazido a diversos campos da sociedade moderna.
Reflita: Como você, individualmente, pode contribuir para que
a IA se estabeleça na sociedade de forma ética e responsável?
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
49
1.3.5.1. Medicina
A integração da IA com a medicina inaugurou uma era transformadora,
oferecendo uma infinidade de benefícios que melhoram o atendimento ao
paciente, o diagnóstico e a gestão geral da saúde. Esta sinergia entre a
tecnologia avançada e a ciência médica tem o potencial de revolucionar o
panorama da saúde.
Uma das principais vantagens do emprego da IA na medicina é a sua
capacidade de agilizar o processo de diagnóstico. Algoritmos de Aprendizado de
Máquina podem analisar vastos conjuntos de dados, incluindo imagens médicas
e registros de pacientes, com velocidade e precisão sem precedentes. Isso se
traduz em diagnósticos mais rápidos e precisos, levando a intervenções
oportunas e melhores resultados para os pacientes.
Segundo artigo elaborado pela médica Joana Rezende, da MEDWAY, a
Inteligência Artificial faz análises de imagens com precisão entre 5% a 10% maior
que as dos médicos, numa velocidade muito maior. Vejamos 5 aplicações da IA
na medicina (Rezende, 2023):
● Diagnóstico médico assistido por IA: a IA já é aplicada em exames
laboratoriais, em diagnósticos por imagem e em históricos médicos,
ajudando os médicos a identificarem doenças e condições de saúde com
mais rapidez e precisão melhorando a eficácia do tratamento. Um exemplo
prático é a análise de células por Visão Computacional, o que permite
identificar, porimagens, a existência de tumores não visíveis a olho nu.
Dessa forma, a IA funciona de forma preventiva, contribuindo não apenas
para o tratamento, mas para a prevenção de problemas de saúde.
● Medicina personalizada: a IA desempenha um papel fundamental ao
adaptar os tratamentos com base nas características individuais do paciente.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
50
Ao analisar dados genéticos, fatores de estilo de vida e históricos médicos,
os algoritmos de IA podem identificar planos de tratamento ideais,
minimizando os efeitos adversos e maximizando a eficácia terapêutica. Esta
abordagem personalizada representa um salto significativo em direção a
cuidados de saúde mais eficazes e centrados no paciente. Além disso, a IA
contribui para a otimização das operações hospitalares e da gestão de
recursos.
Os modelos de análise preditiva podem prever admissões de pacientes,
permitindo que as instalações de saúde aloquem recursos de forma
eficiente e simplifiquem os fluxos de trabalho. Isto não só aumenta a
eficiência operacional, mas também garante que os profissionais médicos
possam se concentrar mais no atendimento ao paciente.
● Análise de imagens médicas: a interpretação de imagens médicas
(tomografias computadorizadas, ressonâncias magnéticas, radiografias,
mamografias) é uma tarefa complexa, que exige precisão e experiência. A
partir de seu desempenho superior na identificação de padrões visuais,
algoritmos comparam milhares ou milhões de imagens em alguns
segundos. A análise de IA aponta mudanças em tecidos e órgãos humanos.
Desse modo, ela detecta indícios precoces de anomalias e doenças.
● Assistência cirúrgica robótica: a cirurgia robótica é uma operação
auxiliada por robôs, minimamente invasiva. Esses robôs dão assistência a
procedimentos cirúrgicos complexos, garantindo precisão e estabilidade ao
realizar movimentos delicados, que seriam complicados para serem
executados de forma manual. É possível para o médico controlar o
procedimento à distância. O sistema robótico controlado por IA permite
ainda a análise de dados em tempo real, transformando estes dados em
informações valiosas para os médicos-cirurgiões, ainda durante o
procedimento.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
51
● Monitoramento de saúde e prevenção de doenças: no domínio da
investigação médica, a IA acelera o ritmo da descoberta de enfermidades.
Algoritmos de Aprendizado de Máquina podem analisar vastos conjuntos de
dados para identificar padrões, potenciais candidatos a medicamentos e
modalidades de tratamento. Isto acelera o processo de desenvolvimento de
medicamentos, tornando-o mais rentável e facilitando a introdução de
terapias inovadoras no mercado.
Hoje, cada indivíduo pode monitorar e fornecer um conjunto incontável de
dados, sobre sua própria saúde, por meio dos dispositivos vestíveis, como
relógios inteligentes (smartwatches) e pulseiras inteligentes, que.
combinados com algoritmos de IA realizam um constante
acompanhamento dos sinais vitais do usuário, registra-os e fornecem
informações a respeito de sua saúde geral.
Além destas cinco aplicações, também vale destacar o advento e
popularização da telemedicina, que, potencializada pela IA, tornou-se um
componente crucial dos cuidados de saúde modernos. Chatbots controlados por
IA e assistentes virtuais de saúde oferecem respostas imediatas às dúvidas dos
pacientes, fornecem informações de saúde e até auxiliam em diagnósticos
preliminares. Isto não só melhora a acessibilidade aos serviços de saúde, mas
também alivia a carga sobre os prestadores de cuidados de saúde,
permitindo-lhes concentrar-se em casos complexos.
Apesar destes benefícios notáveis, as implicações éticas da IA na medicina
também merecem uma consideração cuidadosa. As preocupações com a
privacidade, a segurança dos dados e os preconceitos algorítmicos devem ser
abordados para garantir a implantação responsável e equitativa de tecnologias
de IA nos cuidados de saúde (Kissinger et al., 2023).
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
52
Concluindo, a integração da IA na medicina é uma promessa imensa para o
avanço do atendimento ao paciente, do diagnóstico e da gestão da saúde.
Desde diagnósticos rápidos a planos de tratamento personalizados e maior
eficiência operacional, os benefícios da IA na medicina são vastos. Ao passo em
que o campo continua a evoluir, é essencial uma abordagem ponderada e ética
para aproveitar todo o potencial da IA na melhoria dos resultados globais dos
cuidados de saúde.
Reflita: você confiaria mais em um diagnóstico médico
realizado por uma pessoa ou por uma IA? Por quê?
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
53
1.3.5.2. Indústria
A Indústria tem vivido uma revolução impulsionada pela IA, com aplicações
práticas que transformam processos tradicionais. A manutenção preditiva, o
controle de estoque, o design generativo, a gestão da qualidade, a robótica e a
redução de perdas são apenas algumas das áreas em que a IA exerce impacto
significativo, moldando um novo paradigma industrial.
A manutenção preditiva, um dos destaques da aplicação da IA na indústria,
revoluciona a abordagem convencional de reparos e substituições. Sistemas de
IA alimentados por ML analisam dados em tempo real, identificando padrões
que indicam possíveis falhas em equipamentos. Isso permite intervenções
proativas, reduzindo o tempo de inatividade e os custos associados. A previsão
precisa de necessidades de manutenção impulsiona a eficiência operacional.
O controle de estoque é outra esfera na qual a IA desempenha um papel
relevante. Sistemas inteligentes utilizam algoritmos de ML para analisar padrões
de demanda, sazonalidade e comportamento do consumidor. Essa análise
preditiva aprimorada resulta em uma gestão de estoque mais eficiente,
reduzindo custos de armazenamento e evitando escassez ou excesso de
produtos. A precisão na previsão de demanda é vital para a sustentabilidade e
competitividade das empresas na era digital.
O design generativo, por sua vez, ilustra como a IA influencia a criação de
produtos inovadores. Algoritmos generativos capacitados por IA exploram
automaticamente diversas opções de design com base em critérios específicos.
Essa abordagem não apenas acelera o processo criativo, mas também leva à
concepção de produtos mais eficientes em termos de recursos e desempenho. A
IA se torna uma aliada na busca pela excelência einovação no design industrial.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
54
No que diz respeito à gestão da qualidade, a IA proporciona avanços
significativos na identificação e prevenção de defeitos. Sistemas de Visão
Computacional e algoritmos de reconhecimento de padrões permitem a
detecção automática de falhas em tempo real. Isso não só aprimora a qualidade
do produto final, mas também reduz desperdícios ao identificar problemas em
estágios iniciais da produção (Nascimento Jr e Yoneyama, 2011). A IA se destaca
como uma ferramenta essencial na busca pela excelência na produção
industrial.
A robótica colaborativa é outra área em que a IA desempenha um papel
transformador. Colaboração eficiente entre humanos e robôs, mediada por
algoritmos avançados, está redefinindo os limites da automação industrial
(ABB, 2021). A IA permite que robôs colaborativos (ou cobots) se adaptem
dinamicamente às mudanças no ambiente de trabalho, melhorando a
flexibilidade e eficiência da produção. A coexistência harmoniosa entre
humanos e robôs é essencial para maximizar os benefícios da automação.
Figura 17: Robótica colaborativa.
Fonte: ABB.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://www.redesdesaude.com.br/aprendizado-de-maquina-machine-learning/
https://new.abb.com/news/pt-br/detail/74647/robos-colaborativos-ja-sao-realidade-na-industria-40
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
55
Por fim, a redução de perdas emerge como uma preocupação central na
era da Indústria 4.0. A IA, ao otimizar processos em diferentes estágios da
produção, contribui significativamente para a minimização de desperdícios.
Seja por meio da prevenção de defeitos, da gestão eficiente de estoque ou da
manutenção preditiva, a IA atua como um catalisador na redução de perdas,
promovendo a sustentabilidade e a eficiência econômica.
Em síntese, a Inteligência Artificial é uma força motriz nos avanços da
Indústria 4.0, impactando a manutenção preditiva, controle de estoque, design
generativo, gestão da qualidade, robótica e redução de perdas.
Essas aplicações práticas não apenas melhoram a eficiência operacional,
mas também redefinem a maneira como concebemos e conduzimos processos
industriais (TOTVS, 2023).
Reflita: Dado o nível de produção exigido hoje dos meios
industriais, para atender à crescente demanda e suprir o
mercado consumidor, você vê outra possibilidade para a indústria
que não seja utilizar a IA para automatizar os seus processos? Se
sim, qual?
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
56
1.3.5.3. Agronomia
A IA tem emergido como uma força catalisadora na transformação da
agronomia, redefinindo a forma como abordamos a produção agrícola e o
manejo de recursos naturais. Neste contexto, destacamos avanços e influências
específicas, abordando aplicações práticas da IA, tais como a otimização do
cultivo, o monitoramento agrícola, a previsão de colheitas, o manejo inteligente
de pragas e doenças, além do desenvolvimento de sistemas de irrigação
eficientes.
A otimização do cultivo é uma das contribuições mais marcantes da IA na
agronomia moderna (Rehagro, 2024). Sistemas baseados em Aprendizado de
Máquina analisam uma miríade de variáveis, incluindo condições climáticas, tipo
de solo e histórico de cultivo, para recomendar práticas agrícolas específicas.
Isso não apenas aumenta a eficiência na alocação de recursos, mas também
contribui para a maximização do rendimento das colheitas, promovendo uma
agricultura mais sustentável e rentável.
Figura 18: IA na agricultura.
Educação e Profissão.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://educacaoeprofissao.com.br/impacto-da-ia-na-agricultura-para-a-seguranca-alimentar-global/
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
57
O monitoramento agrícola é outra aplicação destacada da IA na
otimização de práticas agronômicas. Equipamentos equipados com sensores
de alta precisão coletam dados em tempo real sobre o estado das plantas, solo
e clima. Essas informações são processadas por algoritmos de IA, fornecendo
insights valiosos para os agricultores. A combinação de imagens de satélite,
drones e sensores terrestres, aliada à análise inteligente de dados, possibilita o
monitoramento preciso do desenvolvimento das culturas, identificação precoce
de problemas e ajustes rápidos nas práticas de manejo (Zanatta, 2023).
A previsão de colheitas é uma ferramenta estratégica aprimorada pela IA,
contribuindo para o planejamento eficiente da produção. Modelos preditivo
utilizam dados históricos, condições meteorológicas e variáveis ambientais
para antecipar o momento ideal da colheita (Orbia, 2024). Essa abordagem não
apenas reduz a incerteza para os agricultores, mas também permite uma
gestão mais eficiente da cadeia de suprimentos, minimizando desperdícios e
otimizando a distribuição de produtos agrícolas.
O manejo inteligente de pragas e doenças representa uma resposta
proativa aos desafios enfrentados na agricultura. A IA, por meio de algoritmos
de detecção, possibilita a identificação precoce de padrões associados a
infestações, isso permite a aplicação precisa de pesticidas e a implementação
de estratégias de controle direcionadas, minimizando o uso de produtos
químicos e reduzindo os impactos ambientais adversos (Zanatta, 2023).
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
58
A gestão eficiente da irrigação é vital em regiões agrícolas com escassez
de água. A IA, integrada a sistemas de irrigação automatizados, contribui para
a utilização otimizada desse recurso. Algoritmos de Aprendizado de Máquina,
analisam dados de sensores para determinar as necessidades hídricas
específicas de cada área do campo, permitindo uma distribuição precisa e
eficiente da água. Essa abordagem não apenas conserva recursos hídricos, mas
também aumenta a eficiência no uso da água na agricultura (Conectar Agro,
2022).
Em conclusão, a IA está redefinindo a agronomia, oferecendo soluções
inovadoras para os desafios enfrentados na produção agrícola. A otimização do
cultivo, o monitoramento agrícola, a previsão de colheitas, o manejo inteligente
de pragas e doenças, e a gestão eficienteda irrigação são apenas algumas das
áreas em que a IA exerce influência significativa. Essas aplicações não apenas
aumentam a eficiência da produção, mas também contribuem para a
construção de um modelo agrícola mais sustentável e adaptável aos desafios
contemporâneos.
Figura 19: Irrigação inteligente.
Fonte: Conectar Agro.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://blog.conectaragro.com.br/gestao-eficiente-de-irrigacao/
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
59
1.3.5.4. Educação
A integração da IA com a educação representa uma revolução pedagógica,
proporcionando uma série de estratégias inovadoras para aprimorar a
aprendizagem e oferecer benefícios significativos tanto para alunos quanto para
educadores (Huttenlocher et al., 2023). Uma aplicação notável é a personalização
do ensino, em que algoritmos de IA analisam o desempenho individual dos
alunos e adaptam os materiais de aprendizado de acordo com suas
necessidades específicas. Plataformas de aprendizado online já utilizam IA para
oferecer exercícios personalizados e feedback instantâneo, promovendo um
aprendizado mais eficaz.
Outra estratégia valiosa é a implementação de assistentes virtuais. Essas
ferramentas, como o ChatGPT Edu, podem responder a perguntas dos alunos
em tempo real, oferecendo suporte adicional e estimulando a curiosidade. Além
disso, sistemas de tutoria inteligente são capazes de identificar áreas de
dificuldade dos alunos e fornecer exercícios adicionais ou explicações detalhadas
para reforçar o entendimento.
Figura 20: IA na educação.
Fonte: Terra.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://www.terra.com.br/noticias/educacao/5-cuidados-necessarios-antes-de-usar-ia-na-educacao,de60f6899161bc6f4b3b4fbefd9ccd37a5yk0upp.html
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
60
Os benefícios do uso da IA na educação incluem a personalização do ensino
para atender às diferentes necessidades de aprendizagem, a automatização de
tarefas administrativas para liberar tempo dos educadores e a oferta de
recursos educacionais mais acessíveis e inclusivos. No entanto, é vital abordar
considerações éticas, como a privacidade dos alunos e a transparência nos
algoritmos, para garantir uma implementação responsável e ética da IA na
educação, segundo a redação Homework (Terra, 2023).
A Conferência Internacional sobre Inteligência Artificial e Educação
“Planejando a educação na era da IA: liderar o avanço”, realizada em 2019 na
China, com representantes de agências das Nações Unidas, instituições
acadêmicas, sociedade civil e o setor privado para debater a temática. O
documento final da conferência traz 10 recomendações de ações a serem
implementadas por governos e outras partes interessadas, em resposta às
oportunidades e desafios relacionados à IA na educação (Instituto Unibanco,
2024):
Figura 21: Ações recomendadas Conferência Internacional IA e Educação.
Fonte: Instituto Unibanco.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://observatoriodeeducacao.institutounibanco.org.br/em-debate/inteligencia-artificial-na-educacao
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
61
Figura 22: Ações recomendadas Conferência Internacional IA e Educação
Fonte: Instituto Unibanco.
Em suma, a IA não apenas aprimora a eficácia do processo de
aprendizagem, mas também abre novas possibilidades para uma educação
mais personalizada, flexível e eficiente.
Figura 23: IA para aprendizagem efetiva.
Fonte :Educação e Profissão.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://observatoriodeeducacao.institutounibanco.org.br/em-debate/inteligencia-artificial-na-educacao
https://educacaoeprofissao.com.br/inteligencia-artificial-revolucionando-a-educacao/
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
62
1.3.5.5. Segurança
A IA emerge como uma força transformadora no campo da segurança,
abrangendo desde a segurança pública até a proteção de dados e sistemas
críticos. Neste contexto amplo, a IA desempenha um papel vital na detecção
proativa de ameaças, na análise de padrões complexos e na adaptação dinâmica
para enfrentar os desafios cada vez mais sofisticados em segurança. Ao mesmo
tempo que oferece eficiência e agilidade, a implementação ética e responsável
da IA na segurança torna-se um imperativo para equilibrar a inovação
tecnológica com considerações éticas e de privacidade (Silva, 2023).
A aplicação da IA na segurança da informação representa uma linha de
defesa cada vez mais crucial em um cenário digital complexo e em constante
evolução. Os desafios contemporâneos em segurança cibernética demandam
abordagens avançadas, e a IA oferece uma série de ferramentas e estratégias
para fortalecer a proteção de dados e sistemas. Algoritmos de Aprendizado de
Máquina podem identificar padrões anômalos no tráfego de rede, detectando
atividades suspeitas e possíveis vulnerabilidades em tempo real, respondendo
rapidamente a potenciais ameaças de forma proativa, e não mais reativa como
nos sistemas anteriores de segurança da informação.
As soluções baseadas em IA, como os sistemas de detecção e resposta a
incidentes (IDR), têm a capacidade de aprender com comportamentos normais
e, assim, destacar atividades que desviam da norma, indicando possíveis
ataques. Além disso, algoritmos de reconhecimento de padrões são
empregados na identificação de malware, phishing e outras ameaças,
aumentando a eficácia dos programas antivírus tradicionais (Embratel, 2020).
Contudo, a implementação da IA na segurança da informação também
levanta preocupações éticas e de privacidade.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
63
A interpretação precisa dos resultados da IA e a mitigação de possíveis
vieses nos algoritmos são aspectos cruciais para garantir uma defesa sólida
sem comprometer a integridade e a privacidade dos dados (Kissinger et al.,
2023).
Em última análise, a IA na segurança da informação não apenas fortalece a
resiliência contra ameaças cibernéticas, mas também destaca a necessidade de
abordagens éticas e transparentes para garantir uma cibersegurança robusta e
equilibrada.
Figura 24: IA e segurança da informação.
Fonte:Mundo do Marketing.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://www.mundodomarketing.com.br/4-beneficios-da-inteligencia-artificial-para-a-seguranca-digital/
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
64
A utilização da IA na segurança pública tem desempenhado um papel
significativo na modernização e eficiência dos métodos de prevenção, resposta
e investigação. Um exemplo notável é o emprego de sistemas de vigilância
baseados em IA, que são capazes de analisar grandes volumes de dados de
câmeras de vigilância em tempo real. Esses sistemas podem identificar padrões
suspeitos, reconhecer comportamentos anômalos e alertar as autoridades para
potenciais ameaças, contribuindo para a prevenção de crimes.
Outra aplicação crucial está na análise de dados para prever atividades
criminosas. Algoritmos de Aprendizado de Máquina podem analisar padrões
históricos e atuais para antecipar áreas de risco e alocar recursos de maneira
mais estratégica. Essa capacidade preditiva permite uma resposta mais proativa
por parte das forças de segurança, contribuindo para a mitigação de incidentes.
Figura 25: IA e segurança pública.
Fonte: NatGeo Brasil.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://www.nationalgeographicbrasil.com/ciencia/2023/06/quem-foi-alan-turing-pioneiro-no-desenvolvimento-da-inteligencia-artificial-e-da-computacao-moderna
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
65
No contexto investigativo, a IA também se mostra valiosa na análise de
grandes conjuntos de dados, facilitando a identificação de padrões complexos e
relações entre elementos aparentemente não relacionados. Algoritmos de
reconhecimento facial, por exemplo, podem ajudar na identificação de
suspeitos, enquanto ferramentas de Processamento de Linguagem Natural
podem analisar grandes volumes de dados textuais para obter insights
relevantes.
Entretanto, é importante destacar que o uso da IA na segurança pública
levanta questões éticas e de privacidade. É necessário implementar
salvaguardas rigorosas para garantir o uso responsável da tecnologia,
protegendo os direitos individuais e evitando discriminações injustas (Silva,
2023).
Em resumo, a IA na segurança pública oferece um potencial significativo
para melhorar a eficiência das operações, prevenir crimes e fortalecer as
capacidades investigativas. No entanto, seu uso deve ser acompanhado de
estratégias transparentes e éticas para garantir que essas tecnologias
beneficiem a sociedade de maneira equitativa e responsável.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
66
1.3.5.6. Infraestrutura de cidades
inteligentes
As Smart Cities, ou cidades inteligentes, surgem como um paradigma
inovador na busca por soluções sustentáveis e eficientes para os desafios
urbanos contemporâneos. No cerne dessa transformação, a IA emerge como
uma força motriz, moldando de maneira significativa o panorama urbano e
redefinindo a interação entre os cidadãos e a infraestrutura urbana.
Nas cidades inteligentes existe um ecossistema tecnológico de sensores
conectados, redes de comunicação eficientes e coleta de dados em tempo real
criando uma malha digital que permeia todos os aspectos da cidade (Secti,
2019). De acordo com o Cities in Motion Index, do IESE Business School na
Espanha, 10 dimensões indicam o nível de inteligência de uma cidade:
governança, administração pública, planejamento urbano, tecnologia, o
meio-ambiente, conexões internacionais, coesão social, capital humano e a
economia.
Figura 26:Smart city.
Fonte:SECTI.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://www.secti.df.gov.br/entenda-o-que-e-uma-smart-city/
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
67
O papel da IA para que uma cidade inteligente seja viável e funcional
abrange vários aspectos (Secti, 2019), e sua influência é visível em setores
cruciais, como:
● Mobilidade urbana aprimorada: sistemas de transporte inteligentes,
impulsionados pela IA, vem revolucionando a mobilidade urbana.
Algoritmos de roteamento dinâmico consideram variáveis em tempo real,
como tráfego e condições meteorológicas, oferecendo alternativas
eficientes de deslocamento.
O uso da IA na mobilidade urbana tem sido evidenciado por uma série de
exemplos práticos que transformam significativamente a forma como as
pessoas se deslocam nas cidades (Estadão, 2023). Aplicativos de
compartilhamento de viagens incorporam IA para otimizar a alocação de
veículos, reduzindo o tempo de espera e promovendo a eficiência no uso de
recursos. Além disso, o desenvolvimento de veículos autônomos, que
empregam técnicas avançadas de Aprendizado de Máquina, promete
revolucionar a mobilidade urbana, proporcionando uma alternativa segura
e eficiente de transporte.
● Eficiência energética e sustentabilidade: a IA também se destaca na
gestão eficiente de energia. Sistemas de iluminação pública adaptativa,
controlados por algoritmos inteligentes, ajustam-se automaticamente às
condições ambientais, reduzindo o desperdício de energia. A IA possibilita
também a coleta e análise de dados históricos, padrões de consumo e
fatores externos, como condições climáticas, para prever a demanda de
energia elétrica e auxiliar na tomada de decisões estratégicas, otimizando a
geração e a distribuição de energia (Romagnole, 2023).
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
68
Podemos citar ainda algumas ações que estão se tornando comuns, com os
“gêmeos digitais” (digital twins). Essa é uma tecnologia que combina IA e
realidade aumentada para criar uma cópia virtual de uma planta real, e assim,
monitorar em tempo real, dados como temperatura, vibração e consumo de
energia de um sistema ou instalação (Pacete, 2022). De acordo com a Gartner,
em 2021, metade das maiores empresas do mundo já utilizavam gêmeos
digitais, e a estimativa para 2023 das receitas geradas a partir desta tecnologia
foi de US$ 13 bilhões.
Assim como as demais aplicações envolvendo IA, em cidades inteligentes
também existem desafios éticos e questões de privacidade. A transparência na
coleta e uso de dados, bem como a consideração dos impactos sociais, são
cruciais para garantir que a inovação tecnológica beneficie toda a comunidade.
Figura 27: Gêmeos digitais.
Fonte: Forbes.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.com
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://www.redesdesaude.com.br/aprendizado-de-maquina-machine-learning/
https://forbes.com.br/forbes-tech/2022/09/digital-twin-como-funciona-a-tecnologia-que-espelha-o-mundo-real/
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
69
1.3.6. Aprendizado de Máquina
Como a Inteligência Humana, a Inteligência Artificial também parte de um
ponto para outro mais avançado por meio do aprendizado. Este aprendizado
pode ser mais ou menos aprofundado, como ocorre também com os
conhecimentos que nós adquirimos (Russel e Norvig, 2003).
Desta forma, o aprendizado artificial ou Aprendizado de Máquina não é
somente um subgrupo da IA, mas também toda a estrutura que permite, por
meio de algoritmos, que uma IA ganhe mais autonomia e aperfeiçoamento em
suas tarefas, fazendo com que um sistema fique mais inteligente (Kissinger et
al., 2023).
Figura 28: Evolução da IA.
Fonte: Redes de Saúde.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://www.redesdesaude.com.br/aprendizado-de-maquina-machine-learning/
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
70
O ML se concentra no desenvolvimento de algoritmos e modelos
estatísticos que permitem aos computadores executarem tarefas sem
programação explícita. Por meio da análise de dados e padrões (treinamento),
os sistemas de aprendizagem automática melhoram o seu desempenho ao
longo do tempo, incrementando a sua capacidade de fazer previsões ou tomar
decisões (IBM, 2023).
Ao invés de implementar rotinas de software, como na programação
tradicional, com um conjunto específico de regras e instruções que quando
atendidas realizam uma ação para completar uma tarefa em particular, em ML a
máquina é “treinada” utilizando uma grande quantidade de dados e algoritmos
que lhe proporcionam a habilidade de aprender como executar a tarefa,
tomando decisões em situações que não são conhecidas.
O processo do Machine Learning envolve as seguintes etapas:
1. Coleção de dados: os dados são coletados de várias fontes. Podem ser
dados já existentes, que são aqueles que já foram coletados para outros
propósitos, ou dados gerados especificamente para o treinamento do
modelo.
2. Preparação de dados: os dados são preparados para o treinamento do
modelo. O preparo dos dados deve envolver, se necessário, as etapas de
limpeza, com a remoção de dados incorretos ou incompletos, e
transformação, com a conversão dos dados para um formato que o modelo
possa entender.
3. Escolha do algoritmo: Um algoritmo de Aprendizado de Máquina é
selecionado para a tarefa específica que o modelo deve realizar. Existem
muitos disponíveis, que serão apresentados nas próximas sessões, cada um
com suas próprias vantagens e desvantagens.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
71
4. Treinamento do modelo: O modelo é treinado usando os dados de
treinamento. Este processo pode ser dividido nas seguintes etapas:
● Inicialização: Os parâmetros do modelo são inicializados com
valores aleatórios.
● Iteração: O modelo é apresentado a um conjunto de dados de
treinamento e os parâmetros do modelo são ajustados para
minimizar o erro de previsão.
● Parada: O processo de treinamento é interrompido quando o erro
de previsão é aceitável.
5. Avaliação do modelo: O modelo é avaliado usando um conjunto de dados
de teste que deve ser diferente do conjunto de dados de treinamento, para
garantir que o modelo não esteja apenas memorizando estes dados.
6. Aprimoramento do modelo: Se o desempenho do modelo não for
satisfatório, o modelo pode ser aprimorado usando as seguintes técnicas:
● Alteração do algoritmo de Aprendizado de Máquina.
● Mudança nos parâmetros do modelo.
● Aumento do tamanho do conjunto de dados de treinamento.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
72
O infográfico abaixo resume as etapas do Aprendizado de Máquina,
condensando em três blocos principais:
Os modelos podem ser aplicados em uma variedade de domínios, desde
reconhecimento de imagem e voz até diagnóstico médico, previsão financeira
e recomendações personalizadas em plataformas online. A capacidade de
aprender com dados e melhorar o desempenho ao longo do tempo faz do ML
uma ferramenta poderosa com aplicações crescentes em diversas indústrias
(Kissinger et al., 2023).
Esse aprendizado pode ocorrer de diversas formas, como Aprendizado
Supervisionado (usando conjuntos de dados rotulados), Aprendizado não
Supervisionado (encontrando padrões em conjuntos de dados não rotulados)
e Aprendizado por Reforço (aprendendo com tentativa e erro).
Figura 29: Funcionamento do Machine Learning.
Fonte: Facti.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
73
1.3.6.1. Algoritmos para Aprendizado de
máquina
A utilização eficaz de Machine Learning (ML) envolve a compreensão dos
tipos de sistemas categorizados por métodos de treinamento, formas de
aprendizado e modos de funcionamento. Estas categorias podem ser
combinadas conforme a necessidade específica. São elas (Microsoft, 2022):
1. Supervisionado: Quando tentamos prever uma variável dependente a partir
de uma lista de variáveis independentes.
2. Não Supervisionado: Quando não existem resultados pré-definidos para o
modelo utilizar como referência para aprender.
3. Por reforço: Quando precisamos determinar qual é a melhor ação a ser
tomada, dependendo das circunstâncias na qual essa ação será executada
Vamos nos aprofundar nestes tipos de aprendizado nas próximas seções
deste capítulo.
Figura 30: Tipos de Aprendizado de Máquina.
Fonte: Medium
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://hlima.me/o-que-%C3%A9-intelig%C3%AAncia-artificial-e-aprendizado-de-m%C3%A1quina-92c0903ee7ea
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
1.3.6.1.1. Aprendizado Supervisionado
O Aprendizado Supervisionado possui alguns modelos que propõem
técnicas diferentes para tipos de análises de dados diferentes, vejamos estes
modelos:
1. Regressão: O modelo por regressão, no contexto doAprendizado de
Máquina Supervisionado, é fundamental para resolver problemas em que a
tarefa envolve a predição de valores numéricos. Visa estimar uma variável
contínua com base nas relações identificadas nos dados de treinamento.
Esses modelos são amplamente utilizados em situações como previsão de
vendas, análise financeira e qualquer contexto em que a resposta desejada
seja um número real. A flexibilidade e aplicabilidade dos modelos de
regressão no Aprendizado de Máquina supervisionado destacam sua
importância na resolução de uma ampla gama de problemas do mundo real
(Microsoft, 2022).
Este modelo segue a seguinte função como parâmetro:
Exemplo de aplicação: Se queremos prever a quantidade de bicicletas
alugadas num dia futuro (Y), precisaríamos alimentar a regressão com os
seguintes dados de entrada para análise (X): quantidade de bicicletas alugadas
nos dias anteriores, temperatura média dos dias anteriores, dias da semana.
74
Figura 31: Função de regressão .
Fonte: Microsoft AI900.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://www.redesdesaude.com.br/aprendizado-de-maquina-machine-learning/
https://learn.microsoft.com/pt-br/training/paths/get-started-with-artificial-intelligence-on-azure/
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
75
2. Classificação: o modelo por classificação é uma abordagem essencial para
resolver problemas em que o objetivo é atribuir uma classe ou rótulo a
instâncias de dados com base em padrões previamente identificados. Nesse
método, o modelo é treinado usando um conjunto de dados rotulado, onde
as entradas estão associadas a suas respectivas classes conhecidas.
Durante o treinamento, o algoritmo busca aprender a relação entre as
características das instâncias e suas classes correspondentes. Após o
treinamento, o modelo torna-se capaz de generalizar para novos dados não
rotulados, classificando-os com base no conhecimento adquirido durante a
fase de treinamento. A classificação é uma técnica poderosa com amplas
aplicações, desde diagnósticos médicos até reconhecimento de padrões em
grandes conjuntos de dados, destacando-se como uma ferramenta valiosa
no arsenal do Aprendizado de Máquina supervisionado (Microsoft, 2022).
Exemplo: prever as chances de um paciente ter diabetes (Y) por meio das
entradas de dados (X): Histórico de doenças do paciente, quais tiveram
diabetes.
3. Matriz de confusão: é uma ferramenta crucial no Aprendizado de Máquina
supervisionado, fornecendo uma visão abrangente do desempenho do
modelo de classificação. Essa matriz organiza os resultados da classificação
em quatro categorias: verdadeiro positivo, verdadeiro negativo, falso
positivo e falso negativo.
A diagonal principal da matriz representa as previsões corretas, enquanto
as células fora dessa diagonal indicam erros de classificação. A matriz de
confusão é particularmente valiosa para avaliar a sensibilidade e a
especificidade do modelo, além de calcular métricas como precisão, recall e
F1-score.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
76
Ao analisar a distribuição dos resultados, os praticantes de Aprendizado de
Máquina podem ajustar e otimizar seus modelos para alcançar um
desempenho mais preciso e confiável. A interpretação cuidadosa da matriz de
confusão é essencial para avaliar a eficácia de modelos de classificação e
orientar refinamentos necessários durante o processo de desenvolvimento
(Microsoft, 2022).
Abaixo estão os significados das métricas utilizadas neste modelo:
● Acurácia: indica uma performance geral do modelo. Dentre todas as
classificações, quantas o modelo classificou corretamente (% diagonal);
● Precisão: dentre todas as classificações de classe Positivo que o modelo
fez, quantas estão corretas (% linha de cima);
● Recall/reinvocação/sensibilidade: dentre todas as situações de classe
Positivo como valor esperado, quantas estão corretas(% primeira coluna);
● F1-Score: média harmônica entre precisão e recall.
Figura 32: Matriz de confusão.
Fonte: Medium
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://www.redesdesaude.com.br/aprendizado-de-maquina-machine-learning/
https://medium.com/@mateuspdua/machine-learning-m%C3%A9tricas-de-avalia%C3%A7%C3%A3o-acur%C3%A1cia-precis%C3%A3o-e-recall-d44c72307959
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
77
1.3.6.1.2. Aprendizado não Supervisionado
O algoritmo é desafiado a aprender padrões sem a orientação explícita dos
dados. Por exemplo, robôs que aprendem a limpar a casa reconhecendo
padrões diários de poeira.
Este paradigma é amplamente utilizado em tarefas como clustering, em que
o algoritmo agrupa automaticamente instâncias de dados sem conhecer
antecipadamente suas categorias. Ele é essencial para explorar padrões
intrínsecos em grandes conjuntos de dados, proporcionando insights valiosos e
facilitando a compreensão de estruturas complexas sem a necessidade de
rótulos explícitos (Souza, 2021).
Figura 33: ML Aprendizado não Supervisionado.
Fonte: Learning Data.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://www.redesdesaude.com.br/aprendizado-de-maquina-machine-learning/
https://www.learningdata.dev/post/fundamentos-basicos-do-machine-learning-que-voce-precisa-saber#viewer-d9in1
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
78
1.3.6.1.3. Aprendizado Semi Supervisionado
O Aprendizado de Máquina Semi Supervisionado se situa entre os
paradigmas supervisionado e não supervisionado, incorporando características
de ambos. Nesse cenário, o modelo é treinado em um conjunto de dados que
contém tanto dados rotulados quanto não rotulados. Enquanto utiliza os dados
rotulados para aprender padrões e fazer previsões, o modelo também aproveita
as informações dos dados não rotulados para aprimorar sua generalização e
capacidade de lidar com novos exemplos (Russel e Norvig, 2022).
Esse enfoque é particularmente útil em cenários em que a rotulação
completa dos dados é custosa ou impraticável. O Aprendizado de Máquina semi
supervisionado oferece uma solução equilibrada, permitindo que modelos se
beneficiem da orientação fornecida pelos dados rotulados e, simultaneamente,
explorem a riqueza dos dados não rotulados para uma aprendizagem mais
robusta e abrangente.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
79
1.3.6.1.4. Aprendizado por Reforço
O Aprendizado de Máquina por Reforço é um paradigma onde um agente
aprende a realizar ações em um ambiente para maximizar uma recompensa
cumulativa ao longo do tempo. Este método é inspirado em processos de
aprendizado em seres vivos, em que o comportamento é moldado por meio de
experiências e feedback positivo ou negativo.
Um exemplo prático notável é o treinamento de agentes de Inteligência
Artificial para jogos. O agente, muitas vezes representado por uma rede neural,
interage com o ambiente do jogo, fazendo escolhas de ações com o objetivo de
maximizar uma pontuação ou recompensa. Conforme o agente recebe feedback
sobre suas ações, ele ajusta suas estratégias para melhorar o desempenho ao
longo do tempo.
Figura 34: Exemplo de Aprendizagem de Máquina por Reforço.
Fonte: Redes de saúde.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://www.redesdesaude.com.br/aprendizado-de-maquina-machine-learning/
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
80
O Aprendizado de Máquina por Reforço também é aplicado em setores
como robótica, automação industrial e até mesmo em otimizações de processos
em empresas. Essa abordagem dinâmica e adaptativa tem demonstrado grande
eficácia em lidar com ambientes complexos e incertos, sendo este o cenário
encontrado por aplicações críticas, como a operação de carros autônomos.
Encerramos assim o entendimento necessário sobre algoritmos de IA para,
na próxima seção, discutir sobre outro nível de Aprendizado de Máquina: as
redes neurais e o Deep Learning.
Figura 35: Exemplo de aprendizado por reforço em carro autônomo.
Fonte: LAMFO
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://lamfo-unb.github.io/2017/07/27/tres-tipos-am/
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
81
1.3.7. Redes neurais e Deep Learning
Para iniciarmos este conteúdo, precisamos rapidamente trazer o contexto
histórico a partir do cenário resumido por Russel e Norvig (2022).
Em 1943, Warren McCulloch e Walter Pitts, neurocientistas estadunidense
publicaram o artigo "Um Cálculo Lógico das Ideias Imanentes na Atividade
Nervosa”, propondo um modelo matemático para os neurônios artificiais,
entrando para a história como neurônio de McCulloch-Pitts.
Em seguida, já em 1949, Donald Olding Hebb, psicólogo canadense, publica
sua obra "A Organização do Comportamento: Uma Teoria Neuropsicológica”, em
que propõe uma teoria da aprendizagem que veio a se chamar regra (teoria) de
Hebb.
Já comentamos anteriormente acerca do nascimento da primeira rede
neural ainda no final da década de 1950 por Frank Rosenblatt, cientista da
computação estadunidense na Universidade de Cornell.
Rosenblatt criou uma rede de múltiplos neurônios dispostos em camadas,
sendo eles discriminadores lineares. Essa rede recebeu o nome de perceptrons.
Em seguida, com a publicação do livro Perceptrons, Minsky e Papert
concluíram que o Perceptron, proposto por Rosenblatt, eram limitados a
resolver apenas problemas linearmente separáveis, sem a utilização de redes
neurais com mais de uma camada. Esta conclusão paralisou por algum tempo os
próximos avanços na área das redes neurais.
Foi a partir da década de 1970, que os campos de Inteligência Artificial junto
com o processamento digital de imagens e o Aprendizado de Máquina
cresceram e se desenvolveram (Szeliski, 2022).
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
82
O trabalho de John Hopfield, físico, biólogo e neurologista estadunidense,
em 1982 foi considerado um marco para a história das redes neurais ao
introduzir o modelo de rede neural recorrente capaz de armazenar e recuperar
memórias, vindo a ser batizado pelo nome de seu descobridor (rede neural
Hopfield).
Em 1986, Rumelhart, Hinton e Willians demonstraram a capacidade de
treinar eficientemente as redes contendo camadas intermediárias, implicando
no modelo atual de redes neurais artificiais, a chamada Perceptron Multi
Camadas, introduzindo um método poderoso conhecido por Backpropagation.
Antes de definirmos o que é uma rede neural, explicaremos sobre seus
neurônios artificiais e a analogia ao sistema nervoso de organismos vivos. Um
neurônio artificial é inspirado no neurônio biológico, uma célula nervosa
responsável pela transmissão dos impulsos nervosos, é uma unidade básica do
sistema nervoso central e sua comunicação se dá por meio das sinapses.
Figura 36: Representação artística de um neurônio biológico com suas sinapses (ligações).
Fonte: imagem gerada por IA.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
83
O neurônio biológico é composto de três partes, soma (seu corpo celular),
seguido dos dendritos, responsável pela entradas nervosas e por fim, dos
axônios, responsáveis pela saída dos sinais do neurônio.
O cérebro humano tem em média 1011 neurônios, como cada neurônio
forma entre 1 mil e 10 mil sinapses, estima-se 1014 sinapses em nosso cérebro,
formando uma rede completissima!
Imitando o sistema biológico, o neurônio artificial, a unidade de
processamento de uma rede neural, possui uma capacidade de operação local a
partir de suas entradas. Seu comportamento inteligente se deve a interação
entre essas unidade de processamento.
Assim como o nosso sistema nervoso, uma rede neural possui uma série de
camadas. Temos as camadas de entrada, onde os padrões são apresentados à
rede neural. Em seguida, vem as camadas internas conhecidas como camadas
intermediárias (ou escondidas, em inglês, hidden layers). Por fim, temos a
camada de saída, onde apresenta-se o resultado do processamento executado
pela rede neural.
Figura 37: Imagem representando uma rede neural multi camadas.
Fonte: Wikimedia Commons.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://upload.wikimedia.org/wikipedia/commons/thumb/0/00/Multi-Layer_Neural_Network-Vector-Blank.svg/2560px-Multi-Layer_Neural_Network-Vector-Blank.svg.png
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
84
Assim, pode-se definir redes neurais como modelos computacionais
inspirados na estrutura e funcionamento do cérebro humano. Consistem em
nós interconectados, ou neurôniosartificiais, organizados em camadas. As
redes neurais são usadas no Aprendizado de Máquina para reconhecer
padrões, tomar decisões e melhorar a precisão por meio de treinamento em
grandes conjuntos de dados (Pregowska e Osial, 2022).
As redes neurais permitem a implementação de um nível específico de IA,
conhecido como Deep Learning.
Figura 38: Rede Neural Artificial.
Fonte: UNESP.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://parajovens.unesp.br/autoria/agnieszka-pregowska/
https://parajovens.unesp.br/o-que-e-uma-rede-social-e-para-que-serve/
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
85
Deep Learning é um subconjunto de Aprendizado de Máquina que envolve
redes neurais com múltiplas camadas (redes neurais profundas). É excelente no
processamento e análise de grandes quantidades de dados, permitindo
capacidade de aprendizagem e tomada de decisão mais complexas e
sofisticadas.
É uma abordagem revolucionária que visa imitar o funcionamento do
cérebro humano. Diferentemente do Aprendizado de Máquina convencional, o
Deep Learning permite que modelos aprendam automaticamente
representações hierárquicas complexas e extraiam informações específicas a
partir de dados brutos (Oracle, 2024).
Veja abaixo no infográfico a comparação entre os níveis de Aprendizado de
Máquina:
Figura 39: Níveis de Aprendizado de Máquina.
Fonte: Oficina de valor.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://oficinadevalor.com.br/ng/i-a-machine-learning-e-deep-learning-replicar-memorizar-e-aprender/
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
86
Os modelos de Aprendizado Profundo absorvem informações de várias
fontes de dados e analisam esses dados em tempo real, sem a necessidade de
intervenção humana. Para isso, são necessárias unidades de processamento
gráfico (GPUs) otimizadas para modelos de treinamento, ideais para processar
vários cálculos simultaneamente (Oracle, 2024).
O Deep Learning, ao se aprofundar nas complexidades das redes neurais,
tem transformado a paisagem da IA. Sua capacidade de aprender
automaticamente a partir de dados brutos posiciona-o como uma ferramenta
poderosa em diversas aplicações, impulsionando muitas tecnologias de IA que
podem melhorar a automação e as tarefas analíticas (Neurotech, 2019).
Figura 40: IA vs. ML vs. Deep Learning.
Fonte: Neurotech.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://www.oracle.com/br/artificial-intelligence/
https://www.neurotech.com.br/blog/deep-learning-moda-realidade/
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
87
Somente citando usos mais corriqueiros e conhecidos, as técnicas de Deep
Learning são aplicadas para personalizar a navegação na internet e uso de
smartphones, para gerar legendas em vídeos do YouTube, executar o
reconhecimento de fala em telefones e alto-falantes inteligentes, fornecer
reconhecimento facial para fotografias e habilitar carros autônomos.
Por fim, temos falado muito que para o Aprendizado de Máquina é
essencial o uso de dados, que necessariamente precisam ser captados e
trabalhados de alguma forma para serem utilizados pelos sistemas de IA.
Então, vamos tratar na próxima seção sobre este assunto, aprofundando
nossos conhecimento em “Mineração de dados”.
1.3.8. Mineração de dados
Mineração de dados (ou Data Mining) é um conjunto de técnicas que se
baseia em vários campos que se sobrepõem, incluindo análise estatística,
Machine Learning (ML) e matemática. Ela é utilizada em análises que
necessitam processar e explorar grandes conjuntos de dados (AWS, 2023). Com
ferramentas e métodos de mineração de dados, as organizações podem
descobrir padrões e relacionamentos ocultos em seus dados, transformando
dados dados brutos em conhecimento prático. As empresas usam esse
conhecimento para resolver problemas, analisar o impacto futuro das decisões
de negócios e aumentar suas margens de lucro.
Portanto, podemos resumir que a mineração de dados é um processo
complexo e estruturado que visa descobrir padrões, relações e informações
úteis em grandes conjuntos de dados. Por ser complexo, esse processo é
comumente dividido em fases distintas, cada uma desempenhando um papel
crucial na extração de conhecimento.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://blogs.oracle.com/oracle-france/deep-learning-definition
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
88
Vamos explorar as fases propostas pelas melhores práticas ditadas pela
metodologia CRISP-DM (Cross Industry Standard Process for Data Mining) para
organização de projetos de mineração de dados (Chapman, 2000) :
1. Compreensão do negócio: a primeira fase envolve entender
completamente os objetivos e requisitos do negócio. Nesta etapa, os
especialistas em mineração de dados colaboram com os envolvidos em
determinada ação empresarial ou projeto para definir claramente os
problemas a serem resolvidos e os resultados desejados. Essa compreensão
é fundamental para orientar o processo de mineração de dados em direção
aos objetivos.
2. Compreensão dos dados: antes de iniciar a análise, é essencial explorar e
compreender os dados disponíveis. Isso inclui a identificação de fontes de
dados, a avaliação da qualidade dos dados, e a compreensão das
características essenciais, como distribuição, variabilidade e relevância. Uma
análise aprofundada dos dados estabelece as bases para as etapas
subsequentes.
3. Pré-processamento de dados: nesta fase, os dados brutos são preparados
para a análise. Isso inclui a limpeza de dados inconsistentes, a normalização
de escalas e a transformação de variáveis quando necessário. O
pré-processamento visa garantir que os dados estejam prontos para serem
alimentados nos algoritmos de mineração, melhorando a qualidade dos
resultados.
4. Modelagem: a fase de modelagem é onde os algoritmos de mineração de
dados são aplicados aos dados preparados. Diferentes técnicas, como
árvores de decisão, redes neurais e algoritmos de clustering, são utilizadas
para identificar padrões e extrair informações valiosas. Durante esta etapa,
os parâmetros dos modelos são ajustados para otimizar o desempenho.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
89
5. Avaliação: a avaliação dos modelos gerados é uma fase crítica paragarantir a eficácia e a relevância dos resultados. Métricas como precisão,
recall e F1-score são frequentemente utilizadas para medir o desempenho
do modelo em relação aos objetivos estabelecidos. Essa avaliação permite
ajustes adicionais e refinamentos, se necessário.
6. Implementação e interpretação: a última fase envolve a implementação
dos resultados na prática. Os insights extraídos são traduzidos em ações ou
estratégias de negócios. Além disso, é crucial interpretar os resultados de
maneira compreensível para os não especialistas, facilitando a tomada de
decisões informadas.
Em conjunto, essas seis fases formam um ciclo contínuo de mineração de
dados, onde a retroalimentação constante e a adaptação são essenciais para
garantir a eficácia e a relevância contínuas do processo, conforme ilustra a
figura abaixo:
Figura 41: Etapas de Extração, Processamento e Carregamento de dados.
Fonte: adaptado de Fayyad et al. (1996).
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
90
Neste momento, retorne ao Google Sala de Aula e, na aba
"Atividades", procure a seção intitulada "Etapa Conceitualizar".
Nessa área você encontrará uma série de links com materiais
que foram criteriosamente escolhidos e disponibilizados. Trata-se de
recursos que têm por objetivo apresentar informações adicionais e
insights, permitindo que você amplie e enriqueça o seu
conhecimento acerca dos temas discutidos neste capítulo.
Este momento final do capítulo deve lhe proporcionar reflexões
críticas a respeito do conteúdo abordado, ajudando na
compreensão e fixação do conteúdo.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
91
1.4. Consolidar
1.4.1. Consolidando o conhecimento
Após nos aprofundarmos nos conceitos mais importantes da IA, conhecer
aplicações e discutir métodos de Aprendizado de Máquina, finalizamos este
capítulo nesta seção, que tem a função de te ajudar a consolidar sua visão
sobre esses assuntos. Primeiro, vamos a um exercício de autoconhecimento,
apresentado a seguir, e por último você poderá retomar o estudo de caso:
● Pense em IA e tudo o que viu neste capítulo. Agora, analise bem cada uma
das três figuras abaixo, uma por vez, e reflita: qual foi a sua primeira
percepção ao olhar a imagem? O que ela te lembra? Se fosse discutir algum
assunto sobre a imagem, o que seria? Na próxima página você poderá
comparar as suas percepções com a do autor.
Figura 42: Exercício Consolidar.
Fonte: IT Forum.
1
Figura 43: Exercício Consolidar.
Fonte: UOL.
2
Figura 44: Exercício Consolidar.
Fonte: Fast Company Brasil.
3
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://itforum.com.br/noticias/7-carreiras-ia-generativa-robert-half/
https://ne10.uol.com.br/mundobit/2019/07/22/fusao-homem-maquina-continua-sendo-uma-fantasia/index.html
https://fastcompanybrasil.com/tech/inteligencia-artificial/cientistas-usam-ia-generativa-na-busca-por-tratamentos-para-doencas-incuraveis/
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
92
● Ponto de vista do autor sobre as imagens:
Na figura 1, a ideia é ilustrar um ponto que discutimos durante o capítulo,
sobre a influência da IA no mundo do trabalho e profissões, especialmente no
que diz respeito ao nosso posicionamento frente às novas tecnologias,
enxergando-as como oportunidade de novas colocações, de melhorias no modo
de realizar nosso trabalho e otimização nos meios de produção. Temê-la não é
mais uma opção, já que a IA, aparentemente, veio para ficar e permanecer. O
que devemos é ter o cuidado ético para fazer bom uso dela, inclusive no mundo
do trabalho.
A figura 2 trata de algo que parecia muito mais distante, e fora de qualquer
discussão envolvendo a realidade: a fusão homem-máquina. Entretanto, cada
vez mais verificamos o surgimento de implantes de chips subcutâneos, órgãos
e membros biônicos entre outras tecnologias inteligentes incorporadas ao
corpo. Tudo isso nos leva a crer que, continuando nessa crescente, veremos
novas possibilidades nos próximos anos e décadas, e descobriremos que a ideia
de uma integração total entre a Inteligência Humana com a Artificial não é algo
restrito aos filmes de ficção como achávamos outrora.
Por fim, na figura 3 reside uma das grandes esperanças em relação ao uso
da IA: a descoberta da cura para doenças hoje tidas como incuráveis. Espera-se,
para os próximos anos, que a IA acelere pesquisas que trarão avanços nesse
sentido, e, quem sabe, poderemos deixar de ver pessoas morrendo de
enfermidades que atualmente não possuem tratamento nem vacinas.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
1.4.2. Solução final do estudo de caso
Você se lembra que o cenário do estudo de caso simulava um convite para
que você integrasse a equipe da Facti que iria produzir um material didático de
um curso da área de TI?
Se não se recorda, volte à "Etapa Inspirar" para rever o problema
trabalhado.
Você deveria desenvolver um texto que convencesse aos leitores de que a
IA, uma vez aplicada de forma consciente e responsável, produz mais
benefícios do que malefícios, em resposta ao seguinte questionamento:
“Inteligência Artificial - devemos temê-la ou abraçá-la?”.
93
Inicialmente, releia com atenção o cenário do estudo de caso da
"Etapa Inspirar" e as suas anotações e conclusões iniciais. Na
sequência, você deverá promover o aprimoramento da solução
anteriormente apresentada usando os conhecimentos que obteve
ao longo do capítulo e do conteúdo adicional.
Lembre-se de que este aprimoramento não será objeto de
correção ou avaliação: trata-se de uma atividade individual que
deverá lhe ajudar a refletir sobre os conceitos que foram estudados
e a testar novos cenários e hipóteses, validando os seus resultados
práticos.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
94
O ponto de partida é revisitar as anotações de suas ideias iniciais que
registrou na "Etapa Inspirar". Em seguida, verifique possíveis aprimoramentos
no seu texto mediante tudo o que aprendeu neste capítulo.
Arquive o refinamento do estudo de caso no formulário disponível
no Google Sala de Aula, na aba “Etapa Consolidar”.
D
oc
um
en
to
a
ss
in
ado
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
95
1.5. Avaliar
Para concluir este capítulo, você deverá realizar a “Etapa Avaliar”, que
consiste no preenchimento do Questionário de Avaliação disponível no Google
Sala de Aula e que tem como objetivo permitir que você acompanhe
individualmente a evolução do seu aprendizado.
Não será atribuída nota para a atividade, mas a sua entrega é obrigatória,
pois, acima de tudo, servirá como insumo para uma análise pessoal e também
para a realização de autocrítica a respeito dos pontos compreendidos e daqueles
que exigem maior dedicação.
O formulário salvará as respostas de forma automática e, por isso, pode ser
iniciado em um momento e finalizado posteriormente. Ele também será
disponibilizado a você, para que faça consultas futuras. Além dos materiais
didáticos fornecidos, você poderá usar quaisquer outros recursos e referências.
Todavia, atente para o fato de que poderá respondê-lo somente uma vez.
O registro e envio das respostas é individual e deve ser realizado dentro do
prazo estipulado para a realização do curso.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
96
Referências
ABB. Robôs colaborativos já são realidade na Indústria 4.0. ABB Press release,
2021. Disponível em: https://new.abb.com/news/pt-br/detail/74647/robos-
colaborativos-ja-sao-realidade-na-industria-40. Acesso em: 23 janeiro 2024.
AWS. O que é computação quântica? AWS, 2023. Disponível em:
https://aws.amazon.com/pt/what-is/quantum-computing/. Acesso em: 22 janeiro
2024.
AWS. O que é mineração de dados? AWS, 2023. Disponível em:
https://aws.amazon.com/pt/what-is/data-mining/. Acesso em: 22 janeiro 2024.
CONECTARAGRO. Gestão eficiente de irrigação: produtividade e
sustentabilidade nas áreas rurais. ConectarAGRO, 2022. Disponível em:
https://blog.conectaragro.com.br/gestao-eficiente-de-irrigacao/. Acesso em: 22
janeiro 2024.
CRISP-DM — Organizando seu projeto de mineração de dados. Medium,
2023. Disponível em: https://medium.com/@ia.bb/crisp-dm-organizando-seu-
projeto-de-minera%C3%A7%C3%A3o-de-dados-fdb0399cbd9b. Acesso em: 22
janeiro 2024.
DVORSKY, G. Too smart for our own good: How artificial superintelligence
could lead to humanity’s demise. Genetic Literacy Project, 2021. Disponível em:
https://geneticliteracyproject.org/2021/06/16/too-smart-for-our-own-good-
how-artificial-superintelligence-could-lead-to-humanitys-demise/. Acesso em: 18
janeiro 2024.
EMBRATEL. Qual o impacto da Inteligência Artificial na segurança dos
dados? Redação Embratel, 2020. Disponível em: https://proximonivel.embratel.
com.br/qual-o-impacto-da-inteligencia-artificial-na-seguranca-dos-dados/.
Acesso em: 22 janeiro 2024.
ESTADÃO. Como a inteligência artificial pode afetar a mobilidade urbana.
Redação Mobilidade, 2023. Disponível em: https://mobilidade.estadao.com.br
/inovacao/como-a-inteligencia-artificial-pode-afetar-a-mobilidade-urbana/#:~:tex
t=Por%20fim%2C%20os%20ve%C3%ADculos%20aut%C3%B4nomos,como%20a%
20Tesla%2C%20por%20exemplo. Acesso em: 20 janeiro 2024.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://new.abb.com/news/pt-br/detail/74647/robos-colaborativos-ja-sao-realidade-na-industria-40
https://new.abb.com/news/pt-br/detail/74647/robos-colaborativos-ja-sao-realidade-na-industria-40
https://aws.amazon.com/pt/what-is/quantum-computing/
https://aws.amazon.com/pt/what-is/data-mining/
https://blog.conectaragro.com.br/gestao-eficiente-de-irrigacao/
https://medium.com/@ia.bb/crisp-dm-organizando-seu-projeto-de-minera%C3%A7%C3%A3o-de-dados-fdb0399cbd9b
https://medium.com/@ia.bb/crisp-dm-organizando-seu-projeto-de-minera%C3%A7%C3%A3o-de-dados-fdb0399cbd9b
https://geneticliteracyproject.org/2021/06/16/too-smart-for-our-own-good-how-artificial-superintelligence-could-lead-to-humanitys-demise/
https://geneticliteracyproject.org/2021/06/16/too-smart-for-our-own-good-how-artificial-superintelligence-could-lead-to-humanitys-demise/
https://proximonivel.embratel.com.br/qual-o-impacto-da-inteligencia-artificial-na-seguranca-dos-dados/
https://proximonivel.embratel.com.br/qual-o-impacto-da-inteligencia-artificial-na-seguranca-dos-dados/
https://mobilidade.estadao.com.br/inovacao/como-a-inteligencia-artificial-pode-afetar-a-mobilidade-urbana/#:~:text=Por%20fim%2C%20os%20ve%C3%ADculos%20aut%C3%B4nomos,como%20a%20Tesla%2C%20por%20exemplo
https://mobilidade.estadao.com.br/inovacao/como-a-inteligencia-artificial-pode-afetar-a-mobilidade-urbana/#:~:text=Por%20fim%2C%20os%20ve%C3%ADculos%20aut%C3%B4nomos,como%20a%20Tesla%2C%20por%20exemplo
https://mobilidade.estadao.com.br/inovacao/como-a-inteligencia-artificial-pode-afetar-a-mobilidade-urbana/#:~:text=Por%20fim%2C%20os%20ve%C3%ADculos%20aut%C3%B4nomos,como%20a%20Tesla%2C%20por%20exemplo
https://mobilidade.estadao.com.br/inovacao/como-a-inteligencia-artificial-pode-afetar-a-mobilidade-urbana/#:~:text=Por%20fim%2C%20os%20ve%C3%ADculos%20aut%C3%B4nomos,como%20a%20Tesla%2C%20por%20exemplo
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
97
FAYYAD, U.M.; PIATETSKY-SHAPIRO, G.; SMYTH, P.; UTHURUSAMY,R. Advances in
knowledge discovery and data mining. [S.l.]: AAAI/MIT Press, 1996.
FERREIRA, D. Como funciona a Inteligência Artificial: guia completo com
exemplos. Web Estratégica, 2023. Disponível em: https://webestrategica.
com.br/como-funciona-a-inteligencia-artificial/. Acesso em: 17 janeiro 2024.
GONÇALVES, A.L.D. Prêmio Jabuti desclassifica livro ilustrado com
ferramenta de IA. Tecmundo, 2023. Disponível em: https://www.tecmundo.
com.br/software/273742-premio-jabuti-desclassifica-livro-ilustrado-ferramenta-i
a.htm. Acesso em: 17 janeiro 2024.
GURGEL, C.H. Alan: um gênio, um revolucionário e um símbolo. Jovens
Cientistas Brasil, 2023. Disponível em : https://www.jovenscientistasbrasil.
com.br/post/alan-turing-um-g%C3%AAnio-um-revolucion%C3%A1rio-e-um-s%C
3%ADmbolo . Acesso em: 17 janeiro 2024.
IBM. O que é a IA forte?. IBM, 2023. Disponível em:
https://www.ibm.com/br-pt/topics/strong-ai. Acesso em: 20 janeiro 2024.
INSTITUTO UNIBANCO. Inteligência Artificial na Educação: conheça os
efeitos dessa tecnologia no ensino e na aprendizagem. Observatório de
educação, 2023. Disponível em: https://observatoriodeeducacao.instituto
unibanco.org.br/em-debate/inteligencia-artificial-na-educacao. Acesso em: 23
janeiro 2024.
LAPOLA, M. Como os computadores quânticos podem mudar o mundo que
conhecemos. Revista Galileu, 2021. Disponível em: https://revistagalileu.globo.
com/Ciencia/noticia/2021/12/como-os-computadores-quanticos-podem-mudar-
o-mundo-que-conhecemos.html. Acesso em: 25 janeiro 2024.
MCCARTHY, J. What is artificial intelligence?. Computer Science Department -
Stanford University, 2007. Disponível em: http://www-formal.stanford.edu/jmc/.
Acesso em: 16 janeiro 2024.
MICROSOFT. Conceitos básicos de IA do Microsoft Azure: Visão geral da IA.
Microsoft Learn, 2023. Disponível em: https://learn.microsoft.com/pt-br/
training/paths/get-started-with-artificial-intelligence-on-azure/.Acesso em: 20
janeiro 2024.
NEUROTECH. Deep Learning: Moda ou Realidade? Neurotech, 2019.
Disponível em: https://www.neurotech.com.br/blog/deep-learning-moda-
realidade/. Acesso em: 22 janeiro 2024.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://webestrategica.com.br/como-funciona-a-inteligencia-artificial/
https://webestrategica.com.br/como-funciona-a-inteligencia-artificial/
https://www.tecmundo.com.br/software/273742-premio-jabuti-desclassifica-livro-ilustrado-ferramenta-ia.htm
https://www.tecmundo.com.br/software/273742-premio-jabuti-desclassifica-livro-ilustrado-ferramenta-ia.htm
https://www.tecmundo.com.br/software/273742-premio-jabuti-desclassifica-livro-ilustrado-ferramenta-ia.htm
https://www.jovenscientistasbrasil.com.br/post/alan-turing-um-g%C3%AAnio-um-revolucion%C3%A1rio-e-um-s%C3%ADmbolo
https://www.jovenscientistasbrasil.com.br/post/alan-turing-um-g%C3%AAnio-um-revolucion%C3%A1rio-e-um-s%C3%ADmbolo
https://www.jovenscientistasbrasil.com.br/post/alan-turing-um-g%C3%AAnio-um-revolucion%C3%A1rio-e-um-s%C3%ADmbolo
https://www.ibm.com/br-pt/topics/strong-ai
https://observatoriodeeducacao.institutounibanco.org.br/em-debate/inteligencia-artificial-na-educacao
https://observatoriodeeducacao.institutounibanco.org.br/em-debate/inteligencia-artificial-na-educacao
https://revistagalileu.globo.com/Ciencia/noticia/2021/12/como-os-computadores-quanticos-podem-mudar-o-mundo-que-conhecemos.html
https://revistagalileu.globo.com/Ciencia/noticia/2021/12/como-os-computadores-quanticos-podem-mudar-o-mundo-que-conhecemos.html
https://revistagalileu.globo.com/Ciencia/noticia/2021/12/como-os-computadores-quanticos-podem-mudar-o-mundo-que-conhecemos.html
http://www-formal.stanford.edu/jmc/
https://learn.microsoft.com/pt-br/training/paths/get-started-with-artificial-intelligence-on-azure/
https://learn.microsoft.com/pt-br/training/paths/get-started-with-artificial-intelligence-on-azure/
https://www.neurotech.com.br/blog/deep-learning-moda-realidade/
https://www.neurotech.com.br/blog/deep-learning-moda-realidade/
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
98
NORVIG, P.; RUSSEL, S. Inteligência Artificial: Uma Abordagem Moderna. LTC
editora 4ª edição, 2022.
ONODY, R.N. Teste de Turing e Inteligência Artificial. IFSC, 2021. Disponível
em: https://www2.ifsc.usp.br/portal-ifsc/teste-de-turing-e-inteligencia-artificial/.
Acesso em: 17 janeiro 2024.
ORACLE. O que é Deep Learning? Disponível em:
https://www.oracle.com/br/artificial-intelligence/machine-learning/what-is-deep
-learning/. Acesso em: 22 janeiro 24.
ORBIA. Como a Inteligência Artificial está transformando a agricultura.
Orbia, 2023. Disponível em: https://www.orbia.ag/novidades/como-a-
inteligencia-artificial-esta-transformando-a-agricultura. Acesso em: 22 janeiro
2024.
PACETE, Luiz Gustavo. Digital twin: como funciona a tecnologia que espelha
o mundo real. Forbes Tech, 2022. Disponível em:
https://forbes.com.br/forbes-tech/2022/09/digital-twin-como-funciona-a-tecnol
ogia-que-espelha-o-mundo-real/. Acesso em 22 janeiro 2024.
PARLAMENTO EUROPEU. O que é a Inteligência Artificial e como funciona?
PE, 2023. Disponível em: https://www.europarl.europa.eu/news/pt/headlines/
society/20200827STO85804/o-que-e-a-inteligencia-artificial-e-como-funciona.
Acesso em: 16 janeiro 2024.
PERGENTINO, Camila. Inteligência artificial pode aumentar em 14% a
produtividade de trabalhadores, aponta estudo. Época Negócios, 2023..
Disponível em: https://epocanegocios.globo.com/futuro-do-trabalho/noticia/
2023/04/inteligencia-artificial-aumenta-em-14percent-a-produtividade-de-trabal
hadores-aponta-estudo.ghtml. Acesso em: 24 janeiro 2024.
PINHEIRO, Guilherme P. A Regulação da Inteligência Artificial: Visões das
Propostas da Câmara dos Deputados e do Senado Federal. Disponível em:
https://www.brasil-economia-governo.org.br/2023/06/05/a-regulacao-da-intelig
encia-artificial-visoes-das-propostas-da-camara-dos-deputados-e-do-senado-fed
eral/. Acesso em 20 janeiro 2024.
PREGOWSKA, A.; OSIALl, M. O que é uma rede neural e para que serve?.
UNESP, 2022. Disponível em https://parajovens.unesp.br/o-que-e-uma-rede-
social-e-para-que-serve/. Acesso em: 20 janeiro 2024.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://www2.ifsc.usp.br/portal-ifsc/teste-de-turing-e-inteligencia-artificial/
https://www.oracle.com/br/artificial-intelligence/machine-learning/what-is-deep-learning/
https://www.oracle.com/br/artificial-intelligence/machine-learning/what-is-deep-learning/
https://www.orbia.ag/novidades/como-a-inteligencia-artificial-esta-transformando-a-agricultura
https://www.orbia.ag/novidades/como-a-inteligencia-artificial-esta-transformando-a-agricultura
https://forbes.com.br/forbes-tech/2022/09/digital-twin-como-funciona-a-tecnologia-que-espelha-o-mundo-real/
https://forbes.com.br/forbes-tech/2022/09/digital-twin-como-funciona-a-tecnologia-que-espelha-o-mundo-real/
https://www.europarl.europa.eu/news/pt/headlines/society/20200827STO85804/o-que-e-a-inteligencia-artificial-e-como-funciona
https://www.europarl.europa.eu/news/pt/headlines/society/20200827STO85804/o-que-e-a-inteligencia-artificial-e-como-funciona
https://epocanegocios.globo.com/futuro-do-trabalho/noticia/2023/04/inteligencia-artificial-aumenta-em-14percent-a-produtividade-de-trabalhadores-aponta-estudo.ghtml
https://epocanegocios.globo.com/futuro-do-trabalho/noticia/2023/04/inteligencia-artificial-aumenta-em-14percent-a-produtividade-de-trabalhadores-aponta-estudo.ghtml
https://epocanegocios.globo.com/futuro-do-trabalho/noticia/2023/04/inteligencia-artificial-aumenta-em-14percent-a-produtividade-de-trabalhadores-aponta-estudo.ghtml
https://www.brasil-economia-governo.org.br/2023/06/05/a-regulacao-da-inteligencia-artificial-visoes-das-propostas-da-camara-dos-deputados-e-do-senado-federal/
https://www.brasil-economia-governo.org.br/2023/06/05/a-regulacao-da-inteligencia-artificial-visoes-das-propostas-da-camara-dos-deputados-e-do-senado-federal/
https://www.brasil-economia-governo.org.br/2023/06/05/a-regulacao-da-inteligencia-artificial-visoes-das-propostas-da-camara-dos-deputados-e-do-senado-federal/
https://parajovens.unesp.br/o-que-e-uma-rede-social-e-para-que-serve/
https://parajovens.unesp.br/o-que-e-uma-rede-social-e-para-que-serve/
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
99
REDAÇÃO GQ. Christie's faz história com o primeiro leilão de uma obra
pintada por Inteligência Artificial. Globo.com, set, 2018. Disponível em:
https://gq.globo.com/Prazeres/Tecnologia/noticia/2018/09/christies-faz-historia
-com-o-primeiro-leilao-de-uma-obra-pintada-por-inteligencia-artificial.html.
Acesso em: 17 janeiro 2024.
REDAÇÃO HOMEWORK. 5 cuidados necessários antes de usar IA na
educação. 2023. Disponível em:
https://www.terra.com.br/noticias/educacao/5-cuidados-necessarios-antes-de-u
sar-ia-na-educacao,de60f6899161bc6f4b3b4fbefd9ccd37a5yk0upp.html?utm_so
urce=clipboard. Acesso em: 17 janeiro 2024.
REDAÇÃO NATGEO. Quem foi Alan Turing, pioneiro no desenvolvimento da
Inteligência Artificial e da computacao moderna. National Geographic Brasil,
2023. Disponível em: https://www.nationalgeographicbrasil.com/ciencia/2023/
06/quem-foi-alan-turing-pioneiro-no-desenvolvimento-da-inteligencia-artificial-
e-da-computacao-moderna. Acesso em: 18 janeiro 2024.
REHAGRO. Inteligência artificial na agricultura: benefícios e aplicações.
Rehagro, 2023. Disponívelem: https://rehagro.com.br/blog/inteligencia-
artificial-na-agricultura. Acesso em: 22 janeiro 2024.
ROMAGNOLE. O Impacto Transformador da Inteligência Artificial no Setor
Elétrico Brasileiro. Redação Romagnole, 2024. Disponível em:
https://www.romagnole.com.br/noticias/o-impacto-transformador-da-inteligen
cia-artificial-no-setor-eletrico-brasileiro%EF%BF%BC/#:~:text=A%20IA%20tem%
20sido%20utilizada,e%20a%20distribui%C3%A7%C3%A3o%20de%20energia.
Acesso em: 20 janeiro 2024.
RUSSELL, S.J.; NORVIG, P. Artificial Intelligence - A modern Approach. Pearson
Education, 2ª Edição, 2003.
SANKHYA. IA Generativa: o que é, vantagens e exemplos. 2023. Disponível
em: https://www.sankhya.com.br/blog/ia-generativa/. Acesso em: 19 janeiro
2024.
SCUDILIO, J. Como a Inteligência Artificial está transformando os Negócios.
FLAI, 2020. Disponível em: https://www.flai.com.br/juscudilio/como-a-inteligen
cia-artificial-esta-transformando-os-negocios/. Acesso em: 20 janeiro 2024.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://gq.globo.com/Prazeres/Tecnologia/noticia/2018/09/christies-faz-historia-com-o-primeiro-leilao-de-uma-obra-pintada-por-inteligencia-artificial.html
https://gq.globo.com/Prazeres/Tecnologia/noticia/2018/09/christies-faz-historia-com-o-primeiro-leilao-de-uma-obra-pintada-por-inteligencia-artificial.html
https://www.terra.com.br/noticias/educacao/5-cuidados-necessarios-antes-de-usar-ia-na-educacao,de60f6899161bc6f4b3b4fbefd9ccd37a5yk0upp.html?utm_source=clipboard
https://www.terra.com.br/noticias/educacao/5-cuidados-necessarios-antes-de-usar-ia-na-educacao,de60f6899161bc6f4b3b4fbefd9ccd37a5yk0upp.html?utm_source=clipboard
https://www.terra.com.br/noticias/educacao/5-cuidados-necessarios-antes-de-usar-ia-na-educacao,de60f6899161bc6f4b3b4fbefd9ccd37a5yk0upp.html?utm_source=clipboard
https://www.nationalgeographicbrasil.com/ciencia/2023/06/quem-foi-alan-turing-pioneiro-no-desenvolvimento-da-inteligencia-artificial-e-da-computacao-moderna
https://www.nationalgeographicbrasil.com/ciencia/2023/06/quem-foi-alan-turing-pioneiro-no-desenvolvimento-da-inteligencia-artificial-e-da-computacao-moderna
https://www.nationalgeographicbrasil.com/ciencia/2023/06/quem-foi-alan-turing-pioneiro-no-desenvolvimento-da-inteligencia-artificial-e-da-computacao-moderna
https://rehagro.com.br/blog/inteligencia-artificial-na-agricultura
https://rehagro.com.br/blog/inteligencia-artificial-na-agricultura
https://www.romagnole.com.br/noticias/o-impacto-transformador-da-inteligencia-artificial-no-setor-eletrico-brasileiro%EF%BF%BC/#:~:text=A%20IA%20tem%20sido%20utilizada,e%20a%20distribui%C3%A7%C3%A3o%20de%20energia
https://www.romagnole.com.br/noticias/o-impacto-transformador-da-inteligencia-artificial-no-setor-eletrico-brasileiro%EF%BF%BC/#:~:text=A%20IA%20tem%20sido%20utilizada,e%20a%20distribui%C3%A7%C3%A3o%20de%20energia
https://www.romagnole.com.br/noticias/o-impacto-transformador-da-inteligencia-artificial-no-setor-eletrico-brasileiro%EF%BF%BC/#:~:text=A%20IA%20tem%20sido%20utilizada,e%20a%20distribui%C3%A7%C3%A3o%20de%20energia
https://www.sankhya.com.br/blog/ia-generativa/
https://www.flai.com.br/juscudilio/como-a-inteligencia-artificial-esta-transformando-os-negocios/
https://www.flai.com.br/juscudilio/como-a-inteligencia-artificial-esta-transformando-os-negocios/
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
100
SOTERO, A. Vale a leitura em 2024: revolução da IA para um mundo mais
humano. Investnews, 2024. Disponível em: https://investnews.com.br/
colunistas/melhores-livros/vale-ler-em-2024-a-revolucao-da-ia-para-um-mundo-
mais-humano. Acesso em: 16 janeiro 2024.
SOUSA, G. Fundamentos Básicos do Machine Learning que você Precisa
Saber. Learning Data, 2021. Disponível em: https://www.learningdata.dev/post/
fundamentos-basicos-do-machine-learning-que-voce-precisa-saber#viewer-d9i
n1. Acesso em 22 janeiro 2024.
SZELISKI, R. Computer Vision: Algorithms and Applications. Springer, Nova
Iorque, 2022.
TOTVS. Indústria 4.0: pilares, tecnologias, impactos e desafios. Equipe
TOTVS, 2023. Disponível em: https://www.totvs.com/blog/gestao-industrial/
industria-4-0/. Acesso em 23 janeiro 2024.
TURING, A.M. Computing machinery and intelligence. Mind. UK, 1950,
59(236), 433-460.
WELLS III, R.E. Strong AI vs. Weak AI: What's the Difference? Lifewire, 2023.
Disponível em: https://www.lifewire.com/strong-ai-vs-weak-ai-7508012. Acesso
em: 22 janeiro 2024.
ZANATTA, C. Inteligência artificial já é realidade na agricultura; entenda
como funciona. Redação Techtudo, 2023. Disponível em:
https://www.techtudo.com.br/noticias/2023/10/inteligencia-artificial-ja-e-realida
de-na-agricultura-entenda-como-funciona-edsoftwares.ghtml. Acesso em: 22
janeiro 2024.
ZENDESK. Quais são os tipos de Inteligência Artificial? Zendesk, 2023.
Disponível em: https://www.zendesk.com.br/blog/tipos-inteligencia-artificial/.
Acesso em: 19 janeiro 2024.
Do
cu
m
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://investnews.com.br/colunistas/melhores-livros/vale-ler-em-2024-a-revolucao-da-ia-para-um-mundo-mais-humano
https://investnews.com.br/colunistas/melhores-livros/vale-ler-em-2024-a-revolucao-da-ia-para-um-mundo-mais-humano
https://investnews.com.br/colunistas/melhores-livros/vale-ler-em-2024-a-revolucao-da-ia-para-um-mundo-mais-humano
https://www.learningdata.dev/post/fundamentos-basicos-do-machine-learning-que-voce-precisa-saber#viewer-d9in1
https://www.learningdata.dev/post/fundamentos-basicos-do-machine-learning-que-voce-precisa-saber#viewer-d9in1
https://www.learningdata.dev/post/fundamentos-basicos-do-machine-learning-que-voce-precisa-saber#viewer-d9in1
https://www.totvs.com/blog/gestao-industrial/industria-4-0/
https://www.totvs.com/blog/gestao-industrial/industria-4-0/
https://www.lifewire.com/strong-ai-vs-weak-ai-7508012
https://www.techtudo.com.br/noticias/2023/10/inteligencia-artificial-ja-e-realidade-na-agricultura-entenda-como-funciona-edsoftwares.ghtml
https://www.techtudo.com.br/noticias/2023/10/inteligencia-artificial-ja-e-realidade-na-agricultura-entenda-como-funciona-edsoftwares.ghtml
https://www.zendesk.com.br/blog/tipos-inteligencia-artificial/
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
Capítulo 2:
Introdução à Visão
Computacional
Autor
Bruno Agrofoglio Ferreira
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
102
2.1. Introdução
Desejamos boas vindas ao capítulo de Introdução à Visão Computacional!
Este conteúdo foi desenvolvido para apresentar o conceito de Visão
Computacional, sua origem, desenvolvimento, aplicações e algoritmos.
Iniciamos nosso conteúdo com a introdução ao campo da computação
conhecido como Visão Computacional, trazendo seu contexto histórico,
seguindo para a apresentação das técnicas e hardwares responsáveis pela
aquisição e processamento das imagens. Também abordamos os fundamentos
do processamento de imagens, comentando acerca dos métodos de
pré-processamento das imagens antes da realização dos algoritmos de
treinamento.
Separamos as aplicações daVisão Computacional por grandes áreas como o
rastreamento de objetos em sequências de vídeo, vigilância e automação,
reconhecimento facial e biometria, medicina e diagnóstico, veículos autônomos,
drones e na robótica.
Além do Aprendizado de Máquina, também trazemos o uso de redes
neurais do Aprendizado Profundo para o treinamento de modelos mais
avançados de Visão Computacional.
O conteúdo finaliza comentando sobre os algoritmos mais utilizados e
aplicados atualmente na área de Visão Computacional.
Para consolidar o conhecimento, utilizaremos uma ferramenta No Code, ou
seja, não são necessários conhecimentos prévios de programação. Essa
ferramenta auxiliará na a criação de um modelo de reconhecimento de objetos,
de forma simples e prática, sem a necessidade de instalação de software e
utilizando a própria câmera do seu dispositivo para realizar as capturas.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
103
2.2. Inspirar
Vivemos em um mundo digital, conectados grande parte do nosso tempo a
tecnologia. Gadgets, smartphones e computadores habilitam nossa
comunicação, servem como meio de pagamento e permissão de acesso a locais,
além dos mais diversos usos da tecnologia.
Equipamentos que, em quase sua totalidade, contam as câmeras para
realizar uma série destas atividades, desde uma simples foto ou captura de
vídeo, ao pagamento de contas e transferências, leitura de códigos de barras de
produtos e boletos, Pix e compartilhamento de arquivos e informações usando
QR codes.
Dentro deste contexto, a Visão Computacional emerge como um dos pilares
fundamentais da computação moderna, impulsionada significativamente pelas
técnicas avançadas de Machine Learning e Deep Learning num campo em que a
análise humana levaria um tempo demasiadamente longo (Russel e Norvig,
2022), requerendo um esforço humano gigantesco além de ser extremamente
repetitivo.
Aqui, não dizemos que é fácil interpretar o mundo real por meio da Visão
Computacional, pelo contrário, modelar computacionalmente o nosso mundo
físico, objetos e cenas ao nosso redor, requer um grande esforço cognitivo e
também poder computacional para a execução de nossos algoritmos mais
avançados.
A introdução de novos recursos e aprimoramentos na Visão Computacional,
culmina em aplicações robustas e transformadoras para diversos setores como,
por exemplo, em segurança, onde por meio de sequências de vídeo pode-se
monitorar o perímetro contra invasores ou piscinas e lagos em busca de
afogamentos em andamento (Szeliski, 2022).
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
104
2.2.1. Estudo de Caso
Este estudo de caso busca incentivar a reflexão sobre as aplicações da Visão
Computacional em nosso cotidiano. Reflita como essa tecnologia pode
beneficiar ainda mais nossa vida, tornar a nossa sociedade mais segura,
promover avanços na medicina e na qualidade de vida, prover conforto para os
lares, aprimorar equipamentos tecnológicos como smartphones e gadgets,
contribuir com a mobilidade dentro das cidades, entre outras áreas de aplicação
que você entender serem interessantes.
Antes de iniciarmos a "Etapa de Conceitualização" na qual
haverá a apresentação do conteúdo e a experimentação dos
conceitos trabalhados por meio de atividades práticas, entre no
Google Sala de Aula, na aba "Etapa Inspirar", para acessar todos
os materiais disponibilizados, que visam a estimular sua reflexão e
iniciar a ambientação com o conteúdo deste capítulo.
Como última atividade desta etapa, prepare-se para trabalhar a
solução inicial do estudo de caso que será apresentado na
próxima seção.
A solução inicial que você elaborará não será objeto de
correção ou avaliação: trata-se de uma atividade individual que
deverá lhe ajudar a refletir sobre os conceitos apresentados e a
entender como trabalhá-los de maneira prática.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
105
Leia com atenção o cenário do estudo de caso e lembre-se: o
propósito desta atividade é promover uma reflexão inicial acerca do
assunto a ser discutido no cenário tendo por base somente os
conhecimentos de que você dispõe neste momento.
2.2.1.1. Cenário
A Facti, uma Instituição Científica e Tecnológica (ICT) privada reconhecida
por sua atuação no mercado de Tecnologias da Informação e Comunicação
(TICs), está iniciando um novo projeto utilizando Visão Computacional.
Você, uma pessoa apaixonada por tecnologia, recém contratada para o time
de desenvolvimento está convocado(a) para identificar um nicho que demande a
aplicação da Visão Computacional.
Reflita como será a detecção, que objeto você irá detectar ou rastrear, sobre
qual cenário isso ocorrerá, considerando aspectos como condições climáticas,
ambiente interno e externo, possíveis tecnologias existentes e concorrentes.
Importante: coloque a sua resposta na atividade "Apresentação
da solução inicial", no Google Sala de Aula, em um documento no
formato de texto. Utilize este momento para trabalhar as suas ideias
iniciais com o máximo de detalhamento que puder. Mais adiante, as
suas anotações serão retomadas para o refinamento da solução do
estudo de caso.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
106
2.3. Conceitualizar
2.3.1. Introdução à Visão Computacional
A visão é um dos cinco sentidos humanos. Como seres humanos somos
capazes de enxergar em três dimensões graças a um par de globos oculares que
nos fornecem uma visão estéreo (mono quando é um canal ou via, estéreo
quando são dois canais ou vias). Nosso cérebro é capaz de localizar objetos
rapidamente, reconhecer pessoas e animais familiares, inferir acerca de
emoções nos rostos ou perigos ao nosso redor. Assim como acontece com os
seres humanos, a informação obtida por meio da visão pode nos servir para
classificar objetos e orientar escolhas (Marr, 2010).
Vamos ver um exemplo? Quando você vai ao supermercado escolher
bananas e, ao verificar a cor das frutas disponíveis, constata que todas as
bananas estão verdes, optando por comprá-las você precisará aguardar o
amadurecimento para consumi-las. Se no mesmo cenário você tivesse a opção
bananas verdes e bananas amarelas, poderia optar por comprar uma parte das
frutas amarelas podendo realizar o consumo imediato delas.
Figura 45: Cesta de frutas com bananas verdes e amarelas.
Fonte: imagem gerada por IA.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
ono
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
107
A grosso modo, é dessa mesma forma que a Visão Computacional funciona:
ela adquire a imagem digital, realiza tratamentos, identifica objetos
reconhecendo padrões e classificando. A partir das informações de classificação,
a tomada de decisão é realizada.
Que tal outro exemplo, agora utilizando Visão Computacional num cenário
industrial? Neste exemplo, estamos numa esteira de processamento de frutas,
neste caso, bananas. As frutas devem ser separadas de acordo com o seu ponto
de amadurecimento para diferentes destinos. Frutas mais verdes, que levarão
um tempo maior para amadurecer, deverão seguir para os destinos mais
distantes. Por outro lado, frutas mais amarelas, praticamente maduras, deverão
ser entregues aos destinos mais próximos. De forma simplificada, estamos
otimizando a distribuição visando a manutenção da qualidade da fruta na
chegada ao cliente final. Neste exemplo, podemos utilizar uma câmera para a
obtenção de imagens que serão processadas em tempo real e servirão de base
para a tomada de decisão de um robô ou esteira separadora, responsável por
direcionar as frutas nas caixas corretas de acordo com o destino.
A Visão Computacional, portanto, é um campo interdisciplinar que combina
técnicas de processamento de imagens, Inteligência Artificial e Ciência da
Computação com o objetivo de dar às máquinas a capacidade de interpretar
visualmente informações do mundo real (Bengio et al., 2013).
Figura 46: Bananas transportadas por esteira.
Fonte: imagem gerada por IA.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
108
Você já deve ter notado que a Visão Computacional parece estar em muitos
lugares, não é mesmo? Neste momento, você deve ter acesso a um dispositivo
celular (smartphone) que possui uma câmera. Possivelmente, o equipamento
conta com recursos de Visão Computacional embarcados nele (Davies, 2005).
Calma! Vamos primeiro verificar se o aparelho cumpre com o pré-requisito
para ser um dispositivo de Visão Computacional - e não apenas uma simples
câmera. Precisamos primeiro saber se o seu dispositivo consegue “ver”, ou seja,
possui uma câmera integrada, para captura de imagens no espectro visível ou
não (já iremos comentar sobre outros espectros mais adiante).
A partir dessa capacidade de “visão” do dispositivo, se ele for capaz de
interpretar, identificar e/ou classificar o que lhe foi apresentado, sim, estamos
lidando com um dispositivo que proporciona Visão Computacional, ou seja, a
capacidade que uma máquina tem de adquirir, processar e classificar essas
imagens para que sejam tomadas decisões a partir dessa “visão”.
Em nossos celulares, nós podemos encontrar a combinação de aplicativos e
câmeras que proporcionam a identificação de rostos, sorrisos e até objetos
durante a execução. Um exemplo é o Google Lens e o Google Fotos, hoje
integrado às aplicações de câmera de boa parte dos celulares com sistema
Android. O iPhone também possui o Visual Look Up, recurso integrado ao app
Fotos. Esses aplicativos possuem a capacidade de reconhecimento de objetos,
cenários e contextos, possibilitando realizar uma pesquisa na barra de busca
com termos como cachorro, gato, praia ou até Natal.
Figura 47: Smartphone.
Fonte: imagem gerada por IA.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
109
Durante cerca de 50 anos, antes do desenvolvimento das redes neurais
aplicadas para Visão Computacional (em meados de 2012), a detecção e
classificação era obtida por meio de uma série de algoritmos de processamento
de imagem (Chen et al., 2022).
Com o surgimento de técnicas para o reconhecimento de imagens baseadas
em redes neurais, tornando a detecção menos artesanal, visto que para cada
contexto era necessário um algoritmo específico que funcionava muito bem
para um determinado conjunto de treinamento.
Apesar de ser eficiente, a classificação baseada em Aprendizado de Máquina,
utilizando de forma linear diferentes algoritmos, é inflexível, ou seja, mais
restrita no sentido de contexto de aplicação (Bengio et al., 2013).
Por exemplo, uma aplicação para detecção de automóveis, funcionaria muito
bem durante o dia, porém, para a detecção de automóveis no período noturno
seria necessário o treinamento de um novo modelo, visando melhorar a
eficiência e mitigar erros na detecção durante um ciclo diário (dia e noite ao
longo de 24 horas).
Além disso, trazia consigo o risco de dependência da atualização desses
algoritmos específicos para continuar atualizada. Essas dependências podiam
em muitos casos, quebrar o programa principal, necessitando de ajustes
constantes para que o mesmo continuasse funcionando.
Figura 48: Concepção artística de veículos em uma avenida detectados por meio da Visão Computacional.
Fonte: imagem gerada por IA.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
110
2.3.1.1. Contexto histórico
Segundo David Marr (2010), o desenvolvimento da Visão Computacional
é inseparável da Inteligência Artificial. Aqui, pretende-se resumir alguns marcos
temporais importantes para o desenvolvimento da área, sabendo que não
haverá como contemplar todos, visto que é uma área ampla e cujo
desenvolvimento ocorreu em diversos países, necessitando de uma extensa
pesquisa bibliográfica.
Em 1951, Marvin Minsky (1961) desenvolveu a primeira máquina de
aprendizado com rede neural de fiação aleatória conhecida como SNARC
(Stochastic Neural Analog Reinforcement Calculator) junto à sua equipe dentro do
MIT (Massachusetts Institute of Technology). O SNARC foi um neurocomputador
simples, composto por 100 neurônios artificiais, capaz de resolver um labirinto
de ratos usando um algoritmo de Aprendizado por Reforço. Este algoritmo de
reforço funciona premiando o dispositivo por tomar as decisões corretas que, no
caso do SNARC, eram aquelas voltadas a chegar ao prêmio no final do labirinto.
Figura 49: Professor Marvin Minsky.
Fonte: imagem gerada por IA.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
111
O Aprendizado por Reforço capacita um agente a tomar decisões em um
ambiente complexo, recebendo recompensas por ações bem-sucedidas. Os
seres humanos também aprendem a tomar decisõesem um ambiente complexo
a partir de informações do sistema visual, no caso, do mundo ao nosso redor.
Nós, seres humanos, recebemos recompensas por tomar decisões que nos
ajudam a sobreviver e prosperar.
Portanto, os modelos de Aprendizado por Reforço podem aprender a
identificar e rastrear objetos em movimento, além de entender a relação entre
eles. No entanto, é importante notar que os modelos de Aprendizado por
Reforço não são perfeitos, cometendo erros, assim como o sistema visual
humano (Forsyth e Ponce, 2015). Além disso, os modelos de Aprendizado por
Reforço são limitados pelos dados em que são treinados, desta forma, se os
dados de treinamento não forem representativos do mundo real, os modelos
podem não ser capazes de generalizar bem para novas situações.
Na década de 1960, outros pesquisadores desenvolveram algoritmos para
uma variedade de tarefas, incluindo reconhecimento de padrões,
correspondência estéreo e fluxo óptico, era um salto no campo da Inteligência
Artificial, marcado principalmente pelo lançamento do livro Perceptrons, em
1969, quando Minsky e Seymour Papert abordam a rede neural mais antiga,
criada por Frank Rosenblatt em 1958.
Figura 50: Releitura da obra Relatividade de Maurits Cornelis Escher.
Fonte: imagem gerada por IA.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
112
Já na década de 1970, a Visão Computacional continuou a se desenvolver,
com a chegada de novos algoritmos e técnicas, iniciando sua expansão para
aplicações práticas, como robótica e processamento de imagens médicas,
devido ao maior desenvolvimento no campo da microeletrônica e o advento das
câmeras digitais.
Minsky e seu grupo no MIT desenvolveram uma variedade de modelos de
processamento de imagens, incluindo o modelo de visão de Marr-Hildreth em
1980 onde, notadamente, a Visão Computacional alcançou um novo nível de
maturidade.
Avançando para a década de 1990, surgem novas técnicas como
processamento de imagens digitais, modelagem física e Aprendizado de
Máquina. A partir dos anos 2000, a Visão Computacional experimentou um novo
ciclo de avanços, com o surgimento da aprendizagem profunda ou, em inglês,
Deep Learning (Bengio et al., 2013).
Em 2010 a humanidade iniciou testes com veículos autônomos e realidade
aumentada, ampliando as aplicações da tecnologia, culminando nos dias atuais
com o amadurecimento e aplicação em uma variedade de campos, incluindo
robótica, medicina, segurança e entretenimento.
Figura 51: Professores Marvin Minsky e Seymour Papert.
Fonte: imagem gerada por IA.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
113
2.3.1.2. Aquisição e representação de
imagens digitais
A Visão Computacional é a área da computação que realiza a interpretação
de imagens digitais. Segundo Richard Szeliski (2022), dentro da Visão
Computacional os cientistas buscam descrever o mundo a partir de uma ou mais
imagens, reconstruindo suas propriedades com base na forma, iluminação e
distribuição de cores.
A aquisição de imagens é o processo pelo qual uma imagem do mundo real
é capturada para ser posteriormente processada por computadores.
Entre os métodos empregados para realizar essa aquisição estão as câmeras
digitais, os scanners que empregam feixes de luz para digitalizar imagens
impressas ou objetos tridimensionais, convertendo a informação visual em
dados digitais e as câmeras de vídeo que são capazes de capturar sequências de
imagens, sendo valiosas para análises dinâmicas do ambiente (Forsyth e Ponce,
2015).
Figura 52: Câmeras digitais modernas são construídas com sensor CMOS.
Fonte: imagem gerada por IA.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
114
Geralmente, a informação no formato digital é obtida a partir de um
hardware específico como um CMOS (Complementary Metal Oxide Semiconductor,
que em português significa semicondutor de óxido metálico complementar) ou
um CCD (charge-coupled device, ou dispositivo de carga acoplada), que atuam
(com tecnologias diferentes) convertendo luz em sinal elétrico que, em seguida,
transformam-se em um conjunto de dados armazenados digitalmente.
Atualmente, o sensor CMOS é o mais utilizado comercialmente, devido ao
seu menor custo de fabricação, maior eficiência energética e velocidade superior
ao CCD. Câmeras de alto desempenho podem contar com sensores CMOS
empilhados visando uma captura mais fiel, porém, a um custo muito maior, pois
conta com uma tecnologia complexa e que ainda está em desenvolvimento.
A Visão Computacional também pode ser obtida por câmeras não
convencionais, como mencionado anteriormente, acerca de espectros fora do
visível ao olho humano.
Podemos utilizar imagens de infravermelho, ultravioleta, raios X, raios gama,
RADAR (Radio Detection And Ranging ou detecção e medida de distância por
rádio), LIDAR (Light Detection And Ranging ou detecção e alcance por luz) e
SONAR (Sound Navigation and Ranging ou navegação e determinação da
distância pelo som).
Figura 53: imagem obtida por LIDAR. Sobreposta há um modelo mecânico associado à hidráulica predial.
Fonte: Wikimedia Commons.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://upload.wikimedia.org/wikipedia/commons/2/23/Scan-to-BIM_Mechanical_Room.jpg
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
115
Em astronomia e astrofísica, telescópios em órbita podem capturar imagens
nos espectros infravermelho, ultravioleta, raios X e raios gama, que são
bloqueados pela atmosfera terrestre em quase sua totalidade.
Essas imagens fornecem informação além do espectro visível de berçários
estelares, centros de galáxias, pulsares, regiões altamente ativas, geralmente
próximas aos buracos negros e outras áreas de interesse para a fronteira da
ciência.
No campo da medicina, equipamentos de ressonância magnética,
ultrassonografia, raios X entre outros, fornecem imagens a partir de tecnologias
ou espectros que não são visíveis ao olho humano.
Em aplicações de segurança e no campo militar, a aquisição de imagens no
espectro infravermelho, imagens de RADAR, LIDAR e SONAR são essenciais para
navegação, ataque e defesa das forças, além de resgate, busca e salvamento.
Figura 54: Representação artística de um telescópio orbital.
Fonte: imagem gerada por IA.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
códi
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
116
Assim, a aquisição de imagens fornece dados brutos, a entrada essencial
para realizar tarefas como reconhecimento de objetos, rastreamento de
movimento e análise de imagem. A partir da aquisição, dá-se a representação de
imagens, processo pelo o qual a informação visual capturada é transformada de
forma que pode ser manipulada por sistemas computacionais (Forsyth e Ponce,
2015).
Entre os formatos de imagem digital, os dois mais comuns são as imagens
raster, compostas por matrizes de pixels e as imagens vetoriais, compostas por
objetos geométricos como linhas e polígonos, como a extensão .SVG (Scalable
Vector Graphics, ou gráficos vetoriais escalonáveis).
A escolha entre esses formatos depende da aplicação específica. As imagens
vetoriais são mais utilizadas para desenhos técnicos e gráficos, como as
utilizadas em impressão 3D. Já as imagens raster são preferíveis para fotografias.
Nas imagens raster, cada pixel representa um ponto na imagem. A
informação geralmente contem as coordenadas de posição x e y do pixel,
seguida, por exemplo, dos valores de cor RGB (Red - vermelho, Green - verde e
Blue - azul).
Figura 55: Abstração de pixels em uma imagem.
Fonte: imagem gerada por IA.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
117
Dessa forma, cada pixel - que adotamos como um quadrilátero com a menor
informação possível de uma imagem - é registrado em série, originando um
arquivo muito maior, com a informação de todos os pixels que compõem a
imagem. Esses arquivos possuem extensões que são geralmente conhecidas
pelos usuários como .JPG, .PNG, .GIF ou .BMP.
A informação do pixel pode ser expressa como um número inteiro ou ponto
flutuante. Quando nos referimos à forma matricial, estamos tratando colunas e
linhas que podemos associar com os eixos x e y, respectivamente, de um plano
cartesiano.
Humanamente, a comparação pixel a pixel seria impossível! Veja um
exemplo para uma foto com 5 megapixels (MP) - portanto, possuindo uma
matriz de 2.560 pixels por 1.920 pixels (2560x1920), que contém exatamente
4.915.200 pixels (daí a resolução da câmera de 5MP).
Note que é uma matriz dificílima até mesmo de se representar fisicamente
em papel e caneta! Atualmente, boa parte dos aparelhos celulares já contam
com câmeras que possuem resoluções maiores que 108 MP (12000x9000),
resultando em 108 milhões de pixels.
Figura 56: Trecho da saída de um script em Python que lê informação pixel a pixel.
Fonte: os Autores.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
118
A aquisição da imagem acontece em três etapas. Primeiro temos a etapa
óptica, que é quando os raios de luz atravessam as lentes do conjunto óptico da
câmera, passando pelo obturador.
Em seguida, ocorre a etapa de sensibilização eletrônica do CCD ou CMOS,
ajustando-se o ganho e transformando a informação analógica para digital por
meio de um conversor ADC (Analog-to-Digital Converter). Este processo encerra a
segunda etapa do processamento e é realizada no chip sensor da câmera.
A terceira e última etapa, por sua vez, ocorre no processador de sinal de
imagem ou ISP (Image Signal Processor), um processador de imagem digital, ou
DSP (Digital Signal Processor), que transforma a imagem bruta (raw data) em
imagem comprimida após as etapas de quantização, correção de erros causados
por ruído ou exposição incorreta, balanceamento de nível de branco e do
contraste.
Com os recentes avanços na microeletrônica e em sistemas embarcados,
atualmente já encontramos ISPs que realizam desde o reconhecimento de
objetos e faces, até o estudo de movimento da aquisição, realizando um
processamento de alto nível sobre a imagem.
Figura 57: Raios de luz atravessam o conjunto óptico, atingindo o sensor CMOS de uma câmera.
Fonte: imagem gerada por IA.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
119
2.3.1.3. Fundamentos de processamento de
imagens
Vimos anteriormente que a aquisição da imagem nas câmeras digitais
modernas, utilizando matrizes CMOS, ocorre em três etapas, cujo
processamento na primeira e segunda etapa é praticamente físico, com a
transformação de energia (e informação) luminosa em elétrica. A terceira etapa
é composta por processamento eletrônico da imagem, por meio da aplicação de
filtragem para promover os processos de coloração, remoção de ruído, ajuste da
curva de contraste (nível de gamma), ajuste de cores e finalmente a compressão
do arquivo.
Na etapa de correção da imagem são aplicados métodos matemáticos que
atualmente podem contar até com Aprendizado de Máquina. Tais correções
incluem a remoção do efeito de mosaico (demosaic ou demosaicing), que visa
corrigir as imagens a partir de amostras de cores incompletas recebidas pelo
sensor CMOS. Isso se deve à forma como é realizada a captura na maioria das
câmeras digitais atuais.
Figura 58: Sensor CMOS de uma câmera visto por meio de microscópio.
Fonte: Wikimedia Commons.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://upload.wikimedia.org/wikipedia/commons/7/73/CMOS_under_a_microscope_02.jpg
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
120
Em 1974, Bryce Edward Bayer, que trabalhava para a Kodak, desenvolveu o
que conhecemos hoje como filtro Bayer, uma matriz de cores que é instalada em
sobre o fotossensor. O filtro Bayer divide o sensor em pequenos quadrados,
cada um coberto por um filtro de cor diferente, como vermelho (R), verde (G) e
azul (B). Dessa forma, cada pixel do sensor captura apenas uma cor, originando a
perda de parte da informação, requerendo assim a sua reconstrução a partir da
informação dos pixels adjacentes (Lian et al., 2005).
Para reconstruir uma imagem colorida completa a partir de amostras
incompletas (devido à perda de informação no filtro Bayer) pelo sensor da
câmera, o software de processamento de imagem (embarcado junto ao CMOS)
deve estimar as cores que faltam para cada pixel, reconstruindo informação.
Assim, como o demosaicing, temos o denoise ou denoising que é o processo
de remoção de ruído. Este ruído pode ter origem no sensor, no processamento
e/ou na transmissão, sendo necessário o seu tratamento, seja ainda a nível de
hardware ou no pós processamento a nível de software.
Curiosidade: A matriz de Bayer aloca dois pixels verdes cada
par de pixels azul e vermelho, pois somos muito mais sensíveis ao
brilho que a cor, dessa forma, a luz verde, que contribuimuito
mais para a percepção do brilho que as cores azul e vermelha, cria
uma imagem com aparência muito melhor, parecendo “mais viva”
do que seria numa distribuição uniforme de cores.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
121
Para ajustarmos o contraste de uma imagem, podemos realizar a correção
por meio da alteração de parâmetros que impactam na equação da curva de
gamma. Dessa forma, podemos aumentar ou diminuir o contraste de todos os
pixels da imagem, deixando-a mais nítida ou mais suave.
O demosaicing e o denoising também podem ser realizados na aquisição de
imagens médicas, como as de tomografia computadorizada ou ressonância
magnética, até imagens de satélite em infravermelho, sempre buscando uma
melhoria na qualidade da imagem.
Figura 59: Imagem no espectro infravermelho detectando volume de água em
suspensão na atmosfera (tempestades) obtida por um satélite climático.
Fonte: Wikimedia Commons.
Figura 60: Imagem de ressonância utilizada para a detecção de um tumor cerebral (destaque).
Fonte: Wikimedia Commons.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://upload.wikimedia.org/wikipedia/commons/c/cf/NESDIS_Atlantic_Ocean_1_June_0000-0600.png
https://upload.wikimedia.org/wikipedia/commons/7/7f/Oligodendroglioma_006.jpg
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
122
Note que, até aqui, foi abordado apenas o código de cores RGB. Seres
humanos, por natureza possuem um sistema de captação óptica tricromático,
ou seja, percebemos as cores dos objetos e não apenas o contraste como
acontece em muitos outros animais que possuem o sistema óptico dicromático
(Szeliski, 2022).
Algumas teorias da evolução das espécies apontam que essa diferença
ocorreu, pois como seres onívoros, além de caçar, também necessitamos
diferenciar a cor de frutos e vegetais para nos alimentarmos. Animais
predadores como cães e gatos, caçam suas presas apenas baseados no
contraste. A regra aos mamíferos é a visão dicromática - nós, seres humanos,
somos uma exceção à regra (Griebel, 2002).
Figura 62: A maioria dos mamíferos como os gatos possuem sistema óptico dicromático.
Fonte: imagem gerada por IA.
Figura 61: Seres humanos possuem sistema óptico tricromático, possuindo três tipos de
cones, cada tipo mais sensível a uma cor: vermelho, verde e azul.
Fonte: imagem gerada por IA.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
123
Em 1931, a Comissão Internacional de Iluminação (CIE ou Commission
Internationale d'Eclairage) estabeleceu as primeiras ligações entre o espectro
eletromagnético e as cores percebidas pelo sistema fisiológico óptico humano. A
partir de experimentos, foram definidos os comprimentos de onda de 700
nanômetros para a cor vermelha (R), 546,1 nanômetros para a cor verde (G) e
435,8 nanômetros para a cor azul (B).
Por causa da indistinguibilidade de cores entre alguns diferentes espectros,
um novo espaço de cores foi desenvolvido um novo espaço de cores, conhecido
como CIE RGB XYZ. Atualmente, devido à criação de modernas imagens de alta
definição, como a HDTV, foi criado um novo padrão para o espaço de cores
chamado ITU-R BT.709, alterando as coordenadas XYZ de cada uma das cores
primárias (RGB).
Figura 63: Diagrama de cromaticidade CIE XY de 1931.
Fonte: Wikimedia Commons.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://upload.wikimedia.org/wikipedia/commons/thumb/3/3b/CIE1931xy_blank.svg/1927px-CIE1931xy_blank.svg.png
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
124
Agora que encerrou-se a etapa de como as imagens tridimensionais são
obtidas por meio do conjunto óptico e sensores, será abordada a etapa de
tratamento de imagens por meio do processamento por software. Iniciando
pelo tipo de transformação mais simples, a que manipula cada pixel de forma
independente, sem observar a sua vizinhança. Este tipo de processamento é
conhecida como operação pontual ou processamento pontual, no qual aplica-se
os chamados operadores pontuais. Nesta etapa, uma ferramenta necessária do
ponto de vista de eficiência e conveniência é a famosa transformada rápida de
Fourier ou FFT (Fast Fourier Transform).
Curiosidade: Em 1807, Jean Baptiste Joseph Fourier,
completou seus estudos no qual observou séries senoidais
harmonicamente relacionadas para representar a distribuição
de temperatura de um corpo. Ao representar as funções por
somas de senos e cossenos ou pela soma de exponenciais
complexas, Fourier criava o que conhecemos hoje como análise
de Fourier, uma das técnicas mais utilizadas na área de
processamento de sinal pela engenharia. Fourier propôs que
uma função periódica pode ser descrita por uma série, sendo
utilizada para descrever sinais discretos, vindo a ser batizada de
série de Fourier, onde a função temporal pode ser expressa
como uma combinação linear de exponenciais complexas
harmonicamente relacionadas.
Já a transformada de Fourier recebe este nome em
homenagem ao Fourier. Seu algoritmo começou a ser
pesquisado ainda em 1805 por Carl Friedrich Gauss.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
125
A transformada de Fourier é uma poderosa ferramenta matemática que
permite decompor uma função em suas frequências componentes, úteis para
entender a composição de uma função ou para realizar operações com esta
função. Sabe-se que a transformada de Fourier de uma função temporal é uma
função complexa, em que o valor real da transformada representa a amplitude
das frequências componentes da função original, enquanto o argumento
complexo representa a fase das frequências componentes. A versão moderna da
transformada rápida de Fourier surgiu em 1965, a partir dos trabalhos de John
Tukey e James Cooley.
A transformação a nível do pixel geralmente é utilizada para ajuste de
contraste e brilho, como o ajuste desses parâmetros em uma cena com céu claro
ou seu inverso quando está nublado. Essas operações pontuais se dão a nível de
software, matematicamente elas envolvem uma operação linear, mas há
operações não lineares, como o ajuste de gamma, por exemplo.
Entre as operações de transformação pontual, temos as transformações de
cores que podem ser realizadas em apenas um canalou nos três canais (RGB)
simultaneamente. Efeitos interessantes podem ser obtidos por meio dessa
transformação, como a alteração ou remoção de fundo da imagem, mudança de
uma imagem colorida para tons de cinza.
Figura 64: Imagem original à esquerda. Alteração na luminosidade e saturação (imagem à direita).
Fonte: imagem gerada por IA.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
126
Após encerrar as etapas de operações pontuais nas transformações ao nível
do pixel (como o ajuste de brilho e contraste), além das transformações que
envolvem cores, abordaremos as transformações que envolvem a composição, o
fosqueamento e a equalização de histograma.
Quando uma transformação ocorre na forma de atingir uma determinada
vizinhança, ou seja, não mais pontual ou pixel a pixel, ela é conhecida como
filtro.
Os filtros possuem diversas finalidades, como promover o ajuste de tons da
imagem, realizar o desfoque, alterar a nitidez, remover ruídos e alterar bordas.
Portanto, um filtro é uma função que modifica os valores dos pixels de uma
imagem atingindo sua vizinhança (Szeliski, 2022).
A aplicação de filtros no processamento de imagens é também chamada de
convolução. A convolução é um operador linear, ou seja, uma operação
matemática que combina duas funções para produzir uma terceira função. A
convolução é realizada deslizando um filtro sobre uma imagem e calculando a
convolução de cada pixel da imagem com o filtro, lembrando que existem filtros
lineares e não lineares.
Figura 65: Imagem original (a), seguida dos filtros:
“desfocar” (b), “envelhecer” (c), “relevo” (d), “pontilhado” (e) e “elétrico” (f).
Fonte: imagem gerada por IA.
a b c
d e f
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
127
Até aqui, vimos as operações pontuais e os filtros lineares e não lineares.
Além disso, existem operações como a interpolação (estimativa do valor de um
pixel a partir de sua vizinhança) e a decimação (redução da taxa de amostragem
visando a melhora na relação sinal-ruído) que visam alterar a resolução de uma
imagem, e outras como as wavelets (funções trigonométricas que servem para
representar sinais e imagens) e a representação multi-resolução (utilizada para
representar dados em diferentes escalas de frequência) que otimizam a análise
da imagem em diferente níveis de detalhe.
Neste capítulo, optou-se por não nos aprofundar além do que exposto até
aqui em filtragem e aplicação das transformações, devido ao ferramental
matemático necessário extenso para ser contemplado dentro deste capítulo.
Gostaríamos de encerrar esta subseção com as transformações que se dão
de forma geométrica, pois elas nos auxiliarão no tratamento de casos como o
rastreamento de objetos e o tratamento tridimensional de objetos a partir de
imagens bidimensionais.
As transformações geométricas podem ser paramétricas ou uma
deformação baseada em malha, onde utiliza-se uma malha para mapear pontos
de uma imagem para uma nova posição.
Entre as principais transformações geométricas paramétricas estão a
translação (preserva a orientação), a rígida ou euclidiana (preserva o
comprimento), a transformação por similaridade (preservando os ângulos), a
transformação afim (preserva o paralelismo) e a transformação projetiva
(preservando as retas do objeto).
Visto que a transformação paramétrica controla um número pequeno de
parâmetros, para realizar deformações locais mais precisas, com a manipulação
de um número maior de parâmetros ou graus de liberdade, utilizamos a
deformação baseada em malha.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
128
Apresentada as etapas básicas da Visão Computacional que incluem
filtragem, redimensionamento e correção de cor, encerraremos este tópico
comentando sobre o processamento digital avançado de imagens.
No processamento digital avançado, utilizamos a segmentação, que pode
ser baseada em formatos, cores ou intensidade dos pixels. Também utilizamos a
detecção de bordas onde, a partir do reconhecimento e detecção, conseguimos
estimar movimento e estruturas a partir do movimento ao longo das imagens.
Dessa forma, a classificação dessas imagens é realizada por Aprendizado de
Máquina por meio destes grandes volumes de dados inseridos, junto aos rótulos
de classificação dos objetos a serem detectados, possibilitando a criação de um
modelo 3D denso, rastreando pessoas, reconhecendo objetos e cenas.
A tridimensionalidade é obtida a partir da superposição de sequências de
imagens bidimensionais, cuja Visão Computacional pode extrair e comparar
dados obtendo informações de velocidade, volume, posição no espaço, entre
outras, acerca dos objetos (Forsyth e Ponce, 2015).
Figura 66: Por meio da segmentação ou da detecção de bordas podemos manipular
imagens como a remoção do fundo apresentada acima.
Fonte: imagem gerada por IA.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
129
2.3.1.4. Aplicações da Visão Computacional
Até aqui você já deve ter percebido o alcance da Visão Computacional. Essa
potencialidade de aplicação diversa, desde uma aplicação recreativa como
aplicar filtros e outros efeitos de imagem para publicar nas redes sociais, até
modernos sistemas de detecção de incêndios florestais.
Observe um exemplo quando a Visão Computacional é aplicada em sistemas
computacionais de reconhecimento de tráfego, possibilitando a distinção entre
pedestres, bicicletas, veículos leves e pesados, trens e bondes, auxiliando a
mobilidade urbana, indo além dos sensores que detectam o fluxo de veículos de
forma eletrônica, geralmente usando sensores indutivos.
Para ilustrar, vamos citar o sistema empregado na cidade alemã de
Darmstadt, em que as câmeras podem reconhecer elementos presentes no
trânsito das cidades, seja durante o dia ou à noite devido ao emprego de
câmeras espectrais que identificam e reconhecem objetos no espectro do
infravermelho, tal sistema organiza o tráfego, permitindo a travessia segura de
pedestres, principalmente em faixas próximas às escolas. Ele também pode ser
utilizado para otimizar a rota de veículos exclusivos de transporte público como
ônibus e VLTs (veículo leve sobre trilhos), alterando a sinalização semafórica
permitindo uma interrupção menor no fluxo desses veículos coletivos.
Figura 67: Sistema de Visão Computacional para operação autônoma de tráfego.
Fonte: Teledyne FLIR LLC.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fact
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://www.flir.com.br/discover/traffic/roads-tunnels/smart-traffic-management-in-the-city-of-darmstadt
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
130
2.3.1.4.1. Rastreamento de objetos em
sequências de vídeo
O rastreamento de objetos em sequências de vídeo é uma funcionalidade da
Visão Computacional essencial em diversas aplicações de ponta como robótica,
medicina, segurança e entretenimento. Com adequado poder computacional,
podemos monitorar em tempo real o fluxo (streaming) de uma câmera de
segurança, por exemplo, realizando a detecção de invasores no perímetro.
Outro exemplo, agora em robótica, é o rastreamento de objetos a partir de
câmeras onboard do equipamento móvel, permitindo que os robôs naveguem
pelo mundo e interajam de forma eficiente com o ambiente onde o mesmo
opera.
Figura 69: Robô quadrúpede Spot operando por um sistema de câmeras.
Fonte: Boston Dynamics.
Figura 68: Sistema combinado de RADAR e Visão Computacional formam
um perímetro protegido eletronicamente.
Fonte: Teledyne FLIR.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://bostondynamics.com
https://www.flir.com
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
131
O processo durante o rastreamento de objetos pode ser dividido em duas
etapas principais. Na primeira etapa, a detecção de objetos envolve a
identificação inicial dos elementos na sequência de vídeo que desejamos
rastrear. Em seguida, o algoritmo de rastreamento de objetos acompanha o
movimento desses elementos ao longo do tempo.
O rastreamento pode ser realizado utilizando características como bordas,
formas e texturas para identificar objetos. Outros métodos de rastreamento -
como os baseados em Aprendizado de Máquina - aprendem a reconhecer
objetos por meio de conjuntos de dados de treinamento, criando assim modelos
matemáticos para cada objeto, o que oferece uma precisão potencialmente
superior e proporciona flexibilidade e adaptabilidade.
É importante lembrar que, à medida em que os métodos de rastreamento de
objetos nas sequências de vídeo evoluem e novas técnicas continuam a ser
desenvolvidas quase que diariamente, os avanços que experimentamos em um
curto intervalo de tempo parecem gigantes.
Um desses últimos avanços ocorre no campo das redes neurais (tópico que
abordaremos mais à frente). Quando utilizadas, a redes neurais conseguem
reconhecer imagens de forma significativamente maior, ampliando também o
contexto de aplicação (Szeliski, 2022), não ficando mais restrita à limitações
como operar de dia ou de noite, ser aplicada de forma versátil com poucas ou
nenhuma alteração, algo impensável para o modelo tradicional que utiliza o
Aprendizado de Máquina.
Outra vantagem da rede neural é a possibilidade de aplicação do modelo a
partir de um número menor de imagens quando comparado ao treinamento de
modelos baseados em Aprendizado de Máquina. Atualmente já temos modelos
generativos como LLM utilizados para o reconhecimento de objetos e imagens
por meio de redes neurais (You et al, 2023).
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
132
2.3.1.4.2. Aplicações em vigilância e
automação
Ao pensarmos em segurança, a primeira imagem que nos vem à cabeça é a
aplicação de câmeras de vigilância. As câmeras mais modernas, sejam elas
indoor e outdoor, já possuem reconhecimento de objetos e detecção automática
de invasão no perímetro utilizando Aprendizado de Máquina (Szeliski, 2022),
realizando o disparo automático de alarmes, alertas de intrusão no perímetro
monitorado, detecção automática de rostos e placas veiculares, aumentando a
capacidade de detecção e evitando fadigas humanas que podem comprometer a
segurança do sistema. Tais modelos são embarcados no próprio hardware da
câmera, junto a um pequeno aplicativo servidor que possibilita o usuário
conectar-se diretamente à câmera por meio de um smartphone, computador e
até smart TV, realizando ajustes como a seleção da área a ser monitorada, a
sensibilidade de disparo de eventos, deixando a câmera mais precisa para a
aplicação e evitando falsos disparos automáticos.
Figura 70: Câmeras de vigilância geralmente possuem captura
no espectro visível e também no infravermelho.
Fonte: imagem gerada por IA.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
133
Em áreas de pesquisa e aplicações em segurança, também podemos utilizar
câmeras no espectro do infravermelho ou ultravioleta, que o olho humano não
consegue enxergar naturalmente. Na captura nesses espectros não visíveis é
realizado um tratamento adicionando cores para a exibição no espectro visível
por meio de telas, tornando, desta maneira, a informação inteligível a humanos
que as enxergam em monitores e telas convencionais.
A câmera infravermelho permite a captura de imagens térmicas, auxiliando
no período noturno e também em regiões lagos, oceanos, florestas e matas,
onde a assinatura térmica humana cria um destaque sobre a paisagem (Szeliski,
2022).
Figura 72: Imagem termográfica (espectro infravermelho).
Fonte: Teledyne FLIR.
Figura 71: Utilizar captura e processamento no infravermelho habilita a
navegação por meio de ambientes sem iluminação, como o oceano durante a noite.
Fonte: Teledyne FLIR.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://www.flir.com
https://www.flir.com
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
134
Já a captura em ultravioleta nos permite observar maiores detalhes em
imagens durante o dia, isso porque o ultravioleta está além do espectro visível.
Estima-se que pouco menos de 10% da emissão espectral solar esteja contido no
espectro ultravioleta (Corrêa, 2015), portanto observar essa parte do espectro
aumenta o nível detalhes na captura de imagens.
Porém, para realizar a captura no espectro ultravioleta, as câmeras precisam
passar por adaptação, visto que o vidro comum absorve grande parte da luz
ultravioleta, principalmente pelo fato do vidro conter impurezas como sódio e
ferro em sua composição. Como as lentes que equipam o conjunto óptico das
câmeras são produzidos com vidro comum, grande parte da informação é
perdida. Para contornar esse efeito, câmeras de captura no ultravioleta utilizam
vidro puro, utilizando sílica pura para a sua fabricação, tornando esses
equipamentos mais caros e raros de serem encontrados no mercado.Figura 73: Acima, uma imagem capturada com espectro ultravioleta. Abaixo, a mesma
captura por meio do vidro de uma janela.
Fonte: Teledyne Lumenera.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://www.lumenera.com
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
135
A Visão Computacional está em constante evolução no mercado, recebendo
grandes aportes financeiros não apenas por parte de grandes empresas, mas
também financiamento destinado startups, impulsionando a pesquisa e a
aplicação em reconhecimento de objetos e cenas para a prevenção de crimes,
fraudes (Russel e Norvig, 2022) e demais aplicações de segurança.
Em atividades comerciais, sistemas de reconhecimento de objetos permitem
checkouts automáticos em lojas ou a verificação contra fraudes em guichês de
autoatendimento, como hoje encontramos em alguns supermercados aqui no
Brasil e em lojas no exterior. Um sistema simples, geralmente instalado sobre os
caixas de supermercados, realiza a captura de uma câmera, sendo utilizado para
verificar se houve desvio, erro ou furto de uma mercadoria.
Há sistemas completamente autônomos com o uso de Visão Computacional
combinado com Inteligência Artificial como é o caso de algumas lojas da rede
Decathlon presentes no Brasil e das lojas da rede Amazon Go em algumas
cidades dos Estados Unidos da América. Neste caso, o cliente realiza a entrada
na loja a partir de um QR code gerado no aplicativo de celular, realiza a compra,
colocando os itens da prateleira em sua sacola, realizando a saída da loja. O
sistema automaticamente rastreia o que foi retirado da prateleira pelo cliente,
insere em seu carrinho de compras virtual e ao sair da loja, debitando o valor da
compra de sua carteira de dinheiro ou cartão de crédito cadastrado no
aplicativo, facilitando o processo de compra, checkout e pagamento, além de
evitar fraudes e furto de itens no supermercado.
Figura 74: Rede de lojas que utiliza Visão Computacional
para automatizar completamente a experiência de compras.
Fonte: Amazon.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://www.amazon.com/b?ie=UTF8&node=16008589011
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
136
Outra aplicação na área de segurança é o reconhecimento óptico de
caracteres ou OCR (Optical Character Recognition) que pode reconhecer letras
tipográficas, de bastão ou caligráficas, transformando informação analógica em
digital. Este tópico será abordado mais à frente neste capítulo.
Em resumo, neste campo, interessa-nos a análise caligráfica para fins
periciais ou ainda os leitores automáticos de placa (Automatic Number Plate
Recognition em inglês, ou apenas ANPR) que permitem o monitoramento
contínuo de vias públicas e privadas (Szeliski, 2022), por exemplo, os sistemas de
inteligência policial que utilizam o LAP (Leitor Automático de Placa) para abordar
carros suspeitos ou com registro de sinistro, débito de impostos, furto ou roubo.
Pórticos instalados em rodovias, nas entradas das cidades e em vias
principais monitoram 24 horas o fluxo de veículos, reconhecendo
automaticamente as placas dos veículos que transitam naquele ponto (Russel e
Norvig, 2022).
A partir da aquisição da imagem, são extraídos os caracteres que compõem
aquela placa e comparados com o banco de dados de registro e também de
ocorrências, desta forma, se alguma anomalia é detectada, um alerta é gerado e
aquele veículo passa a ser acompanhado por autoridades humanas que
localizam e informam as equipes policiais que procederão com o cerco visando a
captura deste veículo e seus ocupantes.
Figura 75: Leitores Automático de Placas aumentam a segurança nas
cidades e também nas rodovias.
Fonte: imagem gerada por IA.
ABC 0D12
NORMAL
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
137
2.3.1.4.3. Reconhecimento facial e
biometria
Dentro da Visão Computacional há dois campos que se preocupam com a
identificação de pessoas a partir de dados praticamente únicos, intrinsecamente
ligados à nossa natureza humana.
No primeiro campo, o de reconhecimento facial, utilizam-se técnicas de
Visão Computacional para identificar pessoas por suas características faciais
(Szeliski, 2022), além de realizar a detecção de fadiga e emoções.
Enquanto que no segundo campo, o da a biometria, temos a capacidade de
identificar pessoas por suas características físicas, como impressões digitais
(Szeliski, 2022), íris ou voz.
Neste capítulo, será abordado o reconhecimento facial, com reconhecimento
de emoções, além do reconhecimento de voz, com um sólido embasamento,
atividades para aplicação do conceito.
Figura 76: A papiloscopia é o estudo da identificação humana pelas
impressões digitais, também conhecidas por papilas dérmicas.
Fonte: imagem gerada por IA.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
138
Quando a Visão Computacional é aplicada para biometria, podemos
distinguir pessoas a partir da análise dessas características que incluem pontos
faciais, como o nariz, olhos e boca, até características mais sutis, como a forma
do rosto ou a distância entre os olhos (Szeliski, 2022). Uma vez que essas
características faciais são extraídas, elas podem ser comparadas a um banco de
dados de características faciais conhecidas, chegando a uma correlação entre
uma pessoa previamente cadastrada e a pessoa da imagem sob análise.
É dessa forma que sistemas de segurança em ruas, avenidas, aeroportos,
entre outros locais públicos, detectam pessoas desaparecidas, suspeitas e até
foragidas da polícia. Se as características faciais forem semelhantes o suficiente,
o sistema de reconhecimento facial concluirá que a pessoa na imagem ou vídeo
é a mesma pessoa no banco de dados (Russel e Norvig, 2022), alertando o
responsável pelo sistema ou autoridade competente.
Outra tecnologia, famosa pelos filmes de ação e ficção, é o escaneamento de
íris, possibilitando a distinção de indivíduos. Essa tecnologia é muito utilizada
para o controle de acesso biométrico, assim como a biometria por impressão
digital e também voz (Russel e Norvig, 2022).
Figura 77: Scanner biométrico de íris.
Fonte: Wikimedia Commons.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://upload.wikimedia.org/wikipedia/commons/f/fc/IrisScanIraq.jpg
Trilha de Aprendizagem: Inteligência Artificial aplicada àVisão Computacional
139
Na área de automação predial, nos deparamos com o reconhecimento facial
biométrico para autenticar pessoas (Russel e Norvig, 2022), permitindo o acesso
a áreas internas de residências, edifícios e empresas ou áreas de circulação
restrita, como ocorre em hospitais, centros de pesquisa e indústrias.
Em marketing e áreas de monitoramento do consumo e da reação humana,
a Visão Computacional pode ser utilizada para guiar o desenvolvimento de uma
campanha a partir das reações do público, auxiliando na análise de
comportamento do consumidor.
Por exemplo, em campanhas políticas (Kissinger et al., 2023), o
reconhecimento facial pode mostrar a quais discursos um determinado público
está mais receptivo, fornecendo assim informações estratégicas para os
candidatos que podem, em tempo real, alterar o rumo de suas ações ao
detectarem sinais de repulsa por parte do eleitorado.
Figura 79: Visão Computacional aplicada para aferição da reação
de um público a um determinado discurso.
Fonte: imagem gerada por IA.
Figura 78: Sensor biométrico de impressão digital para controle de acesso.
Fonte: Wikimedia Commons.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://upload.wikimedia.org/wikipedia/commons/a/a0/PERCo_CL15_biometric_controller.jpg
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
140
2.3.1.4.4. Visão Computacional em
medicina e diagnóstico
No cenário médico, a Visão Computacional permite que sejam realizados
diagnósticos precisos (Russel e Norvig, 2022) a partir da classificação e análise
de um grande conjunto de dados (dataset) anteriores de diagnósticos.
Por exemplo, na área de oncologia, sinais de tumores podem ser
identificados a partir da Visão Computacional em seus primeiros estágios,
encaminhando o paciente para um tratamento precoce, melhorando a
expectativa de vida e a taxa de sucesso do tratamento contra o câncer. Estudo
apresentado recentemente acerca da detecção de tumores cerebrais,
demonstram uma precisão média (mAP) de 97,6% (Selcuk e Serif, 2023).
Figura 80: Representação artística criada de uma imagem de ressonância magnética.
Fonte: imagem gerada por IA.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
141
Continuando no campo de aplicações da Visão Computacional na área
médica, pesquisas recentes tratam da aplicação da Visão Computacional para a
detecção e diagnóstico de retinopatia diabética por meio do processamento de
imagens do fundo do olho, atingindo dessa forma a precisão comparável a dos
profissionais médicos que realizam o diagnóstico nessa área, equivalente a
índices entre 90% e 95% na precisão (Abini e Priya, 2023).
A aplicação consiste no uso de processamento de imagens para localizar
características como manchas, indicativas de sangramento ou exsudato na
retina, microaneurismas (pequenas dilatações dos vasos sanguíneos na retina) e
edema macular, caracterizado pelo acúmulo de líquido na mácula, região central
da retina, capaz de causar perda de visão.
Essa abordagem inovadora envolve o emprego de técnicas de Aprendizado
Profundo de redes neurais, treinando estes modelos para identificar a
retinopatia diabética em imagens do fundo do olho. Durante a etapa de
treinamento, conjuntos de dados contendo imagens com e sem retinopatia
diabética, promovendo a classificação das imagens nesses dois grupos, criando
um padrão reconhecimento mais preciso da condição.
Figura 81: Imagem de fundo de olho apresentando sinais comuns à retinopatia diabética.
Fonte: Wikimedia Commons.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://upload.wikimedia.org/wikipedia/commons/0/07/Fundus_-_diabetic_retinopathy.png
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
142
Por fim, o registro de um grande número de imagens usando ressonância
magnética funcional, extraindo informações emocionais faciais da atividade do
córtex visual humano, localizado no lobo occipital, na parte de trás do cérebro.
Por meio de Aprendizado de Máquina, imagens diagnósticas permite o
mapeamento cerebral antes e durante a execução de tarefas cognitivas ou de
entretenimento. A pesquisa de neuroimagem no córtex visual concentra-se
principalmente na decodificação da semântica dos estímulos visuais pois ainda
não está claro como o córtex visual pode representar a informação emocional
nas imagens (Yang et al., 2019).
Estes estudos fornecem aos médicos e pesquisadores informações sobre o
funcionamento das atividades cerebrais e possíveis diagnósticos, bem como
sobre o uso de fármacos mais adequados para a supressão ou estimulação de
regiões no cérebro afetadas por acidentes ou doenças degenerativas.
Figura 82: Imagem de ressonância magnética funcional apresentando a concentração
sanguínea na área do córtex visual de um paciente ao apresentar imagens de rostos à ele.
Fonte: Wikimedia Commons.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://upload.wikimedia.org/wikipedia/commons/e/ef/Fusiform_face_area_face_recognition.jpg
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
143
2.3.1.4.5. Aplicações em veículos
autônomos e drones
Veículos autônomos capazes de auto locomoção dentro das cidades são
dotados de sistema de Visão Computacional junto a tecnologias de detecção e
imageamento (Szeliski, 2022) como LIDAR (Light Detection and Ranging), RADAR
(Radio Detection and Ranging) e SONAR (Sound Navigation and Ranging).
Esse conjunto de informações capacita o hardware do veículo a navegar,
prever cenários e tomar decisões planejando rotas e evitando obstáculos e
situações perigosas durante a sua locomoção.
Temos a aplicação da Visão Computacional também para segurança
automotiva (Russel e Norvig, 2022), onde câmeras instaladas no exterior do
veículo processam dimensionalmente informações relativas à vagas de
estacionamento, presença de pessoas e objetos em “pontos cegos” de um
veículo. Já as câmeras internas do veículo podem fornecer o estado de atenção
de um motorista, detectando distrações e fadiga, evitando acidentes de trânsito.
Figura 83: Veículo autônomo da empresa Uber em teste.
Fonte: Wikimedia Commons.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://upload.wikimedia.org/wikipedia/commons/c/cf/Uber_testing_self-driving_car_%2832985799932%29.jpg
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
144
Na construçãocivil e também nas áreas de restauração e manutenção de
prédios, sejam eles históricos como castelos ou funcionais como usinas de
energia, o mapeamento por Visão Computacional (Szeliski, 2022) por meio de
fotogrametria obtida por drones colabora com técnicos e engenheiros.
Com a reconstrução tridimensional dos mesmos em modelos 3D para
computador, possibilita-se a verificação de falhas estruturais (Szeliski, 2022), a
realização de previsão de recursos e custos para a manutenção ou reparação
dessas estruturas, bem como serviços de vistoria, garantindo a qualidade da
estrutura como ocorre em torres com pás eólicas para a geração de energia
elétrica.
Figura 85: Inspeção de estruturas a partir de drones autônomos
dotados de Visão Computacional.
Fonte: Yang Zhou Jiuhong Xiao.
Figura 84: Inspeção de torre de telefonia celular com drone equipado de LIDAR e Visão Computacional.
Fonte: Parrot Drone.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://yangrobotics.com/autonomous-drone-inspection-with-deep-reinforcement-learning
https://www.parrot.com
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
145
2.3.1.4.6. Visão Computacional em robótica
Vamos agora para outro setor cuja aplicação da Visão Computacional
encontra aplicações, concentrando grandes somas de investimento para o
desenvolvimento de novas técnicas e aplicações.
Numa indústria, se uma câmera pode identificar objetos defeituosos na linha
de produção e removê-los da linha antes que sejam embalados, enviando-os
para reparo ou apenas descartando-os, estamos nos referindo a um hardware
de Visão Computacional (Russel e Norvig, 2022), os mesmos são dotados com
sistemas de Inteligência Artificial, permitindo o embarque direto na câmera
(hardware) de detecção.
Nas indústrias, a inspeção realizada pelo setor de qualidade pode ser feita a
partir de câmeras e Visão Computacional (Szeliski, 2022), garantindo a qualidade
dos produtos e a manutenção de elevados padrões para as grandes marcas.
Câmeras, no espectro visível ou até nos raios X (Szeliski, 2022), são
empregadas para a verificação do cumprimento às normas de tolerância
dimensional como na indústria automotiva e aeronáutica.
Figura 86: Câmeras de inspeção visual utilizando Visão Computacional podem verificar
a qualidade na montagem das componentes de placas de circuito impresso.
Fonte: Cognex.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://www.cognex.com
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
146
Podemos listar exemplos como na indústria de bebidas ou eletrônica, bem
como em manufatura avançada, em que câmeras mono ou estéreo realizam a
inspeção mecânica, apontando falhas em embalagens, rótulos e até circuitos
microeletrônicos.
Em logística, temos depósitos que utilizam a Visão Computacional na
peletização (Szeliski, 2022) e na classificação automática dos pacotes,
diferenciando destinos e agilizando o tratamento das encomendas.
Alguns sistemas também podem auxiliar na paletização, ou seja, no
agrupamento de itens iguais ou semelhantes, automatizando o trabalho manual
e aumentando a eficiência no processamento logístico, além de reduzir erros de
separação.
Por fim, já encontramos robôs como drones, AGVs (Automated Guided Vehicle,
em português Veículo Guiado Automaticamente) e AMRs (Autonomous Mobile
Robot, em português Robô Móvel Autônomo) que são capazes de navegar
dentro de armazéns (Szeliski, 2022), reconhecendo itens e seus locais de
armazenamento, realizar desde o transporte do mesmo para o despacho
multimodal como até a realização de inventário, registrando a quantidade de
itens armazenados.
Figura 87: AMRs utilizados em logística possuem sistema de posicionamento interno que
combinado com LIDAR, sensores de proximidade e choque operam de forma autônoma e segura.
Fonte: Jungheinrich.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://www.jungheinrich.com
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
147
2.3.2. Redes neurais e Deep Learning para a
Visão Computacional
Visto que já foram abordados a definição e o contexto histórico das redes
neurais no capítulo 2, dedicaremos esta seção a apresentar as aplicações das
redes neurais e do Aprendizado Profundo (Deep Learning) para a Visão
Computacional.
Atualmente, as redes neurais são aplicadas em diversas áreas da Visão
Computacional, destacamos streaming de imagens, modelagem 3D e
renderização (Szeliski, 2022).
Já, nas redes de Aprendizado Profundo, ocorre um processo similar ao que já
observamos em Aprendizado de Máquina (Szeliski, 2022), onde a otimização de
cada estágio deste processo e de seus parâmetros buscam minimizar o erro. As
atuais redes trabalham com feedforward, um tipo de arquitetura de rede neural
em que os dados não formam ciclos, eles atravessam a rede em apenas uma
direção. Essas redes são discriminativas e determinísticas, treinadas usando um
algoritmo de otimização conhecido como gradiente descendente como regra de
treinamento, também conhecido por retropropagação ou backpropagation.
A principal mudança quando comparamos o Aprendizado Profundo para
Visão Computacional contra as outras técnicas de Aprendizado de Máquina é
que evitamos a dependência de diversos estágios de pré-processamento que
extraiam recursos para os classificadores.
No início deste capítulo, buscamos apresentar as dificuldades de adaptação
na detecção de objetos utilizando Aprendizado de Máquina, exatamente por
causa dessa característica intrínseca do algoritmo, a sua dependência com esses
estágios de pré-processamento, algo que é superado quando utilizamos o
Aprendizado Profundo na Visão Computacional.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
148
2.3.3. Algoritmos mais comuns em Visão
Computacional
Sucintamente, listamos aqui os algoritmos que atualmente são empregados
em Visão Computacional, muitos dos quais você conhecerá mais a frente neste
capítulo.
Começando pelas Redes Neurais Convolucionais (CNNs), cuja utilização em
em tarefas de reconhecimento de imagens, detecção de objetos e segmentação
de imagens, torna este tipo de algoritmo excelente para identificar rostos,
objetos e cenas. Aplicações em redes CNN tridimensionais já são capazes de
reconhecer e classificar ações humanas além de processamento volumétrico de
objetos (Szeliski, 2022).
O SIFT (Scale-Invariant Feature Transform) possibilita a detecção e descrição
de características em imagens, o termo invariante à escala refere-se a sua
capacidade de detectar essas características em imagens de diferentes
tamanhos (Russel e Norvig, 2022), sendo muito utilizado para a detecçãode
faces em movimento. Temos também o SURF (Speeded Up Robust Features), uma
variação mais rápida do SIFT, utilizado para aplicações que necessitam de maior
eficiência como a navegação autônoma, como no caso dos veículos e robôs
autônomos. Além dos dois algoritmos anteriores, uma alternativa rápida
também muito empregada é o ORB (Oriented FAST and Rotated BRIEF), usado em
reconhecimento de objetos e emparelhamento de imagens, especialmente em
sistemas onde o tempo de processamento é crítico (visto que ele é mais rápido
que o SIFT e o SURF).
O filtro de Canny para detecção de bordas (Canny, 1986) é uma técnica
básica e poderosa para detectar bordas em imagens, há muito tempo útil em
várias aplicações, como reconhecimento de padrões e visão estéreo.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
149
Um algoritmo de destaque é o RANSAC (Random Sample Consensus) e suas
modificações (Szeliski, 2022) que podem deixá-lo com uma performance
superior. Eles são amplamente utilizados para estimar parâmetros de um
modelo matemático em dados com ruídos, principalmente em reconstrução 3D
ou alinhamento de imagens.
Outro algoritmo clássico é a transformada de Hough (em homenagem a seu
inventor), utilizada para detecção de formas geométricas, como linhas e círculos
(Szeliski, 2022), em aplicações como a análise de tráfego por meio de câmeras de
monitoramento.
Em detecção de faces, temor um algoritmo muito utilizado, a detecção de
características Haar (ou Haar Cascades), em homenagem à matemático húngaro
Alfred Haar, cuja abordagem se dará mais a frente desta obra.
Entre as arquiteturas mais modernas estão as GANs (Generative Adversarial
Networks), criadas por Goodfellow et al em 2014. Tratam-se de redes neurais
generativas adversárias, ou seja, duas redes neurais que competem entre si
(Szeliski, 2022). A primeira rede rede é chamada de gerador, sendo responsável
por gerar dados artificiais, enquanto a segunda rede é chamada de
discriminador, ficando responsável por distinguir entre dados reais e dados
artificiais.
Temos o algoritmo de segmentação semântica e de instâncias como a Mask
R-CNN que realiza a compreensão detalhada de uma cena. Há ainda as Redes
Neurais Recorrentes (RNNs) e o Long Short-Term Memory (LSTM) para aplicações
em que se faz necessário a interpretação da temporalidade dos dados como em
sequências de vídeo (Szeliski, 2022).
Ainda existem outros algoritmos e modificações sobre os aqui expostos, que
estão em constante evolução e desenvolvimento. Por tratar-se de um campo
promissor, trabalhos nesta área são naturalmente inevitáveis e constantes.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
150
2.3.4. Apresentando a plataforma Edge
Impulse
Iniciamos esta etapa com os primeiros passos na criação de uma conta
gratuita na plataforma de treinamento de Inteligência Artificial na nuvem
chamada Edge Impulse.
A Edge Impulse é uma plataforma de desenvolvimento que se concentra em
trazer Aprendizado de Máquina e Inteligência Artificial para dispositivos de
borda, conhecidos como edge devices, como microcontroladores (ou MCU,
acrônimo de MicroController Unit), sensores IoT (Internet of Things ou Internet das
Coisas) e pequenos computadores de placa única (SBC ou Single Board Computer)
como os Raspberry Pi.
Figura 88: Página inicial da plataforma Edge Impulse.
Para iniciar, você pode clicar em Get Started ou Login.
Fonte: adaptado de Edge Impulse.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://edgeimpulse.com
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
151
Para o nosso exemplo, visando a conceitualização do conhecimento e
promoção de um aprendizado hands on, necessitamos criar uma conta gratuita
na comunidade Edge Impulse. Vamos guiar você neste passo a passo.
Figura 89: Vamos criar uma conta pessoal e gratuita na comunidade Edge Impulse.
Fonte: adaptado de Edge Impulse.
Figura 90: Caso tenha escolhido Login, clique em Sign up
para criar sua conta na comunidade Edge Impulse.
Fonte: adaptado de Edge Impulse.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://edgeimpulse.com
https://edgeimpulse.com
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
152
A plataforma solicitará alguns dados para o cadastro, como nome completo,
nome de usuário, e-mail (pode ser o pessoal) e, opcionalmente, o seu título
profissional. O último campo solicita a criação de uma senha.
Figura 92: Você receberá um e-mail de ativação da Edge Impulse em sua caixa de entrada.
Clique no link que a plataforma enviou para ativar a sua conta.
Fonte: adaptado de Edge Impulse.
Figura 91: Preencha os dados solicitados pela plataforma Edge Impulse conforme indicação acima.
Fonte: adaptado de Edge Impulse.
Nome próprio
Nome de usuário
E-mail
Senha
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://edgeimpulse.com
https://edgeimpulse.com
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
153
2.3.5. Criando um assistente de voz com No
Code
Aproveitaremos o próprio tutorial de boas vindas da plataforma para realizar
os primeiros passos de um projeto na Edge Impulse.
Figura 93: Assim que você confirma sua conta e realiza o primeiro acesso, a plataforma sugere a criação do seu
primeiro projeto em 5 minutos. Clique em Let´s build your first model in 5 minutes! para prosseguir.
Fonte: adaptado de Edge Impulse.
Figura 94: Na segunda etapa, definiremos um comando para chamar o nosso assistente de voz.
Neste exemplo, sugerimos a sentença: “Ola mundo”.
Fonte: adaptado de Edge Impulse.
Palavra-chave
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://edgeimpulse.com
https://edgeimpulse.com
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
154
Você já deve ter notado que a plataforma está disponível no idioma inglês,
caso sinta-se melhor, você pode ativar o tradutor automático do navegador para
lhe ajudar na compreensão dos passos.
Nossas legendas, abaixo das figuras capturadas da tela, lhe ajudarão nesta
compreensão, listandoas etapas necessárias para a conclusão do projeto,
norteando o caminho desse primeiro aprendizado na plataforma.
Figura 96: Clique em Record yourself saying “Ola mundo” for 38 seconds
para gravar sua sentença para o treinamento.
Fonte: adaptado de Edge Impulse.
Figura 95: Após inserir a sentença “Ola mundo” clique em Next, collect some data
para prosseguir com o treinamento.
Fonte: adaptado de Edge Impulse.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://edgeimpulse.com
https://edgeimpulse.com
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
155
Figura 97: Você será perguntado se deseja compartilhar o acesso ao seu microfone pela
plataforma Edge Impulse. Clique em Permitir para prosseguir com o uso do microfone.
Fonte: adaptado de Edge Impulse.
Figura 98: Diga “Ola mundo”, realizando pausas de 1 segundo entre cada sentença.
Esses dados serão utilizados no modelo de reconhecimento de voz que estamos criando.
Fonte: adaptado de Edge Impulse.
Ao trabalhar na aquisição de dados, sejam eles para o treinamento ou para o
teste, pela plataforma Edge Impulse nos navegadores, podemos nos deparar
com a solicitação de uso do microfone ou câmera, portanto, mensagem desse
tipo serão comuns ao longo do nosso exemplo.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://edgeimpulse.com
https://edgeimpulse.com
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
156
Figura 100: Agora, inserimos ruído para diferenciar o comando de chamada do assistente voz
de outros ruído de fundo, para continuar clique em Next, adding other data.
Fonte: adaptado de Edge Impulse.
Figura 99: Após a captura bem sucedida do comando de voz para treinamento,
clique em OK para prosseguir.
Fonte: adaptado de Edge Impulse.
Após a etapa de captura de áudio por meio das sentenças, a plataforma
iniciará o processamento com a separação das frases que utilizará para
treinamento e validação das etapas mais a frente do nosso exemplo.
Automaticamente a plataforma realiza a separação de cerca de 80% das
amostras para treinamento e os demais 20% para validação (teste) do nosso
modelo treinado.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://edgeimpulse.com
https://edgeimpulse.com
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
157
Figura 102: Etapa de inserção de ruído finalizada, clique em OK para prosseguir.
Fonte: adaptado de Edge Impulse.
Figura 101: A plataforma realizará a mistura do ruído de fundo com as suas sentenças de voz gravadas.
Para prosseguir, clique em Let´s mix in other keywords and background noise.
Fonte: adaptado de Edge Impulse.
Nesta etapa, a plataforma insere sentenças e ruídos aleatórios para o nosso
treinamento, de forma a diferenciar a sentença “Ola mundo” de outras
sentenças.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://edgeimpulse.com
https://edgeimpulse.com
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
158
Figura 104: Depois da etapa de definição automática dos parâmetros para o
treinamento, clique em Next, spectrograms para prosseguir.
Fonte: adaptado de Edge Impulse.
Figura 103: Após a inserção dos dados e o processamento completo,
clique em Next, design an impulse para continuar.
Fonte: adaptado de Edge Impulse.
Após a adição de ruído e sentenças aleatórias chega a etapa de definição das
características e da extração dos parâmetros para o treinamento do modelo que
utilizaremos. Na plataforma, esta etapa é chamada de impulse.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://edgeimpulse.com
https://edgeimpulse.com
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
159
As etapas seguintes envolvem a verificação dos dados brutos utilizando o
espectrograma e a geração de características a partir dos dados coletados.
Figura 106: Após a configuração dos parâmetros, a plataforma irá gerar as características de cada amostra
enviada para treinamento. Após esta etapa, clique em Next, train a neural network para continuar.
Fonte: adaptado de Edge Impulse.
Figura 105: A análise do espectrograma (representação visual do sinal sonoro) é utilizada para a edição dos dados
brutos, excluindo partes que não são interessantes o treinamento. Para continuar clique em Next, generate features.
Fonte: adaptado de Edge Impulse.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://edgeimpulse.com
https://edgeimpulse.com
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
160
Finalizando o treinamento, já podemos realizar nossos primeiros testes.
Figura 108: Para testar o modelo, você deve permitir novamente o acesso ao microfone,
para isso clique em Give access to the microfone.
Fonte: adaptado de Edge Impulse.
Figura 107: Na etapa de treinamento da rede neural é onde ocorre a classificação da sentença “Ola mundo”.
Após esta etapa, clique em Next, take the model for a spin para prosseguir com o exemplo.
Fonte: adaptado de Edge Impulse.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://edgeimpulse.com
https://edgeimpulse.com
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
161
Figura 110: Para finalizar a etapa de testes, clique em Next, check out next steps.
Fonte: adaptado de Edge Impulse.
Realize o teste do seu modelo, note que ao falar “Ola mundo”, a plataforma
informa a correspondência da sentença pronunciada com o modelo gerado.
Figura 109: Ruídos e sentenças desconhecidas aparecem em NOISE e UNKNOWN, respectivamente. Quando o
modelo detecta a sentença “Ola mundo”, a correspondência próxima a 1,00 surge na coluna central (OLA_MUNDO).
Fonte: adaptado de Edge Impulse.
Sentenças
desconhecidasRuído Ola mundo
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
ove
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://edgeimpulse.com
https://edgeimpulse.com
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
162
Encerrar
Figura 111: A plataforma apresenta os principais dados do seu projeto, como o tempo de inferência, a quantidade
de memória RAM e Flash a ser utilizada caso venha a embarcar este modelo em um microcontrolador Cortex M4F.
Fonte: adaptado de Edge Impulse.
Acessar a documentação
Compartilhar
Figura 112: Entre as informações mais importantes de um projeto estão
a matriz de confusão e a acurácia do modelo.
Fonte: adaptado de Edge Impulse.
Acurácia do modelo
Parabéns! Você concluiu seu primeiro projeto No Code utilizando redes
neurais para o treinamento de um modelo.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://edgeimpulse.com
https://edgeimpulse.com
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
163
Figura 113: Neste exemplo, criamos um modelo similar ao utilizado pelos
assistentes de voz para ativar a detecção e ouvir as nossas solicitações.
Fonte: adaptado de Edge Impulse.
Neste momento, retorne ao Google Sala de Aula e, na aba
"Atividades", procure a seção intitulada "Etapa Conceitualizar".
Nessa área você encontrará uma série de links com materiais
que foram criteriosamente escolhidos e disponibilizados. Trata-se
de recursos que têm por objetivo apresentar informações
adicionais e insights, permitindo que você amplie e enriqueça o seu
conhecimento acerca dos temas discutidos neste capítulo.
Este momento final do capítulo deve lhe proporcionar reflexões
críticas a respeito do conteúdo abordado, ajudando na
compreensão e fixação do conteúdo.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://edgeimpulse.com
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
164
2.4. Consolidar
2.4.1. Estudo de caso
Chegamos na etapa onde podemos exercitar o conhecimento adquirido até
aqui! Note que esta não é uma atividade obrigatória e não consta do processo
de avaliação.
Aqui, sugerimos a prática da criação de um modelo de reconhecimento de
objetos, em nosso caso, um smartphone, utilizando a plataforma Edge Impulse.
A plataforma Edge Impulse, no momento em que escrevemos este material,
possui a capacidade de realizar o treinamento de modelos para a detecção de
voz (exemplo utilizado dentro da etapa Conceitualizar), modelo para a detecção
de gestos e também modelos de reconhecimento de objetos em sequências de
vídeo ou em imagens.
Vamos apresentar os passos para a realização desta atividade, a partir dela,
você pode realizar outros treinamentos de modelo para a aplicação que desejar.
Figura 114: Para criar um novo projeto, você de retornar à dashboard inicial da Edge Impulse. Para isso,
clique em Projects (B) no menu suspenso da parte superior onde encontram-se as iniciais do seu nome (A).
Fonte: adaptado de Edge Impulse.
A
B
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://edgeimpulse.com
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
165
Figura 116: Descendo a página inicial do projeto, você encontrará tutoriais que irão lhe ajudar nas
etapas de configuração para aquisição e treinamento do modelo, recomenda-se a leitura.
Fonte: adaptado de Edge Impulse.
O primeiro passo é definir o nome e as opções de privacidade do projeto.
Figura 115: Aqui, sugerimos o nome “Reconhecimento de objetos”, opção de projeto pessoal (Personal)
e privacidade no projeto (Private). Em seguida, clique em Create new project para continuar.
Fonte: adaptado de Edge Impulse.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://edgeimpulse.com
https://edgeimpulse.com
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
166
Aqui, iniciamos a coleta de dados. Para isso, utilizaremos a câmera.
Figura 118: Para utilizar a câmera do seu computador, clique em Connect to your computer.
A plataforma realizará a requisição para uso do seu dispositivo.
Fonte: adaptado de Edge Impulse.
Figura 117: Para realizar a coleta de dados para o projeto, clique em Collect new data. Você também pode incluir
outros dispositivos como SBCs e MCUs para realizar esta etapa, caso tenha eles à disposição.
Fonte: adaptado de Edge Impulse.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://edgeimpulse.com
https://edgeimpulse.com
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
167
Após a conexão da plataforma Edge Impulse com o seu computador,
seguiremos para a etapa de permissão de acesso à câmera.
Note que você precisa ter um smartphone para realizar a captura dessas
imagens para treinamento do modelo.
Figura 120: Clique em Give access to the camera para prosseguir à etapa de aquisição de imagens.
Caso o navegador solicite a sua permissão para utilização da câmera, clique em Permitir.
Fonte: adaptado de Edge Impulse.
Figura 119: Após a conexão do computador ao projeto, clique em Collect images? para iniciar a aquisição
utilizando a câmera do computador. Note que será aberta uma nova aba no seu navegador.
Fonte: adaptado de Edge Impulse.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://edgeimpulse.com
https://edgeimpulse.com
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
168
Sugerimos a coleta de 100 imagens, a plataforma irá separar
automaticamente as imagens que serão utilizadas para treino e as de teste.
Figura 121: Para realizar a aquisição da imagem, clique em Capture.
A cada captura, a contagem de imagens capturas é atualizada.
Fonte: adaptado de Edge Impulse.
Figura 122: Capture imagens em diferentes posições do smartphone, assim o seu modelo ficará mais preciso. Ao
atingir 100 imagens capturadas, você pode fechar esta aba de captura (clique no X da aba aberta no navegador).
Fonte: adaptado de Edge Impulse.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://edgeimpulse.com
https://edgeimpulse.com
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
169
Seguimos para a etapa de definição dos parâmetros para o treinamento.
Figura 124: Após a inserção das imagens (dados brutos), clicaremos em Labeling queue
para criar os rótulos dos objetos identificados na imagem, em nosso exemplo, o smartphone.
Fonte: adaptado de Edge Impulse.
Figura 123: A plataforma confirmará se estamos criando um modelo para detecção de objetos,
neste caso clique em Yes para prosseguir.
Fonte: adaptado de Edge Impulse.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://edgeimpulse.com
https://edgeimpulse.com
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
170
Agora, identificaremos o smartphone em nossas fotos para o treinamento.
Figura 126: Ao realizar a seleção da área onde está o smartphone pela primeira vez, a plataforma perguntará
qual o nome do rótulo para este objeto. Você pode usar celular ou smartphone, ao seu critério.
Fonte: adaptado de Edge Impulse.
Figura 125: Com o mouse ou touchpad, selecione o smartphone na imagem.
Você terá uma caixa retangular à disposição para isso.
Fonte: adaptado de Edge Impulse.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://edgeimpulse.com
https://edgeimpulse.com
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
171
A contagem de itens restantes é atualizada a cada confirmação de rótulo.
Figura 128: Deixar a opção Track objects between frames irá lhe ajudar mantendo o objeto rastreado
entre as imagens obtidas, diminuindo parte do trabalho manual de rotulação.
Fonte: adaptado de Edge Impulse.
Figura 127: Note que na primeira foro a ser classificada, a plataforma irá indicar a quantidade de fotos restantes
para a classificação. Após inserir o rótulo e sua área em torno do objeto a ser classificado clique em Save labels.
Fonte: adaptado de Edge Impulse.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://edgeimpulse.com
https://edgeimpulse.com
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
172
Figura 129: Lembre-se de realizar rotações no smartphone para que a captura de imagens do aparelho
seja realizada na maior quantidade de posições possíveis, melhorando o nosso modelo.
Fonte: adaptado de Edge Impulse.
Figura 130: A área de seleção do rótulo deve conter integralmente o smartphone,
para que o modelo seja treinado corretamente.
Fonte: adaptado de Edge Impulse.
É necessária a aquisição de imagens do smartphone em diversas posições.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://edgeimpulse.com
https://edgeimpulse.com
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
173
Finalizamos assim a etapa de rotulação do objeto dentro das imagens de
treinamento. Podemos prosseguir para a próxima etapa.
Figura 131: A última imagem para rotular será indicada na parte superior como 1 items left.
Ao concluir, clique em Save labels para finalizar a etapa de rotulação.
Fonte: adaptado de Edge Impulse.
Figura 132: Ao terminar a rotulação, você terá informação na parte superior o índice zero em Labeling queue (0) e
próximo ao centro da página em No items in queue. Para prosseguir na próxima etapa, clique em Create impulse.
Fonte: adaptado de Edge Impulse.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://edgeimpulse.com
https://edgeimpulse.com
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
174
Agora vamos definir os parâmetros para realizar o treinamento de nosso
modelo de reconhecimento de objeto.
Figura 134: Selecione Image e clique em Add para utilizar o bloco de processamento para imagens.
Fonte: adaptado de Edge Impulse.
Figura 133: Clique em Add a processing block para selecionar o tipo de modelo que estamos treinando.
Fonte: adaptado de Edge Impulse.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://edgeimpulse.com
https://edgeimpulse.com
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
175
Figura 136: Escolha a opção Object Detection (Images) de autoria da Edge Impulse
e clique em Add para utilizar este bloco de treinamento.
Fonte: adaptado de Edge Impulse.
Finalizando a etapa de criação do impulse com o bloco de treinamento.
Figura 135: Clique em Add a learning block, para selecionar o bloco de
treinamento (modelo de rede) que utilizaremos.
Fonte: adaptado de Edge Impulse.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://edgeimpulse.com
https://edgeimpulse.com
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
176
Clique em Save Impulse para escolher os parâmetros para a classificação.
Figura 137: Depois de clicar em Save Impulse, você receberá a confirmação que os blocos de processamento e
de treinamento foram gravados com sucesso. Clique em Image no menu à esquerda para prosseguir.
Fonte: adaptado de Edge Impulse.
Figura 138: Para configurar os parâmetros de treinamento, primeiro selecione Grayscale (escala de cinza).
Em seguida, clique em Save parameters para prosseguir.
Fonte: adaptado de Edge Impulse.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://edgeimpulse.com
https://edgeimpulse.com
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
177
Figura 139: Clique em Generate features para iniciar iniciar
a geração das características para o treinamento.
Fonte: adaptado de Edge Impulse.
Figura 140: Após a conclusão do trabalho de geração das características, clique
em Object detection, no menu à esquerda para prosseguir à próximaetapa.
Fonte: adaptado de Edge Impulse.
A etapa de geração de características é essencial para o treinamento.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://edgeimpulse.com
https://edgeimpulse.com
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
178
Figura 142: Para iniciar os ciclos de treinamento clique em Start training. Essa etapa é a
mais demorada do processo, por favor, aguarde a conclusão para continuar.
Fonte: adaptado de Edge Impulse.
Figura 141: A plataforma realiza uma sugestão de 60 ciclos de treinamento (Number of training cycles).
Não altere a taxa de aprendizado (Learning rate), mantendo-a em 0.001.
Fonte: adaptado de Edge Impulse.
Ajustando as configurações importantes para a realização do treinamento.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://edgeimpulse.com
https://edgeimpulse.com
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
179
Figura 143: O treinamento encerra no ciclo 59 pois iniciou sua contagem no 0.
Caso utilize 100 ciclos de treinamento, a conclusão ocorrerá no ciclo 99.
Fonte: adaptado de Edge Impulse.
Figura 144: A acurácia do treinamento é exibida no F1 SCORE, em nosso caso, 100%. Esse parâmetro também é
conhecido como mAP (mean Average Precision), uma métrica usada para avaliar a qualidade do modelo treinado.
Para continuar, clique em Live classification no menu à esquerda. Fonte: adaptado de Edge Impulse.
A última etapa envolve o treinamento do nosso modelo de reconhecimento.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://edgeimpulse.com
https://edgeimpulse.com
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
180
Figura 146: Clique agora em Connect to your computer para
acessar a câmera do seu computador.
Fonte: adaptado de Edge Impulse.
Figura 145: Para abrir a câmera e testar o nosso modelo, clique sobre o ícone de
microchip indicado pela seta laranja na imagem acima.
Fonte: adaptado de Edge Impulse.
Vamos testar nosso modelo? Para isso, necessitamos novamente do acesso à
câmera do computador. Estamos chegando ao final do nosso exemplo.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://edgeimpulse.com
https://edgeimpulse.com
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
181
Figura 148: Em seguida, permita o acesso à câmera do computador.
Fonte: adaptado de Edge Impulse.
Figura 147: Na nova aba aberta, primeiro mudaremos para o modo de classificação.
Para isso, clique em Switch to classification mode.
Fonte: adaptado de Edge Impulse.
Ao conectar o computador e solicitar o microfone ou câmera, há sempre dois
modos. O modo de aquisição de imagens ou sons para o treinamento do
modelo ou o modo de classificação em tempo real, para validação do modelo.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://edgeimpulse.com
https://edgeimpulse.com
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
182
Figura 149: Reconhecimento do smartphone utilizado no treinamento.
Fonte: adaptado de Edge Impulse.
Figura 150: Teste com dois smartphones, um utilizado no modelo e outro aparelho de marca e modelo diferente.
Note que o modelo reconheceu corretamente os dois aparelhos.
Fonte: adaptado de Edge Impulse.
Finalizado o treinamento, experimente testar o seu modelo colocando o
smartphone em várias posições, se possível inclua outro aparelho ou troque de
modelo para testar se o modelo o reconhece também.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://edgeimpulse.com
https://edgeimpulse.com
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
183
2.4.2. Solução final do estudo de caso
Agora, aproximando-se da etapa final do capítulo de Introdução à Visão
Computacional, propomos que utilize a plataforma Edge Impulse para criar um
modelo de reconhecimento de objeto utilizando No Code.
O ponto de partida é revisitar o arquivo no qual você fez o planejamento da
aplicação que você registrou na "Etapa Inspirar".
Em seguida, escolha um objeto que deseja identificar, como realizamos com
o smartphone. Verifique possíveis aprimoramentos no seu planejamento e, se
for preciso, reescreva-o.
Planejar o que será feito é essencial para que o desenvolvimento de seu
projeto seja mais assertivo. Teste o modelo criado, procure pontos fortes na
detecção e pontos fracos em que o modelo não funciona corretamente.
Inicialmente, releia com atenção o cenário do estudo de caso da
"Etapa Inspirar" e as suas anotações e conclusões iniciais. Na
sequência, você deverá promover o aprimoramento da solução
anteriormente apresentada usando os conhecimentos que obteve
ao longo do capítulo e do conteúdo adicional.
Lembre-se de que este aprimoramento não será objeto de
correção ou avaliação: trata-se de uma atividade individual que
deverá lhe ajudar a refletir sobre os conceitos que foram estudados
e a testar novos cenários e hipóteses, validando os seus resultados
práticos.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
184
Arquive o refinamento do estudo de caso no formulário disponível
no Google Sala de Aula, na aba “Etapa Consolidar”.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
185
2.5. Avaliar
Para concluir este capítulo, você deverá realizar a “Etapa Avaliar”, que
consiste no preenchimento do Questionário de Avaliação disponível no Google
Sala de Aula e que tem como objetivo permitir que você acompanhe
individualmentea evolução do seu aprendizado.
Não será atribuída nota para a atividade, mas a sua entrega é obrigatória,
pois, acima de tudo, servirá como insumo para uma análise pessoal e também
para a realização de autocrítica a respeito dos pontos compreendidos e daqueles
que exigem maior dedicação.
O formulário salvará as respostas de forma automática e, por isso, pode ser
iniciado em um momento e finalizado posteriormente. Ele também será
disponibilizado a você, para que faça consultas futuras. Além dos materiais
didáticos fornecidos, você poderá usar quaisquer outros recursos e referências.
Todavia, atente para o fato de que poderá respondê-lo somente uma vez.
O registro e envio das respostas é individual e deve ser realizado dentro do
prazo estipulado para a realização do curso.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
186
Referências
ABINI, M. A.; PRIYA, S. Sridevi Sathya, Detection and Classification of Diabetic
Retinopathy Using Pretrained Deep Neural Networks. International
Conference on Innovations in Engineering and Technology (ICIET),
Muvattupuzha, Índia, 2023, pp.1-7.
BENGIO, Yoshua; COURVILLE, Aaron; VINCENT, Pascal. Representation
Learning: A Review and New Perspectives. IEEE Transactions on Pattern
Analysis and Machine Intelligence, Vol. 35, No. 8, Ago. 2013, pp.1798-1828.
CANNY, John. A Computational Approach to Edge Detection. IEEE Transactions
on Pattern Analysis and Machine Intelligence, Vol. PAMI-8, No. 6, Nov. 1986,
pp.679-698.
CHEN, Wei et al. Deep Learning for Instance Retrieval: A Survey. IEEE
Transactions on Pattern Analysis and Machine Intelligence, Vol. 45, No. 6, Jun.
2022, pp.7270-7292.
CORRÊA, Marcelo de Paula. Solar ultraviolet radiation: properties,
characteristics and amounts observed in Brazil and South America.
Continuing Medical Education. Anais Brasileiros de Dermatologia, Vol. 90, No. 3,
2015, pp.297-313.
DAVIES, E. R. Machine Vision: Theory, Algorithms, Practicalities. Morgan
Kaufmann, Massachusetts, 2005.
FORSYTH, David A.; PONCE, Jean. Computer Vision: A Modern Approach.
Pearson, Harlow, 2015.
GRIEBEL, Ulrike. Color Vision in Marine Mammals: A Review. ResearchGate,
Jan, 2002. Disponível em: https://www.researchgate.net/publication/228484862 .
Acesso em: 15 jan. 2024.
GOODFELLOW, Ian J. et al. Generative Adversarial Networks. Arxiv, Jun, 2014.
Disponível em: https://arxiv.org/pdf/1406.2661.pdf . Acesso em: 20 jan. 2024.
KISSINGER, Henry A.; SCHMIDT, Eric; HUTTENLOCHER, Daniel. A Era da IA e
nosso futuro como humanos. Alta Books, Rio de Janeiro, 2023.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
187
LIAN, Naixiang; CHANG, Lanlan; TAN, Yap-Peng. Improved color filter array
demosaicking by accurate luminance estimation. IEEE International
Conference on Image Processing, 2005.
MARR, David. Vision: A Computational Investigation into the Human
Representation and Processing of Visual Information. The MIT Press,
Londres, 2010.
MINSKY, Marvin. Steps Toward Artificial Intelligence. McGraw-Hill, Nova
Iorque, 1961.
RUSSEL, Stuart; NORVIG, Peter. Artificial Intelligence: A Modern Approach.
Prentice Hall, Nova Jersey, 2022.
SELCUK, Burcu; SERIF, Tacha. Brain Tumor Detection and Localization with
YOLOv8. 8th International Conference on Computer Science and Engineering
(UBMK), Burdur, Turquia. 2023, pp.477-481.
SZELISKI, Richard. Computer Vision: Algorithms and Applications. Springer,
Nova Iorque, 2022.
YANG, Qiang et al. Decoding Facial Emotion from Activity in The Human
Visual Cortex using Functional Magnetic Resonance Imaging. International
Conference on Medical Imaging Physics and Engineering (ICMIPE), Shenzhen,
China, 2019, pp.1-5.
YOU, Haoxuan et al. Ferret: Refer and Ground anything anywhere any
granularity. Arxiv, Out, 2023. Disponível em:
https://arxiv.org/pdf/2310.07704.pdf . Acesso em: 17 jan. 2024.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
Capítulo 3:
Python para
desenvolvimento de
Inteligência Artificial:
do básico às aplicações
avançadas
Autoras
Adriana da Silva Nogueira
Larissa de Oliveira Figueira
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
189
3.1. Introdução
Desejamos boas vindas ao capítulo Python para Desenvolvimento de
Inteligência Artificial: do básico às aplicações avançadas! Este conteúdo foi
desenvolvido para ajudar no aprendizado na linguagem de programação
Python, iniciando com os fundamentos e avançando até algumas das técnicas
utilizadas em aplicações de IA.
O capítulo inicia com uma introdução ao Python, explorando os elementos
básicos e a aplicabilidade prática da linguagem, o que é essencial para
estabelecer uma base sólida antes de nos aprofundarmos em conceitos mais
complexos. A seguir, o conteúdo se concentra nos comandos essenciais, que
são cruciais para qualquer programador, seguidos por uma exploração aos
tipos de dados, variáveis, constantes e comandos de entrada - todos elementos
fundamentais para a manipulação de dados.
Avançará para o controle de fluxo, uma habilidade chave para desenvolver
lógicas complexas em seus códigos, além de conceitos relacionados a funções e
modularidade, conhecimentos indispensáveis para manter seu código
organizado e eficiente.
Com um foco especial em bibliotecas específicas utilizadas em IA,
fornecemos uma base sólida para aplicações mais avançados e exploramos as
estruturas de dados, essenciais para o tratamento eficaz e eficiente de grandes
conjuntos de dados em IA.
Abordamos, ainda, manipulação de arquivos e strings, uma competência
fundamental para a gestão de dados e apresentamos ferramentas de
desenvolvimento como VSCode, PyCharm, Google Colab e Jupyter Notebook,
que permitem otimizar o fluxo de trabalho.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
190
Ao final deste capítulo, você terá não apenas compreendido os conceitos
fundamentais do Python, mas também terá adquirido habilidades práticas para
enfrentar desafios no campo da IA.
Figura 151: Analogia à linguagem Python.
Fonte: imagem gerada por IA.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
191
3.2. Inspirar
Você já ouviu falar sobre a linguagem de programação Python? Essa
linguagem tem ganhado destaque mundialmente, tornando-se a escolha de
muitos devido à sua versatilidade e eficiência. É notável como Python está se
tornando uma ferramenta essencial em diversas áreas, incluindo
desenvolvimento web, ciência de dados e Inteligência Artificial.
Diante dessa expansão tecnológica, algumas pessoas podem ter receios
sobre aprender uma nova linguagem de programação. No entanto, como
aponta Silva (2022),
“[...] essas dúvidas frequentemente surgem por falta de familiaridade
com o campo. Muitos deixam de perceber o potencial que o domínio do
Python oferece, não só para o desenvolvimento profissional, mas também
para a compreensão de como a tecnologia molda nosso mundo.”
Com a crescente demanda por automação e inovação, o Python se torna
uma habilidade cada vez mais valiosa, abrindo diversas oportunidades.
Em uma recente entrevista à revista 'Tecnologia Hoje', Carlos Mendes
(2023), diretor de inovação da Tech Solutions, destacou: “no futuro, muitas
funções que hoje são manuais serão automatizadas por meio de linguagens como o
Python. Isso não significa a eliminação de empregos, mas a transformação deles.”.
E como se preparar profissionalmente para esse futuro tecnológico?
Mendes (2023) ressalta: “o diferencial estará na capacidade do profissional de se
adaptar, aprender continuamente e dominar ferramentas tecnológicas, como o
Python, para permanecer relevante no mercado”.
Por sua versatilidade e abrangência o Python pode ser utilizado em diversas
áreas. Uma das áreas que podemos destacar é o desenvolvimento web, no qual
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
192
a linguagem é frequentemente usada para desenvolver websites e aplicações
web por meio do uso de ferramentas disponibilizadas para facilitar o processo
de desenvolvimento.
Em Ciência de Dados e Análise de Dados, o Python torna-se uma escolha
popular devido a bibliotecas como Pandas, NumPy, que facilitam a manipulação
de dados, análise estatística, e Machine Learning e que serão tratadas neste
capítulo. Embora não seja tão popular quanto outras linguagens, pode ser
usado em jogos, especialmente para scripting e prototipagem rápida. Pygame é
uma biblioteca popular para desenvolvimento de jogos.
Além disso, é uma linguagem útil para automação de redes, scripting de
servidores e administração de sistemas. Na área de análise financeira, pode ser
usado para análise de dados, algoritmos de trading automatizado, e
modelagem de risco.
Existe, ainda, diversos pacotes (bibliotecas) que permitem desenvolver
sistemas de Inteligência Artificial e Aprendizado de Máquina que serão tratados
neste e em outros capítulos deste material.
Resumindo, o objetivo principal deste capítulo é proporcionar uma
compreensão sólida e abrangente da linguagem de programação Python,
fornecendo as habilidades necessárias para desenvolver e implementar
aplicações variadas, com um enfoque especial nas áreas relacionadas à
Inteligência Artificial. O material visa construir uma base robusta em
programação, desde a instalação e configuração do ambiente de
desenvolvimento até conceitos avançados como manipulação de dados,
estruturas de dados e uso de bibliotecas específicas para IA.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
193
Antes de iniciarmos a "Etapa de Conceitualização" na qual
haverá a apresentação do conteúdo e a experimentação dos
conceitos trabalhados por meio de atividades práticas, entre no
Google Sala de Aula, na aba "Etapa Inspirar", para acessar todos
os materiais disponibilizados, que visam a estimular sua reflexão e
iniciar a ambientação com o conteúdo deste capítulo.
Como última atividade desta etapa, prepare-se para trabalhar a
solução inicial do estudo de caso que será apresentado na
próxima seção.
A solução inicial que você elaborará não será objeto de
correção ou avaliação: trata-se de uma atividade individual que
deverá lhe ajudar a refletir sobre os conceitos apresentados e a
entender como trabalhá-los de maneira prática.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
3.2.1. Estudo de Caso
Este estudo de caso visa promover a reflexão acerca do uso do Python no
desenvolvimento de soluções para variados setores. A meta central é destacar a
flexibilidade desta linguagem e oferecer perspectivas para projetos vindouros.
3.2.1.1. Cenário
A Facti, uma Instituição Científica e Tecnológica (ICT) privada reconhecida
por sua atuação no mercado de Tecnologias da Informação e Comunicação
(TICs), está em meio a uma fase de expansão. Com o objetivo de atender à
crescente demanda por soluções nos seus projetos de Pesquisa,
Desenvolvimento e Inovação (PD&I), a instituição está à procura de novos
talentos. Em particular, a Facti busca alguém com conhecimento em Python
para integrar a sua equipe de desenvolvedores.
Você, uma pessoa com interesse, paixão e ambição, recebeu a
oportunidade para se juntar à equipe da Facti, que, como parte do processo
seletivo e para demonstrar a amplitude de suas habilidades, propôs um desafio
estimulante: desenvolver uma aplicação em Python que não só mostre as suas
194
Leia com atenção o cenário do estudo de caso e lembre-se: o
propósito desta atividade é promover uma reflexão inicial acerca do
assunto a ser discutido no cenário tendo por base somente os
conhecimentos de que você dispõe neste momento.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
195
habilidades técnicas mas também,evidencie a sua capacidade de contribuir
significativamente para as aplicações em Inteligência Artificial, um aspecto
crucial no ciclo de desenvolvimento de software da ICT.
O sucesso nesta tarefa poderia significar não apenas uma posição na
equipe da Facti, mas também a chance de moldar o futuro das soluções
tecnológicas. Prepare-se para aprimorar suas competências em Python e
descobrir inovações e contribuições relevantes na área tecnológica.
Com base nas informações apresentadas, escreva uma proposta teórica
detalhada de uma aplicação que contemple os requisitos referentes ao
processo seletivo daFacti e que você considere interessante para ser
desenvolvido após o aprendizado do conteúdo deste capítulo. Esta proposta
não requer conhecimento técnico prévio, mas a organização de ideias, em um
esboço, que poderá se transformar em um projeto inovador.
Importante: coloque a sua resposta na atividade
"Apresentação da solução inicial", no Google Sala de Aula, em
um documento no formato de texto. Utilize este momento para
trabalhar as suas ideias iniciais com o máximo de detalhamento que
puder. Mais adiante, as suas anotações serão retomadas para o
refinamento da solução do estudo de caso.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
196
3.3. Conceitualizar
3.3.1. De onde vem a linguagem Python?
O Centro de Matemática e Ciência da Computação (CWI), situado na capital
da Holanda, Amsterdã, é o berço de diversas linguagens de programação. Foi a
partir de 1982, nas instalações do CWI, que os estudos iniciados culminaram no
desenvolvimento da linguagem Python. Em 1989, Guido van Rossum (Figura
152), programador e membro do projeto ABC, ao enfrentar dificuldades na
implementação de um programa em linguagem C, decidiu criar uma linguagem
de programação capaz de resolvê-las. Surgiu então a proposta que se tornaria a
linguagem Python.
A intenção era criar uma linguagem interpretada, com comandos de fácil
compreensão. Van Rossum considerava que os programas em C eram extensos
e de difícil entendimento, especialmente para programadores menos
experientes.
Figura 152: Guido van Rossum.
Fonte: Peter Adams Photo.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://www.peteradamsphoto.com/guido-van-rossum-2/
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
Após criar a linguagem, surgiu o desafio de nomeá-la. Dentro do CWI,
existia um padrão de nomeação para projetos internos, relacionado à televisão
ou a programas televisivos. Assim, Van Rossum decidiu batizar a linguagem em
homenagem ao seu programa de humor favorito, o Monty Python’s Flying Circus,
dando-lhe o nome de Python. Apesar do símbolo ser uma serpente e
contrariando expectativas, o nome da linguagem não tem origem na serpente
píton, mas sim no programa de comédia.
Atualmente, a linguagem Python está na versão 3.12.1, lançada em 2023.
Os scripts em Python têm a extensão .py.
É uma das linguagens de programação mais populares do mundo, sendo
utilizada em uma ampla variedade de aplicações, incluindo ciência de dados,
Aprendizado de Máquina, Inteligência Artificial, web, desenvolvimento de
software e muito mais.
A Python Software Foundation é uma organização sem fins lucrativos que
coordena o desenvolvimento da linguagem.
3.3.1.1. Porque escolher o Python para
programar?
Existem várias razões pelas quais muitas pessoas escolhem Python como
sua linguagem de programação. Veja algumas das mais comuns:
● Sintaxe¹ clara e concisa: a sintaxe de Python é simples e fácil de ler, o que
facilita a aprendizagem, especialmente para iniciantes em programação.
197
¹A sintaxe de programação refere-se ao conjunto de regras que define a combinação de símbolos que são
considerados um programa válido em uma linguagem de programação. Em outras palavras, é a forma como as
instruções são escritas e organizadas para que o computador as entenda e execute.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
198
● Versatilidade e aplicações diversas: Python é uma linguagem de
propósito geral, o que significa que pode ser utilizada em uma ampla
variedade de domínios, como desenvolvimento web, automação, ciência de
dados, Inteligência Artificial, Aprendizado de Máquina, automação de
tarefas, entre outros.
● Comunidade² ativa e suporte: Python tem uma comunidade enorme e
ativa. Isso significa que há uma vasta quantidade de recursos, bibliotecas³ e
módulos disponíveis. Além disso, é fácil encontrar suporte e soluções para
problemas comuns.
● Bibliotecas poderosas: Python possui uma rica coleção de bibliotecas e
frameworks que facilitam o desenvolvimento em diversas áreas. Por
exemplo, o Django e o Flask para desenvolvimento web, NumPy e Pandas
para manipulação de dados, TensorFlow e PyTorch para Aprendizado de
Máquina, entre outros.
● Portabilidade: Python é conhecido por ser portátil, o que significa que o
código escrito em Python pode ser executado em diversas plataformas sem
a necessidade de modificações significativas.
● Aprendizado rápido: devido à sua sintaxe simples e clara, Python é
frequentemente recomendado como a primeira linguagem para iniciantes
em programação. Isso facilita o aprendizado dos fundamentos da
programação.
² Dentro do contexto de programação, uma comunidade é definida como um grupo de pessoas que compartilham
objetivos comuns, se reunindo com a intenção de trocar ideias, programar eventos como workshops e palestras, e
se atualizar sobre tendências e demandas do mercado. Esses grupos são formados por programadores e são
utilizados para suporte mútuo, aprendizado e compartilhamento de conhecimentos.
³Em programação, bibliotecas são conjuntos de códigos pré-escritos que os programadores podem utilizar para
realizar tarefas comuns sem a necessidade de escrever código do zero.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
199
Essas são apenas algumas das razões pelas quais Python é uma escolha
popular para programadores em diversas áreas. No entanto, a escolha da
linguagem muitas vezes depende do contexto específico do projeto e das
preferências pessoais do desenvolvedor.
É importante destacar, antes de começarmos a aprender a programar, que a
execução de programas nesta linguagem depende de um componente de
software chamado interpretador. Este interpretador é fundamental, pois
permite que os códigos escritos ou scripts sejam processados e executados.
Sem ele, os códigos permanecem inativos e não podem ser rodados. Em
resumo, o funcionamento dos programas depende da interpretação que este
software realiza. Na seção 3.2.2, forneceremos orientações sobre como
proceder com esta instalação.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
200
3.3.2. Instalação do Python
Para instalar o Python siga os passos a seguir:Passo 1: Acesse o link https://www.python.org/downloads/ (Figura 153). É
possível instalar o Python para Windows, Linux/UNIX, macOS e outras
plataformas. É recomendável instalar sempre a última versão. Verifique, antes
de realizar o download, a versão que seja compatível ao Sistema Operacional de
seu computador (inclusive se para Windows 32 ou 64 bits). Atenção: o Python
não oferece mais suporte para Sistema Operacional Windows 7 ou inferior.
Passo 2: Clique no botão Download Python 3.12.1, onde este representa a
última versão disponível. O arquivo com extensão .exe será baixado para a pasta
de downloads do seu computador.
Passo 3: Após o download, localize o arquivo e execute-o clicando duas vezes
sobre ele.
Figura 153: Download do Python.
Fonte: adaptado de Python.org.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://www.python.org/downloads/
https://www.python.org/downloads/
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
201
Passo 4: A instalação iniciará. Clique em Install Now conforme mostra a
Figura 154 e aguarde a finalização da instalação (Figura 155).
Figura 155: Progresso da Instalação do Python.
Fonte: adaptado de Python.org.
Figura 154: Instalando o Python.
Fonte: adaptado de Python.org.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://www.python.org/downloads/
https://www.python.org/downloads/
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
202
3.3.3. Comandos essenciais em Python
Criar um script em Python é semelhante a redigir um texto. No entanto, é
importante lembrar que os comandos são executados sequencialmente, na
ordem em que são escritos, linha a linha, de cima para baixo. Essas
características definem as propriedades de uma linguagem estruturada, embora
o Python também permite outras abordagens.
Além dos comandos, é crucial destacar a importância dos comentários, que
desempenham um papel essencial na documentação e explicação do
funcionamento do código para terceiros.
3.3.3.1. Mas como comentar os scripts?
Como definição de boas práticas de programação, os comentários são
comuns nos mais variados cenários. Assim como em outras linguagens, existem
duas formas de se comentar em Python:
1. Comentários em linha (uma única linha)
2. Comentários em bloco (um conjunto de linhas)
Comentários em linha, como apresentado acima começam com o símbolo #
e continuam até o final da linha. Eles são frequentemente usados para fornecer
informações breves sobre o código que está sendo executado.
# ISSO É UM COMENTÁRIO EM UMA ÚNICA LINHA
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
203
Já os comentários em bloco começam e terminam com as três aspas
duplas """, ou com três aspas simples '''. Eles podem ser usados para fornecer
comentários mais longos, como explicações de código ou documentação.
A seguir abordaremos os comandos essenciais. O primeiro comando é
denominado de comando de saída, pois fornece informações aos usuários. Ao
longo deste capítulo você será apresentado a inúmeros comandos, conceitos e
problemas, permeados por soluções e exemplos, a fim de facilitar o
entendimento e gerar os conhecimentos necessários.
'''
ISSO É UM COMENTÁRIO
EM UM BLOCO
DE LINHAS
'''
"""
ISSO TAMBÉM É UM COMENTÁRIO
EM UM BLOCO
DE LINHAS
"""
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
204
3.3.3.2. O que é um comando de saída?
Um comando de saída é uma instrução que imprime um valor ou uma
mensagem na tela de saída, permitindo assim que o usuário interaja com o
programa exibindo dados. Em Python, este comando (função) é o print().
A função aceita um ou mais argumentos, que podem ser de qualquer tipo,
incluindo números, strings, listas, tuplas, dicionários e objetos.
A sintaxe do comando print é dada a seguir:
Toda cadeia de caracteres a ser exibida em Python deve ser colocada entre
aspas, podendo ser simples ou duplas. No momento em que a linha de
comando é executada, ela apresentará na tela de saída o conjunto de
caracteres (cadeia) que estiver contida entre aspas. O comando possui
variações na forma com que recebe cadeia de caracteres e valores. A sintaxe de
algumas possíveis variações são mostradas a seguir:
O uso da vírgula é importante quando é necessário inserir espaços entre
palavras, frases e/ou valores.
print("FRASE A SER IMPRESSA NA TELA")
print("PALAVRA1","PALAVRA2","PALAVRA3")
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
205
O uso do símbolo + entre cadeias de caracteres realiza uma operação
denominada concatenação, que une duas ou mais cadeias de caracteres,
formando uma única cadeia.
Na próxima seção, serão apresentados diversos ambientes de programação
para o desenvolvimento em Python. Esses ambientes oferecem a execução de
scripts e uma ampla variedade de recursos que facilitam o trabalho do
programador.
print("PALAVRA1" + "PALAVRA2" + "PALAVRA3")
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
206
3.3.4. Ferramentas de programação em
Python
Nesta seção, serão exploradas quatro ferramentas de desenvolvimento para
programadores e cientistas de dados: Visual Studio Code, Jupyter Notebook,
Google Colab e PyCharm (Figura 156), respectivamente.
Cada uma dessas ferramentas tem características únicas e é adequada para
diferentes aspectos do desenvolvimento em linguagem Python. Enquanto o
Jupyter Notebook e o Google Colab são excelentes para experimentação
interativa e análise de dados, o Visual Studio Code e o PyCharm oferecem
recursos mais robustos para desenvolvimento de software e gerenciamento de
projetos. A escolha da ferramenta mais adequada pode variar de acordo com
suas necessidades e preferências pessoais.
Embora você possa optar por usar a ferramenta que mais lhe agrada para
realizar as atividades propostas neste capítulo,sugerimos que experimente
todas elas. Essa abordagem não só amplia suas habilidades, mas também
oferece uma visão abrangente sobre diferentes possibilidades para
programação em Python, facilitando assim o seu aprendizado.
Figura 156: Logotipos dos ambientes de desenvolvimento contemplados ao longo do curso.
Fonte: as Autoras.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
207
3.3.4.1. O que é um editor de código?
Um editor de código é um software projetado para facilitar a escrita e edição
de código-fonte, ou seja, programas em uma determinada linguagem de
programação. Todo editor possui recursos avançados como realce de sintaxe,
que muda a cor e o formato do texto conforme a linguagem de programação e
completação automática de código, que agiliza a codificação ao sugerir
comandos e estruturas de código. Além disso, muitos editores oferecem
verificação de erros em tempo real, ajudando a identificar e corrigir problemas
de sintaxe e lógica à medida que o código é escrito.
Os editores de código também suportam várias linguagens de programação,
adaptando-se às necessidades de projetos diversos (Figura 157). Eles auxiliam na
manutenção de boas práticas de formatação, como a correta indentação e
alinhamento do código e facilitam a navegação em grandes bases de código.
Outra característica valiosa é a integração com sistemas de controle de versão,
como Git, permitindo aos desenvolvedores gerenciar e rastrear alterações de
forma eficiente.
Figura 157: Simulação de um ambiente de desenvolvimento de código.
Fonte: imagem gerada por IA.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
208
3.3.4.2. O que é a ferramenta Visual Studio
Code?
O Visual Studio Code (VS Code), desenvolvido pela Microsoft, é um editor de
código gratuito, leve e de código aberto (open source) que oferece suporte a uma
ampla variedade de linguagens de programação. É uma escolha popular entre
desenvolvedores, tendo assim, uma ampla comunidade de usuários ativa. Ele é
multiplataforma, estando disponível para Windows, macOS e Linux, o que facilita
a criação, exportação e sincronização de perfis para o usuário.
O VS Code suporta uma vasta gama de extensões que permitem
personalizar o ambiente de desenvolvimento para atender às necessidades
específicas de programadores e linguagens de programação, oferecendo um
editor de texto altamente flexível, com destaque de sintaxe, autocompletar,
formatação automática e outras funcionalidades que melhoram a produtividade
do desenvolvedor.
Ele oferece integração para controle de versão com sistemas baseados no
Git, tornando o gerenciamento de versões mais eficiente, além de permitir a
depuração do código diretamente no ambiente de programação, facilitando a
identificação e correção de erros.
A integração com serviços de nuvem, como Azure e AWS, simplificam o
desenvolvimento de aplicativos que utilizam esta tecnologia.
Para instalar o VS Code siga os passos a seguir:
Passo 1: Acesse o link https://code.visualstudio.com/download (Figura 158) e
selecione a versão mais adequada ao seu Sistema Operacional.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://code.visualstudio.com/download
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
Após clicar no link para baixar o programa, você será redirecionado para a
página da documentação e o download será iniciado. Após o término, localize o
arquivo executável na pasta de downloads do seu computador.
Passo 2: Para realizar a instalação é necessário aceitar os termos de licença
do software. Após clicar em “Eu aceito o acordo”, clique em Próximo e siga os
passos a seguir (Figura 159-165).
209
Figura 158: Página de downloads do VS Code.
Fonte: adaptado de VS Code.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://code.visualstudio.com/download
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
210
Figura 159: Aceite dos termos de licença.
Fonte: adaptado de VS Code.
Figura 160: Escolha do local da instalação.
Fonte: adaptado de VS Code.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://code.visualstudio.com/download
https://code.visualstudio.com/download
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
211
Figura 161: Escolha da pasta no menu iniciar.
Fonte: adaptado de VS Code.
Figura 162: Seleção de tarefas adicionais.
Fonte: adaptado de VS Code.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://code.visualstudio.com/download
https://code.visualstudio.com/download
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
212
Figura 163: Instalação do VS Code.
Fonte: adaptado de VS Code.
Figura 164: Progresso da instalação.
Fonte: adaptado de VS Code.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://code.visualstudio.com/download
https://code.visualstudio.com/download
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
Ao finalizar a instalação, o VS Code será iniciado e você visualizará a tela a
seguir (Figura 166). Antes de iniciar a programação nesta IDE, devem ser
instaladas algumas extensões sobre as quais abordaremos no próximo tópico.
213
Figura 165: Finalização da instalação.
Fonte: adaptado de VS Code.
Figura 166: Tela inicial do VS Code.
Fonte: adaptado de VS Code.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://code.visualstudio.com/download
https://code.visualstudio.com/downloadTrilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
214
3.3.4.2.1. Instalando extensões
As extensões são módulos de software adicionais que ampliam ou
adicionam funcionalidades ao editor de código. Permitem personalizar e
adaptar o ambiente de desenvolvimento conforme as necessidades e
preferências de cada desenvolvedor, melhorando a experiência de
desenvolvimento e aumentando a produtividade e eficiência. Além das
fornecidas pelo fabricante do software, as extensões podem ser desenvolvidas
pela comunidade de usuários ou por terceiros.
Estima-se que a ferramenta possui um pouco mais de 30 mil de extensões
disponíveis na aba extensões do VS Code que cobrem diversas áreas. Entre as
extensões específicas para linguagens de programação, as mais comuns são
utilizadas nas linguagens Java, TypeScript, Python, HTML, CSS, JavaScript, Ruby,
C e C++.
Antes de iniciarmos o desenvolvimento de códigos nesta IDE, instale a
extensão Português (PT-BR) que permite traduzir a IDE. Com o VS Code aberto,
clique no ícone Extensões (Figura 167).
Figura 167: Extensões no VS Code.
Fonte: adaptado de VS Code.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://code.visualstudio.com/download
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
215
Digite a palavra “Portuguese” no campo de busca e clique no botão Install
na primeira opção apresentada conforme a figura 168.
Ao final da instalação será solicitado que a IDE seja reiniciada para que as
configurações de linguagem sejam aplicadas (Figura 169).
A segunda extensão que precisará ser instalada é a IntelliCode que utiliza
Inteligência Artificial para recomendar opções autocomplete por meio de uma
lista suspensa. Use a opção instalar desta extensão conforme mostra a Figura
170.
O processo de instalação das extensões sempre seguirá o mesmo processo,
ou seja, você deve pesquisar pelo nome da mesma na aba extensões e clicar no
botão instalar, porém, nem sempre será necessário reiniciar o VS Code.
Figura 168: Extensão Portuguese.
Fonte: adaptado de VS Code.
Figura 169: Reiniciando a IDE.
Fonte: adaptado de VS Code.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://code.visualstudio.com/download
https://code.visualstudio.com/download
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
216
3.3.4.2.2. Realizando os primeiros códigos
no VS Code
Para programar em Python no VS Code você deve clicar em Novo Arquivo
na página inicial ou clicar no menu Arquivo, opção Novo Arquivo conforme
apresentado na Figura 171.
Figura 170: Extensão IntelliCode.
Fonte: adaptado de VS Code.
Figura 171: Novo arquivo no VS Code.
Fonte: adaptado de VS Code.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://code.visualstudio.com/download
https://code.visualstudio.com/download
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
217
Surgirá a caixa de diálogo (Figura 172) Novo Arquivo na qual deve ser
digitado o nome do arquivo. Neste caso o nome dado será Exercicio1.py, sendo
py a extensão padrão dos arquivos em Python.
Pressione Enter e surgirá a caixa de diálogo para salvar o arquivo. Selecione
o local mais apropriado e adicione a extensão .py, clicando em seguida em Criar
Arquivo conforme a Figura 173.
O arquivo será criado e surgirá no canto inferior direito uma caixa de diálogo
(Figura 174) perguntando se deseja instalar as configurações recomendadas
para o Python. Instale as configurações para só então iniciar a codificação.
Figura 172: Caixa de diálogo Novo Arquivo.
Fonte: adaptado de VS Code.
Figura 173: Caixa de diálogo Criar Arquivo.
Fonte: adaptado de VS Code.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://code.visualstudio.com/download
https://code.visualstudio.com/download
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
218
Digite o código a seguir e execute-o por meio da tecla F5 do teclado ou do
menu Executar, opção Iniciar a Depuração.
A depuração é um processo que visa identificar e corrigir erros em um
programa. É possível definir pontos de interrupção no código, indicando em
que a execução do programa deve pausar. Durante a execução, o
desenvolvedor pode inspecionar variáveis, avaliar expressões e percorrer o
código fonte linha a linha, permitindo uma análise detalhada. Além disso, o VS
Code oferece ferramentas como consoles interativos e visualização de pilha de
chamadas, facilitando a compreensão do fluxo de execução, além de suportar
testes unitários, proporcionando maior eficiência.
1. #Primeiro Código em Python
2. print("Olá, mundo!")
Figura 174: Instalação das configurações recomendadas.
Fonte: adaptado de VS Code.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://code.visualstudio.com/download
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
219
Vamos testar outro exemplo. Para isso você precisa pedir um Arquivo Novo
e selecionar a opção Arquivo Python (Figura 175).
Teste as saídas simples e as saídas concatenadas apresentadas a seguir e
veja as saídas produzidas (Figura 176).
1. """
2. Testando saídas simples e concatenadas
3. """
4. print('Olá, mundo!', 'Hoje é dia de aprender a
programar.')
5. print('Olá, mundo!'+'Hoje é dia de aprender a
programar')
Figura 175: Arquivo Python.
Fonte: adaptado de VS Code.
Figura 176: Terminal do VSCode exibindo as saídas geradas pelo código apresentado.
Fonte: captura de tela da IDE.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://code.visualstudio.com/download
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
220
3.3.4.3. Conhecendo o Jupyter Notebook
como ferramenta de programação
O Jupyter Notebook é uma aplicação de código aberto que permite a criação
e compartilhamento de documentos interativos contendo código, texto
explicativo, visualizações e equações matemáticas. É amplamente utilizado por
cientistas de dados, pesquisadores e educadores para criar ambientesde
computação interativa em linguagens como Python, R e Julia.
Os notebooks Jupyter consistem em células que podem conter código
executável, texto formatado usando a linguagem de marcação Markdown e
visualizações incorporadas, tornando-os uma ferramenta poderosa para
explorar dados, desenvolver algoritmos, e comunicar resultados de forma
integrada.
3.3.4.3.1. Instalação do Jupyter Notebook
(Anaconda)
Para instalar o Jupyter Notebook siga os passos a seguir.
Passo 1: Acesse o link https://www.anaconda.com/products/distribution e
baixe o executável Jupyter Notebook Anaconda. Verifique o Sistema Operacional
desejado conforme seu computador, isto é, se para Windows 32 ou 64 bits.
Passo 2: Após finalizar o download, execute o arquivo seguindo os passos
abaixo (Figura 177).
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://www.anaconda.com/products/distribution
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
Clique em “Download” se as configurações estiverem corretas ou procure o
instalador compatível no final da página para instalar a versão gratuita e open
source. Atente-se aos requisitos mínimos, conforme especificado no site.
Passo 2: Após finalizar o download, execute o arquivo seguindo os passos
abaixo (Figura 178-185).
221
Figura 177: Baixando o Jupyter Notebook (Anaconda3 2023.09-0).
Fonte: adaptado de Anaconda.
Figura 178: Instalando Anaconda3 2023.09-0 (passo 1).
Fonte: adaptado de Anaconda.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://anaconda.org/anaconda/jupyter
https://www.anaconda.com/products/distribution
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
222
Figura 180: Instalando Anaconda3 2023.09-0 (passo 3).
Fonte: adaptado de Anaconda.
Figura 179: Instalando Anaconda3 2023.09-0 (passo 2).
Fonte: adaptado de Anaconda.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://www.anaconda.com/products/distribution
https://www.anaconda.com/products/distribution
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
223
Figura 181: Instalando Anaconda3 2023.09-0 (passo 4).
Fonte: adaptado de Anaconda.
Figura 182: Instalando Anaconda3 2023.09-0 (passo 5).
Fonte: adaptado de Anaconda.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://www.anaconda.com/products/distribution
https://www.anaconda.com/products/distribution
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
224
ATENÇÃO: Marcar a opção Add Anaconda to my PATH environment
variable. Ao marcar esta opção, haverá a instalação das variáveis do sistema
para não ter que configurá-las individualmente depois.
Figura 183: Instalando Anaconda3 2023.09-0 (passo 6).
Fonte: adaptado de Anaconda.
Figura 184: Instalando Anaconda3 2023.09-0 (passo 7).
Fonte: adaptado de Anaconda.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://www.anaconda.com/products/distribution
https://www.anaconda.com/products/distribution
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
225
Figura 185: Instalando Anaconda3 2023.09-0 (passo 8).
Fonte: adaptado de Anaconda.
Passo 3: Após o fim da instalação, o Jupyter Notebook (Anaconda) abrirá em
seu navegador padrão uma nova janela, para que seja realizado o registro
gratuito no Anaconda Nucleus e, a partir daí, seja possível utilizar a ferramenta.
Caso a página não abra automaticamente em uma nova janela do
navegador, realize o registro pode ser realizado em
https://anaconda.cloud/getting-started-with-anaconda-distribution.
Para efetuar o registro forneça um e-mail válido, crie e repita a senha nos
campos indicados e marque as opções: “Academic”, “I have read and agree to
Anaconda's Privacy Policy and Terms of Service” e “não sou um robô” (Figura
186).
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://www.anaconda.com/products/distribution
https://anaconda.cloud/getting-started-with-anaconda-distribution
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
226
Em seguida, uma nova janela abrirá para a indicação de dados pessoais
(Figura 187).
Figura 186: Registrando o Anaconda Nucleus (passo 1).
Fonte: adaptado de Anaconda.
Figura 187: Instalando Anaconda3 2023.09-0 (passo 2).
Fonte: adaptado de Anaconda.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://www.anaconda.com/products/distribution
https://www.anaconda.com/products/distribution
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
227
Passo 4: Para finalizar o cadastro será necessário clicar em enviar um e-mail
de verificação (Send Verification Email). Uma mensagem será enviada ao e-mail
informado e deverá ser acessada para que seja confirmada.
Com o cadastro finalizado, será possível abrir e editar códigos no Jupyter
Notebook. Para isso, abra novamente o prompt de comando (cmd) (figura 188)
para criar a pasta que irá comportar os arquivos notebooks, com os seguintes
passos:
Executar o Jupyter Notebook no prompt de comando para ativá-lo. Uma aba
no navegador padrão deverá ser aberta com a tela do Jupyter Notebook.
Caso não abra a página do navegador com os comandos, também é
possível abrir o Jupyter Notebook copiando-se os links da forma como
aparecerá nas duas últimas linhas do seu prompt de comando.
Uma outra possibilidade de abrir o Jupyter Notebook é localizar o ícone do
aplicativo no Menu Iniciar do Windows. Note que, sempre que iniciado, um
prompt de comando é aberto e deverá permanecer aberto enquanto estiver
utilizando o Jupyter em seu navegador.
mkdir \Projetos
//Criando a pasta Projetos
cd \Projetos
//Acessando o diretório criado
jupyter notebook
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ador
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
228
Passo 5: Para começar um novo projeto, localize no canto superior direito a
opção “New” e clique em “Python 3 (ipykernel)”. Uma nova janela se abrirá com
o ambiente de programação (Figura 189). Explore a ferramenta para se
ambientar.
Figura 188: Criando a pasta de projetos para o Jupyter Notebook.
Fonte: as Autoras.
Figura 189: Ambiente de projetos do Jupyter Notebook.
Fonte: adaptado de Anaconda.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://www.anaconda.com/products/distribution
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
229
3.3.4.3.2. Desenvolvendo códigos básicos
em markdown e Python
Markdown é uma linguagem de marcação simples que foi criada com o
objetivo de ser facilmente escrita e compreendida, permitindo que o texto seja
convertido em um HTML válido. É comumente usada para formatar textos em
plataformas online, como fóruns, wikis entre outras.
A funcionalidade principal desta linguagem em Python é adicionar
formatação básica como listas, links, imagens e outros elementos, sem a
necessidade de usar HTML ou linguagens mais complexas, o que faz com que a
documentação esteja clara e bem formatada junto com o código fonte.
A seguir são apresentados exemplos em markdown.
# Título Principal
## Subtítulo
### Sub-subtítulo
**Texto em Negrito**
*Texto em Itálico*
- Item 1
- Item 2
- Subitem A
- Subitem B
'texto comentado aqui'
print("Olá, mundo!")
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
230
3.3.4.4. Conhecendo o Google Colab como
ferramenta de programação
O Google Colaboratory, mais conhecido como Google Colab, é um serviço de
nuvem gratuito do Google, criado para incentivar a pesquisa de Aprendizado de
Máquina e Inteligência Artificial. É uma ferramenta que permite misturar
código-fonte (geralmente na linguagem Python) e texto formatado (geralmente
em Markdown) com imagens. O resultado desse código dá origem à técnica
conhecida como notebook.
Como o Google Colab dedicada ao desenvolvimento em Python, é possível
testá-lo online, diretamente no navegador, sem necessidade de instalar o Python
e nenhum outro software em sua máquina local. O ambiente é pré-configurado,
tendo as principais bibliotecas Python pré-instaladas, o que torna mais fácil
importá-las e utilizar os recursos.
Uma de suas maiores vantagens é a possibilidade de utilizar os servidores do
Google, permitindo habilitar e utilizar Unidades de Processamento Gráfico
(GPUs) enquanto executa os códigos, principalmente durante o uso de
bibliotecas para treinamento de modelos de Aprendizado de Máquina, análise
de dados e simulações complexas, sem a necessidade de um hardware
poderoso.
A ferramenta funciona na maioria dos navegadores - como Chrome, Firefox e
Safari - e está disponível para acesso em https://colab.research.google.com.
Para iniciar e criar o seu primeiro código, basta clicar na opção “Arquivo” e
criar “Novo Notebook” (Figura 190). O arquivo é criado com uma célula para
escrever código ou texto e executá-la individualmente, apresentando o resultado
da execução, logo abaixo da célula correspondente (Figura 191).
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://colab.research.google.com
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
231
Figura 190: Ambiente inicial do Google Colab.
Fonte: adaptado de Google Colab.
Figura 191: Ambiente de projetos do Google Colab.
Fonte: adaptado de Google Colab.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://colab.research.google.com/
https://colab.research.google.com/
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
232
3.3.4.5. Conhecendo o PyCharm como
ferramentas de programação em Python
O PyCharm é uma IDE projetada especificamente para a linguagem de
programação Python. Foi desenvolvida pela pela JetBrains e oferece uma ampla
gama de recursos que facilitam o processo de desenvolvimento.
Apresenta uma interface de usuário intuitiva e amigável, proporcionando
uma experiência de desenvolvimento fluida. Seus menus intuitivos e a
organização da barra de ferramentas facilita a navegação e o acesso rápido às
funcionalidades essenciais.
A IDE do PyCharm é uma multiplataforma com versões para Windows,
MacOS e Linux, que fornece análise de código, depurador gráfico, auto
completação de código e capacidades de navegação que facilitam a escrita de
código.
3.3.4.5.1. Instalando o PyCharm
Para instalar esta ferramenta siga os passos apresentados a seguir.
Passo 1: Para a realização das atividades previstas neste e em alguns dos
outros capítulos, será necessário baixar o Pycharm Community Edition. Utilize
esta versão por ser gratuita e open source.
Acesse o site https://www.jetbrains.com/pt-br/pycharm/download, localize a
versão indicada para seu sistema operacional e clique em Baixar (Figura 192).
Atente-se aos requisitos mínimos indicados para um melhor desempenho da
IDE.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://www.jetbrains.com/pt-br/pycharm/download
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
233
Passo 2: O arquivo será baixado para a pasta de downloads do seu computador.
Acesse-a e localize o arquivo pycharm-community-2023.X.X.exe (em que X
representa a versão do programa). Inicie a instalação e siga os passos
apresentados a seguir (Figura 193-197).
Figura 192: Área de download PyCharm.
Fonte: adaptado de PyCharm.
Figura 193: Instalando o PyCharm.
Fonte: adaptado de PyCharm.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://www.jetbrains.com/pt-br/pycharm/download/?section=windows
https://www.jetbrains.com/pt-br/pycharm/download/?section=windows
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
234
Figura 194: Instalando o PyCharm.
Fonte: adaptado de PyCharm.
Figura 195: Instalando o PyCharm.
Fonte: adaptado de PyCharm.
D
oc
um
en
to
a
ss
in
ad
o
el
et
roni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://www.jetbrains.com/pt-br/pycharm/download/?section=windows
https://www.jetbrains.com/pt-br/pycharm/download/?section=windows
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
235
Figura 196: Instalando o PyCharm.
Fonte: adaptado de PyCharm.
Figura 197: Instalando o PyCharm.
Fonte: adaptado de PyCharm.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://www.jetbrains.com/pt-br/pycharm/download/?section=windows
https://www.jetbrains.com/pt-br/pycharm/download/?section=windows
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
236
Ao abrir o PyCharm pela primeira vez, uma janela chamada Create Project
aparecerá a tela apresentada a seguir (Figura 198), e nela, define-se as
configurações necessárias para iniciar um novo projeto.
É possível criar um novo projeto a qualquer momento, clicando em File e,
em seguida, New Project no menu superior da janela principal do PyCharm.
Primeiro, especifica-se o nome do projeto e o local padrão em que será salvo.
Ao clicar em Create, o projeto é criado e direcionado para o ambiente de
programação (Figura 199), contendo os recursos necessários.
Figura 198: Criando um novo projeto no PyCharm.
Fonte: adaptado de PyCharm.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://www.jetbrains.com/pt-br/pycharm/download/?section=windows
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
237
Figura 199: Ambiente de programação do PyCharm.
Fonte: adaptado de PyCharm.
Todas as propostas de soluções relacionadas às atividades de
experimentação sugeridos na etapa de conceitualização serão disponibilizadas
via Google Colab, enquanto os exemplos apresentados ao longo deste capítulo
serão executados utilizando o VSCode.
Nos capítulos subsequentes, outras ferramentas serão empregadas.
Para complementar e otimizar seu aprendizado, será realizada uma seção
de atividades de experimentação referentes aos temas abordados.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
https://www.jetbrains.com/pt-br/pycharm/download/?section=windows
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
238
3.3.5. Atividades de experimentação
IMPORTANTE: Antes de iniciar as atividades de experimentação, é
fundamental completar os passos anteriores relacionados à
configuração da IDE escolhida.
Recomenda-se estudar o conteúdo dos tópicos anteriores para se
familiarizar com os temas que serão abordados nos atividades de
experimentação.
É importante esclarecer que estas atividades não compõem a
avaliação e não haverá correção formal por parte dos instrutores; o
objetivo é a autoaprendizagem e prática. As respostas e dicas de
desenvolvimento para cada atividade estão disponíveis em arquivos
específicos no Google Sala de Aula, na aba Etapa Conceitualizar.
O nível de complexidade de cada atividade é indicado pelos
seguintes símbolos:
● Complexidade Baixa
●● Complexidade Média
●●● Complexidade Alta
Encorajamos a criação de suas soluções antes de consultar o
gabarito disponível, para maximizar o aprendizado.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
239
As atividades de experimentação a seguir foram elaborados para ajudá-lo a
familiarizar-se com as funcionalidades básicas do comando print em Python,
uma habilidade essencial para qualquer pessoa que está começando a
programar nesta linguagem.
Atividades de experimentação 1 ●
Escreva um programa que use o comando print para exibir a frase "Olá,
Mundo!".
Atividades de experimentação 2 ●
Utilize o comando print para exibir seu nome completo.
Atividades de experimentação 3 ●●
Crie um programa que combine duas strings e as exibe usando o comando
print. Por exemplo, "Python" e "Programação" se tornam "PythonProgramação".
Atividades de experimentação 4 ●
Use o print para mostrar o resultado de uma operação matemática simples,
como 5 + 3.
Atividades de experimentação 5 ●●
Escreva um poema ou uma citação famosa usando o print, formatando-o em
várias linhas.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
240
Atividades de experimentação 6 ●●
Use o comando print com o parâmetro end para juntar a saída de dois
comandos print em uma única linha.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
241
3.3.6. Tipos de dados e variáveis
Tipos de dados são categorias que determinam os valores que uma variável
pode armazenar e as operações que podem ser realizadas sobre esses valores.
Na linguagem Python, os tipos de dados são dinâmicos, ou seja, a linguagem
permite que o tipo de dado de uma variável seja determinado em tempo de
execução, adaptando-se conforme o necessário e eliminando assim a
necessidade de declarar explicitamente o tipo de dado de uma variável.
Mas afinal, o que é uma variável?
Em programação, uma variável é um espaço de armazenamento temporário
na memória do computador, identificado por um nome, que contém um valor ou
informação. Em essência, pode ser definida como um rótulo associado a um
local na memória do computador em que os dados podem ser armazenados,
acessados e recuperados durante a execução de um programa.
Figura 200: Exemplo da definição de variável como um espaço de armazenamento.
Fonte: as Autoras.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional242
Na figura 200 temos uma analogia simples com o contexto apresentado.
Neste caso, uma variável foi definida com o rótulo NOME para armazenar a
cadeia de caracteres "João".
Mas afinal, o que é armazenado em uma variável?
É possível armazenar diferentes tipos de dados, como números, caracteres,
valores booleanos entre outros, dependendo da linguagem de programação
utilizada. Verifique a seguir cada um dos tipos de dados mais utilizados:
1. Inteiro (int): representa números inteiros
2. Ponto Flutuante (float): representa os números decimais
3. String (str): representa a sequência de caracteres, como palavras ou frases.
4. Booleano (bool): representa os valores lógicos verdadeiro (True) ou falso
(False).
É importante ressaltar que os tipos de dados apresentados anteriormente
referem-se a variáveis consideradas simples, ou seja, armazenam apenas uma
única informação por vez.
variavel_inteira = 12
variavel_real = 3.1415926
variavel_caractere = "Olá, Mundo"
variavel_booleana = True
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
243
No item específico sobre estrutura de dados, iremos conhecer as variáveis
compostas, como listas, tuplas, dicionários e conjuntos, que nos permitem
organizar os dados de maneira mais complexa.
Cada variável deve ter um identificador, que é um nome único que a
identifica. O identificador é usado para localizar a variável na memória do
computador, essa atribuição deve respeitar regras da linguagem de
programação para ser válido.
Quais as regras necessárias para a definição
de identificadores?
• Nunca devem iniciar com números
• Nunca devem ter caracteres especiais
• Podem ter qualquer comprimento
• Podem mesclar letras e números
• Podem iniciar com sublinhado (_)
• Letras maiúsculas são diferentes de minúsculas
• Não podem corresponder a palavras reservadas
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
244
3.3.7. O que é um comando de entrada?
Um comando de entrada é uma instrução capaz de receber dados fornecidos
por meio do teclado. Em Python, este comando é o input(). A função input() é
utilizada para que o usuário possa interagir com o programa, fornecendo
informações como cadeias de caracteres e valores.
A sintaxe do comando input é dada a seguir:
É necessário que o comando esteja vinculado a uma variável, pois é nela que
os dados fornecidos serão armazenados. A sintaxe de tal linha de comando pode
ser observada abaixo:
Analisando a sintaxe apresentada, pode-se perceber que a função input está
vinculada a uma saída de texto, ou seja, ela permite ao programador exibir
informações na tela para o usuário, a fim de orientá-lo em relação aos dados
que serão inseridos. Verifique um exemplo de aplicação abaixo.
input('')
var = input('Texto que será exibido na tela de saída')
1. nome = input('Qual o seu nome? ')
2. idade = input('Qual a sua idade? ')
3. altura = input('Qual a sua altura? ')
4. print('Seu nome é: ', nome,'.')
5. print('Sua idade é: ', idade,'anos.')
6. print('Sua altura é: ',altura,'m.')
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
245
No exemplo anterior, pode-se observar a criação de três variáveis destinadas
a armazenar informações obtidas por meio da função input. Um exemplo é o
identificador 'nome' vinculado à função por meio do operador de atribuição4,
ou seja, o dado que será armazenado na variável será uma informação de
entrada.
É importante destacar que, ao ser utilizado na forma apresentada, o
comando atribui automaticamente o tipo de dado str à variável associada.
Abaixo, pode ser observada a saída de tela final, gerada pelo código anterior
quando compilado, executado e com os dados de entrada fornecidos pelo
usuário (Figura 201).
4O operador de atribuição em programação é utilizado para atribuir um valor a uma variável. Ele é representado pelo sinal de igual
(=). Ao utilizá-lo, você estará essencialmente dizendo ao programa para armazenar o valor à direita do sinal de igual na variável à
esquerda do sinal de igual.
Figura 201: Terminal do VSCode exibindo as saídas geradas pelo código apresentado.
Fonte: captura de tela da IDE.
1. num1 = input('Forneça um valor inteiro:')
2. num2 = input('Forneça um segundo valor inteiro:')
3. num3 = input('Forneça um terceiro valor inteiro:')
4. print('A soma dos valores fornecidos é:',
num1+num2+num3)
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
No exemplo acima, o código solicita três valores inteiros ao usuário por
meio do comando de entrada. Note que esses valores são armazenados nas
variáveis denominadas num1, num2 e num3, e ao final é esperado que seja
exibido na tela a soma dos três valores fornecidos (Figura 202).
Na saída exibida acima, é possível perceber que o resultado esperado não
ocorre. Em vez de realizar a soma, o programa está realizando a concatenação
das variáveis, ou seja, agrupando os dados de num1, num2 e num3. Isso
ocorre porque, como informado anteriormente, os dados obtidos por meio do
comando de entrada são armazenados como strings e não como os valores
inteiros desejados.
Para garantir o correto funcionamento do código apresentado é essencial
realizar a conversão dos tipos de dados, ou seja, efetuar a transformação das
variáveis de string para o tipo numérico.
246
Figura 202: Terminal do VSCode exibindo as saídas geradas pelo código apresentado.
Fonte: captura de tela da IDE.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
247
3.3.7.1. Como converter os dados do
comando input para o tipo necessário?
Abaixo são apresentadas possibilidades de sintaxe para a conversão das
variáveis de acordo com o tipo de dado (Tabela 1):
O código apresentado anteriormente foi adequado para que atenda ao
objetivo desejado.
As formas de conversão dos dados apresentadas (linha 2 e 4) são diferentes,
porém equivalentes.
int(variavel) Converte o conteúdo da variável para o tipo numérico
inteiro.
float(variavel) Converte o conteúdo da variável para o tipo numérico
real.
str(variavel) Converte o conteúdo da variável para o tipocadeia de
caracteres.
1. num1 = input('Forneça um valor inteiro: ')
2. num1 = int(num1)
3.
4. num2 = int(input('Forneça um segundo valor inteiro: '))
Tabela 1: Conversão de dados.
Fonte: as Autoras.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
É possível que ambas as variáveis deixem de ser strings (str) e se tornem
números inteiros (int) no momento da inserção dos dados. Assim, o exemplo
anterior terá a seguinte estrutura:
Observe que o objetivo da implementação foi atingido com sucesso, mas se
um dado do tipo float for fornecido pelo usuário haverá uma indicação de erro
no terminal.
Outro ponto relevante é que, para apresentar como resultado a soma dos
três valores inteiros fornecidos, foi utilizado o operador aritmético de adição
(+). Além do operador de adição e do operador de atribuição que já foram
mencionados, existem outros operadores aritméticos, que serão apresentados
a seguir.
248
1. num1 = int(input('Forneça um valor inteiro: '))
2. num2 = int(input('Forneça um segundo valor inteiro: '))
3. num3 = int(input('Forneça um terceiro valor inteiro:
'))
4. print('A soma dos valores fornecidos é:',
num1+num2+num3)
Figura 203: Terminal do VSCode exibindo as saídas geradas pelo código apresentado.
Fonte: captura de tela da IDE.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
249
3.3.8. Operadores aritméticos
Em Python, os operadores aritméticos englobam aqueles empregados em
instruções aritméticas básicas e tradicionais. A Tabela 2 destaca os operadores,
suas funcionalidades e sintaxes.
Com base nos operadores apresentados, será possível a construção de
expressões, uma vez que estas podem ser formadas por combinações de
variáveis, operadores aritméticos, constantes e o operador de atribuição. A
seguir, podemos analisar um trecho de código em Python que representa uma
expressão.
Operador
Significado
Sintaxe em
Python
Operação realizada
=
Atribuição
A = B
Atribui B a variável A
+
Adição
A = B + C
Atribui à A a soma entre B e C
-
Subtração
A = B - C
Atribui à A a subtração entre B
e C
*
Multiplicação
A = B * C
Atribui à A a multiplicação
entre B e C
/
Divisão
A = B / C
Atribui à A a divisão entre B e C
//
Divisão exata
A = B // C
Atribui à A a parte inteira do
quociente da divisão entre B e
C
**
Potenciação
A = B ** C
Atribui à A o valor de BC
%
Resto da
divisão
A = B % C
Atribui a A o resto da divisão
entre B e C
Tabela 2: Operadores aritméticos.
Fonte: as Autoras.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
No código acima, observe que são inseridas diversas operações aritméticas.
No entanto, qual é a ordem em que elas são executadas? Quem define essa
sequência é a ordem de precedência dos operadores, que pode ser analisada
na Tabela 3.
Assim como as regras matemáticas exigem, o cálculo de expressões
inicia-se respeitando parênteses, seguido por multiplicações, divisões e resto da
divisão, mantendo a ordem da esquerda para a direita. Posteriormente, são
resolvidas as adições e subtrações.
250
1. '''Esse programa irá exibir para o usuário o cálculo da
seguinte expressão matemática resultado = x2 + 3.5 y
2. + z/3 -4 '''
3.
4. x = float(input('Forneça um valor para a variável x: '))
5. y = float(input('Forneça um valor para a variável y: '))
6. z = float(input('Forneça um valor para a variável z: '))
7.
8. resultado = x ** 2 + 3.5 * y + z/3 - 4
9.
10. print('x2 + 3.5 y + z/3 - 4 =',resultado)
1
2
3
4
()
**
/
+
*
-
//
%
Tabela 3: Precedência dos operadores.
Fonte: as Autoras.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
251
No trecho do código anterior, as variáveis que aparecem à direita do
comando de atribuição (x, y e z) serão substituídas pelos valores que
armazenam no momento em que o computador executa a linha que contém
esta expressão.
A saída de tela abaixo (Figura 204) foi gerada após a execução do código,
note que três valores reais foram atribuídos às variáveis x, y e z. E o cálculo foi
realizado seguindo as normas definidas pela precedência de operadores.
Assim foram realizadas as seguintes operações:
= (2.5)² + (3.5 * 3.2) + (7.8 / 3) - 4
= 6.25 + 11.2 + 2.6 - 4
=16.05
Se desejar alterar a ordem em que o cálculo é realizado, é necessário inserir
parênteses para evidenciá-la nas linhas de código.
Figura 204: Terminal do VSCode exibindo as saídas geradas pelo código apresentado.
Fonte: captura de tela da IDE.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
Com a inserção dos parênteses na expressão aritmética, os cálculos serão
iniciados sempre por eles, considerando sempre o parêntese mais interno e
avançando para os parênteses mais externos. Abaixo é possível verificar a
sequência de passos para a realização de tal operação.
= (( 2.1(5.5) ) * 3.2) + ((5/3) - 4)
= (59.18 * 3.2) + (1.66 - 4)
= 189.38 - 2.34
= 187.04
A saída de tela apresentada na figura 205 destaca o resultado obtido após a
inserção de três novos valores reais nas variáveis x, y e z, juntamente com a
adição de parênteses à estrutura da expressão aritmética.
252
1. '''Esse programa irá exibir para o usuário o cálculo
2. da seguinte expressão matemática
3. resultado = (x(2+3.5)y) + ((z/3) - 4 )'''
4.
5. x = float(input('Forneça um valor para a variável x:'))
6. y = float(input('Forneça um valor para a variável y:'))
7. z = float(input('Forneça um valor para a variável z:'))
8.
9. resultado = ((x ** (2 + 3.5)) * y) +( (z/3) - 4)
10.
11. print('x2 + 3.5 y + z/3 - 4 =',resultado)
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional253
É de extrema importância compreender que as constantes em expressões
numéricas são definidas pelos tipos de dados int e float.
Para complementar e otimizar seu aprendizado, será realizada uma seção
de atividades de experimentação referentes aos temas abordados.
Figura 205: Terminal do VSCode exibindo as saídas geradas pelo código apresentado.
Fonte: captura de tela da IDE.
Mas o que é uma constante?
Uma constante representa um valor numérico que pode
ser atribuído a variáveis, as quais não terão seus valores
alterados ao longo da execução do programa. As constantes
inteiras podem assumir valores positivos ou negativos,
sendo números inteiros que não possuem casas decimais.
Por outro lado, as constantes reais podem apresentar
precisão decimal, incluindo casas decimais em sua
representação.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
254
3.3.9. Atividades de experimentação
IMPORTANTE: Antes de iniciar as atividades de experimentação
propostas, é fundamental completar os passos anteriores relacionados
à configuração da IDE escolhida.
Recomenda-se estudar o conteúdo dos tópicos anteriores para se
familiarizar com os temas que serão abordados nas atividades.
É importante esclarecer que estas atividades de experimentação
não compõem a avaliação e não haverá correção formal por parte dos
instrutores; o objetivo é a autoaprendizagem e prática. As respostas e
dicas de desenvolvimento para cada atividade estão disponíveis em
arquivos específicos no Google Sala de Aula, na aba “Etapa
Conceitualizar”.
O nível de complexidade de cada atividade é indicado pelos
seguintes símbolos:
● Complexidade Baixa
●● Complexidade Média
●●● Complexidade Alta
Encorajamos a criação de suas soluções antes de consultar o
gabarito disponível, para maximizar o aprendizado.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
255
As atividades de experimentação a seguir permitem a prática dos
operadores aritméticos em Python enquanto trabalham com cenários da vida
real, aprimorando as habilidades de resolução de problemas e programação.
Atividades de experimentação 7 ●
Faça um código utilizando a linguagem Python capaz de calcular o valor de
f(x), sendo x uma variável real fornecida como entrada (input) pelo usuário.
Atividades de experimentação 8 ●●
Imagine que você está trabalhando em um projeto de física e precisa
calcular a velocidade final de um objeto em movimento. Você sabe a velocidade
inicial, a aceleração constante do objeto, e a distância percorrida. Para isso
escreva um programa em Python que peça ao usuário para inserir a velocidade
inicial (em metros por segundo), a aceleração constante (em metros por
segundo ao quadrado), e a distância percorrida (em metros).
Calcule e exiba a velocidade final do objeto.
Atividades de experimentação 9 ●●
Desenvolva um programa que converta a temperatura de Celsius para
Fahrenheit. A temperatura em Celsius deve ser fornecida pelo usuário. A fórmula
de conversão foi disponibilizada na página a seguir.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
256
Atividades de experimentação 10 ●●
Elabore um programa em Python que seja capaz de calcular o valor final de
uma compra, considerando a aplicação de descontos. O programa deve
primeiramente pedir ao usuário para inserir o montante total da compra e a
porcentagem de desconto e exibir o valor final da compra na tela.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
257
3.3.10. Estruturas de controle de fluxo
Estruturas de controle de fluxo são conjuntos de códigos que possibilitam a
modificação da sequência padrão de execução do programa. Essas estruturas
gerenciam a ordem na qual as instruções são realizadas, permitindo que o
programa faça escolhas e itere sobre ações.
Existem três categorias principais de estruturas de controle de fluxo:
● Sequencial: as instruções são executadas em ordem, uma após a outra,
conforme aparecem no código.
● Condicional: capacita o programa a tomar decisões com base em condições.
Se uma condição for verdadeira, o programa executa um bloco de código
específico; caso contrário, pode executar outro bloco ou prosseguir para a
próxima instrução.
● Repetição: conhecida como loops, essa estrutura permite que um bloco de
código seja repetido várias vezes enquanto uma condição específica
permanecer verdadeira. Isso é útil para automatizar tarefas que requerem
repetição.
A primeiro momento iremos abordar as estruturas condicionais, também
conhecidas como estruturas de tomada de decisão.
3.3.10.1. Estrutura condicional
Estruturas condicionais são elementos essenciais em um programa, pois
determinam quais ações serão tomadas com base em condições específicas. A
inclusão dessas estruturas confere aos programas uma maior flexibilidade,
permitindo que se adaptem às complexidades do mundo real.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
258
A presença de estruturas condicionais representa uma distinção significativa
entre os computadores modernos e as simples máquinas de calcular. É por meio
dessas estruturas que os programadores têm a capacidade de definir diferentes
fluxos de execução ao longo de um programa.
Na abordagem que será adotada, as estruturas condicionais levam em
consideração comparações entre valores, valores e variáveis, variáveis e
variáveis, e até mesmo expressões mais complexas. Essas comparações sempre
resultam em um valor booleano, podendo ser verdadeiro ou falso,
proporcionando a base para as decisões lógicas dentro do programa.
3.3.10.2. Operadores relacionais
Como mencionado anteriormente, ao combinar operadores com valores
constantes, variáveis ou expressões, obtém-se como resposta um valor
booleano verdadeiro. Para que tal comparação seja possível, serão utilizados os
operadores relacionais apresentados a seguir (Tabela 4):
Símbolo do Operador
Significado
==
Igual a
!=
Diferente de
>
Maior que
<
Menor que
>=
Maior ou igual a
<=
Menor ou igual a
Tabela 4: Operadores relacionais.
Fonte:as Autoras.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
259
Combinação
Significado
Valor booleano de
retorno
15 == 15
O valor constante 15 é igual ao
valor constante 15.
1 - Verdade
8 > 5
O valor constante 8 é maior que o
valor constante 5.
1 - Verdade
9 < 13
O valor constante 9 é menor que o
valor constante 13.
1 - Verdade
7 >= 13
O valor constante 7 é maior ou
igual ao valor constante 13.
0 - Falso
variavel == 9
O valor contido na variável
“variavel” é igual a constante 9.
1 – Verdade (se “variavel”
conter o valor nove).
0 – Falso (se “variavel”
conter valor diferente de
nove)
variavel >= 50
O valor contido na variável
“variavel” é maior ou igual a 50
1 – Verdade (se “variavel”
conter um valor maior
ou igual a 50).
0 – Falso (se “variavel”
conter valor menor que
50)
Na Tabela 5 está representado exemplos de operadores relacionais
combinados com constantes, variáveis ou expressões, juntamente aos valores
resultantes.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
260
Combinação
Significado
Valor booleano de retorno
variavel != 13
O valor contido na variável
“ variavel” é diferente de 13.
1 – Verdade (se “variavel”
conter um valor diferente de
13).
0 – Falso (se “variavel” conter
valor igual a 13)
3.3.10.3. Estruturas condicionais if / if - else
3.3.10.3.1. Estrutura condicional simples - if
Operadores relacionais são frequentemente utilizados em estruturas
condicionais ou em processos de tomada de decisão. No contexto do Python,
essas estruturas condicionais são representadas pelo comando if (se). O
comando if possui algumas particularidades que devem ser observadas,
conforme será demonstrado a seguir. Adicionalmente, é crucial enfatizar a
importância de manter a indentação adequada no bloco do comando if.
Indentação, em termos gerais, refere-se aos recuos utilizados no código ou
script com o propósito de destacar ou definir a estrutura do algoritmo. Esses
recuos discernem quais comandos fazem parte da estrutura condicional,
delineando como os comandos estão agrupados em blocos. A indentação
consiste em uma tabulação (espaço) à direita na linha subsequente à linha de
comando if.
Tabela 5: Operações com operadores relacionais.
Fonte: as Autoras.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
261
Um exemplo claro desse recuo pode ser observado no trecho de código a
seguir.
O comando if possui sintaxe simples, a qual é mostrada a seguir:
if condição:
print("O espaço à esquerda desta linha é a indentação")
#mais comandos podem pertencer a essa condicional
if condição:
#Seu bloco de comando se inicia aqui
A estrutura tem início no comando if, indicando o começo da sintaxe da
estrutura condicional. Em seguida, temos a condição, formada pelos
operadores relacionais, seguidos por "dois pontos", marcando o início do bloco
de comandos. A execução desse comando ocorre apenas se a condição inserida
for avaliada como verdadeira. Em caso contrário, o bloco de comandos não é
executado. Em outras palavras, para a instrução acima, a linha é interpretada
como "se a condição for verdadeira, execute o bloco de códigos abaixo". Assim,
• Se a condição for VERDADEIRA:
Os comandos abaixo e indentados após os dois pontos ":" são
executados.
• Se a condição for FALSA:
Os comandos abaixo e indentados após os dois pontos ":" não são
executados.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
262
Um exemplo de seu funcionamento é o programa deve verificar se um
usuário do programa é maior de idade. Nessa situação, caso a idade seja maior
ou igual a 18 anos, o programa exibe na tela a mensagem “Bem-vindo, usuário”.
Analisando o código acima, podemos verificar a execução da estrutura
condicional simples. Note que na linha 4, temos o comando if indicando o início
da estrutura, acompanhado pela condição de a variável ser maior ou igual a 18
anos. A estrutura é seguida pelo comando print, que só será executado se a
variável possuir um valor maior ou igual a 18, ou seja, se a resposta da condição
booleana for 1. Caso contrário nada será executado e o programa será
finalizado, ambos os casos podem ser vistos nos terminais a seguir (Figura 206
e 207).
1. print('Olá usuário, informe seu nome: ')
2. nome = input()
3. idade = int(input('Qual a sua idade: '))
4. if idade >= 18:
5. print('Bem vindo(a),',nome)
Figura 206: Terminal do VSCode exibindo as saídas geradas pelo código apresentado.
Fonte: captura de tela da IDE.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
263
3.3.10.3.2. Estrutura condicional composta
- if/else
Após compreender como lidar com a condição quando é verdadeira (por
meio do if), torna-se crucial saber como instruir o programa a agir caso a
condição não seja verdadeira. Nesse cenário, o else (senão) entra em cena. É
importante ressaltar que o comando else só pode existir se houver, e apenas se
houver, um comando if associado a ele. Em outras palavras, ele representa a
alternativa à condição indicada pelo if.
if condição:
'''Seu bloco de código se inicia aqui e será
executado se a condição do if for verdadeira'''
else:
'''Seu bloco de código se inicia aqui e será
executado se a condição do if for falsa'''
Figura 207: Terminal do VSCode exibindo as saídas geradas pelo código apresentado.
Fonte: captura de tela da IDE.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
264
Como seria interpretado o código?
Se a condição for verdadeira, o bloco de comandos imediatamente abaixo,
corretamente indentado, será executado. Caso contrário (se a condição
associada ao if for falsa), o bloco de comandos correspondente, também
devidamente indentado, será executado. Para ilustrar a aplicação serárefeito o
exemplo anterior. Nessa situação, caso a idade seja maior ou igual a 18 anos, o
programa exibe na tela a mensagem “Bem-vindo, usuário”. Caso contrário,
exibe “Proibida a entrada”.
1. print('Olá usuário, informe seu nome:')
2. nome = input()
3. idade = int(input('Qual a sua idade: '))
4. if idade > 18:
5. print('Bem vindo(a),',nome,'.')
6. else:
7. print(nome,'infelizmente a sua entrada não é
permitida.')
Analisando o código acima, podemos verificar a execução da estrutura
condicional composta. Note que na linha 4, temos o comando if indicando o
início da estrutura, acompanhado pela condição de a variável ser maior ou igual
a 18 anos. A estrutura é seguida pelo comando print, que só será executado se
a variável possuir um valor maior ou igual a 18, ou seja, se a resposta da
condição booleana for 1. Caso contrário, isto é, se a condição que acompanha o
if for falsa (booleano for 0), o programa se remete para a linha 6, executando o
bloco de comandos que a acompanha. Ambos os casos podem ser vistos nos
exemplos a seguir (Figura 208).
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
265
Observe que o terminal acima exibe uma possível saída, considerando que
o usuário forneceu a idade de 45 anos. Nesse cenário, o valor fornecido é
analisado na condição do if (45 > 18), a qual é avaliada como verdadeira.
Portanto, o bloco de comandos associado ao if é executado, e a mensagem
"Bem-vindo, José Eduardo Santos" é exibida na tela. O bloco de comandos
vinculado ao else será ignorado.
Observe que o segundo terminal (Figura 209) apresenta uma segunda
possível saída, levando em consideração que o usuário forneceu a idade de 15
anos. Nesse contexto, o valor fornecido é analisado na condição do if (15 > 18),
a qual é avaliada como falsa.
Figura 208: Terminal do VSCode exibindo as saídas geradas pelo código apresentado.
Fonte: captura de tela da IDE.
Figura 209: Terminal do VSCode exibindo as saídas geradas pelo código apresentado.
Fonte: captura de tela da IDE.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
266
Dessa forma, o bloco de comandos associado ao if é ignorado, e o bloco de
comandos vinculado ao else será executado, exibindo a mensagem "Clara
Nascimento, infelizmente, a sua entrada não é permitida" na tela.
No exemplo a seguir, o uso de if-else é destinado para verificar uma
condição aritmética. É conhecido que não existe divisão por valor zero na
matemática. Nesse caso, o valor do denominador é testado e somente é
realizada a divisão se esse valor for diferente de zero (!=). Deve ser exibida na
tela o valor da divisão exata (//) e o resto da divisão (%).
Analisando o código acima, podemos verificar a execução da estrutura
condicional composta. Observe que na linha 4, temos o comando if indicando
o início da estrutura, acompanhado pela condição de a variável "denominador"
ser diferente de 0.
1. numerador = int(input('Forneça o numerador para a
divisão: '))
2. denominador = int(input("Forneça o denominador para a
divisão: "))
3.
4. if denominador != 0 :
5. divisao_exata = numerador // denominador
6. resto = numerador % denominador
7. print('Quociente = ', divisao_exata)
8. print('Resto da divisão = ', resto)
9. else :
10. print('Impossível realizar a divisão.') D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
267
A estrutura é seguida pelas operações aritméticas para calcular a divisão
exata e o resto da divisão entre as variáveis inteiras obtidas no input. Em
seguida, temos o comando print nas linhas 5, 6, 7 e 8, os quais só serão
executados se a variável possuir um valor diferente de 0, ou seja, se a resposta
da condição booleana for 1.
Caso contrário, isto é, se a condição que acompanha o if for falsa (booleano
for 0), o programa se direciona para a linha 9, executando o bloco de comandos
que a acompanha. Ambos os casos podem ser vistos nos terminais a seguir
(Figura 210).
Observe que o terminal acima exibe uma possível saída, considerando que
o usuário forneceu um denominador diferente de zero. Nesse contexto, o valor
fornecido é analisado na condição do if (3 != 0), a qual é avaliada como
verdadeira.
Portanto, o bloco de comandos associado ao if é executado, efetuando os
cálculos relacionados à divisão exata e ao resto da divisão, os quais são então
exibidos na tela. O bloco de comandos vinculado ao else será ignorado.
Figura 210: Terminal do VSCode exibindo as saídas geradas pelo código apresentado.
Fonte: captura de tela da IDE.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
268
Observe que o segundo terminal (Figura 211) apresenta uma segunda
possível saída, levando em consideração que o usuário forneceu um
denominador igual a 0. Nesse contexto, o valor fornecido é analisado na
condição do if (0 != 0), a qual é avaliada como falsa. Dessa forma, o bloco de
comandos associado ao if é ignorado, e o bloco de comandos vinculado ao else
será executado, exibindo a mensagem "Impossível realizar a divisão" na tela.
Para que seja possível aprimorar os seus conhecimentos será apresentado
mais um exemplo em que será abordada as estruturas condicionais aninhadas.
3.3.10.3.3. Estrutura condicional aninhada
A estrutura condicional aninhada refere-se à inclusão de uma estrutura
condicional dentro de outra. Isso significa que dentro do bloco de código de
uma estrutura condicional (como um if ou else), você pode ter outra estrutura.
Esse aninhamento permite criar lógicas mais complexas, em que a
execução de certos blocos de código depende de várias condições. Para
evidenciar o funcionamento desta estrutura, observe a implementação abaixo.
Figura 211: Terminal do VSCode exibindo as saídas geradas pelo código apresentado.
Fonte: captura de tela da IDE.
D
oc
um
en
to
a
ss
in
ad
o
el
et
ro
ni
ca
m
en
te
. V
er
ifi
ca
çã
o
no
s
ite
h
ttp
s:
//p
91
.fa
ct
i.c
om
.b
r/
pa
e/
va
lid
ac
ao
.h
tm
l,
in
fo
rm
an
do
o
c
ód
ig
o
ve
rif
ic
ad
or
P
A
E
5-
48
55
-8
34
1-
71
56
-3
86
8-
31
11
e
o
có
di
go
C
R
C
U
Z
D
IG
M
X
2.
Trilha de Aprendizagem: Inteligência Artificial aplicada à Visão Computacional
Neste exemplo, ocorre uma estrutura condicional aninhada, em que um
bloco de código condicional (if) está incorporado dentro de outro. O código
dentro do primeiro if será executado