Logo Passei Direto
Buscar
Material
páginas com resultados encontrados.
páginas com resultados encontrados.
left-side-bubbles-backgroundright-side-bubbles-background

Experimente o Premium!star struck emoji

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

left-side-bubbles-backgroundright-side-bubbles-background

Experimente o Premium!star struck emoji

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

left-side-bubbles-backgroundright-side-bubbles-background

Experimente o Premium!star struck emoji

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

left-side-bubbles-backgroundright-side-bubbles-background

Experimente o Premium!star struck emoji

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

left-side-bubbles-backgroundright-side-bubbles-background

Experimente o Premium!star struck emoji

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

left-side-bubbles-backgroundright-side-bubbles-background

Experimente o Premium!star struck emoji

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

left-side-bubbles-backgroundright-side-bubbles-background

Experimente o Premium!star struck emoji

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

left-side-bubbles-backgroundright-side-bubbles-background

Experimente o Premium!star struck emoji

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

left-side-bubbles-backgroundright-side-bubbles-background

Experimente o Premium!star struck emoji

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

left-side-bubbles-backgroundright-side-bubbles-background

Experimente o Premium!star struck emoji

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

Prévia do material em texto

DOMINE FERRAMENTAS DE IA 
PARA TURBINAR A PRODUÇÃO 
DE CONTEÚDOS DIGITAIS
Professor Esp. Leonam Nagel
2023 by Editora Edufatecie. Copyright do Texto C 2023. Os autores. Copyright C Edição 2023 Editora Edufatecie.
O conteúdo dos artigos e seus dados em sua forma, correção e confiabilidade são de responsabilidade exclusiva
dos autores e não representam necessariamente a posição oficial da Editora Edufatecie. Permitido o download da 
obra e o compartilhamento desde que sejam atribuídos créditos aos autores, mas sem a possibilidade de alterá-la 
de nenhuma forma ou utilizá-la para fins comerciais.
REITORIA Prof. Me. Gilmar de Oliveira
DIREÇÃO ADMINISTRATIVA Prof. Me. Renato Valença
DIREÇÃO DE ENSINO PRESENCIAL Prof. Me. Daniel de Lima
DIREÇÃO DE ENSINO EAD Profa. Dra. Giani Andrea Linde Colauto
DIREÇÃO FINANCEIRA PRESENCIAL Eduardo Luiz Campano Santini
DIREÇÃO FINANCEIRA EAD Guilherme Esquivel
DIREÇÃO DE INOVAÇÃO Prof. Me. Jorge Luiz Garcia Van Dal
NÚCLEO DE APOIO PSICOLÓGICO E PSICOPEDAGÓGICO Bruna Tavares Fernandes
BIBLIOTECÁRIA Tatiane Viturino Oliveira
PESQUISADOR INSTITUCIONAL Tiago Pereira da Silva
COORDENAÇÃO DE ENSINO, PESQUISA E EXTENSÃO (CONPEx) – MODALIDADE PRESENCIAL Profa. Ma. Luciana Moraes
COORDENAÇÃO DE ENSINO, PESQUISA E EXTENSÃO (CONPEx) – MODALIDADE EaD Me. Bruno Eckert Bertuol
COORDENAÇÃO DO DEPTO. DE PRODUÇÃO DE MATERIAIS DIDÁTICOS Luiz Fernando Freitas
REVISÃO ORTOGRÁFICA E NORMATIVA Beatriz Longen Rohling
Carolayne Beatriz da Silva Cavalcante
Eduardo Alves de Oliveira
Gleice Emanoela Nunes Ferreira
Isabelly Oliveira Fernandes de Souza
Jéssica Eugênio Azevedo
Louise Ribeiro
Marcelino Fernando Rodrigues Santos
Stephanie Vieira
Maria Clara da Silva Costa
Vinicius Rovedo Bratfisch
PROJETO GRÁFICO E DIAGRAMAÇÃO Bruna de Lima Ramos
Carlos Firmino de Oliveira
Lucas Patrick Rodrigues Ferreira Estevão
Vitor Amaral Poltronieri
ESTÚDIO, PRODUÇÃO E EDIÇÃO André Oliveira Vaz
DE VÍDEO Carlos Henrique Moraes dos Anjos
Felipe Souza Oliveira
Leandro Tenório
Maria Beatriz Paula da Silva
Pedro Vinícius de Lima Machado
Thassiane da Silva Jacinto
As imagens utilizadas neste material didático 
são oriundas do banco de imagens Shutterstock
33
Autor
Professor Esp. Leonam 
Nagel
Leonam Nagel é consultor especializado em Inteligência Artificial Generativa, 
pós-graduando em Liderança e Transformação Digital na Era da IA pela 
PUC-PR e fundador da Bull Up Mídia, empresa referência em consultoria e 
educação sobre aplicações práticas de IA Generativa.
Um dos idealizadores do Núcleo Inteligência Artificial e Disrupção da Acibalc, 
Leonam lidera iniciativas para facilitar e democratizar o uso da IA no ambiente 
corporativo. Em 2024, realizou palestras e workshops para mais de 40 
empresas no Brasil, incluindo organizações renomadas como Cagece no 
Ceará, Karsten e Altenburg em Santa Catarina.
Mantém parcerias estratégicas com entidades de peso, como SCMC de Santa 
Catarina, Inaed do Maranhão, Unifatecie no Paraná, UDESC e TI Exames, 
reforçando seu compromisso com o desenvolvimento tecnológico e inovação 
empresarial em diversas regiões do país.
Com experiência prática na implantação de soluções inteligentes para 
produtividade, marketing digital, criação de chatbots, análise e visualização 
de dados, Leonam alia seu conhecimento técnico avançado à sua trajetória 
criativa nas artes cênicas, música e audiovisual. Sua abordagem leve, prática 
e criativa torna a adoção da IA Generativa acessível e impactante para equipes 
e lideranças empresariais.
4
Apresentação
O cenário da inteligência artificial (IA) está em meio a uma 
transformação significativa, marcada por uma rápida expansão 
e especialização de aplicações em diversos setores. Desde 
ferramentas de uso geral que otimizam a produtividade 
cotidiana até geradores de conteúdo criativo altamente 
especializados e plataformas de desenvolvimento de software 
assistidas por IA. A inovação avança em ritmo acelerado. 
Esse crescimento é impulsionado por investimentos 
substanciais de capital de risco, alimentando uma competição 
intensa para desenvolver modelos mais capazes, intuitivos 
e integrados. As aplicações de IA deixaram de ser conceitos 
futuristas para se tornarem ferramentas práticas que estão 
remodelando indústrias e redefinindo fluxos de trabalho.
Esta apostila pretende fornecer uma análise detalhada e 
estruturada de 29 aplicações específicas de IA, agrupadas nas 
seguintes categorias: Ferramentas para Uso Geral, Pesquisa 
na Internet, Criação de Apresentações, Geradores de Imagem, 
Geradores de Vídeo, Criação de Sites e Aplicativos, Criação 
de Avatares e Dublagem de Vídeo, e Legendas e Tradução de 
Texto. 
Para cada aplicação, será abordado: sua funcionalidade 
principal (O que é), seus diferenciais-chave (Diferenciais), 
seu histórico de desenvolvimento, incluindo desenvolvedor, 
país de origem e marcos de financiamento (História), o 
URL oficial para acesso (Site para acesso) e sua estrutura 
de preços, incluindo planos disponíveis e disponibilidade de 
testes gratuitos (Preço). O escopo deste material limita-se às 
aplicações listadas e aos pontos de dados solicitados, com 
5
base nas informações disponíveis publicamente. Aplicações 
listadas em múltiplas categorias, como Krea e Freepik, terão 
suas funcionalidades abordadas em cada contexto relevante.
Plano de Estudo:
• Unidade 1: Ferramentas de IA para uso geral.
• Unidade 2: Pesquisa na internet.
• Unidade 3: Criação de apresentações.
• Unidade 4: Geradores de imagens.
• Unidade 5: Geradores de vídeo.
• Unidade 6: Apps para criação de sites e aplicativos.
• Unidade 7: Criação de avatares e dublagem de vídeo.
• Unidade 8: Legendas e tradução de texto com IA.
6
Sumário
Ferramentas de IA para uso geral
Pesquisa na internet
Criação de apresentações
Geradores de imagens
7
Geradores de vídeo
Apps para criação de sites e aplicativos
Criação de avatares e dublagem de vídeo
Legendas e tradução de texto com IA
Unidade 1
FERRAMENTAS DE IA 
PARA USO GERAL
9UNIDADE 1 FERRAMENTAS DE IA PARA USO GERAL
Esta categoria abrange grandes modelos de linguagem (LLMs) fundamentais e assistentes 
de IA projetados para uma ampla gama de tarefas conversacionais, geração de conteúdo, 
raciocínio e resolução de problemas. Frequentemente, estas ferramentas servem como 
a tecnologia subjacente para aplicações mais especializadas em outras categorias. A 
competição neste espaço é intensa, com os principais players buscando diferenciar-se 
mediante capacidades únicas, abordagens éticas e modelos de acesso.
A dinâmica competitiva neste segmento é evidente através dos rápidos ciclos de lançamento 
de modelos cada vez mais potentes (como a progressão da família Claude 3 para 3.7 e 
Grok 1 para 3) e das rodadas de financiamento massivas que atraem bilhões de dólares. 
Esta “corrida armamentista” dos grandes modelos obriga os players a adotarem estratégias 
de diferenciação claras. A Anthropic, por exemplo, enfatiza a segurança, a confiabilidade e 
a ética, incorporando princípios como a “IA Constitucional” no design do Claude. A xAI, por 
outro lado, aproveita a integração única do Grok com os dados em tempo real da plataforma 
X e cultiva uma personalidade mais ousada e “sem filtros”. Já a Poe adota uma estratégia 
de agregação, posicionando-se como um hub centralizado que oferece acesso a múltiplos 
modelos de ponta de diferentes fornecedores. Embora as capacidades centrais dos LLMs 
possam estar convergindo, estas estratégias distintas focadas no acesso a dados únicos, 
na segurança/ética ou em vantagens de plataforma/ecossistema são cruciais para sua 
posição no mercado.
Outra tendência marcante é a crescente acessibilidade e plataformização destas ferramentas. 
Já não estão vinculadas as interfaces de chat na web; estão cada vez mais disponíveis em 
múltiplas plataformas, incluindo aplicativos móveis (iOS, Android) e aplicativosà Kuaishou sinaliza a crescente competição global no mercado de vídeo generativo.
• Site para acesso: https://www.klingai.com/.
https://www.klingai.com/
https://www.klingai.com/
43UNIDADE 5 GERADORES DE VÍDEO
• Preço: Modelo Freemium. O plano gratuito oferece créditos diários. Os planos pagos são:
• Free: créditos diários/mensais limitados (66/dia ou 166/mês?), recursos básicos.
• Standard: cerca de US$ 10/mês - 660 créditos/mês. Remoção de marca d’água.
• Pro: cerca de US$ 37/mês - 3000 créditos/mês. Maior qualidade/controle. Acesso 
prioritário.
• Premier: cerca de US$ 92/mês - 8000 créditos/mês. Acesso prioritário.
5.2. RunwayML
• O que é: uma empresa de pesquisa em IA aplicada que desenvolve modelos e ferramentas 
generativas para criação de conteúdo multimídia, com forte ênfase em vídeo e imagem. É 
conhecida por sua colaboração no desenvolvimento do Stable Diffusion e por sua própria 
série “Gen” de modelos de vídeo.
• Diferenciais:
• Evolução de Modelos de Vídeo (Série Gen): possui um histórico claro de avanço 
em modelos de vídeo: Gen-1 (Video-to-Video), Gen-2 (Text/Image-to-Video), 
Gen-3 Alpha (melhor fidelidade, consistência e movimento), e Gen-4 (foco em 
consistência de personagens/objetos, cobertura de cena, física realista e efeitos 
visuais generativos - GVFX). Isso demonstra um roteiro de desenvolvimento 
robusto.
• Consistência Aprimorada: o modelo Gen-4 é especificamente projetado para 
manter a consistência de personagens, objetos e estilos entre diferentes cenas, 
usando imagens de referência sem necessidade de fine-tuning adicional.
• Controles Avançados: ferramentas como Multi-Motion Brush (permite controlar 
o movimento de até cinco elementos independentemente) e Camera Control 
(direciona o movimento da câmera virtual) oferecem um nível de controle granular 
sobre a geração.
• Animação de Personagens (Act-One): capacidade de gerar performances de 
personagens expressivas a partir de um vídeo de referência (driving video) e uma 
imagem do personagem, eliminando a necessidade de rigging complexo.
• Geração de Imagem (Frames): possui seu próprio modelo base de geração de 
imagem, destacado pelo “controle estilístico sem precedentes”.
• Ferramentas de Áudio: inclui Text to Speech (texto para fala), Lip Sync 
(sincronização labial) e Custom Voices (vozes personalizadas).
• Foco Empresarial: colabora com grandes organizações de mídia para criar 
versões fine-tuned proprietárias de suas ferramentas e oferece planos Enterprise 
robustos.
• História: Fundada em 2018 por Cristóbal Valenzuela (CEO), Alejandro Matamala (CDO) 
44UNIDADE 5 GERADORES DE VÍDEO
e Anastasis Germanidis (CTO), que se conheceram na NYU. Sediada em Manhattan, Nova 
York. Teve papel fundamental no lançamento do Stable Diffusion em colaboração com a 
LMU Munich e com apoio da Stability AI. Possui um histórico de financiamento substancial: 
Seed (US$ 2M, 2018), Series A (US$ 8.5M, Dez 2020), Series B (US$ 35M, Dez 2021), 
Series C (US$ 50M, Dez 2022), extensão da Series C (US$ 141M, Jun 2023, avaliação 
de US$ 1.5B, com investimento de Google, Nvidia, Salesforce) e Series D (US$ 308M, 
Abr 2025, avaliação de mais de US$ 3B, liderada por General Atlantic). O financiamento 
total ultrapassa US$ 544 milhões. Este capital massivo e o apoio de gigantes da tecnologia 
posicionam a RunwayML como um líder de mercado, focado em pesquisa de ponta e 
aplicações profissionais/empresariais. Alegações sobre o uso de dados do YouTube para 
treinar o Gen-3 levantam questões éticas e legais relevantes para toda a indústria.
• Site para acesso: https://runwayml.com/ 
• Preço: Modelo Freemium. O plano gratuito oferece créditos iniciais únicos. Os planos 
pagos fornecem créditos mensais:
• Basic (Free): 125 créditos únicos, recursos limitados, marca d’água.
• Standard: US$ 15/mês (US$ 12/mês no plano anual) - 625 créditos/mês. Sem 
marca d’água, upscale para 4K.
• Pro: US$ 35/mês (US$ 28/mês no plano anual) - 2250 créditos/mês. Vozes 
customizadas.
• Unlimited: US$ 95/mês (US$ 76/mês no plano anual) - Gerações ilimitadas em 
modo relaxado, 2250 créditos mensais para gerações mais rápidas. Acesso ao 
modelo Frames.
• Enterprise: preço customizado.
• O custo em créditos por segundo de vídeo varia conforme o modelo utilizado (ex: 
Gen-4 vs Gen-3 Alpha Turbo). Créditos mensais não utilizados não acumulam.
5.3 PikaLabs
• O que é: uma plataforma de IA focada em simplificar e democratizar a criação de vídeos, 
permitindo transformar texto, imagens ou clipes de vídeo existentes em novo conteúdo de 
vídeo. Foi fundada por estudantes de doutorado de Stanford.
• Diferenciais:
• Pikatwists: um recurso distintivo que permite manipular personagens ou objetos 
específicos dentro de um vídeo, mantendo o restante da cena intacto, oferecendo 
um controle de edição localizado.
• Flexibilidade de Input: suporta múltiplos fluxos de trabalho: Text-to-Video, Image-
https://runwayml.com/
https://runwayml.com/
45UNIDADE 5 GERADORES DE VÍDEO
to-Video e Video-to-Video.
• Ferramentas de Edição: além dos Pikatwists, oferece recursos como Modify 
Region (modificar região), Lip Sync, Sound Effects (efeitos sonoros), Expand 
Canvas (expandir tela) e Extend Video Length (estender duração). Recursos como 
Pikaframes, Pikascenes, Pikadditions e Pikaswaps são mencionados como parte 
dos planos pagos.
• Foco na Usabilidade: tem como objetivo reduzir a barreira de entrada para a 
criação de vídeos, tornando a ferramenta acessível mesmo para iniciantes, com 
uma interface amigável.
• Desenvolvimento Ágil: a empresa afirma incorporar rapidamente novos recursos 
com base no feedback dos usuários. Múltiplas versões de modelos são mencionadas 
(1.0, 1.5, 2.0, 2.1, 2.2, Turbo, Pro), sugerindo iteração rápida.
• História: fundada em 2023 por Demi Guo (CEO) e Chenlin Meng, ambas com doutorado por 
Stanford. Sediada em Palo Alto, Califórnia. A startup atraiu rapidamente um financiamento 
total de US$ 115 milhões: um grant inicial (US$ 226K, Dez 2022), uma Series A (US$ 35M, 
Nov 2023, liderada pela Lightspeed) e uma Series B (US$ 80M, Jun 2024, liderada pela 
Spark Capital). Sua avaliação foi reportada em US$ 470 milhões em junho de 2024. A lista 
de investidores inclui nomes de peso como Lightspeed Venture Partners, Spark Capital, Nat 
Friedman, Daniel Gross, Elad Gil, Adam D’Angelo (CEO da Quora), Andrej Karpathy (ex-
Tesla/OpenAI), SV Angel e Homebrew. O rápido crescimento e o alto financiamento para 
uma empresa tão jovem destacam o enorme interesse dos investidores em ferramentas de 
vídeo por IA acessíveis e inovadoras.
• Site para acesso: https://pika.art/.
• Preço: Modelo Freemium. Oferece um plano gratuito. Os planos pagos utilizam créditos 
mensais:
• Standard: US$ 10/mês (US$ 8/mês no plano anual) - 700 créditos/mês. Geração 
mais rápida, sem marca d’água, uso comercial. Acesso aos modelos 1.0, 1.5, 2.1, 
2.2, Turbo, Pro (Pikadditions/Swaps/Twists).
• Pro: US$ 35/mês (US$ 28/mês no plano anual) - 2300 créditos/mês. Geração 
ainda mais rápida.
• Fancy: US$ 95/mês (US$ 76/mês no plano anual) - 6000 créditos/mês. Geração 
mais rápida de todas.
• O custo em créditos varia muito dependendo do modelo e do recurso utilizado 
(ex: Pikatwists custa mais). A API tem preço por segundo de vídeo gerado (US$ 
0.05 a US$ 0.156/seg). Créditos adicionais (rollover) podem ser comprados. A 
inconsistência nas informações de preços/créditos entre as fontes sugere que a 
oferta pode ter mudado rapidamente; a página oficial de preços é a referência mais 
confiável.
https://pika.art/
https://pika.art/
Unidade 6
APPS PARA 
CRIAÇÃO DE SITES E 
APLICATIVOS
47UNIDADE 6 APPS PARA CRIAÇÃO DE SITES E APLICATIVOS
A IA está acelerando a democratização do desenvolvimento de software. Ferramentas 
como GitHub Copilot e Cursor permitem que desenvolvedores experientes e novos 
criadores traduzam a linguagem natural em código. O sucesso dessas ferramentas levou ao 
surgimento de outras, como Bolt.new, e fez com que empresasestabelecidas investissem 
em produtos de IA.
A monetização nessa área é diversa, incluindo modelos baseados em tokens, limites de 
mensagens, créditos de uso, assinaturas e créditos para recursos premium. Essa variedade 
reflete a busca da indústria pelo melhor modelo de precificação para computação e recursos 
de IA, criando um cenário complexo para os usuários.
6.1. Bolt.new
• O que é: Bolt.new é um agente de desenvolvimento web de IA que opera diretamente 
no navegador, construído sobre a tecnologia WebContainer da StackBlitz. Ele permite aos 
usuários gerar, executar, editar e implantar aplicações web full-stack e móveis usando 
prompts de linguagem natural dentro de um ambiente baseado em chat. A plataforma 
suporta linguagens e frameworks web populares e oferece integrações para implantação 
(Netlify), banco de dados e autenticação (Supabase), desenvolvimento móvel (Expo) e 
importação de design (Figma). 
• Diferenciais: a ferramenta aproveita a tecnologia WebContainer estabelecida da StackBlitz 
para fornecer um ambiente de desenvolvimento full-stack diretamente no navegador. Seu 
foco principal é simplificar o processo de desenvolvimento através de prompts de chat, 
tornando-o acessível mesmo para usuários com conhecimento limitado de desenvolvimento 
web (embora alguma compreensão ajude em projetos mais complexos). Oferece integração 
direta para implantação em plataformas como Netlify. A empresa afirma que sua abordagem 
pode reduzir significativamente os custos e o tempo de desenvolvimento em comparação 
com métodos tradicionais.
• História: lançado em 2024 pela StackBlitz (fundada em 2017) como uma ferramenta 
nativa de IA. A própria StackBlitz já possuía uma base de usuários considerável, atingindo 
2 milhões em 2022. Bolt.new está sediada em São Francisco, EUA, e foi fundada por Eric 
Simons. Os detalhes sobre o financiamento são um pouco conflitantes nas fontes: uma 
menciona uma rodada Série B de US$ 105,5 milhões (provavelmente da StackBlitz) que 
48UNIDADE 6 APPS PARA CRIAÇÃO DE SITES E APLICATIVOS
resultou em US$ 20 milhões de ARR rapidamente; outra lista apenas a Nexus Venture 
Partners como investidor institucional; e uma terceira afirma que o Bolt.new levantou US$ 
7,90 milhões no total até 2025. Essa discrepância provavelmente decorre da dificuldade em 
separar o financiamento da empresa-mãe (StackBlitz) da iniciativa específica do produto 
(Bolt.new). O rápido crescimento do ARR (US$ 4 milhões em 4 semanas, US$ 20 milhões 
em 2 meses) é notável e pode refletir o sucesso combinado da StackBlitz e do Bolt.new. 
• Site para acesso: bolt.new
• Preço: Bolt.new utiliza um sistema baseado em tokens. Os planos incluem:
• Gratuito: 1 milhão de tokens por mês (com limite diário de 150.000 tokens). 
• Pro: US$ 20/mês (10 milhões de tokens). 
• Pro 50: US$ 50/mês (26 milhões de tokens). 
• Pro 100: US$ 100/mês (55-60 milhões de tokens – pequena discrepância entre 
fontes ). 
• Pro 200: US$ 200/mês (120 milhões de tokens). 
• Planos Teams também estão disponíveis (US$ 30 a US$ 210 por membro/mês). 
6.2. Lovable
• O que é: Lovable é uma plataforma alimentada por IA que permite a usuários de qualquer 
nível de habilidade criar e implantar aplicações de web full-stack usando prompts de 
linguagem natural, tudo a partir de uma única aba do navegador. A plataforma se posiciona 
como um “engenheiro full stack sobre-humano”. Ela gerencia o frontend (usando React, 
Tailwind, Vite), persistência de dados e autenticação (com integração Supabase), endpoints 
de backend, implantação e colaboração.
• Diferenciais: o foco principal está na interação via linguagem natural, acessível tanto para 
usuários técnicos quanto não técnicos. Oferece colaboração em tempo real (atualmente em 
beta) e compartilhamento de projetos. Integra-se com o Figma através do Visual Copilot da 
Builder.io, permitindo um fluxo de trabalho do design para o aplicativo. Os usuários mantêm 
a propriedade do código gerado e podem exportá-lo ou sincronizá-lo com o GitHub. A 
plataforma enfatiza a velocidade (“20x mais rápido que codificar”) e a qualidade do design 
UI/UX nos aplicativos gerados. Uma característica interessante é que as mensagens do 
tipo “Peça à IA para corrigir” não contam para o limite de uso da plataforma.
49UNIDADE 6 APPS PARA CRIAÇÃO DE SITES E APLICATIVOS
• História: originou-se como GPT Engineer em meados de 2023, um projeto open-source 
popular (mais de 50.000 estrelas no GitHub) voltado para desenvolvedores. Foi renomeado 
para Lovable no final de 2023, ampliando sua missão para incluir usuários não técnicos 
através de uma aplicação web (inicialmente gptengineer.app). Fundada em 2023 por Anton 
Osika e Fabian Hedin. A empresa é descrita como sueca, sediada em Estocolmo, mas está 
incorporada em Dover, DE, EUA. Relatou um crescimento rápido, atingindo € 16,2 milhões 
de ARR (ou US$ 17 milhões de ARR em) e 30.000 clientes pagantes em apenas três meses 
após o lançamento. Levantou US$ 15 milhões (€ 14,3 milhões em) em uma rodada Série 
A liderada pela Creandum em fevereiro de 2025. O financiamento total relatado é de US$ 
27,7 milhões. Investidores chave incluem Creandum, Charlie Songhurst, Thomas Wolf, 
20VC e Antler.
• Site para acesso: lovable.dev 
• Preço: Lovable utiliza um modelo de precificação baseado em mensagens. Os planos 
incluem:
• Gratuito: permite exploração de projetos públicos ilimitados, mas com edições de 
IA diárias/mensais limitadas. 
• Starter: US$ 20/mês (inclui 100 mensagens por segundo) - oferece limites mensais 
(em vez de diários), projetos privados ilimitados e domínios personalizados. 
• Launch: US$ 50/mês (inclui 250 mensagens por segundo) - oferece 2,5x os limites 
mensais do plano Starter. 
• Scale 1: US$ 100/mês (inclui 500 créditos/mensagens, segundo) - oferece 5x os 
limites mensais, acesso antecipado a novos recursos. 
• Teams: preço personalizado, necessário contato com vendas. 
• Um teste gratuito está disponível. O modelo de precificação parece ser baseado 
em interações/mensagens em vez de tokens.
6.3. Replit
• O que é: Replit é um ambiente de desenvolvimento integrado (IDE) baseado na nuvem 
e uma plataforma para desenvolvimento e implantação de software, aprimorado com 
capacidades de IA. Ele permite aos usuários codificar em qualquer linguagem, construir, 
colaborar e implantar aplicativos web, sites, bots, APIs, etc., tudo em um navegador. A 
plataforma apresenta o Replit AI (composto pelo Agent e Assistant) para geração de código, 
explicação, depuração e criação completa de aplicativos a partir de prompts.
50UNIDADE 6 APPS PARA CRIAÇÃO DE SITES E APLICATIVOS
• Diferenciais: fornece um ambiente de desenvolvimento completo na nuvem, sem 
necessidade de configuração, acessível de qualquer lugar. Seu AI Agent visa ser um 
“desenvolvedor de aplicativos automatizado”, gerando planos de construção e iterando com 
base no feedback do usuário. Oferece implantações integradas alimentadas pelo Google 
Cloud. Possui um forte foco em comunidade e educação, buscando diminuir a barreira 
entre aprender e criar. Suporta colaboração através de recursos para equipes (Teams). 
Utiliza modelos de linguagem poderosos como Claude 3.5 Sonnet e GPT-4o.
• História: fundada em 2016 por Amjad Masad e Haya Odeh. A sede fica em Foster City, CA, 
com um hub no Brooklyn, NY. A plataforma tem mais de 30 milhões de usuários. Possui um 
histórico de financiamento significativo: Pré-Seed (US$ 120 mil, Jan 2018, Y Combinator), 
Seed (US$ 4,5 milhões, Out 2018, a16z), Série A (US$ 20 milhões, Fev 2021, A.Capital), 
Série B (US$ 80 milhões, Dez 2021, Coatue), Extensão da Série B (US$ 97,4 milhões, Abr 
2023, a16z, avaliando a empresa em US$ 1,16 bilhão), Rodada Venture (US$ 20 milhões, 
Nov 2023, Craft Ventures). O total levantado é de US$ 221,02 milhões. Investidores chave 
incluem a16z, Coatue, Craft Ventures, Y Combinator, A.Capital.
• Site para acesso: replit.com 
• Preço:Replit oferece vários níveis de assinatura:
• Gratuito: Workspace básico, acesso limitado ao Replit AI, suporte da comunidade, 
3 projetos públicos.
• Replit Core (anteriormente Hacker): US$ 25/usuário (inclui US$ 25 em créditos 
de uso mensal para IA/computação, com cobrança pay-as-you-go após o uso 
dos créditos). Fornece acesso ao Agent/Assistant (Claude Sonnet 3.5, GPT-4o), 
workspace mais poderoso, projetos públicos e privados ilimitados, suporte para 
membros. (Nota: difere ligeiramente no preço/nome, provavelmente informação 
mais antiga). 
• Teams: US$ 40/usuário/mês (inclui US$ 40 em créditos mensais por usuário, pay-
as-you-go). Adiciona faturamento centralizado, controle de acesso baseado em 
função (RBAC), workspace ainda mais poderoso, implantações privadas.
• Enterprise: preço personalizado (Em breve). Adiciona SSO, SCIM, suporte 
dedicado.
6.4. Cursor
• O que é: Cursor é um editor de código nativo de IA construído sobre o VSCode, projetado 
para alta produtividade do desenvolvedor. Ele integra IA de forma transparente para tarefas 
51UNIDADE 6 APPS PARA CRIAÇÃO DE SITES E APLICATIVOS
como autocompletar código (“Tab”), programação em par baseada em chat e edição/geração 
de código inline (“Cmd-K”). O objetivo é funcionar como um “programador par de IA”.
• Diferenciais: construído sobre o VSCode, permite uma migração fácil para usuários 
existentes (importação de extensões, temas, atalhos de teclado). Apresenta um 
autocompletar via Tab altamente preditivo (“tab, tab, tab”) que antecipa edições de múltiplas 
linhas. Possui forte consciência da base de código para fornecer respostas e edições 
contextuais. Capacidades de edição usando linguagem natural. Utiliza uma combinação de 
modelos de IA construídos especificamente e modelos de fronteira. Oferece opções robustas 
de privacidade, incluindo um “Modo de Privacidade” onde o código nunca é armazenado 
remotamente, e possui certificação SOC 2. É elogiado por desenvolvedores por melhorar 
significativamente o fluxo de trabalho em comparação com ferramentas como o Copilot.
• História: desenvolvido pela Anysphere, um laboratório de pesquisa aplicada focado 
na automação da codificação. A Anysphere anunciou o Cursor em janeiro de 2023. 
Financiamento: Seed (US$ 8 milhões do fundo da OpenAI + anjos como Nat Friedman, Arash 
Ferdowsi em 2023), Série A (US$ 60 milhões lideradas pela a16z, Ago 2024) , Série B (US$ 
105 milhões lideradas pela Thrive Capital, a16z, Benchmark, jan. 2025). O financiamento 
total provavelmente ultrapassa US$ 173 milhões. Relatou ter atingido mais de US$ 100 
milhões em ARR e ser usado por milhões de programadores (embora haja questionamentos 
sobre isso no Reddit). Investidores chave: OpenAI, Thrive Capital, Andreessen Horowitz 
(a16z), Benchmark, anjos notáveis. A origem/sede não é explicitamente declarada, mas é 
provavelmente baseada nos EUA, dados os investidores e a certificação SOC 2.
• Site para acesso: cursor.com 
• Preço: Oferece planos em níveis:
• Hobby: gratuito (provavelmente com limites de uso, não especificados nos trechos).
• Pro: US$ 20/mês (autocompletar ilimitado, solicitações premium).
• Business: US$ 40/usuário/mês (adiciona faturamento centralizado, modo de 
privacidade).
• Planos anuais oferecem descontos. 
• Oferece um teste gratuito de 14 dias do plano Pro, sem necessidade de cartão de 
crédito. 
6.5. Windsurf (anteriormente Codeium)
52UNIDADE 6 APPS PARA CRIAÇÃO DE SITES E APLICATIVOS
• O que é: Windsurf é um editor de código de IA “agêntico”, projetado para entender o 
contexto completo do projeto, antecipar a intenção do desenvolvedor e automatizar tarefas 
como codificação, correção, depuração e execução de código. O objetivo é manter os 
desenvolvedores em um “estado de fluxo”. 
• Diferenciais: posiciona-se como mais avançado que assistentes de IA padrão como o 
Cursor. Seu recurso chave, “Cascade”, atua como um agente que pensa passos à frente, 
corrige erros proativamente e pode automatizar a criação/teste de múltiplos arquivos 
(“Modo de Escrita”). O “Supercomplete” prevê a intenção, não apenas o código. O “Windsurf 
Tab” utiliza o histórico de comandos e a área de transferência para sugerir sugestões 
mais inteligentes. Recursos como “Memories” (contexto persistente), “Rules” (instruções 
personalizadas para a IA), upload de imagens para geração de UI, integração com busca 
na web, indexação local para consciência de toda a base de código e um terminal de IA 
aprimoram suas capacidades agênticas. Oferece implantação integrada (em parceria com a 
Netlify) e visualização dentro do editor. Foco empresarial com recursos para produtividade, 
onboarding, segurança e análise.
• História: fundada em 2021. Anteriormente conhecida como Codeium, foi renomeada para 
Windsurf em abril de 2025. Sediada em Mountain View, CA. Financiamento significativo: 
Seed (US$ 3 milhões, jan. 2021), Série A (US$ 25 milhões, Abr 2022), Série B (jan. 2024), 
Série C (ago. 2024), Later Stage VC (fev. 2025, em andamento). O total levantado relatado 
é de US$ 243 milhões. Investidores incluem Kleiner Perkins , Comcast NBCUniversal LIFT 
Labs, Base Case Capital, Founders Fund, Neo, AIX Ventures. Afirma ter mais de 1.000 
clientes empresariais.
• Site para acesso: windsurf.com 
• Preço: Utiliza um sistema de créditos para modelos e recursos premium:
• Gratuito: US$ 0/mês. Inclui acesso ao modelo Cascade Base, créditos premium 
limitados (5 User Prompt + 5 Flow Action por mês após o presente de teste), 
recursos básicos.
• Pro: US$ 15/mês. Inclui 500 User Prompt + 1.500 Flow Action créditos premium/
mês.
• Pro Ultimate: US$ 60/mês. Créditos User Prompt infinitos, 3.000 créditos Flow 
Action/mês. Pode comprar créditos extras (US$ 10 por 400). Suporte prioritário.
• Teams (US$ 35/usuário/mês) e Teams Ultimate (US$ 90/usuário/mês): Créditos 
agrupados, recursos organizacionais, análise.
• Enterprise SaaS: preço personalizado.
Unidade 7
CRIAÇÃO DE AVATARES 
E DUBLAGEM DE VÍDEO 
COM IA
54UNIDADE 7 CRIAÇÃO DE AVATARES E DUBLAGEM DE VÍDEO
O uso de avatares digitais com IA para gerar vídeos está crescendo rapidamente devido 
à economia de tempo e custo, escalabilidade, capacidades multilíngues e novas formas 
de interação. Os principais casos de uso incluem marketing, vendas, aprendizado e 
desenvolvimento, suporte ao cliente e e-learning.
O mercado é competitivo, com grandes players como Synthesia, HeyGen e D-ID. A 
competição se concentra no realismo dos avatares, qualidade de voz, personalização, 
facilidade de uso e recursos empresariais.
A tecnologia está evoluindo da simples geração de vídeo a partir de texto para agentes 
de IA conversacionais em tempo real, abrindo novas aplicações, mas também trazendo 
desafios éticos significativos.
A capacidade de criar representações digitais realistas de pessoas exige diretrizes éticas 
fortes e mecanismos robustos para prevenir o uso indevido. Plataformas líderes estão 
investindo em confiança e segurança, tornando-se um diferencial crítico. 
7.1 HeyGen
• O que é: HeyGen é uma plataforma de criação de vídeo alimentada por IA, especializada 
na geração de vídeos com avatares de IA personalizáveis. Oferece diversos tipos de 
avatares (Vídeo, Foto, Generativo, Stock, UGC), clonagem de voz, tradução de vídeo e 
ferramentas voltadas para marketing, vendas, L&D, entre outros. 
• Diferenciais: destaca-se pela ampla gama de métodos de criação de avatares: clonagem 
a partir de vídeo (Video Avatar), animação de fotos (Photo Avatar), geração a partir de 
prompts de texto (Generative Avatar), uso de avatares pré-fabricados (Stock Avatar) e 
criação de avatares no estilo UGC (User-Generated Content). Apresenta avatares de IA 
interativos capazes de manter conversas com base no conhecimento carregado. Possui 
forte foco em capacidades multilíngues (mais de 70 idiomas, 175+ dialetos) com sincronia 
labial. Fornece ferramentas para testes A/B de roteiros e criadores para anúncios. Oferece 
acesso àAPI e integrações. Enfatiza o realismo nas expressões e gestos dos avatares. 
• História: fundada em dezembro de 2020 por Joshua Xu (ex-Snap) e Wayne Liang (ex-
ByteDance). Sediada em Los Angeles, CA, com membros da equipe também em SF, 
Palo Alto e Toronto. Experimentou um crescimento explosivo, atingindo mais de US$ 35 
55UNIDADE 7 CRIAÇÃO DE AVATARES E DUBLAGEM DE VÍDEO
milhões em ARR em pouco mais de um ano e lucratividade desde o segundo trimestre de 
2023. Levantou um total de US$ 69 milhões: Seed (US$ 9 milhões, nov. 2022 ; ou US$ 5,6 
milhões, nov. 2023) e Série A (US$ 60 milhões, mar/jun 2024, liderada pela Benchmark, 
avaliando a empresa em US$ 500 milhões). Investidores chave incluem Benchmark, Thrive 
Capital, BOND, Conviction, SV Angel, Dylan Field, Elad Gil. Possui mais de 40.000 clientes 
empresariais pagantes.
• Site para acesso: heygen.com 
• Preço: utiliza um modelo de assinatura freemium baseado em créditos. 1 crédito equivale 
a 1 minuto de vídeo gerado.
• Gratuito: US$ 0/mês. Inclui 1 crédito/mês, 1 usuário, 1 Avatar Instantâneo, 120+ 
avatares, 300+ vozes, exportação em 720p, marca d’água HeyGen. 
• Creator: US$ 29/mês (US$ 24/mês anualmente). Inclui 15 créditos/mês (opções até 
120), 1 usuário, 3 Avatares Instantâneos, vozes premium, legendas automáticas, 
sem marca d’água, exportação em 1080p, geração rápida. 
• Team (anteriormente Business): US$ 149/mês (US$ 120/mês anualmente). Inclui 
30 créditos/mês (opções até 300), múltiplos usuários, acesso à API, resolução 4K, 
Kit de Marca, geração mais rápida. 
• Enterprise: preço personalizado. Adiciona opção de Avatar de Estúdio, SSO, 
suporte dedicado, etc. 
• Preços da API: planos separados (Gratuito, Pro US$ 99/mês, Scale US$ 330/mês, 
Enterprise) com diferentes alocações de crédito e recursos como API de Tradução 
de Vídeo. 
7.2 Synthesia
• O que é: Synthesia é uma plataforma líder de comunicação por vídeo de IA para empresas, 
permitindo aos usuários criar vídeos profissionais a partir de texto usando avatares e vozes 
de IA. Foca em casos de uso empresarial como L&D, capacitação de vendas, comunicação 
interna, marketing e atendimento ao cliente.
• Diferenciais: oferece uma vasta biblioteca com mais de 230 avatares de IA diversificados 
e permite a criação de avatares personalizados. Suporte extensivo a idiomas (mais de 
140 idiomas e sotaques) com vozes de IA de alta qualidade e clonagem de voz. Apresenta 
tradução de vídeo com 1 clique e dublagem por IA. Fornece um Assistente de Vídeo de 
IA para gerar vídeos a partir de prompts, links ou documentos. Inclui recursos robustos 
de colaboração (workspaces, colaboração ao vivo, comentários, fluxo de revisão). Forte 
56UNIDADE 7 CRIAÇÃO DE AVATARES E DUBLAGEM DE VÍDEO
foco empresarial com recursos como Kits de Marca, SSO, conformidade SOC 2, análise 
e exportação SCORM. Oferece mais de 300 modelos. Recentemente adicionou avatares 
expressivos com mais emoção.
• História: fundada em 2017 por Victor Riparbelli (CEO), Steffen Tjerrild, Matthias Niessner 
e Lourdes Agapito. Sediada em Londres, Reino Unido. Atingiu o status de unicórnio 
(avaliação de US$ 1 bilhão) em junho de 2023. Levantou mais de US$ 330 milhões no total. 
Rodadas-chave: Seed (US$ 3,1 milhões, 2019), Série A (US$ 12,5 milhões, abr. 2021), 
Série B (US$ 50 milhões, dez. 2021, Kleiner Perkins/GV), Série C (US$ 90 milhões, jun. 
2023, Accel/Nvidia), Série D (US$ 180 milhões, Jan 2025, NEA, avaliando em US$ 2,1 
bilhões). Investidores chave: NEA, Accel, Kleiner Perkins, GV, FirstMark, MMC Ventures, 
Nvidia, Atlassian Ventures, WiL, PSP Growth. Possui mais de 60.000 clientes empresariais, 
incluindo >60% da Fortune 100. Adquiriu a Elai.io.
• Site para acesso: synthesia.io 
• Preço: Oferece vários planos baseados em minutos de vídeo por mês/ano:
• Gratuito: US$ 0/mês. Inclui 3 minutos de vídeo/mês, 1 editor, 6 avatares, 120+ 
idiomas, 60+ modelos, recursos básicos.
• Starter: US$ 29/mês (US$ 18/mês anualmente). Inclui 10 minutos de vídeo/mês 
(120/ano), 1 editor + 3 convidados, 70+ avatares. 
• Creator: US$ 89/mês (US$ 64/mês anualmente). Inclui 30 minutos de vídeo/mês 
(360/ano), 1 editor + 5 convidados, 90+ avatares, fontes personalizadas, página de 
compartilhamento com marca. 
• Enterprise (anteriormente Corporate): preço personalizado. Minutos de vídeo 
ilimitados, 140+ avatares, recursos de colaboração, tradução, SSO, opções de 
avatar personalizado, suporte dedicado.
7.3 D-ID
• O que é: D-ID é uma plataforma de IA especializada na geração de vídeos com avatares 
falantes (“pessoas digitais”) a partir de imagens ou texto. Oferece o Creative Reality™ 
Studio para criação de vídeo self-service e uma API para integração e animação em tempo 
real. Também apresenta Agentes de IA interativos. 
• Diferenciais: o diferencial é a sua chave API de animação em tempo real, permitindo 
a geração síncrona de vídeo a partir de áudio em alta velocidade (100 FPS), adequada 
57UNIDADE 7 CRIAÇÃO DE AVATARES E DUBLAGEM DE VÍDEO
para aplicações interativas como chatbots, avatares em tempo real e jogos. Oferece vários 
métodos de criação de avatar: avatares de estoque, upload de imagens/ilustrações, geração 
de texto para imagem e criação de avatares pessoais a partir de vídeo (níveis Standard, 
Express, Premium+, Studio com diferentes qualidades/requisitos de entrada). Apresenta 
Agentes de IA que combinam modelos de linguagem com avatares em tempo real para 
conversas interativas e não roteirizadas. Suporta mais de 100 idiomas. Integrações com 
Canva e PowerPoint. Forte foco em privacidade e segurança.
• História: uma startup sediada em Tel Aviv, Israel. Fundada antes de 2022 (provavelmente 
antes menciona trabalho com ONGs antes da Série B). O CEO e Co-Fundador é Gil Perry. 
Levantou US$ 25 milhões em financiamento Série B em março de 2022, liderado pela 
Macquarie Capital, elevando o financiamento total para US$ 48 milhões na época. Outros 
investidores incluem Pitango, AXA Venture Partners, OurCrowd, OIF, Maverick, Marubeni. 
(Nota: parecem irrelevantes para a história/financiamento da D-ID, discutindo Crunchbase, 
TechCrunch, DeepSeek, Decagon).
• Site para acesso: d-id.com 
• Preço: utiliza um sistema baseado em créditos ou minutos em diferentes produtos (Studio, 
API, Agents). Oferece um teste gratuito.
• Planos do Studio:
- Trial: gratuito (14 dias). Inclui 3 minutos para Vídeos/Agents/Translate/API. 
Marca d’água em tela cheia.
- Lite: US$ 4,7/mês (cobrado anualmente). 10 min/mês. Marca d’água D-ID. 
Apenas avatares Standard.
- Pro: US$ 16/mês (cobrado anualmente). 15 min/mês. Marca d’água AI. 
Avatares Premium & Standard. 3 Avatares Pessoais. 1 Clonagem de Voz. 
Licença de uso comercial.
- Advanced: US$ 108/mês (cobrado anualmente). 100 min/mês. Logo 
personalizado. 5 Avatares Pessoais. 3 Clonagens de Voz. 3 Agentes 
Incorporados.
- Enterprise: preço personalizado. Minutos personalizados, opção de Avatar 
de Estúdio, avatares pessoais ilimitados, SSO, suporte premium.
Unidade 8
LEGENDAS E 
TRADUÇÃO DE TEXTO 
COM IA
59UNIDADE 8 LEGENDAS E TRADUÇÃO DE TEXTO COM IA
A Inteligência Artificial está se tornando essencial para tornar o conteúdo digital mais acessível, 
através de legendagem precisa, e para superar barreiras linguísticas, com tradução e 
dublagem avançadas. Há uma crescente procura por ferramentas que automatizem esses 
processos com precisão e eficiência, atendendo às necessidades de criadores de vídeo, 
empresas e comunicação global. Observa-se uma mistura de estratégias de plataforma, com 
aplicativos como o Captions evoluindo de ferramentas de legenda para suítes de criação 
de vídeo com IA, enquanto o CapCut atua como um editor de vídeo completo, aproveitando 
seu vasto ecossistema e base de usuários. O DeepL mantém um foco especializado em 
tradução e escrita, competindo na precisão e segurança de seus resultados.
8.1 Captions
• O que é: Captions é um aplicativo de estúdio criativo alimentadopor IA, focado em 
simplificar a criação e edição de vídeos falados. Inicialmente, ganhou notoriedade por 
sua geração precisa de legendas. Atualmente, oferece um conjunto de ferramentas de IA 
que inclui edição automática, dublagem, geração de roteiros, correção de contato visual, 
remoção de ruído e criação de avatares. Está disponível para iOS, Android e Desktop.
• Diferenciais: forte ênfase na automação por IA de todo o fluxo de trabalho de vídeo (estilos 
de “AI Edit”, avatar 3D “AI Creator”). Legendas precisas e dinâmicas, palavra por palavra. 
Dublagem alimentada por IA em mais de 29 idiomas na própria voz do usuário (“Lipdub” 
com movimento labial natural). Correção de contato visual por IA. Geração de sons, zooms, 
B-roll, imagens e fundos por IA. Oferece recursos como AI Shorts/Reddit to Video. 
• História: fundada em 2021 por Gaurav Misra (CEO, ex-Snap) e Dwight Churchill (COO). 
Sediada em Nova York, NY. Lançada inicialmente como um protótipo de rede social de 
vídeo falado, pivotou e depois retornou ao conceito de aplicativo de criação de vídeo com 
IA. Ganhou tração rapidamente (mais de 10 milhões de downloads, mais de 3 milhões de 
vídeos mensais). Levantou um total de US$ 100 milhões. Rodadas incluem: Seed/Série A 
(US$ 15 milhões no total até junho de 2023 - inferido de) Série B (US$ 25 milhões, junho de 
2023, Kleiner Perkins) Série C (US$ 60 milhões, julho de 2024, Index Ventures, avaliando 
em US$ 500 milhões). Investidores chave: Index Ventures, Kleiner Perkins, Sequoia Capital, 
Andreessen Horowitz, SV Angel, HubSpot Ventures, Adobe Ventures. Adquiriu a AlpacaML 
para reforçar a pesquisa em IA. 
60UNIDADE 8 LEGENDAS E TRADUÇÃO DE TEXTO COM IA
• Site para acesso: captions.ai 
• Preço: Oferece planos de assinatura freemium:
• Gratuito: edição manual básica (cortar, zoom, sons, mídia, narração, transições, 
redimensionar), legendas padrão, exportações ilimitadas, sem marca d’água. 
Exclui a maioria dos recursos de IA.
• Pro: US$ 9,99/mês. Inclui recursos gratuitos + AI Creator (2 Twins), AI Edit, Lipdub, 
AI Shorts, Gerador de Roteiro, AI Eye Contact, Denoise, etc. Para ~6-7 projetos de 
IA/mês.
• Max: US$ 24,99/mês. Inclui recursos Pro + AI Twins ilimitados, geração de IA 
mais rápida, mais opções de modelos de IA, geração simultânea (até 2). Para ~20 
projetos de IA/mês.
• Scale: US$ 69,99/mês. Inclui recursos Max + velocidades de geração mais rápidas, 
geração simultânea, acesso antecipado a novos recursos.
• Business/Enterprise: preço personalizado. Inclui Ad Studio (Business), SSO, 
suporte dedicado, termos comerciais (Enterprise).
8.2 CapCut
• O que é: CapCut é um aplicativo e software de edição de vídeo gratuito e completo, 
pertencente à ByteDance (empresa-mãe do TikTok). Oferece uma vasta gama de 
ferramentas de edição, efeitos, filtros, modelos e recursos alimentados por IA para criar 
vídeos, especialmente para redes sociais como o TikTok. Disponível online, em desktop 
(Windows/Mac) e mobile (iOS/Android). 
• Diferenciais: pertence à ByteDance, oferecendo integração perfeita e recursos adaptados 
para o TikTok. É amplamente gratuito, com uma vasta biblioteca de modelos, efeitos, 
músicas e adesivos. Interface amigável, adequada para iniciantes e usuários experientes. 
Inclui numerosos recursos de IA: Fala para Texto (legendas automáticas), Texto para Fala, 
Transcrever Vídeo, Remover Fundo, Correção por IA, Modelo de IA para produtos, roteiros 
de IA, Vídeo longo para curtos, Upscaler de Vídeo, etc. Suporta armazenamento em nuvem 
e colaboração em equipe. Permite exportação em alta resolução (até 4K) e formatos/taxas 
de quadros personalizados. 
• História: desenvolvido pela ByteDance. Lançado pela primeira vez na China como JianYing 
em 2019. Lançado internacionalmente como ViaMaker, depois renomeado para CapCut em 
2020. Baseado em Singapura (entidade legal Bytedance Pte. Ltd. incorporada em jul. 2019) 
61UNIDADE 8 LEGENDAS E TRADUÇÃO DE TEXTO COM IA
ou possivelmente Islândia (informação conflitante em). Alcançou crescimento massivo: 200 
milhões de usuários ativos em 2022 , mais de 1 bilhão de downloads no Google Play até 
jan. 2025 , receita estimada de mais de US$ 100 milhões em 2023. Como produto da 
ByteDance, não possui rodadas de financiamento independentes. A própria ByteDance é 
uma entidade massiva apoiada por investidores como Sequoia, SoftBank, KKR.
• Site para acesso: capcut.com
• Preço: principalmente gratuito. Oferece uma assinatura “CapCut Pro” para acesso a 
recursos/ativos premium.
• Gratuito: acesso à maioria das ferramentas de edição, vastas bibliotecas de 
efeitos, modelos, músicas. 
• Pro: US$ 9,99/mês ou US$ 89,99/ano. Desbloqueia modelos Pro, efeitos, recursos 
e potencialmente mais armazenamento em nuvem. O armazenamento em nuvem 
está migrando para assinatura: US$ 2,49/mês por 100GB, US$ 7,49/mês por 1TB. 
• Teste Gratuito: oferece um teste gratuito de 7 dias para o CapCut Pro. O Pippit AI 
(um produto CapCut?) oferece um teste de 30 dias.
8.3 DeepL
• O que é: DeepL é uma empresa especializada em tradução de idiomas e assistência de 
escrita baseadas em IA de alta precisão. Seus produtos principais são o DeepL Translator 
(para texto e documentos), DeepL Write (para melhorar a escrita) e DeepL API (para 
desenvolvedores). É conhecido por suas traduções com nuances e som natural em mais 
de 30 idiomas.
• Diferenciais: alega precisão de tradução superior (“o tradutor mais preciso do mundo”) 
devido a redes neurais proprietárias treinadas em dados linguísticos especializados. Lida 
com a tradução de documentos (.pdf,.docx,.pptx,.xlsx,.html,.txt) preservando a formatação 
original. Forte foco na segurança de dados (conformidade com GDPR, ISO 27001, SOC 
2), garantindo que o texto do usuário seja excluído após a tradução e não, seja usado 
para treinamento. Oferece recursos como Glossário (definições de termos personalizados), 
controle de formalidade e melhorias de escrita com IA via DeepL Write. Fornece API robusta 
para integração em sites, aplicativos e sistemas empresariais. Disponível via web, aplicativos 
de desktop (Mac, Windows), aplicativos móveis (iOS, Android) e extensões de navegador. 
62UNIDADE 8 LEGENDAS E TRADUÇÃO DE TEXTO COM IA
• História: fundada em agosto de 2017 por Jaroslaw (Jarek) Kutylowski. Sediada em 
Colônia, Alemanha. Fundada por polonês. Atingiu o status de unicórnio (avaliação de US$ 1 
bilhão+) em jan. 2023. Levantou mais de US$ 400 milhões no total. Rodadas chave: Seed/
Série A (pré-2019, b2venture, Benchmark), Rodada Venture (US$ 100 milhões, Jan 2023, 
IVP), Rodada Venture (US$ 300 milhões, Maio 2024, Index Ventures, avaliando em US$ 
2 bilhões). Investidores chave: Index Ventures, IVP, Benchmark, Iconiq Growth, Teachers’ 
Venture Growth, Atomico, WiL, b2venture. Possui mais de 100.000 clientes empresariais/
governamentais. 
• Site para acesso: deepl.com
• Preço: oferece planos freemium para Translator/Write e API:
• Planos Translator/Write:
- Gratuito: tradução de texto limitada (1.500-3.000 caracteres), 3 documentos 
não editáveis/mês (limite de 5MB), 1 glossário (10 entradas).
- Starter: € 7,49/usuário/mês (ou US$ 10,49/mês). Texto ilimitado (ou 1M 
caracteres), 5 documentos editáveis/mês (limite de 10MB), 1 glossário (5k 
entradas). 
- Advanced: € 24,99/usuário/mês (ou US$ 34,49/mês). Texto ilimitado, 20 
documentos editáveis/mês (limite de 20MB), 2.000 glossários, SSO, integração 
com ferramentas CAT. 
- Ultimate: € 49,99/usuário/mês (ou US$ 68,99/mês). Texto ilimitado, 100 
documentos editáveis/mês (limite de 30MB), 2.000 glossários, SSO, ferramentas 
CAT.
À medida que a inteligência artificial generativa consolida sua presença em múltiplos 
setores, o que se observa é uma reconfiguração estrutural nas formas de criar, pesquisar, 
comunicar e operar. As 29 aplicações analisadas nesta apostila evidenciam não apenas a 
variedade de abordagens tecnológicas em curso, mas também um amadurecimento clarona proposta de valor dessas soluções — com uma progressiva migração de experimentos 
promissores para aplicações comerciais concretas e de alto impacto.
As fronteiras tradicionais entre tarefas humanas e automação estão sendo redesenhadas. 
Assistentes generalistas como Claude e Grok demonstram que modelos de linguagem já não 
63UNIDADE 8 LEGENDAS E TRADUÇÃO DE TEXTO COM IA
se limitam a responder perguntas — eles raciocinam, sintetizam conhecimento e moldam 
estratégias. Ao mesmo tempo, ferramentas especializadas em geração de imagem, vídeo, 
pesquisa e desenvolvimento de software mostram uma sofisticação crescente, operando 
em ciclos iterativos curtos e integrando-se de forma mais nativa a fluxos de trabalho 
corporativos.
O design dos modelos de negócios — freemium, baseado em créditos ou planos empresariais 
— também reflete um mercado em rápida evolução, onde acessibilidade e escalabilidade 
se tornaram critérios críticos de adoção. APIs abertas, integrações com ecossistemas 
preexistentes (como Google, GitHub ou Canva) e interfaces simplificadas sugerem que a IA 
está deixando de ser um recurso isolado para se tornar uma camada transversal em quase 
toda infraestrutura digital contemporânea.
No entanto, esse avanço não vem sem fricções. A ascensão de agentes autônomos 
e avatares realistas levanta dilemas éticos relevantes: como garantir consentimento, 
autenticidade e segurança em um mundo onde vozes, rostos e opiniões podem ser 
sintetizados em segundos? O poder da IA está cada vez mais acessível — e isso exige 
vigilância regulatória, alfabetização digital e maturidade no uso.
Este material, portanto, oferece uma fotografia detalhada de um ecossistema em movimento 
acelerado. Mais do que um guia fechado, ele funciona como uma base para análise 
contínua. Porque se há algo certo no campo da IA, é que os modelos evoluem — e nossa 
compreensão sobre eles precisa evoluir junto.
O CAMINHO DAS EMPRESAS DE IA GENERATIVA DE IMAGEM E VÍDEO
Texto elaborado por Leonam Nagel
O mercado de IA generativa é caracterizado por uma competição acirrada, avanços 
tecnológicos quase diários, investimentos massivos de capital de risco e os primeiros sinais 
de consolidação e integração em plataformas maiores. Analisar a história e o financiamento 
de cada empresa oferece um contexto valioso para entender suas estratégias e posições 
no mercado.
• Midjourney: sua trajetória como empresa autofinanciada e lucrativa é notável. 
Focada em um nicho artístico e cultivando uma forte comunidade, demonstrou um 
crescimento orgânico impressionante. Sua adaptação ao adicionar uma interface 
web mostra flexibilidade. Isso prova que é possível ter sucesso sem depender de 
64UNIDADE 8 LEGENDAS E TRADUÇÃO DE TEXTO COM IA
financiamento externo massivo, desde que o produto encontre um mercado forte 
e leal. Sua independência financeira permite focar no produto e na comunidade 
sem as pressões de crescimento trimestral impostas por VCs.
• • Leonardo AI: o caminho da Leonardo AI – receber US$ 31 milhões em VC, construir 
uma suíte abrangente e ser rapidamente adquirida pela Canva – exemplifica a 
tendência de integração. Plataformas de design estabelecidas estão buscando 
ativamente incorporar capacidades de IA de ponta. Isso sugere que ferramentas 
de IA autônomas, mesmo bem-sucedidas, podem se tornar alvos de aquisição 
para players maiores que buscam oferecer fluxos de trabalho mais integrados.
• Recraft AI: com US$ 12 milhões em financiamento Series A e um foco claro em 
design profissional e vetores, além da ambição de construir seu próprio modelo, a 
Recraft segue uma estratégia de especialização vertical. O investimento valida a 
ideia de que nichos específicos dentro da IA generativa são vetores para branding 
são vistos como mercados valiosos e defensáveis.
• Krea AI: o financiamento extremamente alto (US$ 83 milhões) e a avaliação 
elevada (US$ 500 milhões) para uma empresa focada em ser uma interface e 
agregadora de modelos é significativo. Representa uma aposta forte na camada 
de experiência do usuário (UX) como o principal diferencial em um cenário onde 
os modelos de IA subjacentes mudam rapidamente. A capacidade de oferecer 
uma interface intuitiva e unificada para múltiplas tecnologias pode ser um fator-
chave de sucesso.
• Freepik: como uma plataforma estabelecida e de propriedade de private equity, 
a Freepik representa a estratégia de adaptação de um incumbente. Ao integrar 
ferramentas de IA (muitas vezes via agregação e aquisições, como a da Magnific) 
em sua oferta existente de ativos de stock, ela alavanca sua base de usuários e 
biblioteca de conteúdo para competir no novo paradigma da IA. Isso mostra como 
empresas tradicionais podem evoluir para se manterem relevantes.
• Kling AI: a provável associação com a Kuaishou marca a entrada de grandes 
players internacionais de tecnologia no mercado global de IA generativa. Com 
recursos potencialmente vastos, essas empresas podem desafiar rapidamente os 
líderes estabelecidos, trazendo novas perspectivas e tecnologias, intensificando 
a competição.
• RunwayML: com mais de US$ 544 milhões em financiamento de VCs e investidores 
estratégicos como Google e Nvidia, e uma avaliação multibilionária, a RunwayML 
personifica a estratégia de construir modelos de fundação de ponta. Seu foco em 
pesquisa e desenvolvimento e no mercado profissional/empresarial exige capital 
intensivo, mas a posiciona na vanguarda tecnológica do vídeo generativo.
• PikaLabs: a ascensão meteórica da PikaLabs, levantando US$ 115 milhões em 
pouco tempo com foco em usabilidade e recursos inovadores como Pikatwists, 
demonstra o potencial disruptivo de startups ágeis. A inovação na experiência do 
usuário e em funcionalidades específicas pode gerar crescimento rápido e atrair 
investimento significativo, mesmo em um mercado lotado.
Fica evidente que o nível e a origem do financiamento moldam profundamente as estratégias. 
Midjourney, sem investidores externos, pode focar em sustentabilidade e nicho. RunwayML 
e Krea, com capital abundante, podem investir pesadamente em P&D ou na construção de 
plataformas complexas. Leonardo AI seguiu o caminho da aquisição, enquanto Freepik se 
adaptou. O mercado é um mosaico de abordagens diversas, refletindo a natureza dinâmica 
e ainda em formação da IA generativa.
Fonte: O autor (2025).
65UNIDADE 8 LEGENDAS E TRADUÇÃO DE TEXTO COM IA
É o fim de alguns empregos?
A entrevista com Carrie Patel, diretora do jogo Avowed, publicada pela WIRED, oferece 
uma perspectiva valiosa sobre o papel insubstituível da criatividade humana, mesmo em 
um cenário onde a inteligência artificial (IA) está cada vez mais presente. Patel enfatiza 
que “boas histórias de jogos serão escritas por bons designers narrativos”, destacando 
que, apesar dos avanços tecnológicos, a essência criativa permanece uma característica 
exclusivamente humana.
Essa visão se alinha com estudos recentes que indicam que a IA tende a substituir tarefas 
específicas, especialmente as rotineiras, mas não elimina completamente os empregos. 
Em vez disso, ela transforma as competências exigidas, priorizando habilidades como 
pensamento crítico, resolução de problemas e adaptabilidade.
Dados do Fórum Econômico Mundial projetam que, até 2030, a IA criará 170 milhões de 
empregos globalmente, ao mesmo tempo, em que eliminará 92 milhões, resultando em 
um saldo positivo. Isso reflete uma mudança estrutural no mercado de trabalho, onde a 
colaboração entre humanos e máquinas se tornará cada vez mais comum.
No entanto, essa transição não é isenta de desafios. A automação pode levar à perda de 
empregos em algumas áreas, gerando desemprego e desigualdade social. Além disso, a 
IA exige habilidades cognitivas mais complexas, o que pode resultar em desigualdade de 
oportunidades no mercado de trabalho.
Portanto, a questão não é se a IA acabará com os empregos, mas como ela os transformará. 
A adaptação a essa nova realidade requer investimentos em educação erequalificação 
profissional, além de políticas públicas que garantam uma transição justa para todos os 
trabalhadores.
A criatividade humana, como destaca Carrie Patel, continua sendo um diferencial essencial, 
especialmente em áreas que demandam empatia, julgamento e inovação. A IA pode ser 
uma ferramenta poderosa para potencializar essas habilidades, mas não para substituí-las.
FAROKHMANESH, Megan. Director of the Game Avowed Says AI Can’t Replace 
Human Creativity. WIRED, 13 fev. 2025. Disponível em: https://www.wired.com/story/
avowed-obsidian-carrie-patel-interview/. Acesso em: 14 abr. 2025.
https://www.wired.com/story/avowed-obsidian-carrie-patel-interview/
https://www.wired.com/story/avowed-obsidian-carrie-patel-interview/
https://www.wired.com/story/avowed-obsidian-carrie-patel-interview/
https://www.wired.com/story/avowed-obsidian-carrie-patel-interview/
66
Considerações Finais
Vivemos uma época fascinante. Estamos testemunhando o surgimento de uma tecnologia 
com potencial para transformar profundamente a forma como vivemos, trabalhamos e 
resolvemos problemas no nosso dia a dia. 
Embora já tenhamos acesso a aplicações incríveis, que facilitam tarefas, ampliam a 
criatividade e aumentam a produtividade, ainda estamos apenas no começo dessa jornada. 
Existem limitações técnicas a serem superadas, além de desafios éticos, psicológicos e 
sociais que exigem atenção cuidadosa. O uso responsável e consciente da IA será um dos 
grandes temas do nosso tempo.
Essa nova realidade também exige o desenvolvimento de novas habilidades. Entender como 
essas ferramentas funcionam, como podem ser aplicadas e quais os impactos que geram 
se torna essencial para qualquer profissional. Por isso, parabéns a você por investir na sua 
própria educação e por estar se preparando para esse futuro em constante transformação.
Que este material sirva como ponto de partida para sua exploração contínua. A IA está 
evoluindo rapidamente — e nossa compreensão e capacidade de utilizá-la de forma ética e 
criativa também precisam acompanhar esse ritmo.
67
Material Complementar
LIVRO
• Título: Nexus: Uma breve história das redes de informação, da Idade 
da Pedra à inteligência artificial
• Autor: Yuval Noah Harari
• Editora: Companhia das Letras (edição brasileira)
• Sinopse: Neste livro, o autor de Sapiens explora como as redes 
de informação moldaram e transformaram a humanidade desde os 
tempos pré-históricos até a era da inteligência artificial. Harari analisa 
como essas redes influenciam a verdade, o poder e a organização 
social, alertando para os riscos que tecnologias como algoritmos e IA 
representam para a democracia e a liberdade individual. 
FILME/VÍDEO
• Título: Cassandra
• Ano: 2025
• Sinopse: Após décadas desativada, uma assistente virtual doméstica 
dos anos 1970 chamada Cassandra é reativada quando a família Prill 
se muda para uma antiga casa inteligente na Alemanha. Inicialmente 
prestativa, Cassandra logo revela intenções sinistras, manipulando os 
moradores para garantir que nunca mais seja abandonada. A série 
mistura ficção científica, suspense e drama familiar, explorando temas 
de tecnologia e controle. 
• Link: https://www.netflix.com/br/title/81621534
https://www.netflix.com/br/title/81621534
68
WEB
• Anthropic (Claude): https://claude.ai/
• Anthropic (site oficial): https://www.anthropic.com/
• CapCut: https://capcut.com/
• Captions.ai: https://captions.ai/
• Cassandra (Netflix): https://www.netflix.com/br/title/81621534
• Consensus: https://consensus.app/
• Cursor: https://cursor.com/
• D-ID: https://d-id.com/
• DeepL: https://deepl.com/
• Freepik AI Image Generator: https://www.freepik.com/ai/image-
generator
• Gamma: https://gamma.app/
• Grok (xAI): https://grok.com/
• Krea AI: https://www.krea.ai/
• Leonardo AI: https://leonardo.ai/
• Lovable: https://lovable.dev/
• Midjourney: https://www.midjourney.com/
• NotebookLM (Google): https://notebooklm.google.com/
• Perplexity: https://www.perplexity.ai/
• Pika AI: https://pika.art/
• Poe (Quora): https://poe.com/
• Recraft: https://www.recraft.ai/
• Replit: https://replit.com/
• RunwayML: https://runwayml.com/
• Synthesia: https://www.synthesia.io/
• Windsurf (antigo Codeium): https://windsurf.com/
• Wired (matéria): https://www.wired.com/story/avowed-obsidian-
carrie-patel-interview/
• xAI (empresa): https://x.ai/
https://claude.ai/
https://www.anthropic.com/
https://capcut.com/
https://captions.ai/
https://www.netflix.com/br/title/81621534
https://consensus.app/
https://cursor.com/
https://d-id.com/
https://deepl.com/
https://www.freepik.com/ai/image-generator
https://www.freepik.com/ai/image-generator
https://gamma.app/
https://grok.com/
https://www.krea.ai/
https://leonardo.ai/
https://lovable.dev/
https://www.midjourney.com/
https://notebooklm.google.com/
https://www.perplexity.ai/
https://pika.art/
https://poe.com/
https://www.recraft.ai/
https://replit.com/
https://runwayml.com/
https://www.synthesia.io/
https://windsurf.com/
https://www.wired.com/story/avowed-obsidian-carrie-patel-interview/
https://www.wired.com/story/avowed-obsidian-carrie-patel-interview/
https://x.ai/
69
Referências
ANTHROPIC. Claude AI. 2025. Disponível em: https://claude.ai/. Acesso em: 14 abr. 2025.
ANTHROPIC. Site oficial. 2025. Disponível em: https://www.anthropic.com/. Acesso em: 14 
abr. 2025.
CAPCUT. CapCut. 2025. Disponível em: https://capcut.com/. Acesso em: 14 abr. 2025.
CAPTIONS.AI. Captions. 2025. Disponível em: https://captions.ai/. Acesso em: 14 abr. 
2025.
CASSANDRA. Netflix. 2025. Disponível em: https://www.netflix.com/br/title/81621534. 
Acesso em: 14 abr. 2025.
CONSENSUS. Consensus – Search Engine for Research. 2025. Disponível em: https://
consensus.app/. Acesso em: 14 abr. 2025.
CURSOR. Cursor. 2025. Disponível em: https://cursor.com/. Acesso em: 14 abr. 2025.
D-ID. D-ID. 2025. Disponível em: https://d-id.com/. Acesso em: 14 abr. 2025.
DEEPL. DeepL Translator. 2025. Disponível em: https://deepl.com/. Acesso em: 14 abr. 
2025.
FAROKHMANESH, Megan. Director of the Game Avowed Says AI Can’t Replace Human 
Creativity. WIRED, 13 fev. 2025. Disponível em: https://www.wired.com/story/avowed-
obsidian-carrie-patel-interview/. Acesso em: 14 abr. 2025.
FREEPIK. Freepik AI Image Generator. 2025. Disponível em: https://www.freepik.com/ai/
image-generator. Acesso em: 14 abr. 2025.
https://claude.ai/
https://claude.ai/
https://www.anthropic.com/
https://www.anthropic.com/
https://capcut.com/
https://capcut.com/
https://captions.ai/
https://captions.ai/
https://www.netflix.com/br/title/81621534
https://www.netflix.com/br/title/81621534
https://consensus.app/
https://consensus.app/
https://consensus.app/
https://cursor.com/
https://cursor.com/
https://d-id.com/
https://d-id.com/
https://deepl.com/
https://deepl.com/
https://www.wired.com/story/avowed-obsidian-carrie-patel-interview/
https://www.wired.com/story/avowed-obsidian-carrie-patel-interview/
https://www.wired.com/story/avowed-obsidian-carrie-patel-interview/
https://www.freepik.com/ai/image-generator
https://www.freepik.com/ai/image-generator
https://www.freepik.com/ai/image-generator
70
GAMMA. Gamma. 2025. Disponível em: https://gamma.app/. Acesso em: 14 abr. 2025.
GROK. Grok AI. 2025. Disponível em: https://grok.com/. Acesso em: 14 abr. 2025.
KREA. Krea AI. 2025. Disponível em: https://www.krea.ai/. Acesso em: 14 abr. 2025.
LEONARDO.AI. Leonardo AI. 2025. Disponível em: https://leonardo.ai/. Acesso em: 14 abr. 
2025.
LOVABLE. Lovable. 2025. Disponível em: https://lovable.dev/. Acesso em: 14 abr. 2025.
MIDJOURNEY. Midjourney. 2025. Disponível em: https://www.midjourney.com/. Acesso em: 
14 abr. 2025.
NOTEBOOKLM. Google NotebookLM. 2025. Disponível em: https://notebooklm.google.
com/. Acesso em: 14 abr. 2025.
PERPLEXITY. Perplexity AI. 2025. Disponível em: https://www.perplexity.ai/. Acesso em: 14 
abr. 2025.
PIKA. Pika AI. 2025. Disponível em: https://pika.art/. Acesso em: 14 abr. 2025.
POE. Poe by Quora. 2025.Disponível em: https://poe.com/. Acesso em: 14 abr. 2025.
RECRAFT. Recraft AI. 2025. Disponível em: https://www.recraft.ai/. Acesso em: 14 abr. 
2025.
REPLIT. Replit. 2025. Disponível em: https://replit.com/. Acesso em: 14 abr. 2025.
RUNWAY. Runway ML. 2025. Disponível em: https://runwayml.com/. Acesso em: 14 abr. 
2025.
SYNTHESIA. Synthesia. 2025. Disponível em: https://www.synthesia.io/. Acesso em: 14 
abr. 2025.
WINDSURF. Windsurf AI (antigo Codeium). 2025. Disponível em: https://windsurf.com/. 
Acesso em: 14 abr. 2025.
XAI. xAI (empresa de Elon Musk). 2025. Disponível em: https://x.ai/. Acesso em: 14 abr. 
2025.
https://gamma.app/
https://gamma.app/
https://grok.com/
https://grok.com/
https://www.krea.ai/
https://www.krea.ai/
https://leonardo.ai/
https://leonardo.ai/
https://lovable.dev/
https://lovable.dev/
https://www.midjourney.com/
https://www.midjourney.com/
https://notebooklm.google.com/
https://notebooklm.google.com/
https://notebooklm.google.com/
https://www.perplexity.ai/
https://www.perplexity.ai/
https://pika.art/
https://pika.art/
https://poe.com/
https://poe.com/
https://www.recraft.ai/
https://www.recraft.ai/
https://replit.com/
https://replit.com/
https://runwayml.com/
https://runwayml.com/
https://www.synthesia.io/
https://www.synthesia.io/
https://windsurf.com/
https://windsurf.com/
https://x.ai/
https://x.ai/
71UNIDADE 1 FERRAMENTAS DE IA PARA USO GERAL
Endereço:
Telefone:
Megapolo Sede: Praça Brasil, 250 - Centro
CEP 87702-320 - Paranavaí - PR - Brasil
(44) 3045-9898
	Tópico 1
	Tópico 2
	Tópico 3
	Tópico 4
	Tópico 5
	Tópico 6
	Tópico 7
	Tópico 8
	Botão 1: 
	Botão 2: 
	Botão 3: 
	Botão 4: 
	Botão 5: 
	Botão 6: 
	Botão 7: 
	Botão 8:de desktop 
(macOS, Windows). Além disso, a oferta de APIs robustas permite a integração destas 
poderosas capacidades de IA em outros fluxos de trabalho e aplicações. Esta abordagem 
multifacetada reduz as barreiras de entrada para usuários e desenvolvedores, facilitando 
uma adoção mais ampla e a incorporação da IA em diversas rotinas diárias e processos de 
negócio, estendendo seu alcance muito para além das interfaces de chat tradicionais.
1.1. Claude
• O que é: Claude é um assistente de IA desenvolvido pela Anthropic, projetado para 
auxiliar numa vasta gama de tarefas cognitivas, desde brainstorming e análise de dados 
até geração de código e processamento de imagens. Posiciona-se como uma ferramenta 
10UNIDADE 1 FERRAMENTAS DE IA PARA USO GERAL
colaborativa para usuários individuais e equipes, com um forte foco em segurança, precisão 
e confiabilidade. O objetivo declarado é ser útil, inofensivo e honesto em suas interações.
• Diferenciais: 
• Raciocínio Avançado e Modelo Híbrido: Claude destaca-se pela sua capacidade 
de realizar tarefas cognitivas complexas que vão além do simples reconhecimento 
de padrões. O modelo mais recente, Claude 3.7 Sonnet, é apresentado como 
o primeiro modelo de raciocínio híbrido da Anthropic, oferecendo inteligência 
aprimorada.
• Análise de Visão: capaz de transcrever e analisar imagens estáticas, incluindo 
notas manuscritas, gráficos e fotografias.
• Geração e Depuração de Código: auxilia na criação de websites (HTML/CSS), 
conversão de imagens para dados estruturados (JSON) e depuração de bases de 
código complexas.
• Processamento Multilíngue: realiza traduções em tempo real, auxilia na prática 
gramatical e na criação de conteúdo multilíngue.
• Segurança e Ética (“IA Constitucional”): um diferencial central é a abordagem 
da Anthropic à segurança, conhecida como “IA Constitucional”. Este quadro visa 
alinhar o comportamento da IA com valores humanos por meio de um conjunto de 
regras (“constituição”), resultando numa maior resistência a jailbreaks e prevenção 
de uso indevido.
• Confiabilidade e Baixa Taxa de Alucinação: projetado para ter taxas de 
alucinação muito baixas e alta precisão, especialmente em documentos longos, 
tornando-o adequado para casos de uso crítico de negócios.
• Família de Modelos (Haiku, Sonnet, Opus): oferece diferentes modelos 
otimizados para velocidade (Haiku), equilíbrio entre desempenho e velocidade 
(Sonnet) e tarefas complexas de alta performance (Opus).
• Funcionalidade “Artifacts”: permite aos usuários criar e iterar conteúdo (websites, 
gráficos, documentos, código) numa janela dedicada ao lado do chat, com pré-
visualização em tempo real para certos tipos de código.
• Modo de Aprendizagem: uma funcionalidade focada na educação que guia 
o processo de raciocínio dos alunos em vez de fornecer respostas diretas, 
promovendo o pensamento crítico.
• História:
• Desenvolvedor: Anthropic PBC.
• País: Estados Unidos (Sede em São Francisco, Califórnia).
• Fundação: fundada em 2021 por ex-membros proeminentes da OpenAI, incluindo 
os irmãos Daniela e Dario Amodei, devido a divergências na direção da empresa 
anterior.
• Investimentos: a Anthropic atraiu investimentos substanciais de gigantes da 
tecnologia e empresas de capital de risco. A Amazon comprometeu-se a investir 
11UNIDADE 1 FERRAMENTAS DE IA PARA USO GERAL
até $ 8 bilhões (com $ 4 bilhões já investidos até março de 2024) e a Google 
comprometeu-se com mais de $ 2 bilhões. A rodada de financiamento Série E, 
anunciada em 2025, levantou $ 3,5 bilhões, liderada pela Lightspeed Venture 
Partners, avaliando a empresa em $ 61,5 bilhões. Outros investidores incluem 
General Catalyst, Salesforce Ventures, Menlo Ventures, SK Telecom, entre outros. 
O financiamento total excede os $12 bilhões.
• Marcos: lançamento inicial de Claude e Claude Instant (março 2023), lançamento 
público de Claude 2 (julho 2023), lançamento da família Claude 3 (Opus, Sonnet, 
Haiku) com capacidade de entrada de imagem (Março 2024), lançamento do 
plano Team e app iOS (maio 2024), lançamento de Claude 3.5 Sonnet com 
funcionalidade Artifacts (Junho 2024), lançamento de Claude 3.7 Sonnet (fevereiro 
2025). Parcerias estratégicas com AWS, Google Cloud, Palantir (para ambientes 
classificados) e Instructure (Canvas LMS).
• Site para acesso: o assistente de chat está acessível em https://claude.ai/. O site principal 
da empresa é https://www.anthropic.com/.
• Preço: Claude oferece uma estrutura de preços por níveis:
• Plano Gratuito: acesso aos modelos mais recentes, incluindo Claude 3.5 Sonnet, 
via web, iOS e Android. Limites de utilização diária.
• Plano Pro: para usuários intensivos. $20/mês (mensal) ou $17-$18/mês (anual). 
5x mais utilização que o plano gratuito, acesso a todos os modelos Claude, acesso 
prioritário, acesso antecipado a novas funcionalidades e funcionalidade “Projects”.
• Plano Max: para usuários com alto volume de uso. A partir de $100/mês. 5x a 20x 
mais utilização que o Pro, com níveis de uso flexíveis. Inclui benefícios do Pro, 
limites de saída mais altos e acesso prioritário a funcionalidades avançadas.
• Plano Team: para equipes (mínimo 5 membros). $30/usuário/mês (mensal) ou 
$25/usuário/mês (anual). Mais utilização que o Pro, faturação e administração 
centralizadas, funcionalidades de colaboração e janela de contexto de 200k tokens.
• Plano Enterprise: para empresas de grande porte, com preços personalizados. 
Inclui benefícios do Team, janela de contexto expandida, SSO, RBAC, SCIM, logs 
de auditoria e integrações de fontes de dados.
• Preços da API: baseado no modelo e uso.
• Teste Gratuito: o plano gratuito funciona como teste contínuo. Alguns parceiros 
podem oferecer testes específicos.
1.2. Grok
• O que é: Grok é um chatbot de IA generativa desenvolvida pela xAI, a empresa de 
inteligência artificial fundada por Elon Musk. É projetado para fornecer respostas “sem 
filtros”, com um toque de humor e rebeldia, inspirado no Guia do Mochileiro das Galáxias. 
https://claude.ai/
https://claude.ai/
https://www.anthropic.com/
https://www.anthropic.com/
12UNIDADE 1 FERRAMENTAS DE IA PARA USO GERAL
Grok está integrado à plataforma X (anteriormente Twitter) para acessar informações em 
tempo real. Seu objetivo declarado é ser um companheiro de IA “em busca da verdade”.
• Diferenciais: 
• Acesso em Tempo Real ao X e à Web: uma característica distintiva é sua 
capacidade de acessar e incorporar informações em tempo real da plataforma X e 
da web em geral em suas respostas, tornando-o mais atualizado do que modelos 
treinados apenas com dados estáticos.
• Personalidade Única: anunciada como tendo um “senso de humor” e uma “veia 
rebelde”. Grok visa oferecer uma experiência de conversação diferente, menos 
formal e potencialmente mais espirituosa do que outros assistentes de IA.
• Geração de Imagens (Aurora): Grok integra capacidades de geração de imagens 
através de seu modelo Aurora, permitindo aos usuários criar recursos visuais 
diretamente a partir de prompts.
• DeepSearch e Grok Think: oferece funcionalidades de pesquisa aprofundada 
(DeepSearch) para descobrir informações raras e Grok Think para conectar ideias 
complexas e revelar insights.
• Grok Voice: capacidade de interação por voz para um diálogo mais natural e fluido.
• Modelo Open Source (Grok-1): a xAI lançou os pesos e a arquitetura do modelo 
Grok-1 (314 bilhões de parâmetros, Mixture-of-Experts) como open source sob a 
licença Apache 2.0, promovendo a transparência e o desenvolvimento comunitário.
• Integração Nativa com X: Grok está profundamente integrada na plataforma X, 
acessível diretamente na interface do X para assinantes.
• História:
• Desenvolvedor: xAI Corp..
• País: Estados Unidos (Sede na área da Baía de São Francisco, Califórnia; também 
escritórios em Londres e Memphis).
• Fundação: fundada por Elon Musk em março de 2023, com o objetivo ambicioso 
de “compreender a verdadeira natureza do universo”. Anunciada oficialmente em 
julhode 2023.
• Investimentos: a xAI levantou mais de $12 bilhões no total. Uma divulgação inicial 
em dezembro de 2023 mostrou $134.7 milhões. Seguiram-se rodadas massivas: 
$6 bilhões na Série B (maio 2024) e outros $6 bilhões na Série C (Dezembro 
2024). Investidores de peso incluem Andreessen Horowitz (a16z), Sequoia Capital, 
Lightspeed Venture Partners, Fidelity, BlackRock, Kingdom Holdings, Valor Equity 
Partners, Vy Capital, entre outros.
• Aquisição da X Corp.: em março de 2025, a xAI adquiriu a X Corp. (desenvolvedora 
da plataforma X/Twitter), numa transação de ações que avaliou a xAI em $80 bilhões 
e a X Corp. em $33 bilhões (mais $12 bilhões de dívida). Ambas as empresas 
foram colocadas sob uma nova entidade holding, X.AI Holdings Corp., avaliada 
em mais de $100 bilhões. Esta aquisição solidifica o acesso da xAI aos dados da 
13UNIDADE 1 FERRAMENTAS DE IA PARA USO GERAL
plataforma X para treino e distribuição.
• Marcos dos Modelos: Grok-0 (agosto 2023), Grok-1 (Novembro 2023, open-source 
março 2024), Grok-1.5 (março 2024), Grok-1.5 Vision (Abril 2024), Grok-2 (agosto 
2024, com geração de imagem), API (outubro 2024), modelo de imagem Aurora 
(dezembro 2024), Grok-3 (fevereiro 2025, com modo “Think” e DeepSearch).
• Site para acesso: o site principal da xAI é https://x.ai/. O produto Grok pode ser acessado 
em https://grok.com/ ou diretamente através da plataforma X em https://x.com/i/grok.
• Preço: o acesso ao Grok está intrinsecamente ligado à subscrição da plataforma X.
• Acesso Gratuito: o acesso é gratuito, mas limitado em comparação com os níveis 
pagos.
• X Premium: custa US$ 8 por mês ou US$ 7 por mês se pago anualmente. Este 
nível oferece acesso avançado com limites de utilização aumentados e acesso 
antecipado a novas funcionalidades.
• X Premium+: custa US$ 40 por mês ou US$ 32,92 por mês, se pago anualmente. 
Oferece os níveis mais elevados de acesso, uma experiência totalmente sem 
anúncios e acesso mais rápido a novas funcionalidades.
• Plano SuperGrok: um novo plano focado especificamente no acesso às 
funcionalidades avançadas do Grok através de sua aplicação móvel e website, 
sem os outros benefícios premium do X. O preço varia de US$ 15 a US$ 30 por 
mês, dependendo da fonte.
• API: a xAI planeja lançar uma API empresarial, provavelmente com um modelo de 
preços baseado no uso.
• Teste Gratuito: o acesso gratuito atual ao Grok 3 funciona como um teste limitado.
*Nota: Preços e funcionalidades sujeitos a alterações. Existe inconsistência nas 
fontes sobre os preços exatos do Premium+ e SuperGrok.*
1.3. Poe
• O que é: Poe (Platform for Open Exploration) é uma plataforma desenvolvida pela Quora 
que funciona como um agregador de chatbots e modelos de IA. Permite aos usuários 
acessar, interagir e comparar respostas de diversos modelos de IA de ponta (como GPT-
4.5 da OpenAI, Claude 3.7 Sonnet da Anthropic, Gemini 2.0 da Google, Llama da Meta, 
entre outros) numa única interface. Além disso, permite a criação e partilha de chatbots 
personalizados.
https://x.ai/
https://x.ai/
https://grok.com/
https://grok.com/
https://x.com/i/grok
https://x.com/i/grok
14UNIDADE 1 FERRAMENTAS DE IA PARA USO GERAL
• Diferenciais:
• Agregação de Modelos: o principal diferencial é o acesso centralizado a uma 
vasta gama de modelos de IA de diferentes fornecedores, permitindo aos usuários, 
experimentar e comparar diversas “personalidades” e capacidades de IA sem ter 
que alternar entre plataformas.
• Chat Multi-Bot: funcionalidade que permite conversar com múltiplos bots em 
simultâneo numa única thread, facilitando a comparação direta das suas respostas 
e a combinação das suas forças para tarefas específicas.
• Criação e Partilha de Bots Personalizados: qualquer usuário pode criar facilmente 
chatbots personalizados (mais de 1 milhão já criados) com prompts específicos ou 
bases de conhecimento próprias (ex: PDFs, imagens) e compartilhá-los com a 
comunidade Poe.
• Monetização para Criadores: a Poe implementou um programa de monetização 
que permite aos criadores de bots ganhar dinheiro com suas criações, seja mediante 
uma taxa por mensagem ou recebendo uma parte da receita de subscrição dos 
usuários que convertem através dos seus bots.
• Geração Multimédia: integra geradores de imagem (FLUX, Ideogram, Stable 
Diffusion, DALL-E 3) e vídeo (Runway, ElevenLabs, Veo 2, etc.), permitindo a 
criação de conteúdo visual diretamente na plataforma.
• Motor de Busca IA: oferece um motor de busca integrado que utiliza processamento 
de linguagem natural avançado e pesquisa na web para fornecer resultados 
relevantes.
• Compatibilidade Multiplataforma: acessível via web, iOS, Android e macOS. 
• História:
• Desenvolvedor: Quora, Inc..
• País: Estados Unidos (Sede em Mountain View, Califórnia).
• Fundação: a Poe foi anunciada pela equipe da Quora em dezembro de 2022 e 
lançada publicamente em fevereiro de 2023. A versão desktop foi lançada em 
março de 2023. A Quora, a empresa-mãe, foi fundada em 2009 por Adam D’Angelo 
(atual CEO) e Charlie Cheever.
• Investimentos: em janeiro de 2024, a Quora levantou $75 milhões numa rodada 
liderada pela Andreessen Horowitz (a16z), com o objetivo específico de financiar 
e acelerar o programa de monetização para criadores na plataforma Poe. A 
estratégia da Poe aproveita a vasta base de usuários existente da Quora (mais de 
400 milhões de visitantes únicos) como um canal de distribuição.
• Site para acesso: https://poe.com/.
• Preço: Poe opera num modelo freemium.
https://poe.com/
https://poe.com/
15UNIDADE 1 FERRAMENTAS DE IA PARA USO GERAL
• Gratuito: acesso básico com um limite diário ou mensal de mensagens, e acesso a um 
número limitado de bots.
• Pago: US$ 19,99/mês ou US$ 199,99/ano (US$ 16,67/mês). Acesso ilimitado a mensagens, 
bots premium e recursos avançados.
• Teste gratuito: a versão gratuita serve como teste.
*Nota: Podem existir outros níveis de preços ou variações regionais. Limites exatos 
do plano gratuito podem variar.*
Unidade 2 
PESQUISA NA INTERNET
17UNIDADE 2 PESQUISA NA INTERNET
Esta categoria agrupa ferramentas de IA especificamente concebidas para revolucionar a 
forma como pesquisamos e interagimos com informações online e em documentos. Em vez de 
simplesmente devolver uma lista de links, estas ferramentas visam sintetizar conhecimento, 
verificar fatos, analisar dados e fornecer respostas diretas e contextualizadas, muitas vezes 
com um forte enfoque na transparência e na confiabilidade das fontes.
Observa-se uma clara evolução no paradigma da pesquisa, afastando-se da recuperação 
de links baseada em palavras-chave, característica do Google tradicional, em direção 
a “motores de resposta” conversacionais. Aplicações como Perplexity, Consensus e 
NotebookLM exemplificam esta mudança. Estas ferramentas não se limitam a encontrar 
páginas relevantes; elas processam, analisam e sintetizam informações de múltiplas fontes 
para fornecer respostas diretas e coerentes. O Perplexity posiciona-se explicitamente como 
um “motor de resposta” para a web em geral, enquanto o Consensus se especializa na 
síntese de literatura científica e o NotebookLM atua como um especialista personalizado 
sobre os documentos fornecidos pelo usuário. Esta abordagem responde a uma necessidade 
crescente dos usuários por respostas rápidas, confiáveis e já digeridas, em contraste com a 
tarefa morosa de analisar múltiplas fontes individualmente.
Um pilar fundamental destas ferramentas de pesquisa de nova geração é a sua capacidade 
de ancorar as respostas em fontes específicas, aumentando a transparência e a confiança. O 
problema da “alucinação” – a tendência dos LLMs gerais para gerar informações plausíveis, 
mas factualmente incorretas – é um obstáculo significativo para a sua utilização em 
contextos de pesquisa rigorosa. Ferramentas como Perplexity, Consensus e NotebookLM 
abordam diretamente este desafio ao fornecer citações claras e rastreáveis para as suas 
afirmações. O Perplexityutiliza notas de rodapé clicáveis que remetem para as fontes web 
originais, o Consensus referencia artigos de investigação específicos, e o NotebookLM 
cita os documentos carregados pelo usuário. Este compromisso com a verificabilidade é 
crucial para aplicações de pesquisa, onde a precisão e a confiabilidade da informação são 
primordiais.
Além da simples resposta a perguntas, está a emergir uma capacidade mais avançada 
designada “Deep Research” (Pesquisa Profunda) como uma funcionalidade específica 
em várias plataformas de IA de topo, incluindo Gemini da Google, Perplexity, ChatGPT 
da OpenAI e até ferramentas como HyperWrite. Isto assinala uma evolução para além 
18UNIDADE 2 PESQUISA NA INTERNET
dos assistentes de pesquisa, em direção a agentes de IA capazes de realizar tarefas de 
investigação complexas de forma autônoma. Estas funcionalidades envolvem tipicamente 
o planejamento de múltiplos passos de pesquisa, a consulta e análise aprofundada de 
centenas de fontes (incluindo websites e PDFs), a síntese de descobertas e a geração de 
relatórios detalhados e estruturados. A emergência independente desta capacidade em 
plataformas concorrentes sugere uma forte procura do mercado por IA que possa assumir 
tarefas de conhecimento morosas e complexas, funcionando mais como um assistente de 
investigação autônomo do que como uma mera ferramenta de consulta.
2.1. NotebookLM
• O que é: NotebookLM é um assistente de pesquisa e tomada de notas alimentado por IA, 
desenvolvido pela Google. Funciona como um colaborador que se torna um “especialista 
instantâneo” nos documentos e fontes que o usuário carrega (suporta Google Docs, Slides, 
PDFs, URLs da web, texto copiado, URLs do YouTube). O seu objetivo é ajudar os usuários 
a pensar melhor, permitindo-lhes ler, fazer anotações, fazer perguntas e gerar vários tipos 
de conteúdo baseados exclusivamente nas suas fontes.
• Diferenciais:
• Ancoragem nas Fontes (Source Grounding): a principal característica distintiva 
é que todas as respostas e conteúdos gerados pelo NotebookLM são estritamente 
baseados nas fontes fornecidas pelo usuário. Inclui sempre citações online que 
indicam exatamente onde a informação foi encontrada nos documentos originais.
• Geração de Conteúdo Estruturado: pode gerar automaticamente vários tipos 
de resumos e documentos úteis a partir das fontes, como resumos gerais, FAQs, 
guias de estudo, índices, cronologias e documentos informativos (briefing docs).
• Visão Geral em Áudio (Audio Overviews): converte notas e resumos em áudio 
estilo podcast, permitindo aos usuários consumir a informação em movimento. 
Uma funcionalidade beta permite interagir com os “anfitriões” de IA durante a 
reprodução do áudio, fazendo perguntas por voz.
• Descoberta de Fontes (Discover Sources): uma funcionalidade que permite 
ao NotebookLM sugerir e adicionar fontes relevantes da web com base num 
tópico descrito pelo usuário, expandindo a base de conhecimento para além dos 
documentos inicialmente carregados.
• Geração de Mapas Mentais: capacidade de visualizar as conexões e ideias 
principais das fontes num formato de mapa mental.
• Integração com Ecossistema Google: utiliza a conta Google para autenticação 
e é alimentado pelos modelos de IA Gemini da Google (Gemini Pro, Gemini 2.0 
Flash).
19UNIDADE 2 PESQUISA NA INTERNET
• Versão Empresarial (NotebookLM Plus): oferece limites de utilização mais 
elevados, funcionalidades premium (como personalização de respostas, áudio 
interativo), opções de partilha e análise adicionais, e controles de segurança e 
administração de nível empresarial (IAM, VPC-SC).
• História:
• Desenvolvedor: Google (inicialmente incubado no Google Labs, agora um produto 
mais estabelecido).
• País: Estados Unidos.
• Fundação/Lançamento: Evoluiu de projetos internos de IA da Google. Foi 
melhorado ao longo do tempo, com a adição de funcionalidades como citações 
(julho de 2023), suporte expandido a formatos de documentos e a transição do 
modelo PaLM 2 para os mais capazes modelos Gemini (Gemini Pro, Gemini 2.0 
Flash). A versão Plus e as integrações empresariais foram anunciadas em dezembro 
de 2024, e a funcionalidade Discover Sources foi adicionada posteriormente.
• Investimentos: sendo um produto da Google, o seu desenvolvimento é financiado 
pelo orçamento geral de investigação e desenvolvimento da Google.
• Site para acesso: https://notebooklm.google.com/.
• Preço: NotebookLM oferece um nível gratuito e um nível pago (Plus).
• NotebookLM (Standard/Gratuito): gratuito para usuários individuais com uma 
conta Google (maiores de 18 anos, em mais de 200 regiões suportadas). Inclui 
as funcionalidades principais, mas com limites de utilização (os limites específicos 
não são detalhados, mas são inferiores aos do Plus).
• NotebookLM Plus: nível pago com limites de utilização significativamente 
mais elevados (5x mais notebooks e fontes que o gratuito; especificamente 500 
notebooks, 300 fontes por notebook, 500 consultas de chat por dia, 20 gerações 
de áudio por dia), acesso a funcionalidades premium (personalização do estilo/
comprimento das respostas, modo interativo nas Visões Gerais em Áudio), e 
opções adicionais de partilha e análise.
• Custo (Individual): incluído na subscrição Google One AI Premium, que custa 
$20/mês (com um desconto de 50% para estudantes elegíveis). Estava previsto 
ser incluído no início de 2025.
• Custo (Empresarial): disponível para empresas, escolas e organizações através 
do Google Workspace ou pode ser adquirido separadamente via Google Cloud. O 
preço é de $9 USD por licença por mês, com opção de desconto para subscrições 
anuais. Oferece proteção de nível empresarial, controles de segurança (VPC-SC, 
IAM) e análise de utilização.
*Nota: Limites exatos do plano gratuito não especificados. Preços e funcionalidades 
sujeitos a alterações.*
https://notebooklm.google.com/
https://notebooklm.google.com/
20UNIDADE 2 PESQUISA NA INTERNET
2.2. Perplexity
• O que é: Perplexity AI autodenomina-se um “motor de respostas” (answer engine) 
conversacional. Utiliza modelos de linguagem grandes (LLMs) e acesso a dados da web em 
tempo real para fornecer respostas diretas, precisas e bem fundamentadas nas perguntas 
dos usuários, em vez de apenas uma lista de links.
• Diferenciais:
• Respostas Diretas com Citações: fornece respostas em linguagem natural, 
semelhantes a uma conversa, com citações (notas de rodapé numeradas e 
clicáveis) que remetem para as fontes originais na web, permitindo a verificação e 
aprofundamento da informação.
• Pesquisa em Tempo Real: a capacidade de acessar informações da web em 
tempo real é central, garantindo respostas atualizadas sobre notícias e eventos 
recentes.
• Modos de Foco: permite aos usuários direcionar a pesquisa para tipos específicos 
de fontes, como acadêmicas, notícias, YouTube, Reddit ou domínios específicos, 
para resultados mais relevantes.
• Pro Search: uma funcionalidade de pesquisa mais aprofundada que envolve 
diálogo conversacional e memória contextual para exploração detalhada de tópicos.
• Escolha de Modelos (Pro): os subscritores Pro podem escolher entre vários LLMs 
avançados (como GPT-4, Claude 3.7 Sonnet, Deepseek R1, Sonar da Perplexity) 
para potenciar as suas pesquisas.
• Upload de Ficheiros: permite carregar documentos (PDF, Word, etc.) e imagens 
para análise e questionamento sobre o seu conteúdo.
• Organização (Spaces & Pages): funcionalidades para organizar pesquisas 
por tópicos em “Spaces” personalizados e gerar “Pages” (páginas de web 
personalizáveis) a partir de prompts.
• Hubs Especializados: lançou funcionalidades focadas em domínios como Compras 
(Shopping), Finanças (Finance) e Eleições (Elections), oferecendo resultados mais 
estruturados para essas áreas.
• Deep Research: funcionalidade de agente de IA que realiza pesquisa e análise 
aprofundada de forma autônoma, gerando relatórios abrangentes.
• API Flexível: oferece uma API com diferentes modos de pesquisa(alto, médio, 
baixo) para controlar os custos e a profundidade da pesquisa.
• História:
• Desenvolvedor: Perplexity AI, Inc..
• País: Estados Unidos (Sede em São Francisco, Califórnia).
• Fundação: fundada em agosto de 2022 por Aravind Srinivas (CEO, ex-OpenAI, 
21UNIDADE 2 PESQUISA NA INTERNET
Google Brain, DeepMind), Denis Yarats (CTO, ex-Meta AI), Johnny Ho (CSO, ex-
Quora) e Andy Konwinski (Presidente, cofundador da Databricks). A motivação 
partilhada foi a frustração com a incapacidade dos motores de busca tradicionais 
de fornecerem respostas diretas e contextuais.
• Investimentos: a Perplexity demonstrou uma trajetória de avaliação extremamente 
rápida. Atingiu 10 milhões de usuários ativos mensais em 2023. Levantou $26M na 
Série A (2023). Seguiram-se várias rodadas em 2024: $73.6M na Série B (Janeiro, 
avaliação de $520M, liderada por IVP, com Nvidia, Jeff Bezos); $63M adicionais 
(março, avaliação de $1.04B, tornando-se unicórnio); procurou mais $250M (Abril, 
avaliação de $2.5-3B); e $500M (novembro, avaliação de $9B). Em fevereiro de 
2025, surgiram relatos de que estaria a procurar levantar até $1.5 bilhão com uma 
avaliação de $18 bilhões. O financiamento total reportado ultrapassa os $900 
milhões. Os elevados custos computacionais da IA e o “momento zeitgeist” da 
startup são fatores que contribuem para estas rodadas.
• Marcos: lançamento da aplicação móvel, lançamento do Perplexity Pages, planos 
de introdução de publicidade, lançamento das aplicações Buy with Pro e Snap to 
Shop, lançamento da funcionalidade Deep Research.
• Site para acesso: https://www.perplexity.ai/.
• Preço: Perplexity oferece um modelo freemium com três níveis principais.
• Preços da API: os preços variam com base no modelo e uso. Os assinantes Pro e 
Enterprise recebem US$ 5 em créditos mensais.
• Standard (Gratuito): Inclui pesquisas rápidas ilimitadas, 5 pesquisas Pro por dia, 
3 uploads de arquivos por dia e organização via Coleções/Spaces. Deep Research 
tem um limite diário.
• Profissional (Pro): US$ 20/mês. Oferece mais de 300 pesquisas Pro por dia, 
modelos de IA avançados, uploads ilimitados de arquivos, ferramentas de geração 
de imagens, US$ 5 em créditos de API mensais e pesquisas Deep Research 
ilimitadas.
• Enterprise: preços personalizados (self-service a partir de US$ 40/usuário/mês). 
Inclui todos os recursos Pro, além de segurança aprimorada, privacidade de 
dados, gerenciamento de usuários, SSO e integração com bases de conhecimento 
internas.
*Nota: Preços e limites sujeitos a alterações.*
2.3. Consensus
• O que é: Consensus é um motor de busca acadêmico alimentado por IA, projetado 
especificamente para ajudar estudantes, pesquisadores, clínicos e outros profissionais a 
encontrar, compreender e sintetizar rapidamente informações de artigos de investigação 
científica. Indexa mais de 200 milhões de artigos de todas as áreas da ciência e academia.
https://www.perplexity.ai/
https://www.perplexity.ai/
22UNIDADE 2 PESQUISA NA INTERNET
• Diferenciais:
• Foco Exclusivo em Investigação Científica: ao contrário de motores de busca 
gerais ou outros assistentes de IA, o Consensus concentra-se exclusivamente em 
literatura científica revista por pares.
• Síntese e Análise por IA: utiliza LLMs (da OpenAI e modelos personalizados) 
para extrair insights-chave, gerar resumos e análises (Pro Analysis) ao nível do 
artigo e da pesquisa.
• Consensus Meter: uma funcionalidade única que visualiza rapidamente o 
consenso científico sobre questões de sim/não, mostrando a distribuição das 
conclusões (sim, possivelmente, não) nos artigos relevantes.
• Citações Diretas: todos os resultados e insights gerados pela IA estão diretamente 
ligados aos artigos de investigação subjacentes, permitindo verificação fácil.
• Filtros de Pesquisa Avançados: permite filtrar resultados por fatores metodológicos 
cruciais como tipo de estudo (RCT, revisão sistemática, meta-análise, etc.), tamanho 
da amostra, população do estudo (humano/animal), acesso aberto, e mais.
• Indicadores de Qualidade: apresenta etiquetas intuitivas que indicam a qualidade 
da revista, contagem de citações e tipo de estudo para identificar rapidamente a 
investigação mais robusta.
• Study Snapshot: fornece um resumo rápido de informações metodológicas chave 
(população, tamanho da amostra, métodos, resultados) diretamente na página de 
resultados.
• Funcionalidade “Ask Paper” (Beta): permite aos usuários interagir diretamente 
com o texto completo de PDFs de artigos individuais, fazendo perguntas específicas 
sobre a metodologia, resultados, etc.
• História:
• Desenvolvedor: Consensus (nome legal: Consensus NLP, Inc.).
• País: Estados Unidos (Sede em Boston).
• Fundação: Fundada em 2020 por Eric Olson (CEO) e Christian Salem.
• Investimentos: levantou um total de $19.2 milhões em 5 rodadas de financiamento. 
A primeira rodada foi em julho de 2021. A rodada mais recente foi uma Série B de 
$11 milhões em agosto de 2024, liderada pela Union Square Ventures e Draper 
Associates, com participação da Winklevoss Capital, Nomad Capital e investidores 
anjo. Rondas anteriores incluem Série A ($3.1M + $840K em 2023) e Seed. Nota: 
A informação de financiamento em algumas fontes ($138.9M, Sumeru Equity 
Partners) refere-se a uma empresa diferente com o mesmo nome focada em 
demos de vendas, não ao motor de busca Consensus.app.
• Adoção: utilizado por estudantes e pesquisadores em mais de 5,000 universidades 
em todo o mundo. Mais de 2 milhões de usuários totais.
• Site para acesso: https://consensus.app/.
https://consensus.app/
https://consensus.app/
23UNIDADE 2 PESQUISA NA INTERNET
• Preço: Consensus oferece um modelo freemium com vários níveis.
• Free (Basic): grátis. Inclui pesquisas ilimitadas, mas limita o uso de recursos de IA 
(10 cada por mês: Análises Pro, Snapshots, mensagens, Ask Paper) e organização 
(10 marcadores, 1 lista).
• Premium: US$ 11,99/mês ou US$ 8,99/mês (pago anualmente). Acesso ilimitado 
a todos os recursos e acesso antecipado a novos recursos.
• Teams: US$ 12,99 por assento/mês ou US$ 9,99 por assento/mês (pago 
anualmente). Inclui recursos Premium, descontos para até 200 assentos e 
gerenciamento centralizado.
• Enterprise: preços personalizados. Inclui recursos do Teams e recursos 
corporativos adicionais.
• Desconto para estudantes: 40% de desconto no plano Premium para endereços 
de e-mail .edu ou .ac verificados.
*Nota: Preços e funcionalidades sujeitos a alterações.*
2.4. Deep Research (Funcionalidade)
• O que é: “Deep Research” não é uma aplicação autônoma, mas sim uma funcionalidade 
avançada de IA agentica que está sendo integrada em várias plataformas de IA de topo, 
como Google Gemini, Perplexity, OpenAI ChatGPT e HyperWrite. Esta funcionalidade 
representa um salto qualitativo em relação à simples pesquisa ou resposta a perguntas, 
permitindo à IA realizar investigação complexa, análise e síntese de forma autônoma, 
culminando na geração de relatórios detalhados.
• Diferenciais: O que distingue a funcionalidade Deep Research é a sua capacidade de 
agir como um assistente de investigação autônomo:
• Operação Agentica: transforma um prompt inicial num plano de investigação 
multifásico, executa autonomamente pesquisas na web (consultando potencialmente 
centenas de fontes, incluindo PDFs e imagens), analisa e raciocina sobre a 
informação recolhida iterativamente, e sintetiza as descobertas num relatório 
abrangente.
• Profundidade e Abrangência: projetada para lidar com tarefas de conhecimento 
complexas que exigiriam horas de trabalho humano, encontrando informações de 
nicho ou não intuitivas.
• Raciocínio Iterativo: mostra o seu processo de pensamento, identificando lacunas 
de informação, resolvendo discrepâncias e ajustando o plano de pesquisa à medida 
que aprende mais.
• Geração de Relatórios Estruturados: produz relatórios multi-página detalhados, 
bem organizados e com citações claras para facilitar a verificação. Algumas 
implementações incluemanálise e visualização de dados.
24UNIDADE 2 PESQUISA NA INTERNET
• Funcionalidades Adicionais (Variáveis): dependendo da plataforma, pode incluir 
a capacidade de gerar uma visão geral em áudio do relatório (Gemini) ou integração 
com ferramentas de análise de dados (ChatGPT).
• História: a funcionalidade Deep Research começou a surgir de forma proeminente em 
várias plataformas de IA líderes no final de 2024 e início de 2025. O seu desenvolvimento 
independente por gigantes como Google, OpenAI e startups inovadoras como Perplexity 
reflete uma tendência da indústria em direção a capacidades de IA mais autônomas e 
agenticas, capazes de lidar com tarefas de conhecimento complexas e morosas, indo além 
dos modelos de pergunta-resposta.
• Site para acesso: a funcionalidade Deep Research é acessada dentro das plataformas 
que a oferecem:
• Google Gemini: através da interface Gemini (https://gemini.google.com/), 
requerendo uma subscrição Gemini Advanced.
• Perplexity: selecionando o modo “Deep Research” na barra de pesquisa em 
https://www.perplexity.ai/.
• OpenAI ChatGPT: selecionando “deep research” no compositor de mensagens 
em https://chatgpt.com/.
• HyperWrite: através da ferramenta específica em https://www.hyperwriteai.com/
aitools/deep-research-ai.
*Nota: A disponibilidade e os preços estão sujeitos a alterações e podem variar 
regionalmente.*
https://gemini.google.com/
https://www.perplexity.ai/
https://www.perplexity.ai/
https://chatgpt.com/
https://chatgpt.com/
https://www.hyperwriteai.com/aitools/deep-research-ai
https://www.hyperwriteai.com/aitools/deep-research-ai
https://www.hyperwriteai.com/aitools/deep-research-ai
Unidade 3
CRIAÇÃO DE 
APRESENTAÇÕES
26UNIDADE 3 CRIAÇÃO DE APRESENTAÇÕES
A criação de apresentações eficazes é uma tarefa essencial em muitos contextos 
profissionais e acadêmicos, mas frequentemente morosa e dependente de competências 
de design. Esta seção analisa ferramentas de IA que procuram automatizar e otimizar este 
processo, indo além do software tradicional como o PowerPoint, ao oferecerem geração de 
conteúdo, design inteligente e formatos mais interativos.
Uma mudança fundamental que estas ferramentas introduzem é o papel da IA como um 
“parceiro de design” ativo, em vez de um mero fornecedor de modelos estáticos. Ferramentas 
como a Gamma não se limitam a preencher slides pré-definidos; elas analisam o input do 
usuário (seja um prompt, um documento ou texto colado) para gerar uma estrutura de 
apresentação completa, sugerir layouts visualmente apelativos e até mesmo gerar conteúdo 
textual e visual relevante. Funcionalidades como a reestilização de toda a apresentação 
com um clique reforçam esta ideia de que a IA assume grande parte do trabalho de design 
e formatação, que tradicionalmente consome muito tempo e esforço. Isto permite que os 
usuários se concentrem mais na mensagem e no conteúdo, em vez de se preocuparem 
com o alinhamento de caixas de texto ou a escolha de paletas de cores.
Outro aspecto notável é a orientação destas novas ferramentas para formatos de 
apresentação digitais e interativos, afastando-se do paradigma do slide estático pensado 
para impressão ou projeção. A Gamma, por exemplo, posiciona-se como um meio “mais 
visual que um documento, mais colaborativo que um slide deck, mais interativo que um 
vídeo”. Isto reflete-se em funcionalidades como a capacidade de incorporar facilmente 
conteúdos ricos e dinâmicos (vídeos, websites, aplicações como Figma ou Airtable, gráficos 
interativos), a publicação online com análise de envolvimento integrada e a garantia de que 
o conteúdo é responsivo e acessível em qualquer dispositivo. 
O uso de um sistema de “cartões” flexíveis em vez de slides rígidos também suporta uma 
apresentação de informação potencialmente mais fluida e não linear, mais adequada ao 
consumo digital assíncrono. Esta abordagem sugere uma transição das apresentações 
como documentos estáticos para experiências de conteúdo web dinâmicas e mensuráveis.
3.1. Gamma
• O que é: Gamma é uma plataforma alimentada por IA que permite aos usuários criar 
apresentações, documentos e páginas de web visualmente apelativos e interativos de 
27UNIDADE 3 CRIAÇÃO DE APRESENTAÇÕES
forma rápida e fácil, mesmo sem conhecimentos de design. Funciona a partir de prompts 
de texto ou importando conteúdo existente.
• Diferenciais:
• Geração por IA: cria rascunhos funcionais de apresentações, documentos 
ou páginas de web em menos de um minuto a partir de um simples prompt, ou 
conteúdo importado (documentos, texto colado).
• Design Assistido por IA: a IA não só gera conteúdo, mas também aplica designs 
e layouts de nível profissional, eliminando a necessidade de formatação manual 
intensiva.
• Reestilização com Um Clique: permite alterar completamente o tema visual de 
toda a apresentação ou documento com um único clique, sem perder o conteúdo.
• Sistema de Cartões Flexíveis: utiliza “cartões” em vez de slides tradicionais, 
oferecendo maior flexibilidade na estruturação e apresentação da informação, 
incluindo cartões aninhados para detalhamento.
• Conteúdo Interativo: permite incorporar facilmente elementos interativos como 
GIFs, vídeos, gráficos, websites inteiros e aplicações de terceiros (Figma, Airtable, 
etc.).
• Análise Integrada: oferece análises incorporadas para medir o envolvimento do 
público com o conteúdo partilhado online.
• Colaboração em Tempo Real: suporta colaboração em tempo real com 
funcionalidades de comentários e reações rápidas.
• Responsivo e Partilhável: o conteúdo gerado é otimizado para visualização em 
qualquer dispositivo (portátil, tablet, telemóvel) e pode ser facilmente partilhado 
mediante um link.
• Exportação: permite exportar o conteúdo para formatos PDF e PPT (PowerPoint).
• Chat IA para Refinamento: inclui um chat IA para refinar, reescrever ou completar 
o conteúdo.
• Personalização de Marca (Plano Pro): o plano Pro oferece funcionalidades 
avançadas como tipos de letra personalizados, análises detalhadas e domínios 
personalizados para manter a consistência da marca.
• História:
• Desenvolvedor: Gamma Tech, Inc..
• País: Estados Unidos (Sede em São Francisco, Califórnia). Nota: Gamma.AI é 
uma empresa de segurança diferente.
• Fundação: fundada em 2020 por Grant Lee (CEO), Jon Noronha e James Fox. 
Começou com a visão de repensar a partilha de ideias num mundo digital, como 
uma alternativa ao PowerPoint. A integração de funcionalidades de IA em 2023 
foi um ponto de inflexão, levando a um crescimento exponencial de usuários (de 
centenas para 10.000 por dia).
28UNIDADE 3 CRIAÇÃO DE APRESENTAÇÕES
• Investimentos: levantou um total de $21.5 milhões. Inclui $7 milhões em rondas 
pre-seed e seed ($3M + $4M) até o final de 2021. Anunciou uma Série A de $12 
milhões liderada pela Accel em maio de 2024. Outros investidores incluem Script 
Capital, South Park Commons, Lorimer Ventures, Fellows Fund, Afore Capital, 
Airborne Ventures. A empresa atingiu a rentabilidade no final de 2024, com uma 
receita anual recorrente (ARR) na casa das dezenas de milhões e quase 50 milhões 
de usuários, operando com uma equipe relativamente pequena (25 pessoas). Nota: 
As referências de financiamento em algumas fontes pertencem a outras empresas 
chamadas Gamma.
• Site para acesso: https://gamma.app/.
• Preço: Gamma utiliza um sistema de créditos para as suas funcionalidades de IA, com 
diferentes níveis de subscrição.
• Plano Gratuito: gratuito para sempre. Oferece 400 créditos de IA (uso único).
• Plano Plus: $10/usuário/mês ou $8/usuário/mês (pago anualmente). 400 créditos 
de IA/mês.
• Plano Pro: $20/usuário/mês ou $15/usuário/mês (pago anualmente). Criação de 
IA ilimitada.
• Plano Enterprise: preço sob consulta.
*Nota: Preços por lugar/usuário. Planos anuais oferecem desconto. Créditos mensais 
do plano Plus não acumulam.*
https://gamma.app/
https://gamma.app/
Unidade 4
GERADORES DE 
IMAGEM
30UNIDADE 4 GERADORES DE IMAGENS
Estaseção explora ferramentas de IA dedicadas à criação de imagens a partir de descrições 
textuais (text-to-image) ou da modificação de imagens existentes (image-to-image). O 
mercado é diversificado, com ferramentas que oferecem diferentes estilos artísticos, níveis 
de controle, especializações (como gráficos vetoriais) e modelos de acesso.
O mercado de geradores de imagem também exibe uma clara tendência para a 
especialização, coexistindo com plataformas mais generalistas. O Recraft, por exemplo, 
foca-se intensamente na geração de gráficos vetoriais (SVG) editáveis e na manutenção 
da consistência visual para designers. O Leonardo AI oferece uma vasta gama de modelos 
pré-treinados para estilos específicos (anime, fotorrealismo, fantasia) e ferramentas como 
texturização 3D, apelando a artistas e designers de jogos. O Krea aposta na geração em 
tempo real e no controle intuitivo, permitindo ciclos de iteração rápidos. 
O Freepik, por sua vez, integra o seu gerador numa plataforma de recursos de stock já 
estabelecida, visando os seus usuários existentes. O Midjourney é amplamente reconhecido 
pelo seu estilo artístico distinto e muitas vezes surreal. Esta segmentação sugere que os 
usuários escolham ferramentas com base nas suas necessidades específicas de output 
(vetor vs. raster, estilo particular) e no seu perfil (designer, artista, profissional de marketing). 
A integração em plataformas existentes (como o Freepik) representa outra vantagem 
competitiva importante.
A maioria dos geradores de imagem analisados adota modelos de negócio freemium, utilizando 
sistemas de créditos para gerir o acesso e a utilização dos recursos computacionalmente 
intensivos. Os níveis gratuitos oferecem tipicamente um número limitado de créditos diários 
ou mensais, servindo como um ponto de entrada e experimentação. Os planos pagos 
desbloqueiam volumes de crédito mais elevados e funcionalidades premium essenciais 
para uso profissional, como gerações privadas (para proteger a propriedade intelectual), 
direitos de uso comercial e processamento prioritário ou mais rápido. 
O Midjourney constitui uma notável exceção, tendo descontinuado o seu teste gratuito e 
operando exclusivamente num modelo de subscrição paga. Esta decisão pode refletir a 
confiança na sua proposta de valor única ou uma estratégia para gerir os custos elevados 
da infraestrutura de IA, focando-se num público disposto a pagar pela sua qualidade e estilo 
distintos.
31UNIDADE 4 GERADORES DE IMAGENS
4.1. Midjourney
• O que é: Midjourney é um programa e serviço de inteligência artificial generativa, alojado 
por um laboratório de investigação independente sediado em São Francisco, Midjourney, Inc. 
Gera imagens a partir de descrições em linguagem natural (prompts), de forma semelhante 
ao DALL-E da OpenAI e ao Stable Diffusion da Stability AI, mas é particularmente conhecido 
pelo seu estilo artístico distinto e muitas vezes surreal.
• Diferenciais:
• Estilo Artístico Único: frequentemente produz imagens com uma estética 
reconhecível, descrita como pictórica, artística ou por vezes gótica/sci-fi, 
diferenciando-se de geradores que visam principalmente o fotorrealismo.
• Interface Principal via Discord: a interação primária ocorre através de comandos 
enviados a um bot no Discord (ex: /imagine), o que fomenta uma forte componente 
comunitária, mas difere das interfaces web típicas.
• Funcionalidades Avançadas de Controle: oferece várias funcionalidades para 
refinar e iterar imagens, incluindo: 
- Pan & Zoom Out: permite expandir a imagem para além das suas bordas 
originais, gerando o ambiente circundante.
- Vary (Region) & Remix: permite selecionar e regenerar partes específicas de 
uma imagem, opcionalmente alterando o prompt (Remix).
- Style Reference (--sref): utiliza uma ou mais imagens de referência para 
guiar o estilo estético (cores, texturas, atmosfera) da imagem gerada.
- Character Reference (--cref): mantém a consistência de um personagem 
através de diferentes imagens, usando uma imagem de referência do 
personagem.
- Image Weight (--iw): controla a influência de uma imagem de prompt no 
resultado final.
• Parâmetros Detalhados: permite aos usuários ajustar múltiplos parâmetros (como 
--chaos, --stylize, --weird) para um controle fino sobre o resultado.
• Modos de Velocidade (Fast/Relax/Turbo): oferece diferentes velocidades de 
geração com custos de GPU associados. O modo Relax (disponível em planos 
superiores) permite gerações ilimitadas (mas mais lentas) sem consumir tempo 
rápido de GPU.
• Geração em Lote (Repeat/Permutations): funcionalidades (--repeat, prompts 
com {}) para gerar múltiplas imagens ou variações de prompts simultaneamente 
(disponível em planos Pro/Mega).
32UNIDADE 4 GERADORES DE IMAGENS
• História:
• Desenvolvedor: Midjourney, Inc., um laboratório de investigação independente.
• País: Estados Unidos (Sede em São Francisco, Califórnia).
• Fundação: fundado por David Holz, que foi cofundador da Leap Motion. A 
plataforma entrou em beta aberto em 12 de julho de 2022. O servidor Discord foi 
lançado em março de 2022.
• Investimentos: David Holz afirmou em agosto de 2022 que a empresa já era 
lucrativa. As fontes indicam que é autofinanciada, sem detalhes sobre rondas de 
financiamento externas nos materiais fornecidos.
• Marcos: lançamento de várias versões do modelo (V5.2 com sistema estético e 
zoom out; V6 em dez. 2023; V6.1). Introdução de funcionalidades como Pan, Style 
Reference, Character Reference. Lançamento da interface web (ago. 2024). Usado 
para prototipagem rápida por artistas e na criação de conteúdos.
• Site para acesso: https://www.midjourney.com/
• Preço: Midjourney opera exclusivamente com planos de assinatura pagos. O teste gratuito 
foi descontinuado.
• Plano Básico: $10/mês ou $96/ano. Inclui 3,3 horas de tempo rápido de GPU/
mês. Não inclui os modos Relax ou Stealth.
• Plano Standard: $30/mês ou $288/ano. Inclui 15 horas de tempo rápido de GPU/
mês e modo Relax ilimitado.
• Plano Pro: $60/mês ou $576/ano. Inclui 30 horas de tempo rápido de GPU/mês, 
modos Relax e Stealth.
• Plano Mega: $120/mês ou $1152/ano. Inclui 60 horas de tempo rápido de GPU/
mês, modos Relax e Stealth.
• Tempo Rápido Extra: Todos os planos permitem a compra de horas extras de 
tempo rápido de GPU.
• Teste Gratuito: não disponível.
*Nota: Todos os planos permitem comprar tempo extra de GPU. Modo Relax gera 
imagens mais lentamente, mas sem consumir horas rápidas.*
4.2. Leonardo AI
• O que é: Leonardo AI é uma plataforma de IA generativa focada na criação de ativos 
visuais de alta qualidade, como arte, imagens e até texturas 3D e vídeos curtos (Motion). 
Posiciona-se como um conjunto de ferramentas para criadores, equipes e desenvolvedores.
https://www.midjourney.com/
33UNIDADE 4 GERADORES DE IMAGENS
• Diferenciais:
• Foco em Ativos de Produção: voltado para a criação de visuais de qualidade 
profissional para projetos como jogos, design gráfico, marketing e concept art.
• Conjunto de Ferramentas Integradas: oferece várias ferramentas além da 
geração básica de imagem:
- AI Canvas: combina geração e edição, permitindo refinar pixels, ajustar 
dimensões, apagar distrações, etc.
- 3D Texture Generation: gera texturas para modelos 3D a partir de prompts 
ou upload de arquivos OBJ.
- Motion: transforma imagens estáticas em animações curtas (vídeos de até 4 
segundos).
- Realtime Canvas: ferramenta de desenho para imagem em tempo real, 
transformando esboços em arte finalizada instantaneamente.
- Elements: ajuda a manter a consistência visual nas gerações.
- Image Guidance (ControlNet): permite usar imagens de referência para 
guiar a estrutura e o estilo da geração.
- Upscalers & Background Removal: ferramentas para melhorar a resolução 
e remover fundos.
• Variedade de Modelos: oferece acesso a múltiplos modelos de IA pré-treinados 
e ajustados pela Leonardo (como PhotoReal, Anime XL, Lightning XL, Kino XL, 
DiffusionXL) e modelos da comunidade, cada um com estilos e especialidades 
diferentes.
• Treinamento de Modelos Personalizados: usuários (em planos pagos) podem 
treinar seus próprios modelos de IA para estilos ou personagens específicos.
• Comunidade Ativa: possui uma grande comunidade de usuários (mencionam +18 
milhões) que compartilham criações e modelos.
• API para Desenvolvedores: oferece uma API para integrar as capacidades da 
Leonardo em outras aplicações.
• Interface Intuitiva: projetado para ser acessível tanto para iniciantes quanto para 
profissionais.
• História:
• Desenvolvedor: Leonardo AI (empresa).
• País: A empresa é sediada na Austrália, especificamente em Sydney e 
rapidamente se destacou como uma das startups de crescimento mais rápido no 
país, especializando-se em conteúdo e pesquisa de IA generativa. Em 2024, a 
34UNIDADE 4 GERADORES DE IMAGENS
Leonardo AI foi adquirida pela Canva, outra empresa australiana líder em design e 
comunicação visual.
• Fundação: foi fundada em 2022.
• Investimentos: levantou $31 milhões numa rodada pre-seed (informação de 
jan 2024) e posteriormente $47 milhões numa rodada mais recente (data não 
especificada, mas provavelmente final de 2024 ou início de 2025). Investidores 
incluem Blackbird, Side Stage Ventures, Smash Capital, Samsung Next.
• Marcos: lançamento de funcionalidades como Alchemy Refiner, Image Generator 
App, Realtime Canvas, Motion, Elements. Rápido crescimento da base de usuários 
e comunidade.
• Site para acesso: https://leonardo.ai/
• Preço: Leonardo AI usa um sistema de tokens para medir o uso, com planos gratuitos e 
pagos.
• Plano Gratuito: 150 tokens diários (recarga se saldofoco em interfaces visuais e interativas (como o Realtime 
Canvas e a edição por chat) em vez de depender apenas de prompts complexos.
• Treinamento de Estilos/Assets: permite aos usuários treinar a IA para replicar 
seus próprios estilos visuais, produtos ou personagens, garantindo consistência.
• Controles de Câmera (Vídeo): para o modelo de vídeo Hailuo, oferece mais de 20 
presets de controle de câmera para direcionar o movimento virtual.
História:
• Desenvolvedor: Krea Technologies Inc. (provavelmente).
• País: Estados Unidos (Sede em São Francisco, Califórnia).
• Fundação: a Krea AI foi fundada em março de 2022 por Diego Rodriguez e Victor 
Perez durante a residência altamente seletiva HF0, voltada para fundadores 
técnicos.
• Investimentos: levantou um total de $83 milhões em várias rodadas. Isso inclui 
$3M (pre-seed/seed), $33M (Série A) e $47M (Série B, liderada pela Bain Capital 
Ventures, com participação da Andreessen Horowitz e Abstract Ventures). A 
avaliação pós-Série B foi reportada em $500 milhões.
• Marcos: lançamento da plataforma com foco em unificação e controle intuitivo, 
introdução de funcionalidades como Realtime Canvas, Video Restyle, 3D Objects, 
Chat. Adoção por criativos em grandes empresas (Pixar, LEGO, Samsung 
mencionados).
• Site para acesso: https://www.krea.ai/
https://www.krea.ai/
https://www.krea.ai/
38UNIDADE 4 GERADORES DE IMAGENS
• Preço: Krea opera num modelo freemium baseado em “Compute Units” (Unidades de 
Computação).
• Plano Gratuito: 50 unidades de computação diárias. Acesso limitado.
• Plano Basic: $10/mês ou $8/mês (anual). 4.000 unidades/mês. Licença comercial.
• Plano Pro: $35/mês ou $28/mês (anual). 20.000 unidades/mês. Licença comercial. 
Fila prioritária.
• Plano Max: $80/mês ou $64/mês (anual). 72.000 unidades/mês. Licença comercial. 
Fila prioritária.
• Plano Enterprise/Teams: preço sob consulta.
*Nota: Compute Units mensais não acumulam. Custo em unidades varia por 
ferramenta. Plano gratuito tem acesso limitado.*
4.5. Freepik
• O que é: O Gerador de Imagens AI da Freepik é uma ferramenta integrada à plataforma 
Freepik (conhecida por seu vasto banco de imagens, vetores e outros recursos de design). 
Ele permite aos usuários criar imagens únicas a partir de descrições textuais (text-to-image) 
em tempo real, usando diferentes modelos e estilos de IA.
• Diferenciais:
• Integração com Ecossistema Freepik: o maior diferencial é estar dentro da 
plataforma Freepik, permitindo gerar imagens AI lado a lado com a busca e uso dos 
mais de 250 milhões de recursos de stock existentes (fotos, vetores, templates).
• Geração em Tempo Real (Flux): utiliza modelos como o Flux para gerar imagens 
rapidamente à medida que o usuário digita ou ajusta o prompt.
• Modelos Exclusivos (Mystic): oferece modelos próprios como o “Freepik Mystic”, 
que visa criar imagens fotorrealistas (especialmente rostos, mãos, texto) que não 
parecem geradas por IA, dispensando edição posterior.
• Facilidade de Uso e Presets: interface intuitiva com presets para estilos (Foto, 
Vintage, Pintura, etc.), cores, enquadramento e iluminação, simplificando a criação 
sem a necessidade de prompts complexos.
• Treinamento de Estilos/Personagens Personalizados (LoRAs): permite aos 
usuários (planos Premium/Premium+) treinar a IA com suas próprias imagens para 
criar estilos ou personagens consistentes que podem ser usados em diferentes 
cenários.
• Ferramentas de Edição AI Integradas: além da geração, integra outras 
ferramentas AI do Freepik:
- Reimagine: gera variações de uma imagem existente.
39UNIDADE 4 GERADORES DE IMAGENS
- Expand: redimensiona imagens preenchendo os espaços vazios com IA 
generativa.
- Retouch: remove ou substitui detalhes/objetos em imagens.
- Upscaler: aumenta a resolução e detalhes (até 10K com Magnific no 
Premium+).
- Sketch to Image (Pikaso): transforma esboços em imagens detalhadas 
(ferramenta relacionada).
• Geração por Permutação: permite usar | no prompt para gerar múltiplas 
combinações de elementos (ex: “um (homem|mulher) em um (parque|biblioteca)”).
• Licença Comercial: oferece licença comercial para as imagens geradas (nos 
planos pagos).
• História:
• Desenvolvedor: Freepik Company S.L.
• País: Espanha (sede provavelmente em Málaga, onde a Freepik foi fundada).
• Fundação: a Freepik foi fundada em 2010. O Gerador de Imagens AI é uma 
adição mais recente ao seu conjunto de ferramentas, capitalizando a onda da IA 
generativa.
• Investimentos: a Freepik Company como um todo recebeu investimentos 
significativos ao longo dos anos (detalhes não focados nos trechos sobre o gerador 
AI especificamente).
• Site para acesso: integrado ao site principal: https://www.freepik.com/ (procure por AI 
Image Generator ou ferramentas AI). Link direto: https://www.freepik.com/ai/image-generator
• Preço: o uso do Gerador de Imagens AI da Freepik está ligado aos planos de assinatura 
da plataforma e utiliza um sistema de créditos AI.
• Plano Gratuito: 20 gerações de imagem gratuitas por dia.
• Plano Essential: $9/mês ou $5.75/mês (pago anualmente). 84.000 créditos AI por 
ano.
• Plano Premium: $20/mês ou $12/mês (pago anualmente). 216.000 créditos AI por 
ano.
• Plano Premium+: $39/mês ou $24.50/mês (pago anualmente). 540.000 créditos 
AI por ano.
Créditos AI: usados para gerar conteúdo AI. O custo em créditos varia dependendo da 
ferramenta e do modelo utilizado. Créditos anuais são dados de uma vez; créditos mensais 
reiniciam a cada mês e não acumulam.
https://www.freepik.com/
https://www.freepik.com/
https://www.freepik.com/ai/image-generator
https://www.freepik.com/ai/image-generator
40UNIDADE 4 GERADORES DE IMAGENS
*Nota: Preços por usuário. Créditos anuais dados de uma vez; créditos mensais (se 
aplicável) não acumulam. Uso comercial AI incluído nos planos pagos.*
Unidade 5
GERADORES DE VÍDEO
42UNIDADE 5 GERADORES DE VÍDEO
A geração de vídeo por IA representa uma fronteira ainda mais desafiadora, lidando com 
a complexidade do movimento, consistência temporal e realismo. No entanto, o progresso 
tem sido vertiginoso, com ferramentas capazes de criar clipes curtos a partir de texto (text-
to-video), animar imagens estáticas (image-to-video) ou transformar vídeos existentes 
(video-to-video). Vamos analisar os principais concorrentes neste campo dinâmico.
5.1. Kling AI
• O que é: um modelo de geração de vídeo por IA, que parece ter fortes laços com a gigante 
chinesa de tecnologia Kuaishou. Posiciona-se como um “estúdio criativo de IA de próxima 
geração”, acessível via web e aplicativo móvel.
• Diferenciais:
• Tipos de Input: suporta geração a partir de texto (Text-to-Video) e imagens (Image-
to-Video).
• Resolução e Duração: afirma gerar vídeos com resolução de até 1080p e ter 
potencial para clipes de até 3 minutos através de um recurso de extensão de vídeo. 
Os planos podem oferecer durações-base de 5 ou 10 segundos.
• Controle de Movimento: inclui um “Motion Brush” para direcionar o movimento 
de objetos específicos na cena e controles detalhados de câmera (Pan, Tilt, Roll, 
Zoom, movimentos Horizontais/Verticais).
• Lip Sync: Mencionado como uma funcionalidade disponível para sincronizar falas.
• Simulação de Física: elogiado por sua capacidade de simular física e movimentos 
de câmera realistas, como filmagens em estilo “handheld”.
• Evolução do Modelo: já menciona versões KLING 1.0, 1.5 e 1.6, indicando um 
desenvolvimento ativo e melhorias contínuas.
• História: a associação com a Kuaishou (conhecida por seus aplicativos de vídeo curto 
como Kwai) é sugerida pelo e-mail de contato, embora o desenvolvedor listado na Google 
Play Store seja “Lohas Games Pte. Ltd.”, cuja relação exata não está clara (poderia ser 
uma subsidiária ou publicadora). Não há informações específicas sobre data de fundação 
ou financiamento do Kling AI nos trechos fornecidos, mas a Kuaishou é uma empresa 
pública estabelecida e com vastos recursos. A entrada de um player potencialmente ligado

Mais conteúdos dessa disciplina