Damos sentido à inovação, aos negócios e à tecnologia

O especialista opina: 'A curiosa história do Nano-Banana'

Escrito por Mike Mingo | 25/09/25 16:06

 

Nesta semana voltamos a contar com um convidado especial que já participou anteriormente no blog da Serban Group como especialista em Inteligência Artificial: Mike Mingo.

No post de hoje, Mike nos fala sobre o recém-lançado modelo de IA do Google para criação e edição de imagens: Nano-Banana. Quer descobrir o segredo do seu sucesso? Então continue lendo!

 

 

Como as empresas criadoras de modelos de IA farão para testar seus modelos, em escala, com usuários reais? Pois é, eu também me perguntava isso.

Acontece que, uma vez que têm o modelo treinado, elas o lançam de forma pública, mas anônima. Assim, sem revelar o autor, o modelo é exposto a uma espécie de “teste às cegas”, competindo com outros em um espaço aberto, onde os usuários interagem com ele e dão sua avaliação. Um desses lugares, talvez o mais popular, se chama LMArena.

 

Um misterioso modelo, chamado Nano-Banana, chegou ao LMArena para medir sua qualidade, verificar se era bom e ajustar o que fosse necessário. O Nano-Banana rapidamente passou a liderar a lista como o melhor modelo nas categorias de geração e edição de imagens. Naquele momento não se sabia qual empresa estava por trás, mas, dada a qualidade, todos apontavam para alguma das gigantes (OpenAI, Google, Claude, Meta…).

 

 

 

Quem está por trás do Nano-Banana?

No dia 28 de agosto de 2025, o Google apresentou oficialmente seu novo modelo — e, de fato, era o Nano-Banana. O nome anônimo usado no LMArena ganhou tanto respeito dentro do ecossistema que decidiram mantê-lo como um “alias”, embora o nome real do modelo (agora disponível ao público em geral) fosse Gemini 2.5 Flash Image.

 

Sua incrível ascensão em popularidade antes do lançamento sem dúvida ajudou o Google a dar notoriedade ao novo modelo. Se isso foi uma estratégia de marketing por parte deles, certamente foi bem-sucedida; tanto que, ao acessar o Gemini, é possível ver um ícone de banana na seção de geração de conteúdo com imagem.

O que há de tão revolucionário no Nano-Banana?

Embora a capacidade de gerar imagens seja muito boa, o que realmente representou um salto de qualidade sem precedentes foi sua capacidade de edição.

Até agora, quando pedíamos a um modelo para editar uma imagem — especialmente com rostos humanos — obtínhamos a edição solicitada, mas ao custo de arruinar a expressão das pessoas. Isso acontece porque, ao ditar ao modelo uma mudança em uma imagem (por exemplo: “Coloque um chapéu de caubói na pessoa à direita”), o modelo desfaz a imagem e a reconstrói (dessa vez com o chapéu). Esse processo, conhecido como “Diffusion”, faz com que os rostos mudem de expressão, deixando às vezes as pessoas irreconhecíveis.

 

Vamos ver com um exemplo real:

 

Como podemos observar, na imagem editada com outra IA que não é o Nano-Banana, a edição não apenas afeta o sujeito ao qual foi aplicada, mas também altera os rostos das demais pessoas que aparecem na fotografia. Com o Nano-Banana, a imagem permanece intacta, exceto pelo sujeito à direita, que é o único impactado pelas mudanças solicitadas.

 

O problema dos modelos anteriores, portanto, é que não conseguem editar apenas uma parte da imagem. O modelo deveria atuar somente na área específica que foi solicitada, mantendo o restante da imagem intacto — e é exatamente isso que o Nano-Banana faz, sendo essa a principal razão do seu sucesso.

 

Vale destacar que a Adobe, empresa líder em edição de imagens e dona de produtos tão conhecidos como o Adobe Photoshop, teve uma queda de 1,7% em suas ações no mesmo dia do lançamento do Nano-Banana, o que representou cerca de 2,8 bilhões de dólares em capitalização de mercado perdida. Alguns especialistas atribuem esse movimento ao impacto que editores de imagem baseados em IA podem ter, tornando a edição avançada de imagens acessível a qualquer usuário.

 

 

Momentos-chave para os modelos de imagem

Há algum tempo surgiu o DeepSeek, vindo da China, que fez a Nvidia perder aproximadamente 589 bilhões de dólares em um único dia (uma queda de 17%). Você pode ler a notícia completa aqui.

Depois foi a vez da OpenAI, com seu novo modelo de geração de imagens que fez grande sucesso na mídia graças à sua capacidade de transformar fotos no reconhecido “estilo Ghibli”.

Agora chega o Gemini 2.5 Flash Image (Nano-Banana) e revoluciona a edição de imagens. Do meu ponto de vista, é fascinante estar vivendo essa evolução, em que praticamente todo mês temos uma novidade que abala os alicerces de indústrias consolidadas.

 

Aqui vai outro exemplo de edição de imagem com o Nano-Banana, no qual eu mesmo sirvo de cobaia:

 

O que vem a seguir?

Qual será a próxima “vítima” da IA? Há muitos candidatos. Seguindo na linha da geração de imagens, talvez o passo natural seja a edição de vídeos. É verdade que já existem modelos que podem gerar vídeos, mas ainda são muito limitados. Por isso, acredito que um dos próximos “efeitos Nano-Banana” pode ir nessa direção e que a próxima revolução esteja relacionada à edição de vídeo.

 

Claramente, a IA está em crescimento exponencial, acelerado pelos imensos investimentos das grandes empresas de tecnologia. Minha percepção é que ela se tornará cada vez melhor, mais intuitiva e fácil de usar e, de fato, alcançará (ou melhor: superará) os humanos em muitas tarefas do dia a dia. Carros e caminhões autônomos são outro exemplo em que já se trabalha e que está prestes a se tornar realidade.

Por enquanto, continuaremos aproveitando todo o potencial da IA e atentos a todas as novidades diárias desse mundo fascinante.