Bitget App
Trading inteligente
Comprar criptoMercadosTradingFuturosRendaWeb3CentralMais
Trading
Spot
Compre e venda criptomoedas
Margem
Amplie seu capital e a eficiência de seus fundos
Onchain
Going Onchain, without going Onchain!
Convert
Sem taxas de corretagem e derrapagem
Explorar
Launchhub
Ganhe vantagens desde o início e comece a ganhar
Copy
Copie o trader de elite com um clique
Robôs
Robô de trading com IA simples, rápido e confiável
Trading
Futuros USDT
Futuros liquidados em USDT
Futuros USDC
Futuros liquidados em USDC
Futuros Coin-M
Futuros liquidados em criptomoedas
Explorar
Guia de futuros
Uma jornada no trading de futuros
Promoções de futuros
Aproveite recompensas generosas!
Renda Bitget
Uma série de produtos para aumentar seus ativos
Renda Simples
Deposite e retire a qualquer momento para obter retornos flexíveis com risco zero
Renda On-chain
Ganhe lucros diariamente sem arriscar o investimento inicial
Renda estruturada
Inovação financeira robusta para navegar pelas oscilações do mercado
VIP e Gestão de Patrimônio
Serviços premium para uma Gestão de Patrimônio inteligente
Empréstimos
Empréstimo flexível com alta segurança de fundos
O mais recente modelo de imagem de IA "Banana" do Google faz internautas enlouquecerem com o "Vibe Photoshoping"

O mais recente modelo de imagem de IA "Banana" do Google faz internautas enlouquecerem com o "Vibe Photoshoping"

MarsBitMarsBit2025/08/30 06:53
Mostrar original
Por:TechFlow

O Google AI Studio lançou o Gemini 2.5 Flash Image (codinome nano-banana), o modelo mais avançado do Google para geração e edição de imagens, conhecido por sua alta velocidade e excelente desempenho em diversos rankings. Resumo gerado pela Mars AI Este resumo foi criado pelo modelo Mars AI, cuja precisão e integridade das informações ainda estão em fase de aprimoramento contínuo.

O mais recente modelo de imagem de IA

Você se lembra do misterioso modelo de edição de imagens por IA “nano-banana” que foi tão comentado anteriormente? Na época, na arena de grandes modelos de linguagem LMArena, ele foi amplamente discutido devido ao seu desempenho excepcional. Os especialistas técnicos do Google Gemini também participaram ativamente nas redes sociais, aumentando a expectativa do público, chegando até a ser considerado como o suposto Gemini 3.0 Pro.

Agora, o Google finalmente revelou seu verdadeiro rosto.

Na madrugada de 27 de agosto (GMT+8), o Google AI Studio lançou oficialmente o Gemini 2.5 Flash Image (codinome nano banana) 🍌.

O mais recente modelo de imagem de IA

O tão aguardado Gemini 2.5 Flash Image finalmente chegou | Fonte da imagem: GeekPark

Este é até agora o modelo de geração e edição de imagens mais avançado do Google, não apenas incrivelmente rápido, proporcionando uma experiência quase “relâmpago”, mas também conquistando resultados SOTA em várias listas e liderando com folga na LMArena.

O mais recente modelo de imagem de IA

Gemini 2.5 Flash Image atinge SOTA logo ao ser lançado | Fonte da imagem: LMarena.ai

No blog técnico, o Google mencionou que o Gemini 2.0 Flash já havia conquistado desenvolvedores com sua baixa latência e alto custo-benefício, mas os usuários sempre esperaram por imagens de maior qualidade e maior controle criativo. O Gemini 2.5 Flash Image chega justamente com essas melhorias de peso: a consistência de personagens finalmente é plenamente mantida, a edição de imagens baseada em prompts está mais precisa, a fusão de múltiplas imagens é natural e fluida, e o entendimento do conhecimento do mundo real faz com que ele seja mais do que um modelo — é como um “ponto de partida” para a próxima geração de aplicativos de sucesso.

O GeekPark também foi um dos primeiros a testá-lo. Surpreendentemente, não se trata apenas de uma atualização de modelo, mas pela primeira vez sentimos de verdade que o futuro da edição de imagens por IA já está ao nosso alcance.

O mais recente modelo de imagem de IA

Já disponível para testes no Google AI Studio | Fonte da imagem: GeekPark

No início, minha intenção era apenas experimentar normalmente, “ver o que há de novo em termos de velocidade”. Mas, para minha surpresa, em poucas horas de uso, tive a sensação de vislumbrar antecipadamente o formato dos próximos aplicativos de sucesso.

No passado, estávamos acostumados com ferramentas como Meitu, onde bastava clicar em alguns botões e aplicar um filtro para melhorar rapidamente a foto. Mas o Gemini 2.5 Flash Image proporciona uma sensação totalmente diferente. Ele é incrivelmente rápido, inteligente como um designer que entende o que você quer — basta dizer o efeito desejado e, em poucos segundos, a imagem aparece na tela.

O mais recente modelo de imagem de IA

Além do efeito, a velocidade é outro diferencial do Gemini 2.5 Flash Image em relação a modelos anteriores | Fonte da imagem: GeekPark


01 Geração ultrarrápida, resultado em segundos

O aspecto mais marcante da experiência com o nano banana é a velocidade. Antes, ao usar alguns modelos open source, mesmo com um computador potente, era preciso esperar dezenas de segundos ou mais para gerar uma imagem decente a partir de um prompt. Para usuários de celular, essa espera era ainda mais sofrida.

Mas o Gemini 2.5 Flash Image reduziu esse tempo para apenas alguns segundos. Ele é o “mais novo, mais rápido e mais eficiente” modelo multimodal nativo do Google, que claramente investiu muito em otimização. Nos meus testes, ao inserir um prompt, em cerca de três ou quatro segundos o resultado já estava pronto, com resolução e detalhes bastante nítidos. (UTC+8)

Essa experiência lembra o uso do Meitu para editar fotos: ao clicar no botão “embelezar”, o efeito aparece quase instantaneamente. A diferença é que o Meitu usa algoritmos para aplicar filtros, enquanto o Gemini 2.5 Flash Image constrói uma imagem do zero ou faz grandes alterações em uma foto conforme seu pedido. Essa sensação de “apontar e acertar” é algo impossível nos processos tradicionais e trabalhosos de edição de imagens.

O mais recente modelo de imagem de IA

Solicitações como “remover pessoas do fundo” podem ser resolvidas com um único prompt | Fonte da imagem: GeekPark

Se a velocidade resolve a experiência do usuário tradicional de edição de imagens, então o “multimodal nativo” expande os limites da capacidade de imagens por IA.

O Gemini 2.5 Flash Image não só gera imagens, mas também entende entradas de texto e imagem simultaneamente. Isso significa que posso enviar uma foto e um prompt textual juntos, e ele irá combinar as informações para entender exatamente o que quero.

Por exemplo, enviei uma foto tirada na rua e pedi: “mude o fundo para a paisagem noturna de Shinjuku, em Tóquio”. Ele não só identificou o sujeito da foto, mas também recortou a pessoa com precisão e substituiu o fundo por uma rua de Shinjuku iluminada por néons. O mais impressionante é que ele manteve a iluminação do personagem, sem aquele efeito artificial de recorte manual.

Esse nível de entendimento me lembra um recurso frequentemente citado nos álbuns de fotos dos smartphones nos últimos anos — “trocar o fundo com um clique”. Mas, antigamente, a troca de fundo deixava as bordas borradas e a iluminação errada, com um resultado artificial. Agora, o Gemini 2.5 Flash Image usa conhecimento do mundo e compreensão visual para aprimorar esses detalhes, tornando o resultado muito mais natural e preservando detalhes de imagem com precisão superior aos modelos tradicionais de texto-para-imagem ou imagem-para-imagem.

O mais recente modelo de imagem de IA

Imagem original & resultado gerado pelo Gemini 2.5 Flash Image | Fonte da imagem: GeekPark

É por isso que acredito que ele redefinirá a experiência de edição de imagens: não depende mais de ajustes manuais, mas sim da compreensão semântica natural do modelo para realizar tarefas de forma eficiente, especialmente em cenários como edição de retratos, que exigem alto nível de detalhe.

O mais recente modelo de imagem de IA

Para demandas de edição de retratos, a consistência de personagens do Gemini 2.5 Flash Image realmente proporciona uma experiência inédita de “Vibe Photoshoping”.

O mais recente modelo de imagem de IA

Um segundo para ajudar o programador a “salvar a reputação” | Fonte da imagem: GeekPark

Essa experiência quebra a antiga impressão de que a geração de imagens por IA era “esotérica”: se o prompt fosse bom, o resultado era surpreendente; se fosse mediano, o resultado podia sair completamente errado.

Mas no Gemini 2.5 Flash Image, percebi que essa “sensação de esoterismo” foi bastante reduzida. Ele entende os prompts com mais precisão e de forma mais intuitiva para o usuário — é por isso que muitos acham que ele é muito mais fácil de usar.

Por exemplo, pedi para “borrar o fundo e destacar o personagem em primeiro plano”, e em poucos segundos a imagem ficou exatamente como eu queria; pedi para “trocar a expressão da pessoa na foto para um sorriso”, e não só a boca ficou levemente curvada, mas até o olhar foi ajustado, com detalhes impressionantes; até testei “colorir uma foto em preto e branco”, e o resultado não foi uma coloração aleatória, mas sim o mais próximo possível da atmosfera das fotos históricas.

Essa capacidade de “fazer o que se pede” me lembra o uso do Meitu no passado, quando eu só queria suavizar a pele e acabava com um rosto artificialmente perfeito. Agora, as operações do Gemini 2.5 Flash Image são precisas e contidas — ele realmente entende o que você quer e tenta reproduzir fielmente.


02 Capacidades aprimoradas, impossível voltar atrás

Para ser mais direto, comparei o Gemini 2.5 Flash Image com as ferramentas de edição de imagens que uso no celular.

No Snapseed, para borrar o fundo, normalmente preciso gastar um ou dois minutos selecionando manualmente a área do primeiro plano e ajustando o nível de desfoque. Mesmo com prática, é preciso corrigir várias vezes.

No Meitu, embora haja a função de borrar o fundo com um clique, muitas vezes as bordas do personagem também ficam borradas, deixando o resultado pouco natural.

Já no Gemini 2.5 Flash Image, basta uma frase e ele identifica automaticamente as bordas entre personagem e fundo, aplicando o desfoque de forma natural, sem necessidade de retoques.

O mais recente modelo de imagem de IA

Essa comparação mostra uma coisa: o Gemini 2.5 Flash Image liberta o usuário de operações complexas, transferindo mais trabalho para o modelo. Para pessoas comuns, ele reduz a barreira da edição de imagens; para profissionais, economiza muito tempo.

Após a experiência, minha maior impressão é que o Gemini 2.5 Flash Image já não é apenas uma ferramenta de edição, mas sim um “assistente inteligente”.

No passado, ao usar o Meitu, estávamos diante de um conjunto de funções pré-definidas: filtros, embelezamento, mosaico, cada botão com uma função. Era preciso escolher e ajustar passo a passo até ficar satisfeito.

Agora, a lógica do Gemini 2.5 Flash Image é totalmente diferente. Ele não exige que você aprenda a lógica da ferramenta, mas entende diretamente sua necessidade. Basta dizer o que quer, e ele faz para você.

Essa mudança parece sutil, mas na verdade transforma completamente o fluxo de edição de imagens. Antes, nos adaptávamos à ferramenta; agora, a ferramenta se adapta a nós. Esse tipo de interação é o protótipo da próxima geração de aplicativos.

No momento, o Gemini 2.5 Flash Image ainda está em estágio inicial e pode ter limitações funcionais. Mas sua velocidade, compreensão e fidelidade já são suficientes para nos fazer imaginar o futuro.

E se ele fosse integrado ao Meitu, como seria? Talvez você abra o app, diga ao celular “melhore esta foto, deixe a pele mais natural” e, em poucos segundos, o resultado aparece (UTC+8); talvez, ao tirar fotos em viagens, você peça “mude o tempo para ensolarado” e a foto fique imediatamente iluminada; ou até mesmo, na edição de vídeos, uma frase pode mudar o clima de todo o trecho.

O mais recente modelo de imagem de IA

Esse método pode rapidamente se tornar a principal função de edição de imagens dos sistemas operacionais móveis no futuro | Fonte da imagem: Twitter

É por isso que acredito que ele revolucionará rapidamente o fluxo de trabalho das ferramentas de edição de imagens, definindo a próxima geração do “Meitu”: não apenas edição, mas uma nova forma de interação com o processamento de imagens, tornando a IA seu parceiro na pós-produção fotográfica.

Porém, atualmente, o Gemini 2.5 Flash Image ainda não pode ser um app de edição de imagens pronto para uso pelo público em geral: não só porque seu objetivo principal ainda é a geração de imagens, e não o ajuste fino de fotos existentes, mas também porque todas as imagens criadas ou editadas pelo Gemini 2.5 Flash Image incluem uma marca d’água digital SynthID, para identificação de conteúdo gerado por IA em plataformas sociais.


03 O ponto de explosão dos aplicativos de sucesso

Pensando bem, o Meitu se tornou um app popular porque resolveu da forma mais simples o problema que todos queriam resolver — deixar as fotos mais bonitas.

O Gemini 2.5 Flash Image vai além, refinando as capacidades complexas da IA em uma experiência de “imagem pronta em segundos” acessível a todos.

Quando pedi pela primeira vez para “borrar o fundo” e, em poucos segundos, a imagem foi tratada de forma natural, ficou claro para mim: esse é o ponto de partida de um aplicativo de sucesso. Ele não é apenas um modelo, mas a base de inúmeros novos produtos no futuro.

O mais recente modelo de imagem de IA

Função de IA para trocar o céu com um clique que bombou entre usuários de celular nos últimos anos | Fonte da imagem: comunidade vivo

Talvez, daqui a alguns anos, esqueçamos o codinome Banana, mas veremos cada vez mais ferramentas de edição de imagens que permitem “dizer o que quer e ver acontecer instantaneamente”, tornando-se, como o Meitu, uma memória coletiva de uma geração de usuários.

Só que desta vez, a IA levará a imaginação ainda mais longe.

0

Aviso Legal: o conteúdo deste artigo reflete exclusivamente a opinião do autor e não representa a plataforma. Este artigo não deve servir como referência para a tomada de decisões de investimento.

PoolX: bloqueie e ganhe!
Até 10% de APR - Quanto mais você bloquear, mais poderá ganhar.
Bloquear agora!