Bitget App
Торгуйте разумнее
Купить криптоРынкиТорговляФьючерсыEarnWeb3ПлощадкаПодробнее
Торговля
Спот
Купить и продать криптовалюту
Маржа
Увеличивайте капитал и эффективность средств
Onchain
Going Onchain, without going Onchain!
Конвертер
Нулевая комиссия за транзакции и отсутствие проскальзывания.
Обзор
Launchhub
Получите преимущество заранее и начните побеждать
Копитрейдинг
Копируйте элитного трейдера в один клик
Боты
Простой, быстрый и надежный торговый бот на базе ИИ
Торговля
Фьючерсы USDT-M
Фьючерсы с расчетами в USDT
Фьючерсы USDC-M
Фьючерсы с расчетами в USDC
Фьючерсы Coin-M
Фьючерсы с расчетами в криптовалютах
Обзор
Руководство по фьючерсам
Путь от новичка до профессионала в торговле фьючерсами
Акции по фьючерсам
Получайте щедрые вознаграждения
Bitget Earn
Продукты для легкого заработка
Simple Earn
Вносите и выводите средства в любое время, чтобы получать гибкий доход без риска
Ончейн-Earn
Получайте прибыль ежедневно, не рискуя основной суммой
Структурированный Earn
Надежные финансовые инновации, чтобы преодолеть рыночные колебания
VIP и Управление капиталом
Премиум-услуги для разумного управления капиталом
Займы
Гибкие условия заимствования с высокой защитой средств
Новая AI-модель изображений "Banana" от Google взорвала интернет: пользователи сходят с ума по "Vibe Photoshoping"

Новая AI-модель изображений "Banana" от Google взорвала интернет: пользователи сходят с ума по "Vibe Photoshoping"

MarsBitMarsBit2025/08/30 06:53
Показать оригинал
Автор:TechFlow

Google AI Studio выпустила Gemini 2.5 Flash Image (кодовое название nano-banana), что является самой передовой моделью генерации и редактирования изображений от Google. Она отличается высокой скоростью работы и отличными результатами в различных рейтингах. Резюме создано Mars AI. Это резюме сгенерировано моделью Mars AI, точность и полнота представленной информации находятся на стадии итерационного обновления.

Новая AI-модель изображений

Помните загадочную модель для редактирования AI-изображений «nano-banana», которая недавно вызвала бурные обсуждения? В LMArena, арене соревнований больших языковых моделей, она благодаря выдающимся результатам стала настоящей сенсацией. Инженеры Google Gemini также активно подогревали интерес в социальных сетях, и модель даже считалась прототипом легендарной Gemini 3.0 Pro.

Теперь Google наконец-то сняла завесу тайны с этой разработки.

В ночь на 27 августа по восточноазиатскому времени Google AI Studio официально представила Gemini 2.5 Flash Image (кодовое название nano banana) 🍌.

Новая AI-модель изображений

Gemini 2.5 Flash Image, долгожданная новинка после длительного анонса | Источник: GeekPark

Это самая передовая на сегодняшний день модель генерации и редактирования изображений от Google: она не только невероятно быстрая, обеспечивая практически «молниеносный» опыт, но и занимает лидирующие позиции во многих рейтингах, а на LMArena опережает конкурентов с большим отрывом.

Новая AI-модель изображений

Gemini 2.5 Flash Image сразу же достигает SOTA-уровня | Источник: LMarena.ai

В техническом блоге Google отмечает, что Gemini 2.0 Flash уже завоевала популярность среди разработчиков благодаря низкой задержке и высокой эффективности, но пользователи всегда ждали более качественных изображений и большего контроля над творчеством. Gemini 2.5 Flash Image как раз и реализует эти долгожданные улучшения: теперь согласованность персонажей сохраняется полностью, редактирование изображений по подсказкам стало точнее, слияние нескольких изображений выглядит естественно и плавно, а понимание реального мира позволяет использовать модель не просто как инструмент, а как «отправную точку» для приложений нового поколения.

GeekPark также одним из первых протестировал новинку. И, что удивительно, это не просто обновление модели — впервые становится ясно, каким будет будущее AI-редактирования фотографий.

Новая AI-модель изображений

В Google AI Studio уже открыт доступ к тестированию | Источник: GeekPark

Сначала я подходил к тесту с обычным интересом — «посмотрим, насколько быстрее стала новая модель». Но всего за несколько часов использования я словно заглянул в будущее хитов следующего поколения.

Раньше мы привыкли к инструментам вроде MeituPic: нажал кнопку, наложил фильтр — и фото тут же стало красивее. Но Gemini 2.5 Flash Image ощущается совершенно иначе. Она невероятно быстрая и умная, словно дизайнер, который понимает твои мысли: достаточно просто описать желаемый эффект — и через несколько секунд результат уже готов.

Новая AI-модель изображений

Помимо качества, скорость — еще одно заметное отличие Gemini 2.5 Flash Image от предыдущих генераторов изображений | Источник: GeekPark


01 Молниеносная генерация — результат за считанные секунды

Самое очевидное впечатление от nano banana — это скорость. Раньше даже при хорошем «железе» для генерации приличного изображения с помощью open-source моделей приходилось ждать десятки секунд, а то и дольше. Для пользователей мобильных устройств это ожидание было особенно мучительным.

Но Gemini 2.5 Flash Image снижает этот порог до нескольких секунд. Это «самая новая, быстрая и эффективная» нативная мультимодальная модель от Google, в которую вложено много усилий по оптимизации. В моем тесте результат по текстовому запросу появлялся за 3–4 секунды, при этом разрешение и детализация были на высоте. (UTC+8)

Этот опыт напоминает использование MeituPic: нажал кнопку «улучшить» — и результат виден мгновенно. Разница в том, что MeituPic применяет фильтры, а Gemini 2.5 Flash Image создает изображение с нуля или кардинально меняет фото по вашему запросу. Такой «точечный» эффект невозможен при традиционном ручном редактировании.

Новая AI-модель изображений

Задачи вроде «удалить прохожих на заднем плане» теперь решаются одним prompt’ом | Источник: GeekPark

Если скорость решает проблему пользовательского опыта традиционного редактирования, то «нативная мультимодальность» расширяет границы возможностей AI-обработки изображений.

Gemini 2.5 Flash Image не только генерирует изображения, но и понимает как текстовые, так и визуальные входные данные. Это значит, что я могу загрузить фото и добавить текстовый запрос — модель объединит обе подсказки и поймет, что именно мне нужно.

Например, я загрузил уличное фото и попросил: «Сделай фоном ночной Токио, район Синдзюку». Модель не только распознала главный объект на фото, но и аккуратно вырезала человека, заменив фон на неоновый Синдзюку. Более того, она сохранила единство светотени, избежав типичного для ручного вырезания эффекта «грубой вставки».

Такое понимание напоминает функцию «замены фона в один клик», которую в последние годы часто рекламируют производители смартфонов. Но раньше края часто были размыты, светотень не совпадала, и результат выглядел неестественно. Теперь же Gemini 2.5 Flash Image использует знания о мире и визуальное восприятие для доработки деталей, обеспечивая гораздо более естественный результат и точную передачу деталей по сравнению с традиционными инструментами.

Новая AI-модель изображений

Оригинал & результат Gemini 2.5 Flash Image | Источник: GeekPark

Вот почему я считаю, что эта модель переопределяет опыт редактирования: теперь не нужно вручную настраивать каждую деталь — модель сама понимает смысл задачи и выполняет ее «в лоб», например, при обработке портретов, где важна каждая мелочь.

Новая AI-модель изображений

Для задач обработки портретов Gemini 2.5 Flash Image обеспечивает невиданную ранее «Vibe Photoshoping» — согласованность персонажа на высшем уровне.

Новая AI-модель изображений

За секунду «спасает» программиста | Источник: GeekPark

Этот опыт ломает привычное представление о генерации AI-изображений как о «магии»: если prompt хороший — результат отличный, если нет — всё может пойти не так.

Но в Gemini 2.5 Flash Image «магия» стала гораздо менее выраженной. Модель точнее понимает подсказки и ближе к интуиции пользователя — поэтому многим она кажется гораздо удобнее.

Например, я попросил «размыть фон, выделить человека на переднем плане» — и через несколько секунд получил именно такой результат; попросил «заменить выражение лица на улыбку» — и не только уголки губ поднялись, но и взгляд изменился, детали были проработаны; даже при «раскрашивании» черно-белых фото цвета были максимально приближены к историческим реалиям.

Такая «точность исполнения» напоминает, как раньше в MeituPic при попытке просто сгладить кожу лицо превращалось в «куклу с максимальным бьюти-эффектом». Теперь же Gemini 2.5 Flash Image действует аккуратно и точно, действительно понимая ваш запрос и стараясь его реализовать.


02 Усиленные возможности — возврата нет

Для наглядности я сравнил модель с привычными мобильными инструментами для редактирования.

В Snapseed, чтобы размыть фон, мне нужно вручную выделять передний план и настраивать степень размытия — на это уходит пара минут и несколько попыток.

В MeituPic есть функция размытия фона в один клик, но она часто размывает и края объекта, делая результат неестественным.

В Gemini 2.5 Flash Image достаточно одной фразы — модель сама определяет границы между человеком и фоном, а размытие выглядит естественно, без доработок.

Новая AI-модель изображений

Это сравнение показывает главное: Gemini 2.5 Flash Image освобождает пользователя от сложных действий, перекладывая работу на модель. Для обычных людей это снижает порог входа, а для профессионалов экономит массу времени.

В результате я понял, что Gemini 2.5 Flash Image — это уже не просто инструмент для редактирования, а скорее «умный помощник».

Раньше мы использовали MeituPic как набор готовых функций: фильтры, улучшение, мозаика — каждая кнопка отвечала за отдельную задачу. Нужно было выбирать и настраивать до тех пор, пока не получишь желаемое.

Теперь же логика Gemini 2.5 Flash Image иная: не вы учитесь пользоваться инструментом, а инструмент понимает ваши потребности. Просто скажите — и он всё сделает за вас.

На первый взгляд это мелочь, но на деле полностью меняет сам процесс редактирования: раньше мы подстраивались под инструмент, теперь инструмент подстраивается под нас. Такой подход — прообраз приложений нового поколения.

Пока Gemini 2.5 Flash Image еще на ранней стадии, и у него есть свои ограничения. Но его скорость, понимание и точность уже позволяют мечтать о будущем.

Что если объединить его с MeituPic? Возможно, вы откроете приложение, скажете: «Сделай кожу естественнее», — и через несколько секунд получите результат (UTC+8); или во время путешествия попросите: «Сделай погоду солнечной», — и фото тут же преобразится; или даже в видеоредакторе одной фразой измените атмосферу целого фрагмента.

Новая AI-модель изображений

В будущем такой подход может быстро стать стандартом для мобильных ОС | Источник: Twitter

Вот почему я уверен: эта модель быстро изменит существующие процессы редактирования и определит новое поколение «MeituPic» — не просто инструмент для обработки, а новый способ взаимодействия с изображениями, где AI становится вашим партнером по постобработке.

Однако сейчас Gemini 2.5 Flash Image еще не готов стать массовым приложением «из коробки»: его основная задача — генерация изображений, а не доработка существующих, и все созданные или отредактированные изображения получают цифровой водяной знак SynthID для идентификации AI-контента на платформах.


03 Точка взлета для хита

Вспомним, почему MeituPic когда-то стал национальным приложением: он простым способом решал универсальную задачу — делал фото красивее.

Gemini 2.5 Flash Image идет дальше: превращает сложные AI-возможности в «мгновенный» опыт, доступный каждому.

Когда я впервые сказал: «Размой фон», — и через несколько секунд получил естественный результат, я понял: это и есть момент рождения хита. Это не просто модель, а фундамент для будущих продуктов.

Новая AI-модель изображений

Функция AI-замены неба, ставшая хитом среди пользователей смартфонов в последние годы | Источник: сообщество vivo

Возможно, через несколько лет мы забудем кодовое имя Banana, но увидим всё больше инструментов, где «достаточно сказать — и сразу получить результат». Такие приложения, как когда-то MeituPic, станут частью коллективной памяти нового поколения.

Только теперь AI раздвинет границы воображения еще дальше.

0

Дисклеймер: содержание этой статьи отражает исключительно мнение автора и не представляет платформу в каком-либо качестве. Данная статья не должна являться ориентиром при принятии инвестиционных решений.

PoolX: вносите активы и получайте новые токены.
APR до 12%. Аирдропы новых токенов.
Внести!

Вам также может понравиться

Hotcoin Research | Рынок ставит более чем на 80% вероятность снижения ставки в сентябре: анализ темпов снижения ставки ФРС в четвертом квартале и прогноз его влияния

В данной статье рассматриваются основания для решения Федеральной резервной системы по процентной ставке, влияние снижения ставки на криптоактивы и исторический опыт, а также проводится сценарный анализ вероятности снижения ставки в сентябре и темпов снижения в четвертом квартале.

深潮2025/08/30 17:29
Hotcoin Research | Рынок ставит более чем на 80% вероятность снижения ставки в сентябре: анализ темпов снижения ставки ФРС в четвертом квартале и прогноз его влияния

Главный кандидат на пост председателя ФРС Уоллер: Ethereum и стейблкоины — следующий шаг в развитии платежей, учреждения должны их внедрять

Один из главных претендентов на пост следующего председателя ФРС, Уоллер, публично выразил оптимизм в отношении цифровых активов, особенно Ethereum и стейблкоинов, и призвал финансовые институты принять криптовалюты как естественный следующий шаг в развитии платежей.

深潮2025/08/30 17:27