گوگل از Nano Banana 2 رونمایی کرد: مدل تصویرساز جمینای ۳.۱ فلش با سرعت و دقت خیره‌کننده

Wait 5 sec.

شرکت گوگل به‌تازگی از انتشار مدل Nano Banana 2 خبر داده است که به‌طور رسمی با نام Gemini 3.1 Flash Image شناخته می‌شود. این به‌روزرسانی پس از عرضه مدل اولیه Nano Banana در سال گذشته و نسخه Nano Banana Pro در آبان ماه صورت می‌گیرد. مدل جدید با هدف ترکیب قابلیت‌های پیشرفته تولید بصری و استدلال نسخه پرو با سرعت پردازش بالای معماری فلش طراحی شده است تا نسبت قیمت به عملکرد بهتری را برای توسعه‌دهندگان جهت استقرار خلق محتوای بصری پیچیده در مقیاس وسیع فراهم کند.خلاصه در یک نگاه معرفی مدل Nano Banana 2 برپایه جمینای ۳.۱ فلش ایمیج با تمرکز بر سرعت و کیفیت. ادغام دانش درنگ (Real-Time) برای رندر دقیق موضوعات بر اساس اطلاعات واقعی و آب‌وهوای زنده. قابلیت تولید متن خوانا درون تصویر و بومی‌سازی محتوای تبلیغاتی برای بازارهای مختلف. حفظ ثبات ظاهری سوژه‌ها (تا ۵ شخصیت و ۱۴ شیء) در سناریوهای مختلف. امکان تنظیم سطوح تفکر (Thinking Levels) برای مدیریت زمان پردازش در پرامپت‌های پیچیده.ویژگی‌های کلیدی و ارتقاهای فنیمدل Nano Banana 2 چندین به‌روزرسانی فنی و عملکردی را با هدف بهبود سرعت و کیفیت خروجی نسبت‌به نسل قبلی خود معرفی می‌کند:ادغام دانش درنگ (Real-Time): این مدل به اطلاعات دنیای واقعی و تصاویر جستجوی وب دسترسی دارد تا موضوعات خاص را به‌دقت رندر کند. برای نمایش این قابلیت، گوگل اپلیکیشن دموی Window Seat را ساخته است که مناظر پنجره‌ای واقع‌گرایانه را بر اساس مکان‌های جهانی خاص و داده‌های زنده آب‌وهوا تولید می‌کند.رندر متن و بومی‌سازی: سیستم می‌تواند متن‌های خوانا را درون تصاویر تولید کند که برای ایجاد رابط کاربری پویا یا ماکت‌های بازاریابی مناسب است. همچنین از بومی‌سازی درون‌تصویر پشتیبانی می‌کند. دموی Global Ad Localizer این ویژگی را با ترجمه متن تبلیغاتی و تطبیق زمینه بصری برای بازارهای بین‌المللی مختلف به‌طور مستقیم در تصویر نشان می‌دهد.ثبات سوژه: این مدل به کاربران اجازه می‌دهد تا ثبات بصری حداکثر ۵ شخصیت متمایز و ۱۴ شیء را در یک جریان کاری واحد حفظ کنند. دموی Pet Passport گوگل این موضوع را با گرفتن یک عکس مرجع از یک حیوان خانگی و رندر دقیق آن در نقاط دیدنی مختلف جهان نشان می‌دهد.سطوح تفکر قابل‌تنظیم: توسعه‌دهندگان اکنون می‌توانند فرآیند استدلال مدل را تنظیم کنند. با جابه‌جایی بین سطوح تفکر حداقل (پیش‌فرض) و بالا/پویا، مدل می‌تواند زمان پردازش بیشتری را به دستورات پیچیده و چندلایه اختصاص دهد که منجر به رعایت بهتر دستورالعمل‌ها می‌شود.گوگل Nano Banana 2مشخصات خروجی و کیفیت بصریمدل Nano Banana 2 از طیف وسیع‌تری از نسبت‌های تصویر پشتیبانی می‌کند و فرمت‌های بومی ۴:۱، ۱:۴، ۸:۱ و ۱:۸ را به لیست خود اضافه کرده است. همچنین یک سطح رزولوشن جدید ۵۱۲ پیکسل معرفی شده که برای کارایی و به حداقل رساندن تأخیر در خطوط لوله سنگین بهینه‌سازی شده است و به پیشنهادات موجود ۱K ،۲K و ۴K می‌پیوندد. این مدل جدید بهبودهایی را در نورپردازی زنده، غنای بافت و جزئیات کلی ارائه می‌دهد، درحالی‌که سرعت تولید سریع‌تری را حفظ می‌کند.یکپارچه‌سازی محصول و دسترس‌پذیریگوگل مدل Nano Banana 2 را برای تولید سریع و وظایف مبتنی‌بر جستجو ارائه می‌دهد، درحالی‌که نسخه پرو برای جریان‌های کاری که نیاز به حداکثر دقت واقعی دارند، باقی می‌ماند. این مدل جدید در پلتفرم‌های زیر درحال انتشار است:ابزارهای توسعه‌دهنده: این مدل از امروز برای توسعه‌دهندگانی که نیاز به استقرار سازمانی یا ساخت برنامه‌های سفارشی دارند، در دسترس است (نیاز به کلید API پولی). این مدل در API جمینای، گوگل AI Studio، ورتکس AI گوگل کلاد و فایربیس ادغام شده است.اپلیکیشن جمینای: مدل Nano Banana 2 جایگزین نسخه پرو به‌عنوان پیش‌فرض در مدل‌های سریع، متفکر و پرو می‌شود. مشترکین Google AI Pro و اولترا همچنان می‌توانند برای کارهای تخصصی با استفاده از گزینه تولید مجدد (Regenerate) به نسخه قبلی دسترسی داشته باشند.جستجوی گوگل: در حالت AI Mode و گوگل لنز در اپلیکیشن گوگل و مرورگرهای وب ادغام شده است. این قابلیت در ۱۴۱ کشور و قلمرو جدید با پشتیبانی از ۸ زبان اضافی در دسترس است.Flow: این مدل اکنون مدل پیش‌فرض تولید تصویر در Flow است و کاربران می‌توانند بدون اعتبار (Zero credits) به آن دسترسی داشته باشند.Google Ads: این مدل هم‌اکنون برای ارائه پیشنهادات دارایی (Asset suggestions) در هنگام ایجاد کمپین‌های تبلیغاتی در دسترس است.احراز هویت و واترمارک محتوادر کنار انتشار مدل، گوگل به‌روزرسانی‌هایی را درباره ابزارهای شناسایی رسانه‌های مولد خود ارائه کرد. خروجی‌های Nano Banana 2 از فناوری واترمارک اختصاصی این شرکت یعنی SynthID استفاده می‌کنند که با اعتبارنامه محتوای C2PA تعامل دارد تا زمینه‌ای درباره نحوه ایجاد یا تغییر تصویر ارائه دهد. طبق گفته گوگل، ویژگی تایید SynthID در اپلیکیشن جمینای از زمان راه‌اندازی در نوامبر تاکنون بیش از ۲۰ میلیون بار استفاده شده است. این شرکت همچنین برنامه‌هایی برای ادغام مستقیم تایید C2PA در اپلیکیشن جمینای در آینده نزدیک دارد.به‌نظر شما آیا سرعت بالاتر و قابلیت رندر متن در مدل جدید Nano Banana 2، می‌تواند آن را به ابزار اصلی طراحان و بازاریابان دربرابر رقبایی مثل میدجرنی تبدیل کند؟نوشته گوگل از Nano Banana 2 رونمایی کرد: مدل تصویرساز جمینای ۳.۱ فلش با سرعت و دقت خیره‌کننده اولین بار در ترنجی پدیدار شد.