گوگل مدل هوش مصنوعی Gemini 2.0 را رسماً معرفی کرد

شرکت گوگل روز چهارشنبه از مدل پیشرفته هوش مصنوعی جدید خود با نام Gemini 2.0 رونمایی کرد. این مدل با هدف پشتیبانی از آنچه که گوگل “عصر عامل” (Agentic Era) می‌نامد، نسل جدیدی از قابلیت‌های هوش مصنوعی را به ارمغان می‌آورد. Gemini 2.0 با ویژگی‌هایی نظیر خروجی‌های بومی تصویر و صدا، پشتیبانی چندحالتی (Multimodal) و یکپارچگی با ابزارهای پیشرفته، نویدبخش توسعه دستیارهای هوش مصنوعی همه‌کاره و کارآمدتر است. با دیجی رو همراه باشید.

لیست

Gemini 2.0 Flash: عملکرد پیشرفته و ویژگی‌های نوین

مدل Gemini 2.0 Flash به عنوان نسخه‌ای بهبود‌ یافته از 1.5 Flash، عملکردی دو برابر سریع‌تر نسبت به مدل قبلی 1.5 Pro ارائه می‌دهد. این مدل از ورودی‌های چندحالتی مانند تصاویر، ویدیوها و صداها پشتیبانی می‌کند و خروجی‌هایی مانند تصاویر تولید شده و تبدیل متن به صدای (Text-to-Speech) چند زبانه ارائه می‌دهد.

این مدل همچنین توانایی استفاده بومی از ابزارهایی مانند جستجوی گوگل و ابزارهای شخص ثالث را داراست که باعث افزایش قابلیت انعطاف‌پذیری آن می‌شود.

مدل Gemini 2.0 Flash امکاناتی از جمله استدلال چندحالتی، درک متون طولانی و برنامه‌ریزی پیشرفته را معرفی می‌کند. این قابلیت‌ها توسعه عامل‌های هوش مصنوعی پیچیده‌تر را ممکن می‌سازند. گوگل این قابلیت‌ها را در قالب نمونه‌های اولیه مختلفی آزمایش کرده است که از جمله آن‌ها می‌توان به پروژه‌های Astra، Mariner و Jules اشاره کرد که در ادامه به توضیح اجمالی هر کدام می‌پردازیم.

پروژه Astra: این نمونه اولیه، طراحی شده برای دستگاه‌های اندرویدی، ویژگی‌هایی مانند گفت‌وگوی چندزبانه پیشرفته، یکپارچگی با ابزارهایی مانند Google Search، Google Lens و Google Maps و حافظه درون‌جلسه‌ای تا 10 دقیقه را ارائه می‌دهد. همچنین، تأخیر کمتر در مکالمات، امکان گفت‌وگوهای طبیعی‌تر را فراهم می‌کند.
پروژه Mariner: این پروژه با هدف بهبود تعامل انسان و عامل هوش مصنوعی در وظایف وب طراحی شده است. با استفاده از Gemini 2.0، پروژه Mariner قادر به پردازش عناصر وب مانند متن، تصاویر و کد است. این پروژه که هنوز در مراحل اولیه قرار دارد، به نرخ موفقیت 83.5 درصد در اجرای وظایف وب دست یافته است.
پروژه Jules برای توسعه‌دهندگان: Jules یک عامل هوش مصنوعی آزمایشی است که در گیت‌هاب (GitHub) یکپارچه شده است. این ابزار به توسعه دهندگان کمک می‌کند با شناسایی مشکلات، پیشنهاد راه‌حل‌ها و اجرای برنامه‌ها تحت نظارت کار خود را بهبود بخشند. این تلاش بخشی از هدف کلی گوگل برای گسترش استفاده از هوش مصنوعی در زمینه‌های مختلف از جمله توسعه نرم‌افزار است.

کاربرد در بازی‌ها و فراتر از آن

با بهره‌گیری از تجربه تیم DeepMind در بازی‌ها، گوگل در حال توسعه عامل‌های هوش مصنوعی است که می‌توانند براساس اقدامات درون بازی استدلال کرده و پیشنهادات بلادرنگ ارائه دهند. این عامل‌ها در بازی‌هایی مانند Clash of Clans و Hay Day در حال آزمایش هستند. علاوه بر این، گوگل پتانسیل Gemini 2.0 را برای رباتیک و استدلال فضایی در محیط‌های فیزیکی بررسی می‌کند.

توسعه مسئولانه هوش مصنوعی با Gemini 2.0

گوگل تعهد خود به توسعه مسئولانه هوش مصنوعی را با تمرکز بر ایمنی و امنیت نشان داده است. اقدامات کلیدی در این راستا شامل موارد زیر است:

همکاری با کمیته مسئولیت و ایمنی (RSC): این گروه داخلی گوگل خطرات احتمالی و اقدامات ایمنی را ارزیابی می‌کند.
تیم‌های بررسی خطر مبتنی بر هوش مصنوعی: قابلیت‌های پیشرفته استدلال Gemini 2.0 برای ارزیابی خطرات به کار گرفته می‌شود.
ایمنی چندحالتی: آموزش Gemini 2.0 برای مدیریت ایمن انواع مختلف ورودی‌ها و خروجی‌ها.
پروژه‌های Astra و Mariner: تحقیقات برای جلوگیری از اشتراک‌گذاری ناخواسته اطلاعات حساس توسط کاربران، با ارائه کنترل حریم خصوصی و اولویت‌بندی دستورالعمل‌های کاربر.

گوگل اشاره کرده است که عرضه Gemini 2.0 Flash و نمونه‌های اولیه پژوهشی مختلف، فصل جدیدی در عصر Gemini را رقم می‌زند. این پیشرفت‌ها نشان دهنده گامی هیجان‌انگیز در توسعه هوش مصنوعی است، در حالی که گوگل همچنان به سمت هوش مصنوعی عمومی (AGI) حرکت می‌کند و ایمنی را در اولویت قرار می‌دهد.

دسترسی به Gemini 2.0

دسترسی به اپلیکیشن Gemini: نسخه بهینه‌سازی شده برای چت، اکنون در وب دسکتاپ و موبایل در دسترس است و اپلیکیشن موبایل Gemini نیز به زودی عرضه خواهد شد.
دسترسی توسعه‌دهندگان: توسعه‌دهندگان می‌توانند از طریق Google AI Studio و Vertex AI به مدل آزمایشی دسترسی داشته باشند.
API چندحالتی زنده: این API جدید از پخش بلادرنگ صدا و ویدیو و استفاده ترکیبی از ابزارها برای توسعه‌دهندگان پشتیبانی می‌کند.
گسترش کاربردها: تست وظایف پیچیده مانند ریاضیات پیشرفته و کدنویسی در حال انجام است و انتشار گسترده‌تر در اوایل سال 2025 برنامه‌ریزی شده است.

اظهارات مدیرعامل گوگل درباره Gemini 2.0

ساندار پیچای (Sundar Pichai)، مدیرعامل گوگل و آلفابت، درباره Gemini 2.0 گفته:

پیشرفت‌های Gemini 2.0 مبتنی بر سرمایه‌گذاری‌های ده ساله ما در یک رویکرد جامع برای نوآوری هوش مصنوعی است. این مدل با استفاده از سخت‌افزارهای سفارشی مانند Trillium و TPUهای نسل ششم ما به طور کامل آموزش دیده و اجرا شده است.

Gemini 2.0، با ارتقاء توانایی‌ها و قابلیت‌های خود، اطلاعات را نه تنها سازمان‌دهی و درک می‌کند، بلکه آن را به شیوه‌ای بسیار مفیدتر به کار می‌گیرد. ما مشتاقیم ببینیم این عصر جدید به کجا می‌رسد.

گوگل مدل هوش مصنوعی Gemini 2.0 را رسماً معرفی کرد