شرکت گوگل روز چهارشنبه از مدل پیشرفته هوش مصنوعی جدید خود با نام Gemini 2.0 رونمایی کرد. این مدل با هدف پشتیبانی از آنچه که گوگل “عصر عامل” (Agentic Era) مینامد، نسل جدیدی از قابلیتهای هوش مصنوعی را به ارمغان میآورد. Gemini 2.0 با ویژگیهایی نظیر خروجیهای بومی تصویر و صدا، پشتیبانی چندحالتی (Multimodal) و یکپارچگی با ابزارهای پیشرفته، نویدبخش توسعه دستیارهای هوش مصنوعی همهکاره و کارآمدتر است. با دیجی رو همراه باشید.
Gemini 2.0 Flash: عملکرد پیشرفته و ویژگیهای نوین
مدل Gemini 2.0 Flash به عنوان نسخهای بهبود یافته از 1.5 Flash، عملکردی دو برابر سریعتر نسبت به مدل قبلی 1.5 Pro ارائه میدهد. این مدل از ورودیهای چندحالتی مانند تصاویر، ویدیوها و صداها پشتیبانی میکند و خروجیهایی مانند تصاویر تولید شده و تبدیل متن به صدای (Text-to-Speech) چند زبانه ارائه میدهد.
این مدل همچنین توانایی استفاده بومی از ابزارهایی مانند جستجوی گوگل و ابزارهای شخص ثالث را داراست که باعث افزایش قابلیت انعطافپذیری آن میشود.
مدل Gemini 2.0 Flash امکاناتی از جمله استدلال چندحالتی، درک متون طولانی و برنامهریزی پیشرفته را معرفی میکند. این قابلیتها توسعه عاملهای هوش مصنوعی پیچیدهتر را ممکن میسازند. گوگل این قابلیتها را در قالب نمونههای اولیه مختلفی آزمایش کرده است که از جمله آنها میتوان به پروژههای Astra، Mariner و Jules اشاره کرد که در ادامه به توضیح اجمالی هر کدام میپردازیم.
- پروژه Astra: این نمونه اولیه، طراحی شده برای دستگاههای اندرویدی، ویژگیهایی مانند گفتوگوی چندزبانه پیشرفته، یکپارچگی با ابزارهایی مانند Google Search، Google Lens و Google Maps و حافظه درونجلسهای تا 10 دقیقه را ارائه میدهد. همچنین، تأخیر کمتر در مکالمات، امکان گفتوگوهای طبیعیتر را فراهم میکند.
- پروژه Mariner: این پروژه با هدف بهبود تعامل انسان و عامل هوش مصنوعی در وظایف وب طراحی شده است. با استفاده از Gemini 2.0، پروژه Mariner قادر به پردازش عناصر وب مانند متن، تصاویر و کد است. این پروژه که هنوز در مراحل اولیه قرار دارد، به نرخ موفقیت 83.5 درصد در اجرای وظایف وب دست یافته است.
- پروژه Jules برای توسعهدهندگان: Jules یک عامل هوش مصنوعی آزمایشی است که در گیتهاب (GitHub) یکپارچه شده است. این ابزار به توسعه دهندگان کمک میکند با شناسایی مشکلات، پیشنهاد راهحلها و اجرای برنامهها تحت نظارت کار خود را بهبود بخشند. این تلاش بخشی از هدف کلی گوگل برای گسترش استفاده از هوش مصنوعی در زمینههای مختلف از جمله توسعه نرمافزار است.
کاربرد در بازیها و فراتر از آن
با بهرهگیری از تجربه تیم DeepMind در بازیها، گوگل در حال توسعه عاملهای هوش مصنوعی است که میتوانند براساس اقدامات درون بازی استدلال کرده و پیشنهادات بلادرنگ ارائه دهند. این عاملها در بازیهایی مانند Clash of Clans و Hay Day در حال آزمایش هستند. علاوه بر این، گوگل پتانسیل Gemini 2.0 را برای رباتیک و استدلال فضایی در محیطهای فیزیکی بررسی میکند.
توسعه مسئولانه هوش مصنوعی با Gemini 2.0
گوگل تعهد خود به توسعه مسئولانه هوش مصنوعی را با تمرکز بر ایمنی و امنیت نشان داده است. اقدامات کلیدی در این راستا شامل موارد زیر است:
- همکاری با کمیته مسئولیت و ایمنی (RSC): این گروه داخلی گوگل خطرات احتمالی و اقدامات ایمنی را ارزیابی میکند.
- تیمهای بررسی خطر مبتنی بر هوش مصنوعی: قابلیتهای پیشرفته استدلال Gemini 2.0 برای ارزیابی خطرات به کار گرفته میشود.
- ایمنی چندحالتی: آموزش Gemini 2.0 برای مدیریت ایمن انواع مختلف ورودیها و خروجیها.
- پروژههای Astra و Mariner: تحقیقات برای جلوگیری از اشتراکگذاری ناخواسته اطلاعات حساس توسط کاربران، با ارائه کنترل حریم خصوصی و اولویتبندی دستورالعملهای کاربر.
گوگل اشاره کرده است که عرضه Gemini 2.0 Flash و نمونههای اولیه پژوهشی مختلف، فصل جدیدی در عصر Gemini را رقم میزند. این پیشرفتها نشان دهنده گامی هیجانانگیز در توسعه هوش مصنوعی است، در حالی که گوگل همچنان به سمت هوش مصنوعی عمومی (AGI) حرکت میکند و ایمنی را در اولویت قرار میدهد.
دسترسی به Gemini 2.0
- دسترسی به اپلیکیشن Gemini: نسخه بهینهسازی شده برای چت، اکنون در وب دسکتاپ و موبایل در دسترس است و اپلیکیشن موبایل Gemini نیز به زودی عرضه خواهد شد.
- دسترسی توسعهدهندگان: توسعهدهندگان میتوانند از طریق Google AI Studio و Vertex AI به مدل آزمایشی دسترسی داشته باشند.
- API چندحالتی زنده: این API جدید از پخش بلادرنگ صدا و ویدیو و استفاده ترکیبی از ابزارها برای توسعهدهندگان پشتیبانی میکند.
- گسترش کاربردها: تست وظایف پیچیده مانند ریاضیات پیشرفته و کدنویسی در حال انجام است و انتشار گستردهتر در اوایل سال 2025 برنامهریزی شده است.
اظهارات مدیرعامل گوگل درباره Gemini 2.0
ساندار پیچای (Sundar Pichai)، مدیرعامل گوگل و آلفابت، درباره Gemini 2.0 گفته:
پیشرفتهای Gemini 2.0 مبتنی بر سرمایهگذاریهای ده ساله ما در یک رویکرد جامع برای نوآوری هوش مصنوعی است. این مدل با استفاده از سختافزارهای سفارشی مانند Trillium و TPUهای نسل ششم ما به طور کامل آموزش دیده و اجرا شده است.
Gemini 2.0، با ارتقاء تواناییها و قابلیتهای خود، اطلاعات را نه تنها سازماندهی و درک میکند، بلکه آن را به شیوهای بسیار مفیدتر به کار میگیرد. ما مشتاقیم ببینیم این عصر جدید به کجا میرسد.