دیجی رودیجی رو
  • اخبار تکنولوژی
    • اخبار داخلی
    • اخبار تلفن همراه
    • اخبار سخت افزار
    • اخبار اپلیکیشن‌ها
  • آموزش
  • بررسی محصولات
  • راهنمای خرید
  • سرگرمی
    • اخبار بازی
    • معرفی بازی
      • بازی موبایل
      • بازی دسکتاپ
      • بازی کنسول
    • معرفی اپلیکیشن
    • سینما و تلویزیون
  • دیجی فکت
  • دیجی لایف
  • دیجی10
  • مقالات گوناگون
خواندن: مدل Gemini 2.5 Computer Use گوگل؛ انقلابی در تعامل هوش مصنوعی با وب و رابط کاربری
به اشتراک بگذارید
ورود
اعلان نمایش بیشتر
تغییر اندازه فونتآآ
دیجی رودیجی رو
تغییر اندازه فونتآآ
جستجو
حساب کاربری دارید؟ ورود
دنبال کردن
تمامی حقوق برای رسانه دیجی‌رو محفوظ است. 1403 ©
دیجی رو > اخبار > اخبار هوش مصنوعی > مدل Gemini 2.5 Computer Use گوگل؛ انقلابی در تعامل هوش مصنوعی با وب و رابط کاربری
اخبار هوش مصنوعیگوگل

مدل Gemini 2.5 Computer Use گوگل؛ انقلابی در تعامل هوش مصنوعی با وب و رابط کاربری

حسین محمودزاده 17 مهر 1404 ساعت 17:56
زمان مطالعه: 5 دقیقه
مدل Gemini 2.5 Computer Use گوگل
اشتراک گذاری
بلیط هواپیما سفرمارکت

گوگل اخیراً مدل جدیدی از هوش مصنوعی خود را با نام Gemini 2.5 Computer Use معرفی کرده است که توانایی تعامل با وب‌سایت‌ها و رابط‌های کاربری را مانند یک انسان دارد. این مدل که در حال حاضر در نسخه پیش‌نمایش عمومی از طریق Gemini API در Google AI Studio و Vertex AI در دسترس است، گامی بزرگ در جهت هوشمندسازی تعاملات دیجیتالی محسوب می‌شود. Gemini 2.5 Computer Use بر پایه قابلیت‌های درک بصری و استدلال مدل Gemini 2.5 Pro ساخته شده و می‌تواند اقدامات مختلفی مانند کلیک، تایپ، اسکرول، هاور کردن، باز کردن منوها و پیمایش در صفحات وب را انجام دهد. با دیجی رو همراه باشید.

لیست
برتری Gemini 2.5 Computer Use در مقایسه با رقبانمایش عملکرد مدل در عملامنیت و پیشگیری از سوء استفاده‌های احتمالیکاربردهای عملی و استفاده‌های داخلینتیجه‌گیری: آینده تعامل هوش مصنوعی با وب

برتری Gemini 2.5 Computer Use در مقایسه با رقبا

گوگل ادعا می‌کند که این مدل در بنچمارک‌های مختلف مانند Online-Mind2Web، WebVoyager و AndroidWorld عملکرد بهتری نسبت به ابزارهای مشابه دارد. علاوه بر این، Gemini 2.5 Computer Use با داشتن تاخیر کمتر، تجربه کاربری روان‌تری را ارائه می‌دهد. برخلاف مدل‌های سنتی هوش مصنوعی که به APIها وابسته هستند، این مدل از اسکرین‌شات‌های رابط کاربری برای تحلیل و تصمیم‌گیری در خصوص اقدامات بعدی خود استفاده می‌کند.

مدل Gemini 2.5 Computer Use گوگل

فرایند کار به این صورت است که مدل یک تسک (مأموریت)، یک اسکرین‌شات از محیط دیجیتال و تاریخچه اقدامات اخیر دریافت می‌کند. سپس با تحلیل رابط کاربری، اقدامی مانند کلیک روی یک دکمه یا تایپ در یک فیلد را پیشنهاد می‌دهد. این اقدام در سمت کلاینت اجرا شده و یک اسکرین‌شات جدید به مدل ارسال می‌شود تا فرایند ادامه یابد.

نمایش عملکرد مدل در عمل

گوگل با ارائه چند نمونه عملی، توانایی‌های این مدل را به نمایش گذاشته است. در یکی از دموها، یک عامل هوش مصنوعی یادداشت‌های چسبان دیجیتال را روی یک تخته سفید مرتب می‌کند. در نمونه دیگری، اطلاعات مربوط به یک حیوان خانگی از یک وب‌سایت به سیستم CRM منتقل می‌شود. این دموها با سرعت بیشتری نمایش داده می‌شوند تا فرایند را در زمان واقعی نشان دهند.

در حال حاضر، Gemini 2.5 Computer Use از 13 اقدام مختلف پشتیبانی می‌کند و بهترین عملکرد را در مرورگرهای وب دارد. گوگل اعلام کرده که این مدل هنوز برای وظایف سطح سیستم عامل دسکتاپ بهینه نشده است، اما در بنچمارک‌های موبایل پتانسیل خوبی از خود نشان داده است.

مدل Gemini 2.5 Computer Use گوگل

امنیت و پیشگیری از سوء استفاده‌های احتمالی

گوگل برای جلوگیری از سوء استفاده‌های احتمالی، اقدامات امنیتی مختلفی را پیاده‌سازی کرده است. هر اقدام پیشنهادی توسط مدل، قبل از اجرا توسط یک سرویس امنیتی بررسی می‌شود. توسعه‌دهندگان نیز می‌توانند اقدامات خاصی را محدود کنند یا برای وظایف پرخطر مانند تراکنش‌های مالی، تأیید صریح کاربر را الزامی نمایند.

کاربردهای عملی و استفاده‌های داخلی

در حال حاضر تعدادی از تیم‌های داخلی گوگل از این مدل در محیط داخلی شرکت استفاده می‌کنند. Gemini 2.5 Computer Use در وظایف مختلفی مانند تست رابط کاربری (UI) و اتوماسیون در پلتفرم‌هایی مانند Google Search و Firebase مورد استفاده قرار می‌گیرد. توسعه‌دهندگان خارجی که در برنامه دسترسی اولیه شرکت کرده‌اند، از این مدل برای ساخت ابزارهای اتوماسیون گردش کار و دستیارهای هوشمند استفاده می‌کنند.

مدل Gemini 2.5 Computer Use گوگل

توسعه‌دهندگان می‌توانند از طریق Google AI Studio یا Vertex AI به این مدل دسترسی پیدا کنند. گوگل همچنین یک محیط دموی مبتنی بر وب را نیز برای تست قابلیت‌های مدل جدید ارائه کرده است.

نتیجه‌گیری: آینده تعامل هوش مصنوعی با وب

مدل Gemini 2.5 Computer Use گوگل با قابلیت‌های مرور وب مانند انسان یک پیشرفت بزرگ در زمینه هوش مصنوعی و تعامل با رابط‌های کاربری است. این مدل با توانایی انجام اقدامات مختلف مانند کلیک، تایپ و پیمایش، می‌تواند در زمینه‌های مختلفی مانند اتوماسیون، تست رابط کاربری برنامه‌ها و دستیارهای هوشمند مورد استفاده قرار گیرد. با توجه به اقدامات امنیتی و پشتیبانی گوگل، انتظار می‌رود که این مدل در آینده نزدیک نقش مهمی در بهبود تعاملات دیجیتالی ایفا کند.

اخبار تکنولوژی
بلیط اتوبوس
تاکسی بین شهری
برچسب ها: گوگل, هوش مصنوعی
این مقاله را به اشتراک بگذارید
توییتر Whatsapp Whatsapp تلگرام ایمیل کپی کرده لینک پرینت
چه حسی به این مطلب داری؟
Sad0
Sleepy0
Love0
Happy0
Angry0
Cry0
Surprise0
مقاله قبلی چطور با انتخاب هاست پرسرعت، سرعت سایت وردپرس خود را دو برابر کنیم؟ چطور با انتخاب هاست پرسرعت، سرعت سایت وردپرس خود را دو برابر کنیم؟
مقاله بعدی مقایسه اسنپدراگون 8 الیت نسل 5 با اسنپدراگون 8 نسل 3 مقایسه اسنپدراگون 8 الیت نسل 5 با اسنپدراگون 8 نسل 3؛ نبردی بین دو نسل پرچمدار
نظر بدهید نظر بدهید

نظر بدهید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

لطفا یک امتیاز انتخاب کنید!

تبلیغات

موبوگیفت
  • خرید ممبر ایتا
  • خرید فالوور ایرانی
  • خرید فالوور ارزان
  • خرید ممبر تلگرام
  • خرید بیت کوین
  • پنجره دوجداره
  • کاغذ A4
  • سرور اچ پی
  • فالوور روبیکا با کیفیت
  • مخزن کرایوژنیک
  • سرفیس پرو 12
  • خرید ممبر ایتا
  • دستگاه جوجه کشی دماوند
  • پیش بینی قیمت ارزها
  • ارز نئو رقیب قدرتمند اتریوم
  • ثروتمندان 2025 بیت کوین
  • قیمت یو اس دی کوین (USDC)
  • قوی ترین جهش ریپل
  • دوربین کوچک سیم کارت خور
  • خرید سرور hp ماهان شبکه اچ پی

آخرین خبرها

هوش مصنوعی در امنیت سایبری

نقش هوش مصنوعی در امنیت سایبری؛ از تهدید شغلی تا بزرگترین فرصت تاریخ

سرمایه‌گذاری انویدیا در نوکیا

سرمایه‌گذاری انویدیا در نوکیا؛ اتحاد یک میلیارد دلاری برای رهبری در هوش مصنوعی و 6G

اینستا 360 ایکس 4 ایر

«اینستا 360 ایکس 4 ایر» معرفی شد؛ یک دوربین اکشن 8K با قیمت باورنکردنی

مطالب مرتبط

هوش مصنوعی در امنیت سایبری
اخبار هوش مصنوعیاخبار امنیتیمنتخب

نقش هوش مصنوعی در امنیت سایبری؛ از تهدید شغلی تا بزرگترین فرصت تاریخ

8 آبان 1404 ساعت 21:27
انویدیا
اخبار سخت افزاراخبار هوش مصنوعی

به لطف غوغای هوش مصنوعی، انویدیا به اولین شرکت 5 تریلیون دلاری جهان تبدیل شد!

7 آبان 1404 ساعت 19:19
دانشنامه گروکی پدیا
اخبار اینترنت و شبکه

دانشنامه گروکی پدیا رسماً معرفی شد؛ رقیب هوش مصنوعی ویکی‌پدیا از سوی ایلان ماسک

6 آبان 1404 ساعت 22:53
تراشه ویلو گوگل
اخبار سخت افزارگوگل

تراشه ویلو گوگل با سرعتی 13,000 برابر بیشتر از ابرکامپیوترها جهان را شگفت‌زده کرد

3 آبان 1404 ساعت 17:23

درباره دیجی‌رو

رسانه دیجی‌رو با شعار دنیای تکنولوژی در اوایل سال 94 تاسیس شد. ماموریت ما اطلاع رسانی صحیح و ارائه آخرین اخبار تکنولوژی، بررسی محصولات دیجیتال، راهنمای خرید کالاهای دیجیتال و همچنین تهیه به‌روزترین مطالب آموزشی و مقالات در حوزه تکنولوژی، علم و سبک زندگی است. گروه دیجی‌رو همه‌ی تلاش خود را به کار خواهد گرفت که روزبه‌روز بر کیفیت و خدمات این رسانه بیفزاید تا دیجی رو به عنوان رسانه‌ای معتبر بدرخشد.

logo-samandehi
دنبال کردن
تمامی حقوق برای رسانه دیجی‌رو محفوظ است. 1403 ©
خوش آمدید

ورود به حساب کاربری

فراموش رمز عبور