دیجی رودیجی رو
  • اخبار تکنولوژی
    • اخبار داخلی
    • اخبار تلفن همراه
    • اخبار سخت افزار
    • اخبار اپلیکیشن‌ها
  • آموزش
  • بررسی محصولات
  • راهنمای خرید
  • سرگرمی
    • اخبار بازی
    • معرفی بازی
      • بازی موبایل
      • بازی دسکتاپ
      • بازی کنسول
    • معرفی اپلیکیشن
    • سینما و تلویزیون
  • دیجی فکت
  • دیجی لایف
  • دیجی10
  • مقالات گوناگون
خواندن: مدل Gemini 2.5 Computer Use گوگل؛ انقلابی در تعامل هوش مصنوعی با وب و رابط کاربری
به اشتراک بگذارید
ورود
اعلان نمایش بیشتر
تغییر اندازه فونتآآ
دیجی رودیجی رو
تغییر اندازه فونتآآ
جستجو
حساب کاربری دارید؟ ورود
دنبال کردن
تمامی حقوق برای رسانه دیجی‌رو محفوظ است. 1403 ©
دیجی رو > اخبار > اخبار هوش مصنوعی > مدل Gemini 2.5 Computer Use گوگل؛ انقلابی در تعامل هوش مصنوعی با وب و رابط کاربری
اخبار هوش مصنوعیگوگل

مدل Gemini 2.5 Computer Use گوگل؛ انقلابی در تعامل هوش مصنوعی با وب و رابط کاربری

حسین محمودزاده 17 مهر 1404 ساعت 17:56
زمان مطالعه: 5 دقیقه
مدل Gemini 2.5 Computer Use گوگل
اشتراک گذاری
بلیط هواپیما سفرمارکت

گوگل اخیراً مدل جدیدی از هوش مصنوعی خود را با نام Gemini 2.5 Computer Use معرفی کرده است که توانایی تعامل با وب‌سایت‌ها و رابط‌های کاربری را مانند یک انسان دارد. این مدل که در حال حاضر در نسخه پیش‌نمایش عمومی از طریق Gemini API در Google AI Studio و Vertex AI در دسترس است، گامی بزرگ در جهت هوشمندسازی تعاملات دیجیتالی محسوب می‌شود. Gemini 2.5 Computer Use بر پایه قابلیت‌های درک بصری و استدلال مدل Gemini 2.5 Pro ساخته شده و می‌تواند اقدامات مختلفی مانند کلیک، تایپ، اسکرول، هاور کردن، باز کردن منوها و پیمایش در صفحات وب را انجام دهد. با دیجی رو همراه باشید.

لیست
برتری Gemini 2.5 Computer Use در مقایسه با رقبانمایش عملکرد مدل در عملامنیت و پیشگیری از سوء استفاده‌های احتمالیکاربردهای عملی و استفاده‌های داخلینتیجه‌گیری: آینده تعامل هوش مصنوعی با وب

برتری Gemini 2.5 Computer Use در مقایسه با رقبا

گوگل ادعا می‌کند که این مدل در بنچمارک‌های مختلف مانند Online-Mind2Web، WebVoyager و AndroidWorld عملکرد بهتری نسبت به ابزارهای مشابه دارد. علاوه بر این، Gemini 2.5 Computer Use با داشتن تاخیر کمتر، تجربه کاربری روان‌تری را ارائه می‌دهد. برخلاف مدل‌های سنتی هوش مصنوعی که به APIها وابسته هستند، این مدل از اسکرین‌شات‌های رابط کاربری برای تحلیل و تصمیم‌گیری در خصوص اقدامات بعدی خود استفاده می‌کند.

مدل Gemini 2.5 Computer Use گوگل

فرایند کار به این صورت است که مدل یک تسک (مأموریت)، یک اسکرین‌شات از محیط دیجیتال و تاریخچه اقدامات اخیر دریافت می‌کند. سپس با تحلیل رابط کاربری، اقدامی مانند کلیک روی یک دکمه یا تایپ در یک فیلد را پیشنهاد می‌دهد. این اقدام در سمت کلاینت اجرا شده و یک اسکرین‌شات جدید به مدل ارسال می‌شود تا فرایند ادامه یابد.

نمایش عملکرد مدل در عمل

گوگل با ارائه چند نمونه عملی، توانایی‌های این مدل را به نمایش گذاشته است. در یکی از دموها، یک عامل هوش مصنوعی یادداشت‌های چسبان دیجیتال را روی یک تخته سفید مرتب می‌کند. در نمونه دیگری، اطلاعات مربوط به یک حیوان خانگی از یک وب‌سایت به سیستم CRM منتقل می‌شود. این دموها با سرعت بیشتری نمایش داده می‌شوند تا فرایند را در زمان واقعی نشان دهند.

در حال حاضر، Gemini 2.5 Computer Use از 13 اقدام مختلف پشتیبانی می‌کند و بهترین عملکرد را در مرورگرهای وب دارد. گوگل اعلام کرده که این مدل هنوز برای وظایف سطح سیستم عامل دسکتاپ بهینه نشده است، اما در بنچمارک‌های موبایل پتانسیل خوبی از خود نشان داده است.

مدل Gemini 2.5 Computer Use گوگل

امنیت و پیشگیری از سوء استفاده‌های احتمالی

گوگل برای جلوگیری از سوء استفاده‌های احتمالی، اقدامات امنیتی مختلفی را پیاده‌سازی کرده است. هر اقدام پیشنهادی توسط مدل، قبل از اجرا توسط یک سرویس امنیتی بررسی می‌شود. توسعه‌دهندگان نیز می‌توانند اقدامات خاصی را محدود کنند یا برای وظایف پرخطر مانند تراکنش‌های مالی، تأیید صریح کاربر را الزامی نمایند.

کاربردهای عملی و استفاده‌های داخلی

در حال حاضر تعدادی از تیم‌های داخلی گوگل از این مدل در محیط داخلی شرکت استفاده می‌کنند. Gemini 2.5 Computer Use در وظایف مختلفی مانند تست رابط کاربری (UI) و اتوماسیون در پلتفرم‌هایی مانند Google Search و Firebase مورد استفاده قرار می‌گیرد. توسعه‌دهندگان خارجی که در برنامه دسترسی اولیه شرکت کرده‌اند، از این مدل برای ساخت ابزارهای اتوماسیون گردش کار و دستیارهای هوشمند استفاده می‌کنند.

مدل Gemini 2.5 Computer Use گوگل

توسعه‌دهندگان می‌توانند از طریق Google AI Studio یا Vertex AI به این مدل دسترسی پیدا کنند. گوگل همچنین یک محیط دموی مبتنی بر وب را نیز برای تست قابلیت‌های مدل جدید ارائه کرده است.

نتیجه‌گیری: آینده تعامل هوش مصنوعی با وب

مدل Gemini 2.5 Computer Use گوگل با قابلیت‌های مرور وب مانند انسان یک پیشرفت بزرگ در زمینه هوش مصنوعی و تعامل با رابط‌های کاربری است. این مدل با توانایی انجام اقدامات مختلف مانند کلیک، تایپ و پیمایش، می‌تواند در زمینه‌های مختلفی مانند اتوماسیون، تست رابط کاربری برنامه‌ها و دستیارهای هوشمند مورد استفاده قرار گیرد. با توجه به اقدامات امنیتی و پشتیبانی گوگل، انتظار می‌رود که این مدل در آینده نزدیک نقش مهمی در بهبود تعاملات دیجیتالی ایفا کند.

اخبار تکنولوژی
بلیط اتوبوس
تاکسی بین شهری
برچسب ها: گوگل, هوش مصنوعی
این مقاله را به اشتراک بگذارید
توییتر Whatsapp Whatsapp تلگرام ایمیل کپی کرده لینک پرینت
چه حسی به این مطلب داری؟
Sad0
Sleepy0
Love0
Happy0
Angry0
Cry0
Surprise0
مقاله قبلی چطور با انتخاب هاست پرسرعت، سرعت سایت وردپرس خود را دو برابر کنیم؟ چطور با انتخاب هاست پرسرعت، سرعت سایت وردپرس خود را دو برابر کنیم؟
نظر بدهید نظر بدهید

نظر بدهید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

لطفا یک امتیاز انتخاب کنید!

تبلیغات

موبوگیفت
  • خرید ممبر ایتا
  • خرید فالوور ایرانی
  • خرید فالوور ارزان
  • خرید ممبر تلگرام
  • پنجره دوجداره
  • کاغذ A4
  • دستگاه جوجه کشی دماوند
  • پیش بینی قیمت ارزها
  • ارز نئو رقیب قدرتمند اتریوم
  • ثروتمندان 2025 بیت کوین
  • قیمت یو اس دی کوین (USDC)
  • قوی ترین جهش ریپل
  • دوربین کوچک سیم کارت خور
  • خرید بیت کوین
  • خرید سرور hp ماهان شبکه اچ پی
  • فالوور روبیکا با کیفیت

آخرین خبرها

چطور با انتخاب هاست پرسرعت، سرعت سایت وردپرس خود را دو برابر کنیم؟

چطور با انتخاب هاست پرسرعت، سرعت سایت وردپرس خود را دو برابر کنیم؟

اهمیت بسته‌بندی و ابزارهای چاپی

اهمیت بسته‌بندی و ابزارهای چاپی در موفقیت برندها؛ از جعبه و پاکت تا لیبل

دسته دوال سنس Icon Blue

دسته دوال سنس Icon Blue رونمایی شد؛ ادای احترام سونی به آبی نمادین پلی استیشن

مطالب مرتبط

چین ابرقدرت رباتیک جهان
اخبار هوش مصنوعی

چین ابرقدرت رباتیک جهان است؛ نصب بیش از نیمی از ربات‌های صنعتی جهانی در 2025

16 مهر 1404 ساعت 19:09
تراشه های هوش مصنوعی موبایل
اخبار هوش مصنوعیاخبار تلفن همراه

عرضه تراشه های هوش مصنوعی موبایل در سال جاری 74 درصد رشد خواهد کرد

9 مهر 1404 ساعت 13:04
اپلیکیشن Veritas اپل
اخبار هوش مصنوعیاپل

آزمایش اپلیکیشن Veritas شبیه به ChatGPT توسط اپل آغاز شد

7 مهر 1404 ساعت 14:13
کروم اندروید
اخبار اپلیکیشن‌هاگوگل

کروم اندروید اکنون می‌تواند هر صفحه وب را مانند یک پادکست برایتان بخواند!

1 مهر 1404 ساعت 10:32

درباره دیجی‌رو

رسانه دیجی‌رو با شعار دنیای تکنولوژی در اوایل سال 94 تاسیس شد. ماموریت ما اطلاع رسانی صحیح و ارائه آخرین اخبار تکنولوژی، بررسی محصولات دیجیتال، راهنمای خرید کالاهای دیجیتال و همچنین تهیه به‌روزترین مطالب آموزشی و مقالات در حوزه تکنولوژی، علم و سبک زندگی است. گروه دیجی‌رو همه‌ی تلاش خود را به کار خواهد گرفت که روزبه‌روز بر کیفیت و خدمات این رسانه بیفزاید تا دیجی رو به عنوان رسانه‌ای معتبر بدرخشد.

logo-samandehi
دنبال کردن
تمامی حقوق برای رسانه دیجی‌رو محفوظ است. 1403 ©
خوش آمدید

ورود به حساب کاربری

فراموش رمز عبور