گوگل، غول دنیای فناوری، اخیراً قابلیتهای هوش مصنوعی جدیدی را به جمینی لایو (Gemini Live) اضافه کرده است که به آن اجازه میدهد تا صفحه نمایش شما یا تصاویر گرفته شده توسط دوربین گوشی هوشمندتان را “ببیند” و به سوالات مربوط به آنها به صورت لحظهای پاسخ دهد. الکس جوزف (Alex Joseph)، سخنگوی گوگل، در ایمیلی به وبسایت The Verge این موضوع را تأیید کرده است. این قابلیتها تقریباً یک سال پس از اولین نمایش پروژه آسترا (Project Astra) توسط گوگل، که نیروی محرکه این قابلیتها است، عرضه میشوند. با دیجی رو همراه باشید.
یکی از کاربران ردیت (Reddit) گزارش داده است که این قابلیت بر روی گوشی شیائومی او ظاهر شده است، همانطور که وبسایت 9to5Google نیز به آن اشاره کرده است. همین کاربر، ویدیویی را منتشر کرده است که توانایی جدید جمینی در خواندن صفحه نمایش را به نمایش میگذارد. این یکی از دو قابلیتی است که گوگل در اوایل ماه مارس اعلام کرد که “به عنوان بخشی از طرح گوگل وان ایآی پریمیوم (Google One AI Premium) در اواخر ماه جاری برای مشترکین Gemini Advanced عرضه خواهد شد.”
قابلیت دیگر آسترا که در حال حاضر در حال عرضه است، “ویدیوی زنده” است. این قابلیت به جمینی اجازه میدهد تا آنچه را که در قاب دوربین گوشی هوشمند شما دیده میشود، به صورت لحظهای تفسیر کرده و به سوالات مربوط به آن پاسخ دهد. در ویدیوی نمایشی که گوگل در این ماه منتشر کرد، فردی از این قابلیت برای کمک به انتخاب رنگ نقاشی برای سفالهای تازه لعابخورده خود استفاده میکند. این قابلیت به کاربر اجازه میدهد تا با استفاده از دوربین گوشی، رنگهای مختلف را در محیط اطراف خود بررسی کرده و به جمینی بگوید که رنگی مشابه با فلان شیء را پیدا کند یا رنگی که با فلان رنگ همخوانی دارد را پیشنهاد دهد.
عرضه این قابلیتها توسط گوگل، نمونهای تازه از پیشتازی این شرکت در زمینه دستیارهای هوش مصنوعی است، در حالی که آمازون در حال آمادهسازی عرضه محدود و دسترسی اولیه به نسخه ارتقاء یافته الکسا با نام الکسا پلاس (Alexa Plus) خود است و اپل نیز عرضه سیری (Siri) ارتقاء یافته خود را به تعویق انداخته است. هر دوی این شرکتها قرار است قابلیتهایی مشابه قابلیتهایی که آسترا در حال حاضر در حال فعالسازی آنها است، ارائه دهند. در همین حال، سامسونگ همچنان بیکسبی (Bixby) را دارد، اما جمینی به عنوان دستیار پیشفرض در گوشیهای این شرکت جایگزین بیکسبی شده است.
این قابلیتهای جدید، نشان دهنده پیشرفت قابل توجه در تعامل انسان با هوش مصنوعی هستند. جمینی اکنون قادر است تا نه تنها به سوالات متنی پاسخ دهد، بلکه با “دیدن” دنیای اطراف کاربر از طریق دوربین گوشی یا صفحه نمایش، اطلاعات را درک کرده و به سوالات بصری نیز پاسخ دهد. این امر، امکانات جدیدی را در زمینههای مختلف، از جمله آموزش، کارهای روزمره و حتی انجام فعالیتهای خلاقانه، فراهم میکند.
به عنوان مثال، فرض کنید شما در حال تماشای یک ویدیوی آموزشی در مورد دستور پخت یک غذا هستید. میتوانید از جمینی بخواهید تا مواد لازم را شناسایی کند یا مراحل انجام کار را به شما توضیح دهد. یا اگر در حال خرید مبلمان هستید، میتوانید از جمینی بخواهید تا رنگهای مختلف را با دکوراسیون منزل شما مقایسه کرده و بهترین گزینه را پیشنهاد دهد. این قابلیتها، همچنین میتوانند به افراد دارای معلولیت کمک کنند. به عنوان مثال، فردی با اختلال بینایی میتواند از جمینی برای توصیف محیط اطراف خود یا خواندن متن روی یک تابلو استفاده کند. این قابلیتها، میتوانند زندگی روزمره را برای افراد دارای معلولیت آسانتر و مستقلتر کنند.
گوگل با پیشبرد پروژه آسترا، نشان میدهد که به دنبال ایجاد یک دستیار هوش مصنوعی است که نه تنها هوشمند، بلکه بصری و قابل اعتماد نیز باشد. این شرکت در تلاش است تا جمینی را به یک همراه هوشمند تبدیل نماید که بتواند در هر زمان و هر مکان، به کاربران کمک کند. قابلیتهای جدید معرفی شده در قالب پروژه آسترا، همچنین نشان دهنده رقابت شدید بین شرکتهای بزرگ فناوری در زمینه هوش مصنوعی است. گوگل، آمازون و اپل، همگی در تلاش هستند تا بهترین دستیار هوش مصنوعی را به کاربران خود ارائه دهند. این رقابت، میتواند منجر به نوآوریهای بیشتر و بهبود کیفیت خدمات هوش مصنوعی شود.
با این حال، عرضه چنین قابلیتهای پیشرفتهای، ابهاماتی را نیز در مورد حریم خصوصی و امنیت دادهها مطرح میکند. گوگل باید اطمینان حاصل کند که اطلاعات کاربران به طور ایمن ذخیره و پردازش میشوند و از آنها در برابر سوء استفاده محافظت میشود.
در نهایت، عرضه قابلیتهای جدید جمینی لایو، گامی مهم در جهت ایجاد یک دستیار هوش مصنوعی قدرتمند و کاربردی است. این قابلیتها، میتوانند زندگی روزمره را برای کاربران آسانتر و لذتبخشتر کرده و امکانات جدیدی را در زمینههای مختلف فراهم کنند.