گوگل به تازگی از یکی از جدیدترین دستاوردهای خود در حوزه هوش مصنوعی رونمایی کرده است. این مدل جدید، که با نام “Veo” معرفی شده، یک ابزار پیشرفته برای تولید محتوای ویدیویی است. Veo قادر است با استفاده از ورودیهای متنی کاربران، ویدیوهایی با کیفیت بسیار بالا تولید کند. این مدل هوش مصنوعی به طور خاص طراحی شده تا بتواند نیازهای مختلف کاربران، به ویژه کسب و کارها، را برآورده سازد.
این ابزار پیشرفته به عنوان بخشی از خدمات Google Cloud ارائه میشود و کسب و کارها میتوانند از طریق پلتفرم Vertex AI به آن دسترسی داشته باشند. Veo با ویژگیهای منحصر به فرد خود، به عنوان یکی از نوآوریهای کلیدی گوگل در زمینه تولید محتوای دیجیتال شناخته میشود. در ادامه این مطلب از دیجی رو، به بررسی کامل ویژگیها، کاربردها و امکانات این مدل هوش مصنوعی خواهیم پرداخت. با ما همراه باشید.
معرفی Veo: از متن تا ویدیو
Veo به عنوان جدیدترین مدل هوش مصنوعی معرفی شده توسط شرکت گوگل، توانایی تولید ویدیوهایی با کیفیت بالا، تا رزولوشن 1080p، را دارد. این مدل پیشرفته قادر است ویدیوهایی را که توسط کاربران درخواست داده میشود، بر اساس ورودیهای متنی یا تصویری آنها تولید کند. نکته قابل توجه این است که این ویدیوها میتوانند در سبکهای مختلف بصری و حتی سینمایی طراحی و ارائه شوند، که این امر کاربرد این ابزار را برای پروژههای متنوع بسیار گسترده کرده است.
گوگل اخیراً این مدل را برای استفاده خصوصی در اختیار کاربران سرویس Vertex AI، که بخشی از پلتفرم Google Cloud محسوب میشود، قرار داده است. به این معنا که افرادی که از این سرویس پیشرفته استفاده میکنند، اکنون میتوانند با وارد کردن متن یا تصویر به عنوان ورودی، ویدیوهای باکیفیت بالا ایجاد کنند.
به گفته گوگل، Veo اولین مدل هوش مصنوعی از نوع خود است که توسط یک ارائه دهنده خدمات ابری در مقیاس بزرگ عرضه شده است. این قابلیت نوآورانه، که تولید ویدیو بر پایه تصاویر را امکانپذیر میکند، یک جهش قابل توجه در صنعت تولید محتوای دیجیتال به حساب میآید.
مسائل امنیتی و جلوگیری از مشکلات حق نشر
مدلهای هوش مصنوعی در سالهای اخیر با چالشهای جدی در زمینههایی همچون مسائل امنیتی، شفافیت دادهها و همچنین نقض حقوق مالکیت معنوی مواجه بودهاند. این مشکلات باعث شدهاند که شرکتهای پیشرو در حوزه فناوری تلاش کنند تا ابزارها و راهکارهایی برای جلوگیری از این چالشها ایجاد کنند. گوگل نیز در این راستا گامی مهم برداشته و از فناوری پیشرفتهای به نام SynthID استفاده کرده است. این فناوری که توسط شرکت DeepMind توسعه داده شده، اکنون در دو مدل هوش مصنوعی Veo و نسخه بهروز شده Imagen 3 مورد استفاده قرار گرفته است.
اما فناوری SynthID دقیقاً چه کاری انجام میدهد؟ این تکنولوژی نوین نوعی واترمارک دیجیتال تقریباً نامرئی ایجاد میکند که به صورت مستقیم بر روی محتوای تولید شده توسط مدلهای هوش مصنوعی اعمال میشود. این واترمارک، بدون ایجاد تغییر قابل مشاهده در کیفیت یا ظاهر محتوا، به شناسایی و تأیید صحت محتوای دیجیتال کمک میکند. به علاوه، استفاده از این واترمارک نگرانیهای مرتبط با اطلاعات گمراه کننده و انتساب اشتباه محتوا را به حداقل میرساند.
نکته جالب توجه این است که این فناوری از لحاظ مفهومی مشابه با سیستم “Content Credentials” شرکت ادوبی است. ادوبی نیز از این فناوری برای اعمال واترمارک بر روی محتواهای تولید شده توسط ابزارهای هوش مصنوعی خود استفاده میکند. اکنون گوگل با استفاده از SynthID، راهکاری مشابه اما پیشرفتهتر را در مدلهای Veo و Imagen 3 پیادهسازی کرده است. این اقدام، یک گام مؤثر برای افزایش شفافیت و ایمنی در حوزه تولید محتوای دیجیتال به شمار میرود.
دیگر بهروزرسانیهای گوگل
علاوه بر مدل Veo، گوگل نسخه جدید Imagen 3، که یک مدل پیشرفته برای تولید تصویر از متن میباشد، را نیز معرفی کرده است. این ابزار قدرتمند به زودی برای تمامی کاربران سرویس Google Cloud در دسترس خواهد بود. کاربران میتوانند از هفته آینده، از طریق پلتفرم Vertex AI به این ابزار دسترسی پیدا کنند و از قابلیتهای پیشرفته آن برای تولید تصاویر باکیفیت بهرهمند شوند.
این ابزار پیشرفته در ماه اوت سال جاری برای اولینبار به صورت آزمایشی در ایالات متحده عرضه شد. هدف از این عرضه اولیه، بررسی عملکرد مدل و دریافت بازخورد از کاربران بود. اکنون گوگل قصد دارد این سرویس را به طور گستردهتری در سطح جهانی ارائه دهد تا کاربران بیشتری بتوانند از امکانات متنوع آن استفاده کنند.
اگر در لیست کاربران مجاز گوگل قرار داشته باشید، دسترسی به قابلیتهای ویژهای برای شما فراهم خواهد شد. از جمله این قابلیتها میتوان به ویرایش پیشرفته تصاویر بر اساس ورودیهای متنی اشاره کرد. همچنین، کاربران میتوانند با استفاده از این ابزار، سبک و ظاهر تصاویر تولید شده را به دلخواه خود تغییر دهند. این تنظیمات شامل شخصیسازی کامل برند، موضوع، لوگو، و حتی ویژگیهای محصول در تصاویر و ویدیوهای تولید شده است. گوگل با ارائه این امکانات، نشان داده که به دنبال ایجاد تجربهای بینقص و انعطافپذیر برای کاربران حرفهای و کسب و کارها میباشد.
نتیجهگیری
مدل هوش مصنوعی Veo، با توانایی تولید ویدیوهای باکیفیت از متن و تصویر، یک گام مهم در رقابت گوگل با شرکتهایی همچون OpenAI محسوب میشود. ویژگیهایی نظیر فناوریهای امنیتی SynthID و امکان شخصیسازی محتوا، این مدل را به ابزاری جذاب برای کسب و کارها تبدیل کرده است.
با معرفی Veo و بهروزرسانیهای دیگر همچون Imagen 3، گوگل نشان داده است که در حوزه هوش مصنوعی مولد برنامههای بلند مدتی داشته و در تلاش است تا به یکی از پیشروان این حوزه تبدیل شود.