گوگل مدل هوش مصنوعی Veo را برای رقابت با Sora از شرکت OpenAI معرفی کرد

گوگل به تازگی از یکی از جدیدترین دستاوردهای خود در حوزه هوش مصنوعی رونمایی کرده است. این مدل جدید، که با نام “Veo” معرفی شده، یک ابزار پیشرفته برای تولید محتوای ویدیویی است. Veo قادر است با استفاده از ورودی‌های متنی کاربران، ویدیوهایی با کیفیت بسیار بالا تولید کند. این مدل هوش مصنوعی به طور خاص طراحی شده تا بتواند نیازهای مختلف کاربران، به ویژه کسب و کارها، را برآورده سازد.

این ابزار پیشرفته به عنوان بخشی از خدمات Google Cloud ارائه می‌شود و کسب و کارها می‌توانند از طریق پلتفرم Vertex AI به آن دسترسی داشته باشند. Veo با ویژگی‌های منحصر به فرد خود، به عنوان یکی از نوآوری‌های کلیدی گوگل در زمینه تولید محتوای دیجیتال شناخته می‌شود. در ادامه این مطلب از دیجی رو، به بررسی کامل ویژگی‌ها، کاربردها و امکانات این مدل هوش مصنوعی خواهیم پرداخت. با ما همراه باشید.

معرفی Veo: از متن تا ویدیو

Veo به عنوان جدیدترین مدل هوش مصنوعی معرفی شده توسط شرکت گوگل، توانایی تولید ویدیوهایی با کیفیت بالا، تا رزولوشن 1080p، را دارد. این مدل پیشرفته قادر است ویدیوهایی را که توسط کاربران درخواست داده می‌شود، بر اساس ورودی‌های متنی یا تصویری آن‌ها تولید کند. نکته قابل توجه این است که این ویدیوها می‌توانند در سبک‌های مختلف بصری و حتی سینمایی طراحی و ارائه شوند، که این امر کاربرد این ابزار را برای پروژه‌های متنوع بسیار گسترده کرده است.

گوگل اخیراً این مدل را برای استفاده خصوصی در اختیار کاربران سرویس Vertex AI، که بخشی از پلتفرم Google Cloud محسوب می‌شود، قرار داده است. به این معنا که افرادی که از این سرویس پیشرفته استفاده می‌کنند، اکنون می‌توانند با وارد کردن متن یا تصویر به عنوان ورودی، ویدیوهای باکیفیت بالا ایجاد کنند.

به گفته گوگل، Veo اولین مدل هوش مصنوعی از نوع خود است که توسط یک ارائه دهنده خدمات ابری در مقیاس بزرگ عرضه شده است. این قابلیت نوآورانه، که تولید ویدیو بر پایه تصاویر را امکان‌پذیر می‌کند، یک جهش قابل توجه در صنعت تولید محتوای دیجیتال به حساب می‌آید.

مسائل امنیتی و جلوگیری از مشکلات حق نشر

مدل‌های هوش مصنوعی در سال‌های اخیر با چالش‌های جدی در زمینه‌هایی همچون مسائل امنیتی، شفافیت داده‌ها و همچنین نقض حقوق مالکیت معنوی مواجه بوده‌اند. این مشکلات باعث شده‌اند که شرکت‌های پیشرو در حوزه فناوری تلاش کنند تا ابزارها و راهکارهایی برای جلوگیری از این چالش‌ها ایجاد کنند. گوگل نیز در این راستا گامی مهم برداشته و از فناوری پیشرفته‌ای به نام SynthID استفاده کرده است. این فناوری که توسط شرکت DeepMind توسعه داده شده، اکنون در دو مدل هوش مصنوعی Veo و نسخه به‌روز شده Imagen 3 مورد استفاده قرار گرفته است.

اما فناوری SynthID دقیقاً چه کاری انجام می‌دهد؟ این تکنولوژی نوین نوعی واترمارک دیجیتال تقریباً نامرئی ایجاد می‌کند که به صورت مستقیم بر روی محتوای تولید شده توسط مدل‌های هوش مصنوعی اعمال می‌شود. این واترمارک، بدون ایجاد تغییر قابل مشاهده در کیفیت یا ظاهر محتوا، به شناسایی و تأیید صحت محتوای دیجیتال کمک می‌کند. به علاوه، استفاده از این واترمارک نگرانی‌های مرتبط با اطلاعات گمراه کننده و انتساب اشتباه محتوا را به حداقل می‌رساند.

نکته جالب توجه این است که این فناوری از لحاظ مفهومی مشابه با سیستم “Content Credentials” شرکت ادوبی است. ادوبی نیز از این فناوری برای اعمال واترمارک بر روی محتواهای تولید شده توسط ابزارهای هوش مصنوعی خود استفاده می‌کند. اکنون گوگل با استفاده از SynthID، راهکاری مشابه اما پیشرفته‌تر را در مدل‌های Veo و Imagen 3 پیاده‌سازی کرده است. این اقدام، یک گام مؤثر برای افزایش شفافیت و ایمنی در حوزه تولید محتوای دیجیتال به شمار می‌رود.

دیگر به‌روزرسانی‌های گوگل

علاوه بر مدل Veo، گوگل نسخه جدید Imagen 3، که یک مدل پیشرفته برای تولید تصویر از متن می‌باشد، را نیز معرفی کرده است. این ابزار قدرتمند به زودی برای تمامی کاربران سرویس Google Cloud در دسترس خواهد بود. کاربران می‌توانند از هفته آینده، از طریق پلتفرم Vertex AI به این ابزار دسترسی پیدا کنند و از قابلیت‌های پیشرفته آن برای تولید تصاویر باکیفیت بهره‌مند شوند.

این ابزار پیشرفته در ماه اوت سال جاری برای اولین‌بار به صورت آزمایشی در ایالات متحده عرضه شد. هدف از این عرضه اولیه، بررسی عملکرد مدل و دریافت بازخورد از کاربران بود. اکنون گوگل قصد دارد این سرویس را به طور گسترده‌تری در سطح جهانی ارائه دهد تا کاربران بیشتری بتوانند از امکانات متنوع آن استفاده کنند.

اگر در لیست کاربران مجاز گوگل قرار داشته باشید، دسترسی به قابلیت‌های ویژه‌ای برای شما فراهم خواهد شد. از جمله این قابلیت‌ها می‌توان به ویرایش پیشرفته تصاویر بر اساس ورودی‌های متنی اشاره کرد. همچنین، کاربران می‌توانند با استفاده از این ابزار، سبک و ظاهر تصاویر تولید شده را به دلخواه خود تغییر دهند. این تنظیمات شامل شخصی‌سازی کامل برند، موضوع، لوگو، و حتی ویژگی‌های محصول در تصاویر و ویدیوهای تولید شده است. گوگل با ارائه این امکانات، نشان داده که به دنبال ایجاد تجربه‌ای بی‌نقص و انعطاف‌پذیر برای کاربران حرفه‌ای و کسب و کارها می‌باشد.

نتیجه‌گیری

مدل هوش مصنوعی Veo، با توانایی تولید ویدیوهای باکیفیت از متن و تصویر، یک گام مهم در رقابت گوگل با شرکت‌هایی همچون OpenAI محسوب می‌شود. ویژگی‌هایی نظیر فناوری‌های امنیتی SynthID و امکان شخصی‌سازی محتوا، این مدل را به ابزاری جذاب برای کسب و کارها تبدیل کرده است.

با معرفی Veo و به‌روزرسانی‌های دیگر همچون Imagen 3، گوگل نشان داده است که در حوزه هوش مصنوعی مولد برنامه‌های بلند مدتی داشته و در تلاش است تا به یکی از پیشروان این حوزه تبدیل شود.