به تازگی دو تن از محققان فیسبوک به نام های برایان دولهنسکی (Brian Dolhansky ) و کریستین کانتون فرر (Cristian Canton Ferrer) با ارسال یک مقاله در این شبکه اجتماعی بزرگ، خبر از پروژه هوش مصنوعی جدید خود داده اند. این دو قصد دارند اپلیکیشنی طراحی کنند که هدف آن بازکردن چشم افراد در عکسها است!
بسیاری از افراد همواره با این مشکل روبرو بوده اند که در هنگام گرفتن عکس یک لحظه پلک زدهاند و در نتیجه چشمانشان در عکس بسته افتاده است. در برخی مواقع می توان به سادکی و با گرفتن دوباره عکس این مشکل را برطرف کرد، اما اگر بعداً متوجه این موضوع شوید و یا عکسی داشته باشید که از هر لحاظ دوست داشتنی و عالی بوده و تنها مشکلش همین بسته بودن چشمها باشد چه؟ اینجاست که دو پژوهشگر مذکور به فکر افتادهاند تا با استفاده از قابلیت های هوش مصنوعی راهی برای حل مسئله پیدا کنند.
پیش از این برخی مهندسین برای برطرف کردن مشکل بسته بودن چشم ها در عکس به سراغ استفاده از ابزارهای ویرایش تصویر رفته اند که نتایج قابل قبولی نداشته است. اما تعدادی دیگر از محققان سعی کرده اند تا از قابلیت های هوش مصنوعی برای این کار استفاده کنند اما مشکلی که در این بین وجود دارد این است که در این رویکرد نیز به تعداد زیادی تصویر به عنوان دیتابیس جهت تأمین داده های اولیه یادگیری ماشین، نیاز است تا بتوان چشم فرد را به صورت واقعی و باورپذیر در تصویر اضافه کرد. تا به امروز هیچ یک از این دو روش نتوانسته نتیجه خوبی داشته باشد و دولهنسکی و فرر امیدوارند با کمک دیگر عکس هایی که شخص مورد نظر در فیسبوک ارسال کرده و استفاده از این تصاویر به عنوان مواد خام مورد نیاز برای یادگیری ماشین، بتوانند نتیجه کار را به شکل قابل توجهی بهبود دهند.
این فناوری جدید Eye in-painting with Exemplar Generative Adversarial Networks یا به اختصار ExGans نام دارد. عبارت Eye in-painting به این نکته اشاره دارد که در این روش از طراحی یک بخش اضافه بر روی تصویر برای اعمال افکت مورد نظر استفاده می شود و GANs هم به نوع خاصی از شبکه عصبی یادگیری عمیق اطلاق می شود. اپلیکیشینی که دولهنسکی و فرر مشغول کار بر روی آن هستند، از چندین بخش مختلف برای رسیدن به هدف برخوردار می باشد. ابتدا این اپلیکیشن به دنبال دیگر عکس هایی که شخص مورد نظر در آن ها حضور دارد، می گردد و اطمینان حاصل می کند که این تصاویر قابل استفاده هستند. سپس چشمها را بر اساس این تصاویر ترسیم کرده و با مطابقت دادن نورپردازی و رنگ و دیگر فاکتورهای آن با عکس، اقدام به اضافه کردن آن می کند. این اپلیکیشن حتی پس از اینکه عکس را تصحیح کرده و چشمها را باز کرد، دوباره آن را مورد بررسی قرار می دهد تا از کیفیت کار خود اطمینان حاصل کند! این طور که دولهنسکی و فرر می گویند، با این رویکرد جدید مشکلات قبلی در رابطه با حالت نامناسب چشمها یا عدم همخوانی چشمها با دیگر بخش های صورت، برطرف می شود.
این دو محقق گزارش دادهاند که تا کنون به موفقیت های زیادی در این پروژه دست پیدا کرده اند و اغلب عکس هایی که با این روش تصحیح کرده اند بسیار بهتر از نتایج به دست آمده توسط دیگر روش ها بوده است. البته هنوز هم برخی مشکلات در این راه وجود داردکه از جمله آن ها می توان به این موارد اشاره کرد: نتایج ضعیف در عکس هایی که کیفیت بالایی ندارد، عکس هایی که زاویه دید شخص در آن ها مناسب نیست و یا برخی موانع مانند موها جلوی چشم را تاحدودی گرفته اند.
اسم برنامش چیا
ها؟