گوگل به کامپیوترها نقاشی کردن یاد می‌دهد!

گوگل در حال حاضر در حال کار بر روی تعدادی پروژه تحقیقاتی جهت هوشمند‌تر کردن هر چه بیشتر رایانه‌ها و افزایش کارایی فنی آن‌ها است. یکی از این پروژه‌های جالب نیز در مورد آموزش نقاشی به ماشین‌ها می‌باشد!

در تاریخ 11 آوریل (22 فروردین)، محققان گوگل یک با انتشار یک مقاله فنی، اقدام به توصیف طرحی با عنوان “sketch-rnn” نمودند. این طرح در واقع یک شبکه عصبی است که با استفاده از هزاران تصویر خام کشیده شده توسط انسان‌ها، می‌تواند خود اقدام به ایجاد نقاشی‌هایی ساده نماید.

یکی از اهداف این مقاله، نشان دادن این موضوع است که می‌توان به ماشین‌ها نقاشی آموزش داد تا بتوانند طرح‌هایی مشخص مانند طرح یک خانه، یک درخت یا یک سگ، را به شیوه‌ای مشابه با انسان ایجاد نمایند.

دو تن از نویسندگان مقاله مذکور به نام‌های دیوید ها (David Ha) و داگلاس اک (Douglas Eck)، که از جمله محققان گروه تحقیقات یادگیری گوگل یعنی Google Brain می‌باشند، در مورد این طرح چنین گفته‌اند:

به عنوان یک انسان، ما نمی‌توانیم دنیا را به عنوان شبکه‌ای از پیکسل‌ها درک کنیم، اما در عوض می‌توانیم اقدام به توسعه مفاهیمی انتزاعی نماییم تا نمایان‌گر آنچه که مشاهده می‌کنیم، باشند.

مردم از توانایی بصری لازم برای ترسیم آنچه که می‌ببینید، با استفاده از یک سری خطوط و حرکات قلم، برخوردار هستند. به عنوان مثال، یک کودک همواره تمایل دارد تا یک خانه را با کشیدن یک مثلث در بالای یک مربع و با اضافه کردن در و پنجره به آن، به تصویر بکشد.

ابزار autodraw گوگل

در حالی که چنین نقاشی ساده‌ای ممکن است واقعیت را دقیقاً مانند یک عکس نمایش ندهد، اما می‌تواند در برقراری ارتباط با یک فرد دیگر کاملاً مفید و مؤثر باشد. ها و اک معتقدند: “چیزهایی مانند مرد، زن، چشم، صورت، گربه، سگ، و غیره می‌توانند به وضوح با نقاشی‌های ساده‌ای نشان داده شوند“. به گفته آن‌ها، به طرزی مشابه، به آسانی می‌توان از یک سری خطوط و حرکات قلم برای انتقال احساسات افراد استفاده کرد.

هدف ارائه کنندگان طرح مذکور این است که ببینید آیا رایانه‌ها نیز می‌توانند چنین روشی را برای انتقال مفاهیم با استفاده از خطوطی ساده، بیاموزند. برخی از کاربردهای بالقوه این طرح می‌تواند شامل مواردی همچون تولید ابزاری برای کمک به هنرمندان باشد که راه‌های متعدد به پایان رساندن یک طرح را پیشنهاد دهد و یا ابزاری که بتواند به طراحان الگو کمک کند تا طرح‌هایی مشابه اما منحصر به فرد را برای استفاده در کاغذ دیواری، منسوجات و غیره، خلق نمایند. بنا به گفته پژوهشگران این طرح، این فناوری می‌تواند برای اهداف آموزشی، از جمله برای آموزش طراحی به افراد و یا تقویت توانایی طراحی آن‌ها نیز مورد استفاده قرار گیرد.

گوگل به منظور آموزش شبکه عصبی خود، از مجموعه‌ای از طرح‌های کشیده شده توسط کاربران شرکت کننده در طرح Quick Draw A.I. Experiment استفاده نموده است. به همین منظور سایتی با عنوان Quick Draw راه‌اندازی شده و از کاربران خواسته شده بود تا اشیائی خاص، مانند یک دست، یک خرچنگ یا با چنگک را در کمتر از 20 ثانیه طراحی کنند و در همین حین، شبکه عصبی نیز سعی می‌کرد تا آنچه را که کاربر قصد انجامش را دارد، حدس بزند.

پس از آن کاربران به انتخاب خود می‌توانستند طرح خود را به گوگل ارسال نموده و آن را به مجموعه بزرگ داده‌های این شرکت اضافه نمایند تا برای آموزش شبکه مذکور مورد استفاده قرار بگیرد.

شبکه عصبی‌ای که گوگل در مقاله فنی خود توصیف کرده، شامل 75 طبقه‌بندی مختلف برای تصاویر است که هر یک حاوی حدود 70،000 نمونه از طرح‌های ارائه شده توسط کاربران از طریق Quick Draw، هستند.

با توجه به گفته‌های ها و اک، مدلی که گوگل در مقاله خود شرح داده، به تنهایی قادر به بازسازی طرح‌های ارائه شده توسط انسان‌ها می‌باشد. حتی زمانی که یک طرح به صورت عمدی اشتباه طراحی شود، مانند یک گربه با سه چشم، مدل مذکور قادر به تشخیص اشتباه و تولید یک تصویر صحیح از گربه‌ای با دو چشم، خواهد بود.

بعضی از کارهایی که گوگل در این زمینه انجام داده، در حال حاضر به نتایجی نیز رسیده‌اند. یکی از این نمونه کارها یک ابزار مبتنی بر وب است که گوگل این هفته آن را با نام AutoDraw در دسترس قرار داد. این ابزار رایگان با استفاده از یادگیری ماشین قادر است تا طرح ساده‌ای را که کاربر در گوشی، تبلت و یا رایانه خود می‌کشد، تشخیص داده و سپس به طور خودکار آن را کامل کرده و یا پیشنهاداتی برای تکمیل آن ارائه نماید.