گوگل در حال حاضر در حال کار بر روی تعدادی پروژه تحقیقاتی جهت هوشمندتر کردن هر چه بیشتر رایانهها و افزایش کارایی فنی آنها است. یکی از این پروژههای جالب نیز در مورد آموزش نقاشی به ماشینها میباشد!
در تاریخ 11 آوریل (22 فروردین)، محققان گوگل یک با انتشار یک مقاله فنی، اقدام به توصیف طرحی با عنوان “sketch-rnn” نمودند. این طرح در واقع یک شبکه عصبی است که با استفاده از هزاران تصویر خام کشیده شده توسط انسانها، میتواند خود اقدام به ایجاد نقاشیهایی ساده نماید.
یکی از اهداف این مقاله، نشان دادن این موضوع است که میتوان به ماشینها نقاشی آموزش داد تا بتوانند طرحهایی مشخص مانند طرح یک خانه، یک درخت یا یک سگ، را به شیوهای مشابه با انسان ایجاد نمایند.
دو تن از نویسندگان مقاله مذکور به نامهای دیوید ها (David Ha) و داگلاس اک (Douglas Eck)، که از جمله محققان گروه تحقیقات یادگیری گوگل یعنی Google Brain میباشند، در مورد این طرح چنین گفتهاند:
به عنوان یک انسان، ما نمیتوانیم دنیا را به عنوان شبکهای از پیکسلها درک کنیم، اما در عوض میتوانیم اقدام به توسعه مفاهیمی انتزاعی نماییم تا نمایانگر آنچه که مشاهده میکنیم، باشند.
مردم از توانایی بصری لازم برای ترسیم آنچه که میببینید، با استفاده از یک سری خطوط و حرکات قلم، برخوردار هستند. به عنوان مثال، یک کودک همواره تمایل دارد تا یک خانه را با کشیدن یک مثلث در بالای یک مربع و با اضافه کردن در و پنجره به آن، به تصویر بکشد.
در حالی که چنین نقاشی سادهای ممکن است واقعیت را دقیقاً مانند یک عکس نمایش ندهد، اما میتواند در برقراری ارتباط با یک فرد دیگر کاملاً مفید و مؤثر باشد. ها و اک معتقدند: “چیزهایی مانند مرد، زن، چشم، صورت، گربه، سگ، و غیره میتوانند به وضوح با نقاشیهای سادهای نشان داده شوند“. به گفته آنها، به طرزی مشابه، به آسانی میتوان از یک سری خطوط و حرکات قلم برای انتقال احساسات افراد استفاده کرد.
هدف ارائه کنندگان طرح مذکور این است که ببینید آیا رایانهها نیز میتوانند چنین روشی را برای انتقال مفاهیم با استفاده از خطوطی ساده، بیاموزند. برخی از کاربردهای بالقوه این طرح میتواند شامل مواردی همچون تولید ابزاری برای کمک به هنرمندان باشد که راههای متعدد به پایان رساندن یک طرح را پیشنهاد دهد و یا ابزاری که بتواند به طراحان الگو کمک کند تا طرحهایی مشابه اما منحصر به فرد را برای استفاده در کاغذ دیواری، منسوجات و غیره، خلق نمایند. بنا به گفته پژوهشگران این طرح، این فناوری میتواند برای اهداف آموزشی، از جمله برای آموزش طراحی به افراد و یا تقویت توانایی طراحی آنها نیز مورد استفاده قرار گیرد.
گوگل به منظور آموزش شبکه عصبی خود، از مجموعهای از طرحهای کشیده شده توسط کاربران شرکت کننده در طرح Quick Draw A.I. Experiment استفاده نموده است. به همین منظور سایتی با عنوان Quick Draw راهاندازی شده و از کاربران خواسته شده بود تا اشیائی خاص، مانند یک دست، یک خرچنگ یا با چنگک را در کمتر از 20 ثانیه طراحی کنند و در همین حین، شبکه عصبی نیز سعی میکرد تا آنچه را که کاربر قصد انجامش را دارد، حدس بزند.
پس از آن کاربران به انتخاب خود میتوانستند طرح خود را به گوگل ارسال نموده و آن را به مجموعه بزرگ دادههای این شرکت اضافه نمایند تا برای آموزش شبکه مذکور مورد استفاده قرار بگیرد.
شبکه عصبیای که گوگل در مقاله فنی خود توصیف کرده، شامل 75 طبقهبندی مختلف برای تصاویر است که هر یک حاوی حدود 70،000 نمونه از طرحهای ارائه شده توسط کاربران از طریق Quick Draw، هستند.
با توجه به گفتههای ها و اک، مدلی که گوگل در مقاله خود شرح داده، به تنهایی قادر به بازسازی طرحهای ارائه شده توسط انسانها میباشد. حتی زمانی که یک طرح به صورت عمدی اشتباه طراحی شود، مانند یک گربه با سه چشم، مدل مذکور قادر به تشخیص اشتباه و تولید یک تصویر صحیح از گربهای با دو چشم، خواهد بود.
بعضی از کارهایی که گوگل در این زمینه انجام داده، در حال حاضر به نتایجی نیز رسیدهاند. یکی از این نمونه کارها یک ابزار مبتنی بر وب است که گوگل این هفته آن را با نام AutoDraw در دسترس قرار داد. این ابزار رایگان با استفاده از یادگیری ماشین قادر است تا طرح سادهای را که کاربر در گوشی، تبلت و یا رایانه خود میکشد، تشخیص داده و سپس به طور خودکار آن را کامل کرده و یا پیشنهاداتی برای تکمیل آن ارائه نماید.