ما به عنوان انسان وقتی در جمعهای شلوغ و پر سر و صدا هستیم بهسختی میتوانیم صدای افراد را از یکدیگر تشخیص و تمایز بدهیم. حال تصور کنید که این کار برای دستگاهها چقدر میتواند دشوار باشد.
اما به نظر میرسد که وقتی حرف از تشخیص صدا میشود، انسانها در حال از دست دادن برتریشان بر دستگاهها هستند. گوگل در این زمینه تکنولوژی جدیدی خلق کرده که به هوش مصنوعیاش کمک میکند تا وقتی چند نفر به طور همزمان در حال گفتوگو با یکدیگر هستند صدایشان را از هم تفکیک کند.
هوش مصنوعی سیستم تشخیص صدای گوگل چطور کار میکند؟
این سیستم بر مبنای مدل تفکیک صوتی-تصویری کار میکند که یعنی میتواند صدای افراد را با تحت نظر قرار دادن چهرهشان هنگام صحبت، شناسایی کند. شبکهی عصبی آن طوری تعلیم داده شده که در یک مهمانی ساختگی که توسط محققین ایجاد شده بود، صدای افراد گوناگون را از همدیگر جدا و تفکیکسازی کند. حتی برای آموزش بیشتر این هوش مصنوعی، صداهای پس زمینه به این محیطهای آموزشی مجازی اضافه شده بود.
نتایج این آزمایش حیرتانگیز بود، چراکه این سیستم نه تنها توانست بهطور کامل صدای پس زمینه را جدا کند بلکه توانست صدای دو نفری که همزمان با هم گفتوگو میکردند را نیز از هم متمایز سازد.
با این حال شاید این تکنولوژی جدید گوگل مشکلات امنیتی را هم به همراه داشته باشد چراکه ممکن است برای جاسوسی در مکانهای مختلف و توسط افراد سودجو مورد استفاده قرار بگیرد. هر چند که برای این کار به تلاشهای بیشتری احتیاج است ولی آن روز خیلی هم دور نیست.