تکنولوژی جدید گوگل می‌تواند صدای افراد را در شلوغی تشخیص دهد!

30 اسفند 1399 ساعت 20:26

زمان مطالعه: 2 دقیقه

ما به عنوان انسان وقتی در جمع‌های شلوغ و پر سر و صدا هستیم به‌سختی می‌توانیم صدای افراد را از یکدیگر تشخیص و تمایز بدهیم. حال تصور کنید که این کار برای دستگاه‌ها چقدر می‌تواند دشوار باشد.

اما به نظر می‌رسد که وقتی حرف از تشخیص صدا می‌شود، انسان‌ها در حال از دست دادن برتری‌شان بر دستگاه‌ها هستند. گوگل در این زمینه تکنولوژی جدیدی خلق کرده که به هوش مصنوعی‌اش کمک می‌کند تا وقتی چند نفر به طور هم‌زمان در حال گفت‌وگو با یکدیگر هستند صدایشان را از هم تفکیک کند.

هوش مصنوعی سیستم تشخیص صدای گوگل چطور کار می‌کند؟

این سیستم بر مبنای مدل تفکیک صوتی-تصویری کار می‌کند که یعنی می‌تواند صدای افراد را با تحت نظر قرار دادن چهره‌شان هنگام صحبت، شناسایی کند. شبکه‌ی عصبی آن طوری تعلیم داده شده که در یک مهمانی ساختگی که توسط محققین ایجاد شده بود، صدای افراد گوناگون را از همدیگر جدا و تفکیک‌سازی کند. حتی برای آموزش بیشتر این هوش مصنوعی، صداهای پس زمینه به این محیط‌های آموزشی مجازی اضافه شده بود.

نتایج این آزمایش حیرت‌انگیز بود، چراکه این سیستم نه تنها توانست به‌طور کامل صدای پس زمینه را جدا کند بلکه توانست صدای دو نفری که هم‌زمان با هم گفت‌وگو می‌کردند را نیز از هم متمایز سازد.

با این حال شاید این تکنولوژی جدید گوگل مشکلات امنیتی را هم به همراه داشته باشد چراکه ممکن است برای جاسوسی در مکان‌های مختلف و توسط افراد سودجو مورد استفاده قرار بگیرد. هر چند که برای این کار به تلاش‌های بیشتری احتیاج است ولی آن روز خیلی هم دور نیست.