اخترع العلماء سماعة تحجب أصوات الناس المزعجين

يمكنك أن تحظى بمحادثة مع أربعة أشخاص، يتحدث خلالها اثنان ويُعزل أي صوت من الأصوات الأربعة.

مخروط السكون

تمتلك السماعة الجديدة القدرة على إعادة ترتيب الميكروفونات السبعة ذاتية الانتشار لتقسيم الغرفة إلى ما يسمى ‘مناطق الكلام’، مما يسمح لها بتعقب وتحديد الأصوات المختلفة حتى أثناء تحركها.

ويقول الباحثون الذين يقفون وراء الاختراع إن هذا التحديد الدقيق لا يسمح لهم بفصل المحادثات المتزامنة فحسب، بل يسمح لهم أيضًا بكتم صوت المناطق الصاخبة أو الأشخاص المزعجين بناءً على الطلب، من أجل بعض التطبيقات، مثل: مؤتمرات الفيديو في الاجتماعات.

وكما هو مفصل في دراسة حديثة نُشرت عن العمل في مجلة الاتصالات الطبيعة The Nature Communications، تتألف السماعة غير التقليدية من ما يعرف باسم ‘سرب الروبوت’.

تأتي الميكروفونات ذاتية الانتشار كروبوتات صغيرة الحجم تتواصل مع بعضها البعض، وتتحرك على عجلاتها الصغيرة إلى نقاط مختلفة من تلقاء نفسها، مثل: (رومبا صغيرة)، وتعود إلى محطة الشحن عند الحاجة.

وقال المؤلف المشارك في رئاسة الدراسة ‘مالك إيتاني Malek Itani’ من كلية بول ألين لعلوم الحاسب الآلي في بيانٍ له: “للمرة الأولى، وباستخدام ما نسميه السرب الصوتي الآلي، تمكنا من تتبع مواقع العديد من الأشخاص الذين يتحدثون في الغرفة وحجب كلامهم”.

البحث الطنان

يقول الباحثون أنّ الروبوتات النموذجية تستخدم تقنية شبيهة بتحديد الموقع بالصدى عالي التردد من أجل التنقل في محيطها، وتعد هذه القدرة على التنقل أمرًا بالغ الأهمية.

وتكون الشبكة العصبية التي تعالج البيانات قادرة على إجراء حسابات أكثر دقة من خلال نشر الميكروفونات إلى الخارج قدر الإمكان.

وعلى الرغم من ذلك، تقتصر الروبوتات على لوحات التجوال؛ لأنها قادرة فقط على التمركز في مساحة ثنائية الأبعاد.

ويوضح المؤلف المشارك في إدارة الأعمال ‘توشاو تشن Tuochao Chen’ في مدرسة ألين قائلًا: “لقد طورنا شبكات عصبية تستخدم هذه الإشارات المتأخرة زمنيًا لفصل ما يقوله كل شخص وتتبع موقعه في الفراغ، إذ يمكن أن يكون لديك أربعة أشخاص في محادثتين وتعزل أيًّا من الأصوات الأربعة وتضع كل صوت في غرفة واحدة”.

في المنطقة

تدعم ادعاءات تشين نتائج تجارب العالم الحقيقي.

اختبر الباحثون سرب الروبوت في أماكن مثل المكاتب والمطابخ في حين كان ثلاثة إلى خمسة أشخاص يتحدثون، مع عدم وجود معرفة مسبقة للمواقع أو الأصوات.

على الرغم من تلك العقبات، كان الجهاز لا يزال قادرًا على تحديد موقع الأصوات بنسبة 90% من الوقت، ضمن مسافة 1.6 قدم من بعضها البعض. وفي الوقت نفسه، كان الخطأ المتوسط أقل من ست بوصات في كل السيناريوهات ويُعد هذا خطأً صغيرًا جدًا.

ومع ذلك فقد كانت سرعته تسمح له بالانخفاض قليلًا.

وفي المتوسط، يستغرق النظام 1.82 ثانية لمعالجة ما يعادل ثلاث ثوان من الصوت، وهو ما قد يجعل المؤتمرات بالفيديو خافتة بعض الشيء.

في المرحلة التالية، يريد الباحثون تطبيق تقنيات الكتم والفصل هذه في الفضاء المادي في الوقت الحقيقي، من خلال استخدام الميكروفونات المحلية للقيام بما تقوم به سماعة الأذن المانعة للضوضاء في أذنيك، ولكن في غرفة كاملة.

  • ترجمة: حنان الميهوب
  • تدقيق علمي ولغوي: روان نيوف
  • المصادر: 1