У переповнених середовищах з кількома динаміками наявні слухові апарати можуть бути складними для фільтрації звуку. (Зображення: Rawpixel.com через Shutterstock)
Чи траплялося вам коли-небудь важко розрізнити голос свого друга серед інших розмов у переповненій кімнаті? Вчені називають цю проблему «проблемою коктейльної вечірки», і це може бути особливо важко для людей із втратою слуху.
Більшість слухових апаратів оснащені спрямованими фільтрами, які допомагають користувачам зосередитися на звуках перед ними. Вони найкраще зменшують статичний фоновий шум, але не сприймають їх у складніших акустичних сценаріях, наприклад, коли користувач знаходиться серед гостей коктейльної вечірки, які стоять близько один до одного та розмовляють з однаковою гучністю.
Тепер новий алгоритм може покращити те, як слухові апарати вирішують проблему коктейльних вечірок. Модель, що отримала назву «біологічно орієнтований алгоритм сегрегації звуку» (BOSSA), натхненна слуховою системою мозку, яка використовує сигнали з обох вух для визначення джерела шуму та може фільтрувати звук за місцем розташування.
Александр Бойд, докторант з біомедичної інженерії в Бостонському університеті, порівняв спрямовані фільтри та BOSSA з ліхтариками, оскільки вони підсвічують те, що знаходиться на їхньому шляху.
«BOSSA — це новий ліхтарик із вужчим та більш вибірковим променем», — сказав він Live Science. Порівняно зі стандартними фільтрами, BOSSA має краще розрізняти динаміки, хоча його ще потрібно протестувати в реальних умовах із належними слуховими апаратами.
Бойд нещодавно очолив лабораторне випробування BOSSA, результати якого були опубліковані 22 квітня в журналі Communications Engineering. В експерименті учасники з втратою слуху одягли навушники, що відтворювали аудіо, призначене для імітації одночасної розмови п'яти людей з різних кутів навколо слухача.
Аудіо фільтрували через BOSSA або більш традиційний алгоритм слухових апаратів, і учасники порівнювали обидва фільтри з тим, як вони чули аудіо без додаткової обробки.
У кожному випробуванні учасників просили стежити за реченнями, які озвучує один із п'яти мовців. Гучність «цільового мовця» відносно інших мовців змінювалася між випробуваннями. Коли цільовий мовець стояв на відстані до 30 градусів від слухача в будь-якому напрямку, учасники могли розрізнити більшу частку слів з нижчим порогом гучності за допомогою алгоритму BOSSA, ніж за допомогою звичайного алгоритму або без сторонньої допомоги.
Звичайний алгоритм, здається, краще обслуговував користувачів, ніж BOSSA, у розрізненні мовлення від статичного шуму. Однак це було перевірено лише на чотирьох з восьми учасників.
Стандартний алгоритм працює, зменшуючи відволікаючі звуки шляхом збільшення співвідношення сигнал/шум для звуків, що надходять із заданого напрямку. Для порівняння, BOSSA перетворює звукові хвилі на вхідні імпульси, які алгоритм може обробити, подібно до того, як равлик у внутрішньому вусі перетворює коливання звукових хвиль на сигнали, що передаються нейронами.
Алгоритм імітує, як спеціальні клітини середнього мозку — верхньої частини стовбура мозку, що з'єднує головний і спинний мозок — вибірково реагують на звуки, що надходять з певного напрямку. Ці просторово налаштовані клітини оцінюють напрямок на основі відмінностей у часі та гучності звукових сигналів, що надходять до кожного вуха.
Бойд сказав, що цей аспект BOSSA базується на дослідженнях середнього мозку сипух, які мають складні просторові здібності, оскільки вони покладаються на звукові сигнали для визначення місцезнаходження здобичі. Сигнали, відфільтровані BOSSA, потім перетворюються на звук для слухача.
BOSSA змодельована за моделлю шляху уваги нервової системи «знизу вгору», який збирає фрагменти сенсорної інформації, що потім інтерпретується мозком. Ці сенсорні сигнали визначають, які аспекти навколишнього середовища заслуговують на увагу, а які можна ігнорувати.
Але увага також диктується шляхом «зверху вниз», за яким попередні знання людини та її поточні цілі формують її сприйняття. У цьому випадку людина може вирішити, на чому їй слід зосередитися. Ці два способи обробки не обов’язково є взаємовиключними; наприклад, голос вашого друга може бути чутний одночасно тому, що ви його впізнаєте, і тому, що він кричить крізь шум натовпу.
Підхід BOSSA «знизу вгору» може допомогти людям зосередитися на мовленні, яке доходить із заздалегідь визначеного місця, але в реальному житті люди швидко переключають свою увагу на інші розмови. «Ви не можете зробити це з цим алгоритмом», — сказав Майкл Стоун, дослідник аудіології з Манчестерського університету у Великій Британії, який не брав участі в новому дослідженні.
Стоун додав, що дослідження не відтворило, як звуки луною відбиваються та реверберують у реальному житті, особливо в приміщенні. Тим не менш, він сказав, що BOSSA може бути більш практичним для слухових апаратів, ніж алгоритми, засновані на глибоких нейронних мережах, ще одному новому підході до фільтрації звуку.
Моделі глибоких нейронних мереж потребують ретельного навчання, щоб бути готовими до всіх різних конфігурацій динаміків, з якими може зіткнутися користувач. А після впровадження обчислювальні вимоги цих моделей вимагають багато потужності. BOSSA для порівняння простіша, спираючись переважно на просторову різницю між двома звуками.
BOSSA також може бути прозорішою, ніж «чорна скринька» глибоких нейронних мереж, сказав Фан-Ган Цзен, професор отоларингології Каліфорнійського університету в Ірвайні, який не брав участі в дослідженні. Це означає, що було б легше інтерпретувати, як звукові вхідні дані стають алгоритмічними виходами, що, можливо, спростить уточнення моделі.
Цзен додав, що BOSSA може потребувати подальшого вдосконалення, оскільки його вивчатимуть у більш реалістичних сценаріях. Дослідники планують протестувати BOSSA у належних слухових апаратах, а не в навушниках, а також сподіваються розробити механізм керування, який допоможе користувачам спрямовувати фокус алгоритму.
Застереження
Ця стаття призначена лише для ознайомлення та не є метою надання медичних порад.
Лорен Шнайдер, дописувач Live Science
Лорен Шнайдер — журналістка, що спеціалізується на питаннях здоров'я та науки, яка зараз здобуває ступінь магістра за програмою репортажів про науку, здоров'я та навколишнє середовище в Нью-Йоркському університеті. Перш ніж стати письменницею, вона отримала ступінь бакалавра з неврології в Техаському університеті в Остіні. У вільний час Лорен дивиться фільми, плаває, редагує Вікіпедію або проводить час з Люсі, своєю неймовірно милою чорною кішкою.
Ви повинні підтвердити своє публічне ім'я, перш ніж коментувати
Будь ласка, вийдіть із системи, а потім увійдіть знову. Після цього вам буде запропоновано ввести своє ім'я для відображення.
Вийти
Sourse: www.livescience.com