Алгоритм штучного інтелекту використовується для розпакування нейронауки людської мови

Вчені використали тип штучного інтелекту, який називається великою мовною моделлю, щоб відкрити нове розуміння того, як людський мозок розуміє та створює мову. (Автор зображення: Юічіро Чіно/Getty Images)

Використовуючи штучний інтелект (ШІ), вчені розгадали складну мозкову діяльність, яка розгортається під час щоденних розмов.

Інструмент може запропонувати нове розуміння нейронауки мови, і колись він може допомогти вдосконалити технології, призначені для розпізнавання мовлення, або допомогти людям спілкуватися, кажуть дослідники.

Грунтуючись на тому, як модель штучного інтелекту транскрибує аудіо в текст, дослідники, які стоять за дослідженням, можуть відобразити мозкову активність, яка відбувається під час розмови, точніше, ніж традиційні моделі, які кодують особливі особливості мовної структури, такі як фонеми (прості звуки, з яких складаються слова) і частини мови (такі як іменники, дієслова та прикметники).

Модель, яка використовується в дослідженні під назвою Whisper, натомість використовує аудіофайли та їхні текстові розшифровки, які використовуються як навчальні дані для зіставлення аудіо з текстом. Потім він використовує статистику цього відображення, щоб «навчитися» передбачати текст із нових аудіофайлів, які він раніше не чув.

Таким чином, Whisper працює виключно на основі цієї статистики без будь-яких особливостей мовної структури, закодованої в оригінальних налаштуваннях. Але, незважаючи на це, у дослідженні вчені показали, що ці структури все ще з’являлися в моделі після її навчання.

Дослідження проливає світло на те, як працюють ці типи моделей штучного інтелекту — так звані великі мовні моделі (LLM). Але дослідницьку групу більше цікавить розуміння людської мови та когнітивних можливостей. Виявлення подібності між тим, як модель розвиває здібності до обробки мови, і тим, як люди розвивають ці навички, може бути корисним для розробки пристроїв, які допомагають людям спілкуватися.

«Насправді йдеться про те, як ми думаємо про пізнання», — сказав провідний автор дослідження Аріель Гольдштейн, доцент Єврейського університету в Єрусалимі. Результати дослідження свідчать про те, що «ми повинні думати про пізнання через призму цього [статистичного] типу моделі», — сказав Гольдштейн Live Science.

Розпакування пізнання

У дослідженні, опублікованому 7 березня в журналі Nature Human Behaviour, брали участь чотири учасники з епілепсією, які вже перенесли операцію з імплантації електродів для моніторингу мозку з клінічних причин.

Отримавши згоду, дослідники записували всі розмови пацієнтів під час перебування в лікарні, яке тривало від кількох днів до тижня. Загалом вони записали понад 100 годин аудіо.

Кожному з учасників було встановлено від 104 до 255 електродів для моніторингу активності їх мозку.

Більшість досліджень, у яких використовуються записи розмов, проводяться в лабораторії за дуже контрольованих обставин протягом приблизно години, сказав Голдштейн. Хоча це контрольоване середовище може бути корисним для визначення ролі різних змінних, Голдштейн і його співробітники хотіли «дослідити мозкову діяльність і поведінку людини в реальному житті».

Їхнє дослідження показало, як різні частини мозку задіюються під час виконання завдань, необхідних для створення та розуміння мови.

Гольдштейн пояснив, що тривають дебати щодо того, чи активізуються окремі частини мозку під час виконання цих завдань, чи весь орган реагує більш колективно. Перша ідея може припустити, що одна частина мозку обробляє фактичні звуки, з яких складаються слова, тоді як інша інтерпретує значення цих слів, а третя виконує рухи, необхідні для розмови.

Згідно з альтернативною теорією, ці різні області мозку працюють узгоджено, використовуючи «розподілений» підхід, сказав Голдштейн.

Дослідники виявили, що певні ділянки мозку корелювали з деякими завданнями.

Наприклад, області, які, як відомо, беруть участь в обробці звуку, такі як верхня скронева звивина, виявляли більшу активність при обробці слухової інформації, а області, задіяні в мисленні вищого рівня, такі як нижня лобова звивина, були більш активними для розуміння значення мови.

Вони також могли бачити, що зони стали активними послідовно.

Наприклад, область, яка найбільше відповідає за сприйняття слів, активувалася раніше, ніж область, яка відповідає за їх інтерпретацію. Однак дослідники також чітко бачили, як зони активувалися під час діяльності, для якої вони, як відомо, не спеціалізувалися.

«Я вважаю, що це найбільш повний і повний реальний доказ цього розподіленого підходу», — сказав Голдштейн.

Зв’язок моделей ШІ з внутрішньою роботою мозку

Дослідники використали 80% записаного аудіо та супровідних транскрипцій, щоб навчити Whisper, щоб потім він міг передбачити транскрипції для решти 20% аудіо.

Потім команда подивилася, як аудіо та транскрипції були зафіксовані Whisper, і зіставила ці уявлення з мозковою активністю, зафіксованою за допомогою електродів.

Після цього аналізу вони могли використати модель, щоб передбачити, яка мозкова активність відбуватиметься з розмовами, які не були включені в дані навчання. Точність моделі перевершила модель, засновану на особливостях структури мови.

Хоча дослідники не запрограмували фонему чи слово у своїй моделі з самого початку, вони виявили, що ці мовні структури все ще відображаються на тому, як модель розробляє свої транскрипти. Тож він витягнув ці функції без вказівки.

Дослідження є «новаторським, оскільки воно демонструє зв’язок між роботою обчислювальної акустичної моделі для перетворення мови в мову та функцією мозку», — сказав Live Science в електронному листі Леонхард Шільбах, керівник дослідницької групи в Мюнхенському центрі нейронаук у Німеччині, який не брав участі в роботі.

Однак він додав, що «потрібно ще багато досліджень, щоб з’ясувати, чи справді цей зв’язок передбачає схожість у механізмах, за допомогою яких мовні моделі та мозок обробляють мову».

«Порівняння мозку зі штучними нейронними мережами є важливим напрямком роботи», — сказав Гашпер Бегуш, доцент кафедри лінгвістики Каліфорнійського університету в Берклі, який не брав участі в дослідженні.

«Якщо ми зрозуміємо внутрішню роботу штучних і біологічних нейронів і їхню схожість, ми зможемо проводити експерименти та симуляції, які було б неможливо провести в нашому біологічному мозку», — сказав він Live Science електронною поштою.

Anna Demming Соціальні посилання Навігація Live Science Contributor

Анна Деммінг — незалежний науковий журналіст і редактор. Вона має ступінь доктора філософії в Королівському коледжі Лондона з фізики, зокрема нанофотоніки та того, як світло взаємодіє з дуже малим. Вона почала свою редакторську кар’єру, працюючи у Nature Publishing Group у Токіо в 2006 році. Відтоді вона працювала редактором у Physics World і New Scientist. Публікації, в яких вона брала участь на позаштатній основі, включають The Guardian, New Scientist, Chemistry World і Physics World, серед інших. Вона любить всю науку загалом, але особливо матеріалознавство та фізику, наприклад квантову фізику та конденсовані речовини.

Перш ніж коментувати, потрібно підтвердити своє загальнодоступне відображуване ім’я

Будь ласка, вийдіть, а потім увійдіть знову, після чого вам буде запропоновано ввести ваше відображуване ім’я.

Вийти

Sourse: www.livescience.com

No votes yet.
Please wait...

Ответить

Ваш адрес email не будет опубликован. Обязательные поля помечены *