Ученые в Сибири усовершенствовали алгоритм распознавания речи

Новосибирск. 18 апреля. ИНТЕРФАКС - Специалисты Новосибирского госуниверситета ввели новый модуль в открытую систему "Писец", сообщил "Интерфаксу" разработчик системы, научный сотрудник лаборатории прикладных цифровых технологий Механико-математического факультета НГУ Иван Бондаренко.

"Мы ввели туда модерацию неопределенности - система помечает слово, в котором она не уверена", - сказал ученый на полях международной конференции по искусственному интеллекту и естественному языку "AINL-2025".

Для пользователя сомнительное слово будет выделяться серым цветом, отметил он.

По словам Бондаренко, "Писец" реализуется как достаточно компактная языковая модель с перспективой установки на различные девайсы.

Также на базе китайской Qwen Audio в лаборатории планируется сделать большую мультимодальную модель для русского языка, чтобы она могла одновременно воспринимать русский текст, русскую речь неречевые акустические события, определять количество говорящих и т.д.

Бондаренко отметил, что в текущем году "Писец" не писал "Тотальный диктант".

Как сообщалось, годом ранее система продемонстрировала хорошие знания грамматики, но допустила ошибки в словах, которые услышала неверно.

Изначально "Писец" разрабатывался год назад для автоматического стенографирования звукозаписей интервью или защит диссертаций. Соответственно, даже 20-30% ошибок в расшифрованных текстах - это уже тот уровень, который позволяет человеку гораздо быстрее подготовить чистовой текст стенограммы, чем если бы он писал его "с нуля".

Горячие темы: