Ученые в Сибири усовершенствовали алгоритм распознавания речи
Новосибирск. 18 апреля. ИНТЕРФАКС - Специалисты Новосибирского госуниверситета ввели новый модуль в открытую систему "Писец", сообщил "Интерфаксу" разработчик системы, научный сотрудник лаборатории прикладных цифровых технологий Механико-математического факультета НГУ Иван Бондаренко.
"Мы ввели туда модерацию неопределенности - система помечает слово, в котором она не уверена", - сказал ученый на полях международной конференции по искусственному интеллекту и естественному языку "AINL-2025".
Для пользователя сомнительное слово будет выделяться серым цветом, отметил он.
По словам Бондаренко, "Писец" реализуется как достаточно компактная языковая модель с перспективой установки на различные девайсы.
Также на базе китайской Qwen Audio в лаборатории планируется сделать большую мультимодальную модель для русского языка, чтобы она могла одновременно воспринимать русский текст, русскую речь неречевые акустические события, определять количество говорящих и т.д.
Бондаренко отметил, что в текущем году "Писец" не писал "Тотальный диктант".
Как сообщалось, годом ранее система продемонстрировала хорошие знания грамматики, но допустила ошибки в словах, которые услышала неверно.
Изначально "Писец" разрабатывался год назад для автоматического стенографирования звукозаписей интервью или защит диссертаций. Соответственно, даже 20-30% ошибок в расшифрованных текстах - это уже тот уровень, который позволяет человеку гораздо быстрее подготовить чистовой текст стенограммы, чем если бы он писал его "с нуля".
Горячие темы: |