Учени от БАН представи три модерни технологии за машинна обработка на реч
Иновации в областта на синтеза и разпознаването на българска реч – говоряща програма, медицински диктофон и административен „интелигентен стенограф“ демонстрирa Институтът по информационни и комуникационни технологии (ИИКТ-БАН), съобщиха от БАН.
Tрите иновативни разработки са на базата на оригинални технологии за машинна обработка на реч и са базирани на последните достижения на дълбокото машинно самообучение.
Проф. дмн Стоян Михов направи за първи път демонстрация как работят продуктите. Говорящата програма дава възможност да се генерира възможно най-естествена реч за хората със зрителни проблеми. По време на представянето председателят на Съюза на слепите Васил Долапчиев връчи почетния знак на Съюза на проф. Стоян Михов. Над 10 000 души ще могат да ползват програмата и това ще им помогне да се ориентират в океана от информация и за социалното им приспособяване, каза с благодарност Долапчиев.
Прототипи на системи за разпознаване на българска реч – за медицински цели (медицински диктофон), както и за административни нужди (интелигентен стенограф) демонстрира на събитието проф. Михов. Те са с технологично ниво на готовност 7.
Диктофонът ще облекчи работата на медицинските специалисти при изготвянето на документация и е реализиран като облачна услуга. Подготвен е медицински езиков корпус и терминологичен речник с половин милион думи. Текстът директно се разпознава и може да влезе в информационната система.
Интелигентният стенограф BG-Conformer подпомага изготвянето на документация като протоколи, стенограми и др. в различни области на администрацията. За разработването му е използван корпус от един милион отделни изречения от стенограми на пленарни заседания на Народното събрание (2010 – 2018 г.). Системата не притежава речник, а работи със срички и така се повишава прецизността на разпознаване.
Демонстрираните разработки достигат качество и прецизност, неотстъпващи на световните достижения в областта, каза проф. Стоян Михов. Синтезаторът NeuralSpeechLab вече се използва от стотици хора със зрителни увреждания, а медицинският диктофон и интелигентният стенограф са завършени прототипи, готови за реализиране в крайни продукти. Екипът от ИИКТ-БАН продължава работа по усъвършенстване на технологиите и разработването на нови приложения, отбеляза проф. Михов.
Най-новите постижения на Института са резултат от научни изследвания, финансирани както от Фонда за научни изследвания, така и от Националната научна програма „еЗдраве“ в отговор на потребностите на обществото.