Як камп’ютар навучыўся размаўляць па-беларуску

2 комментария
Як камп’ютар навучыўся размаўляць па-беларуску
skitchedТэхналогіі распазванання тэкставай інфармацыі і пераводу яе ў маўленне распрацаваныя шмат для якіх моваў свету. Цяпер і беларуская не выключэнне. У нашай краіне распрацоўкай такой праграмы займаюцца ў Аб’яднаным інстытуце праблем інфарматыкі Нацыянальнай акадэміі навук, а таксама ў прыватнай кампаніі «Сакрамент». Пра сваю распрацоўку «Нашай Ніве«расказала кандыдат тэхнічных навук Лілія Цырульнік і малодшы навуковы супрацоўнік Юрась Гецэвіч, які непасрэдна займаецца беларускамоўным сегментам. У чым адметнасць вашай лабараторыі?
Лілія Цырульнік: Наша асаблівасць — гэта распрацоўка сістэмы сінтэзу маўлення для беларускай мовы. Акрамя гэтага, мы распрацавалі такія сістэмы для расейскай і польскай моваў, а таксама займаемся стварэннем сінтэзатара якуцкай мовы.
Дзе можа выкарыстоўвацца ваша праграма?
ЛЦ: Сфера прымянення даволі шырокая: стварэнне аўдыёкніг, чытанне электроннай пошты, дапамога сляпым людзям. Што яшчэ важна, сістэма сінтэзу беларускага маўлення будзе спрыяць захаванню мовы.
Колькі каштуе такая праграма?
ЛЦ: Пакуль няма камерцыйнай версіі праграмы для беларускай мовы, яна будзе створана цягам некалькіх месяцаў. Для канчатковага карыстальніка гэта будзе адзін кошт, для карпаратыўнага ўжытку ці для выкарыстоўвання ў сістэмах апавяшчэння абанентаў па тэлефоне — іншы. Напрыклад, створаная намі праграма для агучвання аўдыёкніг на расейскай мове «aBookForge» каштуе каля $7. На гэту лічбу можна арыентавацца.
Як даўно вы займаецеся распрацоўкамі сінтэзатараў маўлення?
ЛЦ: Лабараторыя існуе ўжо больш за 40 гадоў. Былы загадчык лабараторыі — Барыс Мяфодзевіч Лабанаў — вядомы вучоны, на рахунку якога шмат навуковых распрацовак. Дарэчы, яго голасам «размаўляе» праграма. А беларускамоўным сінтэзатарам пачалі займацца гадоў 10 таму.
skitchedЦі звяртаецеся вы да паслуг філолагаў?
ЛЦ: Вядома ж. Трэба ўлічваць асаблівасці і гукаў, і інтанацыі. Напрыклад, у польскай мове націск трапляе пераважна на перадапошні склад. Мовы пастаянна развіваюцца, з’яўляюцца новыя словы. А вось колькасць гукаў — абмежаваная. У беларускай мове ёсць 42 гукі. Такім чынам, з існуючай базы гукаў праграма ўтварае словы, сказы, тэксты… Акрамя таго, адзін і той жа гук можа быць вымаўлены з рознай інтанацыяй і тэмпам.
Ці можа праграмма «размаўляць» голасам іншага чалавека па жаданні заказчыка?
ЛЦ: Што тычыцца персанальнага голасу, у нас распрацавана тэхналогія, дзякуючы якой любы дыктар можа прачытаць пэўны тэкст, зрабіць яго аўдыёзапіс. Потым гэты запіс апрацоўваецца спецыяльным чынам і ствараецца маўленчая база дадзеных. Таму тэарэтычна праграма можа размаўляць любым голасам.
З якімі цяжкасцямі вы сутыкаліся пры распрацоўцы беларускай версіі?
Юрась Гецэвіч: Найбольшую складанасць выклікаюць розныя скарачэнні, абрэвіятуры, даты, а таксама пастаноўка націскаў у словах. Да таго ж, людзі часта робяць памылкі пры напісанні тэкстаў. Таму мая задача — рабіць лінгвістычны блок, які б мог распазнаваць «закадаваныя» выразы ў тэксце, затым пераводзіць іх у арфаграфічныя словы, знаходзіць гэтыя словы ў слоўніку і расстаўляць націскі. Напачатку слоўніка не было. Нам яго перадалі з Лабараторыі камп’ютарнай лінгвістыкі БДУ. Зразумела, што прыйшлося яго адаптаваць, дадаваць новыя словы, імёны.
Каб лепш зразумець, як працуе праграма, Юрась Гецэвіч надрукаваў некалькі словаў на клавіятуры — і камп’ютар прамовіў прыемным мужчынскім голасам з лёгкім металічным акцэнтам: «Прывітанне, газета «Наша Ніва»! Вы першая беларуская газета з малюнкамі. А мы першая лабараторыя, якая сінтэзуе беларускую мову». Крыніца: «Наша Ніва»

Хотите сообщить важную новость?

Пишите в наш Телеграм

Горячие события

EMERGE 2020
1 июня — 3 июня

EMERGE 2020

Вебинар «Советы от рекрутеров: как найти квалифицированную работу в Европе»
4 июня

Вебинар «Советы от рекрутеров: как найти квалифицированную работу в Европе»

Читайте также

Экспаты з Расіі, Ўкраіны, Вялікабрытаніі, Шры-Ланкі чытаюць Караткевiча
Экспаты з Расіі, Ўкраіны, Вялікабрытаніі, Шры-Ланкі чытаюць Караткевiча

Экспаты з Расіі, Ўкраіны, Вялікабрытаніі, Шры-Ланкі чытаюць Караткевiча

5 комментариев
Тестировщица, которая оскорбила мову в соцсети, больше не работает в EPAM. +Комментарий компании
Тестировщица, которая оскорбила мову в соцсети, больше не работает в EPAM. +Комментарий компании

Тестировщица, которая оскорбила мову в соцсети, больше не работает в EPAM. +Комментарий компании

137 комментариев
IT-валанцёры распрацавалі Doika — віджэт для збору грошай з картак на грамадскія мэты
IT-валанцёры распрацавалі Doika — віджэт для збору грошай з картак на грамадскія мэты

IT-валанцёры распрацавалі Doika — віджэт для збору грошай з картак на грамадскія мэты

2 комментария
«Неба — проста дупа». Як dev.by тыкаў лазернай указкай у МКС і здымаў зоркі за 145 км ад Мінска. (+ Гайд па оптыцы і лайфхакі ад астрафатографа)
«Неба — проста дупа». Як dev.by тыкаў лазернай указкай у МКС і здымаў зоркі за 145 км ад Мінска. (+ Гайд па оптыцы і лайфхакі ад астрафатографа)

«Неба — проста дупа». Як dev.by тыкаў лазернай указкай у МКС і здымаў зоркі за 145 км ад Мінска. (+ Гайд па оптыцы і лайфхакі ад астрафатографа)

4 комментария

Обсуждение

-1

ууу дзякуй, даволі цікава.

1

Добра, што прагледзеў другi ролiк - там верш вымаўляецца значна лепей.
Поспехаў вам, Сакрамент!

Спасибо! 

Получать рассылки dev.by про белорусское ИТ

Что-то пошло не так. Попробуйте позже