Хотите дальше читать devby? 📝
Support us

Як камп’ютар навучыўся размаўляць па-беларуску

Оставить комментарий
Як камп’ютар навучыўся размаўляць па-беларуску
skitchedТэхналогіі распазванання тэкставай інфармацыі і пераводу яе ў маўленне распрацаваныя шмат для якіх моваў свету. Цяпер і беларуская не выключэнне. У нашай краіне распрацоўкай такой праграмы займаюцца ў Аб’яднаным інстытуце праблем інфарматыкі Нацыянальнай акадэміі навук, а таксама ў прыватнай кампаніі «Сакрамент». Пра сваю распрацоўку «Нашай Ніве«расказала кандыдат тэхнічных навук Лілія Цырульнік і малодшы навуковы супрацоўнік Юрась Гецэвіч, які непасрэдна займаецца беларускамоўным сегментам. У чым адметнасць вашай лабараторыі?
Лілія Цырульнік: Наша асаблівасць — гэта распрацоўка сістэмы сінтэзу маўлення для беларускай мовы. Акрамя гэтага, мы распрацавалі такія сістэмы для расейскай і польскай моваў, а таксама займаемся стварэннем сінтэзатара якуцкай мовы.
Дзе можа выкарыстоўвацца ваша праграма?
ЛЦ: Сфера прымянення даволі шырокая: стварэнне аўдыёкніг, чытанне электроннай пошты, дапамога сляпым людзям. Што яшчэ важна, сістэма сінтэзу беларускага маўлення будзе спрыяць захаванню мовы.
Колькі каштуе такая праграма?
ЛЦ: Пакуль няма камерцыйнай версіі праграмы для беларускай мовы, яна будзе створана цягам некалькіх месяцаў. Для канчатковага карыстальніка гэта будзе адзін кошт, для карпаратыўнага ўжытку ці для выкарыстоўвання ў сістэмах апавяшчэння абанентаў па тэлефоне — іншы. Напрыклад, створаная намі праграма для агучвання аўдыёкніг на расейскай мове «aBookForge» каштуе каля $7. На гэту лічбу можна арыентавацца.
Як даўно вы займаецеся распрацоўкамі сінтэзатараў маўлення?
ЛЦ: Лабараторыя існуе ўжо больш за 40 гадоў. Былы загадчык лабараторыі — Барыс Мяфодзевіч Лабанаў — вядомы вучоны, на рахунку якога шмат навуковых распрацовак. Дарэчы, яго голасам «размаўляе» праграма. А беларускамоўным сінтэзатарам пачалі займацца гадоў 10 таму.
skitchedЦі звяртаецеся вы да паслуг філолагаў?
ЛЦ: Вядома ж. Трэба ўлічваць асаблівасці і гукаў, і інтанацыі. Напрыклад, у польскай мове націск трапляе пераважна на перадапошні склад. Мовы пастаянна развіваюцца, з’яўляюцца новыя словы. А вось колькасць гукаў — абмежаваная. У беларускай мове ёсць 42 гукі. Такім чынам, з існуючай базы гукаў праграма ўтварае словы, сказы, тэксты… Акрамя таго, адзін і той жа гук можа быць вымаўлены з рознай інтанацыяй і тэмпам.
Ці можа праграмма «размаўляць» голасам іншага чалавека па жаданні заказчыка?
ЛЦ: Што тычыцца персанальнага голасу, у нас распрацавана тэхналогія, дзякуючы якой любы дыктар можа прачытаць пэўны тэкст, зрабіць яго аўдыёзапіс. Потым гэты запіс апрацоўваецца спецыяльным чынам і ствараецца маўленчая база дадзеных. Таму тэарэтычна праграма можа размаўляць любым голасам.
З якімі цяжкасцямі вы сутыкаліся пры распрацоўцы беларускай версіі?
Юрась Гецэвіч: Найбольшую складанасць выклікаюць розныя скарачэнні, абрэвіятуры, даты, а таксама пастаноўка націскаў у словах. Да таго ж, людзі часта робяць памылкі пры напісанні тэкстаў. Таму мая задача — рабіць лінгвістычны блок, які б мог распазнаваць «закадаваныя» выразы ў тэксце, затым пераводзіць іх у арфаграфічныя словы, знаходзіць гэтыя словы ў слоўніку і расстаўляць націскі. Напачатку слоўніка не было. Нам яго перадалі з Лабараторыі камп’ютарнай лінгвістыкі БДУ. Зразумела, што прыйшлося яго адаптаваць, дадаваць новыя словы, імёны.
Каб лепш зразумець, як працуе праграма, Юрась Гецэвіч надрукаваў некалькі словаў на клавіятуры — і камп’ютар прамовіў прыемным мужчынскім голасам з лёгкім металічным акцэнтам: «Прывітанне, газета «Наша Ніва»! Вы першая беларуская газета з малюнкамі. А мы першая лабараторыя, якая сінтэзуе беларускую мову». Крыніца: «Наша Ніва»
Помогаете devby = помогаете ИТ-комьюнити.

Засапортить сейчас.

Читайте также
В твиттере дискуссия про мову: может ли компания просить коммуницировать на беларуском?
В твиттере дискуссия про мову: может ли компания просить коммуницировать на беларуском?
В твиттере дискуссия про мову: может ли компания просить коммуницировать на беларуском?
1 комментарий
«Сюды не едуць па грошы». Распрацоўшчык пра жыццё, кошты i адукацыю ў Фiнляндыi
«Сюды не едуць па грошы». Распрацоўшчык пра жыццё, кошты i адукацыю ў Фiнляндыi
«Сюды не едуць па грошы». Распрацоўшчык пра жыццё, кошты i адукацыю ў Фiнляндыi
50 комментариев
Выкладчыку не працягнулi кантракт з-за мовы (БДУIР адмаўляе гэта). Цяпер ён рабочы ў Ізраілі
Выкладчыку не працягнулi кантракт з-за мовы (БДУIР адмаўляе гэта). Цяпер ён рабочы ў Ізраілі
Выкладчыку не працягнулi кантракт з-за мовы (БДУIР адмаўляе гэта). Цяпер ён рабочы ў Ізраілі
15 комментариев
Айцiшнiкi чытаюць верш Пiмена Панчанкi «Родная мова». Паглядзіце, як чулліва!
Айцiшнiкi чытаюць верш Пiмена Панчанкi «Родная мова». Паглядзіце, як чулліва!
Айцiшнiкi чытаюць верш Пiмена Панчанкi «Родная мова». Паглядзіце, як чулліва!
Тыдзень пачаўся з міжнароднага свята — Дня роднай мовы. Разам з МТС мы вырашылі павіншаваць чытачоў і папрасілі айцішнікаў прачытаць верш Пімена Панчанкі, які ён напісаў у 1964 годзе. 
1 комментарий

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.