„Common Voice“ доби поддршка за македонски јазик

Гоце Митевски

0

По една година и речиси четири месеци, откога се активиравме околу локализацијата на „Common Voice“ на македонски јазик, имаме убави вести. Целта е остварена. Македонскиот јазик е достапен на „Common Voice“ и сите заинтересирани страни отсега можат да се вклучат во создавањето на аудио записи во отворената база на гласовни податоци.

За да стане еден јазик достапен на Common Voice и за да може да се снимаат аудио записи од лица што сакаат да го донираат својот глас, потребно е да се создаде збирка од најмалку 5.000 реченици, на литературен македонски јазик, којашто што спаѓа во јавниот домен и не подлежи на авторски права. Тоа би можело да бидат реченици што доаѓаат од било каде, но под услов да се во согласност со условите на Common Voice.

Голема благодарност до сите што активно придонесоа да завршиме со оваа фаза на активностите и овозможија, најпрво да се создаде неопходната збирка од 5.000 реченици, па потоа и истата детално ја прегледаа за да се осигураме дека создаваме квалитетни основни содржини од коишто подоцна може да се снимаат аудио записи. Посебна благодарност до Матеј Плавевски.

Честитки!

Што значи ова и како понатаму?

Отсега сите заинтересирани страни можат да започнат со читање на основните содржини и да го донираат својот глас за тренирање на невронската мрежа „DeepSpeech“.

Сѐ што е потребно, е успешна регистрација на кориснички профил на https://commonvoice.mozilla.org/mk и веднаш потоа може да се започне со снимање, но и слушање на постоечките аудио записи. Во моментов збирката на аудио записи на македонски јазик е празна и следниот чекор е да ја наполниме со најмалку 1.200 аудио записи.

Сите што сакаат можат да го донираат својот глас, а базата на гласовни податоци е целосно отворена и достапна за слободно преземање преку страницата „Податочни множества“.

Придобивките за македонскиот јазик од овој проект се огромни. Ве повикуваме да ни се придружите и да придонесеме за зачувување на нашиот јазик, но и да овозможиме развој на сосема нови системи и решенија базирани на гласовни содржини.

Однапред ви благодариме.

No responses yet

Post a comment

Post Your Comment