Milli elektron tərcümə

proqramlarının imkanları genişlənir 

 

"Dilmanc" tərcüməçisinin mobil versiyası artıq "Google Play Store"da

 

Azərbaycanda peşəkar elektron tərcümə proqramlarının hazırlanması istiqamətində bu vaxta qədər bir sıra ciddi işlər həyata keçirilib. Bu işdə təbii ki, Rabitə və İnformasiya Texnologiyaları Nazirliyinin fəallığı xüsusi olaraq qeyd edilməlidir. Bu cür layihələrdən biri məhz Dilmanc layihəsidir.

“Dilmanc” tərcüməçisinin mobil versiyası artıq “Google Play Store”da "Dilmanc Translator" axtarmaqla “Android” bazasında işləyən smartfonlara yüklənə bilər. Rabitə və İnformasiya Texnologiyaları Nazirliyinin “Dilmanc” layihəsi çərçivəsində yaradılmış “Dilmanc” mobil tərcüməçi vasitəsilə şifahi nitqi, mətni və ayrı-ayrı sözləri Azərbaycan dilindən digər dillərə və əksinə tərcümə etmək mümkündür.

Proqrama tərcümə nəticəsində alınmış mətni səsləndirmək imkanı da əlavə edilmişdir. Tək söz daxil etdikdə, həmin sözün lüğətdəki tərcüməsi, nitq hissəsi, sinonimləri və s. göstərilir. Şifahi nitqin tanınmasında səhv olduqda alınmış mətn redaktə edilə bilər.

“Dilmanc Conversation” - söhbət rejimində əcnəbi ilə canlı söhbət üçün tərcümə aləti işə düşür. Bu zaman müvafiq düymələri basmaqla Azərbaycan dilində danışdıqda xarici dildəki tərcümə, xarici dildə danışdıqda isə Azərbaycan dilindəki tərcümə səsləndirilir.

Proqram tamamilə ödənişsiz yayılır və “Google Play Store”da "Dilmanc Translator" axtarmaqla “Android” bazasında işləyən smartfonlara yüklənə bilər. Layihə rəhbəri Əbülfət Fətullayev gələcəkdə proqramın digər mobil platformalar üçün də hazırlanacağını qeyd edib. Bundan əlavə, o, layihədə böyük mətnləri Azərbaycan dilindən rus və ingilis dillərinə və əksinə əvvəlkindən daha yüksək keyfiyyətlə tərcümə edən internet saytının yaradılması üzərində işlər getdiyini bildirib.

Qeyd edək ki, bir neçə ay əvvəl layihə çərçivəsində şifahi nitqi mətnə çevirən sistem istifadəyə verilmişdi. “Dilmanc İmla” adlanan bu sistemlə keyfiyyətli mikrofondan istifadə edildikdə klaviaturada yığmaqdan bir neçə dəfə sürətli mətn daxil etmək mümkündür. Bu proqram da pulsuz olaraq layihə saytından yüklənə bilər. İnformasiya texnologiyalarının dinamik inkişafı insanlarla kompüterlər və texnoloji vasitələr arasındakı informasiya mübadiləsinin daha sürətli olması zərurəti yaradır. Bu zərurəti aradan qaldırmaq üçün nitqin tanınması ən mühüm vasitələrdən biri hesab olunur. Bu sistem informasiyanı - mətni kompüterə klaviaturadan istifadə etmədən birbaşa mikrofona danışmaq vasitəsiylə daxil etməyə imkan verir. Bu həm mətni sürətlə yazmağa, həm də qurğuları səslə idarə etməyə imkan yaradır.

Azərbaycan dili üçün nitqin tanınması sisteminin yaradılmasına 2007-ci ildən Rabitə və İnformasiya Texnolgiyaları Nazirliyinin dəstəyilə Dilmanc layihəsi çərçivəsində başlanmışdır. Bu müddətdə Azərbaycan dilinin fonem tərkibi (nitq vahidləri, səslər və s.) bir daha tədqiq edilmiş, sözlərin tələffüz qaydaları araşdırılaraq tələffüz bazası yaradılmışdır. Fonemlərin akustik modellərinin yaradılması üçün Azərbaycan dilinin nitq korpusu yaradılmışdır. Nitq korpusunun yaradılması üçün 2500 nəfərdən çox müxtəlif yaş kateqoriyasından insanların səsləri yazılmışdır. Bundan əlavə, nitqin tanınması sisteminin komponentlərindən biri olan dil modelinin yaradılması üçün Azərbaycan dilinin mətn korpusu yaradılmışdır. Bu mətn korpusunun yaradılması üçün isə, internetdə Azərbaycan dilli saytlarının əksəriyyətinin kontenti serverlərimizə köçürülmüşdür.

Nitq və mətn korpuslarının üzərində modellərin öyrədilməsi və istifadəçinin nitqinin tanınması üçün mövcud alqoritmlər ətraflı tədqiq olunaraq paylanmış nitqin tanınması sistemi yaradılmışdır. Paylanmış sistem dedikdə çoxlu istifadəçilərin səsini eyni zamanda emal edə bilən onlayn servis nəzərdə tutulur.

Hal-hazırda dilmanc nitqin tanınması sistemi 1 milyona yaxın söz-forma tanıya bilir. Keyfiyyətli mikrofondan istifadə edildikdə sistemin dəqiqliyi 92%-dən artıqdır. Sistemin əsas xüsusiyyətlərinin biri də istifadə edildikcə keyfiyyətin yaxşılaşmasıdır. İstifadəçilər proqramdan istifadə edən zaman yüksək ehtimalla tapılmış cümlələr və onlara uyğun səs faylları serverə yazılır. Bu səslər vaxtaşırı olaraq sistemin nitq korpusuna əlavə edilir və sistem yenidən öyrədilir. Nitq korpusu artdıqca tanıma keyfiyyəti də artır. dilmanc.az saytında yerləşdirilmiş Dilmanc nitqin tanınması sistemi eyni zamanda çoxlu istifadəçilərin səsini emal edə bilən, çoxlu serverlər üzərində paylanmış arxitekturaya malik olan sistemdir. Sistemdəki serverlər 3 qrupa ayrılır: yönləndirmə serverləri (front-end), tanıma serverləri (back-end) və məlumat serverləri (data-server).

İstifadəçinin səsi saytdan yönləndirmə serverlərindən birinə göndərilir. Yönləndirmə serveri ən az yüklənmiş tanıma serverini seçərək səsi ona göndərir. Nitqin tanınması prosesi bu serverdə yerinə yetirilir. Bu zaman həmin server məlumat serverlərinin birindəki dil modelindən də istifadə edir.

Mətnin səsləndirilməsi və ya nitqin sintezi sistemi kompüterə daxil edilmiş mətni şifahi insan nitqinə çevirən proqram təminatıdır. Mətnin səsləndirilməsi sistemi istifadəçilərin kompüterlə və digər sistemlərlə daha təbii yolla ünsiyyət qurmasını təmin edən vasitələrdən biridir.

Mətnin səsləndirilməsi sisteminin tətbiq edilməsi bir çox yeni imkanlar yaradır:

1. Məlumat-sorğu sistemlərində insan operatorların əvəzinə mətnin səsləndirilməsi sistemi lazımi məlumatı istifadəçiyə şifahi oxuya bilər. Bununla həm xərclərin azaldılması, həm də sistemin 24 saat ərzində fasiləsiz işləməsi təmin olunur.

2. Avtomatlaşdırılmış məlumat sistemlərində isə bütün mümkün cavablar əvvəlcədən studiyada diktorun səsi ilə yazılır. Məlumatlar dəyişdirildikdə və ya yeni cavablar əlavə olunduqda hər dəfə diktorun səsinin yazılmasına ehtiyac duyulur. Mümkün cavablar çox olduqda isə, hər bir variant üçün diktorun səsinin yazılması praktik olaraq mümkün olmur. Mətnin səsləndirilməsi sistemi hər iki problemi effektiv həll edir.

3. İstifadəçinin diqqətinin yayınmamasının kritik olduğu hallarda mətnləri oxumaq əvəzində oxunuşuna qulaq asmaq imkanı yaradır. Misal üçün, avtomobili idarə edən zaman, telefona gələn mesajlar mətnin səsləndirilməsi zamanı səslə oxunur. Bu sistem xarici dillər üçün bəzi yeni avtomobillərdə artıq tətbiq edilmişdir.

4. Görmə qüsuru olan insanlar mətnin səsləndirilməsi sisteminin inteqrasiya olunduğu xüsusi proqram təminatı vasitəsilə kompüterdən istifadə edir, kitabları oxuyur, internetdə işləyirlər.

Xarici dillərin əksəriyyəti üçün mətnin səsləndirilməsi sistemləri mobil telefonlarda, kompüterlərdə, avtomobillərdə, naviqasiya sistemlərində, məlumat-sorğu sistemlərində, hərbi sənayedə, robot texnikasında və digər sahələrdə geniş istifadə olunmaqdadır. Azərbaycanda mətnin səsləndirilməsi sistemi ilk dəfə Dilmanc layihəsi çərçivəsində hazırlanmış və ilk versiyası 2012-ci ildə istifadəyə verilmişdir.

Qeyd edək ki, Dilmanc layihəsi çərçivəsində Azərbaycan dili üçün linqvistik texnologiyaların yaradılması və tətbiqi sahəsində işlər həyata keçirilir. Layihədəki əsas elmi tədqiqat istiqamətləri aşağıdakılardır:

• Azərbaycan dilindən digər dillərə və əksinə tərcümə sistemlərinin yaradılması

• Azərbaycan dili üçün nitqin tanınması sisteminin yaradılması

• Azərbaycan dili üçün mətnin səsləndirilməsi sisteminin yaradılması

• Telefon danışığını Azərbaycan dilindən digər dillərə və əksinə tərcümə edə bilən sistemin yaradılması

Layihənin əsas prioritetlərindən biri də bu texnologiyaların istifadəçilər tərəfindən praktik istifadəsini təmin etmək üçün proqram təminatının hazırlanmasıdır.

Hazırda layhədə nəzərdə tutulmuş elmi tədqiqat istiqamətlərinin hər biri üzrə praktik nəticələr əldə olunmuş və onların keyfiyyətinin artırılması üzərində işlər gedir. Layihə çərçivəsində Azərbaycan dili üçün aşağıdakı texnologiyalar yaradılmışdır:

• Azərbaycan-İngilis, İngilis-Azərbaycan və Türk-Azərbaycan istiqamətləri üzrə tərcümə sistemi yaradılıb istifadəyə verilmişdir və keyfiyyətin artırılması üzərində işlər gedir

• Azərbaycan-Rus və Rus-Azərbaycan istiqaməti üzrə tərcümə sistemi yaradılmış və istifadəyə verilmişdir

• Azərbaycan dili üçün nitqin tanınması sistemi yaradılmış və keyfiyyətin artırılması üzərində işlər gedir

• Azərbaycan dili üçün verilmiş mətni səslə oxuyan mətnin səsləndirilməsi sistemi yaradılmış və istifadəyə verilmişdir

• Telefon danışığını Azərbaycan dilindən digər dillərə və əksinə tərcümə edə bilən sistemin keyfiyyətinin artırılması üzərində işlər gedir

Layihə çərçivəsində yaradılmış texnologiyalar bir çox beynəlxalq sərgilərdə uğurla təqdim olunmuşdur. İsveçrədə keçirilən ITU Telecom World, Almaniyada keçirilən CeBIT, Türkiyədə CeBIT Bilişim, Rusiyada keçirilən Svyaz Ekspokomm, Bakıdakı Bakutel və digər sərgilərdə bir çox nüfuzlu dövlət rəsmiləri, beynəlxalq təşkilatların nümayəndələri, şirkət rəhbərləri və digər qonaqlar bu texnologiyalarla tanış olmuşlar. Bu şəxslər arasında Azərbaycan prezidenti İlham Əliyev və xanımı Mehriban Əliyeva, BMT baş katibi Pan Gi-Mun, Beynəlxalq Telekommunikasiya İttifaqının sədri Hamadun Ture və digər şəxslər olmuşdur.

 

Sevinc

 

Həftə içi.- 2014.- 1-3 fevral.- S.6.