Nazirliyin dəstəyilə yaradılan Azərbaycan dilinin milli korpusu haradadır ?
28-03-2024, 09:54
On illər öncə, o zamankı Rabitə və Yüksək Texnologiyalar Nazirliyinin dəstəyilə Dilmanc layihəsi həyata keçirilirdi.
Layihənin elmi rəhbəri sabiq nazir Əli Abbasov idi.
O zamanlar üçün uğurlu bir layihə idi. Xatırlayıram ki xeyli dövlət resursları xərclənən bu layihə çərçivəsində bir xeyli işlər də görülmüşdü.
Layihə çərçivəsində “Dilmanc” tərcümə sistemi, şifahi nitqi mətnə çevirən “Dilmanc İmla” sistemi, mətnlərin səsləndirilməsi sistemi və s. hazırlanmışdı.
Maraqlı məqam həm də odur ki, bu dövlət layihəsi çərçivəsində Azərbaycan dilinin nəhəng bir milli korpusu (Ana dilimizdə indiyədək mövcud olan, elektron formatda toplanmış və sistemləşdirilmiş böyük mətnlər bazası ) formalaşmışdı.
Hansı ki Ana dilimizdə süni intellekt həllərinin və NLP ( təbii dilin emalı) layihələrin inkişafı üçün, Ana dilimizdəki mətnlərin emalı və riyazi-statistik təhlili üçün bu resurs mühüm əhəmiyyət kəsb edir.
Lakin hazırda belə bir dövlət resursu nə dövlət sektoru, nə biznes sektoru, nə də elmi tədqiqat üçün əlçatan deyil.
Dəfələrlə ən yüksək elmi toplantılarda Azərbaycan dilinin milli korpusunun olmaması ciddi müzakirə predmetinə çevrilib.
Belə bir korpus olmadan Azərbaycan dilini dəstəkləyən keyfiyyətli süni intellekt həllərinin yaradılması qeyri mümkündür.
Baxmayaraq ki bəzi elmi institutlarda və şirkətlərdə milli korpusla və bunun əsasında süni intellekt həllərinin yaradılması ilə bağlı müəyyən addımlar atılıb , lakin hələ də bu vacib dövlət əhəmiyyətli məsələyə sahiblik edən, bu işə cavabdehlik daşıyan qurum qeyri-müəyyəndir.
Maraqlıdır, görəsən dövlət dəstəyilə yaradılan həmin milli korpus indi haradadır?
Nə üçün dövlət resursları hesabına hazırlanan həmin resurs dövlət, özəl və elm sektoru üçün əlçatan deyil?
Əgər belə bir korpus əlçatan olardısa Azərbaycanda süni intellekt sahəsində ciddi uğurlar əldə etmək mümkün olardı.
Məhz belə bir resursun olmaması hazırda ölkədə süni intellekt sahəsinin inkişafını əngəlləyən amillərdəndir.
Hazırda elə bizim özümüz də media monitorinq sisteminin sentiment analizinin üzərində işləyərkən belə bir milli korpusun əlçatan olmamasından xeyli əziyyət çəkirik.
Bildiyim qədər Dilmanc rəhbərliyi layihə başa çatanda bu datanı Nazirliyə təhvil verib. Ondan sonra isə bu data qapadılıb və onun taleyindən bir xəbər yoxdur.
Ümid edirəm RİNN bu məsələyə bir aydınlıq gətirəcək.
Fikrimcə, maraqlı tərəflər, RİNN -nin Aİ Lab qurumu və 4SİM, ETN -nin İS və İT elmi institutları, AMEA Dilçilik İnstitutu, ADA , AzTU və digər müvafiq Universitetlər, bu sahədə çalışan biznes qurumları, A2Z, Robotronics şirkətləri məhz bu problemin həlli üçün bir araya gəlməlidir.
Düşünürəm ki, RİNN maraqlı tərəfləri və elə Dilmanc komandasını da cəlb etməklə keçmişdə formalaşan milli korpusun inkişafı və biznes üçün, dövlət və elm sektoru üçün əlçatan edilməsi istiqamətində səylərini gücləndirməlidir.
Osman Gunduz
TEREF