Süni intellekt musiqi

 

Yaradıcı alət yoxsa sənətçinin əvəzçisi?

 

Musiqi mədəniyyətin ən qədim eyni zamanda ən emosional ifadə vasitələrindən biridir. Musiqi insanın daxili aləmini, duyğularını, düşüncələrini əks etdirən bir dil, bir sənət formasıdır. Tarix boyu musiqi insanın yaradıcılıq təxəyyülünün məhsulu olmuş, ifaçının şəxsi hiss düşüncələri ilə həyat tapmışdır. Amma texnologiyanın inkişafı ilə bu sahəyə yeni oyunçu daxil olur: süni intellekt. Süni intellekt alqoritmlər, böyük verilənlər bazası statistik modellər vasitəsilə işləyən proqram təminatıdır. Son illərdə alqoritmlər cəmiyyətin bütün sahələrinə təsir göstərib bu sahələrdən biri musiqidir. Hazırda süni intellekt müxtəlif janrlarda musiqi yarada bilir, məşhur ifaçıların səslərini təqlid edir, hətta dinləyicinin fərdi zövqünə uyğun melodiyalar təqdim edə bilir. Bəzi proqramlar bir neçə dəqiqə içində tamamilə yeni kompozisiyalar hazırlayır onları dərhal yaymaq mümkündür. Bu proses musiqi sənətinin gələcəyi üçün ciddi suallar doğurur. Süni intellekt sənətçiyə yardımçı vasitə kimi xidmət edəcək, yoxsa insan yaradıcılığının yerini alacaq? Yaradıcılığın emosional tərəfi alqoritmlərlə əvəz oluna bilərmi?

Qara Qarayev adına Mərkəzi İncəsənət məktəbinin nəzəriyyə şöbəsinin müəllimi, musiqişünas Pərvin Səfərli Olaylar.az-a açıqlamasında  deyib ki,bu məsələ son dövrlərdə olduqca aktualdır. Süni intellekt sahəsi keçən əsrin ortalarında yaranıb, lakin son illərdə çox geniş inkişaf edərək artıq real tətbiq mərhələsinə keçib. Bu texnologiya təkcə yerlərimizi deyil, ailə həyatımızı ictimaiyyətin digər sahələrini, o cümlədən yaradıcılığı da əhatə edir:" Ancaq yaradıcılıq anlayışının öz adından da göründüyü kimi, o, ilk növbədə ruhla bağlıdır. Ruhun intellektin vəhdətindən yüksək sənət nümunəsi yaranır. Musiqidə süni intellektdən istifadə etmək mümkündür, lakin musiqi sənəti musiqi peşəkarlığı tamam başqa anlayışlardır. Peşəkar qulağı heç vaxt aldatmaq mümkün deyil. Əgər sən peşəkar sənətlə məşğul olursansa, bu sənətin dərinliyi incəliyinı hakimsənsə, burada aldanmaq mümkün deyil. İnsan faktoru-insanın düşüncəsi, fikirləri, daxili aləmi ruhu yaradıcılığın əsasını təşkil edir. Bədii əsər insanın ruh, intellekt, dünyagörüşü, həyat təcrübəsi, hadisələri qavrama onları yaradıcılıq süzgəcindən, bədii təfəkkür prizmasından keçirərək ortaya qoyduğu bir sənət nümunəsidir. Söhbət burada konkret olaraq sənətdən, peşəkar sənətdən gedir. Musiqi çoxşaxəli bir sənətdir: kino musiqisi var, pop musiqisi, ciddi, yüngül musiqi növləri s. mövcuddur. Bir çox sahələrdə süni intellekt insanı əvəz edə bilər. Ancaq burada söhbət musiqi sənətindən gedir. Məsələn, kino musiqisini götürək. Kino musiqisi əsasən dekorativ xarakter daşıyır, obraz hadisələri müşaiyət edir. Bəli, elə musiqi nümunələri yaradıla bilər ki, süjeti tamaşaçıya yüksək səviyyədə təqdim etsin. Artıq qulağımız Hollywood filmlərinin musiqisinə öyrəşib, bu xüsusda müəyyən bir model formalaşıb. Filmin musiqisi müəyyən streotip üzərində qurulur, hər bir səhnəyə özəl bir musiqi dili var biz bu musiqi dilini başa düşüb qəbul edirik. Bu, konveyer vasitəsilə yaranan musiqidir. Lakin sizə kino musiqisini yüksək sənət nümunəsi kimi göstərən bir misal təqdim edim. Q.Qarayev rejissor Q. Kozintsevin "Don Kixot" filminə musiqi yazmışdır. Rejissor öz xatirələrində bildirir: "Mən heç vaxt filmlərimin efir nümayişinə baxmıram. Televizorda "Don Kixot" filminin növbəti dəfə nümayiş etdirirdilər. Mən durub otaqdan çıxmaq istədim, Lakin Qarayevin musiqisi məni dayanmağa məcbur etdi mən sırf musiqiyə görə filmə tamaşa etdim" Bax, bu musiqi artıq sırf dekorativlikdən, müşaiyətdən çıxaraq fərdi bir əsər kimi təzahür edir. Təsadüfi deyil ki, Q.Qarayev filmin musiqisi əsasında simfonik qravürlər yazmış ona simfonik həyat vermişdir.

Peşəkar sənətə gəldikdə... Musiqidə elə qanunauyğunluqlar var ki, süni intellekt onları yerinə yetirə bilmir. Bəstəkar bir ideya təqdim edir, onun musiqi forma məzmununu təyin edir, müəyyən bir quruluş yaradır. Məsələn, klassik musiqi formaları içərisində sonata-Alleqro forması, klassik musiqi janrları arasında simfoniya janrı var ki, bunlar həyati konfliktlərin, təzahürlərin bədii modeli kimi ən tutarlı forma məzmuna malikdirlər.  Məsələn, sonata formasında iki əsas mövzu verilir - həyatın əsasən iki müxtəlif yönümünü, əks qütbləri əks etdirən iki mövzu. Bu mövzular əsərin inkişafı zamanı qarşıdurmalara, dəyişikliklərə məruz qalır. Bu proses isə yalnız bəstəkara, yaradıcı ruha məxsus yolla aparılır. Onun həyat təcrübəsindən, dünyaya, hadisələrə baxış prizmasından keçirilərək. Burada dramaturgiya məsələsi var-ideyanın musiqi vasitəsilə dramaturji baxımdan necə təqdim olunması həll olunması. Hər bəstəkar bunu fərqli şəkildə edir bu fərqlilik, peşəkarlıq ortaya sənət nümunəsi qoyur.

Müasir musiqi sənətinin öz forma məzmunu, fərqli dramaturgiyası musiqi dili var. Çünki qədər insanın yaradıcı ruhu var, bir o qədər yeni üslub cərəyanlar ortaya çıxır. 

Süni intellekt tərəfindən yazılmış musiqi nümunələrini dinlədikdə görürəm ki, bir mövzu qoyulur, lakin o inkişaf etmir, cüzi dəyişikliklərlə əsər sona çatır. Bəstəkar musiqisi belə olmur. Bəstəkar musiqisində mövzu dəyişir, həyat konfliktlərini əks etdirir bizi kulminasiyaya aparır. Müxtəlif növ dramaturgiya onun  mərhələləri var: problem qoyulur həll edilir. Süni intellekt bunu edə bilmir. Peşəkar musiqi prosesində mövcud olan təfəkkür, yaradıcılıq musiqi düşüncəsi süni intellektdə yoxdur. Ona görə deyirəm ki, yaradıcı, peşəkar qulağı süni intellekt aldada bilmir. O, yalnız bəzi tərəfləri verə bilir, lakin zənginliyi təqdim edə bilmir. Bəsit nümunələr yaradır, melodiyanı məntiqsiz qurur, üslubları qarışdırır, amma bunu peşəkar səviyyədə etmir. Çünki peşəkar səviyyədə üslub qarşılaşdırmaları məsələsinə ciddi yanaşılır. Süni intellekt verilmiş proqram, modellər əsasında işləyir, yaradıcı insan isə hansı bazadan çıxacağını, hansı texniki peşəkar mərhələlərdən keçəcəyini fərdi olaraq özü müəyyən edir nəticədə bədii əsər ortaya çıxır. Süni intellektdə bu proses yoxdur.

Düzdür, müxtəlif eksperimentlər aparılıb süni intellekt musiqisi dinləyicilərə təqdim edilib. Amma zalda oturan dinləyicilər peşəkar qulağa malik deyillər. Onlar yalnız intonasiya bazasını eşidirlər, musiqinin daxili zənginliyini duya bilmirlər. Müəyyən səviyyədə aldadılırlar, amma peşəkar səviyyədə yox. Çünki əsər zahiri prosesdən ibarət deyil, onun daxili prosesi var. Bu, roman oxumağa bənzəyir: paralel xətlər, konfliktlər, personajların qarşıdurmaları. Əsərin bədii yükü keyfiyyəti süni intellekt tərəfindən heç vaxt tam şəkildə yaradıla bilməz. Gələcəkdə baş verəcəyini görəcəyik, amma indiki mərhələdə musiqi baxımından süni intellekt mənim üçün qorxulu deyil. Kino, pop yüngül xarakterli musiqi sahələrində istifadə oluna bilər, burada biznes tərəfi böyükdür. Amma sənət sahəsində işləməyəcək. Digər tərəfdən, bu proqramların peşəkar qeyri-peşəkar səviyyələri var. Daha çox ödəniş tələb edən proqramlar daha peşəkar tətbiqlərdir onlardan əsasən peşəkar musiqiçilər istifadə edə bilər. Məncə, yeni texnikalar yaradıcı insanın əlinə düşəndə çox faydalı ola bilər. Yaradıcı insan bu texnikaları öz ideyalarına köməkçi kimi istifadə edə bilər. Bu vasitələrdən düzgün istifadə edərək yeni, innovativ ideyalar ortaya çıxarmaq mümkündür. Məsələn, gələcəkdə dinləyici ilə ifaçı arasında neyro-bağlantı yarana bu bağlantı vasitəsilə musiqi əsərləri formalaşa bilər. Müasir texnologiyalar artıq insan düşüncələrini hisslərini birbaşa musiqiyə çevirmək imkanlarını ortaya qoyur. Amma bu imkanlar yenə yaradıcı insanın əlində olmalıdır.

Süni intellekt indiyə qədər yaranmış musiqi bazasından, intonasiya ifadə vasitələrindən istifadə edir. O, mövcud bazanı qarışdıraraq nəsə təqdim edir bu, orijinal olmur. Sənət orijinallıq, individuallıq tələb edir. Bu, mənim sırf musiqişünaslıq baxışımdır. Mənim çox sevdiyim politoloq İrina Xakamarda da deyir ki, süni intellekt gələcəkdə bizi bir çox sahədə əvəz edə bilər, amma yaradıcılıq sahəsində yox. Çünki yaradıcılıq ruhu Allahın verdiyi ruhdur-unikaldır, təkrar olunmazdır.

İnsan gərək səmimi olsun. Səmimiyyət dedikdə nəyi seçdiyimiz vacibdir: canlınımı seçirik, yoxsa cansızımı? Təəssüf ki, dövr bizi canlı ilə cansız arasındakı fərqin azaldılmasına doğru aparır. Bu fərqi itirməmək lazımdır. İki nümunə təqdim olunsa- süni intellekt musiqisi canlı insan musiqisi-ilk dəqiqələrdə fərqi anlamaq çətin ola bilər. Amma sonra insan qulağı, duyumu bu fərqi tutacaq. Hələ ki, tutacaq. Gələcəkdə texnologiya o səviyyəyə çata bilər ki, bu fərqi hiss etmək çox çətin ola bilər. İnsan isə indidən öz seçimini etməlidir: hansı amilə daha çox üstünlük vermək- insan ruhuna intellektinəmi, onun ortaya qoyduğu məhsulamı, yoxsa cansız alətin.... Fikrimcə, müasir dövrümüzdə cəmiyyət, fərdiyyət  böyük bir seçim qarşısındadır. Əgər biz indi seçim etməsək, gələcəkdə bizim özümüzün seçimə məruz qalacağımız  labüddür. Mən texnologiyanın inkişafının əleyhinə deyiləm. Əksinə, onun bizə yeni üfüqlər aça biləcəyi fikrindəyəm. Lakin bu insan ruhunun, yaradıcılığının ziddinə, əleyhinə olmamaq şərtilə...    Arzu edirəm ki, insanlar daha çox canlı ünsiyyəti, yaradıcılığı insan ruhunu seçsinlər".

 Süni intellekt musiqi yaradan zaman hansı əsas texnologiyalardan məlumat bazalarından istifadə edir bu proses insan yaradıcılığı ilə texniki baxımdan dərəcədə müqayisə oluna bilər? Alqoritmlərin tanınmış ifaçıların səsini üslubunu təqlid etməsi texniki baxımdan qədər təhlükəsizdir bu, gələcəkdə musiqi sənayesində hansı riskləri yarada bilər? AI mütəxəssisi, Alas Academy direktoru Natiq Məmişovin fikrincə süni intellekt musiqi yaradarkən bir neçə əsas texnologiyaya əsaslanır:"Birinci istiqamət neyron audio kodeklərdir (audio → "token" çevrilməsi). Müasir sistemlərin əksəriyyəti səsi birbaşa dalğa forması kimi emal etmir. Audio əvvəlcə "sıxılmış" diskret kodlara - tokenlərə çevrilir. Məsələn, SoundStream kimi neyron kodeklər audionu encoder/decoder kvantlaşdırma mexanizmi ilə kodlaşdırır.

İkinci texnologiya Transformer əsaslı "dil modeli" yanaşmasıdır. Bu mərhələdə tokenlər artıq musiqinin bir növ "əlifbası" kimi davranır. Model bu token ardıcıllığını növbəti tokeni proqnozlaşdırmaq prinsipi ilə generasiya edir. MusicGen bu yanaşmanın klassik nümunəsidir.

Üçüncü istiqamət diffusion modelləridir, xüsusən "latent" məkanda işləyən sistemlər. Bəzi "text-to-audio" "text-to-music" modelləri səsin latent təmsilində səs-küyü mərhələli şəkildə "təmizləyərək" audionu formalaşdırır. Stable Audio Open bu prosesi açıq şəkildə autoencoder, mətn embedding-ləri latent-space diffusion transformer (DiT) kombinasiyası kimi təsvir edir.

Dördüncü əsas məqam şərtləndirmədir (conditioning). Model təsadüfi musiqi yaratmır, adətən mətn promptları ilə şərtlənir. Bu promptlara janr, ovqat (mood), tempo, alətlər mövzu daxildir. Bəzi hallarda isə melodiyalar, ritm akkordlar kimi idarəedici siqnallar da istifadə olunur.

Məlumat bazaları nədən ibarət olur?

Böyük həcmdə audio treklər + metadata: janr, tempo, alətlər, etiketlər; bəzən mətn təsviri ya "tag"lər. Bəzi modellər Creative Commons kimi açıq lisenziyalı datasetlərə fokuslanır (məs: Stable Audio Open-un fərqli dataset yanaşması).

İnsan yaradıcılığı ilə texniki müqayisə necədir? Oxşarlıq ondan ibarətdir ki, həm insan, həm süni intellekt dinlədiyi öyrəndiyi nümunələrdən stil, harmoniya, ritm forma qanunauyğunluqlarını mənimsəyir. Fərq isə ondadır ki, insan "niyə bu hissəni belə etdim?" sualına məqsəd, kontekst, emosional niyyət şəxsi həyat təcrübəsi ilə cavab verir. Süni intellekt isə əsasən ehtimallar üzərindən "ən uyğun davam"ı qurur. Praktik nəticədə AI çox vaxt demo, prototip ideya generatoru kimi güclü olur. "İmza" yaradıcılığı, dərin məna kontekst uyğunluğu isə hələ ən stabil şəkildə insanda qalır".

Tanınmış ifaçıların səsini üslubunu təqlid etmək qədər təhlükəsizdir? Natiq Məmişov bildirir ki, bu, texniki baxımdan təhlükəsiz sayılmır. Çünki səs biometrik kimlikdir:

"Səs klonlaşdırılması impersonasiya təkcə musiqi məsələsi deyil, identifikasiya etibar məsələsidir. Platformalar da bunu risk kimi qiymətləndirir. Məsələn, Spotify 2025-ci ildə icazəsiz səs klonu impersonasiya ilə bağlı siyasətini sərtləşdirib bu cür kontentin silinəcəyini açıqlayıb. Sənaye riskləri real ssenarilərlə özünü göstərir.

Bunlara impersonasiya reputasiya zərəri daxildir: "filan artist yeni mahnı buraxdı" görüntüsü ilə saxta buraxılışlar. Digər risk royalti fırıldağı spam selidir. Platformalara kütləvi şəkildə AI musiqisi yüklənir. Spotify son 12 ayda 75 milyon AI spam trek sildiyini açıqlayıb.

Bundan əlavə, hüquqi etik mübahisələr mövcuddur: hansı hallarda bu, sadəcə üslub təqlididir, hansı hallarda isə səs kimliyinin oğurluğu sayılır? Bu sərhəd getdikcə daha konfliktli olur. Dinləyicinin aldadılması "deepfake audio" ilə bağlı şəffaflıq problemi ciddi risklər arasındadır".

Ekspert qeyd edir ki, süni intellekt musiqi nəzəriyyəsinin qaydalarını əl ilə tətbiq etmir. O, böyük həcmdə məlumatdan statistik struktur pattern-ləri öyrənir onları yeni kombinasiyalarda "sample" edir:

"Bu texnologiyanın inkişafında əsas risklər nələrdir? Birinci risk hüquq razılıq məsələsidir. Datasetlərin lisenziyası, artistlərin səsinin tembrinin icazəsiz istifadəsi, müəlliflik hüquqları gəlir bölgüsü bu kateqoriyaya daxildir.

İkinci risk impersonasiya, fırıldaqçılıq dezinformasiyadır. Saxta artist buraxılışları, saxta duetlər, şantaj reputasiya hücumları buna nümunədir. Platformaların siyasəti sərtləşdirməsi məhz bununla bağlıdır.

Üçüncü risk bazarın kontent seli ilə keyfiyyətsizləşməsidir. Kütləvi AI musiqi yüklənməsi dinləyici üçün axtarışı çətinləşdirir, real artistlərin görünürlüğünü azalda bilər spam, royalti sui-istifadəsini artırır.

Dördüncü risk şəffaflıq etiketləmə ilə bağlıdır. AI ilə yaradılan kontentin açıq şəkildə işarələnməsi, dinləyicinin aldadılmaması üçün tənzimləmələr aparılır.

Beşinci risk isə yaradıcılıq ekosisteminə təsirdir. "Səs üslub bazarı" formalaşır- kimlik üslub lisenziyası olan olmayan iki paralel bazar yaranır ki, bu da sənaye daxilində gərginliyə səbəb olur".

Bu müzakirələr göstərir ki, süni intellekt musiqi sahəsində tam xilaskar, sənətçinin birbaşa əvəzçisidir. O, insan yaradıcılığının əsasında duran ruhu, fərdi təcrübəni daxili dramaturgiyanı daşıya bilmir, amma düzgün əllərdə güclü bir alətə çevrilə bilər. Texnologiya musiqinin istehsal formasını dəyişir, lakin onun mahiyyətini hələ ki dəyişdirə bilmir. Əsl sual süni intellektin qədər irəli gedəcəyi deyil, insanın bu inkişaf qarşısında nəyi qoruyacağıdır. Canlı ifanın, fərdi üslubun, səmimi emosiyanın dəyəri qorunduqca, musiqi sənət olaraq qalacaq. Əks halda, sürətlə çoxalan səslər içində ruhu olan musiqini tapmaq getdikcə çətinləşəcək. Seçim yenə insanın öz əlindədir: alqoritmlərin qurduğu səslərimi, yoxsa insan ruhunun yaratdığı musiqinimi dinləmək?

 

Zeynəb Mustafazadə

 

Olaylar.- 2025.- 19-25 dekabr, ¹44.- S.19; 21.